Amazon

2017年2月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28        

最近のトラックバック

無料ブログはココログ

Amazon2

« Windows10にRとRStudioをインストールする | トップページ | RStudioをサーバー(Ubuntu16.04)にインストールする »

2016年7月11日 (月)

Ubuntu16.04にJupyter NotebookとPython3とRをインストールする

今回は以下を目的に作業します。

  ・データの分析にR/Pythonを使えるようにしたい
  ・Jupyter otebookを使いたい
  ・サーバーにインストールして、いちいち自分のPCに環境を作りたくない

と、言う訳でサーバー(Ubuntu16.04LTS)にPython/R/Jupyter Notebookをインストールします。





遅ればせながら、ちょっとRに興味を持っています。しかし、この言語は・・・と、言うか、
この言語を利用する目的ってちょっと変わっているんですよね。通常の言語の場合は、
最終的な目的は、プログラムを作成する事(実行体 EXE等)を作成する事です。なので、
使っている際は、そのプログラムの結果が重要です。

しかし、Rの場合は、どちらかと言うと、「何を・どのように処理して・どの様な結果が得られたか?」と、
手順・考え方を整理する事が非常に大切です。プログラムと言うよりはコメントが大切と言ったイメージ
でしょうか。Jupyter Notebookはその様な「考え方」と「処理結果」を交互に書いた、レポートの様な
物を作ることができるツールです。しかも、処理結果にグラフを簡単に書く事ができる為、
非常に結果が分かりやすくまとめる事ができるツールです。
公式サイトのTry it in your browserから試す事が可能です。Rの場合はWelcome R - demo.ipynbを
選択して下さい。

また今回からUbuntuはUbuntuServer16.04LTSを使用する事とします。特に理由16.04で
なければならない理由はありませんが、丁度この春出たばっかりで2021年までサポートが
ありますし、やっぱり新しい方が良いかな…と(笑)



1. anacondaでPythonを導入する

今回はanacondaパッケージを使用してPythonとJupyter Notebookをインストールします。

AnacondaはPythonとデータ分析・数値計算環境を構築する為のパッケージをまとめたものです。
機械学習ライブラリscikit-learn等のパッケージを簡単にインストールする事ができます。
また、Python環境の切り替え用にpyenvを使用します。


・pyenvのインストール

正式なインストール方法はこちら(Simple Python version management)です。
上記リンク先の"Basic GitHub Checkout"に全て記載があります。

  1. gitからチェックアウトする
  
  
  
  2. 環境変数を設定する

  
  
  3. pyenv initをログイン時に動作させる設定をする

  
  
  ここまでできたら、ログインしなおすか、.bash_rcを実行して今設定した環境変数等を反映させます。


・anacondaのインストール

続いてanacondaを使用して、PythonとJupyter Notebookをインストールします。
Pythonのバージョンはどちらでも良いですが、今後の事を考えるとv3系にすべきかと
思います。ここでは、2016年7月現在で最新の3-4.0.0をインストールする事にします。

  1. インストールできるバージョンの確認

  以下のコマンドを実行して、pyenvでインストールできるpythonを調べます。
  pyenv -install だけを実行すると様々なパッケージが出てきますが、今回はanacondaを
  利用するつもりなのでgrepして検索します。
  
  
  
  どうやら3-4.0.0が最新の様ですのでこれを利用する事とします。
  
  2. pythonのインストール

  以下を実行するだけです。必要な物をダウンロードして設定してくれます。
  多少時間がかかります。
  
  
  
  shim fileを一応更新します。
  
  
  各ユーザーのデフォルトのpythonのバージョンをanaconda3-4.0.0にします。
  
  
  
  これでPythonが導入できました。以下の通り、anaconda3-4.0.0とPython3.5.1が
  インストールされている事が分かります。
  
  

2. R言語のインストール

正式なインストール方法はこちら(Download R for Linux)です。
上記リンク先の"Download R for Linux"→"ubuntu/"→"README.html"を参照して下さい。

・リポジトリの設定

Rその物はapt-getでインストールする事になりますが、その前にリポジトリを設定する必要があります。

まず、Ubuntuのバージョンを確認します。Ubuntu16.04であれば以下の様に表示されるはずです。
下記に出てくる"DISTRIB_CODENAME=xenial"が重要です。


ダウンロード元のリポジトリを設定します。以下のファイルの末尾に一行追加します。


次の一行を追加する。(ミラーサイトはjpにしておきました)


このままだと野良リポジトリですので公開鍵を登録するため、端末上で以下のコマンドを実行します。


・Rのインストール

リポジトリの情報をupdateしてapt-getするだけです。



これでRがインストールできました。以下の様にしてバージョンを確認する事ができます。


試しにちょっと計算。うん、ちゃんと動いてそうですね。
(ちなみにRの起動は端末から半角大文字の"R"です)



さらに、Rで日本語を利用する場合は、日本語フォントもインストールが必要です。
Ubuntuをデスクトップとして使用している場合は既に入っているかもしれませんが
念の為以下を実行しましょう。



3. RをJupyter Notebookから利用できるようにする

ここまでで、RとPythonとJupyter Notebookがインストールされました。最後に、Rを
Jupyter Notebookから利用できる様に構成します。

・IRkernelパッケージのインストール
RをJupyter Notebookから利用できるようにするためにはRにIRkernelパッケージを
インストールする必要があります。
正式なインストール方法はこちら(Installation)です。

Rを起動して、以下のコマンドを実行します。


実行するとCRANのミラーサイトを聞かれます。Japan(Tokyo)で良いと思います。
処理を開始すると、そこそこ時間がかかりますので気長に待ちましょう。

そして、実行した所何やらエラーが発生しました。その対応法も公式サイトに書いてあります。



rzmqについてエラーが発生した場合にdevtoolsパッケージが出来ていませんので
以下を実行します。

まずRを抜けて不足しているPackageをインストールします



続いて、Rから以下のコマンドを実行します。



・Jupyter Notebookの設定

この状態で既にJupyter Notebookは起動するのですが、このままだとlocalhostからしか
Jupyter Notebookに接続できません。全てのIPアドレスの端末(PC)から接続出来るようには
設定します。

以下の様に起動するユーザーのhomeディレクトリに.jupyter/jupyter_Notebook_config.pyと
言う設定ファイルを作成します。

mkdir .jupyter
vi ~/.jupyter/jupyter_notebook_config.py


上記ファイルの作成後に以下の様にコマンドラインから入力してjupyter Notebookを起動すればokです。


これで、jupyter notebookが使用できるようになりました。

ブラウザーからhttp://[サーバーのIPアドレス]:8888で接続して下さい。


20160702_01



結構手順が多かったですが、なんとか起動出来るようになりました。



しかし、このJupyter Notebookと言う繰り返し実行が可能な、実行環境とその意味だけでなく
結果まで同時にまとめたレポートを作成できる環境は素晴らしいですね。まさにRだったりPythonに
よるデータ分析に求められている物だと思います。
さて、これで何かの分析の真似事をしてみたいですが…う~ん、データがないな。。。






この作業をしている時に、また「メモリが足りません」的なエラーをWindowsが吐いてしまった…。
Athon 5350とメモリ8GBと言う超貧弱な環境で色々遊ぶには限界が来たのかもしれません。。。
RってどれぐらいCPUとメモリを必要とするのでしょうね。メモリを追加すればまだ戦えるのか、
それとももう厳しいのか…。本当はAMDの新CPUのZENを待っていたのですが、なかなか発売されないので…。
せめてAMDからDDR4に対応したCPUが発売されていれば購入したのですが…。
Windows10への無償アップグレード期間が終わってしまう…。











« Windows10にRとRStudioをインストールする | トップページ | RStudioをサーバー(Ubuntu16.04)にインストールする »

データサイエンティスト・データ分析」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/1680410/66441274

この記事へのトラックバック一覧です: Ubuntu16.04にJupyter NotebookとPython3とRをインストールする:

« Windows10にRとRStudioをインストールする | トップページ | RStudioをサーバー(Ubuntu16.04)にインストールする »