データサイエンス分野が本職の人は、ほとんどの人が使用しているツールJupyterNotebook。
Webブラウザ上で動作する開発環境でデータ分析した実行結果を簡単に可視化できる環境としてめちゃくちゃ便利です。
今回はそんなデータサイエンス業界では標準になりつつあるJupyterNotebookについて書こうと思います。
私は、データサイエンスが本職ではないですがPythonのコードを書いてどんな動きになるかテストするときや、グラフや表をさっと表示させたいときに使っていてデータサイエンスが本職でなくても重宝しています。
JupyterNotebookとは?
正式名称はジュパイターノートブックといいます。ただ、似た綴りで土星を表す単語Jupiter(ジュピター)と似ているので、結構ジュピターと呼んでる人が多いみたいです。そんな経緯もあって今ではどっちの呼び方でもいいみたいです。
このJupyterNotebook。昔はIPython Notebookと呼ばれていてpython専用の開発環境でしたが、今ではRuby、R言語などのたくさんの言語がサポートされるようになっていて現在のJupyterという名前に変更されました。ただ、ほとんどの方は、Pythonで使われていると思います。
ここ数年のPython人気は、このJupyterNotebookを使いたいからの理由で使い始めた方も結構いると思います。それほど便利な環境です。
JupyterNotebookの後継バージョン
JupyterNotebookは、実のところ後継バージョンが出ています。
名称はJupyterLab。
基本的には、JupyterNotebookと同じで機能強化版だと思ってもらえればよいです。なのでこれから使う人はJupyterLabを使うことをお勧めします。
JupyterNotebook(lab)を使う方法は?
自分のPython環境でJupyterを使う方法を紹介します。自分の環境に合わせてお好きな環境で試してみてください。
Anacondaをインストールして使う
Pythonでよく使うライブラリを一つにまとめた環境をインストール形式で提供しているAnaconda環境で使用する方法があります。Anacondaをインストールすると自動的にJupyterがインストールされています。インストールが完了後にlauncherからJupyter Labを起動すると使えます。
Anaconda環境のインストール方法は以下の記事を参考にしていただければと思います。
JupyterLabだけをインストールして使う
Anacondaではなく、都度必要なライブラリをpipコマンドでインストールしている人は、以下のコマンドを実行してインストールしてください。ここではjupyterLabをインストールしています。
pip install jupyterlab
Google Colabを使う
ちょっと毛並みが違いますが、JupyterNotebookをベースにして、Googleが独自で進化させたGoogle Colabで使うことも可能です。ここでは詳細には触れませんが、Googleアカウントさせあれば、自分の端末にPythonをインストールしなくてもJupyterNotebookをベースとした環境を使用することができます。何も操作せずに90分経過するとリセットされたりの多少の制限はあります。
VSCodeでJupyterNotebookを使う
個人的にはこの環境が一番気に入っていて使用しています。VSCodeの拡張機能からJupyterをインストールして使うこともできます。以下のようにVSCode上で、Jupyterを実行することができます。
※個人的にJupyterでコードを記述するときにコード補完がイマイチな部分があります。なのでVSCodeで実行できるようにすれば、コード補完もバッチリ効きます。
上述のように、自分の環境に合わせた形でインストールできます。
次にJupyterNotebook(lab)を使うことによるメリットについて書こうと思います。
JupyterNotebook(lab)を使うメリット
このJupyterNotebook(lab)を使ってみたときに感じたメリットは以下の通りです。
- 1行ごとに実行結果を確認できる
- マークダウンが書ける
- 表の出力が簡単
- グラフの出力が簡単
- Jupyterで記述したプログラムファイルを共有できる
- 無料で使える
JupyterNotebook(lab)を使ってみる
ここでは、Windows10のパソコンにpipコマンドでJupyterLabをインストールした状態で、使ってみようと思います。
JupyterLabの起動と新規ファイル作成
JupyterLabを使うには、pythonを実行できる環境にパスを移動して以下のコマンドを実行します。
jupyter lab
以下の画面ででPython3を選択します。拡張子はipynbになります。
※ファイル名はRenameで変更できます。
1行ごとに実行結果を確認できる
JupyterLabにprint(“hello python”)を入力し、実行ボタンを押します。
実行ボタン▶を押すだけで、実行結果が表示されます。
マークダウンが書ける
マークダウンは、select cell typeに[Markdown]を選択して記述します。
実行ボタン▶を押すと、マークダウンが表示されます。
マークダウンでPGの実行結果の考察やタイトルなどを記述できるので、このファイル自体がレポートとして完結できるので報告書などの提出資料としても非常に便利です。
表の出力が簡単
表の出力は、dataframeをそのまま記述すれば表形式のデータがそのまま表示されます。
以下の例では、pandasで変数dfに表データを格納してdfを実行すれば、表形式の結果が返ってきます。
import pandas as pd
df = pd.DataFrame({'Japanese': [55, 96, 76, 82,67],
'Mathmatics': [44, 77, 54, 67, 88],
'English': [67, 54, 76, 91, 68]})
df
グラフの出力が簡単
グラフの出力も、グラフ出力ライブラリでグラフを作るだけで表示されます。
以下はmatplotlibをいうグラフ出力ライブラリで折れ線グラフを表示させています。
import matplotlib.pyplot as plt
x=[1,2,3,4,5,6,7,8]
y=[3,6,9,12,15,18,21,24]
plt.plot(x,y)
plt.show()
これらの実行したプログラムは、ipynbファイルを他のJupyter環境があるパソコンにコピーすれば結果も含めて共有することも可能です。
VSCodeでJupyterを実行するとコード補完が効く
JupyterNotebookを使っていて、唯一不便だなと思うところはコードの補完がいまいちなところです。
たとえば、printを記述したいときにprと入力すると予測してくれてprintを候補として補完してくれるのですが、JupyterNotebookの場合はタブを1回入力しないと表示されません。
一方でVSCodeの拡張機能で使うときはタブを入力しなくても入力候補を補完してくれます。
補完も効くし、Jupyterと同じく表やグラフもそのまま表示できるので非常に使いやすく、VSCodeで実行するのが一番おすすめです。
まとめ
- JupyterNotebookは、Webブラウザ上で動作する開発環境でデータ分析した実行結果を簡単に可視化できる。
- JupyterNotebookのバージョンアップ版がJupyterLab
- JupyterNotebookは、マークダウンを書くことができる。
- JupyterNotebookは、表やグラフが簡単に記述できる。
- VSCodeでもJupyterNotebookを使用することができて補完も効く。
これからPythonを始める人は、自分の入力したコードを1行ずつ実行でき、表やグラフもすぐに表示できるのでPythonの学習にはかなりおすすめです。
表の出力やグラフ出力処理を書くときは先にJupyterNotebookでプログラミングして出力結果を見てからソースを記述したりしています。
コメント