Python3+scipy+matplotlib でCSVデータからグラフ+近似関数を描画する。

今後の準備の回。

[amazonjs asin="4873116988″ locale="JP" title="実践 機械学習システム"]

前提

pyenvをインストール。
CentOS7 pyenvをホームディレクトリにインストール

その後、pyvenvで環境を構築。

[shell]
pyvenv ~/.machine_learning
source ~/.machine_learning/bin/activate
pip install –upgrade pip
[/shell]

あとgitをインストール。

 

gitから使うパッケージをダウンロード

今回作成したソースをgitに上げたため、ダウンロードしてくる。

umentu/analize_data

その後、requirements.txtに書かれているパッケージをインストールする。

[shell]
cd ~
git clone https://github.com/umentu/analize_data.git
cd ~/analize_data
pip install -r requirements.txt
[/shell]

Macの場合、matplotlibを使うときにエラーになる可能性があるため、以下を参考に設定を変更する。

【Mac】matplotlibをimportした際に「Python is not installed as a framework.」のエラー

 

create_data.pyでデータを生成

create_data.pyで解析するCSVデータを生成できる。

[shell]
python create_data.py
cat number_data.txt

990 7478
991 7289
992 7769
993 8683
994 7235
995 8367
996 7093
997 8711
998 7683
999 7471
[/shell]

試しに、ipythonを起動してCSVデータを読み込んでみる。

[shell]
ipython

In [1]: import scipy as sp
In [2]: data = sp.genfromtxt("./number_data.txt", delimiter="\t")

In [3]: data
Out[3]:
array([[ 0.00000000e+00, 1.98700000e+03],
[ 1.00000000e+00, 1.66900000e+03],
[ 2.00000000e+00, 2.29000000e+03],
…,
[ 9.97000000e+02, 8.71100000e+03],
[ 9.98000000e+02, 7.68300000e+03],
[ 9.99000000e+02, 7.47100000e+03]])
[/shell]

 

データをプロットする

analize.pyを実行すると、CSVデータを読み込んでグラフを描画する。

[shell]
python analize.py
[/shell]
analize

 

データから近似関数を求め描画する。

model.pyを実行すると、CSVデータから算出される近似関数を求め描画する。

[shell]
python model.py
[/shell]

model

詳細な説明は次回以降。