2017年12月6日に実施した、「ソニーのNeural Network Console大勉強会~何ができる?どう使う?質問しよう!~」で使用したスライド資料です。
This is a slide of "Seminar of Sony's Neural Network Console" held in 6th December.
[db analytics showcase Sapporo 2017] B14: GPU コンピューティング最前線 by エヌビディア 佐々木邦暢Insight Technology, Inc.
GPUの演算能力を汎用的に活用する「GPUコンピューティング」が誕生してはや10年。多くのスーパーコンピューターに採用されるなど科学技術計算の領域で実績を積み重ねたこの技術は、近年のAIムーブメントを支える重要な存在になっています。高度な画像認識、自然言語処理、そして自動運転などますます複雑になる問題のために登場した Volta 世代の新型GPUをはじめ、GPUコンピューティングの最新情報をお伝えします。
32. Keras と GPU 版 TensorFlow をインストール
(tensorflow-with-gpu) $ pip install keras tensorflow-gpu
(tensorflow-with-gpu) $ pip list --format=columns | grep -i -e keras -e tensorflow
Keras 2.0.8
tensorflow-gpu 1.3.0
tensorflow-tensorboard 0.1.5
sudo apt install nvidia-cuda-dev
sudo apt update
sudo apt upgrade
33. git clone keras
> cd
> mkdir src
> cd src
> git clone https://github.com/fchollet/keras.git
> cd keras/examples
34. mnist サンプルを実行
## 時間計測を行い mnist cnn を実行する
> time python mnist_cnn.py
Test loss: 0.0300338261104
Test accuracy: 0.9902
real 2m5.097s
user 0m54.152s
sys 1m15.292s
35. GPU稼働情報を表示
> nvidia-smi
Sat Sep 2 18:33:33 2017
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 384.69 Driver Version: 384.69 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 105... Off | 00000000:01:00.0 Off | N/A |
| N/A 43C P0 N/A / N/A | 398MiB / 4041MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 1129 G /usr/lib/xorg/Xorg 224MiB |
| 0 1848 G compiz 135MiB |
| 0 2712 G ...el-token=A824897B35D121CF49ACBD4502480B90 36MiB |
| 0 3840 G /usr/lib/firefox/firefox 1MiB |
+-----------------------------------------------------------------------------+
36. 今度はCPUで計測
$ pip uninstall -y tensorflow-gpu
$ pip install tensorflow
$ time python mnist_cnn.py
Test loss: 0.0295431383794
Test accuracy: 0.9893
real 18m30.578s
user 122m28.916s
sys 10m3.364s
37. MNIST データ セット
National Institute of Standards and Technology(米国国立標準技術研究所)の混
合データ セット (MNIST データ セット) は、画像認識(IR)アルゴリズムを比較す
る際のベンチマーク。データ セットには計 70,000 枚の画像が含まれていて
60,000 枚は学習用画像 (IR モデルの作成に使用) で 10,000 枚は判別用画像 (モデ
ルの精度の評価に使用)。各 MNIST 画像は、1 つの手書き数字をデジタル化した
もの。サイズはそれぞれ 28 x 28 ピクセルです。各ピクセル値は 0 (白) ~ 255
(黒) の値で、中間のピクセル値は灰色の網かけを表す。各画像の数値を識別する
のは、人間には簡単ですが、コンピューターにとっては至難の業です。