SlideShare a Scribd company logo
1 of 34
Download to read offline
NNCチャレンジ!
〜「最近よく使われるオノマトペ」の
ラベルを画像につける〜
NNC(Neural Network Console)とは、
ソニーネットワークコミュニケーションズ株式会社が開
発・運営する、ディープラーニングの開発基盤。
GUI画面でドラッグ&ドロップにより簡単にニューラル
ネットワークを作成でき、Pythonコードがかけなくても
すぐにAI開発が始められる。機械学習で使用するレイ
ヤーを豊富に揃えているだけでなく、学習履歴の保存機
能やネットワークの構造を自動で編集してくれる機能も
あり、めちゃくちゃ便利。
NNC(Neural Network Console)とは
2
1.
InTRODUCTION
3
INTRODUCTIONS
✖ 選択したテーマ
○ ①人物画像をNNCで学習させ新しいオノマトペの画像カ
テゴリ分類を作り出す
✖ テーマ選択理由と分類カテゴリの決定方法
○ 新しい感覚で画像を検索したい
○ 現在、PIXTAでは検索結果が0件〜数件程度のオノマトペ
を画像タグとできるようにする
4
オノマトペとは
物や人の状態を表す擬音語や擬態語
キラキラ、ウキウキ、ザーザー など
5
INTRODUCTIONS
✖ 設定したオノマトペ
6
わくてか
期待や嬉しさ、喜びで、
心が弾んでいる様子を表す
つよつよ
非常に強いさま。
きわめて丈夫なさま
しゅっと
今風、あか抜けた、洗練された、
すっきりとした、かっこいい
きゅんきゅん
感動して胸が締めつけられるような
気持ちになるさま
わーきゃー
複数人で元気に騒ぐさま
学習用データ提供:PIXTA
2.
METHOD
さあ、早速チャレンジしてみよう!
7
1. 画像前処理を行う
1.1. Average Hashで類似の画像をまとめる
1.2. 手動で中身を調整する(根性)
1.3. サイズ調整とアノテーション
2. モデルを構築する(試行錯誤)
2.1. 基本的なCNN
2.2. ResNet-18、ResNet-50
3. 結果とまとめ
MEthods
8
9
1. 画像前処理を行う
1.1. Average Hashで類似の画像をまとめる
10,000点のデータから
指定した画像とAverage Hash
が近いデータを対象フォル
ダにコピーする
10
10,000点のデータから
指定した画像とAverage Hash
が近いデータを対象フォル
ダにコピーする
11
10,000点のデータから
指定した画像とAverage
Hashが近いデータを図のよ
うに取得し、対象フォルダ
にコピーする
12
1. 画像前処理を行う
1.2. 手動で中身を調整する
フォルダ内の画像のうち、意
図したアノテーションに該当
しないものは除いた(主観)
また、目標は画像に対してオ
ノマトペのラベルを付けるこ
とであり、付与するラベルは1
つとは限らないため、
同一ファイルが複数のフォル
フだに存在するのはOKとし
た。
13
1. 画像前処理を行う
1.3. サイズ調整とアノテーション
画像のサイズや色設定を変更し、
各画像へのラベルづけをする
14
1. 画像前処理を行う
1.3. サイズ調整とアノテーション
アップローダを使用して、
データをアップロード
15
2. モデルを構築する
2.1. 基本的なCNN
早速、NNCの画面を使用し、簡単なネットワークを作成していきます。
画像サイズは32*32、64*64、128*128を試したが、
いずれも精度は30%程度しかなかった。
16
2. モデルを構築する
2.2. ResNet-18を使用
精度が出なかったため、ネットワークはResNetを使用することにした。
CPUを使用していたため、まずは一番軽量なResNet-18を選択。
画像サイズは128*128(RGB)とした。
17
2. モデルを構築する
2.2. ResNet-18を使用
CPUを使用すると、50epochでも学習完了までに約45時間かかってしまう。
これでは精度が上がらなくてもやり直しにとても時間がかかる。
そのため、GPUを使用することにした。
45時間!
18
2. モデルを構築する
2.2. ResNet-18を使用
GPU(v100*1)をお借りすると、100epochでもたったの6分半で学習が完
了した。
パラメータ調整したり再学習したりが一気にやりやすくなった!!
6分半!
19
2. モデルを構築する
2.2. ResNet-18を使用
GPUを使って学習を進めると精度がかなり上がってきたように見える。もう
少し良い精度まで持っていきたいが、今回はネットワークをいじったりや
独自ロス関数の使用は行う時間が無い。
もっと精度を上げるために...
やったこと
✖ 再学習を行ってみる
→それなりに精度はあがった
✖ 画像の解像度をあげる(画像が複雑なので効果ありそう)
→ あまり効果はなかった
 解像度を下げてもそれ何に特徴量を抽出できている
ResNet-18 → ResNet-50へ変えてみる
20
21
2. モデルを構築する
2.3. ResNet-50を使用
ResNet-50に変更してみた。
22
2. モデルを構築する
2.3. ResNet-50を使用
なんと、結果は悪くなってしまった。
データ作成の際に画像の雰囲気をざっくり見てアノテーションしたので、
画像の細かいところまで見すぎると、逆に良くなかったのかもしれない。
23
2. モデルを構築する
2.4. ResNet-18(input:480*480)でおちつく
最終的に
ResNet-18でおちついた
24
2. モデルを構築する
2.4. ResNet-18(input:480*480)でおちつく
学習は順調に進んだ
3.
RESULT & conclusion
画像にオノマトペがついた!
25
26
3. 結果とまとめ
3.1. EVALUATION
60%前後となった!
わくてか
27
3. 結果とまとめ
3.2. 画像へのラベリング
つよつよ
28
3. 結果とまとめ
3.2. 画像へのラベリング
しゅっと
29
3. 結果とまとめ
3.2. 画像へのラベリング
きゅんきゅん
30
3. 結果とまとめ
3.2. 画像へのラベリング
わーきゃー
31
3. 結果とまとめ
3.2. 画像へのラベリング
まとめ
✖ 今回はResNet-18をほぼそのまま利用した
✖ 使用する画像サイズは128×128と480×480の
どちらも精度はほとんど変わらなかった
⇒60%程度
✖ 精度は高くないが、画像に対していくつかラベルを付
与したいため、回答が不正解でもNGではないと考えら
れる(わくてか(正)>0.3、わーきゃー(不)>0.35など)
✖ 画像はあまり細かく見過ぎない方がいいかもしれない
(ResNet-50はダメだった)
32
Hello!
川上詩織(Kawakami Shiori)
You can find me at:
@sk_we11dan
http://facebook.com/shiori.kawakami.75
33
株式会社エクスで最新技術の調査研究を行っています
自己紹介
Thanks!
34

More Related Content

Similar to NNCチャレンジ!〜「最近よく使われるオノマトペ」の ラベルを画像につける〜

人工知能のコードをハックする会 #2
人工知能のコードをハックする会 #2人工知能のコードをハックする会 #2
人工知能のコードをハックする会 #2Ryohei Kamiya
 
[DL Hacks]OCNet: Object Context Networkfor Scene Parsing
[DL Hacks]OCNet: Object Context Networkfor Scene Parsing[DL Hacks]OCNet: Object Context Networkfor Scene Parsing
[DL Hacks]OCNet: Object Context Networkfor Scene ParsingDeep Learning JP
 
01 idea table3.0
01 idea table3.001 idea table3.0
01 idea table3.0umisuzume
 
2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open source2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open sourceYoshiyuki Nakamura
 
march report in japanese
march report in japanesemarch report in japanese
march report in japanesenao takatoshi
 
【Deep Learning】AlexNetの解説&実装 by PyTorch (colabリンク付き)
【Deep Learning】AlexNetの解説&実装 by PyTorch (colabリンク付き)【Deep Learning】AlexNetの解説&実装 by PyTorch (colabリンク付き)
【Deep Learning】AlexNetの解説&実装 by PyTorch (colabリンク付き)Daichi Hayashi
 
AIがAIを生み出す?
AIがAIを生み出す?AIがAIを生み出す?
AIがAIを生み出す?Daiki Tsuchiya
 
Azure Antenna AI 概要
Azure Antenna AI 概要Azure Antenna AI 概要
Azure Antenna AI 概要Miho Yamamoto
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~nlab_utokyo
 
日本仮想化技術株式会社のインターンシップについて
日本仮想化技術株式会社のインターンシップについて日本仮想化技術株式会社のインターンシップについて
日本仮想化技術株式会社のインターンシップについてVirtualTech Japan Inc./Begi.net Inc.
 
Ncnn a universal and efficient neural network inference with vulkan
Ncnn  a universal and efficient neural network inference with vulkanNcnn  a universal and efficient neural network inference with vulkan
Ncnn a universal and efficient neural network inference with vulkankcnguo
 
2018/3/23 Introduction to Deep Learning by Neural Network Console
2018/3/23 Introduction to Deep Learning by Neural Network Console2018/3/23 Introduction to Deep Learning by Neural Network Console
2018/3/23 Introduction to Deep Learning by Neural Network ConsoleSony Network Communications Inc.
 
鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る
鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る
鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知るKazuki Nakajima
 
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...de:code 2017
 
Scikit-learnを使って 画像分類を行う
Scikit-learnを使って 画像分類を行うScikit-learnを使って 画像分類を行う
Scikit-learnを使って 画像分類を行うArata Honda
 
機械学習 (AI/ML) 勉強会 #1 基本編
機械学習 (AI/ML) 勉強会 #1 基本編機械学習 (AI/ML) 勉強会 #1 基本編
機械学習 (AI/ML) 勉強会 #1 基本編Fujio Kojima
 
Intalio japan special cloud workshop
Intalio japan special cloud workshopIntalio japan special cloud workshop
Intalio japan special cloud workshopDaisuke Sugai
 
Power biで気づく!現場機器の異常監視システム on azure
Power biで気づく!現場機器の異常監視システム on azurePower biで気づく!現場機器の異常監視システム on azure
Power biで気づく!現場機器の異常監視システム on azureIoTビジネス共創ラボ
 
mi-8. 人工知能とコンピュータビジョン
mi-8. 人工知能とコンピュータビジョンmi-8. 人工知能とコンピュータビジョン
mi-8. 人工知能とコンピュータビジョンkunihikokaneko1
 

Similar to NNCチャレンジ!〜「最近よく使われるオノマトペ」の ラベルを画像につける〜 (20)

人工知能のコードをハックする会 #2
人工知能のコードをハックする会 #2人工知能のコードをハックする会 #2
人工知能のコードをハックする会 #2
 
[DL Hacks]OCNet: Object Context Networkfor Scene Parsing
[DL Hacks]OCNet: Object Context Networkfor Scene Parsing[DL Hacks]OCNet: Object Context Networkfor Scene Parsing
[DL Hacks]OCNet: Object Context Networkfor Scene Parsing
 
01 idea table3.0
01 idea table3.001 idea table3.0
01 idea table3.0
 
BriCAプラットフォーム説明会(2022-05)
BriCAプラットフォーム説明会(2022-05)BriCAプラットフォーム説明会(2022-05)
BriCAプラットフォーム説明会(2022-05)
 
2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open source2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open source
 
march report in japanese
march report in japanesemarch report in japanese
march report in japanese
 
【Deep Learning】AlexNetの解説&実装 by PyTorch (colabリンク付き)
【Deep Learning】AlexNetの解説&実装 by PyTorch (colabリンク付き)【Deep Learning】AlexNetの解説&実装 by PyTorch (colabリンク付き)
【Deep Learning】AlexNetの解説&実装 by PyTorch (colabリンク付き)
 
AIがAIを生み出す?
AIがAIを生み出す?AIがAIを生み出す?
AIがAIを生み出す?
 
Azure Antenna AI 概要
Azure Antenna AI 概要Azure Antenna AI 概要
Azure Antenna AI 概要
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~
 
日本仮想化技術株式会社のインターンシップについて
日本仮想化技術株式会社のインターンシップについて日本仮想化技術株式会社のインターンシップについて
日本仮想化技術株式会社のインターンシップについて
 
Ncnn a universal and efficient neural network inference with vulkan
Ncnn  a universal and efficient neural network inference with vulkanNcnn  a universal and efficient neural network inference with vulkan
Ncnn a universal and efficient neural network inference with vulkan
 
2018/3/23 Introduction to Deep Learning by Neural Network Console
2018/3/23 Introduction to Deep Learning by Neural Network Console2018/3/23 Introduction to Deep Learning by Neural Network Console
2018/3/23 Introduction to Deep Learning by Neural Network Console
 
鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る
鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る
鳥肌必至のニューラルネットワークによる近未来の画像認識技術を体験し、IoTの知られざるパワーを知る
 
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
 
Scikit-learnを使って 画像分類を行う
Scikit-learnを使って 画像分類を行うScikit-learnを使って 画像分類を行う
Scikit-learnを使って 画像分類を行う
 
機械学習 (AI/ML) 勉強会 #1 基本編
機械学習 (AI/ML) 勉強会 #1 基本編機械学習 (AI/ML) 勉強会 #1 基本編
機械学習 (AI/ML) 勉強会 #1 基本編
 
Intalio japan special cloud workshop
Intalio japan special cloud workshopIntalio japan special cloud workshop
Intalio japan special cloud workshop
 
Power biで気づく!現場機器の異常監視システム on azure
Power biで気づく!現場機器の異常監視システム on azurePower biで気づく!現場機器の異常監視システム on azure
Power biで気づく!現場機器の異常監視システム on azure
 
mi-8. 人工知能とコンピュータビジョン
mi-8. 人工知能とコンピュータビジョンmi-8. 人工知能とコンピュータビジョン
mi-8. 人工知能とコンピュータビジョン
 

Recently uploaded

TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成Hiroshi Tomioka
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 

Recently uploaded (9)

TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 

NNCチャレンジ!〜「最近よく使われるオノマトペ」の ラベルを画像につける〜