SlideShare a Scribd company logo
1 of 6
使用データ: TED動画 https://www.ted.com、Steve Jobsスピーチ http://news.stanford.edu/news/2005/june15/jobs-061505.html
動画向けアプリケーション テキスト向けウェブアプリケーション
英単語帳作成アプリケーション
• 背景、課題
英語の動画を視聴する際、未知の英単語を聞くと、前後の文脈から
意味を推測する必要があるため、動画の内容に集中できないことがある。
• 「英単語帳作成アプリケーション」による解決
本アプリケーションを用いて、動画ファイルから、
日本語訳を把握しておくと良い英単語のリスト(英単語帳)を取得する。
• 効果
視聴前に英単語を学習することで、視聴中に英単語の意味を
推測する必要がなくなるため、動画の内容を把握しやすくなる。
• 動画向けアプリケーション構成
動画
ファイル
Watson
Speech to Text
Node-RED
dashDB
(1)動画の音声を
テキスト化
(4)日本語訳を検索し、
難易度降順でソート
(3)出現頻度が高い英単語抽出、
SQL文作成
英単語難易度
(Google Books
Ngram)
日本語訳
(WordNet)
(2)テキスト送付/英単語リスト取得
動画向けアプリケーション
使用データ: 日本語WordNet http://nlpwww.nict.go.jp/wn-ja
Google Books Ngram http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
• テキスト向けウェブアプリケーション構成
• Bluemix活用ポイント
 大量の音声データをテキスト化できるWatson Speech to Textを活用
 Node-REDを用い、試行錯誤を繰り返す開発を効率化
 Vaadinを活用し、クライアントアプリのJavaコードをウェブアプリに流用することで、
開発工数削減
英文
テキスト
Vaadin
(1)テキスト送付/
結果表示
テキスト向けウェブアプリケーション
Node-RED
dashDB
(4)日本語訳を検索し、
難易度降順でソート
(3)出現頻度が高い
英単語抽出、SQL文作成
英単語難易度
(Google Books
Ngram)
日本語訳
(WordNet)
(2)テキスト送付/英単語リスト取得
使用データ: 日本語WordNet http://nlpwww.nict.go.jp/wn-ja
Google Books Ngram http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
以降、補足スライド
Node-REDで作成した処理
Node-REDを用いて、テキスト内の英単語の集計、SQL文作成処理を記述した。
対応英単語数
# 項目 英単語数
1 英単語難易度データ
(Google Books Ngram の
出現頻度上位データ)
714,071単語
2 日本語訳データ
(日本語WordNetの全登録データ)
80,171単語
3 本アプリの対応英単語数
(#1,2両データに存在する単語数)
44,224単語
※動画向け英単語帳作成アプリケーションの場合は、
#1,2とWatson Speech to Textの対応英単語の全てに存在する英単語の数になる。

More Related Content

Viewers also liked

俺の一日 濡れない、焼けない、遅刻しない
俺の一日 濡れない、焼けない、遅刻しない俺の一日 濡れない、焼けない、遅刻しない
俺の一日 濡れない、焼けない、遅刻しないYUSUKE MORIZUMI
 
みまもりWATニャン
みまもりWATニャンみまもりWATニャン
みまもりWATニャンYUSUKE MORIZUMI
 
Neo4j発表者募集
Neo4j発表者募集Neo4j発表者募集
Neo4j発表者募集洸平 土岐
 
オフラインファーストの思想と実践
オフラインファーストの思想と実践オフラインファーストの思想と実践
オフラインファーストの思想と実践Shumpei Shiraishi
 
Watsonでメール監視
Watsonでメール監視Watsonでメール監視
Watsonでメール監視YUSUKE MORIZUMI
 
ふぁ!?フォトソン君
ふぁ!?フォトソン君ふぁ!?フォトソン君
ふぁ!?フォトソン君YUSUKE MORIZUMI
 
1分で分かるdeveloperWorks Premium
1分で分かるdeveloperWorks Premium1分で分かるdeveloperWorks Premium
1分で分かるdeveloperWorks PremiumYUSUKE MORIZUMI
 
StrongLoopでサクっと始めるAPIエコノミー
StrongLoopでサクっと始めるAPIエコノミーStrongLoopでサクっと始めるAPIエコノミー
StrongLoopでサクっと始めるAPIエコノミーYUSUKE MORIZUMI
 
Presto - Hadoop Conference Japan 2014
Presto - Hadoop Conference Japan 2014Presto - Hadoop Conference Japan 2014
Presto - Hadoop Conference Japan 2014Sadayuki Furuhashi
 

Viewers also liked (13)

俺の一日 濡れない、焼けない、遅刻しない
俺の一日 濡れない、焼けない、遅刻しない俺の一日 濡れない、焼けない、遅刻しない
俺の一日 濡れない、焼けない、遅刻しない
 
Senrigan
SenriganSenrigan
Senrigan
 
Blue-mixer
Blue-mixerBlue-mixer
Blue-mixer
 
みまもりWATニャン
みまもりWATニャンみまもりWATニャン
みまもりWATニャン
 
Neo4j発表者募集
Neo4j発表者募集Neo4j発表者募集
Neo4j発表者募集
 
オフラインファーストの思想と実践
オフラインファーストの思想と実践オフラインファーストの思想と実践
オフラインファーストの思想と実践
 
Watsonでメール監視
Watsonでメール監視Watsonでメール監視
Watsonでメール監視
 
20170124 linux basic_1
20170124 linux basic_120170124 linux basic_1
20170124 linux basic_1
 
ふぁ!?フォトソン君
ふぁ!?フォトソン君ふぁ!?フォトソン君
ふぁ!?フォトソン君
 
20170124 linux basic_2
20170124 linux basic_220170124 linux basic_2
20170124 linux basic_2
 
1分で分かるdeveloperWorks Premium
1分で分かるdeveloperWorks Premium1分で分かるdeveloperWorks Premium
1分で分かるdeveloperWorks Premium
 
StrongLoopでサクっと始めるAPIエコノミー
StrongLoopでサクっと始めるAPIエコノミーStrongLoopでサクっと始めるAPIエコノミー
StrongLoopでサクっと始めるAPIエコノミー
 
Presto - Hadoop Conference Japan 2014
Presto - Hadoop Conference Japan 2014Presto - Hadoop Conference Japan 2014
Presto - Hadoop Conference Japan 2014
 

More from YUSUKE MORIZUMI

Bluemixハンズオン資料
Bluemixハンズオン資料Bluemixハンズオン資料
Bluemixハンズオン資料YUSUKE MORIZUMI
 
デジタル広告におけるブロックチェーンの適用
デジタル広告におけるブロックチェーンの適用デジタル広告におけるブロックチェーンの適用
デジタル広告におけるブロックチェーンの適用YUSUKE MORIZUMI
 
KituraとサーバーサイドSwift
KituraとサーバーサイドSwiftKituraとサーバーサイドSwift
KituraとサーバーサイドSwiftYUSUKE MORIZUMI
 
よく見てワトソン!
よく見てワトソン!よく見てワトソン!
よく見てワトソン!YUSUKE MORIZUMI
 

More from YUSUKE MORIZUMI (6)

Bluemixハンズオン資料
Bluemixハンズオン資料Bluemixハンズオン資料
Bluemixハンズオン資料
 
Developers circle vol1
Developers circle vol1Developers circle vol1
Developers circle vol1
 
デジタル広告におけるブロックチェーンの適用
デジタル広告におけるブロックチェーンの適用デジタル広告におけるブロックチェーンの適用
デジタル広告におけるブロックチェーンの適用
 
KituraとサーバーサイドSwift
KituraとサーバーサイドSwiftKituraとサーバーサイドSwift
KituraとサーバーサイドSwift
 
How to sign-up Twilio
How to sign-up TwilioHow to sign-up Twilio
How to sign-up Twilio
 
よく見てワトソン!
よく見てワトソン!よく見てワトソン!
よく見てワトソン!
 

Recently uploaded

【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成Hiroshi Tomioka
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 

Recently uploaded (9)

【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 

英単語帳作成アプリケーション

  • 1. 使用データ: TED動画 https://www.ted.com、Steve Jobsスピーチ http://news.stanford.edu/news/2005/june15/jobs-061505.html 動画向けアプリケーション テキスト向けウェブアプリケーション 英単語帳作成アプリケーション • 背景、課題 英語の動画を視聴する際、未知の英単語を聞くと、前後の文脈から 意味を推測する必要があるため、動画の内容に集中できないことがある。 • 「英単語帳作成アプリケーション」による解決 本アプリケーションを用いて、動画ファイルから、 日本語訳を把握しておくと良い英単語のリスト(英単語帳)を取得する。 • 効果 視聴前に英単語を学習することで、視聴中に英単語の意味を 推測する必要がなくなるため、動画の内容を把握しやすくなる。
  • 2. • 動画向けアプリケーション構成 動画 ファイル Watson Speech to Text Node-RED dashDB (1)動画の音声を テキスト化 (4)日本語訳を検索し、 難易度降順でソート (3)出現頻度が高い英単語抽出、 SQL文作成 英単語難易度 (Google Books Ngram) 日本語訳 (WordNet) (2)テキスト送付/英単語リスト取得 動画向けアプリケーション 使用データ: 日本語WordNet http://nlpwww.nict.go.jp/wn-ja Google Books Ngram http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
  • 3. • テキスト向けウェブアプリケーション構成 • Bluemix活用ポイント  大量の音声データをテキスト化できるWatson Speech to Textを活用  Node-REDを用い、試行錯誤を繰り返す開発を効率化  Vaadinを活用し、クライアントアプリのJavaコードをウェブアプリに流用することで、 開発工数削減 英文 テキスト Vaadin (1)テキスト送付/ 結果表示 テキスト向けウェブアプリケーション Node-RED dashDB (4)日本語訳を検索し、 難易度降順でソート (3)出現頻度が高い 英単語抽出、SQL文作成 英単語難易度 (Google Books Ngram) 日本語訳 (WordNet) (2)テキスト送付/英単語リスト取得 使用データ: 日本語WordNet http://nlpwww.nict.go.jp/wn-ja Google Books Ngram http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
  • 6. 対応英単語数 # 項目 英単語数 1 英単語難易度データ (Google Books Ngram の 出現頻度上位データ) 714,071単語 2 日本語訳データ (日本語WordNetの全登録データ) 80,171単語 3 本アプリの対応英単語数 (#1,2両データに存在する単語数) 44,224単語 ※動画向け英単語帳作成アプリケーションの場合は、 #1,2とWatson Speech to Textの対応英単語の全てに存在する英単語の数になる。