Submit Search
Upload
ツッコミを入れてくれるAIスピーカー「Ahoca」を作った話
•
Download as PPTX, PDF
•
0 likes
•
509 views
洸
洸介 藤田
Follow
RaspberryPiと異常検知技術を用いて、ツッコミAIスピーカーを作りました。Brainpadの社内LTスライドです。
Read less
Read more
Data & Analytics
Report
Share
Report
Share
1 of 31
Download now
Recommended
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
Yusuke Uchida
DeNA TechCon 2018での講演資料です。 「深層学習、特に畳み込みニューラルネットワーク (CNN) の進化により、近年のコンピュータビジョン技術は急速に発展しています。CNNは画像分類だけではなく、物体検出、セグメンテーション、姿勢推定といった様々なタスクに利用されています。 本公演では、近年提案されている様々なCNNや物体検出手法を解説します。また、これらの技術の応用として、車載カメラ画像認識を用いた運転行動モニタリングについて紹介します。」
ネット選挙大分市選管
ネット選挙大分市選管
Yuki Fujino Oita Univ.
Otsuma(2010713)
Otsuma(2010713)
真 岡本
Hadoopエンタープライズソリューションセミナー2012: Hadoop&RabbitMQを利用したTwitter全量リアルタイム解析
Hadoopエンタープライズソリューションセミナー2012: Hadoop&RabbitMQを利用したTwitter全量リアルタイム解析
Kenji Hara
2012/12/20に東京コンファレンスセンター品川で開催された『Hadoopエンタープライズソリューションセミナー』(NTTデータ主催)での講演資料です。 講演概要 == NTTコミュニケーションズはソーシャルメディアをリアルタイムに解析する大規模データ処理基盤を開発しており、クチコミ分析サービス「BuzzFinder」では日本語ツイートの全量をリアルタイムに分析しています。 本セッションではHadoopとRabbitMQを活用した大規模日本語データ解析の事例をご紹介します。
人工知能に何ができないか? ー ゲームと人工知能の視点から -
人工知能に何ができないか? ー ゲームと人工知能の視点から -
Youichiro Miyake
2017年11月11日 秀明大学における講演。 http://www.shumei-u.ac.jp/festa2017/single-project-sm.html
Watanabe civictechforum
Watanabe civictechforum
siramatu-lab
watanabe wants to make community with LOD of activity
人工知能技術の現状-今後の見通し-社会へのインパクト-岡夏樹
人工知能技術の現状-今後の見通し-社会へのインパクト-岡夏樹
KIT Cognitive Interaction Design
最近発展が著しい人工知能(AI)技術を次のように整理してできるだけ分かりやすく解説 1. AIにとっては難しいと言われてきたことで最近できるようになったこと。これらが共通に持つ性質は何か。 2. 最新のAIでも難しいこと。それらはなぜ難しいのか。 3. 将来の見通し。いつ頃、何ができるようになりそうか。 4. 社会へのインパクト。最近AIによってできるようになったこと、近い将来できるようになりそうなことは、社会をどう変革するか?我々はそれにどう備えるべきか? 最後に、本学で保有するAI技術とその応用例の一部を簡単に紹介
Otsuma(2010727)
Otsuma(2010727)
真 岡本
Recommended
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
Yusuke Uchida
DeNA TechCon 2018での講演資料です。 「深層学習、特に畳み込みニューラルネットワーク (CNN) の進化により、近年のコンピュータビジョン技術は急速に発展しています。CNNは画像分類だけではなく、物体検出、セグメンテーション、姿勢推定といった様々なタスクに利用されています。 本公演では、近年提案されている様々なCNNや物体検出手法を解説します。また、これらの技術の応用として、車載カメラ画像認識を用いた運転行動モニタリングについて紹介します。」
ネット選挙大分市選管
ネット選挙大分市選管
Yuki Fujino Oita Univ.
Otsuma(2010713)
Otsuma(2010713)
真 岡本
Hadoopエンタープライズソリューションセミナー2012: Hadoop&RabbitMQを利用したTwitter全量リアルタイム解析
Hadoopエンタープライズソリューションセミナー2012: Hadoop&RabbitMQを利用したTwitter全量リアルタイム解析
Kenji Hara
2012/12/20に東京コンファレンスセンター品川で開催された『Hadoopエンタープライズソリューションセミナー』(NTTデータ主催)での講演資料です。 講演概要 == NTTコミュニケーションズはソーシャルメディアをリアルタイムに解析する大規模データ処理基盤を開発しており、クチコミ分析サービス「BuzzFinder」では日本語ツイートの全量をリアルタイムに分析しています。 本セッションではHadoopとRabbitMQを活用した大規模日本語データ解析の事例をご紹介します。
人工知能に何ができないか? ー ゲームと人工知能の視点から -
人工知能に何ができないか? ー ゲームと人工知能の視点から -
Youichiro Miyake
2017年11月11日 秀明大学における講演。 http://www.shumei-u.ac.jp/festa2017/single-project-sm.html
Watanabe civictechforum
Watanabe civictechforum
siramatu-lab
watanabe wants to make community with LOD of activity
人工知能技術の現状-今後の見通し-社会へのインパクト-岡夏樹
人工知能技術の現状-今後の見通し-社会へのインパクト-岡夏樹
KIT Cognitive Interaction Design
最近発展が著しい人工知能(AI)技術を次のように整理してできるだけ分かりやすく解説 1. AIにとっては難しいと言われてきたことで最近できるようになったこと。これらが共通に持つ性質は何か。 2. 最新のAIでも難しいこと。それらはなぜ難しいのか。 3. 将来の見通し。いつ頃、何ができるようになりそうか。 4. 社会へのインパクト。最近AIによってできるようになったこと、近い将来できるようになりそうなことは、社会をどう変革するか?我々はそれにどう備えるべきか? 最後に、本学で保有するAI技術とその応用例の一部を簡単に紹介
Otsuma(2010727)
Otsuma(2010727)
真 岡本
デジタルメディア創作部勉強会「オブジェクト指向入門1」
デジタルメディア創作部勉強会「オブジェクト指向入門1」
Hokuto Tateyama
Data scientist casual talk in 白金台
Data scientist casual talk in 白金台
Hiroko Onari
河野ゼミ研究紹介20211020
河野ゼミ研究紹介20211020
義広 河野
河野ゼミ 研究紹介
人類のデータを使って学習する 人工主体の公共的役割を考える
人類のデータを使って学習する 人工主体の公共的役割を考える
Hiro Hamada
https://phsc.jp/conference.html#2022_aki
ゲームの中の人工知能
ゲームの中の人工知能
Youichiro Miyake
Slide for my Lecture of Game AI held in Tamagawa University on 2014.6.26
サイバーエージェントにおける計算社会科学
サイバーエージェントにおける計算社会科学
Masanori Takano
東京大学 メディアコンテンツ特別講義1 #utmc1
最終報告会
最終報告会
Kazuhiro Ikeda
2011年2月19日の最終報告会におけるプレゼン資料です。プロジェクトの1年間の活動のまとめとなっております。
More Related Content
Similar to ツッコミを入れてくれるAIスピーカー「Ahoca」を作った話
デジタルメディア創作部勉強会「オブジェクト指向入門1」
デジタルメディア創作部勉強会「オブジェクト指向入門1」
Hokuto Tateyama
Data scientist casual talk in 白金台
Data scientist casual talk in 白金台
Hiroko Onari
河野ゼミ研究紹介20211020
河野ゼミ研究紹介20211020
義広 河野
河野ゼミ 研究紹介
人類のデータを使って学習する 人工主体の公共的役割を考える
人類のデータを使って学習する 人工主体の公共的役割を考える
Hiro Hamada
https://phsc.jp/conference.html#2022_aki
ゲームの中の人工知能
ゲームの中の人工知能
Youichiro Miyake
Slide for my Lecture of Game AI held in Tamagawa University on 2014.6.26
サイバーエージェントにおける計算社会科学
サイバーエージェントにおける計算社会科学
Masanori Takano
東京大学 メディアコンテンツ特別講義1 #utmc1
最終報告会
最終報告会
Kazuhiro Ikeda
2011年2月19日の最終報告会におけるプレゼン資料です。プロジェクトの1年間の活動のまとめとなっております。
Similar to ツッコミを入れてくれるAIスピーカー「Ahoca」を作った話
(7)
デジタルメディア創作部勉強会「オブジェクト指向入門1」
デジタルメディア創作部勉強会「オブジェクト指向入門1」
Data scientist casual talk in 白金台
Data scientist casual talk in 白金台
河野ゼミ研究紹介20211020
河野ゼミ研究紹介20211020
人類のデータを使って学習する 人工主体の公共的役割を考える
人類のデータを使って学習する 人工主体の公共的役割を考える
ゲームの中の人工知能
ゲームの中の人工知能
サイバーエージェントにおける計算社会科学
サイバーエージェントにおける計算社会科学
最終報告会
最終報告会
ツッコミを入れてくれるAIスピーカー「Ahoca」を作った話
1.
と を使って ツッコミAIスピーカー Ahoca を作った話 ふじた
2.
このスライドについて このスライドはBrainPadの 社内LTで発表した内容です 2
3.
自己紹介 藤田 洸介
略歴 東京生まれ東京育ち 慶應義塾大学環境情報学部(通称SFC) 専攻(と呼べるほどのものはない) 研究室のキーワード『おしゃべりなロングテール』 現代社会のロングテール(たとえば、ラブライバー、アダルトビデオ、ゆめかわいい) に対しインターネット上のデータを収集、解析、解釈して言語化、構造化、可視 化するゼミ 自分の研究はお笑いの好みとコンプレックス(以下ざっくり説明) 仮説:笑いの好みとコンプレックスは関係性がある データ1:ネット大喜利サービス、ボケてのデータを収集し、ボケをクラスタリ ング データ2:大喜利の面白さ評価と、コンプレックに関するアンケートを行うWEB アプリを作成 結果:WEBアプリで笑いの評価をすると、笑いの好みとコンプレックスタイプを 示してくれるWEBアプリを作成 3 ふじた こうすけ
4.
今日伝えたいこと 笑いをデータで表現する可能性 意訳:あんまりハードル上げないでね Raspberry Piは慣れないとつらい 意訳:今週寝不足なのでやさしく見守ってね 4
5.
今日の構成 1.笑い学 2.ツッコミAIスピーカーの中身 3.実機デモ 5
6.
6 なんでおもしろい?
7.
学問としての笑いの分類 7 生物学的考察 社会学的考察 表現論的考察 哲学的考察 人間は生物として「笑うという行為」にどんな意味 があるのか 集団や社会において、「笑い」がどんな機能を果た しているか 「笑わせる素」になるものは何があるのか 「笑い」はどんな心理的メカニズム・プロセスで生 じるのか 藤田の興味分野&今日の話題 (出典:井上宏『笑い学のすすめ』世界思想社)
8.
笑いのメカニズム 笑いの不一致説 8 笑いの二元結合説
笑いの優越説 笑いの緊張解放説 予期していたある概念と、これと関連して考えられた事物が一致しないと 突然分かったときに笑いが生じる 3段オチ ⇒2回同じことを繰り返し、3回目で予想を外して違うことをする 例 不一致のものあるいは関係の無いものが、ある同一平面上で結合するとき 二人連れが天婦羅を食べに行って、一方が「この海老は養殖 かな?」と聞くと、他方が「いや、和食やで」と答える場合 例 (論文引用) 他者の劣等性と比較して、現在の自分の優位性を突如感じることから生ず る勝利の感情 友人が目の前でコケた時例 緊張した束縛から、突然解放されるときに生じる感情 お葬式でだれかが長~いオナラをしたとき例
9.
「お前がラフな…」の笑いを紐解いてみる 9 1. 文章の内容と、画像がマッチしている 2. 「ラフな服装」と「骸骨」という概念が、身 にまとうものが簡単という意味でマッチして いる ⇒
笑いの二元結合説! 3. 「ラフな服装」と「骸骨」という概念が実際 の常識とズレている ⇒ 笑いの不一致説! 4. 周りの人が正装で来ているのに、ある人だけ 軽装 ⇒ 笑いの優越説! 5. 「明日ラフな格好して行って周りが正装だっ たら恥ずかしいな・・・」という緊張感と、実際 に別の誰かがそうなっていた状況の対比 ⇒ 笑いの緊張解放説! だから面白い!
10.
「お前がラフな…」の笑いを紐解いてみる 10 1. 文章の内容と、画像がマッチしている 2. 「ラフな服装」と「骸骨」という概念が、身 にまとうものが簡単という意味でマッチして いる ⇒
笑いの二元結合説! 3. 「ラフな服装」と「骸骨」という概念が実際 の常識とズレている ⇒ 笑いの不一致説! 4. 周りの人が正装で来ているのに、ある人だけ 軽装 ⇒ 笑いの優越説! 5. 「明日ラフな格好して行って周りが正装だっ たら恥ずかしいな・・・」という緊張感と、実際 に別の誰かがそうなっていた状況の対比 ⇒ 笑いの緊張解放説! だから面白い! ちょっと待ってください
11.
「お前がラフな…」の笑いを紐解いてみる 11 1. 文章の内容と、画像がマッチしている 2. 「ラフな服装」と「骸骨」という概念が、身 にまとうものが簡単という意味でマッチして いる ⇒
笑いの二元結合説! 3. 「ラフな服装」と「骸骨」という概念が実際 の常識とズレている ⇒ 笑いの不一致説! 4. 周りの人が正装で来ているのに、ある人だけ 軽装 ⇒ 笑いの優越説! 5. 「明日ラフな格好して行って周りが正装だっ たら恥ずかしいな・・・」という緊張感と、実際 に別の誰かがそうなっていた状況の対比 ⇒ 笑いの緊張解放説! だから面白い! これを5歳児が見ても笑うでしょうか?
12.
「お前がラフな…」の笑いを紐解いてみる 12 1. 文章の内容と、画像がマッチしている 2. 「ラフな服装」と「骸骨」という概念が、身 にまとうものが簡単という意味でマッチして いる ⇒
笑いの二元結合説! 3. 「ラフな服装」と「骸骨」という概念が実際 の常識とズレている ⇒ 笑いの不一致説! 4. 周りの人が正装で来ているのに、ある人だけ 軽装 ⇒ 笑いの優越説! 5. 「明日ラフな格好して行って周りが正装だっ たら恥ずかしいな・・・」という緊張感と、実際 に別の誰かがそうなっていた状況の対比 ⇒ 笑いの緊張解放説! だから面白い! これを5歳児が見ても笑うでしょうか? NO
13.
「お前がラフな…」の笑いを紐解いてみる 13 1. 文章の内容と、画像がマッチしている 2. 「ラフな服装」と「骸骨」という概念が、身 にまとうものが簡単という意味でマッチして いる ⇒
笑いの二元結合説! 3. 「ラフな服装」と「骸骨」という概念が実際 の常識とズレている ⇒ 笑いの不一致説! 4. 周りの人が正装で来ているのに、ある人だけ 軽装 ⇒ 笑いの優越説! 5. 「明日ラフな格好して行って周りが正装だっ たら恥ずかしいな・・・」という緊張感と、実際 に別の誰かがそうなっていた状況の対比 ⇒ 笑いの緊張解放説! だから面白い! これを5歳児が見ても笑うでしょうか? NO Why?
14.
笑いを理解するのには常識が必要 1人だけ服装が違うと恥ずかしいという 常識が必要 「ラフな格好」という概念と「骸骨」を 結び付けられる常識が必要
周りの服装を気にして、恐る恐る服を選 ぶ経験が必要 14 この例の場合・・・ つまり、 データ分析の文脈で笑いを扱うためには、何かしらの方法 で常識を覚えさせなければならず、非常にハードルが高い 笑いという分野において、数値解析が進んでいないのはおそらくこれが要因
15.
でも、それをつくりました! 15
16.
1.笑い学 2.ツッコミAIスピーカーの中身 3.実機デモ 16
17.
AIスピーカー元年 17
18.
AIスピーカーは賢く家電を操作する 18 画像元:https://allabout.co.jp/gm/gc/472269/ OK Google! エアコンを付けて! はい、暖房を起動します
19.
でもボケには対応してくれない 19 画像元:https://allabout.co.jp/gm/gc/472269/ OK Google! 暖房を8000度にセットして!(????) 暖房を起動します
20.
これを作った! 20 画像元:https://allabout.co.jp/gm/gc/472269/ OK Google! 暖房を8000度にセットして! 焼け死ぬわ!!!
21.
ツッコミAIスピーカー Ahoca! 21※単純にRaspberry Pi、スピーカーのみ
22.
システム概要図 22 暖房8000度! 熱いわ! Cloud Speech APIマイク 音声 データ ボケ検知 モジュール AquesTalk (合成音声) 音声 データ スピーカー テキスト データ ツッコミ テキスト CSV ファイル ツッコミ発話機能 AquesTalk (合成音声) 音声 データ スピーカー ボケ テキスト Cloud Speech API 音声 データ ツッコミ テキスト ツッコミ記録機能 保存 保存 もはや冷房 じゃないだろ! 冷房を90度 に設定します マイク
23.
ボケの検知 23 笑いの不一致説では、予測した 常識に対して不一致のときに笑 いが生まれるとされる エアコンで設定できる温度は通常 18~31度程度 夏場は冷房、冬場は暖房を入れる
温度は1度単位で設定し、小数点 までは入力しない エアコン設定の常識 音声入力内容が常識から外れ、 笑いが生まれる状況が作り出されている場合 ボケとして検知! 笑いのメカニズム 今回対応するツッコミは、数値データで扱いやすい、エアコンの設定入力のみ
24.
ボケ=異常 として異常検知を行う 24 通常の設定温度データの分布 = (引用:出手
剛『異常検知と変化検知』) 入力温度18 30 イメージ図 正常データ = 常識 ボケの設定温度データ = 異常データ 𝑥′′ (=2) 異常 正常
25.
正常データ分布の推定 入力データ WEB上で公開されている、エアコンの設定温度に関するアンケートをマージ
アンケート数:6 合計モニター数:9050 設定温度分布推定方法 粒度 :冷房、暖房それぞれで推定 推定分布:混合正規分布 推定手法:EMアルゴリズム 結果 25 冷房の設定温度分布と推定確率密度分布 暖房の設定温度分布と推定確率密度分布 確率確率 温度 温度
26.
異常値の定義 26 異常度は以下に定義 Kは分布の個数 𝒙は入力値 𝜇
𝑘分布kの平均 Σ 𝑘分布kの共分散 𝝅 𝒌は各クラスタの混合重み 𝑘=1 𝐾 𝝅 𝒌 = 1 𝑎 𝑥 > 𝑎 𝑡ℎなら異常と判定 𝑎 𝑡ℎ=10 冷房温度データに恣意的に異常データを加え、異常度を計算 冷房の異常度分布 ボケではなく真面目に温度を入 力した際に、ボケだと判定され てつっこまれると悲しい ⇒緩めに設定 例えば、15度や35度は正常と判断
27.
今回対応するツッコミ 1. 入力温度の高低に対するツッコミ アンケートデータをもとに正常な入力値の分布を推定し
入力温度の推定確率を算出 確率を元に異常度を定義し、異常度が設定した閾値を超えたら異常(ボケ) と検知 入力の温度によって場合分けしてツッコミを入れる(入れない) 2. 入力モード(冷房or暖房)に対するツッコミ アンケートデータと、当日の日付情報をもとに、アンケートデータで該当日 付に冷暖房を使用している割合を算出 割合を確率とみなし、確率から定義した異常度が閾値を超えたら異常(ボケ と検知) 入力によって場合分けしてツッコミを入れる(入れない) 3. 少数での温度入力に対するツッコミ 入力温度として少数までしてきた場合、問答無用でツッコミ 27
28.
1.笑い学 2.ツッコミAIスピーカーの中身 3.実機デモ 28
29.
デモ動画 https://vimeo.com/247594648 29
30.
Raspberry Piを初めて使った私が 辛かったしたこと 音声入力デバイスの利用
デフォルトの音声入力デバイスはUSBからの入力になっていないので、 configファイルをいじる必要あり…しかし Qiitaで「このファイルをいじればOK!」って書いてあっても、OSの バージョンによってそのファイルがない場合がある 音声出力 同じように、上記ファイルを弄る必要性 上記ファイルをいじっても、アナログ端子だと非常に音が悪い USBは音が良いらしいので、USBスピーカーを買うも、なぜか認識さ れない←イマココ 音声ファイルの操作に慣れていない サンプリングレートとかの用語を理解してないとつらい 30
31.
今後やりたいこと こいつの名前はAhocaなので、「Ahoca、暖房設定 して」と呼びかけて起動したい 本当に家電操作できるようになる
他のボケに対応したい 同じことを繰り返す⇒「しつこい!」 日常会話からボケ検知 ︙ ツッコミフレーズを生成する おそらく世の中にツッコミの整ったデータはないので、 皆さんAhoca、質の高いツッコミをしまくって成長させ てあげてください 31
Download now