SlideShare a Scribd company logo
YouTure
YouTube 再生数・いいね数 予測アプ
リ
2019 / 08 / 30 Team
YouTube + Future
目次
1.サービスについて
・目的
・システム概要
・動作の様子
2.前処理について
・タイトル
・カテゴリ
3.予測モデルについて
4.レコメンドについて
5.Webアプリについて
6.今後の課題
サービスについて
目的
YouTuber のため
参考資料 https://markezine.jp/article/detail/27843
システム概要
タイトル
カテゴリ
登録者数
予測再生数
予測いいね数
タイトル
類似タイトル
の提案
サムネイル
キーワード
サムネイル
類似動画の提案
入力 出力
動作の様子
前処理について
再生数・高評価の予測システム
データ編
使用しているデータセット
Trending YouTube Video Statis
Trending YouTube Video Statistics
https://www.kaggle.com/datasnaek/y
outube-new
タイトル編
入力されたタイトルを
分かち書きする
入力されたタイトルを分かち書きする
入力 された タイトル を 分かち 書き する
テキストデータのベクトル化
1: わたし リンゴ 食べる
2: ぼく リンゴ みかん 食べる
3: わたし リンゴ 見つける リンゴ 食べる
index わたし ぼく リンゴ みかん 食べる 見つける
0 1 0 1 0 1 0
1 0 1 1 1 1 0
2 1 0 2 0 1 1
tf-idfを求める
tf-idfって単語の重要度を測る手法なんだ
index わたし ぼく リンゴ みかん 食べる 見つける
0 0 0 0.42544054 0 0.72033345 0.54783215
1 0.6317450 0.4804584 0.3731188 0.4804584 0 0
2 0 0.4298397 0.6676177 0.4298397 0 0.4298397
tf-idfからタイトルの
特徴量を求める
特徴量は各単語の値の合計値とした
index わたし ぼく リンゴ みかん 食べる 見つける 特徴量
0 0 0 0.4254405 0 0.7203334 0.5478321 2.693606
1 0.6317450 0.4804584 0.3731188 0.4804584 0 0 1.9657806
2 0 0.4298397 0.6676177 0.4298397 0 0.4298397 1.9571368
カテゴリ編
One-Hot エンコーディング
index category_id_1 category_id_2 category_id_3
0 1 0 0
1 0 0 1
2 0 1 0
3 0 0 1
index category_id
0 1
1 3
2 2
3 3
ワン! ほっと
予測モデルについて
再生数・高評価の予測システム
重回帰分析を用いた
教師あり予測モデル
※使用モデル sklearn liner-model※精度はscoreメソッドを用いて求めた
タイトル
カテゴリ
登録者数
予測再生数
予測いいね数
SCORE 78%
サムネイルと
タイトルから
似ている動画を
レコメンド
サムネイル編
どうやってサムネイルから
おすすめ動画を
紹介するの?
画像データから
コサイン類似度を求める
YOUTUBEの
サムネイルから物体認識
(モデル : DenseNet)
ONE-HOT エンコーディング
AI
猫!
椅子!
1万枚の画像データ
入力されたキーワードを配列化
[0,0,0,…1,0,0,0,...,1,...,0]
類似度を求める
入力されたデータと既存のデータから
算出した角度の近さから類似度がわかる
θ
COSθが1に近い
ほど似ているんだ
って!
類似度の高い動画を表示
こんな動画があるよ
タイトル編
タイトル同士の類似度を
求めるにはどうすれば
予測モデルのタイトルと
同様にTF-IDFを求める!!
tf-idfからコサイン類似度
以後サムネイル同様に類似度の高いタイトルを表示
index 0 1 2
0 文書0 x 文書0 文書0 x 文書1 文書0 x 文書2
1 文書1 x 文書0 文書1 x 文書1 文書1 x 文書2
2 文書2 x 文書0 文書2 x 文書1 文書2 x 文書2
Webアプリについて
フレームワークには
Materializeを用いた
マテリアルデザイン とは
現実世界のルール
(奥行きや,影など,質量)を取り入れ
直感的な操作を実現する
今後の課題
〇精度の向上
〇タイトル処理
〇追加要素
精度の向上
〇問題点
・データ量が足りない
〇改善案
・YouTube Data APIからデータ収集を行う
タイトル処理
〇問題点
・現在のタイトルの特徴量は特徴量として
あまり成果を発揮できていない
〇改善案
・文章として意味のある特徴量を求める
追加要素
・入力画面で画像を入力できるようにする
・タイトルやサムネの改善提案を行う
・youtubeアカウントと連携することで
登録者数の入力を省く
ご清聴ありがとう
ございました
thank you for your attention

More Related Content

Similar to YouTure

ビルドプロセスとCI #STAC2014
ビルドプロセスとCI #STAC2014ビルドプロセスとCI #STAC2014
ビルドプロセスとCI #STAC2014
Koji Hasegawa
 
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #SeleniumjpSeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
Yahoo!デベロッパーネットワーク
 
チェックポイント(1)(2)(3) デモンストレーション
チェックポイント(1)(2)(3) デモンストレーション チェックポイント(1)(2)(3) デモンストレーション
チェックポイント(1)(2)(3) デモンストレーション
FatWireKK
 
Hadoop conferencejapan2011
Hadoop conferencejapan2011Hadoop conferencejapan2011
Hadoop conferencejapan2011Ichiro Fukuda
 
楽天におけるビッグデータを対象としたデータサイエンス&AIの最新応用事例
楽天におけるビッグデータを対象としたデータサイエンス&AIの最新応用事例楽天におけるビッグデータを対象としたデータサイエンス&AIの最新応用事例
楽天におけるビッグデータを対象としたデータサイエンス&AIの最新応用事例
Rakuten Group, Inc.
 
SkyWayを使いこなすために How to use SkyWay -SkyWay UG Kansai #1 スペシャルバージョン-
SkyWayを使いこなすために How to use SkyWay -SkyWay UG Kansai #1 スペシャルバージョン-SkyWayを使いこなすために How to use SkyWay -SkyWay UG Kansai #1 スペシャルバージョン-
SkyWayを使いこなすために How to use SkyWay -SkyWay UG Kansai #1 スペシャルバージョン-
Yusuke Naka
 
テスト自動化への1エンジニアとしての期待
テスト自動化への1エンジニアとしての期待テスト自動化への1エンジニアとしての期待
テスト自動化への1エンジニアとしての期待
teyamagu
 
20 分で理解する Azure Active Directory 最新アップデートと利活用シナリオ
20 分で理解する Azure Active Directory 最新アップデートと利活用シナリオ20 分で理解する Azure Active Directory 最新アップデートと利活用シナリオ
20 分で理解する Azure Active Directory 最新アップデートと利活用シナリオ
Yusuke Kodama
 
WordPressで考えるこれからのコンテンツ制作
WordPressで考えるこれからのコンテンツ制作WordPressで考えるこれからのコンテンツ制作
WordPressで考えるこれからのコンテンツ制作
Takami Kazuya
 
Talendデータ・ファブリック・ソリューションの概要
Talendデータ・ファブリック・ソリューションの概要Talendデータ・ファブリック・ソリューションの概要
Talendデータ・ファブリック・ソリューションの概要
QlikPresalesJapan
 
推薦システムを構築する手順書 with Azure Machine Learning
推薦システムを構築する手順書 with Azure Machine Learning推薦システムを構築する手順書 with Azure Machine Learning
推薦システムを構築する手順書 with Azure Machine Learning
Masayuki Ota
 
Backlog APIを使ってチケットの進捗を可視化する取組みをやってみる.pdf
Backlog APIを使ってチケットの進捗を可視化する取組みをやってみる.pdfBacklog APIを使ってチケットの進捗を可視化する取組みをやってみる.pdf
Backlog APIを使ってチケットの進捗を可視化する取組みをやってみる.pdf
apple4328
 
20180922 jazug8 cosmosdb_search
20180922 jazug8 cosmosdb_search20180922 jazug8 cosmosdb_search
20180922 jazug8 cosmosdb_search
Kazuhiro Wada
 
データ視点のit資産価値評価の検討(経営情報学会2014)
データ視点のit資産価値評価の検討(経営情報学会2014)データ視点のit資産価値評価の検討(経営情報学会2014)
データ視点のit資産価値評価の検討(経営情報学会2014)
Tetsu Kawata
 
20110519 okuyama tokyo_linuxstudy
20110519 okuyama tokyo_linuxstudy20110519 okuyama tokyo_linuxstudy
20110519 okuyama tokyo_linuxstudyTakahiro Iwase
 
[BPStudy#80] パブリック クラウド プラットフォーム「Microsoft Azure」 最新アップデート #bpstudy
[BPStudy#80] パブリック クラウド プラットフォーム「Microsoft Azure」 最新アップデート #bpstudy[BPStudy#80] パブリック クラウド プラットフォーム「Microsoft Azure」 最新アップデート #bpstudy
[BPStudy#80] パブリック クラウド プラットフォーム「Microsoft Azure」 最新アップデート #bpstudy
Naoki (Neo) SATO
 
Azure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/SparkAzure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/Spark
Ryoma Nagata
 
Elastic on Azure Integration & Building React UI Based Search App Using Azure...
Elastic on Azure Integration & Building React UI Based Search App Using Azure...Elastic on Azure Integration & Building React UI Based Search App Using Azure...
Elastic on Azure Integration & Building React UI Based Search App Using Azure...
Shotaro Suzuki
 
新規システムUI開発で設計失敗したけどいい感じにリファクタリングできた話
新規システムUI開発で設計失敗したけどいい感じにリファクタリングできた話新規システムUI開発で設計失敗したけどいい感じにリファクタリングできた話
新規システムUI開発で設計失敗したけどいい感じにリファクタリングできた話
KentaEndoh
 
IBM XCITE Spring 2015 - XPages application success story and IBM Bluemix
IBM XCITE Spring 2015 - XPages application success story and IBM BluemixIBM XCITE Spring 2015 - XPages application success story and IBM Bluemix
IBM XCITE Spring 2015 - XPages application success story and IBM Bluemix
Atsushi Sato
 

Similar to YouTure (20)

ビルドプロセスとCI #STAC2014
ビルドプロセスとCI #STAC2014ビルドプロセスとCI #STAC2014
ビルドプロセスとCI #STAC2014
 
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #SeleniumjpSeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
 
チェックポイント(1)(2)(3) デモンストレーション
チェックポイント(1)(2)(3) デモンストレーション チェックポイント(1)(2)(3) デモンストレーション
チェックポイント(1)(2)(3) デモンストレーション
 
Hadoop conferencejapan2011
Hadoop conferencejapan2011Hadoop conferencejapan2011
Hadoop conferencejapan2011
 
楽天におけるビッグデータを対象としたデータサイエンス&AIの最新応用事例
楽天におけるビッグデータを対象としたデータサイエンス&AIの最新応用事例楽天におけるビッグデータを対象としたデータサイエンス&AIの最新応用事例
楽天におけるビッグデータを対象としたデータサイエンス&AIの最新応用事例
 
SkyWayを使いこなすために How to use SkyWay -SkyWay UG Kansai #1 スペシャルバージョン-
SkyWayを使いこなすために How to use SkyWay -SkyWay UG Kansai #1 スペシャルバージョン-SkyWayを使いこなすために How to use SkyWay -SkyWay UG Kansai #1 スペシャルバージョン-
SkyWayを使いこなすために How to use SkyWay -SkyWay UG Kansai #1 スペシャルバージョン-
 
テスト自動化への1エンジニアとしての期待
テスト自動化への1エンジニアとしての期待テスト自動化への1エンジニアとしての期待
テスト自動化への1エンジニアとしての期待
 
20 分で理解する Azure Active Directory 最新アップデートと利活用シナリオ
20 分で理解する Azure Active Directory 最新アップデートと利活用シナリオ20 分で理解する Azure Active Directory 最新アップデートと利活用シナリオ
20 分で理解する Azure Active Directory 最新アップデートと利活用シナリオ
 
WordPressで考えるこれからのコンテンツ制作
WordPressで考えるこれからのコンテンツ制作WordPressで考えるこれからのコンテンツ制作
WordPressで考えるこれからのコンテンツ制作
 
Talendデータ・ファブリック・ソリューションの概要
Talendデータ・ファブリック・ソリューションの概要Talendデータ・ファブリック・ソリューションの概要
Talendデータ・ファブリック・ソリューションの概要
 
推薦システムを構築する手順書 with Azure Machine Learning
推薦システムを構築する手順書 with Azure Machine Learning推薦システムを構築する手順書 with Azure Machine Learning
推薦システムを構築する手順書 with Azure Machine Learning
 
Backlog APIを使ってチケットの進捗を可視化する取組みをやってみる.pdf
Backlog APIを使ってチケットの進捗を可視化する取組みをやってみる.pdfBacklog APIを使ってチケットの進捗を可視化する取組みをやってみる.pdf
Backlog APIを使ってチケットの進捗を可視化する取組みをやってみる.pdf
 
20180922 jazug8 cosmosdb_search
20180922 jazug8 cosmosdb_search20180922 jazug8 cosmosdb_search
20180922 jazug8 cosmosdb_search
 
データ視点のit資産価値評価の検討(経営情報学会2014)
データ視点のit資産価値評価の検討(経営情報学会2014)データ視点のit資産価値評価の検討(経営情報学会2014)
データ視点のit資産価値評価の検討(経営情報学会2014)
 
20110519 okuyama tokyo_linuxstudy
20110519 okuyama tokyo_linuxstudy20110519 okuyama tokyo_linuxstudy
20110519 okuyama tokyo_linuxstudy
 
[BPStudy#80] パブリック クラウド プラットフォーム「Microsoft Azure」 最新アップデート #bpstudy
[BPStudy#80] パブリック クラウド プラットフォーム「Microsoft Azure」 最新アップデート #bpstudy[BPStudy#80] パブリック クラウド プラットフォーム「Microsoft Azure」 最新アップデート #bpstudy
[BPStudy#80] パブリック クラウド プラットフォーム「Microsoft Azure」 最新アップデート #bpstudy
 
Azure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/SparkAzure Purview Linage for Dataflow/Spark
Azure Purview Linage for Dataflow/Spark
 
Elastic on Azure Integration & Building React UI Based Search App Using Azure...
Elastic on Azure Integration & Building React UI Based Search App Using Azure...Elastic on Azure Integration & Building React UI Based Search App Using Azure...
Elastic on Azure Integration & Building React UI Based Search App Using Azure...
 
新規システムUI開発で設計失敗したけどいい感じにリファクタリングできた話
新規システムUI開発で設計失敗したけどいい感じにリファクタリングできた話新規システムUI開発で設計失敗したけどいい感じにリファクタリングできた話
新規システムUI開発で設計失敗したけどいい感じにリファクタリングできた話
 
IBM XCITE Spring 2015 - XPages application success story and IBM Bluemix
IBM XCITE Spring 2015 - XPages application success story and IBM BluemixIBM XCITE Spring 2015 - XPages application success story and IBM Bluemix
IBM XCITE Spring 2015 - XPages application success story and IBM Bluemix
 

YouTure

Editor's Notes

  1. feature=特徴 future=未来 capture=つかみ取る
  2. 0 1 0 0 1 0 0 1 2 0 1 0 3 0 0 1