SlideShare a Scribd company logo
Submit Search
Upload
Login
Signup
Deim2015「各種メタデータの特徴を考慮した未知レシピへのメタデータ自動付与方式」
Report
Nな人 -enunahito-
Follow
STRUDENT at University
Mar. 1, 2015
•
0 likes
•
1,042 views
1
of
19
Deim2015「各種メタデータの特徴を考慮した未知レシピへのメタデータ自動付与方式」
Mar. 1, 2015
•
0 likes
•
1,042 views
Download Now
Download to read offline
Report
Food
各種メタデータの特徴を考慮した未知レシピへのメタデータ自動付与方式
Nな人 -enunahito-
Follow
STRUDENT at University
Recommended
機械学習超入門@渋谷
Yuko Ishizaki
1.2K views
•
46 slides
"おもしろい研究"への挑戦 - Challenges for "Omoshiroi" research
Akihiko Shirai
4.3K views
•
63 slides
IEEE DSAA 2017投稿呼びかけ
Yoji Kiyota
822 views
•
7 slides
英語論文を書くときに便利なコロケーション確認ツール
sho-yokoi
2.3K views
•
7 slides
Twitter炎上分析事例 2014年
Takeshi Sakaki
2.5K views
•
37 slides
実践多クラス分類 Kaggle Ottoから学んだこと
nishio
38.4K views
•
129 slides
More Related Content
Featured
Introduction to Data Science
Christy Abraham Joy
44K views
•
51 slides
Time Management & Productivity - Best Practices
Vit Horky
158.9K views
•
42 slides
The six step guide to practical project management
MindGenius
28.4K views
•
27 slides
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
8.7K views
•
21 slides
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
53.6K views
•
138 slides
12 Ways to Increase Your Influence at Work
GetSmarter
400.4K views
•
64 slides
Featured
(20)
Introduction to Data Science
Christy Abraham Joy
•
44K views
Time Management & Productivity - Best Practices
Vit Horky
•
158.9K views
The six step guide to practical project management
MindGenius
•
28.4K views
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
•
8.7K views
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
•
53.6K views
12 Ways to Increase Your Influence at Work
GetSmarter
•
400.4K views
ChatGPT webinar slides
Alireza Esmikhani
•
27.8K views
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Project for Public Spaces & National Center for Biking and Walking
•
6.1K views
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
DevGAMM Conference
•
3.1K views
Barbie - Brand Strategy Presentation
Erica Santiago
•
23.8K views
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Saba Software
•
25K views
Introduction to C Programming Language
Simplilearn
•
8.1K views
The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...
Palo Alto Software
•
88K views
9 Tips for a Work-free Vacation
Weekdone.com
•
7K views
I Rock Therefore I Am. 20 Legendary Quotes from Prince
Empowered Presentations
•
142.6K views
How to Map Your Future
SlideShop.com
•
274.8K views
Beyond Pride: Making Digital Marketing & SEO Authentically LGBTQ+ Inclusive -...
AccuraCast
•
3.3K views
Read with Pride | LGBTQ+ Reads
Kayla Martin-Gant
•
1K views
Exploring ChatGPT for Effective Teaching and Learning.pptx
Stan Skrabut, Ed.D.
•
56.2K views
How to train your robot (with Deep Reinforcement Learning)
Lucas García, PhD
•
42.1K views
Deim2015「各種メタデータの特徴を考慮した未知レシピへのメタデータ自動付与方式」
1.
各種メタデータの特徴を考慮した 未知レシピへのメタデータ自動付与方式
2.
背景(推薦精度の高精度化) 推薦精度の高精度化 レシピに適切なメタデータを付与 メタデータなしレシピ群 メタデータ付与済みレシピ群 子供が喜ぶレシピが 見つけにくい 子供が喜ぶレシピが 豊富! ただし大量のレシピデータに適切なメタデータを 人手で付与することは容易ではない 1
3.
本研究の狙い メタデータ付与 済みデータ 未知レシピ 類似度分析に基づく未知レシピへの メタデータ自動付与 メタデータ付レシピとの類似度分析に基づいたメタ データ自動付与方式の開発を行う. 2
4.
本研究で扱うメタデータ 先行研究(気分で料理を検索するシステム)にて扱っている 6軸のメタデータを採用する. 上記6軸のメタデータ付与済みレシピ500件 以下の6軸を -5 〜
5 で評価 からだ こころ 味 時間 お金 アレンジ [-5 [-5 [-5 [-5 [-5 [-5 ⇔ ⇔ ⇔ ⇔ ⇔ ⇔ 5] 5] 5] 5] 5] 5] (元気)(お疲れ) (ワクワク)(シクシク) (こってり) (本格) (豪華) (アレンジ) (あっさり) (お手軽) (安く) (定番) マスターレシピ 3
5.
提案手法の開発手順 メタデータ付与 済みデータ (マスターレシピ)未知レシピ ①マスターレシピ群の 特徴ベクトル抽出 ②未知レシピ群の 特徴ベクトル抽出 ③マスターレシピ群に対する未知レシピ群の 類似度分析に基づくメタデータ自動付与 4
6.
メタデータ自動付与方法① マスターレシピの最も類似度の上位のメタデータを そのままコピーして,未知レシピに付与する(TOPコピー) U(i) = M1(i) U(i):未知レシピの各気分データ M1(i):類似度ランク1位のレシピの気分データ i:{からだ,ココロ,味,時間,お金,アレンジ} 未知レシピ マスターレシピ 5
7.
メタデータ自動付与方法② マスターレシピの類似度の上位3件のメタデータを 平均してコピー(3件平均コピー) U(i) = Mn(i):対象未知レシピと類似度順 序がn番のマスターレシピの各気 分データ 3 M1(i) +
M2(i) + M3(i) 未知レシピ マスターレシピ マスターレシピ マスターレシピ 6
8.
メタデータ自動付与方法③ マスターレシピの類似度の上位3件のメタデータに類似度順位を 考慮した重みを加えたものを平均してコピー(3件重み平均コピー) U(i) = S1 +
S2 + S3 S1*M1(i) + S2*M2(i) + S3*M3(i) Sm:対象未知レシピと類似 度順位がm番のマスター レシピとの類似度 未知レシピ マスターレシピ マスターレシピマスターレシピ 7
9.
メタデータ自動付与方法④ マスターレシピの類似度の上位5件のメタデータを 平均してコピー(5件平均コピー) U(i) = 5 M1(i) +
M2(i) + M3(i) + M4(i) + M5(i) 未知レシピ マスターレシピ マスターレシピ マスターレシピ マスターレシピ マスターレシピ 8
10.
メタデータ自動付与方法⑤ マスターレシピの類似度上位5件のメタデータに,類似度順位を 考慮した重みを加えたものを平均してコピー(5件重み平均コピー) U(i) = S1 +
S2 + S3 + S4 + S5 S1*M1(i) + S2*M2(i) + S3*M3(i) + S4*M4(i) + S5*M5(i) 未知レシピ マスターレシピ マスターレシピ マスターレシピ マスターレシピ マスターレシピ 9
11.
評価実験のまとめ 10 これまでに行った5種類のメタデータ自動付与方式により 付与されたメタデータの妥当性は十分高いとはいえない. からだ,こころ,味,時間,お金,アレンジの 各軸の特徴を,一つのベクトルで表すのは無理がある. 軸ごとの特徴量を個別に抽出!
12.
軸ごとに特徴量を抽出 からだ こころ 味 時間 お金 アレンジ ○○ハンバーグ お弁当にぴったり・・・ パパッとできる・・・・ お疲れ レシピ 元気 シクシク ウキウキ お疲れ 元気 お手軽
本格 安く 豪華に 定番 アレンジ
13.
軸の再検討 時間とからだの相関 0.55 時間とお金の相関 0.70 時間とアレンジの相関
0.35 味とからだの相関 0.76 味と時間の相関 0.68 味とお金の相関 0.65 味とアレンジの相関 0.25 お金とからだの相関 0.70 お金とアレンジの相関 0.38 アレンジとからだの相関 0.14 「こころ」と「味」は, 相関が高い こころとからだの相関 0.81 こころと味の相関 0.95 こころと時間の相関 0.63 こころとお金の相関 0.71 こころとアレンジの相関 0.23 味軸に統合 6軸間の相関をとり,その妥当性を確認した. 12
14.
「味」軸の特徴を考慮したレシピ特徴抽出 13 レシピ中の「あっさり(-5)」 「(+5)こってり」 材料,調味料,調理手順で判別することができる お酢,塩,茹でる,… あっさり度の高いレシピと,こってり度の高いレシピ数件を 形態素解析し,特徴語をレシピベクトルとして採用する. あっさり度の高いレシピ こってり度の高いレシピ 特徴語抽出 特徴語抽出 「あっさり」を表す特徴語 肉汁,油,炒める,… 「こってり」を表す特徴語 レシピ レシピ
15.
レシピ中の「お疲れ(-5)」 「(+5)元気」 材料,調味料,調理手順で判別することができる 「からだ」軸の特徴を考慮したレシピ特徴抽出 14 お酢,ガーリック,薬膳,… お疲れ度の高いレシピと,元気度の高いレシピ数件を 形態素解析し,特徴語をレシピベクトルとして採用する. お疲れ度の高いレシピ 元気度の高いレシピ 特徴語抽出 特徴語抽出 「お疲れ」を表す特徴語 肉汁,ステーキ,焼く,… 「元気」を表す特徴語 レシピ レシピ
16.
調理動作辞書を作成し,時間のかかり具合を算出. この時,動詞の数も考慮する. 切る 時間がかかる 蒸す 時間がかからない お手軽度を 高くする 本格度を 高くする 15 「時間」軸の特徴を考慮したレシピ特徴抽出
17.
材料毎の平均値段表を作成 ステーキ:369円/100g キャベツ:93円/1玉 さんま:125円/1匹 「食品統計」のようなデータを用い、1食あたりの 金額を算出する。 算出された値段を正規化し,-5〜5のデータ値と、 合計金額で出力する。 16 「お金」軸の特徴を考慮したレシピ特徴抽出
18.
17 未知レシピ 入力された未知レシピと同名のレシピを検索し, そのレシピに頻出する名詞と動詞を取得する. それを定番メニューとして,Edit Distanceにもとづいて アレンジ度を算出する. ②アレンジ度の算出 「アレンジ」軸の特徴を考慮したレシピ特徴抽出 レシピ レシピ レシピ レシピ 同名のレシピ ①動詞,名詞を抽出
19.
まとめ 18 マスターレシピとの類似度分析に基づく未知 レシピへのメタデータ自動付与方式の提案 – 6軸(からだ,こころ,味,時間,お金,アレンジ) ごとに,特徴を調査 – 各軸の特徴を考慮したレシピ特徴ベクトルの抽 出方式を検討 今後の課題 –
評価実験を行い,提案方式の有効性を検証
Editor's Notes
各種メタデータの特徴を考慮した未知レシピへのメタデータ自動付与方式
近年,レシピの検索・推薦に関する取り組みが盛んに行われている レシピ推薦サービスにおいて,高精度に推薦アイテムの選定を行うためには,各レシピデータを分析し,適切なメタデータを付与することが考えられる. 例えばレシピに,「子供の喜ぶレシピ」というメタデータが付与されていれば,そのようなレシピが検索・推薦しやすくなります. しかし大量のレシピデータに適切なメタデータを人手で付与することは容易ではありません.
そこで本研究では既に人の手によりメタデータが付与されているレシピとの類似度分析に基づいたメタデータ自動付与方式の開発を行う.
本研究で扱うメタデータは,共同研究者である森下らの「気分で料理を検索するシステム」の「気分で料理がぽん!」で使われた, ユーザの気分に合致するようなメタデータ付与済みのレシピ500件(マスターレシピ)の,メタデータを使う. このメタデータは,「からだ」「こころ」「味」「時間」「お金」「アレンジ」の6つの軸をそれぞれ-5から+5で評価したものであり, 気分で料理がポンとは,ユーザの気分を入力すると,その気分にあったレシピが推薦されるというものであるが,しかし,気分データが付与されているレシピは500件しかないため,数が少ない. そのため,本研究ではそのメタデータを自動付与することを目指している.
提案手法の開発手順について ①マスターレシピ群の特徴ベクトル抽出を行う ②未知レシピ軍の特徴ベクトルの抽出を行う ③マスターレシピ群に対する未知レシピ群の類似度分析に基づくメタデータ自動付与を行う と言った流れになる
次にメタデータ自動付与方法を5つ紹介する. なお,グラフは2次元で表記しているが,実際は多次元である. 赤い丸がマスターレシピ群で,灰色のバツが未知レシピである. 一つ目が,メスターレシピの最も類似度の上位のメタデータをそのままコピーしたもの(TOPコピーという).
2つ目が,マスターレシピの類似度上位3件のメタデータをそれぞれ平均したものをメタデータとして決定し,未知レシピに付与するといったもの.
3つ目が,マスターレシピの類似度上位3件のメタデータに,類似度順位を考慮した重みを加え,平均したものをメタデータとして決定し,未知レシピに付与するといったもの.
4つ目が,マスターレシピの類似度上位5件のメタデータをそれぞれ平均したものをメタデータとして決定し,未知レシピに付与するといったもの.
5つ目が,マスターレシピの類似度上位5件のメタデータに,類似度順位を考慮した重みを加え,平均したものをメタデータとして決定し,未知レシピに付与するといったもの.
これらのメタデータ自動付与方式の妥当性の評価を,先行研究で行った結果,付与されたメタデータの妥当性は十分に高いとはいえないことがわかった. 味軸や時間軸,お金軸などの,全く異なる特徴量を一つのベクトルで表すのは無理があるということが考えられたので,軸ごとの特徴量を個別に抽出する必要があると考えた.
このように,現在のマスターレシピにある,からだ,こころ,味,時間,お金,アレンジの,各軸の特徴を考慮した,次元抽出を行う.
先行研究では,6軸で研究を行っていたが,各軸の相関をとり,その妥当性を確認したところ,こころ軸と味軸は相関が非常に高い為, メタデータを自動付与しても心軸と味軸は特徴も似ており,ほとんど同じ値が付与されてしまうことになる. よって,こころ軸は味軸に統合して考えることにする.
それでは,各軸の特徴を考慮したレシピ次元算出方法について,1つずつ説明していきます. 味軸は,レシピ中の材料や調味料,調理手順であっさりかこってりかを判別することができます. 例えば,「お酢」や「塩」,「茹でる」などは,あっさりしたレシピに多く登場し,逆に「肉汁」や「油」,「炒める」などはこってりしたレシピに多く登場します. なので,味軸は,マスターレシピのあっさり度の高いレシピ数件と,こってり度の高いレシピ数件から,特徴語を抽出し,レシピベクトルとして採用します.
からだ軸も味軸と同様で,レシピ中の材料や調味料,調理手順であっさりかこってりかを判別することができます. 例えば,「お酢」や「ガーリック」,「薬膳(やくぜん)」などは,お疲れ度の高いレシピに多く登場し,逆に「肉汁」や「ステーキ」,「焼く」などは元気度の高いレシピに多く登場します. なので,からだ軸も,マスターレシピのお疲れ度の高いレシピ数件と,元気度の高いレシピ数件から,特徴語を抽出し,レシピベクトルとして採用します.
時間軸は,調理動作辞書を作成し,時間のかかり具合を算出します. 例として,「切る」という動詞は比較的時間がかからないため,お手軽度を高くし, 「蒸す」という動詞は,時間がかかるため,本格度を高くします. しかしこのとき,「切る」という動詞が複数回出現した場合,作業に有する時間が増えてしまいます. なので,動詞の個数も考慮して考えます.
お金軸は,食材の値段データを作成し,1食あたりの金額を算出します. マスターレシピの食材を全て値段に置き換え,値段のヒストグラムを作成します. 次に,未知レシピの食材を全て値段に置き換え,そのヒストグラムに当てはめ,データを正規化し,-5〜5のデータの値として出力します. こうすることにより,1食あたりの値段と,今までのお金軸同様の-5〜+5の値の両方をユーザに提示することができます.
アレンジ軸は,「定番メニューからどれだけアレンジされているか」というものを示す軸なので,まずは「定番」の基準を決めなければなりません. なので,入力された未知レシピと同名のレシピをインターネット上で検索し,それぞれから材料や調味料を示す「名詞」と,調理手順を示す「動詞」を抽出し, 頻出するものを定番メニューの比較対象として決定します. 次に,未知レシピから名詞と動詞を抽出し,Edit Distance(レーベンシュタイン距離)にもとづいてアレンジ度を算出し,-5〜5の範囲に正規化して出力します.