Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Takeshi Arabiki
PDF, PPTX
10,925 views
クックパッド特売情報 における自然言語処理 〜固有表現抽出を利用した検索システム〜
第 10 回 YANS シンポジウムの発表資料です
Engineering
◦
Read more
33
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 31
2
/ 31
3
/ 31
4
/ 31
5
/ 31
6
/ 31
7
/ 31
8
/ 31
9
/ 31
10
/ 31
11
/ 31
12
/ 31
13
/ 31
14
/ 31
15
/ 31
16
/ 31
17
/ 31
18
/ 31
19
/ 31
20
/ 31
21
/ 31
22
/ 31
23
/ 31
24
/ 31
25
/ 31
26
/ 31
27
/ 31
28
/ 31
29
/ 31
30
/ 31
31
/ 31
More Related Content
PDF
初めて論文を書くあなたへ_論文執筆の際に頻回に行ったアドバイスをまとめました.私が目指す格好いい論文を書くためのtipsです.
by
eijiaramaki1
PDF
論文のいろは
by
Shu Sakamoto
PPTX
オーバーエンジニアリングって何? #devsumi #devsumiA
by
Ore Product
PDF
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
by
Tokoroten Nakayama
PDF
強化学習その3
by
nishio
PDF
マッチングサービスにおけるKPIの話
by
cyberagent
PDF
Anomaly detection 系の論文を一言でまとめた
by
ぱんいち すみもと
PDF
エンジニアという仕事を楽しみ続けるためのキャリア戦略
by
Shuichi Tsutsumi
初めて論文を書くあなたへ_論文執筆の際に頻回に行ったアドバイスをまとめました.私が目指す格好いい論文を書くためのtipsです.
by
eijiaramaki1
論文のいろは
by
Shu Sakamoto
オーバーエンジニアリングって何? #devsumi #devsumiA
by
Ore Product
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
by
Tokoroten Nakayama
強化学習その3
by
nishio
マッチングサービスにおけるKPIの話
by
cyberagent
Anomaly detection 系の論文を一言でまとめた
by
ぱんいち すみもと
エンジニアという仕事を楽しみ続けるためのキャリア戦略
by
Shuichi Tsutsumi
What's hot
PPTX
優れた研究論文の書き方
by
Masanori Kado
PPTX
論文に関する基礎知識2015
by
Mai Otsuki
PDF
事業が対峙する現実からエンジニアリングを俯瞰する #devlove
by
Itsuki Kuroda
PDF
開発速度が速い #とは(LayerX社内資料)
by
mosa siru
PDF
UXデザインワークショップ資料 by ATOMOS DESIGN
by
Akihiko Kodama
PPTX
深層学習の非常に簡単な説明
by
Seiichi Uchida
PDF
“機械学習の説明”の信頼性
by
Satoshi Hara
PDF
データサイエンティスト スキルチェックリスト
by
The Japan DataScientist Society
PPTX
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
by
西岡 賢一郎
PDF
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
by
諒介 荒木
PDF
ChatGPTは思ったほど賢くない
by
Carnot Inc.
PPTX
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
by
Deep Learning JP
PDF
研究効率化Tips Ver.2
by
cvpaper. challenge
PDF
モノタロウECプラットフォームを支える開発運用モダナイゼーションの取り組み #devsumi
by
株式会社MonotaRO Tech Team
PDF
実践的な設計って、なんだろう?
by
増田 亨
PDF
いまさら聞けない機械学習の評価指標
by
圭輔 大曽根
PDF
失敗から学ぶ機械学習応用
by
Hiroyuki Masuda
PDF
AbemaTVにおける推薦システム
by
cyberagent
PDF
R による文書分類入門
by
Takeshi Arabiki
PDF
オントロジーとは?
by
Kouji Kozaki
優れた研究論文の書き方
by
Masanori Kado
論文に関する基礎知識2015
by
Mai Otsuki
事業が対峙する現実からエンジニアリングを俯瞰する #devlove
by
Itsuki Kuroda
開発速度が速い #とは(LayerX社内資料)
by
mosa siru
UXデザインワークショップ資料 by ATOMOS DESIGN
by
Akihiko Kodama
深層学習の非常に簡単な説明
by
Seiichi Uchida
“機械学習の説明”の信頼性
by
Satoshi Hara
データサイエンティスト スキルチェックリスト
by
The Japan DataScientist Society
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
by
西岡 賢一郎
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
by
諒介 荒木
ChatGPTは思ったほど賢くない
by
Carnot Inc.
【DL輪読会】論文解説:Offline Reinforcement Learning as One Big Sequence Modeling Problem
by
Deep Learning JP
研究効率化Tips Ver.2
by
cvpaper. challenge
モノタロウECプラットフォームを支える開発運用モダナイゼーションの取り組み #devsumi
by
株式会社MonotaRO Tech Team
実践的な設計って、なんだろう?
by
増田 亨
いまさら聞けない機械学習の評価指標
by
圭輔 大曽根
失敗から学ぶ機械学習応用
by
Hiroyuki Masuda
AbemaTVにおける推薦システム
by
cyberagent
R による文書分類入門
by
Takeshi Arabiki
オントロジーとは?
by
Kouji Kozaki
More from Takeshi Arabiki
PDF
開発の心得
by
Takeshi Arabiki
PDF
Introduction to Japanese Morphological Analysis
by
Takeshi Arabiki
PDF
Rのデータ構造とメモリ管理
by
Takeshi Arabiki
PDF
HTML5 Canvas で学ぶアフィン変換
by
Takeshi Arabiki
PDF
Introduction to Favmemo for Immature Engineers
by
Takeshi Arabiki
PDF
Rのスコープとフレームと環境と
by
Takeshi Arabiki
PDF
twitteRで快適Rライフ!
by
Takeshi Arabiki
PDF
RではじめるTwitter解析
by
Takeshi Arabiki
PDF
R版Getopt::Longを作ってみた
by
Takeshi Arabiki
PDF
Rデータフレーム自由自在
by
Takeshi Arabiki
PDF
HMM, MEMM, CRF メモ
by
Takeshi Arabiki
PDF
文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜
by
Takeshi Arabiki
PDF
Rデバッグあれこれ
by
Takeshi Arabiki
PDF
はじめてのまっぷりでゅ〜す
by
Takeshi Arabiki
PDF
TwitterのデータをRであれこれ
by
Takeshi Arabiki
PDF
Twitterのデータを取得する準備
by
Takeshi Arabiki
開発の心得
by
Takeshi Arabiki
Introduction to Japanese Morphological Analysis
by
Takeshi Arabiki
Rのデータ構造とメモリ管理
by
Takeshi Arabiki
HTML5 Canvas で学ぶアフィン変換
by
Takeshi Arabiki
Introduction to Favmemo for Immature Engineers
by
Takeshi Arabiki
Rのスコープとフレームと環境と
by
Takeshi Arabiki
twitteRで快適Rライフ!
by
Takeshi Arabiki
RではじめるTwitter解析
by
Takeshi Arabiki
R版Getopt::Longを作ってみた
by
Takeshi Arabiki
Rデータフレーム自由自在
by
Takeshi Arabiki
HMM, MEMM, CRF メモ
by
Takeshi Arabiki
文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜
by
Takeshi Arabiki
Rデバッグあれこれ
by
Takeshi Arabiki
はじめてのまっぷりでゅ〜す
by
Takeshi Arabiki
TwitterのデータをRであれこれ
by
Takeshi Arabiki
Twitterのデータを取得する準備
by
Takeshi Arabiki
クックパッド特売情報 における自然言語処理 〜固有表現抽出を利用した検索システム〜
1.
クックパッド特売情報 における自然言語処理 ∼固有表現抽出を利用した検索システム∼ YANS 第 10
回シンポジウム (2015/09/05 ) クックパッド株式会社 買物情報事業部 Takeshi Arabiki (@a_bicky)
2.
お話しすること •ものをつくること •ものを動かすこと •現実の問題を知ること •足りない技術を生み出すこと
3.
お話しすること •ものをつくること •ものを動かすこと •現実の問題を知ること •足りない技術を生み出すこと
4.
クックパッド特売情報
6.
•いわゆるチラシサービスの一種 •店舗さんが商品情報を投稿 クックパッド特売情報
7.
商品検索の使いどころ
8.
商品検索の使いどころ
9.
•各ユーザに限定すると商品数が少ない ‣ e.g. 登録している店舗の商品 ‣
1件しかヒットしないことがよくある •ユーザが意図的に検索するわけではない ‣ より適合率(精度)が求められる 特殊な検索事情
10.
商品検索の 初期の課題
11.
投稿された商品名 キーワード たまねぎドレッシング フルーツゼリー みかん たまねぎ ドレッシング フルーツ ゼリー みかん 形態素単位のインデキシング
12.
投稿された商品名 キーワード たまねぎドレッシング フルーツゼリー みかん たまねぎ ドレッシング フルーツ ゼリー みかん 形態素単位のインデキシング形態素単位のインデキシング 「たまねぎ」を使ったレシピに掲出 「みかん」を使ったレシピに掲出
13.
固有表現抽出を利用した 検索システム
14.
投稿された商品名 キーワード 固有表現単位のインデキシング たまねぎドレッシング 商品名 フルーツゼリー みかん 味商品名 たまねぎドレッシング フルーツゼリー みかん:TASTE
15.
固有表現抽出を使うメリット •適合率が上がる •正規表現と違って文字列全体を考慮できる •似たパターンの未知データにも対応可能
16.
固有表現抽出の方法 •MeCab+IPAdic による形態素解析と正規化 ‣ コストを商品名に最適化 ‣
辞書に代表表記の情報も登録 •CRFsuite による固有表現抽出 ‣ 形態素解析した結果を素性に利用 ‣ タグとして商品名、味、産地 etc.
17.
% mecab -d
dic 薄切り 薄切り 名詞,サ変接続,*,*,*,*,薄切り,ウスギリ,ウスギリ EOS 薄切 薄切 名詞,サ変接続,*,*,*,*,薄切,ウスギリ,ウスギリ,薄切り,薄切り,ウスギリ EOS 形態素解析結果と代表表記
18.
学習データの作成
19.
商品検索の 現在の課題
20.
商品名の形態素解析の難しさ •かつおたたき •ロース肉薄切り •名詞の間にある接頭詞・名詞接尾 ‣ e.g.「徳用焼き餃子」「生姜焼き徳用」
21.
商品名の形態素解析の難しさ •かつおたたき → かつ/お/たたき •ロース肉薄切り → ロース/肉薄/切り •名詞の間にある接頭詞・名詞接尾 ‣ e.g.「徳用焼き餃子」「生姜焼き徳用」
22.
知識ベースの構築 •同義語 ‣ 「パクチー」と「コリアンダー」 •一般名と品種・商品名 ‣ 「じゃがいも」と「メークイン」 •原料 ‣
「卵黄」と「卵」
23.
商品検索クエリの最適化 •材料は「豚肉」だけど「豚肉薄切り」かも ‣ 「豚肉ブロック」は掲出させたくない •材料名のクレンジング ‣ 材料名の括弧の中身は必要かどうか ‣
e.g.(薄切り)、(あれば)
24.
課題は たくさん
25.
最も深刻 な問題
26.
人手不足
27.
ブレークスルー
28.
http://www.nii.ac.jp/dsc/idr/cookpad/cookpad.html
29.
お話しすること •ものをつくること •ものを動かすこと •現実の問題を知ること •足りない技術を生み出すこと
30.
•ものをつくること •ものを動かすこと •現実の問題を知ること •足りない技術を生み出すこと
31.
自然言語処理で 世界中の食卓に 笑顔を!
Download