Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Takeshi Arabiki
PDF, PPTX
10,925 views
クックパッド特売情報 における自然言語処理 〜固有表現抽出を利用した検索システム〜
第 10 回 YANS シンポジウムの発表資料です
Engineering
◦
Read more
33
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 31
2
/ 31
3
/ 31
4
/ 31
5
/ 31
6
/ 31
7
/ 31
8
/ 31
9
/ 31
10
/ 31
11
/ 31
12
/ 31
13
/ 31
14
/ 31
15
/ 31
16
/ 31
17
/ 31
18
/ 31
19
/ 31
20
/ 31
21
/ 31
22
/ 31
23
/ 31
24
/ 31
25
/ 31
26
/ 31
27
/ 31
28
/ 31
29
/ 31
30
/ 31
31
/ 31
More Related Content
PPTX
セマンティックWebとオントロジー:現状と将来展望
by
National Institute of Informatics (NII)
PPTX
固有表現抽出と適用例のご紹介
by
Core Concept Technologies
PDF
オントロジーとは?
by
Kouji Kozaki
PDF
機械学習と機械発見:自然科学研究におけるデータ利活用の再考
by
Ichigaku Takigawa
PPTX
AWSで作る分析基盤
by
Yu Otsubo
PPTX
forestFloorパッケージを使ったrandomForestの感度分析
by
Satoshi Kato
PDF
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
PDF
機械学習モデルの判断根拠の説明
by
Satoshi Hara
セマンティックWebとオントロジー:現状と将来展望
by
National Institute of Informatics (NII)
固有表現抽出と適用例のご紹介
by
Core Concept Technologies
オントロジーとは?
by
Kouji Kozaki
機械学習と機械発見:自然科学研究におけるデータ利活用の再考
by
Ichigaku Takigawa
AWSで作る分析基盤
by
Yu Otsubo
forestFloorパッケージを使ったrandomForestの感度分析
by
Satoshi Kato
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
機械学習モデルの判断根拠の説明
by
Satoshi Hara
What's hot
PDF
ブレインパッドにおける機械学習プロジェクトの進め方
by
BrainPad Inc.
PDF
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
by
Yahoo!デベロッパーネットワーク
PDF
20180925 CV勉強会 SfM解説
by
Fujimoto Keisuke
PDF
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
by
horihorio
PDF
[DLHacks LT] PytorchのDataLoader -torchtextのソースコードを読んでみた-
by
Deep Learning JP
PDF
放送大学テキスト「自然言語処理」 7章 構文の解析(1)
by
Yasuhide Miura
PDF
傾向スコア解析とUplift Modelling
by
Yohei Sato
PDF
失敗から学ぶ機械学習応用
by
Hiroyuki Masuda
PDF
機械学習の未解決課題
by
Hiroyuki Masuda
PDF
CHAIN公開セミナー20200817吉田発表資料
by
Masatoshi Yoshida
PDF
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
by
MPRG_Chubu_University
PDF
BERT+XLNet+RoBERTa
by
禎晃 山崎
PDF
機械学習モデルの判断根拠の説明(Ver.2)
by
Satoshi Hara
PDF
3次元レジストレーションの基礎とOpen3Dを用いた3次元点群処理
by
Toru Tamaki
PDF
プライバシー保護のためのサンプリング、k-匿名化、そして差分プライバシー
by
Hiroshi Nakagawa
PPTX
RandomForestとR package
by
Shuma Ishigami
PDF
Rを用いたLTV(Life Time Value)の推定
by
宏喜 佐野
PDF
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
by
諒介 荒木
PDF
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
by
Akisato Kimura
PPTX
Isolation forest
by
kataware
ブレインパッドにおける機械学習プロジェクトの進め方
by
BrainPad Inc.
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
by
Yahoo!デベロッパーネットワーク
20180925 CV勉強会 SfM解説
by
Fujimoto Keisuke
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
by
horihorio
[DLHacks LT] PytorchのDataLoader -torchtextのソースコードを読んでみた-
by
Deep Learning JP
放送大学テキスト「自然言語処理」 7章 構文の解析(1)
by
Yasuhide Miura
傾向スコア解析とUplift Modelling
by
Yohei Sato
失敗から学ぶ機械学習応用
by
Hiroyuki Masuda
機械学習の未解決課題
by
Hiroyuki Masuda
CHAIN公開セミナー20200817吉田発表資料
by
Masatoshi Yoshida
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
by
MPRG_Chubu_University
BERT+XLNet+RoBERTa
by
禎晃 山崎
機械学習モデルの判断根拠の説明(Ver.2)
by
Satoshi Hara
3次元レジストレーションの基礎とOpen3Dを用いた3次元点群処理
by
Toru Tamaki
プライバシー保護のためのサンプリング、k-匿名化、そして差分プライバシー
by
Hiroshi Nakagawa
RandomForestとR package
by
Shuma Ishigami
Rを用いたLTV(Life Time Value)の推定
by
宏喜 佐野
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
by
諒介 荒木
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
by
Akisato Kimura
Isolation forest
by
kataware
More from Takeshi Arabiki
PDF
開発の心得
by
Takeshi Arabiki
PDF
Introduction to Japanese Morphological Analysis
by
Takeshi Arabiki
PDF
R による文書分類入門
by
Takeshi Arabiki
PDF
Rのデータ構造とメモリ管理
by
Takeshi Arabiki
PDF
HTML5 Canvas で学ぶアフィン変換
by
Takeshi Arabiki
PDF
Introduction to Favmemo for Immature Engineers
by
Takeshi Arabiki
PDF
Rのスコープとフレームと環境と
by
Takeshi Arabiki
PDF
twitteRで快適Rライフ!
by
Takeshi Arabiki
PDF
RではじめるTwitter解析
by
Takeshi Arabiki
PDF
R版Getopt::Longを作ってみた
by
Takeshi Arabiki
PDF
Rデータフレーム自由自在
by
Takeshi Arabiki
PDF
HMM, MEMM, CRF メモ
by
Takeshi Arabiki
PDF
文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜
by
Takeshi Arabiki
PDF
Rデバッグあれこれ
by
Takeshi Arabiki
PDF
はじめてのまっぷりでゅ〜す
by
Takeshi Arabiki
PDF
TwitterのデータをRであれこれ
by
Takeshi Arabiki
PDF
Twitterのデータを取得する準備
by
Takeshi Arabiki
開発の心得
by
Takeshi Arabiki
Introduction to Japanese Morphological Analysis
by
Takeshi Arabiki
R による文書分類入門
by
Takeshi Arabiki
Rのデータ構造とメモリ管理
by
Takeshi Arabiki
HTML5 Canvas で学ぶアフィン変換
by
Takeshi Arabiki
Introduction to Favmemo for Immature Engineers
by
Takeshi Arabiki
Rのスコープとフレームと環境と
by
Takeshi Arabiki
twitteRで快適Rライフ!
by
Takeshi Arabiki
RではじめるTwitter解析
by
Takeshi Arabiki
R版Getopt::Longを作ってみた
by
Takeshi Arabiki
Rデータフレーム自由自在
by
Takeshi Arabiki
HMM, MEMM, CRF メモ
by
Takeshi Arabiki
文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜
by
Takeshi Arabiki
Rデバッグあれこれ
by
Takeshi Arabiki
はじめてのまっぷりでゅ〜す
by
Takeshi Arabiki
TwitterのデータをRであれこれ
by
Takeshi Arabiki
Twitterのデータを取得する準備
by
Takeshi Arabiki
クックパッド特売情報 における自然言語処理 〜固有表現抽出を利用した検索システム〜
1.
クックパッド特売情報 における自然言語処理 ∼固有表現抽出を利用した検索システム∼ YANS 第 10
回シンポジウム (2015/09/05 ) クックパッド株式会社 買物情報事業部 Takeshi Arabiki (@a_bicky)
2.
お話しすること •ものをつくること •ものを動かすこと •現実の問題を知ること •足りない技術を生み出すこと
3.
お話しすること •ものをつくること •ものを動かすこと •現実の問題を知ること •足りない技術を生み出すこと
4.
クックパッド特売情報
6.
•いわゆるチラシサービスの一種 •店舗さんが商品情報を投稿 クックパッド特売情報
7.
商品検索の使いどころ
8.
商品検索の使いどころ
9.
•各ユーザに限定すると商品数が少ない ‣ e.g. 登録している店舗の商品 ‣
1件しかヒットしないことがよくある •ユーザが意図的に検索するわけではない ‣ より適合率(精度)が求められる 特殊な検索事情
10.
商品検索の 初期の課題
11.
投稿された商品名 キーワード たまねぎドレッシング フルーツゼリー みかん たまねぎ ドレッシング フルーツ ゼリー みかん 形態素単位のインデキシング
12.
投稿された商品名 キーワード たまねぎドレッシング フルーツゼリー みかん たまねぎ ドレッシング フルーツ ゼリー みかん 形態素単位のインデキシング形態素単位のインデキシング 「たまねぎ」を使ったレシピに掲出 「みかん」を使ったレシピに掲出
13.
固有表現抽出を利用した 検索システム
14.
投稿された商品名 キーワード 固有表現単位のインデキシング たまねぎドレッシング 商品名 フルーツゼリー みかん 味商品名 たまねぎドレッシング フルーツゼリー みかん:TASTE
15.
固有表現抽出を使うメリット •適合率が上がる •正規表現と違って文字列全体を考慮できる •似たパターンの未知データにも対応可能
16.
固有表現抽出の方法 •MeCab+IPAdic による形態素解析と正規化 ‣ コストを商品名に最適化 ‣
辞書に代表表記の情報も登録 •CRFsuite による固有表現抽出 ‣ 形態素解析した結果を素性に利用 ‣ タグとして商品名、味、産地 etc.
17.
% mecab -d
dic 薄切り 薄切り 名詞,サ変接続,*,*,*,*,薄切り,ウスギリ,ウスギリ EOS 薄切 薄切 名詞,サ変接続,*,*,*,*,薄切,ウスギリ,ウスギリ,薄切り,薄切り,ウスギリ EOS 形態素解析結果と代表表記
18.
学習データの作成
19.
商品検索の 現在の課題
20.
商品名の形態素解析の難しさ •かつおたたき •ロース肉薄切り •名詞の間にある接頭詞・名詞接尾 ‣ e.g.「徳用焼き餃子」「生姜焼き徳用」
21.
商品名の形態素解析の難しさ •かつおたたき → かつ/お/たたき •ロース肉薄切り → ロース/肉薄/切り •名詞の間にある接頭詞・名詞接尾 ‣ e.g.「徳用焼き餃子」「生姜焼き徳用」
22.
知識ベースの構築 •同義語 ‣ 「パクチー」と「コリアンダー」 •一般名と品種・商品名 ‣ 「じゃがいも」と「メークイン」 •原料 ‣
「卵黄」と「卵」
23.
商品検索クエリの最適化 •材料は「豚肉」だけど「豚肉薄切り」かも ‣ 「豚肉ブロック」は掲出させたくない •材料名のクレンジング ‣ 材料名の括弧の中身は必要かどうか ‣
e.g.(薄切り)、(あれば)
24.
課題は たくさん
25.
最も深刻 な問題
26.
人手不足
27.
ブレークスルー
28.
http://www.nii.ac.jp/dsc/idr/cookpad/cookpad.html
29.
お話しすること •ものをつくること •ものを動かすこと •現実の問題を知ること •足りない技術を生み出すこと
30.
•ものをつくること •ものを動かすこと •現実の問題を知ること •足りない技術を生み出すこと
31.
自然言語処理で 世界中の食卓に 笑顔を!
Download