Submit Search
Upload
論文紹介 Knowledge Vault: A Web-Scale Approach to Probabilistic Knowledge Fusion
•
0 likes
•
281 views
S
simaokasonse
Follow
論文紹介 Knowledge Vault: A Web-Scale Approach to Probabilistic Knowledge Fusion
Read less
Read more
Technology
Report
Share
Report
Share
1 of 24
Download now
Download to read offline
Recommended
HPKP Supercookies (公開鍵ピンニングによるユーザ追跡)
HPKP Supercookies (公開鍵ピンニングによるユーザ追跡)
Muneaki Nishimura
Cloudian update at cloudian seminar 2014
Cloudian update at cloudian seminar 2014
CLOUDIAN KK
オブジェクトストレージのユースケース (Cloudweek2014 講演資料)
オブジェクトストレージのユースケース (Cloudweek2014 講演資料)
CLOUDIAN KK
Silverlightをあれこれ紹介
Silverlightをあれこれ紹介
mizusawa
Microsoft Azure/SRT - 最新技術情報アップデート
Microsoft Azure/SRT - 最新技術情報アップデート
Shige Fukushima
LODはWebと世界をどのように進化させてきたか
LODはWebと世界をどのように進化させてきたか
AWAlab
ナレッジグラフ入門
ナレッジグラフ入門
KnowledgeGraph
情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion
Rakuten Group, Inc.
Recommended
HPKP Supercookies (公開鍵ピンニングによるユーザ追跡)
HPKP Supercookies (公開鍵ピンニングによるユーザ追跡)
Muneaki Nishimura
Cloudian update at cloudian seminar 2014
Cloudian update at cloudian seminar 2014
CLOUDIAN KK
オブジェクトストレージのユースケース (Cloudweek2014 講演資料)
オブジェクトストレージのユースケース (Cloudweek2014 講演資料)
CLOUDIAN KK
Silverlightをあれこれ紹介
Silverlightをあれこれ紹介
mizusawa
Microsoft Azure/SRT - 最新技術情報アップデート
Microsoft Azure/SRT - 最新技術情報アップデート
Shige Fukushima
LODはWebと世界をどのように進化させてきたか
LODはWebと世界をどのように進化させてきたか
AWAlab
ナレッジグラフ入門
ナレッジグラフ入門
KnowledgeGraph
情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion
Rakuten Group, Inc.
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
More Related Content
Recently uploaded
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
Recently uploaded
(8)
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Featured
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
Vit Horky
The six step guide to practical project management
The six step guide to practical project management
MindGenius
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
Featured
(20)
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
Skeleton Culture Code
Skeleton Culture Code
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
How to have difficult conversations
How to have difficult conversations
Introduction to Data Science
Introduction to Data Science
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
The six step guide to practical project management
The six step guide to practical project management
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
論文紹介 Knowledge Vault: A Web-Scale Approach to Probabilistic Knowledge Fusion
1.
論文紹介:Knowledge Vault: A
Web-‐Scale Approach to Probabilis;c Knowledge Fusion 発表者:M1島岡聖世 15/07/21 知識獲得研究会論文紹介 1
2.
背景 • GoogleがFreebaseのサポートを終了 • 人手による知識ベースの拡大は頭打ちに
• ウェブからのマイニングによる知識ベースの 自動構築へ Knowledge Vault 15/07/21 知識獲得研究会論文紹介 2
3.
Knowledge Vault • WEBからの情報抽出はノイズが多い
• そこで、異なる複数のソースから情報抽出を 行うことで統計的信頼性を高める – テキストパターン – DOM構造 – HTML表構造 – Freebase Knowledge Vault 15/07/21 知識獲得研究会論文紹介 3
4.
Knowledge Vault 貢献1:ノイズの多い情報抽出を既存の知識ベースと 組み合わせることにより信頼性を高めた
15/07/21 知識獲得研究会論文紹介 4
5.
Knowledge Vault およそ33%の事実はFreebaseに存在しないもの 貢献2:かつてない規模の知識ベースの構築 15/07/21
知識獲得研究会論文紹介 5
6.
Knowledge Vault 貢献3:複数の異なる情報抽出を組み合わせることで それぞれを単独で動かすよりも性能が上がることを実証 15/07/21
知識獲得研究会論文紹介 6
7.
概要 Knowledge Vaultの目的 15/07/21 知識獲得研究会論文紹介
7
8.
概要 4種類のシステム 2種類のシステム 4+2=6種類のシステムを一つに統合 15/07/21 8
9.
概要 Knowledge Vaultが用いる学習データ ・Knowledge Vaultが抽出した160億のトリプルを
8:2に分割してそれぞれ訓練、学習データとする ・Local Closed World AssumpBon: (s,p,o)のラベルは以下のようにして定める もし (s,p,o)がFreebaseに存在するならTrue もし (s,p,o’), o’ ≠ o がFreebaseに存在するならFalse それ以外の場合は未知として、データを除外 15/07/21 知識獲得研究会論文紹介 9
10.
Extractors • 4種類の情報抽出システム –
Text Documents (TXT) – HTML Trees (DOM) – HTML Tables (TBL) – Human Annotated pages (ANO) • 情報抽出器の出力 – トリプル (s,p,o) – スコア • 各述語ごとに独立した抽出機を学習する – 4469個の2値分類器をMapReduceで学習 15/07/21 知識獲得研究会論文紹介 10
11.
Text Documents (TXT) •
Distant Supervisionを用いて、2エンティティの 現れる文から組成を取り出し、ラベルを付与 • Freebaseのトリプルをシードとしてブートスト ラッピングを行い、述語pを表すテキストを大 量に集め、それを教師データとして学習する。 15/07/21 知識獲得研究会論文紹介 11
12.
HTML Trees (DOM) •
Text Documentsと同じように学習する • ただし、素性としてテキストではなくHTMLの DOMの経路を利用する 15/07/21 知識獲得研究会論文紹介 12
13.
HTML tables (TBL) 15/07/21
知識獲得研究会論文紹介 13
14.
Human Annotated pages
(ANO) 15/07/21 知識獲得研究会論文紹介 14
15.
Graph-‐based priors • Freebaseを情報抽出の事前知識として利用
• 2種類の事前知識のモデル – Path ranking algorithm (PRA) – Neural network model (MLP) • モデルの出力 – トリプルがTrueであるスコア 15/07/21 知識獲得研究会論文紹介 15
16.
Path ranking algorithm
(PRA) • Freebaseのグラフを予測したい述語以外の経 路を通ってランダムウォークして、主語から目 的語にたどり着けるかどうかにより経路を評 価する – 大学に行ったかどうかを予測する経路: 15/07/21 知識獲得研究会論文紹介 16
17.
Neural network model
(MLP) エンベディングの Nearest Neighbors: 15/07/21 知識獲得研究会論文紹介 17
18.
Knowledge fusion • 複数のモデルを組み合わせることで性能を上 げる
• 入力:10次元ベクトル – 4つの情報抽出システムの抽出数と平均スコア – 2つの事前知識モデルのスコア • 出力 – トリプルが真である確率 15/07/21 知識獲得研究会論文紹介 18
19.
結果の評価 • 各情報抽出システムの性能を調べる ・DOMが抽出量の大部分を占めている ・4つを組み合わせたシステムの性能が良い AUC:ランダムに選んだ正例がランダムに選んだ負例よりも高スコアである確率 15/07/21
知識獲得研究会論文紹介 19
20.
結果の評価 • システムを組み合わせると性能は上がるか 上がる! 15/07/21 20
21.
結果の評価 • 文書数を大きくすると性能は上がるか 上がる! 15/07/21 21
22.
結果の評価 15/07/21 知識獲得研究会論文紹介 22
23.
結果の評価 15/07/21 知識獲得研究会論文紹介 23
24.
結果の評価 15/07/21 知識獲得研究会論文紹介 24
Download now