SlideShare uses cookies to improve functionality and performance, and to provide you with relevant advertising. If you continue browsing the site, you agree to the use of cookies on this website. See our User Agreement and Privacy Policy.
SlideShare uses cookies to improve functionality and performance, and to provide you with relevant advertising. If you continue browsing the site, you agree to the use of cookies on this website. See our Privacy Policy and User Agreement for details.
Successfully reported this slideshow.
Activate your 30 day free trial to unlock unlimited reading.
2.
• 知識ベース:エンティティとそれらの間の関係
• 動機:知識ベースは不完全
• Freebaseに記録された人の中で 78.5% は国籍の情報
がない (Min et al., 2013)
2018/3/13 2
記述もれした事実を補完する「知識ベース補完」
言語処理学会年次大会
Donald Trump
New York City
United States
知識ベース
② 知識ベースに書かれていない
記述もれした事実を補完したい
① 知識ベースに
書かれた知識を
モデル化して
was_born_in is_located_in
nationality
3.
2018/3/13 3
主要なアプローチ:ベクトル空間モデル
言語処理学会年次大会
Honolulu
Donald Trump
New York City
United States
is_located_inwas_born_in
nationality
エンティティは
ベクトル空間上の点
関係はエンティティ
間のマッピング
低次元ベクトル空間
Barack Obama
4.
2018/3/13 4
低次元の空間に埋め込む利点はパラメータ共有
言語処理学会年次大会
• 低次元の場合,エンティティはパラメータを共有することが強制される
同じ関係を共有する「似た」エンティティは互いに近づく
• 汎化性能の向上に直結
Honolulu
Donald Trump
New York City
United States
is_located_inwas_born_in
nationalityBarack Obama
5.
2018/3/13 5
関係はパラメータが多くなるので共有されにくい
言語処理学会年次大会
• 関係を線形変換としてモデル化:𝒗 𝑇𝑟𝑢𝑚𝑝
⊤
𝑴 𝑤𝑎𝑠_𝑏𝑜𝑟𝑛_𝑖𝑛 ≈ 𝒗 𝑁𝑒𝑤𝑌𝑜𝑟𝑘
⊤
• エンティティが𝑑次元ベクトル
関係は𝒅 𝟐のパラメータが必要となりパラメータ共有されにくい
• 研究課題:いかに関係の次元を削減するか?
Honolulu
Donald Trump
New York City
United States
is_located_inwas_born_in
nationality
エンティティは
ベクトル空間上の点
関係はエンティティ
間のマッピング
Barack Obama