More Related Content
More from sekizawayuuki (20)
読解支援@2015 08-10-6
- 1. ネットオークションの出品情報文書
からの2段階属性抽出
塚原裕常,
宮崎林太郎,
西村純,
前田直人,
森辰則,
小林寛之,
石川雄介,
田中裕也,
翁松齢.
言語処理学会第15回年次大会発表論文集,
pp.400-‐403,
2009
プレゼンテーション
関沢祐樹
2015/08/10
1
- 2. 概要
• ネットオークションでの検索:全文検索
– サイズ、色を指定 → 思わぬ結果になることも
• 色の例:赤 → 赤西仁 (人名)
• サイズの例: L → PHILODOX (ブランド名)
• 出品情報文書
– 不要な情報が多い
• これを取り除けば精度が上がる?
• 提案
– 出品情報文書を文単位に分け、必要かを二値分類
– 機械学習手法を用いる
2015/08/10
2
- 4. 提案手法
• 二段階構成
1. 大域的情報で大まかに分類(SVMの二値分類)
• 出品情報文書を文単位で分類 (以下の素性を使用)
1. 分類対象となる文における形態素の出現頻度 (BOW)
2. 分類対象となる文の前後の文の判定結果
3. 分類対象となる前後の文の形態素の出現頻度
2. 局所的情報で詳細に抽出
• ベースラインと同じ方法
2015/08/10
4