Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
長岡技術科学大学 自然言語処理研究室
1,434 views
質問意図によるQAサイト質問文の自動分類
林 秀治, 山本 和英. 質問意図によるQAサイト質問文の自動分類. 信学技報, vol. 113, no. 83, , NLC2013-10, pp. 51-56 (2013.6)
Technology
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 29
2
/ 29
3
/ 29
4
/ 29
5
/ 29
6
/ 29
7
/ 29
8
/ 29
9
/ 29
10
/ 29
11
/ 29
12
/ 29
13
/ 29
14
/ 29
15
/ 29
16
/ 29
17
/ 29
18
/ 29
19
/ 29
20
/ 29
21
/ 29
22
/ 29
23
/ 29
24
/ 29
25
/ 29
26
/ 29
27
/ 29
28
/ 29
29
/ 29
More Related Content
PDF
質問表現によるQAサイト質問文の自動分類
by
長岡技術科学大学 自然言語処理研究室
PDF
Katayama m
by
harmonylab
PDF
質問の難易度情報を用いたQAサイトにおける最適な回答者提示
by
長岡技術科学大学 自然言語処理研究室
PDF
QAサイトにおける専門用語を用いた最適な回答者提示
by
長岡技術科学大学 自然言語処理研究室
PPTX
ゲームアプリと「仮想通貨」
by
Masayuki Watanabe
PDF
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
by
Jon Burkhart
PDF
用言等換言辞書を用いた換言結果の考察
by
長岡技術科学大学 自然言語処理研究室
PDF
Cannes insights mma
by
Mobile Marketing Association
質問表現によるQAサイト質問文の自動分類
by
長岡技術科学大学 自然言語処理研究室
Katayama m
by
harmonylab
質問の難易度情報を用いたQAサイトにおける最適な回答者提示
by
長岡技術科学大学 自然言語処理研究室
QAサイトにおける専門用語を用いた最適な回答者提示
by
長岡技術科学大学 自然言語処理研究室
ゲームアプリと「仮想通貨」
by
Masayuki Watanabe
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
by
Jon Burkhart
用言等換言辞書を用いた換言結果の考察
by
長岡技術科学大学 自然言語処理研究室
Cannes insights mma
by
Mobile Marketing Association
Viewers also liked
PDF
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
by
長岡技術科学大学 自然言語処理研究室
PDF
10 Landing Page Case Studies to Help you Optimize your Own
by
Wishpond
PDF
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
by
North Texas Chapter of the ISSA
PDF
Selecting Proper Lexical Paraphrase for Children
by
長岡技術科学大学 自然言語処理研究室
PDF
対訳コーパスから生成したワードグラフによる部分的機械翻訳
by
長岡技術科学大学 自然言語処理研究室
PDF
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
by
長岡技術科学大学 自然言語処理研究室
PDF
Automatic Selection of Predicates for Common Sense Knowledge Expression
by
長岡技術科学大学 自然言語処理研究室
PDF
넥스트 컨퍼런스 2013: Conference on Innovation and The Future
by
SparkLabs Group
PPTX
Dicas presentes de natal 2014
by
Tudo de bom Cosméticos
PPT
AIM-OPP for clearbook
by
Jinky Quizon
PDF
用言等換言辞書の構築
by
長岡技術科学大学 自然言語処理研究室
PDF
кратко
by
kulibin
DOC
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
by
НАЕК «Енергоатом»
PPTX
Consumer Web Platforms & Customer Acquisition
by
Dave McClure
PDF
Local SEO - How to beat your clueless competitors
by
Greg Gifford
PDF
Ordem trt2
by
Douglas Fabiano Melo
PDF
Socialmedianew
by
comnico inc.
PDF
5 Questions That You Should Ask in Any Negotiation
by
Manisha Dorawala
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
by
長岡技術科学大学 自然言語処理研究室
10 Landing Page Case Studies to Help you Optimize your Own
by
Wishpond
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
by
North Texas Chapter of the ISSA
Selecting Proper Lexical Paraphrase for Children
by
長岡技術科学大学 自然言語処理研究室
対訳コーパスから生成したワードグラフによる部分的機械翻訳
by
長岡技術科学大学 自然言語処理研究室
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
by
長岡技術科学大学 自然言語処理研究室
Automatic Selection of Predicates for Common Sense Knowledge Expression
by
長岡技術科学大学 自然言語処理研究室
넥스트 컨퍼런스 2013: Conference on Innovation and The Future
by
SparkLabs Group
Dicas presentes de natal 2014
by
Tudo de bom Cosméticos
AIM-OPP for clearbook
by
Jinky Quizon
用言等換言辞書の構築
by
長岡技術科学大学 自然言語処理研究室
кратко
by
kulibin
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
by
НАЕК «Енергоатом»
Consumer Web Platforms & Customer Acquisition
by
Dave McClure
Local SEO - How to beat your clueless competitors
by
Greg Gifford
Ordem trt2
by
Douglas Fabiano Melo
Socialmedianew
by
comnico inc.
5 Questions That You Should Ask in Any Negotiation
by
Manisha Dorawala
Similar to 質問意図によるQAサイト質問文の自動分類
PDF
20121125_アンケートを作ろう@アンケート研究会
by
Takanori Hiroe
PDF
専門用語を対象とした語彙数推定テストの開発とその信頼性の評価:図書館情報学分野を事例として
by
ssuser9a82681
PDF
キーワード推定を内包したオーディオキャプション法
by
Yuma Koizumi
PDF
katayama m
by
harmonylab
PPTX
Mtg121024
by
Kosuke Kagawa
PPTX
Jacet2014ykondo_final
by
早稲田大学
PDF
質問応答システム入門
by
Hiroyoshi Komatsu
PDF
新しいコンピュータ支援語学学習態度尺度作成の試み:英語を学習する大学生を対象として
by
Yusaku Kawaguchi
PPTX
Information retrieval model
by
Yuku Takahashi
PDF
nl190segment
by
Hiroshi Ono
20121125_アンケートを作ろう@アンケート研究会
by
Takanori Hiroe
専門用語を対象とした語彙数推定テストの開発とその信頼性の評価:図書館情報学分野を事例として
by
ssuser9a82681
キーワード推定を内包したオーディオキャプション法
by
Yuma Koizumi
katayama m
by
harmonylab
Mtg121024
by
Kosuke Kagawa
Jacet2014ykondo_final
by
早稲田大学
質問応答システム入門
by
Hiroyoshi Komatsu
新しいコンピュータ支援語学学習態度尺度作成の試み:英語を学習する大学生を対象として
by
Yusaku Kawaguchi
Information retrieval model
by
Yuku Takahashi
nl190segment
by
Hiroshi Ono
More from 長岡技術科学大学 自然言語処理研究室
PDF
大規模常識知識ベース構築のための常識表現の自動獲得
by
長岡技術科学大学 自然言語処理研究室
PDF
「やさしい日本語」変換システムの試作
by
長岡技術科学大学 自然言語処理研究室
PDF
大規模常識知識ベース構築のための常識表現の自動獲得
by
長岡技術科学大学 自然言語処理研究室
PDF
機械学習を用いたニ格深層格の自動付与の検討
by
長岡技術科学大学 自然言語処理研究室
PDF
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
by
長岡技術科学大学 自然言語処理研究室
PDF
Web上の誹謗中傷を表す文の自動検出
by
長岡技術科学大学 自然言語処理研究室
PDF
文字列の出現頻度情報を用いた分かち書き単位の自動取得
by
長岡技術科学大学 自然言語処理研究室
PDF
普通名詞換言辞書の構築
by
長岡技術科学大学 自然言語処理研究室
PDF
Generation of Descriptive Elements for Text
by
長岡技術科学大学 自然言語処理研究室
PDF
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
by
長岡技術科学大学 自然言語処理研究室
PDF
文脈の多様性に基づく名詞換言の提案
by
長岡技術科学大学 自然言語処理研究室
PDF
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
by
長岡技術科学大学 自然言語処理研究室
PDF
普通名詞換言辞書の構築
by
長岡技術科学大学 自然言語処理研究室
PDF
二格深層格の定量的分析
by
長岡技術科学大学 自然言語処理研究室
PDF
Developing User-friendly and Customizable Text Analyzer
by
長岡技術科学大学 自然言語処理研究室
PDF
常識表現となり得る用言の自動選定の検討
by
長岡技術科学大学 自然言語処理研究室
PDF
保険関連文書を対象とした文章校正支援のための変換誤り検出
by
長岡技術科学大学 自然言語処理研究室
PDF
用言等換言辞書を人手で作りました
by
長岡技術科学大学 自然言語処理研究室
PDF
フレーズテーブルを用いた教師なし用語対訳抽出手法の比較
by
長岡技術科学大学 自然言語処理研究室
PDF
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
by
長岡技術科学大学 自然言語処理研究室
大規模常識知識ベース構築のための常識表現の自動獲得
by
長岡技術科学大学 自然言語処理研究室
「やさしい日本語」変換システムの試作
by
長岡技術科学大学 自然言語処理研究室
大規模常識知識ベース構築のための常識表現の自動獲得
by
長岡技術科学大学 自然言語処理研究室
機械学習を用いたニ格深層格の自動付与の検討
by
長岡技術科学大学 自然言語処理研究室
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
by
長岡技術科学大学 自然言語処理研究室
Web上の誹謗中傷を表す文の自動検出
by
長岡技術科学大学 自然言語処理研究室
文字列の出現頻度情報を用いた分かち書き単位の自動取得
by
長岡技術科学大学 自然言語処理研究室
普通名詞換言辞書の構築
by
長岡技術科学大学 自然言語処理研究室
Generation of Descriptive Elements for Text
by
長岡技術科学大学 自然言語処理研究室
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
by
長岡技術科学大学 自然言語処理研究室
文脈の多様性に基づく名詞換言の提案
by
長岡技術科学大学 自然言語処理研究室
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
by
長岡技術科学大学 自然言語処理研究室
普通名詞換言辞書の構築
by
長岡技術科学大学 自然言語処理研究室
二格深層格の定量的分析
by
長岡技術科学大学 自然言語処理研究室
Developing User-friendly and Customizable Text Analyzer
by
長岡技術科学大学 自然言語処理研究室
常識表現となり得る用言の自動選定の検討
by
長岡技術科学大学 自然言語処理研究室
保険関連文書を対象とした文章校正支援のための変換誤り検出
by
長岡技術科学大学 自然言語処理研究室
用言等換言辞書を人手で作りました
by
長岡技術科学大学 自然言語処理研究室
フレーズテーブルを用いた教師なし用語対訳抽出手法の比較
by
長岡技術科学大学 自然言語処理研究室
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
by
長岡技術科学大学 自然言語処理研究室
Recently uploaded
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):コアマイクロシステムズ株式会社 テーマ 「AI HPC時代のトータルソリューションプロバイダ」
by
PC Cluster Consortium
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):日本ヒューレット・パッカード合同会社 テーマ1「大規模AIの能力を最大限に活用するHPE Comp...
by
PC Cluster Consortium
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):Pacific Teck Japan テーマ3「『TrinityX』 AI時代のクラスターマネジメ...
by
PC Cluster Consortium
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):Pacific Teck Japan テーマ2「『Slinky』 SlurmとクラウドのKuber...
by
PC Cluster Consortium
PDF
論文紹介:DiffusionRet: Generative Text-Video Retrieval with Diffusion Model
by
Toru Tamaki
PDF
論文紹介:HiLoRA: Adaptive Hierarchical LoRA Routing for Training-Free Domain Gene...
by
Toru Tamaki
PDF
論文紹介:MotionMatcher: Cinematic Motion Customizationof Text-to-Video Diffusion ...
by
Toru Tamaki
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):エヌビディア合同会社 テーマ1「NVIDIA 最新発表製品等のご案内」
by
PC Cluster Consortium
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):日本ヒューレット・パッカード合同会社 テーマ3「IT運用とデータサイエンティストを強力に支援するH...
by
PC Cluster Consortium
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):富士通株式会社 テーマ1「HPC&AI: Accelerating material develo...
by
PC Cluster Consortium
PDF
膨大なデータ時代を制する鍵、セグメンテーションAIが切り拓く解析精度と効率の革新
by
Data Source
PPTX
ChatGPTのコネクタ開発から学ぶ、外部サービスをつなぐMCPサーバーの仕組み
by
Ryuji Egashira
PPTX
2025年11月24日情報ネットワーク法学会大井哲也発表「API利用のシステム情報」
by
Tetsuya Oi
PDF
ニューラルプロセッサによるAI処理の高速化と、未知の可能性を切り拓く未来の人工知能
by
Data Source
PDF
AI開発の最前線を変えるニューラルネットワークプロセッサと、未来社会における応用可能性
by
Data Source
PCCC25(設立25年記念PCクラスタシンポジウム):コアマイクロシステムズ株式会社 テーマ 「AI HPC時代のトータルソリューションプロバイダ」
by
PC Cluster Consortium
PCCC25(設立25年記念PCクラスタシンポジウム):日本ヒューレット・パッカード合同会社 テーマ1「大規模AIの能力を最大限に活用するHPE Comp...
by
PC Cluster Consortium
PCCC25(設立25年記念PCクラスタシンポジウム):Pacific Teck Japan テーマ3「『TrinityX』 AI時代のクラスターマネジメ...
by
PC Cluster Consortium
PCCC25(設立25年記念PCクラスタシンポジウム):Pacific Teck Japan テーマ2「『Slinky』 SlurmとクラウドのKuber...
by
PC Cluster Consortium
論文紹介:DiffusionRet: Generative Text-Video Retrieval with Diffusion Model
by
Toru Tamaki
論文紹介:HiLoRA: Adaptive Hierarchical LoRA Routing for Training-Free Domain Gene...
by
Toru Tamaki
論文紹介:MotionMatcher: Cinematic Motion Customizationof Text-to-Video Diffusion ...
by
Toru Tamaki
PCCC25(設立25年記念PCクラスタシンポジウム):エヌビディア合同会社 テーマ1「NVIDIA 最新発表製品等のご案内」
by
PC Cluster Consortium
PCCC25(設立25年記念PCクラスタシンポジウム):日本ヒューレット・パッカード合同会社 テーマ3「IT運用とデータサイエンティストを強力に支援するH...
by
PC Cluster Consortium
PCCC25(設立25年記念PCクラスタシンポジウム):富士通株式会社 テーマ1「HPC&AI: Accelerating material develo...
by
PC Cluster Consortium
膨大なデータ時代を制する鍵、セグメンテーションAIが切り拓く解析精度と効率の革新
by
Data Source
ChatGPTのコネクタ開発から学ぶ、外部サービスをつなぐMCPサーバーの仕組み
by
Ryuji Egashira
2025年11月24日情報ネットワーク法学会大井哲也発表「API利用のシステム情報」
by
Tetsuya Oi
ニューラルプロセッサによるAI処理の高速化と、未知の可能性を切り拓く未来の人工知能
by
Data Source
AI開発の最前線を変えるニューラルネットワークプロセッサと、未来社会における応用可能性
by
Data Source
質問意図によるQAサイト質問文の自動分類
1.
質問意図によるQAサイト 質問文の自動分類 長岡技術科学大学
林 秀治 山本 和英
2.
1.背景・目的 2.キーワードによる分類 3.語の頻度によるスコアでの分類
4.正規化したスコアでの分類
3.
1.背景・目的 2.キーワードによる分類 3.語の頻度によるスコアでの分類
4.正規化したスコアでの分類
4.
4 背景
自然文の質問により、簡単に自分の知りたい 情報を得ることができるQAサイトの利用者は 増加している。しかし、質問をしても回答を 得られないことが多い。 回答者が答えられそうな質問を探す場合、カ テゴリごとに分けて表示などは可能だが、そ れ以外の方法で数を絞ることができない。
5.
5 目的
質問文の難易度は質問者が求める回答の内容 によって分類することができると考えた。 回答者が答えやすい質問をより簡単に見つけ るための支援として、質問文を質問者の質問 意図ごとに事実、根拠、提案、意見、経験の5 タイプに自動で分類する方法を提案する。
6.
6 質問の分類
渡邊らは『コミュニティQAにおける質問の多 面的評価法の検討』という研究で事実、根 拠、提案、意見、経験の5種類のタイプを定義 し、人手での判定を行っている。 本研究ではこの5タイプを質問文の難易度ごと の分類に使用するため、今回の目的に合わせ て再定義し用いた。
7.
質問タイプの定義 7
事実 答えが明確に1つに決まる質問 答えはいくつか考えられるが1つあればいい質問 自分の考えがあっているか尋ねるような質問 とあるものについての情報を求める質問 例:富士山の標高は何mですか? エクセルで平均を出す方法を教えて 手袋は着けるであってますか?
8.
質問タイプの定義 8
根拠 理由や根拠についての質問 例:どんぐりにはなぜ帽子がついているのですか 血液型占いの根拠はなんですか? 提案 ある物事のオススメについての質問 例:オススメの英語勉強法はなんですか? 観光に行くならどこがお勧めですか?
9.
質問タイプの定義 9
経験 経験に基づいた回答を求める質問 例:ミニチュアダックスを飼ってらっしゃる方、 習性や性格を教えてください。 意見 回答者の意見やアドバイスを求める質問 アンケート形式の質問 回答する人に関する質問 例:この服どう思いますか? 集中したいときどうしますか?
10.
1.背景・目的 2.キーワードによる分類 3.語の頻度によるスコアでの分類
4.正規化したスコアでの分類
11.
キーワードによる分類の方法 質問文に、ある特定の語(キーワード)が含ま
れていたとき、質問文をそのキーワードが該当 するタイプに分類する。 キーワードは筆者が質問文を分類するときに、 『この語があればこの分類を表している』と考 えたのものを使用してた。 複数のキーワードが1つの質問文に含まれてい る場合は、優先度が高いキーワードのタイプに 分類される。 11
12.
使用するキーワードとその分類 事実:知りたい、方法、教えて、ますか、 ですか、でしょうか
根拠:どうして、何故、なんで、根拠、由来 提案:オススメ 意見:どちら、あなた 経験:る方 12
13.
使用するキーワードの優先度 優先度順:オススメ、知りたい、方法、どうして
何故、なんで、根拠、由来、教えて ますか、ですか、でしょうか、る方 『オススメを知りたい』という質問は『知りた い』よりも『オススメ』の優先度が高いので、 事実ではなく提案に分類される。 13
14.
キーワードによる分類の結果 Yahoo!知恵袋からランダムに抽出した質問文
のうち、文中に一つの質問しかないと判断し た1509文を自動分類した。 その結果1380文の分類に成功した。 14 タイプ質問文数 事実1090 根拠113 提案32 意見221 経験38 キーワード分類の精度・再現率 100 80 60 40 20 0 事実根拠提案経験意見 タイプ 精度・再現率 精度 再現率
15.
15 考察
キーワードを多く設定できた事実は結果がよ く、1つしか設定できなかった経験は結果がわ るかった 提案もキーワードは1つだけだが、提案タイプ の質問で全体的に見られ、その他のタイプで はほとんど使用されない語のため結果は良よ かった より多くの語をそれぞれのタイプでの出現頻 度を考慮し、分類に使用すれば結果がよくな るのでは?
16.
1.背景・目的 2.キーワードによる分類 3.語の頻度によるスコアでの分類
4.正規化したスコアでの分類
17.
語の頻度による分類 より多くの語を分類に使用するために、各タ
イプでの語の頻度で重み付けを行う以下のス コア関数を定義し用いた A=Freq(c,w)/Q_c+0.0001 B=Freq(all,c)/(ΣQ-Q_c)+0.0001 Score=A/B Freq(c,w):タイプCでの語Wの出現数 Q_c:タイプCの質問文の数 17
18.
語の頻度による分類の方法 質問文に含まれる語のスコアを全て足し、そ の合計のスコアが最も高い種類に分類される。
例:世界一短い曲は何ですか? + + + = 18 世界一 0.02939 0.00117 0.00037 0.00127 0.00173 事実 根拠 提案 経験 意見 短い 0.00562 0.00039 0.00012 0.00042 0.01730 ・・・ “?” 0.00527 0.00485 0.00105 0.00511 0.00811 合計 0.07415 0.02628 0.00840 0.02601 0.05994 この質問の場合、事実のスコアが一番高いの で、事実に分類される。
19.
語の頻度による分類の結果 キーワードの分類で使用した1509文を使って スコアを算出し、そのスコアで1509文を自動
分類した 19 語の頻度による分類の精度、再現率 100 80 60 40 20 0 事実根拠提案経験意見 タイプ 精度・再現率 精度(スコア) 精度(キーワード) 再現率(スコア) 再現率(キーワード)
20.
語の頻度による分類結果の考察 キーワードによる分類に比べ、全体的に精
度・再現率ともに向上した。 事実以外の分類で精度が低いのは事実の質問 が誤って分類されているためなので、事実の 再現率向上が全ての分類の精度向上につなが る 20
21.
データ追加後の分類の結果 スコアの計算は語の頻度を使うので、使用する 質問文の数を増やした方がよりよい結果が得ら
れると考え、データを追加し、1509文か ら、2938文とした データ追加後の分類の精度、再現率 21 100 80 60 40 20 0 事実根拠提案経験意見 タイプ 精度・再現率 精度(追加後) 精度(追加前) 再現率(追加後) 再現率(追加前) タイプ質問文数 事実1967 根拠216 提案90 意見500 経験31
22.
1.背景・目的 2.キーワードによる分類 3.語の頻度によるスコアでの分類
4.正規化したスコアでの分類
23.
23 スコアの正規化
事実の誤分類が多い原因を、データが増える ほどスコアに差が出る現在のスコア関数にあ ると考えた そこで、全ての分類でスコアの最大値が同じ1 になるように正規化した。
24.
スコア正規化後の分類結果 スコア正規化前と同様に2938文からスコアを 算出し、得られたスコアでその2938文を自動
分類した。 24 スコア正規化後の分類の精度、再現率 100 80 60 40 20 0 事実根拠提案経験意見 タイプ 精度・再現率 精度(正規化後) 精度(正規化前) 再現率(正規化後) 再現率(正規化前)
25.
スコア正規化後の結果の考察 再現率は大きな変化が見られなかったが、精
度は全体的によくなった。 意見の精度のみ30ポイント近く下がった この原因は、今までいろいろなタイプに分類 されていた事実がほぼ全て意見に分類される ようになってしまったためである。 25
26.
事実の再現率が低い理由の調査 事実の再現率が低い原因を調べるために、各
分類のスコアが上位の語を調べた。 事実根拠提案意見経験 エクセル由来オススメ別れるきつく 再決定下旬貴方実体験 歌詞山下予算エッチ受けよ 関数何故肌誘わ転換 入力物入れ合い浮気まさ 26
27.
27 考察
事実以外のタイプでは、該当するタイプの質問 のみで全体的に出現する語のスコアが高いため その語を手がかりに分類を行うことができる 事実では、事実全体で出現しやすい語はほかの タイプの質問でも出現しやい。そのため、より 多くの語にスコアを付与する必要があり、スコ ア付与にその語が入った人手で分類済みの質問 が必要な本手法では、これ以上の精度向上は困 難であることがわかった。
28.
28 まとめ
QAサイトの回答者支援として、質問文を質問意 図ごとに事実、根拠、提案、意見、経験の5タイ プに自動で分類する手法を提案した。 分類はキーワード、語の頻度によるスコアとそ れを正規化したものを使う3つの手法で行った 結果、スコアを正規化したものが一番結果が良 かった。 しかし、事実のより正確な分類にはより多くの 語のスコアが必要になるため、スコア計算に質 問文のデータが必要な本手法ではこれ以上の精 度向上は困難であることがわかった。
29.
ご清聴ありがとうございました
Download