Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

crossnoteの機械学習でパブリックコメントを分類する

2,293 views

Published on

crossnoteの機械学習でパブリックコメントを分類する

Published in: Software
  • Be the first to comment

  • Be the first to like this

crossnoteの機械学習でパブリックコメントを分類する

  1. 1. パブリックコメントを分類する 2016 update It, Inc. ML
  2. 2. はじめに crossnote ML は これに機械学習の機能を追加するものです。 本機能によって、crossnote が管理しているドキュメントを 様々な観点で自動的に分類することができるようになりました。 どういった分類ができるか、具体的な例で説明いたします。 crossnote(クロスノート) は 文書を仕事にする人たちの 共同作業を支援する 総合文書管理ソフトです
  3. 3. 自由記載の内容を分類 神奈川県で募集した高校入試制度についてのパブリックコメントを分類します。 Point! 人によって書き方が違う文章を内容に応じて分類できるか? 少ないデータでも分類できるか? パブリックコメントは自由記載のため、同じ内容でも人によって書き方が違います。 1項目あたりのデータ数が少ないうえ、似た内容を 分類するため、 難易度の高い課題と言えます。
  4. 4. 準備 使用したデータ 「神奈川県公立高等学校入学者選抜制度改善方針(案)」に関する意見募集 項目 件数 面接に関する意見 91 学力検査、学校独自問題に関する意見 86 選抜機会の一体化に関する意見 51 選考資料を取り扱う比率に関する意見 55 選考方法に関する意見 37 改善制度の導入時期に関する意見 40 学習に用いたデータ数 ※PDFから抽出する際に欠落したものがあり、公表されているものと件数は異なります また、件数が極端に少ない項目とその他に類するものは除外しました。 データ数は少な目です
  5. 5. 学習範囲の設定 【コメント】 10分程度の面接で、学力・能力を見極めるのは極めて困難。2割の配点は高すぎる。 【回答】 面接では、中学3年間にわたる、新しい学習指導要領で示された学力の3つの要素のうちの「主体的に 学習に取り組む態度(学習意欲)」及び受検者の特性や長所を含む総合的な意欲を共通に測ることとしてお ります。また、評価基準を定め、公平な面接となるようにします。 文章例 用意したデータにはコメントと回答の両方が記載されています。 今回は、コメントを分類したいので、crossnote MLの機能を使い、コメント部のみを学習す るように設定しました。 学習範囲の設定 学習範囲はコメント部だけ
  6. 6. 分類成績 選考方法、導入時期の2項目については、教師データ数不足と 判定されました。教師データを増やすことで改善が見込めます。 正解率は平均88%と良好でした。 自由記載の文章であっても 比較的精度よく分類できています。 データ不足の判定
  7. 7. 並列表示 類似した内容のコメントを見比べることで、 回答に矛盾がないかチェックできます コメント 回答 crossnote ML は コメントと回答を並列に表示できます
  8. 8. 業務適用 自由記載されたものでも、内容に基づいて分類できます。 問い合わせを分類し、過去の同様の問い合わせにどう回答したか検索したい こんな場合に応用できます 質問と回答など、対になった内容を並べてみることができます。 データ数が少なくても、比較的精度良く分類できます。
  9. 9. 社名 アップデイティット株式会社 英文社名 update it, Inc. 所在地 〒224-0001 横浜市都筑区中川1丁目6-35 中川カスケード201 TEL 045-910-5825 MAIL info@updateit.co.jp 本書は crossnote ver1.7.12 (2016/8 リリース)に基づいて作成しています。 最新の情報につきましては、弊社ホームページ http://www.updateit.co.jp をご覧ください。 さらに詳しい内容につきましては、下記までお問い合わせください。

×