Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する

1,770 views

Published on

諸般の事情により、スライドは発表時のものの一部となります。

Published in: Data & Analytics
  • Be the first to comment

第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する

  1. 1. 第17回 Machine Learning 15minutes!(2017/10/28) ビジネスの出会いを科学する R&D Group 研究員:高橋 寛治@kanji250tr
  2. 2. 法人向け名刺管理サービス 個人向け名刺アプリ Sansanは2つの名刺サービスを提供しています ➢ 名刺のデータ化 ➢ 名刺による人脈の管理 ➢ 人手による正確なデータ化
  3. 3. 名刺を企業の資産に変える 2 名刺は人と人との出会いの証である接点情報 → 誰と誰が、いつ出会ったかを記録したビジネスデータベースとなる データ化およびビジネスデータベースからの価値創出がR&Dの課題
  4. 4. ビジネスの出会いを科学するために必要な2つの領域 3 名刺データ化の自動化 データ活用
  5. 5. 年間数億枚の名刺を99.9%の精度でデータ化 4 人力入力に比べ、名刺1枚あたりの入力コストを 機械学習を適用することで約80%削減 名刺画像の読取 名刺情報の入力 ビジネスデータベース 人力×機械学習など
  6. 6. データ活用一例:キーワードによる属性の付与 5 企業の特徴や属性を表すキーワードを付与する 業種分類 Sansan株式会社:情報処理サービス / パッケージソフト業 生きた情報(トレンド)も含めたい IoT, ディープラーニング, ビットコイン, AI, Fintech
  7. 7. 名詞の連接を計算しキーワードを抽出 6 キーワード抽出 • 形態素解析や不用語削除など前処理 を適用 • 会社単位でキーワード候補を抽出 • TermExtractによりスコアリング • Top Nをキーワードとして抽出 1. トップページを取得 2. 形態素解析 クラウド 名詞 名刺管理 名詞 サービス 名詞 を 助詞 提供 名詞 する 動詞 3. キーワード候補抽出4. キーワード抽出 クラウド 名詞 名刺管理 名詞 サービス 名詞 提供 名詞 クラウド名刺管理 𝐹𝐿𝑅 𝐶𝑁 = 𝑓 𝐶𝑁 × 𝐿𝑅 𝐶𝑁 𝐿𝑅 𝐶𝑁 = ෑ 𝑖=1 𝐿 𝐹𝐿 𝑁𝑖 + 1 𝐹𝑅 𝑁𝑖 + 1 1 2𝐿
  8. 8. 出会いの 精査 意図した 複数の 出会い 出会いへの アプローチ ミッション 目的 成果 偶然の 複数の 出会い ミッション 目的との マッチング 出会う べき人 名刺DB ・成果の理解 ・人物特徴の分析 ・リコメンド Sansan レコメンドエンジン データ活用の今後

×