Copyright(C) 2017 Findy Inc. All rights reserved.
Findyを作ってわかった
機械学習エンジニアとその分析
CTO 佐藤 将高 (@ma3tk)
2017/07/29(土) Machine Learning 15minutes!
Copyright(C) 2017 Findy Inc. All rights reserved.
2
FifteenMinutesController::show # 今日の発表
● ドラクエ11は3DS派/PS4派かについては話しません
● 機械学習の技術的なお話は他の方にお任せします!
● Findy 創業して1年
● 人材系に関わってわかった、
「機械学習エンジニアってこうであるべき?」
という提案のお話をします
● 会社とプロダクトの話 → そこからわかったこと
Copyright(C) 2017 Findy Inc. All rights reserved.
findy.members.myself
3
ファインディ株式会社
取締役CTO:佐藤 将高
  (@ma3tk)
東京大学情報理工学系研究科創造情報学専攻卒業後、グリーを経てFindy
の創業に参画。大学院では、稲葉真理研究室に所属。過去10年分の論文
に対し論文間の類似度を、自然言語処理やデータマイニングにより内容の
解析を定量的・定性的に行うことで算出する論文を執筆。グリーではゲーム
プラットフォームの開発、Nativeゲームの開発、QAエンジニアを経験し、フロ
ントエンドからバックエンドまで開発に精通している。筋トレが好き。最近は
肩トレにハマっている。B:85 D:130 S:120
Copyright(C) 2017 Findy Inc. All rights reserved.
findy = Company.find_by(name: FINDY_INC) # 知ってたりします?
4
Copyright(C) 2017 Findy Inc. All rights reserved.
5
Copyright(C) 2017 Findy Inc. All rights reserved.
findy.description # ファインディについて
6
2016年 6月 ファインディ株式会社(Findy Inc.)設立
2016年 9月 Findy Score α版 テスト開始
2016年11月 人事向け・求人票採点サービスFindy Score をリリース
2017年 3月 オフィスを五反田に移転
2017年 5月 ハイスキルなエンジニアのプレミアム転職Findy リリース
Copyright(C) 2017 Findy Inc. All rights reserved.
findy_score = findy.products.first # Findy Score をリリース
Copyright(C) 2017 Findy Inc. All rights reserved. 8
findy_score.description # Findy Score is 何?
● 企業の人事向けプロダクト
● 募集要項のテキストを入れると、
「100点満点中何点の出来か」がわかる
Copyright(C) 2017 Findy Inc. All rights reserved. 9
Findy Score の次のステップ
アイディアは面白いと褒めてくれたり、
評判がよかったりはする
…
けど、売上がほとんど無い!!(つらい)
…
売上を作りつつ、Findy Score が活かせる
何かが作れないか。
Copyright(C) 2017 Findy Inc. All rights reserved.
Findy Score 生かしたいが、どこかにヒントはないか?
10
• 「面接担当者が技術のことを理解していな
かった」
• 「人事担当者に技術力が伝わる履歴書をど
う書けば良いか分からなかった」
• 「スカウトは定型文ばかり」
• 「興味ない、知らない会社からのスカウトば
かり来る」
イケてる会社ドコー!?!?
エンジニアの悩み 人事の悩み
• 「エンジニアの応募が来ない」
• 「レジュメを見ても技術力が分からない」
• 「スカウトを毎日打つのが大変」
イケてるエンジニア誰なのー!?!?
ヒアリングしたことで、
エンジニアと人事の間に存在する大きな壁の存在に気付いた
Copyright(C) 2017 Findy Inc. All rights reserved.
findy.products.all[1] # ハイスキルなエンジニアのプレミアム転職 Findy
11
つまり、イケてるエンジニアとイケてる企業をマッチング
イケてるエンジニア イケてる企業
Copyright(C) 2017 Findy Inc. All rights reserved.
サービス紹介 エンジニアの審査
12
Findyのマッチング
• エンジニアがGitHubログイ
ンするだけで言語別にスキ
ル偏差値を算出
• 解析対象はGitHubの公開
レポジトリのみ
• 多くのエンジニアから支持
されており、かつ日々スキ
ルを磨いている方を中心に
ハイスキルエンジニアと判
定
• 機械学習のインターンや副
業エンジニアを採用し、強
化中
エンジニアのGitHubを解析して、スキル偏差値を算出
Copyright(C) 2017 Findy Inc. All rights reserved. 13
ハイスキルなエンジニアのプレミアム転職「Findy」リリース
Copyright(C) 2017 Findy Inc. All rights reserved.
本題: 機械学習エンジニアについてわかったこと
14
1. 求人票の側面から
2. 自社で機械学習にチャレンジしてみて
3. 機械学習エンジニアを採用してみて
Copyright(C) 2017 Findy Inc. All rights reserved.
1. 求人票の側面
15
● 先程あったように、数万件の求人を読み込みした
● 職種別に平均のFindy Score を出してみた
 ▶ 機械学習エンジニアは平均スコアが少し低め
Copyright(C) 2017 Findy Inc. All rights reserved.
1. 求人票の側面
16
• 平均スコアが低い職種の理由
▶いい求人の母数が少ない
 ▶応募してくる人が一定数いるので具体化する必要がない
 ▶情報量が不足
• 機械学習エンジニアの求人をよく読んでみた
 ▶内容がわかりにくく、業務内容があいまい
機械学習エンジニアでどういう人取ればいいのか、
わかってないのでは?
Copyright(C) 2017 Findy Inc. All rights reserved.
自社でも機械学習(ディープラーニング)にチャレンジ!
17
ディープラーニングの目的は?
▶Findy Score の評価項目に対する特長量の自動抽出
実装してみた
● 優秀な機械学習エンジニア T さんに求人票の解析のためにディー
プラーニング周りの実装を手伝ってもらった
● Tさん「たぶん、有意義な結果出ませんよ(笑) とりあえずやってみま
す?(笑)」
↓
実行
↓
Tさん「やっぱり厳しかったです(笑)」
機械学習の専門家でも、ドメインに対する知識が必要
Copyright(C) 2017 Findy Inc. All rights reserved.
機械学習エンジニアを採用する過程で…
18
● ありがたいことに、「機械学習がやりたい!」という若手が多い
Findyへのインターン応募数が多数
● しかし、「求人票に興味がある」「人材領域に対して革新的な事を
やってみたい」というような人は少ない
● 機械学習エンジニアのインターンは今までで1人だけ
● 僕らもどういう人採ればいいのかわからない…
何人も面接してきたけど採用するのが難しい
Copyright(C) 2017 Findy Inc. All rights reserved.
なぜ採用しなかったか
19
● 自分たちが Findy.us を作る時に、データ分析をしてきたが、求人票
の知識がないと仮説検証が難しい
  ▶ドメイン知識が必要
● そもそも求人票ってなんなのか、どういう要素があるのか、良いとは
なんなのか、悪いとはなんなのか…
● 仮説検証がそもそも難しい
 ▶自分たちの場合、求人を読み込んだ代表の山田が教師あり学習の
教師と化し、彼の脳内の判断軸をモデル化した
 ▶もし人材業界に興味がない機械学習を知っているエンジニアがやっ
たとしても上記がわからなければ結果は出にくい?
 ▶その業界をずっと見てないとわからないことがある
仮説検証のための観点に気付ける可能性が低いから
Copyright(C) 2017 Findy Inc. All rights reserved.
これらの学びとしてわかること
20
● 機械学習エンジニアがある領域にチャレンジする場合、その領域の
プロフェッショナルであるもしくは興味が強い状態が望ましい
● 機械学習を専門とするよりも、ある領域を専門としつつ機械学習も使
えるエンジニアであるべき
 ▶ ディープラーニングって目的じゃなくて何かを解決するための手段
● 求人票の解析は制約条件が多くないので簡単に機械学習できるか
と言われても難しい領域
ある領域のプロが機械学習をやる方が成功しやすいのでは
Copyright(C) 2017 Findy Inc. All rights reserved.
結論
21
1. 欲しい領域のドメイン知識を持った人を採用
2. ドメインのプロに広義の機械学習を教え込む
3. 機械学習のプロはそういう人をうまく導いてあげる
と成功しやすいかも
※もちろん僕らの見解なので、機械学習のプロがチャレンジしていってもいいと思います
※機械学習のプロがよく知ってる領域なら一番ラクですね
Copyright(C) 2017 Findy Inc. All rights reserved.
22
⭐ ご清聴ありがとうございました⭐
HRの話、筋トレの相談、カラオケのお誘い、ドラクエ11の話、
後ほどの懇親会でお話しましょう!
また、オフィスで おいしいプロテイン を準備してあるので、
是非 五反田まで遊びに来てください!

Findy を作ってわかった、機械学習エンジニアとその分析 - Machine Learning15minutes! 2017/07/29

  • 1.
    Copyright(C) 2017 FindyInc. All rights reserved. Findyを作ってわかった 機械学習エンジニアとその分析 CTO 佐藤 将高 (@ma3tk) 2017/07/29(土) Machine Learning 15minutes!
  • 2.
    Copyright(C) 2017 FindyInc. All rights reserved. 2 FifteenMinutesController::show # 今日の発表 ● ドラクエ11は3DS派/PS4派かについては話しません ● 機械学習の技術的なお話は他の方にお任せします! ● Findy 創業して1年 ● 人材系に関わってわかった、 「機械学習エンジニアってこうであるべき?」 という提案のお話をします ● 会社とプロダクトの話 → そこからわかったこと
  • 3.
    Copyright(C) 2017 FindyInc. All rights reserved. findy.members.myself 3 ファインディ株式会社 取締役CTO:佐藤 将高   (@ma3tk) 東京大学情報理工学系研究科創造情報学専攻卒業後、グリーを経てFindy の創業に参画。大学院では、稲葉真理研究室に所属。過去10年分の論文 に対し論文間の類似度を、自然言語処理やデータマイニングにより内容の 解析を定量的・定性的に行うことで算出する論文を執筆。グリーではゲーム プラットフォームの開発、Nativeゲームの開発、QAエンジニアを経験し、フロ ントエンドからバックエンドまで開発に精通している。筋トレが好き。最近は 肩トレにハマっている。B:85 D:130 S:120
  • 4.
    Copyright(C) 2017 FindyInc. All rights reserved. findy = Company.find_by(name: FINDY_INC) # 知ってたりします? 4
  • 5.
    Copyright(C) 2017 FindyInc. All rights reserved. 5
  • 6.
    Copyright(C) 2017 FindyInc. All rights reserved. findy.description # ファインディについて 6 2016年 6月 ファインディ株式会社(Findy Inc.)設立 2016年 9月 Findy Score α版 テスト開始 2016年11月 人事向け・求人票採点サービスFindy Score をリリース 2017年 3月 オフィスを五反田に移転 2017年 5月 ハイスキルなエンジニアのプレミアム転職Findy リリース
  • 7.
    Copyright(C) 2017 FindyInc. All rights reserved. findy_score = findy.products.first # Findy Score をリリース
  • 8.
    Copyright(C) 2017 FindyInc. All rights reserved. 8 findy_score.description # Findy Score is 何? ● 企業の人事向けプロダクト ● 募集要項のテキストを入れると、 「100点満点中何点の出来か」がわかる
  • 9.
    Copyright(C) 2017 FindyInc. All rights reserved. 9 Findy Score の次のステップ アイディアは面白いと褒めてくれたり、 評判がよかったりはする … けど、売上がほとんど無い!!(つらい) … 売上を作りつつ、Findy Score が活かせる 何かが作れないか。
  • 10.
    Copyright(C) 2017 FindyInc. All rights reserved. Findy Score 生かしたいが、どこかにヒントはないか? 10 • 「面接担当者が技術のことを理解していな かった」 • 「人事担当者に技術力が伝わる履歴書をど う書けば良いか分からなかった」 • 「スカウトは定型文ばかり」 • 「興味ない、知らない会社からのスカウトば かり来る」 イケてる会社ドコー!?!? エンジニアの悩み 人事の悩み • 「エンジニアの応募が来ない」 • 「レジュメを見ても技術力が分からない」 • 「スカウトを毎日打つのが大変」 イケてるエンジニア誰なのー!?!? ヒアリングしたことで、 エンジニアと人事の間に存在する大きな壁の存在に気付いた
  • 11.
    Copyright(C) 2017 FindyInc. All rights reserved. findy.products.all[1] # ハイスキルなエンジニアのプレミアム転職 Findy 11 つまり、イケてるエンジニアとイケてる企業をマッチング イケてるエンジニア イケてる企業
  • 12.
    Copyright(C) 2017 FindyInc. All rights reserved. サービス紹介 エンジニアの審査 12 Findyのマッチング • エンジニアがGitHubログイ ンするだけで言語別にスキ ル偏差値を算出 • 解析対象はGitHubの公開 レポジトリのみ • 多くのエンジニアから支持 されており、かつ日々スキ ルを磨いている方を中心に ハイスキルエンジニアと判 定 • 機械学習のインターンや副 業エンジニアを採用し、強 化中 エンジニアのGitHubを解析して、スキル偏差値を算出
  • 13.
    Copyright(C) 2017 FindyInc. All rights reserved. 13 ハイスキルなエンジニアのプレミアム転職「Findy」リリース
  • 14.
    Copyright(C) 2017 FindyInc. All rights reserved. 本題: 機械学習エンジニアについてわかったこと 14 1. 求人票の側面から 2. 自社で機械学習にチャレンジしてみて 3. 機械学習エンジニアを採用してみて
  • 15.
    Copyright(C) 2017 FindyInc. All rights reserved. 1. 求人票の側面 15 ● 先程あったように、数万件の求人を読み込みした ● 職種別に平均のFindy Score を出してみた  ▶ 機械学習エンジニアは平均スコアが少し低め
  • 16.
    Copyright(C) 2017 FindyInc. All rights reserved. 1. 求人票の側面 16 • 平均スコアが低い職種の理由 ▶いい求人の母数が少ない  ▶応募してくる人が一定数いるので具体化する必要がない  ▶情報量が不足 • 機械学習エンジニアの求人をよく読んでみた  ▶内容がわかりにくく、業務内容があいまい 機械学習エンジニアでどういう人取ればいいのか、 わかってないのでは?
  • 17.
    Copyright(C) 2017 FindyInc. All rights reserved. 自社でも機械学習(ディープラーニング)にチャレンジ! 17 ディープラーニングの目的は? ▶Findy Score の評価項目に対する特長量の自動抽出 実装してみた ● 優秀な機械学習エンジニア T さんに求人票の解析のためにディー プラーニング周りの実装を手伝ってもらった ● Tさん「たぶん、有意義な結果出ませんよ(笑) とりあえずやってみま す?(笑)」 ↓ 実行 ↓ Tさん「やっぱり厳しかったです(笑)」 機械学習の専門家でも、ドメインに対する知識が必要
  • 18.
    Copyright(C) 2017 FindyInc. All rights reserved. 機械学習エンジニアを採用する過程で… 18 ● ありがたいことに、「機械学習がやりたい!」という若手が多い Findyへのインターン応募数が多数 ● しかし、「求人票に興味がある」「人材領域に対して革新的な事を やってみたい」というような人は少ない ● 機械学習エンジニアのインターンは今までで1人だけ ● 僕らもどういう人採ればいいのかわからない… 何人も面接してきたけど採用するのが難しい
  • 19.
    Copyright(C) 2017 FindyInc. All rights reserved. なぜ採用しなかったか 19 ● 自分たちが Findy.us を作る時に、データ分析をしてきたが、求人票 の知識がないと仮説検証が難しい   ▶ドメイン知識が必要 ● そもそも求人票ってなんなのか、どういう要素があるのか、良いとは なんなのか、悪いとはなんなのか… ● 仮説検証がそもそも難しい  ▶自分たちの場合、求人を読み込んだ代表の山田が教師あり学習の 教師と化し、彼の脳内の判断軸をモデル化した  ▶もし人材業界に興味がない機械学習を知っているエンジニアがやっ たとしても上記がわからなければ結果は出にくい?  ▶その業界をずっと見てないとわからないことがある 仮説検証のための観点に気付ける可能性が低いから
  • 20.
    Copyright(C) 2017 FindyInc. All rights reserved. これらの学びとしてわかること 20 ● 機械学習エンジニアがある領域にチャレンジする場合、その領域の プロフェッショナルであるもしくは興味が強い状態が望ましい ● 機械学習を専門とするよりも、ある領域を専門としつつ機械学習も使 えるエンジニアであるべき  ▶ ディープラーニングって目的じゃなくて何かを解決するための手段 ● 求人票の解析は制約条件が多くないので簡単に機械学習できるか と言われても難しい領域 ある領域のプロが機械学習をやる方が成功しやすいのでは
  • 21.
    Copyright(C) 2017 FindyInc. All rights reserved. 結論 21 1. 欲しい領域のドメイン知識を持った人を採用 2. ドメインのプロに広義の機械学習を教え込む 3. 機械学習のプロはそういう人をうまく導いてあげる と成功しやすいかも ※もちろん僕らの見解なので、機械学習のプロがチャレンジしていってもいいと思います ※機械学習のプロがよく知ってる領域なら一番ラクですね
  • 22.
    Copyright(C) 2017 FindyInc. All rights reserved. 22 ⭐ ご清聴ありがとうございました⭐ HRの話、筋トレの相談、カラオケのお誘い、ドラクエ11の話、 後ほどの懇親会でお話しましょう! また、オフィスで おいしいプロテイン を準備してあるので、 是非 五反田まで遊びに来てください!