Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
ヒューレットパッカード社の
社員の離職リスク予測
中山ところてん
@tokoroten
第一回機械学習ビジネス研究会
http://ml-business.connpass.com/event/36234/
2016/08/28
自己紹介
• ところてん
• 所属
• Emotion Intelligence
• 職歴
• 半導体計測機開発
• 情報セキュリティ、ビッグデータ
• ソーシャルゲームデータ分析、ソーシャルゲームゲームディレクター、広告分析
• EC周りのデ...
お仕事
https://www.zenclerk.com/
• ZenClerk
• クーポンを「配布しない」サービス
• 配布だけならだれでもできる
• 利益が改善するように配布するようにするのがミソ
• ユーザの行動や、マウスの動きから、
...
お仕事
https://www.zenclerk.com/interest_widget/
• Interest Widget
• マウスの動きはページスクロールから、商品への興味を予測
• お客様が「興味を持ったであろう商品」を自動で記録し、...
出典書籍
• ヤバい予測学
• ビジネス寄りの機械学習に関する書籍
• 原著:The Power of Predict Who Will Click,Buy,
Lie,or Die
• 原著は2016年に改訂版が出ている
• 2章88pより
•...
HP社の離職予測
• 初出は2011年のPredictive Analytics Worldというカンファレンス
• http://www.predictiveanalyticsworld.com/london/2011/agenda.
php...
書籍中での解説
• HPのインドのバンガロールの分析チームが開発
• Flight Risk
• メモ:直訳すると「高跳びリスク」、「離職リスク」の意味
• 訓練データ
• 給与、昇進、昇給、勤務評価、ジョブローテーション等のデータ2年分
• ...
分析結果
• 精度・効果
• フライトリスクが高い方から40%の従業員に退職者の75%が含まれる
• 欠員補充や生産性の低下に対して、推定三億ドルのコスト削減効果
• 辞めない傾向にある社員
• 給料が高い、昇給が多い、勤務評価が向上している
...
運用
• フライトリスクを導入したチームでは、離職率が20%から15%に減少
• フライトリスクは一年に四回更新
• データの取り扱いに関して、「解釈」「限界」「悪影響」について訓練を受け
たごく一部の幹部社員にのみ情報開示、自分の部下しか閲覧...
なぜ離職予測がコスト削減につながるのか?
• 書籍の中で深く触れられていなかったので、自分
で計算をしてみる
• 日本基準で計算しているので、エージェントコストが支
配的
• 一人辞めると、年俸の50%くらいのコストがかかると
見ていい
• 離...
なぜ離職予測がコスト削減につながるのか?(別試算)
• 会計事務所(PwC社)のコンサルタントの試算
• 自分の推定とだいたい同じ
• 有給消化をコストとするのは…
https://www.rosei.jp/jinjour/article.ph...
原典を読んでみる
• 発表資料は未公開、カンファレンス参加者にのみ公開?
• HPのサイトからも見つけられず
• ヤバい予測学の著者のブログに当時の記事が載っていた
• http://www.predictiveanalyticsworld.c...
近しい事例を漁ってみる
• 退社予備軍を見つけ出せ―データ分析通じて離職防止
• http://jp.wsj.com/articles/SB1003031769182402414900458051903076980
9198
• クレディ・スイ...
近しい事例を漁ってみる
• Googleは辞めそうな社員を予測している
• http://japan.zdnet.com/article/20393400/
• http://www.wsj.com/articles/SB12426903804...
近しい事例を漁ってみる
• Analyzing Employee Turnover- Predictive Methods
• https://www.linkedin.com/pulse/analyzing-employee-turnover...
離職予測ができるサービス
• IBM Watson
• 決定木で出力してくれるらしい(労働時間、職位、SOの有無などが見える)
https://www.ibm.com/blogs/watson-analytics/watson-analytic...
離職予測ができるサービス
• Talent Analytics
• アルゴリズム不明
http://www.talentanalytics.com/predict-employee-flight-risk-predictive-talent-a...
離職予測ができるサービス
• workday
• 統合人材管理ツール
http://www.workday.com/jp/applications/professional_services_automation.php
クラウドソーシングでのアルゴリズム作成
• CrowdANALYTIXのコンテスト
• SanDiskの依頼で本番データでガチ
• 複数のデータサイエンティストが競う
• 賞金は9000ドル
• SlideShareに解説が上がっていた
• h...
• 株式会社susque、サブロク
• 日本のストレスチェック義務化の流れと、北米の離職予測を融合
• 勤怠管理+ストレスチェックから、鬱病発症予測、離職予測を実現
• その会社に新入社員が入った場合の離職リスクを予測、新人選抜コストを下げる
...
• priskHR
• http://www.prisk.jp/
• 文脈としてはサブロクと同一、ストレスチェック+離職予測
• データマイニング機能はなさそう?
• 分析レポート、コンサルティングはオプションサービス
日本での取り組み状況
集団分析から個人介入へ
• 個人分析に向かっている
• HPは「個人を罰するためにには使わない」と言っている
• WSJの事例やサブロクでは個人のスコアを予測して、介入を実施
• これまともに運用できるのか?
• 今でさえ「上司がアンケートを見...
まとめ
• 離職予測は北米では一般的になっている
• 採用コストは年俸の50%程度
• 離職率が下げられると、大きなコスト削減
• 離職予測には特別な技術は要らない
• DT、RF、LR、生存時間分析あたりでよさそう
• データさえあれば、だれ...
終わりに
• アルゴリズムの開発者は「自分のフライトリスクは高い」と語る
https://www.linkedin.com/in/anindya-sankar-dey-396479a
HP → アクセンチュア → ウォルマートラボ
(ノ∀`)ア...
Upcoming SlideShare
Loading in …5
×

ヒューレットパッカード社の 社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

13,427 views

Published on

第一回機械学習ビジネス研究会で話した内容です
http://ml-business.connpass.com/event/36234/

Published in: Technology

ヒューレットパッカード社の 社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

  1. 1. ヒューレットパッカード社の 社員の離職リスク予測 中山ところてん @tokoroten 第一回機械学習ビジネス研究会 http://ml-business.connpass.com/event/36234/ 2016/08/28
  2. 2. 自己紹介 • ところてん • 所属 • Emotion Intelligence • 職歴 • 半導体計測機開発 • 情報セキュリティ、ビッグデータ • ソーシャルゲームデータ分析、ソーシャルゲームゲームディレクター、広告分析 • EC周りのデータ分析、興味解析、購買予測、広告CPA最適化
  3. 3. お仕事 https://www.zenclerk.com/ • ZenClerk • クーポンを「配布しない」サービス • 配布だけならだれでもできる • 利益が改善するように配布するようにするのがミソ • ユーザの行動や、マウスの動きから、 「クーポンを渡したら購買に転じる人」を予測 • ABテストを行い、リフトを計測 • 基盤作ったり、アルゴリズム作ったり、営業したり
  4. 4. お仕事 https://www.zenclerk.com/interest_widget/ • Interest Widget • マウスの動きはページスクロールから、商品への興味を予測 • お客様が「興味を持ったであろう商品」を自動で記録し、提示するサービス • 興味推定アルゴリズムを作ったり、営業したり
  5. 5. 出典書籍 • ヤバい予測学 • ビジネス寄りの機械学習に関する書籍 • 原著:The Power of Predict Who Will Click,Buy, Lie,or Die • 原著は2016年に改訂版が出ている • 2章88pより • プライバシーの攻防、という章の中で、企業が従業員を 監視・予測しているという文脈で紹介 • ほかにもTarget社(EC通販)の妊婦予測なども併せて紹 介、購買履歴から妊婦かどうかを予測する • 本スライドでは、書籍の内容外の私の考えには「メモ」と 付けてあります https://www.amazon.co.jp/dp/4484131250
  6. 6. HP社の離職予測 • 初出は2011年のPredictive Analytics Worldというカンファレンス • http://www.predictiveanalyticsworld.com/london/2011/agenda. php#day1-5a • 要約:離職が予測できると、コスト削減したり、原因追及したりできる メモ:Attritionは「摩耗」「損耗」の意味がだが、ここでは「社員の減少」を意味するっぽい
  7. 7. 書籍中での解説 • HPのインドのバンガロールの分析チームが開発 • Flight Risk • メモ:直訳すると「高跳びリスク」、「離職リスク」の意味 • 訓練データ • 給与、昇進、昇給、勤務評価、ジョブローテーション等のデータ2年分 • 実際に社員が辞めたかどうか • 実験対象 • HPの「営業の管理」部門 • 「営業の管理」には専門スキルが要求されるために、育成コストが高い • M&Aにより組織成長しているため、組織内の報奨制度がつぎはぎだらけ • メモ:報奨制度の対照実験の環境が図らずとも実現されている?
  8. 8. 分析結果 • 精度・効果 • フライトリスクが高い方から40%の従業員に退職者の75%が含まれる • 欠員補充や生産性の低下に対して、推定三億ドルのコスト削減効果 • 辞めない傾向にある社員 • 給料が高い、昇給が多い、勤務評価が向上している • メモ:もし勤務評価が悪い人をクビにしているなら、生存バイアスなのでは・・・ • 頻繁なジョブローテ • 定期的な仕事の変化が日常業務を面白いと感じさせるのでは?という考察 • 辞める傾向にある社員 • 昇進の回数が多い社員、昇進に対して昇給が小幅な社員 • メモ:人員不足->給与据え置き昇進->責任だけ増えるというコンボか? • メモ:HPの肩書を利用して、給与の他社に転職するのだと思われる
  9. 9. 運用 • フライトリスクを導入したチームでは、離職率が20%から15%に減少 • フライトリスクは一年に四回更新 • データの取り扱いに関して、「解釈」「限界」「悪影響」について訓練を受け たごく一部の幹部社員にのみ情報開示、自分の部下しか閲覧できない • 社員名は暗号化されており、幹部が持つ暗号鍵でのみ復号可能 • メモ: • データを読むための訓練を施すというのが大変良い • 正しくデータ分析を運用するための仕組みが会社として備わっている
  10. 10. なぜ離職予測がコスト削減につながるのか? • 書籍の中で深く触れられていなかったので、自分 で計算をしてみる • 日本基準で計算しているので、エージェントコストが支 配的 • 一人辞めると、年俸の50%くらいのコストがかかると 見ていい • 離職率20%だと、20%の人員に50%のコスト増が かかるので、給与支払対して10%のコスト増 • 考察 • 超過勤務に伴う他の社員の疲弊、離職リスクの増大 等を考えると、副次的な効果はもっと多そう • 離職率が下がると、大幅なコストカットができることが わかる • 離職率が2pt下がると、コストが給与の1%分下がる 社員の基本的な数値類 unit 年俸 800 万円/年 営業日 240 日/年 有給休暇 20 日/年 実労働日数 220 日/年 1日あたりコスト 3.6 万円/日 退職に伴うコスト(生産性低下) 引継ぎ日数(本人) 10 日 引継ぎ日数(同僚) 10 日 引継ぎによる費用 72.7 万円 採用に伴うコスト 社員の採用稼働 10 日 社員の採用稼働コスト 36.4 万円 エージェント採用料率(年俸に対して) 40% エージェントコスト 320 万円 欠員に対する同僚の超過労働コスト 欠員期間 20 日 超過労働による給与割り増し 25% 超過労働に伴う支払 18.2 万円 教育に対するコスト 教育期間 20 日 教育に対するコスト 72.7 万円 社員が一人辞めると、欠員補充に対するコスト 520 万円 年俸比率 65%
  11. 11. なぜ離職予測がコスト削減につながるのか?(別試算) • 会計事務所(PwC社)のコンサルタントの試算 • 自分の推定とだいたい同じ • 有給消化をコストとするのは… https://www.rosei.jp/jinjour/article.php?entry_no=64795
  12. 12. 原典を読んでみる • 発表資料は未公開、カンファレンス参加者にのみ公開? • HPのサイトからも見つけられず • ヤバい予測学の著者のブログに当時の記事が載っていた • http://www.predictiveanalyticsworld.com/patimes/the-privacy- pickle-hewlett-packards-prediction-of-employee-behavior/2716/ • 割と本の内容そのままだが、一部違うことが書いてある • ブログと書籍の内容の相違 • HPの社員は離職スコアのことを知らされていない • 社員を罰するのではなく、離職率を下げるために行っている • 「ドリルダウン」はしない、全体を俯瞰してパターンを発見するのに使う
  13. 13. 近しい事例を漁ってみる • 退社予備軍を見つけ出せ―データ分析通じて離職防止 • http://jp.wsj.com/articles/SB1003031769182402414900458051903076980 9198 • クレディ・スイス(金融) • 大所帯のチームで無能なマネージャーの下で働いていると、離職しやすい • 空きポストに対して、離職リスクの高い人から優先して声掛け • ボロメトリックス(組織分析サービス、2015年9月MSに買収、Officeと融合?) • 同僚との交流、必要な会議以外のイベントへの出席から離職を予測 • アルティメット・ソフトウエア(労務・給与管理システム会社) • 福利厚生の適用を放棄した社員と、離職の相関を発見 • マイクロン・テクノロジー(半導体) • 製造部門において採用時の業務説明内容が不正確だと、離職リスクが高い • 仕事のために引っ越しをした社員は離職リスクが高い • ウォルマート • 社員の昇進時期を予測、後任を確保するために利用。毎年16万人が昇進
  14. 14. 近しい事例を漁ってみる • Googleは辞めそうな社員を予測している • http://japan.zdnet.com/article/20393400/ • http://www.wsj.com/articles/SB124269038041932531 • 看護師の採用で「辞めない人材」を予測 • https://web.archive.org/web/20160125223928/http://www.sa nkeibiz.jp/macro/news/160125/mcb1601250500017-n1.htm • Pegged Software(http://www.peggedsoftware.com/ )を利用 • キーボードの打ち方や、1つのページに何秒間とどまるか、ブラウザーのタブをいつ閉じるかといっ たデータから、アルゴリズムを使って候補者の仕事ぶりを予測することができるという。 • 例えば、ストレスの大きい状況に直面したときの反応を試すために、数学を専門としない人に 微分積分の問題を出し、固まってしまうか、別のページに移動するか、答えを入力したり修正 したりするかといった反応を測定する。
  15. 15. 近しい事例を漁ってみる • Analyzing Employee Turnover- Predictive Methods • https://www.linkedin.com/pulse/analyzing-employee-turnover- predictive-methods-richard-rosenow-pmp • 転職予測に使うアルゴリズムの説明 • Logistic Regression • Survival Analysis(生存分析) • 決定木 • ランダムフォレスト • まぁ、そうだよね…。離職予測に特別な技術は要らないみたい。
  16. 16. 離職予測ができるサービス • IBM Watson • 決定木で出力してくれるらしい(労働時間、職位、SOの有無などが見える) https://www.ibm.com/blogs/watson-analytics/watson-analytics-use-case-for-hr-retaining-valuable-employees/
  17. 17. 離職予測ができるサービス • Talent Analytics • アルゴリズム不明 http://www.talentanalytics.com/predict-employee-flight-risk-predictive-talent-analytics/
  18. 18. 離職予測ができるサービス • workday • 統合人材管理ツール http://www.workday.com/jp/applications/professional_services_automation.php
  19. 19. クラウドソーシングでのアルゴリズム作成 • CrowdANALYTIXのコンテスト • SanDiskの依頼で本番データでガチ • 複数のデータサイエンティストが競う • 賞金は9000ドル • SlideShareに解説が上がっていた • http://www.slideshare.net/divyabh /employee-attrition-analysis • 精度は 決定木>RF>KSVM>LR の順 • 直観に反する順番、何かトリックがあるのかも • 特別な技術は特に要らないことが示唆される • ジョブランクが高くて、勤続年数が長い人は 残りやすい(あたりまえ) • 末端ノードにわりと原因が現れる(黒塗り) https://www.crowdanalytix.com/contests/employee-attrition-analysis
  20. 20. • 株式会社susque、サブロク • 日本のストレスチェック義務化の流れと、北米の離職予測を融合 • 勤怠管理+ストレスチェックから、鬱病発症予測、離職予測を実現 • その会社に新入社員が入った場合の離職リスクを予測、新人選抜コストを下げる 日本での取り組み状況 http://officelife.tokyo/A/fintech/campany/102 http://r36.jp/
  21. 21. • priskHR • http://www.prisk.jp/ • 文脈としてはサブロクと同一、ストレスチェック+離職予測 • データマイニング機能はなさそう? • 分析レポート、コンサルティングはオプションサービス 日本での取り組み状況
  22. 22. 集団分析から個人介入へ • 個人分析に向かっている • HPは「個人を罰するためにには使わない」と言っている • WSJの事例やサブロクでは個人のスコアを予測して、介入を実施 • これまともに運用できるのか? • 今でさえ「上司がアンケートを見るから、全部最高評価にしておいた」と言ってるや つがゴロゴロいる • HPでさえ幹部に対してデータの読み方の訓練を施して、 そのうえで「集団の傾向は信頼できるが、個人のスコアは信頼できない」としている • HPでさえ取り扱いが難しい劇薬を、どのように取り扱っていくのか? • 社員100人の会社の人事や社長のレベルで取り扱えるのか? • どうすれば運用に乗るのか?
  23. 23. まとめ • 離職予測は北米では一般的になっている • 採用コストは年俸の50%程度 • 離職率が下げられると、大きなコスト削減 • 離職予測には特別な技術は要らない • DT、RF、LR、生存時間分析あたりでよさそう • データさえあれば、だれでも簡単にできそう • ここ一年に日本でも離職予測の流れが来ている • メンタルヘルス診断の義務化と、AIブームの合わせ技で、調達ドン • 良質なデータセットが手に入るようになった • うつ病頻発(目的変数)メンタルヘルス診断の義務化(説明変数) • でも離職予測のデータを使える人が育ってるの? • アクションをどうやってセットにして売るか?がカギっぽい(会場でのディスカッションから)
  24. 24. 終わりに • アルゴリズムの開発者は「自分のフライトリスクは高い」と語る https://www.linkedin.com/in/anindya-sankar-dey-396479a HP → アクセンチュア → ウォルマートラボ (ノ∀`)アチャー

×