Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

20200129 merpay-techtalk-hmj

756 views

Published on

Tech Talk|Backend, ML Engineer 〜Fintechにおける不正決済対策〜 https://mercari.connpass.com/event/159735/ での発表資料です.

Published in: Data & Analytics
  • Be the first to comment

  • Be the first to like this

20200129 merpay-techtalk-hmj

  1. 1. 不正決済検知への機械学習の活用事例 とグラフ理論を活用した実験について Tech Talk|Backend, ML Engineer 〜Fintechにおける不正決済対策〜 2020/01/29 Wed, @hmj
  2. 2. 自己紹介 @Hmj_kd メルペイ Machine Learning Engineer 北海道釧路市出身.釧路高専を卒業後に東京工業大学物理 学科(テーマは, ブラックホールの幾何学)へ編入学. 情報キュレーションサービス会社でのデータ分析,ロジックの 開発・運用を経て, 2018年より株式会社メルペイにて機械学習 /自然言語処理を 中心としたクレジットスコアのトランスミッションの設計開発に携 わり,2019年10月よりAML system の ML として携わる. 好きなラーメンは,蒙古タンメンかラーメン二郎.
  3. 3. 今日話すこと ● 2019/10 ~12 での AML system の ML の立ち上げ ● グラフ理論を活用した不正検知の実験の事例
  4. 4. 2019/10 ~ AML system の ML の立ち上げ
  5. 5. ぜひこちらもご覧ください モバイル決済のあんしん・あんぜんを支える不正検知システムの裏側| Ito HIroshi|note
  6. 6. 立ち上げ時期と進め方 ● 2019/10 ○ 課題の整理,データ理解 ● 2019/11 ○ データ分析,モデリング ● 2019/12 ○ 評価実験の準備 ● 課題整理 ○ 関係者でブレストを定期的に 開催 ○ 機械学習でなくとも効果的な ルールが設計できれば, それ を採用 ● 疑わしい取引のデータや溜まって いる運用のデータの理解
  7. 7. 2019/10 ~ 12 月では ● 教師あり学習の枠組みでいくつかの提案とモデリング ○ 疑わしい「取引」の検知や , 稼働しているルールの最適化を目標 ○ 正常標本の数 >> 異常標本の数, な問題に適したモデル性能評価設計 ● 常に変化していく不正の手口に,柔軟に対応できる解決策の模索 ○ 後述
  8. 8. グラフ理論を活用した 不正検知の実験の事例
  9. 9. Motivation ● 疑わしい人たちが ● 疑わしい取引などの行為を ● 行うタイミングで検知したい → もし,疑わしい人たちの “つながり” を事前に推定できるなら, そこに検知のリソースを充てておくことができるかもしれない
  10. 10. Overview 全体の膨大な取引の中から,疑わしい人たち のつながりを, 事前に予測していくつかの小さなグラフ(Sub Graph)を作っておき, その Sub Graph 内のアカウント間で疑わしい 取引が発生したら検知をする というアイデア.
  11. 11. “グラフ” とは 丸い円と,それらを結ぶ線で,抽象化さ れたものがグラフです. ● 丸い円はノード(頂点) ● 線はエッジ(辺) といわれています. ノード i に繋がっているエッジの本数を そのノードの次数といいます. 1 2 4 3
  12. 12. ノードやエッジにはいくつかあります メルカリのお客さまを ノードとみる 招待関係でエッジを はる 取引(sell と buy)の関係 でエッジをはる 加盟店を ノードとみる
  13. 13. グラフの “形状” に 着目しました
  14. 14. 形状に着目した動機 ● とある取引データから, たまたまグラフ化をして形状を発見し た ● (厳密ではないですが)位相不変量でグラフを有限個で分類 できるのではないか ?
  15. 15. グラフ理論によく登場する特殊なグラフ(一例)
  16. 16. 例えば,招待関係でグラフをつくると... 1人のお客さまが多 数招待しているケー ス 右上から数珠上に招 待を繰り返す
  17. 17. 初期の段階では,ざっくりとルールでわけてみました EdgeRate >= Th AvgCluster > 0 Yes No Is One Pair ? Is Tree ? Is Star ? Is Path ? Is Cycle ? Is Almost Star ? Is Almost Path ? GraphTopologyType .AlmostComplete GraphTopologyType .NonZeroAvgCluster GraphTopologyType .CompleteStar One way ? GraphTopologyType .CompleteTree GraphTopologyType .OnePairOneWay GraphTopologyType .OnePairBiDirectional GraphTopologyType .CompletePath GraphTopologyType .CompleteCycle GraphTopologyType .AlmostStar GraphTopologyType .AlmostPath GraphTopologyType .Other Yes No
  18. 18. グラフの形と潜在的な怪しさ度合いの比較 ほぼ 星 星
  19. 19. グラフの形と潜在的な怪しさ度合いの比較 ほぼ 星 星 << この形が, 全体に登場する度合い >> 疑わしい「人」「取引」が発 生する度合い
  20. 20. グラフを活用したケースの今後の発展 解決していきたい点 - 捉えきれていない”つながり”もあるので,エッジの予測モデルなど検討していき たい - 変化する手口の検知だが,実際に実験的に検知しても,それがどういう手口な のかを判断することはまだ難しい
  21. 21. ご清聴ありがとうございます !!

×