SlideShare a Scribd company logo
1 of 33
Download to read offline
1
9月8日 基調講演: Valliappa Lakshmanan 氏 (Google, Director
for Data Analytics and AI Solutions on Google Cloud)
“Machine Learning Design Patterns in Industry”
産業界における機械学習デザインパターン
https://ses.sigse.jp/2021/
2021年9月6日
機械学習デザインパターンおよび機械
学習システムの品質保証の取り組み
鷲崎 弘宜
早稲田大学 / 国立情報学研究所 /
システム情報 / エクスモーション
2021年 8月25日
washizaki@waseda.jp
http://www.washi.cs.waseda.ac.jp/
2
【オンラインセミナー】 豆寄席
目次
• 機械学習システムと品質
• 機械学習品質技術: テスト、修正、フレームワーク
• 機械学習デザインパターン
3
機械学習によるパラダイム転換
4
目標
学習デー
タ
学習済み
モデル
活動 /
システム(動作)
目標 モデル
活動 /
システム(動作)
データ
従来のエンジニアリング: 演繹的(モデルが最初に与えられる)
機械学習ベース: 帰納的(モデル・アルゴリズムがデータで決まる)
プロセス 実行
プロダクト
機械学習ベース・データ駆動エンジニアリング 機械学習システム
参考: 丸山 宏, 機械学習工学に向けて, JST機械学習型システム開発へのパラダイム転換, 2017 4
5
人工知能シス
テムにおける
品質の概念
人工知能シス
テムの品質マ
ネジメント
人工知能シス
テムの品質保
証技術
人工知能ベースシステムの品質
• 訓練・テストデー
タの品質
• モデルの品質
• 機械学習システ
ムの品質
• 疑似オラクル
• メタモルフィックテス
ティング
• 頑健性検査
• ニューロンカバレッジ
• 説明生成
(PoC、監視、オ
ンライン学習、更
新など)
飯泉紀子、鷲崎弘宜、誉田直美 監修、SQuBOK策定部会 編、“ソフトウェア品質知識体系ガイド
(第3版)-SQuBOK Guide V3-”、ISBN 978-4-274-22631-1、2020/11/21、オーム社 5
機械学習システムの構成と品質技術
訓練
データ
訓練済み
モデル
予測・推論(に
基づく振舞い)
基盤ソフトウ
ェアシステム
データ
複数モデル
感度分析・逆追跡
モデルデバッグ・修正
アーキテクチャ
段階的設計・検証
モニタリング
失敗対策
上位目標
ミスの無さ、偏りの無
さ、網羅性
性能、頑健さ、
解釈・説明性
組み入れ正しさ
品質保証全体
合目的性、
想定外対応
内平 直志, 「人工知能とソフトウェア工学・品質管理」, 第33年度ソフトウェア品質管理研究会第7回特別講義, 2017
Eric Breck et al., The ML Test Score: A Rubric for ML Production Readiness and Technical Debt Reduction, IEEE Big Data 2017
データテスト
メタモルフィック
テスティング
フレームワーク、デザインパターン
6
目次
• 機械学習システムと品質
• 機械学習品質技術: テスト、修正、フレームワーク
• 機械学習デザインパターン
7
性能・網羅性: メタモルフィックテスティング
• メタモルフィック関係に基づき大量に試験
• 入力への変化により、出力の変化を予想できる関係
• 例: A の検索結果数 ≧ A かつ B の検索結果数
• 例: sin(x) = sin(x + 360度)
8
入力の変化 出力の変化
並び変え
無し
ノイズの追加
意味的に同じもの
統計的に同じもの
経験的に近いもの 僅か
定数の加算、乗算 定数の加算、乗算
狭める 部分集合
全く異なるもの 互いに素
x t(x)
f(x) g(f(x))
変換t
変換g
参考: S. Segura et al., "Metamorphic Testing of RESTful Web APIs," IEEE Transactions on Software Engineering, 2017
参考: C. Murphy, “Applications of Metamorphic Testing”, http://www.cis.upenn.edu/~cdmurphy/pubs/MetamorphicTesting-Columbia-17Nov2011.ppt
f(t(x))
=
変換f 変換f
8
機械学習による画像認識のテスト
• ノイズ追加等によるメタモルフィックテスト
明度
レンズ
の汚れ
障害物
自動運転車の場合 [Tian’18]
文字認識の場合
Y Tian, et al., DeepTest: Automated Testing of Deep-Neural-Network-driven
Autonomous Cars, ICSE 2018 https://arxiv.org/pdf/1708.08559.pdf
参考: 本田澄,アーキテクチャ・品質エンジニアリング, スマートエスイー講義資料, 2018 9
ニューラルネットワークデバッグ(修正)
• 再訓練
• 正攻法であるが、時間・コスト高
• 追加訓練データの検討の難しさ、性能悪化の可能性
• オンライン学習
• 特定データによる逐次学習を通じた修正
• 性能悪化の副作用の可能性
• データ拡充: 生成 [a]、選択 [b]、拡張 [c]など
• モデルのパラメータを直接には修正せず試行錯誤
• 敵対的サンプルに対して脆弱な可能性
• 特定サンプルに応じたパラメータ直接変更
• 要因分析と修正
• 敵対的サンプルに対する特定ラベルに関する修正 [d]
• 失敗データにおける影響個所の探索と修正 [e]
• 参考: 修正仕方全般の実証研究 [f]
10
[a] Generative adversarial nets, NIPS 2014
[b] MODE: automated neural network model debugging via state differential analysis and input selection, ESEC/FSE 2018
[c] Autoaugment: Learning augmentation policies from data, arXiv:1805.09501, 2019
[d] 敵対的サンプルに対するニューラルネットワークモデルの学習無し修正とその評価, JSSST大会 2019
[e] Search Based Repair of Deep Neural Networks, arXiv:1912.12463, 2019
[f] Repairing Deep Neural Networks: Fix Patterns and Challenges, ICSE 2020
敵対的サンプルに対する修正 [e]
• 要因分析: 特定のラベルに対する検証データと誤認識データと
のニューロン出力の平均値の差分による局所化
• 修正: 局所化した個所の重みパラメータの特定修正率による更
新 → 検証データによるデグレ有無の確認
11
[d] 敵対的サンプルに対するニューラルネットワークモデルの学習無し修正とその評価, JSSST大会 2019
検証データに
よる平均値
誤認識データ
による平均値
最優先で修正す
べきニューロン
12
プロジェクト要求
(AI/MLキャンバス他)
アーキテクチャ設計
(SysML他)
安全性解析
(Safety case, STAMP他)
要求・安全論
証
要求・実装
マッピング
実装手法・
ツール
変換
訓練済み
モデル
データ
変換
モデル
訓練デー
タ
推論結果
機能・品質要求
(GORE他)
メタモデル
DSL
マッピン
グ・変換パ
ターン
モデル設計・
設定
テスト・
自動修正
要求・設計
パターン
性能・頑健性: JST未来社会eAIプロジェクト
高品質AIを実現するフレームワークに向けて
何のために何をどの程度?
他への影響は?
運用し続けられる?
異なる環境やツールは?
Jati H. Husen, Hnin Thandar Tun, Nobukazu Yoshioka, Hironori Washizaki and Yoshiaki Fukazawa, “Goal-Oriented
Machine Learning-Based Component Development Process,” ACM/IEEE 24th International Conference on Model Driven
Engineering Languages and Systems (MODELS), online, Sun 10 – Fri 15 October 2021.
目次
• 機械学習システムと品質
• 機械学習品質技術: テスト、修正、フレームワーク
• 機械学習デザインパターン
13
機械学習工学とパターン(ランゲージ)
• 特定文脈での問題と解決をまとめたもの(のまと
まり)
• 抽象と具象をつなぐ道具: 問題・解決再利用、アーキテ
クチャ一貫
• 様々な関係者間の共通言語
• 設計や要求・プロセスのパターン整理とフレーム
ワークへの統合へ
• 『機械学習デザインパターン ―データ準備、モデル構
築、MLOpsの実践上の問題と解決』(Lakshmananら著, 鷲
崎ら訳, オライリージャパン, 2021年10月予定) Googleプ
ラットフォームチームによる30のパターン,
https://www.amazon.co.jp/dp/4873119561
• 『Software Engineering Patterns for ML Applications』
(SEP4MLA), eAIチームによる系統的文献調査に基づく15
のパターン, https://github.com/eai-transfer/ml-design-
pattern
• 『AIエンジニアのための機械学習システムデザインパ
ターン』澁井雄介(翔泳社, 2021),機械学習のモデルや
ワークフローを本番システムで稼働させる作法,
https://github.com/mercari/ml-system-design-pattern
14
機械学習システムの構成とデザインパターン
15
学習
データ
学習済み
モデル
予測・推論(に
基づく振舞い)
基盤ソフトウ
ェアシステム
データ
データ表現
パターン
問題表現パ
ターン
モデル訓練パターン
レジリエントサー
ビングパターン
再現性パターン
責任のあるAIパターン
レジリエントサー
ビングパターン
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』
(Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021年10月予定) 15
データ表現パターン
16
• 様々なデータから機械学習モデルが扱いやすいフィーチャへの表現
パターン 問題 解決
特徴量ハッシュ
Hashed Feature
カテゴリ変数についてとりうる
種類を特定困難。One-hot
encodingではCold-Start問題。
ユニークな文字列としたうえ
でハッシュ値に変換。
埋め込み
Embeddings
One-hot encodingではデータの近
さを扱えない
意味的な近さを表すように特
徴の埋め込み。
特徴量クロス
Feature Cross
もともとの変数群そのままでは
関係に基づく分類や予測が困難
複数のカテゴリ変数の組み合
わせで関係を容易に表現
マルチモーダル入力
Multimodal Input
異なる種別の入力を扱いにくい 分散表現の結合
x × y ラベル
AC +
BC -
AD -
BD +
A
B
C
D
特徴量クロス
マルチ
モーダル
入力
x
y
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
特徴量ハッシュ Hashed Feature
• 問題: カテゴリ変数についてとりうる種類を特定困難。One-hot encodingで
はout-of-vocabulary問題・Cold-Start問題。
• 解決:
• 1. ユニークな文字列へ変換
• 2. 決定的な方法でハッシュ値に変換
• 3. ハッシュ値の設定バケット数(カテゴリ数)の剰余の採用
• 考慮: バケット衝突、他の集約フィーチャ併用、バケット数チューニング
17
One-hot encoding
tf.feature_column.categorical_column_with_hash_bucket(
airport, num_buckets, dtype=tf.dtypes.string
)
Hashed Feature
TensorFlowに
おける実装
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
埋め込み Embeddings
• 問題: カテゴリ数が膨大な場合の難しさ(疎行列化)。One-hot encoding
ではデータの近さを扱えない。
• 解決: 訓練可能な特徴埋め込みレイヤで意味的な近さを表すように小次
元のベクトル化、および、重みの訓練
• 考慮
• 経験則: 次元数 = 元のカテゴリ数の4乗根
• テキスト: 語単位の小次元ベクトル表現、平均をとるなどの集約。Word2Vecや
BERTなどのさらなる意味・文脈考慮。
• 画像: 畳み込みCNN、オートエンコーダなど
18
訓練後のベクトル表現
オートエンコーダ
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
問題表現パターン
19
パターン 問題 解決
問題再設定
Reframing
当初の目的変数や出力で限界 回帰から分類へ変更(逆も)
マルチラベル
Multilabel
出力層の活性化がsoftmaxでは
マルチラベルの扱い困難
出力層の活性化にsigmoidを用いる
アンサンブル学
習Ensembles
バイアス(偏り)とバリアン
ス(分散)のトレードオフ
アンサンブル学習: 学習不足時はブースティ
ング、過学習時はバギングほか
カスケード
Cascade
通常と特殊を同一モデルで扱
い困難
通常と特殊に分類のうえそれぞれに訓練・予
測し集約
中立クラス
Neutral Class
データに主観評価を含むなど
により任意・ランダム性
Yes, NoにMaybeを加えた分類とする
リバランシング
Rebalancing
データセットが不均衡 Accuracy以外評価、ダウンサンプリング、
アップサンプリング、Reframing
ブースティング バギング
マルチラベル アンサンブル学習
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
問題再設定 Reframing
• 問題: 確率的であるため、特に精緻な実数の予測に固執すると
当初の目的変数や出力形式では限界を生じる場合が有る(特
に分布上のピークが複数の場合)。
• 解決: 問題を捉えなおす。特に回帰から分類へ変更する。
• 考慮:
• 数値が重要な場合は逆に回帰へ(例: 都市そのものより緯度・経度)
• 分類への移行方法: 回帰結果による分類、マルチタスク学習
• 真に目的にかなうものか注意(例:おすすめ映画の種類からユーザのク
リック数へと予測問題を変更すると、過剰にクリック数の増大方向)
20
分類が正確な場合 回帰が正確な場合
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
カスケード Cascade
• 問題: 通常と特殊を同一モデルで扱い困難
• 解決: 通常と特殊に分類のうえ、それぞれに訓練したモデ
ルで予測し、最後に集約
• 考慮
• 分類が決定的であれば、本来は入力を加えて単一モデル化すべき
• Rebalancingできるのであればそうすべき
21
分類
通常時
の予測
特殊時
の予測
最終
評価
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
モデル訓練パターン • 訓練の繰り返し(ループ)の仕方
22
パターン 問題 解決
価値ある過学習Useful
Overfitting
物理シミュレーションのように
全入力を扱える
過学習で良い。実際にはモンテカルロ
法でサンプリングなど
チェックポイント
Checkpoints
複雑なモデルは訓練に時間を要
する
訓練モデル外の情報も含めて全ての状
態をエポック単位で保存・再開
転移学習 Transfer
Learning
非構造データ訓練に巨大データ 転移学習、ファインチューニング
分散戦略 Distribution
Strategy
深層学習モデルの訓練に長時間 並列化による分散学習
ハイパーパラメータ
チューニング
Hyperparameter Tuning
ハイパーパラメータ人手チュー
ニングは長時間・不正確。グ
リッドサーチでは非効率。
外側の最適化ループとしてのハイパー
パラメータチューニング。ベイズ最適
化による効率的探索。
価値ある
過学習
ハイパーパラ
メータチュー
ニング
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
転移学習 Transfer Learning
• 問題: 非構造データ訓練に巨大データ必要。特にテキスト
や画像では汎用のモデルで個別の問題を十分に扱えない。
• 解決: 同種データで訓練済みのモデルによる転移学習
• 考慮: 重みの変更是非
• 特徴量抽出: 重みFix
• ファインチューニング: 重みの更新
23
基準 データ
セット
タスク
の同一
性
許容時
間・コ
スト
特徴量抽
出
小 異なる
タスク
少
ファイン
チューニ
ング
大 同一・
類似タ
スク
多
訓練済みモデル
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
レジリエントサービングパターン MLDP
• 訓練モデルをデプロイし人の関与なく弾力的に予測稼働・運用
24
パターン 問題 解決
ステートレスサービング
関数Stateless Serving
Function
モデルの巨大化。訓練時と
稼働時の環境相違
モデルの中核のみエキスポート、ステー
トレスREST APIとしてデプロイ
バッチサービングBatch
Serving
非同期の予測を数多く実施
困難
バッチ処理、分散処理環境下で大量デー
タによる非同期予測
継続的モデル評価
Continued Model
Evaluation
コンセプトドリフト、デー
タドリフト
継続的なモデル評価・モニタリングと再
訓練
2段階予測 Two-Phase
Predictions
エッジデバイス上の縮退さ
れた訓練モデルの性能低下
単純なタスク用のモデルをエッジ、複雑
なものをクラウド上で稼働
キー付き予測 Keyed
Predictions
多数の入力データをスケー
ラブルに扱えない
入力へキー付加、キー付きで出力するこ
とで分散環境下で容易な扱い
キー付き予測
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
継続的モデル評価 Continued Model Evaluation
• 問題: モデルはデプロイした瞬間から劣化していく。背景にある
前提の変化に伴う入力と目標の関係の変化(コンセプトドリフ
ト)、入力データからの予測時データの変化(データドリフト)。
• 解決: 継続的なモデル評価・モニタリングと再訓練
• 考慮
• 閾値による性能と訓練コストのトレードオフ
• オフラインでの古いデータによる学習モデルの新データへの適用評価
25
閾値によ
る変化
古い
データ
最新
データ
学習モ
デル
学習モ
デル
流用
古いデー
タによる
評価
最新デー
タによる
評価
評価メトリクス比較
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
2段階予測 Two-Phase Predictions
• 問題: エッジデバイスへデプロイする縮退訓練モデルの性能低下
• 解決: 単純なタスク用のモデルをエッジ(例: 「OK, Google」の識別
分類)、複雑なものをクラウド上で稼働(例: 音声指示の認識)
• 考慮
• 通信が貧弱な場合に備えてエッジデバイスで完結するオフラインモデル
• センサデータを、エッジで異常判定時のみクラウドへ送信
• エッジデバイス側のモデルの定期的な更新
26
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
再現性パターン • 決定的な出力を得やすく、訓練・開発効率
27
パターン 問題 解決
変換Transform 入力とフィーチャの異なり 変換・前処理の仕方を保存再利用、訓練・
予測時で一貫
繰り返し可能な分割
Repeatable Splitting
ランダムな訓練、検証、テスト
用分割では再現困難
関係を用いたい変数をハッシュ化し剰余に
よりデータ分割
スキーマブリッジ
Bridged Schema
入力データのスキーマが訓練後
に幾らか変更
古いデータを確率的な方法で新データス
キーマへ変換
ウィンドウ推論
Windowed Inference
訓練・運用間の歪みを避けられ
るよう一定の時間枠ごと集約
モデルの状態を外部記録、時間依存の方法
で集約計算された特徴量の一貫利用
ワークフローパイプラ
イン Workflow Pipeline
単一ファイルではスケールせず 各ステップを分けてサービス化
特徴量ストア Feature
Store
アドホックな特徴量エンジニア
リング
プロジェクトやチームを超えた特徴量共有
モデルバージョニング
Model Versioning
モデル更新時の後方互換性困難 モデルバージョンを異なるエンドポイント
提供、比較
(cash, card)
(cash, gift card, debit card, credit card)
変換
ブリッジ化スキーマ
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
責任のあるAIパターン
• 様々な利害関係者へ
のモデルの影響
28
パターン 問題 解決
経験的ベ
ンチマー
クHeuristic
Benchmark
結果の良し悪
しの程度を意
思決定者へ説
明困難
過去との比較や
経験則に基づく
判断
説明可能
な予測
Explainable
Predictions
予測の説明困
難
シンプルなモデ
ル採用、予測結
果における説明
など
公平性レ
ンズ
Fairness
Lens
不均衡データ
に基づく異な
る人々のグ
ループに対す
る問題のある
バイアス
(What-If toolや
Fairness
Indicatorsなどに
よる)訓練前後
のデータセット
の分析、結果比
較、均衡化など
What-If Tool (WIT)による可視化例
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
説明可能な予測 Explainable Predictions
• 問題: 予測の説明困難
• 解決: シンプルなモデル採用、予測結果における説明など
29
原 聡, 私のブックマーク: 機械学習における解釈性, 人工知能 33(5), 2018
原 聡, 私のブックマーク: 説明可能AI, 人工知能 34(4), 2019
AI ・機械学習 グループ, アドバンス・トップエスイー 最先端ソフトウェアゼミ成果発表, 2019
https://www.topse.jp/images/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%82%BC%E3%83%9F.pdf
分類 概要 例
大域的説
明
近似モ
デル
決定木(Born Again
Trees)
ルール(defragTrees)
局所的説
明
根拠 特徴量(LIME)
データ(influence)
深層学習
モデルの
説明
特に画
像認識
モデル
の根拠
注目領域のハイライト
(SmoothGrad)
説明文生成(Visual
Explanations)
説明可能
なモデル
設計
説明可
能モデ
ル
シンプルなモデルの採用
ルールセット
(Interpretable decision
sets)
短時間
using 19990914 build on win98
using the new account wizard if I
add multiple accounts with the
same server…
長時間
this mean the problem was with
their web page and its cool now or
we still need to figure out what the
actual bug was and fix that…
Y. Noyori, H. Washizaki, et al., “Extracting features related
to bug fixing time of bug reports by deep learning and
gradient-based visualization,” 2021 IEEE International
Conference on Artificial Intelligence and Computer
Applications
例: バグレポートの修正時間予測
の深層学習モデルの説明
『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 202129
まとめ
• 機械学習システムと品質
• 機械学習品質技術: テスト、修正、フレームワーク
• 『機械学習デザインパターン ―データ準備、モデル構築、
MLOpsの実践上の問題と解決』(Lakshmananら著, 鷲崎ら訳, オ
ライリージャパン, 2021年10月予定)
• https://www.amazon.co.jp/dp/4873119561
• 機械学習モデルおよびシステムの設計の問題、解決、その有効な理
由をコツとしてまとめたデザインパターン集
• 特にGoogleプラットフォーム上で有用、コード例あり
• 個々に代替やトレーオフの考慮解説あり、パターン間の関連あり
30
問題表現
データ表現
モデル訓練
問題表現
データ表現
モデル訓練 モデル訓練
サービング
再現性 再現性
責任AI 責任AI
再現性
責任AI
サービング
サービング
問題表現
データ表現
PoC 開発 運用(MLOps)
実行委員長: 鷲崎 弘宜(早稲田大学)
プログラム委員長: 横川 智教(岡山県立大学)
副プログラム委員長: 戸田 航史(福岡工業大)
ローカル委員長: 坂本一憲、齋藤大輔(早稲田)
会計委員長: 徳本 晋(富士通研究所)
ワークショップ委員長: 大森 隆行(立命館大学)
ポスター委員長: 名倉 正剛(南山大学)
招待論文委員長: 崔 恩瀞(京都工芸繊維大)
出版委員長: まつ本 真佑(大阪大学)
広報委員長: 藤井 拓(オージス総研)、
水野 修(京都工芸繊維大学)
31
ソフトウェアエンジニアリングプロフェッショナル集団や将来それに連なる若手・学生および周
辺の関係者が集い交流するとともに、人々や社会の価値創造に貢献するソフトウェアエンジ
ニアリングに向けた研究、実践、人材育成の研究および実践成果の発表と議論を通じて深化
と拡大を進め、その結果を社会へ発信するとともに更なる深化および拡大の基礎を得る。
https://ses.sigse.jp/2021/
機械学習 関連の発表多数あり
基調講演:
• Forrest Shull 氏 (IEEE Computer Society 2021 会
長, CMU/SEI) :ソフトウェアエンジニアリングの将
来展望
• 込山 俊博 氏(日本電気株式会社エグゼクティブ
エキスパート,ISO/IEC/JTC1 JTC1/SC7/WG6
Convenor):ソフトウェア品質評価のための国際
規格の制定,普及及び活用
• Valliappa Lakshmanan 氏 (Google, Google Cloud
Platform Director): 産業界における機械学習デ
ザインパターン
• 劉 少英 氏(広島大学 教授): ソフトウェア品質保
証とコスト削減のためのテストベース形式検証)
2021年9月6日
主査: 鷲崎 弘宜
幹事: 小川 秀人、伏田 享平、伊原 彰紀、竹
内 広宜、徳本 晋、福田 浩章、横川 智教
運営委員: 33名
情報処理学会ソフトウェア工学研究会 SIGSE 2021年度
1977年創設 45年目 会員約440名 http://www.ipsj.or.jp/sig/se/
プロフェッショナル集団および周辺関係者が集う場を形成し、物理空間とデジタル空間が融合
した社会におけるソフトウェアエンジニアリング確立に向け研究、実践、人材育成の深化と拡
大を通じ社会価値を提供し続ける。
• 場: 周辺と連携し、ソフトウェアエンジニアリング領域のプロフェッショナル集団を形成する
• 参加者数 2020年7月 74名→ 2021年7月110名、SES2020 333名
• 国内外連携: MODELS 2021連携(General Chairs 岸教授、鵜林教授)、SWEBOK策定他
• 研究: 理論とデータに裏付けされて世界発信可能なソフトウェアエンジニアリング研究を促
進して深掘りし広げる
• 発表数 2020年7月 5件→ 2021年7月 9件、卓越研究賞 2020年 7件
• 実践: ソフトウェアエンジニアリングの実践を通じて社会へ実質的な価値を創造し続ける
• 企業主体・産学連携 発表数 2020年7月 1件→ 2021年7月 3件
• 人材育成: ソフトウェアエンジニアリングに関わる人々の成長と次世代育成を促進する
• 推薦博士論文 2020年2件 → 2021年3件
• 渡航支援
研究集会: 11月、2022年3月
シンポジウム/ワークショップ
• SES2021 9月6-8日
• ウィンターワークショップ 2022年1-2月
ワーキンググループ
• 要求工学、国際的研究活動活性化、ソ
フトウェアの評価、産学連携促進ほか
ぜひ入会ください!
参考: enPit-Proスマートエスイー https://smartse.jp
• 文科省 社会人教育 enPiT-Pro AI・IoT×ビジネス
• 正規履修 履修証明プログラム10科目120時間
• 2020年からオンライン中心の短期コース履修も実施中
• 一部JMOOCオンライン提供中、関連内容をセミナー
全国規模の14大学・
研究所ネットワーク
26以上の企業・業界
団体(会員企業5000
超)・自治体との連携
+
+
クラウド
センサ・IoT
人工
知能
ビッグ
データ 生成
知識
抽出
革新
情報処理
アプリケーション
ビジネス
価値
創造
題材・事例
教材・指導
受講生派遣・
外部評価
進学・共同
研究接続
教材・指導
地区展開
スマートエスイー
通信・物理
協力校
33

More Related Content

What's hot

学習時に使ってはいないデータの混入「リーケージを避ける」
学習時に使ってはいないデータの混入「リーケージを避ける」学習時に使ってはいないデータの混入「リーケージを避ける」
学習時に使ってはいないデータの混入「リーケージを避ける」西岡 賢一郎
 
【DL輪読会】Scaling laws for single-agent reinforcement learning
【DL輪読会】Scaling laws for single-agent reinforcement learning【DL輪読会】Scaling laws for single-agent reinforcement learning
【DL輪読会】Scaling laws for single-agent reinforcement learningDeep Learning JP
 
(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説Hironori Washizaki
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)RyuichiKanoh
 
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language ModelsDeep Learning JP
 
機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計Takahiro Kubo
 
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018Takahiro Kubo
 
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...Deep Learning JP
 
[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networksDeep Learning JP
 
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...Deep Learning JP
 
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向Kensho Hara
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)Masahiro Suzuki
 
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...Deep Learning JP
 
強化学習と逆強化学習を組み合わせた模倣学習
強化学習と逆強化学習を組み合わせた模倣学習強化学習と逆強化学習を組み合わせた模倣学習
強化学習と逆強化学習を組み合わせた模倣学習Eiji Uchibe
 
MLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめMLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめKenichi Sonoda
 
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門tmtm otm
 
深層生成モデルと世界モデル
深層生成モデルと世界モデル深層生成モデルと世界モデル
深層生成モデルと世界モデルMasahiro Suzuki
 
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs 【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs Deep Learning JP
 

What's hot (20)

学習時に使ってはいないデータの混入「リーケージを避ける」
学習時に使ってはいないデータの混入「リーケージを避ける」学習時に使ってはいないデータの混入「リーケージを避ける」
学習時に使ってはいないデータの混入「リーケージを避ける」
 
【DL輪読会】Scaling laws for single-agent reinforcement learning
【DL輪読会】Scaling laws for single-agent reinforcement learning【DL輪読会】Scaling laws for single-agent reinforcement learning
【DL輪読会】Scaling laws for single-agent reinforcement learning
 
(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
 
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models
 
機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計
 
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
 
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
 
Point net
Point netPoint net
Point net
 
MLOpsはバズワード
MLOpsはバズワードMLOpsはバズワード
MLOpsはバズワード
 
[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks[DL輪読会]DropBlock: A regularization method for convolutional networks
[DL輪読会]DropBlock: A regularization method for convolutional networks
 
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
 
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)
 
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
 
強化学習と逆強化学習を組み合わせた模倣学習
強化学習と逆強化学習を組み合わせた模倣学習強化学習と逆強化学習を組み合わせた模倣学習
強化学習と逆強化学習を組み合わせた模倣学習
 
MLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめMLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめ
 
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門
 
深層生成モデルと世界モデル
深層生成モデルと世界モデル深層生成モデルと世界モデル
深層生成モデルと世界モデル
 
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs 【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
 

Similar to 機械学習デザインパターンおよび機械学習システムの品質保証の取り組み

機械学習応用アーキテクチャ・デザインパターン概観
機械学習応用アーキテクチャ・デザインパターン概観機械学習応用アーキテクチャ・デザインパターン概観
機械学習応用アーキテクチャ・デザインパターン概観Hironori Washizaki
 
機械学習応用のためのソフトウェアエンジニアリングパターン
機械学習応用のためのソフトウェアエンジニアリングパターン機械学習応用のためのソフトウェアエンジニアリングパターン
機械学習応用のためのソフトウェアエンジニアリングパターンHironoriTAKEUCHI1
 
機械学習デザインパターンの必要性と機械学習ライフサイクル
機械学習デザインパターンの必要性と機械学習ライフサイクル機械学習デザインパターンの必要性と機械学習ライフサイクル
機械学習デザインパターンの必要性と機械学習ライフサイクルHironori Washizaki
 
機械学習デザインパターン Machine Learning Design Patterns
機械学習デザインパターン Machine Learning Design Patterns機械学習デザインパターン Machine Learning Design Patterns
機械学習デザインパターン Machine Learning Design PatternsHironori Washizaki
 
機械学習システムの33のアーキテクチャパターンおよびデザインパターン
機械学習システムの33のアーキテクチャパターンおよびデザインパターン機械学習システムの33のアーキテクチャパターンおよびデザインパターン
機械学習システムの33のアーキテクチャパターンおよびデザインパターンHironori Washizaki
 
機械学習アーキテクチャ・デザインパターン
機械学習アーキテクチャ・デザインパターン機械学習アーキテクチャ・デザインパターン
機械学習アーキテクチャ・デザインパターンHironori Washizaki
 
新しいソフトウェアエンジニアリングのためのパターンランゲージに向けて
新しいソフトウェアエンジニアリングのためのパターンランゲージに向けて新しいソフトウェアエンジニアリングのためのパターンランゲージに向けて
新しいソフトウェアエンジニアリングのためのパターンランゲージに向けてHironori Washizaki
 
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))HironoriTAKEUCHI1
 
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップDaiyu Hatakeyama
 
AutoML & InterpretML (2019/11/27 Deep Learning Lab 講演資料)
AutoML & InterpretML (2019/11/27 Deep Learning Lab 講演資料)AutoML & InterpretML (2019/11/27 Deep Learning Lab 講演資料)
AutoML & InterpretML (2019/11/27 Deep Learning Lab 講演資料)Keita Onabuta
 
[DL輪読会]Parity Models: A General Framework for Coding-Based Resilience in ML I...
[DL輪読会]Parity Models: A General Framework for Coding-Based Resilience in ML I...[DL輪読会]Parity Models: A General Framework for Coding-Based Resilience in ML I...
[DL輪読会]Parity Models: A General Framework for Coding-Based Resilience in ML I...Deep Learning JP
 
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論Nobukazu Yoshioka
 
機械学習工学と機械学習応用システムの開発@SmartSEセミナー(2021/3/30)
機械学習工学と機械学習応用システムの開発@SmartSEセミナー(2021/3/30)機械学習工学と機械学習応用システムの開発@SmartSEセミナー(2021/3/30)
機械学習工学と機械学習応用システムの開発@SmartSEセミナー(2021/3/30)Nobukazu Yoshioka
 
機械学習プラットフォーム5つの課題とAmazon SageMakerの4つの利点
機械学習プラットフォーム5つの課題とAmazon SageMakerの4つの利点機械学習プラットフォーム5つの課題とAmazon SageMakerの4つの利点
機械学習プラットフォーム5つの課題とAmazon SageMakerの4つの利点西岡 賢一郎
 
開催の辞
開催の辞開催の辞
開催の辞MLSE
 
Azure machine learning service 最新の機械学習プラットフォーム
Azure machine learning service 最新の機械学習プラットフォームAzure machine learning service 最新の機械学習プラットフォーム
Azure machine learning service 最新の機械学習プラットフォームKeita Onabuta
 
Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善Hironori Washizaki
 
第3回SEMAT勉強会 SEMATエッセンス解説
第3回SEMAT勉強会 SEMATエッセンス解説第3回SEMAT勉強会 SEMATエッセンス解説
第3回SEMAT勉強会 SEMATエッセンス解説Hironori Washizaki
 
データ分析コンペでスキルアップしよう.pdf
データ分析コンペでスキルアップしよう.pdfデータ分析コンペでスキルアップしよう.pdf
データ分析コンペでスキルアップしよう.pdfH. K
 

Similar to 機械学習デザインパターンおよび機械学習システムの品質保証の取り組み (20)

機械学習応用アーキテクチャ・デザインパターン概観
機械学習応用アーキテクチャ・デザインパターン概観機械学習応用アーキテクチャ・デザインパターン概観
機械学習応用アーキテクチャ・デザインパターン概観
 
機械学習応用のためのソフトウェアエンジニアリングパターン
機械学習応用のためのソフトウェアエンジニアリングパターン機械学習応用のためのソフトウェアエンジニアリングパターン
機械学習応用のためのソフトウェアエンジニアリングパターン
 
機械学習デザインパターンの必要性と機械学習ライフサイクル
機械学習デザインパターンの必要性と機械学習ライフサイクル機械学習デザインパターンの必要性と機械学習ライフサイクル
機械学習デザインパターンの必要性と機械学習ライフサイクル
 
機械学習デザインパターン Machine Learning Design Patterns
機械学習デザインパターン Machine Learning Design Patterns機械学習デザインパターン Machine Learning Design Patterns
機械学習デザインパターン Machine Learning Design Patterns
 
組込みSW開発技術研究会キックオフミーティング
組込みSW開発技術研究会キックオフミーティング組込みSW開発技術研究会キックオフミーティング
組込みSW開発技術研究会キックオフミーティング
 
機械学習システムの33のアーキテクチャパターンおよびデザインパターン
機械学習システムの33のアーキテクチャパターンおよびデザインパターン機械学習システムの33のアーキテクチャパターンおよびデザインパターン
機械学習システムの33のアーキテクチャパターンおよびデザインパターン
 
機械学習アーキテクチャ・デザインパターン
機械学習アーキテクチャ・デザインパターン機械学習アーキテクチャ・デザインパターン
機械学習アーキテクチャ・デザインパターン
 
新しいソフトウェアエンジニアリングのためのパターンランゲージに向けて
新しいソフトウェアエンジニアリングのためのパターンランゲージに向けて新しいソフトウェアエンジニアリングのためのパターンランゲージに向けて
新しいソフトウェアエンジニアリングのためのパターンランゲージに向けて
 
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
 
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ
 
AutoML & InterpretML (2019/11/27 Deep Learning Lab 講演資料)
AutoML & InterpretML (2019/11/27 Deep Learning Lab 講演資料)AutoML & InterpretML (2019/11/27 Deep Learning Lab 講演資料)
AutoML & InterpretML (2019/11/27 Deep Learning Lab 講演資料)
 
[DL輪読会]Parity Models: A General Framework for Coding-Based Resilience in ML I...
[DL輪読会]Parity Models: A General Framework for Coding-Based Resilience in ML I...[DL輪読会]Parity Models: A General Framework for Coding-Based Resilience in ML I...
[DL輪読会]Parity Models: A General Framework for Coding-Based Resilience in ML I...
 
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
 
機械学習工学と機械学習応用システムの開発@SmartSEセミナー(2021/3/30)
機械学習工学と機械学習応用システムの開発@SmartSEセミナー(2021/3/30)機械学習工学と機械学習応用システムの開発@SmartSEセミナー(2021/3/30)
機械学習工学と機械学習応用システムの開発@SmartSEセミナー(2021/3/30)
 
機械学習プラットフォーム5つの課題とAmazon SageMakerの4つの利点
機械学習プラットフォーム5つの課題とAmazon SageMakerの4つの利点機械学習プラットフォーム5つの課題とAmazon SageMakerの4つの利点
機械学習プラットフォーム5つの課題とAmazon SageMakerの4つの利点
 
開催の辞
開催の辞開催の辞
開催の辞
 
Azure machine learning service 最新の機械学習プラットフォーム
Azure machine learning service 最新の機械学習プラットフォームAzure machine learning service 最新の機械学習プラットフォーム
Azure machine learning service 最新の機械学習プラットフォーム
 
Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善
 
第3回SEMAT勉強会 SEMATエッセンス解説
第3回SEMAT勉強会 SEMATエッセンス解説第3回SEMAT勉強会 SEMATエッセンス解説
第3回SEMAT勉強会 SEMATエッセンス解説
 
データ分析コンペでスキルアップしよう.pdf
データ分析コンペでスキルアップしよう.pdfデータ分析コンペでスキルアップしよう.pdf
データ分析コンペでスキルアップしよう.pdf
 

More from Hironori Washizaki

Machine Learning Software Engineering Patterns and Their Engineering
Machine Learning Software Engineering Patterns and Their EngineeringMachine Learning Software Engineering Patterns and Their Engineering
Machine Learning Software Engineering Patterns and Their EngineeringHironori Washizaki
 
IEEE Computer Society 2024 Technology Predictions Update
IEEE Computer Society 2024 Technology Predictions UpdateIEEE Computer Society 2024 Technology Predictions Update
IEEE Computer Society 2024 Technology Predictions UpdateHironori Washizaki
 
鷲崎弘宜, "国際規格ISO/IEC 24773とその意義", 情報処理学会 第86回全国大会
鷲崎弘宜, "国際規格ISO/IEC 24773とその意義", 情報処理学会 第86回全国大会鷲崎弘宜, "国際規格ISO/IEC 24773とその意義", 情報処理学会 第86回全国大会
鷲崎弘宜, "国際規格ISO/IEC 24773とその意義", 情報処理学会 第86回全国大会Hironori Washizaki
 
IEEE Computer Society’s Strategic Activities and Products including SWEBOK Guide
IEEE Computer Society’s Strategic Activities and Products including SWEBOK GuideIEEE Computer Society’s Strategic Activities and Products including SWEBOK Guide
IEEE Computer Society’s Strategic Activities and Products including SWEBOK GuideHironori Washizaki
 
TISO/IEC JTC1におけるソフトウェア工学知識体系、技術者認証および品質の標準化と研究・教育他への活用
TISO/IEC JTC1におけるソフトウェア工学知識体系、技術者認証および品質の標準化と研究・教育他への活用TISO/IEC JTC1におけるソフトウェア工学知識体系、技術者認証および品質の標準化と研究・教育他への活用
TISO/IEC JTC1におけるソフトウェア工学知識体系、技術者認証および品質の標準化と研究・教育他への活用Hironori Washizaki
 
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225Hironori Washizaki
 
Joseph Yoder : Being Agile about Architecture
Joseph Yoder : Being Agile about ArchitectureJoseph Yoder : Being Agile about Architecture
Joseph Yoder : Being Agile about ArchitectureHironori Washizaki
 
世界標準のソフトウェア工学知識体系SWEBOK Guide最新第4版を通じた開発アップデート
世界標準のソフトウェア工学知識体系SWEBOK Guide最新第4版を通じた開発アップデート世界標準のソフトウェア工学知識体系SWEBOK Guide最新第4版を通じた開発アップデート
世界標準のソフトウェア工学知識体系SWEBOK Guide最新第4版を通じた開発アップデートHironori Washizaki
 
SWEBOK Guide Evolution and Its Emerging Areas including Machine Learning Patt...
SWEBOK Guide Evolution and Its Emerging Areas including Machine Learning Patt...SWEBOK Guide Evolution and Its Emerging Areas including Machine Learning Patt...
SWEBOK Guide Evolution and Its Emerging Areas including Machine Learning Patt...Hironori Washizaki
 
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向Hironori Washizaki
 
SQuBOKガイドV3概説 ~IoT・AI・DX時代のソフトウェア品質とシステム監査~
SQuBOKガイドV3概説 ~IoT・AI・DX時代のソフトウェア品質とシステム監査~SQuBOKガイドV3概説 ~IoT・AI・DX時代のソフトウェア品質とシステム監査~
SQuBOKガイドV3概説 ~IoT・AI・DX時代のソフトウェア品質とシステム監査~Hironori Washizaki
 
人生100年・60年カリキュラム時代のDX人材育成: スマートエスイー 2021年度成果および2022年度募集
人生100年・60年カリキュラム時代のDX人材育成: スマートエスイー 2021年度成果および2022年度募集人生100年・60年カリキュラム時代のDX人材育成: スマートエスイー 2021年度成果および2022年度募集
人生100年・60年カリキュラム時代のDX人材育成: スマートエスイー 2021年度成果および2022年度募集Hironori Washizaki
 
スマートエスイーコンソーシアムの概要と2021年度成果紹介
スマートエスイーコンソーシアムの概要と2021年度成果紹介スマートエスイーコンソーシアムの概要と2021年度成果紹介
スマートエスイーコンソーシアムの概要と2021年度成果紹介Hironori Washizaki
 
DXの推進において企業内に求められる人材やデジタル人材の育て方
DXの推進において企業内に求められる人材やデジタル人材の育て方DXの推進において企業内に求められる人材やデジタル人材の育て方
DXの推進において企業内に求められる人材やデジタル人材の育て方Hironori Washizaki
 
対応性のある運用のパターン
対応性のある運用のパターン対応性のある運用のパターン
対応性のある運用のパターンHironori Washizaki
 
モデル訓練のパターン
モデル訓練のパターンモデル訓練のパターン
モデル訓練のパターンHironori Washizaki
 
パターンのつながりとAI活用成熟度
パターンのつながりとAI活用成熟度パターンのつながりとAI活用成熟度
パターンのつながりとAI活用成熟度Hironori Washizaki
 
データ表現のパターン
データ表現のパターンデータ表現のパターン
データ表現のパターンHironori Washizaki
 
青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)
青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)
青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)Hironori Washizaki
 
Software Engineering Patterns for Machine Learning Applications
Software Engineering Patterns for Machine Learning ApplicationsSoftware Engineering Patterns for Machine Learning Applications
Software Engineering Patterns for Machine Learning ApplicationsHironori Washizaki
 

More from Hironori Washizaki (20)

Machine Learning Software Engineering Patterns and Their Engineering
Machine Learning Software Engineering Patterns and Their EngineeringMachine Learning Software Engineering Patterns and Their Engineering
Machine Learning Software Engineering Patterns and Their Engineering
 
IEEE Computer Society 2024 Technology Predictions Update
IEEE Computer Society 2024 Technology Predictions UpdateIEEE Computer Society 2024 Technology Predictions Update
IEEE Computer Society 2024 Technology Predictions Update
 
鷲崎弘宜, "国際規格ISO/IEC 24773とその意義", 情報処理学会 第86回全国大会
鷲崎弘宜, "国際規格ISO/IEC 24773とその意義", 情報処理学会 第86回全国大会鷲崎弘宜, "国際規格ISO/IEC 24773とその意義", 情報処理学会 第86回全国大会
鷲崎弘宜, "国際規格ISO/IEC 24773とその意義", 情報処理学会 第86回全国大会
 
IEEE Computer Society’s Strategic Activities and Products including SWEBOK Guide
IEEE Computer Society’s Strategic Activities and Products including SWEBOK GuideIEEE Computer Society’s Strategic Activities and Products including SWEBOK Guide
IEEE Computer Society’s Strategic Activities and Products including SWEBOK Guide
 
TISO/IEC JTC1におけるソフトウェア工学知識体系、技術者認証および品質の標準化と研究・教育他への活用
TISO/IEC JTC1におけるソフトウェア工学知識体系、技術者認証および品質の標準化と研究・教育他への活用TISO/IEC JTC1におけるソフトウェア工学知識体系、技術者認証および品質の標準化と研究・教育他への活用
TISO/IEC JTC1におけるソフトウェア工学知識体系、技術者認証および品質の標準化と研究・教育他への活用
 
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
アジャイル品質のパターンとメトリクス Agile Quality Patterns and Metrics (QA2AQ) 20240225
 
Joseph Yoder : Being Agile about Architecture
Joseph Yoder : Being Agile about ArchitectureJoseph Yoder : Being Agile about Architecture
Joseph Yoder : Being Agile about Architecture
 
世界標準のソフトウェア工学知識体系SWEBOK Guide最新第4版を通じた開発アップデート
世界標準のソフトウェア工学知識体系SWEBOK Guide最新第4版を通じた開発アップデート世界標準のソフトウェア工学知識体系SWEBOK Guide最新第4版を通じた開発アップデート
世界標準のソフトウェア工学知識体系SWEBOK Guide最新第4版を通じた開発アップデート
 
SWEBOK Guide Evolution and Its Emerging Areas including Machine Learning Patt...
SWEBOK Guide Evolution and Its Emerging Areas including Machine Learning Patt...SWEBOK Guide Evolution and Its Emerging Areas including Machine Learning Patt...
SWEBOK Guide Evolution and Its Emerging Areas including Machine Learning Patt...
 
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
デジタルトランスフォーメーション(DX)におけるソフトウェアの側面とダイバーシティ・インクルーシブに関する研究実践動向
 
SQuBOKガイドV3概説 ~IoT・AI・DX時代のソフトウェア品質とシステム監査~
SQuBOKガイドV3概説 ~IoT・AI・DX時代のソフトウェア品質とシステム監査~SQuBOKガイドV3概説 ~IoT・AI・DX時代のソフトウェア品質とシステム監査~
SQuBOKガイドV3概説 ~IoT・AI・DX時代のソフトウェア品質とシステム監査~
 
人生100年・60年カリキュラム時代のDX人材育成: スマートエスイー 2021年度成果および2022年度募集
人生100年・60年カリキュラム時代のDX人材育成: スマートエスイー 2021年度成果および2022年度募集人生100年・60年カリキュラム時代のDX人材育成: スマートエスイー 2021年度成果および2022年度募集
人生100年・60年カリキュラム時代のDX人材育成: スマートエスイー 2021年度成果および2022年度募集
 
スマートエスイーコンソーシアムの概要と2021年度成果紹介
スマートエスイーコンソーシアムの概要と2021年度成果紹介スマートエスイーコンソーシアムの概要と2021年度成果紹介
スマートエスイーコンソーシアムの概要と2021年度成果紹介
 
DXの推進において企業内に求められる人材やデジタル人材の育て方
DXの推進において企業内に求められる人材やデジタル人材の育て方DXの推進において企業内に求められる人材やデジタル人材の育て方
DXの推進において企業内に求められる人材やデジタル人材の育て方
 
対応性のある運用のパターン
対応性のある運用のパターン対応性のある運用のパターン
対応性のある運用のパターン
 
モデル訓練のパターン
モデル訓練のパターンモデル訓練のパターン
モデル訓練のパターン
 
パターンのつながりとAI活用成熟度
パターンのつながりとAI活用成熟度パターンのつながりとAI活用成熟度
パターンのつながりとAI活用成熟度
 
データ表現のパターン
データ表現のパターンデータ表現のパターン
データ表現のパターン
 
青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)
青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)
青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)
 
Software Engineering Patterns for Machine Learning Applications
Software Engineering Patterns for Machine Learning ApplicationsSoftware Engineering Patterns for Machine Learning Applications
Software Engineering Patterns for Machine Learning Applications
 

機械学習デザインパターンおよび機械学習システムの品質保証の取り組み

  • 1. 1 9月8日 基調講演: Valliappa Lakshmanan 氏 (Google, Director for Data Analytics and AI Solutions on Google Cloud) “Machine Learning Design Patterns in Industry” 産業界における機械学習デザインパターン https://ses.sigse.jp/2021/ 2021年9月6日
  • 2. 機械学習デザインパターンおよび機械 学習システムの品質保証の取り組み 鷲崎 弘宜 早稲田大学 / 国立情報学研究所 / システム情報 / エクスモーション 2021年 8月25日 washizaki@waseda.jp http://www.washi.cs.waseda.ac.jp/ 2 【オンラインセミナー】 豆寄席
  • 3. 目次 • 機械学習システムと品質 • 機械学習品質技術: テスト、修正、フレームワーク • 機械学習デザインパターン 3
  • 4. 機械学習によるパラダイム転換 4 目標 学習デー タ 学習済み モデル 活動 / システム(動作) 目標 モデル 活動 / システム(動作) データ 従来のエンジニアリング: 演繹的(モデルが最初に与えられる) 機械学習ベース: 帰納的(モデル・アルゴリズムがデータで決まる) プロセス 実行 プロダクト 機械学習ベース・データ駆動エンジニアリング 機械学習システム 参考: 丸山 宏, 機械学習工学に向けて, JST機械学習型システム開発へのパラダイム転換, 2017 4
  • 5. 5 人工知能シス テムにおける 品質の概念 人工知能シス テムの品質マ ネジメント 人工知能シス テムの品質保 証技術 人工知能ベースシステムの品質 • 訓練・テストデー タの品質 • モデルの品質 • 機械学習システ ムの品質 • 疑似オラクル • メタモルフィックテス ティング • 頑健性検査 • ニューロンカバレッジ • 説明生成 (PoC、監視、オ ンライン学習、更 新など) 飯泉紀子、鷲崎弘宜、誉田直美 監修、SQuBOK策定部会 編、“ソフトウェア品質知識体系ガイド (第3版)-SQuBOK Guide V3-”、ISBN 978-4-274-22631-1、2020/11/21、オーム社 5
  • 6. 機械学習システムの構成と品質技術 訓練 データ 訓練済み モデル 予測・推論(に 基づく振舞い) 基盤ソフトウ ェアシステム データ 複数モデル 感度分析・逆追跡 モデルデバッグ・修正 アーキテクチャ 段階的設計・検証 モニタリング 失敗対策 上位目標 ミスの無さ、偏りの無 さ、網羅性 性能、頑健さ、 解釈・説明性 組み入れ正しさ 品質保証全体 合目的性、 想定外対応 内平 直志, 「人工知能とソフトウェア工学・品質管理」, 第33年度ソフトウェア品質管理研究会第7回特別講義, 2017 Eric Breck et al., The ML Test Score: A Rubric for ML Production Readiness and Technical Debt Reduction, IEEE Big Data 2017 データテスト メタモルフィック テスティング フレームワーク、デザインパターン 6
  • 7. 目次 • 機械学習システムと品質 • 機械学習品質技術: テスト、修正、フレームワーク • 機械学習デザインパターン 7
  • 8. 性能・網羅性: メタモルフィックテスティング • メタモルフィック関係に基づき大量に試験 • 入力への変化により、出力の変化を予想できる関係 • 例: A の検索結果数 ≧ A かつ B の検索結果数 • 例: sin(x) = sin(x + 360度) 8 入力の変化 出力の変化 並び変え 無し ノイズの追加 意味的に同じもの 統計的に同じもの 経験的に近いもの 僅か 定数の加算、乗算 定数の加算、乗算 狭める 部分集合 全く異なるもの 互いに素 x t(x) f(x) g(f(x)) 変換t 変換g 参考: S. Segura et al., "Metamorphic Testing of RESTful Web APIs," IEEE Transactions on Software Engineering, 2017 参考: C. Murphy, “Applications of Metamorphic Testing”, http://www.cis.upenn.edu/~cdmurphy/pubs/MetamorphicTesting-Columbia-17Nov2011.ppt f(t(x)) = 変換f 変換f 8
  • 9. 機械学習による画像認識のテスト • ノイズ追加等によるメタモルフィックテスト 明度 レンズ の汚れ 障害物 自動運転車の場合 [Tian’18] 文字認識の場合 Y Tian, et al., DeepTest: Automated Testing of Deep-Neural-Network-driven Autonomous Cars, ICSE 2018 https://arxiv.org/pdf/1708.08559.pdf 参考: 本田澄,アーキテクチャ・品質エンジニアリング, スマートエスイー講義資料, 2018 9
  • 10. ニューラルネットワークデバッグ(修正) • 再訓練 • 正攻法であるが、時間・コスト高 • 追加訓練データの検討の難しさ、性能悪化の可能性 • オンライン学習 • 特定データによる逐次学習を通じた修正 • 性能悪化の副作用の可能性 • データ拡充: 生成 [a]、選択 [b]、拡張 [c]など • モデルのパラメータを直接には修正せず試行錯誤 • 敵対的サンプルに対して脆弱な可能性 • 特定サンプルに応じたパラメータ直接変更 • 要因分析と修正 • 敵対的サンプルに対する特定ラベルに関する修正 [d] • 失敗データにおける影響個所の探索と修正 [e] • 参考: 修正仕方全般の実証研究 [f] 10 [a] Generative adversarial nets, NIPS 2014 [b] MODE: automated neural network model debugging via state differential analysis and input selection, ESEC/FSE 2018 [c] Autoaugment: Learning augmentation policies from data, arXiv:1805.09501, 2019 [d] 敵対的サンプルに対するニューラルネットワークモデルの学習無し修正とその評価, JSSST大会 2019 [e] Search Based Repair of Deep Neural Networks, arXiv:1912.12463, 2019 [f] Repairing Deep Neural Networks: Fix Patterns and Challenges, ICSE 2020
  • 11. 敵対的サンプルに対する修正 [e] • 要因分析: 特定のラベルに対する検証データと誤認識データと のニューロン出力の平均値の差分による局所化 • 修正: 局所化した個所の重みパラメータの特定修正率による更 新 → 検証データによるデグレ有無の確認 11 [d] 敵対的サンプルに対するニューラルネットワークモデルの学習無し修正とその評価, JSSST大会 2019 検証データに よる平均値 誤認識データ による平均値 最優先で修正す べきニューロン
  • 12. 12 プロジェクト要求 (AI/MLキャンバス他) アーキテクチャ設計 (SysML他) 安全性解析 (Safety case, STAMP他) 要求・安全論 証 要求・実装 マッピング 実装手法・ ツール 変換 訓練済み モデル データ 変換 モデル 訓練デー タ 推論結果 機能・品質要求 (GORE他) メタモデル DSL マッピン グ・変換パ ターン モデル設計・ 設定 テスト・ 自動修正 要求・設計 パターン 性能・頑健性: JST未来社会eAIプロジェクト 高品質AIを実現するフレームワークに向けて 何のために何をどの程度? 他への影響は? 運用し続けられる? 異なる環境やツールは? Jati H. Husen, Hnin Thandar Tun, Nobukazu Yoshioka, Hironori Washizaki and Yoshiaki Fukazawa, “Goal-Oriented Machine Learning-Based Component Development Process,” ACM/IEEE 24th International Conference on Model Driven Engineering Languages and Systems (MODELS), online, Sun 10 – Fri 15 October 2021.
  • 13. 目次 • 機械学習システムと品質 • 機械学習品質技術: テスト、修正、フレームワーク • 機械学習デザインパターン 13
  • 14. 機械学習工学とパターン(ランゲージ) • 特定文脈での問題と解決をまとめたもの(のまと まり) • 抽象と具象をつなぐ道具: 問題・解決再利用、アーキテ クチャ一貫 • 様々な関係者間の共通言語 • 設計や要求・プロセスのパターン整理とフレーム ワークへの統合へ • 『機械学習デザインパターン ―データ準備、モデル構 築、MLOpsの実践上の問題と解決』(Lakshmananら著, 鷲 崎ら訳, オライリージャパン, 2021年10月予定) Googleプ ラットフォームチームによる30のパターン, https://www.amazon.co.jp/dp/4873119561 • 『Software Engineering Patterns for ML Applications』 (SEP4MLA), eAIチームによる系統的文献調査に基づく15 のパターン, https://github.com/eai-transfer/ml-design- pattern • 『AIエンジニアのための機械学習システムデザインパ ターン』澁井雄介(翔泳社, 2021),機械学習のモデルや ワークフローを本番システムで稼働させる作法, https://github.com/mercari/ml-system-design-pattern 14
  • 16. データ表現パターン 16 • 様々なデータから機械学習モデルが扱いやすいフィーチャへの表現 パターン 問題 解決 特徴量ハッシュ Hashed Feature カテゴリ変数についてとりうる 種類を特定困難。One-hot encodingではCold-Start問題。 ユニークな文字列としたうえ でハッシュ値に変換。 埋め込み Embeddings One-hot encodingではデータの近 さを扱えない 意味的な近さを表すように特 徴の埋め込み。 特徴量クロス Feature Cross もともとの変数群そのままでは 関係に基づく分類や予測が困難 複数のカテゴリ変数の組み合 わせで関係を容易に表現 マルチモーダル入力 Multimodal Input 異なる種別の入力を扱いにくい 分散表現の結合 x × y ラベル AC + BC - AD - BD + A B C D 特徴量クロス マルチ モーダル 入力 x y 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 17. 特徴量ハッシュ Hashed Feature • 問題: カテゴリ変数についてとりうる種類を特定困難。One-hot encodingで はout-of-vocabulary問題・Cold-Start問題。 • 解決: • 1. ユニークな文字列へ変換 • 2. 決定的な方法でハッシュ値に変換 • 3. ハッシュ値の設定バケット数(カテゴリ数)の剰余の採用 • 考慮: バケット衝突、他の集約フィーチャ併用、バケット数チューニング 17 One-hot encoding tf.feature_column.categorical_column_with_hash_bucket( airport, num_buckets, dtype=tf.dtypes.string ) Hashed Feature TensorFlowに おける実装 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 18. 埋め込み Embeddings • 問題: カテゴリ数が膨大な場合の難しさ(疎行列化)。One-hot encoding ではデータの近さを扱えない。 • 解決: 訓練可能な特徴埋め込みレイヤで意味的な近さを表すように小次 元のベクトル化、および、重みの訓練 • 考慮 • 経験則: 次元数 = 元のカテゴリ数の4乗根 • テキスト: 語単位の小次元ベクトル表現、平均をとるなどの集約。Word2Vecや BERTなどのさらなる意味・文脈考慮。 • 画像: 畳み込みCNN、オートエンコーダなど 18 訓練後のベクトル表現 オートエンコーダ 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 19. 問題表現パターン 19 パターン 問題 解決 問題再設定 Reframing 当初の目的変数や出力で限界 回帰から分類へ変更(逆も) マルチラベル Multilabel 出力層の活性化がsoftmaxでは マルチラベルの扱い困難 出力層の活性化にsigmoidを用いる アンサンブル学 習Ensembles バイアス(偏り)とバリアン ス(分散)のトレードオフ アンサンブル学習: 学習不足時はブースティ ング、過学習時はバギングほか カスケード Cascade 通常と特殊を同一モデルで扱 い困難 通常と特殊に分類のうえそれぞれに訓練・予 測し集約 中立クラス Neutral Class データに主観評価を含むなど により任意・ランダム性 Yes, NoにMaybeを加えた分類とする リバランシング Rebalancing データセットが不均衡 Accuracy以外評価、ダウンサンプリング、 アップサンプリング、Reframing ブースティング バギング マルチラベル アンサンブル学習 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 20. 問題再設定 Reframing • 問題: 確率的であるため、特に精緻な実数の予測に固執すると 当初の目的変数や出力形式では限界を生じる場合が有る(特 に分布上のピークが複数の場合)。 • 解決: 問題を捉えなおす。特に回帰から分類へ変更する。 • 考慮: • 数値が重要な場合は逆に回帰へ(例: 都市そのものより緯度・経度) • 分類への移行方法: 回帰結果による分類、マルチタスク学習 • 真に目的にかなうものか注意(例:おすすめ映画の種類からユーザのク リック数へと予測問題を変更すると、過剰にクリック数の増大方向) 20 分類が正確な場合 回帰が正確な場合 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 21. カスケード Cascade • 問題: 通常と特殊を同一モデルで扱い困難 • 解決: 通常と特殊に分類のうえ、それぞれに訓練したモデ ルで予測し、最後に集約 • 考慮 • 分類が決定的であれば、本来は入力を加えて単一モデル化すべき • Rebalancingできるのであればそうすべき 21 分類 通常時 の予測 特殊時 の予測 最終 評価 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 22. モデル訓練パターン • 訓練の繰り返し(ループ)の仕方 22 パターン 問題 解決 価値ある過学習Useful Overfitting 物理シミュレーションのように 全入力を扱える 過学習で良い。実際にはモンテカルロ 法でサンプリングなど チェックポイント Checkpoints 複雑なモデルは訓練に時間を要 する 訓練モデル外の情報も含めて全ての状 態をエポック単位で保存・再開 転移学習 Transfer Learning 非構造データ訓練に巨大データ 転移学習、ファインチューニング 分散戦略 Distribution Strategy 深層学習モデルの訓練に長時間 並列化による分散学習 ハイパーパラメータ チューニング Hyperparameter Tuning ハイパーパラメータ人手チュー ニングは長時間・不正確。グ リッドサーチでは非効率。 外側の最適化ループとしてのハイパー パラメータチューニング。ベイズ最適 化による効率的探索。 価値ある 過学習 ハイパーパラ メータチュー ニング 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 23. 転移学習 Transfer Learning • 問題: 非構造データ訓練に巨大データ必要。特にテキスト や画像では汎用のモデルで個別の問題を十分に扱えない。 • 解決: 同種データで訓練済みのモデルによる転移学習 • 考慮: 重みの変更是非 • 特徴量抽出: 重みFix • ファインチューニング: 重みの更新 23 基準 データ セット タスク の同一 性 許容時 間・コ スト 特徴量抽 出 小 異なる タスク 少 ファイン チューニ ング 大 同一・ 類似タ スク 多 訓練済みモデル 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 24. レジリエントサービングパターン MLDP • 訓練モデルをデプロイし人の関与なく弾力的に予測稼働・運用 24 パターン 問題 解決 ステートレスサービング 関数Stateless Serving Function モデルの巨大化。訓練時と 稼働時の環境相違 モデルの中核のみエキスポート、ステー トレスREST APIとしてデプロイ バッチサービングBatch Serving 非同期の予測を数多く実施 困難 バッチ処理、分散処理環境下で大量デー タによる非同期予測 継続的モデル評価 Continued Model Evaluation コンセプトドリフト、デー タドリフト 継続的なモデル評価・モニタリングと再 訓練 2段階予測 Two-Phase Predictions エッジデバイス上の縮退さ れた訓練モデルの性能低下 単純なタスク用のモデルをエッジ、複雑 なものをクラウド上で稼働 キー付き予測 Keyed Predictions 多数の入力データをスケー ラブルに扱えない 入力へキー付加、キー付きで出力するこ とで分散環境下で容易な扱い キー付き予測 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 25. 継続的モデル評価 Continued Model Evaluation • 問題: モデルはデプロイした瞬間から劣化していく。背景にある 前提の変化に伴う入力と目標の関係の変化(コンセプトドリフ ト)、入力データからの予測時データの変化(データドリフト)。 • 解決: 継続的なモデル評価・モニタリングと再訓練 • 考慮 • 閾値による性能と訓練コストのトレードオフ • オフラインでの古いデータによる学習モデルの新データへの適用評価 25 閾値によ る変化 古い データ 最新 データ 学習モ デル 学習モ デル 流用 古いデー タによる 評価 最新デー タによる 評価 評価メトリクス比較 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 26. 2段階予測 Two-Phase Predictions • 問題: エッジデバイスへデプロイする縮退訓練モデルの性能低下 • 解決: 単純なタスク用のモデルをエッジ(例: 「OK, Google」の識別 分類)、複雑なものをクラウド上で稼働(例: 音声指示の認識) • 考慮 • 通信が貧弱な場合に備えてエッジデバイスで完結するオフラインモデル • センサデータを、エッジで異常判定時のみクラウドへ送信 • エッジデバイス側のモデルの定期的な更新 26 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 27. 再現性パターン • 決定的な出力を得やすく、訓練・開発効率 27 パターン 問題 解決 変換Transform 入力とフィーチャの異なり 変換・前処理の仕方を保存再利用、訓練・ 予測時で一貫 繰り返し可能な分割 Repeatable Splitting ランダムな訓練、検証、テスト 用分割では再現困難 関係を用いたい変数をハッシュ化し剰余に よりデータ分割 スキーマブリッジ Bridged Schema 入力データのスキーマが訓練後 に幾らか変更 古いデータを確率的な方法で新データス キーマへ変換 ウィンドウ推論 Windowed Inference 訓練・運用間の歪みを避けられ るよう一定の時間枠ごと集約 モデルの状態を外部記録、時間依存の方法 で集約計算された特徴量の一貫利用 ワークフローパイプラ イン Workflow Pipeline 単一ファイルではスケールせず 各ステップを分けてサービス化 特徴量ストア Feature Store アドホックな特徴量エンジニア リング プロジェクトやチームを超えた特徴量共有 モデルバージョニング Model Versioning モデル更新時の後方互換性困難 モデルバージョンを異なるエンドポイント 提供、比較 (cash, card) (cash, gift card, debit card, credit card) 変換 ブリッジ化スキーマ 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 28. 責任のあるAIパターン • 様々な利害関係者へ のモデルの影響 28 パターン 問題 解決 経験的ベ ンチマー クHeuristic Benchmark 結果の良し悪 しの程度を意 思決定者へ説 明困難 過去との比較や 経験則に基づく 判断 説明可能 な予測 Explainable Predictions 予測の説明困 難 シンプルなモデ ル採用、予測結 果における説明 など 公平性レ ンズ Fairness Lens 不均衡データ に基づく異な る人々のグ ループに対す る問題のある バイアス (What-If toolや Fairness Indicatorsなどに よる)訓練前後 のデータセット の分析、結果比 較、均衡化など What-If Tool (WIT)による可視化例 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 2021
  • 29. 説明可能な予測 Explainable Predictions • 問題: 予測の説明困難 • 解決: シンプルなモデル採用、予測結果における説明など 29 原 聡, 私のブックマーク: 機械学習における解釈性, 人工知能 33(5), 2018 原 聡, 私のブックマーク: 説明可能AI, 人工知能 34(4), 2019 AI ・機械学習 グループ, アドバンス・トップエスイー 最先端ソフトウェアゼミ成果発表, 2019 https://www.topse.jp/images/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%82%BC%E3%83%9F.pdf 分類 概要 例 大域的説 明 近似モ デル 決定木(Born Again Trees) ルール(defragTrees) 局所的説 明 根拠 特徴量(LIME) データ(influence) 深層学習 モデルの 説明 特に画 像認識 モデル の根拠 注目領域のハイライト (SmoothGrad) 説明文生成(Visual Explanations) 説明可能 なモデル 設計 説明可 能モデ ル シンプルなモデルの採用 ルールセット (Interpretable decision sets) 短時間 using 19990914 build on win98 using the new account wizard if I add multiple accounts with the same server… 長時間 this mean the problem was with their web page and its cool now or we still need to figure out what the actual bug was and fix that… Y. Noyori, H. Washizaki, et al., “Extracting features related to bug fixing time of bug reports by deep learning and gradient-based visualization,” 2021 IEEE International Conference on Artificial Intelligence and Computer Applications 例: バグレポートの修正時間予測 の深層学習モデルの説明 『機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決』Lakshmananら著, 鷲崎ら訳, オライリージャパン, 202129
  • 30. まとめ • 機械学習システムと品質 • 機械学習品質技術: テスト、修正、フレームワーク • 『機械学習デザインパターン ―データ準備、モデル構築、 MLOpsの実践上の問題と解決』(Lakshmananら著, 鷲崎ら訳, オ ライリージャパン, 2021年10月予定) • https://www.amazon.co.jp/dp/4873119561 • 機械学習モデルおよびシステムの設計の問題、解決、その有効な理 由をコツとしてまとめたデザインパターン集 • 特にGoogleプラットフォーム上で有用、コード例あり • 個々に代替やトレーオフの考慮解説あり、パターン間の関連あり 30 問題表現 データ表現 モデル訓練 問題表現 データ表現 モデル訓練 モデル訓練 サービング 再現性 再現性 責任AI 責任AI 再現性 責任AI サービング サービング 問題表現 データ表現 PoC 開発 運用(MLOps)
  • 31. 実行委員長: 鷲崎 弘宜(早稲田大学) プログラム委員長: 横川 智教(岡山県立大学) 副プログラム委員長: 戸田 航史(福岡工業大) ローカル委員長: 坂本一憲、齋藤大輔(早稲田) 会計委員長: 徳本 晋(富士通研究所) ワークショップ委員長: 大森 隆行(立命館大学) ポスター委員長: 名倉 正剛(南山大学) 招待論文委員長: 崔 恩瀞(京都工芸繊維大) 出版委員長: まつ本 真佑(大阪大学) 広報委員長: 藤井 拓(オージス総研)、 水野 修(京都工芸繊維大学) 31 ソフトウェアエンジニアリングプロフェッショナル集団や将来それに連なる若手・学生および周 辺の関係者が集い交流するとともに、人々や社会の価値創造に貢献するソフトウェアエンジ ニアリングに向けた研究、実践、人材育成の研究および実践成果の発表と議論を通じて深化 と拡大を進め、その結果を社会へ発信するとともに更なる深化および拡大の基礎を得る。 https://ses.sigse.jp/2021/ 機械学習 関連の発表多数あり 基調講演: • Forrest Shull 氏 (IEEE Computer Society 2021 会 長, CMU/SEI) :ソフトウェアエンジニアリングの将 来展望 • 込山 俊博 氏(日本電気株式会社エグゼクティブ エキスパート,ISO/IEC/JTC1 JTC1/SC7/WG6 Convenor):ソフトウェア品質評価のための国際 規格の制定,普及及び活用 • Valliappa Lakshmanan 氏 (Google, Google Cloud Platform Director): 産業界における機械学習デ ザインパターン • 劉 少英 氏(広島大学 教授): ソフトウェア品質保 証とコスト削減のためのテストベース形式検証) 2021年9月6日
  • 32. 主査: 鷲崎 弘宜 幹事: 小川 秀人、伏田 享平、伊原 彰紀、竹 内 広宜、徳本 晋、福田 浩章、横川 智教 運営委員: 33名 情報処理学会ソフトウェア工学研究会 SIGSE 2021年度 1977年創設 45年目 会員約440名 http://www.ipsj.or.jp/sig/se/ プロフェッショナル集団および周辺関係者が集う場を形成し、物理空間とデジタル空間が融合 した社会におけるソフトウェアエンジニアリング確立に向け研究、実践、人材育成の深化と拡 大を通じ社会価値を提供し続ける。 • 場: 周辺と連携し、ソフトウェアエンジニアリング領域のプロフェッショナル集団を形成する • 参加者数 2020年7月 74名→ 2021年7月110名、SES2020 333名 • 国内外連携: MODELS 2021連携(General Chairs 岸教授、鵜林教授)、SWEBOK策定他 • 研究: 理論とデータに裏付けされて世界発信可能なソフトウェアエンジニアリング研究を促 進して深掘りし広げる • 発表数 2020年7月 5件→ 2021年7月 9件、卓越研究賞 2020年 7件 • 実践: ソフトウェアエンジニアリングの実践を通じて社会へ実質的な価値を創造し続ける • 企業主体・産学連携 発表数 2020年7月 1件→ 2021年7月 3件 • 人材育成: ソフトウェアエンジニアリングに関わる人々の成長と次世代育成を促進する • 推薦博士論文 2020年2件 → 2021年3件 • 渡航支援 研究集会: 11月、2022年3月 シンポジウム/ワークショップ • SES2021 9月6-8日 • ウィンターワークショップ 2022年1-2月 ワーキンググループ • 要求工学、国際的研究活動活性化、ソ フトウェアの評価、産学連携促進ほか ぜひ入会ください!
  • 33. 参考: enPit-Proスマートエスイー https://smartse.jp • 文科省 社会人教育 enPiT-Pro AI・IoT×ビジネス • 正規履修 履修証明プログラム10科目120時間 • 2020年からオンライン中心の短期コース履修も実施中 • 一部JMOOCオンライン提供中、関連内容をセミナー 全国規模の14大学・ 研究所ネットワーク 26以上の企業・業界 団体(会員企業5000 超)・自治体との連携 + + クラウド センサ・IoT 人工 知能 ビッグ データ 生成 知識 抽出 革新 情報処理 アプリケーション ビジネス 価値 創造 題材・事例 教材・指導 受講生派遣・ 外部評価 進学・共同 研究接続 教材・指導 地区展開 スマートエスイー 通信・物理 協力校 33