瀬尾 佳隆
Microsoft MVP
for AI
AI-900
ポイント解説
Microsoft AI fan
2021/12/14
瀬尾 佳隆 (@seosoft)
MVP for AI
自己紹介
瀬尾 佳隆 (せお よしたか)
• フリーランスのエンジニア
• MVP for AI (Jul 2018 – Jun 2022) /
MVP (Jan 2009 – Jun 2018)
• Microsoft Certified Trainer (2021–2022)
• 学生向け・MS社員向け AI / IT トレーニング (2020-2021)
• マイクロソフト公式の認定資格トレーニングを 1年間で 38回を担当
• 業種別マイクロソフト パートナー プログラム トレーニング (2019-2020)
2
AI-900: Microsoft Azure AI Fundamentals
https://docs.microsoft.com/ja-jp/learn/certifications/exams/ai-
900
3
AI-900 で評価されるスキル
AI のワークロードと考慮事項の説明 15-20% 7-10 問 程度
機械学習の基本原則の説明 30-35% 15-18 問 程度
コンピューター ビジョン ワークロードの機能の説明 15-20% 7-10 問 程度
自然言語処理 (NLP) ワークロードの機能の説明 15-20% 7-10 問 程度
会話型 AI ワークロードの機能の説明 15-20% 7-10 問 程度
4
詳細な評価スキルはダウンロード可能
https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4wGpB
AI のワークロードと考慮事項
• 責任ある AI がポイント
そもそも “AI” とは
人間の行動と能力を模倣するソフトウェア
6
機械学習 予測 を行い データ から結論を導き出す方法を
コンピューター モデル に「教える」こと
異常検出 システムのエラーや 異常 な状態を自動的に検出する機能
コンピューター
ビジョン
カメラ、ビデオ、画像 などの視覚的な情報を解釈する機能
自然言語処理 文字言語 や 音声言語 を解釈して応答する機能
対話型 AI 会話 に参加するためのソフトウェア "エージェント" の機能
https://docs.microsoft.com/ja-jp/learn/modules/get-started-ai-
fundamentals/1-introduction
責任ある AI
原則 課題またはリスク 例
公平性
偏りが結果に影響する可能性がある ローン承認モデルで、データの偏りが原因で
性別による差別が生じる
信頼性と
安全性
エラーによって損害が発生する可能性が
ある
自律走行車でシステム障害が発生したために
衝突が起こる
プライバシーと
セキュリティ
データが流出する可能性がある 医療診断ボットが、患者の機密データを使用して
トレーニングされる
包括性
ソリューションがすべてのユーザーに
対して有効ではない可能性がある
ホーム オートメーション アシスタントで、視覚障碍
のあるユーザーに音声出力が提供されない
透明性
ユーザーが複雑なシステムを信頼する
必要がある
AI ベースの金融ツールで推奨事項が、
何に基づいているのかがわからない
アカウンタ
ビリティ
誰が AI 主導の意思決定の責任を
負うのか
顔認識による証拠に基づいて無実の人が有罪
判決を受けた場合、誰がその責任を負うのか
7
https://docs.microsoft.com/ja-jp/learn/modules/get-started-ai-fundamentals/7-
challenges-with-ai
https://docs.microsoft.com/ja-jp/learn/modules/responsible-
ai-principles/
「責任ある AI の基本原則を確認する」
8
機械学習の基本原則
• 予測問題 3種類の理解
• 評価指標の理解
機械学習とは
◼データ の 特徴 を コンピューターに見つけさせる
こと
例) ある商品の過去の売り上げデータから
買ってくれた人、買ってくれなかった人の特徴を
見つけ出す
• 性別
• 年齢
• 一人か他の人と一緒か
• 地域、季節、曜日・・・
◼特徴を見つけさせるには 実際のデータ が必要
10
学習対象のデータの形式
11
パラメーター
(説明変数)
予測対象
(目的変数)
パラメーター
(説明変数)
予測対象
(目的変数)
パラメーター
(説明変数)
数値を予測したい ラベルを予測したい 正解ラベルを持たない
回帰 (Regression)
数値を予測
• 教師あり 学習
• 数値 を問われたら回帰
• 何個?
• 何円?
• 何人?
• モデルは線形 (y = ax + b) で
なくてもよい
• 明日の売り上げは 何円 になるか?
12
分類 (Classification)
ラベルを予測
• 教師あり 学習
• どれに該当するか を問われたら分類
• True or False
• 犬か、猫か
• 松か、竹か、梅か
• 晴れか、曇りか、雨か、雪か
• Computer Vision も分類(多値分類)
• 明日は売り上げ目標を 達成できるか、できないか?
13
クラスタリング (Clustering / クラスター化)
コンピューターに グループ分け させる
• 教師なし 学習
• クラスターの数は 人間が指示
• どう分けるかは コンピューター任せ
(教師なし = 正解が分かっていない)
14
回帰モデルの評価指標
平均絶対誤差
Mean Absolute Error
予測値と実際の値との差(絶対差)の平均
値が小さいほど モデルの予測が正確
二乗平均平方根誤差
Root Mean Square
Error
予測値と実際の値との差の二乗の平均の平方根
値が小さいほど モデルの予測が正確
相対二乗誤差
Relative Square Error
予測値と実際の値との差の二乗に基づく、0~1 の範囲 の相対的な値
値が 0 に近いほど モデルの予測が正確
相対絶対誤差
Relative Absolute
Error
予測と実際の値との絶対差に基づく、0~1 の範囲 の相対的な値
値が 0 に近いほど モデルの予測が正確
決定係数
R2
予測と実際の値とがどれだけ近いかを表す指標
0~1 の範囲で値が 1 に近いほど モデルの予測が正確
15
Predicted vs. True グラフ
• 予測値と実際の値との誤差の相関
• 破線・・・完璧なモデルの誤差
• 実線と帯・・・作成したモデルの “残余”
• 下のヒストグラムは実際の値の分布
Residuals ヒストグラム
• 残余値の範囲の頻度を示す
• 0 (= グラフ中央) が高いほど良いモデル
• 残余・・・予測値と実際の値との差
• 品質が良いモデルであれば、完璧なモデルの
誤差
に近い値になる
回帰モデルの評価指標の視覚化
16
分類モデルの評価
混同行列 (Confusion Matrix)
分類モデルの性能を測るために使用する
17
True Positive
実際に Positive であり、正しく Positive であると
予測したデータ
False Positive
実際は Negative であるが、誤って Positive であると
予測したデータ
False Negative
実際は Positive であるが、誤って Negative であると
予測したデータ
True Negative
実際に Negative であり、正しく Negatite であると
予測したデータ
分類モデルの評価指標
18
Accuracy
精度
正解率
𝑇𝑃 + 𝑇𝑁
𝑇𝑃 + 𝐹𝑃 + 𝐹𝑁 + 𝑇𝑁
すべてのデータのうち正解した割合
もっとも単純な指標
Precision
適合率
(精度)
𝑇𝑃
𝑇𝑃 + 𝐹𝑃
Positive と予測したもののうち
本当に Positive である割合
Recall とはトレードオフの関係
Recall
再現率
真陽性率
𝑇𝑃
𝑇𝑃 + 𝐹𝑁
実際には Positive なデータのうち
取りこぼしなく Positive であると
予測した割合
F-measure F 値
Precision と Recall
との調和平均
Precision と Recall との一方に
偏らせずに評価したい場合に使う
“左上 + 右下” の比率が大きいほど良い
モデル
セル色の濃さで視覚的に判断
Accuracy
19
Precision と Recall の直感的な例
20
予測
Positive Negative
実際
Positive
TP FN
Negative
FP TN
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 =
6
6 + 1
𝑅𝑒𝑐𝑎𝑙𝑙 =
6
6 + 2
◼ROC 曲線 (受信者動作特性曲線)
• 偽陽性率と真陽性率 (=再現率) とが
どのように変化するかをグラフ化
• 曲線が “上に張り付く” ほど良い
モデル
◼AUC
• ROC 曲線より下の面積
• 1 に近いほど良いモデル
• 0.5 だとランダムに回答するのと同じ品質
=予測の精度が低い
ROC 曲線 / AUC
21
自動 ML デザイナー
機械学習用のツール
22
機械学習の処理フロー
23
データセットの作成
データの整形・特徴選択
アルゴリズムの選択
モデルのスコアリング
モデルの評価
データの分割
(1) データの準備
(2) モデルの学習
(3) モデルの評価
モデルのトレーニング
テスト データ
特徴 (x)+正解 (y)
トレーニング データ
特徴 (x)+正解 (y)
(1) データの準備
自動 ML
24
データセットの作成
データの整形・特徴選択
アルゴリズムの選択
モデルのスコアリング
モデルの評価
データの分割
(2) モデルの学習
(3) モデルの評価
モデルのトレーニング
テスト データ
特徴 (x)+正解 (y)
トレーニング データ
特徴 (x)+正解 (y)
ユーザーが行うのは、データセットの作成と自動 ML の起動だけ
自動 ML が処理する範囲
デザイナー
25
データセットの作成
データの整形・特徴選択
アルゴリズムの選択
モデルのスコアリング
モデルの評価
データの分割
モデルのトレーニング
テスト データ
特徴 (x)+正解 (y)
トレーニング データ
特徴 (x)+正解 (y)
モジュールを繋げて Pipeline を作る
参考) 機械学習のアルゴリズムの選択
チートシートを活用
26
https://docs.microsoft.com/ja-jp/azure/machine-
learning/algorithm-cheat-sheet?context=azure/machine-
Computer Vision
(視覚サービス)
• サービスや機能が多いので名前と機能を理解
Computer Vision の機能
画像分類 画像を 分類 「この画像は何?」
物体検出 画像内で認識した 個々の物体 を分類
「この画像には何と何が写ってる?
その位置は?」
セマンティック
セグメンテーション
画像内で認識した個々の物体に 着色
「この画像で写ってるものに色を
塗って」
画像解析 画像についての タグや要約 を生成 「この画像を説明して」
顔検出と認識 画像の中の人間の 顔 を認識
「この画像に写っている人の顔の
位置を教えて」
光学文字認識 画像内の 文字 を検出して読み取る
「この画像に写っている文字を
教えて」 28
画像をアップロードして学習 モデルの評価
Custom Vision
29
◼光学文字認識するだけではなく
認識した文字列の意味まで
予測する
• 店舗名
• 住所
• 日付・時刻
• 商品名
• 価格
• 合計金額
など
Form Recognizer
30
視覚サービス利用時に必要な情報
サービス名 利用時に必要な情報
Computer
Vision
• Key ・・・クライアント アプリケーションの認証に使用
• Endpoint ・・・リソースにアクセスできる HTTP アドレス
Custom Vision • Project ID ・・・Custom Vision プロジェクトの一意の ID
• Model name ・・・公開中にモデルに割り当てた名前
• Prediction endpoint ・・・"予測" リソースのエンドポイントの
HTTP アドレス
• Prediction key ・・・"予測" リソースの認証キー
Face • Key ・・・クライアント アプリケーションの認証に使用
• Endpoint ・・・リソースにアクセスできる HTTP アドレス
OCR • Key ・・・クライアント アプリケーションの認証に使用
• Endpoint ・・・リソースにアクセスできる HTTP アドレス
31
OCR API
◼少量 のテキスト
• 写真 中の 看板、商品パッケージ など
◼取得の単位
• テキストを含む画像内の 領域
• 各領域のテキストの 行
• 各テキスト行の 単語
Read API (読み取り API)
◼テキスト中心 の画像
• 文書 や Web ページ のハードコピーなど
◼取得の単位
• ページ サイズと向きに関する情報を
含むテキストの 各ページ
• 各ページ上のテキストの 行
• 各テキスト行の 単語
◼入力の制限
• PDF / TIFF ファイル ・・・最大 2,000
ページ
• ファイルサイズ ・・・50MB
OCR API / Read API
32
https://docs.microsoft.com/ja-jp/learn/modules/read-text-computer-
vision/2-ocr-azure
自然言語処理
• テキストと音声のサービスの範囲
• Language Understanding の理解
• 2021年11月発表の Language Studio は現在プレビュー
• AI-900 の範囲にはまだ入らないと考えられる
自然言語処理とは?
34
テキスト分析とエンティティ認識
センチメント分析
音声認識と合成
機械翻訳
意味論的言語モデル
Text Analytics
35
• 主要言語: 英語
• センチメント: 88% が肯定的
• キーフレーズ: "wonderful
vacation"
• エンティティ: France
翻訳サービスの機能比較
◼Translator Text
• テキストからテキスト への翻訳
◼Speech
• Speech to Text ・・・音声 からテキスト
• Text to Speech ・・・テキストから 音声
• Speech Translation ・・・音声から音声
36
Intent : ユーザーの意図・目的 Entity : 参照される項目
Language Understanding (LUIS)
37
対話型 AI
• QnA Maker の理解
• Bot Service とチャネルの理解
• 2021年11月発表の Language Studio は現在プレビュー
• AI-900 の範囲にはまだ入らないと考えられる
Bot に関する責任ある AI ガイドライン
1. ボットができる (およびできない) ことについて透明性を保つ
2. ユーザーがボットと通信していることを明確にする
3. 必要に応じてボットを人間にシームレスに引き渡し可能にする
4. ボットが文化的基準を尊重することを確認する
5. ボットが信頼できることを確認する
6. ユーザーのプライバシーを尊重する
7. データを安全に処理する
8. ボットがアクセシビリティの基準を満たしていることを確認する
9. ボットのアクションに対する説明責任を想定する
39
https://www.microsoft.com/en-
us/research/uploads/prod/2018/11/Bot_Guidelines_Nov_2018.pdf
ナレッジベース : Q&A の管理 テスト ペイン : ポータル内でテスト
QnA Maker
40
Bot Service とチャネル
◼作成した Bot は 複数の “チャネル” に接続可能
• チャネルごとに 個別の Bot を作る必要はない
41
https://docs.microsoft.com/ja-jp/learn/modules/build-faq-chatbot-qna-maker-azure-
bot-service/2-get-started-qna-bot
Bot
Web チャット
メール
音声
改めて AI-900 で AI の勉強
AI-900: Microsoft Azure AI Fundamentals
https://docs.microsoft.com/ja-jp/learn/certifications/exams/ai-
900
43
AI-900 で評価されるスキル
AI のワークロードと考慮事項の説明 15-20% 7-10 問 程度
機械学習の基本原則の説明 30-35% 15-18 問 程度
コンピューター ビジョン ワークロードの機能の説明 15-20% 7-10 問 程度
自然言語処理 (NLP) ワークロードの機能の説明 15-20% 7-10 問 程度
会話型 AI ワークロードの機能の説明 15-20% 7-10 問 程度
44
詳細な評価スキルはダウンロード可能
https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4wGpB

AI-900 ポイント解説