人工知能を用いた医用画像処理技術

人工知能を用いた
医用画像処理技術
大阪市立大学医学部附属病院
中央放射線部
片山豊

Engineer・技師としての自己紹介
…………………………………… 開発業 ……………………………………
• 1998 年 : オートバイ用マフラーの開発・製造
• CAD/CAM を用いたマシニング
• オンラインショッピングシステム (cgi，JavaScript) の構築
…………………………………… 放射線技師 ……………………………………
• 2003 年: 大阪大学医学部附属病院 (Intern)
• 2004 年: 市立泉佐野りんくう総合医療センター (非常勤)
• 2006 年: 社会医療法人仙養会北摂総合病院 (医療情報)
• 2007 年: 大阪市立大学医学部附属病院 (MI と MR)
• 2018 年: 人工知能研究会 (大阪市立大学放射線診断学・IVR 学) に Join
………………………………… 主な研究内容 …………………………………………………………………………………………………
• EGS4 を用いて低エネルギー領域の視野外 X 線のモンテカルロシミュレーション
• Bilateral Filter を用いた核医学画像の画質改善1
• Super-Resolution による放射線画像の高解像度化2
• Compressed Sensing を用いた CT の被曝低減処理
• 深層学習を用いた Detection/Classification
• 敵対的生成ネットワーク Generative Adversarial Networks (GAN) を用いた放射線画像の生成
• 敵対的生成ネットワーク Generative Adversarial Networks (GAN) を用いた音楽のスタイル変換
1) 片山豊, 上田健太郎, 日浦慎作, 他.
骨シンチグラフィへのバイラテラルフィルタの適用.
日本放射線技術学会雑誌, 2013, 69.12: 1363-1371.
2) 片山豊, 上田健太郎, 日浦慎作, 他.
PET 画像に対する超解像を用いたデノイズ手法の適用.
日本放射線技術学会雑誌, 2018, 74.7: 653-660.

巷でよく言われる人工知能 (AI)
• yes/no の分類
• a, b, c, … の分類
⇒ 分類のためのモデル構築
• スパム分類
• ヒト・イヌ・ネコと言ったカテゴリへの画像分類
• AI に職が奪われる
• FAX すらなくならない
日本ではきっと起こらない
• アノテーションを行う
仕事を創造

人工知能 ≒ 深層学習？
• AI ⊃ ML ⊃ NN ⊃ DL
人工知能 (Artificial Intelligence: AI)
機械学習 (Machine Learning: ML)
ニューラルネットワーク (Neural Network: NN)
深層学習 (Deep Learning: DL)

主な AI の定義
定義人物
人工的に作られた人間のような知能，
ないしはそれを作る技術
松尾豊
(東京大学大学院)
人工的に作られた，知能を持つ実態．
あるいはそれをつくろうとすることに
よって知能自体を研究する分野である
中島秀之
(公立はこだて未来大学長)
人間の頭脳活動を極限まで
シミュレートするシステムである
長尾真
(京都大学名誉教授)
引用:『深層学習教科書ディープラーニング G 検定公式テキスト』(出典：『人工知能学会誌』)

AI の種類
• 理想: 人間のように考えて行動できる AI
⇒ 汎用的な AI = AGI: Artificial General Intelligence
⇒ 強い AI (Strong AI)
• 現実: 人より巧みに行える物事が
予め定義された一つに限定
⇒ 弱い AI (Narrow AI)
K.I.T.T.@ナイトライダー
(1982-1986)
ドラえもん
(1969-1996)
則巻アラレ
(1981-1986)
Siri@Apple (2011-)
(自然言語処理)

AI の成果・事例
• 画像認識に関する主な事例
• 物体認識: 犬や猫の識別や，物体の意味の言語化など
• 不良品の検出: 製造業で作る部品などの検品など
• 異物混入の検出: 食品の製造ラインでの異物検出など
• 病変の検出: 医療用画像 (Xp や MMG など) から病変を見つけるなど
• 自動運転: 産業界で競争が激化している
• 音声認識に関する主な事例
• スマートスピーカー: Google Home や Amazon Echo など，
音声で問い掛けると，何らかの回答を話す製品
• 自然言語処理に関する主な事例
• チャット bot: Web サイト上で質問に対する適切な回答を
自動的に返し会話を成立させるもの (ex: 女子高生 AI「りんな」)
• ロボティクス (強化学習)に関する主な事例
• ゲームの自動対戦: 2015 年にプロ囲碁棋士を AI (AlphaGo) が破った

AI の行政への導入
• 撮影した写真だけで粗大ゴミの種類や料金が
わかる画像認識 AI を横浜市が導入 (2019 年 9 月 2 日)
• AI を活用した粗大ごみ画像認識サービス
“SODAI Vision API (ソダイ)” をオークネットが開発
• 2016 年にリリースされた膨大な中古車データを使った
車両画像識別システムの技術を応用

AI ができること・していること
• 入力に対して適切な出力を出すシステム
• 膨大な計算を
膨大なエネルギーを使って膨大な半導体を動作させて
解答または選択肢を絞り込む
⇒ 数を撃てば当たるの総当たり戦略

AI と人間
• AI
⇒ データを与えられた近傍のみ予測可能
• 人間
⇒ データを与えられてない領域でもある程度予測可能
内挿: 人間のプロ以上
外挿: 乳幼児未満
AI

AI の弱点
• 色が似ているため砂漠を裸の人と認識
⇒ AI から見た砂漠の画像は Pornographie
• 区別するには「裸でいる状況」を
理解する必要があり非常に難しい課題

AI の歴史
引用: 総務省 HP 第 1 部特集 IoT・ビッグデータ・AI ～ネットワークとデータが創造する新たな価値～
http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h28/html/nc142120.html
大型コンピュータからパーソナルコンピュータを経て，
スマートフォンの普及によりデータ流通量の爆発的増加．
⇒ ビッグデータ時代の到来が AI ブームの切っ掛け
白いタピオカが入った
ココナッツミルク (1992 年)
黒いタピオカが入った
ココナッツミルク (2008 年)
黒いタピオカドリンク (2018 年)

身近な機械学習
検索エンジン推奨システム
音声認識
Siri や Google Assistant
遺伝子データ解析

機械学習とは…
• 既知のデータからパターンを学習することで，
未知のデータに遭遇した際も学習した
パターンを元に分類するアルゴリズム
⇒ “物事を本質的に予測する”
• データのどの部分が結果に影響を
及ぼしているのか (特徴量) を人間が判断し，
調整することで予測や認識の精度が向上

機械学習とは…
機械学習
教師あり学習
回帰
売上予測，人口予測，
需要予測，不正検知
分類
故障診断，画像分類，
顧客維持
教師なし学習クラスタリング
レコメンド，顧客セグ
メンテーション，ター
ゲットマーケティング
強化学習
バンディット
アルゴリズム
ゲーム，広告，自動運
転，リアルタイム診断
Q 学習

教師あり学習 ⇒ 要教師データ
(Supervised Training)
• ラベリング済みのデータが与えられる学習方法
• “果物” について “色・重さ・種類” という要素を
学習することで，新しく入力された情報を予測
• 初期はこの分野の開発が最も発達
バナナ
リンゴ
ブドウ
訓練データ
未知の画像
機械学習アルゴリズム
画像はブドウ

教師なし学習 ⇒ 自習
(Unsupervised Training)
• 出力データが学習時に与えられない学習方法
• 正解となる出力を与えず入力データから
規則性を発見していくのが特徴
• ラベリングされていないデータセットをもとに
機械が自ら学習を行うという仕組
購買データ
機械学習アルゴリズム
• レコメンデーション
• グルーピング
• 売上予測

教師あり学習 vs 教師なし学習
教師あり学習教師なし学習

強化学習 ⇒ RIZAP
(Reinforcement Learning)
• 実行と失敗を繰り返す中で，
徐々に正しい方向を見いだすという学習方法
• 機械に単純なゲームをルールを教えずに実行
• 偶然に良い結果を出した時には報酬を与える
• 悪い結果の時には報酬なし or 罰を与える
• 報酬を最大限にすることを目標をするよう設定し
ゲームを複数回実行
• 最終的には最も効率よく正答にたどり着く方法にたどり着く
(ex: alphaGo)

転移学習 (Transfer Learning)
• ある領域で学習させたモデルを
別の領域に適応させる技術
• 広くデータが手に入る領域で学習させたモデルを
少ないデータしかない領域に適応させたり，
シミュレータ環境で学習させたモデルを
現実に適応させたりする技術
• 学習データが増えた際にも追加で学習を行える
• 近年目覚ましい発達を遂げている
転移: “Transfer” or “Metastasis” ?

メタ学習 (Meta Learning)
• 学習方法を学習すること (Learning to Learn)
• コンピュータがデータから反復的に学習し，
人が気づいていなかったデータの中の
隠れた情報やパターンを見つけ出す
⇒ メタ学習は機械の学習能力を高めるのを
目的として，学習プロセスを学んでいく
⇒ Metastasis (転移) ではない!

Neural Network (NN)
人工知能 (artificial intelligence: AI)
機械学習 (machine learning: ML)
深層学習 (deep learning: DL)

ニューラルネットワーク
• 脳神経を模範した数学モデル (ニューロンモデル)
• ネットワーク形成する多数の人工ニューロンの
シナプス結合強度を変化させて
問題解決能力を獲得
神経細胞 (Wikipedia)
樹状突起
核
細胞体
ミエリン鞘
ランヴィエ絞輪
シュワン細胞
軸索末端
入力
出力
ニューロンモデル
閾値
入力 1
入力 2
出力
結合荷重

単純パーセプトロン (第一世代 )
• パーセプトロンは
複数の入力を受け取り1 つの信号を出力する関数
W1
W2
• 入力に重みを掛け合わせた値の和に対して bias (b) を加えたものに応じて
“0” か “1” を出力
• 一次不定方程式
• 非線形な識別は原理的に不可能
b
x1 y
x2
1

分類問題の基本
特徴抽出可能特徴抽出不可能
• 1 次関数として (最小単位) の NN → 直線的に分類できる簡単な特徴抽出に有効

多層パーセプトロン (第二世代)
• 多数の単純パーセプトロンを階層的に組み合わせる
• 十分な数のニューロンが隠れ層にあれば
任意の非線形関数は 3 層のネットワークで近似可能
• パラメータの最適化は NP 困難
• 誤差逆伝搬法で局所解へ収束
Inputs
Outputs

多層パーセプトロン (第二世代)
• 4 層以上の誤差逆伝搬法は成功しない
• 一般に層が深くなるほど
誤差逆伝搬法が下層まで届かなくなる
• 学習の精度が下っていくので
層を増やしすぎない適切な仕組みが必要
• 過学習が多い (訓練データにのみに適応される現象)
Inputs
Outputs

深層学習 (第三世代)
• 多層 (4 層以上) の
ニューラルネットワークによる機械学習手法
• Deep Neural Network: DNN
• ありとあらゆる特徴を抽出可能
• 畳み込み層より特徴量を抽出
• 半自動で特徴量抽出が可能
深層学習人工知能学会深層学習手法の全体像 xiv
2 層: パーセプトロン
3 層: 階層型ニューラルネット

• Deep Learning は中間層を多層にすることで
情報伝達と処理を増やし出力層が深い位置にある
• Neural Network に比べて特徴量の精度や汎用性をあげたり，
予測精度を向上させることが可能
⇒ パターンやルールの発見に加えて，
特徴量の設定，学習も自動的に行うのが特徴
深層学習 (第三世代)
Inputs Outputs
Input Layer Hidden Layer Output Layer

分類問題の基本 - DL
特徴抽出可能特徴抽出可能
3 層以上の NN (DL) は可微分で連続な任意関数を近似できる

深層学習のインパクト
• 2012 年には物体の認識率を競う
The ImageNet Large Scale Visual Recognition Challenge
(ILSVRC: 2010 年から始まった画像認識の競技会) で
Geoffrey Everest Hinton 率いるトロント大学が
深層学習によって圧勝 (画像識別精度 75 % → 96 %)．
2012年以降の画像認識におけるエラー率の推移

多層化 (4 層以上) による問題
• 勾配消失 (ニューラルネットワークの問題点)
• 複数の層を伝播していく過程で誤差情報が消失
• 活性化関数 (Rectified Linear Unit: ReLU) の使用
• 自己符号化器による事前学習で初期値設定
• 過学習 (過適合)
• 多層化によって複雑な事象をモデル化できるが
学習データにあまりに適合しすぎて
学習データ以外では正解率が低くなる現象
• 学習データだけに最適化されて汎用性がない状態
• アルゴリズムの改良とデータ量の増大
• 増大したデータを処理できるコンピュータの爆発的な性能向上

過学習 (過適合)
• 精度が高い深層学習
• 学習データが少ないと過学習となり精度 100%
• 交差検証ができない
• 過学習 (過適合) を防ぐために正則化が必要
• 医療系 AI にありがちな精度が高すぎる研究は
データセットを再確認！

深層学習のまとめ
• 深層学習の基本構造は関数
• 入力に対して適切な出力を出すシステム
Input Output
碁盤の画像
次の一手

画像分類
(Classification)
物体検出
(Detection)
画像認識
(Segmentation)
超解像
(Super-Resolution)
ノイズ低減
(Denoise)
敵対的生成
ネットワーク
(Generative Adversarial
Networks: GAN)
画像解析画像処理画像生成・その他
医用画像領域への DL の適用
自然言語
処理
(Natural
Language
Processing)

画像解析
• 静止画や動画などから，特徴を抽出し
対象となる物を判断し認識する技術
• 人間
⇒過去の経験から見た物を理解し分類
• コンピュータ
⇒画像データから特徴を学習し確立で表示

AI による画像認識の仕組み
• 深層学習が登場前
• 用意したデータセットに対し，個別に特徴量を
ラベリング
⇒ 人の顔を学習させるのであれば，目，鼻および
口などを指定する必要があった．
• 深層学習の登場後
• 大量の画像パターンから特徴を自動的に抽出し，
学習モデルを作成

機械学習のワークフロー
使うデータの検討データ収集
アルゴリズムの選定
データの選択データの加工・整形・拡張学習・評価用にデータを分類
ハイパーパラメータの調整学習
推論 ② から ⑤ を繰り返す最適なモデルの選択
学習済みモデルを本番環境で Deploy
① データの準備
② 手法の選択
③ 前処理
④ モデルのトレーニング
⑤ モデルの評価
⑤ 納品・本運用

データセットの作成
• Detection (Classification・Segmentation) をするには…
• 教師データに疾患のある画像が必要 (正常例は不要)
• 画像に対応した病理検査の結果があればベスト！
• データ数は多ければ多いほど良い (正しいデータ)．
• 病変の範囲 (形状) に関心領域を設定する必要があるため，
関心領域を設定できるソフトに入力できる形式に変換．
• 対応する病理データを含むため，
データの取扱には要注意！
• 確実に匿名化を行い，管理を行う必要がある．

画像認識の学習器作成
• 実際にビジネスに AI を導入するには…
• 学習済みモデルを使用: 推論の処理のみなので大規模な計算資源は不要
• 学習モデルの作成:
⇒ 大量のデータだけではなく，
膨大な量のデータを処理するための時間や電力，
GPU のように大量のデータを処理出来る機器が必要
• DL の特徴として，正しい生データの量が多ければ多いほど精度上昇
⇒ 大量のデータさえあれば DL で従来の ML では扱えなかった
複雑なデータでも処理を行うことが可能になったが，
識別結果の調整が難しくテストデータが少ないと性能が出せない
学習用データ
セット作成
学習済み
モデル
未知の画像
?
学習済み
モデル
画像認識
ex: Dog or Cat
学習処理
推論処理
Dog Cat
モデル
学習
特徴量
抽出

乳がん
• 乳がんの発症を高い精度で予測できる
AI モデルを MIT が開発
• 2009 年 1 月 1 日から 2012 年 12 月 31 日までの
39,571 人 88,994 件のマンモグラフィを使用
• 人の目では認識できない微細なパターンも
特定できるように訓練
• 人種に関わらず高精度
Above: MIT/MGH AI model identified woman at high risk 4 years (left) before her breast cancer (right):.Image Credit: MIT CSAIL

肺がん
A promising step forward for predicting lung cancer https://www.blog.google/technology/health/lung-cancer-prediction/
End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography Nature Medicine (2019)
• 肺がんの発症を高い精度で予測できる
AI モデルを Google が開発
• 匿名化された 45,856 件の胸部 CT スクリーニング
検査でがんが発見された症例
• Google の AI モデルは医師チームよりも
がんのケースを 5 ％多く検知でき，
誤診率は 11 ％低かった

世界最大のデータセット
• Google は 2016 年に機械学習のためのデーセット
「Open Images」を初めてリリース．
• 2019 年 5 月 8 日に Open Images Dataset V5 を公開．
• Open Images Dataset V5 は 350 カテゴリにわたる
280 万個のセグメンテーションマスクが用意されている．
Google AI Blog: Announcing Open Images V5 and the ICCV 2019 Open Images Challenge
https://ai.googleblog.com/2019/05/announcing-open-images-v5-and-iccv-2019.html

標準ディジタル画像
データベース［胸部腫瘤陰影像］
• JSRT が公開している “標準ディジタル画像
データベース［胸部腫瘤陰影像］” が必須
http://imgcom.jsrt.or.jp/download/
http://imgcom.jsrt.or.jp/minijsrtdb/

データセットの利用
• 自施設でデータセットを作成するには，
大量の答え付きのデータセットが必要だが，
公開されているデータセットを利用するので
あれば，アルゴリズムの開発のみで良い．
• 肺がん，乳がんのデータセット (研究) が多い理由は，
画像データと病理データが紐付いて存在しているため．
• 疾患に対するデータセットの多くは
所見が間違えていることがある．
• 公開データを用いる場合はそこもチェックが必要．

データセットの作成
• 工学系の人は，
公開されている患者情報 (カルテ情報) しか
入手できずデータセットの作成ができない．
• 患者情報にアクセスできるのが医療職の
アドバンテージ (倫理委員会の許可が必須)
• 深層学習を用いた研究は工学系では安定期
• 深層学習を用いた研究は医療領域では臨床適用期
• 医療画像による病変検出は医師の代替でしかなく，
AI でないとできないことがない．
• 臨床としては意味があるが，
テクノロジーとしては面白さがない．

データセットの要件
• AI 技術によって業務プロセスを自動化するに
は，膨大な量の学習用データが必要だと考えが
主流 (だった)
• 正しくない学習用データによる誤った判断につなが
る不適切なバイアスが問題
• 学習用データの質が重視される
• 機械学習をベースにした AI システムから有益
な結果を得るためには，質の高い学習用データ
の用意が必要

法律の解釈
• 平成 30 年 12 月 19 日
厚生労働省医政局医事課長通知文書
• 「人工知能 (AI) を用いた診断、
治療等の支援を行うプログラムの利用と
医師法第 17 条の規定との関係について」
• AI を用いた診断・治療支援を行うプログラムを利用
して
診療を行う場合についても、診断、治療等を行う主体は
医師であり、医師はその最終的な判断の責任を負う
こととなり、当該診療は医師法第 17 条の医業として
行われるものであるので、十分ご留意をいただ
きたい。「診断責任は医師」
⇒ こう定義されたので医療 AI は動き出した

AI 搭載医療機器の
承認審査短縮へ法改正
• 動脈瘤の検出など，医療分野では AI を活用し
た様々な取り組みがなされている
• 新しく取得したデータを再学習させると性能が
向上するという AI の特性上，性能が変われば
頻繁に審査を受ける必要がある
• 法改正により，再学習で性能が向上した場合の
承認審査期間が短縮がされる見通し

時流 - AI Winter is well on its way
• 米の AI 研究者の Filip Piekniewski 氏が，自身の
Blog で「AI 冬の時代がやってくる」と主張
https://blog.piekniewski.info/2018/05/28/ai-winter-is-well-on-its-way/

時流 - AI Winter is well on its way
① Deep Learning の研究者たちの (ネット上での)
発言が少なくなった
② Deep Learning はスケールしていない
③ 自動走行技術は，まだまだ不完全
• 2012 年に AlexNet という DL のモデルが
世界中の AI 研究者に衝撃を与えた
• AlexNet のパラメータ数は 6000 万程度
• 最近のモデルのパラメータ数は AlexNet の 1000 倍以上
• 性能が 1000 倍以下
• 一部の研究者が主張するほど，DL が
指数関数的な進化を遂げていない

時流 - Thomas Nield の主張
• AI の歴史
• 推論や検索に基づいた第 1 次 AI ブーム
• エキスパートシステムの開発が流行した第 2 次 AI ブーム
• これらのブームが終息した原因
• AI に対する過度な期待とその期待に便乗した AI の誇張
• AI で実現可能なことを実際より大きく見せることで期待を煽るが，
その期待に応えられない度にブームが終息
• 現在の AI ブームに煽動と誇張を見る同氏は，
この流行は2019年から2020年にかけて終息すると主張．
• ディープラーニングの流行がもたらした第 3 次 AI ブーム
• ディープラーニングの進化を加速するはずの学習データが
不足していること，さらにはディープラーニングをもってしても
計算複雑性理論から見て解決困難な問題は依然として解決が難しい
• AI を正しく活用するためにはディープラーニングの効用を妄信せず，
個々の問題にあった AI 技法を適用する
Thomas Nield
アメリカ大手航空会社サウスウエスト航空のビジネスコンサルタントを務めているとともに，
SQL や RxJava に関する入門書をオライリーから出版．
同氏が長文英文記事メディア Medium に投稿した記事の要約．

時流 - 敵対的生成ネットワーク
• 2018 年頃は，AI バブルの様相を呈していた．
• 機械学習と呼んでいたものが，AI と名称変更する
だけで新規性に富んだテーマとして扱われる．
• AI を実現できるソフトウェアが開発され，
モデルの構築が簡便に実現可能な
プラットフォームが完成．
⇒ AI は安定期 (一般化) に突入．
• 敵対的生成ネットワーク (Generative adversarial
networks: GANs) を用いた研究が盛んになり，
新たな時流が生じた．

時流 - 敵対的生成ネットワーク
• 2014 年にイアン・グッドフェローらによって
発表された教師なし学習で使用される人工知能
アルゴリズムの一種
• ゼロサムゲームフレームワークで
互いに競合する2つのニューラルネットワークの
システムによって実装

GAN の仕組み
• 二つの AI が違う役割を持って，
切磋琢磨することによって，似ているデータを作成
• Generator (生成者)
生成データの特徴の種に相当するノイズを入力することで，
このノイズを所望のデータに近づけるようにマッピングする．
⇒ データ生成
• Discriminator (識別者)
Generator が生成した偽物のデータと本物のデータが与えられ，
その真偽を判定
Z
(ノイズ)
Generator
Discriminator
本物
or
偽物
本物の
データ
本物の
データ
本物の
データ
偽物の
データ
偽物の
データ
偽物の
データ

GAN でできること
• 教師データからの画像生成
• 高解像度の画像生成
• 画像の翻訳
• 文章からの文字起こし
• 動画の翻訳
• 画像のスタイル変換
できないことは少ない

実際には存在しない寝室を生成
Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks
Alec Radford, Luke Metz, Soumith Chintala
(Submitted on 19 Nov 2015 (v1), last revised 7 Jan 2016 (this version, v2))

実際には存在しない顔写真
PHOTOGRAPHS BY CARL BERGSTROM AND JEVIN WEST/UNIVERSITY OF WASHINGTON;
PHILIP WANG/THISPERSONDOESNOTEXIST.COM
このアルゴリズムには，顔を入れ替えた偽の動画 (Deep Fake) と同等のコードを含む

著作権フリーの生成した顔画像
• GAN による画像生成は，
人物や動物，アニメキャラから賃貸物件まで，
あらゆる画像が対処となり試されてきた．
• 生成物の著作権については明言されていない場合
が多い．
• https://generated.photos/
著作権フリーの
オリジナル顔画像が 10 万枚公開された．

著作権フリーの生成した顔画像
• GAN による生成画像の特徴
• 背景に特有のアーチファクトが発生
• 眼鏡のツルが頓珍漢なデザインになる
• 左右対称性が全然無い
⇒ 実際の顔画像の背景などを加工すれば GAN 風

学習データを作成 (GAN)
• AI 技術を産業に応用する際の課題
• AI が学習するための教師データの不足
• CT や MRI から AI が病気を Detection しようにも
病気の画像が少なければ充分な学習ができず
システムの精度が上がりにくい
• 教師データの回転や移動によるデータ量の
水増しではなく GAN で学習データを生成
• 偏りやドメインシフトの影響が大きくなる
• GAN をドメイン適応用に開発することで
大規模データ間の違いを修正し，
さらに大きなデータベースを開発できる可能性がある？

AI は人間の医師よりも優秀？
• 2012 年以降の深層学習に関わる研究論文を調査
• AI による自動診断に関する研究論文は 2 万件以上存在
• 質の高いデータを AI に分析させたものと同じ画像を専門医にも
見せて比較している研究に絞って調べると 14 件該当
• 14 件の研究の中から病気を正確に診断した精度を算出すると，
医者が 86 ％，AI は 87 ％という精度
⇒ AI の医療への応用を研究した論文は内容が不十分
⇒ AI が人間を超えたと言うが実際には同等程度
Xiaoxuan Liu MBChB, Livia Faes MD, Aditya U Kale MBChB, et al.
A comparison of deep learning performance against health-care professionals in detecting diseases from medical imaging:
a systematic review and meta-analysis Lancet Digital Health 2019/09/25

AI の診断を信じられますか？
• 胸部 X 線検査では様々な疾患を指摘することが
でき，その中でも肺がんの発見が重要である．
• 胸部 X 線検査で肺がんを見逃す可能性は高い．
• 胸部 X 線検査の画像はパターンが多く，診断が難しい．
• 肺がんは診断後に手術が行われ，病理所見が
得られることから，自動診断の対象となる
ことが多く，AI を用いた胸部 X 線検査の
自動診断に関する研究が多く行われてる．
• 今現在その精度は医師と同等以上と言われている．

AI の診断を信じられますか？
• AI の基本的な問題点
• AI のモデルを構築した学習データの違いによって
性能に違いが出るドメインシフト
• 同じ問題を解くために集めたはずのデータの分布領域
(ドメイン) にズレが生じていることで精度に影響が出る．
• 自分で集めたデータでは学習とテストが共にうまくが，
同じ問題用に集めた隣人のデータではうまくいかない現象．
• 汎化性能が高ければデータセットを変更しても
精度に影響が出ないはずだが，悪くなる現象．
• 大規模データベース 3 種類を同じモデル・環境で
学習させ，それぞれを別のデータベースで評価し
データセットの影響を評価
Eduardo H. P. Pooch∗, Pedro L. Ballester, Rodrigo C. Barros
Can we trust deep learning models diagnosis? The impact of domain shift in chest radiograph classification
arXiv:1909.01940v1 [eess.IV] 3 Sep 2019

AI の性能を評価する方法
• AI の性能評価指標として TPR (真陽性率) と
ACC (正確率) 等の指標が用いられてきたが，
統計的指標に基づき正確に評価する手法を開発．
• TPR や ACC など各指標の特性と有効性を，
分布関数 (iCDF) を使った統計学的な
解析によって検証．
2018 年 3 月 5 日京都大学

機械学習エンジニア
• どのような課題でも深層学習で解決できると思ってる
勘違いをしている人は多い
• 深層学習で end-to-end に解ける問題は多くない
• 機械学習を使わずに解ける課題なら機械学習は使わない方がいい
• 良識のあるエンジニアを雇うと，機械学習を使うはずだった
プロジェクトに「機械学習は必要ない」となる
• テクノロジーに夢を見ていない老害
• 機械学習と深層学習が流行りすぎて「画像処理 = 深層学習」
• 方法が目的になっている傾向がある
• AI エンジニアは，
学習データやアルゴリズムの用意 (お膳立て) をして，
気持ちよく学習して頂くために働く召使い．

Web Application
• Googleは，Web ブラウザで
リアルタイムに人間の姿勢推定を
可能にする機械学習モデル「PoseNet」の
TensorFlow.js バーションをリリース
• PoseNet
• 映像中の人物から 1 つまたは複数のポーズを検出
• ToseorFlow.js
• Web ブラウザで実行できる
オープンソースの機械学習ライブラリ
• Google がオープンソースとして公開している
機械学習ライブラリ「TensorFlow」の JavaScript 版
• 実行環境は何でも良い！

開発環境
• Ubuntu (Linux)
• GPU 付きの PC で，
本格的に Deep Learning を学び実践したい人向け
• Windows
• 使い慣れた環境を使いたい人にとって最良
• GPU が使え，TensorFlow や PyTorch なども使える
• Visual Studio で開発したい人には人気
• macOS (Mac)
• CPU を使って Deep Learning を試したい人向け
• 環境構築が必要！

市販品
• 開発環境が事前に組み込まれているコンピュータ
• Deep Infinity (パソコン工房)
• DeepEye
• 高価だが，環境構築を行わなくて良い
⇒ 研究に集中できる
• DL 用 Framework を Download するだけで，
環境設定や整合性を気にすることなく
環境構築ができ，導入時間を大幅に短縮可能！
• 環境構築が不要！

AI と Python の親和性
• 2015 年以降，AI ブームにより
Python 関連書籍の売れ行きが好調
• AI 人気が Python 人気に直結しているのは，
AI システムを開発するプログラミング言語として
Python が最も使いやすい
• 今日のシステム開発においてはプログラムは
ゼロから書くのではなく，プログラムの共通部品を
集めた Library や特定用途向けの開発基盤である
Framework を活用して工数を抑えるのが一般的
• AI 分野の Library や Framework の充実度合いで，
Python は他のプログラミング言語を圧倒

Library
• 特定の処理を再利用するために
切り出されたプログラムの一部
• 何か処理を行う時に，自分で全ての処理を書かなくても，
Library をつかえば (簡単に) 特定の処理を実行可能
• 自分が書けない複雑な処理も Library を活用すれば，
比較的簡単に実装することが可能
• オープンソースソフトウェアとして
配布されているものも多い
• ソースコードを改変して自身のプロダクトに
取り込むことが可能
• Library を使うと，機械学習のコアな部分を一から
Coding する必要がない

Python の Library
分野名称概要リリース
機械学習 scikit-learn 多くのアルゴリズムに対応した Library 2007
深層学習 TensorFlow Google が開発した Library 2015
PyTorch Facebook が開発した Library 2016
Chainer Preferred Networks が開発した Library 2015
計算 NumPy 行列操作を高速処理する Library 2006
SciPy 統計やフーリエ変換など科学技術計算で
よく使われる関数を提供する Library
2001
前処理 pandas 表形式のデータ整形，欠損値の補完と
いったデータ分析の処理前に便利な機能
を提供する Library
2011
可視化 matplotlib 2 次元のグラフを描画する Library 2003
Web App Djangi フルスタックの Web App Framework 2005
Flask 軽量な Web App Framework 2010

AI の勘違い (都市伝説)
• AI は人間の脳のように機能する
• 現在の AI は “弱い AI” ⇒ 決められた単一タスクのみ処理可能
• インテリジェントマシンは自ら学習する
• 学習には “問題の設定”と“適切なデータセットの提供” が必要
• AI は 100 ％客観的になれる
• AI は全てエンジニアによるデータとルールに基づいている
• データセットと結果を評価し，潜在的な偏見が生じず
次の学習サイクルに新しい知識と統合できるようする必要がある
• AI は定型業務を代替し得る
• AI の予測・分類・クラスタ化により的確な判断が可能
• 医療: 放射線科医よりも迅速に病気を発見
• 金融・保険業界: ロボアドバイザが資産管理や詐欺検出に利用
• FAX すらなくならない日本では，
定型業務の全てが AI に置き換わることはない

近年の AI ブーム
• 誰もが AI を求めている？
• “AI” ではなく，“AI っぽい何か” を求めている
• “休憩するためにカフェに行く” のではなく，
“インスタ映えのためにカフェに行く”
• 前提が違うと話しが噛み合わない．
インスタ映えを目的に撮影していないので映えた写真ではない！

世界 10 カ国の AI の利用状況
• 日本の職場における AI の利用率は 29 %
⇒ 10 カ国・地域で最下位
• 管理職とロボットのどちらを信頼するのか？
⇒ロボットと回答した率は日本は76%
⇒ 世界平均の64%を上回った

AI の課題
0 5 10 15 20 25 30 35 40 45
十分な量・質を備えたデータの取得
AI の精度が不十分
AI 活用リスクが大きい
メンテナンスコストが高い
AI 導入の目的が不明確
ベンダーとのコミュニケーションが困難
ベンダーの自社が属する業界への知識不足
従来の手法で ROI や評価基準が設定できず…
契約条件が不適当
AI 人材・知識不足
経営層の納得が得にくい
現場の納得が得にくい
適切なベンダー選定が困難
課題が不明瞭
その他
フェーズごとの課題
企画・立案段階 (n=381) 企画・立案終了~概念実証完了まで (n=381) 概念実証終了~実用化済み (n=381)
• 課題が不明瞭
• AI 導入の目的が不明瞭
• 十分な量・質を備えたデータが取得できていない
• AI の精度が不十分
• データの取得と課題の選出が問題．
• 特に医用データは医療関係者の介在が
なければ公開データ以外取得不可能．
引用：「平成30年度成果報告書産業分野における人工知能及びその内の機械学習の活用状況及び人工知能技術の安全性に関する調査」

機械学習エンジニアの不足
• 経済産業省は機械学習に関わる人材が
2020 年には 4.8 万人不足すると予測
• 2019 年 3 月に政府の AI 戦略が
年間 25 万人を目標に AI 人材を育成
• 教育再生会議が全ての大学生が
AI などの基礎的な素養を身につけられるように
標準カリキュラムを作成することを提言
• 高校教育
• AI などを理解するうえで必要な
「確率」「統計」「行列」などを確実に学ぶ
• 技術の発展に応じて教育内容を迅速に変えるため，
学習指導要領の一部改訂や教科書の一部訂正といった制度を活用
• 大学教育
• 産業界と協力しながら AI や数理，データサイエンスの分野で
求められる知識や技能を特定し，それを身につけられる
教育プログラムを国が認定する制度の創設
• 履修状況を採用活動やインターンシップなどに活用することを想定

AutoML
• 2017 年頃から AutoML が注目を集め出した
• ニューラルネットワークが
ニューラルネットワークを作り上げる
• 2018 年初頭，
Google が画像分類の Cloud AutoML をアルファ版公開
• Cloud AutoML は機械学習の専門家でなくても
高品質な画像分類モデルを生成できるというもの
⇒ Neural Architecture Search (NAS) の理論が背景にある
• NAS が従来のニューラルネットワーク設計との違い
⇒ NAS はニューラルネットワークのアーキテクチャ自体を最適化

AutoML
• 機械学習の専門知識がなくても，
最小限の労力で，高品質のカスタム機械学習
モデルをトレーニングできるサービス
• Google: AutoML Vision
• データセットを用意すれば学習済みモデルの
作成が依頼でき，完成したモデルを購入できる
画像分類無料有料
訓練毎月最初のモデル 10 個に
ついては，アカウントごとに
1 ノード時間まで無料
以後のトレーニング時間については，
1 時間あたり USD $20.00
予測 1,000 枚までの画像は無料画像の数が 1,001～5,000,000 枚の場合，
画像 1,000 枚あたり $3

AI のコーディングについて
• 今や Tensorflow や Keras で
簡単に ML のコーディングが可能
⇒ "MatrixFlow" や "Prediction One" など，
誰でも簡単に AutoML で AI モデルを構築出来る
⇒ 誰でも AI を 1 から作れる時代
• 既存の AI サービスを
うまくビジネスに落とし込むかが重要な時代にシフト
• “機械学習の基礎を理解” した上で AI を使いこな
し，
“必要な時にはツールで対応しきれない部分を
自ら作成して補い，それぞれの課題に対応
出来るような人材の育成が重要と考える．

医療系 DL，AI をしたい方へ
• Neural Network Console (ソニー株式会社)
• Azure Machine Learning Studio (Microsoft)
• MatrixFlow (株式会社 MatrixFlow)
• Cloud AutoML (Google)
• Coding の必要がなく GUI でモデルの構築が可能．
• 環境構築が不要または簡単に完了．
• Coding についての学習を省くことができるので，
DL の基礎となる数学や統計を学べる．
• 医用画像に対する AI の運用は，教師データの作成に
医用情報が必要となるため，Medical が介入する必要があ
る．
• 特に Classification，Detection，Segmentation
• データクリーニングに多くの時間を費やす必要がある．
• 研究 < 臨床となっており，目新しさよりも安定を求める傾向．
• 医療系 AI を医療人が行うことに一定の需要はある．

最後に
• 機械学習の概念
• 歴代の人工知能ブーム
• データセットの作成
• 医用画像領域への深層学習の適用
•ご清聴ありがとうございまし
た．

人工知能を用いた医用画像処理技術

More Related Content

What's hot

Similar to 人工知能を用いた医用画像処理技術

More from Yutaka KATAYAMA

人工知能を用いた医用画像処理技術

Editor's Notes