Successfully reported this slideshow.
Your SlideShare is downloading. ×

桐山諭和 気管支鏡下擦過ギムザ染色細胞の良悪性自動鑑別システム:複数のCNNでの検討

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Loading in …3
×

Check these out next

1 of 23 Ad

More Related Content

Recently uploaded (20)

Advertisement

桐山諭和 気管支鏡下擦過ギムザ染色細胞の良悪性自動鑑別システム:複数のCNNでの検討

  1. 1. 気管支鏡下擦過ギムザ染色細胞の 良悪性自動鑑別システム: 複数のCNNでの検討 桐山諭和1、寺本篤司2、山田あゆみ2、道塲彩乃3 、櫻井映子3 、塚本徹哉3 1成田記念病院 病理診断科 2藤田医科大学 医療科学部放射線学科 3藤田医科大学 医学部病理診断学 JSDP 2021
  2. 2. 2 今回の演題に関して開示すべきCOIはありません。 桐山諭和
  3. 3. *近年、様々な分野でAI(人工知能)を活用し作業の 自動化に向けた取り組みが行われている。 *医療分野も例外ではなく、AIを搭載した医療機器の 臨床実装は着実に進んでいる。 3 【 はじめに 】 AI(人工知能):人間の能力をコンピューターでも可能にするための技術 機械学習:人間が行う学習能力と同様の機能をコンピューターで実現 しようとする人工知能技術 ディープラーニング:構造が複雑な人工ニューラルネットワーク(CNN) 入 力 デ ー タ 出 力 デ ー タ 入力層 隠れ層 出力層
  4. 4. *病理領域のAIは、組織を用いたものは様々な検討がなされているが、細胞診 領域での報告はまだ少ない。 *呼吸器領域の細胞診診断時に組織型推定が困難な症例が多く診断に難渋して いた。 我々は以前、呼吸器LBC検体を用いて組織型自動推定がどの程度可能 なのか検討、3種類の組織 (ADC, SqCC, Small)に分類、精度71%と報告した。 (Teramotoら Research Article | Open Access Volume 2017 |Article ID 4067832 Automated Classification of Lung Cancer Types from Cytological Images Using Deep Convolutional Neural Networks) *ROSEではギムザ染色での評価を求められることが多く判断に難渋している。 TBLB時に同時に擦過ギムザ染色も作成しているため、今回はギムザ標本を用 いた自動解析について評価してみた。 4 【 研究背景 】
  5. 5. ① ギムザ染色標本を用いて、正常細胞と肺癌細胞を分類するために複数のCNN (畳み込みニューラルネットワーク)( VGG16、InceptionV3、ResNetは50層、 DenseNet121、169、201層)のモデル別に分類精度を比較検討した。 ② CNNモデルが良悪性判定をする基準に、核の大きさとクロマチン濃度差が含 まれている可能性について検討してみた。 ③ 別施設での検体について本モデルがどう解析するのか検討してみた。 5 【 研究背景 】
  6. 6. *顕微鏡専用カメラ、対物レンズ40倍を使用し、2752×2208 画素にデジタル化した。 *良性:88症例、悪性:143症例を用いて、1症例につき最大 5枚まで撮影。 *706×706画素のパッチ画像として良性1179枚、悪性529枚 に切り出した。 *良性は180度、悪性は90度単位で画像回転によるdata augmentationを行い、良悪性の枚数を揃えた。 6 【 方法① 】 patch images
  7. 7. * 全231症例のパッチ画像、良性1179枚、悪性529枚を3セットに分割し、 交差検証法により分類精度の評価を行った。 * 自然画像を事前学習させた6種類のCNNを転用し、ファインチュー ニングを行い分類精度を比較検討した。 7 SET1 SET2 SET3 良性 395 395 389 悪性 177 174 178 データセット ↓ 1回目 SET1 SET2 SET3 2回目 SET1 SET2 SET3 3回目 SET1 SET2 SET3 赤を検証用データとした。
  8. 8. 8 DenseNet 121,169,201 ResNet 50 InceptionV3 VGG-16 * 今回検討した複数の深層畳み込みニューラルネットワーク(CNN)
  9. 9. 9 《良性:1179枚》 《悪性:529枚》 ? CNN 良性 悪性
  10. 10. 【学習条件・使用機器】 10 GPU NVIDIA TITAN RTX 入出力画像サイズ 224x224 CPU AMD Ryzen9 3900X バッチサイズ 1 メモリ 64 GB 学習回数 200 OS ubuntu 16.04LTS 最適化アルゴリズム Adam 使用ライブラリ Keras,Tensorflow 学習係数 0.00005 β1,β2 0.9, 0.999
  11. 11. 11 【 結果;良性症例 】 一部のCNNが正解 6種類全CNNモデルで正解 全モデルで正解なし 小型細胞や個細胞性のものを良性と捉える傾向が示唆された。
  12. 12. 12 6種類全CNNモデルで正解 一部のCNNで正解 全モデルで正解なし 腺癌 扁平上皮癌 小細胞癌 【 結果 ;悪性症例】 細胞が密に集簇・重積しているものを悪性と捉える傾向が示唆された。
  13. 13. 13 【 CNNモデル別の精度比較結果】 Sensitivity Specificity Accuracy F-value VGG16 83.7 90.6 88.5 81.8 InceptionV3 90.9 95.2 93.9 90.2 ResNet50 89.9 95.2 93.6 89.6 DenseNet121 91.8 94.8 93.9 90.3 DenseNet169 92.3 96.7 95.3 92.4 DenseNet201 89.6 96.4 94.3 90.7 予測 陰性 陽性 実際 陰性 1140 39 陽性 41 488 DenseNet169 モデル別ではDenseNet 169層構造が他のモデルよりも良好な分類精度だった。
  14. 14. * 本研究では、ギムザ染色された肺の細胞診画像を用いて、正常細胞(良性) と肺癌細胞(悪性)を分類するために、6種類のCNNモデルを用いて検討 した。 * 小型細胞や個細胞性のものを良性と、細胞が密に集簇・重積しているものを 悪性と捉える傾向が示唆された。 * 交差検証により、感度・特異度ともに高く、特に特異度は90%以上の分類 精度が得られた。 * モデル別ではDenseNet、特に169層構造が他のモデルよりも良好な分類精度 であった。 14 【 小括① 】
  15. 15. *ImageJを用いてRGBのカラーパッチ画像をHSB形式に変換し、 輝度成分をとりだした。 *核辺縁をマーキングし、 面積(核の大きさ)と 輝度の平均値(クロマチン濃度) を計測。 *4パターンに分類し、17個づつランダムに評価。 全モデルが正解した悪性 全モデルが正解した良性 一部のモデルが間違えた悪性(良性と判定) 一部のモデルが間違えた良性(悪性と判定) 15 【 方法②:核の評価】
  16. 16. M a l i g n a n t ( c o r r e c t ) B e n i g n ( c o r r e c t ) M a l i g n a n t ( w r o n g , j u d g e d a s b e n i g n ) B e n i g n ( w r o n g , j u d g e d a s m a l i g n a n t ) 0 500 1000 1500 2000 2500 Area M a l i g n a n t ( c o r r e c t ) B e n i g n ( c o r r e c t ) M a l i g n a n t ( w r o n g , j u d g e d a s b e n i g n ) B e n i g n ( w r o n g , j u d g e d a s m a l i g n a n t ) 0 50 100 150 200 250 Mean (HSB) 16 【 結果② 】 (全モデル正解) 悪 性 良 性 悪 性 良 性 (一部のモデルが間違えた) ( 良 性 と 判 定 ) ( 悪 性 と 判 定 ) (全モデル正解) 悪 性 良 性 悪 性 良 性 (一部のモデルが間違えた) ( 良 性 と 判 定 ) ( 悪 性 と 判 定 ) p<0.0001 P=0.0205 P=0.0001 P=0.0186 P=0.0006 P=0.0057 核の大きさ クロマチン濃度差 悪性 良性 悪性症例では核の大きさが、良性症例ではクロマチン濃度差が判定基準? 悪性
  17. 17. * 6種類のCNNモデルが良悪性分類した画像について4パターンに分けて 再評価した。 * 我々が細胞診検鏡時に良悪判定の基準として用いている核腫大やクロマチン 濃度差をCNNも同様に評価していることが推察された。 * 悪性症例では核の大きさが評価の一部に、クロマチン濃度差は良性症例の 判定基準の参考になっている可能性が考慮された。 17 【 小括② 】
  18. 18. 18 【 方法③:別施設検体 】 * 今回は、大学で施行されたTBLB時の気管支擦過検体で作成したギムザ 染色標本を用いて検討したが、別病院でのTBLB時の気管支生検検体で作成 したスタンプ検体でのギムザ染色標本(10症例:陰性87枚、陽性70枚) について、評価が可能か検討してみた。 別病院、検体採取方法は違う。 ギムザ染色も施設が違うと 色味が異なることがある。 撮影顕微鏡やカメラなどの 条件は同じ。
  19. 19. *感度は70%以上でありやや良好な分類精度であった。 *特異度はとても正解率が悪く、全体に悪性と捉えている傾向がうかがえる。 【 結果③ 】 Sensitivity Specificity Inception V3 84.2 51.7 ResNet50 90.0 11.5 DenseNet121 70.0 42.5 DenseNet169 71.4 49.4 DenseNet201 88.6 11.5 19
  20. 20. 腺癌 扁平上皮癌 小細胞癌 腺癌 扁平上皮癌 腺癌 【 結果 ;悪性症例】 5種類全CNNモデルで正解 一部のCNNで正解 全モデルで正解なし 細胞が密に集簇・重積しているものを悪性と捉える傾向が示唆された。 20
  21. 21. 【 結果 ;良性症例】 5種類全CNNモデルで正解 一部のCNNで正解 全モデルで正解なし 繊毛の明瞭な細胞も悪性と判断している。 クロマチン濃度が濃いためか、全体に悪性と捉えている? 21
  22. 22. * 別病院、検体採取方法の異なる肺細胞診ギムザ画像について、5種類の CNNモデルを用いて良悪性の分類を試みた。 * クロマチン濃度が濃いためか、全体に悪性と捉えている傾向がうかがえた。 * モデル別では肺細胞ギムザ標本ではDenseNet 169層構造が良好な分類精度 であったが、別病院の異なる条件下ではInception V3が感度および特異度 ともに良好な分類精度であった。 * 条件が異なるものを評価する場合には追加で見当が必要となる可能性が 示唆された。 22 【 小括③ 】
  23. 23. * ギムザ染色された肺の細胞診画像を用いて、良悪性を分類するために、複数 のCNNモデルを用いて検討した。 DenseNet 169層が良好な分類精度であった。 * 悪性症例では核の大きさが評価の一部に、良性症例ではクロマチン濃度差が CNN判定基準の参考になっている可能性が考慮された。 * 上記5種類のCNNモデルを用いて、別病院で検体採取方法の異なる肺細胞診 ギムザ画像について、良悪性の分類を試みた。 全体に悪性と捉える傾向が うかがえた。モデル別ではInception V3が感度および特異度ともにベストな 結果を示した。 * ギムザ染色でもCNNによる良悪性鑑別が十分に可能だが、染色条件などは 検討が必要かもしれない。将来の迅速細胞診(ROSE)への応用を期待したい。 23 【 まとめ 】

Editor's Notes

  • 学習条件と使用機器について提示します。

×