SlideShare a Scribd company logo
1 of 38
Download to read offline
從開源資料集看人工智慧醫療應用
余方國 博士
05/06/2021
2
演講大綱
Part 1: 人工智慧醫療應用概述 : 資料型態 / 應用類型 / 評估標準
為什麼『人工智慧醫療應用開源資料集』值得所有人工智慧相關人員關注 ?
Part 2: 人工智慧醫療應用開源資料集案例 : 圖像 / 音頻 / 文本 / 圖網
跨界『智慧製造』和『智慧金融』的相關案例及類似場景 !
3
人工智慧醫療應用資料集案例
中文名稱 資料型態 任務簡述
1 心臟病資料集 數字表格資料 分類
2 中風資料集 數字文字表格資料 分類/異常檢測
3 醫療保險詐欺資料集 數字文字表格資料 分類/異常檢測
4 醫療費用預測資料集 數字文字表格資料 回歸
5 藥品使用反饋資料集 數字文字表格資料/自然語言 自然語言處理
6 新冠肺炎全球趨勢資料集 數字文字表格資料/時間序列 時間序列分析預測
7 胸部 X 光肺炎資料集 圖像資料 圖像分類
8 新冠肺炎電腦斷層掃描資料集 圖像資料 圖像分割
9 心音檢測資料集 音頻資料 音頻分割/音頻分類
10 藥物交互作用資料集 文字表格資料/圖網資料 連接預測
4
人工智慧醫療應用 — 資料型態
視頻資料
音頻資料
圖像資料
圖網資料
時序資料
文本資料
表格資料
5
人工智慧醫療應用 — 應用類型
醫療診斷
營運管理 生醫研究
心臟病資料集
中風資料集
胸部 X 光肺炎資料集
新冠肺炎電腦斷層掃描資料集
心音檢測資料集
醫療保險詐欺資料集
醫療費用預測資料集
掛號爽約資料集
新冠肺炎全球趨勢資料集
藥品使用反饋資料集
藥物交互作用資料集
6
人工智慧醫療應用 — 評估標準
https://www.mathworks.com/discovery/interpretability.html
Performance
- Accuracy
- Precision
- Recall
- F1 Score
- MSE
- mAP
- ...
Explainability
- Verification of the system
- Improvement of the system
- Learn from the system
- Compliance to legislation
7
醫療應用開源資料集對不同領域人員的啟示
●
醫療專業人員及應用開發人員
調研人工智慧醫療應用案例 : 應用場景 , 資料內容 , 標記方式 , 評估標準 ,
檢測模型 , 最佳實踐 ;
●
非醫療專業人員及應用開發人員
了解人工智慧 / 機器學習 / 深度學習 / 資料科學的應用場景及技術發展 ,
孰悉資料模型開源生態 , 系統化蒐集整理專業案例 ;
8
演講大綱
Part 1: 人工智慧醫療應用概述 : 資料型態 / 應用類型 / 評估標準
為什麼『人工智慧醫療應用開源資料集』值得所有人工智慧相關人員關注 ?
Part 2: 人工智慧醫療應用開源資料集案例 : 圖像 / 音頻 / 文本 / 圖網
跨界『智慧製造』和『智慧金融』的相關案例及類似場景 !
9
圖像辨識 — 圖像分類 / 目標檢測 / 圖像分割
https://ataspinar.com/2017/12/04/using-convolutional-neural-networks-to-detect-features-in-sattelite-images/
10
圖像分類 (image classification)
軟性電子顯示器瑕疵檢測
https://aidea-web.tw/topic/a49e3f76-69c9-4a4a-bcfc-c882840b3f27
肌肉骨骼 X 光
https://stanfordmlgroup.github.io/competitions/mura/
11
目標檢測 (object detection)
(1) open, (2) short, (3) mouse bite, (4) spur, (5) copper, (6) pin hole
https://github.com/tangsanli5201/DeepPCB
印刷電路板
瑕疵檢測
胸部 X 光
(1) Aortic enlargement, (2) Atelectasis, (3) Cardiomegaly, (4) Calcification,
(5) Clavicle fracture, (6) Consolidation, (7) Edema, (8) Emphysema, (9)
Enlarged PA, (10) Interstitial lung disease (ILD), (11) Infiltration, (12) Lung
cavity, (13) Lung cyst, (14) Lung opacity, (15) Mediastinal shift, (16)
Nodule/Mass, (17) Pulmonary fibrosis, (18) Pneumothorax, (19) Pleural
thickening, (20) Pleural effusion, (21) Rib fracture, (22) Other lesion, (23)
Lung tumor, (24) Pneumonia, (25) Tuberculosis, (26) Other diseases, (27)
Chronic obstructive pulmonary disease (COPD), (28) No finding
https://www.kaggle.com/c/vinbigdata-chest-xray-abnormalities-detection
12
圖像分割 (image segmentation)
新冠肺炎電腦斷層掃描
磁鐵瓦片瑕疵檢測
https://www.kaggle.com/andrewmvd/covid19-ct-scans
https://github.com/abin24/Magnetic-tile-defect-datasets
13
圖像辨識 — 圖像分類 / 目標檢測 / 圖像分割
Image Classification
Image Segmentation
Object Detection
14
兒科骨齡檢測 (RSNA Pediatric Bone Age Challenge 2017)
https://www.kaggle.com/kmader/rsna-bone-age
https://www.16bit.ai/blog/ml-and-future-of-radiology
two inputs regression output
15
根據房屋圖像及房型地點估計房價
●
Number of Bedrooms: 4
●
Number of bathrooms: 4
●
Area: 4053
●
Zipcode: 85255
●
Price: 869,500
https://github.com/emanhamed/Houses-dataset
16
醫療音頻資料集
https://www.kaggle.com/kinguistics/heartbeat-sounds
https://www.kaggle.com/vbookshelf/respiratory-sound-database
https://zenodo.org/record/4498364#.YIgpf5AzZPY
17
心音波形圖及頻譜圖
https://www.mdpi.com/1424-8220/19/21/4819
18
信號處理及神經網路
https://www.researchgate.net/publication/
335862311_Evaluation_of_Classical_Machine_Learning_Techniques_towards_Urban_Sound_Recognition_on_Embedded_Systems
https://research.sinica.edu.tw/deep-learning-2017-ai-month/
19
製造設備音頻異常資料集
https://zenodo.org/record/3384388#.YIu-0JAzZPY
20
資料擴增 (data augmentation)
https://github.com/AgaMiko/data-augmentation-review
21
藥品使用反饋資料集
參考鏈接 https://www.kaggle.com/jessicali9530/kuc-hackathon-winter-2018
問題說明 根據病症/藥名/反饋/評分/日期等資料進行藥品使用分析
資料內容 訓練及測試兩份資料文件, 訓練文件包括 161272 筆資料 7 個欄位
解題概要 自然語言處理 (natural language processing), 資料挖掘 (data mining)
相關軟體 NLTK, Gensim, Scikit-Learn, Keras, Tensorflow, PyTorch
22
前十大醫療情況統計分析
https://github.com/SumitM0432/Drug-Review-Sentiment-Analysis-and-EDA
23
醫療狀況及相應藥品數量統計
https://www.kaggle.com/lauriandwu/nlp-drug-review
24
藥評好及藥評差的醫療情況
https://www.kaggle.com/lauriandwu/nlp-drug-review
25
前十大高評價藥品統計分析
https://github.com/SumitM0432/Drug-Review-Sentiment-Analysis-and-EDA
26
一個 Anxiety 患者對 Buspirone 的使用反饋
[ 英文原文 ] Have tried Paxil and Lexapro which sent me into hyper-panic and GAD. I was about to
give up on medicines and accept my miserable anxiety as a fact of life when my Doctor
recommended Buspirone. I noticed my anxiety began to taper the second day I took the
medication. No real side effects to speak of through my first week. The one thing it has delivered
for me, HOPE!
[ DeepL 翻譯 ] 我試過 Paxil 和 Lexapro ,它們使我陷入過度恐慌和 GAD 。當我的醫生向我推荐布斯比隆
時,我正准備放棄藥物,接受我悲慘的焦慮作為生活的一個事實。我注意到在我服藥的第二天,我的焦慮就
開始減少了。在我服用的第一個星期,沒有真正的副作用可言。它為我帶來了一件事,就是希望!
[ Google 翻譯 ] 當我嘗試使用 Paxil 和 Lexapro 時,我就陷入了恐慌症和 GAD 。當我的醫生推薦
Buspirone 時,我就放棄了藥物治療,並接受了我生活中的悲慘焦慮。我注意到我的焦慮在第二天開始逐漸
減輕我服用了這種藥物。在我的第一周,沒有真正的副作用可言。它為我帶來了一個希望,那就是希望!
27
一個 Pain 患者對 Toradol 的使用反饋
[ 英文原文 ] I am 30 years old. I had a multiple composite spinal injuries 15 years ago. The aches
and pains unbearable. I started taking anti-inflammatories about 2 years ago. I started getting
injections every month of Toradol and "Depo" something. I am almost off all pain
meds I mean I still have bad days but I can function again.
[ DeepL 翻譯 ] 我今年 30 歲了。 15 年前,我有一個多發性復合脊柱損傷。疼痛難忍。大約 2 年前我開
始服用消炎藥。我開始每個月注射 Toradol 和 "Depo" 什么。我几乎停止了所有的止痛藥,
我的意思是我仍然有不好的日子,但我可以再次發揮作用。
[ Google 翻譯 ] 我今年 30 歲。 15 年前我遭受了多發性脊柱複合損傷。酸痛難以忍受。大約 2 年前我開
始服用抗炎藥。我每個月都開始注射 Toradol 和 ” Depo” 之類的東西。我幾乎不吃任何止痛藥,我的
意思是我現在日子仍然不好,但我可以恢復工作。
28
客戶反饋資料集 — 銀行 / 手機 / 服飾
●
客戶滿意度忠誠度調研
●
產品服務渠道改善創新
●
市場調研競爭產品分析
https://www.kaggle.com/darpan25bajaj/bank-reviewcomplaint-analysis
https://www.kaggle.com/masaladata/14-million-cell-phone-reviews
https://www.kaggle.com/nicapotato/womens-ecommerce-clothing-reviews/code
29
花蓮慈濟醫院藥劑部團隊 (2017)
●
藥物與藥物交互作用
●
西藥與中藥交互作用
●
藥物與食物交互作用
●
藥物與香菸交互作用
●
藥物與酒精交互作用
https://www.eslite.com/product/1001125232587979
30
藥物交互作用資料集
參考鏈接 http://snap.stanford.edu/biodata/datasets/10001/10001-ChCh-Miner.html
問題說明
根據美國食品藥品監督管理局批准藥物的交互作用關係網路進行用藥分析及預測, 如哪種藥
物最有可能和其他藥物共用時產生不良作用、是否能夠預測已知及未知的藥物交互作用
資料內容 1514 藥物, 48514 藥物交互作用
解題概要 網路分析 (network analysis), 連接預測 (link prediction)
相關軟體 Networkx, Node2Vec, nodevectors, Spektral, PyTorch Geometric, Keras, PyTorch
31
圖網路的節點及連接 Graph = Node + Link
https://www.javatpoint.com/graph-representation
32
圖網路的連接預測 Link Prediction in Graph
?
?
?
33
圖網路的連接預測 Link Prediction in Graph
?
Drug 1 Drug 2 Label
已知 A B 1
已知 A D 1
已知 B C 1
已知 B D 1
已知 C E 1
已知 D E 1
未知 C D 0/1? 0.4?
34
Stanford Network Analysis Project / DrugBank
資料數量 :
1514 藥物 , 48514 藥物交互作用
交互作用 :
1514 x 1513 = 2290682 兩兩組合
48514 / 2290682 = 2.1% 有交互作用
35
Stanford Network Analysis Project / DrugBank
資料數量 :
1514 藥物 , 48514 藥物交互作用
交互作用 :
1514 x 1513 = 2290682 兩兩組合
48514 / 2290682 = 2.1% 有交互作用
根據國內健保資料庫的統計分析,發現
一年開出的處方箋中,可能發生藥物交
互作用的比例高達 15.99% (2017)
36
智慧醫療 / 智慧製造 / 智慧金融
視頻資料
音頻資料
圖像資料
圖網資料
時序資料
文本資料
表格資料
37
人工智慧醫療應用資料集選輯
Medium 博客
從開源資料集看人工智慧醫療應用
Q&A

More Related Content

More from Frank Fang Kuo Yu

Orange Data Mining 軟體系統簡介及生醫應用支援
Orange Data Mining 軟體系統簡介及生醫應用支援Orange Data Mining 軟體系統簡介及生醫應用支援
Orange Data Mining 軟體系統簡介及生醫應用支援Frank Fang Kuo Yu
 
Deep Learning and Object Detection
Deep Learning and Object DetectionDeep Learning and Object Detection
Deep Learning and Object DetectionFrank Fang Kuo Yu
 
Data Science and Machine Learning in Smart manufacturing
Data Science and Machine Learning in Smart manufacturingData Science and Machine Learning in Smart manufacturing
Data Science and Machine Learning in Smart manufacturingFrank Fang Kuo Yu
 
Deep Learning and Image Recognition
Deep Learning and Image RecognitionDeep Learning and Image Recognition
Deep Learning and Image RecognitionFrank Fang Kuo Yu
 
Leap Motion Controller and Application Development
Leap Motion Controller and Application DevelopmentLeap Motion Controller and Application Development
Leap Motion Controller and Application DevelopmentFrank Fang Kuo Yu
 
Startup Ecosystem in Shanghai
Startup Ecosystem in ShanghaiStartup Ecosystem in Shanghai
Startup Ecosystem in ShanghaiFrank Fang Kuo Yu
 
Case Method at Harvard Business School
Case Method at Harvard Business SchoolCase Method at Harvard Business School
Case Method at Harvard Business SchoolFrank Fang Kuo Yu
 
如何做報告 (How to make a presentation?)
如何做報告 (How to make a presentation?)如何做報告 (How to make a presentation?)
如何做報告 (How to make a presentation?)Frank Fang Kuo Yu
 

More from Frank Fang Kuo Yu (13)

Orange Data Mining 軟體系統簡介及生醫應用支援
Orange Data Mining 軟體系統簡介及生醫應用支援Orange Data Mining 軟體系統簡介及生醫應用支援
Orange Data Mining 軟體系統簡介及生醫應用支援
 
Deep Learning and Object Detection
Deep Learning and Object DetectionDeep Learning and Object Detection
Deep Learning and Object Detection
 
Data Science and Machine Learning in Smart manufacturing
Data Science and Machine Learning in Smart manufacturingData Science and Machine Learning in Smart manufacturing
Data Science and Machine Learning in Smart manufacturing
 
Automated Machine Learning
Automated Machine LearningAutomated Machine Learning
Automated Machine Learning
 
Deep Learning and Image Recognition
Deep Learning and Image RecognitionDeep Learning and Image Recognition
Deep Learning and Image Recognition
 
Leap Motion Controller and Application Development
Leap Motion Controller and Application DevelopmentLeap Motion Controller and Application Development
Leap Motion Controller and Application Development
 
創客/創業/創新
創客/創業/創新創客/創業/創新
創客/創業/創新
 
Startup Ecosystem in Shanghai
Startup Ecosystem in ShanghaiStartup Ecosystem in Shanghai
Startup Ecosystem in Shanghai
 
Case Method at Harvard Business School
Case Method at Harvard Business SchoolCase Method at Harvard Business School
Case Method at Harvard Business School
 
如何做報告 (How to make a presentation?)
如何做報告 (How to make a presentation?)如何做報告 (How to make a presentation?)
如何做報告 (How to make a presentation?)
 
Introduction to GPRS
Introduction to GPRSIntroduction to GPRS
Introduction to GPRS
 
Introduction to PPP
Introduction to PPPIntroduction to PPP
Introduction to PPP
 
Introduction to TCP/IP
Introduction to TCP/IPIntroduction to TCP/IP
Introduction to TCP/IP
 

從開源資料集看人工智慧醫療應用