Successfully reported this slideshow.
Your SlideShare is downloading. ×

2020/7/25 台灣人工智慧學校|講題:AI與資料視覺化

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Loading in …3
×

Check these out next

1 of 50 Ad

More Related Content

Slideshows for you (20)

Similar to 2020/7/25 台灣人工智慧學校|講題:AI與資料視覺化 (20)

Advertisement

More from 彭其捷 Jack (20)

Recently uploaded (20)

Advertisement

2020/7/25 台灣人工智慧學校|講題:AI與資料視覺化

  1. 1. 與 資料視覺化 彭其捷 foxfirejack@gmail.com
  2. 2. 相關著作(資料視覺化 / 資料科學 / UIUX) 10 刷 2
  3. 3. About Me 【 】 【 】 3
  4. 4. 4 https://hahow.in/cr/data-tableau
  5. 5. Question 什麼是資料視覺化?
  6. 6. https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6 不同月份的感染數變化?
  7. 7. 良好的資料視 覺化設計,可 以友善的幫助 人們從合適的 角度觀察數據 |單日感染個數 人( 萬人)
  8. 8. Question AI 與資料視覺化 的關係?
  9. 9. 10 AI x 視覺化 = 提升數據特性的掌握能力 AI x 視覺化 = 提升模型優化的溝通品質 AI x 視覺化 = 提升成果展示的效果與理解
  10. 10. 可提升數據特性的 掌握能力 AI x 視覺化 Part 1
  11. 11. 探索式資料分析 EDA Exploratory Data Analysis AI 建模前的建置作業 「認識資料」
  12. 12. 可透過視覺化方式輔助探索資料 避免建模時 資料分配 極端值 null 值 資料類型 離散程度
  13. 13. Question 團隊如何進行數 據探索?
  14. 14. 許多團隊,在執行 EDA 資料探索任務階段時,採 用的是 Excel 軟體 有時候會受限
  15. 15. 環保署全國測站,空汙模型之建模數據 國家級測站資料,單一測站每天每小時的資料 累積超過 500 萬筆資料
  16. 16. 固然很好用,但如果 想透過 進行巨量資料 探索、跨表格資料探索,相 對可能會遇到一些挑戰 數據特性掌握能力的 痛點
  17. 17. Python , R 等程式語言可以輔助 EDA / 視覺化 … 但 ...
  18. 18. 難道每個人都要學習 或是 ,才能更具 備 專案的資料探索與 視覺化能力嗎? 數據特性掌握能力的 痛點
  19. 19. 除了 Excel 外,還有很多不錯的軟體工具可輔助 工具名稱 核心優點 核心缺點 所見即所得的直覺操作介面,優異視覺表現, 使用者數眾多,學習容易。 進階資料科學功能較為陽春,商業 價格偏高。 最多使用者人數的工具,容易與既有工作流程 結合。 對巨量數據支援度較差,如要執行 複雜數據分析步驟也較為繁瑣。 知名大廠所推出,操作介面熟悉且社群完整, 有雲端版本。 不支援 Mac 作業系統。 ★ ★ ★ 合適的軟體,能夠幫助我們進行 且不一定要很高的學習門檻
  20. 20. Tableau 工具 x 資料探索 x 視覺化(跨平台) 圖表模組 (Show Me) 快速切換各類圖表,輔 助進行數據觀察 & 視 覺化 選擇資料欄位 (Columns)
  21. 21. 小結 進行資料探索與視覺化,是建置 AI 的重要前置作業 透過 EDA 觀點&友善工具的輔助, 可有效提升團隊對於數據特性的掌握 度,確保 AI 建模前的資料品質
  22. 22. 可提升模型優化的 溝通品質 AI x 視覺化 Part 2
  23. 23. AI 專案 透過機器學習 預測 PM2.5 空污
  24. 24. 25 APP:環境即時通(搭載空品預測)
  25. 25. 專案:透過機器學習(類神經網路) :預測 PM2.5 數值
  26. 26. 空汙 AI 預測 V1 之實驗結果 (紅線:線性迴歸 baseline)(藍線:預測的空污數值)
  27. 27. AI 的演算法產出,大多是數值類型,較難檢核 & 溝通 ex. 空氣品質:預測 17:00 之後的數值 {"station": "u53e4u4ead", "datetime": "2018-09-20 16:00:00", "pred_1": 39.72, "pred_2": 42.9, "pred_3": 40.14, "pred_4": 39.45, "pred_5": 39.42, "pred_6": 35.49, "pred_7": 36.38, "pred_8": 34.85, "pred_9": 31.99, "pred_10": 30.96, "pred_11": 27.22, "pred_12": 28.12, "pred_13": 25.57, "aqi_12hr_4hr_avg_1": 112.0, "aqi_12hr_4hr_avg_2": 112.0, "aqi_12hr_4hr_avg_3": 103.0, "aqi_12hr_4hr_avg_4": 107.0, "aqi_12hr_4hr_avg_5": 110.0, "aqi_12hr_4hr_avg_6": 110.0, "aqi_12hr_4hr_avg_7": 110.0, "aqi_12hr_4hr_avg_8": 109.0, "aqi_12hr_4hr_avg_9": 105.0, "aqi_12hr_4hr_avg_10": 102.0, "aqi_12hr_4hr_avg_11": 96.0, "aqi_12hr_4hr_avg_12": 93.0, "aqi_12hr_4hr_avg_13": 90.0, "error_bound_t4": 8.54762, "error_bound_t7": 11.756, "error_bound_t8": 12.9405, "error_bound_t12": 16.0833, "error_bound_t6": 10.7738, "error_bound_t9": 13.6905, "error_bound_t5": 9.625, "error_bound_t13": 16.6964, "error_bound_t10": 14.5774, "error_bound_t1": 0.434524, "error_bound_t3": 6.36905, "error_bound_t2": 1.125, "error_bound_t11": 15.3095, "pollute_6": "PM2.5", "pollute_10": "PM2.5", "pollute_12": "PM2.5", "pollute_11": "PM2.5", "pollute_3": "PM2.5", "pollute_4": "PM2.5", "pollute_1": "O3", "pollute_7": "PM2.5", "pollute_9": "PM2.5", "pollute_2": "O3", "pollute_5": "PM2.5", "pollute_8": "PM2.5", "pollute_13": "PM2.5"} " 測站名稱
  28. 28. 許多人對於解讀數據、理解模 型的能力有限,需要將資料轉 換為 較低維度、減少抽象、較 好理解的視覺化結果,來促成 團隊進行溝通 AI 溝通品質 痛點
  29. 29. AI 預測準確度視覺化,引導團隊針對 高PM2.5 預測高誤差處 進行討論 數值-真實值 空品-AI預測值 鄉民 燒稻草 境外空汙 移入 沙塵暴 事件 深夜霧大 誤差較大 的地方 某 測 站 某 測 站
  30. 30. 引入各領域專家的討論後,預測模型誤差 大幅降低 持續清理資料,新增 / 調整了 51 個計算特徵 AI 預測擬合度大幅提升 藍線 真實數值 橘線 預測數值 上線的版本
  31. 31. 來源 https://www.youtube.com/watch?v= B8R148hFxPw
  32. 32. 來源 http://playground.tensorflow.org/
  33. 33. 小結 透過資料視覺化,可以提升團隊對於 AI 模型或是流程的溝通品質,讓更 多人參與給意見,來共同找出模型可 優化之處
  34. 34. 可提升成果展示的 效果與理解 AI x 視覺化 Part 3
  35. 35. 許多 AI 服務,需要被轉譯,讓更多人理解 AI 團隊 普羅大眾 & 決策者們 轉譯
  36. 36. 卡米爾演算法 透過物聯網數據 自動推估空汙熱區
  37. 37. 使用新聞稿、網 站,作為 AI 專 案展示的媒 介? https://airtw.epa.gov.tw/CHT/Encyclopedia/AirSensor/AirSensor_1.aspx
  38. 38. 如果使用普通的新聞稿、文 字、學術發表等方式來呈現 成果,很可能讓多數決策 者、普羅大眾相對無感 關於 AI 成果展示的 痛點
  39. 39. 用 AR 視覺化方式,展示空汙 https://www.youtube.com/ watch?v=9kDRl9B12JM
  40. 40. https://web.cw.com.tw/covid19-taipei-lock down/ 用視覺化的方式,轉譯科學
  41. 41. 許多的 AI 核心原理與展示方式,較難讓一般人理解 https://openai.com/blog/emerg ent-tool-use/ 關於捉迷藏 的研究 抓人者 被抓者
  42. 42. https://ww w.youtube. com/watch ?v=Lu56xV lZ40M&feat ure=emb_l ogo 用視覺 化的方 式展示
  43. 43. 小結 透過資料視覺化的技巧,可以 提升 AI 成果展示的變化性, 也能促成普羅大眾、相關決策 者的理解
  44. 44. 結語
  45. 45. 47 AI x 視覺化 = 提升數據特性的掌握能力(前期) AI x 視覺化 = 提升模型優化的溝通品質(中期) AI x 視覺化 = 提升成果展示的效果與理解(後期)
  46. 46. 48 第六本 著作 進階資料 視覺化技巧 即將出版
  47. 47. 49 資料視覺化 / 商業分析研究社(臉書社團) https://www.facebook.com/groups/tw.dataviz/
  48. 48. THE END

×