手把手 Python 資料分析
Terence Huang
自我介紹
學經歷
中山大學 理學博士 (2019/08 ~ )
緯創資通 高級工程師 (2015/03 ~ 2019/04)
長庚醫院 研究助理 (2013/09 ~2014/11)
中山大學 應數系統計碩士 (2011/09 ~ 2013/07)
高雄師大 數學系學士 (2005/09 ~ 2009/07)
獲獎
2017 台南智慧黑客松智慧醫療組第二名
2012 中山高大統計新秀
特殊經歷
訪問 MIT 的工程師 (2017/10 ~ 2018/10)
2019 MOPCON 議程委員
Kaohsiung.py Co-organizer
2
Terence Huang
Slideshare ID: Terence0408
Github ID: Terence0408
Gmail: Terence0408
Outline
3
環境建置
• Pure python 3
• Anaconda 3
jupyter notebook
• Colab
資料整理
• Numpy
• SQL
• Pandas
視覺化、分析
• Sklearn
• Gensim
• matplot
• plotly, …
基本操作
• list / dictionary
• for loop / while
if-else
try-except-finally
• 檔案存取 csv txt
物件存取
• Function
• 爬蟲
環境建置: python 3
• 安裝基本的 python 3
- 缺: 套件都要自行安裝、windows 下常常裝不起來
4
環境建置: Anaconda 3
• 安裝 Anaconda 3
5
環境建置: Colab
• 直接使用 colab 練習
- 優: 打開網頁就可以用,直接存在 google drive 上
- 小缺點:有些套件都要自行安裝
6
Outline
7
環境建置
• Pure python 3
• Anaconda 3
jupyter notebook
• Colab
資料整理
• Numpy
• SQL
• Pandas
視覺化、分析
• Sklearn
• Gensim
• matplot
• plotly, …
基本操作
• list / dictionary
• for loop / while
if-else
try-except-finally
• 檔案存取 csv txt
物件存取
• Function
• 爬蟲
基本操作: list
• https://github.com/Terence0408/Teach_code/blob/master/Basic_operation.ipynb
8
程式
Google: github Terence0408
點選 Teach_code
點選 Basic_operation.ipynb
投影片
Google: Slideshare Terence0408
基本操作: dictionary
• 為什麼存在 Key-Value 的格式
- 以大賣場的資料為例,用 csv 存起來
9
基本操作: dictionary
• 除了用空白、逗號分開的 txt, csv, … 之外
• 還有 Key-Value 的存法
10
firstName lastName
Anna Clayton
Alex Clayton
Excel
套件運用: 爬蟲
• Selenium
11
套件運用: 爬蟲
• Selenium
12
Outline
13
環境建置
• Pure python 3
• Anaconda 3
jupyter notebook
• Colab
資料整理
• Numpy
• SQL
• Pandas
視覺化、分析
• Sklearn
• Gensim
• matplot
• plotly, …
基本操作
• list / dictionary
• for loop / while
if-else
try-except-finally
• 檔案存取 csv txt
物件存取
• Function
• 爬蟲
下次上課前
• 安裝
- PostgreSQL
- pgAdmin
• 帳號: postgres
• 密碼: postgres
• 預習
- SQL 語言簡介 p8 - p18
14
Q&A
Thanks for your attention!
15

# 手把手 Python 資料分析 I