13. 整理資料
Useful info
有用的資訊
Many raw data
很多很多未經整理的資料
MySQL
DB2
RDBMS
Message Queue
Socket / HTTP / SQL
可取得資料的方式皆可
任何一種可以計算的 Process
喜歡用 Hadoop 也可以 (很慢)
20. 所以你需要….
1. Target – 想達到什麼目的
2. Data Source – 要從哪裡收集資料
3. Data Store for raw data – 要把 Raw Data
放在哪裡
4. Algorithm – 如何整理資料
5. Data Processor – 幫你整理資料的工具
6. Data Store for useful data – 存放整理過的
資料
7. Provider – 提供資料的平台