從社群資料來看 工人(群眾)智慧與人工智慧 的結合

1,168 views
1,060 views

Published on

為甚麼要資料科學
系統分析的謬誤
跨領域到超越領域
自動產生候選資料
中間產品

Published in: Internet
0 Comments
11 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,168
On SlideShare
0
From Embeds
0
Number of Embeds
7
Actions
Shares
0
Downloads
29
Comments
0
Likes
11
Embeds 0
No embeds

No notes for slide

從社群資料來看 工人(群眾)智慧與人工智慧 的結合

  1. 1. 從社群資料來看 工人(群眾)智慧與人工智慧 的結合 Gene Hong (食夢黑貘)/2014-08-31
  2. 2. 不一樣的概念 為甚麼要資料科學 系統分析的謬誤 跨領域到超越領域 自動產生候選資料 中間產品
  3. 3. Why Data Science 從資訊退化成資料的原因 資料, 資訊, 知識, 智慧
  4. 4. 電腦是很笨的 推論, 歸納, …... 演算法 大量的原始資料 看出人看不出的事情 但還是須要人的幫忙
  5. 5. God of Data Science
  6. 6. 資訊的價值在於可再利用 天底下無新鮮事 沒有人是一樣的
  7. 7. 甚麼是 Big Data
  8. 8. 為甚麼 Big Data 被認為失敗 Big Data 有很多人都宣稱在做 不了解的人已被既定印像限制住了 宣稱用 Big Data 的服務都沒甚麼效用 用 Big Data 來募資已經募不到錢
  9. 9. 系統分析的謬誤 1. 從上到下的系統分析 2. 目標與須求的鍊結 3. Big Data 的 Variety 與 Veracity 4. 自動化/人工化?
  10. 10. 軟體工程標準流程
  11. 11. 由上到下思維的謬誤 1. 你可以要求社群照你的格式產生資料 2. 你可以要求臉書/Google照你的資料庫設計
  12. 12. 由下到上真的可解決嗎? 1. Big Data 像煮飯 2. 須求與目標的連結, 資料與問題的連結 資料問題是如上, 但重點還是人的問題
  13. 13. 企業組織鍊失去的環節 Business Developer Product Manager System Analyzer Programmer User/Operator
  14. 14. Product Manager 的迷思 一定要有 Profile 一定要有區間 只做內部決策參考用 想要知道原因 資料科學家是最缺的?
  15. 15. 資料科學須要甚麼樣的人
  16. 16. Full-Stack Maker (I) 1. Server, Network, and Hosting Environment. 2. Data Modeling 3. Business Logic 4. API layer / Action Layer / MVC 5. User Interface 6. User Experience 7. Understanding what the customer and the business need
  17. 17. Full-Stack Maker (II) 8. Marketing / Advertising 9. Product and Resource Management 10. Social Network Experience 11. Content / Opinion Provider 12. You have experience all above in these years 13. You are still a User / Programmer / Engineer / Designer AFTER ALL!!!
  18. 18. 考/唸過的系所 理: 數學(, 應數), 化學, 天文, 海洋, 資科, 物理 工: 資工, 電機, 電子 商: 商數 管: 管科, 資管 文: 圖書館, 翻譯, 教育評鑑 法: 社會, 宗教
  19. 19. 資料 3V 之外的 4V 與 5V, Variety Data Source Variety 來源 Data Durability Variety 持久 Data Type Variety 格式 Data Process Variety 處理 Data Usage Variety 使用 Data Customer Variety 客戶
  20. 20. 真的在用 Big Data 嗎? 數量級 時間區間 即時性 應用範圍 實用性 演算法
  21. 21. 真的沒有人在用 Big Data 1. 廣告 2. 社群 3. 行為 4. 內容產生?
  22. 22. 理論與實用
  23. 23. 訪來客 朋友的 cluster 沒辦法拿到所有資料 推銷員演算法 O(n!) 10^12 -> 10^8
  24. 24. 林克傳說 0. 解決集體迷思 (Group Thinking) 1. 近朱者赤, 近貘者黑 2.民意透明化 3. 全民政治
  25. 25. 林克傳說的問題 議題的整理與比較 正負面判斷 相同內容篩選 分類
  26. 26. 人工智慧 計算覆蓋率 算出重要連結 整合議題
  27. 27. 工人(群眾智慧) 定義標籤 集合標籤
  28. 28. 媒體定義
  29. 29. 定義連結的屬性
  30. 30. 定義議題的比較
  31. 31. 媒體支持分布
  32. 32. 工頭堅演算法 1. 語意很難判斷 2. 臉書 API 使用有限 3. 人很少表態 4. 解空間要足夠
  33. 33. 彼得塔之鏡
  34. 34. 計算一個人的傾向
  35. 35. 林克傳說經驗 資料延伸的 Scale 是相當可怕的 資料的多樣性真的很巨大 資料跟實用的落差 中間產品就很有用了
  36. 36. 人工與工人的結合 美好的時光就該浪費在美好事物上 人的價值在於電腦做不到的
  37. 37. 開放林克 最新連結 (更新資料) 熱門連結 議題熱度 意見領袖
  38. 38. 謝謝大家 可以醒過來了

×