網路民意之追尋
Gene Hong/黑貘 @ 2014/05/26
Open Data
Open Government
Open Business
Open Colleges
Open Civic
Focus Civic
Open Civic
Goverment: 如何讓民意讓政府知道
College: 如何讓學術研究知道真正的社會
Business: 如何創造出真正有價值的產品與服務
Civic: 如何討論出真正的想法
真正的問題點
現實的問題
1. 政府自創或製造民意
2. 網路的集體迷思
3. 嗜血的媒體
4. 沒有真實數字的自我猜想
5. 社會疏離感
Group Thinking
集體迷思 (Group Thinking)
樂生效應
資訊的自我屏障
1. 資訊傳遞本身有限
2. 人會不知覺下過濾資訊
開始解決
林克傳說
1. 近朱者赤, 近貘者黑
2.民意透明化
3. 全民政治
林克傳說 (第一期)
1. 讓你定期追隨沒注意到的訊息
2. 分析你與朋友的屬性
3. 讓你找到可以討論的朋友
林克傳說 (第二期)
1. 熱門與最新的連結
2. 話題熱度
3. 議題比較
林克傳說 (服貿期間)
1. 服貿跑馬燈
2. 服貿東西軍
3. 媒體光譜圖
打卡現民意
林克傳說經驗
資料延伸的 Scale 是相當可怕的
資料的多樣性真的很巨大
資料跟實用的落差
中間產品就很有用了
林克傳說數量
Big Data?
資料抓取 10^11
資料儲存 10^9
資料整理 10^7
資料計算 10^5
資料呈現 10^3
林克傳說的取樣
1200~1500萬臉書使用者
100萬使用者取樣
10 億筆訊息/月
1 億筆分享/月
1 萬筆進入分析/月
資料探勘
最近作品
網點: 用 Data Mining 來看 SEO
網智: 用 語意網路 來做跨站導讀
網誌: 用 Google Analytics 來輔助分析網站
訪來客: 用 Facebook API 來看使用者分群
林克傳說: 用社群網站的連結分...
正在進行中
工作建議: 從交友與閱讀資訊探勘
即時約會: 預測會與自己最接近的朋友
景點人潮: 預測某景點可能的遊客數
商品導讀: 從個人文字趨向來做消費建議
接下來的專案
出櫃系統
彼得塔之鏡
系統分析的謬誤
從上到下的系統分析
目標與須求的鍊結
規格書
Big Data 的 Variety 與 Veracity
可行性分析
次級資料
1. 我們有時只能從已抓的資料下手, 而不是最實際的資料
2. 這種指數的計算是簡化其複雜度, 一定會失去一些意義
3. 我們可以視其須要及適用度, 去調整演算法或資料搜集
4. 對於資料的可能性與適用性, 我們還須要一段路來學習
人民的資料
人民之間的互動
給政府企業等資訊的參考
自己與社會的互動 (解決疏離感)
QA
Reach Rate
Link Analysis
Semantic Web
謝謝大家
Q&A
Upcoming SlideShare
Loading in …5
×

網路民意之追尋

428 views
397 views

Published on

Published in: Data & Analytics
0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
428
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
9
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide

網路民意之追尋

  1. 1. 網路民意之追尋 Gene Hong/黑貘 @ 2014/05/26
  2. 2. Open Data Open Government Open Business Open Colleges Open Civic Focus Civic
  3. 3. Open Civic Goverment: 如何讓民意讓政府知道 College: 如何讓學術研究知道真正的社會 Business: 如何創造出真正有價值的產品與服務 Civic: 如何討論出真正的想法 真正的問題點
  4. 4. 現實的問題 1. 政府自創或製造民意 2. 網路的集體迷思 3. 嗜血的媒體 4. 沒有真實數字的自我猜想 5. 社會疏離感 Group Thinking
  5. 5. 集體迷思 (Group Thinking) 樂生效應 資訊的自我屏障 1. 資訊傳遞本身有限 2. 人會不知覺下過濾資訊 開始解決
  6. 6. 林克傳說 1. 近朱者赤, 近貘者黑 2.民意透明化 3. 全民政治
  7. 7. 林克傳說 (第一期) 1. 讓你定期追隨沒注意到的訊息 2. 分析你與朋友的屬性 3. 讓你找到可以討論的朋友
  8. 8. 林克傳說 (第二期) 1. 熱門與最新的連結 2. 話題熱度 3. 議題比較
  9. 9. 林克傳說 (服貿期間) 1. 服貿跑馬燈 2. 服貿東西軍 3. 媒體光譜圖 打卡現民意
  10. 10. 林克傳說經驗 資料延伸的 Scale 是相當可怕的 資料的多樣性真的很巨大 資料跟實用的落差 中間產品就很有用了 林克傳說數量
  11. 11. Big Data? 資料抓取 10^11 資料儲存 10^9 資料整理 10^7 資料計算 10^5 資料呈現 10^3
  12. 12. 林克傳說的取樣 1200~1500萬臉書使用者 100萬使用者取樣 10 億筆訊息/月 1 億筆分享/月 1 萬筆進入分析/月 資料探勘
  13. 13. 最近作品 網點: 用 Data Mining 來看 SEO 網智: 用 語意網路 來做跨站導讀 網誌: 用 Google Analytics 來輔助分析網站 訪來客: 用 Facebook API 來看使用者分群 林克傳說: 用社群網站的連結分享來看訊息傳遞
  14. 14. 正在進行中 工作建議: 從交友與閱讀資訊探勘 即時約會: 預測會與自己最接近的朋友 景點人潮: 預測某景點可能的遊客數 商品導讀: 從個人文字趨向來做消費建議
  15. 15. 接下來的專案 出櫃系統 彼得塔之鏡
  16. 16. 系統分析的謬誤 從上到下的系統分析 目標與須求的鍊結 規格書 Big Data 的 Variety 與 Veracity 可行性分析
  17. 17. 次級資料 1. 我們有時只能從已抓的資料下手, 而不是最實際的資料 2. 這種指數的計算是簡化其複雜度, 一定會失去一些意義 3. 我們可以視其須要及適用度, 去調整演算法或資料搜集 4. 對於資料的可能性與適用性, 我們還須要一段路來學習
  18. 18. 人民的資料 人民之間的互動 給政府企業等資訊的參考 自己與社會的互動 (解決疏離感)
  19. 19. QA Reach Rate Link Analysis Semantic Web
  20. 20. 謝謝大家 Q&A

×