Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

2013台灣秋聚 wlm-opendata

498 views

Published on

2013維基秋聚時談維基愛古蹟,處理古蹟列表資料的甘苦談

Published in: Education

2013台灣秋聚 wlm-opendata

  1. 1. 維基愛古蹟與開放資料 一段要資料與處理資料的艱苦旅程 Supaplex @2013 年維基秋聚 2013/10/26
  2. 2. 維基愛古蹟 ● 2010 年荷蘭維基社群發起 ● 2011 年擴大至歐洲各國 ● 2012 年走向全世界 ● 2013 年台灣首次參加
  3. 3. 維基愛古蹟 ● ● 台北社群與維基協會決定響應參與 社群本身成員不足以籌辦,決定對外招募工作人 力 ● 賽前準備事項:贊助、評審、古蹟列表 ● 拍攝範圍:文資法規定的古蹟與歷史建築
  4. 4. 維基愛古蹟 ● 拍攝古蹟,上傳到維基共享資源 ● 依照賽前公佈的古蹟清單拍攝 ● 古蹟清單來自文化古蹟主管機關 ● 2013 年 9 月比賽期間上傳照片即有參賽資格
  5. 5. Open Data ● ● ● 開放資料 開放資料 ( 英語: Open data) 指的是一種經過 挑選與許可的資料,這些資料不受著作權、專利 權,以及其他管理機制所限制,可以開放給社會 公眾,任何人都可以自由出版使用,不論是要拿 來出版或是做其他的運用都不加以限制。 2010 年開始在台灣流傳的名詞
  6. 6. 古蹟 ● 精省前,台閩地區古蹟,依管轄單位,分為一級 古蹟、二級古蹟、三級古蹟 ● 中央管:一級古蹟 ● 省管:二級古蹟 ● 縣市管:三級古蹟
  7. 7. 古蹟 ● 精省後改為二級制 ● 地方政府以及中央政府管 – 國定古蹟 – 縣市古蹟、直轄市古蹟
  8. 8. 歷史建築 ● 經縣市政府公告 ● 與古蹟的差異: – 保護程度較低 – 限制較少
  9. 9. 資料要求格式-古蹟結構化清單 ● unique id - 能識別古蹟的 unique id ( 必須 ) ● 名稱 – 古蹟的名稱(高度建議) ● 描述 - 古蹟的描述 ( 選擇 ) ● 種類 - 古蹟種類 ( 選擇 ) ● 地址 - 古蹟的地址 ( 建議 ) ● 行政區 - 古蹟所在的行政區 ( 建議 ) ● 經緯度 - 經緯度 ( 強烈建議 ) ● 圖片 - 古蹟的圖片 ( 必須 )
  10. 10. 要資料的過程 ● 去電文化資產局表明需要古蹟、歷史建築清單 ● 承辦人表示上網站查詢即可 – 文化資產查詢 – http://www.boch.gov.tw/boch/frontsite/cultureassets/Cult ureAssetsAction.do? method=doEnterTotal&menuId=310&siteId=101
  11. 11. 要資料的困難(溝通) ● 承辦人不懂需要的格式 ● 網頁介面查詢得不到要的資料 – Caseid – 經緯度 ● 要上班,沒那麼多時間與公家機關打交道 ● 決定以遊擊隊的方式進行,嘗試爬資料
  12. 12. 查詢介面
  13. 13. 查詢介面 ● 古蹟 caseid ● 古蹟經緯度
  14. 14. 查詢介面 ● 古蹟詳細介面頁面有經緯度 ● 輸出的 pdf 只有文化認定的重要資料 – – 無 caseid – ● 並無經緯度 而且難以後續處理 但 caseid 在網址裡
  15. 15. Scraping -轉機 ● 去參加 Code for Tomorrow 的 Data Week #1 ● 偶然在一個場合遇到會 scraping 的人 ● 請求他幫忙抓資料 ● 抓取藏在古蹟介紹頁面的經緯度以及 caseid
  16. 16. Scraping ● 需要後製 ● 人工比對
  17. 17. Csv file Table
  18. 18. 要資料 ● 主管單位:文化部文化資產局 ● 位處舊台中酒廠,現在為台中文化創意產業園區 ● 精省後的機關 ● 電話: (04)2229-5848
  19. 19. Csv 轉 wiki table
  20. 20. Open Data 與古蹟資料 ● 如果文化部有公佈結構化的資料 ● 就不會耗那麼多時間 ● 珍貴的人力可好好運用 ● 能夠做各式各樣的應用
  21. 21. Open Data 資料集 ● 文化部即將公佈古蹟、歷史建築資料
  22. 22. 結論 ● 光搞定資料格式,清理、整理資料就耗去大半精力 ● 感覺文化部比較著重藝文活動而不是古蹟保謢推廣 ● 辦活動需要各式各樣不同技能的人 ● 短期內維基社群很難有資源辦組織化的大型活動 ● 以社群方式運作的活動也許有機會 ● 期待 Open Data 能讓中文維基百科的資料更豐富,能 釋出與維基百科相容授權的資料集
  23. 23. 未來展望 ● ● ● 原台灣金屬礦業公司選粗銅礦的煉製場,現稱十三層 Categories: Cultural heritage monuments in Taiwan , Ruins in Taiwan 維基人接手整理比賽徵集照片分類
  24. 24. 展望 ● ● 陸陸續續有照片用到維基條目 上 有些是古蹟有條目,沒條目的 古蹟照片就加到縣市列表上
  25. 25. 預告 ● ● 11/8~9 2013 開放資料工作坊 暨 2013 台灣開放街圖研討會 聯合會 第二天 11/9( 六 ) 有兩場議程 – – 13:30~14:00 回顧 本地社群活動發展,論 Mapping Party 一年以來的 – ● http://sotm.tw/ 16:30~17:00 ( 與小 B)OSM 進階運用 突飛猛進的台灣公車路線 11/10( 日 ) 14:00 @ 考試院 Mapping Party
  26. 26. 謝謝大家

×