維基愛古蹟與開放資料

一段要資料與處理資料的艱苦旅程
Supaplex @2013 年維基秋聚
2013/10/26
維基愛古蹟
●

2010 年荷蘭維基社群發起

●

2011 年擴大至歐洲各國

●

2012 年走向全世界

●

2013 年台灣首次參加
維基愛古蹟
●

●

台北社群與維基協會決定響應參與
社群本身成員不足以籌辦,決定對外招募工作人
力

●

賽前準備事項:贊助、評審、古蹟列表

●

拍攝範圍:文資法規定的古蹟與歷史建築
維基愛古蹟
●

拍攝古蹟,上傳到維基共享資源

●

依照賽前公佈的古蹟清單拍攝

●

古蹟清單來自文化古蹟主管機關

●

2013 年 9 月比賽期間上傳照片即有參賽資格
Open Data
●

●

●

開放資料
開放資料 ( 英語: Open data) 指的是一種經過
挑選與許可的資料,這些資料不受著作權、專利
權,以及其他管理機制所限制,可以開放給社會
公眾,任何人都可以自由出版使用,不論是要拿
來出...
古蹟
●

精省前,台閩地區古蹟,依管轄單位,分為一級
古蹟、二級古蹟、三級古蹟

●

中央管:一級古蹟

●

省管:二級古蹟

●

縣市管:三級古蹟
古蹟
●

精省後改為二級制

●

地方政府以及中央政府管
–

國定古蹟

–

縣市古蹟、直轄市古蹟
歷史建築
●

經縣市政府公告

●

與古蹟的差異:
–

保護程度較低

–

限制較少
資料要求格式-古蹟結構化清單
●

unique id - 能識別古蹟的 unique id ( 必須 )

●

名稱 – 古蹟的名稱(高度建議)

●

描述 - 古蹟的描述 ( 選擇 )

●

種類 - 古蹟種類 ( 選擇 )

●

...
要資料的過程
●

去電文化資產局表明需要古蹟、歷史建築清單

●

承辦人表示上網站查詢即可
–

文化資產查詢

–

http://www.boch.gov.tw/boch/frontsite/cultureassets/Cult
ure...
要資料的困難(溝通)
●

承辦人不懂需要的格式

●

網頁介面查詢得不到要的資料
–

Caseid

–

經緯度

●

要上班,沒那麼多時間與公家機關打交道

●

決定以遊擊隊的方式進行,嘗試爬資料
查詢介面
查詢介面
●

古蹟 caseid

●

古蹟經緯度
查詢介面
●

古蹟詳細介面頁面有經緯度

●

輸出的 pdf 只有文化認定的重要資料
–
–

無 caseid

–
●

並無經緯度
而且難以後續處理

但 caseid 在網址裡
Scraping -轉機
●

去參加 Code for Tomorrow 的 Data Week #1

●

偶然在一個場合遇到會 scraping 的人

●

請求他幫忙抓資料

●

抓取藏在古蹟介紹頁面的經緯度以及 caseid
Scraping
●

需要後製

●

人工比對
Csv file Table
要資料
●

主管單位:文化部文化資產局

●

位處舊台中酒廠,現在為台中文化創意產業園區

●

精省後的機關

●

電話: (04)2229-5848
Csv 轉 wiki table
Open Data 與古蹟資料
●

如果文化部有公佈結構化的資料

●

就不會耗那麼多時間

●

珍貴的人力可好好運用

●

能夠做各式各樣的應用
Open Data 資料集
●

文化部即將公佈古蹟、歷史建築資料
結論
●

光搞定資料格式,清理、整理資料就耗去大半精力

●

感覺文化部比較著重藝文活動而不是古蹟保謢推廣

●

辦活動需要各式各樣不同技能的人

●

短期內維基社群很難有資源辦組織化的大型活動

●

以社群方式運作的活動也許有機會
...
未來展望

●

●

●

原台灣金屬礦業公司選粗銅礦的煉製場,現稱十三層
Categories: Cultural heritage monuments in Taiwan , Ruins in
Taiwan
維基人接手整理比賽徵集照片分類
展望
●

●

陸陸續續有照片用到維基條目
上
有些是古蹟有條目,沒條目的
古蹟照片就加到縣市列表上
預告
●

●

11/8~9 2013 開放資料工作坊 暨 2013 台灣開放街圖研討會
聯合會
第二天 11/9( 六 ) 有兩場議程
–
–

13:30~14:00
回顧

本地社群活動發展,論 Mapping Party 一年以來的
...
謝謝大家
2013台灣秋聚 wlm-opendata
2013台灣秋聚 wlm-opendata
2013台灣秋聚 wlm-opendata
2013台灣秋聚 wlm-opendata
2013台灣秋聚 wlm-opendata
2013台灣秋聚 wlm-opendata
2013台灣秋聚 wlm-opendata
2013台灣秋聚 wlm-opendata
2013台灣秋聚 wlm-opendata
2013台灣秋聚 wlm-opendata
2013台灣秋聚 wlm-opendata
2013台灣秋聚 wlm-opendata
2013台灣秋聚 wlm-opendata
Upcoming SlideShare
Loading in …5
×

2013台灣秋聚 wlm-opendata

430 views
385 views

Published on

2013維基秋聚時談維基愛古蹟,處理古蹟列表資料的甘苦談

Published in: Education
3 Comments
1 Like
Statistics
Notes
No Downloads
Views
Total views
430
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
1
Comments
3
Likes
1
Embeds 0
No embeds

No notes for slide

2013台灣秋聚 wlm-opendata

  1. 1. 維基愛古蹟與開放資料 一段要資料與處理資料的艱苦旅程 Supaplex @2013 年維基秋聚 2013/10/26
  2. 2. 維基愛古蹟 ● 2010 年荷蘭維基社群發起 ● 2011 年擴大至歐洲各國 ● 2012 年走向全世界 ● 2013 年台灣首次參加
  3. 3. 維基愛古蹟 ● ● 台北社群與維基協會決定響應參與 社群本身成員不足以籌辦,決定對外招募工作人 力 ● 賽前準備事項:贊助、評審、古蹟列表 ● 拍攝範圍:文資法規定的古蹟與歷史建築
  4. 4. 維基愛古蹟 ● 拍攝古蹟,上傳到維基共享資源 ● 依照賽前公佈的古蹟清單拍攝 ● 古蹟清單來自文化古蹟主管機關 ● 2013 年 9 月比賽期間上傳照片即有參賽資格
  5. 5. Open Data ● ● ● 開放資料 開放資料 ( 英語: Open data) 指的是一種經過 挑選與許可的資料,這些資料不受著作權、專利 權,以及其他管理機制所限制,可以開放給社會 公眾,任何人都可以自由出版使用,不論是要拿 來出版或是做其他的運用都不加以限制。 2010 年開始在台灣流傳的名詞
  6. 6. 古蹟 ● 精省前,台閩地區古蹟,依管轄單位,分為一級 古蹟、二級古蹟、三級古蹟 ● 中央管:一級古蹟 ● 省管:二級古蹟 ● 縣市管:三級古蹟
  7. 7. 古蹟 ● 精省後改為二級制 ● 地方政府以及中央政府管 – 國定古蹟 – 縣市古蹟、直轄市古蹟
  8. 8. 歷史建築 ● 經縣市政府公告 ● 與古蹟的差異: – 保護程度較低 – 限制較少
  9. 9. 資料要求格式-古蹟結構化清單 ● unique id - 能識別古蹟的 unique id ( 必須 ) ● 名稱 – 古蹟的名稱(高度建議) ● 描述 - 古蹟的描述 ( 選擇 ) ● 種類 - 古蹟種類 ( 選擇 ) ● 地址 - 古蹟的地址 ( 建議 ) ● 行政區 - 古蹟所在的行政區 ( 建議 ) ● 經緯度 - 經緯度 ( 強烈建議 ) ● 圖片 - 古蹟的圖片 ( 必須 )
  10. 10. 要資料的過程 ● 去電文化資產局表明需要古蹟、歷史建築清單 ● 承辦人表示上網站查詢即可 – 文化資產查詢 – http://www.boch.gov.tw/boch/frontsite/cultureassets/Cult ureAssetsAction.do? method=doEnterTotal&menuId=310&siteId=101
  11. 11. 要資料的困難(溝通) ● 承辦人不懂需要的格式 ● 網頁介面查詢得不到要的資料 – Caseid – 經緯度 ● 要上班,沒那麼多時間與公家機關打交道 ● 決定以遊擊隊的方式進行,嘗試爬資料
  12. 12. 查詢介面
  13. 13. 查詢介面 ● 古蹟 caseid ● 古蹟經緯度
  14. 14. 查詢介面 ● 古蹟詳細介面頁面有經緯度 ● 輸出的 pdf 只有文化認定的重要資料 – – 無 caseid – ● 並無經緯度 而且難以後續處理 但 caseid 在網址裡
  15. 15. Scraping -轉機 ● 去參加 Code for Tomorrow 的 Data Week #1 ● 偶然在一個場合遇到會 scraping 的人 ● 請求他幫忙抓資料 ● 抓取藏在古蹟介紹頁面的經緯度以及 caseid
  16. 16. Scraping ● 需要後製 ● 人工比對
  17. 17. Csv file Table
  18. 18. 要資料 ● 主管單位:文化部文化資產局 ● 位處舊台中酒廠,現在為台中文化創意產業園區 ● 精省後的機關 ● 電話: (04)2229-5848
  19. 19. Csv 轉 wiki table
  20. 20. Open Data 與古蹟資料 ● 如果文化部有公佈結構化的資料 ● 就不會耗那麼多時間 ● 珍貴的人力可好好運用 ● 能夠做各式各樣的應用
  21. 21. Open Data 資料集 ● 文化部即將公佈古蹟、歷史建築資料
  22. 22. 結論 ● 光搞定資料格式,清理、整理資料就耗去大半精力 ● 感覺文化部比較著重藝文活動而不是古蹟保謢推廣 ● 辦活動需要各式各樣不同技能的人 ● 短期內維基社群很難有資源辦組織化的大型活動 ● 以社群方式運作的活動也許有機會 ● 期待 Open Data 能讓中文維基百科的資料更豐富,能 釋出與維基百科相容授權的資料集
  23. 23. 未來展望 ● ● ● 原台灣金屬礦業公司選粗銅礦的煉製場,現稱十三層 Categories: Cultural heritage monuments in Taiwan , Ruins in Taiwan 維基人接手整理比賽徵集照片分類
  24. 24. 展望 ● ● 陸陸續續有照片用到維基條目 上 有些是古蹟有條目,沒條目的 古蹟照片就加到縣市列表上
  25. 25. 預告 ● ● 11/8~9 2013 開放資料工作坊 暨 2013 台灣開放街圖研討會 聯合會 第二天 11/9( 六 ) 有兩場議程 – – 13:30~14:00 回顧 本地社群活動發展,論 Mapping Party 一年以來的 – ● http://sotm.tw/ 16:30~17:00 ( 與小 B)OSM 進階運用 突飛猛進的台灣公車路線 11/10( 日 ) 14:00 @ 考試院 Mapping Party
  26. 26. 謝謝大家

×