草根性的地名辭典 : 由地理標籤形構地方的 概念及空間 範圍 鄧東波 deng@itc.nl; dongpo@iis.sinica.edu.tw   中央研究 院資訊科學研究所研究助理 荷蘭屯 特大學地理資訊科學與地球觀測學院博士 候選人
Web 2.0  時代的資料生產 <ul><li>新興網路技術 </li></ul><ul><ul><li>使用者端 / 瀏覽器介面 ( client-side/web browser  ) 技術更新 </li></ul></ul><ul><u...
草根性地理資訊 <ul><li>而網路技術的革新,亦使得地理資料的生產變得更為容易 </li></ul><ul><ul><li>線上地圖應用程式 </li></ul></ul><ul><ul><li>嵌入式全球定位系統元件 </li></ul>...
草根性地理資訊 的 來源與 類別 地理語義清晰 地理語義模糊 草根性 地理資訊 專業地理資訊
邁向下一代的空間資訊基礎設施  (SDI) 第一代 第二代 第三代 2000 2010 1990 生產者趨使 Producer-driven 資料趨使 Data-driven 處理趨使 Process-driven 使用者參與
數值地名辭典 ( D igita Gazetteer ) <ul><li>數值地名辭典不 僅 是一個地名的地理空間檢索辭典,亦被視為是一種地理資訊系統 ( GIS) ,並包含幾個核心項目 : </li></ul><ul><li>(1) 名稱 (...
線上照片分享平台  —  Flickr
在   Flickr 中的照片、標籤、地理標籤 標籤 地理標籤
照片 、 標籤、地理標籤 Tags Tags Tags Tags
研究課題與目標 <ul><li>研究題課 </li></ul><ul><ul><li>如何建立一套方法以擷取網路中由普羅大眾所生產的地理資訊? </li></ul></ul><ul><ul><li>如何處理網路中非正規的 (informal) ...
研究流程 透過 Flickr API 取得資料 具有標籤和地理標籤的照片 空間資料庫 空間聚類分析 標籤共現分析 觀念階層 Tags Tags Tags Tags
DBSCAN  密度為主的空間群聚分析 <ul><li>假設空間中的一個點 p ,在以點 p 圓心並設定一個半徑 ( EPS ) ,其所構成的鄰近範圍   (Neighborhood) 中所包含的點,其數量大於預設的最低數目的點 ( MinPt...
DBSCAN 的演算方式 <ul><li>密度可及 ( Density-reachable) </li></ul><ul><ul><li>在給定的 EPS 和 MinPts 下,一連串的點 p 1 , .. , p n ,若 p 1 = q 且...
標籤共現分析 <ul><li>觀念階層 (Concept hierarchy) 是一個簡單且基本的知識表達方式 </li></ul><ul><ul><li>樹狀結構的編排方式 , </li></ul></ul><ul><ul><li>每一節點是...
標籤共 現分析 的案例 <ul><li>10 張照片包含 8 個標籤,共被使用 36 次 </li></ul><ul><li>“ 台灣”和“台北”在 P 1 、 P 3 、 P 7 、和 P 10 等照片中共現 (Co-ocurrence) <...
標籤 - 照片矩陣 矩陣相乘
標籤共現相關係數 透過 條件機率 ,可以得到標籤共現的相關係數
由標籤共現相關係數建立觀念階層 <ul><li>將標籤共現相關係數  0.7 的節點 ( 觀念 ) 連結,並建立觀念階層 </li></ul>
「公館」的空間範圍 <ul><li>台灣大學校園西南側 </li></ul><ul><li>羅斯福路鄰近台灣大學校園一帶 </li></ul><ul><li>北至台電大樓 ;  南至寶藏巖 </li></ul><ul><li>雖然有些帶有「公館...
「公館」的觀念階層
「 東區 」 的空間範圍 <ul><li>「 廣義的東區是泛指復興南路以東、內湖南港以西的區域,一般所指的東區商圈則泛指在忠孝東路四段一帶上的太平洋 SOGO 百貨、頂好超市及明曜百貨等商圈,範圍則在復興南路以東,延吉街以西,並介於市民大道和仁...
「 東區 」 的觀念階層
「 陽明山 」的空間範圍 <ul><li>常民所認知的「陽明山」空間範圍為陽明山國家公園的西南方,是為國家公園內景點較多的區域,也就是陽明山公園、竹子湖、擎天崗 … 等地 </li></ul><ul><li>「陽明山」空間範圍中南方區域不為陽明...
「陽明山」的觀念階層
「 阿里山  」 的空間範圍 <ul><li>為風景區內的重要景點和風景區南方阿里山鐵路和公 路的觀景點 </li></ul><ul><li>帶有阿里 山的地理標籤照片分佈廣闊,西起觸口、 東至新中橫公路、南至達娜伊谷,皆有大量帶有「阿里山」地...
「 阿里山  」  的觀念階層
「夜市」所涉及的空間位置
由標籤中得到的夜市名
結論與未來工作 <ul><li>地名的地理標籤照片可以形成地名的空間範圍,且以地名與其它標籤的共現而建立的觀念階層可形構常民對地名的概念化,這二項成果皆可以用來補充正式地名辭典未收錄的部份 </li></ul><ul><li>這個由下而上的地名...
謝謝聆聽.敬請提問 [email_address] [email_address]
Upcoming SlideShare
Loading in …5
×

Digital archivegis2011

401 views

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
401
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
3
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide
  • 1 st SDI generation Users uninvolved; Focused on description, publication, and supply of data 2 nd SDI generation Users involved to some extent; still limited to maximizing supply (production and transmission) of data and service 3 rd generation User’s involvement is deep with focus on production, sharing, and use of GI
  • Digital archivegis2011

    1. 1. 草根性的地名辭典 : 由地理標籤形構地方的 概念及空間 範圍 鄧東波 deng@itc.nl; dongpo@iis.sinica.edu.tw 中央研究 院資訊科學研究所研究助理 荷蘭屯 特大學地理資訊科學與地球觀測學院博士 候選人
    2. 2. Web 2.0 時代的資料生產 <ul><li>新興網路技術 </li></ul><ul><ul><li>使用者端 / 瀏覽器介面 ( client-side/web browser ) 技術更新 </li></ul></ul><ul><ul><li>開放的應用程式介面 (Open API) </li></ul></ul><ul><ul><li>愈來愈多的混搭 (mash-up) 的線上服務 </li></ul></ul><ul><li>使用者生產內容 (User-Generated Content) </li></ul><ul><ul><li>網頁內容不是由少數的人所控制,而是使用者所貢獻 </li></ul></ul><ul><ul><li>資料使用者亦是資料生產者 </li></ul></ul>
    3. 3. 草根性地理資訊 <ul><li>而網路技術的革新,亦使得地理資料的生產變得更為容易 </li></ul><ul><ul><li>線上地圖應用程式 </li></ul></ul><ul><ul><li>嵌入式全球定位系統元件 </li></ul></ul><ul><li>未受地理資訊 訓練的人可將他們所觀察的地理資料分享於網路之中 </li></ul><ul><li>使用者生產地理內容 (User-Generated Geo-Content) </li></ul><ul><li>自願性地理資訊 (Volunteered Geographic Information, VGI) </li></ul>From http://www.datenform.de/mapeng.html
    4. 4. 草根性地理資訊 的 來源與 類別 地理語義清晰 地理語義模糊 草根性 地理資訊 專業地理資訊
    5. 5. 邁向下一代的空間資訊基礎設施 (SDI) 第一代 第二代 第三代 2000 2010 1990 生產者趨使 Producer-driven 資料趨使 Data-driven 處理趨使 Process-driven 使用者參與
    6. 6. 數值地名辭典 ( D igita Gazetteer ) <ul><li>數值地名辭典不 僅 是一個地名的地理空間檢索辭典,亦被視為是一種地理資訊系統 ( GIS) ,並包含幾個核心項目 : </li></ul><ul><li>(1) 名稱 (name) ,包含別名和不同變化的名稱; </li></ul><ul><li>(2) 空間位置 (location) ,用點、線或面型態的座標值; </li></ul><ul><li>(3) 型態 (type) </li></ul>
    7. 7. 線上照片分享平台 — Flickr
    8. 8. 在 Flickr 中的照片、標籤、地理標籤 標籤 地理標籤
    9. 9. 照片 、 標籤、地理標籤 Tags Tags Tags Tags
    10. 10. 研究課題與目標 <ul><li>研究題課 </li></ul><ul><ul><li>如何建立一套方法以擷取網路中由普羅大眾所生產的地理資訊? </li></ul></ul><ul><ul><li>如何處理網路中非正規的 (informal) 地理資訊? </li></ul></ul><ul><ul><li>如何由網路中的地理資訊擷取地名辭典所需要的內容? </li></ul></ul><ul><li>研究目標 : </li></ul><ul><ul><li>由線上照片分享平台 Flickr 中的資料來擷取地名資訊,進而可以使地名辭典更為豐富 </li></ul></ul><ul><ul><ul><li>處理照片中的標籤,以擷取相關的地名資訊 </li></ul></ul></ul><ul><ul><ul><li>處理照片中的地理標籤,以區劃地名所涉及空間範圍 </li></ul></ul></ul><ul><ul><ul><li>分析驗証所擷取的地名資料,並討論本研究所建立的方法 </li></ul></ul></ul>
    11. 11. 研究流程 透過 Flickr API 取得資料 具有標籤和地理標籤的照片 空間資料庫 空間聚類分析 標籤共現分析 觀念階層 Tags Tags Tags Tags
    12. 12. DBSCAN 密度為主的空間群聚分析 <ul><li>假設空間中的一個點 p ,在以點 p 圓心並設定一個半徑 ( EPS ) ,其所構成的鄰近範圍 (Neighborhood) 中所包含的點,其數量大於預設的最低數目的點 ( MinPts ) ,若條件成立,點 p 為核心點 (core point) 且它的鄰近點即形成初始的分群 </li></ul><ul><li>二個重要的變數: 預設半徑 ( EPS ) 和最低數目的點 ( MinPts ) </li></ul><ul><li>EPS = 1 cm; MinPts =5 </li></ul><ul><li>點 p 直接密度可及於點 q </li></ul><ul><li>點 q 不直接密度可及於點 p </li></ul>核心點與邊界點 p q
    13. 13. DBSCAN 的演算方式 <ul><li>密度可及 ( Density-reachable) </li></ul><ul><ul><li>在給定的 EPS 和 MinPts 下,一連串的點 p 1 , .. , p n ,若 p 1 = q 且 p n = p ,則 p i+1 直接的密度可及於 p i ,即點 p 密度可及於點 q 。 </li></ul></ul><ul><li>密度連結 ( Density-connected) </li></ul><ul><ul><li>在給定一 EPS 和 MinPts 下,若點 o 同時密度可及於點 p 和點 q ,則點 p 密度連結於點 q </li></ul></ul>p q p 1 p q o
    14. 14. 標籤共現分析 <ul><li>觀念階層 (Concept hierarchy) 是一個簡單且基本的知識表達方式 </li></ul><ul><ul><li>樹狀結構的編排方式 , </li></ul></ul><ul><ul><li>每一節點是一個觀念,其上下層的二個觀念的關係為「是一個」 (is-a) ,即上下位的關係 (hyponymy) ,或「有一個」 (has-a) ,即部份整體關係 (meronymy) </li></ul></ul><ul><ul><li>其兩兩觀念之關係是決定於標籤在照片集中所共現的頻次,一個標籤在照片集中愈經常與其它標籤共現,其標籤所代表的意義有可能最為一般 (Sanderson and Croft, 1999) ,即愈為抽象或上位的觀念 </li></ul></ul>超市 7-11 全家 萊爾富
    15. 15. 標籤共 現分析 的案例 <ul><li>10 張照片包含 8 個標籤,共被使用 36 次 </li></ul><ul><li>“ 台灣”和“台北”在 P 1 、 P 3 、 P 7 、和 P 10 等照片中共現 (Co-ocurrence) </li></ul><ul><li>將照片 所用的標籤 一一 填入標籤 - 照片矩陣中 </li></ul>
    16. 16. 標籤 - 照片矩陣 矩陣相乘
    17. 17. 標籤共現相關係數 透過 條件機率 ,可以得到標籤共現的相關係數
    18. 18. 由標籤共現相關係數建立觀念階層 <ul><li>將標籤共現相關係數  0.7 的節點 ( 觀念 ) 連結,並建立觀念階層 </li></ul>
    19. 19. 「公館」的空間範圍 <ul><li>台灣大學校園西南側 </li></ul><ul><li>羅斯福路鄰近台灣大學校園一帶 </li></ul><ul><li>北至台電大樓 ; 南至寶藏巖 </li></ul><ul><li>雖然有些帶有「公館」的照片已被定位到古亭捷運站或台灣大學校園內,經過空間聚類這些照片都被排除於這個空間範圍中 </li></ul>
    20. 20. 「公館」的觀念階層
    21. 21. 「 東區 」 的空間範圍 <ul><li>「 廣義的東區是泛指復興南路以東、內湖南港以西的區域,一般所指的東區商圈則泛指在忠孝東路四段一帶上的太平洋 SOGO 百貨、頂好超市及明曜百貨等商圈,範圍則在復興南路以東,延吉街以西,並介於市民大道和仁愛路之間 。」 </li></ul>
    22. 22. 「 東區 」 的觀念階層
    23. 23. 「 陽明山 」的空間範圍 <ul><li>常民所認知的「陽明山」空間範圍為陽明山國家公園的西南方,是為國家公園內景點較多的區域,也就是陽明山公園、竹子湖、擎天崗 … 等地 </li></ul><ul><li>「陽明山」空間範圍中南方區域不為陽明山國家公園,是為中國文化大學,而常民所認知的「陽明山」空間範圍且包含了中國文化大學 </li></ul>
    24. 24. 「陽明山」的觀念階層
    25. 25. 「 阿里山 」 的空間範圍 <ul><li>為風景區內的重要景點和風景區南方阿里山鐵路和公 路的觀景點 </li></ul><ul><li>帶有阿里 山的地理標籤照片分佈廣闊,西起觸口、 東至新中橫公路、南至達娜伊谷,皆有大量帶有「阿里山」地理標籤的照片聚集,這說明了常民的認知中,這些地方是阿里山的一部份,或與阿里山有某種關係 </li></ul>
    26. 26. 「 阿里山 」 的觀念階層
    27. 27. 「夜市」所涉及的空間位置
    28. 28. 由標籤中得到的夜市名
    29. 29. 結論與未來工作 <ul><li>地名的地理標籤照片可以形成地名的空間範圍,且以地名與其它標籤的共現而建立的觀念階層可形構常民對地名的概念化,這二項成果皆可以用來補充正式地名辭典未收錄的部份 </li></ul><ul><li>這個由下而上的地名資料收集方式亦是動態的,地名的認知也有可能隨時間和空間的變化而改變,若常民對於地名認知有改變,在資料充足的條件下,這些變化是可以被很短的時間內收集,因此這種由下而上的方法可以節省收集地名資料的成本 </li></ul><ul><li>草根 性地理資訊收集皆有相同的挑戰,這種由常民所生產的地理資料並不一定與專業的地理資料模式相符,而二種資料之間存在語意層級上不同,為了系統 化 且自動化的收集 草根 性地理資訊,這個語意上的不同必須消弭,這將是未來研究中著重的方向。 </li></ul>
    30. 30. 謝謝聆聽.敬請提問 [email_address] [email_address]

    ×