Advertisement
Advertisement

More Related Content

More from International Federation for information integration(20)

Advertisement

LWC15建一個有溫度的數位典藏報告人:臺北市議會圖書館 鄭有容館員

  1. 現職:臺北市議會圖書館館員、臺大圖資所博士生 建一個有溫度   的數位典藏 分享人:鄭有容
  2. 現有數典 數典改版 建置時間 2008 年 ~2011 年 2015 年 合作單位 中興大學圖資所 自行建置 資料 類型 起迄年代 資料數量 起訖年代 資料數量 議事錄 民 58-91 43,829 筆 民 35-58 22,502 筆 議事公報 民 59-95 31,531 筆 照片 民 62-93 1,249 張 民 62-93 36,000 張 影音資料 民 92-95 1,126 個 民 96-103 2,280 個 功能對照  個別 詢查  圖片瀏覽  數位學習  整合 詢與後分類查  類別瀏覽與議員主題館  數位學習與數位加值 臺北市議會數位典藏介紹 地方議會的起源 : 台灣 政長官公署行 ( 民 34) 的台灣 各級民意機省 關成 方案,…市政府應於民國立 35 年 2 月底前選舉市 議員。參 是孤本 案,從林獻堂、二二八檔 ?
  3. 臺北市議會數位典藏介紹
  4. 為什麼議會要建數位典藏 ?  民主 = demo( 人民 ) + cracy( 統治 ) • 除了典藏之外,最重要是回應人們的訴求。  以下舉一些真實遭遇的案例 • 民眾 : 我們家的土地什麼時候被歸到松山區了 ? • 官員 : 天呀,誰可以告訴我 70 年代某工專是怎麼被合併 的 ? • 記者 : 我想做一則關於新店溪整治的系列報導 ? • 某甲 : 誰可以告訴我金溥聰的五個姊姊叫什麼名字 ?  證明議會的內容是有趣的,是人們會想關心的。
  5.  議員主題瀏覽 : • 從議會網站介接議員個人資料入數位典藏。 • 使用者選擇議員後,可一併瞭解學經歷、數典資料。
  6. 顯示物件關聯關係,並且為使用者進行推薦。  
  7. 重新思考數位典藏 ( 數位人文 )  從數位典藏到數位人文 • 為什麼資料只是被換成數位形式典藏著? • 數位人文即達成傳統數典無法完成的事情。 • 數位人文即運用數位科技找出數位資源的人文價 。值  數位人文的應用方式 • 斷詞技術、詞頻分析、關聯詞分析、資訊視覺化、社 會網絡分析。
  8. 以北門 ( 承恩門 ) 為例  以承恩門為關鍵詞,透過數典進行 詢,找到第二屆民政部查 門質詢紀錄。 • 吳議員敦義: …局長,關於名勝古蹟的認定我有一點淺見提供參考 所謂名勝古蹟一定要有先賢先聖的血汗 在內或具有特殊號召的意義,如果僅是很普通只因為年代較久遠而認定是名勝古蹟因而危 害到公共設施的興建的話,則未免太不對了,譬如最近某條非常重要的馬路要拓寬,據說 在馬路上有一間一兩百年的古屋,破破爛爛,而且既缺乏民族文化的特色,又沒有先聖先 賢的意義在裹頭,硬要認為是名勝古蹟再要花一筆很大的經費遷移修建,經過改頭換面讓 它存在,甚至有人考慮可以保存這座古屋,讓大馬路繞道而行,像這種荒唐的認定法很多 人就認為不可取… • 蔣議員淦生: 剛才吳議員談到臺北市名勝古蹟的問題,我想舉出實例請教局長,就是北門的城樓,這次高 架時將它保存下來了,當初設計時曾發生一點議論,有的人認為是古蹟應該保存,有的人 認為應該拆除,結果還是認為是名勝古蹟而保存下來了,但保存下來將來高架道路完成之 後這古蹟的價值究竟多少呢?這次高架道路為了保有這座古蹟而增加多少支出?這座古蹟 究竟有多少年的歷史值得保留?而且這座建築是否值得保留?我們大家經過北門都看到過 的,這座城樓似乎沒有什麼歷史性價值?不知局長認為如何?
  9. 以北門 ( 承恩門 ) 為例  這麼多的資料,有沒有辦法可以快速瞭解史料內涵 ?  透過斷詞、詞類標註,作為發掘史料的前置步驟。
  10. 以北門 ( 承恩門 ) 為例  利用詞頻的輔助,過濾出高頻詞,判斷關鍵詞與同類詞。  當資料量越大的時候,所過濾出的詞則越準確。  如何建立詞彙的關聯,例如運用演算法進行關聯詞分析,則 有待進一步深入研究。 相關人名相關事件、地點
  11. 以土壤液化為例
  12.  建立重大事件的脈絡,比對歷史中一再重複的事件。 以土壤液化為例 取自筆墨譚心數位典藏網站
  13. 以信義區為例
  14. 以市政預算為例
  15. 瞭解使用者需求  從市議會官網的 GA 擷取資料 • 於首頁及服務選單功能頁面嵌入 GATC 追蹤程式碼 (Google Analytics Tracking Code , GATC) ,將訪客造訪之次級資料 (secondary data) 回傳至 議會 Google 網站流量伺服器分析。 • 資料擷取範圍 (2 年 ) :從 2013/10/01 至 2015/09/30 ,共 730 日工作紀 錄。 • 瀏覽量: 1,809,771 ;網頁請求數 ( 工作階段 ):773,795 。
  16.  設定網站工作紀錄分析指標 • 依照瀏覽量分布差異訂定 5 種瀏覽量分析指標,分別為 「頂標 (5,248 次 ) 」、「前標 (3,571 次 ) 」、「均標 (1,675 次 ) 」、「後標 (658 次 ) 」、「底標 (450 次 ) 」 。 結合 Google Analytics 的使用調查
  17.  將單日瀏覽量達前標 (3,571 次 ) 以上定義為高瀏覽量日,日數共 164 日,高瀏覽量日數間 呈密集規律分布。 結合 Google Analytics 的使用調查  高瀏覽量日數與議事運作期間有關。
  18.  極高瀏覽量與市長施政報告有關 • 將極高瀏覽量指標訂為高於頂標 2 倍 (10,556 次 ) 之單日瀏覽 量,日數共 9 日,單日瀏覽量介於 11,478 次至 20,431 次之 間,為均標瀏覽量指標的 6.92 至 12.20 倍。 • 透過網站的「議事日程周報表」所記錄議程資訊,與極高瀏覽量 日期對照,發現除 2014/11/29 之外,其餘極高瀏覽量日數均 與「市長」赴議會施政報告、質詢及答覆有關,且具連續性。 結合 Google Analytics 的使用調查
  19. GA+ 詞頻分析 = 使用者所關心議題  極高瀏覽量由特定議題所引發 • 由於民 所關注議題可能來自於當日、前日相關新聞,眾 透 過新聞知識系統以限定欄位 詢方式,將檢索條件訂為查 (人名:市長姓名)交集(時間:連續日期前﹝ 1 日至連 續日期最末日) 進入系統檢索﹞ 。 • 檢得 393 則新聞條目,為深入瞭解新聞條目內容架構, 運用 Kimono 爬蟲程式逐則將新聞主題詞彙、關鍵詞彙、 人名詞彙批次匯出,整理有 1,702 個主題詞彙、 1,963 個關鍵詞彙、 1,480 個人名詞彙、並做詞頻分析。
  20. GA+ 詞頻分析 = 使用者所關心議題
  21. 將調 結果視覺化呈現查
  22. GA 也可用來分析使用行為  連線載具類別、品牌與網頁造訪情形交叉分析
  23. GA 也可以結合視覺化
  24. GA 也可以結合視覺化
  25. 結論 : 做一個會說故事的資訊人  扮演協助讀者發掘知識的人,一個知識的顧問。  從泛黃的書頁、交錯的藏書找出概念之間的關聯性,也必須 是一個會說故事的專家。
  26. 運用 Beacon 、蒙太奇片牆、 3D 特效、 3D 列印強化使用者體 驗。 釐清圖書館與博物館的差別,處理對象的不同。  
  27. 結論 : 做一個會說故事的資訊人  什麼是與圖資適合結合的學科 ?  歷史與圖資的共通點 - 強調內容。  Watch your thoughts, for they will become actions.- Margaret Thatcher  發揮溫柔而巨大的力量,證明資料乃至於館員的價 。值
  28. 歡迎大家來使用議事數位典藏

Editor's Notes

  1. 1.有感情、有深度,每當我接觸這些史料,覺得他們是有生命的、有故事的。他是眾人的回憶。只是這些記憶是片段的,我們應該如何用我們的專業去把它組織起來。2.今天除了介紹數典系統外,分享一些結合結合實務層面研究、館員用的到的技術與心得。 3.因為我覺得透過研究去解決工作的問題,這樣會研究會更有意義,像是我現在開展的政治家族史研究,就是從一段故事開始的、林則許與現代政治人物的關係。 4.歷史是過去式,更是現在式。
  2. 民國35年的資料呢、僅存一本,可能不見了這段歷史就不見了。 紀載了什麼?議員質詢紀錄、各種台北市歷史的重要事件影音資料是不公開的。很好的議會歷史報告http://www.twcenter.org.tw/wp-content/uploads/2015/05/g03_04_03_05.pdf是承先啟後的,很好的系統。 百餘項功能、24頁RFP、來回修改17次、怕無人投標。 由於資源類型眾多,也增加撰寫RFP與處理作業的複雜程度。 例如各屆次的影音資料就分別以不同形式保存。 第九屆議事錄影WMV檔(1,126個)轉換為網路串流格式MPG4。 第十屆議事錄影DVD(892片)、第十一屆議事錄影第一次定期大會DVD(185片)還原為MPG2檔案永久典藏及轉換為網路串流格式MPG4。 第十一屆議事錄影第二至八次定期大會Full HD MPG2檔(1203個)轉換為DVD解析度品質MPG2。 總項目大概超過100項、RFP24頁、送上去修改17次。 那時候最大的困擾就是,很怕沒有人來投標。
  3. 大家可以看到我們典藏了許多歷任市長、重大事件的分類瀏覽呈現。右邊就是我說的,限定版(可能只剩一本的)早期議事錄。
  4. 民眾:第三選區包含松山、信義兩區,房價差很大。官員:追究當初預算編列,有沒有貪汙情事。看,這麼多議會時期的資料,將會有多麼精彩的故事。
  5. 除此之外,我們也想透過人的角度將數位典藏的資料更為豐富。我們也介接許多議會做的他案系統,是資料更為豐富。
  6. 德布西的交響樂,海,也深受其影響。並且透過自建辭庫的運作,為人們呈現推薦資料。
  7. 我們可不可以不要把數位典藏做成資料庫,可不可以運用?時間軸很適合用來作災難史的研究。簡單而言,透過分析才能從數位典藏的寶山,找到一把鑰使把內容打開。
  8. 記得前陣子的地震嗎?大家是不是一直在查自己自己的家是不是處於斷層帶、土壤液化帶上面。然而新聞結束了!大家還是繼續住在土壤液化帶上。
  9. 怎麼建立關係,例如譚
  10. 結合地理GIS、時間軸線。
  11. 結合視覺化。 管一座動物園跟一個台北市圖書館預算差不多。 都是數位人文新探討的方式。
  12. 書房:會幫你推薦書籍、館員:我幫你查一本書。 其實在國外,storing telling已變成教授的專長。
  13. 我做這件事情,其實只是出自一個單純的原因。我總覺得,一般圖書館員總缺了一點自信、有點害羞,其實卻是非常專業(例如金溥聰),我只是想證明,身為一個圖書館員,這股力量是溫柔而巨大的,透過數位人文可以換回資料的價值,也可以證明館員的價值,謝謝大家。
Advertisement