SlideShare a Scribd company logo
1 of 12
詞夾子系統使用心得
博宇 2015/09/09
(2015/09/02)
1
更新版本之前 到的問題碰

一開始輸入文本和種子詞彙的選項不能決定詞夾
模具參數

找出的候選詞彙與詞夾沒有排序過
− 詞彙:出現次數、被現有詞夾夾中的次數等
− 詞夾:夾重的數量,夾出新候選詞彙的量等
2
更新後的版本

初始可以輸入詞夾模具參數

候選詞彙和詞夾經過排序,候選詞夾會顯示出前
五個頻率最多的新詞彙

詢畫面中會顯示被排除的詞彙查 ( 下圖紅標處 )
3
測試內容

找出「西遊記」、「三國演義」、「水滸傳」中
所列出的兵器。
− 比起人名數量較少
− 但是「水滸傳」 案的排板有些問題,後來並未使用檔
− 詢期間若有找到新詞彙則會添加詞彙進去查

通常是夾中的詞彙的部分內容含有要尋找的詞彙

或是在看到的節錄段落中看到沒有夾到的詞彙
4

「西遊記」
− 種子詞彙:「金箍棒」、「如意金箍棒」、「九尺釘
耙」、「月牙 」鏟
− 2[2-6]2
− 經過四次循環收斂,截取到 75 個詞彙
− 一次循環:一次揀選候補詞夾 + 一次揀選候補詞彙
5

「三國演義」
− 種子詞彙: 11 個

「雙股劍」、「青龍偃月刀」、「七星寶劍」等
− 2[2-6]2
− 經過六次循環收斂,截取到 40 個詞彙
6
《西遊記》找到的兵器名
• 七星劍 , 七星寶劍 , 三尖兩刃槍 , 三尖兩刃神鋒 , 三股叉 , 三
股鋼叉 , 九尺釘耙 , 九瓣銅錘 , 九齒滲金釘鈀 , 九齒耙 , 九齒
釘耙 , 九齒釘鈀 , 九齒鈀 , 叉兒棒 , 四明鏟 , 大刀 , 大捍刀 , 如
意棒 , 如意的鐵棒 , 如意金箍棒 , 宣花斧 , 宣花鉞斧 , 寶劍 , 寶
杖 , 戒刀 , 方天戟 , 月牙鏟 , 棍子 , 楮白槍 , 混鐵棍 , 渾鐵棍 ,
火叉 , 火尖槍 , 烏油黑棒子 , 牛耳短刀 , 狼牙棒 , 畫桿方天戟 ,
短棍 , 短軟狼牙棒 , 磬槌 , 神鋒 , 竹節鋼鞭 , 芭蒲扇 , 芭蕉扇 ,
芭蕉扇子 , 虎眼鞭 , 赤銅刀 , 輕軟狼牙棒 , 金弓 , 金瓜 , 金箍如
意棒 , 金箍棒 , 金箍鐵棒 , 金鋼套 , 釘鈀 , 鉞斧 , 鉤子 , 鋼刀 ,
鋼叉 , 鐵杵 , 鐵棍 , 鐵棒 , 鐵 藜蒺 , 鐵鈀 , 長槍 , 降妖寶杖 , 降
妖杖 , 降妖棒 , 青鋒寶劍 , 飛龍寶杖 , 飛龍杖 , 黑纓槍 , 點鋼大
叉 , 點鋼槍 , 齊眉棍
7
《三國演義》找到的兵器名

七星寶刀 , 丈八矛 , 丈八點鋼矛 , 三尖刀 , 利刃 , 大刀 , 大
斧 , 大 刀砍 , 寶刀 , 寶劍 , 弓弩 , 弩箭 , 截頭大刀 , 方天畫
戟 , 日月刀 , 松紋鑲寶劍 , 步卒腰刀 , 流星鎚 , 畫戟 , 畫桿
方天戟 , 短刀 , 硬弓 , 蒂鐘 , 蛇矛丈八鎗 , 鋼刀 , 鋼斧 , 鐵
戟 , 鐵棒 , 鐵槍 , 鐵鎚 , 長戈 , 長槍 , 長矛 , 長鎗 , 開山大
斧 , 雙股劍 , 青釭寶劍 , 青龍偃月刀 , 青龍刀 , 飛刀
8
問題

初始設定的詞夾模具參數不會變更到設定的預設值
9
問題

一開始不輸入種子詞彙會把一個空字彙加到正確
詞彙中
10
問題

詢視窗下捲到底的時候會開始捲後面的畫面查

輸入的新候選詞夾若不符格式似乎會出問題
− 格式: [ 前夾 ]...[ 後夾 ]
− Example: 沒輸入 '...' 會使系統一直處於 matching
狀態
11

能找出的詞夾設了上限
− Example: 紅樓夢,種子詞彙「寶玉」
12

More Related Content

Viewers also liked (6)

USAID Perspectives on Monitoring and Evaluation and Health Information Needs ...
USAID Perspectives on Monitoring and Evaluation and Health Information Needs ...USAID Perspectives on Monitoring and Evaluation and Health Information Needs ...
USAID Perspectives on Monitoring and Evaluation and Health Information Needs ...
 
Safety
SafetySafety
Safety
 
The Late-Comer Student
The Late-Comer StudentThe Late-Comer Student
The Late-Comer Student
 
Food Safety 1 Powerpoint Template
Food Safety 1 Powerpoint TemplateFood Safety 1 Powerpoint Template
Food Safety 1 Powerpoint Template
 
Core concept of marketing
Core concept of marketingCore concept of marketing
Core concept of marketing
 
CV of Damiano Rivera Reubal
CV of Damiano Rivera ReubalCV of Damiano Rivera Reubal
CV of Damiano Rivera Reubal
 

More from 景逸 王

博宇 20160316 文件內文時間資訊的整合發想
博宇 20160316 文件內文時間資訊的整合發想博宇 20160316 文件內文時間資訊的整合發想
博宇 20160316 文件內文時間資訊的整合發想景逸 王
 
睿頡 20160316 推薦系統報告
睿頡 20160316 推薦系統報告睿頡 20160316 推薦系統報告
睿頡 20160316 推薦系統報告景逸 王
 
王毅 20160309 上學期回顧
王毅 20160309 上學期回顧王毅 20160309 上學期回顧
王毅 20160309 上學期回顧景逸 王
 
于琳 20160302 上學期回顧
于琳 20160302 上學期回顧于琳 20160302 上學期回顧
于琳 20160302 上學期回顧景逸 王
 
又霖 20160302 進度報告
又霖 20160302 進度報告又霖 20160302 進度報告
又霖 20160302 進度報告景逸 王
 
家富 20160224 上學期回顧
家富 20160224 上學期回顧家富 20160224 上學期回顧
家富 20160224 上學期回顧景逸 王
 
博宇 20160224 上學期回顧
博宇 20160224 上學期回顧博宇 20160224 上學期回顧
博宇 20160224 上學期回顧景逸 王
 
睿頡 20160302 上學期回顧
睿頡 20160302 上學期回顧睿頡 20160302 上學期回顧
睿頡 20160302 上學期回顧景逸 王
 
趙叡 20160302 上學期回顧
趙叡 20160302 上學期回顧趙叡 20160302 上學期回顧
趙叡 20160302 上學期回顧景逸 王
 
Tensor flow (1)
Tensor flow (1)Tensor flow (1)
Tensor flow (1)景逸 王
 
碩士論文題目構思
碩士論文題目構思碩士論文題目構思
碩士論文題目構思景逸 王
 
軟工期末Project進度報告
軟工期末Project進度報告軟工期末Project進度報告
軟工期末Project進度報告景逸 王
 
于琳 20151118 族譜系統-功能延伸
于琳 20151118 族譜系統-功能延伸于琳 20151118 族譜系統-功能延伸
于琳 20151118 族譜系統-功能延伸景逸 王
 
睿頡 20151111 類書對應查詢系統
睿頡 20151111 類書對應查詢系統睿頡 20151111 類書對應查詢系統
睿頡 20151111 類書對應查詢系統景逸 王
 
欣烜 20151104 excel2_earth_圖層繪製
欣烜 20151104 excel2_earth_圖層繪製欣烜 20151104 excel2_earth_圖層繪製
欣烜 20151104 excel2_earth_圖層繪製景逸 王
 
王毅 20151021 osm報告
王毅 20151021 osm報告王毅 20151021 osm報告
王毅 20151021 osm報告景逸 王
 
界昇 20151007 ai_and_law
界昇 20151007 ai_and_law界昇 20151007 ai_and_law
界昇 20151007 ai_and_law景逸 王
 

More from 景逸 王 (20)

博宇 20160316 文件內文時間資訊的整合發想
博宇 20160316 文件內文時間資訊的整合發想博宇 20160316 文件內文時間資訊的整合發想
博宇 20160316 文件內文時間資訊的整合發想
 
睿頡 20160316 推薦系統報告
睿頡 20160316 推薦系統報告睿頡 20160316 推薦系統報告
睿頡 20160316 推薦系統報告
 
王毅 20160309 上學期回顧
王毅 20160309 上學期回顧王毅 20160309 上學期回顧
王毅 20160309 上學期回顧
 
于琳 20160302 上學期回顧
于琳 20160302 上學期回顧于琳 20160302 上學期回顧
于琳 20160302 上學期回顧
 
又霖 20160302 進度報告
又霖 20160302 進度報告又霖 20160302 進度報告
又霖 20160302 進度報告
 
家富 20160224 上學期回顧
家富 20160224 上學期回顧家富 20160224 上學期回顧
家富 20160224 上學期回顧
 
博宇 20160224 上學期回顧
博宇 20160224 上學期回顧博宇 20160224 上學期回顧
博宇 20160224 上學期回顧
 
睿頡 20160302 上學期回顧
睿頡 20160302 上學期回顧睿頡 20160302 上學期回顧
睿頡 20160302 上學期回顧
 
趙叡 20160302 上學期回顧
趙叡 20160302 上學期回顧趙叡 20160302 上學期回顧
趙叡 20160302 上學期回顧
 
Tensor flow (1)
Tensor flow (1)Tensor flow (1)
Tensor flow (1)
 
Jieba
JiebaJieba
Jieba
 
碩士論文題目構思
碩士論文題目構思碩士論文題目構思
碩士論文題目構思
 
軟工期末Project進度報告
軟工期末Project進度報告軟工期末Project進度報告
軟工期末Project進度報告
 
于琳 20151118 族譜系統-功能延伸
于琳 20151118 族譜系統-功能延伸于琳 20151118 族譜系統-功能延伸
于琳 20151118 族譜系統-功能延伸
 
睿頡 20151111 類書對應查詢系統
睿頡 20151111 類書對應查詢系統睿頡 20151111 類書對應查詢系統
睿頡 20151111 類書對應查詢系統
 
欣烜 20151104 excel2_earth_圖層繪製
欣烜 20151104 excel2_earth_圖層繪製欣烜 20151104 excel2_earth_圖層繪製
欣烜 20151104 excel2_earth_圖層繪製
 
Pajek
PajekPajek
Pajek
 
王毅 20151021 osm報告
王毅 20151021 osm報告王毅 20151021 osm報告
王毅 20151021 osm報告
 
Git
GitGit
Git
 
界昇 20151007 ai_and_law
界昇 20151007 ai_and_law界昇 20151007 ai_and_law
界昇 20151007 ai_and_law
 

博宇 20150909 詞夾子心得

Editor's Notes

  1. http://dev.digital.ntu.edu.tw/DADH-2015/