Department of Information Management National Sun Yat-sen University Master T...Henry Li
Virtual reality(VR) has grown immensely over the past few years, enabling businesses and individuals to develop 3D games. In this research an application of HTC Vive VR role playing game is developed to investigate how to effectively design 3D VR games that facilitate immersive storytelling, learning, and gaming experience. The study incorporates the Design Science methodology to study rapid development and design phase in the research process. The findings show that designing a good VR game includes core mechanism, space specification, interaction pattern, movement, and sound effects. In addition, the collaboration between script writers and software engineers to create interactive gameplay with strong storyline missions becomes the most challenging part in VR game. The key successful factors of this collaboration involve identifying restrictions in the team, basic knowledge of these domains and always be willing to share and listen for others opinions with inclusive attitude, keep the lines of communication open. These findings contribute to future research in the design of 3D VR game for the purpose of education and entertainment.
Keywords: Virtual Reality, VR, RPG Game, Game Experience, Cross-domain interoperability
Department of Information Management National Sun Yat-sen University Master T...Henry Li
Virtual reality(VR) has grown immensely over the past few years, enabling businesses and individuals to develop 3D games. In this research an application of HTC Vive VR role playing game is developed to investigate how to effectively design 3D VR games that facilitate immersive storytelling, learning, and gaming experience. The study incorporates the Design Science methodology to study rapid development and design phase in the research process. The findings show that designing a good VR game includes core mechanism, space specification, interaction pattern, movement, and sound effects. In addition, the collaboration between script writers and software engineers to create interactive gameplay with strong storyline missions becomes the most challenging part in VR game. The key successful factors of this collaboration involve identifying restrictions in the team, basic knowledge of these domains and always be willing to share and listen for others opinions with inclusive attitude, keep the lines of communication open. These findings contribute to future research in the design of 3D VR game for the purpose of education and entertainment.
Keywords: Virtual Reality, VR, RPG Game, Game Experience, Cross-domain interoperability
5. A Web-based Method for Computing the Correctness of Distractors in Chinese
Multiple Choice Cloze
ABSTRACT
Over 40 million people are learning the Chinese language and interest keeps
growing. The Chinese proficiency test becomes progressively a famous language test
in the world. The first formal Chinese proficiency test by Taiwan comes fifteen years
after the Hanyu Shuiping Kaoshi (HSK) by China. Thanks to computer technology,
we can generate the test by a computer easily. Computer-assisted Chinese language
testing generator is still a brand new field of research. There are many methods from
English multiple-choice cloze generator can be refer to Chinese multiple-choice cloze
generator except the method for filtering unsuitable candidate distractors. The purpose
of this study is to design a new method to compute correctness of candidate
distractors. This study solves the problem of filtering unsuitable candidate distractors.
The N-gram count value of this method is from Google web search. The accuracy of
this method is assessed by one hundred Chinese multiple-choice cloze questions of
TOP-Huayu.
KEYWORDS:Chinese multiple-choice cloze, computer-assisted language testing
generator, computational linguistics, Chinese proficiency test, correctness of
candidate distractors.
ii
17. 表 2-1 電腦輔助英文詞彙語法出題篩選誘答選項(a)方法一(b)方
法二
將候選誘答選項和相鄰的二個詞(或更多)放到
Google 中(Goto et al., 2010; Sumita et al., 2005)或
方法
一般語料庫(Liu et al., 2005)搜尋,若有結果,表
示該誘答選項不適用。
例子 This is the building what we had our first office.
what 是候選誘答選項(正答是 which)。用來搜
尋的字串可以是「building what we」,也可以是
解釋
「the building what we had」,但是嚴謹程度不一
樣,若有結果表示該誘答選項不適用。
(a) 方法一
產生不同詞性規則的誘答選項 藉此確保誘答選項 ,
方法
是錯誤選項。(Chen et al., 2006)
Representative democracy seemed ______ simultaneously
during the eighteenth and nineteenth centuries in Britain,
Europe, and the United States.
例子 (A) to evolve
(B) to evolving
(C) evolving
(D) evolve
解釋 4 個選項的詞性都不同。
(b) 方法二
以華語文詞彙語法題的觀點來看,方法二較不適合用在本研究,
因華語文詞彙題的誘答選項通常是同一種詞性,且華語文是孤立語,
不像英文有字尾型態變化。另外,Bensoussan 和 Ramraz(1984)也表示
在設計誘答選項時,四個選項中最好都使用同一種詞性,例如全部是
動詞,避免提示效果,故方法二不適合直接用來計算及篩選本研究的
7
21. 3. 第三章 研究工具
本章介紹本研究基礎的三項工具,由於此三項工具使得本研究的
方法得以實現。本章將介紹中研院斷詞系統、Google 網頁搜尋、
TOP-Huayu 詞彙語法。
3.1 中研院斷詞系統
要進行華語文語句分析,必須將語句斷詞後,才能處理。本研究
利用中央研究院中文資訊處理實驗室詞庫小組所發展的中文斷詞系
統 http://ckipsvr.iis.sinica.edu.tw/,將句子斷成數個詞,並重新組成
N-grams。
在偵測未知詞的部份是利用基於語料庫的方法找出句法規則,再
利用此規則來分辨單音節元素,然後找出未知詞或錯誤用法(Chen &
Bai,1998)。斷詞後的範例:
這(Nep) 是(SHI) 一(Neu) 家(Nf) 擁有(VJ) 五百(Neu) 名(Nf) 員工(Na) 的
(DE) 中型(A) 企業(Na) 。(PERIODCATEGORY)
利用 Hong Kong Cityu(HK)的 closedtrack 及 open track、
Beijing University (PK)的 closedtrack 及 open track,共 4 種,
評估此斷詞系統,結果具有相當高的 F scores(Ma & Chen,2003)。
如表 3-1 及表 3-2 其中英文字母代表依序為 test recall (R) test
。 , 、
precision (P)、F score(F)、the out-of-vocabulary (OOV) rate for
the test corpus、the recall on OOV words(Roov)及 the recall on
in-vocabulary(Riv) words。
11
22. 表 3-1 Scores for HK
R P F OOV Roov Riv
Closed 0.947 0.934 0.940 0.071 0.625 0.972
Open 0.958 0.954 0.956 0.071 0.788 0.971
資料來源: Ma & Chen(2003)
表 3-2 Scores for PK
R P F OOV Roov Riv
Closed 0.939 0.934 0.936 0.069 0.642 0.961
Open 0.939 0.938 0.938 0.069 0.675 0.959
資料來源: Ma & Chen(2003)
圖 3-1 中研院中文斷詞系統網站
資料來源:中文斷詞系統 http://ckipsvr.iis.sinica.edu.tw/
12
23. 中研院中文斷詞系統已經廣泛的被各種領域的學者所使用。例如,
陳慶龍(2007)利用此斷詞系統製作中文體育知識問答系統。Huang、
Chiu Chuan Sandnes(2010)製作一個可以診斷憂鬱症的語言分析器
、 、 ,
其中利用中研院中文斷詞系統來擷取關鍵字。
3.2 Google 網頁搜尋
1995 年 Google 的創辦人美國史丹福大學的研究生 Larry Page
以及 Sergey Brin 憑藉其資訊工程的專長,開發名為 BackRub 的搜尋
引擎,後來正式更名為 Google。其任務在於組織全世界的資訊,讓
全球都能使用並有所禆益!可說是目前全球最大的搜尋引撆,現代人
幾乎只要提到資料搜索都絕對離不開 Google 搜尋。正因為它可以在
短時間內找到相當豐富的資料,查詢所得的結果遠多於其他搜尋網站,
因此已經成為許多人不可或缺的工具(童國倫、潘奕萍, 2009)。故本
研究以 Google 為 N-gram count 值的來源,分析選項正答力。
GOOGLE 支援多達一百三十二種語言 包括簡體中文和繁體中文,
,
並有「頁庫存檔」功能,即使網頁檔案被刪除,仍然可以查詢到資料。
而且可以搜尋的資料類型至少包括以下幾種格式:
Adobe Portable Document Format (pdf)
Adobe PostScript (ps)
Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
Lotus WordPro (lwp)
MacWrite (mw)
Microsoft Excel (xls)
Microsoft PowerPoint (ppt)
Microsoft Word (doc)
Microsoft Works (wks, wps, wdb)
Microsoft Write (wri)
Rich Text Format (rtf)
Shockwave Flash (swf)
Text (ans, txt)
HyperText Markup Language (html)
13
40. 例如“我國 天然 資源”的調整值是:
7290 / (7290+10+6+5240) = 0.5810617
所以
F(“我國天然資源”)= 1.5810617。
最後將所有部分正答力 F 加起來就可以得到選項正答力,相似於
Markov Chain 的觀念,即可得到正答力,如以下範例:
「資源」選項的正答力=F(“我國天然資源”)+F(“我國天然資源不”)
+F(“我國天然資源不多”)+F(“我國天然資源不多,”)
+F(“我國天然資源不多,礦產”)+F(“我國天然資源不多,礦產種類”)
+F(“我國天然資源不多,礦產種類只有”)
+F(“我國天然資源不多,礦產種類只有煤”)
+F(“我國天然資源不多,礦產種類只有煤和”)
+F(“我國天然資源不多,礦產種類只有煤和石油”)
+F(“我國天然資源不多,礦產種類只有煤和石油。”)
=1.5810617+3+4+5+4+0+0+0+0+0+0= 17.581062
4.3.2 計算方法
5. 本研究所設計的計算方法如下:
6.
定義𝐺𝑜𝑜𝑔𝑙𝑒(𝑊𝑎 𝑚 )
m m
C(Wa ), if (C(Wa ) > 𝑡 and a < (k − 1) and m = k)
m
or (C(Wa ) > 𝑡 and a < 𝑘 𝑎𝑛𝑑 𝑚 > 𝑘)
m m m
Google(Wa ) = Google(Wa:1 ), if (C(Wa ) = t and a < (k − 1) and m = k)
m
or (C(Wa ) = t and a < 𝑘 𝑎𝑛𝑑 𝑚 > 𝑘)
{ 0, otherwise
(4-9)
𝑎, 𝑘, 𝑚 ∈ ℕ
k=「選項」所在位置,t=0
30
41. m m
C(Wa )代表以 Google 搜尋詞句Wa 後,傳回的搜尋結果數量
m m
C(Wa )。Wa 之間的標點符號會被 Google 省略,例如「,」或「。」
。
送至 Google 搜尋的字串前後加雙引號「”」
,表示不可分割。式 4-9
的 t 是一 threshold value 實際使用時可以改成 t=1 代表從 Google
, ,
搜尋到的結果數為 2 以上才接受,藉此過濾掉只出現 1 次的詞句,因
為它有可能是不常用或不合法的詞句。本研究設定 t=0,使評估時可
m
以取得較多的搜尋結果。以下是Google(Wa )範例:
7
W1 =”我國 天然 資源 不 多 , 礦產”
7
W2 =”天然 資源 不 多 , 礦產”
7
W3 =”資源 不 多 , 礦產”
7 7
C(W1 )= C(W2 )= 0
7 7 7 7
Google(W1 ) =Google(W2 )=Google(W3 )= C(W3 )=5
7 7 7
因為W1 字串在 Google 中的搜尋結果數 C(W1 )=0,所以重新用W2 字
7 7 7
串搜尋 但是W2 字串的搜尋結果數 C(W2 )=0 所以再用W3 字串搜尋,
, ,
7
得到搜尋結果數C(W3 )=5。
定義𝑙𝑒𝑛𝑔𝑡ℎ(𝑊𝑎 𝑚 )
m
m − a + 1, if (C(Wa ) > 𝑡 and a < (k − 1) and m = k)
m
or (C(Wa ) > 𝑡 and a < 𝑘 𝑎𝑛𝑑 𝑚 > 𝑘)
m m m
length(Wa ) = length(Wa:1 ), if (C(Wa ) = t and a < (k − 1) and m = k)
m
or (C(Wa ) = t and a < 𝑘 𝑎𝑛𝑑 𝑚 > 𝑘)
{ 0, otherwise
(4-10)
a, 𝑘, 𝑚 ∈ ℕ
k=「選項」所在位置,t=0
m m
length(Wa )代表最後從google找到C(Wa )時,根據它所用的
m m
最長可得結果字串Wa ,找出字串的 N-grams 長度,而length(Wa )即
代表此長度。t 是一 threshold value,可以改成 t=1,代表從 Google
31
42. m
搜尋到的結果數C(Wa )為 2 以上才接受,藉此過濾掉只出現 1 次的詞
句,因為它有可能是不常用或不合法的詞句。本研究設定 t=0,使評
估時可以取得較多的搜尋結果。
m
以下是length(Wa )範例:
9
W1 =“王 老闆 , 我 上 個 星期 訂 的”
9
W2 =“老闆 , 我 上 個 星期 訂 的”
9 9
C(W1 )=0, C(W2 )= 3
9 9
length (W1 ) = length (W2 ) =8
9 9 9
因為W1 字串在 Google 中的搜尋結果數 C(W1 )=0,所以重新用W2 字
9 9
串搜尋,得到搜尋結果數C(W2 )=3,故 length (W2 ) =9-2+1=8。
定義𝑆𝑐𝑜𝑟𝑒(𝑥)
x − 1, if x > 1
Score(x) = { (4-11)
0, if x ≤ 1
m
Score(x)是計算分數的函數 依 x=length(W1 )來決定該字串的分
,
數,x 越大則分數越高,藉此分數來計算正答力。
定義 Tm,L
Tm,L = ∑ google (Wj m ) , j = {x ∈ 選項編號集合|length(Wx1 ) = L}
m
1
j
(4-12)
32