dc-visitorlog-kevin2. About my self
• neurolinguistic studies of word recognition
• a database of Mandarin Chinese characters/
words
• human perception in detecting F0 changes
• nonlinearity of brain waves and speech
sounds
15年12月19⽇日星期六
4. Main issues
• 2014-11-01 ⾄至 2014-11-30 期間,
10000 筆隨機取樣的台灣地區網站訪客
的瀏覽紀錄
• 預測10K 位訪客在 2014-12-1 ⾄至
2014-12-7 的瀏覽次數
15年12月19⽇日星期六
13. Methods
• 計算的⽅方式∑Ei(freq.) 有很多種
• 試看看 Hilbert-Huang Transformation
(HHT; Huang et al., 1998; 2009)
•EEMD: ensemble empirical mode
decomposition
• Hilbert transfer
15年12月19⽇日星期六
15. • data > (EEMD) > IMFs
• IMF: intrinsic mode function
15年12月19⽇日星期六
17. 預期的訪客瀏覽次數 = ∑Ei(freq.) × weight
weight value:
counts of views of each account
total counts (11/1 ~ 11/30)
• Ei(freq.) = sum(IMF4–8 & Resid.)
15年12月19⽇日星期六
18. 預期的訪客瀏覽次數 = ∑Ei(freq.) × weight
weight value:
counts of views of each account
total counts (11/1 ~ 11/30)
• Ei(freq.) = sum(IMF4–8 & Resid.)
第⼀一次上傳結果,得分:75.23
15年12月19⽇日星期六
20. 預期的訪客瀏覽次數 = ∑Ei(freq.) × weight
weight value:
counts of views (11月最後七天)
total counts (11月最後七天)
• Ei(freq.) = sum(IMF4–8 & Resid.) 瀏覽時間⼤大於500⼩小時
預測值介於 0~1 的數值改為 0 (次數分配偏向
exponential-like distribution)
15年12月19⽇日星期六
21. 預期的訪客瀏覽次數 = ∑Ei(freq.) × weight
weight value:
counts of views (11月最後七天)
total counts (11月最後七天)
• Ei(freq.) = sum(IMF4–8 & Resid.) 瀏覽時間⼤大於500⼩小時
⼤大幅修改⽅方法之後的第⼀一次上傳
得分:76.39
預測值介於 0~1 的數值改為 0 (次數分配偏向
exponential-like distribution)
15年12月19⽇日星期六
23. To improve the outcome
• Analysis of the page view data
• method: linear mixed effect model
• fix factors:
• Days (1–30), Hours (0–23), Days*Hours
• random factor: category (18 categories)
15年12月19⽇日星期六
27. 預期的訪客瀏覽次數 = ∑Ei(freq.) × weight
weight value:
counts of views (11月最後七天)
total counts (11月最後七天)
• Ei(freq.) = sum(IMF4–8 & Resid.)
• 總瀏覽時間⼤大於500⼩小時, 取18pm 以後的次數
預測值介於 0~1 的數值改為 0 (次數分配偏向 exponential-
like distribution)
15年12月19⽇日星期六
28. 預期的訪客瀏覽次數 = ∑Ei(freq.) × weight
weight value:
counts of views (11月最後七天)
total counts (11月最後七天)
• Ei(freq.) = sum(IMF4–8 & Resid.)
• 總瀏覽時間⼤大於500⼩小時, 取18pm 以後的次數
再次修改之後上傳
得分:79.86
預測值介於 0~1 的數值改為 0 (次數分配偏向 exponential-
like distribution)
15年12月19⽇日星期六
29. • 應⽤用⾙貝式定理
• adjusted weight:
• 1 - (0.1398^2) / ((0.1398^2) + 0.2383*(1-0.1398))
(⼈人數)
11月最後⼀一周
次數 > 1
11月最後⼀一周
次數 = 0
總次數 > 1 1398 2383
總次數 = 0 0 6219
15年12月19⽇日星期六
30. 預期的訪客瀏覽次數 = ∑Ei(freq.) × weight
weight value:
counts of views (11月最後七天)
total counts (11月最後七天)
• Ei(freq.) = sum(IMF4–8 & Resid.)
• 總瀏覽時間⼤大於500⼩小時, 取18pm 以後的次數
預測值介於 0~1 的數值改為 0 (次數分配偏向 exponential-
like distribution)
將預測值乘上校正機率
15年12月19⽇日星期六
31. 預期的訪客瀏覽次數 = ∑Ei(freq.) × weight
weight value:
counts of views (11月最後七天)
total counts (11月最後七天)
• Ei(freq.) = sum(IMF4–8 & Resid.)
• 總瀏覽時間⼤大於500⼩小時, 取18pm 以後的次數
再次修改之後上傳
得分:80.415
預測值介於 0~1 的數值改為 0 (次數分配偏向 exponential-
like distribution)
將預測值乘上校正機率
15年12月19⽇日星期六