SlideShare a Scribd company logo
n-gram




         1
NLP




      2
✓ n-gram
    - n-gram
    - n-gram
✓              n-gram
    -
    -
✓ Ameba          n-gram
    - n-gram
    -
    -

                          3
n-gram




         4
N




n-1              n

      ....




                     5
N




n-1               n

      ....
      _
      _
      _   _

                      6
n
2-gram



         _
         _   _
         _   _   _CD
         _   _   _     _




                               7
n
2-gram



         _
         _   _
         _   _   _CD
         _   _   _     _




                               8
n
2-gram



         _
         _   _
         _   _   _CD
         _   _   _     _




                               9
n
2-gram



         _
         _   _
         _   _   _CD
         _   _   _     _




                               10
11
n-gram




         12
13
GSK
      ※
          n


              MeCab

                      14
15
※
n


    MeCab ipadic

                   16
17
18
19
✓ n-gram
    - n-gram
    - n-gram
✓              n-gram
    -
    -
✓ Ameba          n-gram
    - n-gram
    -
    -

                          20
Baidu




        21
22
※Google




          23
24
•
•
    Baidu




            25
−   −


        NG




             26
−   −




        27
_           _       _       _       _           _   _
    _           _       _       _       _           _   _
_       _   _       _               _           _
            _       _2038_                  _       _   _       _   _   _   _
            _       _       _       _
    _           _       _       _       _                   _




                                                                                28
_           _       _       _       _           _   _
    _           _       _       _       _           _   _
_       _   _       _               _           _
            _       _2038_                  _       _   _       _   _   _   _
            _       _       _       _
    _           _       _       _       _                   _




                                                                                29
1.                     w   v


     ※   n-gram

2. w               v
     Weight
3. wi         wj
     Measure



                               30
n-gram
            n-gram
 n > 1)   1-gram




                     31
Weight




freq(w)     w
freq(v)             v
freq(w,v)       w       v




                            32
Measure
[2010         ]             Simpson       Jaccard
                        Simpson-Jaccard




※Vi   Vj   wi,wj
※Simpson          Jaccard

                                                    33
[2010   ]http://nlp.nagaokaut.ac.jp/arc/10/10NLP-asakura.pdf




                                                               34
35
10



     ...




           36
1.
2.      Simpson-Jaccard [    2010]

3. 2+            [   2010]




•
•

                                     37
38
39
•   →
    →

•    5   9



•



             40
10     ×




[       ]




    →
    →       .....


                         100

                               41
42
•

•


•

• BootStrap

              43
44
- FX	 0.0701096506659567
-      	 0.06259698742992559
-    	
     0.06042366216085525
-    	
     0.058799844151470174
-         	 0.05735695738694635
-    	
     0.055435815549429605
-    	
     0.05232985446935419
-       	
        0.04980454574094188
-    	
     0.04927509063333216
-    	
     0.04824717092086649




                                  45
-   	
    0.13373671096183018
-    	 0.0918404883164821
-    	 0.08504703320048444
-    	 0.07961197269662577
-   	
    0.07711954365644495
-   	
    0.07702996997666198
-   	
    0.07662113919947415
-   	
    0.0725147419575286
-   	
    0.06882302518118967
-      	
       0.06849300043195472




                             46
-            	
             0.46469658771106315
-    	 0.11975034678985662
-    	 0.1097484574232766
-    	 0.09879163577196441
-    	 0.09813513570488815
- <EMOJI_546>	0.09719796981762122
-    	 0.09570307958644202
-    	 0.09472409933583924
- □	0.09466494353310652
-     	0.0939216442782036




                                    47
-    	 0.1315343475643398
-    	 0.09995353106829284
- <EMOJI_195>	0.07684385370515374
-          	 0.0668208753259571
-    	 0.064557866506281
-          	 0.06399098585323154
-    	 0.0631873841230999
-         	
          0.059873448412962174
-       	 0.058499392875879214
-          	 0.05843526443912576




                                    48
-         	
          0.05180321648370331
-     	
      0.04568992635712712
-       	 0.03513069449040805
-    	 0.027690371652517847
-     	
      0.024491134248894916
-    	 0.024070717542493413
-    	 0.013918762159274874
- <EMOJI_1BE>	0.013795160758545503
-    	 0.011283944598435737
-    	 0.009334867761007871




                                     49
•




•




    50
51
Baidu          n-gram




        UI

1.


2.
3. 2.        Trie              Double Array Trie Tree
4.                      Trie       Common Prefix Search


                                                         52
53
Amazon EC2
High Performance Computing(HPC)
         2010/07/13




             1.6$ / hour ( 150

                                  54
Amazon EC2 HPC
          4GB




                 55
✓ n-gram
    - n-gram
    - n-gram
✓              n-gram
    -
    -
✓ Ameba          n-gram
    - n-gram
    -
    -

                          56
Ameba
n-gram




         57
Ameba
                n-gram

                n                          7


                            MeCab ipadic
            1        122,500 /     2           1,195,628
        3           1,586,205 /        4        1,021,938
            5         499,788 /     6          231,064
                        7         117,515



                                                            58
n




    59
•
•

•
    •           (<EMOJI_xxx>)


    •
        7,500

• Ameba
                                60
•                         MeCab   ipadic
•                    Hadoop
    • Map/Reduce      5
    •      -gram

•
    •           →
    •         →
    • Unicode       NFKC

•
    •
                                           61
Unicode


    ※




•
•
•
•




          62
•
•




    63
64
<EMOJI_031> - <EMOJI_123>	 0.25245663283888076
<EMOJI_031> -   	0.23865945647496203
<EMOJI_031> -      	0.2233787922434289
<EMOJI_031>   -   <EMOJI_139>	 0.21505030767963476
<EMOJI_031>   -   <EMOJI_320>	 0.20905272608162664
<EMOJI_031>   -   <EMOJI_176>	 0.20767832299973635
<EMOJI_031>   -   ww	0.20396530274266259
<EMOJI_031>   -   <EMOJI_035>	 0.1952646415960877
<EMOJI_031>   -   <EMOJI_029>	 0.19118380193173534
<EMOJI_031>   -     	0.18532801238518545




                                                     65
<EMOJI_022> -         	5.05433098481788
<EMOJI_022>   -   <EMOJI_106>	   0.21255982715221317
<EMOJI_022>   -   <EMOJI_178>	   0.20371824309787556
<EMOJI_022>   -   <EMOJI_105>	   0.19694261277461542
<EMOJI_022>   -   <EMOJI_324>	   0.1960739883132334
<EMOJI_022>   -   <EMOJI_028>	   0.19591157145392102
<EMOJI_022>   -   <EMOJI_143>	   0.19367459051404434
<EMOJI_022>   -   <EMOJI_089>	   0.1894972913601391
<EMOJI_022>   -   <EMOJI_319>	   0.1853140205685605
<EMOJI_022>   -   <EMOJI_187>	   0.18316119166397835




                                                       66
<EMOJI_021> -      	0.1980766824375306
<EMOJI_021> -        	   0.160789228797033
<EMOJI_021> - <EMOJI_143>	 0.15832172025846883
<EMOJI_021> - <EMOJI_325>	 0.15752899334689507
<EMOJI_021> -    	 0.15600103135195192
<EMOJI_021>   -   <EMOJI_089>	 0.15588927293536636
<EMOJI_021>   -   <EMOJI_144>	 0.15288842785042273
<EMOJI_021>   -   <EMOJI_141>	 0.15264128047608577
<EMOJI_021>   -   <EMOJI_022>	 0.1524110403297163
<EMOJI_021>   -      	 0.1520281112500744




                                                     67
<EMOJI_077> -         	 0.20100120017122702
<EMOJI_077>   - <EMOJI_075>	 0.16814782000472359
<EMOJI_077>   - <EMOJI_188>	 0.16407662484190644
<EMOJI_077>   - <EMOJI_134>	 0.1598560562097877
<EMOJI_077>   -   	0.15753861586037332
<EMOJI_077>   -   <EMOJI_007>	 0.1520971768068388
<EMOJI_077>   -   <EMOJI_014>	 0.15101611087607572
<EMOJI_077>   -   <EMOJI_162>	 0.15081721574211884
<EMOJI_077>   -   <EMOJI_044>	 0.14580103348348722
<EMOJI_077>   -     	0.13778630432134603




                                                     68
<EMOJI_181> - <EMOJI_150>	 0.0998223599336455
<EMOJI_181> - <EMOJI_169>	 0.09619906986114168
<EMOJI_181> -    	 0.09407484828035773
<EMOJI_181> -    	   0.0751037382171799
<EMOJI_181> - <EMOJI_008>	 0.06918233066750942
<EMOJI_181> -      	0.05804747259025906
<EMOJI_181> -    	   0.05277048261006679
<EMOJI_181> -   	0.05059336124231738
<EMOJI_181> -    	   0.049448742078198986
<EMOJI_181> - <EMOJI_113>	 0.04768875635910332




                                                 69
70
Markov Clustering Algorithm


(          =                 ≒    )




※MCL:http://www.micans.org/mcl/




                                      71
(                     <>
<             > <               > <                    > <               > <         >         <         > <      > <             > <           >

<                 > <                  > <       > <             > <           > <       > <
                                                                                               <end> <       > <             > <           > <            >
        >

<                 > <     > <         > <              >                                       <   > <                        > <          >


<             > <          > <        > <        > <                 >                         <         > <            > <                          >


<             > <               > <         >                                                  <            > <         > <           >


<       > <         > <          >                                                             <            > <         > <               > <CD> <             >


<             > <          > <         > <             >                                       <            > <             > <                > <            >

                                                                                               <         > <            > <               > <            > <       > <     > <         > <    > <
<           > <     > <CD> <           >
                                                                                                     > <          > <                 > <            >

<                 > <           > <             > <          >                                 <         > <      > <             >

<                               > <                        > <            > <
                                                                                               <         > <       > <                >
    >
                                                                                               <         > <       > <CD> <                > <           > <             > <     > <    > <
<             > <          > <              >
                                                                                               > <         > <          >

<             > <         > <         > <NEW>                                                  <                  > <             > <NEW> <                    >


<           > <           > <         > <        > <             >

                                                                                                                                                                                                    72
<    > <              > <                 > <
    > <               >

<    > <         > <         > <          >


<                     > <                     > <
      > <                             >


<    > <        > <         > <NEW>



<         > <     > <              > <          >



<    > <         > <           > <            > <         >
<   > <         > <          > <      > <           > <
      > <         >

                                                              73
•




•




    74
75
(`         ω        )

(`   ) -        	0.1768694301100037
(`   ) - ⊃	 0.09913242362438676
(`   ) - ({(	   0.09405018119300235
(`   ) -   	0.031062102211042445
(`   ) -        	0.028857016807085342
(`   ) -   	0.02608930784914413
(`   ) - σ	 0.022498088286870093
(`   ) -   	0.016193426515270032
(`   ) - ω	0.016122858488317616
(`   ) -    	 0.01345138088760404




                                        76
(^∀^)

(^∀^)   -        	
                 0.06916344408426699
(^∀^)   -      	 0.06890434881805171
(^∀^)   -         	 0.06795858079282872
(^∀^)   -         	 0.05823929001282186
(^∀^)   -    	
             0.05591209864361552
(^∀^)   -             	 0.055199102468491
(^∀^)   -   	 0.0529766713691993
(^∀^)   -    	
             0.04651788654030653
(^∀^)   -      	 0.04506786291842584




                                            77
(*́д`)

(*́д`) -      	 0.11168727359492218
(*́д`) -   	 0.10079146007557346
(*́д`) -   	 0.09144542975809382
(*́д`) -   	 0.08668152231221557
(*́д`) -   	 0.0828216114116598
(*́д`) -   	 0.07886784003012988
(*́д`) -   	 0.07516063088790395
(*́д`) - д	0.04393643491834669
(*́д`) -    	 0.04391789518745296
(*́д`) -   	 0.041770270015884854




                                      78
(/ω)

(/ω) -   	    0.16208491557582996
(/ω) - ///	 0.12872038557250623
(/ω) -      	 0.1280711164456965
(/ω) -             	   0.11152828905321341
(/ω) -       	 0.09964963425187295
(/ω) -       	 0.09765195595553885
(/ω) -        	    0.09551633971030135
(/ω) -            	 0.08766541396665446
(/ω) - 	
         0.0857860000269694
(/ω) -         	 0.07871911676808412




                                              79
(^0^)/

(^0^)/ -        	 0.09445225976273072
(^0^)/ -             	 0.036873637365873665
(^0^)/ -    	    0.026846223878548046
(^0^)/ - 0	 0.024911172513660745
(^0^)/ -      	 0.019634091253330398
(^0^)/ -             	 0.01680880907554066
(^0^)/ - ^	 0.016789481994256183
(^0^)/ -   	 0.016144113065194438
(^0^)/ -         	    0.015391342223916664
(^0^)/ -    	 .01494851710964888
             0




                                               80
Google Docs              200

http://docs.google.com/leaf?
id=0B5kuQ0wVMAkMNmRhMzM3YzYtYjNlOS00YWI0LWFhYjktZDM2MDFiNWQwY2Zh&hl=ja&a
uthkey=CLbOpdEE




                                                                           81
•




    82
83
•




• n-gram




           84
• 100%




•




         85
86

More Related Content

Viewers also liked

WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成Koji Sekiguchi
 
TensorFlowを使ってテキストをクラス分類してみた
TensorFlowを使ってテキストをクラス分類してみたTensorFlowを使ってテキストをクラス分類してみた
TensorFlowを使ってテキストをクラス分類してみた
Yuya Kato
 
深層学習時代の自然言語処理
深層学習時代の自然言語処理深層学習時代の自然言語処理
深層学習時代の自然言語処理
Yuya Unno
 
中国最新ニュースアプリ事情
中国最新ニュースアプリ事情中国最新ニュースアプリ事情
中国最新ニュースアプリ事情
moai kids
 
mecab-ipadic-NEologd の効果的な使い方
mecab-ipadic-NEologd の効果的な使い方mecab-ipadic-NEologd の効果的な使い方
mecab-ipadic-NEologd の効果的な使い方
Toshinori Sato
 
Pythonで自然言語処理
Pythonで自然言語処理Pythonで自然言語処理
Pythonで自然言語処理moai kids
 
Jubatusでマルウェア分類
Jubatusでマルウェア分類Jubatusでマルウェア分類
Jubatusでマルウェア分類
Shuzo Kashihara
 
自然言語処理はじめました - Ngramを数え上げまくる
自然言語処理はじめました - Ngramを数え上げまくる自然言語処理はじめました - Ngramを数え上げまくる
自然言語処理はじめました - Ngramを数え上げまくる
phyllo
 
TensorFlowを使ってテキストをクラス分類してみたら精度96.8%の分類器を簡単に得ることができた話
TensorFlowを使ってテキストをクラス分類してみたら精度96.8%の分類器を簡単に得ることができた話TensorFlowを使ってテキストをクラス分類してみたら精度96.8%の分類器を簡単に得ることができた話
TensorFlowを使ってテキストをクラス分類してみたら精度96.8%の分類器を簡単に得ることができた話
Yuya Kato
 
ジャストシステムの形態素解析技術 その2 機械学習編
ジャストシステムの形態素解析技術 その2 機械学習編ジャストシステムの形態素解析技術 その2 機械学習編
ジャストシステムの形態素解析技術 その2 機械学習編
JustSystems Corporation
 
乱択データ構造の最新事情 -MinHash と HyperLogLog の最近の進歩-
乱択データ構造の最新事情 -MinHash と HyperLogLog の最近の進歩-乱択データ構造の最新事情 -MinHash と HyperLogLog の最近の進歩-
乱択データ構造の最新事情 -MinHash と HyperLogLog の最近の進歩-
Takuya Akiba
 
自然言語処理における機械学習による曖昧性解消入門
自然言語処理における機械学習による曖昧性解消入門自然言語処理における機械学習による曖昧性解消入門
自然言語処理における機械学習による曖昧性解消入門Koji Sekiguchi
 
自然言語処理 Word2vec
自然言語処理 Word2vec自然言語処理 Word2vec
自然言語処理 Word2vec
naoto moriyama
 
ジャストシステムの形態素解析技術
ジャストシステムの形態素解析技術ジャストシステムの形態素解析技術
ジャストシステムの形態素解析技術
JustSystems Corporation
 
小町のレス数が予測できるか試してみた
小町のレス数が予測できるか試してみた小町のレス数が予測できるか試してみた
小町のレス数が予測できるか試してみた
JubatusOfficial
 
jubarecommenderの紹介
jubarecommenderの紹介jubarecommenderの紹介
jubarecommenderの紹介
JubatusOfficial
 
単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)
JubatusOfficial
 
新聞から今年の漢字を予測する
新聞から今年の漢字を予測する新聞から今年の漢字を予測する
新聞から今年の漢字を予測する
JubatusOfficial
 
JubaQLご紹介
JubaQLご紹介JubaQLご紹介
JubaQLご紹介
JubatusOfficial
 
jubabanditの紹介
jubabanditの紹介jubabanditの紹介
jubabanditの紹介
JubatusOfficial
 

Viewers also liked (20)

WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成
 
TensorFlowを使ってテキストをクラス分類してみた
TensorFlowを使ってテキストをクラス分類してみたTensorFlowを使ってテキストをクラス分類してみた
TensorFlowを使ってテキストをクラス分類してみた
 
深層学習時代の自然言語処理
深層学習時代の自然言語処理深層学習時代の自然言語処理
深層学習時代の自然言語処理
 
中国最新ニュースアプリ事情
中国最新ニュースアプリ事情中国最新ニュースアプリ事情
中国最新ニュースアプリ事情
 
mecab-ipadic-NEologd の効果的な使い方
mecab-ipadic-NEologd の効果的な使い方mecab-ipadic-NEologd の効果的な使い方
mecab-ipadic-NEologd の効果的な使い方
 
Pythonで自然言語処理
Pythonで自然言語処理Pythonで自然言語処理
Pythonで自然言語処理
 
Jubatusでマルウェア分類
Jubatusでマルウェア分類Jubatusでマルウェア分類
Jubatusでマルウェア分類
 
自然言語処理はじめました - Ngramを数え上げまくる
自然言語処理はじめました - Ngramを数え上げまくる自然言語処理はじめました - Ngramを数え上げまくる
自然言語処理はじめました - Ngramを数え上げまくる
 
TensorFlowを使ってテキストをクラス分類してみたら精度96.8%の分類器を簡単に得ることができた話
TensorFlowを使ってテキストをクラス分類してみたら精度96.8%の分類器を簡単に得ることができた話TensorFlowを使ってテキストをクラス分類してみたら精度96.8%の分類器を簡単に得ることができた話
TensorFlowを使ってテキストをクラス分類してみたら精度96.8%の分類器を簡単に得ることができた話
 
ジャストシステムの形態素解析技術 その2 機械学習編
ジャストシステムの形態素解析技術 その2 機械学習編ジャストシステムの形態素解析技術 その2 機械学習編
ジャストシステムの形態素解析技術 その2 機械学習編
 
乱択データ構造の最新事情 -MinHash と HyperLogLog の最近の進歩-
乱択データ構造の最新事情 -MinHash と HyperLogLog の最近の進歩-乱択データ構造の最新事情 -MinHash と HyperLogLog の最近の進歩-
乱択データ構造の最新事情 -MinHash と HyperLogLog の最近の進歩-
 
自然言語処理における機械学習による曖昧性解消入門
自然言語処理における機械学習による曖昧性解消入門自然言語処理における機械学習による曖昧性解消入門
自然言語処理における機械学習による曖昧性解消入門
 
自然言語処理 Word2vec
自然言語処理 Word2vec自然言語処理 Word2vec
自然言語処理 Word2vec
 
ジャストシステムの形態素解析技術
ジャストシステムの形態素解析技術ジャストシステムの形態素解析技術
ジャストシステムの形態素解析技術
 
小町のレス数が予測できるか試してみた
小町のレス数が予測できるか試してみた小町のレス数が予測できるか試してみた
小町のレス数が予測できるか試してみた
 
jubarecommenderの紹介
jubarecommenderの紹介jubarecommenderの紹介
jubarecommenderの紹介
 
単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)
 
新聞から今年の漢字を予測する
新聞から今年の漢字を予測する新聞から今年の漢字を予測する
新聞から今年の漢字を予測する
 
JubaQLご紹介
JubaQLご紹介JubaQLご紹介
JubaQLご紹介
 
jubabanditの紹介
jubabanditの紹介jubabanditの紹介
jubabanditの紹介
 

Similar to n-gramコーパスを用いた類義語自動獲得手法について

Myspace Cube
Myspace CubeMyspace Cube
Myspace Cubetikim143
 
Tibet trip (Chinese version with lots of pictures)
Tibet trip (Chinese version with lots of pictures)Tibet trip (Chinese version with lots of pictures)
Tibet trip (Chinese version with lots of pictures)
wx672
 
Triangulation Sample
Triangulation  SampleTriangulation  Sample
Triangulation SampleChattichai
 
BPStudy #45 自転車 de ダイエット
BPStudy #45 自転車 de ダイエットBPStudy #45 自転車 de ダイエット
BPStudy #45 自転車 de ダイエット
Mitsukuni Sato
 
次世代シーケンサのデータ解析 技術開発編
次世代シーケンサのデータ解析 技術開発編次世代シーケンサのデータ解析 技術開発編
次世代シーケンサのデータ解析 技術開発編mickey24
 

Similar to n-gramコーパスを用いた類義語自動獲得手法について (6)

ปัญหาพิเศษ
ปัญหาพิเศษปัญหาพิเศษ
ปัญหาพิเศษ
 
Myspace Cube
Myspace CubeMyspace Cube
Myspace Cube
 
Tibet trip (Chinese version with lots of pictures)
Tibet trip (Chinese version with lots of pictures)Tibet trip (Chinese version with lots of pictures)
Tibet trip (Chinese version with lots of pictures)
 
Triangulation Sample
Triangulation  SampleTriangulation  Sample
Triangulation Sample
 
BPStudy #45 自転車 de ダイエット
BPStudy #45 自転車 de ダイエットBPStudy #45 自転車 de ダイエット
BPStudy #45 自転車 de ダイエット
 
次世代シーケンサのデータ解析 技術開発編
次世代シーケンサのデータ解析 技術開発編次世代シーケンサのデータ解析 技術開発編
次世代シーケンサのデータ解析 技術開発編
 

More from moai kids

FluentdとRedshiftの素敵な関係
FluentdとRedshiftの素敵な関係FluentdとRedshiftの素敵な関係
FluentdとRedshiftの素敵な関係moai kids
 
Twitterのsnowflakeについて
TwitterのsnowflakeについてTwitterのsnowflakeについて
Twitterのsnowflakeについてmoai kids
 
Programming Hive Reading #4
Programming Hive Reading #4Programming Hive Reading #4
Programming Hive Reading #4moai kids
 
Programming Hive Reading #3
Programming Hive Reading #3Programming Hive Reading #3
Programming Hive Reading #3moai kids
 
"Programming Hive" Reading #1
"Programming Hive" Reading #1"Programming Hive" Reading #1
"Programming Hive" Reading #1moai kids
 
Casual Compression on MongoDB
Casual Compression on MongoDBCasual Compression on MongoDB
Casual Compression on MongoDBmoai kids
 
Introduction to MongoDB
Introduction to MongoDBIntroduction to MongoDB
Introduction to MongoDBmoai kids
 
Hadoop Conference Japan 2011 Fallに行ってきました
Hadoop Conference Japan 2011 Fallに行ってきましたHadoop Conference Japan 2011 Fallに行ってきました
Hadoop Conference Japan 2011 Fallに行ってきましたmoai kids
 
HBase本輪読会資料(11章)
HBase本輪読会資料(11章)HBase本輪読会資料(11章)
HBase本輪読会資料(11章)moai kids
 
snappyについて
snappyについてsnappyについて
snappyについて
moai kids
 
第四回月次セミナー(公開版)
第四回月次セミナー(公開版)第四回月次セミナー(公開版)
第四回月次セミナー(公開版)moai kids
 
第三回月次セミナー(公開版)
第三回月次セミナー(公開版)第三回月次セミナー(公開版)
第三回月次セミナー(公開版)moai kids
 
HandlerSocket plugin Client for Javaとそれを用いたベンチマーク
HandlerSocket plugin Client for Javaとそれを用いたベンチマークHandlerSocket plugin Client for Javaとそれを用いたベンチマーク
HandlerSocket plugin Client for Javaとそれを用いたベンチマークmoai kids
 
Yammer試用レポート(公開版)
Yammer試用レポート(公開版)Yammer試用レポート(公開版)
Yammer試用レポート(公開版)moai kids
 
掲示板時間軸コーパスを用いたワードトレンド解析(公開版)
掲示板時間軸コーパスを用いたワードトレンド解析(公開版)掲示板時間軸コーパスを用いたワードトレンド解析(公開版)
掲示板時間軸コーパスを用いたワードトレンド解析(公開版)moai kids
 
中国と私(仮題)
中国と私(仮題)中国と私(仮題)
中国と私(仮題)moai kids
 
不自然言語処理コンテストLT資料
不自然言語処理コンテストLT資料不自然言語処理コンテストLT資料
不自然言語処理コンテストLT資料moai kids
 
Analysis of ‘lang-8’
Analysis of ‘lang-8’Analysis of ‘lang-8’
Analysis of ‘lang-8’moai kids
 
Androidの音声認識とテキスト読み上げ機能について
Androidの音声認識とテキスト読み上げ機能についてAndroidの音声認識とテキスト読み上げ機能について
Androidの音声認識とテキスト読み上げ機能についてmoai kids
 
Amebaサーチ使用傾向
Amebaサーチ使用傾向Amebaサーチ使用傾向
Amebaサーチ使用傾向moai kids
 

More from moai kids (20)

FluentdとRedshiftの素敵な関係
FluentdとRedshiftの素敵な関係FluentdとRedshiftの素敵な関係
FluentdとRedshiftの素敵な関係
 
Twitterのsnowflakeについて
TwitterのsnowflakeについてTwitterのsnowflakeについて
Twitterのsnowflakeについて
 
Programming Hive Reading #4
Programming Hive Reading #4Programming Hive Reading #4
Programming Hive Reading #4
 
Programming Hive Reading #3
Programming Hive Reading #3Programming Hive Reading #3
Programming Hive Reading #3
 
"Programming Hive" Reading #1
"Programming Hive" Reading #1"Programming Hive" Reading #1
"Programming Hive" Reading #1
 
Casual Compression on MongoDB
Casual Compression on MongoDBCasual Compression on MongoDB
Casual Compression on MongoDB
 
Introduction to MongoDB
Introduction to MongoDBIntroduction to MongoDB
Introduction to MongoDB
 
Hadoop Conference Japan 2011 Fallに行ってきました
Hadoop Conference Japan 2011 Fallに行ってきましたHadoop Conference Japan 2011 Fallに行ってきました
Hadoop Conference Japan 2011 Fallに行ってきました
 
HBase本輪読会資料(11章)
HBase本輪読会資料(11章)HBase本輪読会資料(11章)
HBase本輪読会資料(11章)
 
snappyについて
snappyについてsnappyについて
snappyについて
 
第四回月次セミナー(公開版)
第四回月次セミナー(公開版)第四回月次セミナー(公開版)
第四回月次セミナー(公開版)
 
第三回月次セミナー(公開版)
第三回月次セミナー(公開版)第三回月次セミナー(公開版)
第三回月次セミナー(公開版)
 
HandlerSocket plugin Client for Javaとそれを用いたベンチマーク
HandlerSocket plugin Client for Javaとそれを用いたベンチマークHandlerSocket plugin Client for Javaとそれを用いたベンチマーク
HandlerSocket plugin Client for Javaとそれを用いたベンチマーク
 
Yammer試用レポート(公開版)
Yammer試用レポート(公開版)Yammer試用レポート(公開版)
Yammer試用レポート(公開版)
 
掲示板時間軸コーパスを用いたワードトレンド解析(公開版)
掲示板時間軸コーパスを用いたワードトレンド解析(公開版)掲示板時間軸コーパスを用いたワードトレンド解析(公開版)
掲示板時間軸コーパスを用いたワードトレンド解析(公開版)
 
中国と私(仮題)
中国と私(仮題)中国と私(仮題)
中国と私(仮題)
 
不自然言語処理コンテストLT資料
不自然言語処理コンテストLT資料不自然言語処理コンテストLT資料
不自然言語処理コンテストLT資料
 
Analysis of ‘lang-8’
Analysis of ‘lang-8’Analysis of ‘lang-8’
Analysis of ‘lang-8’
 
Androidの音声認識とテキスト読み上げ機能について
Androidの音声認識とテキスト読み上げ機能についてAndroidの音声認識とテキスト読み上げ機能について
Androidの音声認識とテキスト読み上げ機能について
 
Amebaサーチ使用傾向
Amebaサーチ使用傾向Amebaサーチ使用傾向
Amebaサーチ使用傾向
 

Recently uploaded

UiPath Test Automation using UiPath Test Suite series, part 4
UiPath Test Automation using UiPath Test Suite series, part 4UiPath Test Automation using UiPath Test Suite series, part 4
UiPath Test Automation using UiPath Test Suite series, part 4
DianaGray10
 
Encryption in Microsoft 365 - ExpertsLive Netherlands 2024
Encryption in Microsoft 365 - ExpertsLive Netherlands 2024Encryption in Microsoft 365 - ExpertsLive Netherlands 2024
Encryption in Microsoft 365 - ExpertsLive Netherlands 2024
Albert Hoitingh
 
Elevating Tactical DDD Patterns Through Object Calisthenics
Elevating Tactical DDD Patterns Through Object CalisthenicsElevating Tactical DDD Patterns Through Object Calisthenics
Elevating Tactical DDD Patterns Through Object Calisthenics
Dorra BARTAGUIZ
 
Essentials of Automations: Optimizing FME Workflows with Parameters
Essentials of Automations: Optimizing FME Workflows with ParametersEssentials of Automations: Optimizing FME Workflows with Parameters
Essentials of Automations: Optimizing FME Workflows with Parameters
Safe Software
 
The Future of Platform Engineering
The Future of Platform EngineeringThe Future of Platform Engineering
The Future of Platform Engineering
Jemma Hussein Allen
 
When stars align: studies in data quality, knowledge graphs, and machine lear...
When stars align: studies in data quality, knowledge graphs, and machine lear...When stars align: studies in data quality, knowledge graphs, and machine lear...
When stars align: studies in data quality, knowledge graphs, and machine lear...
Elena Simperl
 
GDG Cloud Southlake #33: Boule & Rebala: Effective AppSec in SDLC using Deplo...
GDG Cloud Southlake #33: Boule & Rebala: Effective AppSec in SDLC using Deplo...GDG Cloud Southlake #33: Boule & Rebala: Effective AppSec in SDLC using Deplo...
GDG Cloud Southlake #33: Boule & Rebala: Effective AppSec in SDLC using Deplo...
James Anderson
 
Designing Great Products: The Power of Design and Leadership by Chief Designe...
Designing Great Products: The Power of Design and Leadership by Chief Designe...Designing Great Products: The Power of Design and Leadership by Chief Designe...
Designing Great Products: The Power of Design and Leadership by Chief Designe...
Product School
 
Empowering NextGen Mobility via Large Action Model Infrastructure (LAMI): pav...
Empowering NextGen Mobility via Large Action Model Infrastructure (LAMI): pav...Empowering NextGen Mobility via Large Action Model Infrastructure (LAMI): pav...
Empowering NextGen Mobility via Large Action Model Infrastructure (LAMI): pav...
Thierry Lestable
 
Dev Dives: Train smarter, not harder – active learning and UiPath LLMs for do...
Dev Dives: Train smarter, not harder – active learning and UiPath LLMs for do...Dev Dives: Train smarter, not harder – active learning and UiPath LLMs for do...
Dev Dives: Train smarter, not harder – active learning and UiPath LLMs for do...
UiPathCommunity
 
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...
Jeffrey Haguewood
 
Kubernetes & AI - Beauty and the Beast !?! @KCD Istanbul 2024
Kubernetes & AI - Beauty and the Beast !?! @KCD Istanbul 2024Kubernetes & AI - Beauty and the Beast !?! @KCD Istanbul 2024
Kubernetes & AI - Beauty and the Beast !?! @KCD Istanbul 2024
Tobias Schneck
 
How world-class product teams are winning in the AI era by CEO and Founder, P...
How world-class product teams are winning in the AI era by CEO and Founder, P...How world-class product teams are winning in the AI era by CEO and Founder, P...
How world-class product teams are winning in the AI era by CEO and Founder, P...
Product School
 
Builder.ai Founder Sachin Dev Duggal's Strategic Approach to Create an Innova...
Builder.ai Founder Sachin Dev Duggal's Strategic Approach to Create an Innova...Builder.ai Founder Sachin Dev Duggal's Strategic Approach to Create an Innova...
Builder.ai Founder Sachin Dev Duggal's Strategic Approach to Create an Innova...
Ramesh Iyer
 
FIDO Alliance Osaka Seminar: FIDO Security Aspects.pdf
FIDO Alliance Osaka Seminar: FIDO Security Aspects.pdfFIDO Alliance Osaka Seminar: FIDO Security Aspects.pdf
FIDO Alliance Osaka Seminar: FIDO Security Aspects.pdf
FIDO Alliance
 
Epistemic Interaction - tuning interfaces to provide information for AI support
Epistemic Interaction - tuning interfaces to provide information for AI supportEpistemic Interaction - tuning interfaces to provide information for AI support
Epistemic Interaction - tuning interfaces to provide information for AI support
Alan Dix
 
FIDO Alliance Osaka Seminar: Passkeys at Amazon.pdf
FIDO Alliance Osaka Seminar: Passkeys at Amazon.pdfFIDO Alliance Osaka Seminar: Passkeys at Amazon.pdf
FIDO Alliance Osaka Seminar: Passkeys at Amazon.pdf
FIDO Alliance
 
Securing your Kubernetes cluster_ a step-by-step guide to success !
Securing your Kubernetes cluster_ a step-by-step guide to success !Securing your Kubernetes cluster_ a step-by-step guide to success !
Securing your Kubernetes cluster_ a step-by-step guide to success !
KatiaHIMEUR1
 
Software Delivery At the Speed of AI: Inflectra Invests In AI-Powered Quality
Software Delivery At the Speed of AI: Inflectra Invests In AI-Powered QualitySoftware Delivery At the Speed of AI: Inflectra Invests In AI-Powered Quality
Software Delivery At the Speed of AI: Inflectra Invests In AI-Powered Quality
Inflectra
 
Assuring Contact Center Experiences for Your Customers With ThousandEyes
Assuring Contact Center Experiences for Your Customers With ThousandEyesAssuring Contact Center Experiences for Your Customers With ThousandEyes
Assuring Contact Center Experiences for Your Customers With ThousandEyes
ThousandEyes
 

Recently uploaded (20)

UiPath Test Automation using UiPath Test Suite series, part 4
UiPath Test Automation using UiPath Test Suite series, part 4UiPath Test Automation using UiPath Test Suite series, part 4
UiPath Test Automation using UiPath Test Suite series, part 4
 
Encryption in Microsoft 365 - ExpertsLive Netherlands 2024
Encryption in Microsoft 365 - ExpertsLive Netherlands 2024Encryption in Microsoft 365 - ExpertsLive Netherlands 2024
Encryption in Microsoft 365 - ExpertsLive Netherlands 2024
 
Elevating Tactical DDD Patterns Through Object Calisthenics
Elevating Tactical DDD Patterns Through Object CalisthenicsElevating Tactical DDD Patterns Through Object Calisthenics
Elevating Tactical DDD Patterns Through Object Calisthenics
 
Essentials of Automations: Optimizing FME Workflows with Parameters
Essentials of Automations: Optimizing FME Workflows with ParametersEssentials of Automations: Optimizing FME Workflows with Parameters
Essentials of Automations: Optimizing FME Workflows with Parameters
 
The Future of Platform Engineering
The Future of Platform EngineeringThe Future of Platform Engineering
The Future of Platform Engineering
 
When stars align: studies in data quality, knowledge graphs, and machine lear...
When stars align: studies in data quality, knowledge graphs, and machine lear...When stars align: studies in data quality, knowledge graphs, and machine lear...
When stars align: studies in data quality, knowledge graphs, and machine lear...
 
GDG Cloud Southlake #33: Boule & Rebala: Effective AppSec in SDLC using Deplo...
GDG Cloud Southlake #33: Boule & Rebala: Effective AppSec in SDLC using Deplo...GDG Cloud Southlake #33: Boule & Rebala: Effective AppSec in SDLC using Deplo...
GDG Cloud Southlake #33: Boule & Rebala: Effective AppSec in SDLC using Deplo...
 
Designing Great Products: The Power of Design and Leadership by Chief Designe...
Designing Great Products: The Power of Design and Leadership by Chief Designe...Designing Great Products: The Power of Design and Leadership by Chief Designe...
Designing Great Products: The Power of Design and Leadership by Chief Designe...
 
Empowering NextGen Mobility via Large Action Model Infrastructure (LAMI): pav...
Empowering NextGen Mobility via Large Action Model Infrastructure (LAMI): pav...Empowering NextGen Mobility via Large Action Model Infrastructure (LAMI): pav...
Empowering NextGen Mobility via Large Action Model Infrastructure (LAMI): pav...
 
Dev Dives: Train smarter, not harder – active learning and UiPath LLMs for do...
Dev Dives: Train smarter, not harder – active learning and UiPath LLMs for do...Dev Dives: Train smarter, not harder – active learning and UiPath LLMs for do...
Dev Dives: Train smarter, not harder – active learning and UiPath LLMs for do...
 
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...
Slack (or Teams) Automation for Bonterra Impact Management (fka Social Soluti...
 
Kubernetes & AI - Beauty and the Beast !?! @KCD Istanbul 2024
Kubernetes & AI - Beauty and the Beast !?! @KCD Istanbul 2024Kubernetes & AI - Beauty and the Beast !?! @KCD Istanbul 2024
Kubernetes & AI - Beauty and the Beast !?! @KCD Istanbul 2024
 
How world-class product teams are winning in the AI era by CEO and Founder, P...
How world-class product teams are winning in the AI era by CEO and Founder, P...How world-class product teams are winning in the AI era by CEO and Founder, P...
How world-class product teams are winning in the AI era by CEO and Founder, P...
 
Builder.ai Founder Sachin Dev Duggal's Strategic Approach to Create an Innova...
Builder.ai Founder Sachin Dev Duggal's Strategic Approach to Create an Innova...Builder.ai Founder Sachin Dev Duggal's Strategic Approach to Create an Innova...
Builder.ai Founder Sachin Dev Duggal's Strategic Approach to Create an Innova...
 
FIDO Alliance Osaka Seminar: FIDO Security Aspects.pdf
FIDO Alliance Osaka Seminar: FIDO Security Aspects.pdfFIDO Alliance Osaka Seminar: FIDO Security Aspects.pdf
FIDO Alliance Osaka Seminar: FIDO Security Aspects.pdf
 
Epistemic Interaction - tuning interfaces to provide information for AI support
Epistemic Interaction - tuning interfaces to provide information for AI supportEpistemic Interaction - tuning interfaces to provide information for AI support
Epistemic Interaction - tuning interfaces to provide information for AI support
 
FIDO Alliance Osaka Seminar: Passkeys at Amazon.pdf
FIDO Alliance Osaka Seminar: Passkeys at Amazon.pdfFIDO Alliance Osaka Seminar: Passkeys at Amazon.pdf
FIDO Alliance Osaka Seminar: Passkeys at Amazon.pdf
 
Securing your Kubernetes cluster_ a step-by-step guide to success !
Securing your Kubernetes cluster_ a step-by-step guide to success !Securing your Kubernetes cluster_ a step-by-step guide to success !
Securing your Kubernetes cluster_ a step-by-step guide to success !
 
Software Delivery At the Speed of AI: Inflectra Invests In AI-Powered Quality
Software Delivery At the Speed of AI: Inflectra Invests In AI-Powered QualitySoftware Delivery At the Speed of AI: Inflectra Invests In AI-Powered Quality
Software Delivery At the Speed of AI: Inflectra Invests In AI-Powered Quality
 
Assuring Contact Center Experiences for Your Customers With ThousandEyes
Assuring Contact Center Experiences for Your Customers With ThousandEyesAssuring Contact Center Experiences for Your Customers With ThousandEyes
Assuring Contact Center Experiences for Your Customers With ThousandEyes
 

n-gramコーパスを用いた類義語自動獲得手法について

  • 1. n-gram 1
  • 2. NLP 2
  • 3. ✓ n-gram - n-gram - n-gram ✓ n-gram - - ✓ Ameba n-gram - n-gram - - 3
  • 4. n-gram 4
  • 5. N n-1 n .... 5
  • 6. N n-1 n .... _ _ _ _ 6
  • 7. n 2-gram _ _ _ _ _ _CD _ _ _ _ 7
  • 8. n 2-gram _ _ _ _ _ _CD _ _ _ _ 8
  • 9. n 2-gram _ _ _ _ _ _CD _ _ _ _ 9
  • 10. n 2-gram _ _ _ _ _ _CD _ _ _ _ 10
  • 11. 11
  • 12. n-gram 12
  • 13. 13
  • 14. GSK ※ n MeCab 14
  • 15. 15
  • 16. ※ n MeCab ipadic 16
  • 17. 17
  • 18. 18
  • 19. 19
  • 20. ✓ n-gram - n-gram - n-gram ✓ n-gram - - ✓ Ameba n-gram - n-gram - - 20
  • 21. Baidu 21
  • 22. 22
  • 23. ※Google 23
  • 24. 24
  • 25. • • Baidu 25
  • 26. − NG 26
  • 27. − 27
  • 28. _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _2038_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 28
  • 29. _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _2038_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 29
  • 30. 1. w v ※ n-gram 2. w v Weight 3. wi wj Measure 30
  • 31. n-gram n-gram n > 1) 1-gram 31
  • 32. Weight freq(w) w freq(v) v freq(w,v) w v 32
  • 33. Measure [2010 ] Simpson Jaccard Simpson-Jaccard ※Vi Vj wi,wj ※Simpson Jaccard 33
  • 34. [2010 ]http://nlp.nagaokaut.ac.jp/arc/10/10NLP-asakura.pdf 34
  • 35. 35
  • 36. 10 ... 36
  • 37. 1. 2. Simpson-Jaccard [ 2010] 3. 2+ [ 2010] • • 37
  • 38. 38
  • 39. 39
  • 40. → → • 5 9 • 40
  • 41. 10 × [ ] → → ..... 100 41
  • 42. 42
  • 44. 44
  • 45. - FX 0.0701096506659567 - 0.06259698742992559 - 0.06042366216085525 - 0.058799844151470174 - 0.05735695738694635 - 0.055435815549429605 - 0.05232985446935419 - 0.04980454574094188 - 0.04927509063333216 - 0.04824717092086649 45
  • 46. - 0.13373671096183018 - 0.0918404883164821 - 0.08504703320048444 - 0.07961197269662577 - 0.07711954365644495 - 0.07702996997666198 - 0.07662113919947415 - 0.0725147419575286 - 0.06882302518118967 - 0.06849300043195472 46
  • 47. - 0.46469658771106315 - 0.11975034678985662 - 0.1097484574232766 - 0.09879163577196441 - 0.09813513570488815 - <EMOJI_546> 0.09719796981762122 - 0.09570307958644202 - 0.09472409933583924 - □ 0.09466494353310652 - 0.0939216442782036 47
  • 48. - 0.1315343475643398 - 0.09995353106829284 - <EMOJI_195> 0.07684385370515374 - 0.0668208753259571 - 0.064557866506281 - 0.06399098585323154 - 0.0631873841230999 - 0.059873448412962174 - 0.058499392875879214 - 0.05843526443912576 48
  • 49. - 0.05180321648370331 - 0.04568992635712712 - 0.03513069449040805 - 0.027690371652517847 - 0.024491134248894916 - 0.024070717542493413 - 0.013918762159274874 - <EMOJI_1BE> 0.013795160758545503 - 0.011283944598435737 - 0.009334867761007871 49
  • 50. • • 50
  • 51. 51
  • 52. Baidu n-gram UI 1. 2. 3. 2. Trie Double Array Trie Tree 4. Trie Common Prefix Search 52
  • 53. 53
  • 54. Amazon EC2 High Performance Computing(HPC) 2010/07/13 1.6$ / hour ( 150 54
  • 55. Amazon EC2 HPC 4GB 55
  • 56. ✓ n-gram - n-gram - n-gram ✓ n-gram - - ✓ Ameba n-gram - n-gram - - 56
  • 58. Ameba n-gram n 7 MeCab ipadic 1 122,500 / 2 1,195,628 3 1,586,205 / 4 1,021,938 5 499,788 / 6 231,064 7 117,515 58
  • 59. n 59
  • 60. • • • • (<EMOJI_xxx>) • 7,500 • Ameba 60
  • 61. MeCab ipadic • Hadoop • Map/Reduce 5 • -gram • • → • → • Unicode NFKC • • 61
  • 62. Unicode ※ • • • • 62
  • 63. • • 63
  • 64. 64
  • 65. <EMOJI_031> - <EMOJI_123> 0.25245663283888076 <EMOJI_031> - 0.23865945647496203 <EMOJI_031> - 0.2233787922434289 <EMOJI_031> - <EMOJI_139> 0.21505030767963476 <EMOJI_031> - <EMOJI_320> 0.20905272608162664 <EMOJI_031> - <EMOJI_176> 0.20767832299973635 <EMOJI_031> - ww 0.20396530274266259 <EMOJI_031> - <EMOJI_035> 0.1952646415960877 <EMOJI_031> - <EMOJI_029> 0.19118380193173534 <EMOJI_031> - 0.18532801238518545 65
  • 66. <EMOJI_022> - 5.05433098481788 <EMOJI_022> - <EMOJI_106> 0.21255982715221317 <EMOJI_022> - <EMOJI_178> 0.20371824309787556 <EMOJI_022> - <EMOJI_105> 0.19694261277461542 <EMOJI_022> - <EMOJI_324> 0.1960739883132334 <EMOJI_022> - <EMOJI_028> 0.19591157145392102 <EMOJI_022> - <EMOJI_143> 0.19367459051404434 <EMOJI_022> - <EMOJI_089> 0.1894972913601391 <EMOJI_022> - <EMOJI_319> 0.1853140205685605 <EMOJI_022> - <EMOJI_187> 0.18316119166397835 66
  • 67. <EMOJI_021> - 0.1980766824375306 <EMOJI_021> - 0.160789228797033 <EMOJI_021> - <EMOJI_143> 0.15832172025846883 <EMOJI_021> - <EMOJI_325> 0.15752899334689507 <EMOJI_021> - 0.15600103135195192 <EMOJI_021> - <EMOJI_089> 0.15588927293536636 <EMOJI_021> - <EMOJI_144> 0.15288842785042273 <EMOJI_021> - <EMOJI_141> 0.15264128047608577 <EMOJI_021> - <EMOJI_022> 0.1524110403297163 <EMOJI_021> - 0.1520281112500744 67
  • 68. <EMOJI_077> - 0.20100120017122702 <EMOJI_077> - <EMOJI_075> 0.16814782000472359 <EMOJI_077> - <EMOJI_188> 0.16407662484190644 <EMOJI_077> - <EMOJI_134> 0.1598560562097877 <EMOJI_077> - 0.15753861586037332 <EMOJI_077> - <EMOJI_007> 0.1520971768068388 <EMOJI_077> - <EMOJI_014> 0.15101611087607572 <EMOJI_077> - <EMOJI_162> 0.15081721574211884 <EMOJI_077> - <EMOJI_044> 0.14580103348348722 <EMOJI_077> - 0.13778630432134603 68
  • 69. <EMOJI_181> - <EMOJI_150> 0.0998223599336455 <EMOJI_181> - <EMOJI_169> 0.09619906986114168 <EMOJI_181> - 0.09407484828035773 <EMOJI_181> - 0.0751037382171799 <EMOJI_181> - <EMOJI_008> 0.06918233066750942 <EMOJI_181> - 0.05804747259025906 <EMOJI_181> - 0.05277048261006679 <EMOJI_181> - 0.05059336124231738 <EMOJI_181> - 0.049448742078198986 <EMOJI_181> - <EMOJI_113> 0.04768875635910332 69
  • 70. 70
  • 71. Markov Clustering Algorithm ( = ≒ ) ※MCL:http://www.micans.org/mcl/ 71
  • 72. ( <> < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < <end> < > < > < > < > > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > <CD> < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < < > < > <CD> < > > < > < > < > < > < > < > < > < > < > < > < > < > < > < < > < > < > > < > < > <CD> < > < > < > < > < > < < > < > < > > < > < > < > < > < > <NEW> < > < > <NEW> < > < > < > < > < > < > 72
  • 73. < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > <NEW> < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > < > 73
  • 74. • • 74
  • 75. 75
  • 76. (` ω ) (` ) - 0.1768694301100037 (` ) - ⊃ 0.09913242362438676 (` ) - ({( 0.09405018119300235 (` ) - 0.031062102211042445 (` ) - 0.028857016807085342 (` ) - 0.02608930784914413 (` ) - σ 0.022498088286870093 (` ) - 0.016193426515270032 (` ) - ω 0.016122858488317616 (` ) - 0.01345138088760404 76
  • 77. (^∀^) (^∀^) - 0.06916344408426699 (^∀^) - 0.06890434881805171 (^∀^) - 0.06795858079282872 (^∀^) - 0.05823929001282186 (^∀^) - 0.05591209864361552 (^∀^) - 0.055199102468491 (^∀^) - 0.0529766713691993 (^∀^) - 0.04651788654030653 (^∀^) - 0.04506786291842584 77
  • 78. (*́д`) (*́д`) - 0.11168727359492218 (*́д`) - 0.10079146007557346 (*́д`) - 0.09144542975809382 (*́д`) - 0.08668152231221557 (*́д`) - 0.0828216114116598 (*́д`) - 0.07886784003012988 (*́д`) - 0.07516063088790395 (*́д`) - д 0.04393643491834669 (*́д`) - 0.04391789518745296 (*́д`) - 0.041770270015884854 78
  • 79. (/ω) (/ω) - 0.16208491557582996 (/ω) - /// 0.12872038557250623 (/ω) - 0.1280711164456965 (/ω) - 0.11152828905321341 (/ω) - 0.09964963425187295 (/ω) - 0.09765195595553885 (/ω) - 0.09551633971030135 (/ω) - 0.08766541396665446 (/ω) - 0.0857860000269694 (/ω) - 0.07871911676808412 79
  • 80. (^0^)/ (^0^)/ - 0.09445225976273072 (^0^)/ - 0.036873637365873665 (^0^)/ - 0.026846223878548046 (^0^)/ - 0 0.024911172513660745 (^0^)/ - 0.019634091253330398 (^0^)/ - 0.01680880907554066 (^0^)/ - ^ 0.016789481994256183 (^0^)/ - 0.016144113065194438 (^0^)/ - 0.015391342223916664 (^0^)/ - .01494851710964888 0 80
  • 81. Google Docs 200 http://docs.google.com/leaf? id=0B5kuQ0wVMAkMNmRhMzM3YzYtYjNlOS00YWI0LWFhYjktZDM2MDFiNWQwY2Zh&hl=ja&a uthkey=CLbOpdEE 81
  • 82. 82
  • 83. 83
  • 86. 86