‫ﺩﺍﻧﺸﮕﺎﻩ ﺍﺻﻔﻬﺎﻥ‬                           ‫ﺩﺍﻧﺸﮑﺪﻩ ﻓﻨﻲ ﻭ ﻣﻬﻨﺪﺳﻲ‬                              ‫ﮔﺮﻭﻩ ﮐﺎﻣﭙﻴﻮﺗﺮ‬         ‫ﻣﺤ...
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬                                   ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬                                      ...
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬                                   ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬                                      ...
‫ﺍﺻﻮﻝ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ )‪(Linked Data Principles‬‬                                                             ‫• ﺍﺳﺘﻔﺎﺩﻩ ﺍ...
‫ﺗﻌﺮﻳﻒ ﻣﻨﺎﺑﻊ ﺑﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺍﺻﻮﻝ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ )ﻣﺜﺎﻝ(‬    ‫‪http://dbpedia.org/page/Nigel_Clough‬‬‫5‬                    ...
‫ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ : ﺩﺭ ﺣﺎﻝ ﺣﺎﺿﺮ‬                                    ‫•‬‫6‬                          ‫72/9/0931‬            ...
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬                                   ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬                                      ...
‫ﻣﺴﺎﻟﻪ ﭘﺎﻳﺎﻥ ﻧﺎﻣﻪ‬                                          ‫ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ ﺑﻪ ﭼﻪ ﺷﮑﻠﯽ ﺍﻧﺠﺎﻡ ﺷﻮﺩ .‬  ...
‫ﺯﻳﺮ ﻣﺴﺎﻳﻞ ﭘﺎﻳﺎﻥ ﻧﺎﻣﻪ‬                                                                                   ‫ﻓﺎﺯﻫﺎﯼ ﭘﺮﻭﮊﻩ‬   ...
‫ﻣﺜﺎﻝ ﺑﺮﺍﯼ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ‬                                            ‫ﻫﻤﻪ ﻧﻮﺩﻫﺎ ﺍﺯ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ...
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬                                    ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬                                     ...
‫ﺭﻭﺷﻬﺎﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ‬                                                  ‫ﺑﻪ ﺳﻪ ﺩﺳﺘﻪ ﮐﻠﯽ ﺗﻘﺴﻴﻢ ﺑﻨﺪﯼ ﻣﯽ ﺷﻮﻧﺪ‬    ‫•‬   ...
‫ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ ‪SimRank‬‬                                    ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﻭﺭﻭﺩﯼ‬    ‫•‬                   ...
‫ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ ‪Bipartite‬‬                                ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﺧﺮﻭﺟﯽ‬    ‫•‬                     ...
‫ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ ‪PRank‬‬                                ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﺧﺮﻭﺟﯽ‬    ‫•‬                         ...
‫ﺭﻭﺵ ﻣﺒﺘﻨﯽ ﺑﺮ ‪Jaccard‬‬     ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﺩﺍﺭﺍﯼ ﺗﻌﺪﺍﺩ ﺑﻴﺸﺘﺮﯼ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺑﺎﺷﻨﺪ‬    ‫•‬                     ‫‪ ...
‫ﺭﻭﺵ ﺗﺮﮐﻴﺒﯽ‬‫ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺩﻭ ﻧﻮﺩ ﺑﻪ ﺻﻮﺭﺕ ﺿﺮﻳﺒﯽ ﺍﺯ ﺷﺒﺎﻫﺖ ﺳﺎﺧﺘﺎﺭﯼ ﻭ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﻣﯽ ﺷﻮﺩ‬          ‫•‬     ...
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬                                    ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬                                     ...
‫ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ‬     ‫ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺩﻭ ﻧﻮﺩ ﺩﺭ ﻳﮏ ﮔﺮﺍﻑ ﺟﻬﺖ ﺩﺍﺭ ﺑﻪ ﻣﻮﺍﺭﺩ ﺯﻳﺮ ﻭﺍﺑﺴﺘﻪ ﺍﺳﺖ‬    ‫•‬‫91‬        ‫ﺧوﺷﮫ ﺑﻧدی در داده...
‫ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﮐﻼﺳﺘﺮﻫﺎ‬‫02‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                ‫72/9/0931‬
‫ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﮐﻼﺳﺘﺮﻫﺎ‬‫12‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                ‫72/9/0931‬
‫ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪﻝ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ‬                                                   ‫1. ﺍﻳﺠﺎﺩ ﺧﻮﺷﻪ ﻫﺎﯼ ﺩﻭ ...
‫ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪﻝ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ‬‫ﺑﺮﺍﯼ ﺍﻳﺠﺎﺩ ﺧﻮﺷﻪ ﻫﺎﯼ ﺩﻭ ﻣﻨﺒﻌﯽ، ﺍﺯ ﺗﻮﺍﺑﻊ ﻣﺠﻤﻮﻉ، ﻣﺎﮐﺰﻳﻤﻢ، ﺗﻌﺪﺍﺩ، ﻣﻴﻨﻴﻤﻢ ﻭ ﻣ...
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬                                    ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬                                     ...
‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬‫• ﺍﺯ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺑﺮﺍﯼ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ. ﮐﻪ ﺩﺭ ﺣﺎﻝ ﺣﺎﺿﺮ ﺑﺎﻟﻎ ﺑﺮ 6.1 ﻣﻴﻠﻴﻮ...
‫ﺗﻮﺯﻳﻊ ﮐﻼﺱ ﺍﻓﺮﺍﺩ ﺩﺭ ﻭﺭﺩﻧﺖ‬‫62‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                 ‫72/9/0931‬
‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ )ﺍﺩﺍﻣﻪ(‬                                                               ‫•‬‫72‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده...
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬                                    ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬                                     ...
‫ﻣﺘﺪﻫﺎﯼ ﺍﺭﺯﻳﺎﺑﯽ‬                                                                                ‫ﺁﻧﺘﺮﻭﭘﻲ:‬      ‫•‬       ...
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬                                    ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬                                     ...
‫ﻧﺘﺎﻳﺞ ﻣﻘﺎﻳﺴﻪ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺎ ﺭﻭﺷﻬﺎﯼ ﻗﺒﻠﯽ‬                                                        ‫•‬‫13‬   ‫ﺧوﺷﮫ ﺑﻧدی در ...
‫ﻧﺘﺎﻳﺞ ﻣﻘﺎﻳﺴﻪ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺎ ﺭﻭﺷﻬﺎﯼ ﻗﺒﻠﯽ‬                                                        ‫•‬‫23‬   ‫ﺧوﺷﮫ ﺑﻧدی در ...
‫ﻧﺘﺎﻳﺞ ﺑﻪ ﺻﻮﺭﺕ ﮔﺮﺍﻑ‬                                                            ‫•‬‫33‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬  ...
‫ﻧﺘﻴﺠﻪ ﮔﻴﺮﯼ ﻭ ﮐﺎﺭﻫﺎﯼ ﺁﻳﻨﺪﻩ‬        ‫ﺭﻭﺷﻲ ﺑﺮﺍﯼ ﻳﺎﻓﺘﻦ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ ﺍﺭﺍﺋﻪ ﺷﺪﻩ ﺍﺳﺖ‬    ‫•‬           ...
‫ﺑﺎ ﺗﺸﮑﺮ ﺍﺯ ﺣﺴﻦ ﺗﻮﺟﻪ ﺷﻤﺎ‬‫53‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬   ‫72/9/0931‬
Upcoming SlideShare
Loading in …5
×

Structure attribute computation of similarities between nodes of a graph with application in clustering

562 views

Published on

يافتن ميزان شباهت در يک گراف جهت دار دارای خصوصيت /مقدار

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
562
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
9
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Structure attribute computation of similarities between nodes of a graph with application in clustering

  1. 1. ‫ﺩﺍﻧﺸﮕﺎﻩ ﺍﺻﻔﻬﺎﻥ‬ ‫ﺩﺍﻧﺸﮑﺪﻩ ﻓﻨﻲ ﻭ ﻣﻬﻨﺪﺳﻲ‬ ‫ﮔﺮﻭﻩ ﮐﺎﻣﭙﻴﻮﺗﺮ‬ ‫ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺳﺎﺧﺘﺎﺭﯼ/ﺧﺼﻮﺻﻴﺘﻲ ﺑﻴﻦ‬ ‫ﻧﻮﺩﻫﺎﯼ ﮔﺮﺍﻑ ‪ RDF‬ﻭ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺁﻥ ﺑﺮﺍﯼ‬ ‫ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫‪Structure/Attribute Computation of Similarities‬‬ ‫‪Between Nodes of a RDF Graph with‬‬ ‫‪Application to Linked Data Clustering‬‬ ‫ﻣﺤﻘﻖ:‬ ‫ﺍﺳﺘﺎﺩ ﺭﺍﻫﻨﻤﺎ:‬ ‫ﻫﺎﺩﻱ ﺧﺴﺮﻭﻱ ﻓﺎﺭﺳﺎﻧﯽ‬ ‫ﺩﮐﺘﺮ ﻣﺤﻤﺪﻋﻠﯽ ﻧﻌﻤﺖ ﺑﺨﺶ‬‫1‬ ‫72/9/0931‬
  2. 2. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬‫2‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  3. 3. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬‫3‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  4. 4. ‫ﺍﺻﻮﻝ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ )‪(Linked Data Principles‬‬ ‫• ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ‪ URI‬ﺑﺮﺍﯼ ﺷﻨﺎﺳﺎﻳﻲ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ‬ ‫• ﺍﺯ ﭘﺮﻭﺗﮑﻞ ‪ HTTP‬ﺑﺮﺍﯼ ﺩﺳﺘﺮﺳﯽ ﺑﻪ ﺍﻳﻦ ﻧﺎﻣﻬﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺷﻮﺩ‬‫• ﻫﻨﮕﺎﻣﯽ ﮐﻪ ﻳﮏ ﻓﺮﺩ، ﺩﺭﺧﻮﺍﺳﺖ ﻳﮏ ‪ URI‬ﺭﺍ ﻣﯽ ﮐﻨﺪ، ﺗﻤﺎﻣﯽ ﺍﻃﻼﻋﺎﺕ ﻣﻔﻴﺪ ﺑﻪ ﻓﺮﻣﺖ ‪ RDF‬ﻧﺸﺎﻥ ﺩﺍﺩﻩ ﺷﻮﺩ‬ ‫• ﻋﺒﺎﺭﺗﻬﺎﯼ ‪ RDF‬ﻻﺯﻡ ﺍﺳﺖ ﺑﻪ ﺩﻳﮕﺮ ‪ URI‬ﻫﺎ ﺍﻧﻮﺍﻉ ﻣﺨﺘﻠﻒ ﻟﻴﻨﮏ ﺩﺍﺷﺘﻪ ﺑﺎﺷﻨﺪ ﺑﻪ ﺻﻮﺭﺗﯽ ﮐﻪ ﺍﻓﺮﺍﺩ ﻗﺎﺩﺭ ﺑﺎﺷﻨﺪ‬ ‫ﺍﻃﻼﻋﺎﺕ ﺑﻴﺸﺘﺮﯼ ﺩﺭ ﻣﻮﺭﺩ ﺁﻥ ﻣﻮﺟﻮﺩﻳﺖ ﮐﺴﺐ ﮐﻨﻨﺪ.‬‫4‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  5. 5. ‫ﺗﻌﺮﻳﻒ ﻣﻨﺎﺑﻊ ﺑﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺍﺻﻮﻝ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ )ﻣﺜﺎﻝ(‬ ‫‪http://dbpedia.org/page/Nigel_Clough‬‬‫5‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  6. 6. ‫ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ : ﺩﺭ ﺣﺎﻝ ﺣﺎﺿﺮ‬ ‫•‬‫6‬ ‫72/9/0931‬ ‫62/7/0931‬
  7. 7. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬‫7‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  8. 8. ‫ﻣﺴﺎﻟﻪ ﭘﺎﻳﺎﻥ ﻧﺎﻣﻪ‬ ‫ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ ﺑﻪ ﭼﻪ ﺷﮑﻠﯽ ﺍﻧﺠﺎﻡ ﺷﻮﺩ .‬ ‫•‬ ‫ﺍﻳﺪﻩ:‬ ‫•‬ ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﻭ ﺳﭙﺲ ﺍﻋﻤﺎﻝ ﺍﻟﮕﻮﺭﻳﺘﻢ ﻫﺎﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﺩﺭ ﻫﺮ ﺧﻮﺷﻪ‬ ‫ﺩﺭ ﻫﺮ ﮐﺪﺍﻡ ﺍﺯ ﺧﻮﺷﻪ ﻫﺎ ﻧﻮﺩﻫﺎﯼ ﺑﺴﻴﺎﺭ ﻣﺸﺎﺑﻪ ﻗﺮﺍﺭ ﮔﺮﻓﺘﻪ ﻣﯽ ﺷﻮﻧﺪ‬ ‫•‬ ‫• ﺑﺮﺍﯼ ﻣﺜﺎﻝ ﻳﮏ ﮐﻼﺳﺘﺮ ﺑﺮﺍﯼ ﺣﻮﺯﻩ ﻭﺭﺯﺵ ﺳﺎﺧﺘﻪ ﺷﻮﺩ، ﮐﻼﺳﺘﺮ ﺩﻳﮕﺮﯼ ﺑﺮﺍﯼ ﺣﻮﺯﻩ ﺁﮐﺎﺩﻣﻴﮏ‬ ‫ﺗﺸﮑﻴﻞ ﺷﻮﺩ ﻭ ...‬ ‫• ﻟﻴﻨﮏ ﻫﺎﯼ ﺍﺯ ﻳﮏ ﮐﻼﺳﺘﺮ ﻣﺜﻼ ﮐﻼﺳﺘﺮ ﻭﺭﺯﺷﯽ ﺑﻪ ﮐﻼﺳﺘﺮ ﺁﮐﺎﺩﻣﻴﮏ ﺣﺬﻑ ﻣﯽ ﺷﻮﻧﺪ ﭼﺮﺍ ﮐﻪ‬ ‫ﻟﻴﻨﮏ ﻳﮏ ﻓﺮﺩ ﺁﮐﺎﺩﻣﻴﮏ ﺑﻪ ﻳﮏ ﻓﺮﺩ ﻭﺭﺯﺵ ﺍﺭﺯﺵ ﮐﻤﯽ ﺩﺍﺭﺩ‬ ‫ﺩﺭ ﺩﺭﻭﻥ ﻫﺮ ﮐﻼﺳﺘﺮ، ﺍﻟﮕﻮﺭﻳﺘﻢ ‪ PageRank‬ﺑﺮﺍﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺷﻮﺩ‬ ‫•‬ ‫• ﺍﻓﺰﺍﻳﺶ ﺩﻗﺖ‬ ‫• ﮐﺎﻫﺶ ﺍﻧﺪﺍﺯﻩ ﮔﺮﺍﻑ ﻭ ﺩﺭ ﻧﺘﻴﺠﻪ ﮐﺎﻫﺶ ﻫﺰﻳﻨﻪ ﻣﺤﺎﺳﺒﻪ ﺭﺗﺒﻪ ﻧﻮﺩﻫﺎ‬‫8‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  9. 9. ‫ﺯﻳﺮ ﻣﺴﺎﻳﻞ ﭘﺎﻳﺎﻥ ﻧﺎﻣﻪ‬ ‫ﻓﺎﺯﻫﺎﯼ ﭘﺮﻭﮊﻩ‬ ‫•‬ ‫• ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺩﺭ ﺍﻟﮕﻮﺭﻳﺘﻢ ﭘﺎﻳﻪ ‪PageRank‬‬ ‫• ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﻫﺎ ﻭ ﻣﻮﺟﻮﺩﻳﺖ ﺩﺭ ﻫﺮ ‪dataset‬‬ ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻧﻮﺩﻫﺎ ﻭ ﻟﻴﻨﮑﻬﺎ - ﺑﺪﻭﻥ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺧﺼﻮﺻﻴﺎﺕ‬ ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻧﻮﺩﻫﺎ ﻭ ﻟﻴﻨﮑﻬﺎ – ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺧﺼﻮﺻﻴﺎﺕ‬ ‫• ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺩﺭ ﻫﺮ ﮐﻼﺳﺘﺮ ﻭ ﻣﻘﺎﻳﺴﻪ ﺑﺎ ﺭﻭﺵ ﭘﺎﻳﻪ‬ ‫ﺍﻳﻦ ﺍﺭﺍﺋﻪ:‬ ‫•‬ ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻧﻮﺩﻫﺎ ﻭ ﻟﻴﻨﮑﻬﺎ – ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺧﺼﻮﺻﻴﺎﺕ‬ ‫ﺯﻳﺮ ﻣﺴﺎﻟﻪ:‬ ‫•‬ ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ‬ ‫• ﻧﻴﺎﺯ ﺑﻪ ﺩﺍﺷﺘﻦ ﺍﻟﮕﻮﺭﻳﺘﻤﯽ ﺗﻮﺍﻧﺎ ﺟﻬﺖ ﻳﺎﻓﺘﻦ ﻣﻴﺰﺍﻥ ﺗﺸﺎﺑﻪ ﺩﻭ ﺍﻳﺘﻢ‬ ‫•‬‫9‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  10. 10. ‫ﻣﺜﺎﻝ ﺑﺮﺍﯼ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ‬ ‫ﻫﻤﻪ ﻧﻮﺩﻫﺎ ﺍﺯ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺍﺳﺘﺨﺮﺍﺝ ﺷﺪﻩ ﺍﺳﺖ‬ ‫•‬ ‫ﺗﻨﻬﺎ ﻳﮏ ﻧﻮﻉ ﺍﺯ ﻟﻴﻨﮏ ﻫﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪﻩ ﺍﺳﺖ ‪wikiPagewikilink‬‬ ‫•‬ ‫• ﺑﺎ ﮔﺬﺍﺷﺘﻦ ﭘﻴﺸﻮﻧﺪ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﻭ ﻳﺎ ﻭﻳﮑﯽ ﭘﺪﻳﺎ ﺑﻪ ﺍﺑﺘﺪﺍﯼ ﺍﻳﻦ ﻧﻮﺩﻫﺎ ﻣﯽ ﺗﻮﺍﻥ ﺁﻥ ﻧﻮﺩ ﺭﺍ ﺩﺭ ﻭﺏ ﺑﺮﺭﺳﯽ ﮐﺮﺩ‬‫• ﻻﺯﻡ ﺑﻪ ﺫﮐﺮ ﺍﺳﺖ ﮐﻪ ﺍﻳﻦ ﮔﺮﺍﻑ ﺑﺨﺶ ﮐﻮﭼﮑﯽ ﺍﺯ ﮔﺮﺍﻑ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺍﺳﺖ. ﺗﻌﺪﺍﺩ ﺯﻳﺎﺩﯼ ﺍﺯ ﻟﻴﻨﮏ ﻫﺎﯼ ﺍﻳﻦ ﻧﻮﺩﻫﺎ ﺑﺮﺍﯼ‬ ‫ﺳﺎﺩﮔﯽ ﺧﺬﻑ ﺷﺪﻩ ﺍﺳﺖ.‬‫01‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  11. 11. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬‫11‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  12. 12. ‫ﺭﻭﺷﻬﺎﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ‬ ‫ﺑﻪ ﺳﻪ ﺩﺳﺘﻪ ﮐﻠﯽ ﺗﻘﺴﻴﻢ ﺑﻨﺪﯼ ﻣﯽ ﺷﻮﻧﺪ‬ ‫•‬ ‫• ﺭﻭﺷﻬﺎﯼ ﺳﺎﺧﺘﺎﺭﯼ‬ ‫• ﮐﻪ ﺗﻨﻬﺎ ﺍﺯ ﺳﺎﺧﺘﺎﺭ ﻟﻴﻨﮏ ﻣﺎﺑﻴﻦ ﻧﻮﺩﻫﺎ ﺑﺮﺍﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﺍﺳﺘﻔﺎﺩﻩ ﻣﯽ ﮐﻨﺪ‬ ‫‪SimRank, BipartiteRank, PRank‬‬ ‫•‬ ‫ﺭﻭﺷﻬﺎﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺪﺍﺭ ﺁﻧﻬﺎ‬ ‫•‬ ‫• ﮐﻪ ﺍﺯ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺁﻧﻬﺎ ﺑﺮﺍﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﺍﺳﺘﻔﺎﺩﻩ ﻣﯽ ﮐﻨﺪ.‬ ‫• ﻣﻌﻤﻮﻻ ﺑﺮ ﺍﺳﺎﺱ ﻣﺤﺎﺳﺒﻪ ﺷﺒﺎﻫﺖ ‪ Jaccard‬ﻫﺴﺘﻨﺪ.‬ ‫ﺭﻭﺷﻬﺎﯼ ﺗﺮﮐﻴﺒﯽ‬ ‫•‬ ‫• ﮐﻪ ﺍﺯ ﻫﺮ ﺩﻭ ﺭﻭﺵ ﻗﺒﻠﯽ ﺑﺮﺍﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﻧﻮﺩﻫﺎ ﺍﺳﺘﻔﺎﺩﻩ ﻣﯽ ﮐﻨﺪ.‬‫21‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  13. 13. ‫ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ ‪SimRank‬‬ ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﻭﺭﻭﺩﯼ‬ ‫•‬ ‫ﺁﻥ ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﺑﺎﺷﻨﺪ‬‫31‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  14. 14. ‫ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ ‪Bipartite‬‬ ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﺧﺮﻭﺟﯽ‬ ‫•‬ ‫ﺁﻥ ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﺑﺎﺷﻨﺪ‬‫41‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  15. 15. ‫ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ ‪PRank‬‬ ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﺧﺮﻭﺟﯽ‬ ‫•‬ ‫ﻭ ﻭﺭﻭﺩﯼ ﺁﻥ ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﺑﺎﺷﻨﺪ‬‫51‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  16. 16. ‫ﺭﻭﺵ ﻣﺒﺘﻨﯽ ﺑﺮ ‪Jaccard‬‬ ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﺩﺍﺭﺍﯼ ﺗﻌﺪﺍﺩ ﺑﻴﺸﺘﺮﯼ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺑﺎﺷﻨﺪ‬ ‫•‬ ‫‪ N‬ﺑﺮﺍﺑﺮ ﺗﻌﺪﺍﺩ ﮐﻞ ﺧﺼﻮﺻﻴﺎﺕ ﻣﻮﺟﻮﺩ ﺩﺭ ﮔﺮﺍﻑ‬ ‫•‬‫61‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  17. 17. ‫ﺭﻭﺵ ﺗﺮﮐﻴﺒﯽ‬‫ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺩﻭ ﻧﻮﺩ ﺑﻪ ﺻﻮﺭﺕ ﺿﺮﻳﺒﯽ ﺍﺯ ﺷﺒﺎﻫﺖ ﺳﺎﺧﺘﺎﺭﯼ ﻭ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﻣﯽ ﺷﻮﺩ‬ ‫•‬ ‫ﺭﻭﺵ ﺩﻳﮕﺮ ﺗﺒﺪﻳﻞ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺩﺭ ﮔﺮﺍﻑ ﺳﺎﺧﺘﺎﺭ‬ ‫•‬ ‫• ﺩﻭ ﻧﻮﺩ ﮐﻪ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺁﻧﻬﺎ ﺍﺯ ﺣﺪ ﺁﺳﺘﺎﻧﻪ ﺑﻴﺸﺘﺮ ﺑﺎﺷﺪ ﻧﻮﺩﻱ ﺍﻳﺠﺎﺩ ﻣﻲ ﺷﻮﺩ ﮐﻪ ﺑﻪ ﻫﺮ ﺩﻭﯼ‬ ‫ﺁﻧﻬﺎ ﺍﺷﺎﺭﻩ ﻣﯽ ﮐﻨﺪ ﻭ ﺑﺪﻳﻦ ﺗﺮﺗﻴﺐ ﺁﻧﻬﺎ ﺩﺭ ﮔﺮﺍﻑ ﺳﺎﺧﺘﺎﺭﯼ ﺑﻪ ﻫﻤﺪﻳﮕﺮ ﻧﺰﺩﻳﮑﺘﺮ ﻣﯽ ﺷﻮﻧﺪ‬ ‫• ﭘﻴﭽﻴﺪﮔﯽ ﺁﻥ ﺑﺴﻴﺎﺭ ﺯﻳﺎﺩ ﺧﻮﺍﻫﺪ ﺷﺪ.‬ ‫71‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  18. 18. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬‫81‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  19. 19. ‫ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺩﻭ ﻧﻮﺩ ﺩﺭ ﻳﮏ ﮔﺮﺍﻑ ﺟﻬﺖ ﺩﺍﺭ ﺑﻪ ﻣﻮﺍﺭﺩ ﺯﻳﺮ ﻭﺍﺑﺴﺘﻪ ﺍﺳﺖ‬ ‫•‬‫91‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  20. 20. ‫ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﮐﻼﺳﺘﺮﻫﺎ‬‫02‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  21. 21. ‫ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﮐﻼﺳﺘﺮﻫﺎ‬‫12‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  22. 22. ‫ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪﻝ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫1. ﺍﻳﺠﺎﺩ ﺧﻮﺷﻪ ﻫﺎﯼ ﺩﻭ ﻣﻨﺒﻌﯽ‬ ‫2. ﺍﺩﻏﺎﻡ ﺩﻭ ﺧﻮﺷﻪ ﺑﺎ ﺑﺎﻻﺗﺮﻳﻦ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ‬ ‫3. ﺗﻮﻗﻒ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﺻﻮﺭﺕ ﺭﺳﻴﺪﻥ ﺑﻪ ﻣﻘﺪﺍﺭ ﺁﺳﺘﺎﻧﻪ‬‫22‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  23. 23. ‫ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪﻝ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ‬‫ﺑﺮﺍﯼ ﺍﻳﺠﺎﺩ ﺧﻮﺷﻪ ﻫﺎﯼ ﺩﻭ ﻣﻨﺒﻌﯽ، ﺍﺯ ﺗﻮﺍﺑﻊ ﻣﺠﻤﻮﻉ، ﻣﺎﮐﺰﻳﻤﻢ، ﺗﻌﺪﺍﺩ، ﻣﻴﻨﻴﻤﻢ ﻭ ﻣﻴﺎﻧﮕﻴﻦ ﻣﯽ ﺗﻮﺍﻥ ﺍﺳﺘﻔﺎﺩﻩ ﻧﻤﻮﺩ.‬ ‫‪‬‬ ‫ﺩﺭ ﭘﻴﺎﺩﻩ ﺳﺎﺯﯼ ﺻﻮﺭﺕ ﮔﺮﻓﺘﻪ، ﺍﺯ ﺗﺎﺑﻊ ﻣﺠﻤﻮﻉ ﺑﺮﺍﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺑﻴﻦ ﺩﻭ ﻧﻮﺩ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ.‬ ‫‪‬‬ ‫ﻓﺮﻣﻮﻝ ﺯﻳﺮ ﺑﺮﺍﯼ ﺗﺮﮐﻴﺐ ﺩﻭ ﮐﻼﺳﺘﺮ ﺩﺭ ﻣﺮﺣﻠﻪ ﺩﻭﻡ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ.‬ ‫‪‬‬‫32‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  24. 24. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬‫42‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  25. 25. ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬‫• ﺍﺯ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺑﺮﺍﯼ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ. ﮐﻪ ﺩﺭ ﺣﺎﻝ ﺣﺎﺿﺮ ﺑﺎﻟﻎ ﺑﺮ 6.1 ﻣﻴﻠﻴﻮﻥ‬ ‫ﻣﻮﺟﻮﺩﻳﺖ ﺩﺍﺭﺩ‬ ‫• ﺑﺎﻟﻎ ﺑﺮ 063 ﻫﺰﺍﺭ ﺍﺯ ﻣﻨﺎﺑﻊ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ، ﺍﻓﺮﺍﺩ ﺭﺍ ﺗﻮﺻﻴﻒ ﻣﯽ ﮐﻨﻨﺪ. ﮐﻪ ﺍﻳﻦ ﺍﻓﺮﺍﺩ ﺗﻮﺳﻂ ﻟﻴﻨﮏ‬ ‫‪ Wikipageredirect‬ﺑﻪ ﻫﻤﺪﻳﮕﺮ ﺍﺷﺎﺭﻩ ﻣﯽ ﮐﻨﻨﺪ.‬ ‫ﻣﻨﺎﺑﻊ ﺗﻮﺳﻂ ﻟﻴﻨﮏ ‪ Wordnet‬ﺑﻪ ﺁﻧﺘﻮﻟﻮﮊﯼ ﺯﺑﺎﻧﯽ ﻭﺭﺩﻧﺖ ﻟﻴﻨﮏ ﺩﺍﺷﺘﻪ ﺍﻧﺪ.‬ ‫•‬ ‫ﺍﺯ ﮐﻞ ﻣﻨﺎﺑﻊ ﺍﻓﺮﺍﺩ ﻣﻮﺟﻮﺩ ﺩﺭ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺗﻨﻬﺎ 021 ﻫﺰﺍﺭ ﻋﺪﺩ ﺍﺯ ﺁﻧﻬﺎ ﺣﺎﻭﯼ ﻣﻘﺪﺍﺭ ﺑﺮﺍﯼ ﺍﻳﻦ ﻟﻴﻨﮏ ﻫﺴﺘﻨﺪ.‬ ‫•‬ ‫ﺍﻓﺮﺍﺩ ﺩﺭ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ، ﺑﻪ 03 ﮐﻼﺱ ﺩﺳﺘﻪ ﺑﻨﺪﯼ ﺷﺪﻩ ﺍﻧﺪ.‬ ‫•‬ ‫ﻫﺪﻑ ﺍﺯ ﺧﻮﺷﻪ ﺑﻨﺪﯼ، ﺗﻮﻟﻴﺪ ﻫﻤﻴﻦ ﮐﻼﺳﻬﺎ ﺑﺪﻭﻥ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻟﻴﻨﮏ ﻭﺭﺩﻧﺖ‬ ‫•‬ ‫• ﺑﻌﺪ ﺍﺯ ﻓﻴﻠﺘﺮﻳﻨﮓ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺍﯼ ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ ﮐﻪ ﻧﺴﺨﻪ ﺍﯼ ﺍﺯ ﺁﻥ ﺩﺭ ﻭﺏ ﺑﺮﺍﯼ ﺍﺳﺘﻔﺎﺩﻩ ﻫﺎﯼ ﺑﻌﺪﯼ‬ ‫ﺍﻧﺘﺸﺎﺭ ﺩﺍﺩﻩ ﺷﺪﻩ ﺍﺳﺖ.‬‫52‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  26. 26. ‫ﺗﻮﺯﻳﻊ ﮐﻼﺱ ﺍﻓﺮﺍﺩ ﺩﺭ ﻭﺭﺩﻧﺖ‬‫62‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  27. 27. ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ )ﺍﺩﺍﻣﻪ(‬ ‫•‬‫72‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  28. 28. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬‫82‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  29. 29. ‫ﻣﺘﺪﻫﺎﯼ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫ﺁﻧﺘﺮﻭﭘﻲ:‬ ‫•‬ ‫• ﻋﺪﺩﯼ ﺍﺳﺖ ﮐﻪ ﻧﺸﺎﻥ ﺩﻫﻨﺪﻩ ﺍﻳﻦ ﺍﺳﺖ ﮐﻪ ﻋﻀﻮﻫﺎﯼ ﻳﮏ ﮐﻼﺳﺘﺮ ﺑﻪ ﻳﮏ ﮐﻼﺱ ﺗﻨﻬﺎ ﺗﻌﻠﻖ ﺩﺍﺭﻧﺪ‬ ‫ﺩﻗﺖ:‬ ‫•‬ ‫• ﺩﺭﺻﺪﯼ ﺍﺯ ﻳﮏ ﮐﻼﺳﺘﺮ ﺍﺳﺖ ﮐﻪ ﺷﺎﻣﻞ ﺍﺷﻴﺎﺀ ﺍﺯ ﻳﮏ ﮐﻼﺱ ﻣﺸﺨﺺ ﺑﺎﺷﺪ.‬ ‫ﺑﺎﺯﻳﺎﺑﯽ‬ ‫•‬‫• ﻋﺪﺩﻱ ﺍﺳﺖ ﮐﻪ ﻧﺸﺎﻥ ﺩﻫﻨﺪﻩ ﺍﻳﻦ ﺍﺳﺖ ﮐﻪ ﺍﻋﻀﺎﻱ ﻳﮏ ﮐﻼﺱ، ﺩﺭ ﻳﮏ ﮐﻼﺳﺘﺮ ﺑﺎ ﻫﻤﺪﻳﮕﺮ ﻭﺍﻗﻊ ﻣﯽ ﺷﻮﻧﺪ‬ ‫‪F-Measure‬‬ ‫•‬ ‫•‬ ‫92‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  30. 30. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬‫03‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  31. 31. ‫ﻧﺘﺎﻳﺞ ﻣﻘﺎﻳﺴﻪ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺎ ﺭﻭﺷﻬﺎﯼ ﻗﺒﻠﯽ‬ ‫•‬‫13‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  32. 32. ‫ﻧﺘﺎﻳﺞ ﻣﻘﺎﻳﺴﻪ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺎ ﺭﻭﺷﻬﺎﯼ ﻗﺒﻠﯽ‬ ‫•‬‫23‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  33. 33. ‫ﻧﺘﺎﻳﺞ ﺑﻪ ﺻﻮﺭﺕ ﮔﺮﺍﻑ‬ ‫•‬‫33‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  34. 34. ‫ﻧﺘﻴﺠﻪ ﮔﻴﺮﯼ ﻭ ﮐﺎﺭﻫﺎﯼ ﺁﻳﻨﺪﻩ‬ ‫ﺭﻭﺷﻲ ﺑﺮﺍﯼ ﻳﺎﻓﺘﻦ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ ﺍﺭﺍﺋﻪ ﺷﺪﻩ ﺍﺳﺖ‬ ‫•‬ ‫ﺍﻋﻤﺎﻝ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺮ ﺭﻭﯼ ﮔﺮﺍﻑ ﺷﺒﮑﻪ ﻫﺎﯼ ﺍﺟﺘﻤﺎﻋﯽ‬ ‫•‬ ‫ﺍﺭﺍﺋﻪ ﻳﮏ ﻣﺘﺪ ﻋﻤﻮﻣﯽ ﺩﺍﺭﺍﯼ ﻗﺎﺑﻠﻴﺖ ﺳﻔﺎﺭﺷﯽ ﺷﺪﻥ ﺑﺮﺍﯼ ﻫﺮ ﺣﻮﺯﻩ ﺧﺎﺹ‬ ‫•‬ ‫ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺍﻳﻦ ﺭﻭﺵ ﺑﺮﺍﯼ ﻣﺤﺎﺳﺒﻪ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺩﺭ ﮔﺮﺍﻑ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬‫43‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  35. 35. ‫ﺑﺎ ﺗﺸﮑﺮ ﺍﺯ ﺣﺴﻦ ﺗﻮﺟﻪ ﺷﻤﺎ‬‫53‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬

×