SlideShare a Scribd company logo
‫رتبه‬ ‫های‬ ‫الگوریتم‬‫بندی‬
‫سایت‬
‫الحکمی‬ ‫باب‬ ‫امیرحسین‬
‫صالحی‬ ‫سروش‬
Amir.Babolhakami@gmail.com
‫فهرست‬
‫مقدمه‬
......................................................................
..............................................3
‫سایت‬ ‫بندی‬ ‫رتبه‬(Web Ranking)
......................................................................
...............5
Page Ranking Algorithm
......................................................................
...................7
Ant ColonyAlgorithm...........................................................................................10
‫ترکیبی‬ ‫الگوریتم‬
......................................................................
..................................12
Page Ranking DevelopedAlgorithm........................................................................15
HITS Algorithm....................................................................................................17
iRank Algorithm...................................................................................................22
BlogRank Algorithm..............................................................................................25
2/30
‫مقدمه‬
‫سایت‬ ‫بندی‬ ‫رتبه‬ ‫به‬ ‫نیاز‬ ‫دلیل‬
‫اطالعات‬ ‫زیاد‬ ‫حجم‬
‫اطالعات‬ ‫بودن‬ ‫یافته‬ ‫غیرساختار‬ ‫و‬ ‫ناهمگني‬
‫زیاد‬ ‫پویایي‬ ،‫نمایي‬ ‫رشد‬
‫هاي‬ ‫قسمت‬ ‫مهمترین‬ ‫از‬ ‫یكي‬ ‫بندي‬ ‫رتبه‬ ‫بخش‬
‫باشد‬ ‫مي‬ ‫جستجو‬ ‫موتور‬.
3/30
‫مقدمه‬
"‫بندي‬ ‫رتبه‬"‫توسط‬ ‫صفحه‬ ‫یك‬ ‫كیفیت‬ ‫كه‬ ‫است‬ ‫فرآیندي‬
‫شود‬ ‫مي‬ ‫زده‬ ‫تخمین‬ ‫جستجو‬ ‫موتور‬.
‫ها‬ ‫سایت‬ ‫بندی‬ ‫رتبه‬ ‫های‬ ‫مزیت‬
‫از‬ ‫جلوگیری‬Web Spam
‫جستجو‬ ‫فضای‬ ‫کاهش‬
4/30
‫سایت‬ ‫بندی‬ ‫رتبه‬(Web Ranking)
‫ها‬ ‫سایت‬ ‫بندی‬ ‫رتبه‬ ‫های‬ ‫روش‬ ‫انواع‬
‫محتوا‬ ‫بر‬ ‫مبتنی‬(‫شده‬ ‫استفاده‬‫در‬
‫اطالعات‬ ‫بازیابي‬‫سنتي‬)
TF-IDF(‫برداری‬ ‫مدل‬ ‫در‬)
BM25(‫احتمال‬ ‫مدل‬ ‫در‬)
5/30
‫سایت‬ ‫بندی‬ ‫رتبه‬(Web Ranking)
‫مبتنی‬‫ساختار‬ ‫بر‬(‫فعلي‬ ‫وب‬ ‫در‬ ‫شده‬ ‫استفاده‬)
Page Ranking Algorithm
Page Ranking Developed Algorithm
Ant Colony Algorithm
‫ترکیبی‬ ‫الگوریتم‬
HITS Algorithm
6/30
Page Ranking Algorithm
‫جز‬‫صفحات‬ ‫بندی‬ ‫رتبه‬ ‫های‬ ‫الگوریتم‬ ‫اولین‬
‫وب‬
‫سایت‬ ‫توسط‬google‫می‬ ‫استفاده‬‫شود‬
‫الگوریتم‬ ‫های‬ ‫ویژگی‬
‫تعداد‬ ‫و‬ ‫صفحه‬ ‫به‬ ‫شده‬ ‫اشاره‬ ‫صفحات‬ ‫به‬ ‫اهمیت‬
‫صفحات‬ ‫از‬ ‫شده‬ ‫خارج‬ ‫های‬ ‫لینک‬
‫شده‬ ‫داده‬ ‫ارجاع‬ ‫های‬ ‫صفحه‬ ‫به‬ ‫اهمیت‬
‫اهمیت‬ ‫داری‬ ‫بیشتر‬ ‫ازجاع‬ ‫با‬ ‫صفحات‬ ‫که‬
‫بیشتری‬
7/30
Page Ranking Algorithm
𝑃𝑅 𝑢 = 1 − 𝑑 + 𝑑 ∗
𝑣𝜖𝐵 𝑢
𝑃𝑅 𝑣
𝑁𝑣
•:𝑃𝑅 𝑢‫صفحه‬ ‫رتبه‬u‫آن‬ ‫رتبه‬ ‫خواهیم‬ ‫می‬ ‫و‬ ‫است‬ ‫جاری‬ ‫صفحه‬ ‫همان‬ ‫که‬
‫باشد‬ ‫می‬ ،‫کنیم‬ ‫محاسبه‬ ‫را‬.
•:𝑑‫می‬ ‫کلیک‬ ‫ها‬ ‫لینک‬ ‫روی‬ ‫مداوم‬ ‫صورت‬ ‫به‬ ‫کاربر‬ ‫اینکه‬ ‫احتمال‬
‫کند‬.
•:𝟏 − 𝒅‫تصادفی‬ ‫صفحه‬ ‫یک‬ ‫به‬ ‫تصادفی‬ ‫صورت‬ ‫به‬ ‫کاربر‬ ‫اینکه‬ ‫احتمال‬
‫کند‬ ‫پرسپش‬.
•:𝑷𝑹(𝒗)Page Rank‫صفحه‬𝑣‫باشد‬ ‫می‬.
•:𝑵𝒗‫صفحه‬ ‫خروجی‬ ‫درجه‬𝑣‫است‬.
•:𝑩(𝒖)‫صفحه‬ ‫به‬ ‫ورودی‬ ‫لینک‬ ‫یک‬ ‫که‬ ‫است‬ ‫هایی‬ ‫گره‬ ‫مجموعه‬𝑢‫دارند‬.
•‫نکته‬:𝑑‫بین‬ ‫مقدار‬ ‫یک‬ ‫که‬ ‫است‬ ‫تعدیل‬ ‫فاکتور‬ ‫یک‬‫و‬ 0 1‫می‬ ‫تنظیم‬
‫شود‬.‫به‬ ‫وب‬ ‫گراف‬ ‫برای‬ ‫معموال‬0.85‫شود‬ ‫می‬ ‫تنظیم‬.
𝑃𝑅 𝑢 = 1 − 𝑑 + 𝑑 ∗
𝑣𝜖𝐵 𝑢
𝑃𝑅 𝑣
𝑁𝑣
•:𝐏𝐑 𝐮‫صفحه‬ ‫رتبه‬u‫آن‬ ‫رتبه‬ ‫خواهیم‬ ‫می‬ ‫و‬ ‫است‬ ‫جاری‬ ‫صفحه‬ ‫همان‬ ‫که‬
‫باشد‬ ‫می‬ ،‫کنیم‬ ‫محاسبه‬ ‫را‬.
•:𝐝‫می‬ ‫کلیک‬ ‫ها‬ ‫لینک‬ ‫روی‬ ‫مداوم‬ ‫صورت‬ ‫به‬ ‫کاربر‬ ‫اینکه‬ ‫احتمال‬
‫کند‬.
•:𝟏 − 𝒅‫تصادفی‬ ‫صفحه‬ ‫یک‬ ‫به‬ ‫تصادفی‬ ‫صورت‬ ‫به‬ ‫کاربر‬ ‫اینکه‬ ‫احتمال‬
‫کند‬ ‫پرسپش‬.
•:𝑷𝑹(𝒗)Page Rank‫صفحه‬𝑣‫باشد‬ ‫می‬.
•:𝑵𝒗‫صفحه‬ ‫خروجی‬ ‫درجه‬𝑣‫است‬.
•:𝑩(𝒖)‫صفحه‬ ‫به‬ ‫ورودی‬ ‫لینک‬ ‫یک‬ ‫که‬ ‫است‬ ‫هایی‬ ‫گره‬ ‫مجموعه‬𝑢‫دارند‬.
•‫نکته‬:𝑑‫بین‬ ‫مقدار‬ ‫یک‬ ‫که‬ ‫است‬ ‫تعدیل‬ ‫فاکتور‬ ‫یک‬‫و‬ 0 1‫می‬ ‫تنظیم‬
‫شود‬.‫به‬ ‫وب‬ ‫گراف‬ ‫برای‬ ‫معموال‬0.85‫شود‬ ‫می‬ ‫تنظیم‬. 8/30
Page Ranking Algorithm
‫مزایا‬
‫مقابل‬ ‫در‬Spam‫کند‬ ‫می‬ ‫مبارزه‬
‫آن‬ ‫به‬ ‫شده‬ ‫گذاری‬ ‫نقطه‬ ‫صفحات‬ ‫اگر‬ ‫است‬ ‫مهم‬ ‫صفحه‬ ‫یک‬
‫باشد‬ ‫مهم‬.
‫صفحات‬ ‫تمام‬ ‫از‬ ‫صفحه‬ ‫بندی‬ ‫رتبه‬ ‫الگوریتم‬ ‫مقادیر‬
‫بدون‬ ‫جستجو‬ ‫زمان‬ ‫در‬ ‫ترجیحا‬ ‫و‬ ‫شود‬ ‫می‬ ‫محاسبه‬
‫شود‬ ‫ذخیره‬ ‫ارتباط‬
‫معایب‬
‫باشد‬ ‫مستقل‬ ‫جستجو‬
‫صفحاتی‬ ‫و‬ ‫دارند‬ ‫توانایی‬ ‫مجموع‬ ‫در‬ ‫که‬ ‫صفحاتی‬ ‫بین‬
‫قائل‬ ‫تمایز‬ ‫وجه‬ ‫است‬ ‫معتبر‬ ‫جستجو‬ ‫عنوان‬ ‫روی‬ ‫بر‬ ‫که‬
‫شود‬ ‫نمی‬
9/30
Ant Colony Algorithm
‫بهینه‬ ‫مسائل‬ ‫برای‬ ‫عامله‬ ‫چند‬ ‫حلی‬ ‫راه‬‫سازی‬
‫روی‬ ‫مشاهده‬ ‫و‬ ‫مطالعه‬ ‫براساس‬ ‫الگوریتم‬ ‫این‬
‫ارائه‬ ‫مورچگان‬‫گردید‬
10/30
Ant Colony Algorithm
𝜏𝑖(𝑡+1)=(1−𝜌).𝜏𝑖𝑗(𝑡)+ Δ𝜏𝑖𝑗(𝑡)
𝜏𝑖𝑗‫های‬ ‫گره‬ ‫بین‬ ‫فرومون‬ ‫میزان‬i‫و‬j‫را‬
‫دهد‬ ‫می‬ ‫نشان‬
𝜌‫است‬ ‫فرمون‬ ‫تبخیر‬ ‫میزان‬)1≥𝜌>0)
Δ𝜏𝑖𝑗‫مورچه‬ ‫که‬ ‫است‬ ‫فرومونی‬ ‫مقدار‬K‫بر‬ ‫ام‬
‫ریزد‬ ‫می‬ ‫است‬ ‫کرده‬ ‫مالقات‬ ‫که‬ ‫هایی‬ ‫یال‬ ‫روی‬.
11/30
‫ترکیبی‬ ‫الگوریتم‬
‫الگوریتم‬ ‫دو‬ ‫از‬ ‫گرفتن‬ ‫الهام‬PageRank‫و‬
‫مورچگان‬ ‫اجتماع‬
‫و‬ ‫کاوی‬ ‫وب‬ ‫ازکاربرد‬ ‫تلفیقی‬ ‫الگوریتم‬ ‫این‬
‫کاوی‬ ‫وب‬ ‫ساختار‬‫است‬
12/30
‫ترکیبی‬ ‫الگوریتم‬
‫فایل‬
‫وب‬ ‫ثبت‬
‫سرور‬
‫پیش‬
‫پردازش‬
‫فایل‬
‫ثبت‬
‫استخراج‬
‫ویژگی‬
‫های‬
‫کاربران‬
‫سازی‬ ‫بردار‬
‫ساخت‬
‫پروفایل‬
‫کاربران‬
‫پروفایل‬
‫کاربران‬
‫استفاده‬
‫از‬
‫اجتماع‬
‫مورچگان‬
‫بندی‬ ‫رتبه‬
‫صفحات‬
13/30
‫ترکیبی‬ ‫الگوریتم‬
𝑃𝑅 𝑢 = 1 − 𝑑 + 𝑑 ∗ ((
𝑣𝜀𝐵 𝑢
𝑃𝑅(𝑣)/𝑁𝑣) + 𝑝 𝑢)
:𝑷𝑹 𝒖‫صفحه‬ ‫رتبه‬u‫خواهیم‬ ‫می‬ ‫و‬ ‫است‬ ‫جاری‬ ‫صفحه‬ ‫همان‬ ‫که‬
‫باشد‬ ‫می‬ ،‫کنیم‬ ‫محاسبه‬ ‫را‬ ‫آن‬ ‫رتبه‬.
:𝒅‫کلیک‬ ‫ها‬ ‫لینک‬ ‫روی‬ ‫مداوم‬ ‫صورت‬ ‫به‬ ‫کاربر‬ ‫اینکه‬ ‫احتمال‬
‫کند‬ ‫می‬.
:𝟏 − 𝒅‫صفحه‬ ‫یک‬ ‫به‬ ‫تصادفی‬ ‫صورت‬ ‫به‬ ‫کاربر‬ ‫اینکه‬ ‫احتمال‬
‫کند‬ ‫پرسپش‬ ‫تصادفی‬.
:𝑷𝑹(𝒗)PageRank‫صفحه‬𝑣‫باشد‬ ‫می‬.
:𝑵𝒗‫صفحه‬ ‫خروجی‬ ‫درجه‬𝑣‫است‬.
:𝑩(𝒖)‫صفحه‬ ‫به‬ ‫ورودی‬ ‫لینک‬ ‫یک‬ ‫که‬ ‫است‬ ‫هایی‬ ‫گره‬ ‫مجموعه‬𝑢
‫دارند‬.
:𝒑 𝒖‫صفحه‬ ‫روی‬ ‫بر‬ ‫گرفته‬ ‫قرار‬ ‫فرومون‬ ‫مقدار‬u‫است‬.
‫نکته‬:𝑑‫بین‬ ‫مقدار‬ ‫یک‬ ‫که‬ ‫است‬ ‫تعدیل‬ ‫فاکتور‬ ‫یک‬‫و‬ 0 1
‫شود‬ ‫می‬ ‫تنظیم‬.‫به‬ ‫وب‬ ‫گراف‬ ‫برای‬ ‫معموال‬0.85‫می‬ ‫تنظیم‬
‫شود‬.
14/30
Page Ranking Developed Algorithm
‫الگوریتم‬Weighted PageRank‫یافته‬ ‫توسعه‬ ‫الگویتم‬
‫الگوریتم‬PageRank‫است‬.
‫دهی‬ ‫رتبه‬ ‫نحوه‬
‫خروجی‬ ‫و‬ ‫ورودی‬ ‫های‬ ‫لینک‬ ‫به‬ ‫اهمیت‬
‫توزیع‬ ‫صفحات‬ ‫محبوبیت‬ ‫بر‬ ‫مبنی‬ ‫بندی‬ ‫رتبه‬ ‫امتیاز‬
‫شده‬
15/30
Page Ranking Developed Algorithm
‫که‬ ‫است‬ ‫موجود‬ ‫الگوریتم‬ ‫این‬ ‫برای‬ ‫مختلف‬ ‫های‬ ‫مدل‬
‫کنیم‬ ‫می‬ ‫بیان‬ ‫را‬ ‫ها‬ ‫آن‬ ‫از‬ ‫بعضی‬:
‫عصبی‬ ‫های‬ ‫شبکه‬ ‫بر‬ ‫مبتنی‬
‫مارکوف‬ ‫زنجیره‬ ‫بر‬ ‫مبتنی‬
‫ها‬ ‫لینک‬ ‫بازدید‬ ‫بر‬ ‫مبتنی‬
‫زمان‬ ‫فاکتور‬ ‫بر‬ ‫مبتنی‬
16/30
HITS Algorithm
‫الگوریتم‬ ‫اجرای‬ ‫از‬ ‫قبل‬HITS‫می‬ ‫اتفاقی‬ ‫چه‬
‫افتد؟‬
‫صفحات‬ ‫ترین‬ ‫مرتبط‬ ‫استخراج‬(Root Set)
‫مجموعه‬ ‫به‬ ‫که‬ ‫صفحاتی‬ ‫استخراج‬Root‫و‬ ‫داده‬ ‫لینک‬
‫است‬ ‫شده‬ ‫زده‬ ‫پیوند‬ ‫یا‬(Base Root)
17/30
HITS Algorithm
‫امتیاز‬ ‫یک‬ ‫صفحه‬ ‫هر‬ ‫به‬Hub‫امتیاز‬ ‫یک‬ ‫و‬Authority‫شود‬ ‫می‬ ‫داده‬
Authority:‫هستند‬ ‫سایت‬ ‫به‬ ‫شده‬ ‫وارد‬ ‫های‬ ‫لینک‬ ‫تعداد‬
Hub:‫هستند‬ ‫سایت‬ ‫از‬ ‫شده‬ ‫خارج‬ ‫های‬ ‫لینک‬ ‫تعداد‬
‫یک‬Authority‫از‬ ‫مناسب‬ ‫ای‬ ‫مجموعه‬ ‫توسط‬ ‫خوب‬Hub‫و‬ ‫است‬ ‫شده‬ ‫اشاره‬
‫بلعکس‬.
‫داریم‬ ‫زیر‬ ‫ویژگی‬ ‫با‬ ‫گرافی‬ ‫تشکیل‬ ‫به‬ ‫نیاز‬ ‫حال‬:
1 , 𝑖𝑓 𝑖,𝑗 ∈ 𝐸
0 , 𝑜𝑡ℎ𝑤𝑒𝑤𝑖𝑠𝑒
𝐿𝑖𝑗
18/30
HITS Algorithm
‫مقادیر‬ ‫حال‬Authority‫و‬Hub‫زیر‬ ‫صورت‬ ‫به‬
‫شود‬ ‫می‬ ‫محاسبه‬:
𝐻𝐼𝑇𝑆𝐴𝑢𝑡ℎ𝑜𝑟𝑖𝑡𝑦 𝑣𝑖 =
𝑣𝑗∈𝑖𝑛(𝑉𝑖)
𝐻𝐼𝑇𝑆 𝐻𝑢𝑏(𝑉𝑗)
𝐻𝐼𝑇𝑆 𝐻𝑢𝑏 𝑣𝑖 =
𝑣𝑗∈𝑜𝑢𝑡(𝑉𝑖)
𝐻𝐼𝑇𝑆𝐴𝑢𝑡ℎ𝑜𝑟𝑖𝑡𝑦(𝑉𝑗)
‫اولیه‬ ‫مقادیر‬Hub‫و‬Authority‫برابر‬1‫است‬.
19/30
HITS Algorithm
‫مزیت‬HITS:
‫توانایی‬‫جستجو‬ ‫موضوع‬ ‫برطبق‬ ‫صفحات‬ ‫بندی‬ ‫رتبه‬
‫دارد‬
‫در‬ ‫بیشتر‬ ‫توانایی‬‫به‬ ‫مربوط‬ ‫صفحات‬ ‫کردن‬ ‫فراهم‬
Hub‫و‬Authority‫را‬‫دارد‬.
‫الگوریتم‬ ‫معایب‬HITS:
‫است‬ ‫ناکارآمد‬ ‫جستجو‬ ‫زمان‬ ‫در‬.
‫ارزیابی‬‫است‬ ‫تدریجی‬ ‫و‬ ‫کند‬ ‫جستجو‬ ‫زمان‬.
20/30
‫بندی‬ ‫رتبه‬‫صفحات‬‫بالگ‬
iRank
BlogRank
21/30
iRank Algorithm
‫برپایه‬‫الگوریتم‬PageRank
‫ساختار‬‫بالگ‬ ‫فضای‬ ‫گراف‬ ‫غیرصریح‬ ‫و‬ ‫ضمنی‬
‫در‬ ‫موجود‬ ‫اطالعات‬ ‫صفحات‬ ‫دهی‬ ‫رتبه‬ ‫در‬ ‫را‬
‫تاثیر‬‫دهیم‬ ‫می‬
‫وبالگ‬ ‫فضای‬ ‫در‬ ‫زمان‬ ‫ویژگی‬ ‫پایه‬ ‫بر‬
‫فاصله‬ ‫براساس‬ ‫گراف‬ ‫های‬ ‫یال‬ ‫دهی‬ ‫وزن‬
‫است‬ ‫دادن‬ ‫پیوند‬ ‫زمانی‬
22/30
iRank Algorithm
𝒘𝒋𝒊
𝒖
= 𝒘(∆𝒅𝒊𝒋)
∆𝑑‫یا‬ ‫مطلب‬ ‫یک‬ ‫به‬ ‫وبالگ‬ ‫دو‬ ‫که‬ ‫زمانی‬ ‫فاصله‬ ‫برابر‬
URL‫کنتد‬ ‫می‬ ‫اشاره‬.
،‫باشد‬ ‫کمتر‬ ‫دادن‬ ‫لینک‬ ‫فرآیند‬ ‫زمانی‬ ‫فاصله‬ ‫چه‬ ‫هر‬
‫است‬ ‫بیشتر‬ ‫پیوند‬ ‫امتیاز‬(‫چرا؟‬)
𝒘𝒋𝒊
𝒖
𝒏𝒋 𝒌 𝒘 𝒋𝒌
𝒖
،‫پیوندها‬ ‫مقادیر‬ ‫محاسبه‬‫بالگ‬ ‫اگر‬bj‫به‬ni،URL
‫باشد‬ ‫کرده‬ ‫اشاره‬ ‫متفاوت‬
‫یک‬ ‫برابر‬ ‫بالگ‬ ‫یک‬ ‫از‬ ‫شده‬ ‫خارج‬ ‫های‬ ‫یال‬ ‫وزن‬ ‫مجموع‬
‫بود‬ ‫خواهد‬
‫الگوریتم‬ ،‫گراف‬ ‫این‬ ‫تولید‬ ‫از‬ ‫بعد‬PageRank‫این‬ ‫روی‬
23/30
BlogRank Algorithm
‫دهی‬ ‫رتبه‬ ‫زمینه‬ ‫در‬ ‫ها‬ ‫الگوریتم‬ ‫ترین‬ ‫جدی‬ ‫از‬ ‫یکی‬
‫بالک‬
‫سال‬ ‫در‬2006‫شد‬ ‫ارائه‬
‫یافته‬ ‫تعمیم‬ ‫نسخه‬PageRank‫باشد‬ ‫می‬
24/30
BlogRank Algorithm
‫محاسبه‬ ‫نحوه‬BlogRank‫صفحه‬ ‫یک‬
𝐵 𝐴 = 1 − 𝑑 + 𝑑(𝐹𝑁 𝑈1 → 𝐴 ∗ 𝐵 𝑈1 + ⋯ + 𝐹𝑁 𝑈 𝑛 → 𝐴 ∗ 𝐵 𝑈 𝑛 )
B(A):BlogRank‫بالگ‬A‫است‬
B(Ui)‫نیز‬BlogRank‫بالک‬ ‫برای‬Ui‫بالگ‬ ‫به‬ ‫که‬ ‫است‬A‫پیوند‬
‫دارد‬
d‫تعدیل‬ ‫ضریب‬‫الگوریتم‬ ‫در‬ ‫شده‬ ‫استفاده‬PageRank‫است‬
FN(Un→A)‫بالگ‬ ‫انتخاب‬ ‫احتمال‬ ‫مقدار‬A‫از‬ ‫بعد‬ ‫کاربر‬ ‫توسط‬
‫بالگ‬ ‫مشاهده‬n‫باشد‬ ‫می‬.
‫این‬‫بالگ‬ ‫مطلوبیت‬ ‫از‬ ‫کاربر‬ ‫تصور‬ ‫دهنده‬ ‫نشان‬ ،‫مقدار‬A‫است‬.
25/30
BlogRank Algorithm
‫زمانی‬ ‫چه‬BlogRank‫مشابه‬PageRank‫باشد؟‬ ‫می‬
‫اگر‬Z‫با‬ ‫بالگی‬T‫خروجی‬ ‫پیوند‬‫باشد‬
𝒋=𝟏
𝒕
𝑭𝑵 𝑼 𝒛 → 𝒋 = 𝟏
N‫بالگ‬ ‫از‬ ‫ها‬ ‫خروجی‬ ‫مجموع‬ ‫تعداد‬z‫باشد‬
‫کاربر‬ ‫حرکت‬ ‫برای‬‫پیوندهای‬ ‫به‬ ‫بالگ‬ ‫صفحه‬ ‫یک‬ ‫از‬
‫خروجی‬‫نباید‬‫داد‬ ‫یکسان‬ ‫احتمال‬.
26/30
BlogRank Algorithm
‫برای‬‫محاسبه‬FN(Uz→j)‫نظیر‬ ‫هایی‬ ‫بالگ‬j‫اهمیت‬ ‫دارای‬ ‫را‬
‫که‬ ‫داند‬ ‫می‬:
(1‫بالگ‬ ‫با‬ ‫همراه‬z‫دسته‬ ‫به‬ ‫متعلق‬(Category)‫مشترک‬
‫باشد‬.
(2‫بالگ‬ ‫با‬ ‫همراه‬z‫به‬ ‫یکسان‬ ‫های‬ ‫پیوند‬ ‫تعداد‬ ‫دارای‬
‫سایت‬‫باشد‬ ‫مختلف‬ ‫های‬.
𝑭𝑵(𝑼 𝒛→𝒋) =
𝑭 𝒛→𝒋
𝑭 𝒛→𝒙
27/30
BlogRank Algorithm
𝐹𝑧→𝑗 = 𝐿 𝑍→𝑙 + 𝑤 𝑇 ∗ 𝑇𝑧→𝑗 + 𝑤 𝑢 ∗ 𝑢 𝑧→𝑗 + 𝑤 𝑁 ∗ 𝑁𝑧→𝑗
L‫بالگ‬ ‫از‬ ‫پیوندها‬ ‫تعداد‬j‫است‬
T‫که‬ ‫است‬ ‫هایی‬ ‫دسته‬ ‫تعداد‬j‫و‬z‫تعلق‬ ‫آنها‬ ‫به‬ ‫دو‬ ‫هر‬
‫دارند‬.
U‫به‬ ‫مشترک‬ ‫پست‬ ‫که‬ ‫است‬ ‫کاربرانی‬ ‫تعداد‬j‫و‬z‫فرستاده‬
‫اند‬
N‫نیز‬‫های‬ ‫سایت‬ ‫به‬ ‫مشترک‬ ‫پیوندهای‬ ‫تعداد‬‫در‬ ‫مختلف‬
‫های‬ ‫بالگ‬j‫و‬z‫می‬‫باشد‬
wT،wU‫و‬wN‫برای‬ ‫ضرایبی‬ ،T،N‫و‬U‫هستند‬
‫الگوریتم‬ ،‫ها‬ ‫بالگ‬ ‫به‬ ‫دهی‬ ‫وزن‬ ‫از‬ ‫بعد‬PageRank‫می‬ ‫بدست‬
‫آید‬
28/30
Reference
1) Page, L., Brin, S., Motwani, R., Winograd,T., "The PageRank Citation Ranking:Bringing
Order to theWeb",Technical Report. Stanford InfoLab, 1999
2) Xing,W., Ghorbani,A., "Weighted PageRank Algorithm", Proceedings of the Second
Annual Conference on Communication Networks and Services Research (CNSR’04),
IEEE, pp. 305- 314, 2004.
3) Dorigo, M., Maniezzo,V., Colorni, A., "Ant System:Optimization by a Colony of
Cooperating Agent", IEEE, vol.26, pp.29-41,1996.
4) Marc Najork, Hugo Zaragoza,MichaelTaylor, “HITS on the web: How dose it
Compare”?
5) Ko Fujimmura,Takafunmi Inoue and Masayuki Sugisaki.The EigenRumor algorithm for
ranking blogs. InWorkshop on theWeblogging Ecosystem, 2005.
29/30
‫آخر‬ ‫سخن‬
Question?
30/30

More Related Content

Viewers also liked

ابزارهای پردازش زبان طبیعی
ابزارهای پردازش زبان طبیعیابزارهای پردازش زبان طبیعی
ابزارهای پردازش زبان طبیعی
Ehsan Asgarian
 
(MATLAB) شبکه‌های عصبی و استفاده از جعبه ابزار آن در محيط متلب
(MATLAB) شبکه‌های عصبی و استفاده از جعبه ابزار آن در محيط متلب(MATLAB) شبکه‌های عصبی و استفاده از جعبه ابزار آن در محيط متلب
(MATLAB) شبکه‌های عصبی و استفاده از جعبه ابزار آن در محيط متلب
Hamed Zarei
 
شبکه های عصبی مصنوعی
شبکه های عصبی مصنوعیشبکه های عصبی مصنوعی
شبکه های عصبی مصنوعی
dataminers.ir
 
دانلود رایگان کد فایل آموزشی شبکه های عصبی مصنوعی Artificial Neural Networ...
دانلود رایگان کد فایل آموزشی شبکه های عصبی مصنوعی    Artificial Neural Networ...دانلود رایگان کد فایل آموزشی شبکه های عصبی مصنوعی    Artificial Neural Networ...
دانلود رایگان کد فایل آموزشی شبکه های عصبی مصنوعی Artificial Neural Networ...
کتابخانه خانه متلب
 
Machine Learning on Big Data
Machine Learning on Big DataMachine Learning on Big Data
Machine Learning on Big Data
Max Lin
 
Web content mining
Web content miningWeb content mining
Web content mining
Akanksha Dombe
 
Web mining slides
Web mining slidesWeb mining slides
Web mining slides
mahavir_a
 
Web Mining
Web Mining Web Mining
Web Mining
guestb73ec6
 

Viewers also liked (8)

ابزارهای پردازش زبان طبیعی
ابزارهای پردازش زبان طبیعیابزارهای پردازش زبان طبیعی
ابزارهای پردازش زبان طبیعی
 
(MATLAB) شبکه‌های عصبی و استفاده از جعبه ابزار آن در محيط متلب
(MATLAB) شبکه‌های عصبی و استفاده از جعبه ابزار آن در محيط متلب(MATLAB) شبکه‌های عصبی و استفاده از جعبه ابزار آن در محيط متلب
(MATLAB) شبکه‌های عصبی و استفاده از جعبه ابزار آن در محيط متلب
 
شبکه های عصبی مصنوعی
شبکه های عصبی مصنوعیشبکه های عصبی مصنوعی
شبکه های عصبی مصنوعی
 
دانلود رایگان کد فایل آموزشی شبکه های عصبی مصنوعی Artificial Neural Networ...
دانلود رایگان کد فایل آموزشی شبکه های عصبی مصنوعی    Artificial Neural Networ...دانلود رایگان کد فایل آموزشی شبکه های عصبی مصنوعی    Artificial Neural Networ...
دانلود رایگان کد فایل آموزشی شبکه های عصبی مصنوعی Artificial Neural Networ...
 
Machine Learning on Big Data
Machine Learning on Big DataMachine Learning on Big Data
Machine Learning on Big Data
 
Web content mining
Web content miningWeb content mining
Web content mining
 
Web mining slides
Web mining slidesWeb mining slides
Web mining slides
 
Web Mining
Web Mining Web Mining
Web Mining
 

Similar to Web ranking (الگوریتم های رتبه بندی سایت)

بک لینک
بک لینکبک لینک
بک لینک
سئو سایت
 
-seo-training-هانیه غفرانی-آموزش سئو-سایت
-seo-training-هانیه غفرانی-آموزش سئو-سایت-seo-training-هانیه غفرانی-آموزش سئو-سایت
-seo-training-هانیه غفرانی-آموزش سئو-سایت
Hanieh Ghofrani
 
seo
seoseo
Behine saze site
Behine saze siteBehine saze site
Behine saze site
danesh_fd
 
an introduction to Web 3.0 - Semantic Web
an introduction to Web 3.0 - Semantic Weban introduction to Web 3.0 - Semantic Web
an introduction to Web 3.0 - Semantic Web
Hossein sharafi
 
Mcdm
McdmMcdm
مزایای بهینه سازی سایت
مزایای بهینه سازی سایتمزایای بهینه سازی سایت
مزایای بهینه سازی سایت
sepandweb.com
 
seo site
seo siteseo site
seo site
esfahandoor95
 
امتحان دی ماه وب مقدماتی
امتحان دی ماه وب مقدماتیامتحان دی ماه وب مقدماتی
امتحان دی ماه وب مقدماتیsomayeh daneshparvar
 
کمی درباره سئو و آموزش سئو
کمی درباره سئو و آموزش سئوکمی درباره سئو و آموزش سئو
کمی درباره سئو و آموزش سئو
PouriaAriafar
 
طراحی سایت
طراحی سایتطراحی سایت
طراحی سایت
Ehsan Shahsavan
 
اصول طراحی سایت
اصول طراحی سایتاصول طراحی سایت
اصول طراحی سایت
Moshaveran international Business School
 
آموزش سئو سایت- seo-site-learning-freeبهینه سازی سایت-http://seofirstpage.ir-...
آموزش سئو سایت- seo-site-learning-freeبهینه سازی سایت-http://seofirstpage.ir-...آموزش سئو سایت- seo-site-learning-freeبهینه سازی سایت-http://seofirstpage.ir-...
آموزش سئو سایت- seo-site-learning-freeبهینه سازی سایت-http://seofirstpage.ir-...
Hanieh Ghofrani
 
بخش دوم :كاربرد رايانه در برق (آموزش ساده سيمولينك )
بخش دوم :كاربرد رايانه در برق (آموزش ساده سيمولينك )بخش دوم :كاربرد رايانه در برق (آموزش ساده سيمولينك )
بخش دوم :كاربرد رايانه در برق (آموزش ساده سيمولينك )
tahereh sharafi
 
معرفی مهمترین افزونه های وردپرس
معرفی مهمترین افزونه های وردپرسمعرفی مهمترین افزونه های وردپرس
معرفی مهمترین افزونه های وردپرس
mehdigholipour
 
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیرازIntroduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Mobin Ranjbar
 

Similar to Web ranking (الگوریتم های رتبه بندی سایت) (20)

Seo part3
Seo part3Seo part3
Seo part3
 
بک لینک
بک لینکبک لینک
بک لینک
 
-seo-training-هانیه غفرانی-آموزش سئو-سایت
-seo-training-هانیه غفرانی-آموزش سئو-سایت-seo-training-هانیه غفرانی-آموزش سئو-سایت
-seo-training-هانیه غفرانی-آموزش سئو-سایت
 
seo
seoseo
seo
 
seo
seoseo
seo
 
Behine saze site
Behine saze siteBehine saze site
Behine saze site
 
an introduction to Web 3.0 - Semantic Web
an introduction to Web 3.0 - Semantic Weban introduction to Web 3.0 - Semantic Web
an introduction to Web 3.0 - Semantic Web
 
Mcdm
McdmMcdm
Mcdm
 
مزایای بهینه سازی سایت
مزایای بهینه سازی سایتمزایای بهینه سازی سایت
مزایای بهینه سازی سایت
 
seo site
seo siteseo site
seo site
 
امتحان دی ماه وب مقدماتی
امتحان دی ماه وب مقدماتیامتحان دی ماه وب مقدماتی
امتحان دی ماه وب مقدماتی
 
کمی درباره سئو و آموزش سئو
کمی درباره سئو و آموزش سئوکمی درباره سئو و آموزش سئو
کمی درباره سئو و آموزش سئو
 
BERZILA
BERZILABERZILA
BERZILA
 
طراحی سایت
طراحی سایتطراحی سایت
طراحی سایت
 
اصول طراحی سایت
اصول طراحی سایتاصول طراحی سایت
اصول طراحی سایت
 
آموزش سئو سایت- seo-site-learning-freeبهینه سازی سایت-http://seofirstpage.ir-...
آموزش سئو سایت- seo-site-learning-freeبهینه سازی سایت-http://seofirstpage.ir-...آموزش سئو سایت- seo-site-learning-freeبهینه سازی سایت-http://seofirstpage.ir-...
آموزش سئو سایت- seo-site-learning-freeبهینه سازی سایت-http://seofirstpage.ir-...
 
بخش دوم :كاربرد رايانه در برق (آموزش ساده سيمولينك )
بخش دوم :كاربرد رايانه در برق (آموزش ساده سيمولينك )بخش دوم :كاربرد رايانه در برق (آموزش ساده سيمولينك )
بخش دوم :كاربرد رايانه در برق (آموزش ساده سيمولينك )
 
معرفی مهمترین افزونه های وردپرس
معرفی مهمترین افزونه های وردپرسمعرفی مهمترین افزونه های وردپرس
معرفی مهمترین افزونه های وردپرس
 
Presentation1
Presentation1Presentation1
Presentation1
 
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیرازIntroduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
 

Web ranking (الگوریتم های رتبه بندی سایت)

  • 1. ‫رتبه‬ ‫های‬ ‫الگوریتم‬‫بندی‬ ‫سایت‬ ‫الحکمی‬ ‫باب‬ ‫امیرحسین‬ ‫صالحی‬ ‫سروش‬ Amir.Babolhakami@gmail.com
  • 2. ‫فهرست‬ ‫مقدمه‬ ...................................................................... ..............................................3 ‫سایت‬ ‫بندی‬ ‫رتبه‬(Web Ranking) ...................................................................... ...............5 Page Ranking Algorithm ...................................................................... ...................7 Ant ColonyAlgorithm...........................................................................................10 ‫ترکیبی‬ ‫الگوریتم‬ ...................................................................... ..................................12 Page Ranking DevelopedAlgorithm........................................................................15 HITS Algorithm....................................................................................................17 iRank Algorithm...................................................................................................22 BlogRank Algorithm..............................................................................................25 2/30
  • 3. ‫مقدمه‬ ‫سایت‬ ‫بندی‬ ‫رتبه‬ ‫به‬ ‫نیاز‬ ‫دلیل‬ ‫اطالعات‬ ‫زیاد‬ ‫حجم‬ ‫اطالعات‬ ‫بودن‬ ‫یافته‬ ‫غیرساختار‬ ‫و‬ ‫ناهمگني‬ ‫زیاد‬ ‫پویایي‬ ،‫نمایي‬ ‫رشد‬ ‫هاي‬ ‫قسمت‬ ‫مهمترین‬ ‫از‬ ‫یكي‬ ‫بندي‬ ‫رتبه‬ ‫بخش‬ ‫باشد‬ ‫مي‬ ‫جستجو‬ ‫موتور‬. 3/30
  • 4. ‫مقدمه‬ "‫بندي‬ ‫رتبه‬"‫توسط‬ ‫صفحه‬ ‫یك‬ ‫كیفیت‬ ‫كه‬ ‫است‬ ‫فرآیندي‬ ‫شود‬ ‫مي‬ ‫زده‬ ‫تخمین‬ ‫جستجو‬ ‫موتور‬. ‫ها‬ ‫سایت‬ ‫بندی‬ ‫رتبه‬ ‫های‬ ‫مزیت‬ ‫از‬ ‫جلوگیری‬Web Spam ‫جستجو‬ ‫فضای‬ ‫کاهش‬ 4/30
  • 5. ‫سایت‬ ‫بندی‬ ‫رتبه‬(Web Ranking) ‫ها‬ ‫سایت‬ ‫بندی‬ ‫رتبه‬ ‫های‬ ‫روش‬ ‫انواع‬ ‫محتوا‬ ‫بر‬ ‫مبتنی‬(‫شده‬ ‫استفاده‬‫در‬ ‫اطالعات‬ ‫بازیابي‬‫سنتي‬) TF-IDF(‫برداری‬ ‫مدل‬ ‫در‬) BM25(‫احتمال‬ ‫مدل‬ ‫در‬) 5/30
  • 6. ‫سایت‬ ‫بندی‬ ‫رتبه‬(Web Ranking) ‫مبتنی‬‫ساختار‬ ‫بر‬(‫فعلي‬ ‫وب‬ ‫در‬ ‫شده‬ ‫استفاده‬) Page Ranking Algorithm Page Ranking Developed Algorithm Ant Colony Algorithm ‫ترکیبی‬ ‫الگوریتم‬ HITS Algorithm 6/30
  • 7. Page Ranking Algorithm ‫جز‬‫صفحات‬ ‫بندی‬ ‫رتبه‬ ‫های‬ ‫الگوریتم‬ ‫اولین‬ ‫وب‬ ‫سایت‬ ‫توسط‬google‫می‬ ‫استفاده‬‫شود‬ ‫الگوریتم‬ ‫های‬ ‫ویژگی‬ ‫تعداد‬ ‫و‬ ‫صفحه‬ ‫به‬ ‫شده‬ ‫اشاره‬ ‫صفحات‬ ‫به‬ ‫اهمیت‬ ‫صفحات‬ ‫از‬ ‫شده‬ ‫خارج‬ ‫های‬ ‫لینک‬ ‫شده‬ ‫داده‬ ‫ارجاع‬ ‫های‬ ‫صفحه‬ ‫به‬ ‫اهمیت‬ ‫اهمیت‬ ‫داری‬ ‫بیشتر‬ ‫ازجاع‬ ‫با‬ ‫صفحات‬ ‫که‬ ‫بیشتری‬ 7/30
  • 8. Page Ranking Algorithm 𝑃𝑅 𝑢 = 1 − 𝑑 + 𝑑 ∗ 𝑣𝜖𝐵 𝑢 𝑃𝑅 𝑣 𝑁𝑣 •:𝑃𝑅 𝑢‫صفحه‬ ‫رتبه‬u‫آن‬ ‫رتبه‬ ‫خواهیم‬ ‫می‬ ‫و‬ ‫است‬ ‫جاری‬ ‫صفحه‬ ‫همان‬ ‫که‬ ‫باشد‬ ‫می‬ ،‫کنیم‬ ‫محاسبه‬ ‫را‬. •:𝑑‫می‬ ‫کلیک‬ ‫ها‬ ‫لینک‬ ‫روی‬ ‫مداوم‬ ‫صورت‬ ‫به‬ ‫کاربر‬ ‫اینکه‬ ‫احتمال‬ ‫کند‬. •:𝟏 − 𝒅‫تصادفی‬ ‫صفحه‬ ‫یک‬ ‫به‬ ‫تصادفی‬ ‫صورت‬ ‫به‬ ‫کاربر‬ ‫اینکه‬ ‫احتمال‬ ‫کند‬ ‫پرسپش‬. •:𝑷𝑹(𝒗)Page Rank‫صفحه‬𝑣‫باشد‬ ‫می‬. •:𝑵𝒗‫صفحه‬ ‫خروجی‬ ‫درجه‬𝑣‫است‬. •:𝑩(𝒖)‫صفحه‬ ‫به‬ ‫ورودی‬ ‫لینک‬ ‫یک‬ ‫که‬ ‫است‬ ‫هایی‬ ‫گره‬ ‫مجموعه‬𝑢‫دارند‬. •‫نکته‬:𝑑‫بین‬ ‫مقدار‬ ‫یک‬ ‫که‬ ‫است‬ ‫تعدیل‬ ‫فاکتور‬ ‫یک‬‫و‬ 0 1‫می‬ ‫تنظیم‬ ‫شود‬.‫به‬ ‫وب‬ ‫گراف‬ ‫برای‬ ‫معموال‬0.85‫شود‬ ‫می‬ ‫تنظیم‬. 𝑃𝑅 𝑢 = 1 − 𝑑 + 𝑑 ∗ 𝑣𝜖𝐵 𝑢 𝑃𝑅 𝑣 𝑁𝑣 •:𝐏𝐑 𝐮‫صفحه‬ ‫رتبه‬u‫آن‬ ‫رتبه‬ ‫خواهیم‬ ‫می‬ ‫و‬ ‫است‬ ‫جاری‬ ‫صفحه‬ ‫همان‬ ‫که‬ ‫باشد‬ ‫می‬ ،‫کنیم‬ ‫محاسبه‬ ‫را‬. •:𝐝‫می‬ ‫کلیک‬ ‫ها‬ ‫لینک‬ ‫روی‬ ‫مداوم‬ ‫صورت‬ ‫به‬ ‫کاربر‬ ‫اینکه‬ ‫احتمال‬ ‫کند‬. •:𝟏 − 𝒅‫تصادفی‬ ‫صفحه‬ ‫یک‬ ‫به‬ ‫تصادفی‬ ‫صورت‬ ‫به‬ ‫کاربر‬ ‫اینکه‬ ‫احتمال‬ ‫کند‬ ‫پرسپش‬. •:𝑷𝑹(𝒗)Page Rank‫صفحه‬𝑣‫باشد‬ ‫می‬. •:𝑵𝒗‫صفحه‬ ‫خروجی‬ ‫درجه‬𝑣‫است‬. •:𝑩(𝒖)‫صفحه‬ ‫به‬ ‫ورودی‬ ‫لینک‬ ‫یک‬ ‫که‬ ‫است‬ ‫هایی‬ ‫گره‬ ‫مجموعه‬𝑢‫دارند‬. •‫نکته‬:𝑑‫بین‬ ‫مقدار‬ ‫یک‬ ‫که‬ ‫است‬ ‫تعدیل‬ ‫فاکتور‬ ‫یک‬‫و‬ 0 1‫می‬ ‫تنظیم‬ ‫شود‬.‫به‬ ‫وب‬ ‫گراف‬ ‫برای‬ ‫معموال‬0.85‫شود‬ ‫می‬ ‫تنظیم‬. 8/30
  • 9. Page Ranking Algorithm ‫مزایا‬ ‫مقابل‬ ‫در‬Spam‫کند‬ ‫می‬ ‫مبارزه‬ ‫آن‬ ‫به‬ ‫شده‬ ‫گذاری‬ ‫نقطه‬ ‫صفحات‬ ‫اگر‬ ‫است‬ ‫مهم‬ ‫صفحه‬ ‫یک‬ ‫باشد‬ ‫مهم‬. ‫صفحات‬ ‫تمام‬ ‫از‬ ‫صفحه‬ ‫بندی‬ ‫رتبه‬ ‫الگوریتم‬ ‫مقادیر‬ ‫بدون‬ ‫جستجو‬ ‫زمان‬ ‫در‬ ‫ترجیحا‬ ‫و‬ ‫شود‬ ‫می‬ ‫محاسبه‬ ‫شود‬ ‫ذخیره‬ ‫ارتباط‬ ‫معایب‬ ‫باشد‬ ‫مستقل‬ ‫جستجو‬ ‫صفحاتی‬ ‫و‬ ‫دارند‬ ‫توانایی‬ ‫مجموع‬ ‫در‬ ‫که‬ ‫صفحاتی‬ ‫بین‬ ‫قائل‬ ‫تمایز‬ ‫وجه‬ ‫است‬ ‫معتبر‬ ‫جستجو‬ ‫عنوان‬ ‫روی‬ ‫بر‬ ‫که‬ ‫شود‬ ‫نمی‬ 9/30
  • 10. Ant Colony Algorithm ‫بهینه‬ ‫مسائل‬ ‫برای‬ ‫عامله‬ ‫چند‬ ‫حلی‬ ‫راه‬‫سازی‬ ‫روی‬ ‫مشاهده‬ ‫و‬ ‫مطالعه‬ ‫براساس‬ ‫الگوریتم‬ ‫این‬ ‫ارائه‬ ‫مورچگان‬‫گردید‬ 10/30
  • 11. Ant Colony Algorithm 𝜏𝑖(𝑡+1)=(1−𝜌).𝜏𝑖𝑗(𝑡)+ Δ𝜏𝑖𝑗(𝑡) 𝜏𝑖𝑗‫های‬ ‫گره‬ ‫بین‬ ‫فرومون‬ ‫میزان‬i‫و‬j‫را‬ ‫دهد‬ ‫می‬ ‫نشان‬ 𝜌‫است‬ ‫فرمون‬ ‫تبخیر‬ ‫میزان‬)1≥𝜌>0) Δ𝜏𝑖𝑗‫مورچه‬ ‫که‬ ‫است‬ ‫فرومونی‬ ‫مقدار‬K‫بر‬ ‫ام‬ ‫ریزد‬ ‫می‬ ‫است‬ ‫کرده‬ ‫مالقات‬ ‫که‬ ‫هایی‬ ‫یال‬ ‫روی‬. 11/30
  • 12. ‫ترکیبی‬ ‫الگوریتم‬ ‫الگوریتم‬ ‫دو‬ ‫از‬ ‫گرفتن‬ ‫الهام‬PageRank‫و‬ ‫مورچگان‬ ‫اجتماع‬ ‫و‬ ‫کاوی‬ ‫وب‬ ‫ازکاربرد‬ ‫تلفیقی‬ ‫الگوریتم‬ ‫این‬ ‫کاوی‬ ‫وب‬ ‫ساختار‬‫است‬ 12/30
  • 13. ‫ترکیبی‬ ‫الگوریتم‬ ‫فایل‬ ‫وب‬ ‫ثبت‬ ‫سرور‬ ‫پیش‬ ‫پردازش‬ ‫فایل‬ ‫ثبت‬ ‫استخراج‬ ‫ویژگی‬ ‫های‬ ‫کاربران‬ ‫سازی‬ ‫بردار‬ ‫ساخت‬ ‫پروفایل‬ ‫کاربران‬ ‫پروفایل‬ ‫کاربران‬ ‫استفاده‬ ‫از‬ ‫اجتماع‬ ‫مورچگان‬ ‫بندی‬ ‫رتبه‬ ‫صفحات‬ 13/30
  • 14. ‫ترکیبی‬ ‫الگوریتم‬ 𝑃𝑅 𝑢 = 1 − 𝑑 + 𝑑 ∗ (( 𝑣𝜀𝐵 𝑢 𝑃𝑅(𝑣)/𝑁𝑣) + 𝑝 𝑢) :𝑷𝑹 𝒖‫صفحه‬ ‫رتبه‬u‫خواهیم‬ ‫می‬ ‫و‬ ‫است‬ ‫جاری‬ ‫صفحه‬ ‫همان‬ ‫که‬ ‫باشد‬ ‫می‬ ،‫کنیم‬ ‫محاسبه‬ ‫را‬ ‫آن‬ ‫رتبه‬. :𝒅‫کلیک‬ ‫ها‬ ‫لینک‬ ‫روی‬ ‫مداوم‬ ‫صورت‬ ‫به‬ ‫کاربر‬ ‫اینکه‬ ‫احتمال‬ ‫کند‬ ‫می‬. :𝟏 − 𝒅‫صفحه‬ ‫یک‬ ‫به‬ ‫تصادفی‬ ‫صورت‬ ‫به‬ ‫کاربر‬ ‫اینکه‬ ‫احتمال‬ ‫کند‬ ‫پرسپش‬ ‫تصادفی‬. :𝑷𝑹(𝒗)PageRank‫صفحه‬𝑣‫باشد‬ ‫می‬. :𝑵𝒗‫صفحه‬ ‫خروجی‬ ‫درجه‬𝑣‫است‬. :𝑩(𝒖)‫صفحه‬ ‫به‬ ‫ورودی‬ ‫لینک‬ ‫یک‬ ‫که‬ ‫است‬ ‫هایی‬ ‫گره‬ ‫مجموعه‬𝑢 ‫دارند‬. :𝒑 𝒖‫صفحه‬ ‫روی‬ ‫بر‬ ‫گرفته‬ ‫قرار‬ ‫فرومون‬ ‫مقدار‬u‫است‬. ‫نکته‬:𝑑‫بین‬ ‫مقدار‬ ‫یک‬ ‫که‬ ‫است‬ ‫تعدیل‬ ‫فاکتور‬ ‫یک‬‫و‬ 0 1 ‫شود‬ ‫می‬ ‫تنظیم‬.‫به‬ ‫وب‬ ‫گراف‬ ‫برای‬ ‫معموال‬0.85‫می‬ ‫تنظیم‬ ‫شود‬. 14/30
  • 15. Page Ranking Developed Algorithm ‫الگوریتم‬Weighted PageRank‫یافته‬ ‫توسعه‬ ‫الگویتم‬ ‫الگوریتم‬PageRank‫است‬. ‫دهی‬ ‫رتبه‬ ‫نحوه‬ ‫خروجی‬ ‫و‬ ‫ورودی‬ ‫های‬ ‫لینک‬ ‫به‬ ‫اهمیت‬ ‫توزیع‬ ‫صفحات‬ ‫محبوبیت‬ ‫بر‬ ‫مبنی‬ ‫بندی‬ ‫رتبه‬ ‫امتیاز‬ ‫شده‬ 15/30
  • 16. Page Ranking Developed Algorithm ‫که‬ ‫است‬ ‫موجود‬ ‫الگوریتم‬ ‫این‬ ‫برای‬ ‫مختلف‬ ‫های‬ ‫مدل‬ ‫کنیم‬ ‫می‬ ‫بیان‬ ‫را‬ ‫ها‬ ‫آن‬ ‫از‬ ‫بعضی‬: ‫عصبی‬ ‫های‬ ‫شبکه‬ ‫بر‬ ‫مبتنی‬ ‫مارکوف‬ ‫زنجیره‬ ‫بر‬ ‫مبتنی‬ ‫ها‬ ‫لینک‬ ‫بازدید‬ ‫بر‬ ‫مبتنی‬ ‫زمان‬ ‫فاکتور‬ ‫بر‬ ‫مبتنی‬ 16/30
  • 17. HITS Algorithm ‫الگوریتم‬ ‫اجرای‬ ‫از‬ ‫قبل‬HITS‫می‬ ‫اتفاقی‬ ‫چه‬ ‫افتد؟‬ ‫صفحات‬ ‫ترین‬ ‫مرتبط‬ ‫استخراج‬(Root Set) ‫مجموعه‬ ‫به‬ ‫که‬ ‫صفحاتی‬ ‫استخراج‬Root‫و‬ ‫داده‬ ‫لینک‬ ‫است‬ ‫شده‬ ‫زده‬ ‫پیوند‬ ‫یا‬(Base Root) 17/30
  • 18. HITS Algorithm ‫امتیاز‬ ‫یک‬ ‫صفحه‬ ‫هر‬ ‫به‬Hub‫امتیاز‬ ‫یک‬ ‫و‬Authority‫شود‬ ‫می‬ ‫داده‬ Authority:‫هستند‬ ‫سایت‬ ‫به‬ ‫شده‬ ‫وارد‬ ‫های‬ ‫لینک‬ ‫تعداد‬ Hub:‫هستند‬ ‫سایت‬ ‫از‬ ‫شده‬ ‫خارج‬ ‫های‬ ‫لینک‬ ‫تعداد‬ ‫یک‬Authority‫از‬ ‫مناسب‬ ‫ای‬ ‫مجموعه‬ ‫توسط‬ ‫خوب‬Hub‫و‬ ‫است‬ ‫شده‬ ‫اشاره‬ ‫بلعکس‬. ‫داریم‬ ‫زیر‬ ‫ویژگی‬ ‫با‬ ‫گرافی‬ ‫تشکیل‬ ‫به‬ ‫نیاز‬ ‫حال‬: 1 , 𝑖𝑓 𝑖,𝑗 ∈ 𝐸 0 , 𝑜𝑡ℎ𝑤𝑒𝑤𝑖𝑠𝑒 𝐿𝑖𝑗 18/30
  • 19. HITS Algorithm ‫مقادیر‬ ‫حال‬Authority‫و‬Hub‫زیر‬ ‫صورت‬ ‫به‬ ‫شود‬ ‫می‬ ‫محاسبه‬: 𝐻𝐼𝑇𝑆𝐴𝑢𝑡ℎ𝑜𝑟𝑖𝑡𝑦 𝑣𝑖 = 𝑣𝑗∈𝑖𝑛(𝑉𝑖) 𝐻𝐼𝑇𝑆 𝐻𝑢𝑏(𝑉𝑗) 𝐻𝐼𝑇𝑆 𝐻𝑢𝑏 𝑣𝑖 = 𝑣𝑗∈𝑜𝑢𝑡(𝑉𝑖) 𝐻𝐼𝑇𝑆𝐴𝑢𝑡ℎ𝑜𝑟𝑖𝑡𝑦(𝑉𝑗) ‫اولیه‬ ‫مقادیر‬Hub‫و‬Authority‫برابر‬1‫است‬. 19/30
  • 20. HITS Algorithm ‫مزیت‬HITS: ‫توانایی‬‫جستجو‬ ‫موضوع‬ ‫برطبق‬ ‫صفحات‬ ‫بندی‬ ‫رتبه‬ ‫دارد‬ ‫در‬ ‫بیشتر‬ ‫توانایی‬‫به‬ ‫مربوط‬ ‫صفحات‬ ‫کردن‬ ‫فراهم‬ Hub‫و‬Authority‫را‬‫دارد‬. ‫الگوریتم‬ ‫معایب‬HITS: ‫است‬ ‫ناکارآمد‬ ‫جستجو‬ ‫زمان‬ ‫در‬. ‫ارزیابی‬‫است‬ ‫تدریجی‬ ‫و‬ ‫کند‬ ‫جستجو‬ ‫زمان‬. 20/30
  • 22. iRank Algorithm ‫برپایه‬‫الگوریتم‬PageRank ‫ساختار‬‫بالگ‬ ‫فضای‬ ‫گراف‬ ‫غیرصریح‬ ‫و‬ ‫ضمنی‬ ‫در‬ ‫موجود‬ ‫اطالعات‬ ‫صفحات‬ ‫دهی‬ ‫رتبه‬ ‫در‬ ‫را‬ ‫تاثیر‬‫دهیم‬ ‫می‬ ‫وبالگ‬ ‫فضای‬ ‫در‬ ‫زمان‬ ‫ویژگی‬ ‫پایه‬ ‫بر‬ ‫فاصله‬ ‫براساس‬ ‫گراف‬ ‫های‬ ‫یال‬ ‫دهی‬ ‫وزن‬ ‫است‬ ‫دادن‬ ‫پیوند‬ ‫زمانی‬ 22/30
  • 23. iRank Algorithm 𝒘𝒋𝒊 𝒖 = 𝒘(∆𝒅𝒊𝒋) ∆𝑑‫یا‬ ‫مطلب‬ ‫یک‬ ‫به‬ ‫وبالگ‬ ‫دو‬ ‫که‬ ‫زمانی‬ ‫فاصله‬ ‫برابر‬ URL‫کنتد‬ ‫می‬ ‫اشاره‬. ،‫باشد‬ ‫کمتر‬ ‫دادن‬ ‫لینک‬ ‫فرآیند‬ ‫زمانی‬ ‫فاصله‬ ‫چه‬ ‫هر‬ ‫است‬ ‫بیشتر‬ ‫پیوند‬ ‫امتیاز‬(‫چرا؟‬) 𝒘𝒋𝒊 𝒖 𝒏𝒋 𝒌 𝒘 𝒋𝒌 𝒖 ،‫پیوندها‬ ‫مقادیر‬ ‫محاسبه‬‫بالگ‬ ‫اگر‬bj‫به‬ni،URL ‫باشد‬ ‫کرده‬ ‫اشاره‬ ‫متفاوت‬ ‫یک‬ ‫برابر‬ ‫بالگ‬ ‫یک‬ ‫از‬ ‫شده‬ ‫خارج‬ ‫های‬ ‫یال‬ ‫وزن‬ ‫مجموع‬ ‫بود‬ ‫خواهد‬ ‫الگوریتم‬ ،‫گراف‬ ‫این‬ ‫تولید‬ ‫از‬ ‫بعد‬PageRank‫این‬ ‫روی‬ 23/30
  • 24. BlogRank Algorithm ‫دهی‬ ‫رتبه‬ ‫زمینه‬ ‫در‬ ‫ها‬ ‫الگوریتم‬ ‫ترین‬ ‫جدی‬ ‫از‬ ‫یکی‬ ‫بالک‬ ‫سال‬ ‫در‬2006‫شد‬ ‫ارائه‬ ‫یافته‬ ‫تعمیم‬ ‫نسخه‬PageRank‫باشد‬ ‫می‬ 24/30
  • 25. BlogRank Algorithm ‫محاسبه‬ ‫نحوه‬BlogRank‫صفحه‬ ‫یک‬ 𝐵 𝐴 = 1 − 𝑑 + 𝑑(𝐹𝑁 𝑈1 → 𝐴 ∗ 𝐵 𝑈1 + ⋯ + 𝐹𝑁 𝑈 𝑛 → 𝐴 ∗ 𝐵 𝑈 𝑛 ) B(A):BlogRank‫بالگ‬A‫است‬ B(Ui)‫نیز‬BlogRank‫بالک‬ ‫برای‬Ui‫بالگ‬ ‫به‬ ‫که‬ ‫است‬A‫پیوند‬ ‫دارد‬ d‫تعدیل‬ ‫ضریب‬‫الگوریتم‬ ‫در‬ ‫شده‬ ‫استفاده‬PageRank‫است‬ FN(Un→A)‫بالگ‬ ‫انتخاب‬ ‫احتمال‬ ‫مقدار‬A‫از‬ ‫بعد‬ ‫کاربر‬ ‫توسط‬ ‫بالگ‬ ‫مشاهده‬n‫باشد‬ ‫می‬. ‫این‬‫بالگ‬ ‫مطلوبیت‬ ‫از‬ ‫کاربر‬ ‫تصور‬ ‫دهنده‬ ‫نشان‬ ،‫مقدار‬A‫است‬. 25/30
  • 26. BlogRank Algorithm ‫زمانی‬ ‫چه‬BlogRank‫مشابه‬PageRank‫باشد؟‬ ‫می‬ ‫اگر‬Z‫با‬ ‫بالگی‬T‫خروجی‬ ‫پیوند‬‫باشد‬ 𝒋=𝟏 𝒕 𝑭𝑵 𝑼 𝒛 → 𝒋 = 𝟏 N‫بالگ‬ ‫از‬ ‫ها‬ ‫خروجی‬ ‫مجموع‬ ‫تعداد‬z‫باشد‬ ‫کاربر‬ ‫حرکت‬ ‫برای‬‫پیوندهای‬ ‫به‬ ‫بالگ‬ ‫صفحه‬ ‫یک‬ ‫از‬ ‫خروجی‬‫نباید‬‫داد‬ ‫یکسان‬ ‫احتمال‬. 26/30
  • 27. BlogRank Algorithm ‫برای‬‫محاسبه‬FN(Uz→j)‫نظیر‬ ‫هایی‬ ‫بالگ‬j‫اهمیت‬ ‫دارای‬ ‫را‬ ‫که‬ ‫داند‬ ‫می‬: (1‫بالگ‬ ‫با‬ ‫همراه‬z‫دسته‬ ‫به‬ ‫متعلق‬(Category)‫مشترک‬ ‫باشد‬. (2‫بالگ‬ ‫با‬ ‫همراه‬z‫به‬ ‫یکسان‬ ‫های‬ ‫پیوند‬ ‫تعداد‬ ‫دارای‬ ‫سایت‬‫باشد‬ ‫مختلف‬ ‫های‬. 𝑭𝑵(𝑼 𝒛→𝒋) = 𝑭 𝒛→𝒋 𝑭 𝒛→𝒙 27/30
  • 28. BlogRank Algorithm 𝐹𝑧→𝑗 = 𝐿 𝑍→𝑙 + 𝑤 𝑇 ∗ 𝑇𝑧→𝑗 + 𝑤 𝑢 ∗ 𝑢 𝑧→𝑗 + 𝑤 𝑁 ∗ 𝑁𝑧→𝑗 L‫بالگ‬ ‫از‬ ‫پیوندها‬ ‫تعداد‬j‫است‬ T‫که‬ ‫است‬ ‫هایی‬ ‫دسته‬ ‫تعداد‬j‫و‬z‫تعلق‬ ‫آنها‬ ‫به‬ ‫دو‬ ‫هر‬ ‫دارند‬. U‫به‬ ‫مشترک‬ ‫پست‬ ‫که‬ ‫است‬ ‫کاربرانی‬ ‫تعداد‬j‫و‬z‫فرستاده‬ ‫اند‬ N‫نیز‬‫های‬ ‫سایت‬ ‫به‬ ‫مشترک‬ ‫پیوندهای‬ ‫تعداد‬‫در‬ ‫مختلف‬ ‫های‬ ‫بالگ‬j‫و‬z‫می‬‫باشد‬ wT،wU‫و‬wN‫برای‬ ‫ضرایبی‬ ،T،N‫و‬U‫هستند‬ ‫الگوریتم‬ ،‫ها‬ ‫بالگ‬ ‫به‬ ‫دهی‬ ‫وزن‬ ‫از‬ ‫بعد‬PageRank‫می‬ ‫بدست‬ ‫آید‬ 28/30
  • 29. Reference 1) Page, L., Brin, S., Motwani, R., Winograd,T., "The PageRank Citation Ranking:Bringing Order to theWeb",Technical Report. Stanford InfoLab, 1999 2) Xing,W., Ghorbani,A., "Weighted PageRank Algorithm", Proceedings of the Second Annual Conference on Communication Networks and Services Research (CNSR’04), IEEE, pp. 305- 314, 2004. 3) Dorigo, M., Maniezzo,V., Colorni, A., "Ant System:Optimization by a Colony of Cooperating Agent", IEEE, vol.26, pp.29-41,1996. 4) Marc Najork, Hugo Zaragoza,MichaelTaylor, “HITS on the web: How dose it Compare”? 5) Ko Fujimmura,Takafunmi Inoue and Masayuki Sugisaki.The EigenRumor algorithm for ranking blogs. InWorkshop on theWeblogging Ecosystem, 2005. 29/30