‫عقاید‬ ‫تحلیل‬ ‫در‬ ‫داده‬ ‫کالن‬ ‫های‬ ‫چالش‬ ‫و‬ ‫کاربرد‬ ‫بررسی‬
‫وامرزانی‬ ‫عزیزی‬ ‫حامد‬**
‫نرم‬ ‫کامپیوتر‬ ‫مهندسی‬ ‫گروه‬‫افزار‬
‫تهران‬ ‫مهندسی‬ ‫و‬ ‫فنی‬ ‫دانشکده‬‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ،‫جنوب‬
‫ایران‬ ،‫تهران‬
st_h_azizi@azad.ac.ir
‫خادمی‬ ‫مریم‬
‫ری‬ ‫گروه‬‫اضی‬‫کاربردی‬
‫دانشکده‬‫جنوب‬ ‫تهران‬ ‫پایه‬ ‫علوم‬‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ،
‫ایران‬ ،‫تهران‬
khademi@azad.ac.ir
‫چکیده‬—‫رسانه‬ ‫محبوبیت‬ ‫و‬ ‫گسترش‬ ‫با‬‫جوامع‬ ‫این‬ ،‫محور‬ ‫کاربر‬ ‫های‬
‫تج‬ ،‫سیاسی‬ ‫گوناگون‬ ‫اطالعات‬ ‫از‬ ‫ارزشمند‬ ‫منبعی‬ ‫به‬ ‫مجازی‬،‫اری‬
‫نشان‬ ‫اطالعاتی‬ ‫این‬ .‫است‬ ‫شده‬ ‫تبدیل‬ ... ‫و‬ ‫اجتماعی‬‫و‬ ‫افکار‬ ‫دهنده‬
‫وسیع‬ ‫دید‬ ‫در‬ ‫و‬ ‫فرد‬ ‫یک‬ ‫احساسات‬‫با‬ ‫که‬ ‫است‬ ‫کشور‬ ‫یک‬ ‫و‬ ‫جامعه‬ ،‫تر‬
‫داده‬ ‫این‬ ‫در‬ ‫کاوش‬‫می‬ ‫ها‬‫حوزه‬ ‫در‬ ‫ارزشی‬ ‫با‬ ‫بسیار‬ ‫دانش‬ ‫به‬ ‫توان‬‫های‬
‫کالن‬ ‫اطالعات‬ ‫از‬ ‫حجم‬ ‫این‬ ‫تحلیل‬ ‫است‬ ‫واضح‬ .‫یافت‬ ‫دست‬ ‫گوناگون‬
‫غیرساخت‬‫یاف‬‫روش‬ ‫نیازمند‬ ،‫کاربران‬ ‫ته‬‫متن‬ ‫بهینه‬ ‫و‬ ‫نوین‬ ‫های‬‫و‬ ‫کاوی‬
.‫است‬ ‫طبیعی‬ ‫زبان‬ ‫پردازش‬
‫تحلیل‬ ‫کاربردهای‬ ‫معرفی‬ ‫از‬ ‫پس‬ ‫مقاله‬ ‫این‬ ‫در‬‫عقاید‬‫یک‬ ‫در‬ ‫کاربران‬
‫کالن‬ ‫مجموعه‬‫شبکه‬ ‫همانند‬ ‫داده‬‫های‬‫سایت‬ ‫یا‬ ‫و‬ ‫اجتماعی‬‫بزرگ‬ ‫های‬
‫چالش‬ ،‫مباحث‬ ‫آخرین‬ ،‫اینترنتی‬ ‫فروش‬‫راه‬ ‫و‬ ‫ها‬‫حوزه‬ ‫این‬ ‫در‬ ‫کارها‬‫مورد‬
.‫گرفت‬ ‫خواهد‬ ‫قرار‬ ‫بررسی‬
‫واژ‬‫ه‬‫کلیدی‬ ‫های‬-‫متن‬ ،‫اجتماعی‬ ‫شبکه‬،‫کاوی‬‫کالن‬‫داده‬‫تحلیل‬ ،‫عقاید‬،
‫طبقه‬‫بندی‬
1.‫مقدمه‬
‫ارزش‬ ‫گاهی‬ ‫و‬ ‫مشترک‬ ‫وجوه‬ ‫داشتن‬ ‫دلیل‬ ‫به‬ ‫جامعه‬ ‫در‬ ‫افراد‬‫مشترک‬ ‫های‬
‫شبکه‬ ‫و‬ ‫گذاشته‬ ‫تأثیر‬ ‫یکدیگر‬ ‫روی‬ ‫بر‬‫آن‬ ‫بین‬ ‫در‬ ‫اعتماد‬ ‫و‬ ‫ارزش‬ ‫از‬ ‫ای‬‫ها‬
‫خاصی‬ ‫موضوعات‬ ‫برای‬‫می‬ ‫ایجاد‬.‫گردد‬
‫شبکه‬‫اجتماعی‬ ‫های‬‫فروشگاه‬ ،‫وبالگ‬ ‫و‬ ‫اینترنتی‬ ‫های‬‫ها‬‫منبع‬ ‫به‬
‫ارز‬‫شمند‬‫زمینه‬ ‫در‬ ‫احساسات‬ ‫کاوش‬ ‫برای‬ ‫ی‬‫مدیریت‬ ‫نظیر‬ ‫گوناگونی‬ ‫هایی‬
،‫مشتری‬ ‫با‬ ‫ارتباط‬‫جامعه‬‫کاوش‬ ،‫بازاریابی‬ ،‫شناسی‬‫افکار‬‫و‬ ‫سیاست‬ ،‫عمومی‬
‫تبدیل‬ ...‫شده‬‫ان‬.‫د‬‫رسیده‬ ‫اثبات‬ ‫به‬ ‫حقیقت‬ ‫این‬‫ب‬ ‫دانش‬ ‫که‬‫ه‬‫دست‬‫آ‬‫از‬ ‫مده‬
‫شبکه‬‫فیس‬ ‫و‬ ‫توییتر‬ ‫نظیر‬ ‫اجتماعی‬ ‫های‬‫بوک‬‫سایت‬ ‫یا‬ ‫و‬‫فروش‬ ‫بزرگ‬ ‫های‬
‫روش‬ ‫دیگر‬ ‫به‬ ‫نسبت‬ ‫باالتری‬ ‫ارزش‬ ‫مراتب‬ ‫به‬ ‫آمازون‬ ‫همانند‬ ‫اینترنتی‬‫های‬
‫زیرا‬ ،‫دارند‬ ‫افراد‬ ‫از‬ ‫فیزیکی‬ ‫مصاحبه‬ ‫و‬ ‫نظرسنجی‬ ‫مانند‬ ‫عقیده‬ ‫کاوش‬ ‫سنتی‬
‫این‬ ‫در‬‫شبکه‬ ‫گونه‬‫خالص‬ ‫نظرات‬ ‫کاربران‬ ً‫ال‬‫معمو‬ ‫ها‬‫می‬ ‫ارائه‬ ‫را‬ ‫خود‬‫و‬ ‫دهند‬
.‫نیست‬ ‫تأثیرگذار‬ ‫آن‬ ‫روی‬ ‫بر‬ ‫عاملی‬ ‫هیچ‬ ‫نوعی‬ ‫به‬
‫به‬‫می‬ ‫مردم‬ ‫اطالعاتی‬ ‫منبع‬ ‫این‬ ‫وسیله‬‫صحیح‬ ‫تصمیمات‬ ‫توانند‬‫با‬ ‫تری‬
‫محصول‬ ‫صاحبان‬ ‫راستا‬ ‫همین‬ ‫در‬ ‫و‬ ‫کنند‬ ‫اتخاذ‬ ‫افراد‬ ‫دیگر‬ ‫تجربیات‬ ‫به‬ ‫توجه‬
‫می‬ ‫نیز‬ ‫خدمات‬ ‫یا‬ ‫و‬‫عقاید‬ ‫و‬ ‫نظرات‬ ‫این‬ ‫تحلیل‬ ‫به‬ ‫توجه‬ ‫با‬ ‫توانند‬‫خود‬ ‫کیفیت‬
.‫بخشند‬ ‫بهبود‬ ‫را‬
‫مقاله‬ ‫عنوان‬
‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
2
‫آمارها‬ ‫آخرین‬ ‫طبق‬[9]‫فیس‬ ‫اجتماعی‬ ‫شبکه‬‫پیدایش‬ ‫زمان‬ ‫از‬ ‫بوک‬
‫سال‬ ‫در‬ ‫خود‬ ‫رسمی‬2004‫توانسته‬ ‫تاکنون‬44/9‫که‬ ‫را‬ ‫فعالی‬ ‫کاربر‬ ‫میلیارد‬
‫می‬ ‫خود‬ ‫شخصی‬ ‫صفحه‬ ‫وارد‬ ‫بار‬ ‫یک‬ ‫حداقل‬ ‫ماهیانه‬‫دنیا‬ ‫سراسر‬ ‫در‬ ‫را‬ ‫شوند‬
‫حدود‬ ‫دقیقه‬ ‫یک‬ ‫در‬ ‫کاربران‬ ‫این‬ ،‫کند‬ ‫جذب‬000/49‫عنوان‬ ‫به‬ ‫را‬ ‫متنی‬ ‫بار‬
‫فیس‬ ‫در‬ ‫وضعیت‬‫می‬ ‫بوک‬‫نو‬‫یسند‬[2]،‫توییتر‬ ‫اجتماعی‬ ‫شبکه‬ ‫در‬ ‫اما‬‫روزانه‬
000‫به‬ )‫(توییت‬ ‫نوشته‬ ‫میلیون‬33‫زب‬‫می‬ ‫منتشر‬ ‫کاربران‬ ‫توسط‬ ‫دنیا‬ ‫زنده‬ ‫ان‬
‫شود‬.‫از‬ ‫بیش‬ ‫آمازون‬ ‫اینترنتی‬ ‫فروش‬ ‫بزرگ‬ ‫سایت‬ ‫در‬270‫فعال‬ ‫کاربر‬ ‫میلیون‬
‫دارد‬ ‫وجود‬‫در‬ ‫را‬ ‫نظرات‬ ‫از‬ ‫عظیمی‬ ‫حجم‬ ‫که‬‫وارد‬ ‫مختلف‬ ‫محصوالت‬ ‫مورد‬
.‫کنند‬ ‫می‬
‫خوان‬ ‫است‬ ‫واضح‬‫نظرات‬ ‫از‬ ‫بخشی‬ ‫حتی‬ ‫یا‬ ‫و‬ ‫تمامی‬ ‫بررسی‬ ‫و‬ ‫دن‬
‫وقت‬ ‫کاری‬ ‫کاربران‬‫در‬ ‫و‬ ‫گیر‬‫داده‬ ‫از‬ ‫عظیم‬ ‫حجم‬ ‫این‬،‫است‬ ‫غیرممکن‬
‫عقیده‬ ‫حوزه‬ ‫در‬ ‫بنابراین‬‫ابزاری‬ ‫بهبود‬ ‫و‬ ‫ساخت‬ ‫دنبال‬ ‫به‬ ‫پژوهشگران‬ ‫کاوی‬
‫به‬ ‫توجه‬ ‫با‬ ‫را‬ ‫کاربران‬ ‫نظرات‬ ‫و‬ ‫عقیده‬ ‫خودکار‬ ‫صورت‬ ‫به‬ ‫بتواند‬ ‫که‬ ‫هستند‬
‫نوشته‬‫های‬‫آنان‬‫استخراج‬‫ذی‬ ‫به‬ ‫کلی‬ ‫وضعیت‬ ‫یک‬ ‫و‬ ‫کند‬.‫بدهد‬ ‫نفعان‬
2.‫مفاهیم‬‫و‬‫الیه‬‫تحلیل‬ ‫مختلف‬ ‫های‬
‫تعار‬‫ی‬‫ف‬‫ز‬‫ی‬‫اد‬‫ی‬‫ب‬ ‫مختلف‬ ‫مقاالت‬ ‫در‬‫ی‬‫ان‬‫همگ‬ ‫که‬ ‫شده‬‫ی‬‫ی‬‫ک‬‫معنا‬‫ی‬‫واحد‬
‫تحل‬ .‫دارند‬ ‫را‬‫ی‬‫ل‬‫احساسات‬‫و‬‫عق‬‫ی‬‫ده‬‫‏‬‫کاوی‬‫معن‬ ‫به‬‫ی‬‫شناخت‬ ‫و‬ ‫کشف‬
‫و‬ ‫مثبت‬ ‫احساسات‬‫ی‬‫ا‬‫منف‬‫ی‬‫به‬ ‫راجع‬ ‫مردم‬‫ی‬‫ک‬‫مسأله‬‫ی‬‫ا‬‫است‬ ‫محصول‬[3].
‫چهارگانه‬ ‫یک‬ ‫نظر‬ ‫یک‬ :‫نظر‬(g, s, h, t)‫آن‬ ‫در‬ ‫که‬ ‫است‬g‫هدف‬
‫که‬ ‫(آنچه‬"‫نظر‬"،)‫است‬ ‫شده‬ ‫بیان‬ ‫آن‬ ‫مورد‬ ‫در‬s،‫شده‬ ‫بیان‬ ‫حس‬h
‫و‬ ‫نظر‬ ‫صاحب‬t‫نظر‬ ‫بیان‬ ‫زمان‬‫است‬.
:‫موجودیت‬‫موجودیت‬ ‫یک‬e،‫شخص‬ ،‫سرویس‬ ،‫محصول‬ ‫یک‬
‫می‬ ‫تعریف‬ ‫جفت‬ ‫یک‬ ‫با‬ ‫که‬ ‫است‬ ‫عنوانی‬ ‫یا‬ ‫سازمان‬ ،‫رخداد‬-
:‫شود‬e:(T,W)‫که‬T‫امثال‬ ‫و‬ ‫زیرجزء‬ ‫و‬ ‫جزء‬ ‫مراتب‬ ‫سلسله‬ ‫یک‬
‫و‬ ‫آن‬W‫خص‬ ‫مجموعه‬‫ا‬‫هم‬ ‫زیرجزء‬ ‫هر‬ .‫است‬ ‫موجودیت‬ ‫آن‬ ‫یص‬
‫خص‬ ‫خودش‬‫ا‬.‫داراست‬ ‫را‬ ‫خود‬ ‫یص‬‫آن‬ ‫همگی‬ ‫وجود‬‫ضروروی‬ ‫ها‬
‫با‬ ‫تحلیل‬ ‫کار‬ ،‫قسمت‬ ‫پنج‬ ‫این‬ ‫از‬ ‫یک‬ ‫هر‬ ‫نبود‬ ‫صورت‬ ‫در‬ ‫و‬ ‫بوده‬
‫روبه‬ ‫مشکل‬.‫شد‬ ‫خواهد‬ ‫رو‬
‫عقیده‬‫م‬ ‫تقسیم‬ ‫تحلیل‬ ‫مختلف‬ ‫سطح‬ ‫سه‬ ‫در‬ ‫کاوی‬‫ی‬‫شود‬[4].
‫سند‬ ‫سطح‬‫آن‬ ‫دنبال‬ ‫به‬ ‫نظری‬ ‫سند‬ ‫یک‬ ‫داشتن‬ ‫با‬ ‫سطح‬ ‫این‬ ‫در‬ :
‫منفی‬ ‫یا‬ ‫مثبت‬ ‫نظر‬ ‫سند‬ ‫این‬ ‫کل‬ ‫بدانیم‬ ‫که‬ ‫هستیم‬.‫دارد‬‫عنوان‬ ‫به‬
‫مقاله‬ ‫یک‬ ‫داشتن‬ ‫با‬ ‫مثال‬‫نقد‬ ‫یا‬‫مشخص‬ ‫سیستم‬ ،‫محصول‬ ‫یک‬ ‫از‬
‫می‬.‫است‬ ‫بوده‬ ‫منفی‬ ‫یا‬ ‫مثبت‬ ‫کلی‬ ‫نظر‬ ‫مسأله‬ ‫مورد‬ ‫در‬ ‫که‬ ‫نماید‬
‫جمله‬ ‫سطح‬:‫مث‬ ‫های‬ ‫دسته‬ ‫به‬ ‫جمالت‬‫و‬ ،‫منفی‬ ،‫بت‬‫دسته‬ ‫خنثی‬
‫می‬ ‫بندی‬‫شوند‬.
‫ویژگی‬ ‫و‬ ‫موجودیت‬ ‫سطح‬:‫زبان‬ ‫ساختارهای‬ ‫به‬ ‫پرداختن‬ ‫جای‬ ‫به‬
‫خود‬ ‫سراغ‬ ‫مستقیما‬ ‫سطح‬ ‫این‬ ‫در‬ ... ‫و‬ ‫عبارت‬ ،‫پارگراف‬ ،‫جمله‬ ‫مثل‬
‫می‬ ‫نظر‬‫جزء‬ ‫(دو‬ ‫آن‬ ‫به‬ ‫مربوط‬ ‫حس‬ ‫و‬ ‫موجودیت‬ ‫اغلب‬ .‫رویم‬
‫می‬ ‫هم‬ ‫با‬ ‫همراه‬ )‫نظر‬ ‫اصلی‬‫کشف‬ ‫دنبال‬ ‫به‬ ‫سطح‬ ‫این‬ ‫در‬ .‫آیند‬‫حس‬
‫موجودیت‬ ‫روی‬‫جنبه‬ ‫و‬ ‫ها‬‫ها‬9
‫هستیم‬ ‫آنها‬ ‫مختلف‬ ‫ها)ی‬ ‫(ویژگی‬‫که‬
.‫دارد‬ ‫بیشتر‬ ‫های‬ ‫پیچیدگی‬ ‫قبل‬ ‫حالت‬ ‫دو‬ ‫به‬ ‫نسب‬ ‫به‬
3.‫تاریخچه‬‫کاربرد‬ ‫و‬
‫اولین‬ ‫از‬ ‫یکی‬‫تحقیقات‬‫سال‬ ‫در‬ ‫حوزه‬ ‫این‬ ‫در‬9171‫کاربنل‬ ‫توسط‬[0]
‫شبیه‬ ‫مدل‬ ‫یک‬ ‫از‬ ‫وی‬ ،‫شد‬ ‫معرفی‬‫که‬ ‫کرد‬ ‫طراحی‬ ‫را‬ ‫کامپیوتری‬ ‫شده‬ ‫سازی‬
‫می‬‫را‬ ‫کار‬ ‫محافظه‬ ‫یا‬ ‫و‬ ‫خواه‬ ‫آزادی‬ ‫حزب‬ ‫از‬ ‫فرد‬ ‫یک‬ ‫سیاسی‬ ‫عقاید‬ ‫توانست‬
‫سیاست‬ ‫به‬ ‫توجه‬ ‫با‬‫و‬ ‫آمریکا‬‫روسیه‬‫سیاست‬ ‫دیگر‬ ‫و‬‫بین‬ ‫های‬‫مدل‬ ‫المللی‬-
‫نما‬ ‫سازی‬.‫ید‬
‫احساسات‬ ‫تحلیل‬ ‫عبارت‬ ‫اما‬‫در‬[6]‫عقیده‬ ‫اصطالح‬ ‫و‬‫در‬ ‫نیز‬ ‫کاوی‬[7]
‫زبان‬ ‫اگرچه‬ ،‫شد‬ ‫برده‬ ‫نام‬ ‫بار‬ ‫اولین‬ ‫برای‬‫طبیعی‬ ‫زبان‬ ‫پردازش‬ ‫و‬ ‫شناسی‬‫سابقه‬
‫سال‬ ‫از‬ ‫قبل‬ ‫تا‬ ‫اما‬ ‫دارند‬ ‫تحقیقاتی‬ ‫طوالنی‬2000‫پژوهش‬ ‫میالدی‬‫بسیار‬ ‫های‬
.‫بود‬ ‫پذیرفته‬ ‫صورت‬ ‫احساسات‬ ‫تحلیل‬ ‫با‬ ‫رابطه‬ ‫در‬ ‫محدودی‬
‫سال‬ ‫در‬ ‫شاخه‬ ‫این‬ ‫در‬ ‫تحقیقات‬ ‫گسترش‬،‫دارد‬ ‫مختلفی‬ ‫دالیل‬ ‫اخیر‬ ‫های‬
ً‫ال‬‫او‬‫حوزه‬ ‫هر‬ ‫تقریبا‬ ‫آن‬ ‫کاربرد‬‫می‬ ‫شامل‬ ‫را‬ ‫ای‬‫به‬ ‫شود‬‫صنعت‬ ‫بخش‬ ‫در‬ ‫ویژه‬
‫تحلیل‬ ‫را‬ ‫بازار‬ ً‫ال‬‫کام‬ ‫دارند‬ ‫نیاز‬ ‫مشاغل‬ ‫صاحبان‬ ،‫بازار‬ ‫بودن‬ ‫رقابتی‬ ‫دلیل‬ ‫به‬
‫برای‬ ‫را‬ ‫زیادی‬ ‫هزینه‬ ‫هستند‬ ‫حاضر‬ ‫و‬ ‫باشند‬ ‫آگاه‬ ‫مشتریان‬ ‫نظرات‬ ‫از‬ ‫و‬ ‫نموده‬
‫چالشی‬ ‫حوزه‬ ‫یک‬ ً‫ا‬‫ثانی‬ ‫دهند‬ ‫انجام‬ ‫اطالعات‬ ‫این‬ ‫داشتن‬‫به‬ ،‫است‬ ‫تحقیقاتی‬-
‫به‬ ‫فارسی‬ ‫زبان‬ ‫در‬ ‫خصوص‬‫پیچیدگی‬ ‫دلیل‬‫زیادی‬ ‫کار‬ ‫جای‬ ‫آن‬ ‫خاص‬ ‫های‬
‫دارد‬[8].
‫آخرین‬ ‫و‬ ‫معرفی‬ ‫احساسات‬ ‫تحلیل‬ ‫پرکاربرد‬ ‫حوزه‬ ‫چند‬ ‫ادامه‬ ‫در‬
.‫گرفت‬ ‫خواهد‬ ‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫تحقیقات‬
1
Aspects
‫مقاله‬ ‫عنوان‬
‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
3
3.1.‫الکترونیک‬ ‫تجارت‬ ‫و‬ ‫بازاریابی‬
‫بیش‬‫عقیده‬ ‫کاربرد‬ ‫ترین‬‫راه‬ ‫زیرا‬ ‫است‬ ‫تجارت‬ ‫و‬ ‫بازار‬ ‫حوزه‬ ‫در‬ ‫کاوی‬‫کارها‬
‫این‬ ‫در‬ ‫کاربردها‬ .‫شد‬ ‫خواهد‬ ‫فروش‬ ‫و‬ ‫سوددهی‬ ‫افزایش‬ ‫به‬ ‫منجر‬ ً‫ال‬‫معمو‬
‫حوزه‬:‫است‬ ‫بررسی‬ ‫قابل‬ ‫زیر‬ ‫دیدگاه‬ ‫سه‬ ‫از‬
‫مشتریان‬ ‫دیدگاه‬ ‫از‬،‫کاال‬ ‫مزایا‬ ‫و‬ ‫معایب‬ ،‫محصول‬ ‫کیفیت‬ ‫بررسی‬ :
... ‫و‬ ‫محصوالت‬ ‫مقایسه‬ ،‫دیگران‬ ‫تجربیات‬ ‫از‬ ‫استفاده‬
‫تولیدکنندگان‬ ‫دیدگاه‬ ‫از‬‫از‬ ‫خود‬ ‫محصول‬ ‫ضعف‬ ‫نقاط‬ ‫کشف‬ :
‫از‬ ‫بهتر‬ ‫درک‬ ،‫مشتریان‬ ‫انتظارات‬ ‫و‬ ‫نظرات‬ ‫نقطه‬ ،‫مشتریان‬ ‫دیدگاه‬
‫مشت‬ ‫نیاز‬‫شرکت‬ ‫سایر‬ ‫با‬ ‫رقابت‬ ‫و‬ ‫مقایسه‬ ،‫خود‬ ‫ریان‬‫در‬ ‫رقیب‬ ‫های‬
... ‫و‬ ‫بازار‬
‫فروشندگان‬ ‫دیدگاه‬ ‫از‬‫با‬ ‫مناسب‬ ‫تبلیغات‬ ،‫بازاریابی‬ :‫و‬ ‫عالیق‬
‫سال‬... ‫و‬ ‫خریداران‬ ‫به‬ ‫مناسب‬ ‫محصول‬ ‫پیشنهاد‬ ،‫مشتریان‬ ‫یق‬
‫مقاله‬ ‫در‬[1]‫جمع‬ ‫پس‬‫بازبینی‬ ‫و‬ ‫نظرات‬ ‫متن‬ ‫آوری‬‫کاربرن‬ ‫های‬2
‫از‬
‫انجمن‬‫شبکه‬ ،‫گفتگو‬ ‫های‬‫فروشگاه‬ ،‫اجتماعی‬ ‫های‬... ‫و‬ ‫اینترنتی‬ ‫آنالین‬ ‫های‬
‫تکنیک‬ ‫از‬ ‫استفاده‬ ‫با‬‫احساسات‬ ‫و‬ ‫عقاید‬ ‫تواستند‬ ‫طبیعی‬ ‫زبان‬ ‫پردازش‬ ‫های‬
‫موبایل‬ ‫گوشی‬ ‫مانند‬ ‫مختلفی‬ ‫محصوالت‬ ‫مورد‬ ‫در‬ ‫را‬ ‫کاربران‬‫به‬‫و‬ ‫آورده‬ ‫دست‬
‫ویژگی‬ ‫مورد‬ ‫در‬ ‫جزئیات‬ ‫به‬‫دیده‬ ‫کاربران‬ ‫نقدهای‬ ‫که‬ ‫در‬ ‫آن‬ ‫مختلف‬ ‫های‬
‫بصری‬ ،‫شده‬‫سازی‬3
‫شکل‬ ‫در‬ ‫دهند‬ ‫انجام‬ ‫را‬9‫موبایل‬ ‫یک‬ ‫ویژگی‬ ‫از‬ ‫نمونه‬ ‫دو‬
‫آمده‬ ‫موردنظر‬ ‫محصول‬ ‫به‬ ‫نسبت‬ ‫کاربران‬ ‫احساسات‬ ‫کلی‬ ‫نتیجه‬ ‫همراه‬ ‫به‬
.‫است‬
‫شکل‬1-‫مورد‬ ‫در‬ ‫کاربران‬ ‫احساسات‬ ‫تحلیل‬ ‫نتایج‬‫موبایل‬ ‫گوشی‬ ‫یک‬
‫ویژگی‬ ‫تحلیل‬ ‫خالصه‬ ،‫کلی‬ ‫نتیجه‬ ‫یک‬ ‫تولید‬ ‫با‬ ‫نهایت‬ ‫در‬ ‫و‬‫مختلف‬ ‫های‬
‫می‬ ‫خالصه‬ ‫نتیجه‬ ‫یک‬ ‫در‬ ‫را‬.‫کند‬
‫در‬‫فارس‬ ‫زبان‬‫ی‬‫ن‬‫ی‬‫ز‬‫محمد‬‫ی‬‫همکاران‬ ‫و‬[90]‫راه‬‫کاری‬‫نقد‬ ‫درجهت‬ ‫را‬
‫ی‬‫ک‬‫احساس‬ ‫واژگان‬ ‫شبکه‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫کاال‬‫ی‬‫که‬‫ی‬‫ک‬‫ی‬‫روش‬ ‫از‬‫های‬‫تحل‬‫ی‬‫ل‬
‫ا‬ ‫در‬ ،‫نمودند‬ ‫ارائه‬ ‫است‬ ‫احساسات‬‫ی‬‫ن‬‫س‬‫ی‬‫ستم‬‫پ‬ ‫مرحله‬ ‫در‬ ‫ابتدا‬‫ی‬‫ش‬‫پردازش‬
‫داده‬‫جداساز‬ ‫با‬ ‫ها‬‫ی‬‫کل‬‫برچسب‬ ،‫جمالت‬ ‫و‬ ‫مات‬‫گذاری‬‫اجزا‬‫ی‬‫ر‬ ‫و‬ ‫سخن‬‫ی‬‫شه‬‫‏‬
2
User Review
3
visualization
‫ی‬‫اب‬‫ی‬‫موردن‬ ‫اطالعات‬ ،‫کلمات‬‫ی‬‫از‬‫م‬ ‫استخراج‬ ‫نقدها‬ ‫از‬‫ی‬‫شود‬‫با‬ ‫بعد‬ ‫مرحله‬ ‫در‬ .
‫و‬ ‫استخراج‬‫ی‬‫ژگ‬‫ی‬‫ها‬‫ی‬‫و‬ ‫از‬ ‫دسته‬ ‫آن‬ ،‫نقدها‬ ‫از‬ ‫کاال‬‫ی‬‫ژگ‬‫ی‬‫ها‬‫کاربران‬ ‫نظر‬ ‫از‬ ‫که‬
‫اهم‬‫ی‬‫ت‬‫ب‬‫ی‬‫ش‬‫تری‬‫م‬ ‫مشخص‬ ‫دارند‬‫ی‬‫شوند‬‫و‬ .‫ی‬‫ژگ‬‫ی‬‫های‬‫به‬‫دست‬‫آمده‬‫با‬‫دقت‬
‫باالیی‬‫مشا‬‫و‬ ‫با‬ ‫به‬‫ی‬‫ژگ‬‫ی‬‫های‬‫واقع‬‫ی‬‫طبقه‬ ‫و‬ ‫بوده‬ ‫کاال‬‫بن‬‫د‬‫ی‬‫احساس‬‫ی‬‫مجموعه‬
‫احساس‬ ‫بار‬ ‫براساس‬ ،‫داده‬‫ی‬‫م‬ ‫صورت‬ ‫متن‬ ‫در‬ ‫موجود‬ ‫واژگان‬‫ی‬‫پذی‬‫رد‬.
‫در‬‫عرصه‬‫ن‬ ‫بورس‬ ‫بازار‬ ‫و‬ ‫سهام‬‫ی‬‫ز‬‫عده‬‫ای‬‫تحل‬ ‫از‬‫ی‬‫ل‬‫گران‬‫سرما‬‫ی‬‫ه‬‫با‬
‫عق‬ ‫از‬ ‫استفاده‬‫ی‬‫ده‬‫کاوی‬‫به‬ ‫راجع‬ ‫کاربران‬‫ی‬‫ک‬‫ق‬ ،‫شرکت‬‫ی‬‫مت‬‫پ‬ ‫را‬ ‫آن‬ ‫سهام‬‫ی‬‫ش‬
‫بی‬‫ن‬‫ی‬‫م‬‫ی‬‫کنن‬‫د‬‫برا‬‫ی‬‫سا‬ ‫وب‬ ‫در‬ ‫مثال‬‫ی‬‫ت‬sentdex.com‫در‬ ‫کاربران‬ ‫نظرات‬
‫شبکه‬‫های‬‫اجتماع‬‫ی‬‫شرکت‬ ‫به‬ ‫راجع‬‫ها‬‫ی‬‫تجز‬ ‫بزرگ‬‫ی‬‫ه‬‫تحل‬ ‫و‬‫ی‬‫ل‬‫و‬ ‫شده‬
‫نما‬‫ی‬‫ش‬‫داده‬‫م‬‫ی‬‫تحل‬ ‫و‬ ‫شود‬‫ی‬‫ل‬‫گران‬‫ا‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫بازار‬‫ی‬‫ن‬‫پ‬ ‫اطالعات‬‫ی‬‫ش‬‫بی‬‫ن‬‫ی‬
‫دق‬‫ی‬‫ق‬‫تری‬‫م‬ ‫را‬‫ی‬‫توانند‬.‫دهند‬ ‫انجام‬
3.2.‫جامعه‬ ‫و‬ ‫سیاست‬
‫شاخص‬‫تری‬‫ن‬‫تحل‬ ‫کاربرد‬‫ی‬‫ل‬‫اح‬‫س‬ ‫عرصه‬ ‫در‬ ‫ساسات‬‫ی‬‫است‬‫به‬ ‫مربوط‬
‫سال‬ ‫انتخابات‬2092‫آمر‬‫ی‬‫کا‬‫است‬‫انتخابات‬ ‫در‬ ‫البته‬ .2008‫تحق‬‫ی‬‫قات‬‫مشابه‬
‫پا‬ ‫سطح‬ ‫در‬‫یی‬‫ن‬‫تری‬‫ت‬ .‫بود‬ ‫شده‬ ‫انجام‬‫ی‬‫م‬‫تبل‬‫ی‬‫غات‬‫ی‬‫اطالعات‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫اوباما‬
‫شبکه‬‫های‬‫اجتماع‬‫ی‬،‫به‬‫خصوص‬‫تویی‬،‫تر‬‫رأ‬ ‫توانست‬‫ی‬‫ز‬ ‫افراد‬‫ی‬‫اد‬‫ی‬‫را‬‫ب‬‫ه‬‫دست‬
‫از‬ ‫استفاده‬ ‫با‬ ،‫آورد‬‫برچسب‬ ‫تعداد‬‫هایی‬‫ا‬ ‫هر‬ ‫در‬ ‫که‬‫ی‬‫الت‬‫حاو‬‫ی‬
#TeamObama tonight‫م‬ ‫توانستند‬ ‫بود‬‫ی‬‫زان‬‫محبوب‬‫ی‬‫ت‬‫و‬‫ی‬‫ق‬ ‫در‬ ‫را‬‫ی‬‫اس‬‫با‬
‫رق‬‫ی‬‫ب‬‫و‬‫ی‬‫آن‬ ،‫دهند‬ ‫نشان‬‫ها‬‫با‬‫استفاده‬‫از‬‫ای‬‫ن‬‫م‬ ‫اطالعات‬‫ی‬‫توانستند‬‫ا‬‫ی‬‫الت‬‫های‬
‫به‬ ‫هدف‬‫تبل‬ ‫منظور‬‫ی‬‫غات‬‫ب‬‫ی‬‫ش‬‫تر‬‫تع‬ ‫را‬‫یی‬‫ن‬‫هم‬ ‫و‬ ‫کرده‬‫چنی‬‫ن‬‫مت‬‫ن‬‫سخنران‬‫ی‬‫و‬‫ی‬
‫ا‬ ‫به‬ ‫توجه‬ ‫با‬ ‫را‬‫تنظ‬ ‫شهر‬ ‫آن‬ ‫قالب‬ ‫فکار‬‫ی‬‫م‬‫کنند‬‫شکل‬ ‫در‬ ،2‫بصری‬ ‫نمونه‬‫سازی‬
‫است‬ ‫شده‬ ‫داده‬ ‫نمایش‬ ‫تحلیل‬ ‫این‬ ‫از‬ ‫حاصل‬[99,92].
‫شکل‬2-‫م‬‫ی‬‫زان‬‫محبوب‬‫ی‬‫ت‬‫ا‬ ‫در‬ ‫اوباما‬‫ی‬‫الت‬‫ها‬‫ی‬‫استفاده‬ ‫با‬ ‫مختلف‬‫عقیده‬
‫در‬ ‫کاوی‬‫تو‬‫یی‬‫تر‬‫انتخابات‬ ‫از‬ ‫قبل‬
‫مقاله‬ ‫عنوان‬
‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
4
‫هندی‬ ‫پژوهشگران‬‫سال‬ ‫در‬2094‫حدود‬ ‫از‬ ‫استفاده‬ ‫با‬23‫م‬‫ی‬‫ل‬‫ی‬‫ون‬‫تو‬‫یی‬‫ت‬
‫از‬96‫م‬‫ی‬‫ل‬‫ی‬‫ون‬‫شبکه‬ ،‫کاربر‬‫ا‬‫ی‬‫حدود‬ ‫با‬40‫م‬‫ی‬‫ل‬‫ی‬‫ون‬‫م‬ ‫که‬ ‫ساختند‬ ‫لبه‬‫ی‬‫توانست‬
‫انتخابات‬ ‫هر‬ ‫برنده‬‫ی‬‫توج‬ ‫با‬ ‫را‬‫عقا‬ ‫به‬ ‫ه‬‫ی‬‫د‬‫نوشته‬‫های‬‫تو‬ ‫کاربران‬‫یی‬‫تر‬‫هند‬ ‫در‬
‫پ‬‫ی‬‫ش‬‫بی‬‫ن‬‫ی‬‫و‬ ،‫کند‬‫ی‬‫ژگ‬‫ی‬‫اصل‬‫ی‬‫س‬‫ی‬‫ستم‬‫آن‬‫ها‬‫بالدرنگ‬‫بودن‬‫تحلی‬‫ل‬‫آن‬‫ه‬‫ا‬‫لذا‬ ،‫بود‬
‫م‬‫ی‬‫توانستند‬‫نت‬ ‫لحظه‬ ‫هر‬ ‫در‬‫ی‬‫جه‬‫به‬ ‫موجود‬ ‫اطالعات‬ ‫به‬ ‫را‬‫روزرسانی‬‫نما‬‫ی‬،‫ند‬‫در‬
‫نها‬‫ی‬‫ت‬‫پ‬‫ی‬‫ش‬‫بی‬‫ن‬‫ی‬‫آن‬‫ها‬‫از‬‫دو‬‫ماه‬‫قبل‬‫از‬‫انتخابات‬‫دقی‬ً‫ا‬‫ق‬‫نت‬ ‫با‬ ‫برابر‬‫ی‬‫جه‬‫ب‬‫از‬ ‫عد‬
.‫بود‬ ‫انتخابات‬
‫اما‬‫تحل‬ ‫با‬ ‫توانستند‬ ‫محققان‬ ،‫جامعه‬ ‫بعد‬ ‫در‬‫ی‬‫ل‬‫کاربر‬ ‫توسط‬ ‫شده‬ ‫وارد‬ ‫متن‬
‫د‬ ‫و‬‫ی‬‫گر‬‫شخص‬ ‫صفحه‬ ‫اطالعات‬‫ی‬‫و‬‫ی‬‫اجتماع‬ ‫شبکه‬ ‫در‬‫ی‬‫ف‬‫ی‬‫س‬،‫بوک‬‫م‬‫ی‬‫زان‬
‫رضا‬‫ی‬‫ت‬‫و‬‫ی‬‫زندگ‬ ‫از‬‫ی‬‫م‬ ‫مجموع‬ ‫در‬ ‫و‬‫ی‬‫زان‬‫رضا‬‫ی‬‫ت‬‫ی‬‫ک‬‫تحل‬ ‫را‬ ‫جامعه‬‫ی‬‫ل‬‫کنند‬
[93].
4.‫عقیده‬ ‫مراحل‬‫کاوی‬
‫شکل‬ ‫در‬3‫مراحل‬‫قطبیت‬ ‫تعیین‬4
‫توسط‬ ‫شده‬ ‫وارد‬ ‫متن‬‫کاربر‬‫داده‬ ‫نشان‬
‫ا‬ .‫است‬ ‫شده‬‫ی‬‫ن‬‫کل‬ ‫اصول‬ ‫مراحل‬‫ی‬‫اجرا‬‫ی‬‫ی‬‫ک‬‫س‬‫ی‬‫ستم‬‫تحل‬‫ی‬‫ل‬‫گر‬‫یک‬ ‫قطبیت‬
‫متن‬‫تشر‬ ‫با‬ ‫ادامه‬ ‫در‬ .‫است‬‫ی‬‫ح‬‫روش‬ ،‫گام‬ ‫هر‬ ‫عمکلرد‬‫های‬‫اجرا‬ ‫مختلف‬‫ی‬‫آن‬
‫بررس‬ ‫مورد‬‫ی‬.‫گرفت‬ ‫خواهد‬ ‫قرار‬
‫شکل‬3–‫مراحل‬‫تحلی‬‫ل‬‫احس‬‫اجتماع‬ ‫شبکه‬ ‫در‬ ‫کاربر‬ ‫اسات‬‫ی‬
4.1.‫پیش‬‫داده‬ ‫پردازش‬‫ها‬
‫ا‬ ‫در‬‫ی‬‫ن‬‫آماده‬ ‫مرحله‬ ‫دو‬ ‫در‬ ‫موردنظر‬ ‫متن‬ ،‫کاربرد‬ ‫برحسب‬ ‫گام‬‫سازی‬‫م‬‫ی‬
،‫گردد‬‫نگارش‬ ‫عالئم‬ ‫و‬ ‫لغات‬ ‫براساس‬ ‫جمله‬ ‫ابتدا‬‫ی‬‫منقطع‬‫تقسی‬ ‫کننده‬‫م‬‫م‬‫ی‬‫شود‬
‫برچسب‬ ‫سپس‬ ‫و‬‫گذاری‬‫دستور‬ ‫مشخصه‬‫ی‬‫م‬ ‫انجام‬ ‫کلمات‬‫ی‬.‫گردد‬
4
Polarity
ً‫ال‬‫معمو‬‫اول‬‫ی‬‫ن‬‫ب‬ ‫جمله‬ ‫شکست‬‫نگارش‬ ‫خاص‬ ‫عالئم‬ ‫راساس‬‫ی‬‫مانند‬
».«(،«;»،«،»،»!«،«‫؟‬»،)»:«‫پذ‬ ‫صورت‬‫ی‬‫رفته‬‫تشک‬ ‫کلمات‬ ‫به‬ ‫جمله‬ ‫سپس‬ ‫و‬‫ی‬‫ل‬‫‏‬
‫دهنده‬‫تقس‬‫ی‬‫م‬‫م‬‫ی‬‫‏‬‫گردد‬.
‫اما‬‫برچسب‬ ‫در‬‫‏‬‫گذاری‬‫برچسب‬ ‫انتساب‬ ‫عمل‬‫‏‬‫های‬‫واژگان‬‫ی‬‫و‬ ‫کلمات‬ ‫به‬
‫نشانه‬‫‏‬‫های‬‫تشک‬‫ی‬‫ل‬‫م‬ ‫صورت‬ ‫متن‬‫ی‬‫‏‬‫پذی‬‫رد‬‫ا‬ ‫واقع‬ ‫در‬‫ی‬‫ن‬‫برچسب‬‫‏‬‫ها‬‫نقش‬
‫کلمات‬‫در‬‫جمله‬‫را‬‫مشخص‬‫م‬‫ی‬‫‏‬‫سازند‬‫کل‬ ‫حالت‬ ‫در‬ .‫ی‬‫روش‬‫‏‬‫های‬
‫برچسب‬‫‏‬‫گذاری‬‫تقس‬ ‫دسته‬ ‫دو‬ ‫به‬ ‫کلمات‬‫ی‬‫م‬‫م‬‫ی‬‫مجموعه‬ ‫اول‬ ‫دسته‬ .‫گردد‬
‫روش‬‫‏‬‫های‬‫آمار‬‫ی‬‫ق‬ ‫دوم‬ ‫دسته‬ ‫و‬‫اعده‬‫روش‬ ‫در‬ .‫هستند‬ ‫محور‬‫‏‬‫های‬‫آمار‬‫ی‬‫ی‬‫ک‬
‫احتمال‬ ‫مجموعه‬‫ی‬‫برچسب‬ ‫از‬‫‏‬‫ها‬‫برای‬‫ی‬‫ک‬‫م‬ ‫انتخاب‬ ‫کلمه‬‫ی‬‫براساس‬ ‫و‬ ‫گردد‬
‫برچسب‬‫ها‬‫ی‬‫ضر‬ ‫مجاور‬‫ی‬‫ب‬‫صح‬ ‫احتمال‬‫ی‬‫ح‬‫ه‬ ‫بودن‬‫محاسبه‬ ‫برچسب‬ ‫ر‬
‫م‬‫ی‬.‫گردد‬
ً‫ال‬‫معمو‬‫روش‬ ‫در‬‫‏‬‫های‬‫غ‬‫ی‬‫رآمار‬‫ی‬‫قوان‬ ‫از‬ ‫استفاده‬ ‫با‬ ،‫محور‬ ‫قاعده‬‫ی‬‫ن‬‫رفع‬ ‫به‬
‫برچسب‬ ‫در‬ ‫ابهامات‬‫‏‬‫گذاری‬‫‏‬‫ها‬‫م‬ ‫پرداخته‬‫ی‬‫‏‬،‫شود‬‫ا‬ ‫مجموعه‬‫ی‬‫ن‬‫قوان‬‫ی‬‫ن‬‫ی‬‫ا‬‫به‬
‫شده‬ ‫داده‬ ‫مدل‬ ‫به‬ ‫آموزش‬ ‫صورت‬‫‏‬‫اند‬‫ی‬‫ا‬‫به‬‫‏‬‫صورت‬‫دستی‬‫مع‬‫ی‬‫ن‬‫گرد‬‫ی‬‫ده‬.‫است‬
‫س‬‫ی‬‫ستم‬‫‏‬‫های‬‫مخف‬ ‫مدل‬ ،‫محور‬ ‫حافظه‬‫ی‬‫مار‬‫تخم‬ ‫روش‬ ‫و‬ ‫کوف‬‫ی‬‫ن‬‫احتمال‬
‫ب‬‫ی‬‫ش‬‫ی‬‫نه‬‫نمونه‬‫‏‬‫هایی‬‫روش‬ ‫از‬‫‏‬‫های‬‫برچسب‬‫‏‬‫گذاری‬‫برا‬ .‫هستند‬‫ی‬[ ‫در‬ ‫مثال‬94]
‫برچسب‬‫‏‬‫زنی‬‫فارس‬ ‫کلمات‬‫ی‬‫مخف‬ ‫مدل‬ ‫از‬ ‫استفاده‬ ‫با‬‫ی‬‫معرف‬ ‫مارکوف‬‫ی‬
‫شده‬.‫است‬
‫مقاله‬ ‫در‬[94]‫پیش‬‫از‬ ‫استفاده‬ ‫با‬ ‫توییتر‬ ‫متنی‬ ‫اطالعات‬ ‫پردازش‬‫چارچوب‬
‫هدوپ‬0
‫کاهش‬ ‫نگاشت‬ ‫و‬6
.‫است‬ ‫پذیرفته‬ ‫صورت‬
4.2.‫ویژگی‬ ‫انتخاب‬
‫نظرات‬‫ی‬‫در‬ ‫کاربران‬ ‫که‬‫ی‬‫ک‬‫اجتماع‬ ‫شبکه‬‫ی‬‫و‬‫ی‬‫ا‬‫در‬‫ی‬‫ک‬‫ا‬ ‫فروشگاه‬‫ی‬‫نترنت‬‫ی‬
‫به‬ ‫راجع‬‫ی‬‫ک‬‫م‬ ‫محصول‬‫ی‬‫‏‬‫دهند‬‫منف‬ ،‫مثبت‬ ‫است‬ ‫ممکن‬‫ی‬‫و‬‫ی‬‫ا‬‫خنث‬‫ی‬.‫باشد‬
‫ا‬‫ی‬‫ن‬‫قطب‬‫ی‬‫ت‬‫به‬‫ی‬‫ک‬‫و‬‫ی‬‫ژگ‬‫ی‬‫ی‬‫ا‬‫ج‬‫از‬ ‫نبه‬‫ی‬‫ک‬‫محصول‬‫ی‬‫ا‬‫نسبت‬ ‫موضوع‬
‫م‬ ‫داده‬‫ی‬‫‏‬‫شود‬‫برا‬ .‫ی‬‫کاربر‬ ‫مثال‬‫ی‬‫اجتماع‬ ‫شبکه‬ ‫در‬‫ی‬‫م‬‫ی‬‫‏‬‫نوی‬‫سد‬"!‫دوستان‬
‫گوش‬ ‫امروز‬‫ی‬‫موبا‬‫ی‬‫ل‬‫جد‬‫ی‬‫د‬‫خر‬‫ی‬‫دم‬‫ک‬‫ی‬‫ف‬‫ی‬‫ت‬‫نما‬ ‫صفحه‬‫ی‬‫ش‬‫فوق‬‫‏‬‫العاده‬‫‏‬‫ای‬‫دارد‬
‫آنتن‬ ‫اما‬‫‏‬‫دهی‬‫ن‬ ‫جالب‬ ‫آن‬‫ی‬‫ست‬."‫ا‬ ‫در‬‫ی‬‫ن‬‫بحث‬ ‫موضوع‬ ‫مثال‬"‫موبا‬‫ی‬‫ل‬"‫و‬ ‫است‬
‫و‬‫ی‬‫ژگ‬‫ی‬‫ی‬‫ا‬‫جنبه‬‫‏‬‫های‬‫ا‬‫ی‬‫ن‬‫موضوع‬"‫صف‬‫نما‬ ‫حه‬‫ی‬‫ش‬"‫و‬"‫آنتن‬‫‏‬‫دهی‬".‫است‬
‫تکنیک‬ ‫از‬ ‫یکی‬‫روش‬ ،‫متن‬ ‫در‬ ‫ویژگی‬ ‫کشف‬ ‫در‬ ‫پرکاربرد‬ ‫های‬‫اطالعات‬
‫متقابل‬7
‫است‬‫روش‬ ‫از‬ ‫یکی‬ ‫که‬‫های‬‫در‬ ‫ویژگی‬ ‫کردن‬ ‫پیدا‬ ‫آماری‬‫جمله‬ ‫یا‬ ‫سند‬
5
Hadoop
6
Map-Reduce
7
Mutual Information
‫مقاله‬ ‫عنوان‬
‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
0
‫کلمه‬ ‫هر‬ ‫برای‬ ،‫است‬x‫سند‬ ‫هر‬ ‫در‬y‫بیش‬ ‫و‬ ‫شده‬ ‫محاسبه‬ ‫مقدار‬‫یا‬ ‫ترین‬
‫اطالعات‬ ‫عنوان‬ ‫به‬ ،‫مقادیر‬ ‫آن‬ ‫میانگین‬‫باالترین‬ ‫و‬ ‫شده‬ ‫منظور‬ ‫کلمه‬ ‫آن‬ ‫مقابل‬
‫آن‬‫می‬ ‫انتخاب‬ ‫ویژگی‬ ‫عنوان‬ ‫به‬ ‫ها‬‫چنان‬ ‫گردد‬‫چه‬x‫و‬y،‫باشند‬ ‫مستقل‬ ‫هم‬ ‫از‬
‫ضابطه‬ ‫مقدار‬(9)‫می‬ ‫صفر‬ ‫را‬‫کند‬.
‫روش‬ ‫البته‬‫دیگری‬ ‫زیاد‬ ‫های‬‫همانند‬ ‫متعدد‬ ‫مقاالت‬ ‫در‬‫نما‬‫ی‬‫ه‬‫ساز‬‫ی‬‫معنا‬‫یی‬
‫پنهان‬
8
[90]‫مارکوف‬ ‫مخفی‬ ‫مدل‬ ،[96]،‫تخص‬‫ی‬‫ص‬‫د‬‫ی‬‫ر‬‫ی‬‫کله‬‫پنهان‬
9
[97]،
‫بیش‬‫آنتروپی‬ ‫ترین‬... ‫و‬.‫است‬ ‫شده‬ ‫معرفی‬
4.3.‫طبقه‬‫بندی‬‫کننده‬10
‫اصل‬ ‫پردازش‬‫ی‬‫تع‬ ‫جهت‬‫یی‬‫ن‬‫قطب‬‫ی‬‫ت‬‫ی‬‫ک‬‫جمله‬‫ی‬‫ا‬‫ی‬‫ک‬‫ا‬ ‫در‬ ‫سند‬‫ی‬‫ن‬‫مرحله‬
‫م‬ ‫صورت‬‫ی‬‫پذی‬،‫رد‬‫اصل‬ ‫هدف‬‫ی‬‫ا‬‫ی‬‫ن‬‫طبقه‬ ‫بخش‬‫بند‬‫ی‬‫ی‬‫ک‬‫جمله‬‫ی‬‫ا‬‫ی‬‫ک‬‫سند‬
‫بر‬‫قطب‬ ‫اساس‬‫ی‬‫ت‬‫حل‬ ‫راه‬ .‫است‬ ‫آن‬‫کل‬ ‫دسته‬ ‫دو‬ ‫به‬ ‫ها‬‫ی‬‫مبتن‬‫ی‬‫بر‬‫ی‬‫ادگ‬‫ی‬‫ر‬‫ی‬
‫ماش‬‫ی‬‫ن‬‫واژه‬ ‫و‬‫نامه‬‫تقسی‬‫م‬‫م‬‫ی‬‫شود‬‫دق‬ ‫ابزارها‬ .‫ی‬ً‫ا‬‫ق‬‫عمل‬ ‫همان‬‫ی‬‫م‬ ‫انجام‬ ‫را‬‫ی‬‫دهند‬
‫طبقه‬ ‫که‬‫بند‬‫ی‬‫کننده‬‫ها‬‫کاربردها‬ ‫در‬‫ی‬‫سنت‬‫ی‬‫متن‬‫کاوی‬‫آن‬ ‫در‬ ،‫دارند‬‫جا‬‫ی‬‫ک‬
‫طبقه‬ ‫از‬ ‫پس‬ ‫سند‬‫ب‬‫ندی‬‫م‬‫ی‬‫توانست‬‫دسته‬ ‫به‬‫های‬‫س‬ ‫همانند‬ ‫مختلف‬‫ی‬‫اس‬‫ی‬،
‫ورزشی‬،‫علم‬‫ی‬‫طبقه‬ ‫در‬ ‫اما‬ ‫گردد‬ ‫اضافه‬ ... ‫و‬‫بند‬‫ی‬‫کننده‬‫عقاید‬‫ا‬ ً‫ال‬‫معمو‬‫ی‬‫ن‬
‫دسته‬‫ها‬‫به‬‫سه‬‫گروه‬،‫مثبت‬‫منفی‬‫خنث‬ ‫و‬‫ی‬‫تبد‬‫ی‬‫ل‬‫م‬‫ی‬.‫گردد‬
‫در‬‫طبقه‬‫‏‬‫بندی‬‫مبتن‬‫ی‬‫پ‬ ‫از‬ ‫که‬ ‫واژگان‬ ‫بر‬‫ی‬‫کره‬‫‏‬‫های‬99
‫و‬ ‫مختلف‬‫ی‬‫ا‬‫واژه‬‫نامه‬92
‫م‬ ‫استفاده‬ ‫خاص‬‫ی‬‫‏‬‫شود‬،‫کل‬ ‫روال‬‫ی‬‫ا‬ ‫به‬‫ی‬‫ن‬‫برا‬ ‫که‬ ‫است‬ ‫شکل‬‫ی‬‫در‬ ‫کلمه‬ ‫هر‬
‫ی‬‫ک‬‫اسام‬ ‫مانند‬ ‫جمله‬‫ی‬،‫افعال‬،‫صفات‬‫و‬‫قی‬‫ود‬‫واژگان‬ ‫شبکه‬ ‫در‬ ،‫موجود‬
‫احساس‬‫ی‬‫م‬ ‫صورت‬ ‫جستجو‬‫ی‬‫گ‬‫ی‬‫رد‬‫صورت‬ ‫در‬ ‫و‬‫ی‬‫موجود‬ ‫شبکه‬ ‫در‬ ‫واژه‬ ‫آن‬ ‫که‬
،‫باشد‬‫احساس‬ ‫برچسب‬‫ی‬‫م‬ ‫استخراج‬ ‫آن‬‫ی‬‫‏‬،‫شود‬‫قطب‬ ‫با‬ ‫متناسب‬ ‫واژه‬ ‫هر‬‫ی‬‫ت‬‫ی‬‫که‬
‫شبکه‬ ‫از‬‫وزن‬ ،‫شده‬ ‫استخراج‬ ‫واژگان‬‫ی‬‫م‬‫ی‬‫گ‬‫ی‬،‫رد‬‫برا‬‫ی‬‫جمله‬ ‫هر‬‫‏‬‫ای‬‫در‬ ‫کاربر‬ ‫که‬
‫اجتماع‬ ‫شبکه‬‫ی‬‫م‬‫ی‬‫نو‬‫ی‬‫سد‬‫وزن‬ ‫مجموع‬‫‏‬‫ها‬‫با‬‫توجه‬‫به‬‫قطبی‬‫ت‬‫محاسبه‬ ‫آن‬
‫م‬‫ی‬‫‏‬،‫گردد‬‫عدد‬ ‫اگر‬‫ی‬‫بزرگ‬‫‏‬‫تر‬‫از‬‫صفر‬‫باشد‬‫آن‬‫جمله‬‫قطبی‬‫ت‬‫م‬ ‫مثبت‬‫ی‬‫‏‬‫گی‬‫رد‬‫و‬
‫در‬‫غ‬‫ی‬‫ر‬‫ا‬‫ی‬‫ن‬‫‏‬‫صورت‬‫منف‬ ‫جمله‬‫ی‬‫م‬ ‫گرفته‬ ‫نظر‬ ‫در‬‫ی‬‫‏‬‫شود‬.
‫وجود‬‫ی‬‫ک‬‫واژه‬‫‏‬‫نام‬‫ه‬‫در‬‫ی‬‫ک‬‫س‬‫ی‬‫ستم‬‫تحل‬‫ی‬‫ل‬‫ضرور‬ ‫احساسات‬‫ی‬‫اما‬ ‫است‬
‫کاف‬‫ی‬‫ن‬‫ی‬‫ست‬‫م‬ ً‫ا‬‫حتم‬ ‫و‬‫ی‬‫‏‬‫بای‬‫ست‬‫د‬ ‫کنار‬ ‫در‬‫ی‬‫گر‬‫روش‬‫‏‬‫های‬‫تکم‬‫ی‬‫ل‬‫به‬ ‫کننده‬‫کار‬
8
Latent Semantic Indexing (LSI)
9
Latent Dirichlet Allocation (LDA)
10
Classifier
11
Corpus
12
Dictionary
.‫شوند‬ ‫برده‬‫در‬‫شکل‬3‫روش‬ ‫انواع‬ ‫شده‬ ‫تالش‬‫‏‬‫های‬‫را‬‫ی‬‫ج‬‫ی‬‫طبقه‬ ‫در‬ ‫که‬‫بند‬‫ی‬
‫عق‬‫ی‬‫ده‬‫نما‬ ‫دارد‬ ‫کاربرد‬ ‫متن‬ ‫در‬‫ی‬‫ش‬[ ‫شود‬ ‫داده‬91.]
‫شکل‬4-‫روش‬ ‫انواع‬‫ها‬‫ی‬‫طبقه‬‫بند‬‫ی‬
‫ب‬‫یش‬‫تکنیک‬ ‫تر‬‫شکل‬ ‫های‬4‫پیاده‬ ‫توانایی‬‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫سازی‬
‫کالن‬‫داده‬93
‫مقیاس‬ ‫ابزارها‬ ‫این‬ ‫از‬ ‫استفاده‬ ‫دارند‬ ‫را‬‫پردازش‬ ‫سرعت‬ ‫و‬ ‫پذیری‬
‫داده‬ ‫حجم‬ ‫در‬‫چشم‬ ‫شکل‬ ‫به‬ ‫را‬ ‫باال‬ ‫های‬‫می‬ ‫افزایش‬ ‫گیری‬.‫دهد‬
‫در‬[98]‫فایل‬ ‫سیستم‬ ‫و‬ ‫هدوپ‬ ‫از‬ ‫استفاده‬ ‫با‬HDFS
94
‫تکنیک‬ ،Naïve
Bayes‫ع‬ ‫به‬‫طبقه‬ ‫نوان‬‫بندی‬‫سینما‬ ‫و‬ ‫فیلم‬ ‫مورد‬ ‫در‬ ‫کاربران‬ ‫نظرات‬ ‫کننده‬‫وب‬
‫پیاده‬ ،‫آمازون‬ ‫سایت‬‫کتابخانه‬ ‫از‬ ‫استفاده‬ ‫بدون‬ ‫نویسندگان‬ .‫است‬ ‫شده‬ ‫سازی‬-
‫پیش‬ ‫های‬‫(همانند‬ ‫هدوپ‬ ‫فرض‬Mahout‫ماژول‬ ،)‫را‬ ‫خود‬ ‫نیاز‬ ‫مورد‬ ‫های‬
.‫نمودند‬ ‫طراحی‬
‫مقیاس‬ ‫داد‬ ‫نشان‬ ‫نتایج‬‫طبقه‬ ‫پذیری‬‫بندی‬‫کننده‬NB‫بدون‬ ‫حتی‬‫داده‬ ‫پایگاه‬
‫به‬‫می‬ ‫پیدا‬ ‫افزایش‬ ‫راحتی‬.‫کند‬
‫دق‬‫حدود‬ ‫بررسی‬ ‫مورد‬ ‫حاالت‬ ‫تمامی‬ ‫در‬ ‫متوسط‬ ‫ت‬82‫اما‬ ‫بوده‬ ‫درصد‬
‫هدوپ‬ ‫چارچوب‬ ‫از‬ ‫که‬ ‫مقاالتی‬ ‫دیگر‬ ‫همانند‬‫نموده‬ ‫استفاده‬‫صورت‬ ‫در‬ ،‫اند‬
‫پیدا‬ ‫افزایش‬ ‫زیادی‬ ‫مقدار‬ ‫تا‬ ‫پردازش‬ ‫سرعت‬ ،‫ورودی‬ ‫اطالعات‬ ‫حجم‬ ‫افزایش‬
.‫کند‬ ‫می‬
‫جدول‬ ‫در‬9‫ز‬ ‫مرتبه‬‫هر‬ ‫به‬ ‫نسبت‬ ‫پردازش‬ ‫مانی‬90‫بازبینی‬ ‫متن‬ ‫هزار‬
‫که‬ ‫حالت‬ ‫اولین‬ ‫در‬ .‫است‬ ‫شده‬ ‫داده‬ ‫نمایش‬ ‫کاربران‬2‫قرار‬ ‫آن‬ ‫در‬ ‫بازبینی‬ ‫هزار‬
‫داده‬ ‫مقدار‬ ‫زیرا‬ ‫ندارد‬ ‫مناسبی‬ ‫زمانی‬ ‫مرتبه‬ ‫سازی‬ ‫موازی‬ ‫است‬ ‫مشخص‬ ،‫دارد‬
‫بالک‬ ‫هر‬ ‫حجم‬ ‫از‬ ‫ورودی‬HDFS‫کم‬‫به‬ ‫نزدیک‬ ‫و‬ ‫حجم‬ ‫افزایش‬ ‫با‬ ‫است‬ ‫تر‬
‫بهینه‬ ‫مقدار‬HDFS‫چشم‬ ‫بهبود‬ ‫زمانی‬ ‫مرتبه‬‫می‬ ‫پیدا‬ ‫گیری‬‫کند‬.
13
Big data
14
Hadoop Distributed File System
(9)
‫مقاله‬ ‫عنوان‬
‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
6
‫جدول‬9–‫هر‬ )‫(ثانیه‬ ‫پردازش‬ ‫زمان‬9000‫کاربران‬ ‫بازبینی‬ ‫متن‬
‫ورودی‬ ‫متن‬ ‫تعداد‬ ‫حجم‬
)‫(هزار‬
220200400600800
/ ‫ثانیه‬10‫متن‬ ‫هزار‬9/40090/4807/624/447/399/3
‫ورودی‬ ‫متن‬ ‫تعداد‬ ‫حجم‬
)‫(هزار‬
900092009400960098002000
/ ‫ثانیه‬10‫متن‬ ‫هزار‬88/277/247/24/237/233/2
5.‫عقیده‬ ‫در‬ ‫داده‬ ‫کالن‬ ‫کاربرد‬‫کاوی‬
‫عظیم‬ ‫حجم‬ ‫پردازش‬ ‫توانایی‬ ‫و‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬ ‫شدن‬ ‫گسترده‬ ‫از‬ ‫بعد‬
‫اطالعات‬‫سازمان‬ ‫دیگر‬‫ها‬‫مجبور‬‫ن‬‫از‬ ‫بودند‬‫ی‬‫ک‬‫را‬ ‫َر‬‫ب‬‫ا‬‫ی‬‫انه‬‫و‬‫ی‬‫ا‬‫داده‬ ‫انباره‬‫ا‬‫ی‬
‫کند‬ ‫استفاده‬‫واقع‬ ‫در‬‫پا‬ ‫ضعف‬‫ی‬‫گاه‬‫داده‬‫ها‬‫ی‬‫رابطه‬‫ا‬‫ی‬‫نگه‬ ‫در‬‫دار‬‫ی‬‫تجز‬ ‫و‬‫ی‬‫ه‬‫و‬
‫تحل‬‫ی‬‫ل‬‫حجم‬‫عظ‬‫ی‬‫م‬‫ی‬‫داده‬ ‫از‬‫ها‬‫ی‬‫ن‬‫ی‬‫مه‬‫ساختار‬‫ی‬‫نما‬ ‫ساختار‬ ‫بدون‬ ‫و‬‫ی‬‫ان‬‫گشت‬
‫کردن‬ ‫مطرح‬ ‫با‬ ‫دانشمندان‬ ‫و‬‫مفهوم‬‫جد‬‫ی‬‫د‬‫ی‬‫نام‬ ‫به‬NoSQL
90
‫به‬ ‫اقدام‬
‫جد‬ ‫نسل‬ ‫ساخت‬‫ی‬‫د‬‫ی‬‫پا‬ ‫از‬‫ی‬‫گاه‬‫ها‬‫ی‬‫داده‬‫ا‬‫ی‬‫م‬ ‫که‬‫ی‬‫تواند‬‫عظ‬ ‫حجم‬‫ی‬‫م‬‫ی‬‫از‬
‫را‬ ‫اطالعات‬‫زیر‬ ‫یک‬ ‫در‬‫سا‬‫ابری‬ ‫خت‬‫نگ‬‫هد‬‫ار‬‫ی‬‫نمودند‬ ،‫کند‬ ‫پردازش‬ ‫و‬[91].
‫بیش‬‫الگوریتم‬ ‫تر‬‫طبقه‬ ‫های‬‫می‬ ‫بندی‬‫با‬ ‫و‬ ‫موازی‬ ‫شکل‬ ‫به‬ ‫تواند‬‫از‬ ‫استفاده‬
‫پیاده‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬‫شود‬ ‫سازی‬[98,20].
‫کال‬ ‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫مزایای‬ ‫از‬ ‫مورد‬ ‫چند‬ ‫به‬ ‫فقط‬ ‫ادامه‬ ‫در‬‫در‬ ‫داده‬ ‫ن‬
‫عقیده‬.‫شد‬ ‫خواهد‬ ‫اشاره‬ ‫کاوی‬
‫پ‬ ‫مراحل‬ ‫از‬ ‫یک‬ ‫هر‬‫ها‬ ‫داده‬ ‫پردازش‬ ‫و‬ ‫پردازش‬ ‫یش‬‫به‬ ‫تواند‬ ‫می‬
‫مرتبط‬ ‫ابزارهای‬ ‫روی‬ ‫بر‬ ‫موازی‬ ‫شکل‬‫از‬ ‫استفاده‬ ‫همانند‬‫چارچوب‬
‫نگاشت‬–‫شود‬ ‫سازی‬ ‫پیاده‬ ‫کاهش‬‫مثال‬ ‫برای‬ ،‫در‬[94]‫از‬ ‫استفاده‬ ‫با‬
‫داده‬ ‫در‬ ،‫نمودند‬ ‫ثابت‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬‫سرعت‬ ‫حجیم‬ ‫های‬
‫در‬ ‫دستورات‬ ‫اجرای‬‫هدوپ‬‫از‬ ‫بیشتر‬‫مدل‬ ‫دیگر‬‫مرسوم‬ ‫های‬‫است‬
‫شکل‬ ‫(در‬0).
‫شکل‬5-‫دوحالت‬ ‫در‬ ‫کلمه‬ ‫شمارش‬ ‫زمان‬ ‫میزان‬‫بررسی‬ ‫مورد‬
15
Not Only SQL
‫پیاده‬ ‫قصد‬ ‫شرکت‬ ‫یک‬ ‫اگر‬‫عقیده‬ ‫سیستم‬ ‫یک‬ ‫اجرایی‬ ‫و‬ ‫سازی‬‫کاوی‬
‫داشته‬‫از‬ ‫استفاده‬ ‫با‬ ‫اما‬ ‫کند‬ ‫صرف‬ ‫باید‬ ‫را‬ ‫زیادی‬ ‫هزینه‬ ‫باشد‬
‫می‬ ‫ابر‬ ‫بستر‬ ‫در‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬‫هز‬ ‫تواند‬‫حد‬ ‫تا‬ ‫را‬ ‫خود‬ ‫ینه‬
‫شرکت‬ ‫از‬ ‫بسیاری‬ ،‫دهد‬ ‫کاهش‬ ‫زیادی‬‫خدمات‬ ‫این‬ ‫دارند‬ ‫وجود‬ ‫ها‬
‫نرم‬ ‫درقالب‬ ‫را‬‫اف‬‫سرویس‬ ‫عنوان‬ ‫به‬ ‫زار‬96
‫می‬ ‫ارایه‬.‫دهند‬
‫داده‬ ‫از‬ ‫حجمی‬ ‫هر‬ ‫اندازه‬ ‫به‬ ‫پذیری‬ ‫مقیاس‬
‫داده‬ ‫پردازش‬ ‫توانایی‬‫ه‬‫لحظه‬ ‫خروجی‬ ‫ایجاد‬ ‫و‬ ‫بالدرنگ‬ ‫صورت‬ ‫به‬ ‫ا‬
ً‫ا‬‫خصوص‬ ‫توانایی‬ ‫این‬ ، ‫ای‬‫زمان‬ ‫یک‬ ‫به‬ ‫وابسته‬ ‫که‬ ‫کاربردهایی‬ ‫در‬
‫است‬ ‫کاربردی‬ ‫بسیار‬ ،‫نتیجه‬ ‫یک‬ ‫بینی‬ ‫پیش‬ ‫مانند‬ ‫است‬ ‫خاص‬[29].
6.‫نتیجه‬‫آینده‬ ‫کارهای‬ ‫و‬ ‫گیری‬
‫ا‬ ‫در‬‫ی‬‫ن‬‫آخر‬ ‫مقاله‬‫ی‬‫ن‬‫و‬ ‫دستاوردها‬‫پژوهش‬‫ها‬‫در‬‫حوزه‬‫تحلی‬‫ل‬‫احساسات‬
‫داده‬ ‫کالن‬ ‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫با‬‫توجه‬ ‫با‬ ‫و‬ ‫گرفت‬ ‫قرار‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬ ‫مورد‬
‫ابزارها‬ ‫این‬ ‫از‬ ‫استفاده‬ ،‫شد‬ ‫مشخص‬ ‫بررسی‬ ‫مورد‬ ‫مقاالت‬ ‫از‬ ‫حاصله‬ ‫نتایج‬ ‫به‬
‫داده‬ ‫حجم‬ ‫که‬ ‫است‬ ‫کاربردی‬ ‫و‬ ‫بهینه‬ ً‫ال‬‫کام‬ ‫صورتی‬ ‫در‬‫و‬ ‫باشد‬ ‫زیاد‬ ‫بسیار‬ ‫ها‬
‫ابزارها‬ ‫دیگر‬ ‫به‬ ‫نسبت‬ ‫نتایج‬ ‫کم‬ ‫داده‬ ‫حجم‬ ‫با‬ ‫محاسبات‬ ‫انجام‬ ‫حالت‬ ‫این‬ ‫در‬
‫ضعیف‬‫است‬ ‫تر‬.
‫به‬‫زمینه‬ ‫عنوان‬‫بیش‬ ‫پژوهش‬ ‫جای‬ ‫زیر‬ ‫عناوین‬ ‫مناسب‬ ‫تحقیقاتی‬ ‫های‬‫تری‬
.‫داشت‬ ‫خواهد‬ ‫حوزه‬ ‫این‬ ‫در‬ ‫فعاالن‬ ‫توسط‬ ‫آینده‬ ‫در‬
‫کاربرد‬ ‫و‬ ‫گسترش‬ ‫با‬‫ی‬‫‏‬‫تر‬‫ابزارها‬ ‫شدن‬‫ی‬‫مد‬‫ی‬‫ر‬‫ی‬‫ت‬‫کالن‬‫داده‬‫دن‬ ‫در‬‫ی‬،‫ا‬
‫م‬‫ی‬‫‏‬‫توان‬‫بس‬‫ی‬‫ار‬‫ی‬‫روش‬ ‫از‬‫‏‬‫های‬‫تشخ‬‫ی‬‫ص‬‫احساسات‬‫عقاید‬ ‫و‬‫زبان‬ ‫در‬
‫فارس‬‫ی‬‫را‬‫از‬ ‫استفاده‬ ‫با‬‫ابزار‬‫ها‬‫ی‬‫مانند‬ ‫آن‬ ‫خاص‬‫هدوپ‬ ‫چارچوب‬
‫پیاده‬‫سازی‬.‫نمود‬
‫ی‬‫ک‬‫ی‬‫روش‬ ‫از‬‫‏‬‫های‬‫آمار‬‫ی‬‫برا‬‫ی‬‫مدل‬‫‏‬‫سازی‬‫مدل‬ ‫از‬ ‫استفاده‬ ‫کلمات‬
n-gram‫م‬ .‫است‬‫ی‬‫‏‬‫توان‬‫برا‬‫ی‬‫مق‬ ‫بردن‬ ‫باال‬‫ی‬‫اس‬‫‏‬‫پذی‬‫ر‬‫ی‬‫اجرا‬ ‫و‬‫ی‬
‫مواز‬‫ی‬،‫ی‬‫ک‬‫ی‬‫روش‬ ‫از‬‫‏‬‫های‬‫آن‬‫نگاشت‬ ‫چارچوب‬ ‫در‬ ‫را‬-‫کاهش‬
‫پ‬‫ی‬‫اده‬‫‏‬‫سازی‬‫نمود‬[22].
‫م‬‫ی‬‫‏‬‫توان‬‫تحق‬ ‫با‬‫ی‬‫ق‬‫رو‬ ‫بر‬‫ی‬‫داده‬ ‫ساختار‬‫‏‬‫های‬‫مبتن‬‫ی‬‫واژه‬ ‫بر‬‫‏‬،‫نامه‬‫زمان‬
‫جستجو‬‫در‬‫آن‬‫را‬‫کاهش‬‫داد‬‫ی‬‫ک‬‫ی‬‫ا‬ ‫از‬‫ی‬‫ن‬‫راه‬‫‏‬‫کارها‬‫می‬‫‏‬‫تواند‬‫پ‬‫ی‬‫اده‬‫‏‬
‫سازی‬‫پا‬ ‫در‬‫ی‬‫گاه‬‫داده‬‫‏‬‫های‬NoSql.‫باشد‬
‫سیستم‬ ‫یک‬ ‫در‬ ‫پردازش‬ ‫از‬ ‫بعد‬ ‫اطالعات‬ ‫سازی‬ ‫بصری‬ ‫چگونگی‬
‫چ‬ ‫همواره‬ ‫داده‬ ‫کالن‬‫بیش‬ ‫پژوهش‬ ‫جای‬ ‫و‬ ‫بوده‬ ‫الشی‬.‫دارد‬ ‫تری‬
16
Software as a Service
‫مقاله‬ ‫عنوان‬
‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬ ‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
7
‫نگاشت‬ ‫چارچوب‬ ‫در‬-‫در‬ ‫الگوریتم‬ ‫یک‬ ‫که‬ ‫زمانی‬ ‫کاهش‬‫محیط‬
‫می‬ ‫اجرا‬ ‫ابری‬‫گره‬ ‫بین‬ ‫را‬ ‫کار‬ ‫دارد‬ ‫وظیفه‬ ‫نگاشت‬ ‫تابع‬ ‫شود‬‫های‬
‫بخش‬ ‫به‬ ‫کار‬ ‫تقسیم‬ .‫کند‬ ‫تقسیم‬ ‫کارگر‬‫و‬ ‫آسان‬ ‫همیشه‬ ‫مساوی‬ ‫های‬
‫هر‬ ،‫باشد‬ ‫قواعد‬ ‫استخراج‬ ‫هدف‬ ‫اگر‬ ‫مثال‬ ‫عنوان‬ ‫به‬ .‫نیست‬ ‫راحت‬
‫بیش‬ ‫تقسیمات‬ ‫تعداد‬ ‫چه‬‫مشکل‬ ‫قاعده‬ ‫استخراج‬ ‫شود‬ ‫تر‬‫خواهد‬ ‫تر‬
‫نگاشت‬ ‫از‬ ‫مناسبی‬ ‫تعداد‬ ‫تعیین‬ ‫بنابراین‬ .‫بود‬‫گره‬ ‫تعداد‬ ‫یا‬ ‫ها‬‫یکی‬ ‫ها‬
‫زمینه‬ ‫از‬‫می‬ ‫تحقیقاتی‬ ‫های‬.‫باشد‬ ‫تواند‬
‫منابع‬
[1] Statista. Facebook number of monthly active users worldwide
2015; Available from:
http://www.statista.com/statistics/264810/number-of-monthly-
active-facebook-users-worldwide/.
[2] GEOFF. Just One Minute On Facebook
JUNE 11, 2014; Available from: http//:wersm.com/just-one-minute-on-
facebook-infographic/.
[3] Adedoyin-Olowe, M.M.G., Mohamed; Stahl, Frederic, A Survey
of Data Mining Techniques for Social Media Analysis. eprint
arXiv, 2014. 1312.4617.
[4] Liu, B. and L. Zhang, A Survey of Opinion Mining and Sentiment
Analysis, in Mining Text Data, C.C. Aggarwal and C. Zhai,
Editors. 2012, Springer US. p. 415-463.
[5] Carbonell, J.G., Subjective Understanding: Computer Models of
Belief Systems, in PhD thesis. 1979.
[6] Nasukawa, T. and J. Yi, Sentiment analysis‫:‏‬capturing favorability
using natural language processing, in Proceedings of the 2nd
international conference on Knowledge capture. 2003, ACM:
Sanibel Island, FL, USA. p. 70-77.
[7] Dave, K., S. Lawrence, and D.M. Pennock, Mining the peanut
gallery: opinion extraction and semantic classification of product
reviews, in Proceedings of the 12th international conference on
World Wide Web. 2003, ACM: Budapest, Hungary. p. 519-528.
[8] Mohammad Ehsan Basiri* , A.R.n., Nasser Ghassem-Aghaee A
Framework for Sentiment Analysis in Persian. Open Transactions
on Information Processing, 2014. 1(3): p. 1-14.
[9] Kherwa, P., et al. An approach towards comprehensive sentimental
data analysis and opinion mining. in Advance Computing
Conference (IACC), 2014 IEEE International ‫.‏‬4102.
[01]‫‏‬،‫محمدی‬ ‫مجید‬ ‫و‬ ‫نفس‬ ‫نیک‬ ‫اکبر‬ ‫علی‬ ‫سمیه؛‬ ،‫زرندی‬ ‫برهانی‬9312‫نقد‬ ‫در‬ ‫کاوی‬ ‫عقیده‬ ،
،‫احساسی‬ ‫واژگان‬ ‫شبکه‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫کاال‬‫کنفرا‬ ‫دومین‬‫سیستم‬ ‫و‬ ‫صنایع‬ ‫مهندسی‬ ‫ملی‬ ‫نس‬
،‫صنایع‬ ‫مهندسی‬ ‫گروه‬ ،‫آباد‬ ‫نجف‬ ‫واحد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ،‫آباد‬ ‫نجف‬ ،‫ها‬
http://www.civilica.com/Paper-NIESC02-NIESC02_082.html‫‏‬
[11] Lewis, R. US Election 2012: Twitter is big winner as Obama is re-
elected for second term. Wed, Nov 7, 2012 ‫‏‏‬[ cited 2015; Available
from: https://uk.news.yahoo.com/us-election-2012--twitter-is-big-
winner-as-obama-is-re-elected-for-second-term-
07112012.html#3DCuuBb.
[12] S. Chandrasekar, E.C., and A. Ginet, Predicting the US
Presidential Election using Twitter data, in CS 229 Machine
Learning Project report. 2012: Stanford University.
[13] Collins, S., et al., Are You Satisfied with Life?: Predicting
Satisfaction with Life from Facebook, in Social Computing,
Behavioral-Cultural Modeling, and Prediction, N. Agarwal, K. Xu,
and N. Osgood, Editors. 2015, Springer International Publishing. p.
24-33.
[14] Amalarethinam, V.J.N.a.D.I.G., Parallel Implementation of Big
Data Pre-Processing Algorithms for Sentiment Analysis of Social
Networking Data. Intern. J. Fuzzy Mathematical Archive, 2015.
6(2): p. 149-159.
[15] Poshyvanyk, D., et al. Combining Probabilistic Ranking and Latent
Semantic Indexing for Feature Identification. in Program
Comprehension, 2006. ICPC 2006. 14th IEEE International
Conference on. 2006.
[16] Rustamov, S., E. Mustafayev, and M.A. Clements. Sentiment
analysis using Neuro-Fuzzy and Hidden Markov models of text. in
Southeastcon, 2013 Proceedings of IEEE. 2013.
[17] Shams, M., A. Shakery, and H. Faili. A non-parametric LDA-
based induction method for sentiment analysis. in Artificial
Intelligence and Signal Processing (AISP), 2012 16th CSI
International Symposium on. 2012.
[18] Bingwei, L., et al. Scalable sentiment classification for Big Data
analysis using Naïve Bayes Classifier. in Big Data, 2013‫‏‬
IEEE International Conference on. 2013.
[19] ،‫خادمی‬ ‫مریم‬ ‫و‬ ‫حامد‬ ،‫وامرزانی‬ ‫عزیزی‬9313‫های‬ ‫چالش‬ ‫و‬ ‫کاربردها‬ ،‫داده‬ ‫کالن‬ ،
،‫آن‬ ‫مرکز‬ ،‫تهران‬ ،‫پایه‬ ‫و‬ ‫مهندسی‬ ‫علوم‬ ‫در‬ ‫نوین‬ ‫دستاوردهای‬ ‫الکترونیکی‬ ‫ملی‬ ‫همایش‬
،‫کاو‬ ‫زمین‬ ‫پژوهشهای‬‫‏‬ http://www.civilica.com/Paper-AEBSCONF01-
AEBSCONF01_114.html
[20] Li, B. and K.C.C. Chan. A Fuzzy Logic Approach for Opinion
Mining on Large Scale Twitter Data. in Utility and Cloud
Computing (UCC), 2014 IEEE/ACM 7th International Conference
on. 2014.
[21] Rahnama, A.H.A., Distributed Real-Time Sentiment Analysis for
Big Data Social Streams. 2014.
[22] Allam, T.M., A.A. Sallam, and H.M. Abdullkader. Managed N-
gram language model based on Hadoop framework and a Hbase
tables. in Informatics and Systems (INFOS), 2014 9th International
Conference on. 2014.

بررسی کاربردها و چالش های کلان داده در تحلیل عقاید

  • 1.
    ‫عقاید‬ ‫تحلیل‬ ‫در‬‫داده‬ ‫کالن‬ ‫های‬ ‫چالش‬ ‫و‬ ‫کاربرد‬ ‫بررسی‬ ‫وامرزانی‬ ‫عزیزی‬ ‫حامد‬** ‫نرم‬ ‫کامپیوتر‬ ‫مهندسی‬ ‫گروه‬‫افزار‬ ‫تهران‬ ‫مهندسی‬ ‫و‬ ‫فنی‬ ‫دانشکده‬‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ،‫جنوب‬ ‫ایران‬ ،‫تهران‬ st_h_azizi@azad.ac.ir ‫خادمی‬ ‫مریم‬ ‫ری‬ ‫گروه‬‫اضی‬‫کاربردی‬ ‫دانشکده‬‫جنوب‬ ‫تهران‬ ‫پایه‬ ‫علوم‬‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ، ‫ایران‬ ،‫تهران‬ khademi@azad.ac.ir ‫چکیده‬—‫رسانه‬ ‫محبوبیت‬ ‫و‬ ‫گسترش‬ ‫با‬‫جوامع‬ ‫این‬ ،‫محور‬ ‫کاربر‬ ‫های‬ ‫تج‬ ،‫سیاسی‬ ‫گوناگون‬ ‫اطالعات‬ ‫از‬ ‫ارزشمند‬ ‫منبعی‬ ‫به‬ ‫مجازی‬،‫اری‬ ‫نشان‬ ‫اطالعاتی‬ ‫این‬ .‫است‬ ‫شده‬ ‫تبدیل‬ ... ‫و‬ ‫اجتماعی‬‫و‬ ‫افکار‬ ‫دهنده‬ ‫وسیع‬ ‫دید‬ ‫در‬ ‫و‬ ‫فرد‬ ‫یک‬ ‫احساسات‬‫با‬ ‫که‬ ‫است‬ ‫کشور‬ ‫یک‬ ‫و‬ ‫جامعه‬ ،‫تر‬ ‫داده‬ ‫این‬ ‫در‬ ‫کاوش‬‫می‬ ‫ها‬‫حوزه‬ ‫در‬ ‫ارزشی‬ ‫با‬ ‫بسیار‬ ‫دانش‬ ‫به‬ ‫توان‬‫های‬ ‫کالن‬ ‫اطالعات‬ ‫از‬ ‫حجم‬ ‫این‬ ‫تحلیل‬ ‫است‬ ‫واضح‬ .‫یافت‬ ‫دست‬ ‫گوناگون‬ ‫غیرساخت‬‫یاف‬‫روش‬ ‫نیازمند‬ ،‫کاربران‬ ‫ته‬‫متن‬ ‫بهینه‬ ‫و‬ ‫نوین‬ ‫های‬‫و‬ ‫کاوی‬ .‫است‬ ‫طبیعی‬ ‫زبان‬ ‫پردازش‬ ‫تحلیل‬ ‫کاربردهای‬ ‫معرفی‬ ‫از‬ ‫پس‬ ‫مقاله‬ ‫این‬ ‫در‬‫عقاید‬‫یک‬ ‫در‬ ‫کاربران‬ ‫کالن‬ ‫مجموعه‬‫شبکه‬ ‫همانند‬ ‫داده‬‫های‬‫سایت‬ ‫یا‬ ‫و‬ ‫اجتماعی‬‫بزرگ‬ ‫های‬ ‫چالش‬ ،‫مباحث‬ ‫آخرین‬ ،‫اینترنتی‬ ‫فروش‬‫راه‬ ‫و‬ ‫ها‬‫حوزه‬ ‫این‬ ‫در‬ ‫کارها‬‫مورد‬ .‫گرفت‬ ‫خواهد‬ ‫قرار‬ ‫بررسی‬ ‫واژ‬‫ه‬‫کلیدی‬ ‫های‬-‫متن‬ ،‫اجتماعی‬ ‫شبکه‬،‫کاوی‬‫کالن‬‫داده‬‫تحلیل‬ ،‫عقاید‬، ‫طبقه‬‫بندی‬ 1.‫مقدمه‬ ‫ارزش‬ ‫گاهی‬ ‫و‬ ‫مشترک‬ ‫وجوه‬ ‫داشتن‬ ‫دلیل‬ ‫به‬ ‫جامعه‬ ‫در‬ ‫افراد‬‫مشترک‬ ‫های‬ ‫شبکه‬ ‫و‬ ‫گذاشته‬ ‫تأثیر‬ ‫یکدیگر‬ ‫روی‬ ‫بر‬‫آن‬ ‫بین‬ ‫در‬ ‫اعتماد‬ ‫و‬ ‫ارزش‬ ‫از‬ ‫ای‬‫ها‬ ‫خاصی‬ ‫موضوعات‬ ‫برای‬‫می‬ ‫ایجاد‬.‫گردد‬ ‫شبکه‬‫اجتماعی‬ ‫های‬‫فروشگاه‬ ،‫وبالگ‬ ‫و‬ ‫اینترنتی‬ ‫های‬‫ها‬‫منبع‬ ‫به‬ ‫ارز‬‫شمند‬‫زمینه‬ ‫در‬ ‫احساسات‬ ‫کاوش‬ ‫برای‬ ‫ی‬‫مدیریت‬ ‫نظیر‬ ‫گوناگونی‬ ‫هایی‬ ،‫مشتری‬ ‫با‬ ‫ارتباط‬‫جامعه‬‫کاوش‬ ،‫بازاریابی‬ ،‫شناسی‬‫افکار‬‫و‬ ‫سیاست‬ ،‫عمومی‬ ‫تبدیل‬ ...‫شده‬‫ان‬.‫د‬‫رسیده‬ ‫اثبات‬ ‫به‬ ‫حقیقت‬ ‫این‬‫ب‬ ‫دانش‬ ‫که‬‫ه‬‫دست‬‫آ‬‫از‬ ‫مده‬ ‫شبکه‬‫فیس‬ ‫و‬ ‫توییتر‬ ‫نظیر‬ ‫اجتماعی‬ ‫های‬‫بوک‬‫سایت‬ ‫یا‬ ‫و‬‫فروش‬ ‫بزرگ‬ ‫های‬ ‫روش‬ ‫دیگر‬ ‫به‬ ‫نسبت‬ ‫باالتری‬ ‫ارزش‬ ‫مراتب‬ ‫به‬ ‫آمازون‬ ‫همانند‬ ‫اینترنتی‬‫های‬ ‫زیرا‬ ،‫دارند‬ ‫افراد‬ ‫از‬ ‫فیزیکی‬ ‫مصاحبه‬ ‫و‬ ‫نظرسنجی‬ ‫مانند‬ ‫عقیده‬ ‫کاوش‬ ‫سنتی‬ ‫این‬ ‫در‬‫شبکه‬ ‫گونه‬‫خالص‬ ‫نظرات‬ ‫کاربران‬ ً‫ال‬‫معمو‬ ‫ها‬‫می‬ ‫ارائه‬ ‫را‬ ‫خود‬‫و‬ ‫دهند‬ .‫نیست‬ ‫تأثیرگذار‬ ‫آن‬ ‫روی‬ ‫بر‬ ‫عاملی‬ ‫هیچ‬ ‫نوعی‬ ‫به‬ ‫به‬‫می‬ ‫مردم‬ ‫اطالعاتی‬ ‫منبع‬ ‫این‬ ‫وسیله‬‫صحیح‬ ‫تصمیمات‬ ‫توانند‬‫با‬ ‫تری‬ ‫محصول‬ ‫صاحبان‬ ‫راستا‬ ‫همین‬ ‫در‬ ‫و‬ ‫کنند‬ ‫اتخاذ‬ ‫افراد‬ ‫دیگر‬ ‫تجربیات‬ ‫به‬ ‫توجه‬ ‫می‬ ‫نیز‬ ‫خدمات‬ ‫یا‬ ‫و‬‫عقاید‬ ‫و‬ ‫نظرات‬ ‫این‬ ‫تحلیل‬ ‫به‬ ‫توجه‬ ‫با‬ ‫توانند‬‫خود‬ ‫کیفیت‬ .‫بخشند‬ ‫بهبود‬ ‫را‬
  • 2.
    ‫مقاله‬ ‫عنوان‬ ‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ 2 ‫آمارها‬ ‫آخرین‬ ‫طبق‬[9]‫فیس‬ ‫اجتماعی‬ ‫شبکه‬‫پیدایش‬ ‫زمان‬ ‫از‬ ‫بوک‬ ‫سال‬ ‫در‬ ‫خود‬ ‫رسمی‬2004‫توانسته‬ ‫تاکنون‬44/9‫که‬ ‫را‬ ‫فعالی‬ ‫کاربر‬ ‫میلیارد‬ ‫می‬ ‫خود‬ ‫شخصی‬ ‫صفحه‬ ‫وارد‬ ‫بار‬ ‫یک‬ ‫حداقل‬ ‫ماهیانه‬‫دنیا‬ ‫سراسر‬ ‫در‬ ‫را‬ ‫شوند‬ ‫حدود‬ ‫دقیقه‬ ‫یک‬ ‫در‬ ‫کاربران‬ ‫این‬ ،‫کند‬ ‫جذب‬000/49‫عنوان‬ ‫به‬ ‫را‬ ‫متنی‬ ‫بار‬ ‫فیس‬ ‫در‬ ‫وضعیت‬‫می‬ ‫بوک‬‫نو‬‫یسند‬[2]،‫توییتر‬ ‫اجتماعی‬ ‫شبکه‬ ‫در‬ ‫اما‬‫روزانه‬ 000‫به‬ )‫(توییت‬ ‫نوشته‬ ‫میلیون‬33‫زب‬‫می‬ ‫منتشر‬ ‫کاربران‬ ‫توسط‬ ‫دنیا‬ ‫زنده‬ ‫ان‬ ‫شود‬.‫از‬ ‫بیش‬ ‫آمازون‬ ‫اینترنتی‬ ‫فروش‬ ‫بزرگ‬ ‫سایت‬ ‫در‬270‫فعال‬ ‫کاربر‬ ‫میلیون‬ ‫دارد‬ ‫وجود‬‫در‬ ‫را‬ ‫نظرات‬ ‫از‬ ‫عظیمی‬ ‫حجم‬ ‫که‬‫وارد‬ ‫مختلف‬ ‫محصوالت‬ ‫مورد‬ .‫کنند‬ ‫می‬ ‫خوان‬ ‫است‬ ‫واضح‬‫نظرات‬ ‫از‬ ‫بخشی‬ ‫حتی‬ ‫یا‬ ‫و‬ ‫تمامی‬ ‫بررسی‬ ‫و‬ ‫دن‬ ‫وقت‬ ‫کاری‬ ‫کاربران‬‫در‬ ‫و‬ ‫گیر‬‫داده‬ ‫از‬ ‫عظیم‬ ‫حجم‬ ‫این‬،‫است‬ ‫غیرممکن‬ ‫عقیده‬ ‫حوزه‬ ‫در‬ ‫بنابراین‬‫ابزاری‬ ‫بهبود‬ ‫و‬ ‫ساخت‬ ‫دنبال‬ ‫به‬ ‫پژوهشگران‬ ‫کاوی‬ ‫به‬ ‫توجه‬ ‫با‬ ‫را‬ ‫کاربران‬ ‫نظرات‬ ‫و‬ ‫عقیده‬ ‫خودکار‬ ‫صورت‬ ‫به‬ ‫بتواند‬ ‫که‬ ‫هستند‬ ‫نوشته‬‫های‬‫آنان‬‫استخراج‬‫ذی‬ ‫به‬ ‫کلی‬ ‫وضعیت‬ ‫یک‬ ‫و‬ ‫کند‬.‫بدهد‬ ‫نفعان‬ 2.‫مفاهیم‬‫و‬‫الیه‬‫تحلیل‬ ‫مختلف‬ ‫های‬ ‫تعار‬‫ی‬‫ف‬‫ز‬‫ی‬‫اد‬‫ی‬‫ب‬ ‫مختلف‬ ‫مقاالت‬ ‫در‬‫ی‬‫ان‬‫همگ‬ ‫که‬ ‫شده‬‫ی‬‫ی‬‫ک‬‫معنا‬‫ی‬‫واحد‬ ‫تحل‬ .‫دارند‬ ‫را‬‫ی‬‫ل‬‫احساسات‬‫و‬‫عق‬‫ی‬‫ده‬‫‏‬‫کاوی‬‫معن‬ ‫به‬‫ی‬‫شناخت‬ ‫و‬ ‫کشف‬ ‫و‬ ‫مثبت‬ ‫احساسات‬‫ی‬‫ا‬‫منف‬‫ی‬‫به‬ ‫راجع‬ ‫مردم‬‫ی‬‫ک‬‫مسأله‬‫ی‬‫ا‬‫است‬ ‫محصول‬[3]. ‫چهارگانه‬ ‫یک‬ ‫نظر‬ ‫یک‬ :‫نظر‬(g, s, h, t)‫آن‬ ‫در‬ ‫که‬ ‫است‬g‫هدف‬ ‫که‬ ‫(آنچه‬"‫نظر‬"،)‫است‬ ‫شده‬ ‫بیان‬ ‫آن‬ ‫مورد‬ ‫در‬s،‫شده‬ ‫بیان‬ ‫حس‬h ‫و‬ ‫نظر‬ ‫صاحب‬t‫نظر‬ ‫بیان‬ ‫زمان‬‫است‬. :‫موجودیت‬‫موجودیت‬ ‫یک‬e،‫شخص‬ ،‫سرویس‬ ،‫محصول‬ ‫یک‬ ‫می‬ ‫تعریف‬ ‫جفت‬ ‫یک‬ ‫با‬ ‫که‬ ‫است‬ ‫عنوانی‬ ‫یا‬ ‫سازمان‬ ،‫رخداد‬- :‫شود‬e:(T,W)‫که‬T‫امثال‬ ‫و‬ ‫زیرجزء‬ ‫و‬ ‫جزء‬ ‫مراتب‬ ‫سلسله‬ ‫یک‬ ‫و‬ ‫آن‬W‫خص‬ ‫مجموعه‬‫ا‬‫هم‬ ‫زیرجزء‬ ‫هر‬ .‫است‬ ‫موجودیت‬ ‫آن‬ ‫یص‬ ‫خص‬ ‫خودش‬‫ا‬.‫داراست‬ ‫را‬ ‫خود‬ ‫یص‬‫آن‬ ‫همگی‬ ‫وجود‬‫ضروروی‬ ‫ها‬ ‫با‬ ‫تحلیل‬ ‫کار‬ ،‫قسمت‬ ‫پنج‬ ‫این‬ ‫از‬ ‫یک‬ ‫هر‬ ‫نبود‬ ‫صورت‬ ‫در‬ ‫و‬ ‫بوده‬ ‫روبه‬ ‫مشکل‬.‫شد‬ ‫خواهد‬ ‫رو‬ ‫عقیده‬‫م‬ ‫تقسیم‬ ‫تحلیل‬ ‫مختلف‬ ‫سطح‬ ‫سه‬ ‫در‬ ‫کاوی‬‫ی‬‫شود‬[4]. ‫سند‬ ‫سطح‬‫آن‬ ‫دنبال‬ ‫به‬ ‫نظری‬ ‫سند‬ ‫یک‬ ‫داشتن‬ ‫با‬ ‫سطح‬ ‫این‬ ‫در‬ : ‫منفی‬ ‫یا‬ ‫مثبت‬ ‫نظر‬ ‫سند‬ ‫این‬ ‫کل‬ ‫بدانیم‬ ‫که‬ ‫هستیم‬.‫دارد‬‫عنوان‬ ‫به‬ ‫مقاله‬ ‫یک‬ ‫داشتن‬ ‫با‬ ‫مثال‬‫نقد‬ ‫یا‬‫مشخص‬ ‫سیستم‬ ،‫محصول‬ ‫یک‬ ‫از‬ ‫می‬.‫است‬ ‫بوده‬ ‫منفی‬ ‫یا‬ ‫مثبت‬ ‫کلی‬ ‫نظر‬ ‫مسأله‬ ‫مورد‬ ‫در‬ ‫که‬ ‫نماید‬ ‫جمله‬ ‫سطح‬:‫مث‬ ‫های‬ ‫دسته‬ ‫به‬ ‫جمالت‬‫و‬ ،‫منفی‬ ،‫بت‬‫دسته‬ ‫خنثی‬ ‫می‬ ‫بندی‬‫شوند‬. ‫ویژگی‬ ‫و‬ ‫موجودیت‬ ‫سطح‬:‫زبان‬ ‫ساختارهای‬ ‫به‬ ‫پرداختن‬ ‫جای‬ ‫به‬ ‫خود‬ ‫سراغ‬ ‫مستقیما‬ ‫سطح‬ ‫این‬ ‫در‬ ... ‫و‬ ‫عبارت‬ ،‫پارگراف‬ ،‫جمله‬ ‫مثل‬ ‫می‬ ‫نظر‬‫جزء‬ ‫(دو‬ ‫آن‬ ‫به‬ ‫مربوط‬ ‫حس‬ ‫و‬ ‫موجودیت‬ ‫اغلب‬ .‫رویم‬ ‫می‬ ‫هم‬ ‫با‬ ‫همراه‬ )‫نظر‬ ‫اصلی‬‫کشف‬ ‫دنبال‬ ‫به‬ ‫سطح‬ ‫این‬ ‫در‬ .‫آیند‬‫حس‬ ‫موجودیت‬ ‫روی‬‫جنبه‬ ‫و‬ ‫ها‬‫ها‬9 ‫هستیم‬ ‫آنها‬ ‫مختلف‬ ‫ها)ی‬ ‫(ویژگی‬‫که‬ .‫دارد‬ ‫بیشتر‬ ‫های‬ ‫پیچیدگی‬ ‫قبل‬ ‫حالت‬ ‫دو‬ ‫به‬ ‫نسب‬ ‫به‬ 3.‫تاریخچه‬‫کاربرد‬ ‫و‬ ‫اولین‬ ‫از‬ ‫یکی‬‫تحقیقات‬‫سال‬ ‫در‬ ‫حوزه‬ ‫این‬ ‫در‬9171‫کاربنل‬ ‫توسط‬[0] ‫شبیه‬ ‫مدل‬ ‫یک‬ ‫از‬ ‫وی‬ ،‫شد‬ ‫معرفی‬‫که‬ ‫کرد‬ ‫طراحی‬ ‫را‬ ‫کامپیوتری‬ ‫شده‬ ‫سازی‬ ‫می‬‫را‬ ‫کار‬ ‫محافظه‬ ‫یا‬ ‫و‬ ‫خواه‬ ‫آزادی‬ ‫حزب‬ ‫از‬ ‫فرد‬ ‫یک‬ ‫سیاسی‬ ‫عقاید‬ ‫توانست‬ ‫سیاست‬ ‫به‬ ‫توجه‬ ‫با‬‫و‬ ‫آمریکا‬‫روسیه‬‫سیاست‬ ‫دیگر‬ ‫و‬‫بین‬ ‫های‬‫مدل‬ ‫المللی‬- ‫نما‬ ‫سازی‬.‫ید‬ ‫احساسات‬ ‫تحلیل‬ ‫عبارت‬ ‫اما‬‫در‬[6]‫عقیده‬ ‫اصطالح‬ ‫و‬‫در‬ ‫نیز‬ ‫کاوی‬[7] ‫زبان‬ ‫اگرچه‬ ،‫شد‬ ‫برده‬ ‫نام‬ ‫بار‬ ‫اولین‬ ‫برای‬‫طبیعی‬ ‫زبان‬ ‫پردازش‬ ‫و‬ ‫شناسی‬‫سابقه‬ ‫سال‬ ‫از‬ ‫قبل‬ ‫تا‬ ‫اما‬ ‫دارند‬ ‫تحقیقاتی‬ ‫طوالنی‬2000‫پژوهش‬ ‫میالدی‬‫بسیار‬ ‫های‬ .‫بود‬ ‫پذیرفته‬ ‫صورت‬ ‫احساسات‬ ‫تحلیل‬ ‫با‬ ‫رابطه‬ ‫در‬ ‫محدودی‬ ‫سال‬ ‫در‬ ‫شاخه‬ ‫این‬ ‫در‬ ‫تحقیقات‬ ‫گسترش‬،‫دارد‬ ‫مختلفی‬ ‫دالیل‬ ‫اخیر‬ ‫های‬ ً‫ال‬‫او‬‫حوزه‬ ‫هر‬ ‫تقریبا‬ ‫آن‬ ‫کاربرد‬‫می‬ ‫شامل‬ ‫را‬ ‫ای‬‫به‬ ‫شود‬‫صنعت‬ ‫بخش‬ ‫در‬ ‫ویژه‬ ‫تحلیل‬ ‫را‬ ‫بازار‬ ً‫ال‬‫کام‬ ‫دارند‬ ‫نیاز‬ ‫مشاغل‬ ‫صاحبان‬ ،‫بازار‬ ‫بودن‬ ‫رقابتی‬ ‫دلیل‬ ‫به‬ ‫برای‬ ‫را‬ ‫زیادی‬ ‫هزینه‬ ‫هستند‬ ‫حاضر‬ ‫و‬ ‫باشند‬ ‫آگاه‬ ‫مشتریان‬ ‫نظرات‬ ‫از‬ ‫و‬ ‫نموده‬ ‫چالشی‬ ‫حوزه‬ ‫یک‬ ً‫ا‬‫ثانی‬ ‫دهند‬ ‫انجام‬ ‫اطالعات‬ ‫این‬ ‫داشتن‬‫به‬ ،‫است‬ ‫تحقیقاتی‬- ‫به‬ ‫فارسی‬ ‫زبان‬ ‫در‬ ‫خصوص‬‫پیچیدگی‬ ‫دلیل‬‫زیادی‬ ‫کار‬ ‫جای‬ ‫آن‬ ‫خاص‬ ‫های‬ ‫دارد‬[8]. ‫آخرین‬ ‫و‬ ‫معرفی‬ ‫احساسات‬ ‫تحلیل‬ ‫پرکاربرد‬ ‫حوزه‬ ‫چند‬ ‫ادامه‬ ‫در‬ .‫گرفت‬ ‫خواهد‬ ‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫تحقیقات‬ 1 Aspects
  • 3.
    ‫مقاله‬ ‫عنوان‬ ‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ 3 3.1.‫الکترونیک‬ ‫تجارت‬ ‫و‬ ‫بازاریابی‬ ‫بیش‬‫عقیده‬ ‫کاربرد‬ ‫ترین‬‫راه‬ ‫زیرا‬ ‫است‬ ‫تجارت‬ ‫و‬ ‫بازار‬ ‫حوزه‬ ‫در‬ ‫کاوی‬‫کارها‬ ‫این‬ ‫در‬ ‫کاربردها‬ .‫شد‬ ‫خواهد‬ ‫فروش‬ ‫و‬ ‫سوددهی‬ ‫افزایش‬ ‫به‬ ‫منجر‬ ً‫ال‬‫معمو‬ ‫حوزه‬:‫است‬ ‫بررسی‬ ‫قابل‬ ‫زیر‬ ‫دیدگاه‬ ‫سه‬ ‫از‬ ‫مشتریان‬ ‫دیدگاه‬ ‫از‬،‫کاال‬ ‫مزایا‬ ‫و‬ ‫معایب‬ ،‫محصول‬ ‫کیفیت‬ ‫بررسی‬ : ... ‫و‬ ‫محصوالت‬ ‫مقایسه‬ ،‫دیگران‬ ‫تجربیات‬ ‫از‬ ‫استفاده‬ ‫تولیدکنندگان‬ ‫دیدگاه‬ ‫از‬‫از‬ ‫خود‬ ‫محصول‬ ‫ضعف‬ ‫نقاط‬ ‫کشف‬ : ‫از‬ ‫بهتر‬ ‫درک‬ ،‫مشتریان‬ ‫انتظارات‬ ‫و‬ ‫نظرات‬ ‫نقطه‬ ،‫مشتریان‬ ‫دیدگاه‬ ‫مشت‬ ‫نیاز‬‫شرکت‬ ‫سایر‬ ‫با‬ ‫رقابت‬ ‫و‬ ‫مقایسه‬ ،‫خود‬ ‫ریان‬‫در‬ ‫رقیب‬ ‫های‬ ... ‫و‬ ‫بازار‬ ‫فروشندگان‬ ‫دیدگاه‬ ‫از‬‫با‬ ‫مناسب‬ ‫تبلیغات‬ ،‫بازاریابی‬ :‫و‬ ‫عالیق‬ ‫سال‬... ‫و‬ ‫خریداران‬ ‫به‬ ‫مناسب‬ ‫محصول‬ ‫پیشنهاد‬ ،‫مشتریان‬ ‫یق‬ ‫مقاله‬ ‫در‬[1]‫جمع‬ ‫پس‬‫بازبینی‬ ‫و‬ ‫نظرات‬ ‫متن‬ ‫آوری‬‫کاربرن‬ ‫های‬2 ‫از‬ ‫انجمن‬‫شبکه‬ ،‫گفتگو‬ ‫های‬‫فروشگاه‬ ،‫اجتماعی‬ ‫های‬... ‫و‬ ‫اینترنتی‬ ‫آنالین‬ ‫های‬ ‫تکنیک‬ ‫از‬ ‫استفاده‬ ‫با‬‫احساسات‬ ‫و‬ ‫عقاید‬ ‫تواستند‬ ‫طبیعی‬ ‫زبان‬ ‫پردازش‬ ‫های‬ ‫موبایل‬ ‫گوشی‬ ‫مانند‬ ‫مختلفی‬ ‫محصوالت‬ ‫مورد‬ ‫در‬ ‫را‬ ‫کاربران‬‫به‬‫و‬ ‫آورده‬ ‫دست‬ ‫ویژگی‬ ‫مورد‬ ‫در‬ ‫جزئیات‬ ‫به‬‫دیده‬ ‫کاربران‬ ‫نقدهای‬ ‫که‬ ‫در‬ ‫آن‬ ‫مختلف‬ ‫های‬ ‫بصری‬ ،‫شده‬‫سازی‬3 ‫شکل‬ ‫در‬ ‫دهند‬ ‫انجام‬ ‫را‬9‫موبایل‬ ‫یک‬ ‫ویژگی‬ ‫از‬ ‫نمونه‬ ‫دو‬ ‫آمده‬ ‫موردنظر‬ ‫محصول‬ ‫به‬ ‫نسبت‬ ‫کاربران‬ ‫احساسات‬ ‫کلی‬ ‫نتیجه‬ ‫همراه‬ ‫به‬ .‫است‬ ‫شکل‬1-‫مورد‬ ‫در‬ ‫کاربران‬ ‫احساسات‬ ‫تحلیل‬ ‫نتایج‬‫موبایل‬ ‫گوشی‬ ‫یک‬ ‫ویژگی‬ ‫تحلیل‬ ‫خالصه‬ ،‫کلی‬ ‫نتیجه‬ ‫یک‬ ‫تولید‬ ‫با‬ ‫نهایت‬ ‫در‬ ‫و‬‫مختلف‬ ‫های‬ ‫می‬ ‫خالصه‬ ‫نتیجه‬ ‫یک‬ ‫در‬ ‫را‬.‫کند‬ ‫در‬‫فارس‬ ‫زبان‬‫ی‬‫ن‬‫ی‬‫ز‬‫محمد‬‫ی‬‫همکاران‬ ‫و‬[90]‫راه‬‫کاری‬‫نقد‬ ‫درجهت‬ ‫را‬ ‫ی‬‫ک‬‫احساس‬ ‫واژگان‬ ‫شبکه‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫کاال‬‫ی‬‫که‬‫ی‬‫ک‬‫ی‬‫روش‬ ‫از‬‫های‬‫تحل‬‫ی‬‫ل‬ ‫ا‬ ‫در‬ ،‫نمودند‬ ‫ارائه‬ ‫است‬ ‫احساسات‬‫ی‬‫ن‬‫س‬‫ی‬‫ستم‬‫پ‬ ‫مرحله‬ ‫در‬ ‫ابتدا‬‫ی‬‫ش‬‫پردازش‬ ‫داده‬‫جداساز‬ ‫با‬ ‫ها‬‫ی‬‫کل‬‫برچسب‬ ،‫جمالت‬ ‫و‬ ‫مات‬‫گذاری‬‫اجزا‬‫ی‬‫ر‬ ‫و‬ ‫سخن‬‫ی‬‫شه‬‫‏‬ 2 User Review 3 visualization ‫ی‬‫اب‬‫ی‬‫موردن‬ ‫اطالعات‬ ،‫کلمات‬‫ی‬‫از‬‫م‬ ‫استخراج‬ ‫نقدها‬ ‫از‬‫ی‬‫شود‬‫با‬ ‫بعد‬ ‫مرحله‬ ‫در‬ . ‫و‬ ‫استخراج‬‫ی‬‫ژگ‬‫ی‬‫ها‬‫ی‬‫و‬ ‫از‬ ‫دسته‬ ‫آن‬ ،‫نقدها‬ ‫از‬ ‫کاال‬‫ی‬‫ژگ‬‫ی‬‫ها‬‫کاربران‬ ‫نظر‬ ‫از‬ ‫که‬ ‫اهم‬‫ی‬‫ت‬‫ب‬‫ی‬‫ش‬‫تری‬‫م‬ ‫مشخص‬ ‫دارند‬‫ی‬‫شوند‬‫و‬ .‫ی‬‫ژگ‬‫ی‬‫های‬‫به‬‫دست‬‫آمده‬‫با‬‫دقت‬ ‫باالیی‬‫مشا‬‫و‬ ‫با‬ ‫به‬‫ی‬‫ژگ‬‫ی‬‫های‬‫واقع‬‫ی‬‫طبقه‬ ‫و‬ ‫بوده‬ ‫کاال‬‫بن‬‫د‬‫ی‬‫احساس‬‫ی‬‫مجموعه‬ ‫احساس‬ ‫بار‬ ‫براساس‬ ،‫داده‬‫ی‬‫م‬ ‫صورت‬ ‫متن‬ ‫در‬ ‫موجود‬ ‫واژگان‬‫ی‬‫پذی‬‫رد‬. ‫در‬‫عرصه‬‫ن‬ ‫بورس‬ ‫بازار‬ ‫و‬ ‫سهام‬‫ی‬‫ز‬‫عده‬‫ای‬‫تحل‬ ‫از‬‫ی‬‫ل‬‫گران‬‫سرما‬‫ی‬‫ه‬‫با‬ ‫عق‬ ‫از‬ ‫استفاده‬‫ی‬‫ده‬‫کاوی‬‫به‬ ‫راجع‬ ‫کاربران‬‫ی‬‫ک‬‫ق‬ ،‫شرکت‬‫ی‬‫مت‬‫پ‬ ‫را‬ ‫آن‬ ‫سهام‬‫ی‬‫ش‬ ‫بی‬‫ن‬‫ی‬‫م‬‫ی‬‫کنن‬‫د‬‫برا‬‫ی‬‫سا‬ ‫وب‬ ‫در‬ ‫مثال‬‫ی‬‫ت‬sentdex.com‫در‬ ‫کاربران‬ ‫نظرات‬ ‫شبکه‬‫های‬‫اجتماع‬‫ی‬‫شرکت‬ ‫به‬ ‫راجع‬‫ها‬‫ی‬‫تجز‬ ‫بزرگ‬‫ی‬‫ه‬‫تحل‬ ‫و‬‫ی‬‫ل‬‫و‬ ‫شده‬ ‫نما‬‫ی‬‫ش‬‫داده‬‫م‬‫ی‬‫تحل‬ ‫و‬ ‫شود‬‫ی‬‫ل‬‫گران‬‫ا‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫بازار‬‫ی‬‫ن‬‫پ‬ ‫اطالعات‬‫ی‬‫ش‬‫بی‬‫ن‬‫ی‬ ‫دق‬‫ی‬‫ق‬‫تری‬‫م‬ ‫را‬‫ی‬‫توانند‬.‫دهند‬ ‫انجام‬ 3.2.‫جامعه‬ ‫و‬ ‫سیاست‬ ‫شاخص‬‫تری‬‫ن‬‫تحل‬ ‫کاربرد‬‫ی‬‫ل‬‫اح‬‫س‬ ‫عرصه‬ ‫در‬ ‫ساسات‬‫ی‬‫است‬‫به‬ ‫مربوط‬ ‫سال‬ ‫انتخابات‬2092‫آمر‬‫ی‬‫کا‬‫است‬‫انتخابات‬ ‫در‬ ‫البته‬ .2008‫تحق‬‫ی‬‫قات‬‫مشابه‬ ‫پا‬ ‫سطح‬ ‫در‬‫یی‬‫ن‬‫تری‬‫ت‬ .‫بود‬ ‫شده‬ ‫انجام‬‫ی‬‫م‬‫تبل‬‫ی‬‫غات‬‫ی‬‫اطالعات‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫اوباما‬ ‫شبکه‬‫های‬‫اجتماع‬‫ی‬،‫به‬‫خصوص‬‫تویی‬،‫تر‬‫رأ‬ ‫توانست‬‫ی‬‫ز‬ ‫افراد‬‫ی‬‫اد‬‫ی‬‫را‬‫ب‬‫ه‬‫دست‬ ‫از‬ ‫استفاده‬ ‫با‬ ،‫آورد‬‫برچسب‬ ‫تعداد‬‫هایی‬‫ا‬ ‫هر‬ ‫در‬ ‫که‬‫ی‬‫الت‬‫حاو‬‫ی‬ #TeamObama tonight‫م‬ ‫توانستند‬ ‫بود‬‫ی‬‫زان‬‫محبوب‬‫ی‬‫ت‬‫و‬‫ی‬‫ق‬ ‫در‬ ‫را‬‫ی‬‫اس‬‫با‬ ‫رق‬‫ی‬‫ب‬‫و‬‫ی‬‫آن‬ ،‫دهند‬ ‫نشان‬‫ها‬‫با‬‫استفاده‬‫از‬‫ای‬‫ن‬‫م‬ ‫اطالعات‬‫ی‬‫توانستند‬‫ا‬‫ی‬‫الت‬‫های‬ ‫به‬ ‫هدف‬‫تبل‬ ‫منظور‬‫ی‬‫غات‬‫ب‬‫ی‬‫ش‬‫تر‬‫تع‬ ‫را‬‫یی‬‫ن‬‫هم‬ ‫و‬ ‫کرده‬‫چنی‬‫ن‬‫مت‬‫ن‬‫سخنران‬‫ی‬‫و‬‫ی‬ ‫ا‬ ‫به‬ ‫توجه‬ ‫با‬ ‫را‬‫تنظ‬ ‫شهر‬ ‫آن‬ ‫قالب‬ ‫فکار‬‫ی‬‫م‬‫کنند‬‫شکل‬ ‫در‬ ،2‫بصری‬ ‫نمونه‬‫سازی‬ ‫است‬ ‫شده‬ ‫داده‬ ‫نمایش‬ ‫تحلیل‬ ‫این‬ ‫از‬ ‫حاصل‬[99,92]. ‫شکل‬2-‫م‬‫ی‬‫زان‬‫محبوب‬‫ی‬‫ت‬‫ا‬ ‫در‬ ‫اوباما‬‫ی‬‫الت‬‫ها‬‫ی‬‫استفاده‬ ‫با‬ ‫مختلف‬‫عقیده‬ ‫در‬ ‫کاوی‬‫تو‬‫یی‬‫تر‬‫انتخابات‬ ‫از‬ ‫قبل‬
  • 4.
    ‫مقاله‬ ‫عنوان‬ ‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ 4 ‫هندی‬ ‫پژوهشگران‬‫سال‬ ‫در‬2094‫حدود‬ ‫از‬ ‫استفاده‬ ‫با‬23‫م‬‫ی‬‫ل‬‫ی‬‫ون‬‫تو‬‫یی‬‫ت‬ ‫از‬96‫م‬‫ی‬‫ل‬‫ی‬‫ون‬‫شبکه‬ ،‫کاربر‬‫ا‬‫ی‬‫حدود‬ ‫با‬40‫م‬‫ی‬‫ل‬‫ی‬‫ون‬‫م‬ ‫که‬ ‫ساختند‬ ‫لبه‬‫ی‬‫توانست‬ ‫انتخابات‬ ‫هر‬ ‫برنده‬‫ی‬‫توج‬ ‫با‬ ‫را‬‫عقا‬ ‫به‬ ‫ه‬‫ی‬‫د‬‫نوشته‬‫های‬‫تو‬ ‫کاربران‬‫یی‬‫تر‬‫هند‬ ‫در‬ ‫پ‬‫ی‬‫ش‬‫بی‬‫ن‬‫ی‬‫و‬ ،‫کند‬‫ی‬‫ژگ‬‫ی‬‫اصل‬‫ی‬‫س‬‫ی‬‫ستم‬‫آن‬‫ها‬‫بالدرنگ‬‫بودن‬‫تحلی‬‫ل‬‫آن‬‫ه‬‫ا‬‫لذا‬ ،‫بود‬ ‫م‬‫ی‬‫توانستند‬‫نت‬ ‫لحظه‬ ‫هر‬ ‫در‬‫ی‬‫جه‬‫به‬ ‫موجود‬ ‫اطالعات‬ ‫به‬ ‫را‬‫روزرسانی‬‫نما‬‫ی‬،‫ند‬‫در‬ ‫نها‬‫ی‬‫ت‬‫پ‬‫ی‬‫ش‬‫بی‬‫ن‬‫ی‬‫آن‬‫ها‬‫از‬‫دو‬‫ماه‬‫قبل‬‫از‬‫انتخابات‬‫دقی‬ً‫ا‬‫ق‬‫نت‬ ‫با‬ ‫برابر‬‫ی‬‫جه‬‫ب‬‫از‬ ‫عد‬ .‫بود‬ ‫انتخابات‬ ‫اما‬‫تحل‬ ‫با‬ ‫توانستند‬ ‫محققان‬ ،‫جامعه‬ ‫بعد‬ ‫در‬‫ی‬‫ل‬‫کاربر‬ ‫توسط‬ ‫شده‬ ‫وارد‬ ‫متن‬ ‫د‬ ‫و‬‫ی‬‫گر‬‫شخص‬ ‫صفحه‬ ‫اطالعات‬‫ی‬‫و‬‫ی‬‫اجتماع‬ ‫شبکه‬ ‫در‬‫ی‬‫ف‬‫ی‬‫س‬،‫بوک‬‫م‬‫ی‬‫زان‬ ‫رضا‬‫ی‬‫ت‬‫و‬‫ی‬‫زندگ‬ ‫از‬‫ی‬‫م‬ ‫مجموع‬ ‫در‬ ‫و‬‫ی‬‫زان‬‫رضا‬‫ی‬‫ت‬‫ی‬‫ک‬‫تحل‬ ‫را‬ ‫جامعه‬‫ی‬‫ل‬‫کنند‬ [93]. 4.‫عقیده‬ ‫مراحل‬‫کاوی‬ ‫شکل‬ ‫در‬3‫مراحل‬‫قطبیت‬ ‫تعیین‬4 ‫توسط‬ ‫شده‬ ‫وارد‬ ‫متن‬‫کاربر‬‫داده‬ ‫نشان‬ ‫ا‬ .‫است‬ ‫شده‬‫ی‬‫ن‬‫کل‬ ‫اصول‬ ‫مراحل‬‫ی‬‫اجرا‬‫ی‬‫ی‬‫ک‬‫س‬‫ی‬‫ستم‬‫تحل‬‫ی‬‫ل‬‫گر‬‫یک‬ ‫قطبیت‬ ‫متن‬‫تشر‬ ‫با‬ ‫ادامه‬ ‫در‬ .‫است‬‫ی‬‫ح‬‫روش‬ ،‫گام‬ ‫هر‬ ‫عمکلرد‬‫های‬‫اجرا‬ ‫مختلف‬‫ی‬‫آن‬ ‫بررس‬ ‫مورد‬‫ی‬.‫گرفت‬ ‫خواهد‬ ‫قرار‬ ‫شکل‬3–‫مراحل‬‫تحلی‬‫ل‬‫احس‬‫اجتماع‬ ‫شبکه‬ ‫در‬ ‫کاربر‬ ‫اسات‬‫ی‬ 4.1.‫پیش‬‫داده‬ ‫پردازش‬‫ها‬ ‫ا‬ ‫در‬‫ی‬‫ن‬‫آماده‬ ‫مرحله‬ ‫دو‬ ‫در‬ ‫موردنظر‬ ‫متن‬ ،‫کاربرد‬ ‫برحسب‬ ‫گام‬‫سازی‬‫م‬‫ی‬ ،‫گردد‬‫نگارش‬ ‫عالئم‬ ‫و‬ ‫لغات‬ ‫براساس‬ ‫جمله‬ ‫ابتدا‬‫ی‬‫منقطع‬‫تقسی‬ ‫کننده‬‫م‬‫م‬‫ی‬‫شود‬ ‫برچسب‬ ‫سپس‬ ‫و‬‫گذاری‬‫دستور‬ ‫مشخصه‬‫ی‬‫م‬ ‫انجام‬ ‫کلمات‬‫ی‬.‫گردد‬ 4 Polarity ً‫ال‬‫معمو‬‫اول‬‫ی‬‫ن‬‫ب‬ ‫جمله‬ ‫شکست‬‫نگارش‬ ‫خاص‬ ‫عالئم‬ ‫راساس‬‫ی‬‫مانند‬ ».«(،«;»،«،»،»!«،«‫؟‬»،)»:«‫پذ‬ ‫صورت‬‫ی‬‫رفته‬‫تشک‬ ‫کلمات‬ ‫به‬ ‫جمله‬ ‫سپس‬ ‫و‬‫ی‬‫ل‬‫‏‬ ‫دهنده‬‫تقس‬‫ی‬‫م‬‫م‬‫ی‬‫‏‬‫گردد‬. ‫اما‬‫برچسب‬ ‫در‬‫‏‬‫گذاری‬‫برچسب‬ ‫انتساب‬ ‫عمل‬‫‏‬‫های‬‫واژگان‬‫ی‬‫و‬ ‫کلمات‬ ‫به‬ ‫نشانه‬‫‏‬‫های‬‫تشک‬‫ی‬‫ل‬‫م‬ ‫صورت‬ ‫متن‬‫ی‬‫‏‬‫پذی‬‫رد‬‫ا‬ ‫واقع‬ ‫در‬‫ی‬‫ن‬‫برچسب‬‫‏‬‫ها‬‫نقش‬ ‫کلمات‬‫در‬‫جمله‬‫را‬‫مشخص‬‫م‬‫ی‬‫‏‬‫سازند‬‫کل‬ ‫حالت‬ ‫در‬ .‫ی‬‫روش‬‫‏‬‫های‬ ‫برچسب‬‫‏‬‫گذاری‬‫تقس‬ ‫دسته‬ ‫دو‬ ‫به‬ ‫کلمات‬‫ی‬‫م‬‫م‬‫ی‬‫مجموعه‬ ‫اول‬ ‫دسته‬ .‫گردد‬ ‫روش‬‫‏‬‫های‬‫آمار‬‫ی‬‫ق‬ ‫دوم‬ ‫دسته‬ ‫و‬‫اعده‬‫روش‬ ‫در‬ .‫هستند‬ ‫محور‬‫‏‬‫های‬‫آمار‬‫ی‬‫ی‬‫ک‬ ‫احتمال‬ ‫مجموعه‬‫ی‬‫برچسب‬ ‫از‬‫‏‬‫ها‬‫برای‬‫ی‬‫ک‬‫م‬ ‫انتخاب‬ ‫کلمه‬‫ی‬‫براساس‬ ‫و‬ ‫گردد‬ ‫برچسب‬‫ها‬‫ی‬‫ضر‬ ‫مجاور‬‫ی‬‫ب‬‫صح‬ ‫احتمال‬‫ی‬‫ح‬‫ه‬ ‫بودن‬‫محاسبه‬ ‫برچسب‬ ‫ر‬ ‫م‬‫ی‬.‫گردد‬ ً‫ال‬‫معمو‬‫روش‬ ‫در‬‫‏‬‫های‬‫غ‬‫ی‬‫رآمار‬‫ی‬‫قوان‬ ‫از‬ ‫استفاده‬ ‫با‬ ،‫محور‬ ‫قاعده‬‫ی‬‫ن‬‫رفع‬ ‫به‬ ‫برچسب‬ ‫در‬ ‫ابهامات‬‫‏‬‫گذاری‬‫‏‬‫ها‬‫م‬ ‫پرداخته‬‫ی‬‫‏‬،‫شود‬‫ا‬ ‫مجموعه‬‫ی‬‫ن‬‫قوان‬‫ی‬‫ن‬‫ی‬‫ا‬‫به‬ ‫شده‬ ‫داده‬ ‫مدل‬ ‫به‬ ‫آموزش‬ ‫صورت‬‫‏‬‫اند‬‫ی‬‫ا‬‫به‬‫‏‬‫صورت‬‫دستی‬‫مع‬‫ی‬‫ن‬‫گرد‬‫ی‬‫ده‬.‫است‬ ‫س‬‫ی‬‫ستم‬‫‏‬‫های‬‫مخف‬ ‫مدل‬ ،‫محور‬ ‫حافظه‬‫ی‬‫مار‬‫تخم‬ ‫روش‬ ‫و‬ ‫کوف‬‫ی‬‫ن‬‫احتمال‬ ‫ب‬‫ی‬‫ش‬‫ی‬‫نه‬‫نمونه‬‫‏‬‫هایی‬‫روش‬ ‫از‬‫‏‬‫های‬‫برچسب‬‫‏‬‫گذاری‬‫برا‬ .‫هستند‬‫ی‬[ ‫در‬ ‫مثال‬94] ‫برچسب‬‫‏‬‫زنی‬‫فارس‬ ‫کلمات‬‫ی‬‫مخف‬ ‫مدل‬ ‫از‬ ‫استفاده‬ ‫با‬‫ی‬‫معرف‬ ‫مارکوف‬‫ی‬ ‫شده‬.‫است‬ ‫مقاله‬ ‫در‬[94]‫پیش‬‫از‬ ‫استفاده‬ ‫با‬ ‫توییتر‬ ‫متنی‬ ‫اطالعات‬ ‫پردازش‬‫چارچوب‬ ‫هدوپ‬0 ‫کاهش‬ ‫نگاشت‬ ‫و‬6 .‫است‬ ‫پذیرفته‬ ‫صورت‬ 4.2.‫ویژگی‬ ‫انتخاب‬ ‫نظرات‬‫ی‬‫در‬ ‫کاربران‬ ‫که‬‫ی‬‫ک‬‫اجتماع‬ ‫شبکه‬‫ی‬‫و‬‫ی‬‫ا‬‫در‬‫ی‬‫ک‬‫ا‬ ‫فروشگاه‬‫ی‬‫نترنت‬‫ی‬ ‫به‬ ‫راجع‬‫ی‬‫ک‬‫م‬ ‫محصول‬‫ی‬‫‏‬‫دهند‬‫منف‬ ،‫مثبت‬ ‫است‬ ‫ممکن‬‫ی‬‫و‬‫ی‬‫ا‬‫خنث‬‫ی‬.‫باشد‬ ‫ا‬‫ی‬‫ن‬‫قطب‬‫ی‬‫ت‬‫به‬‫ی‬‫ک‬‫و‬‫ی‬‫ژگ‬‫ی‬‫ی‬‫ا‬‫ج‬‫از‬ ‫نبه‬‫ی‬‫ک‬‫محصول‬‫ی‬‫ا‬‫نسبت‬ ‫موضوع‬ ‫م‬ ‫داده‬‫ی‬‫‏‬‫شود‬‫برا‬ .‫ی‬‫کاربر‬ ‫مثال‬‫ی‬‫اجتماع‬ ‫شبکه‬ ‫در‬‫ی‬‫م‬‫ی‬‫‏‬‫نوی‬‫سد‬"!‫دوستان‬ ‫گوش‬ ‫امروز‬‫ی‬‫موبا‬‫ی‬‫ل‬‫جد‬‫ی‬‫د‬‫خر‬‫ی‬‫دم‬‫ک‬‫ی‬‫ف‬‫ی‬‫ت‬‫نما‬ ‫صفحه‬‫ی‬‫ش‬‫فوق‬‫‏‬‫العاده‬‫‏‬‫ای‬‫دارد‬ ‫آنتن‬ ‫اما‬‫‏‬‫دهی‬‫ن‬ ‫جالب‬ ‫آن‬‫ی‬‫ست‬."‫ا‬ ‫در‬‫ی‬‫ن‬‫بحث‬ ‫موضوع‬ ‫مثال‬"‫موبا‬‫ی‬‫ل‬"‫و‬ ‫است‬ ‫و‬‫ی‬‫ژگ‬‫ی‬‫ی‬‫ا‬‫جنبه‬‫‏‬‫های‬‫ا‬‫ی‬‫ن‬‫موضوع‬"‫صف‬‫نما‬ ‫حه‬‫ی‬‫ش‬"‫و‬"‫آنتن‬‫‏‬‫دهی‬".‫است‬ ‫تکنیک‬ ‫از‬ ‫یکی‬‫روش‬ ،‫متن‬ ‫در‬ ‫ویژگی‬ ‫کشف‬ ‫در‬ ‫پرکاربرد‬ ‫های‬‫اطالعات‬ ‫متقابل‬7 ‫است‬‫روش‬ ‫از‬ ‫یکی‬ ‫که‬‫های‬‫در‬ ‫ویژگی‬ ‫کردن‬ ‫پیدا‬ ‫آماری‬‫جمله‬ ‫یا‬ ‫سند‬ 5 Hadoop 6 Map-Reduce 7 Mutual Information
  • 5.
    ‫مقاله‬ ‫عنوان‬ ‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ 0 ‫کلمه‬ ‫هر‬ ‫برای‬ ،‫است‬x‫سند‬ ‫هر‬ ‫در‬y‫بیش‬ ‫و‬ ‫شده‬ ‫محاسبه‬ ‫مقدار‬‫یا‬ ‫ترین‬ ‫اطالعات‬ ‫عنوان‬ ‫به‬ ،‫مقادیر‬ ‫آن‬ ‫میانگین‬‫باالترین‬ ‫و‬ ‫شده‬ ‫منظور‬ ‫کلمه‬ ‫آن‬ ‫مقابل‬ ‫آن‬‫می‬ ‫انتخاب‬ ‫ویژگی‬ ‫عنوان‬ ‫به‬ ‫ها‬‫چنان‬ ‫گردد‬‫چه‬x‫و‬y،‫باشند‬ ‫مستقل‬ ‫هم‬ ‫از‬ ‫ضابطه‬ ‫مقدار‬(9)‫می‬ ‫صفر‬ ‫را‬‫کند‬. ‫روش‬ ‫البته‬‫دیگری‬ ‫زیاد‬ ‫های‬‫همانند‬ ‫متعدد‬ ‫مقاالت‬ ‫در‬‫نما‬‫ی‬‫ه‬‫ساز‬‫ی‬‫معنا‬‫یی‬ ‫پنهان‬ 8 [90]‫مارکوف‬ ‫مخفی‬ ‫مدل‬ ،[96]،‫تخص‬‫ی‬‫ص‬‫د‬‫ی‬‫ر‬‫ی‬‫کله‬‫پنهان‬ 9 [97]، ‫بیش‬‫آنتروپی‬ ‫ترین‬... ‫و‬.‫است‬ ‫شده‬ ‫معرفی‬ 4.3.‫طبقه‬‫بندی‬‫کننده‬10 ‫اصل‬ ‫پردازش‬‫ی‬‫تع‬ ‫جهت‬‫یی‬‫ن‬‫قطب‬‫ی‬‫ت‬‫ی‬‫ک‬‫جمله‬‫ی‬‫ا‬‫ی‬‫ک‬‫ا‬ ‫در‬ ‫سند‬‫ی‬‫ن‬‫مرحله‬ ‫م‬ ‫صورت‬‫ی‬‫پذی‬،‫رد‬‫اصل‬ ‫هدف‬‫ی‬‫ا‬‫ی‬‫ن‬‫طبقه‬ ‫بخش‬‫بند‬‫ی‬‫ی‬‫ک‬‫جمله‬‫ی‬‫ا‬‫ی‬‫ک‬‫سند‬ ‫بر‬‫قطب‬ ‫اساس‬‫ی‬‫ت‬‫حل‬ ‫راه‬ .‫است‬ ‫آن‬‫کل‬ ‫دسته‬ ‫دو‬ ‫به‬ ‫ها‬‫ی‬‫مبتن‬‫ی‬‫بر‬‫ی‬‫ادگ‬‫ی‬‫ر‬‫ی‬ ‫ماش‬‫ی‬‫ن‬‫واژه‬ ‫و‬‫نامه‬‫تقسی‬‫م‬‫م‬‫ی‬‫شود‬‫دق‬ ‫ابزارها‬ .‫ی‬ً‫ا‬‫ق‬‫عمل‬ ‫همان‬‫ی‬‫م‬ ‫انجام‬ ‫را‬‫ی‬‫دهند‬ ‫طبقه‬ ‫که‬‫بند‬‫ی‬‫کننده‬‫ها‬‫کاربردها‬ ‫در‬‫ی‬‫سنت‬‫ی‬‫متن‬‫کاوی‬‫آن‬ ‫در‬ ،‫دارند‬‫جا‬‫ی‬‫ک‬ ‫طبقه‬ ‫از‬ ‫پس‬ ‫سند‬‫ب‬‫ندی‬‫م‬‫ی‬‫توانست‬‫دسته‬ ‫به‬‫های‬‫س‬ ‫همانند‬ ‫مختلف‬‫ی‬‫اس‬‫ی‬، ‫ورزشی‬،‫علم‬‫ی‬‫طبقه‬ ‫در‬ ‫اما‬ ‫گردد‬ ‫اضافه‬ ... ‫و‬‫بند‬‫ی‬‫کننده‬‫عقاید‬‫ا‬ ً‫ال‬‫معمو‬‫ی‬‫ن‬ ‫دسته‬‫ها‬‫به‬‫سه‬‫گروه‬،‫مثبت‬‫منفی‬‫خنث‬ ‫و‬‫ی‬‫تبد‬‫ی‬‫ل‬‫م‬‫ی‬.‫گردد‬ ‫در‬‫طبقه‬‫‏‬‫بندی‬‫مبتن‬‫ی‬‫پ‬ ‫از‬ ‫که‬ ‫واژگان‬ ‫بر‬‫ی‬‫کره‬‫‏‬‫های‬99 ‫و‬ ‫مختلف‬‫ی‬‫ا‬‫واژه‬‫نامه‬92 ‫م‬ ‫استفاده‬ ‫خاص‬‫ی‬‫‏‬‫شود‬،‫کل‬ ‫روال‬‫ی‬‫ا‬ ‫به‬‫ی‬‫ن‬‫برا‬ ‫که‬ ‫است‬ ‫شکل‬‫ی‬‫در‬ ‫کلمه‬ ‫هر‬ ‫ی‬‫ک‬‫اسام‬ ‫مانند‬ ‫جمله‬‫ی‬،‫افعال‬،‫صفات‬‫و‬‫قی‬‫ود‬‫واژگان‬ ‫شبکه‬ ‫در‬ ،‫موجود‬ ‫احساس‬‫ی‬‫م‬ ‫صورت‬ ‫جستجو‬‫ی‬‫گ‬‫ی‬‫رد‬‫صورت‬ ‫در‬ ‫و‬‫ی‬‫موجود‬ ‫شبکه‬ ‫در‬ ‫واژه‬ ‫آن‬ ‫که‬ ،‫باشد‬‫احساس‬ ‫برچسب‬‫ی‬‫م‬ ‫استخراج‬ ‫آن‬‫ی‬‫‏‬،‫شود‬‫قطب‬ ‫با‬ ‫متناسب‬ ‫واژه‬ ‫هر‬‫ی‬‫ت‬‫ی‬‫که‬ ‫شبکه‬ ‫از‬‫وزن‬ ،‫شده‬ ‫استخراج‬ ‫واژگان‬‫ی‬‫م‬‫ی‬‫گ‬‫ی‬،‫رد‬‫برا‬‫ی‬‫جمله‬ ‫هر‬‫‏‬‫ای‬‫در‬ ‫کاربر‬ ‫که‬ ‫اجتماع‬ ‫شبکه‬‫ی‬‫م‬‫ی‬‫نو‬‫ی‬‫سد‬‫وزن‬ ‫مجموع‬‫‏‬‫ها‬‫با‬‫توجه‬‫به‬‫قطبی‬‫ت‬‫محاسبه‬ ‫آن‬ ‫م‬‫ی‬‫‏‬،‫گردد‬‫عدد‬ ‫اگر‬‫ی‬‫بزرگ‬‫‏‬‫تر‬‫از‬‫صفر‬‫باشد‬‫آن‬‫جمله‬‫قطبی‬‫ت‬‫م‬ ‫مثبت‬‫ی‬‫‏‬‫گی‬‫رد‬‫و‬ ‫در‬‫غ‬‫ی‬‫ر‬‫ا‬‫ی‬‫ن‬‫‏‬‫صورت‬‫منف‬ ‫جمله‬‫ی‬‫م‬ ‫گرفته‬ ‫نظر‬ ‫در‬‫ی‬‫‏‬‫شود‬. ‫وجود‬‫ی‬‫ک‬‫واژه‬‫‏‬‫نام‬‫ه‬‫در‬‫ی‬‫ک‬‫س‬‫ی‬‫ستم‬‫تحل‬‫ی‬‫ل‬‫ضرور‬ ‫احساسات‬‫ی‬‫اما‬ ‫است‬ ‫کاف‬‫ی‬‫ن‬‫ی‬‫ست‬‫م‬ ً‫ا‬‫حتم‬ ‫و‬‫ی‬‫‏‬‫بای‬‫ست‬‫د‬ ‫کنار‬ ‫در‬‫ی‬‫گر‬‫روش‬‫‏‬‫های‬‫تکم‬‫ی‬‫ل‬‫به‬ ‫کننده‬‫کار‬ 8 Latent Semantic Indexing (LSI) 9 Latent Dirichlet Allocation (LDA) 10 Classifier 11 Corpus 12 Dictionary .‫شوند‬ ‫برده‬‫در‬‫شکل‬3‫روش‬ ‫انواع‬ ‫شده‬ ‫تالش‬‫‏‬‫های‬‫را‬‫ی‬‫ج‬‫ی‬‫طبقه‬ ‫در‬ ‫که‬‫بند‬‫ی‬ ‫عق‬‫ی‬‫ده‬‫نما‬ ‫دارد‬ ‫کاربرد‬ ‫متن‬ ‫در‬‫ی‬‫ش‬[ ‫شود‬ ‫داده‬91.] ‫شکل‬4-‫روش‬ ‫انواع‬‫ها‬‫ی‬‫طبقه‬‫بند‬‫ی‬ ‫ب‬‫یش‬‫تکنیک‬ ‫تر‬‫شکل‬ ‫های‬4‫پیاده‬ ‫توانایی‬‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫سازی‬ ‫کالن‬‫داده‬93 ‫مقیاس‬ ‫ابزارها‬ ‫این‬ ‫از‬ ‫استفاده‬ ‫دارند‬ ‫را‬‫پردازش‬ ‫سرعت‬ ‫و‬ ‫پذیری‬ ‫داده‬ ‫حجم‬ ‫در‬‫چشم‬ ‫شکل‬ ‫به‬ ‫را‬ ‫باال‬ ‫های‬‫می‬ ‫افزایش‬ ‫گیری‬.‫دهد‬ ‫در‬[98]‫فایل‬ ‫سیستم‬ ‫و‬ ‫هدوپ‬ ‫از‬ ‫استفاده‬ ‫با‬HDFS 94 ‫تکنیک‬ ،Naïve Bayes‫ع‬ ‫به‬‫طبقه‬ ‫نوان‬‫بندی‬‫سینما‬ ‫و‬ ‫فیلم‬ ‫مورد‬ ‫در‬ ‫کاربران‬ ‫نظرات‬ ‫کننده‬‫وب‬ ‫پیاده‬ ،‫آمازون‬ ‫سایت‬‫کتابخانه‬ ‫از‬ ‫استفاده‬ ‫بدون‬ ‫نویسندگان‬ .‫است‬ ‫شده‬ ‫سازی‬- ‫پیش‬ ‫های‬‫(همانند‬ ‫هدوپ‬ ‫فرض‬Mahout‫ماژول‬ ،)‫را‬ ‫خود‬ ‫نیاز‬ ‫مورد‬ ‫های‬ .‫نمودند‬ ‫طراحی‬ ‫مقیاس‬ ‫داد‬ ‫نشان‬ ‫نتایج‬‫طبقه‬ ‫پذیری‬‫بندی‬‫کننده‬NB‫بدون‬ ‫حتی‬‫داده‬ ‫پایگاه‬ ‫به‬‫می‬ ‫پیدا‬ ‫افزایش‬ ‫راحتی‬.‫کند‬ ‫دق‬‫حدود‬ ‫بررسی‬ ‫مورد‬ ‫حاالت‬ ‫تمامی‬ ‫در‬ ‫متوسط‬ ‫ت‬82‫اما‬ ‫بوده‬ ‫درصد‬ ‫هدوپ‬ ‫چارچوب‬ ‫از‬ ‫که‬ ‫مقاالتی‬ ‫دیگر‬ ‫همانند‬‫نموده‬ ‫استفاده‬‫صورت‬ ‫در‬ ،‫اند‬ ‫پیدا‬ ‫افزایش‬ ‫زیادی‬ ‫مقدار‬ ‫تا‬ ‫پردازش‬ ‫سرعت‬ ،‫ورودی‬ ‫اطالعات‬ ‫حجم‬ ‫افزایش‬ .‫کند‬ ‫می‬ ‫جدول‬ ‫در‬9‫ز‬ ‫مرتبه‬‫هر‬ ‫به‬ ‫نسبت‬ ‫پردازش‬ ‫مانی‬90‫بازبینی‬ ‫متن‬ ‫هزار‬ ‫که‬ ‫حالت‬ ‫اولین‬ ‫در‬ .‫است‬ ‫شده‬ ‫داده‬ ‫نمایش‬ ‫کاربران‬2‫قرار‬ ‫آن‬ ‫در‬ ‫بازبینی‬ ‫هزار‬ ‫داده‬ ‫مقدار‬ ‫زیرا‬ ‫ندارد‬ ‫مناسبی‬ ‫زمانی‬ ‫مرتبه‬ ‫سازی‬ ‫موازی‬ ‫است‬ ‫مشخص‬ ،‫دارد‬ ‫بالک‬ ‫هر‬ ‫حجم‬ ‫از‬ ‫ورودی‬HDFS‫کم‬‫به‬ ‫نزدیک‬ ‫و‬ ‫حجم‬ ‫افزایش‬ ‫با‬ ‫است‬ ‫تر‬ ‫بهینه‬ ‫مقدار‬HDFS‫چشم‬ ‫بهبود‬ ‫زمانی‬ ‫مرتبه‬‫می‬ ‫پیدا‬ ‫گیری‬‫کند‬. 13 Big data 14 Hadoop Distributed File System (9)
  • 6.
    ‫مقاله‬ ‫عنوان‬ ‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ 6 ‫جدول‬9–‫هر‬ )‫(ثانیه‬ ‫پردازش‬ ‫زمان‬9000‫کاربران‬ ‫بازبینی‬ ‫متن‬ ‫ورودی‬ ‫متن‬ ‫تعداد‬ ‫حجم‬ )‫(هزار‬ 220200400600800 / ‫ثانیه‬10‫متن‬ ‫هزار‬9/40090/4807/624/447/399/3 ‫ورودی‬ ‫متن‬ ‫تعداد‬ ‫حجم‬ )‫(هزار‬ 900092009400960098002000 / ‫ثانیه‬10‫متن‬ ‫هزار‬88/277/247/24/237/233/2 5.‫عقیده‬ ‫در‬ ‫داده‬ ‫کالن‬ ‫کاربرد‬‫کاوی‬ ‫عظیم‬ ‫حجم‬ ‫پردازش‬ ‫توانایی‬ ‫و‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬ ‫شدن‬ ‫گسترده‬ ‫از‬ ‫بعد‬ ‫اطالعات‬‫سازمان‬ ‫دیگر‬‫ها‬‫مجبور‬‫ن‬‫از‬ ‫بودند‬‫ی‬‫ک‬‫را‬ ‫َر‬‫ب‬‫ا‬‫ی‬‫انه‬‫و‬‫ی‬‫ا‬‫داده‬ ‫انباره‬‫ا‬‫ی‬ ‫کند‬ ‫استفاده‬‫واقع‬ ‫در‬‫پا‬ ‫ضعف‬‫ی‬‫گاه‬‫داده‬‫ها‬‫ی‬‫رابطه‬‫ا‬‫ی‬‫نگه‬ ‫در‬‫دار‬‫ی‬‫تجز‬ ‫و‬‫ی‬‫ه‬‫و‬ ‫تحل‬‫ی‬‫ل‬‫حجم‬‫عظ‬‫ی‬‫م‬‫ی‬‫داده‬ ‫از‬‫ها‬‫ی‬‫ن‬‫ی‬‫مه‬‫ساختار‬‫ی‬‫نما‬ ‫ساختار‬ ‫بدون‬ ‫و‬‫ی‬‫ان‬‫گشت‬ ‫کردن‬ ‫مطرح‬ ‫با‬ ‫دانشمندان‬ ‫و‬‫مفهوم‬‫جد‬‫ی‬‫د‬‫ی‬‫نام‬ ‫به‬NoSQL 90 ‫به‬ ‫اقدام‬ ‫جد‬ ‫نسل‬ ‫ساخت‬‫ی‬‫د‬‫ی‬‫پا‬ ‫از‬‫ی‬‫گاه‬‫ها‬‫ی‬‫داده‬‫ا‬‫ی‬‫م‬ ‫که‬‫ی‬‫تواند‬‫عظ‬ ‫حجم‬‫ی‬‫م‬‫ی‬‫از‬ ‫را‬ ‫اطالعات‬‫زیر‬ ‫یک‬ ‫در‬‫سا‬‫ابری‬ ‫خت‬‫نگ‬‫هد‬‫ار‬‫ی‬‫نمودند‬ ،‫کند‬ ‫پردازش‬ ‫و‬[91]. ‫بیش‬‫الگوریتم‬ ‫تر‬‫طبقه‬ ‫های‬‫می‬ ‫بندی‬‫با‬ ‫و‬ ‫موازی‬ ‫شکل‬ ‫به‬ ‫تواند‬‫از‬ ‫استفاده‬ ‫پیاده‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬‫شود‬ ‫سازی‬[98,20]. ‫کال‬ ‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫مزایای‬ ‫از‬ ‫مورد‬ ‫چند‬ ‫به‬ ‫فقط‬ ‫ادامه‬ ‫در‬‫در‬ ‫داده‬ ‫ن‬ ‫عقیده‬.‫شد‬ ‫خواهد‬ ‫اشاره‬ ‫کاوی‬ ‫پ‬ ‫مراحل‬ ‫از‬ ‫یک‬ ‫هر‬‫ها‬ ‫داده‬ ‫پردازش‬ ‫و‬ ‫پردازش‬ ‫یش‬‫به‬ ‫تواند‬ ‫می‬ ‫مرتبط‬ ‫ابزارهای‬ ‫روی‬ ‫بر‬ ‫موازی‬ ‫شکل‬‫از‬ ‫استفاده‬ ‫همانند‬‫چارچوب‬ ‫نگاشت‬–‫شود‬ ‫سازی‬ ‫پیاده‬ ‫کاهش‬‫مثال‬ ‫برای‬ ،‫در‬[94]‫از‬ ‫استفاده‬ ‫با‬ ‫داده‬ ‫در‬ ،‫نمودند‬ ‫ثابت‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬‫سرعت‬ ‫حجیم‬ ‫های‬ ‫در‬ ‫دستورات‬ ‫اجرای‬‫هدوپ‬‫از‬ ‫بیشتر‬‫مدل‬ ‫دیگر‬‫مرسوم‬ ‫های‬‫است‬ ‫شکل‬ ‫(در‬0). ‫شکل‬5-‫دوحالت‬ ‫در‬ ‫کلمه‬ ‫شمارش‬ ‫زمان‬ ‫میزان‬‫بررسی‬ ‫مورد‬ 15 Not Only SQL ‫پیاده‬ ‫قصد‬ ‫شرکت‬ ‫یک‬ ‫اگر‬‫عقیده‬ ‫سیستم‬ ‫یک‬ ‫اجرایی‬ ‫و‬ ‫سازی‬‫کاوی‬ ‫داشته‬‫از‬ ‫استفاده‬ ‫با‬ ‫اما‬ ‫کند‬ ‫صرف‬ ‫باید‬ ‫را‬ ‫زیادی‬ ‫هزینه‬ ‫باشد‬ ‫می‬ ‫ابر‬ ‫بستر‬ ‫در‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬‫هز‬ ‫تواند‬‫حد‬ ‫تا‬ ‫را‬ ‫خود‬ ‫ینه‬ ‫شرکت‬ ‫از‬ ‫بسیاری‬ ،‫دهد‬ ‫کاهش‬ ‫زیادی‬‫خدمات‬ ‫این‬ ‫دارند‬ ‫وجود‬ ‫ها‬ ‫نرم‬ ‫درقالب‬ ‫را‬‫اف‬‫سرویس‬ ‫عنوان‬ ‫به‬ ‫زار‬96 ‫می‬ ‫ارایه‬.‫دهند‬ ‫داده‬ ‫از‬ ‫حجمی‬ ‫هر‬ ‫اندازه‬ ‫به‬ ‫پذیری‬ ‫مقیاس‬ ‫داده‬ ‫پردازش‬ ‫توانایی‬‫ه‬‫لحظه‬ ‫خروجی‬ ‫ایجاد‬ ‫و‬ ‫بالدرنگ‬ ‫صورت‬ ‫به‬ ‫ا‬ ً‫ا‬‫خصوص‬ ‫توانایی‬ ‫این‬ ، ‫ای‬‫زمان‬ ‫یک‬ ‫به‬ ‫وابسته‬ ‫که‬ ‫کاربردهایی‬ ‫در‬ ‫است‬ ‫کاربردی‬ ‫بسیار‬ ،‫نتیجه‬ ‫یک‬ ‫بینی‬ ‫پیش‬ ‫مانند‬ ‫است‬ ‫خاص‬[29]. 6.‫نتیجه‬‫آینده‬ ‫کارهای‬ ‫و‬ ‫گیری‬ ‫ا‬ ‫در‬‫ی‬‫ن‬‫آخر‬ ‫مقاله‬‫ی‬‫ن‬‫و‬ ‫دستاوردها‬‫پژوهش‬‫ها‬‫در‬‫حوزه‬‫تحلی‬‫ل‬‫احساسات‬ ‫داده‬ ‫کالن‬ ‫ابزارهای‬ ‫از‬ ‫استفاده‬ ‫با‬‫توجه‬ ‫با‬ ‫و‬ ‫گرفت‬ ‫قرار‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬ ‫مورد‬ ‫ابزارها‬ ‫این‬ ‫از‬ ‫استفاده‬ ،‫شد‬ ‫مشخص‬ ‫بررسی‬ ‫مورد‬ ‫مقاالت‬ ‫از‬ ‫حاصله‬ ‫نتایج‬ ‫به‬ ‫داده‬ ‫حجم‬ ‫که‬ ‫است‬ ‫کاربردی‬ ‫و‬ ‫بهینه‬ ً‫ال‬‫کام‬ ‫صورتی‬ ‫در‬‫و‬ ‫باشد‬ ‫زیاد‬ ‫بسیار‬ ‫ها‬ ‫ابزارها‬ ‫دیگر‬ ‫به‬ ‫نسبت‬ ‫نتایج‬ ‫کم‬ ‫داده‬ ‫حجم‬ ‫با‬ ‫محاسبات‬ ‫انجام‬ ‫حالت‬ ‫این‬ ‫در‬ ‫ضعیف‬‫است‬ ‫تر‬. ‫به‬‫زمینه‬ ‫عنوان‬‫بیش‬ ‫پژوهش‬ ‫جای‬ ‫زیر‬ ‫عناوین‬ ‫مناسب‬ ‫تحقیقاتی‬ ‫های‬‫تری‬ .‫داشت‬ ‫خواهد‬ ‫حوزه‬ ‫این‬ ‫در‬ ‫فعاالن‬ ‫توسط‬ ‫آینده‬ ‫در‬ ‫کاربرد‬ ‫و‬ ‫گسترش‬ ‫با‬‫ی‬‫‏‬‫تر‬‫ابزارها‬ ‫شدن‬‫ی‬‫مد‬‫ی‬‫ر‬‫ی‬‫ت‬‫کالن‬‫داده‬‫دن‬ ‫در‬‫ی‬،‫ا‬ ‫م‬‫ی‬‫‏‬‫توان‬‫بس‬‫ی‬‫ار‬‫ی‬‫روش‬ ‫از‬‫‏‬‫های‬‫تشخ‬‫ی‬‫ص‬‫احساسات‬‫عقاید‬ ‫و‬‫زبان‬ ‫در‬ ‫فارس‬‫ی‬‫را‬‫از‬ ‫استفاده‬ ‫با‬‫ابزار‬‫ها‬‫ی‬‫مانند‬ ‫آن‬ ‫خاص‬‫هدوپ‬ ‫چارچوب‬ ‫پیاده‬‫سازی‬.‫نمود‬ ‫ی‬‫ک‬‫ی‬‫روش‬ ‫از‬‫‏‬‫های‬‫آمار‬‫ی‬‫برا‬‫ی‬‫مدل‬‫‏‬‫سازی‬‫مدل‬ ‫از‬ ‫استفاده‬ ‫کلمات‬ n-gram‫م‬ .‫است‬‫ی‬‫‏‬‫توان‬‫برا‬‫ی‬‫مق‬ ‫بردن‬ ‫باال‬‫ی‬‫اس‬‫‏‬‫پذی‬‫ر‬‫ی‬‫اجرا‬ ‫و‬‫ی‬ ‫مواز‬‫ی‬،‫ی‬‫ک‬‫ی‬‫روش‬ ‫از‬‫‏‬‫های‬‫آن‬‫نگاشت‬ ‫چارچوب‬ ‫در‬ ‫را‬-‫کاهش‬ ‫پ‬‫ی‬‫اده‬‫‏‬‫سازی‬‫نمود‬[22]. ‫م‬‫ی‬‫‏‬‫توان‬‫تحق‬ ‫با‬‫ی‬‫ق‬‫رو‬ ‫بر‬‫ی‬‫داده‬ ‫ساختار‬‫‏‬‫های‬‫مبتن‬‫ی‬‫واژه‬ ‫بر‬‫‏‬،‫نامه‬‫زمان‬ ‫جستجو‬‫در‬‫آن‬‫را‬‫کاهش‬‫داد‬‫ی‬‫ک‬‫ی‬‫ا‬ ‫از‬‫ی‬‫ن‬‫راه‬‫‏‬‫کارها‬‫می‬‫‏‬‫تواند‬‫پ‬‫ی‬‫اده‬‫‏‬ ‫سازی‬‫پا‬ ‫در‬‫ی‬‫گاه‬‫داده‬‫‏‬‫های‬NoSql.‫باشد‬ ‫سیستم‬ ‫یک‬ ‫در‬ ‫پردازش‬ ‫از‬ ‫بعد‬ ‫اطالعات‬ ‫سازی‬ ‫بصری‬ ‫چگونگی‬ ‫چ‬ ‫همواره‬ ‫داده‬ ‫کالن‬‫بیش‬ ‫پژوهش‬ ‫جای‬ ‫و‬ ‫بوده‬ ‫الشی‬.‫دارد‬ ‫تری‬ 16 Software as a Service
  • 7.
    ‫مقاله‬ ‫عنوان‬ ‫هفتمین‬‫کنفرانس‬‫مهندسی‬‫برق‬‫ایران‬ ‫الکترونیک‬‫و‬–9314‫گناباد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ 7 ‫نگاشت‬ ‫چارچوب‬ ‫در‬-‫در‬ ‫الگوریتم‬ ‫یک‬ ‫که‬ ‫زمانی‬ ‫کاهش‬‫محیط‬ ‫می‬ ‫اجرا‬ ‫ابری‬‫گره‬ ‫بین‬ ‫را‬ ‫کار‬ ‫دارد‬ ‫وظیفه‬ ‫نگاشت‬ ‫تابع‬ ‫شود‬‫های‬ ‫بخش‬ ‫به‬ ‫کار‬ ‫تقسیم‬ .‫کند‬ ‫تقسیم‬ ‫کارگر‬‫و‬ ‫آسان‬ ‫همیشه‬ ‫مساوی‬ ‫های‬ ‫هر‬ ،‫باشد‬ ‫قواعد‬ ‫استخراج‬ ‫هدف‬ ‫اگر‬ ‫مثال‬ ‫عنوان‬ ‫به‬ .‫نیست‬ ‫راحت‬ ‫بیش‬ ‫تقسیمات‬ ‫تعداد‬ ‫چه‬‫مشکل‬ ‫قاعده‬ ‫استخراج‬ ‫شود‬ ‫تر‬‫خواهد‬ ‫تر‬ ‫نگاشت‬ ‫از‬ ‫مناسبی‬ ‫تعداد‬ ‫تعیین‬ ‫بنابراین‬ .‫بود‬‫گره‬ ‫تعداد‬ ‫یا‬ ‫ها‬‫یکی‬ ‫ها‬ ‫زمینه‬ ‫از‬‫می‬ ‫تحقیقاتی‬ ‫های‬.‫باشد‬ ‫تواند‬ ‫منابع‬ [1] Statista. Facebook number of monthly active users worldwide 2015; Available from: http://www.statista.com/statistics/264810/number-of-monthly- active-facebook-users-worldwide/. [2] GEOFF. Just One Minute On Facebook JUNE 11, 2014; Available from: http//:wersm.com/just-one-minute-on- facebook-infographic/. [3] Adedoyin-Olowe, M.M.G., Mohamed; Stahl, Frederic, A Survey of Data Mining Techniques for Social Media Analysis. eprint arXiv, 2014. 1312.4617. [4] Liu, B. and L. Zhang, A Survey of Opinion Mining and Sentiment Analysis, in Mining Text Data, C.C. Aggarwal and C. Zhai, Editors. 2012, Springer US. p. 415-463. [5] Carbonell, J.G., Subjective Understanding: Computer Models of Belief Systems, in PhD thesis. 1979. [6] Nasukawa, T. and J. Yi, Sentiment analysis‫:‏‬capturing favorability using natural language processing, in Proceedings of the 2nd international conference on Knowledge capture. 2003, ACM: Sanibel Island, FL, USA. p. 70-77. [7] Dave, K., S. Lawrence, and D.M. Pennock, Mining the peanut gallery: opinion extraction and semantic classification of product reviews, in Proceedings of the 12th international conference on World Wide Web. 2003, ACM: Budapest, Hungary. p. 519-528. [8] Mohammad Ehsan Basiri* , A.R.n., Nasser Ghassem-Aghaee A Framework for Sentiment Analysis in Persian. Open Transactions on Information Processing, 2014. 1(3): p. 1-14. [9] Kherwa, P., et al. An approach towards comprehensive sentimental data analysis and opinion mining. in Advance Computing Conference (IACC), 2014 IEEE International ‫.‏‬4102. [01]‫‏‬،‫محمدی‬ ‫مجید‬ ‫و‬ ‫نفس‬ ‫نیک‬ ‫اکبر‬ ‫علی‬ ‫سمیه؛‬ ،‫زرندی‬ ‫برهانی‬9312‫نقد‬ ‫در‬ ‫کاوی‬ ‫عقیده‬ ، ،‫احساسی‬ ‫واژگان‬ ‫شبکه‬ ‫از‬ ‫استفاده‬ ‫با‬ ‫کاال‬‫کنفرا‬ ‫دومین‬‫سیستم‬ ‫و‬ ‫صنایع‬ ‫مهندسی‬ ‫ملی‬ ‫نس‬ ،‫صنایع‬ ‫مهندسی‬ ‫گروه‬ ،‫آباد‬ ‫نجف‬ ‫واحد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ،‫آباد‬ ‫نجف‬ ،‫ها‬ http://www.civilica.com/Paper-NIESC02-NIESC02_082.html‫‏‬ [11] Lewis, R. US Election 2012: Twitter is big winner as Obama is re- elected for second term. Wed, Nov 7, 2012 ‫‏‏‬[ cited 2015; Available from: https://uk.news.yahoo.com/us-election-2012--twitter-is-big- winner-as-obama-is-re-elected-for-second-term- 07112012.html#3DCuuBb. [12] S. Chandrasekar, E.C., and A. Ginet, Predicting the US Presidential Election using Twitter data, in CS 229 Machine Learning Project report. 2012: Stanford University. [13] Collins, S., et al., Are You Satisfied with Life?: Predicting Satisfaction with Life from Facebook, in Social Computing, Behavioral-Cultural Modeling, and Prediction, N. Agarwal, K. Xu, and N. Osgood, Editors. 2015, Springer International Publishing. p. 24-33. [14] Amalarethinam, V.J.N.a.D.I.G., Parallel Implementation of Big Data Pre-Processing Algorithms for Sentiment Analysis of Social Networking Data. Intern. J. Fuzzy Mathematical Archive, 2015. 6(2): p. 149-159. [15] Poshyvanyk, D., et al. Combining Probabilistic Ranking and Latent Semantic Indexing for Feature Identification. in Program Comprehension, 2006. ICPC 2006. 14th IEEE International Conference on. 2006. [16] Rustamov, S., E. Mustafayev, and M.A. Clements. Sentiment analysis using Neuro-Fuzzy and Hidden Markov models of text. in Southeastcon, 2013 Proceedings of IEEE. 2013. [17] Shams, M., A. Shakery, and H. Faili. A non-parametric LDA- based induction method for sentiment analysis. in Artificial Intelligence and Signal Processing (AISP), 2012 16th CSI International Symposium on. 2012. [18] Bingwei, L., et al. Scalable sentiment classification for Big Data analysis using Naïve Bayes Classifier. in Big Data, 2013‫‏‬ IEEE International Conference on. 2013. [19] ،‫خادمی‬ ‫مریم‬ ‫و‬ ‫حامد‬ ،‫وامرزانی‬ ‫عزیزی‬9313‫های‬ ‫چالش‬ ‫و‬ ‫کاربردها‬ ،‫داده‬ ‫کالن‬ ، ،‫آن‬ ‫مرکز‬ ،‫تهران‬ ،‫پایه‬ ‫و‬ ‫مهندسی‬ ‫علوم‬ ‫در‬ ‫نوین‬ ‫دستاوردهای‬ ‫الکترونیکی‬ ‫ملی‬ ‫همایش‬ ،‫کاو‬ ‫زمین‬ ‫پژوهشهای‬‫‏‬ http://www.civilica.com/Paper-AEBSCONF01- AEBSCONF01_114.html [20] Li, B. and K.C.C. Chan. A Fuzzy Logic Approach for Opinion Mining on Large Scale Twitter Data. in Utility and Cloud Computing (UCC), 2014 IEEE/ACM 7th International Conference on. 2014. [21] Rahnama, A.H.A., Distributed Real-Time Sentiment Analysis for Big Data Social Streams. 2014. [22] Allam, T.M., A.A. Sallam, and H.M. Abdullkader. Managed N- gram language model based on Hadoop framework and a Hbase tables. in Informatics and Systems (INFOS), 2014 9th International Conference on. 2014.