SlideShare a Scribd company logo
1 of 8
‫بررسی‬‫بورس‬ ‫در‬ ‫آن‬ ‫کاربرد‬ ‫و‬ ‫زمانی‬ ‫های‬ ‫سری‬ ‫در‬ ‫کاوی‬ ‫داده‬
‫میرمحمد‬ ‫محمد‬ ‫سید‬،‫ارشد‬ ‫کارشناسی‬ ‫مقطع‬‫تهران‬ ‫واحد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬
‫جنوب‬،‫تهران‬ ‫استان‬ ،m.mirmohamad@gmail.com
:‫چکیده‬
‫مشاهدات‬ ‫از‬ ‫ای‬ ‫مجموعه‬ ،‫زمانی‬ ‫سری‬ ‫یک‬‫می‬ ‫اتفاق‬ ‫زمان‬ ‫ترتیب‬ ‫به‬ ‫که‬ ‫است‬ ‫ی‬.‫افتند‬
‫بعبارتی‬‫سری‬‫داده‬ ‫از‬ ‫ای‬ ‫دنباله‬ ‫زمانی‬ ‫های‬.‫است‬ ‫زمان‬ ‫به‬ ‫وابسته‬ ‫که‬ ‫هستند‬ ‫هایی‬
،‫هوا‬ ‫روزانه‬ ‫دمای‬ ‫مانند‬‫قیمت‬ ‫و‬ ‫فروشگاه‬ ‫یک‬ ‫هفتگی‬ ‫فروش‬ ‫کل‬‫صندوق‬ ‫و‬ ‫سهام‬ ‫های‬‫های‬
‫سرمایه‬.‫مشترک‬ ‫گذاری‬‫خصوصیت‬‫داده‬ ‫زیاد‬ ‫حجم‬ ،‫زمانی‬ ‫سری‬ ‫یک‬‫زی‬ ‫ابعاد‬ ،‫ها‬‫ضرورت‬ ‫و‬ ‫اد‬
‫ما‬ ‫دارای‬ ‫طرفی‬ ‫از‬ ‫و‬ ‫است‬ ‫مداوم‬ ‫رسانی‬ ‫بروز‬.‫باشد‬ ‫می‬ ‫پیوسته‬ ‫و‬ ‫عددی‬ ‫هیتی‬‫افزایش‬
‫داده‬ ‫از‬ ‫استفاده‬‫د‬ ‫خاص‬ ‫بطور‬ ‫و‬ ،‫زمانی‬ ‫های‬‫اده‬‫گسترده‬ ‫تحقیقات‬ ‫باعث‬ ،‫زمانی‬ ‫سری‬ ‫های‬
‫روی‬ ‫بر‬ ‫کاوی‬ ‫داده‬ ‫فیلد‬ ‫در‬‫آنها‬‫است‬ ‫شده‬.‫که‬ ‫است‬ ‫روشی‬ ‫زمانی‬ ‫سری‬ ‫بینی‬ ‫پیش‬ ‫مدل‬
‫پ‬ ‫برای‬ ‫قبلی‬ ‫شده‬ ‫مشاهده‬ ‫مقادیر‬ ‫از‬‫می‬ ‫استفاده‬ ‫مقادیر‬ ‫آینده‬ ‫بینی‬ ‫یش‬.‫کند‬
‫ما‬‫سری‬ ‫روی‬ ‫جامعی‬ ‫مرور‬ ‫مقاله‬ ‫این‬ ‫در‬‫و‬ ‫داشت‬ ‫خواهیم‬ ‫زمانی‬ ‫های‬3‫جنبه‬‫مهم‬
‫سری‬‫یعنی‬ ‫زمانی‬ ‫های‬Representation،Indexing‫و‬Similarity measure‫می‬ ‫بررسی‬ ‫را‬‫سپس‬ .‫کنیم‬
‫روی‬ ‫مروری‬‫تکنیک‬‫کمک‬ ‫به‬ ‫انتها‬ ‫در‬ ‫و‬ ‫داشت‬ ‫خواهیم‬ ‫ها‬ ‫سری‬ ‫این‬ ‫روی‬ ‫کاوی‬ ‫داده‬ ‫های‬
‫رگرسیون‬‫سهامی‬ ‫بازار‬ ،.‫کرد‬ ‫خواهیم‬ ‫بررسی‬ ‫نمونه‬ ‫بطور‬ ‫را‬
:‫کلیدی‬ ‫کلمات‬
‫سری‬‫های‬،‫زمانی‬‫معیار‬‫شباهت‬,‫تحلیل‬‫زمانی‬،‫معیار‬‫فاصله‬,‫شاخص‬‫بندی‬‫داده‬,
‫کاوش‬‫داده‬
1-:‫مقدمه‬
‫س‬‫ری‬‫داده‬ ‫اشیا‬ ‫از‬ ‫مهمی‬ ‫کالس‬ ‫زمانی‬ ‫های‬
‫زم‬‫می‬ ‫سادگی‬ ‫به‬ ‫و‬ ‫هستند‬ ‫انی‬‫آنه‬ ‫توان‬‫ا‬
‫را‬‫پیدا‬ ‫علمی‬ ‫و‬ ‫مالی‬ ‫کاربردهای‬ ‫در‬
.‫کرد‬‫مثال‬ ‫بطور‬:
•‫قیمت‬ ‫مانند‬ ،‫اقتصاد‬ ‫در‬ ‫زمانی‬ ‫سری‬
‫صادرات‬ ،‫متوالی‬ ‫روزهای‬ ‫در‬ ‫سهام‬
‫درآمد‬ ‫متوسط‬ ،‫متوالی‬ ‫ماههای‬ ‫در‬
... ‫متوالی‬ ‫ماههای‬ ‫در‬
•‫علوم‬ ‫در‬ ‫بویژه‬ ،‫فیزیک‬ ‫زمانی‬ ‫سری‬
،‫دریایی‬ ‫علوم‬ ،‫جوی‬ ‫آثار‬ ‫به‬ ‫مربوط‬
.)‫فیزیک‬ ‫زمین(ژئو‬ ‫فیزیک‬
•‫سری‬‫زم‬ ‫های‬‫انی‬‫بازاریابی‬‫و‬ ‫تجزیه‬ ،
‫یا‬ ‫هفته‬ ‫در‬ ‫فروش‬ ‫ارقام‬ ‫تحلیل‬
‫مسئله‬ ‫یک‬ ‫متوالی‬ ‫ماههای‬‫مهم‬‫در‬
‫تجارت‬‫است‬.
•‫سری‬‫زمانی‬ ‫های‬‫جمعیت‬‫نگاری‬،
‫ساالنه‬ ‫گیری‬ ‫اندازه‬‫جمعیت‬‫با‬‫هدف‬
‫پیش‬‫بینی‬‫تغییرات‬‫جمعیت‬‫در‬‫مدت‬
‫زمان‬‫ده‬‫تا‬‫بیست‬‫سال‬‫آینده‬.
‫ه‬ ‫واقع‬ ‫در‬‫م‬‫می‬ ‫که‬ ‫انطور‬‫سری‬ ‫در‬ ‫بینید‬‫های‬
،‫زمانی‬‫زمان‬ ‫از‬ ‫توالی‬ ‫یک‬ ‫در‬ ‫ها‬ ‫داده‬
‫یا‬ ‫روزانه‬ ‫مثال‬ ،‫شوند‬ ‫می‬ ‫گیری‬ ‫اندازه‬
. ..‫و‬ ‫ساالنه‬ ‫یا‬ ‫هفتگی‬
‫مجموعه‬ ‫زمانی‬ ‫سری‬ ‫یک‬‫مشاهداتی‬ ‫از‬ ‫ای‬
‫و‬ ‫شود‬ ‫می‬ ‫ساخته‬ ‫زمان‬ ‫ترتیب‬ ‫به‬ ‫که‬ ‫است‬
‫و‬ ‫زیاد‬ ‫اطالعات،ابعاد‬ ‫باالی‬ ‫حجم‬ ‫دارای‬
‫طرفی‬ ‫از‬ ‫و‬ ‫است‬ ‫مداوم‬ ‫رسانی‬ ‫بروز‬ ‫ضرورت‬
‫پیوست‬ ‫و‬ ‫عددی‬ ‫ماهیتی‬ ‫دارای‬.‫باشد‬ ‫می‬ ‫ه‬
‫داده‬ ‫در‬ ‫بنابراین‬‫معیار‬ ،‫زمانی‬ ‫سری‬ ‫های‬
.‫است‬ ‫تخمین‬ ‫مبنای‬ ‫بر‬ ‫ها‬ ‫سری‬ ‫شباهت‬
‫موضوع‬ ‫در‬‫سری‬ ‫در‬ ‫کاوی‬ ‫داده‬‫زمانی‬ ‫های‬
‫داده‬ ‫چطور‬ ‫ما‬ ‫که‬ ‫اینست‬ ‫اصلی‬ ‫مشکل‬‫های‬
.‫دهیم‬ ‫نمایش‬ ‫را‬ ‫زمانی‬ ‫سری‬‫حجم‬ ‫با‬ ‫چون‬
‫داده‬ ‫از‬ ‫زیادی‬‫ه‬‫از‬ ‫زیادی‬ ‫ابعاد‬ ‫و‬ ‫ا‬
‫داده‬‫و‬ ‫سر‬ ‫ها‬‫لزوما‬ ‫و‬ ‫داریم‬ ‫کار‬‫تمام‬
‫داده‬ ‫این‬‫کار‬ ‫بدرد‬ ‫است‬ ‫ممکن‬ ‫ابعاد‬ ‫و‬ ‫ها‬
.‫نخورد‬ ‫ما‬‫رایج‬ ‫راهکارهای‬ ‫از‬ ‫یکی‬،
‫ابعاد‬ ‫با‬ ‫ای‬ ‫دامنه‬ ‫به‬ ‫زمانی‬ ‫سری‬ ‫تبدیل‬
‫از‬ ‫استفاده‬ ‫آن‬ ‫همراه‬ ‫به‬ ‫و‬ ‫کمتر‬‫شاخص‬
‫بندی‬.‫است‬ ‫مناسب‬‫ع‬‫معیار‬ ‫این‬ ‫بر‬ ‫الوه‬
‫سری‬ ‫بین‬ ‫شباهت‬‫زیرتوالی‬ ‫یا‬ ‫و‬ ‫زمانی‬ ‫های‬-
‫سری‬ ‫از‬ ‫ای‬‫و‬ ‫زمانی‬ ‫های‬segmentation‫یا‬
‫موضوع‬ ،‫زمانی‬ ‫سری‬ ‫بندی‬ ‫بخش‬‫ات‬‫مهم‬‫ی‬‫در‬
‫داده‬ ‫این‬ ‫روی‬ ‫کاوی‬ ‫داده‬ ‫بحث‬‫می‬ ‫ها‬
‫باش‬‫ن‬‫د‬.
‫ادامه‬ ‫در‬3‫داده‬ ‫مدیریت‬ ‫مهم‬ ‫جنبه‬‫های‬
‫یعنی‬ ‫زمانی‬ ‫سری‬Representation،Similarity
Measure‫و‬Indexing.‫کرد‬ ‫خواهیم‬ ‫بررسی‬ ‫را‬
‫تکنیک‬ ‫سپس‬‫داده‬ ‫این‬ ‫روی‬ ‫کاوی‬ ‫داده‬ ‫های‬-
‫می‬ ‫بررسی‬ ‫را‬ ‫ها‬‫یک‬ ‫انتها‬ ‫در‬ ‫و‬ .‫کنیم‬
‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫را‬ ‫نمونه‬ ‫سهام‬ ‫بازار‬
.‫داد‬ ‫خواهیم‬
2-‫سه‬‫مدیریت‬ ‫در‬ ‫مهم‬ ‫جنبه‬
‫د‬‫ا‬:‫زمانی‬ ‫سری‬ ‫های‬ ‫ده‬
1-2-Representation:‫چطور‬ ‫ما‬ ‫اینکه‬
‫زما‬ ‫سری‬ ‫یک‬ ‫اصلی‬ ‫خصوصیات‬‫نمایش‬ ‫را‬ ‫نی‬
‫تکنیک‬ ‫اینکه‬ ‫و‬ .‫دهیم‬‫های‬Representation
‫در‬ ‫دهند‬ ‫کاهش‬ ‫را‬ ‫ابعاد‬ ‫بتوانند‬ ‫باید‬
.‫شود‬ ‫حفظ‬ ‫سری‬ ‫اصلی‬ ‫خصوصیات‬ ‫حالیکه‬
2-2-Similarity Measure(‫شباهت‬ ‫معیار‬):
‫شباهت‬ ‫معیار‬ ‫توانیم‬ ‫می‬ ‫چطور‬ ‫اینکه‬‫را‬
‫کنیم‬ ‫تعریف‬ ‫ها‬ ‫سری‬ ‫برای‬‫تا‬‫بتوانیم‬
‫که‬ ‫کنیم‬ ‫مشخص‬‫هم‬ ‫با‬ ‫مختلف‬ ‫سری‬ ‫دو‬
‫دارند‬ ‫همخوانی‬‫نه‬ ‫یا‬‫چطور‬ ‫اینکه‬ .‫می‬
‫سری‬ ‫دو‬ ‫بین‬ ‫را‬ ‫حسی‬ ‫فاصله‬ ‫یک‬ ‫توانیم‬
‫پایه‬ ‫بر‬ ‫باید‬ ‫معیار‬ ‫این‬ .‫کنیم‬ ‫فرموله‬
‫مفاهیم‬‫سری‬ ‫بنابراین‬ ،‫باشد‬ ‫ادراکی‬‫هایی‬
‫لح‬ ‫از‬ ‫حتی‬ ‫که‬‫یکسان‬ ‫هم‬ ‫با‬ ‫ریاضی‬ ‫اظ‬
‫می‬ ،‫نیستند‬‫شبیه‬ ‫ادراکی‬ ‫لحاظ‬ ‫از‬ ‫توانند‬
.‫باشند‬ ‫بهم‬
3-2-Indexing:)‫بندی‬ ‫(شاخص‬‫اینکه‬
‫داده‬ ‫عظیم‬ ‫حجم‬ ‫روی‬ ‫بتوانیم‬ ‫چطور‬‫های‬
‫باال‬ ‫سرعت‬ ‫با‬ ‫را‬ ‫ها‬ ‫جو‬ ‫و‬ ‫پرس‬ ‫زمانی‬ ‫سری‬
‫مکانیزم‬ ‫چه‬ ‫دیگر‬ ‫بعبارت‬ .‫دهیم‬ ‫پاسخ‬
indexing‫تکنیک‬ .‫شود‬ ‫گرفته‬ ‫بکار‬ ‫باید‬ ‫ای‬
indexing‫فضای‬ ‫باید‬‫مینیمم‬‫ای‬‫و‬ ‫کند‬ ‫مصرف‬
‫امکان‬ ‫حد‬ ‫تا‬ ‫آن‬ ‫محاسباتی‬ ‫پیچیدگی‬
.‫باشد‬ ‫حداقل‬
‫از‬ ‫تری‬ ‫مفصل‬ ‫توضیح‬ ‫به‬ ‫ادامه‬ ‫در‬3‫جنبه‬
:‫پرداخت‬ ‫خواهیم‬ ‫باال‬
Time Series Data Representation -3:
‫داده‬ ،‫شد‬ ‫اشاره‬ ‫قبال‬ ‫که‬ ‫همانطور‬‫سری‬ ‫های‬
.‫هستند‬ ‫زیادی‬ ‫ابعاد‬ ‫دارای‬ ‫زمانی‬‫اگر‬
‫ندهیم‬ ‫کاهش‬ ‫را‬ ‫ابعاد‬ ‫حجم‬ ‫این‬،‫تعریف‬
‫الگوریتم‬‫داده‬ ‫روی‬ ‫که‬ ‫هایی‬‫سری‬ ‫خام‬ ‫های‬
‫هزینه‬ ‫پر‬ ‫بسیار‬ ‫کنند‬ ‫عمل‬ ‫زمانی‬ ‫های‬
‫دلیل‬ ‫مهمترین‬ .‫بود‬ ‫خواهد‬Time series
Representation‫یا‬ ‫ابعاد‬ ‫کاهش‬dimension reduction
.‫است‬‫تکنیک‬ ‫یک‬Representation‫باید‬‫شکلی‬
‫کاهش‬ ‫با‬ ‫را‬ ‫سری‬ ‫از‬dimension‫ها‬‫ابعاد‬ ‫یا‬
‫بدهد‬ ‫ما‬ ‫به‬‫و‬ ‫اصلی‬ ‫خصوصیات‬ ‫حالیکه‬ ‫در‬
‫شک‬‫ل‬‫است‬ ‫شده‬ ‫حفظ‬ ‫سری‬ ‫اصلی‬.
‫کامپیوتر‬ ‫علوم‬ ‫عمده‬ ‫مشکالت‬ ‫از‬ ‫یکی‬،
‫روش‬ ‫انتخاب‬Representation‫و‬ ‫مناسب‬‫کارآمد‬
‫داده‬ ‫برای‬.‫است‬ ‫زمانی‬ ‫سری‬ ‫های‬‫این‬ ‫با‬
‫دیدگاه‬،‫تکنینک‬‫برای‬ ‫مختلفی‬ ‫های‬
Representation‫سری‬‫آمده‬ ‫بوجود‬ ‫زمانی‬ ‫های‬
‫مثل‬ .‫است‬DFT،PAA،APCA‫که‬ .. ‫و‬‫در‬
‫ادامه‬‫تکنیک‬ ‫این‬ ‫از‬ ‫بعضی‬ ‫مورد‬ ‫در‬‫ها‬
.‫کرد‬ ‫خواهیم‬ ‫صحبت‬
‫بطورکلی‬‫تکنیک‬‫های‬Representation‫دو‬ ‫در‬
‫می‬ ‫قرار‬ ‫دسته‬:‫گیرند‬
1-Adaptive‫سری‬ ‫شکل‬ ‫آنها‬ ‫در‬ ‫که‬ :
‫از‬ ‫بعد‬ ‫جدید‬،‫ابعاد‬ ‫کاهش‬‫سازگار‬
.‫است‬ ‫اصلی‬ ‫سری‬ ‫با‬ ‫همشکل‬ ‫تقریبا‬ ‫و‬
2-Non-Adaptive‫که‬ :‫سری‬ ‫شکل‬ ‫آنها‬ ‫در‬
‫از‬ ‫بعد‬ ‫جدید‬‫لزوما‬ ،‫ابعاد‬ ‫کاهش‬
‫ممکن‬ ‫و‬ ‫نیست‬ ‫اصلی‬ ‫سری‬ ‫با‬ ‫سازگار‬
‫اصلی‬ ‫شکل‬ ‫با‬ ‫متفاوت‬ ‫کامال‬ ‫است‬
.‫باشد‬
‫شکل‬(1)‫تکنیک‬ ‫انواع‬ ‫از‬ ‫نمایی‬‫های‬
Representation‫می‬ ‫نشان‬ ‫را‬:‫دهد‬
(‫شکل‬1)
‫رایج‬ ‫از‬ ‫برخی‬ ‫بررسی‬ ‫به‬ ‫حال‬‫تکنیک‬ ‫ترین‬-
‫های‬Representation‫می‬:‫پردازیم‬
Sampling -1-3‫برداری‬ ‫نمونه‬ ‫یا‬:
‫د‬‫داده‬ ‫نقاط‬ ‫تعداد‬ ‫اگر‬ ‫تکنیک‬ ‫این‬ ‫ر‬‫ای‬
،‫سازند‬ ‫می‬ ‫را‬ ‫سری‬ ‫که‬m‫بگیرم‬ ‫نظر‬ ‫در‬
،n‫از‬ ‫بعد‬ ‫داده‬ ‫نقاط‬ ‫تعداد‬‫کاهش‬‫ابعاد‬
‫که‬ ‫است‬n<m‫صورت‬ ‫به‬ ‫نقاط‬ ‫این‬ .‫است‬
‫قرار‬ ‫و‬ ‫شوند‬ ‫می‬ ‫انتخاب‬ ‫سری‬ ‫از‬ ‫نمونه‬
.‫باشند‬ ‫نقاط‬ ‫کل‬ ‫نماینده‬ ‫است‬
‫متد‬ ‫یک‬ ‫متد‬ ‫این‬Non-Adaptive‫شکل‬ ‫و‬ ‫است‬
‫زمانیکه‬ ‫را‬ ‫اصلی‬ ‫سری‬n‫کوچک‬ ‫بسیار‬
‫باشد‬‫است‬ ‫ممکن‬ ‫و‬ ‫کند‬ ‫حفظ‬ ‫تواند‬ ‫نمی‬
.‫شود‬ ‫اصلی‬ ‫سری‬ ‫شکل‬ ‫از‬ ‫متفاوت‬
(‫شکل‬2)
-2-3(PAA) Piecewise Aggregate
Approximation:
‫به‬ ‫اصلی‬ ‫سری‬ ‫روش‬ ‫این‬ ‫در‬segment‫یا‬ ‫ها‬
‫بخش‬‫هر‬ ‫برای‬ ‫و‬ ‫شود‬ ‫می‬ ‫تقسیم‬ ‫مختلف‬ ‫های‬
segment‫و‬ ‫شود‬ ‫می‬ ‫محاسبه‬ ‫مقدار‬ ‫میانگین‬
‫یک‬ ‫عنوان‬ ‫به‬data point‫سری‬ ‫نمایش‬ ‫برای‬
‫جدید‬‫می‬ ‫گرفته‬ ‫نظر‬ ‫در‬.‫شود‬‫اگ‬‫سری‬ ‫طول‬ ‫ر‬
‫داده‬ ‫نقاط‬ ‫تعداد‬ ‫یا‬ ‫ما‬‫برابر‬ ‫ای‬m‫باشد‬
‫برابر‬ ‫ما‬ ‫سری‬P1=(p1…pm)‫از‬ ‫بعد‬ ‫که‬ ‫است‬
dimension reduction‫ابعاد‬ ‫کاهش‬ ‫یا‬‫به‬ ‫تبدیل‬
P2=(p1..pn)‫که‬ ‫شود‬ ‫می‬n<m‫و‬ ‫است‬‫کدام‬ ‫هر‬
‫محاسبه‬ ‫زیر‬ ‫فرمول‬ ‫از‬ ‫جدید‬ ‫سری‬ ‫نقاط‬ ‫از‬
‫می‬:‫شوند‬
‫آن‬ ‫در‬ ‫که‬𝑒𝑘‫انتهای‬ ‫نقطه‬ ‫مقدار‬ ‫برابر‬
‫بخش‬𝑘‫ام‬‫و‬𝑠𝑘‫ابتدای‬ ‫مقدار‬‫بخش‬𝑘‫ام‬
.‫است‬
(‫شکل‬3)
3-3-Adaptive Piecewise Constant
Approximation(APCA):
‫روش‬ ‫یافته‬ ‫تعمیم‬ ‫روش‬ ‫این‬PAA‫در‬ ‫و‬ ‫است‬
‫یک‬ ‫طول‬ ‫آن‬segment‫وبدین‬ ‫نیست‬ ‫ثابت‬
‫تواند‬ ‫می‬ ‫ترتیب‬adaptive‫سری‬ ‫اصلی‬ ‫باشکل‬
.‫باشد‬
(‫شکل‬4)
4-3-Piecewise Linear Approximation:
‫این‬ ‫به‬‫تکنیک‬Piecewise Linear Representation‫یا‬
PLR.‫شود‬ ‫می‬ ‫گفته‬ ‫هم‬
:‫دارد‬ ‫مختلف‬ ‫روش‬ ‫دو‬ ‫تکنیک‬ ‫این‬
1-linear interpolation
2-linear regression
Linear Interpolation -1-4-3:
‫توالی‬ ‫کنیم‬ ‫فرض‬ ‫اگر‬P = (p1 … pj)‫داشته‬ ‫را‬
‫خطی‬ ‫برابر‬ ‫تخمین‬ ‫خط‬ ‫روش‬ ‫این‬ ‫در‬ ،‫باشیم‬
‫که‬ ‫است‬𝑝1‫به‬ ‫را‬𝑝𝑗‫خط‬ ‫و‬ .‫کند‬ ‫می‬ ‫متصل‬
‫از‬ ‫بعدی‬ ‫تخمین‬𝑝𝑗.‫شد‬ ‫خواهد‬ ‫شروع‬PLR‫یک‬
‫الگوریتم‬bottom-up.‫است‬PLR‫تخمین‬ ‫یک‬ ‫با‬
‫شکلی‬ ‫به‬ ‫شود‬ ‫می‬ ‫آغاز‬ ‫زمانی‬ ‫سری‬ ‫از‬ ‫خوب‬
‫طول‬ ‫به‬ ‫سری‬ ‫تخمین‬ ‫برای‬ ‫که‬m،m/2،segment
‫جفت‬ ‫شونده‬ ‫تکرار‬ ‫بطور‬ ‫و‬ ‫است‬ ‫نیاز‬ ‫مورد‬
segment‫هستند‬ ‫ترین‬ ‫هزینه‬ ‫کم‬ ‫که‬ ‫هایی‬
‫ا‬ ‫و‬ ‫شوند‬ ‫می‬ ‫ادغام‬ ‫هم‬ ‫با‬‫تا‬ ‫موضوع‬ ‫ین‬
‫می‬ ‫پیدا‬ ‫ادامه‬ ‫زمانی‬‫تعداد‬ ‫که‬ ‫کند‬
segment.‫باشد‬ ‫نیاز‬ ‫مورد‬ ‫تعداد‬ ‫برابر‬ ‫ها‬
(‫شکل‬5)
(‫شکل‬6)
Linear Regression -2-4-3:
‫روش‬ ‫این‬،‫ر‬ ‫سری‬‫خطوط‬ ‫بهترین‬ ‫با‬ ‫ا‬‫اتصال‬
‫می‬ ‫نمایش‬‫که‬ ‫خطی‬ ‫بهترین‬ ‫بعبارتی‬ .‫دهد‬
‫سری‬ ‫از‬ ‫تقریبی‬ ‫و‬ ‫تخمین‬ ‫دهنده‬ ‫نشان‬
‫حفظ‬ ‫با‬ ‫ابعاد‬ ‫کاهش‬ ‫این‬ ‫بر‬ ‫عالوه‬ .‫است‬
.‫شود‬ ‫می‬ ‫انجام‬ ‫روش‬ ‫این‬ ‫در‬ ‫برجسته‬ ‫نقاط‬
‫برجسته‬ ‫نقاط‬ ‫این‬ ‫به‬PIP‫یا‬Perceptually
Important Points‫می‬ ‫گفته‬.‫شود‬
‫زمانی‬ ‫سری‬ ‫در‬𝑃‫با‬𝑛( ‫نقطه‬𝑃 =
(𝑝1 … 𝑝𝑛)‫پردازش‬ ‫فرآیند‬ ‫در‬ ‫نقاط‬ ،)PIP
‫جای‬ ،‫نقطه‬ ‫اهمیت‬ ‫به‬ ‫توجه‬ ‫با‬ ‫توانند‬ ‫می‬
.‫کنند‬ ‫عوض‬ ‫را‬ ‫خودشان‬
‫یعنی‬ ‫داده‬ ‫نقطه‬ ‫اولین‬𝑝1‫یعنی‬ ‫وآخرین‬
𝑝𝑛‫دومین‬ ‫و‬ ‫اولین‬PIP.‫هستند‬ ‫ها‬PIP
‫نقطه‬ ،‫بعدی‬‫را‬ ‫فاصله‬ ‫بیشترین‬ ‫که‬ ‫است‬ ‫ای‬
‫دو‬ ‫با‬PIP‫او‬‫چهارم‬ ‫نقطه‬ .‫باشد‬ ‫داشته‬ ‫ل‬
‫نقطه‬ ،‫با‬ ‫را‬ ‫فاصله‬ ‫بیشترین‬ ‫که‬ ‫است‬ ‫ای‬
‫دو‬ ‫که‬ ‫خطی‬PIP‫متصل‬ ‫بهم‬ ‫آنرا‬ ‫مجاور‬
.‫باشد‬ ‫داشته‬ ‫کرده‬‫اولین‬ ‫مابین‬ ‫همچنین‬
‫و‬‫دومین‬PIP.‫باشد‬‫موقعیت‬ ‫پردازش‬ ‫فرآیند‬
PIP‫تعداد‬ ‫زمانیکه‬ ‫تا‬PIP‫بدست‬ ‫نظر‬ ‫مورد‬
‫سری‬ ‫نقاط‬ ‫تمام‬ ‫یا‬ ‫و‬ ‫بیاید‬P‫لیست‬ ‫به‬
‫شده‬ ‫مرتب‬L‫پیدا‬ ‫ادامه‬ ،‫شوند‬ ‫الحاق‬
‫می‬.‫کند‬
( ‫شکل‬7)‫از‬ ‫نمایشی‬Linear Regression‫با‬7
PIP:‫باشد‬ ‫می‬
(‫شکل‬7)
‫تکنیک‬ ‫حال‬ ‫هر‬ ‫به‬‫بحث‬ ‫برای‬ ‫زیادی‬ ‫های‬
Representation‫حوصله‬ ‫از‬ ‫که‬ ‫است‬ ‫شده‬ ‫مطرح‬
‫معیار‬ ‫ادامه‬ ‫در‬ .‫است‬ ‫خارج‬ ‫مقاله‬ ‫این‬
.‫داد‬ ‫خواهیم‬ ‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫را‬ ‫شباهت‬
SimilarityMeasure -4:
‫شباهت‬ ‫معیار‬،‫بنیاد‬‫آنالیز‬ ‫برای‬ ‫مهمی‬
‫سری‬‫و‬ ‫گوناگون‬ ‫زمانی‬ ‫های‬‫ر‬‫وش‬‫های‬
.‫باشد‬ ‫می‬ ‫کاوی‬ ‫داده‬‫در‬‫داده‬ ‫پایگاه‬‫ه‬‫ا‬‫ی‬
‫مرسوم‬‫دقیق‬ ‫همخوانی‬ ،‫شباهت‬ ‫معیار‬ ،
‫اما‬ ‫است‬ ‫مقادیر‬‫در‬‫داده‬‫زمانی‬ ‫سری‬ ‫های‬
‫معیار‬ ،‫دارند‬ ‫پیوسته‬ ‫و‬ ‫عددی‬ ‫ماهیتی‬ ‫که‬
.‫است‬ ‫تخمین‬ ‫روش‬ ‫به‬ ‫شباهت‬
‫س‬ ‫یک‬ ‫در‬ ‫کنید‬ ‫فرض‬‫مربوط‬ ‫زمانی‬ ‫ری‬‫به‬
‫جو‬ ‫و‬ ‫پرس‬ ‫سهام‬:‫داریم‬ ‫نیاز‬ ‫را‬ ‫زیر‬ ‫های‬
1-‫تمام‬ ‫کردن‬ ‫پیدا‬‫سهام‬‫که‬ ‫هایی‬
‫سه‬ ‫شبیه‬‫ا‬‫م‬A.‫هستند‬
2-‫که‬ ‫سهامدارانی‬ ‫تمام‬ ‫کردن‬ ‫پیدا‬
‫قیمت‬ ‫مبنای‬ ‫بر‬ ‫خریدشان‬ ‫الگوی‬
‫های‬ ‫سهام‬ ‫پایانی‬high-tech‫بوده‬
.‫است‬
‫داده‬‫توانند‬ ‫می‬ ‫ها‬‫شباهت‬ ‫بررسی‬ ‫جهت‬‫به‬
‫پردازش‬ ‫و‬ ‫سازماندهی‬ ‫مختلف‬ ‫روش‬ ‫دو‬
.‫شوند‬
1-Whole sequence matching‫که‬‫بر‬‫روی‬
‫داده‬ ‫کل‬‫شباهت‬ ‫زمانی‬ ‫سری‬ ‫های‬
.‫شود‬ ‫می‬ ‫بررسی‬
2-Subsequence matching‫این‬ ‫در‬ ‫که‬
‫زیرتوالی‬ ‫اگر‬ ،‫روش‬‫نام‬ ‫به‬ ‫ای‬Q
‫نام‬ ‫به‬ ‫سری‬ ‫و‬ ‫باشیم‬ ‫داشته‬P،
‫می‬ ‫بررسی‬ ‫صورت‬ ‫این‬ ‫به‬ ‫شباهت‬‫شود‬
‫توالی‬ ‫زیر‬ ‫که‬‫از‬ ‫هایی‬P‫که‬‫با‬Q
‫دارند‬ ‫همخوانی‬‫می‬ ‫انتخاب‬.‫شوند‬
Indexing -5:
‫طرح‬ ‫یک‬Indexing‫می‬ ‫کمک‬ ‫ما‬ ‫به‬‫تا‬ ‫کند‬
‫کارآمد‬ ‫سازماندهی‬‫داده‬ ‫از‬ ‫ی‬‫ها‬‫منظور‬ ‫به‬
‫داده‬ ‫سریع‬ ‫بازیابی‬‫دیتابیس‬ ‫از‬ ‫ها‬‫های‬
.‫باشیم‬ ‫داشته‬ ‫بزرگ‬
Data Mining Tasks -6:
‫روش‬‫های‬‫س‬ ‫کاوی‬ ‫داده‬ ‫برای‬ ‫را‬ ‫زیر‬‫ری‬‫های‬
‫می‬ ‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫زمانی‬:‫دهیم‬
•Query by content
•Motif discovery
•Clustering
•Classification
•Prediction (Forecasting)
•Summarization(Segmentation)
•Anomaly Detection
6-1-Query by content:
‫روش‬ ‫این‬‫مبنای‬ ‫بر‬‫حل‬ ‫راه‬ ‫بازیابی‬‫هایی‬
‫و‬ ‫پرس‬ ‫به‬ ‫را‬ ‫شباهت‬ ‫بیشترین‬ ‫که‬ ‫است‬‫جوی‬
( ‫شکل‬ .‫دارند‬ ‫کاربر‬ ‫درخواستی‬8)Query
by content‫فضای‬ ‫یک‬ ‫در‬ ‫را‬2‫نشان‬ ‫بعدی‬
‫می‬:‫دهد‬
(‫شکل‬8)
،‫باال‬ ‫شکل‬ ‫در‬‫سری‬ ‫یک‬ ‫نمایانگر‬ ‫نقطه‬ ‫هر‬
‫داده‬ ‫از‬‫به‬ ‫توجه‬ ‫با‬ ‫که‬ ‫باشد‬ ‫می‬ ‫های‬
‫فضای‬ ‫از‬ ‫ای‬ ‫نقطه‬ ‫در‬ ‫آن‬ ‫خصوصیات‬2‫بعدی‬
‫وارد‬ ‫جو‬ ‫و‬ ‫پرس‬ ‫یک‬ ‫وقتی‬ .‫است‬ ‫گرفته‬ ‫قرار‬
‫نمایش‬ ‫از‬ ‫شکلی‬ ‫به‬ ‫تبدیل‬ ،‫شود‬ ‫می‬ ‫سیستم‬
(Representation‫که‬ ‫شود‬ ‫می‬ )‫با‬ ‫مقایسه‬ ‫قابل‬
.‫شود‬ ‫دیگر‬ ‫نقاط‬‫مقایسه‬ ‫گونه‬ ‫دو‬ ‫سپس‬
.‫شود‬ ‫انجام‬ ‫تواند‬ ‫می‬Range query‫سری‬ ‫که‬-
‫مشخص‬ ‫فاصله‬ ‫با‬ ‫را‬ ‫هایی‬𝑒‫از‬query‫ما‬ ‫به‬
‫و‬ ‫دهد‬ ‫می‬k-Nearest- neighborhood‫که‬𝑘‫نقطه‬
‫با‬ ‫فاصله‬ ‫کمترین‬ ‫که‬ ‫ای‬query‫دارند‬ ‫را‬
‫می‬ ‫ما‬ ‫به‬.‫دهد‬
6-2-Clustering:
‫کالسترینگ‬ ‫در‬‫است‬ ‫نقاطی‬ ‫کردن‬ ‫پیدا‬ ‫هدف‬
‫بیشت‬ ‫که‬‫و‬ ‫دارند‬ ‫بهم‬ ‫را‬ ‫شباهت‬ ‫رین‬
‫کالستر‬‫با‬ ‫را‬ ‫فاصله‬ ‫بیشترین‬ ‫مختلف‬ ‫های‬
.‫دارند‬ ‫هم‬
(‫شکل‬9)
‫روش‬clustering‫می‬ ‫تقسیم‬ ‫روش‬ ‫زیر‬ ‫دو‬ ‫به‬:‫شود‬
1-Whole Series Clustering‫یک‬ ‫روش‬ ‫این‬ ‫در‬
‫سری‬ ‫با‬ ‫کامل‬ ‫بطور‬ ‫زمانی‬ ‫سری‬
‫و‬ ‫شود‬ ‫می‬ ‫مقایسه‬ ‫دیگر‬ ‫زمانی‬
‫شبی‬ ‫که‬ ‫آنهایی‬‫یک‬ ‫در‬ ‫هستند‬ ‫هم‬ ‫ه‬
‫می‬ ‫قرار‬ ‫کالستر‬.‫گیرند‬
2-Subsequence Clustering‫زیر‬ ‫روش‬ ‫این‬ ‫در‬
‫توالی‬‫سری‬ ‫از‬ ‫ها‬‫مقایسه‬ ‫و‬ ‫ایجاد‬ ‫ها‬
‫می‬.‫شوند‬
Classification -3-6:
‫زیرتوالی‬ ‫یا‬ ‫سری‬ ‫به‬ ‫روش‬ ‫این‬ ‫در‬‫هایی‬
‫یک‬ ‫سری‬ ‫از‬class label‫با‬ .‫شود‬ ‫می‬ ‫داده‬
‫داده‬ ‫به‬ ‫توجه‬‫که‬ ‫موجود‬ ‫های‬class label-
‫می‬ ‫آموزش‬ ‫مدل‬ ،‫است‬ ‫مشخص‬ ‫شان‬‫بینید‬‫و‬
‫می‬ ‫سیستم‬ ‫وارد‬ ‫جدیدی‬ ‫سری‬ ‫وقتی‬،‫شود‬
‫می‬‫مقدار‬ ‫تواند‬class label‫تخمین‬ ‫آنرا‬
.‫بزند‬
‫شکل‬(11)‫می‬ ‫نشان‬ ‫را‬ ‫فرآیند‬ ‫این‬
:‫دهد‬
(‫شکل‬10)
‫شکل‬a‫می‬ ‫نشان‬ ‫را‬ ‫آموزشی‬ ‫مجموعه‬.‫دهد‬
‫شکل‬b‫داده‬‫بدون‬ ‫های‬label‫می‬ ‫نشان‬ ‫را‬-
.‫است‬ ‫شده‬ ‫سیستم‬ ‫وارد‬ ‫که‬ ‫دهد‬‫شکل‬ ‫در‬
c‫نسبت‬ ‫کالس‬ ‫یک‬ ‫به‬ ‫شده‬ ‫وارد‬ ‫نقطه‬ ‫هر‬
.‫است‬ ‫شده‬ ‫داده‬
Segmentation -7:
‫سری‬ ‫دقیق‬ ‫تخمین‬ ‫روش‬ ‫این‬ ‫هدف‬‫زمانی‬ ‫های‬
‫کا‬ ‫با‬‫اصلی‬ ‫خصوصیات‬ ‫حالیکه‬ ‫در‬ ‫ابعاد‬ ‫هش‬
‫آن‬‫حفظ‬‫می‬ ‫است‬ ‫شده‬.‫باشد‬
‫شکل‬(11)‫سیستم‬ ‫یک‬ ‫خروجی‬segmentation‫را‬
‫می‬ ‫نشان‬:‫دهد‬
(‫شکل‬11)
‫از‬ ‫سری‬ ‫بازسازی‬ ‫خطای‬ ‫کاهش‬ ‫روش‬ ‫این‬ ‫هدف‬
‫این‬ ‫برای‬ ‫اصلی‬ ‫راهکار‬ ‫و‬ ‫است‬ ‫اصلی‬ ‫سری‬
‫روش‬ ‫شود‬ ‫می‬ ‫استفاده‬ ‫سالهاست‬ ‫که‬ ‫موضوع‬
PLA‫های‬ ‫روش‬ ‫(از‬representation‫پیش‬ ‫که‬ ‫است‬ )
‫صحبت‬ ‫آن‬ ‫به‬ ‫راجع‬ ‫تر‬.‫کردیم‬
Prediction -1-7:
‫سری‬ ‫در‬ ‫مهم‬ ‫های‬ ‫روش‬ ‫از‬ ‫یکی‬‫زمانی‬ ‫های‬
‫اس‬‫سری‬ ‫زیر‬ ‫یا‬ ‫سری‬ ‫کمک‬ ‫به‬ ‫آن‬ ‫در‬ ‫و‬ ‫ت‬‫ها‬
‫مقاد‬ ، ‫موجود‬ ‫مقادیر‬ ‫و‬‫آینده‬ ‫یر‬
‫زیر‬ ‫و‬ ‫ها‬ ‫سری‬ ‫و‬ ‫متغیرها‬‫بینی‬ ‫پیش‬ ‫ها‬ ‫سری‬
.‫شود‬ ‫می‬ ‫زده‬ ‫تخمین‬ ‫و‬
‫شکل‬(12)‫می‬ ‫نشان‬ ‫را‬ ‫بینی‬ ‫پیش‬ ‫سناریوی‬
:‫دهد‬
(‫شکل‬12)
Anomaly Detection -2-7:
‫توالی‬ ‫زیر‬ ‫روش‬ ‫دراین‬‫با‬ ‫که‬ ‫سری‬ ‫های‬
‫تفاوت‬ ‫سری‬ ‫نرمال‬ ‫حالت‬‫مالجظه‬ ‫قابل‬
‫می‬ ‫شناسایی‬ ‫را‬ ‫دارند‬.‫کنیم‬‫شکل‬(13)
‫می‬ ‫روش‬ ‫این‬ ‫برای‬ ‫مثالی‬:‫باشد‬
(‫شکل‬13)
Motif Discovery -3-7:
‫توالی‬ ‫زیر‬ ‫کردن‬ ‫پیدا‬ ‫هدف‬‫که‬ ‫است‬ ‫هایی‬
‫د‬ ‫پیوسته‬‫تکرار‬ ‫بزرگتر‬ ‫زمانی‬ ‫سری‬ ‫یک‬ ‫ر‬
‫شده‬‫ها‬ ‫زیرتوالی‬ ‫این‬ ‫به‬ . .‫اند‬motif‫می‬
.‫گویند‬
‫شکل‬(11)‫این‬‫می‬ ‫نشان‬ ‫را‬ ‫موضوع‬:‫دهد‬
(‫شکل‬14)
‫بینی‬ ‫پیش‬ ‫به‬ ‫راجع‬ ‫خواهیم‬ ‫می‬ ‫ادامه‬ ‫در‬
‫کمک‬ ‫به‬ ‫سهام‬ ‫بازار‬TimeSeries data mining
‫نمونه‬ ‫بازار‬ ‫یک‬ ‫ادامه‬ ‫در‬ ‫و‬ ‫کنیم‬ ‫صحبت‬
‫می‬ ‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫را‬.‫دهیم‬
‫با‬ ‫سهام‬ ‫بازار‬ ‫بینی‬ ‫پیش‬
‫از‬ ‫استفاده‬Time Series Data
Mining:
‫برای‬ ‫جذاب‬ ‫موضوعات‬ ‫از‬ ‫یکی‬‫محققان‬‫در‬
‫بینی‬ ‫پیش‬ ، ‫سالها‬ ‫طی‬ ‫در‬ ،‫مالی‬ ‫امور‬
‫این‬ ‫نتایج‬ ‫و‬ .‫است‬ ‫سهام‬ ‫آینده‬ ‫قیمت‬
‫فروش‬ ‫و‬ ‫خرید‬ ‫در‬ ‫فعاالن‬ ‫به‬ ‫تحقیقات‬
‫برای‬ ‫مناسب‬ ‫زمان‬ ‫تا‬ ‫کند‬ ‫می‬ ‫کمک‬ ‫سهام‬
‫و‬ ‫بزنند‬ ‫تخمین‬ ‫را‬ ‫سهام‬ ‫فروش‬ ‫و‬ ‫خرید‬
.‫کنند‬ ‫گیری‬ ‫تصمیم‬ ‫آن‬ ‫مبنای‬ ‫بر‬
‫می‬ ‫ما‬‫سری‬ ‫کاوی‬ ‫داده‬ ‫روش‬ ‫هر‬ ‫از‬ ‫توانیم‬
‫ب‬ ‫پیش‬ ‫برای‬ ‫زمانی‬‫سهام‬ ‫آینده‬ ‫ارزش‬ ‫ینی‬
.‫بگیریم‬ ‫کمک‬‫از‬ ‫ما‬ ‫مقاله‬ ‫این‬ ‫در‬
‫رگرسیون‬ ‫آنالیز‬‫های‬ ‫روش‬ ‫از‬ ‫که‬
Prediction‫است‬‫مقادیر‬ ‫بینی‬ ‫پیش‬ ‫برای‬
‫نیجریه‬ ‫بازار‬ ‫در‬ ‫سهام‬ ‫قیمت‬ ‫آینده‬
‫کرده‬ ‫استفاده‬.‫ایم‬
‫اطالعات‬ ‫ازخالصه‬ ‫کار‬ ‫این‬ ‫برای‬ ‫ما‬
‫درتبادالت‬ ‫ها‬ ‫قیمت‬ ‫هفتگی‬ ‫و‬ ‫روزانه‬
‫نیجریه‬ ‫سهام‬ ‫بازار‬‫برای‬3‫به‬ ‫سهام‬
‫های‬ ‫نام‬First Bank of Nigeria Plc, Zenith Bank Plc,
and Skye Bank‫کرده‬ ‫استفاده‬.‫ایم‬
Linear Regression‫تکنیک‬ ‫ترین‬ ‫رایج‬ ‫از‬ ‫یکی‬-
‫ارزش‬ ‫بینی‬ ‫پیش‬ ‫برای‬ ‫کاوی‬ ‫داده‬ ‫های‬
‫مشخصه‬‫مقادیر‬ ‫مبنای‬ ‫بر‬ ‫ها‬‫مش‬‫خ‬‫صه‬‫های‬
‫است‬ ‫دیگر‬‫این‬ ‫از‬ ‫مثال‬ ‫این‬ ‫در‬ ‫ما‬ ‫و‬
‫می‬ ‫روش‬.‫کنیم‬ ‫استفاده‬ ‫خواهیم‬
‫ممکن‬ ‫مقادیر‬ ‫از‬ ‫تخمینی‬ ‫که‬ ‫رگرسیون‬ ‫خط‬
:‫است‬ ‫زیر‬ ‫فرمول‬ ‫به‬ ،‫است‬ ‫سری‬ ‫یک‬
𝑌 = 𝑎𝑥 + 𝑏
‫آن‬ ‫در‬ ‫که‬𝑌،‫وابسته‬ ‫متغیر‬𝑥‫متغیر‬
‫و‬ ‫مستقل‬𝑎‫و‬ ‫خط‬ ‫ضریب‬𝑏‫مبدا‬ ‫از‬ ‫عرض‬
.‫است‬ ‫خط‬
‫مقدار‬𝑎‫و‬𝑏‫فرمول‬ ‫از‬‫های‬‫زیر‬
‫شو‬ ‫می‬ ‫محاسبه‬‫ن‬:‫د‬
Y،‫سهام‬ ‫فعلی‬ ‫قیمت‬ ‫کننده‬ ‫مشخص‬x
‫مقدار‬P.E، ‫سود‬ ‫به‬ ‫قیمت‬ ‫نسبت‬ ‫یا‬𝑦̅
‫سهام‬ ‫های‬ ‫قیمت‬ ‫میانگین‬𝑥̅‫میانگین‬P.E
‫و‬n‫در‬ ‫دخیل‬ ‫سهام‬ ‫های‬ ‫قیمت‬ ‫تعداد‬
.‫باشد‬ ‫می‬ ‫فرمول‬
‫برای‬ ‫که‬ ‫ای‬ ‫داده‬3‫جمع‬ ‫نظر‬ ‫مورد‬ ‫سهام‬
‫صورت‬ ‫به‬ ‫است‬ ‫شده‬ ‫آوری‬( ‫جدول‬1):‫است‬
( ‫جدول‬1)
‫اطالعات‬ ‫به‬ ‫توجه‬ ‫با‬ ‫خواهیم‬ ‫می‬ ‫ما‬ ‫حاال‬
‫برای‬ ‫را‬ ‫رگرسیون‬ ‫خط‬ ، ‫باال‬3‫بانک‬
.‫کنیم‬ ‫فرموله‬ ‫نظر‬ ‫مورد‬
‫کار‬ ‫این‬ ‫مثال‬ ‫طور‬ ‫به‬‫بانک‬ ‫برای‬ ‫را‬
‫این‬ ‫جزئیات‬ .‫ایم‬ ‫داده‬ ‫انجام‬ ‫اول‬
‫می‬ ‫را‬ ‫محاسبه‬( ‫جدول‬ ‫در‬ ‫توانید‬2)
.‫کنید‬ ‫مشاهده‬
‫جدول‬(2)
‫مقدار‬ ‫اینجا‬ ‫تا‬a‫و‬b‫محاسبه‬ ‫را‬
‫خط‬ ‫فرمول‬ ‫در‬ ‫جایگذاری‬ ‫با‬ ‫حاال‬ .‫کردیم‬
:‫رسیم‬ ‫می‬ ‫زیر‬ ‫فرمول‬ ‫به‬
‫برا‬ ‫را‬ ‫رگرسیون‬ ‫خط‬ ‫فرمول‬ ‫ترتیب‬ ‫بهمین‬
‫ی‬2.‫میکنیم‬ ‫محاسبه‬ ‫دیگر‬ ‫سهام‬
‫مقدار‬ ‫وقتی‬ ،‫ها‬ ‫فرمول‬ ‫این‬ ‫داشتن‬ ‫با‬
‫مقدار‬ ‫واقع‬ ‫در‬ ،‫شود‬ ‫سیستم‬ ‫وارد‬ ‫جدیدی‬
P.E‫بر‬ ‫جدیدی‬‫محاسبه‬ ‫نظر‬ ‫مورد‬ ‫سهام‬ ‫ای‬
‫می‬ ،‫شود‬‫در‬ ‫آن‬ ‫جایگذاری‬ ‫با‬ ‫توانیم‬
‫جای‬ ‫باال(به‬ ‫فرمول‬x( ‫سهام‬ ‫ارزش‬ )y)
.‫بزنیم‬ ‫تخمین‬ ‫را‬
‫از‬ ‫آمده‬ ‫بدست‬ ‫فرمول‬ ‫زیر‬ ‫در‬3‫سهام‬
:‫ایم‬ ‫کرده‬ ‫محاسبه‬ ‫را‬ ‫نظر‬ ‫مورد‬
•First Bank Plc
•𝑦 = 35.85 + 0.12𝑥
•Skye Bank Plc
•𝑦 = 30.97 − 0.64𝑥
•Zenith Bank Plc
•𝑦 = 14.39 + 1.16𝑥
-8:‫گیری‬ ‫نتیجه‬
‫امروزه‬‫طور‬ ‫به‬ ‫زمانی‬ ‫سری‬ ‫های‬ ‫داده‬
‫مخ‬ ‫موضوعات‬ ‫در‬ ‫گسترده‬‫ت‬‫الخصوص‬ ‫علی‬ ‫لف‬
‫و‬ ‫هستند‬ ‫مطرح‬ ‫علمی‬ ‫و‬ ‫مالی‬ ‫مباحث‬
‫این‬ ‫باالی‬ ‫حجم‬ ‫بعلت‬ ‫اما‬ .‫دارند‬ ‫کاربرد‬
‫بروز‬ ‫ضرورت‬ ‫و‬ ‫زیاد‬ ‫ابعاد‬ ‫و‬ ‫اطالعات‬
‫به‬ ‫نیاز‬ ،‫ها‬ ‫داده‬ ‫این‬ ‫مداوم‬ ‫رسانی‬
‫صورت‬ ‫به‬ ‫بتوانند‬ ‫که‬ ‫است‬ ‫هایی‬ ‫تکنیک‬
‫پرکا‬ ‫و‬ ‫مفید‬ ‫الگوهای‬ ‫خودکار‬‫ربر‬‫د‬‫را‬
‫کشف‬ ‫ها‬ ‫داده‬ ‫عظیم‬ ‫حجم‬ ‫این‬ ‫دل‬ ‫از‬
‫داده‬ ‫های‬ ‫تکنیک‬ ‫بنابراین‬ .‫نمایند‬
‫بسیار‬ ‫تواند‬ ‫می‬ ‫ها‬ ‫داده‬ ‫این‬ ‫روی‬ ‫کاوی‬
.‫باشند‬ ‫اهمیت‬ ‫با‬
‫این‬ ‫در‬ ‫کاوی‬ ‫داده‬ ‫از‬ ‫خاص‬ ‫طور‬ ‫به‬ ‫ما‬
‫بینی‬ ‫پیش‬ ‫و‬ ‫سهام‬ ‫بازار‬ ‫در‬ ‫ها‬ ‫سری‬
‫تکنیک‬ ‫کمک‬ ‫به‬ ‫سهام‬ ‫آینده‬ ‫قیمت‬
‫یعنی‬ ‫آن‬ ‫نوع‬ ‫ترین‬ ‫ساده‬ ‫و‬ ‫رگرسیون‬
‫رگرسیو‬‫اما‬ .‫کردیم‬ ‫استفاده‬ ‫خطی‬ ‫ن‬
‫ما‬ ‫که‬ ‫بود‬ ‫این‬ ‫داشت‬ ‫وجود‬ ‫که‬ ‫موضوعی‬
‫از‬ ‫توانستیم‬ ‫می‬ ‫نظرمان‬ ‫مورد‬ ‫هدف‬ ‫برای‬
‫نیز‬ ‫دیگری‬ ‫کاوی‬ ‫داده‬ ‫تکنیک‬ ‫هر‬
.‫نماییم‬ ‫استفاده‬
‫ما‬ ‫به‬ ‫که‬ ‫مدلی‬ ‫آوردن‬ ‫بدست‬ ‫نهایت‬ ‫در‬
‫یک‬ ‫سهام‬ ‫آینده‬ ‫وضعیت‬ ‫بینی‬ ‫پیش‬ ‫در‬
‫این‬ ‫به‬ ‫منجر‬ ‫تواند‬ ‫می‬ ‫کند‬ ‫کمک‬ ‫شرکت‬
‫ا‬ ‫ذینفعان‬ ‫که‬ ‫شود‬‫بتوانند‬ ‫بازار‬ ‫ین‬
‫و‬ ‫خرید‬ ‫برای‬ ‫موقعی‬ ‫به‬ ‫و‬ ‫درست‬ ‫تصمیمات‬
.‫بگیرند‬ ‫هایشان‬ ‫سهام‬ ‫فروش‬
‫مر‬‫ا‬‫جع‬:
[1] Tak-chung Fu, A review on time series data
mining, Department of Computing, Hong Kong
Polytechnic University, Hunghom, Kowloon,
Hong Kong, Elsevier Publications, 2011
[2] PHILIPPE ESLING and CARLOS AGON,
Time-Series Data Mining,Institut de Recherche
et Coordination, ACM Computing Surveys,
2012
[3] S AbdulsalamSulaiman Olaniyi, Adewole,
Kayode S., Jimoh, R. G, Stock Trend Prediction
Using Regression Analysis – A Data Mining
Approach,AJSS Journal, 2010-11

More Related Content

Viewers also liked (6)

SaltStack Configuration Management
SaltStack Configuration ManagementSaltStack Configuration Management
SaltStack Configuration Management
 
Ιστορία Β Γυμνασίου Σταυροφοριες
 Ιστορία Β Γυμνασίου Σταυροφοριες  Ιστορία Β Γυμνασίου Σταυροφοριες
Ιστορία Β Γυμνασίου Σταυροφοριες
 
Legislación laboral
Legislación laboralLegislación laboral
Legislación laboral
 
Presentacion primerdia
Presentacion primerdiaPresentacion primerdia
Presentacion primerdia
 
Flujo circular de la economía
Flujo circular de la economíaFlujo circular de la economía
Flujo circular de la economía
 
Anonimizando tomates
Anonimizando tomatesAnonimizando tomates
Anonimizando tomates
 

Similar to Time series data mining

Classification of Iris flower data
Classification of Iris flower dataClassification of Iris flower data
Classification of Iris flower data
sahar zare
 
مقاله هندسه محاسباتی
مقاله هندسه محاسباتی مقاله هندسه محاسباتی
مقاله هندسه محاسباتی
faezeh akbari
 

Similar to Time series data mining (20)

Clustering customers based on kmeans algorithm
Clustering customers based on kmeans algorithmClustering customers based on kmeans algorithm
Clustering customers based on kmeans algorithm
 
Time series
Time seriesTime series
Time series
 
Classification of Iris flower data
Classification of Iris flower dataClassification of Iris flower data
Classification of Iris flower data
 
Neural network ph neutralization
Neural network ph neutralizationNeural network ph neutralization
Neural network ph neutralization
 
Neural networks
Neural networksNeural networks
Neural networks
 
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیرازIntroduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
 
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
 
Data streaming & kafka
Data streaming & kafkaData streaming & kafka
Data streaming & kafka
 
Thesis Chaptersنگارپژوه :: فصل بندی پایان نامه
Thesis Chaptersنگارپژوه :: فصل بندی پایان نامه Thesis Chaptersنگارپژوه :: فصل بندی پایان نامه
Thesis Chaptersنگارپژوه :: فصل بندی پایان نامه
 
Anp
AnpAnp
Anp
 
مقاله هندسه محاسباتی
مقاله هندسه محاسباتی مقاله هندسه محاسباتی
مقاله هندسه محاسباتی
 
Ahp multi index decision . ms.samaneh mirrahimi and ms.masomeh jahanshahi
Ahp  multi index decision . ms.samaneh mirrahimi and ms.masomeh jahanshahiAhp  multi index decision . ms.samaneh mirrahimi and ms.masomeh jahanshahi
Ahp multi index decision . ms.samaneh mirrahimi and ms.masomeh jahanshahi
 
بردار و ماتریس 3
بردار و ماتریس 3بردار و ماتریس 3
بردار و ماتریس 3
 
111
111111
111
 
نحوه ی نوشتن پروپوزال
نحوه ی نوشتن پروپوزالنحوه ی نوشتن پروپوزال
نحوه ی نوشتن پروپوزال
 
فرآیندهای تصادفی
فرآیندهای تصادفیفرآیندهای تصادفی
فرآیندهای تصادفی
 
نمونه پروژه سایت پروژه تیوب
نمونه پروژه سایت پروژه تیوبنمونه پروژه سایت پروژه تیوب
نمونه پروژه سایت پروژه تیوب
 
particle swarm optimized autonomous learning fuzzy system
particle swarm optimized autonomous learning fuzzy systemparticle swarm optimized autonomous learning fuzzy system
particle swarm optimized autonomous learning fuzzy system
 
Machine learning and big-data-in-physics 13970711-Dr. Amin Nezarat
Machine learning and big-data-in-physics 13970711-Dr. Amin NezaratMachine learning and big-data-in-physics 13970711-Dr. Amin Nezarat
Machine learning and big-data-in-physics 13970711-Dr. Amin Nezarat
 
برنامه سازی3
برنامه سازی3برنامه سازی3
برنامه سازی3
 

Time series data mining

  • 1. ‫بررسی‬‫بورس‬ ‫در‬ ‫آن‬ ‫کاربرد‬ ‫و‬ ‫زمانی‬ ‫های‬ ‫سری‬ ‫در‬ ‫کاوی‬ ‫داده‬ ‫میرمحمد‬ ‫محمد‬ ‫سید‬،‫ارشد‬ ‫کارشناسی‬ ‫مقطع‬‫تهران‬ ‫واحد‬ ‫اسالمی‬ ‫آزاد‬ ‫دانشگاه‬ ‫جنوب‬،‫تهران‬ ‫استان‬ ،m.mirmohamad@gmail.com :‫چکیده‬ ‫مشاهدات‬ ‫از‬ ‫ای‬ ‫مجموعه‬ ،‫زمانی‬ ‫سری‬ ‫یک‬‫می‬ ‫اتفاق‬ ‫زمان‬ ‫ترتیب‬ ‫به‬ ‫که‬ ‫است‬ ‫ی‬.‫افتند‬ ‫بعبارتی‬‫سری‬‫داده‬ ‫از‬ ‫ای‬ ‫دنباله‬ ‫زمانی‬ ‫های‬.‫است‬ ‫زمان‬ ‫به‬ ‫وابسته‬ ‫که‬ ‫هستند‬ ‫هایی‬ ،‫هوا‬ ‫روزانه‬ ‫دمای‬ ‫مانند‬‫قیمت‬ ‫و‬ ‫فروشگاه‬ ‫یک‬ ‫هفتگی‬ ‫فروش‬ ‫کل‬‫صندوق‬ ‫و‬ ‫سهام‬ ‫های‬‫های‬ ‫سرمایه‬.‫مشترک‬ ‫گذاری‬‫خصوصیت‬‫داده‬ ‫زیاد‬ ‫حجم‬ ،‫زمانی‬ ‫سری‬ ‫یک‬‫زی‬ ‫ابعاد‬ ،‫ها‬‫ضرورت‬ ‫و‬ ‫اد‬ ‫ما‬ ‫دارای‬ ‫طرفی‬ ‫از‬ ‫و‬ ‫است‬ ‫مداوم‬ ‫رسانی‬ ‫بروز‬.‫باشد‬ ‫می‬ ‫پیوسته‬ ‫و‬ ‫عددی‬ ‫هیتی‬‫افزایش‬ ‫داده‬ ‫از‬ ‫استفاده‬‫د‬ ‫خاص‬ ‫بطور‬ ‫و‬ ،‫زمانی‬ ‫های‬‫اده‬‫گسترده‬ ‫تحقیقات‬ ‫باعث‬ ،‫زمانی‬ ‫سری‬ ‫های‬ ‫روی‬ ‫بر‬ ‫کاوی‬ ‫داده‬ ‫فیلد‬ ‫در‬‫آنها‬‫است‬ ‫شده‬.‫که‬ ‫است‬ ‫روشی‬ ‫زمانی‬ ‫سری‬ ‫بینی‬ ‫پیش‬ ‫مدل‬ ‫پ‬ ‫برای‬ ‫قبلی‬ ‫شده‬ ‫مشاهده‬ ‫مقادیر‬ ‫از‬‫می‬ ‫استفاده‬ ‫مقادیر‬ ‫آینده‬ ‫بینی‬ ‫یش‬.‫کند‬ ‫ما‬‫سری‬ ‫روی‬ ‫جامعی‬ ‫مرور‬ ‫مقاله‬ ‫این‬ ‫در‬‫و‬ ‫داشت‬ ‫خواهیم‬ ‫زمانی‬ ‫های‬3‫جنبه‬‫مهم‬ ‫سری‬‫یعنی‬ ‫زمانی‬ ‫های‬Representation،Indexing‫و‬Similarity measure‫می‬ ‫بررسی‬ ‫را‬‫سپس‬ .‫کنیم‬ ‫روی‬ ‫مروری‬‫تکنیک‬‫کمک‬ ‫به‬ ‫انتها‬ ‫در‬ ‫و‬ ‫داشت‬ ‫خواهیم‬ ‫ها‬ ‫سری‬ ‫این‬ ‫روی‬ ‫کاوی‬ ‫داده‬ ‫های‬ ‫رگرسیون‬‫سهامی‬ ‫بازار‬ ،.‫کرد‬ ‫خواهیم‬ ‫بررسی‬ ‫نمونه‬ ‫بطور‬ ‫را‬ :‫کلیدی‬ ‫کلمات‬ ‫سری‬‫های‬،‫زمانی‬‫معیار‬‫شباهت‬,‫تحلیل‬‫زمانی‬،‫معیار‬‫فاصله‬,‫شاخص‬‫بندی‬‫داده‬, ‫کاوش‬‫داده‬
  • 2. 1-:‫مقدمه‬ ‫س‬‫ری‬‫داده‬ ‫اشیا‬ ‫از‬ ‫مهمی‬ ‫کالس‬ ‫زمانی‬ ‫های‬ ‫زم‬‫می‬ ‫سادگی‬ ‫به‬ ‫و‬ ‫هستند‬ ‫انی‬‫آنه‬ ‫توان‬‫ا‬ ‫را‬‫پیدا‬ ‫علمی‬ ‫و‬ ‫مالی‬ ‫کاربردهای‬ ‫در‬ .‫کرد‬‫مثال‬ ‫بطور‬: •‫قیمت‬ ‫مانند‬ ،‫اقتصاد‬ ‫در‬ ‫زمانی‬ ‫سری‬ ‫صادرات‬ ،‫متوالی‬ ‫روزهای‬ ‫در‬ ‫سهام‬ ‫درآمد‬ ‫متوسط‬ ،‫متوالی‬ ‫ماههای‬ ‫در‬ ... ‫متوالی‬ ‫ماههای‬ ‫در‬ •‫علوم‬ ‫در‬ ‫بویژه‬ ،‫فیزیک‬ ‫زمانی‬ ‫سری‬ ،‫دریایی‬ ‫علوم‬ ،‫جوی‬ ‫آثار‬ ‫به‬ ‫مربوط‬ .)‫فیزیک‬ ‫زمین(ژئو‬ ‫فیزیک‬ •‫سری‬‫زم‬ ‫های‬‫انی‬‫بازاریابی‬‫و‬ ‫تجزیه‬ ، ‫یا‬ ‫هفته‬ ‫در‬ ‫فروش‬ ‫ارقام‬ ‫تحلیل‬ ‫مسئله‬ ‫یک‬ ‫متوالی‬ ‫ماههای‬‫مهم‬‫در‬ ‫تجارت‬‫است‬. •‫سری‬‫زمانی‬ ‫های‬‫جمعیت‬‫نگاری‬، ‫ساالنه‬ ‫گیری‬ ‫اندازه‬‫جمعیت‬‫با‬‫هدف‬ ‫پیش‬‫بینی‬‫تغییرات‬‫جمعیت‬‫در‬‫مدت‬ ‫زمان‬‫ده‬‫تا‬‫بیست‬‫سال‬‫آینده‬. ‫ه‬ ‫واقع‬ ‫در‬‫م‬‫می‬ ‫که‬ ‫انطور‬‫سری‬ ‫در‬ ‫بینید‬‫های‬ ،‫زمانی‬‫زمان‬ ‫از‬ ‫توالی‬ ‫یک‬ ‫در‬ ‫ها‬ ‫داده‬ ‫یا‬ ‫روزانه‬ ‫مثال‬ ،‫شوند‬ ‫می‬ ‫گیری‬ ‫اندازه‬ . ..‫و‬ ‫ساالنه‬ ‫یا‬ ‫هفتگی‬ ‫مجموعه‬ ‫زمانی‬ ‫سری‬ ‫یک‬‫مشاهداتی‬ ‫از‬ ‫ای‬ ‫و‬ ‫شود‬ ‫می‬ ‫ساخته‬ ‫زمان‬ ‫ترتیب‬ ‫به‬ ‫که‬ ‫است‬ ‫و‬ ‫زیاد‬ ‫اطالعات،ابعاد‬ ‫باالی‬ ‫حجم‬ ‫دارای‬ ‫طرفی‬ ‫از‬ ‫و‬ ‫است‬ ‫مداوم‬ ‫رسانی‬ ‫بروز‬ ‫ضرورت‬ ‫پیوست‬ ‫و‬ ‫عددی‬ ‫ماهیتی‬ ‫دارای‬.‫باشد‬ ‫می‬ ‫ه‬ ‫داده‬ ‫در‬ ‫بنابراین‬‫معیار‬ ،‫زمانی‬ ‫سری‬ ‫های‬ .‫است‬ ‫تخمین‬ ‫مبنای‬ ‫بر‬ ‫ها‬ ‫سری‬ ‫شباهت‬ ‫موضوع‬ ‫در‬‫سری‬ ‫در‬ ‫کاوی‬ ‫داده‬‫زمانی‬ ‫های‬ ‫داده‬ ‫چطور‬ ‫ما‬ ‫که‬ ‫اینست‬ ‫اصلی‬ ‫مشکل‬‫های‬ .‫دهیم‬ ‫نمایش‬ ‫را‬ ‫زمانی‬ ‫سری‬‫حجم‬ ‫با‬ ‫چون‬ ‫داده‬ ‫از‬ ‫زیادی‬‫ه‬‫از‬ ‫زیادی‬ ‫ابعاد‬ ‫و‬ ‫ا‬ ‫داده‬‫و‬ ‫سر‬ ‫ها‬‫لزوما‬ ‫و‬ ‫داریم‬ ‫کار‬‫تمام‬ ‫داده‬ ‫این‬‫کار‬ ‫بدرد‬ ‫است‬ ‫ممکن‬ ‫ابعاد‬ ‫و‬ ‫ها‬ .‫نخورد‬ ‫ما‬‫رایج‬ ‫راهکارهای‬ ‫از‬ ‫یکی‬، ‫ابعاد‬ ‫با‬ ‫ای‬ ‫دامنه‬ ‫به‬ ‫زمانی‬ ‫سری‬ ‫تبدیل‬ ‫از‬ ‫استفاده‬ ‫آن‬ ‫همراه‬ ‫به‬ ‫و‬ ‫کمتر‬‫شاخص‬ ‫بندی‬.‫است‬ ‫مناسب‬‫ع‬‫معیار‬ ‫این‬ ‫بر‬ ‫الوه‬ ‫سری‬ ‫بین‬ ‫شباهت‬‫زیرتوالی‬ ‫یا‬ ‫و‬ ‫زمانی‬ ‫های‬- ‫سری‬ ‫از‬ ‫ای‬‫و‬ ‫زمانی‬ ‫های‬segmentation‫یا‬ ‫موضوع‬ ،‫زمانی‬ ‫سری‬ ‫بندی‬ ‫بخش‬‫ات‬‫مهم‬‫ی‬‫در‬ ‫داده‬ ‫این‬ ‫روی‬ ‫کاوی‬ ‫داده‬ ‫بحث‬‫می‬ ‫ها‬ ‫باش‬‫ن‬‫د‬. ‫ادامه‬ ‫در‬3‫داده‬ ‫مدیریت‬ ‫مهم‬ ‫جنبه‬‫های‬ ‫یعنی‬ ‫زمانی‬ ‫سری‬Representation،Similarity Measure‫و‬Indexing.‫کرد‬ ‫خواهیم‬ ‫بررسی‬ ‫را‬ ‫تکنیک‬ ‫سپس‬‫داده‬ ‫این‬ ‫روی‬ ‫کاوی‬ ‫داده‬ ‫های‬- ‫می‬ ‫بررسی‬ ‫را‬ ‫ها‬‫یک‬ ‫انتها‬ ‫در‬ ‫و‬ .‫کنیم‬ ‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫را‬ ‫نمونه‬ ‫سهام‬ ‫بازار‬ .‫داد‬ ‫خواهیم‬ 2-‫سه‬‫مدیریت‬ ‫در‬ ‫مهم‬ ‫جنبه‬ ‫د‬‫ا‬:‫زمانی‬ ‫سری‬ ‫های‬ ‫ده‬ 1-2-Representation:‫چطور‬ ‫ما‬ ‫اینکه‬ ‫زما‬ ‫سری‬ ‫یک‬ ‫اصلی‬ ‫خصوصیات‬‫نمایش‬ ‫را‬ ‫نی‬ ‫تکنیک‬ ‫اینکه‬ ‫و‬ .‫دهیم‬‫های‬Representation ‫در‬ ‫دهند‬ ‫کاهش‬ ‫را‬ ‫ابعاد‬ ‫بتوانند‬ ‫باید‬ .‫شود‬ ‫حفظ‬ ‫سری‬ ‫اصلی‬ ‫خصوصیات‬ ‫حالیکه‬ 2-2-Similarity Measure(‫شباهت‬ ‫معیار‬): ‫شباهت‬ ‫معیار‬ ‫توانیم‬ ‫می‬ ‫چطور‬ ‫اینکه‬‫را‬ ‫کنیم‬ ‫تعریف‬ ‫ها‬ ‫سری‬ ‫برای‬‫تا‬‫بتوانیم‬ ‫که‬ ‫کنیم‬ ‫مشخص‬‫هم‬ ‫با‬ ‫مختلف‬ ‫سری‬ ‫دو‬ ‫دارند‬ ‫همخوانی‬‫نه‬ ‫یا‬‫چطور‬ ‫اینکه‬ .‫می‬ ‫سری‬ ‫دو‬ ‫بین‬ ‫را‬ ‫حسی‬ ‫فاصله‬ ‫یک‬ ‫توانیم‬ ‫پایه‬ ‫بر‬ ‫باید‬ ‫معیار‬ ‫این‬ .‫کنیم‬ ‫فرموله‬ ‫مفاهیم‬‫سری‬ ‫بنابراین‬ ،‫باشد‬ ‫ادراکی‬‫هایی‬ ‫لح‬ ‫از‬ ‫حتی‬ ‫که‬‫یکسان‬ ‫هم‬ ‫با‬ ‫ریاضی‬ ‫اظ‬ ‫می‬ ،‫نیستند‬‫شبیه‬ ‫ادراکی‬ ‫لحاظ‬ ‫از‬ ‫توانند‬ .‫باشند‬ ‫بهم‬ 3-2-Indexing:)‫بندی‬ ‫(شاخص‬‫اینکه‬ ‫داده‬ ‫عظیم‬ ‫حجم‬ ‫روی‬ ‫بتوانیم‬ ‫چطور‬‫های‬ ‫باال‬ ‫سرعت‬ ‫با‬ ‫را‬ ‫ها‬ ‫جو‬ ‫و‬ ‫پرس‬ ‫زمانی‬ ‫سری‬ ‫مکانیزم‬ ‫چه‬ ‫دیگر‬ ‫بعبارت‬ .‫دهیم‬ ‫پاسخ‬ indexing‫تکنیک‬ .‫شود‬ ‫گرفته‬ ‫بکار‬ ‫باید‬ ‫ای‬ indexing‫فضای‬ ‫باید‬‫مینیمم‬‫ای‬‫و‬ ‫کند‬ ‫مصرف‬ ‫امکان‬ ‫حد‬ ‫تا‬ ‫آن‬ ‫محاسباتی‬ ‫پیچیدگی‬ .‫باشد‬ ‫حداقل‬ ‫از‬ ‫تری‬ ‫مفصل‬ ‫توضیح‬ ‫به‬ ‫ادامه‬ ‫در‬3‫جنبه‬ :‫پرداخت‬ ‫خواهیم‬ ‫باال‬ Time Series Data Representation -3: ‫داده‬ ،‫شد‬ ‫اشاره‬ ‫قبال‬ ‫که‬ ‫همانطور‬‫سری‬ ‫های‬ .‫هستند‬ ‫زیادی‬ ‫ابعاد‬ ‫دارای‬ ‫زمانی‬‫اگر‬ ‫ندهیم‬ ‫کاهش‬ ‫را‬ ‫ابعاد‬ ‫حجم‬ ‫این‬،‫تعریف‬ ‫الگوریتم‬‫داده‬ ‫روی‬ ‫که‬ ‫هایی‬‫سری‬ ‫خام‬ ‫های‬ ‫هزینه‬ ‫پر‬ ‫بسیار‬ ‫کنند‬ ‫عمل‬ ‫زمانی‬ ‫های‬ ‫دلیل‬ ‫مهمترین‬ .‫بود‬ ‫خواهد‬Time series Representation‫یا‬ ‫ابعاد‬ ‫کاهش‬dimension reduction .‫است‬‫تکنیک‬ ‫یک‬Representation‫باید‬‫شکلی‬ ‫کاهش‬ ‫با‬ ‫را‬ ‫سری‬ ‫از‬dimension‫ها‬‫ابعاد‬ ‫یا‬
  • 3. ‫بدهد‬ ‫ما‬ ‫به‬‫و‬ ‫اصلی‬ ‫خصوصیات‬ ‫حالیکه‬ ‫در‬ ‫شک‬‫ل‬‫است‬ ‫شده‬ ‫حفظ‬ ‫سری‬ ‫اصلی‬. ‫کامپیوتر‬ ‫علوم‬ ‫عمده‬ ‫مشکالت‬ ‫از‬ ‫یکی‬، ‫روش‬ ‫انتخاب‬Representation‫و‬ ‫مناسب‬‫کارآمد‬ ‫داده‬ ‫برای‬.‫است‬ ‫زمانی‬ ‫سری‬ ‫های‬‫این‬ ‫با‬ ‫دیدگاه‬،‫تکنینک‬‫برای‬ ‫مختلفی‬ ‫های‬ Representation‫سری‬‫آمده‬ ‫بوجود‬ ‫زمانی‬ ‫های‬ ‫مثل‬ .‫است‬DFT،PAA،APCA‫که‬ .. ‫و‬‫در‬ ‫ادامه‬‫تکنیک‬ ‫این‬ ‫از‬ ‫بعضی‬ ‫مورد‬ ‫در‬‫ها‬ .‫کرد‬ ‫خواهیم‬ ‫صحبت‬ ‫بطورکلی‬‫تکنیک‬‫های‬Representation‫دو‬ ‫در‬ ‫می‬ ‫قرار‬ ‫دسته‬:‫گیرند‬ 1-Adaptive‫سری‬ ‫شکل‬ ‫آنها‬ ‫در‬ ‫که‬ : ‫از‬ ‫بعد‬ ‫جدید‬،‫ابعاد‬ ‫کاهش‬‫سازگار‬ .‫است‬ ‫اصلی‬ ‫سری‬ ‫با‬ ‫همشکل‬ ‫تقریبا‬ ‫و‬ 2-Non-Adaptive‫که‬ :‫سری‬ ‫شکل‬ ‫آنها‬ ‫در‬ ‫از‬ ‫بعد‬ ‫جدید‬‫لزوما‬ ،‫ابعاد‬ ‫کاهش‬ ‫ممکن‬ ‫و‬ ‫نیست‬ ‫اصلی‬ ‫سری‬ ‫با‬ ‫سازگار‬ ‫اصلی‬ ‫شکل‬ ‫با‬ ‫متفاوت‬ ‫کامال‬ ‫است‬ .‫باشد‬ ‫شکل‬(1)‫تکنیک‬ ‫انواع‬ ‫از‬ ‫نمایی‬‫های‬ Representation‫می‬ ‫نشان‬ ‫را‬:‫دهد‬ (‫شکل‬1) ‫رایج‬ ‫از‬ ‫برخی‬ ‫بررسی‬ ‫به‬ ‫حال‬‫تکنیک‬ ‫ترین‬- ‫های‬Representation‫می‬:‫پردازیم‬ Sampling -1-3‫برداری‬ ‫نمونه‬ ‫یا‬: ‫د‬‫داده‬ ‫نقاط‬ ‫تعداد‬ ‫اگر‬ ‫تکنیک‬ ‫این‬ ‫ر‬‫ای‬ ،‫سازند‬ ‫می‬ ‫را‬ ‫سری‬ ‫که‬m‫بگیرم‬ ‫نظر‬ ‫در‬ ،n‫از‬ ‫بعد‬ ‫داده‬ ‫نقاط‬ ‫تعداد‬‫کاهش‬‫ابعاد‬ ‫که‬ ‫است‬n<m‫صورت‬ ‫به‬ ‫نقاط‬ ‫این‬ .‫است‬ ‫قرار‬ ‫و‬ ‫شوند‬ ‫می‬ ‫انتخاب‬ ‫سری‬ ‫از‬ ‫نمونه‬ .‫باشند‬ ‫نقاط‬ ‫کل‬ ‫نماینده‬ ‫است‬ ‫متد‬ ‫یک‬ ‫متد‬ ‫این‬Non-Adaptive‫شکل‬ ‫و‬ ‫است‬ ‫زمانیکه‬ ‫را‬ ‫اصلی‬ ‫سری‬n‫کوچک‬ ‫بسیار‬ ‫باشد‬‫است‬ ‫ممکن‬ ‫و‬ ‫کند‬ ‫حفظ‬ ‫تواند‬ ‫نمی‬ .‫شود‬ ‫اصلی‬ ‫سری‬ ‫شکل‬ ‫از‬ ‫متفاوت‬ (‫شکل‬2) -2-3(PAA) Piecewise Aggregate Approximation: ‫به‬ ‫اصلی‬ ‫سری‬ ‫روش‬ ‫این‬ ‫در‬segment‫یا‬ ‫ها‬ ‫بخش‬‫هر‬ ‫برای‬ ‫و‬ ‫شود‬ ‫می‬ ‫تقسیم‬ ‫مختلف‬ ‫های‬ segment‫و‬ ‫شود‬ ‫می‬ ‫محاسبه‬ ‫مقدار‬ ‫میانگین‬ ‫یک‬ ‫عنوان‬ ‫به‬data point‫سری‬ ‫نمایش‬ ‫برای‬ ‫جدید‬‫می‬ ‫گرفته‬ ‫نظر‬ ‫در‬.‫شود‬‫اگ‬‫سری‬ ‫طول‬ ‫ر‬ ‫داده‬ ‫نقاط‬ ‫تعداد‬ ‫یا‬ ‫ما‬‫برابر‬ ‫ای‬m‫باشد‬ ‫برابر‬ ‫ما‬ ‫سری‬P1=(p1…pm)‫از‬ ‫بعد‬ ‫که‬ ‫است‬ dimension reduction‫ابعاد‬ ‫کاهش‬ ‫یا‬‫به‬ ‫تبدیل‬ P2=(p1..pn)‫که‬ ‫شود‬ ‫می‬n<m‫و‬ ‫است‬‫کدام‬ ‫هر‬ ‫محاسبه‬ ‫زیر‬ ‫فرمول‬ ‫از‬ ‫جدید‬ ‫سری‬ ‫نقاط‬ ‫از‬ ‫می‬:‫شوند‬ ‫آن‬ ‫در‬ ‫که‬𝑒𝑘‫انتهای‬ ‫نقطه‬ ‫مقدار‬ ‫برابر‬ ‫بخش‬𝑘‫ام‬‫و‬𝑠𝑘‫ابتدای‬ ‫مقدار‬‫بخش‬𝑘‫ام‬ .‫است‬ (‫شکل‬3) 3-3-Adaptive Piecewise Constant Approximation(APCA): ‫روش‬ ‫یافته‬ ‫تعمیم‬ ‫روش‬ ‫این‬PAA‫در‬ ‫و‬ ‫است‬ ‫یک‬ ‫طول‬ ‫آن‬segment‫وبدین‬ ‫نیست‬ ‫ثابت‬ ‫تواند‬ ‫می‬ ‫ترتیب‬adaptive‫سری‬ ‫اصلی‬ ‫باشکل‬ .‫باشد‬ (‫شکل‬4)
  • 4. 4-3-Piecewise Linear Approximation: ‫این‬ ‫به‬‫تکنیک‬Piecewise Linear Representation‫یا‬ PLR.‫شود‬ ‫می‬ ‫گفته‬ ‫هم‬ :‫دارد‬ ‫مختلف‬ ‫روش‬ ‫دو‬ ‫تکنیک‬ ‫این‬ 1-linear interpolation 2-linear regression Linear Interpolation -1-4-3: ‫توالی‬ ‫کنیم‬ ‫فرض‬ ‫اگر‬P = (p1 … pj)‫داشته‬ ‫را‬ ‫خطی‬ ‫برابر‬ ‫تخمین‬ ‫خط‬ ‫روش‬ ‫این‬ ‫در‬ ،‫باشیم‬ ‫که‬ ‫است‬𝑝1‫به‬ ‫را‬𝑝𝑗‫خط‬ ‫و‬ .‫کند‬ ‫می‬ ‫متصل‬ ‫از‬ ‫بعدی‬ ‫تخمین‬𝑝𝑗.‫شد‬ ‫خواهد‬ ‫شروع‬PLR‫یک‬ ‫الگوریتم‬bottom-up.‫است‬PLR‫تخمین‬ ‫یک‬ ‫با‬ ‫شکلی‬ ‫به‬ ‫شود‬ ‫می‬ ‫آغاز‬ ‫زمانی‬ ‫سری‬ ‫از‬ ‫خوب‬ ‫طول‬ ‫به‬ ‫سری‬ ‫تخمین‬ ‫برای‬ ‫که‬m،m/2،segment ‫جفت‬ ‫شونده‬ ‫تکرار‬ ‫بطور‬ ‫و‬ ‫است‬ ‫نیاز‬ ‫مورد‬ segment‫هستند‬ ‫ترین‬ ‫هزینه‬ ‫کم‬ ‫که‬ ‫هایی‬ ‫ا‬ ‫و‬ ‫شوند‬ ‫می‬ ‫ادغام‬ ‫هم‬ ‫با‬‫تا‬ ‫موضوع‬ ‫ین‬ ‫می‬ ‫پیدا‬ ‫ادامه‬ ‫زمانی‬‫تعداد‬ ‫که‬ ‫کند‬ segment.‫باشد‬ ‫نیاز‬ ‫مورد‬ ‫تعداد‬ ‫برابر‬ ‫ها‬ (‫شکل‬5) (‫شکل‬6) Linear Regression -2-4-3: ‫روش‬ ‫این‬،‫ر‬ ‫سری‬‫خطوط‬ ‫بهترین‬ ‫با‬ ‫ا‬‫اتصال‬ ‫می‬ ‫نمایش‬‫که‬ ‫خطی‬ ‫بهترین‬ ‫بعبارتی‬ .‫دهد‬ ‫سری‬ ‫از‬ ‫تقریبی‬ ‫و‬ ‫تخمین‬ ‫دهنده‬ ‫نشان‬ ‫حفظ‬ ‫با‬ ‫ابعاد‬ ‫کاهش‬ ‫این‬ ‫بر‬ ‫عالوه‬ .‫است‬ .‫شود‬ ‫می‬ ‫انجام‬ ‫روش‬ ‫این‬ ‫در‬ ‫برجسته‬ ‫نقاط‬ ‫برجسته‬ ‫نقاط‬ ‫این‬ ‫به‬PIP‫یا‬Perceptually Important Points‫می‬ ‫گفته‬.‫شود‬ ‫زمانی‬ ‫سری‬ ‫در‬𝑃‫با‬𝑛( ‫نقطه‬𝑃 = (𝑝1 … 𝑝𝑛)‫پردازش‬ ‫فرآیند‬ ‫در‬ ‫نقاط‬ ،)PIP ‫جای‬ ،‫نقطه‬ ‫اهمیت‬ ‫به‬ ‫توجه‬ ‫با‬ ‫توانند‬ ‫می‬ .‫کنند‬ ‫عوض‬ ‫را‬ ‫خودشان‬ ‫یعنی‬ ‫داده‬ ‫نقطه‬ ‫اولین‬𝑝1‫یعنی‬ ‫وآخرین‬ 𝑝𝑛‫دومین‬ ‫و‬ ‫اولین‬PIP.‫هستند‬ ‫ها‬PIP ‫نقطه‬ ،‫بعدی‬‫را‬ ‫فاصله‬ ‫بیشترین‬ ‫که‬ ‫است‬ ‫ای‬ ‫دو‬ ‫با‬PIP‫او‬‫چهارم‬ ‫نقطه‬ .‫باشد‬ ‫داشته‬ ‫ل‬ ‫نقطه‬ ،‫با‬ ‫را‬ ‫فاصله‬ ‫بیشترین‬ ‫که‬ ‫است‬ ‫ای‬ ‫دو‬ ‫که‬ ‫خطی‬PIP‫متصل‬ ‫بهم‬ ‫آنرا‬ ‫مجاور‬ .‫باشد‬ ‫داشته‬ ‫کرده‬‫اولین‬ ‫مابین‬ ‫همچنین‬ ‫و‬‫دومین‬PIP.‫باشد‬‫موقعیت‬ ‫پردازش‬ ‫فرآیند‬ PIP‫تعداد‬ ‫زمانیکه‬ ‫تا‬PIP‫بدست‬ ‫نظر‬ ‫مورد‬ ‫سری‬ ‫نقاط‬ ‫تمام‬ ‫یا‬ ‫و‬ ‫بیاید‬P‫لیست‬ ‫به‬ ‫شده‬ ‫مرتب‬L‫پیدا‬ ‫ادامه‬ ،‫شوند‬ ‫الحاق‬ ‫می‬.‫کند‬ ( ‫شکل‬7)‫از‬ ‫نمایشی‬Linear Regression‫با‬7 PIP:‫باشد‬ ‫می‬ (‫شکل‬7) ‫تکنیک‬ ‫حال‬ ‫هر‬ ‫به‬‫بحث‬ ‫برای‬ ‫زیادی‬ ‫های‬ Representation‫حوصله‬ ‫از‬ ‫که‬ ‫است‬ ‫شده‬ ‫مطرح‬ ‫معیار‬ ‫ادامه‬ ‫در‬ .‫است‬ ‫خارج‬ ‫مقاله‬ ‫این‬ .‫داد‬ ‫خواهیم‬ ‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫را‬ ‫شباهت‬ SimilarityMeasure -4: ‫شباهت‬ ‫معیار‬،‫بنیاد‬‫آنالیز‬ ‫برای‬ ‫مهمی‬ ‫سری‬‫و‬ ‫گوناگون‬ ‫زمانی‬ ‫های‬‫ر‬‫وش‬‫های‬ .‫باشد‬ ‫می‬ ‫کاوی‬ ‫داده‬‫در‬‫داده‬ ‫پایگاه‬‫ه‬‫ا‬‫ی‬ ‫مرسوم‬‫دقیق‬ ‫همخوانی‬ ،‫شباهت‬ ‫معیار‬ ، ‫اما‬ ‫است‬ ‫مقادیر‬‫در‬‫داده‬‫زمانی‬ ‫سری‬ ‫های‬ ‫معیار‬ ،‫دارند‬ ‫پیوسته‬ ‫و‬ ‫عددی‬ ‫ماهیتی‬ ‫که‬ .‫است‬ ‫تخمین‬ ‫روش‬ ‫به‬ ‫شباهت‬ ‫س‬ ‫یک‬ ‫در‬ ‫کنید‬ ‫فرض‬‫مربوط‬ ‫زمانی‬ ‫ری‬‫به‬ ‫جو‬ ‫و‬ ‫پرس‬ ‫سهام‬:‫داریم‬ ‫نیاز‬ ‫را‬ ‫زیر‬ ‫های‬ 1-‫تمام‬ ‫کردن‬ ‫پیدا‬‫سهام‬‫که‬ ‫هایی‬ ‫سه‬ ‫شبیه‬‫ا‬‫م‬A.‫هستند‬ 2-‫که‬ ‫سهامدارانی‬ ‫تمام‬ ‫کردن‬ ‫پیدا‬ ‫قیمت‬ ‫مبنای‬ ‫بر‬ ‫خریدشان‬ ‫الگوی‬ ‫های‬ ‫سهام‬ ‫پایانی‬high-tech‫بوده‬ .‫است‬ ‫داده‬‫توانند‬ ‫می‬ ‫ها‬‫شباهت‬ ‫بررسی‬ ‫جهت‬‫به‬ ‫پردازش‬ ‫و‬ ‫سازماندهی‬ ‫مختلف‬ ‫روش‬ ‫دو‬ .‫شوند‬
  • 5. 1-Whole sequence matching‫که‬‫بر‬‫روی‬ ‫داده‬ ‫کل‬‫شباهت‬ ‫زمانی‬ ‫سری‬ ‫های‬ .‫شود‬ ‫می‬ ‫بررسی‬ 2-Subsequence matching‫این‬ ‫در‬ ‫که‬ ‫زیرتوالی‬ ‫اگر‬ ،‫روش‬‫نام‬ ‫به‬ ‫ای‬Q ‫نام‬ ‫به‬ ‫سری‬ ‫و‬ ‫باشیم‬ ‫داشته‬P، ‫می‬ ‫بررسی‬ ‫صورت‬ ‫این‬ ‫به‬ ‫شباهت‬‫شود‬ ‫توالی‬ ‫زیر‬ ‫که‬‫از‬ ‫هایی‬P‫که‬‫با‬Q ‫دارند‬ ‫همخوانی‬‫می‬ ‫انتخاب‬.‫شوند‬ Indexing -5: ‫طرح‬ ‫یک‬Indexing‫می‬ ‫کمک‬ ‫ما‬ ‫به‬‫تا‬ ‫کند‬ ‫کارآمد‬ ‫سازماندهی‬‫داده‬ ‫از‬ ‫ی‬‫ها‬‫منظور‬ ‫به‬ ‫داده‬ ‫سریع‬ ‫بازیابی‬‫دیتابیس‬ ‫از‬ ‫ها‬‫های‬ .‫باشیم‬ ‫داشته‬ ‫بزرگ‬ Data Mining Tasks -6: ‫روش‬‫های‬‫س‬ ‫کاوی‬ ‫داده‬ ‫برای‬ ‫را‬ ‫زیر‬‫ری‬‫های‬ ‫می‬ ‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫زمانی‬:‫دهیم‬ •Query by content •Motif discovery •Clustering •Classification •Prediction (Forecasting) •Summarization(Segmentation) •Anomaly Detection 6-1-Query by content: ‫روش‬ ‫این‬‫مبنای‬ ‫بر‬‫حل‬ ‫راه‬ ‫بازیابی‬‫هایی‬ ‫و‬ ‫پرس‬ ‫به‬ ‫را‬ ‫شباهت‬ ‫بیشترین‬ ‫که‬ ‫است‬‫جوی‬ ( ‫شکل‬ .‫دارند‬ ‫کاربر‬ ‫درخواستی‬8)Query by content‫فضای‬ ‫یک‬ ‫در‬ ‫را‬2‫نشان‬ ‫بعدی‬ ‫می‬:‫دهد‬ (‫شکل‬8) ،‫باال‬ ‫شکل‬ ‫در‬‫سری‬ ‫یک‬ ‫نمایانگر‬ ‫نقطه‬ ‫هر‬ ‫داده‬ ‫از‬‫به‬ ‫توجه‬ ‫با‬ ‫که‬ ‫باشد‬ ‫می‬ ‫های‬ ‫فضای‬ ‫از‬ ‫ای‬ ‫نقطه‬ ‫در‬ ‫آن‬ ‫خصوصیات‬2‫بعدی‬ ‫وارد‬ ‫جو‬ ‫و‬ ‫پرس‬ ‫یک‬ ‫وقتی‬ .‫است‬ ‫گرفته‬ ‫قرار‬ ‫نمایش‬ ‫از‬ ‫شکلی‬ ‫به‬ ‫تبدیل‬ ،‫شود‬ ‫می‬ ‫سیستم‬ (Representation‫که‬ ‫شود‬ ‫می‬ )‫با‬ ‫مقایسه‬ ‫قابل‬ .‫شود‬ ‫دیگر‬ ‫نقاط‬‫مقایسه‬ ‫گونه‬ ‫دو‬ ‫سپس‬ .‫شود‬ ‫انجام‬ ‫تواند‬ ‫می‬Range query‫سری‬ ‫که‬- ‫مشخص‬ ‫فاصله‬ ‫با‬ ‫را‬ ‫هایی‬𝑒‫از‬query‫ما‬ ‫به‬ ‫و‬ ‫دهد‬ ‫می‬k-Nearest- neighborhood‫که‬𝑘‫نقطه‬ ‫با‬ ‫فاصله‬ ‫کمترین‬ ‫که‬ ‫ای‬query‫دارند‬ ‫را‬ ‫می‬ ‫ما‬ ‫به‬.‫دهد‬ 6-2-Clustering: ‫کالسترینگ‬ ‫در‬‫است‬ ‫نقاطی‬ ‫کردن‬ ‫پیدا‬ ‫هدف‬ ‫بیشت‬ ‫که‬‫و‬ ‫دارند‬ ‫بهم‬ ‫را‬ ‫شباهت‬ ‫رین‬ ‫کالستر‬‫با‬ ‫را‬ ‫فاصله‬ ‫بیشترین‬ ‫مختلف‬ ‫های‬ .‫دارند‬ ‫هم‬ (‫شکل‬9) ‫روش‬clustering‫می‬ ‫تقسیم‬ ‫روش‬ ‫زیر‬ ‫دو‬ ‫به‬:‫شود‬ 1-Whole Series Clustering‫یک‬ ‫روش‬ ‫این‬ ‫در‬ ‫سری‬ ‫با‬ ‫کامل‬ ‫بطور‬ ‫زمانی‬ ‫سری‬ ‫و‬ ‫شود‬ ‫می‬ ‫مقایسه‬ ‫دیگر‬ ‫زمانی‬ ‫شبی‬ ‫که‬ ‫آنهایی‬‫یک‬ ‫در‬ ‫هستند‬ ‫هم‬ ‫ه‬ ‫می‬ ‫قرار‬ ‫کالستر‬.‫گیرند‬ 2-Subsequence Clustering‫زیر‬ ‫روش‬ ‫این‬ ‫در‬ ‫توالی‬‫سری‬ ‫از‬ ‫ها‬‫مقایسه‬ ‫و‬ ‫ایجاد‬ ‫ها‬ ‫می‬.‫شوند‬ Classification -3-6: ‫زیرتوالی‬ ‫یا‬ ‫سری‬ ‫به‬ ‫روش‬ ‫این‬ ‫در‬‫هایی‬ ‫یک‬ ‫سری‬ ‫از‬class label‫با‬ .‫شود‬ ‫می‬ ‫داده‬ ‫داده‬ ‫به‬ ‫توجه‬‫که‬ ‫موجود‬ ‫های‬class label- ‫می‬ ‫آموزش‬ ‫مدل‬ ،‫است‬ ‫مشخص‬ ‫شان‬‫بینید‬‫و‬ ‫می‬ ‫سیستم‬ ‫وارد‬ ‫جدیدی‬ ‫سری‬ ‫وقتی‬،‫شود‬ ‫می‬‫مقدار‬ ‫تواند‬class label‫تخمین‬ ‫آنرا‬ .‫بزند‬ ‫شکل‬(11)‫می‬ ‫نشان‬ ‫را‬ ‫فرآیند‬ ‫این‬ :‫دهد‬ (‫شکل‬10)
  • 6. ‫شکل‬a‫می‬ ‫نشان‬ ‫را‬ ‫آموزشی‬ ‫مجموعه‬.‫دهد‬ ‫شکل‬b‫داده‬‫بدون‬ ‫های‬label‫می‬ ‫نشان‬ ‫را‬- .‫است‬ ‫شده‬ ‫سیستم‬ ‫وارد‬ ‫که‬ ‫دهد‬‫شکل‬ ‫در‬ c‫نسبت‬ ‫کالس‬ ‫یک‬ ‫به‬ ‫شده‬ ‫وارد‬ ‫نقطه‬ ‫هر‬ .‫است‬ ‫شده‬ ‫داده‬ Segmentation -7: ‫سری‬ ‫دقیق‬ ‫تخمین‬ ‫روش‬ ‫این‬ ‫هدف‬‫زمانی‬ ‫های‬ ‫کا‬ ‫با‬‫اصلی‬ ‫خصوصیات‬ ‫حالیکه‬ ‫در‬ ‫ابعاد‬ ‫هش‬ ‫آن‬‫حفظ‬‫می‬ ‫است‬ ‫شده‬.‫باشد‬ ‫شکل‬(11)‫سیستم‬ ‫یک‬ ‫خروجی‬segmentation‫را‬ ‫می‬ ‫نشان‬:‫دهد‬ (‫شکل‬11) ‫از‬ ‫سری‬ ‫بازسازی‬ ‫خطای‬ ‫کاهش‬ ‫روش‬ ‫این‬ ‫هدف‬ ‫این‬ ‫برای‬ ‫اصلی‬ ‫راهکار‬ ‫و‬ ‫است‬ ‫اصلی‬ ‫سری‬ ‫روش‬ ‫شود‬ ‫می‬ ‫استفاده‬ ‫سالهاست‬ ‫که‬ ‫موضوع‬ PLA‫های‬ ‫روش‬ ‫(از‬representation‫پیش‬ ‫که‬ ‫است‬ ) ‫صحبت‬ ‫آن‬ ‫به‬ ‫راجع‬ ‫تر‬.‫کردیم‬ Prediction -1-7: ‫سری‬ ‫در‬ ‫مهم‬ ‫های‬ ‫روش‬ ‫از‬ ‫یکی‬‫زمانی‬ ‫های‬ ‫اس‬‫سری‬ ‫زیر‬ ‫یا‬ ‫سری‬ ‫کمک‬ ‫به‬ ‫آن‬ ‫در‬ ‫و‬ ‫ت‬‫ها‬ ‫مقاد‬ ، ‫موجود‬ ‫مقادیر‬ ‫و‬‫آینده‬ ‫یر‬ ‫زیر‬ ‫و‬ ‫ها‬ ‫سری‬ ‫و‬ ‫متغیرها‬‫بینی‬ ‫پیش‬ ‫ها‬ ‫سری‬ .‫شود‬ ‫می‬ ‫زده‬ ‫تخمین‬ ‫و‬ ‫شکل‬(12)‫می‬ ‫نشان‬ ‫را‬ ‫بینی‬ ‫پیش‬ ‫سناریوی‬ :‫دهد‬ (‫شکل‬12) Anomaly Detection -2-7: ‫توالی‬ ‫زیر‬ ‫روش‬ ‫دراین‬‫با‬ ‫که‬ ‫سری‬ ‫های‬ ‫تفاوت‬ ‫سری‬ ‫نرمال‬ ‫حالت‬‫مالجظه‬ ‫قابل‬ ‫می‬ ‫شناسایی‬ ‫را‬ ‫دارند‬.‫کنیم‬‫شکل‬(13) ‫می‬ ‫روش‬ ‫این‬ ‫برای‬ ‫مثالی‬:‫باشد‬ (‫شکل‬13) Motif Discovery -3-7: ‫توالی‬ ‫زیر‬ ‫کردن‬ ‫پیدا‬ ‫هدف‬‫که‬ ‫است‬ ‫هایی‬ ‫د‬ ‫پیوسته‬‫تکرار‬ ‫بزرگتر‬ ‫زمانی‬ ‫سری‬ ‫یک‬ ‫ر‬ ‫شده‬‫ها‬ ‫زیرتوالی‬ ‫این‬ ‫به‬ . .‫اند‬motif‫می‬ .‫گویند‬ ‫شکل‬(11)‫این‬‫می‬ ‫نشان‬ ‫را‬ ‫موضوع‬:‫دهد‬ (‫شکل‬14) ‫بینی‬ ‫پیش‬ ‫به‬ ‫راجع‬ ‫خواهیم‬ ‫می‬ ‫ادامه‬ ‫در‬ ‫کمک‬ ‫به‬ ‫سهام‬ ‫بازار‬TimeSeries data mining ‫نمونه‬ ‫بازار‬ ‫یک‬ ‫ادامه‬ ‫در‬ ‫و‬ ‫کنیم‬ ‫صحبت‬ ‫می‬ ‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫را‬.‫دهیم‬ ‫با‬ ‫سهام‬ ‫بازار‬ ‫بینی‬ ‫پیش‬ ‫از‬ ‫استفاده‬Time Series Data Mining: ‫برای‬ ‫جذاب‬ ‫موضوعات‬ ‫از‬ ‫یکی‬‫محققان‬‫در‬ ‫بینی‬ ‫پیش‬ ، ‫سالها‬ ‫طی‬ ‫در‬ ،‫مالی‬ ‫امور‬ ‫این‬ ‫نتایج‬ ‫و‬ .‫است‬ ‫سهام‬ ‫آینده‬ ‫قیمت‬ ‫فروش‬ ‫و‬ ‫خرید‬ ‫در‬ ‫فعاالن‬ ‫به‬ ‫تحقیقات‬ ‫برای‬ ‫مناسب‬ ‫زمان‬ ‫تا‬ ‫کند‬ ‫می‬ ‫کمک‬ ‫سهام‬ ‫و‬ ‫بزنند‬ ‫تخمین‬ ‫را‬ ‫سهام‬ ‫فروش‬ ‫و‬ ‫خرید‬ .‫کنند‬ ‫گیری‬ ‫تصمیم‬ ‫آن‬ ‫مبنای‬ ‫بر‬ ‫می‬ ‫ما‬‫سری‬ ‫کاوی‬ ‫داده‬ ‫روش‬ ‫هر‬ ‫از‬ ‫توانیم‬ ‫ب‬ ‫پیش‬ ‫برای‬ ‫زمانی‬‫سهام‬ ‫آینده‬ ‫ارزش‬ ‫ینی‬ .‫بگیریم‬ ‫کمک‬‫از‬ ‫ما‬ ‫مقاله‬ ‫این‬ ‫در‬ ‫رگرسیون‬ ‫آنالیز‬‫های‬ ‫روش‬ ‫از‬ ‫که‬ Prediction‫است‬‫مقادیر‬ ‫بینی‬ ‫پیش‬ ‫برای‬ ‫نیجریه‬ ‫بازار‬ ‫در‬ ‫سهام‬ ‫قیمت‬ ‫آینده‬ ‫کرده‬ ‫استفاده‬.‫ایم‬ ‫اطالعات‬ ‫ازخالصه‬ ‫کار‬ ‫این‬ ‫برای‬ ‫ما‬ ‫درتبادالت‬ ‫ها‬ ‫قیمت‬ ‫هفتگی‬ ‫و‬ ‫روزانه‬ ‫نیجریه‬ ‫سهام‬ ‫بازار‬‫برای‬3‫به‬ ‫سهام‬
  • 7. ‫های‬ ‫نام‬First Bank of Nigeria Plc, Zenith Bank Plc, and Skye Bank‫کرده‬ ‫استفاده‬.‫ایم‬ Linear Regression‫تکنیک‬ ‫ترین‬ ‫رایج‬ ‫از‬ ‫یکی‬- ‫ارزش‬ ‫بینی‬ ‫پیش‬ ‫برای‬ ‫کاوی‬ ‫داده‬ ‫های‬ ‫مشخصه‬‫مقادیر‬ ‫مبنای‬ ‫بر‬ ‫ها‬‫مش‬‫خ‬‫صه‬‫های‬ ‫است‬ ‫دیگر‬‫این‬ ‫از‬ ‫مثال‬ ‫این‬ ‫در‬ ‫ما‬ ‫و‬ ‫می‬ ‫روش‬.‫کنیم‬ ‫استفاده‬ ‫خواهیم‬ ‫ممکن‬ ‫مقادیر‬ ‫از‬ ‫تخمینی‬ ‫که‬ ‫رگرسیون‬ ‫خط‬ :‫است‬ ‫زیر‬ ‫فرمول‬ ‫به‬ ،‫است‬ ‫سری‬ ‫یک‬ 𝑌 = 𝑎𝑥 + 𝑏 ‫آن‬ ‫در‬ ‫که‬𝑌،‫وابسته‬ ‫متغیر‬𝑥‫متغیر‬ ‫و‬ ‫مستقل‬𝑎‫و‬ ‫خط‬ ‫ضریب‬𝑏‫مبدا‬ ‫از‬ ‫عرض‬ .‫است‬ ‫خط‬ ‫مقدار‬𝑎‫و‬𝑏‫فرمول‬ ‫از‬‫های‬‫زیر‬ ‫شو‬ ‫می‬ ‫محاسبه‬‫ن‬:‫د‬ Y،‫سهام‬ ‫فعلی‬ ‫قیمت‬ ‫کننده‬ ‫مشخص‬x ‫مقدار‬P.E، ‫سود‬ ‫به‬ ‫قیمت‬ ‫نسبت‬ ‫یا‬𝑦̅ ‫سهام‬ ‫های‬ ‫قیمت‬ ‫میانگین‬𝑥̅‫میانگین‬P.E ‫و‬n‫در‬ ‫دخیل‬ ‫سهام‬ ‫های‬ ‫قیمت‬ ‫تعداد‬ .‫باشد‬ ‫می‬ ‫فرمول‬ ‫برای‬ ‫که‬ ‫ای‬ ‫داده‬3‫جمع‬ ‫نظر‬ ‫مورد‬ ‫سهام‬ ‫صورت‬ ‫به‬ ‫است‬ ‫شده‬ ‫آوری‬( ‫جدول‬1):‫است‬ ( ‫جدول‬1) ‫اطالعات‬ ‫به‬ ‫توجه‬ ‫با‬ ‫خواهیم‬ ‫می‬ ‫ما‬ ‫حاال‬ ‫برای‬ ‫را‬ ‫رگرسیون‬ ‫خط‬ ، ‫باال‬3‫بانک‬ .‫کنیم‬ ‫فرموله‬ ‫نظر‬ ‫مورد‬ ‫کار‬ ‫این‬ ‫مثال‬ ‫طور‬ ‫به‬‫بانک‬ ‫برای‬ ‫را‬ ‫این‬ ‫جزئیات‬ .‫ایم‬ ‫داده‬ ‫انجام‬ ‫اول‬ ‫می‬ ‫را‬ ‫محاسبه‬( ‫جدول‬ ‫در‬ ‫توانید‬2) .‫کنید‬ ‫مشاهده‬ ‫جدول‬(2) ‫مقدار‬ ‫اینجا‬ ‫تا‬a‫و‬b‫محاسبه‬ ‫را‬ ‫خط‬ ‫فرمول‬ ‫در‬ ‫جایگذاری‬ ‫با‬ ‫حاال‬ .‫کردیم‬ :‫رسیم‬ ‫می‬ ‫زیر‬ ‫فرمول‬ ‫به‬ ‫برا‬ ‫را‬ ‫رگرسیون‬ ‫خط‬ ‫فرمول‬ ‫ترتیب‬ ‫بهمین‬ ‫ی‬2.‫میکنیم‬ ‫محاسبه‬ ‫دیگر‬ ‫سهام‬ ‫مقدار‬ ‫وقتی‬ ،‫ها‬ ‫فرمول‬ ‫این‬ ‫داشتن‬ ‫با‬ ‫مقدار‬ ‫واقع‬ ‫در‬ ،‫شود‬ ‫سیستم‬ ‫وارد‬ ‫جدیدی‬ P.E‫بر‬ ‫جدیدی‬‫محاسبه‬ ‫نظر‬ ‫مورد‬ ‫سهام‬ ‫ای‬ ‫می‬ ،‫شود‬‫در‬ ‫آن‬ ‫جایگذاری‬ ‫با‬ ‫توانیم‬ ‫جای‬ ‫باال(به‬ ‫فرمول‬x( ‫سهام‬ ‫ارزش‬ )y) .‫بزنیم‬ ‫تخمین‬ ‫را‬ ‫از‬ ‫آمده‬ ‫بدست‬ ‫فرمول‬ ‫زیر‬ ‫در‬3‫سهام‬ :‫ایم‬ ‫کرده‬ ‫محاسبه‬ ‫را‬ ‫نظر‬ ‫مورد‬ •First Bank Plc •𝑦 = 35.85 + 0.12𝑥 •Skye Bank Plc
  • 8. •𝑦 = 30.97 − 0.64𝑥 •Zenith Bank Plc •𝑦 = 14.39 + 1.16𝑥 -8:‫گیری‬ ‫نتیجه‬ ‫امروزه‬‫طور‬ ‫به‬ ‫زمانی‬ ‫سری‬ ‫های‬ ‫داده‬ ‫مخ‬ ‫موضوعات‬ ‫در‬ ‫گسترده‬‫ت‬‫الخصوص‬ ‫علی‬ ‫لف‬ ‫و‬ ‫هستند‬ ‫مطرح‬ ‫علمی‬ ‫و‬ ‫مالی‬ ‫مباحث‬ ‫این‬ ‫باالی‬ ‫حجم‬ ‫بعلت‬ ‫اما‬ .‫دارند‬ ‫کاربرد‬ ‫بروز‬ ‫ضرورت‬ ‫و‬ ‫زیاد‬ ‫ابعاد‬ ‫و‬ ‫اطالعات‬ ‫به‬ ‫نیاز‬ ،‫ها‬ ‫داده‬ ‫این‬ ‫مداوم‬ ‫رسانی‬ ‫صورت‬ ‫به‬ ‫بتوانند‬ ‫که‬ ‫است‬ ‫هایی‬ ‫تکنیک‬ ‫پرکا‬ ‫و‬ ‫مفید‬ ‫الگوهای‬ ‫خودکار‬‫ربر‬‫د‬‫را‬ ‫کشف‬ ‫ها‬ ‫داده‬ ‫عظیم‬ ‫حجم‬ ‫این‬ ‫دل‬ ‫از‬ ‫داده‬ ‫های‬ ‫تکنیک‬ ‫بنابراین‬ .‫نمایند‬ ‫بسیار‬ ‫تواند‬ ‫می‬ ‫ها‬ ‫داده‬ ‫این‬ ‫روی‬ ‫کاوی‬ .‫باشند‬ ‫اهمیت‬ ‫با‬ ‫این‬ ‫در‬ ‫کاوی‬ ‫داده‬ ‫از‬ ‫خاص‬ ‫طور‬ ‫به‬ ‫ما‬ ‫بینی‬ ‫پیش‬ ‫و‬ ‫سهام‬ ‫بازار‬ ‫در‬ ‫ها‬ ‫سری‬ ‫تکنیک‬ ‫کمک‬ ‫به‬ ‫سهام‬ ‫آینده‬ ‫قیمت‬ ‫یعنی‬ ‫آن‬ ‫نوع‬ ‫ترین‬ ‫ساده‬ ‫و‬ ‫رگرسیون‬ ‫رگرسیو‬‫اما‬ .‫کردیم‬ ‫استفاده‬ ‫خطی‬ ‫ن‬ ‫ما‬ ‫که‬ ‫بود‬ ‫این‬ ‫داشت‬ ‫وجود‬ ‫که‬ ‫موضوعی‬ ‫از‬ ‫توانستیم‬ ‫می‬ ‫نظرمان‬ ‫مورد‬ ‫هدف‬ ‫برای‬ ‫نیز‬ ‫دیگری‬ ‫کاوی‬ ‫داده‬ ‫تکنیک‬ ‫هر‬ .‫نماییم‬ ‫استفاده‬ ‫ما‬ ‫به‬ ‫که‬ ‫مدلی‬ ‫آوردن‬ ‫بدست‬ ‫نهایت‬ ‫در‬ ‫یک‬ ‫سهام‬ ‫آینده‬ ‫وضعیت‬ ‫بینی‬ ‫پیش‬ ‫در‬ ‫این‬ ‫به‬ ‫منجر‬ ‫تواند‬ ‫می‬ ‫کند‬ ‫کمک‬ ‫شرکت‬ ‫ا‬ ‫ذینفعان‬ ‫که‬ ‫شود‬‫بتوانند‬ ‫بازار‬ ‫ین‬ ‫و‬ ‫خرید‬ ‫برای‬ ‫موقعی‬ ‫به‬ ‫و‬ ‫درست‬ ‫تصمیمات‬ .‫بگیرند‬ ‫هایشان‬ ‫سهام‬ ‫فروش‬ ‫مر‬‫ا‬‫جع‬: [1] Tak-chung Fu, A review on time series data mining, Department of Computing, Hong Kong Polytechnic University, Hunghom, Kowloon, Hong Kong, Elsevier Publications, 2011 [2] PHILIPPE ESLING and CARLOS AGON, Time-Series Data Mining,Institut de Recherche et Coordination, ACM Computing Surveys, 2012 [3] S AbdulsalamSulaiman Olaniyi, Adewole, Kayode S., Jimoh, R. G, Stock Trend Prediction Using Regression Analysis – A Data Mining Approach,AJSS Journal, 2010-11