SlideShare a Scribd company logo
1 of 36
‫زمانی‬ ‫های‬ ‫سری‬ ‫کاوش‬
‫زروانی‬ ‫مارال‬–‫سارا‬‫صابری‬
‫پور‬ ‫کیوان‬ ‫رضا‬ ‫محمد‬ ‫دکتر‬
1
‫تعالی‬ ‫بسمه‬
‫زمانی‬ ‫های‬ ‫سری‬
‫تعریف‬
•‫زمانی‬ ‫فواصل‬ ‫در‬ ‫که‬ ‫آماری‬ ‫های‬ ‫داده‬ ‫از‬ ‫ای‬ ‫دنباله‬
‫اند‬ ‫شده‬ ‫آوری‬ ‫جمع‬ ‫منظم‬ ‫و‬ ‫مساوی‬.
•‫مقادیر‬ ‫از‬ ‫شده‬ ‫مرتب‬ ‫ی‬ ‫دنباله‬ ‫یک‬ ‫دیگر‬ ‫بیان‬ ‫به‬
‫سرعت‬ ،‫خون‬ ‫فشار‬ ،‫هوا‬ ‫دمای‬ ‫مانند‬ ‫تصادفی‬ ‫متغیر‬ ‫یک‬
‫و‬ ‫باد‬...‫میباشد‬.
‫ها‬ ‫سری‬ ‫انواع‬
•‫گسسته‬:‫باشند‬ ‫خاصی‬ ‫زمان‬ ‫یک‬ ‫به‬ ‫مربوط‬ ‫مشاهدات‬.‫نرخ‬
‫سهام‬ ‫در‬ ‫بهره‬
•‫پیوسته‬:‫و‬ ‫دار‬ ‫دنباله‬ ‫صورت‬ ‫به‬ ‫زمان‬ ‫واحد‬ ‫در‬ ‫مشاهدات‬
‫باشند‬ ‫پیوسته‬.‫مانند‬‫جریان‬ ‫و‬ ‫ولتاژ‬‫الکتریکی‬
‫ها‬ ‫ویژگی‬
•‫ابتدا‬‫دارند‬ ‫مشخصی‬ ‫انتهای‬ ‫و‬.
•‫نیستند‬ ‫مستقل‬.
0 50 100 150 200 250 300 350 400 450 500
23
24
25
26
27
28
29
25.1750
25.2250
25.2500
25.2500
25.2750
25.3250
25.3500
25.3500
25.4000
25.4000
25.3250
25.2250
25.2000
25.1750
..
..
24.6250
24.6750
24.6750
24.6250
24.6250
24.6250
24.6750
24.7500
2
‫کاربرد‬ ‫های‬ ‫حوزه‬
‫پزشکی‬ ‫ی‬ ‫حوزه‬
‫بیماران‬ ‫مغزی‬ ‫و‬ ‫قلبی‬ ‫های‬ ‫سیگنال‬ECG‫و‬EEG
‫امورمالی‬ ‫ی‬ ‫حوزه‬
‫بازار‬ ‫قیمت‬ ،‫تورم‬ ،‫سهام‬ ‫بازار‬ ‫بررسی‬
‫هواشناسی‬
‫هوا‬ ‫دمای‬ ‫بینی‬ ‫پیش‬ ،‫ناگهانی‬ ‫تغییرات‬ ‫بینی‬ ‫پیش‬
‫نگاری‬ ‫لرزه‬
‫جنایات‬ ‫بینی‬ ‫پیش‬ ‫و‬ ‫کشف‬
3
‫زمانی‬ ‫های‬ ‫سری‬ ‫تنوع‬:
‫کاوی‬ ‫تصویر‬
4
0 10 20 30 40 50 60 70 80 90
Hand at rest
Hand moving
to shoulder
level
Steady
pointing
0 10 20 30 40 50 60 70 80 90
Hand at rest
Hand moving
above holster
Hand moving
down to grasp
gun
Hand moving to
shoulder level
Steady
pointing
Point
Gun-Draw
‫های‬ ‫سری‬ ‫تنوع‬‫زمانی‬:‫تصویرکاوی‬
5
‫تجزیه‬‫زمانی‬ ‫های‬ ‫سری‬ ‫تحلیل‬ ‫و‬
‫تعریف‬
‫به‬‫با‬ ،‫داده‬ ‫مفهوم‬ ‫درک‬ ‫جهت‬ ‫شده‬ ‫گرفته‬ ‫کار‬ ‫به‬ ‫های‬ ‫روش‬ ‫تمام‬
‫داده‬ ‫گویی‬ ‫پیش‬ ‫برای‬ ‫تالش‬ ‫یا‬ ‫داده‬ ‫تولید‬ ‫سیستم‬ ‫اساس‬ ‫توضیح‬ ‫هدف‬
‫گفته‬ ‫زمانی‬ ‫سری‬ ‫تحلیل‬ ،‫زمانی‬ ‫سری‬ ‫ی‬ ‫آینده‬ ‫به‬ ‫مربوط‬ ‫های‬
‫میشود‬.
‫تحلیل‬ ‫و‬ ‫تجزیه‬ ‫اهداف‬
•‫توصیف‬
•‫سازی‬ ‫مدل‬
•‫پیش‬‫بینی‬
•‫کنترل‬
‫طول‬ ‫در‬ ‫متغیر‬ ‫یک‬ ‫رفتار‬ ‫توصیف‬
‫زمان‬
‫آینده‬ ‫مقادیر‬ ‫از‬ ‫تخمینی‬ ‫داشتن‬
‫متغیر‬ ‫ی‬
‫الگو‬ ‫کشف‬
‫طول‬ ‫در‬ ‫متغیر‬ ‫پویایی‬ ‫بررسی‬
‫مقاومت‬ ‫منظور‬ ‫به‬ ‫زمان‬‫در‬
‫آینده‬ ‫احتمالی‬ ‫های‬ ‫شوک‬ ‫برابر‬
6
‫سری‬ ‫های‬ ‫مولفه‬
‫زمانی‬ ‫روند‬ ‫یا‬ ‫بلندمدت‬ ‫نوسانات‬(Trend):‫به‬ ‫زمانی‬ ‫سری‬ ‫تمایل‬
‫بودن‬ ‫ثابت‬ ‫حتی‬ ‫یا‬ ‫کاهش‬ ،‫افزایش‬.
‫تناوبی‬ ‫نوسانات‬(:(Cyclic‫مقاطع‬ ‫در‬ ‫تکراری‬ ‫و‬ ‫یکسان‬ ‫تغییرات‬
‫مدت‬‫میان‬.
‫فصلی‬ ‫نوسانات‬(Seasonal:)‫یک‬ ‫از‬ ‫تر‬‫کوتاه‬ ‫ای‬‫دوره‬ ‫در‬ ‫که‬ ‫تغییراتی‬
‫دهد‬‫می‬ ‫رخ‬ ‫تکراری‬ ‫صورت‬ ‫به‬ ‫تناوب‬.
‫نامعمول‬ ‫نوسانات‬Irregular):)‫عوامل‬ ‫اثر‬ ‫بر‬ ‫تغییرات‬ ‫گونه‬ ‫این‬
‫شوند‬‫می‬ ‫ایجاد‬ ‫بینی‬‫پیش‬ ‫غیرقابل‬ ‫و‬ ‫تصادفی‬. ‫مدل‬‫های‬‫سری‬
‫زمانی‬
‫معمول‬ ‫مدل‬ ‫دو‬
‫ها‬ ‫مولفه‬ ‫ضرب‬ ‫حاصل‬
‫ها‬ ‫مولفه‬ ‫جمع‬ ‫حاصل‬
7
‫های‬ ‫سری‬ ‫کاوش‬
‫زمانی‬
‫تعریف‬
‫خصوصیات‬‫ویژه‬‫ی‬‫سری‬‫های‬‫زمانی‬‫از‬‫قبیل‬‫حجم‬‫زیاد‬‫داده‬‫ها‬،
‫ابعاد‬‫زیاد‬‫و‬‫ضرورت‬‫بروز‬‫رسانی‬‫مداوم‬‫و‬‫از‬‫طرفی‬‫ماهیت‬‫عددی‬‫و‬
‫پیوسته‬‫آنها‬‫باعث‬‫استفاده‬‫از‬‫تکنیک‬‫های‬‫تحلیل‬‫داده‬(Data Mining)
‫در‬‫کاوش‬‫این‬‫نوع‬‫از‬‫داده‬‫ها‬‫شد‬.
‫مراحل‬‫اصلی‬
‫ها‬ ‫داده‬ ‫آوری‬ ‫جمع‬
‫پردازش‬ ‫پیش‬
‫شباهت‬‫سنجی‬
‫کاوی‬ ‫داده‬ ‫های‬ ‫تکنیک‬
8
‫آوری‬ ‫جمع‬
‫دیتا‬ ‫نظر‬ ‫مورد‬ ‫رویداد‬ ‫شناسایی‬
‫تعیین‬‫پارامترهایی‬‫که‬‫میخواهیم‬‫عملیات‬‫کاوش‬‫روی‬‫آنها‬‫انجام‬
‫بدهیم‬.
‫داده‬ ‫آوری‬ ‫جمع‬
‫داده‬‫ها‬‫از‬‫طریق‬‫حسگرها‬‫و‬‫یا‬‫سیستم‬‫های‬‫ناظر‬‫در‬‫بازه‬‫های‬
‫زمانی‬‫منظم‬‫جمع‬‫آوری‬‫میشوند‬.
‫ی‬ ‫ذخیره‬‫ها‬ ‫داده‬
•‫برای‬‫استفاده‬ ‫زمانی‬ ‫سری‬ ‫های‬ ‫دیتابیس‬ ‫از‬ ‫ها‬ ‫داده‬ ‫ی‬ ‫ذخیره‬
‫میکنند‬.
•‫زمان‬key value‫حساب‬‫میشود‬.
9
‫پردازش‬ ‫پیش‬(Preprocess)
‫استخراج‬‫ویژگی‬
‫نرمالیزه‬‫کردن‬
‫حذف‬‫نویز‬:‫استفاده‬‫از‬‫فیلتر‬‫های‬‫موجک‬‫و‬...
‫انتخاب‬‫ویژگی‬:‫بازنمایی‬‫داده‬‫ها‬‫از‬‫طریق‬‫انتخاب‬‫ویژگی‬
‫های‬‫پراهمیت‬
‫هدف‬،‫کاهش‬‫ابعاد‬(Dimension Reduction)‫سری‬‫زمانی‬‫است‬‫زیرا‬‫اجرای‬
‫الگوریتم‬‫ها‬‫روی‬‫داده‬‫های‬‫خام‬‫به‬‫علت‬‫حجم‬‫زیاد‬‫آنها‬
‫پرهزینه‬‫است‬.
‫یکی‬‫از‬‫مشکالت‬‫عمده‬‫علوم‬،‫کامپیوتر‬‫انتخاب‬‫روش‬‫مناسب‬‫و‬
‫کارآمد‬‫برای‬‫بازنمایی‬(Representation)‫داده‬‫های‬‫سری‬‫زمانی‬‫است‬.
‫یک‬‫تکنیک‬‫بازنمایی‬‫باید‬‫بتواند‬‫ویژگی‬‫ها‬‫ی‬‫سری‬‫زمانی‬‫را‬
‫حفظ‬‫کند‬.
10
‫برخی‬‫ها‬ ‫روش‬ ‫ترین‬ ‫رایج‬ ‫از‬:
 Sampling Non-Adaptive
 Piecewise Aggregate Approximation (PAA) Non-Adaptive
 Adaptive Piecewise Constant Approximation (APCA)
11
‫بازنمایی‬ ‫های‬ ‫تکنیک‬
(Representation)
sampling PAA
‫سنجی‬ ‫شباهت‬(Similarity)
‫کاوش‬ ‫در‬ ‫که‬ ‫کارهایی‬ ‫تمامی‬ ‫برای‬ ‫مناسب‬ ‫شباهت‬ ‫معیار‬ ‫از‬ ‫استفاده‬
‫است‬ ‫واجب‬ ‫میدهیم‬ ‫انجام‬ ‫زمانی‬ ‫سری‬.
‫میشود‬ ‫انجام‬ ‫صورت‬ ‫دو‬ ‫به‬ ‫سنجی‬ ‫شباهت‬ ‫کلی‬ ‫طور‬ ‫به‬:
Whole sequence matching -1
‫بر‬‫روی‬‫بررسی‬ ‫شباهت‬ ‫زمانی‬ ‫سری‬ ‫های‬ ‫داده‬ ‫کل‬‫شود‬ ‫می‬.
Subsequence matching -2
‫روش‬ ‫این‬ ‫در‬،‫نام‬ ‫به‬ ‫زیرتوالی‬ ‫اگریک‬Q‫داشته‬‫باشیم‬‫یک‬ ‫و‬‫به‬ ‫سری‬
‫نام‬P‫که‬ ‫میشود‬ ‫بررسی‬ ‫صورت‬ ‫این‬ ‫به‬ ‫شباهت‬ ،‫زیر‬‫از‬ ‫هایی‬ ‫توالی‬P
‫با‬ ‫که‬Q‫میشوند‬ ‫انتخاب‬ ‫دارند‬ ‫همخوانی‬.
12
Q
C
D(Q,C)
    

n
i
ii cqCQD
1
2
,
‫زمانی‬ ‫سری‬ ‫دو‬C‫و‬Q‫داریم‬:
Q = q1…qn
C = c1…cn
‫زیر‬ ‫فرمول‬ ‫از‬ ‫سری‬ ‫دو‬ ‫این‬ ‫ی‬ ‫فاصله‬
‫میشود‬ ‫محاسبه‬:
13
‫معیار‬
‫شباهت‬
‫اقلیدسی‬ ‫ی‬ ‫فاصله‬Euclidean
Distance Metric
14
‫اقلیدسی‬ ‫فاصله‬ ‫بررسی‬
‫باید‬ ‫و‬ ‫است‬ ‫ضعیف‬ ‫زمانی‬ ‫های‬ ‫سری‬ ‫سنجی‬ ‫شباهت‬ ‫برای‬ ‫معیار‬ ‫این‬
‫حذف‬ ،‫کردن‬ ‫نرمالیزه‬ ‫جمله‬ ‫از‬ ‫تبدیالتی‬ ‫آن‬ ‫ی‬ ‫محاسبه‬ ‫از‬ ‫قبل‬
‫و‬ ‫نویز‬...‫شود‬ ‫انجام‬ ‫ها‬ ‫داده‬ ‫روی‬.
Linear trendDenoising
Normalize
‫بعضی‬ ‫سنجی‬ ‫شباعت‬ ‫برای‬ ‫نبودن‬ ‫پویا‬ ‫علت‬ ‫به‬ ‫اقلیدسی‬ ‫ی‬ ‫فاصله‬
‫نیست‬ ‫مناسب‬ ‫ها‬ ‫سری‬.
15
‫معیار‬
‫شباهت‬ ‫پویا‬ ‫زمانی‬ ‫تاب‬ ‫و‬ ‫پیچ‬Dynamic Time
Warping
‫کاوی‬ ‫داده‬ ‫وظایف‬ [1]
‫بندی‬ ‫طبقه‬Classification
‫بندی‬ ‫خوشه‬Clustering
‫نامتعارف‬ ‫رویدادهای‬ ‫تشخیص‬Anomaly Detection
‫پرتکرار‬ ‫الگوهای‬ ‫تشخیص‬Motif Discovery
‫قواعد‬ ‫تشخیص‬Rule Discovery
‫بندی‬ ‫قطعه‬Segmentation
‫بینی‬ ‫پیش‬Prediction
16
‫بندی‬ ‫طبقه‬ [2]
‫سری‬ ‫کل‬ ‫اساس‬ ‫بر‬(Whole Series)
‫زمانی‬ ‫ی‬ ‫بازه‬ ‫چند‬ ‫یا‬ ‫یک‬ ‫اساس‬ ‫بر‬(Intervals)
‫دنباله‬ ‫زیر‬ ‫یک‬ ‫اساس‬ ‫بر‬((Shapelet
‫زیردنباله‬ ‫تکرار‬ ‫تعداد‬ ‫اساس‬ ‫بر‬(Dictionary Based)
‫باال‬ ‫معیارهای‬ ‫از‬ ‫ترکیبی‬(Combination)
‫مدل‬ ‫اساس‬ ‫بر‬(Model Based)
Whole series
intervals
shapelet
17
18
‫دسته‬ ‫مسائل‬ ‫که‬ ‫هاست‬ ‫داده‬ ‫تحلیل‬ ‫برای‬ ‫ابزاری‬ ‫بندی‬ ‫خوشه‬
‫می‬ ‫حل‬ ‫را‬ ‫بندی‬‫کندو‬‫آن‬ ‫هدف‬‫موارد‬ ‫توزیع‬‫می‬ ‫گروه‬ ‫چند‬ ‫در‬
‫باشد‬(‫افراد،اشیا،رویدادها‬)‫به‬‫از‬ ‫قوی‬ ‫ای‬ ‫درجه‬ ‫که‬ ‫طوری‬
‫مشابه‬ ‫های‬ ‫خوشه‬ ‫از‬ ‫اعضایی‬ ‫تواندمیان‬ ‫می‬ ‫ارتباط‬‫و‬‫درجه‬
‫باشد‬ ‫متفاوت‬ ‫های‬ ‫خوشه‬ ‫اعضای‬ ‫میان‬ ‫ضعیف‬.
19
‫بندی‬ ‫]3[خوشه‬
‫زمانی‬ ‫سری‬ ‫در‬ ‫بندی‬ ‫خوشه‬ ‫انواع‬
‫افراز‬ ‫مبتی‬ ‫بندی‬ ‫خوشه‬
‫مراتبی‬ ‫سلسله‬ ‫بندی‬ ‫خوشه‬
Whole Series Clustering
Subsequence Clustering
‫زمانی‬ ‫سری‬ ‫یک‬ ‫روش‬ ‫این‬ ‫در‬
‫سری‬ ‫با‬ ‫کامل‬ ‫بطور‬‫زمانی‬
‫و‬ ‫شود‬ ‫می‬ ‫مقایسه‬ ‫دیگر‬
‫هستند‬ ‫هم‬ ‫شبیه‬ ‫که‬ ‫آنهایی‬
‫یک‬ ‫در‬‫قرار‬ ‫خوشه‬
‫میگیرند‬.
‫ها‬ ‫زیرتوالی‬ ‫روش‬ ‫این‬ ‫در‬
‫و‬ ‫ایجاد‬ ‫ها‬ ‫سری‬ ‫از‬
‫مقایسه‬
‫میشوند‬.
20
Feature base
Model base
Raw_data based
21
‫الگوریتم‬
‫]4[ها‬
‫روش‬ ‫سنتی‬ ‫های‬ ‫روش‬ ‫به‬ ‫متفاوتی‬ ‫های‬ ‫روش‬ ‫حوزه‬ ‫این‬ ‫در‬
‫مانند‬ ‫هایی‬:
ECTS(Early classification time series)
Sum Time-Mousam
ARIMA
‫فازی‬ ‫منطق‬ ‫و‬ ‫رویکرد‬ ‫اساس‬ ‫بر‬ ‫پیشگویی‬
22
‫تکرار‬ ‫پر‬ ‫های‬ ‫الگو‬ ‫کشف‬(Motifs)
‫توالی‬ ‫زیر‬ ‫کردن‬ ‫پیدا‬ ‫هدف‬‫است‬ ‫هایی‬‫که‬‫پیوسته‬‫در‬
‫شوند‬ ‫می‬ ‫تکرار‬ ‫زمانی‬ ‫سری‬.
‫دنباله‬ ‫زیر‬ ‫این‬ ‫به‬‫ها‬"Motif"‫می‬‫گویند‬.
‫الهام‬ ‫ایده‬ ‫این‬‫از‬ ‫گرفته‬‫بررسی‬ ‫و‬ ‫تحلیل‬ ‫پروژه‬
‫باشد‬ ‫می‬ ‫انفورماتیک‬ ‫بیو‬ ‫در‬ ‫ها‬ ‫ژن‬.
‫تشخیص‬ ‫در‬ ‫کاربرد‬‫طبقه‬ ‫و‬ ‫بندی‬ ‫خوشه‬ ،‫آنومالی‬‫بندی‬
‫است‬.
GACATAATAACCAGCTATCTGCTCGCATCGCCGCGACATAGCT
0 10 20 30 40 50 60
-2
-1
0
1
2
23
Winding Dataset
(The angular speed of reel 2)
0 500 1000 1500 2000 2500
0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
A B C
A B C
24
‫تشخیص‬‫آنومالی‬
‫زیر‬ ‫روش‬ ‫دراین‬‫های‬ ‫توالی‬‫که‬ ‫سری‬‫حالت‬ ‫با‬‫نرمال‬
‫قابل‬ ‫تفاوت‬ ‫سری‬‫ای‬ ‫مالجظه‬‫شناسایی‬ ‫را‬ ‫دارند‬‫می‬
‫کنیم‬.
‫روش‬‫معمول‬‫برای‬‫تشخیص‬،‫آنومالی‬‫استخراج‬‫یک‬‫مدل‬‫از‬
‫رفتارنرمال‬‫های‬‫سری‬‫زمانی‬‫و‬‫سپس‬
‫یافتن‬‫نرمال‬ ‫حالت‬ ‫با‬ ‫زیادی‬ ‫اختالف‬ ‫که‬ ‫ای‬ ‫دنبال‬ ‫زیر‬
‫دارد‬.‫ازرویکرد‬ ‫مدل‬ ‫استخراج‬ ‫برای‬SOM‫و‬SVR
‫شود‬ ‫می‬ ‫استفاده‬.
25
‫بخش‬‫بندی‬(Segmentation)
‫بخش‬
‫بندی‬‫در‬‫سری‬‫زمانی‬‫اغلب‬‫به‬‫عنوان‬‫یک‬‫الگوریتم‬‫کا‬
‫هش‬‫ابعاد‬‫شود‬‫می‬ ‫اشاره‬.
Sliding-Windows (SW)
Top-Down (TD)
Bottom-Up (BU)
26
‫قواعد‬ ‫کشف‬(Rule Discovery)
‫است‬ ‫کاوی‬ ‫داده‬ ‫در‬ ‫متداول‬ ‫کارهای‬ ‫از‬ ‫یکی‬ ‫انجمنی‬ ‫قواعد‬ ‫کاوش‬
‫تراکنش‬ ‫در‬ ‫شده‬ ‫کشف‬ ‫نمادین‬ ‫های‬ ‫آیتم‬ ‫روی‬ ‫بر‬ ‫آن‬ ‫تمرکز‬ ‫که‬
‫است‬ ‫مالی‬ ‫های‬.
‫تقسیم‬ ‫هایی‬ ‫بخش‬ ‫به‬ ‫ها‬ ‫داده‬ ‫ابتدا‬ ‫زمانی‬ ‫سری‬ ‫های‬ ‫داده‬ ‫در‬
‫نماد‬ ‫یک‬ ‫عنوان‬ ‫به‬ ‫بخش‬ ‫هر‬ ‫و‬ ‫شوند‬ ‫می‬ ‫بندی‬(symbol)‫نظر‬ ‫در‬
‫اعمال‬ ‫آنها‬ ‫روی‬ ‫قواعد‬ ‫استخراج‬ ‫های‬ ‫تکنیک‬ ‫و‬ ‫شود‬ ‫می‬ ‫گرفته‬
‫شود‬ ‫می‬.‫الگوریتم‬ ‫روش‬ ‫این‬ ‫مهم‬ ‫های‬ ‫الگوریتم‬ ‫از‬A priori
‫است‬.
27
‫زمانی‬ ‫های‬ ‫سری‬ ‫بینی‬ ‫پیش‬
‫پیش‬ ‫های‬ ‫روش‬ ‫از‬ ‫یکی‬ ‫زمانی‬ ‫های‬ ‫سری‬ ‫بینی‬ ‫پیش‬
‫با‬ ‫داده‬ ‫توالی‬ ‫یک‬ ‫روی‬ ‫آینده‬ ‫مقادیر‬ ‫بینی‬
‫باشد‬ ‫می‬ ‫زمان‬ ‫بر‬ ‫مبتنی‬ ‫های‬ ‫داده‬ ‫از‬ ‫استفاده‬.
‫مانند‬ ‫متعددی‬ ‫جهانی‬ ‫مسایل‬ ‫در‬ ‫ضروری‬ ‫نقشی‬
‫بینی‬ ‫پیش‬ ،‫ای‬ ‫شبکه‬ ‫های‬ ‫ترافیک‬ ،‫مالی‬ ‫بازارهای‬
‫بازی‬ ‫را‬ ‫موارد‬ ‫سایر‬ ‫و‬ ‫هوا‬‫کند‬ ‫می‬.
28
‫متحرک‬ ‫میانگین‬ ‫بینی‬‫پیش‬ ‫روش‬
‫عنوان‬ ‫به‬ ‫قبل‬ ‫دوره‬ ‫چند‬ ‫تقاضاي‬ ‫میانگین‬ ‫روش‬ ‫این‬ ‫در‬
‫شود‬ ‫مي‬ ‫گرفته‬ ‫نظر‬ ‫در‬ ‫بعد‬ ‫دوره‬ ‫تقاضاي‬ ‫بیني‬ ‫پیش‬.
‫تعیین‬‫دوره‬ ‫تقاضاي‬ ،‫آنها‬ ‫میانگین‬ ‫كه‬ ‫هایي‬ ‫دوره‬ ‫تعداد‬
‫هاي‬ ‫دوره‬ ‫اطالعات‬ ‫ارزش‬ ‫به‬ ‫بستگي‬ ،‫دهد‬ ‫مي‬ ‫شكل‬ ‫را‬ ‫بعد‬
‫دارد‬ ‫گذشته‬.
29
‫مثال‬
30
31
‫رگرسیون‬
‫كه‬ ‫شود‬ ‫مي‬ ‫تقسیم‬ ‫غیرخطي‬ ‫و‬ ‫خطي‬ ‫نوع‬ ‫دو‬ ‫به‬ ‫رگرسیون‬ ‫روش‬
‫متغیره‬ ‫چند‬ ‫یا‬ ‫و‬ ‫متغیره‬ ‫یك‬ ‫است‬ ‫ممكن‬ ‫یك‬ ‫هر‬
‫باشند‬.‫استفاده‬‫كه‬ ‫است‬ ‫منطقي‬ ‫زماني‬ ‫رگرسیون‬ ‫روش‬ ‫از‬
‫داشته‬ ‫وجود‬ ‫متغیرها‬ ‫بین‬ ‫همبستگي‬ ‫رابطه‬ ‫نوعي‬
‫باشد‬.‫روابط‬‫حداقل‬ ‫روش‬ ‫پایه‬ ‫بر‬ ‫متغیره‬ ‫یك‬ ‫خطي‬ ‫رگرسیون‬
‫است‬ ‫مجذورات‬.
32
‫پیش‬ ‫برای‬ ‫عصبی‬ ‫شبکه‬ ‫از‬ ‫استفاده‬
‫زمانی‬ ‫های‬ ‫سری‬ ‫بینی‬
‫داده‬‫را‬ ‫واقعی‬ ‫دنیای‬ ‫نویزی‬ ‫و‬ ‫چندبعدی‬ ،‫پیچیده‬ ‫زمانی‬ ‫های‬
‫داد‬ ‫شرح‬ ‫پارامترها‬ ‫بر‬ ‫مبتنی‬ ‫تحلیلی‬ ‫معادالت‬ ‫با‬ ‫نمیتوان‬.
‫روش‬ ‫این‬ ‫که‬ ‫است‬ ‫این‬ ‫سنتی‬ ‫های‬ ‫روش‬ ‫اصلی‬ ‫اشکال‬ ‫این‬ ‫بر‬ ‫عالوه‬
‫باشند‬ ‫می‬ ‫ذهنی‬ ‫های‬ ‫داده‬ ‫تحلیل‬ ‫اساس‬ ‫بر‬ ‫ها‬
33
‫شبکه‬ ‫از‬ ‫استفاده‬‫برای‬ ‫عمیق‬‫پیش‬
‫زمانی‬ ‫های‬ ‫سری‬ ‫بینی‬
‫های‬‫شبکه‬LSTM‫عبارت‬ ‫شده‬ ‫خالصه‬ ‫که‬
"Long Short Term Memory"‫نوع‬ ،‫هستند‬
‫هستند‬ ‫بازگشتی‬ ‫عصبی‬ ‫های‬‫شبکه‬ ‫از‬ ‫خاصی‬
‫های‬‫وابستگی‬ ‫یادگیری‬ ‫توانائی‬ ‫که‬
‫دارند‬ ‫را‬ ‫بلندمدت‬.‫برای‬ ‫ها‬‫شبکه‬ ‫این‬
‫توسط‬ ‫بار‬ ‫اولین‬Hochreiter‫و‬
Schmidhuber‫سال‬ ‫در‬۱۹۹۷‫شده‬ ‫ارائه‬
‫است‬.
34
‫ها‬ ‫چالش‬
‫اختالل‬ ‫یا‬ ‫نویز‬
‫ها‬ ‫داده‬ ‫زیاد‬ ‫حجم‬
‫ها‬ ‫داده‬ ‫ابعاد‬ ‫بودن‬ ‫باال‬
35
‫مراجع‬
 1. Bagnall, A., et al., The great time series classification bake off: a
review and experimental evaluation of recent algorithmic advances. Data
Mining and Knowledge Discovery, 2017. 31(3): p. 606-660.
 2. Maimon, O. and L. Rokach, Data mining and knowledge discovery
handbook. 2005.
 3. Saha, M., M. Levitt, and W. Chiu, MOTIF-EM: an automated
computational tool for identifying conserved regions in CryoEM structures.
Bioinformatics, 2010. 26(12): p. i301-i309.
 4. ‫کتاب‬‫پور‬ ‫کیوان‬ ‫دکتر‬ ‫پیشرفته‬ ‫کاوی‬ ‫داده‬
36

More Related Content

Similar to Time series

ارزیابی سامانه‌های رایانه‌ای با کمک شبیه‌سازی
ارزیابی سامانه‌های رایانه‌ای با کمک شبیه‌سازیارزیابی سامانه‌های رایانه‌ای با کمک شبیه‌سازی
ارزیابی سامانه‌های رایانه‌ای با کمک شبیه‌سازی
Sadegh Dorri N.
 
متعادل‌ کننده بار در پایگاه داده‌ توزیع‌ شده
متعادل‌ کننده بار در پایگاه داده‌ توزیع‌ شدهمتعادل‌ کننده بار در پایگاه داده‌ توزیع‌ شده
متعادل‌ کننده بار در پایگاه داده‌ توزیع‌ شده
Hadi Rasouli
 

Similar to Time series (20)

Mcdm
McdmMcdm
Mcdm
 
مقدمه ای بر هوش تجاری
مقدمه ای بر هوش تجاریمقدمه ای بر هوش تجاری
مقدمه ای بر هوش تجاری
 
Heat exchanger
Heat exchangerHeat exchanger
Heat exchanger
 
کلان داده کاربردها و چالش های آن
کلان داده کاربردها و چالش های آنکلان داده کاربردها و چالش های آن
کلان داده کاربردها و چالش های آن
 
ATM
ATMATM
ATM
 
Crypto Invest / Trade
Crypto Invest / TradeCrypto Invest / Trade
Crypto Invest / Trade
 
Clustering customers based on kmeans algorithm
Clustering customers based on kmeans algorithmClustering customers based on kmeans algorithm
Clustering customers based on kmeans algorithm
 
Markov-Chains-Approach.ppsx
Markov-Chains-Approach.ppsxMarkov-Chains-Approach.ppsx
Markov-Chains-Approach.ppsx
 
مقاله بررسی مدل های ارزیابی ریسک امنیت اطلاعات برای رایانش ابری نویسنده ناص...
مقاله بررسی مدل های ارزیابی ریسک امنیت اطلاعات برای رایانش ابری   نویسنده ناص...مقاله بررسی مدل های ارزیابی ریسک امنیت اطلاعات برای رایانش ابری   نویسنده ناص...
مقاله بررسی مدل های ارزیابی ریسک امنیت اطلاعات برای رایانش ابری نویسنده ناص...
 
ارزیابی سامانه‌های رایانه‌ای با کمک شبیه‌سازی
ارزیابی سامانه‌های رایانه‌ای با کمک شبیه‌سازیارزیابی سامانه‌های رایانه‌ای با کمک شبیه‌سازی
ارزیابی سامانه‌های رایانه‌ای با کمک شبیه‌سازی
 
Data streaming & kafka
Data streaming & kafkaData streaming & kafka
Data streaming & kafka
 
Sql tuning
Sql tuningSql tuning
Sql tuning
 
Knowledge Management Reliability (PhD thesis defense)
Knowledge Management Reliability (PhD thesis defense)Knowledge Management Reliability (PhD thesis defense)
Knowledge Management Reliability (PhD thesis defense)
 
particle swarm optimized autonomous learning fuzzy system
particle swarm optimized autonomous learning fuzzy systemparticle swarm optimized autonomous learning fuzzy system
particle swarm optimized autonomous learning fuzzy system
 
shape optimization
shape optimizationshape optimization
shape optimization
 
Health-medicine-and-Block-chain1402-1-12.pptx
Health-medicine-and-Block-chain1402-1-12.pptxHealth-medicine-and-Block-chain1402-1-12.pptx
Health-medicine-and-Block-chain1402-1-12.pptx
 
تفکر سیستمی سخت- Hard Systems Thinking
تفکر سیستمی سخت- Hard Systems Thinkingتفکر سیستمی سخت- Hard Systems Thinking
تفکر سیستمی سخت- Hard Systems Thinking
 
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیرازIntroduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
 
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
 
متعادل‌ کننده بار در پایگاه داده‌ توزیع‌ شده
متعادل‌ کننده بار در پایگاه داده‌ توزیع‌ شدهمتعادل‌ کننده بار در پایگاه داده‌ توزیع‌ شده
متعادل‌ کننده بار در پایگاه داده‌ توزیع‌ شده
 

Time series

  • 1. ‫زمانی‬ ‫های‬ ‫سری‬ ‫کاوش‬ ‫زروانی‬ ‫مارال‬–‫سارا‬‫صابری‬ ‫پور‬ ‫کیوان‬ ‫رضا‬ ‫محمد‬ ‫دکتر‬ 1 ‫تعالی‬ ‫بسمه‬
  • 2. ‫زمانی‬ ‫های‬ ‫سری‬ ‫تعریف‬ •‫زمانی‬ ‫فواصل‬ ‫در‬ ‫که‬ ‫آماری‬ ‫های‬ ‫داده‬ ‫از‬ ‫ای‬ ‫دنباله‬ ‫اند‬ ‫شده‬ ‫آوری‬ ‫جمع‬ ‫منظم‬ ‫و‬ ‫مساوی‬. •‫مقادیر‬ ‫از‬ ‫شده‬ ‫مرتب‬ ‫ی‬ ‫دنباله‬ ‫یک‬ ‫دیگر‬ ‫بیان‬ ‫به‬ ‫سرعت‬ ،‫خون‬ ‫فشار‬ ،‫هوا‬ ‫دمای‬ ‫مانند‬ ‫تصادفی‬ ‫متغیر‬ ‫یک‬ ‫و‬ ‫باد‬...‫میباشد‬. ‫ها‬ ‫سری‬ ‫انواع‬ •‫گسسته‬:‫باشند‬ ‫خاصی‬ ‫زمان‬ ‫یک‬ ‫به‬ ‫مربوط‬ ‫مشاهدات‬.‫نرخ‬ ‫سهام‬ ‫در‬ ‫بهره‬ •‫پیوسته‬:‫و‬ ‫دار‬ ‫دنباله‬ ‫صورت‬ ‫به‬ ‫زمان‬ ‫واحد‬ ‫در‬ ‫مشاهدات‬ ‫باشند‬ ‫پیوسته‬.‫مانند‬‫جریان‬ ‫و‬ ‫ولتاژ‬‫الکتریکی‬ ‫ها‬ ‫ویژگی‬ •‫ابتدا‬‫دارند‬ ‫مشخصی‬ ‫انتهای‬ ‫و‬. •‫نیستند‬ ‫مستقل‬. 0 50 100 150 200 250 300 350 400 450 500 23 24 25 26 27 28 29 25.1750 25.2250 25.2500 25.2500 25.2750 25.3250 25.3500 25.3500 25.4000 25.4000 25.3250 25.2250 25.2000 25.1750 .. .. 24.6250 24.6750 24.6750 24.6250 24.6250 24.6250 24.6750 24.7500 2
  • 3. ‫کاربرد‬ ‫های‬ ‫حوزه‬ ‫پزشکی‬ ‫ی‬ ‫حوزه‬ ‫بیماران‬ ‫مغزی‬ ‫و‬ ‫قلبی‬ ‫های‬ ‫سیگنال‬ECG‫و‬EEG ‫امورمالی‬ ‫ی‬ ‫حوزه‬ ‫بازار‬ ‫قیمت‬ ،‫تورم‬ ،‫سهام‬ ‫بازار‬ ‫بررسی‬ ‫هواشناسی‬ ‫هوا‬ ‫دمای‬ ‫بینی‬ ‫پیش‬ ،‫ناگهانی‬ ‫تغییرات‬ ‫بینی‬ ‫پیش‬ ‫نگاری‬ ‫لرزه‬ ‫جنایات‬ ‫بینی‬ ‫پیش‬ ‫و‬ ‫کشف‬ 3
  • 4. ‫زمانی‬ ‫های‬ ‫سری‬ ‫تنوع‬: ‫کاوی‬ ‫تصویر‬ 4
  • 5. 0 10 20 30 40 50 60 70 80 90 Hand at rest Hand moving to shoulder level Steady pointing 0 10 20 30 40 50 60 70 80 90 Hand at rest Hand moving above holster Hand moving down to grasp gun Hand moving to shoulder level Steady pointing Point Gun-Draw ‫های‬ ‫سری‬ ‫تنوع‬‫زمانی‬:‫تصویرکاوی‬ 5
  • 6. ‫تجزیه‬‫زمانی‬ ‫های‬ ‫سری‬ ‫تحلیل‬ ‫و‬ ‫تعریف‬ ‫به‬‫با‬ ،‫داده‬ ‫مفهوم‬ ‫درک‬ ‫جهت‬ ‫شده‬ ‫گرفته‬ ‫کار‬ ‫به‬ ‫های‬ ‫روش‬ ‫تمام‬ ‫داده‬ ‫گویی‬ ‫پیش‬ ‫برای‬ ‫تالش‬ ‫یا‬ ‫داده‬ ‫تولید‬ ‫سیستم‬ ‫اساس‬ ‫توضیح‬ ‫هدف‬ ‫گفته‬ ‫زمانی‬ ‫سری‬ ‫تحلیل‬ ،‫زمانی‬ ‫سری‬ ‫ی‬ ‫آینده‬ ‫به‬ ‫مربوط‬ ‫های‬ ‫میشود‬. ‫تحلیل‬ ‫و‬ ‫تجزیه‬ ‫اهداف‬ •‫توصیف‬ •‫سازی‬ ‫مدل‬ •‫پیش‬‫بینی‬ •‫کنترل‬ ‫طول‬ ‫در‬ ‫متغیر‬ ‫یک‬ ‫رفتار‬ ‫توصیف‬ ‫زمان‬ ‫آینده‬ ‫مقادیر‬ ‫از‬ ‫تخمینی‬ ‫داشتن‬ ‫متغیر‬ ‫ی‬ ‫الگو‬ ‫کشف‬ ‫طول‬ ‫در‬ ‫متغیر‬ ‫پویایی‬ ‫بررسی‬ ‫مقاومت‬ ‫منظور‬ ‫به‬ ‫زمان‬‫در‬ ‫آینده‬ ‫احتمالی‬ ‫های‬ ‫شوک‬ ‫برابر‬ 6
  • 7. ‫سری‬ ‫های‬ ‫مولفه‬ ‫زمانی‬ ‫روند‬ ‫یا‬ ‫بلندمدت‬ ‫نوسانات‬(Trend):‫به‬ ‫زمانی‬ ‫سری‬ ‫تمایل‬ ‫بودن‬ ‫ثابت‬ ‫حتی‬ ‫یا‬ ‫کاهش‬ ،‫افزایش‬. ‫تناوبی‬ ‫نوسانات‬(:(Cyclic‫مقاطع‬ ‫در‬ ‫تکراری‬ ‫و‬ ‫یکسان‬ ‫تغییرات‬ ‫مدت‬‫میان‬. ‫فصلی‬ ‫نوسانات‬(Seasonal:)‫یک‬ ‫از‬ ‫تر‬‫کوتاه‬ ‫ای‬‫دوره‬ ‫در‬ ‫که‬ ‫تغییراتی‬ ‫دهد‬‫می‬ ‫رخ‬ ‫تکراری‬ ‫صورت‬ ‫به‬ ‫تناوب‬. ‫نامعمول‬ ‫نوسانات‬Irregular):)‫عوامل‬ ‫اثر‬ ‫بر‬ ‫تغییرات‬ ‫گونه‬ ‫این‬ ‫شوند‬‫می‬ ‫ایجاد‬ ‫بینی‬‫پیش‬ ‫غیرقابل‬ ‫و‬ ‫تصادفی‬. ‫مدل‬‫های‬‫سری‬ ‫زمانی‬ ‫معمول‬ ‫مدل‬ ‫دو‬ ‫ها‬ ‫مولفه‬ ‫ضرب‬ ‫حاصل‬ ‫ها‬ ‫مولفه‬ ‫جمع‬ ‫حاصل‬ 7
  • 8. ‫های‬ ‫سری‬ ‫کاوش‬ ‫زمانی‬ ‫تعریف‬ ‫خصوصیات‬‫ویژه‬‫ی‬‫سری‬‫های‬‫زمانی‬‫از‬‫قبیل‬‫حجم‬‫زیاد‬‫داده‬‫ها‬، ‫ابعاد‬‫زیاد‬‫و‬‫ضرورت‬‫بروز‬‫رسانی‬‫مداوم‬‫و‬‫از‬‫طرفی‬‫ماهیت‬‫عددی‬‫و‬ ‫پیوسته‬‫آنها‬‫باعث‬‫استفاده‬‫از‬‫تکنیک‬‫های‬‫تحلیل‬‫داده‬(Data Mining) ‫در‬‫کاوش‬‫این‬‫نوع‬‫از‬‫داده‬‫ها‬‫شد‬. ‫مراحل‬‫اصلی‬ ‫ها‬ ‫داده‬ ‫آوری‬ ‫جمع‬ ‫پردازش‬ ‫پیش‬ ‫شباهت‬‫سنجی‬ ‫کاوی‬ ‫داده‬ ‫های‬ ‫تکنیک‬ 8
  • 9. ‫آوری‬ ‫جمع‬ ‫دیتا‬ ‫نظر‬ ‫مورد‬ ‫رویداد‬ ‫شناسایی‬ ‫تعیین‬‫پارامترهایی‬‫که‬‫میخواهیم‬‫عملیات‬‫کاوش‬‫روی‬‫آنها‬‫انجام‬ ‫بدهیم‬. ‫داده‬ ‫آوری‬ ‫جمع‬ ‫داده‬‫ها‬‫از‬‫طریق‬‫حسگرها‬‫و‬‫یا‬‫سیستم‬‫های‬‫ناظر‬‫در‬‫بازه‬‫های‬ ‫زمانی‬‫منظم‬‫جمع‬‫آوری‬‫میشوند‬. ‫ی‬ ‫ذخیره‬‫ها‬ ‫داده‬ •‫برای‬‫استفاده‬ ‫زمانی‬ ‫سری‬ ‫های‬ ‫دیتابیس‬ ‫از‬ ‫ها‬ ‫داده‬ ‫ی‬ ‫ذخیره‬ ‫میکنند‬. •‫زمان‬key value‫حساب‬‫میشود‬. 9
  • 10. ‫پردازش‬ ‫پیش‬(Preprocess) ‫استخراج‬‫ویژگی‬ ‫نرمالیزه‬‫کردن‬ ‫حذف‬‫نویز‬:‫استفاده‬‫از‬‫فیلتر‬‫های‬‫موجک‬‫و‬... ‫انتخاب‬‫ویژگی‬:‫بازنمایی‬‫داده‬‫ها‬‫از‬‫طریق‬‫انتخاب‬‫ویژگی‬ ‫های‬‫پراهمیت‬ ‫هدف‬،‫کاهش‬‫ابعاد‬(Dimension Reduction)‫سری‬‫زمانی‬‫است‬‫زیرا‬‫اجرای‬ ‫الگوریتم‬‫ها‬‫روی‬‫داده‬‫های‬‫خام‬‫به‬‫علت‬‫حجم‬‫زیاد‬‫آنها‬ ‫پرهزینه‬‫است‬. ‫یکی‬‫از‬‫مشکالت‬‫عمده‬‫علوم‬،‫کامپیوتر‬‫انتخاب‬‫روش‬‫مناسب‬‫و‬ ‫کارآمد‬‫برای‬‫بازنمایی‬(Representation)‫داده‬‫های‬‫سری‬‫زمانی‬‫است‬. ‫یک‬‫تکنیک‬‫بازنمایی‬‫باید‬‫بتواند‬‫ویژگی‬‫ها‬‫ی‬‫سری‬‫زمانی‬‫را‬ ‫حفظ‬‫کند‬. 10
  • 11. ‫برخی‬‫ها‬ ‫روش‬ ‫ترین‬ ‫رایج‬ ‫از‬:  Sampling Non-Adaptive  Piecewise Aggregate Approximation (PAA) Non-Adaptive  Adaptive Piecewise Constant Approximation (APCA) 11 ‫بازنمایی‬ ‫های‬ ‫تکنیک‬ (Representation) sampling PAA
  • 12. ‫سنجی‬ ‫شباهت‬(Similarity) ‫کاوش‬ ‫در‬ ‫که‬ ‫کارهایی‬ ‫تمامی‬ ‫برای‬ ‫مناسب‬ ‫شباهت‬ ‫معیار‬ ‫از‬ ‫استفاده‬ ‫است‬ ‫واجب‬ ‫میدهیم‬ ‫انجام‬ ‫زمانی‬ ‫سری‬. ‫میشود‬ ‫انجام‬ ‫صورت‬ ‫دو‬ ‫به‬ ‫سنجی‬ ‫شباهت‬ ‫کلی‬ ‫طور‬ ‫به‬: Whole sequence matching -1 ‫بر‬‫روی‬‫بررسی‬ ‫شباهت‬ ‫زمانی‬ ‫سری‬ ‫های‬ ‫داده‬ ‫کل‬‫شود‬ ‫می‬. Subsequence matching -2 ‫روش‬ ‫این‬ ‫در‬،‫نام‬ ‫به‬ ‫زیرتوالی‬ ‫اگریک‬Q‫داشته‬‫باشیم‬‫یک‬ ‫و‬‫به‬ ‫سری‬ ‫نام‬P‫که‬ ‫میشود‬ ‫بررسی‬ ‫صورت‬ ‫این‬ ‫به‬ ‫شباهت‬ ،‫زیر‬‫از‬ ‫هایی‬ ‫توالی‬P ‫با‬ ‫که‬Q‫میشوند‬ ‫انتخاب‬ ‫دارند‬ ‫همخوانی‬. 12
  • 13. Q C D(Q,C)       n i ii cqCQD 1 2 , ‫زمانی‬ ‫سری‬ ‫دو‬C‫و‬Q‫داریم‬: Q = q1…qn C = c1…cn ‫زیر‬ ‫فرمول‬ ‫از‬ ‫سری‬ ‫دو‬ ‫این‬ ‫ی‬ ‫فاصله‬ ‫میشود‬ ‫محاسبه‬: 13 ‫معیار‬ ‫شباهت‬ ‫اقلیدسی‬ ‫ی‬ ‫فاصله‬Euclidean Distance Metric
  • 14. 14 ‫اقلیدسی‬ ‫فاصله‬ ‫بررسی‬ ‫باید‬ ‫و‬ ‫است‬ ‫ضعیف‬ ‫زمانی‬ ‫های‬ ‫سری‬ ‫سنجی‬ ‫شباهت‬ ‫برای‬ ‫معیار‬ ‫این‬ ‫حذف‬ ،‫کردن‬ ‫نرمالیزه‬ ‫جمله‬ ‫از‬ ‫تبدیالتی‬ ‫آن‬ ‫ی‬ ‫محاسبه‬ ‫از‬ ‫قبل‬ ‫و‬ ‫نویز‬...‫شود‬ ‫انجام‬ ‫ها‬ ‫داده‬ ‫روی‬. Linear trendDenoising Normalize
  • 15. ‫بعضی‬ ‫سنجی‬ ‫شباعت‬ ‫برای‬ ‫نبودن‬ ‫پویا‬ ‫علت‬ ‫به‬ ‫اقلیدسی‬ ‫ی‬ ‫فاصله‬ ‫نیست‬ ‫مناسب‬ ‫ها‬ ‫سری‬. 15 ‫معیار‬ ‫شباهت‬ ‫پویا‬ ‫زمانی‬ ‫تاب‬ ‫و‬ ‫پیچ‬Dynamic Time Warping
  • 16. ‫کاوی‬ ‫داده‬ ‫وظایف‬ [1] ‫بندی‬ ‫طبقه‬Classification ‫بندی‬ ‫خوشه‬Clustering ‫نامتعارف‬ ‫رویدادهای‬ ‫تشخیص‬Anomaly Detection ‫پرتکرار‬ ‫الگوهای‬ ‫تشخیص‬Motif Discovery ‫قواعد‬ ‫تشخیص‬Rule Discovery ‫بندی‬ ‫قطعه‬Segmentation ‫بینی‬ ‫پیش‬Prediction 16
  • 17. ‫بندی‬ ‫طبقه‬ [2] ‫سری‬ ‫کل‬ ‫اساس‬ ‫بر‬(Whole Series) ‫زمانی‬ ‫ی‬ ‫بازه‬ ‫چند‬ ‫یا‬ ‫یک‬ ‫اساس‬ ‫بر‬(Intervals) ‫دنباله‬ ‫زیر‬ ‫یک‬ ‫اساس‬ ‫بر‬((Shapelet ‫زیردنباله‬ ‫تکرار‬ ‫تعداد‬ ‫اساس‬ ‫بر‬(Dictionary Based) ‫باال‬ ‫معیارهای‬ ‫از‬ ‫ترکیبی‬(Combination) ‫مدل‬ ‫اساس‬ ‫بر‬(Model Based) Whole series intervals shapelet 17
  • 18. 18
  • 19. ‫دسته‬ ‫مسائل‬ ‫که‬ ‫هاست‬ ‫داده‬ ‫تحلیل‬ ‫برای‬ ‫ابزاری‬ ‫بندی‬ ‫خوشه‬ ‫می‬ ‫حل‬ ‫را‬ ‫بندی‬‫کندو‬‫آن‬ ‫هدف‬‫موارد‬ ‫توزیع‬‫می‬ ‫گروه‬ ‫چند‬ ‫در‬ ‫باشد‬(‫افراد،اشیا،رویدادها‬)‫به‬‫از‬ ‫قوی‬ ‫ای‬ ‫درجه‬ ‫که‬ ‫طوری‬ ‫مشابه‬ ‫های‬ ‫خوشه‬ ‫از‬ ‫اعضایی‬ ‫تواندمیان‬ ‫می‬ ‫ارتباط‬‫و‬‫درجه‬ ‫باشد‬ ‫متفاوت‬ ‫های‬ ‫خوشه‬ ‫اعضای‬ ‫میان‬ ‫ضعیف‬. 19 ‫بندی‬ ‫]3[خوشه‬
  • 20. ‫زمانی‬ ‫سری‬ ‫در‬ ‫بندی‬ ‫خوشه‬ ‫انواع‬ ‫افراز‬ ‫مبتی‬ ‫بندی‬ ‫خوشه‬ ‫مراتبی‬ ‫سلسله‬ ‫بندی‬ ‫خوشه‬ Whole Series Clustering Subsequence Clustering ‫زمانی‬ ‫سری‬ ‫یک‬ ‫روش‬ ‫این‬ ‫در‬ ‫سری‬ ‫با‬ ‫کامل‬ ‫بطور‬‫زمانی‬ ‫و‬ ‫شود‬ ‫می‬ ‫مقایسه‬ ‫دیگر‬ ‫هستند‬ ‫هم‬ ‫شبیه‬ ‫که‬ ‫آنهایی‬ ‫یک‬ ‫در‬‫قرار‬ ‫خوشه‬ ‫میگیرند‬. ‫ها‬ ‫زیرتوالی‬ ‫روش‬ ‫این‬ ‫در‬ ‫و‬ ‫ایجاد‬ ‫ها‬ ‫سری‬ ‫از‬ ‫مقایسه‬ ‫میشوند‬. 20
  • 22. ‫الگوریتم‬ ‫]4[ها‬ ‫روش‬ ‫سنتی‬ ‫های‬ ‫روش‬ ‫به‬ ‫متفاوتی‬ ‫های‬ ‫روش‬ ‫حوزه‬ ‫این‬ ‫در‬ ‫مانند‬ ‫هایی‬: ECTS(Early classification time series) Sum Time-Mousam ARIMA ‫فازی‬ ‫منطق‬ ‫و‬ ‫رویکرد‬ ‫اساس‬ ‫بر‬ ‫پیشگویی‬ 22
  • 23. ‫تکرار‬ ‫پر‬ ‫های‬ ‫الگو‬ ‫کشف‬(Motifs) ‫توالی‬ ‫زیر‬ ‫کردن‬ ‫پیدا‬ ‫هدف‬‫است‬ ‫هایی‬‫که‬‫پیوسته‬‫در‬ ‫شوند‬ ‫می‬ ‫تکرار‬ ‫زمانی‬ ‫سری‬. ‫دنباله‬ ‫زیر‬ ‫این‬ ‫به‬‫ها‬"Motif"‫می‬‫گویند‬. ‫الهام‬ ‫ایده‬ ‫این‬‫از‬ ‫گرفته‬‫بررسی‬ ‫و‬ ‫تحلیل‬ ‫پروژه‬ ‫باشد‬ ‫می‬ ‫انفورماتیک‬ ‫بیو‬ ‫در‬ ‫ها‬ ‫ژن‬. ‫تشخیص‬ ‫در‬ ‫کاربرد‬‫طبقه‬ ‫و‬ ‫بندی‬ ‫خوشه‬ ،‫آنومالی‬‫بندی‬ ‫است‬. GACATAATAACCAGCTATCTGCTCGCATCGCCGCGACATAGCT 0 10 20 30 40 50 60 -2 -1 0 1 2 23
  • 24. Winding Dataset (The angular speed of reel 2) 0 500 1000 1500 2000 2500 0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140 A B C A B C 24
  • 25. ‫تشخیص‬‫آنومالی‬ ‫زیر‬ ‫روش‬ ‫دراین‬‫های‬ ‫توالی‬‫که‬ ‫سری‬‫حالت‬ ‫با‬‫نرمال‬ ‫قابل‬ ‫تفاوت‬ ‫سری‬‫ای‬ ‫مالجظه‬‫شناسایی‬ ‫را‬ ‫دارند‬‫می‬ ‫کنیم‬. ‫روش‬‫معمول‬‫برای‬‫تشخیص‬،‫آنومالی‬‫استخراج‬‫یک‬‫مدل‬‫از‬ ‫رفتارنرمال‬‫های‬‫سری‬‫زمانی‬‫و‬‫سپس‬ ‫یافتن‬‫نرمال‬ ‫حالت‬ ‫با‬ ‫زیادی‬ ‫اختالف‬ ‫که‬ ‫ای‬ ‫دنبال‬ ‫زیر‬ ‫دارد‬.‫ازرویکرد‬ ‫مدل‬ ‫استخراج‬ ‫برای‬SOM‫و‬SVR ‫شود‬ ‫می‬ ‫استفاده‬. 25
  • 27. ‫قواعد‬ ‫کشف‬(Rule Discovery) ‫است‬ ‫کاوی‬ ‫داده‬ ‫در‬ ‫متداول‬ ‫کارهای‬ ‫از‬ ‫یکی‬ ‫انجمنی‬ ‫قواعد‬ ‫کاوش‬ ‫تراکنش‬ ‫در‬ ‫شده‬ ‫کشف‬ ‫نمادین‬ ‫های‬ ‫آیتم‬ ‫روی‬ ‫بر‬ ‫آن‬ ‫تمرکز‬ ‫که‬ ‫است‬ ‫مالی‬ ‫های‬. ‫تقسیم‬ ‫هایی‬ ‫بخش‬ ‫به‬ ‫ها‬ ‫داده‬ ‫ابتدا‬ ‫زمانی‬ ‫سری‬ ‫های‬ ‫داده‬ ‫در‬ ‫نماد‬ ‫یک‬ ‫عنوان‬ ‫به‬ ‫بخش‬ ‫هر‬ ‫و‬ ‫شوند‬ ‫می‬ ‫بندی‬(symbol)‫نظر‬ ‫در‬ ‫اعمال‬ ‫آنها‬ ‫روی‬ ‫قواعد‬ ‫استخراج‬ ‫های‬ ‫تکنیک‬ ‫و‬ ‫شود‬ ‫می‬ ‫گرفته‬ ‫شود‬ ‫می‬.‫الگوریتم‬ ‫روش‬ ‫این‬ ‫مهم‬ ‫های‬ ‫الگوریتم‬ ‫از‬A priori ‫است‬. 27
  • 28. ‫زمانی‬ ‫های‬ ‫سری‬ ‫بینی‬ ‫پیش‬ ‫پیش‬ ‫های‬ ‫روش‬ ‫از‬ ‫یکی‬ ‫زمانی‬ ‫های‬ ‫سری‬ ‫بینی‬ ‫پیش‬ ‫با‬ ‫داده‬ ‫توالی‬ ‫یک‬ ‫روی‬ ‫آینده‬ ‫مقادیر‬ ‫بینی‬ ‫باشد‬ ‫می‬ ‫زمان‬ ‫بر‬ ‫مبتنی‬ ‫های‬ ‫داده‬ ‫از‬ ‫استفاده‬. ‫مانند‬ ‫متعددی‬ ‫جهانی‬ ‫مسایل‬ ‫در‬ ‫ضروری‬ ‫نقشی‬ ‫بینی‬ ‫پیش‬ ،‫ای‬ ‫شبکه‬ ‫های‬ ‫ترافیک‬ ،‫مالی‬ ‫بازارهای‬ ‫بازی‬ ‫را‬ ‫موارد‬ ‫سایر‬ ‫و‬ ‫هوا‬‫کند‬ ‫می‬. 28
  • 29. ‫متحرک‬ ‫میانگین‬ ‫بینی‬‫پیش‬ ‫روش‬ ‫عنوان‬ ‫به‬ ‫قبل‬ ‫دوره‬ ‫چند‬ ‫تقاضاي‬ ‫میانگین‬ ‫روش‬ ‫این‬ ‫در‬ ‫شود‬ ‫مي‬ ‫گرفته‬ ‫نظر‬ ‫در‬ ‫بعد‬ ‫دوره‬ ‫تقاضاي‬ ‫بیني‬ ‫پیش‬. ‫تعیین‬‫دوره‬ ‫تقاضاي‬ ،‫آنها‬ ‫میانگین‬ ‫كه‬ ‫هایي‬ ‫دوره‬ ‫تعداد‬ ‫هاي‬ ‫دوره‬ ‫اطالعات‬ ‫ارزش‬ ‫به‬ ‫بستگي‬ ،‫دهد‬ ‫مي‬ ‫شكل‬ ‫را‬ ‫بعد‬ ‫دارد‬ ‫گذشته‬. 29
  • 31. 31
  • 32. ‫رگرسیون‬ ‫كه‬ ‫شود‬ ‫مي‬ ‫تقسیم‬ ‫غیرخطي‬ ‫و‬ ‫خطي‬ ‫نوع‬ ‫دو‬ ‫به‬ ‫رگرسیون‬ ‫روش‬ ‫متغیره‬ ‫چند‬ ‫یا‬ ‫و‬ ‫متغیره‬ ‫یك‬ ‫است‬ ‫ممكن‬ ‫یك‬ ‫هر‬ ‫باشند‬.‫استفاده‬‫كه‬ ‫است‬ ‫منطقي‬ ‫زماني‬ ‫رگرسیون‬ ‫روش‬ ‫از‬ ‫داشته‬ ‫وجود‬ ‫متغیرها‬ ‫بین‬ ‫همبستگي‬ ‫رابطه‬ ‫نوعي‬ ‫باشد‬.‫روابط‬‫حداقل‬ ‫روش‬ ‫پایه‬ ‫بر‬ ‫متغیره‬ ‫یك‬ ‫خطي‬ ‫رگرسیون‬ ‫است‬ ‫مجذورات‬. 32
  • 33. ‫پیش‬ ‫برای‬ ‫عصبی‬ ‫شبکه‬ ‫از‬ ‫استفاده‬ ‫زمانی‬ ‫های‬ ‫سری‬ ‫بینی‬ ‫داده‬‫را‬ ‫واقعی‬ ‫دنیای‬ ‫نویزی‬ ‫و‬ ‫چندبعدی‬ ،‫پیچیده‬ ‫زمانی‬ ‫های‬ ‫داد‬ ‫شرح‬ ‫پارامترها‬ ‫بر‬ ‫مبتنی‬ ‫تحلیلی‬ ‫معادالت‬ ‫با‬ ‫نمیتوان‬. ‫روش‬ ‫این‬ ‫که‬ ‫است‬ ‫این‬ ‫سنتی‬ ‫های‬ ‫روش‬ ‫اصلی‬ ‫اشکال‬ ‫این‬ ‫بر‬ ‫عالوه‬ ‫باشند‬ ‫می‬ ‫ذهنی‬ ‫های‬ ‫داده‬ ‫تحلیل‬ ‫اساس‬ ‫بر‬ ‫ها‬ 33
  • 34. ‫شبکه‬ ‫از‬ ‫استفاده‬‫برای‬ ‫عمیق‬‫پیش‬ ‫زمانی‬ ‫های‬ ‫سری‬ ‫بینی‬ ‫های‬‫شبکه‬LSTM‫عبارت‬ ‫شده‬ ‫خالصه‬ ‫که‬ "Long Short Term Memory"‫نوع‬ ،‫هستند‬ ‫هستند‬ ‫بازگشتی‬ ‫عصبی‬ ‫های‬‫شبکه‬ ‫از‬ ‫خاصی‬ ‫های‬‫وابستگی‬ ‫یادگیری‬ ‫توانائی‬ ‫که‬ ‫دارند‬ ‫را‬ ‫بلندمدت‬.‫برای‬ ‫ها‬‫شبکه‬ ‫این‬ ‫توسط‬ ‫بار‬ ‫اولین‬Hochreiter‫و‬ Schmidhuber‫سال‬ ‫در‬۱۹۹۷‫شده‬ ‫ارائه‬ ‫است‬. 34
  • 35. ‫ها‬ ‫چالش‬ ‫اختالل‬ ‫یا‬ ‫نویز‬ ‫ها‬ ‫داده‬ ‫زیاد‬ ‫حجم‬ ‫ها‬ ‫داده‬ ‫ابعاد‬ ‫بودن‬ ‫باال‬ 35
  • 36. ‫مراجع‬  1. Bagnall, A., et al., The great time series classification bake off: a review and experimental evaluation of recent algorithmic advances. Data Mining and Knowledge Discovery, 2017. 31(3): p. 606-660.  2. Maimon, O. and L. Rokach, Data mining and knowledge discovery handbook. 2005.  3. Saha, M., M. Levitt, and W. Chiu, MOTIF-EM: an automated computational tool for identifying conserved regions in CryoEM structures. Bioinformatics, 2010. 26(12): p. i301-i309.  4. ‫کتاب‬‫پور‬ ‫کیوان‬ ‫دکتر‬ ‫پیشرفته‬ ‫کاوی‬ ‫داده‬ 36