More Related Content Similar to Time series (20) Time series1. زمانی های سری کاوش
زروانی مارال–ساراصابری
پور کیوان رضا محمد دکتر
1
تعالی بسمه
2. زمانی های سری
تعریف
•زمانی فواصل در که آماری های داده از ای دنباله
اند شده آوری جمع منظم و مساوی.
•مقادیر از شده مرتب ی دنباله یک دیگر بیان به
سرعت ،خون فشار ،هوا دمای مانند تصادفی متغیر یک
و باد...میباشد.
ها سری انواع
•گسسته:باشند خاصی زمان یک به مربوط مشاهدات.نرخ
سهام در بهره
•پیوسته:و دار دنباله صورت به زمان واحد در مشاهدات
باشند پیوسته.مانندجریان و ولتاژالکتریکی
ها ویژگی
•ابتدادارند مشخصی انتهای و.
•نیستند مستقل.
0 50 100 150 200 250 300 350 400 450 500
23
24
25
26
27
28
29
25.1750
25.2250
25.2500
25.2500
25.2750
25.3250
25.3500
25.3500
25.4000
25.4000
25.3250
25.2250
25.2000
25.1750
..
..
24.6250
24.6750
24.6750
24.6250
24.6250
24.6250
24.6750
24.7500
2
3. کاربرد های حوزه
پزشکی ی حوزه
بیماران مغزی و قلبی های سیگنالECGوEEG
امورمالی ی حوزه
بازار قیمت ،تورم ،سهام بازار بررسی
هواشناسی
هوا دمای بینی پیش ،ناگهانی تغییرات بینی پیش
نگاری لرزه
جنایات بینی پیش و کشف
3
5. 0 10 20 30 40 50 60 70 80 90
Hand at rest
Hand moving
to shoulder
level
Steady
pointing
0 10 20 30 40 50 60 70 80 90
Hand at rest
Hand moving
above holster
Hand moving
down to grasp
gun
Hand moving to
shoulder level
Steady
pointing
Point
Gun-Draw
های سری تنوعزمانی:تصویرکاوی
5
6. تجزیهزمانی های سری تحلیل و
تعریف
بهبا ،داده مفهوم درک جهت شده گرفته کار به های روش تمام
داده گویی پیش برای تالش یا داده تولید سیستم اساس توضیح هدف
گفته زمانی سری تحلیل ،زمانی سری ی آینده به مربوط های
میشود.
تحلیل و تجزیه اهداف
•توصیف
•سازی مدل
•پیشبینی
•کنترل
طول در متغیر یک رفتار توصیف
زمان
آینده مقادیر از تخمینی داشتن
متغیر ی
الگو کشف
طول در متغیر پویایی بررسی
مقاومت منظور به زماندر
آینده احتمالی های شوک برابر
6
7. سری های مولفه
زمانی روند یا بلندمدت نوسانات(Trend):به زمانی سری تمایل
بودن ثابت حتی یا کاهش ،افزایش.
تناوبی نوسانات(:(Cyclicمقاطع در تکراری و یکسان تغییرات
مدتمیان.
فصلی نوسانات(Seasonal:)یک از ترکوتاه ایدوره در که تغییراتی
دهدمی رخ تکراری صورت به تناوب.
نامعمول نوساناتIrregular):)عوامل اثر بر تغییرات گونه این
شوندمی ایجاد بینیپیش غیرقابل و تصادفی. مدلهایسری
زمانی
معمول مدل دو
ها مولفه ضرب حاصل
ها مولفه جمع حاصل
7
9. آوری جمع
دیتا نظر مورد رویداد شناسایی
تعیینپارامترهاییکهمیخواهیمعملیاتکاوشرویآنهاانجام
بدهیم.
داده آوری جمع
دادههاازطریقحسگرهاویاسیستمهایناظردربازههای
زمانیمنظمجمعآوریمیشوند.
ی ذخیرهها داده
•برایاستفاده زمانی سری های دیتابیس از ها داده ی ذخیره
میکنند.
•زمانkey valueحسابمیشود.
9
11. برخیها روش ترین رایج از:
Sampling Non-Adaptive
Piecewise Aggregate Approximation (PAA) Non-Adaptive
Adaptive Piecewise Constant Approximation (APCA)
11
بازنمایی های تکنیک
(Representation)
sampling PAA
12. سنجی شباهت(Similarity)
کاوش در که کارهایی تمامی برای مناسب شباهت معیار از استفاده
است واجب میدهیم انجام زمانی سری.
میشود انجام صورت دو به سنجی شباهت کلی طور به:
Whole sequence matching -1
بررویبررسی شباهت زمانی سری های داده کلشود می.
Subsequence matching -2
روش این در،نام به زیرتوالی اگریکQداشتهباشیمیک وبه سری
نامPکه میشود بررسی صورت این به شباهت ،زیراز هایی توالیP
با کهQمیشوند انتخاب دارند همخوانی.
12
13. Q
C
D(Q,C)
n
i
ii cqCQD
1
2
,
زمانی سری دوCوQداریم:
Q = q1…qn
C = c1…cn
زیر فرمول از سری دو این ی فاصله
میشود محاسبه:
13
معیار
شباهت
اقلیدسی ی فاصلهEuclidean
Distance Metric
14. 14
اقلیدسی فاصله بررسی
باید و است ضعیف زمانی های سری سنجی شباهت برای معیار این
حذف ،کردن نرمالیزه جمله از تبدیالتی آن ی محاسبه از قبل
و نویز...شود انجام ها داده روی.
Linear trendDenoising
Normalize
15. بعضی سنجی شباعت برای نبودن پویا علت به اقلیدسی ی فاصله
نیست مناسب ها سری.
15
معیار
شباهت پویا زمانی تاب و پیچDynamic Time
Warping
16. کاوی داده وظایف [1]
بندی طبقهClassification
بندی خوشهClustering
نامتعارف رویدادهای تشخیصAnomaly Detection
پرتکرار الگوهای تشخیصMotif Discovery
قواعد تشخیصRule Discovery
بندی قطعهSegmentation
بینی پیشPrediction
16
17. بندی طبقه [2]
سری کل اساس بر(Whole Series)
زمانی ی بازه چند یا یک اساس بر(Intervals)
دنباله زیر یک اساس بر((Shapelet
زیردنباله تکرار تعداد اساس بر(Dictionary Based)
باال معیارهای از ترکیبی(Combination)
مدل اساس بر(Model Based)
Whole series
intervals
shapelet
17
19. دسته مسائل که هاست داده تحلیل برای ابزاری بندی خوشه
می حل را بندیکندوآن هدفموارد توزیعمی گروه چند در
باشد(افراد،اشیا،رویدادها)بهاز قوی ای درجه که طوری
مشابه های خوشه از اعضایی تواندمیان می ارتباطودرجه
باشد متفاوت های خوشه اعضای میان ضعیف.
19
بندی ]3[خوشه
20. زمانی سری در بندی خوشه انواع
افراز مبتی بندی خوشه
مراتبی سلسله بندی خوشه
Whole Series Clustering
Subsequence Clustering
زمانی سری یک روش این در
سری با کامل بطورزمانی
و شود می مقایسه دیگر
هستند هم شبیه که آنهایی
یک درقرار خوشه
میگیرند.
ها زیرتوالی روش این در
و ایجاد ها سری از
مقایسه
میشوند.
20
22. الگوریتم
]4[ها
روش سنتی های روش به متفاوتی های روش حوزه این در
مانند هایی:
ECTS(Early classification time series)
Sum Time-Mousam
ARIMA
فازی منطق و رویکرد اساس بر پیشگویی
22
23. تکرار پر های الگو کشف(Motifs)
توالی زیر کردن پیدا هدفاست هاییکهپیوستهدر
شوند می تکرار زمانی سری.
دنباله زیر این بهها"Motif"میگویند.
الهام ایده ایناز گرفتهبررسی و تحلیل پروژه
باشد می انفورماتیک بیو در ها ژن.
تشخیص در کاربردطبقه و بندی خوشه ،آنومالیبندی
است.
GACATAATAACCAGCTATCTGCTCGCATCGCCGCGACATAGCT
0 10 20 30 40 50 60
-2
-1
0
1
2
23
24. Winding Dataset
(The angular speed of reel 2)
0 500 1000 1500 2000 2500
0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140
A B C
A B C
24
25. تشخیصآنومالی
زیر روش دراینهای توالیکه سریحالت بانرمال
قابل تفاوت سریای مالجظهشناسایی را دارندمی
کنیم.
روشمعمولبرایتشخیص،آنومالیاستخراجیکمدلاز
رفتارنرمالهایسریزمانیوسپس
یافتننرمال حالت با زیادی اختالف که ای دنبال زیر
دارد.ازرویکرد مدل استخراج برایSOMوSVR
شود می استفاده.
25
27. قواعد کشف(Rule Discovery)
است کاوی داده در متداول کارهای از یکی انجمنی قواعد کاوش
تراکنش در شده کشف نمادین های آیتم روی بر آن تمرکز که
است مالی های.
تقسیم هایی بخش به ها داده ابتدا زمانی سری های داده در
نماد یک عنوان به بخش هر و شوند می بندی(symbol)نظر در
اعمال آنها روی قواعد استخراج های تکنیک و شود می گرفته
شود می.الگوریتم روش این مهم های الگوریتم ازA priori
است.
27
28. زمانی های سری بینی پیش
پیش های روش از یکی زمانی های سری بینی پیش
با داده توالی یک روی آینده مقادیر بینی
باشد می زمان بر مبتنی های داده از استفاده.
مانند متعددی جهانی مسایل در ضروری نقشی
بینی پیش ،ای شبکه های ترافیک ،مالی بازارهای
بازی را موارد سایر و هواکند می.
28
29. متحرک میانگین بینیپیش روش
عنوان به قبل دوره چند تقاضاي میانگین روش این در
شود مي گرفته نظر در بعد دوره تقاضاي بیني پیش.
تعییندوره تقاضاي ،آنها میانگین كه هایي دوره تعداد
هاي دوره اطالعات ارزش به بستگي ،دهد مي شكل را بعد
دارد گذشته.
29
32. رگرسیون
كه شود مي تقسیم غیرخطي و خطي نوع دو به رگرسیون روش
متغیره چند یا و متغیره یك است ممكن یك هر
باشند.استفادهكه است منطقي زماني رگرسیون روش از
داشته وجود متغیرها بین همبستگي رابطه نوعي
باشد.روابطحداقل روش پایه بر متغیره یك خطي رگرسیون
است مجذورات.
32
33. پیش برای عصبی شبکه از استفاده
زمانی های سری بینی
دادهرا واقعی دنیای نویزی و چندبعدی ،پیچیده زمانی های
داد شرح پارامترها بر مبتنی تحلیلی معادالت با نمیتوان.
روش این که است این سنتی های روش اصلی اشکال این بر عالوه
باشند می ذهنی های داده تحلیل اساس بر ها
33
34. شبکه از استفادهبرای عمیقپیش
زمانی های سری بینی
هایشبکهLSTMعبارت شده خالصه که
"Long Short Term Memory"نوع ،هستند
هستند بازگشتی عصبی هایشبکه از خاصی
هایوابستگی یادگیری توانائی که
دارند را بلندمدت.برای هاشبکه این
توسط بار اولینHochreiterو
Schmidhuberسال در۱۹۹۷شده ارائه
است.
34
36. مراجع
1. Bagnall, A., et al., The great time series classification bake off: a
review and experimental evaluation of recent algorithmic advances. Data
Mining and Knowledge Discovery, 2017. 31(3): p. 606-660.
2. Maimon, O. and L. Rokach, Data mining and knowledge discovery
handbook. 2005.
3. Saha, M., M. Levitt, and W. Chiu, MOTIF-EM: an automated
computational tool for identifying conserved regions in CryoEM structures.
Bioinformatics, 2010. 26(12): p. i301-i309.
4. کتابپور کیوان دکتر پیشرفته کاوی داده
36