یادگیری-ماشین-1.ppsx

‫یادگیری‬
‫ماشین‬
‫درس‬ ‫نام‬
:
‫محمودی‬ ‫فریبرز‬ ‫دکتر‬
‫کامپیوتر‬ ‫مهندسی‬ ‫گروه‬
‫دانشگاه‬
‫قزوین‬ ‫اسالمی‬ ‫آزاد‬
& Mitchell Ch. 1
& Russell Ch. 18
2

‫مقدمه‬

‫تعریف‬
‫فرهنگ‬
‫لغات‬
‫از‬
:

‫عبارت‬
‫است‬
‫از‬
‫بدست‬
‫آوردن‬
‫دانش‬
‫و‬
‫یا‬
‫فهم‬
‫آن‬
‫از‬
‫طریق‬
،‫مطالعه‬
‫آموزش‬
‫و‬
‫یا‬
‫تجربه‬
.

‫همچنین‬
‫گفته‬
‫شده‬
‫است‬
‫که‬
‫عبارت‬
‫است‬
‫از‬
‫بهبود‬
‫عملکرد‬
‫از‬
‫طریق‬
‫تجربه‬
.

‫تعریف‬
‫ماشین‬
:

‫ماشین‬
‫عبارت‬
‫است‬
‫از‬
‫اینکه‬
‫چگونه‬
‫توان‬‫می‬
‫ای‬‫برنامه‬
‫نوشت‬
‫که‬
‫از‬
‫طریق‬
‫تجربه‬
‫کرده‬
‫و‬
‫عملکرد‬
‫خود‬
‫را‬
‫بهتر‬
‫کند‬
.
‫ممکن‬
‫است‬
‫باعث‬
‫تغییر‬
‫در‬
‫ساختار‬
‫برنامه‬
‫و‬
‫یا‬
‫ها‬‫داده‬
‫شود‬
.
3

‫ماشین‬ ‫یادگیری‬ ‫تعریف‬
 From Mitchell (1997: 2):
A computer program is said to learn from
experience E with respect to some class of
tasks T and performance measure P, if its
performance at tasks in T, as measured by P,
improves with experience E.
 From Witten and Frank (2000: 6):
Things learn when they change their behavior in a
way that makes them perform better in the future.
In practice this means:
We have sets of examples from which we want to extract regularities.
4

‫مقدمه‬

‫ماشین‬
‫زمینه‬
‫تحقیقاتی‬
‫نسبتا‬
‫جدیدی‬
‫از‬
‫هوش‬
‫مصنوعی‬
‫است‬
‫که‬
‫در‬
‫حال‬
‫حاضر‬
‫دوران‬
‫رشد‬
‫و‬
‫تکامل‬
‫خود‬
‫را‬
‫می‬
‫گذراند‬
‫و‬
‫زمینه‬
‫ای‬
‫بسیار‬
‫فعال‬
‫در‬
‫علوم‬
‫کامپیوتر‬
‫می‬
‫باشد‬
.

‫علوم‬
‫مختلفی‬
‫در‬
‫ارتباط‬
‫با‬
‫ماشین‬
‫در‬
‫ارتباط‬
‫هستند‬
‫از‬
‫جمله‬
:

‫هوش‬
،‫مصنوعی‬
،‫روانشناسی‬
،‫فلسفه‬
‫تئوری‬
،‫اطالعات‬
‫آمار‬
‫و‬
،‫احتماالت‬
‫تئوری‬
‫کنترل‬
‫و‬
...
5

‫درس‬ ‫اهداف‬
‫هدف‬
‫از‬
‫این‬
‫درس‬
‫ارائه‬
‫یک‬
‫دید‬
‫کلی‬
‫نسبت‬
‫به‬
‫ماشین‬
‫است‬
‫که‬
‫مباحث‬
‫زیر‬
‫را‬
‫در‬
‫بر‬
‫می‬
‫گیرد‬
:

‫های‬‫جنبه‬
‫عملی‬
‫شامل‬
:
‫های‬‫الگوریتم‬
‫مختلف‬
‫نظیر‬
‫های‬‫درخت‬
‫تصمیم‬
،
‫های‬‫شبکه‬
‫عصبی‬
‫و‬
‫های‬‫شبکه‬
‫باور‬
‫بیزی‬
.

‫مدلهای‬
‫عمومی‬
‫شامل‬
:
‫الگوریتم‬
‫ژنتیک‬
‫و‬
‫تقویتی‬
.

‫مفاهیم‬
‫تئوریک‬
‫شامل‬
:
‫های‬‫زمینه‬
‫مرتبط‬
‫درعلم‬
،‫آمار‬
‫بیزین‬
‫بررسی‬
‫می‬
‫شوند‬
.
‫در‬
‫این‬
‫مباحث‬
‫ارتباط‬
‫تعداد‬
‫مثالها‬
‫با‬
‫کارائی‬
‫بررسی‬
‫می‬
،‫شوند‬
‫میزان‬
‫خطای‬
‫قابل‬
6

‫مراجع‬

‫درس‬ ‫کتاب‬
:
 Machine learning by Tom Mitchell, McGraw Hill, 1997.

‫مراجع‬ ‫سایر‬
 Artificial Intelligence: A Modern Approach, By Stuart J.
Russell and Peter Norvig, 2nd Edition.
 Reinforcement learning: An introduction, By Richard S.
Sutton & Andrew G Barto.
 Introduction to machine learning by Nils J. Nilson.
7

‫درس‬ ‫سایت‬
 http://fzmahmoudi.googlepages.com

‫در‬ ‫فوق‬ ‫آدرس‬ ‫ازطریق‬ ‫درس‬ ‫به‬ ‫مربوط‬ ‫اطالعات‬ ‫سایر‬ ‫و‬ ‫تمرینات‬
‫گرفت‬ ‫خواهند‬ ‫قرار‬ ‫دانشجویان‬ ‫اختیار‬
.
 Qiau.ml@gmail.com

‫شود‬ ‫ارسال‬ ‫فوق‬ ‫الکترونیک‬ ‫پست‬ ‫به‬ ‫باید‬ ‫درسی‬ ‫تکالیف‬
.
8

‫درس‬ ‫سیالبس‬
 Introduction
 Learning Concept
 Decision Tree Learning
 Artificial Neural Networks
 Evaluating Hypothesis
 Bayesian Learning & Networks
 Computational Learning Theory
 Learning based Instance
 Algorithms Genetic
 Reinforcement Learning
 SupportVector Machine (SVM)
9

‫مقدمه‬

‫مفهوم‬

‫با‬
‫درخت‬
‫تصمیم‬

‫شبکه‬
‫مصنوعی‬ ‫عصبی‬ ‫های‬

‫فرضیه‬ ‫ارزیابی‬

‫و‬ ‫بیزین‬ ‫یادگیری‬
‫شبکه‬
‫بیزی‬ ‫باور‬ ‫های‬

‫یادگیری‬ ‫تئوری‬
‫محاسباتی‬

‫بر‬ ‫مبتنی‬
‫نمونه‬

‫ژنتیک‬ ‫الگوریتم‬

‫ی‬
‫تقویتی‬ ‫ادگیری‬

‫پشتیبان‬ ‫بردار‬ ‫ماشین‬

‫یادگیری؟‬ ‫چرا‬

‫استفاده‬
‫از‬
‫در‬
‫محیطهای‬
‫ناشناخته‬
‫ضروری‬
‫است‬
.

‫یعنی‬
‫وقتی‬
‫طراح‬
‫نسبت‬
‫به‬
‫محیط‬
‫کمبود‬
‫دانش‬
‫دارد‬
.

‫ممکن‬
‫است‬
‫موقع‬
‫طراحی‬
‫یک‬
‫سیستم‬
‫تمامی‬
‫ویژگیهای‬
‫آن‬
‫شناخته‬
‫شده‬
‫نباشد‬
‫در‬
‫حالیکه‬
‫ماشین‬
‫می‬
‫تواند‬
‫حین‬
‫کار‬
‫آنها‬
‫را‬
‫یاد‬
‫بگیرد‬
.

‫ممکن‬
‫است‬
‫در‬
‫خیل‬
‫عظیمی‬
‫از‬
‫داده‬
‫اطالعات‬
‫مهمی‬
‫نهفته‬
‫باشد‬
‫که‬
‫بشر‬
‫قادر‬
‫به‬
‫تشخیص‬
‫آن‬
‫نباشد‬
(
‫داده‬
‫کاوی‬
)

‫به‬
‫عنوان‬
‫یک‬
‫روش‬
‫ساخت‬
‫سیستم‬
‫قابل‬
‫است‬
.

‫بعضی‬
‫کارها‬
‫را‬
‫بدرستی‬
‫نمی‬
‫توان‬
‫توصیف‬
‫نمود‬
.
‫در‬
‫صورتیکه‬
‫ممکن‬
‫است‬
‫آنها‬
‫را‬
‫بتوان‬
‫به‬
‫صورت‬
‫مثالهای‬
(
‫ورودی‬
/
‫خروجی‬
)
‫معین‬
‫نمود‬
.

‫یعنی‬
‫عامل‬
‫را‬
‫با‬
‫واقعیت‬
‫مواجه‬
‫کند‬‫می‬
‫به‬
‫جای‬
‫آنکه‬
‫سعی‬
‫در‬
‫حل‬
‫مستقیم‬
‫مساله‬
‫نماید‬
.

‫مکانیزم‬
‫گیری‬‫تصمیم‬
‫عامل‬
‫را‬
‫به‬
‫منظور‬
‫بهبود‬
‫عملکرد‬
‫آن‬
‫اصالح‬
‫نماید‬‫می‬
.

‫ممکن‬
‫است‬
‫محیط‬
‫در‬
‫طول‬
‫زمان‬
‫تغییر‬
‫کند‬
.
‫ماشین‬
‫می‬
‫تواند‬
‫با‬
‫این‬
‫تغییرات‬
‫خود‬
‫را‬
‫با‬
‫آنها‬
‫وفق‬
‫دهد‬
.
10

‫یادگیری؟‬ ‫چرا‬

‫در‬
‫سالهای‬
‫اخیر‬
‫پیشرفتهای‬
‫زیادی‬
‫در‬
‫ها‬
‫و‬
‫تئوری‬
‫های‬
‫مربوطه‬
‫بوجود‬
‫آمده‬
‫و‬
‫زمینه‬
‫های‬
‫تحقیقاتی‬
‫جدید‬
‫زیادی‬
‫پدید‬
‫آمده‬
‫اند‬
.

‫داده‬
‫های‬
‫آزمایشی‬
‫زیادی‬
‫بصورت‬
Online
‫بوجود‬
‫آمده‬
‫اند‬
.

‫کامپیوتر‬
‫ها‬
‫قدرت‬
‫زیادی‬
‫بدست‬
‫آورده‬
‫اند‬

‫جنبه‬
‫های‬
‫عملی‬
‫با‬
‫کاربردهای‬
‫صنعتی‬
‫بوجود‬
‫آمده‬
‫اند‬
.
(
‫در‬
‫زمینه‬
‫پردازش‬
‫گفتار‬
‫برنامه‬
‫های‬
‫مبتنی‬
‫بر‬
‫از‬
‫همه‬
‫روشهای‬
‫دیگر‬
‫پیشی‬
‫گرفته‬
‫اند‬
)
11

‫یادگیری‬ ‫کاربردهای‬ ‫از‬ ‫برخی‬
‫ماشین‬

‫روباتها‬ ‫کنترل‬

‫کاوی‬ ‫داده‬

‫گفتار‬ ‫تشخیص‬

‫متن‬ ‫شناسائی‬

‫داده‬ ‫پردازش‬
‫اینترنتی‬ ‫های‬

Bioinformatics

‫کامپیوتری‬ ‫بازیهای‬
12

‫ماشین‬ ‫یادگیری‬ ‫وظیفه‬
.1
‫بندی‬‫دسته‬
‫یا‬
Classification
‫گفتار‬ ‫تشخیص‬ ‫مثل‬
.
.2
‫مسئله‬ ‫حل‬
‫بازی‬ ‫مثل‬ ‫عمل‬ ‫و‬ ‫طراحی‬ ،
‫در‬ ‫اتومبیل‬ ‫راندن‬ ،‫ها‬
‫بزرگراه‬
.
13

‫الگوریتمهای‬ ‫ارزیابی‬ ‫مبنای‬

‫بندی‬‫دسته‬ ‫دقت‬
.

‫آن‬ ‫کیفیت‬ ‫و‬ ‫حل‬ ‫راه‬ ‫صحت‬
.

‫عملکرد‬ ‫سرعت‬
.
14

‫ماشین‬ ‫و‬ ‫انسان‬ ‫یادگیری‬

‫است؟‬ ‫چگونه‬ ‫انسان‬ ‫یادگیری‬

‫طریق‬ ‫از‬ ‫انسان‬
‫بیرونی‬ ‫محیط‬ ‫با‬ ‫تعامل‬
‫می‬ ‫یاد‬
‫گیرد‬
.

‫است؟‬ ‫چگونه‬ ‫ماشین‬ ‫یادگیری‬

‫طریق‬ ‫از‬
‫برنامه‬ ‫نوشتن‬
‫می‬
‫بکند‬ ‫باید‬ ‫چه‬ ‫که‬ ‫گفت‬ ‫ماشین‬ ‫به‬ ‫توان‬
.

‫طریق‬ ‫از‬
‫متعدد‬ ‫مثالهای‬ ‫نمایش‬
‫می‬
‫یادگیری‬ ‫به‬ ‫وادار‬ ‫را‬ ‫ماشین‬ ‫توان‬
‫نمود‬
.

‫می‬ ‫ماشین‬
‫طریق‬ ‫از‬ ‫تواند‬
‫واقعی‬ ‫محیط‬ ‫تجربه‬
‫بگیرید‬ ‫یاد‬
.
15

‫تکنیک‬
‫یادگیری‬ ‫مختلف‬ ‫های‬

‫استقرایی‬ ‫یادگیری‬
(Inductive)
‫متعدد‬ ‫مثالهای‬ ‫مبنای‬ ‫بر‬ ‫یادگیری‬ ‫که‬
‫می‬ ‫انجام‬
‫شود‬
.
‫درخت‬ ‫مثل‬
‫تصمیم‬ ‫های‬

Connectionist
‫صورت‬ ‫بشر‬ ‫مغز‬ ‫مدل‬ ‫مبنای‬ ‫بر‬ ‫یادگیری‬ ‫که‬
‫می‬
‫پذیرد‬
.
‫شبکه‬ ‫مثل‬
‫مصنوعی‬ ‫عصبی‬ ‫های‬

Bayesian
‫فرضیه‬ ‫که‬
‫ارائه‬ ‫داده‬ ‫مورد‬ ‫در‬ ‫مختلفی‬ ‫های‬
‫می‬
‫شود‬
.

Reinforcement
‫استفاده‬ ‫محیط‬ ‫در‬ ‫تجربه‬ ‫و‬ ‫سنسورها‬ ‫از‬ ‫که‬
‫می‬
‫شود‬
.

Evolutionary
16

‫یادگیر‬ ‫عامل‬ ‫ساختار‬
17

‫ساختار‬
‫یادگیر‬ ‫عامل‬

‫عنصر‬
‫اجرایی‬
(Performance Element)
:
‫یک‬
‫عامل‬
‫غیریادگیر‬
‫است‬
‫که‬
‫با‬
‫توجه‬
‫به‬
‫ادراکات‬
‫و‬
‫دانش‬
‫موجود‬
‫سعی‬
‫در‬
‫حل‬
‫مساله‬
‫دارد‬
.

‫نقاد‬
(Critic)
:
‫عنصری‬
‫است‬
‫که‬
‫با‬
‫توجه‬
‫به‬
‫استاندارد‬
‫بیرونی‬
‫بازخوردی‬
‫از‬
‫میزان‬
‫موفقیت‬
‫عامل‬
‫باز‬
‫گرداند‬‫می‬
.

‫عنصر‬
‫یادگیرنده‬
(Learning Element)
:
‫با‬
‫توجه‬
‫به‬
‫بازخوردی‬
‫که‬
‫از‬
‫نقاد‬
‫اخذ‬
‫کند‬‫می‬
‫تغییرات‬
‫الزم‬
‫را‬
‫در‬
‫دانش‬
‫عنصر‬
‫اجرایی‬
‫ایجاد‬
‫تا‬
‫عملکرد‬
‫آنرا‬
‫بهبود‬
‫بخشد‬
.

‫ایجادگر‬
‫مساله‬
(Problem Generator)
:
‫این‬
‫عنصر‬
‫عملی‬
‫را‬
‫که‬
‫منجر‬
‫به‬
‫یک‬
‫تجربه‬
‫جدید‬
‫شود‬‫می‬
‫به‬
‫عنصر‬
‫اجرایی‬
‫پیشنهاد‬
.
18

‫یادگیرنده‬ ‫عنصر‬
(Learning element)

‫است‬ ‫زیر‬ ‫عوامل‬ ‫تاثیر‬ ‫تحت‬ ‫یادگیرنده‬ ‫عنصر‬ ‫طراحی‬
:

‫دارند‬ ‫آموزش‬ ‫قابلیت‬ ‫اجرایی‬ ‫عنصر‬ ‫اجزاء‬ ‫از‬ ‫کدامیک‬
.

‫است‬ ‫موجود‬ ‫اجزا‬ ‫این‬ ‫آموزش‬ ‫برای‬ ‫بازخوردی‬ ‫چه‬
.

‫است‬ ‫شده‬ ‫گرفته‬ ‫بکار‬ ‫اجزا‬ ‫این‬ ‫برای‬ ‫دانشی‬ ‫نمایش‬ ‫شیوه‬ ‫چه‬
.

‫بازخورد‬ ‫انواع‬
:

‫ناظر‬ ‫با‬ ‫یادگیری‬
(Supervised learning)
:
‫چند‬ ‫برای‬ ‫درست‬ ‫جوابهای‬ ‫داشتن‬
‫مثال‬
.

‫ناظر‬ ‫بدون‬ ‫یادگیری‬
(Unsupervised learning)
:
‫جوابهای‬ ‫به‬ ‫دسترسی‬ ‫عدم‬
‫درست‬
.
19

‫یادگیری‬ ‫بندی‬‫دسته‬

‫با‬
‫ناظر‬
:
‫مجموعه‬
‫ای‬
‫از‬
‫موجود‬
‫می‬
‫باشد‬
‫که‬
‫در‬
‫آن‬
‫به‬
‫ازای‬
‫هر‬
،‫ورودی‬
‫مقدار‬
‫خروجی‬
‫و‬
‫یا‬
‫تابع‬
‫مربوطه‬
‫مشخص‬
‫است‬
.
‫هدف‬
‫سیستم‬
‫یادگیر‬
‫بدست‬
‫آوردن‬
‫فرضیه‬
‫ای‬
‫است‬
‫که‬
‫تابع‬
‫و‬
‫یا‬
‫رابطه‬
‫بین‬
‫ورودی‬
‫و‬
‫خروجی‬
‫را‬
‫حدس‬
‫بزند‬
.

‫بدون‬
‫ناظر‬
:
‫مجموعه‬
‫ای‬
‫از‬
‫موجود‬
‫می‬
‫باشد‬
‫که‬
‫در‬
‫آن‬
‫فقط‬
‫مقدار‬
‫ورودیها‬
‫مشخص‬
‫است‬
‫و‬
‫اطالعاتی‬
‫در‬
‫مورد‬
‫خروجی‬
‫صحیح‬
‫دردست‬
‫نیست‬
.
‫بدون‬
‫ناظر‬
‫برای‬
‫ورودیها‬
‫و‬
‫یا‬
‫پیش‬
‫بینی‬
‫مقدار‬
‫بعدی‬
‫بر‬
‫اساس‬
‫موقعیت‬
‫فعلی‬
‫عمل‬
‫می‬
‫کند‬
.
20

‫ناظر‬ ‫با‬ ‫یادگیری‬ ‫از‬ ‫مثالی‬

‫یک‬
‫پایگاه‬
‫داده‬
‫شامل‬
‫قیمت‬
50
‫خانه‬
‫و‬
‫مساحت‬
‫خانه‬
‫ها‬
‫وجود‬
‫دارد‬
‫چگونه‬
‫می‬
‫توان‬
‫نرخ‬
‫خانه‬
‫ها‬
‫را‬
‫بر‬
‫اساس‬
‫تابعی‬
‫از‬
‫اندازه‬
‫آنها‬
‫یاد‬
‫گرفت؟‬
21
‫مساحت‬
‫قیمت‬
560
1012
893
2196
936
37
79
76
130
82

‫ناظر‬ ‫با‬ ‫یادگیری‬ ‫از‬ ‫مثالی‬

‫خانه‬ ‫مساحت‬
Input feature: x(i) =

‫خانه‬ ‫قیمت‬
Output feature: y(i) =
< x(i), y(i) >
‫یادگیری‬ ‫مثال‬
{x(i), y(i) , i=1:m}
‫یادگیری‬ ‫مجموعه‬
‫عمل‬
:
‫با‬
‫داشتن‬
‫یک‬
‫مجموعه‬
‫می‬
‫خواهیم‬
‫تابعی‬
‫بصورت‬
h: xy
‫یاد‬
‫بگیریم‬
‫که‬
h(x)
‫بتواند‬
‫مقدار‬
y
‫را‬
‫بخوبی‬
‫حدس‬
‫بزند‬
.
‫این‬
‫تابع‬
‫فرضیه‬
‫و‬
‫یا‬
hypothesis
‫نامیده‬
‫می‬
‫شود‬
.
22

‫بندی‬‫دسته‬ ‫و‬ ‫رگرسیون‬

‫رگرسیون‬
(
Regression
)
:
‫وقتی‬
‫که‬
‫تابع‬
‫هدف‬
‫بصورت‬
‫پیوسته‬
‫باشد‬
‫مسئله‬
‫یک‬
‫مسئله‬
‫رگرسیون‬
(
‫برازاندن‬
‫منحنى‬
Curve fitting
)
‫خواهد‬
‫بود‬
.
‫مثل‬
‫رابطه‬
‫قیمت‬
‫و‬
‫مساحت‬
‫خانه‬
‫ها‬
.

(Classification)
:
‫وقتی‬
‫که‬
y
‫فقط‬
‫بتواند‬
‫تعداد‬
‫محدودی‬
‫مقدار‬
‫گسسته‬
‫بگیرد‬
‫مسئله‬
‫یک‬
‫مسئله‬
‫خواهد‬
‫بود‬
.
‫مثل‬
:
‫آیا‬
‫مکان‬
‫موردنظر‬
‫یک‬
‫آپارتمان‬
‫است‬
‫یا‬
‫یک‬
‫خانه؟‬
23

24
‫استقرایی‬ ‫یادگیری‬
Inductive
learning

‫است‬ ‫ناظر‬ ‫با‬ ‫یادگیری‬ ‫شیوه‬ ‫یک‬
.

‫یادگیری‬ ‫شکل‬ ‫ترین‬‫ساده‬
:
‫مثال‬ ‫چند‬ ‫روی‬ ‫از‬ ‫تابع‬ ‫یک‬ ‫یادگیری‬
f
‫هدف‬ ‫تابع‬
‫مورد‬
،‫است‬ ‫نظر‬
‫یک‬
‫مثال‬
‫شکل‬ ‫به‬ ‫مرتبی‬ ‫زوج‬ ‫تابع‬ ‫این‬ ‫از‬
(x, f(x))
‫باشد‬‫می‬
.
‫تابع‬ ‫یافتن‬ ‫ما‬ ‫مساله‬
‫فرضیه‬
h
‫که‬ ‫نحوی‬ ‫به‬ ‫است‬
:

‫باشد‬ ‫منطبق‬ ‫اصلی‬ ‫تابع‬ ‫به‬ ‫ممکن‬ ‫حد‬ ‫تا‬ ‫که‬
:
h ≈ f

‫یک‬ ‫ما‬ ‫ورودی‬
‫آموزشی‬ ‫مجموعه‬
(training set)
‫باشد‬‫می‬ ‫مثال‬ ‫چندین‬ ‫حاوی‬
.


25
‫استقرایی‬ ‫یادگیری‬ ‫روش‬

‫تابع‬ ‫تنظیم‬ ‫یا‬ ‫و‬ ‫ایجاد‬
h
‫آموزشی‬ ‫مجموعه‬ ‫روی‬ ‫که‬ ‫نحوی‬ ‫به‬
‫با‬
f
‫باشد‬ ‫داشته‬ ‫تطابق‬
.

‫تابع‬
h
‫تابع‬ ‫یک‬
‫سازگار‬
(consistent)
‫با‬ ‫اگر‬ ‫بود‬ ‫خواهد‬
f
‫باشد‬ ‫داشته‬ ‫تطابق‬ ‫مثالها‬ ‫تمام‬ ‫روی‬
.

‫روش‬ ‫مشابه‬
‫منحنى‬ ‫برازاندن‬
(Curve fitting)

26

h
‫با‬
f
.

‫تابع‬
h
‫سازگار‬
(consistent)
f
.

(Curve fitting)

27

h
‫با‬
f
.

‫تابع‬
h
‫سازگار‬
(consistent)
f
.

(Curve fitting)

28

h
‫با‬
f
.

‫تابع‬
h
‫سازگار‬
(consistent)
f
.

(Curve fitting)

29

h
‫با‬
f
.

‫تابع‬
h
‫سازگار‬
(consistent)
f
.

(curve fitting)

30

h
‫با‬ ‫آموزشی‬ ‫مجموعه‬ ‫روی‬ ‫که‬ ‫نحوی‬ ‫به‬
f
.

‫تابع‬
h
‫سازگار‬
(consistent)
f
‫تمام‬ ‫روی‬
‫باشد‬ ‫داشته‬ ‫تطابق‬ ‫مثالها‬
.

(curve fitting)

‫اصل‬
Ockham
:
‫ترین‬‫ساده‬
‫است‬ ‫ترجیح‬ ‫مورد‬ ‫سازگار‬ ‫فرضیه‬
.

31
‫تصمیم‬ ‫درخت‬ ‫با‬ ‫یادگیری‬
Decision trees
‫مساله‬
:
‫تصمیم‬
‫میز‬ ‫یک‬ ‫شدن‬ ‫خالی‬ ‫برای‬ ‫نکردن‬ ‫یا‬ ‫کردن‬ ‫صبر‬ ‫مورد‬ ‫در‬ ‫گیری‬
‫زیر‬ ‫صفات‬ ‫روی‬ ‫شرایط‬ ‫به‬ ‫توجه‬ ‫با‬ ‫رستوران‬ ‫یک‬ ‫در‬
:
.1
Alternate
:
‫وجود‬ ‫رستوران‬ ‫این‬ ‫نزدیکی‬ ‫در‬ ‫جایگزینی‬ ‫رستوران‬ ‫آیا‬
‫دارد؟‬
.2
Bar
:
‫رستوران‬ ‫در‬ ‫انتظار‬ ‫زمان‬ ‫در‬ ‫نوشیدنی‬ ‫صرف‬ ‫برای‬ ‫محلی‬ ‫آیا‬
‫دارد؟‬ ‫وجود‬
.3
Fri/Sat
:
‫است؟‬ ‫هفته‬ ‫آخر‬ ‫روز‬ ‫یک‬ ‫امروز‬ ‫آیا‬
.4
Hungry
:
‫است؟‬ ‫چقدر‬ ‫ما‬ ‫گرسنگی‬ ‫میزان‬
.5
Patrons
:
‫چندتاست؟‬ ‫رستوران‬ ‫در‬ ‫موجود‬ ‫مشتریان‬ ‫تعداد‬
(None, Some,
Full)
.6
Price
:
‫چیست؟‬ ‫رستوران‬ ‫قیمت‬ ‫محدوده‬
($, $$, $$$)
.7
Raining
:
‫بارد؟‬‫می‬ ‫رستوران‬ ‫خارج‬ ‫در‬ ‫باران‬ ‫آیا‬
.8
Reservation
:
‫خیر؟‬ ‫یا‬ ‫ایم‬‫داده‬ ‫انجام‬ ‫رزرو‬ ‫قبل‬ ‫از‬ ‫آیا‬
.9
Type
:
‫است؟‬ ‫نوعی‬ ‫چه‬ ‫از‬ ‫رستوران‬
(French, Italian, Thai, Burger)
.10
WaitEstimate
:
‫است؟‬ ‫چقدر‬ ‫انتظار‬ ‫تخمینی‬ ‫زمان‬
(0-10, 10-30, 30-60,
>60)

32
‫صفت‬ ‫بر‬ ‫مبتنی‬ ‫نمایشهای‬
Attribute-based representations

‫بوسیله‬ ‫مثالها‬
‫صفات‬ ‫مقادیر‬
(
‫پیوسته‬ ،‫گسسته‬ ،‫بولی‬
)
‫شوند‬‫می‬ ‫توصیف‬
.

‫با‬ ‫مثالها‬
‫مثبت‬
(T)
‫و‬
‫منفی‬
(F)
‫اند‬‫شده‬ ‫بندی‬‫طبقه‬
.

33
‫تصمیم‬ ‫درخت‬
Decision
trees 
‫فرضیه‬ ‫نمایش‬ ‫برای‬ ‫ممکن‬ ‫شیوه‬ ‫یک‬
‫باشد‬‫می‬
.

‫موارد‬ ‫در‬
true
‫انجام‬ ‫انتظار‬ ‫عمل‬
‫پذیرد‬‫می‬
.

34
‫توصیف‬ ‫قابلیت‬
Expressiveness

‫دارا‬ ‫را‬ ‫ورودی‬ ‫صفات‬ ‫از‬ ‫تابعی‬ ‫هر‬ ‫توصیف‬ ‫قابلیت‬ ‫تصمیم‬ ‫درختهای‬
‫باشند‬‫می‬
.

‫توسط‬ ‫حقیقت‬ ‫جدول‬ ‫یک‬ ‫با‬ ‫شده‬ ‫بیان‬ ‫بولی‬ ‫تابع‬ ‫هر‬ ‫دیگر‬ ‫عبارت‬ ‫به‬
‫است‬ ‫توصیف‬ ‫قابل‬ ‫تصمیم‬ ‫درخت‬
.
‫مسیر‬ ‫یک‬ ‫جدول‬ ‫سطر‬ ‫هر‬ ‫حال‬ ‫این‬ ‫در‬
‫است‬ ‫برگ‬ ‫تا‬ ‫ریشه‬ ‫از‬
.

‫وجود‬ ‫سازگار‬ ‫تصمیم‬ ‫درخت‬ ‫یک‬ ‫آموزشی‬ ‫مجموعه‬ ‫هر‬ ‫برای‬ ‫بنابراین‬
،‫دارد‬
(
‫تابع‬ ‫اینکه‬ ‫مگر‬
f
‫باشد‬ ‫قطعی‬ ‫غیر‬
)
‫وجود‬ ‫احتمال‬ ‫این‬ ‫اما‬
‫نباشند‬ ‫تعمیم‬ ‫قابل‬ ‫درخت‬ ‫در‬ ‫جدید‬ ‫مثالهای‬ ‫که‬ ‫دارد‬
.

‫تصمیم‬ ‫درختهای‬ ‫با‬ ‫ترجیح‬
‫فشرده‬
‫است‬
.

35
‫فرضیه‬ ‫فضاهای‬
Hypothesis
spaces
‫سوال‬
:
‫تصمیم‬ ‫درخت‬ ‫چند‬
(
‫فرضیه‬
)
‫برای‬ ‫متمایز‬
n
‫بولی‬ ‫صفت‬
=
‫با‬ ‫توان‬‫می‬ ‫که‬ ‫متمایز‬ ‫بولی‬ ‫توابع‬ ‫تعداد‬
n
‫ساخت‬
.
=
‫با‬ ‫متمایز‬ ‫حقیقت‬ ‫جداول‬ ‫تعداد‬
2n
‫سطر‬
=
22n
.

‫برای‬ ‫مثال‬ ‫بطور‬
6
18،446،744،073،709،551،616
‫دارد‬ ‫وجود‬ ‫درخت‬
.

36
‫فرضیه‬ ‫فضاهای‬
Hypothesis
spaces
‫سوال‬
:
‫تصمیم‬ ‫درخت‬ ‫چند‬
(
‫فرضیه‬
)
‫برای‬ ‫متمایز‬
n
=
‫با‬ ‫توان‬‫می‬ ‫که‬ ‫متمایز‬ ‫بولی‬ ‫توابع‬ ‫تعداد‬
n
‫ساخت‬ ‫بولی‬ ‫صفت‬
.
=
‫با‬ ‫متمایز‬ ‫حقیقت‬ ‫جداول‬ ‫تعداد‬
2n
‫سطر‬
=
22n
.

‫برای‬ ‫مثال‬ ‫بطور‬
6
18،446،744،073،709،551،616
‫دارد‬ ‫وجود‬ ‫درخت‬
.
‫سوال‬
:
‫دارد؟‬ ‫وجود‬ ‫خالص‬ ‫عطفی‬ ‫فرضیه‬ ‫چند‬

‫عطفی‬ ‫فرضیه‬ ‫هر‬
(
‫نظیر‬
Hungry  Rain
)
‫برگ‬ ‫تا‬ ‫ریشه‬ ‫از‬ ‫مسیر‬ ‫یک‬
‫است‬ ‫تصمیم‬ ‫درخت‬ ‫در‬
.

‫بدون‬ ‫یا‬ ‫منفی‬ ،‫مثبت‬ ‫نقش‬ ‫عطفی‬ ‫فرضیه‬ ‫یک‬ ‫در‬ ‫است‬ ‫ممکن‬ ‫صفت‬ ‫هر‬
‫باشد‬ ‫داشته‬ ‫تاثیر‬
.

‫برای‬ ‫نتیجه‬ ‫در‬
n
،‫صفت‬
3n
‫دارد‬ ‫وجود‬ ‫متمایز‬ ‫عطفی‬ ‫فرضیه‬
.

‫شود‬‫می‬ ‫باعث‬ ‫فرضیه‬ ‫فضای‬ ‫حجم‬ ‫افزایش‬
:

‫یابد‬ ‫افزایش‬ ‫هدف‬ ‫تابع‬ ‫توصیف‬ ‫شانس‬
.

‫آموزشی‬ ‫مجموعه‬ ‫با‬ ‫سازگار‬ ‫های‬‫فرضیه‬ ‫تعداد‬ ‫افزایش‬ ‫باعث‬ ‫دیگر‬ ‫طرف‬ ‫از‬
‫شود‬‫می‬
‫شود‬‫می‬ ‫بیشتر‬ ‫نیز‬ ‫غاط‬ ‫بینی‬ ‫پیش‬ ‫احتمال‬ ‫نتیجه‬ ‫در‬ ‫و‬
.
‫یک‬ ‫فضا‬ ‫این‬ ‫در‬ ‫تا‬ ‫داریم‬ ‫هوشمند‬ ‫الگوریتم‬ ‫یک‬ ‫به‬ ‫نیاز‬ ‫پس‬
‫درخت‬
‫بیابد‬ ‫سازگار‬
.

37
‫درخت‬ ‫یادگیری‬ ‫الگوریتم‬
‫تصمیم‬

‫هدف‬
:
‫است‬ ‫آموزشی‬ ‫مثالهای‬ ‫با‬ ‫سازگار‬ ‫درخت‬ ‫کوچکترین‬ ‫یافتن‬
.

‫ایده‬
:
‫انتخاب‬
(
‫بازگشتی‬
)
‫معنی‬ ‫با‬
‫ریشه‬ ‫برای‬ ‫صفت‬ ‫ترین‬
(
‫زیر‬
)
‫درخت‬
.

38
‫صفت‬ ‫انتخاب‬

‫ایده‬
:
‫ایده‬ ‫حالت‬ ‫در‬ ‫خوب‬ ‫صفت‬ ‫یک‬
‫آل‬
‫دو‬ ‫به‬ ‫را‬ ‫مثالها‬
‫می‬ ‫تفکیک‬ ‫منفی‬ ‫تمام‬ ‫و‬ ‫مثبت‬ ‫تمام‬ ‫زیرمجموعه‬
‫کند‬
.

‫بنابراین‬
Patrons?
‫است‬ ‫بهتری‬ ‫انتخاب‬
.

39
‫اطالعات‬ ‫تئوری‬ ‫از‬ ‫استفاده‬

‫پیاده‬ ‫در‬
‫سازی‬
Choose-Attribute
‫الگوریتم‬ ‫در‬
DTL
‫از‬
‫اطالعاتی‬ ‫محتوای‬
(
‫انتروپی‬
)
‫می‬ ‫استفاده‬
‫شود‬
.

‫حاوی‬ ‫آموزشی‬ ‫مجموعه‬ ‫یک‬ ‫برای‬
p
‫و‬ ‫مثبت‬ ‫مثال‬
n
‫منفی‬ ‫مثال‬
:
n
p
n
n
p
n
n
p
p
n
p
p
n
p
n
n
p
p
I









2
2 log
log
)
,
(
)
P(v
)
-P(v
))
, P(v
),
I(P(v
n
i i
i
n 

 1 2
1 log

40
‫اطالعات‬ ‫تئوری‬ ‫از‬ ‫استفاده‬

‫داریم‬ ‫منفی‬ ‫و‬ ‫مثبت‬ ‫کالس‬ ‫دو‬ ‫حالتیکه‬ ‫در‬
:

‫اگر‬
I=0
‫کالس‬ ‫یک‬ ‫در‬ ‫مثالها‬ ‫همه‬ ‫یعنی‬ ‫باشد‬
‫هستند‬
.

‫اگر‬
I=1
‫و‬ ‫کالس‬ ‫یک‬ ‫در‬ ‫مثالها‬ ‫نصف‬ ‫یعنی‬ ‫باشد‬
‫هستند‬ ‫دوم‬ ‫کالس‬ ‫در‬ ‫دیگر‬ ‫نصف‬
.

41
‫اطالعات‬ ‫بهره‬
Information
gain

‫نظیر‬ ‫منتخب‬ ‫صفت‬ ‫یک‬
A
‫آموزشی‬ ‫مجموعه‬
E
‫زیرمجموعه‬ ‫به‬ ‫را‬
‫هاای‬
E1, … , Ev
‫مقادیر‬ ‫اساس‬ ‫بر‬
A
‫می‬ ‫تقسیم‬
‫نماید‬
.
‫آنکاه‬ ‫فرض‬ ‫با‬
A
‫دارای‬
v
‫است‬ ‫متمایز‬ ‫مقدار‬
.
‫صفت‬ ‫اطالعات‬ ‫میزان‬
A
‫اسات‬ ‫عبارت‬
‫از‬
:

(IG)
‫اطالعاات‬ ‫میازان‬ ‫و‬ ‫انتروپای‬ ‫تفریق‬ ‫حاصل‬ ‫که‬
‫صفت‬
A
‫است‬ ‫صفت‬ ‫انتخاب‬ ‫برای‬ ‫مناسبی‬ ‫معیار‬ ‫است‬
.

‫که‬ ‫شود‬‫می‬ ‫انتخاب‬ ‫صفتی‬
‫بیشترین‬
‫اطالعات‬ ‫بهره‬ ‫مقدار‬
(IG)
‫را‬
‫باشد‬ ‫داشته‬
.

 




v
i i
i
i
i
i
i
i
i
n
p
n
n
p
p
I
n
p
n
p
A
remainder
1
)
,
(
)
(
)
(
)
,
(
)
( A
remainder
n
p
n
n
p
p
I
A
IG 




42
‫داریم‬ ‫شده‬ ‫ذکر‬ ‫آموزشی‬ ‫مجموعه‬ ‫برای‬
:
p = n = 6, I(6/12, 6/12) = 1 bit
‫صفات‬ ‫مجموعه‬ ‫این‬ ‫برای‬
Patrons
‫و‬
Type
‫بگیرید‬ ‫نظر‬ ‫در‬ ‫را‬
(
‫سایر‬ ‫همچنین‬ ‫و‬
‫صفات‬
:)
‫صفت‬ ‫مجموعه‬ ‫این‬ ‫در‬
Patrons
‫بیشترین‬
IG
‫به‬ ‫پس‬ ‫داراست‬ ‫صفات‬ ‫سایر‬ ‫به‬ ‫نسبت‬ ‫را‬
‫الگوریتم‬ ‫توسط‬ ‫درخت‬ ‫ریشه‬ ‫عنوان‬
DTL
‫شود‬‫می‬ ‫انتخاب‬
bits
0
)]
4
2
,
4
2
(
12
4
)
4
2
,
4
2
(
12
4
)
2
1
,
2
1
(
12
2
)
2
1
,
2
1
(
12
2
[
1
)
(
bits
0541
.
)]
6
4
,
6
2
(
12
6
)
0
,
1
(
12
4
)
1
,
0
(
12
2
[
1
)
(











I
I
I
I
Type
IG
I
I
I
Patrons
IG
Information
gain

43
‫مثال‬

‫شده‬ ‫داده‬ ‫آموزش‬ ‫تصمیم‬ ‫درخت‬
‫با‬
12
‫مثال‬
:

‫است‬ ‫واقعی‬ ‫فرضیه‬ ‫درخت‬ ‫از‬ ‫تر‬‫ساده‬ ‫درخت‬ ‫این‬
.
‫پیچیده‬ ‫های‬‫فرضیه‬ ‫کوچک‬ ‫آموزشی‬ ‫های‬‫مجموعه‬ ‫اساسا‬
‫کند‬‫نمی‬ ‫ایجاد‬
.

44
‫اندازه‬
‫کارایی‬ ‫گیری‬
Performance
measurement 
‫چگونه‬
‫توان‬‫می‬
‫که‬ ‫شد‬ ‫مطمئن‬
h ≈ f
‫؟‬
.1
‫از‬ ‫استفاده‬
‫قضایای‬
/
‫اطالعات‬ ‫تئوری‬ ‫آماری‬
.
.2
‫آزمایش‬
h
‫یک‬ ‫روی‬
‫جدید‬ ‫آزمایشی‬ ‫مجموعه‬
.
(
‫امتحان‬
‫روی‬
‫های‬‫اندازه‬
‫تست‬ ‫و‬ ‫آموزشی‬ ‫مجموعه‬ ‫از‬ ‫متفاوت‬
‫باقیمانده‬ ‫روی‬
‫ها‬‫داده‬
‫آزمایشی‬ ‫مجموعه‬ ‫عنوان‬ ‫به‬
)
‫آموزش‬ ‫منحنی‬
=
‫به‬ ‫نسبت‬ ‫آزمایشی‬ ‫مجموعه‬ ‫روی‬ ‫پاسخ‬ ‫درستی‬ ‫درصد‬
‫آموزشی‬ ‫مجموعه‬ ‫اندازه‬

46
‫حد‬ ‫از‬ ‫بیش‬ ‫تطبیق‬
(Over
fitting)

‫گاهی‬
‫اوقات‬
‫در‬
‫مجموعه‬
‫آموزشی‬
‫نادری‬
‫وجود‬
‫دارد‬
‫که‬
‫ممکن‬
‫است‬
‫با‬
‫توزیع‬
‫کلی‬
‫داده‬
‫ها‬
‫مطابقت‬
‫نداشته‬
‫باشند‬
.
‫تعداد‬
‫زیاد‬
‫های‬‫گره‬
‫یک‬
‫درخت‬
‫تصمیم‬
‫باعث‬
‫می‬
‫شود‬
‫تا‬
‫درخت‬
‫درجه‬
‫آزادی‬
‫زیادی‬
‫برای‬
‫انطباق‬
‫با‬
‫این‬
‫مثالها‬
‫داشته‬
‫باشد‬
.

47
‫از‬ ‫بیش‬ ‫تطبیق‬ ‫با‬ ‫مقابله‬
‫حد‬

‫اجتناب‬
‫از‬
‫رشد‬
‫درخت‬
‫در‬
‫مرحله‬
‫ایجاد‬
.

‫هرس‬
‫کردن‬
(Post-Pruning)
‫درخت‬
‫پس‬
‫از‬
‫ایجاد‬
.

‫روشهای‬
‫تعیین‬
‫اندازه‬
‫درخت‬
:

‫از‬
‫دو‬
‫مجموعه‬
‫جداگانه‬
‫آموزش‬
‫و‬
‫تست‬
‫جهت‬
‫ارزیابی‬
.

‫بکارگیری‬
‫تستهای‬
‫آماری‬
(
‫نظیر‬
‫روش‬
Quinlan 86
)
‫برای‬
‫تخمین‬
‫بسط‬
‫دادن‬
‫یا‬
‫هرس‬
‫کردن‬
‫یک‬
‫گره‬
.

‫از‬
‫توابع‬
‫هیوریستیک‬
‫برای‬
‫تشخیص‬
‫اندازه‬
‫مناسب‬
‫درخت‬
.
(
‫نظیر‬
‫روش‬
Quinlan & Rivest 89
‫و‬
‫روش‬
Mehta et al.95
)

48
‫کاهش‬ ‫خطای‬ ‫هرس‬
‫یافته‬
Reduced Error Pruning

‫یک‬
‫روش‬
‫مقابله‬
‫با‬
.Over fitting

‫ابداع‬
‫شده‬
‫توسط‬
Quinlan
.1987

‫حذف‬
‫زیردرخت‬
‫و‬
‫جایگزینی‬
‫آن‬
‫با‬
‫ریشه‬
‫زیردرخت‬
.

‫تخصیص‬
‫کالس‬
‫اکثریت‬
‫به‬
‫گره‬
‫جایگزین‬
‫شده‬
.

‫حذف‬
،‫زیردرخت‬
‫مشروط‬
‫به‬
‫اینکه‬
‫خطای‬
‫گره‬
‫جایگزین‬
‫شده‬
‫بیشتر‬
‫از‬

49
‫کاهش‬ ‫خطای‬ ‫هرس‬
‫یافته‬
Reduced Error Pruning

یادگیری-ماشین-1.ppsx

یادگیری-ماشین-1.ppsx

Recommended

Recommended

More Related Content

Featured

Featured (20)

یادگیری-ماشین-1.ppsx