‫رﻗﺎﺑﺘﻲ‬ ‫ﺟﺴﺘﺠﻮي‬‫ﻲ‬ ‫ﺑ‬ ‫ر‬ ‫ﺠﻮي‬ ‫ﺟ‬
‫ﺷﺸﻢ‬ ‫ﻓﺼﻞ‬
‫رﺿﻮي‬ ‫ﻧﺎﺻﺮ‬ ‫ﺳﻴﺪ‬‫رﺿﻮي‬ ‫ﺻﺮ‬ ‫ﻴ‬
Email: razavi@Comp.iust.ac.ir
13841384
‫ﻣﻘﺪﻣﻪ‬‫ﻣﻘﺪﻣﻪ‬
•‫ﺑﻬﻴﻨﻪ‬ ‫ﻫﺎي‬ ‫ﺗﺼﻤﻴﻢ‬
‫آﻟ‬ •‫آﻟﻔﺎ‬ ‫ﻫﺮس‬-‫ﺑﺘﺎ‬
•‫ﻛﺎﻣﻞ‬ ‫ﻏ‬ ‫و‬ ‫ﺑﻼدرﻧﮓ‬ ‫ﻫﺎي‬ ‫ﺗﺼ‬ •‫ﻛﺎﻣﻞ‬ ‫ﻏﻴﺮ‬ ‫و‬ ‫ﺑﻼدرﻧﮓ‬ ‫ﻫﺎي‬ ‫ﺗﺼﻤﻴﻢ‬
N. Razavi - AI course - 2005 2
‫ﻫﺎ‬ ‫ﺑﺎزي‬ ‫در‬ ‫ﺑﻬﻴﻨﻪ‬ ‫ﻫﺎي‬ ‫ﺗﺼﻤﻴﻢ‬‫ﻫﺎ‬ ‫ﺑﺎزي‬ ‫در‬ ‫ﺑﻬﻴﻨﻪ‬ ‫ﻫﺎي‬ ‫ﺗﺼﻤﻴﻢ‬
•‫ﺑﺎزي‬‫ﻫﺎي‬‫دو‬‫ﻧﻔﺮه‬)MAX‫و‬MIN(
‫ا‬ ‫ا‬MAX‫ﺎز‬‫ﻛ‬MIN •‫اﺑﺘﺪا‬MAX‫ﺑﺎزي‬‫ﻣﻲ‬،‫ﻛﻨﺪ‬‫ﺳﭙﺲ‬MIN‫و‬...
•‫ﺑﺎزي‬‫ﺑﻪ‬‫ﻋﻨﻮان‬‫ﻳﻚ‬‫ﻧﻮع‬‫از‬‫ﻣﺴﺄﻟﻪ‬‫ﺟﺴﺘﺠﻮ‬ ‫ز‬ ‫ﺑ‬‫ﺑ‬‫ﻮ‬‫ﻳ‬‫ﻮع‬‫ز‬‫ﻮ‬
–‫ﺣﺎﻟﺖ‬‫اوﻟﻴﻪ‬:‫ﺷﺎﻣﻞ‬‫ﻣﻮﻗﻌﻴﺖ‬‫ﺻﻔﺤﻪ‬‫و‬‫ﻧﻮﺑﺖ‬‫ﺑﺎزﻳﻜﻦ‬
‫ﺗﺎ‬‫ﺎﻧﺸ‬‫ﻟ‬‫از‬‫ز‬‫ﺎ‬(move state)‫ا‬‫اﻧ‬ ‫ﮔ‬ –‫ﺗﺎﺑﻊ‬‫ﺟﺎﻧﺸﻴﻦ‬:‫ﻟﻴﺴﺘﻲ‬‫از‬‫زوج‬‫ﻫﺎي‬(move, state)‫را‬‫ﺑﺮ‬‫ﻣﻲ‬‫ﮔﺮداﻧﺪ‬
–‫ﺗﺴﺖ‬‫ﺗﺮﻣﻴﻨﺎل‬:‫ﺗﻌﻴﻴﻦ‬‫ﻛﻨﻨﺪه‬‫ﭘﺎﻳﺎن‬‫ﺑﺎزي‬)‫ﺣﺎﻟﺖ‬‫ﻫﺎي‬‫ﺗﺮﻣﻴﻨﺎل‬(
–‫ﺗﺎﺑﻊ‬‫ﺳﻮدﻣﻨﺪي‬:‫ﺑﻪ‬‫ﻫﺮ‬‫ﺣﺎﻟﺖ‬‫ﭘﺎﻳﺎﻧﻲ‬‫ﻳﻚ‬‫ﻣﻘﺪار‬‫ﻋﺪدي‬‫ﻣﻲ‬‫دﻫﺪ‬
•‫درﺧﺖ‬‫ﺑﺎزي‬:‫ﺗﻮﺳﻂ‬‫ﺣﺎﻟﺖ‬‫اوﻟﻴﻪ‬‫و‬‫ﻛﺖ‬ ‫ﺣ‬‫ﻫﺎي‬‫ﻗﺎﻧﻮﻧ‬‫اي‬ ‫ﺑ‬‫ﻫ‬ ‫درﺧﺖ‬‫ﺑﺎزي‬:‫ﺗﻮﺳﻂ‬‫ﺣﺎﻟﺖ‬‫اوﻟﻴﻪ‬‫و‬‫ﺣﺮﻛﺖ‬‫ﻫﺎي‬‫ﻗﺎﻧﻮﻧﻲ‬‫ﺑﺮاي‬‫ﻫﺮ‬
‫ﻃﺮف‬‫ﻣﺸﺨﺺ‬‫ﻣﻲ‬‫ﺷﻮد‬
N. Razavi - AI course - 2005 3
‫ﺟﺴﺘﺠﻮ‬ ‫ﻣﺴﺎﺋﻞ‬ ‫ﺑﺎ‬ ‫ﻣﻘﺎﻳﺴﻪ‬ ‫در‬ ‫ﺑﺎزي‬‫ﺟﺴﺘﺠﻮ‬ ‫ﻣﺴﺎﺋﻞ‬ ‫ﺑﺎ‬ ‫ﻣﻘﺎﻳﺴﻪ‬ ‫در‬ ‫ﺑﺎزي‬
•‫رﻗﻴﺐ‬»‫ﺑﻴﻨﻲ‬ ‫ﭘﻴﺶ‬ ‫ﻗﺎﺑﻞ‬ ‫ﻏﻴﺮ‬«‫ﺑﺮاي‬ ‫ﺣﺮﻛﺖ‬ ‫ﻳﻚ‬ ‫ﻛﺮدن‬ ‫ﻣﺸﺨﺺ‬
‫ﻗ‬ ‫ف‬ ‫ﻃ‬ ‫از‬ ‫ﻜ‬ ‫ﺦ‬ ‫ﺎ‬‫رﻗﻴﺐ‬ ‫ﻃﺮف‬ ‫از‬ ‫ﻣﻤﻜﻦ‬ ‫ﭘﺎﺳﺦ‬ ‫ﻫﺮ‬
•‫زﻣﺎﻧﻲ‬ ‫ﻫﺎي‬ ‫ﻣﺤﺪودﻳﺖ‬‫ﺗﻘﺮﻳﺐ‬ ‫ﺑﺎﻳﺪ‬ ‫ﻫﺪف‬ ‫ﻳﺎﻓﺘﻦ‬ ‫ﺑﺮاي‬ ‫ﻣﺘﺎﺳﻔﺎﻧﻪ‬ ‫ﻲ‬ ‫ز‬ ‫ي‬ ‫ﻳﺖ‬ ‫و‬‫ﺮﻳﺐ‬ ‫ﻳ‬ ‫ﺑ‬ ‫ف‬ ‫ﻦ‬ ‫ﻳ‬ ‫ي‬ ‫ﺑﺮ‬
‫زد‬
N. Razavi - AI course - 2005 4
‫ﺑﺎزي‬ ‫درﺧﺖ‬)2‫ﻗﻄﻌ‬ ‫ﻧﻔﺮه‬( ‫ﺑﺎزي‬ ‫درﺧﺖ‬)2-‫ﻗﻄﻌﻲ‬ ،‫ﻧﻔﺮه‬(
N. Razavi - AI course - 2005 5
MinimaxMinimax
•‫ﻗﻄﻌﻲ‬ ‫ﻫﺎي‬ ‫ﺑﺎزي‬ ‫در‬ ‫ﻋﺎﻟﻲ‬ ‫ﺑﺎزي‬‫ﻲ‬ ‫ي‬ ‫زي‬ ‫ﺑ‬ ‫ر‬ ‫ﻲ‬ ‫زي‬ ‫ﺑ‬
•‫اﻳﺪه‬:‫ﻣﻘﺪار‬ ‫ﺑﻴﺸﺘﺮﻳﻦ‬ ‫ﺑﺎ‬ ‫ﻣﻮﻗﻌﻴﺘﻲ‬ ‫ﺑﻪ‬ ‫ﺣﺮﻛﺖ‬ ‫اﻧﺘﺨﺎب‬minimax
•=‫ﺑﺎزي‬ ‫ﺑﻬﺘﺮﻳﻦ‬ ‫ﺑﺮاﺑﺮ‬ ‫در‬ ‫دﺳﺘﻴﺎﺑﻲ‬ ‫ﻗﺎﺑﻞ‬ ‫اﻣﺘﻴﺎز‬ ‫ﺑﻬﺘﺮﻳﻦ‬
‫ﺎل‬ •‫ﻣﺜﺎل‬:
N. Razavi - AI course - 2005 6
‫ﺑﻬﻴﻨﻪ‬ ‫اﺳﺘﺮاﺗﮋي‬‫ﺑﻬﻴﻨﻪ‬ ‫اﺳﺘﺮاﺗﮋي‬
•‫ﺑﺎ‬‫داﺷﺘﻦ‬‫درﺧﺖ‬،‫ﺑﺎزي‬‫اﺳﺘﺮاﺗﮋي‬‫ﺑﻬﻴﻨﻪ‬‫را‬‫ﻣﻲ‬‫ﺗﻮان‬‫ﺑﺎ‬‫در‬‫ﻧﻈﺮ‬‫ﮔﺮﻓﺘﻦ‬‫ﻣﻘﺪار‬
minimax‫ه‬ ‫ﮔ‬‫ﻫﺎ‬‫ﻦ‬ ‫ﺗﻌ‬‫ﻮد‬ ‫ﻧ‬: minimax‫ﮔﺮه‬‫ﻫﺎ‬‫ﺗﻌﻴﻴﻦ‬‫ﻧﻤﻮد‬:
( )=VALUE-MINMAX n
( )
( )
⎪
⎨
⎧
dMAXiifVALUEMINIMAX
stateterminalaisifUTILITY nn
( ) ( )
( ) ( )⎪
⎩
⎨
−
−
∈
∈
nodeMINaisifVALUEMINIMAXmin
nodeMAXaisifVALUEMINIMAXmax
ns
ns
nSuccessorss
nSuccessorss
( )⎩
N. Razavi - AI course - 2005 7
‫اﻟﮕﻮرﻳﺘﻢ‬Minimax ‫اﻟﮕﻮرﻳﺘﻢ‬Minimax
N. Razavi - AI course - 2005 8
‫ﺧﺼﻮﺻﻴﺎت‬Minimax ‫ﺧﺼﻮﺻﻴﺎت‬Minimax
•‫ﻛﺎﻣﻞ؟‬‫ﺑﻠﻪ‬)‫ﺑﻪ‬‫ﺷﺮط‬‫ﻣﺤﺪود‬‫ﺑﻮدن‬‫درﺧﺖ‬(
)‫ﻛ‬‫ﻛ‬( •‫ﺑﻬﻴﻨﻪ؟‬‫ﺑﻠﻪ‬)‫در‬‫ﻣﻘﺎﺑﻞ‬‫رﻗﻴﺒﻲ‬‫ﻛﻪ‬‫ﺑﻬﻴﻨﻪ‬‫ﺑﺎزي‬‫ﻣﻲ‬‫ﻛﻨﺪ‬(
•‫ﺪﮔ‬ ‫ﭽ‬ ‫ﭘ‬‫؟‬ ‫زﻣﺎﻧ‬O(bm) •‫ﭘﻴﭽﻴﺪﮔﻲ‬‫زﻣﺎﻧﻲ؟‬O(b )
•‫ﭘﻴﭽﻴﺪﮔﻲ‬‫ﺣﺎﻓﻈﻪ؟‬O(bm))‫ﻛﺎوش‬‫اول‬-‫ﻋﻤﻖ‬( ‫ﻲ‬ ‫ﭘﻴﭽﻴ‬( )‫ش‬‫ﻖ‬
•‫در‬‫ﺷﻄﺮﻧﺞ‬b ≈ 35‫و‬m ≈ 100)‫در‬‫ﺑﺎزي‬‫ﻫﺎي‬‫ﻣﻌﻘﻮل‬(
‫ا‬‫ﻞ‬‫ﻖ‬ ‫ﻗ‬‫ﻼ‬ ‫ﻛﺎ‬‫ن‬ ‫ﻘ‬‫ﻓ‬‫ﻧ‬‫ﺎﺷﺪ‬ ‫راه‬‫ﺣﻞ‬‫دﻗﻴﻖ‬‫ﻛﺎﻣﻼ‬‫ﻣﻘﺮون‬‫ﺑﻪ‬‫ﺻﺮﻓﻪ‬‫ﻧﻤﻲ‬‫ﺑﺎﺷﺪ‬.
N. Razavi - AI course - 2005 9
‫ﻧﻔﺮه‬ ‫ﭼﻨﺪ‬ ‫ﻫﺎي‬ ‫ﺑﺎزي‬ ‫در‬ ‫ﺑﻬﻴﻨﻪ‬ ‫ﺗﺼﻤﻴﻤﺎت‬‫ﻧﻔﺮه‬ ‫ﭼﻨﺪ‬ ‫ﻫﺎي‬ ‫ﺑﺎزي‬ ‫در‬ ‫ﺑﻬﻴﻨﻪ‬ ‫ﺗﺼﻤﻴﻤﺎت‬
(1, 2, 6)A
(1, 2, 6) (1, 5, 2)B ( , , ) ( , , )
(1, 2, 6) (6, 1, 2) (1, 5, 2) (5, 4, 5)C
A
(1, 2, 6) (4, 2, 3) (6, 1, 2) (7, 4, 1) (5, 1, 1) (1, 5, 2) (7, 7, 1) (5, 4, 5)
N. Razavi - AI course - 2005 10
‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬-‫ﺑﺘﺎ‬
N. Razavi - AI course - 2005 11
‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬-‫ﺑﺘﺎ‬
N. Razavi - AI course - 2005 12
‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬-‫ﺑﺘﺎ‬
N. Razavi - AI course - 2005 13
‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬-‫ﺑﺘﺎ‬
N. Razavi - AI course - 2005 14
‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬-‫ﺑﺘﺎ‬
MINIMAX-VALUE (root) = max (min (3, 12, 8), min (2, x, y), min (14, 5, 2))
= max (3, min (2, x, y), 2)
= max(3, z, 2) where z ≤ 2
= 3
N. Razavi - AI course - 2005 15
‫آﻟﻔﺎ‬ ‫ﺧﻮاص‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫ﺧﻮاص‬-‫ﺑﺘﺎ‬
•‫ﻫﺮس‬‫ﻛﺮدن‬‫ﺑﺮ‬‫روي‬‫ﻧﺘﻴﺠﻪ‬‫ﻧﻬﺎﻳﻲ‬‫ﺗﺎﺛﻴﺮ‬‫ﻧﺪارد‬
•‫ﺗﺮﺗﻴﺐ‬‫ﺧﻮب‬‫ﺣﺮﻛﺖ‬‫ﻫﺎ‬‫ﻣﻴﺰان‬‫ﺗﺎﺛﻴﺮ‬‫اﻟﮕﻮرﻳﺘﻢ‬‫را‬‫ﺑﻬﺒﻮد‬‫ﻣﻲ‬‫ﺑﺨﺸﺪ‬
•‫ﺑﺎ‬»‫ﺑﻬﺘﺮﻳﻦ‬‫ﺗﺮﺗﻴﺐ‬«،‫ﭘﻴﭽﻴﺪﮔﻲ‬‫زﻣﺎﻧﻲ‬=O(bm/2) ‫ﺑ‬‫ﺮﻳﻦ‬ ‫ﺑﻬ‬‫ﻴﺐ‬ ‫ﺮ‬‫ﻲ‬ ‫ﭘﻴﭽﻴ‬‫ﻲ‬ ‫ز‬( )
•‫ﻋﻤﻖ‬‫ﺟﺴﺘﺠﻮي‬‫دو‬‫ﺑﺮاﺑﺮ‬
•‫ﻳﻚ‬‫ﻣﺜﺎل‬‫ﺳﺎده‬‫از‬‫ارزش‬‫اﺳﺘﺪﻻل‬‫در‬‫ﻣﻮرد‬‫ﻣﺤﺎﺳﺒﺎت‬‫ﻣﺮﺗﺒﻂ‬)‫ﺷﻜﻠﻲ‬‫از‬‫اﺑﺮ‬
‫ﻻل‬(‫اﺳﺘﺪﻻل‬(
N. Razavi - AI course - 2005 16
‫ﺗﺴﻤﻴﻪ‬ ‫وﺟﻪ‬‫ﺗﺴﻤﻴﻪ‬ ‫وﺟﻪ‬
•‫آﻟﻔﺎ‬‫ﻣﻘﺪار‬‫ﺑﻬﺘﺮﻳﻦ‬‫اﻧﺘﺨﺎب‬)‫ﻳﻌﻨﻲ‬
‫ﻳﻦ‬ ‫ﺑﺎﻻﺗ‬‫ﻣﻘﺪار‬(‫ﻳﺎﻓﺘﻪ‬‫ﺷﺪه‬‫ﺗﺎ‬‫ﻛﻨﻮن‬ ‫ﺑﺎﻻﺗﺮﻳﻦ‬‫ﻣﻘﺪار‬(‫ﻳﺎﻓﺘﻪ‬‫ﺷﺪه‬‫ﺗﺎ‬‫ﻛﻨﻮن‬
‫در‬‫ﻫﺮ‬‫ﻧﻘﻄﻪ‬‫اﻧﺘﺨﺎب‬‫در‬‫ﻃﻮل‬‫ﻣﺴﻴﺮ‬
‫ا‬‫ﺎﺷ‬ ‫ﺑﺮاي‬max‫ﻣﻲ‬‫ﺑﺎﺷﺪ‬
•‫اﮔﺮ‬v‫ﺑﺪﺗﺮ‬‫از‬‫آﻟﻔﺎ‬،‫ﺑﺎﺷﺪ‬max‫از‬ ‫ﺮ‬‫ﺮ‬ ‫ﺑ‬‫ز‬‫ﺑ‬‫ز‬
‫آن‬‫اﺟﺘﻨﺎب‬‫ﻣﻲ‬‫ﻛﻨﺪ‬
‫آن‬‫ﺷﺎ‬‫ا‬‫ﻛ‬ ‫آن‬‫ﺷﺎﺧﻪ‬‫را‬‫ﻫﺮس‬‫ﻣﻲ‬‫ﻛﻨﺪ‬
•‫ﺑﺘﺎ‬‫ﻧﻴﺰ‬‫ﺑﺮاي‬min‫ﻣﺎﻧﻨﺪ‬‫آﻟﻔﺎ‬‫ﺗﻌﺮﻳﻒ‬ ‫ﺑ‬‫ﻴﺰ‬‫ي‬ ‫ﺑﺮ‬‫ﺮﻳ‬
‫ﻣﻲ‬‫ﺷﻮد‬
N. Razavi - AI course - 2005 17
‫آﻟﻔﺎ‬ ‫اﻟﮕﻮرﻳﺘﻢ‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫اﻟﮕﻮرﻳﺘﻢ‬-‫ﺑﺘﺎ‬
N. Razavi - AI course - 2005 18
‫آﻟﻔﺎ‬ ‫اﻟﮕﻮرﻳﺘﻢ‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫اﻟﮕﻮرﻳﺘﻢ‬-‫ﺑﺘﺎ‬
N. Razavi - AI course - 2005 19
‫ﻣﻨﺎﺑﻊ‬ ‫ﻫﺎي‬ ‫ﻣﺤﺪودﻳﺖ‬‫ﻣﻨﺎﺑﻊ‬ ‫ﻫﺎي‬ ‫ﻣﺤﺪودﻳﺖ‬
‫ﻓﺮض‬‫ﻛﻨﻴﺪ‬100‫ﺛﺎﻧﻴﻪ‬‫زﻣﺎن‬‫دارﻳﻢ‬‫و‬‫در‬‫ﻫﺮ‬‫ﺛﺎﻧﻴﻪ‬‫ﻣﻲ‬‫ﺗﻮان‬104‫ﮔﺮه‬
‫ش‬ ‫ﺘ‬ ‫ﮔ‬‫ا‬ ‫ﮔﺴﺘﺮش‬‫داد‬.
‫در‬‫ﻫﺮ‬‫ﺣﺮﻛﺖ‬106‫ﮔﺮه‬ ‫ر‬‫ﺮ‬‫ﺖ‬ ‫ﺮ‬1‫ﺮ‬
‫روش‬‫اﺳﺘﺎﻧﺪارد‬:
‫ش‬‫ﺎ‬‫ﻘ‬ •‫ﺗﺴﺖ‬‫ﺑﺮش‬:‫ﻣﺎﻧﻨﺪ‬‫ﻣﺤﺪوده‬‫ﻋﻤﻘﻲ‬
•‫ﺗﺎﺑﻊ‬‫ارزﻳﺎﺑﻲ‬: ‫ﺗﺎﺑﻊ‬‫ارزﻳﺎﺑﻲ‬:
=‫ﻣﻴﺰان‬‫ﺗﺨﻤﻴﻨﻲ‬‫ﻣﻄﻠﻮب‬‫ﺑﻮدن‬‫ﻣﻮﻗﻌﻴﺖ‬
N. Razavi - AI course - 2005 20
‫ارزﻳﺎﺑ‬ ‫ﺗﺎﺑﻊ‬‫ارزﻳﺎﺑﻲ‬ ‫ﺗﺎﺑﻊ‬
•‫در‬،‫ﺷﻄﺮﻧﺞ‬‫ﻣﻌﻤﻮﻻ‬‫ﻣﺠﻤﻮع‬‫وزن‬‫دار‬‫وﻳﮋﮔﻲ‬‫ﻫﺎ‬
Eval(s) = w1f1(s) + w2f2(s) + … + wnfn(s)
•‫ﻣﺜﺎل‬:w1=9‫و‬ 1
f1(s) = (# of white queens) – ( # of black queens)
N. Razavi - AI course - 2005 21
‫ﺟﺴﺘﺠﻮ‬ ‫ﺑﺮش‬‫ﺟﺴﺘﺠﻮ‬ ‫ﺑﺮش‬
•MinimaxCutoff‫ﻣﺎﻧﻨﺪ‬MinimaxValue‫ﻣﻲ‬‫ﺑﺎﺷﺪ‬‫ﺟﺰ‬‫اﻳﻨﻜﻪ‬:
1Terminal?‫ﺑﺎ‬Cutoff?‫ﺟﺎﻳﮕﺰﻳﻦ‬‫ﺷﺪه‬‫و‬ 1.Terminal?‫ﺑﺎ‬Cutoff?‫ﺟﺎﻳﮕﺰﻳﻦ‬‫ﺷﺪه‬‫و‬
2.Utility‫ﺑﺎ‬Eval‫ﺟﺎﻳﮕﺰﻳﻦ‬‫ﺷﺪه‬‫اﺳﺖ‬
•‫آﻳﺎ‬‫در‬‫ﻋﻤﻞ‬‫ﻛﺎر‬‫ﻣﻲ‬‫ﻛﻨﺪ؟‬ ‫ﻳ‬‫ر‬‫ﻞ‬‫ر‬‫ﻲ‬
bm = 106 m = 4
‫د‬‫ﻧ‬ ‫ﺷﻄ‬‫ﺶ‬‫ﻨ‬4‫ﻪ‬ ‫ﻻ‬‫ﻧﺎ‬‫ﺪ‬ ‫ا‬‫ﻛﻨﻨﺪ‬‫ﺖ‬ ‫ا‬! ‫در‬‫ﺷﻄﺮﻧﺞ‬‫ﭘﻴﺶ‬‫ﺑﻴﻨﻲ‬4‫ﻻﻳﻪ‬‫ﻧﺎ‬‫اﻣﻴﺪ‬‫ﻛﻨﻨﺪه‬‫اﺳﺖ‬!
–4‫ﻻﻳﻪ‬=‫اﻧﺴﺎن‬‫ﻣﺒﺘﺪي‬
‫ﻻ‬‫ﻛ‬‫ﻟ‬ –8‫ﻻﻳﻪ‬=‫ﻛﺎﻣﭙﻴﻮﺗﺮﻫﺎي‬‫ﻣﻌﻤﻮﻟﻲ‬‫و‬‫اﻧﺴﺎن‬‫ﻫﺎي‬‫ﺣﺮﻓﻪ‬‫اي‬
–12‫ﻻﻳﻪ‬=Deep Blue‫و‬‫ﻛﺎﺳﭙﺎروف‬
N. Razavi - AI course - 2005 22
‫ﺳﺎزي‬ ‫ﭘﻴﺎده‬‫ﺳﺎزي‬ ‫ﭘﻴﺎده‬
•‫ﺗﻌﻴﻴﻦ‬‫ﻳﻚ‬‫ﻣﺤﺪوده‬‫ﻋﻤﻘﻲ‬‫ﻣﺎﻧﻨﺪ‬d
–d‫ﺑﺎﻳﺪ‬‫ﻃﻮري‬‫اﻧﺘﺨﺎب‬‫ﺷﻮد‬‫ﻛﻪ‬‫زﻣﺎن‬‫ﻻزم‬‫از‬‫ﻗﻮاﻧﻴﻦ‬‫ﺑﺎزي‬‫ﺗﺠﺎوز‬‫ﻧﻜﻨﺪ‬ d‫ﺑﺎﻳﺪ‬‫ﻃﻮري‬‫اﻧﺘﺨﺎب‬‫ﺷﻮد‬‫ﻛﻪ‬‫زﻣﺎن‬‫ﻻزم‬‫از‬‫ﻗﻮاﻧﻴﻦ‬‫ﺑﺎزي‬‫ﺗﺠﺎوز‬‫ﻧﻜﻨﺪ‬
•‫روش‬‫ﺑﻬﺘﺮ‬:‫اﺳﺘﻔﺎده‬‫از‬IDS‫ﺗﺎ‬‫وﻗﺘﻲ‬‫ﻛﻪ‬‫زﻣﺎن‬‫دارﻳﻢ‬
‫ﺸﻜﻼ‬ •‫ﻣﺸﻜﻼت‬:
–‫ﺧﻄﺎ‬‫ﺑﻪ‬‫دﻟﻴﻞ‬‫ﺗﻘﺮﻳﺒﻲ‬‫ﺑﻮدن‬‫ﺗﺎﺑﻊ‬‫ارزﻳﺎﺑﻲ‬)‫ﺷﻜﻞ‬6.8b(
•‫ﺑﻪ‬‫ﺗﺎﺑﻊ‬‫ﺗﺴﺖ‬Cutoff‫ﭘﻴﭽﻴﺪه‬‫ﺗﺮي‬‫ﻧﻴﺎز‬‫دارﻳﻢ‬
–‫ﻣﺸﻜﻞ‬‫ﺣﺎﻟﺖ‬‫ﻫﺎي‬‫ﻧﺎآرام‬‫ﺟﺴﺘﺠﻮي‬‫اﻧﺘﻈﺎر‬‫ﺑﺮاي‬‫آراﻣﺶ‬ ‫ﻞ‬‫ي‬‫م‬ ‫ر‬‫ﺠﻮي‬ ‫ﺟ‬‫ر‬‫ي‬ ‫ﺑﺮ‬‫ﺶ‬ ‫ر‬
–‫ﻣﺸﻜﻞ‬‫اﺛﺮ‬‫اﻓﻖ‬)‫ﺷﻜﻞ‬6.9(
•‫ﺑﻬﺒﻮد‬‫ﺳﺨﺖ‬‫اﻓﺰار‬‫ﺑﺮاي‬‫اﻧﺠﺎم‬‫ﺟﺴﺘﺠﻮﻫﺎي‬‫ﻋﻤﻴﻖ‬‫ﺗﺮ‬ ‫م‬
•‫ﮔﺴﺘﺮش‬‫ﻫﺎي‬‫اﻧﻔﺮادي‬
N. Razavi - AI course - 2005 23
‫ﺷﻜﻞ‬68 ‫ﺷﻜﻞ‬6-8
N. Razavi - AI course - 2005 24
‫اﻓﻖ‬ ‫اﺛﺮ‬‫اﻓﻖ‬ ‫اﺛﺮ‬
N. Razavi - AI course - 2005 25
‫ﻋﻤﻞ‬ ‫در‬ ‫ﻗﻄﻌ‬ ‫ﻫﺎي‬ ‫ﺑﺎزي‬‫ﻋﻤﻞ‬ ‫در‬ ‫ﻗﻄﻌﻲ‬ ‫ﻫﺎي‬ ‫ﺑﺎزي‬
•Chess:Deep Blue‫در‬‫ﺳﺎل‬1997‫ﻗﻬﺮﻣﺎن‬‫دﻧﻴﺎي‬‫اﻧﺴﺎن‬‫ﻫﺎ‬)‫ﻛﺎﺳﭙﺎروف‬(
‫را‬‫ﺷﻜﺴﺖ‬‫داد‬.Deep blue‫در‬‫ﻳﻚ‬‫ﺛﺎﻧﻴﻪ‬200‫ﻣﻴﻠﻴﻮن‬‫ﻣﻮﻗﻌﻴﺖ‬‫را‬‫ﺟﺴﺘﺠﻮ‬ ‫ﻳ‬‫ﻴ‬‫ﻴﻮ‬ ‫ﻴ‬‫ﻴ‬ ‫ﻮ‬‫ﻮ‬
‫ﻣﻲ‬‫ﻛﻨﺪ‬‫و‬‫از‬‫ﺗﻮاﺑﻊ‬‫ارزﻳﺎﺑﻲ‬‫ﺑﺴﻴﺎر‬‫ﭘﻴﭽﻴﺪه‬‫اي‬‫اﺳﺘﻔﺎده‬‫ﻣﻲ‬‫ﻛﻨﺪ‬.
•Othello:‫ﻗﻬﺮﻣﺎن‬‫ﻫﺎي‬‫اﻧﺴﺎﻧﻲ‬‫از‬‫رﻗﺎﺑﺖ‬‫ﺑﺎ‬‫ﻛﺎﻣﭙﻴﻮﺗﺮﻫﺎ‬)‫ﻛﻪ‬‫ﺧﻴﻠﻲ‬‫ﺧﻮب‬
‫ﻫﺴﺘﻨﺪ‬(‫اﻣﺘﻨﺎع‬‫ﻣﻲ‬‫ورزﻧﺪ‬. ‫ع‬‫ﻲ‬
•Go:‫ﻗﻬﺮﻣﺎن‬‫ﻫﺎي‬‫اﻧﺴﺎﻧﻲ‬‫از‬‫رﻗﺎﺑﺖ‬‫ﺑﺎ‬‫ﻛﺎﻣﭙﻴﻮﺗﺮﻫﺎ‬)‫ﻛﻪ‬‫ﺑﺴﻴﺎر‬‫ﺑﺪ‬‫ﻫﺴﺘﻨﺪ‬(‫اﻣﺘﻨﺎع‬ Go:‫ﻗﻬﺮﻣﺎن‬‫ﻫﺎي‬‫اﻧﺴﺎﻧﻲ‬‫از‬‫رﻗﺎﺑﺖ‬‫ﺑﺎ‬‫ﻛﺎﻣﭙﻴﻮﺗﺮﻫﺎ‬)‫ﻛﻪ‬‫ﺑﺴﻴﺎر‬‫ﺑﺪ‬‫ﻫﺴﺘﻨﺪ‬(‫اﻣﺘﻨﺎع‬
‫ﻣﻲ‬‫ورزﻧﺪ‬.‫در‬‫ﺑﺎزي‬Go‫ﻓﺎﻛﺘﻮر‬‫اﻧﺸﻌﺎب‬‫ﺑﻴﺸﺘﺮ‬‫از‬300‫ﻣﻲ‬،‫ﺑﺎﺷﺪ‬‫ﺑﻨﺎﺑﺮاﻳﻦ‬
‫اﻛﺜﺮ‬‫ﺑﺮﻧﺎﻣﻪ‬‫ﻫﺎ‬‫ﺑﺮاي‬‫اراﺋﻪ‬‫ﺣﺮﻛﺖ‬‫ﻫﺎي‬‫ﻣﻌﻘﻮل‬‫از‬‫ﭘﺎﻳﮕﺎه‬‫ﻫﺎي‬‫داﻧﺶ‬‫اﻟﮕﻮﻳﻲ‬ ‫ﺮ‬‫ﺮ‬‫ﺮ‬‫ﺮ‬‫ﻮ‬‫ﭘ‬‫ﺶ‬‫ﻲ‬ ‫ﻮ‬
‫اﺳﺘﻔﺎده‬‫ﻣﻲ‬‫ﻛﻨﻨﺪ‬.
N. Razavi - AI course - 2005 26
‫ﻫﺴﺘﻨﺪ‬ ‫ﺷﺎﻧﺲ‬ ‫ﻋﻨﺎﺻﺮ‬ ‫داراي‬ ‫ﻛﻪ‬ ‫ﻫﺎﻳ‬ ‫ﺑﺎزي‬‫ﻫﺴﺘﻨﺪ‬ ‫ﺷﺎﻧﺲ‬ ‫ﻋﻨﺎﺻﺮ‬ ‫داراي‬ ‫ﻛﻪ‬ ‫ﻫﺎﻳﻲ‬ ‫ﺑﺎزي‬
N. Razavi - AI course - 2005 27
‫ارزﻳﺎﺑ‬ ‫ﺗﺎﺑﻊ‬ ‫ﻣﻌﻨﺎي‬‫ارزﻳﺎﺑﻲ‬ ‫ﺗﺎﺑﻊ‬ ‫ﻣﻌﻨﺎي‬
•‫ﺗﻐﻴﻴﺮي‬‫ﻛﻪ‬‫ﺗﺮﺗﻴﺐ‬‫ﻧﺴﺒﻲ‬‫ﻣﻘﺎدﻳﺮ‬‫را‬‫ﺣﻔﻆ‬‫ﻣﻲ‬،‫ﻛﻨﺪ‬‫در‬‫ﺗﺼﻤﻴﻢ‬minimax
‫ﺗﺄﺛﻴﺮي‬،‫ﻧﺪارد‬‫اﻣﺎ‬‫ﻣﻲ‬‫ﺗﻮاﻧﺪ‬‫ﺗﺼﻤﻴﻢ‬‫در‬‫ﻣﻮرد‬‫ﮔﺮه‬‫ﻫﺎي‬‫ﺷﺎﻧﺲ‬‫را‬‫ﺗﻐﻴﻴﺮ‬‫دﻫﺪ‬ ‫ﻴﺮي‬‫ر‬‫ﻲ‬‫ﻮ‬‫ﻴﻢ‬ ‫ﺼ‬‫ر‬‫ﻮر‬‫ﺮ‬‫ي‬‫ﺲ‬‫ر‬‫ﻴﻴﺮ‬
•‫راه‬‫ﺣﻞ‬:‫ﺗﺒﺪﻳﻼت‬‫ﺧﻄﻲ‬
N. Razavi - AI course - 2005 28
‫ﺧﻼﺻﻪ‬‫ﺧﻼﺻﻪ‬
‫ﻛ‬‫ﻛ‬‫ﻟﺬ‬ •‫ﻛﺎر‬‫ﻛﺮدن‬‫ﺑﺮ‬‫روي‬‫ﺑﺎزي‬‫ﻫﺎ‬‫ﻟﺬت‬‫ﺑﺨﺶ‬‫اﺳﺖ‬!
•‫ﺑﺎزي‬‫ﻫﺎ‬‫ﻧﻜﺎت‬‫ﻣﻬ‬‫ﻣﺘﻌﺪدي‬‫را‬‫در‬AI‫ﺑﻪ‬‫ﺎﻳﺶ‬ ‫ﻧ‬‫ﻣ‬‫ﮔﺬارﻧﺪ‬ •‫ﺑﺎزي‬‫ﻫﺎ‬‫ﻧﻜﺎت‬‫ﻣﻬﻢ‬‫ﻣﺘﻌﺪدي‬‫را‬‫در‬AI‫ﺑﻪ‬‫ﻧﻤﺎﻳﺶ‬‫ﻣﻲ‬‫ﮔﺬارﻧﺪ‬
•‫ﻋﺎﻟﻲ‬‫ﺑﻮدن‬‫ﻣﻤﻜﻦ‬‫ﻧﻴﺴﺖ‬‫ﺑﺎﻳﺪ‬‫ﺗﻘﺮﻳﺐ‬‫زد‬ ‫ﻲ‬‫ﺑﻮ‬‫ﻦ‬‫ﻴ‬‫ﻳ‬ ‫ﺑ‬‫ﺮﻳﺐ‬
•‫ﻓﻜﺮ‬‫ﻛﺮدن‬‫در‬‫ﻣﻮرد‬‫اﻳﻨﻜﻪ‬‫ﺑﻪ‬‫ﭼﻪ‬‫ﭼﻴﺰي‬‫ﻓﻜﺮ‬‫ﻛﻨﻲ‬‫اﻳﺪه‬‫ﺧﻮﺑﻲ‬
‫ﺎﺷ‬ ‫ﻣﻲ‬‫ﺑﺎﺷﺪ‬
N. Razavi - AI course - 2005 29

AI ch6

  • 1.
    ‫رﻗﺎﺑﺘﻲ‬ ‫ﺟﺴﺘﺠﻮي‬‫ﻲ‬ ‫ﺑ‬‫ر‬ ‫ﺠﻮي‬ ‫ﺟ‬ ‫ﺷﺸﻢ‬ ‫ﻓﺼﻞ‬ ‫رﺿﻮي‬ ‫ﻧﺎﺻﺮ‬ ‫ﺳﻴﺪ‬‫رﺿﻮي‬ ‫ﺻﺮ‬ ‫ﻴ‬ Email: razavi@Comp.iust.ac.ir 13841384 ‫ﻣﻘﺪﻣﻪ‬‫ﻣﻘﺪﻣﻪ‬ •‫ﺑﻬﻴﻨﻪ‬ ‫ﻫﺎي‬ ‫ﺗﺼﻤﻴﻢ‬ ‫آﻟ‬ •‫آﻟﻔﺎ‬ ‫ﻫﺮس‬-‫ﺑﺘﺎ‬ •‫ﻛﺎﻣﻞ‬ ‫ﻏ‬ ‫و‬ ‫ﺑﻼدرﻧﮓ‬ ‫ﻫﺎي‬ ‫ﺗﺼ‬ •‫ﻛﺎﻣﻞ‬ ‫ﻏﻴﺮ‬ ‫و‬ ‫ﺑﻼدرﻧﮓ‬ ‫ﻫﺎي‬ ‫ﺗﺼﻤﻴﻢ‬ N. Razavi - AI course - 2005 2 ‫ﻫﺎ‬ ‫ﺑﺎزي‬ ‫در‬ ‫ﺑﻬﻴﻨﻪ‬ ‫ﻫﺎي‬ ‫ﺗﺼﻤﻴﻢ‬‫ﻫﺎ‬ ‫ﺑﺎزي‬ ‫در‬ ‫ﺑﻬﻴﻨﻪ‬ ‫ﻫﺎي‬ ‫ﺗﺼﻤﻴﻢ‬ •‫ﺑﺎزي‬‫ﻫﺎي‬‫دو‬‫ﻧﻔﺮه‬)MAX‫و‬MIN( ‫ا‬ ‫ا‬MAX‫ﺎز‬‫ﻛ‬MIN •‫اﺑﺘﺪا‬MAX‫ﺑﺎزي‬‫ﻣﻲ‬،‫ﻛﻨﺪ‬‫ﺳﭙﺲ‬MIN‫و‬... •‫ﺑﺎزي‬‫ﺑﻪ‬‫ﻋﻨﻮان‬‫ﻳﻚ‬‫ﻧﻮع‬‫از‬‫ﻣﺴﺄﻟﻪ‬‫ﺟﺴﺘﺠﻮ‬ ‫ز‬ ‫ﺑ‬‫ﺑ‬‫ﻮ‬‫ﻳ‬‫ﻮع‬‫ز‬‫ﻮ‬ –‫ﺣﺎﻟﺖ‬‫اوﻟﻴﻪ‬:‫ﺷﺎﻣﻞ‬‫ﻣﻮﻗﻌﻴﺖ‬‫ﺻﻔﺤﻪ‬‫و‬‫ﻧﻮﺑﺖ‬‫ﺑﺎزﻳﻜﻦ‬ ‫ﺗﺎ‬‫ﺎﻧﺸ‬‫ﻟ‬‫از‬‫ز‬‫ﺎ‬(move state)‫ا‬‫اﻧ‬ ‫ﮔ‬ –‫ﺗﺎﺑﻊ‬‫ﺟﺎﻧﺸﻴﻦ‬:‫ﻟﻴﺴﺘﻲ‬‫از‬‫زوج‬‫ﻫﺎي‬(move, state)‫را‬‫ﺑﺮ‬‫ﻣﻲ‬‫ﮔﺮداﻧﺪ‬ –‫ﺗﺴﺖ‬‫ﺗﺮﻣﻴﻨﺎل‬:‫ﺗﻌﻴﻴﻦ‬‫ﻛﻨﻨﺪه‬‫ﭘﺎﻳﺎن‬‫ﺑﺎزي‬)‫ﺣﺎﻟﺖ‬‫ﻫﺎي‬‫ﺗﺮﻣﻴﻨﺎل‬( –‫ﺗﺎﺑﻊ‬‫ﺳﻮدﻣﻨﺪي‬:‫ﺑﻪ‬‫ﻫﺮ‬‫ﺣﺎﻟﺖ‬‫ﭘﺎﻳﺎﻧﻲ‬‫ﻳﻚ‬‫ﻣﻘﺪار‬‫ﻋﺪدي‬‫ﻣﻲ‬‫دﻫﺪ‬ •‫درﺧﺖ‬‫ﺑﺎزي‬:‫ﺗﻮﺳﻂ‬‫ﺣﺎﻟﺖ‬‫اوﻟﻴﻪ‬‫و‬‫ﻛﺖ‬ ‫ﺣ‬‫ﻫﺎي‬‫ﻗﺎﻧﻮﻧ‬‫اي‬ ‫ﺑ‬‫ﻫ‬ ‫درﺧﺖ‬‫ﺑﺎزي‬:‫ﺗﻮﺳﻂ‬‫ﺣﺎﻟﺖ‬‫اوﻟﻴﻪ‬‫و‬‫ﺣﺮﻛﺖ‬‫ﻫﺎي‬‫ﻗﺎﻧﻮﻧﻲ‬‫ﺑﺮاي‬‫ﻫﺮ‬ ‫ﻃﺮف‬‫ﻣﺸﺨﺺ‬‫ﻣﻲ‬‫ﺷﻮد‬ N. Razavi - AI course - 2005 3 ‫ﺟﺴﺘﺠﻮ‬ ‫ﻣﺴﺎﺋﻞ‬ ‫ﺑﺎ‬ ‫ﻣﻘﺎﻳﺴﻪ‬ ‫در‬ ‫ﺑﺎزي‬‫ﺟﺴﺘﺠﻮ‬ ‫ﻣﺴﺎﺋﻞ‬ ‫ﺑﺎ‬ ‫ﻣﻘﺎﻳﺴﻪ‬ ‫در‬ ‫ﺑﺎزي‬ •‫رﻗﻴﺐ‬»‫ﺑﻴﻨﻲ‬ ‫ﭘﻴﺶ‬ ‫ﻗﺎﺑﻞ‬ ‫ﻏﻴﺮ‬«‫ﺑﺮاي‬ ‫ﺣﺮﻛﺖ‬ ‫ﻳﻚ‬ ‫ﻛﺮدن‬ ‫ﻣﺸﺨﺺ‬ ‫ﻗ‬ ‫ف‬ ‫ﻃ‬ ‫از‬ ‫ﻜ‬ ‫ﺦ‬ ‫ﺎ‬‫رﻗﻴﺐ‬ ‫ﻃﺮف‬ ‫از‬ ‫ﻣﻤﻜﻦ‬ ‫ﭘﺎﺳﺦ‬ ‫ﻫﺮ‬ •‫زﻣﺎﻧﻲ‬ ‫ﻫﺎي‬ ‫ﻣﺤﺪودﻳﺖ‬‫ﺗﻘﺮﻳﺐ‬ ‫ﺑﺎﻳﺪ‬ ‫ﻫﺪف‬ ‫ﻳﺎﻓﺘﻦ‬ ‫ﺑﺮاي‬ ‫ﻣﺘﺎﺳﻔﺎﻧﻪ‬ ‫ﻲ‬ ‫ز‬ ‫ي‬ ‫ﻳﺖ‬ ‫و‬‫ﺮﻳﺐ‬ ‫ﻳ‬ ‫ﺑ‬ ‫ف‬ ‫ﻦ‬ ‫ﻳ‬ ‫ي‬ ‫ﺑﺮ‬ ‫زد‬ N. Razavi - AI course - 2005 4
  • 2.
    ‫ﺑﺎزي‬ ‫درﺧﺖ‬)2‫ﻗﻄﻌ‬ ‫ﻧﻔﺮه‬(‫ﺑﺎزي‬ ‫درﺧﺖ‬)2-‫ﻗﻄﻌﻲ‬ ،‫ﻧﻔﺮه‬( N. Razavi - AI course - 2005 5 MinimaxMinimax •‫ﻗﻄﻌﻲ‬ ‫ﻫﺎي‬ ‫ﺑﺎزي‬ ‫در‬ ‫ﻋﺎﻟﻲ‬ ‫ﺑﺎزي‬‫ﻲ‬ ‫ي‬ ‫زي‬ ‫ﺑ‬ ‫ر‬ ‫ﻲ‬ ‫زي‬ ‫ﺑ‬ •‫اﻳﺪه‬:‫ﻣﻘﺪار‬ ‫ﺑﻴﺸﺘﺮﻳﻦ‬ ‫ﺑﺎ‬ ‫ﻣﻮﻗﻌﻴﺘﻲ‬ ‫ﺑﻪ‬ ‫ﺣﺮﻛﺖ‬ ‫اﻧﺘﺨﺎب‬minimax •=‫ﺑﺎزي‬ ‫ﺑﻬﺘﺮﻳﻦ‬ ‫ﺑﺮاﺑﺮ‬ ‫در‬ ‫دﺳﺘﻴﺎﺑﻲ‬ ‫ﻗﺎﺑﻞ‬ ‫اﻣﺘﻴﺎز‬ ‫ﺑﻬﺘﺮﻳﻦ‬ ‫ﺎل‬ •‫ﻣﺜﺎل‬: N. Razavi - AI course - 2005 6 ‫ﺑﻬﻴﻨﻪ‬ ‫اﺳﺘﺮاﺗﮋي‬‫ﺑﻬﻴﻨﻪ‬ ‫اﺳﺘﺮاﺗﮋي‬ •‫ﺑﺎ‬‫داﺷﺘﻦ‬‫درﺧﺖ‬،‫ﺑﺎزي‬‫اﺳﺘﺮاﺗﮋي‬‫ﺑﻬﻴﻨﻪ‬‫را‬‫ﻣﻲ‬‫ﺗﻮان‬‫ﺑﺎ‬‫در‬‫ﻧﻈﺮ‬‫ﮔﺮﻓﺘﻦ‬‫ﻣﻘﺪار‬ minimax‫ه‬ ‫ﮔ‬‫ﻫﺎ‬‫ﻦ‬ ‫ﺗﻌ‬‫ﻮد‬ ‫ﻧ‬: minimax‫ﮔﺮه‬‫ﻫﺎ‬‫ﺗﻌﻴﻴﻦ‬‫ﻧﻤﻮد‬: ( )=VALUE-MINMAX n ( ) ( ) ⎪ ⎨ ⎧ dMAXiifVALUEMINIMAX stateterminalaisifUTILITY nn ( ) ( ) ( ) ( )⎪ ⎩ ⎨ − − ∈ ∈ nodeMINaisifVALUEMINIMAXmin nodeMAXaisifVALUEMINIMAXmax ns ns nSuccessorss nSuccessorss ( )⎩ N. Razavi - AI course - 2005 7 ‫اﻟﮕﻮرﻳﺘﻢ‬Minimax ‫اﻟﮕﻮرﻳﺘﻢ‬Minimax N. Razavi - AI course - 2005 8
  • 3.
    ‫ﺧﺼﻮﺻﻴﺎت‬Minimax ‫ﺧﺼﻮﺻﻴﺎت‬Minimax •‫ﻛﺎﻣﻞ؟‬‫ﺑﻠﻪ‬)‫ﺑﻪ‬‫ﺷﺮط‬‫ﻣﺤﺪود‬‫ﺑﻮدن‬‫درﺧﺖ‬( )‫ﻛ‬‫ﻛ‬( •‫ﺑﻬﻴﻨﻪ؟‬‫ﺑﻠﻪ‬)‫در‬‫ﻣﻘﺎﺑﻞ‬‫رﻗﻴﺒﻲ‬‫ﻛﻪ‬‫ﺑﻬﻴﻨﻪ‬‫ﺑﺎزي‬‫ﻣﻲ‬‫ﻛﻨﺪ‬( •‫ﺪﮔ‬‫ﭽ‬ ‫ﭘ‬‫؟‬ ‫زﻣﺎﻧ‬O(bm) •‫ﭘﻴﭽﻴﺪﮔﻲ‬‫زﻣﺎﻧﻲ؟‬O(b ) •‫ﭘﻴﭽﻴﺪﮔﻲ‬‫ﺣﺎﻓﻈﻪ؟‬O(bm))‫ﻛﺎوش‬‫اول‬-‫ﻋﻤﻖ‬( ‫ﻲ‬ ‫ﭘﻴﭽﻴ‬( )‫ش‬‫ﻖ‬ •‫در‬‫ﺷﻄﺮﻧﺞ‬b ≈ 35‫و‬m ≈ 100)‫در‬‫ﺑﺎزي‬‫ﻫﺎي‬‫ﻣﻌﻘﻮل‬( ‫ا‬‫ﻞ‬‫ﻖ‬ ‫ﻗ‬‫ﻼ‬ ‫ﻛﺎ‬‫ن‬ ‫ﻘ‬‫ﻓ‬‫ﻧ‬‫ﺎﺷﺪ‬ ‫راه‬‫ﺣﻞ‬‫دﻗﻴﻖ‬‫ﻛﺎﻣﻼ‬‫ﻣﻘﺮون‬‫ﺑﻪ‬‫ﺻﺮﻓﻪ‬‫ﻧﻤﻲ‬‫ﺑﺎﺷﺪ‬. N. Razavi - AI course - 2005 9 ‫ﻧﻔﺮه‬ ‫ﭼﻨﺪ‬ ‫ﻫﺎي‬ ‫ﺑﺎزي‬ ‫در‬ ‫ﺑﻬﻴﻨﻪ‬ ‫ﺗﺼﻤﻴﻤﺎت‬‫ﻧﻔﺮه‬ ‫ﭼﻨﺪ‬ ‫ﻫﺎي‬ ‫ﺑﺎزي‬ ‫در‬ ‫ﺑﻬﻴﻨﻪ‬ ‫ﺗﺼﻤﻴﻤﺎت‬ (1, 2, 6)A (1, 2, 6) (1, 5, 2)B ( , , ) ( , , ) (1, 2, 6) (6, 1, 2) (1, 5, 2) (5, 4, 5)C A (1, 2, 6) (4, 2, 3) (6, 1, 2) (7, 4, 1) (5, 1, 1) (1, 5, 2) (7, 7, 1) (5, 4, 5) N. Razavi - AI course - 2005 10 ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬-‫ﺑﺘﺎ‬ N. Razavi - AI course - 2005 11 ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬-‫ﺑﺘﺎ‬ N. Razavi - AI course - 2005 12
  • 4.
    ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬‫ﺑﺘﺎ‬‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬-‫ﺑﺘﺎ‬ N. Razavi - AI course - 2005 13 ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬-‫ﺑﺘﺎ‬ N. Razavi - AI course - 2005 14 ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫ﻫﺮس‬ ‫ﻣﺜﺎل‬-‫ﺑﺘﺎ‬ MINIMAX-VALUE (root) = max (min (3, 12, 8), min (2, x, y), min (14, 5, 2)) = max (3, min (2, x, y), 2) = max(3, z, 2) where z ≤ 2 = 3 N. Razavi - AI course - 2005 15 ‫آﻟﻔﺎ‬ ‫ﺧﻮاص‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫ﺧﻮاص‬-‫ﺑﺘﺎ‬ •‫ﻫﺮس‬‫ﻛﺮدن‬‫ﺑﺮ‬‫روي‬‫ﻧﺘﻴﺠﻪ‬‫ﻧﻬﺎﻳﻲ‬‫ﺗﺎﺛﻴﺮ‬‫ﻧﺪارد‬ •‫ﺗﺮﺗﻴﺐ‬‫ﺧﻮب‬‫ﺣﺮﻛﺖ‬‫ﻫﺎ‬‫ﻣﻴﺰان‬‫ﺗﺎﺛﻴﺮ‬‫اﻟﮕﻮرﻳﺘﻢ‬‫را‬‫ﺑﻬﺒﻮد‬‫ﻣﻲ‬‫ﺑﺨﺸﺪ‬ •‫ﺑﺎ‬»‫ﺑﻬﺘﺮﻳﻦ‬‫ﺗﺮﺗﻴﺐ‬«،‫ﭘﻴﭽﻴﺪﮔﻲ‬‫زﻣﺎﻧﻲ‬=O(bm/2) ‫ﺑ‬‫ﺮﻳﻦ‬ ‫ﺑﻬ‬‫ﻴﺐ‬ ‫ﺮ‬‫ﻲ‬ ‫ﭘﻴﭽﻴ‬‫ﻲ‬ ‫ز‬( ) •‫ﻋﻤﻖ‬‫ﺟﺴﺘﺠﻮي‬‫دو‬‫ﺑﺮاﺑﺮ‬ •‫ﻳﻚ‬‫ﻣﺜﺎل‬‫ﺳﺎده‬‫از‬‫ارزش‬‫اﺳﺘﺪﻻل‬‫در‬‫ﻣﻮرد‬‫ﻣﺤﺎﺳﺒﺎت‬‫ﻣﺮﺗﺒﻂ‬)‫ﺷﻜﻠﻲ‬‫از‬‫اﺑﺮ‬ ‫ﻻل‬(‫اﺳﺘﺪﻻل‬( N. Razavi - AI course - 2005 16
  • 5.
    ‫ﺗﺴﻤﻴﻪ‬ ‫وﺟﻪ‬‫ﺗﺴﻤﻴﻪ‬ ‫وﺟﻪ‬ •‫آﻟﻔﺎ‬‫ﻣﻘﺪار‬‫ﺑﻬﺘﺮﻳﻦ‬‫اﻧﺘﺨﺎب‬)‫ﻳﻌﻨﻲ‬ ‫ﻳﻦ‬‫ﺑﺎﻻﺗ‬‫ﻣﻘﺪار‬(‫ﻳﺎﻓﺘﻪ‬‫ﺷﺪه‬‫ﺗﺎ‬‫ﻛﻨﻮن‬ ‫ﺑﺎﻻﺗﺮﻳﻦ‬‫ﻣﻘﺪار‬(‫ﻳﺎﻓﺘﻪ‬‫ﺷﺪه‬‫ﺗﺎ‬‫ﻛﻨﻮن‬ ‫در‬‫ﻫﺮ‬‫ﻧﻘﻄﻪ‬‫اﻧﺘﺨﺎب‬‫در‬‫ﻃﻮل‬‫ﻣﺴﻴﺮ‬ ‫ا‬‫ﺎﺷ‬ ‫ﺑﺮاي‬max‫ﻣﻲ‬‫ﺑﺎﺷﺪ‬ •‫اﮔﺮ‬v‫ﺑﺪﺗﺮ‬‫از‬‫آﻟﻔﺎ‬،‫ﺑﺎﺷﺪ‬max‫از‬ ‫ﺮ‬‫ﺮ‬ ‫ﺑ‬‫ز‬‫ﺑ‬‫ز‬ ‫آن‬‫اﺟﺘﻨﺎب‬‫ﻣﻲ‬‫ﻛﻨﺪ‬ ‫آن‬‫ﺷﺎ‬‫ا‬‫ﻛ‬ ‫آن‬‫ﺷﺎﺧﻪ‬‫را‬‫ﻫﺮس‬‫ﻣﻲ‬‫ﻛﻨﺪ‬ •‫ﺑﺘﺎ‬‫ﻧﻴﺰ‬‫ﺑﺮاي‬min‫ﻣﺎﻧﻨﺪ‬‫آﻟﻔﺎ‬‫ﺗﻌﺮﻳﻒ‬ ‫ﺑ‬‫ﻴﺰ‬‫ي‬ ‫ﺑﺮ‬‫ﺮﻳ‬ ‫ﻣﻲ‬‫ﺷﻮد‬ N. Razavi - AI course - 2005 17 ‫آﻟﻔﺎ‬ ‫اﻟﮕﻮرﻳﺘﻢ‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫اﻟﮕﻮرﻳﺘﻢ‬-‫ﺑﺘﺎ‬ N. Razavi - AI course - 2005 18 ‫آﻟﻔﺎ‬ ‫اﻟﮕﻮرﻳﺘﻢ‬‫ﺑﺘﺎ‬ ‫آﻟﻔﺎ‬ ‫اﻟﮕﻮرﻳﺘﻢ‬-‫ﺑﺘﺎ‬ N. Razavi - AI course - 2005 19 ‫ﻣﻨﺎﺑﻊ‬ ‫ﻫﺎي‬ ‫ﻣﺤﺪودﻳﺖ‬‫ﻣﻨﺎﺑﻊ‬ ‫ﻫﺎي‬ ‫ﻣﺤﺪودﻳﺖ‬ ‫ﻓﺮض‬‫ﻛﻨﻴﺪ‬100‫ﺛﺎﻧﻴﻪ‬‫زﻣﺎن‬‫دارﻳﻢ‬‫و‬‫در‬‫ﻫﺮ‬‫ﺛﺎﻧﻴﻪ‬‫ﻣﻲ‬‫ﺗﻮان‬104‫ﮔﺮه‬ ‫ش‬ ‫ﺘ‬ ‫ﮔ‬‫ا‬ ‫ﮔﺴﺘﺮش‬‫داد‬. ‫در‬‫ﻫﺮ‬‫ﺣﺮﻛﺖ‬106‫ﮔﺮه‬ ‫ر‬‫ﺮ‬‫ﺖ‬ ‫ﺮ‬1‫ﺮ‬ ‫روش‬‫اﺳﺘﺎﻧﺪارد‬: ‫ش‬‫ﺎ‬‫ﻘ‬ •‫ﺗﺴﺖ‬‫ﺑﺮش‬:‫ﻣﺎﻧﻨﺪ‬‫ﻣﺤﺪوده‬‫ﻋﻤﻘﻲ‬ •‫ﺗﺎﺑﻊ‬‫ارزﻳﺎﺑﻲ‬: ‫ﺗﺎﺑﻊ‬‫ارزﻳﺎﺑﻲ‬: =‫ﻣﻴﺰان‬‫ﺗﺨﻤﻴﻨﻲ‬‫ﻣﻄﻠﻮب‬‫ﺑﻮدن‬‫ﻣﻮﻗﻌﻴﺖ‬ N. Razavi - AI course - 2005 20
  • 6.
    ‫ارزﻳﺎﺑ‬ ‫ﺗﺎﺑﻊ‬‫ارزﻳﺎﺑﻲ‬ ‫ﺗﺎﺑﻊ‬ •‫در‬،‫ﺷﻄﺮﻧﺞ‬‫ﻣﻌﻤﻮﻻ‬‫ﻣﺠﻤﻮع‬‫وزن‬‫دار‬‫وﻳﮋﮔﻲ‬‫ﻫﺎ‬ Eval(s)= w1f1(s) + w2f2(s) + … + wnfn(s) •‫ﻣﺜﺎل‬:w1=9‫و‬ 1 f1(s) = (# of white queens) – ( # of black queens) N. Razavi - AI course - 2005 21 ‫ﺟﺴﺘﺠﻮ‬ ‫ﺑﺮش‬‫ﺟﺴﺘﺠﻮ‬ ‫ﺑﺮش‬ •MinimaxCutoff‫ﻣﺎﻧﻨﺪ‬MinimaxValue‫ﻣﻲ‬‫ﺑﺎﺷﺪ‬‫ﺟﺰ‬‫اﻳﻨﻜﻪ‬: 1Terminal?‫ﺑﺎ‬Cutoff?‫ﺟﺎﻳﮕﺰﻳﻦ‬‫ﺷﺪه‬‫و‬ 1.Terminal?‫ﺑﺎ‬Cutoff?‫ﺟﺎﻳﮕﺰﻳﻦ‬‫ﺷﺪه‬‫و‬ 2.Utility‫ﺑﺎ‬Eval‫ﺟﺎﻳﮕﺰﻳﻦ‬‫ﺷﺪه‬‫اﺳﺖ‬ •‫آﻳﺎ‬‫در‬‫ﻋﻤﻞ‬‫ﻛﺎر‬‫ﻣﻲ‬‫ﻛﻨﺪ؟‬ ‫ﻳ‬‫ر‬‫ﻞ‬‫ر‬‫ﻲ‬ bm = 106 m = 4 ‫د‬‫ﻧ‬ ‫ﺷﻄ‬‫ﺶ‬‫ﻨ‬4‫ﻪ‬ ‫ﻻ‬‫ﻧﺎ‬‫ﺪ‬ ‫ا‬‫ﻛﻨﻨﺪ‬‫ﺖ‬ ‫ا‬! ‫در‬‫ﺷﻄﺮﻧﺞ‬‫ﭘﻴﺶ‬‫ﺑﻴﻨﻲ‬4‫ﻻﻳﻪ‬‫ﻧﺎ‬‫اﻣﻴﺪ‬‫ﻛﻨﻨﺪه‬‫اﺳﺖ‬! –4‫ﻻﻳﻪ‬=‫اﻧﺴﺎن‬‫ﻣﺒﺘﺪي‬ ‫ﻻ‬‫ﻛ‬‫ﻟ‬ –8‫ﻻﻳﻪ‬=‫ﻛﺎﻣﭙﻴﻮﺗﺮﻫﺎي‬‫ﻣﻌﻤﻮﻟﻲ‬‫و‬‫اﻧﺴﺎن‬‫ﻫﺎي‬‫ﺣﺮﻓﻪ‬‫اي‬ –12‫ﻻﻳﻪ‬=Deep Blue‫و‬‫ﻛﺎﺳﭙﺎروف‬ N. Razavi - AI course - 2005 22 ‫ﺳﺎزي‬ ‫ﭘﻴﺎده‬‫ﺳﺎزي‬ ‫ﭘﻴﺎده‬ •‫ﺗﻌﻴﻴﻦ‬‫ﻳﻚ‬‫ﻣﺤﺪوده‬‫ﻋﻤﻘﻲ‬‫ﻣﺎﻧﻨﺪ‬d –d‫ﺑﺎﻳﺪ‬‫ﻃﻮري‬‫اﻧﺘﺨﺎب‬‫ﺷﻮد‬‫ﻛﻪ‬‫زﻣﺎن‬‫ﻻزم‬‫از‬‫ﻗﻮاﻧﻴﻦ‬‫ﺑﺎزي‬‫ﺗﺠﺎوز‬‫ﻧﻜﻨﺪ‬ d‫ﺑﺎﻳﺪ‬‫ﻃﻮري‬‫اﻧﺘﺨﺎب‬‫ﺷﻮد‬‫ﻛﻪ‬‫زﻣﺎن‬‫ﻻزم‬‫از‬‫ﻗﻮاﻧﻴﻦ‬‫ﺑﺎزي‬‫ﺗﺠﺎوز‬‫ﻧﻜﻨﺪ‬ •‫روش‬‫ﺑﻬﺘﺮ‬:‫اﺳﺘﻔﺎده‬‫از‬IDS‫ﺗﺎ‬‫وﻗﺘﻲ‬‫ﻛﻪ‬‫زﻣﺎن‬‫دارﻳﻢ‬ ‫ﺸﻜﻼ‬ •‫ﻣﺸﻜﻼت‬: –‫ﺧﻄﺎ‬‫ﺑﻪ‬‫دﻟﻴﻞ‬‫ﺗﻘﺮﻳﺒﻲ‬‫ﺑﻮدن‬‫ﺗﺎﺑﻊ‬‫ارزﻳﺎﺑﻲ‬)‫ﺷﻜﻞ‬6.8b( •‫ﺑﻪ‬‫ﺗﺎﺑﻊ‬‫ﺗﺴﺖ‬Cutoff‫ﭘﻴﭽﻴﺪه‬‫ﺗﺮي‬‫ﻧﻴﺎز‬‫دارﻳﻢ‬ –‫ﻣﺸﻜﻞ‬‫ﺣﺎﻟﺖ‬‫ﻫﺎي‬‫ﻧﺎآرام‬‫ﺟﺴﺘﺠﻮي‬‫اﻧﺘﻈﺎر‬‫ﺑﺮاي‬‫آراﻣﺶ‬ ‫ﻞ‬‫ي‬‫م‬ ‫ر‬‫ﺠﻮي‬ ‫ﺟ‬‫ر‬‫ي‬ ‫ﺑﺮ‬‫ﺶ‬ ‫ر‬ –‫ﻣﺸﻜﻞ‬‫اﺛﺮ‬‫اﻓﻖ‬)‫ﺷﻜﻞ‬6.9( •‫ﺑﻬﺒﻮد‬‫ﺳﺨﺖ‬‫اﻓﺰار‬‫ﺑﺮاي‬‫اﻧﺠﺎم‬‫ﺟﺴﺘﺠﻮﻫﺎي‬‫ﻋﻤﻴﻖ‬‫ﺗﺮ‬ ‫م‬ •‫ﮔﺴﺘﺮش‬‫ﻫﺎي‬‫اﻧﻔﺮادي‬ N. Razavi - AI course - 2005 23 ‫ﺷﻜﻞ‬68 ‫ﺷﻜﻞ‬6-8 N. Razavi - AI course - 2005 24
  • 7.
    ‫اﻓﻖ‬ ‫اﺛﺮ‬‫اﻓﻖ‬ ‫اﺛﺮ‬ N.Razavi - AI course - 2005 25 ‫ﻋﻤﻞ‬ ‫در‬ ‫ﻗﻄﻌ‬ ‫ﻫﺎي‬ ‫ﺑﺎزي‬‫ﻋﻤﻞ‬ ‫در‬ ‫ﻗﻄﻌﻲ‬ ‫ﻫﺎي‬ ‫ﺑﺎزي‬ •Chess:Deep Blue‫در‬‫ﺳﺎل‬1997‫ﻗﻬﺮﻣﺎن‬‫دﻧﻴﺎي‬‫اﻧﺴﺎن‬‫ﻫﺎ‬)‫ﻛﺎﺳﭙﺎروف‬( ‫را‬‫ﺷﻜﺴﺖ‬‫داد‬.Deep blue‫در‬‫ﻳﻚ‬‫ﺛﺎﻧﻴﻪ‬200‫ﻣﻴﻠﻴﻮن‬‫ﻣﻮﻗﻌﻴﺖ‬‫را‬‫ﺟﺴﺘﺠﻮ‬ ‫ﻳ‬‫ﻴ‬‫ﻴﻮ‬ ‫ﻴ‬‫ﻴ‬ ‫ﻮ‬‫ﻮ‬ ‫ﻣﻲ‬‫ﻛﻨﺪ‬‫و‬‫از‬‫ﺗﻮاﺑﻊ‬‫ارزﻳﺎﺑﻲ‬‫ﺑﺴﻴﺎر‬‫ﭘﻴﭽﻴﺪه‬‫اي‬‫اﺳﺘﻔﺎده‬‫ﻣﻲ‬‫ﻛﻨﺪ‬. •Othello:‫ﻗﻬﺮﻣﺎن‬‫ﻫﺎي‬‫اﻧﺴﺎﻧﻲ‬‫از‬‫رﻗﺎﺑﺖ‬‫ﺑﺎ‬‫ﻛﺎﻣﭙﻴﻮﺗﺮﻫﺎ‬)‫ﻛﻪ‬‫ﺧﻴﻠﻲ‬‫ﺧﻮب‬ ‫ﻫﺴﺘﻨﺪ‬(‫اﻣﺘﻨﺎع‬‫ﻣﻲ‬‫ورزﻧﺪ‬. ‫ع‬‫ﻲ‬ •Go:‫ﻗﻬﺮﻣﺎن‬‫ﻫﺎي‬‫اﻧﺴﺎﻧﻲ‬‫از‬‫رﻗﺎﺑﺖ‬‫ﺑﺎ‬‫ﻛﺎﻣﭙﻴﻮﺗﺮﻫﺎ‬)‫ﻛﻪ‬‫ﺑﺴﻴﺎر‬‫ﺑﺪ‬‫ﻫﺴﺘﻨﺪ‬(‫اﻣﺘﻨﺎع‬ Go:‫ﻗﻬﺮﻣﺎن‬‫ﻫﺎي‬‫اﻧﺴﺎﻧﻲ‬‫از‬‫رﻗﺎﺑﺖ‬‫ﺑﺎ‬‫ﻛﺎﻣﭙﻴﻮﺗﺮﻫﺎ‬)‫ﻛﻪ‬‫ﺑﺴﻴﺎر‬‫ﺑﺪ‬‫ﻫﺴﺘﻨﺪ‬(‫اﻣﺘﻨﺎع‬ ‫ﻣﻲ‬‫ورزﻧﺪ‬.‫در‬‫ﺑﺎزي‬Go‫ﻓﺎﻛﺘﻮر‬‫اﻧﺸﻌﺎب‬‫ﺑﻴﺸﺘﺮ‬‫از‬300‫ﻣﻲ‬،‫ﺑﺎﺷﺪ‬‫ﺑﻨﺎﺑﺮاﻳﻦ‬ ‫اﻛﺜﺮ‬‫ﺑﺮﻧﺎﻣﻪ‬‫ﻫﺎ‬‫ﺑﺮاي‬‫اراﺋﻪ‬‫ﺣﺮﻛﺖ‬‫ﻫﺎي‬‫ﻣﻌﻘﻮل‬‫از‬‫ﭘﺎﻳﮕﺎه‬‫ﻫﺎي‬‫داﻧﺶ‬‫اﻟﮕﻮﻳﻲ‬ ‫ﺮ‬‫ﺮ‬‫ﺮ‬‫ﺮ‬‫ﻮ‬‫ﭘ‬‫ﺶ‬‫ﻲ‬ ‫ﻮ‬ ‫اﺳﺘﻔﺎده‬‫ﻣﻲ‬‫ﻛﻨﻨﺪ‬. N. Razavi - AI course - 2005 26 ‫ﻫﺴﺘﻨﺪ‬ ‫ﺷﺎﻧﺲ‬ ‫ﻋﻨﺎﺻﺮ‬ ‫داراي‬ ‫ﻛﻪ‬ ‫ﻫﺎﻳ‬ ‫ﺑﺎزي‬‫ﻫﺴﺘﻨﺪ‬ ‫ﺷﺎﻧﺲ‬ ‫ﻋﻨﺎﺻﺮ‬ ‫داراي‬ ‫ﻛﻪ‬ ‫ﻫﺎﻳﻲ‬ ‫ﺑﺎزي‬ N. Razavi - AI course - 2005 27 ‫ارزﻳﺎﺑ‬ ‫ﺗﺎﺑﻊ‬ ‫ﻣﻌﻨﺎي‬‫ارزﻳﺎﺑﻲ‬ ‫ﺗﺎﺑﻊ‬ ‫ﻣﻌﻨﺎي‬ •‫ﺗﻐﻴﻴﺮي‬‫ﻛﻪ‬‫ﺗﺮﺗﻴﺐ‬‫ﻧﺴﺒﻲ‬‫ﻣﻘﺎدﻳﺮ‬‫را‬‫ﺣﻔﻆ‬‫ﻣﻲ‬،‫ﻛﻨﺪ‬‫در‬‫ﺗﺼﻤﻴﻢ‬minimax ‫ﺗﺄﺛﻴﺮي‬،‫ﻧﺪارد‬‫اﻣﺎ‬‫ﻣﻲ‬‫ﺗﻮاﻧﺪ‬‫ﺗﺼﻤﻴﻢ‬‫در‬‫ﻣﻮرد‬‫ﮔﺮه‬‫ﻫﺎي‬‫ﺷﺎﻧﺲ‬‫را‬‫ﺗﻐﻴﻴﺮ‬‫دﻫﺪ‬ ‫ﻴﺮي‬‫ر‬‫ﻲ‬‫ﻮ‬‫ﻴﻢ‬ ‫ﺼ‬‫ر‬‫ﻮر‬‫ﺮ‬‫ي‬‫ﺲ‬‫ر‬‫ﻴﻴﺮ‬ •‫راه‬‫ﺣﻞ‬:‫ﺗﺒﺪﻳﻼت‬‫ﺧﻄﻲ‬ N. Razavi - AI course - 2005 28
  • 8.
    ‫ﺧﻼﺻﻪ‬‫ﺧﻼﺻﻪ‬ ‫ﻛ‬‫ﻛ‬‫ﻟﺬ‬ •‫ﻛﺎر‬‫ﻛﺮدن‬‫ﺑﺮ‬‫روي‬‫ﺑﺎزي‬‫ﻫﺎ‬‫ﻟﺬت‬‫ﺑﺨﺶ‬‫اﺳﺖ‬! •‫ﺑﺎزي‬‫ﻫﺎ‬‫ﻧﻜﺎت‬‫ﻣﻬ‬‫ﻣﺘﻌﺪدي‬‫را‬‫در‬AI‫ﺑﻪ‬‫ﺎﻳﺶ‬ ‫ﻧ‬‫ﻣ‬‫ﮔﺬارﻧﺪ‬•‫ﺑﺎزي‬‫ﻫﺎ‬‫ﻧﻜﺎت‬‫ﻣﻬﻢ‬‫ﻣﺘﻌﺪدي‬‫را‬‫در‬AI‫ﺑﻪ‬‫ﻧﻤﺎﻳﺶ‬‫ﻣﻲ‬‫ﮔﺬارﻧﺪ‬ •‫ﻋﺎﻟﻲ‬‫ﺑﻮدن‬‫ﻣﻤﻜﻦ‬‫ﻧﻴﺴﺖ‬‫ﺑﺎﻳﺪ‬‫ﺗﻘﺮﻳﺐ‬‫زد‬ ‫ﻲ‬‫ﺑﻮ‬‫ﻦ‬‫ﻴ‬‫ﻳ‬ ‫ﺑ‬‫ﺮﻳﺐ‬ •‫ﻓﻜﺮ‬‫ﻛﺮدن‬‫در‬‫ﻣﻮرد‬‫اﻳﻨﻜﻪ‬‫ﺑﻪ‬‫ﭼﻪ‬‫ﭼﻴﺰي‬‫ﻓﻜﺮ‬‫ﻛﻨﻲ‬‫اﻳﺪه‬‫ﺧﻮﺑﻲ‬ ‫ﺎﺷ‬ ‫ﻣﻲ‬‫ﺑﺎﺷﺪ‬ N. Razavi - AI course - 2005 29