Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Problématiques d'intelligence artificielle dans le domaine des jeux sur ordinateur

3,270 views

Published on

rapport de recherche rédigé dans le cadre de mon DÉA « Communication Homme-Machine & Ingénierie de l'Enseignement ».

Après un bref rappel historique, je présente la situation actuelle de l'intelligence artificielle dans les jeux et les problématiques qui y sont liées.

J'ouvre alors sur des perspectives d'avenir.

Published in: Technology
  • Be the first to like this

Problématiques d'intelligence artificielle dans le domaine des jeux sur ordinateur

  1. 1. Probl´matiques d’intelligence artificielle e dans le domaine des jeux sur ordinateur Damien Clauzel 15 d´cembre 2003 e
  2. 2. A strange game. The only winning move is not to play. – Joshua, Wargames 1
  3. 3. Table des mati`res e 1 Des jeux intelligents ? 3 1.1 Historique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2 Attraits de l’intelligence artificielle . . . . . . . . . . . . . . . 4 1.3 Quelques rep`res . . . . . . . . . . . . . . . . . . . . . . . . . e 5 2 Les modes fondamentaux 6 2.1 Tours de jeu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.1.1 Tour par tour . . . . . . . . . . . . . . . . . . . . . . . 6 2.1.2 D´roulement continu e (temps r´el) . e . . . . . . . . . . . 7 2.2 Raisonnements . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.2.1 Algorithmique . . . . . . . . . . . . . . . . . . . . . . 8 2.2.2 Expertise . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.2.3 Neuronique . . . . . . . . . . . . . . . . . . . . . . . . 9 3 Domaines concern´s e 10 3.1 Adversaire informatique . . . . . . . . . . . . . . . . . . . . . 10 3.2 Relations vis ` vis de l’environnement . . . . . . . . . . . . . 11 a 3.3 Acquisition et analyse d’informations . . . . . . . . . . . . . . 12 4 Projection dans l’avenir 15 4.1 Support mat´riel . . . . . . . . . . . . . . . . . . . . . . . . . 15 e 4.2 Gestion de profils . . . . . . . . . . . . . . . . . . . . . . . . . 16 5 Conclusion 17 2
  4. 4. Chapitre 1 Des jeux intelligents ? 1.1 Historique Au d´but ´tait l’informaticien. Et cet informaticien, venant du monde des e e math´matiques, se mit ` rˆver. Rˆver que ces nouveaux ordinateurs, capable e a e e d’effectuer plusieurs milliers d’op´rations par secondes, seraient un jour en e mesure de r´soudre des probl`mes complexes. Un autre de ses espoirs ´tait e e e de donner vie ` la machine, ou tout du moins l’intelligence dans un premier a temps, cela lui suffirait largement. Au fur et ` mesure que les ann´es passaient, que les ordinateurs gagnaient a e en puissance, que les algorithmes s’am´lioraient et que la connaissance glo- e bale du domaine s’accroissait, les probl`mes abord´s devinrent de plus en e e plus complexes. D´j`, le morpion laissait la place aux ´checs, aux dames et ea e au go[1]. Des voyageurs de commerce parcouraient inlassablement les routes a ` la recherche d’un chemin optimal sur des cartes colori´es au plus juste. e On assistait ` la d´finition de cat´gories de probl`mes, et ` l’´mergence de a e e e a e nouvelles approches. Cela se passait des ann´es 60 ` 90. De l’apparition des e a premiers ordinateurs dans les universit´s jusqu’au d´barquement massif de e e l’informatique individuelle. Lorsque John MacCarthy affirmait que ”toute activit´ intellectuelle peut e ˆtre d´crite avec suffisamment de pr´cision pour ˆtre simul´e par une ma- e e e e e chine”, il ne songeait probablement pas aux jeux actuels sur ordinateur. Depuis une dizaine d’ann´es, les jeux informatiques ne se contentent plus de e ` oe reproduire des principes existants, mais en inventent d’autres. A cˆt´ des 3
  5. 5. jeux traditionnels comme les ´checs se trouvent les wargames dont les figu- e rines jadis de plombs s’animent d´sormais au son du clairon virtuel, mais e aussi des simulations de courses de v´hicules ou des immersions ` la premi`re e a e personne dans un univers tridimensionnel rempli d’adversaires hostiles. 1.2 Attraits de l’intelligence artificielle Les principaux avantages d’un adversaire informatique sont qu’il est tou- jours disponible et d’humeur ´gale, mˆme quand il perd. D’autres qualit´ e e e sont sa capacit´ d’adaptation de niveau, sa logique et sa facult´ ` suivre e e a des raisonnements pr´d´finis. Cela permet d’essayer des variantes ou encore e e d’affiner des strat´gies en les reprenant ` un certain point. Au-del` de ces e a a ´l´ments, des logiciels sachant jouer sont de nos jours consid´r´s comme des ee ee adversaires ` part enti`re. Il n’est pas rare de voir des titres de rang at- a e tribu´s ` des programmes, les joueurs pouvant ainsi se comparer ` eux. Cet e a a aspect culturel est entr´ dans le monde du jeu depuis de nombreuses ann´es e e et devrait y rester. Quel joueur d’´checs pourrait aujourd’hui affirmer que e Deeper Blue n’est pas un vrai joueur d’´checs, capable non seulement d’ana- e lyse, mais ´galement de prise de d´cision strat´gique et d’improvisation ? La e e e complexit´ de son raisonnement est devenue telle que ses d´veloppeurs ne e e sont plus capables de pr´dire avec certitude ses actions ` venir, mais juste e a de donner des indications sur son travail en cours. Trop complexe pour ˆtre e rang´ dans la cat´gorie des programmes pousseurs de pions, mais pas encore e e assez pour pr´tendre pouvoir se passer de ses concepteurs afin de continuer e a ` s’am´liorer. Si son cas n’est pas repr´sentatif de l’intelligence artificielle e e en elle-mˆme, il en est certainement un symbole fort. e Un int´rˆt indirect de l’intelligence artificielle se cache dans la maniabilit´ ee e d’un jeu. Si l’ordinateur arriver ` rep´rer des habitudes chez un joueur, il a e peut lui proposer de prendre en charge lui-mˆme ces tˆches, afin que l’ˆtre e a e humain puisse se consacrer ` autre chose. Par exemple, en s´lectionnant un a e groupe d’unit´s, si le joueur en laisse une de cˆt´ car manifestement son e oe action ´tait trop malhabile, l’ordinateur pourra juger s’il est pertinent d’in- e clure ou non cette unit´. Cette cat´gorie, plus orient´e sur les interactions e e e homme-machine que sur la r´flexion pure, connaˆ actuellement une forte e ıt croissance. Les jeux ´tant de plus en plus riches, il devient n´cessaire de e e 4
  6. 6. fournir aux joueurs des outils en ad´quations avec la complexit´ des inter- e e actions disponibles. 1.3 Quelques rep`res e Une poign´e de grands jeux, connus de tous et faisant l’objet d’´tudes e e depuis de nombreuses ann´es, font office d’´chelle de comparaison dans le e e domaine du jeu sur ordinateur. Voici les principaux d’entre eux[2]. Chacun caract´rise une fa¸on d’aborder la question du jeu, mais quasiment tous e c emploient la mˆme m´thode, la force brute. Des approches diff´rentes comme e e e la reconnaissance de formes pour le Go ou les r´seaux de neurones pour e othello sont parfois utilis´s, mais cette approche reste tr`s minoritaire malgr´ e e e les succ`s rencontr´s. e e Nb possibilit´s e Jeu Nb emplacements Nb pi`ces e 1012 Aw´l´ ee 12 trous 48 graines 1032 Dames 100 cases 2 x 20 pions noirs et blancs 1060 Othello 64 cases 64 pions bicolores 10128 ´ Echecs 64 cases 2 x 16 pi`ces noires et blanches e 10172 Go 361 points 180 pierres blanches et 181 pierres noires ´ Etat actuel : * Bridge : les programmes ne d´passent pas le niveau d’un d´butant e e * Aw´l´ : 889 063 398 406 parties possibles, jeu maˆ e ee ıtris´ * Dames : les IA ont d´pass´ les champions humains e e * Othello : victoire sans appel de l’ordinateur en 1997 ´ * Echecs : uniquement une poign´e d’humaisn arrivent ` tenir tˆte aux e a e ordinateurs * Go : l’ordinateur a le niveau d’un faible joueur en club 5
  7. 7. Chapitre 2 Les modes fondamentaux 2.1 Tours de jeu Nous distinguerons deux grands modes de fonctionnement des jeux : le tour par tour et le continu, souvent nomm´ ` tord ”temps r´el”. ea e 2.1.1 Tour par tour Nous ´voluons ici dans le domaine des jeux dit ”classiques”. Morpion, e ´checs, dames, go ou backgammon, ces jeux ont en commun plusieurs ca- e ract´ristiques[3] : les joueurs jouent ` tour de rˆle, ` chaque tour ils choi- e a o a sissent une action parmi un nombre ferm´ et petit de possibilit´s et on peut e e pr´dire l’effet d’une action sur le jeu. Ce type de fonctionnement laisse un e temps de r´flexion ´lev´ ` l’ordinateur. Celui-ci peut en effet exploiter non e e ea seulement le temps qui lui est imparti durant son tour, mais ´galement du- e rant celui de son (ou ses) adversaire(s). De plus, la gestion du jeu ` propre- a ment dit est souvent extrˆmement simple, requ´rant donc peu de ressources. e e L’essentiel des calculs se porte par cons´quent sur la r´flexion en elle-mˆme. e e e Traditionnellement, les probl`mes pos´s dans cette cat´gorie de jeu sont e e e r´solus par la force brute. La repr´sentation des situations passant par des e e arbres, on se retrouve ` employer des algorithmes bien connus, sur lesquels a sont apport´es des am´liorations mineures. Les heuristiques[4] sont les fers e e de lance de ce type de r´solution car intervenant aux endroits critiques de e ces algorithmes, ` savoir comment juger quelles branches de l’arbre il est a int´ressant de d´velopper. e e 6
  8. 8. Les probl`mes rencontr´s dans ces cas sont principalement la taille des e e arbres ` explorer a 1 . Plus la fonction d’´valuation est ´labor´e, plus il faudra e e e de temps pour la calculer, ce qui limite la profondeur de l’arbre ´tudi´. En e e revanche, une fonction simple donnera une r´ponse rapide, mais potentiel- e lement d’une qualit´ faible par rapport ` ce qui aurait pu ˆtre trouv´. Tout e a e e l’art des heuristiques repose sur le subtil compromis entre l’efficacit´ et la e vitesse. 2.1.2 D´roulement continu (temps r´el) e e Les jeux ` d´roulement continu constituent une gageure pour l’ordinateur. a e Non seulement doit-il g´rer le jeu en lui-mˆme, planifier ses actions et tenir e e compte des agissements des autres participants (humains ou informatiques), mais ´galement le faire rapidement, et de fa¸on continue. On imagine mal e c les joueurs d’une ´quipe de football s’arrˆtant toutes les 3 minutes afin de e e d´cider des actions ` suivre. Certain jeux n’existent que par cette notion de e a continuit´, afin de mettre ` l’´preuve les r´flexes et capacit´s de raisonnement e a e e e instantan´ de l’ˆtre humain. e e Dans cette approche, la question de la r´activit´ est primordiale. Ne pas e e agir est souvent aussi lourd de cons´quences que de mal agir. Les m´thodes e e de prise de d´cision ont donc une tr`s forte contrainte temporelle. Ainsi, dans e e les jeux d’´checs on pourra s’astreindre de rendre une r´ponse en un temps e e donn´. L’accent est par cons´quent mis sur la segmentation d’un probl`me e e e en un ensemble pouvant ˆtre traiter plus simplement, et rapidement. Une e pratique courante est d’affecter un facteur de priorit´ ` chacune de ces sous- ea tˆches, et d’effectuer une juste r´partition du temps de calcul disponible a e selon des crit`res relatifs ` la situation actuelle dans le jeu. e a Ici aussi, les heuristiques jouent un rˆle primordial dans la d´termination o e des actions ` effectuer en priorit´. On les retrouve ` diff´rents niveaux, a e a e mais celles suscitant actuellement le plus d’int´rˆt sont celles en haut de la ee pyramide de d´cision, car ce sont elles qui conditionnent la strat´gie globale e e de l’ordinateur. Mieux vaut-il attaquer que se d´fendre ? Sur quelle partie e 1 Un joueur d’´checs a en moyenne 35 possibilit´s de jeu ` chaque coup, une partie e e a tenant habituellement lieu sur 30 demi-coups, la taille de l’espace d’´tats est de l’ordre de e 30 35 7
  9. 9. du jeu dois-je fournir un effort ? Les meilleurs techniques de jeu ne servent a ` rien au niveau local si elles ne sont pas d´cid´es d’un point de vue global. e e 2.2 Raisonnements Il existe 3 grandes fa¸on de raisonner pour l’ordinateur[5]. c 2.2.1 Algorithmique La r´solution du probl`me est obtenue par la m´canisation. Il s’agit de e e e trouver une m´thode syst´matique conduisant au r´sultat. Tout le chemin e e e a ` parcourir est d´crit pas ` pas pour atteindre le r´sultat d´sir´. Il s’agit e a e e e l` d’une proc´dure d’automate totalement planifi´e et pr´sent´e selon une a e e e e s´quence tr`s pr´cise ` respecter. Il faut ´tudier compl`tement le probl`me e e e a e e e et codifier exhaustivement la solution. Il est n´cessaire de bien d´cortiquer e e celle-ci pour la mettre dans un automate rapide qui va la d´rouler beaucoup e plus rapidement que le cerveau. On peut y ajouter un peu de r´flexion et e optimiser le calcul, mais cela restera une proc´dure imagin´e par l’homme. e e Les jeux mettant en oeuvre cette m´thode sont les plus courants. En effet, e dans la grande majorit´ des probl`mes, la d´finition d’un algorithme suffit e e e a ` obtenir une r´ponse ` une question donn´e. Cependant, on se prive de la e a e capacit´ d’apprentissage. e 2.2.2 Expertise On effectue une m´canisation du raisonnement pour obtenir des d´ductions e e et des conclusions. Grˆce ` la connaissance du domaine, pr´alablement et a a e consciencieusement communiqu´e par un expert, on d´crit les r`gles ` suivre. e e e a Il s’agit ensuite de les enchaˆ ıner d’une fa¸on g´n´rale en employant les c e e r´sultats fournis au fur et ` mesure. Cela revient ` transcrire tout le savoir e a a et la maˆ ıtrise d’un expert d’un jeu pr´cis dans une base de connaissance, e puis de confronter le syst`me au probl`me. e e Cette m´thode est tr`s rarement employ´e pour des raisons de perfor- e e e mances. C’est un syst`me dont on ne sait pas pr´dire l’arrˆt, et dont les e e e ´tapes interm´diaires sont insatisfaisantes. Il n´cessite une compr´hension e e e e 8
  10. 10. aigu des m´canismes du jeu et n’est (pratiquement) pas capable d’apprendre e a ` partir de situations inconnues. 2.2.3 Neuronique Le but de cette m´thode est l’apprentissage par la pratique, en tentant de e m´moriser les diff´rences entre les parties. Aucune expertise externe n’est e e apport´e, si ce n’est lors de la cr´ation du r´seau et par mim´tisme des op- e e e e posants. Un programme de s´lection r´compense les meilleures m´thodes et e e e ´limine les plus faibles. Ce proc´d´ est gourmand en temps, et est g´n´ralement e e e e e r´alis´ en deux phases. La premi`re consiste ` laisser la machine apprendre e e e a et ` d´velopper sa propre logique de r´solution du probl`me. La 2`me est a e e e e l’exploitation proprement dite, o` l’on confronte la m´thode de la machine u e a ` la situation afin de la r´soudre. e Cette fa¸on d’aborder la r´solution de probl`me est consid´r´ comme la c e e ee plus ´l´gante et la plus efficace car l’ordinateur d´cide seul de la mani`re ee e e de r´soudre la situation qui lui est expos´, sans aide ext´rieur et en s’adap- e e e tant. Malheureusement, elle demeure fort difficile ` exploiter ` cause de la a a longueur d’apprentissage, et de la complexit´ inh´rente ` la gestion des neu- e e a rones. 9
  11. 11. Chapitre 3 Domaines concern´s e 3.1 Adversaire informatique Une fa¸on naturelle d’aborder la question des adversaires informatiques c est d’envisager la simulation des raisonnements humains. Or, les r´alisations e de ces dix derni`res ann´es ont montr´s que les performances n’´taient pas e e e e a ` la hauteur des esp´rances. Outre le fait d’ˆtre trop lourde et complexe e e a ` mettre en oeuvre pour ˆtre efficace, cette m´thode implique aussi une e e connaissance suffisante de l’intelligence humaine telle que nous l’employons au quotidien. Cette voie est donc laiss´e de cˆt´ en faveur d’une approche e oe oppos´e, ` savoir cr´er une forme de raisonnement propre ` la machine. e a e a Une des questions revenant fr´quemment en avant est de savoir s’il est e souhaitable pour l’utilisateur de pouvoir diff´rencier un adversaire humain e d’un opposant informatique, en se basant uniquement sur ses r´actions dans e le jeu. On voit d´j` le test de Turing[6] poindre son nez ` l’horizon. Si l’on ea a interroge les principaux int´ress´s, ` savoir les joueurs eux-mˆmes, il ressort e e a e globalement que ceux-ci pr´f`rent affronter des adversaires ayant un compor- ee tement semblable ` celui-d’un humain plutˆt qu’un ”stupide programme”. a o Le crit`re de qualit´, fort subjectif au demeurant, semble ˆtre la capacit´ e e e e d’un programme ` s’inspirer de comportement humain afin d’assurer une a bonne efficacit´. Mˆme si cela peut en r´alit´ impos´ une fa¸on de jouer e e e e e c plus faible ` l’ordinateur, car la strat´gie humaine n’est pas toujours la plus a e pertinente. Ainsi, l` o` l’ordinateur pourrait d´terminer que la m´thode ga- a u e e gnante est d’effectuer toujours le mˆme parcours entre diff´rents points du e e jeu afin de r´aliser des objectifs mineurs, le joueur humain emploiera un e 10
  12. 12. autre comportement en argumentant que oui, peut-ˆtre que cette fa¸on de e c jouer est efficace en terme de victoire, mais elle ne l’est pas du point de vue ludique. Un individu humain joue principalement pour le plaisir[7], alors que l’or- dinateur joue pour gagner. Il y a l` une diff´rence fondamentale entre nos a e deux protagonistes. ` ma connaissance, il n’existe pas de travaux actuels a prenant en compte l’aspect qu’un opposant informatique doit avant tout distraire l’humain avant de lui opposer une r´sistance farouche. e 3.2 Relations vis ` vis de l’environnement a La tendance actuelle dans le domaine des jeux sur ordinateur est l’agran- dissement massif des zones exploitables. Les cartes deviennent de plus en plus vastes, avec toujours plus de complexit´. Reliefs, moyens de d´placement, e e perspectives, ´l´ments ´volutifs, tout ceci contribue ` offrir ` l’utilisateur en- ee e a a core plus d’interactions, et donc d’amusement. L` o` les choses deviennent a u difficiles, c’est que notre ami l’ordinateur, lui, s’arrache les puces. Comment tenir compte de tous ces param`tres[8] ? Quels sont les crit`res permettant e e de calculer le d´placement optimum de ses unit´s ? Et s’il doit en outre e e g´rer des groupes d’´l´ments aux caract´ristiques h´t´rog`nes (vitesse de e ee e ee e d´placement, puissance de feu pour forcer le passage, etc), il fini par ne plus e s’en sortir. Il est toutefois possible de d´composer une situation complexe e en plusieurs sous-probl`mes. Ainsi, le d´placement coordonn´ de plusieurs e e e groupes d’unit´ (niveau macro) pourra ˆtre g´r´ en employant une m´thode, e e ee e tandis que la gestion d’un groupe sera confi´ ` un autre, pour finir au niveau ea micro, l’unit´ en elle-mˆme, qui ne se d´placera que dans le cadre restreint e e e du groupe. Selon les cas, on peut employer algorithmes comme A* ou des techniques multi-agents communicant via un blackboard. Mais cette derni`re e m´thode est peu usit´e, car difficilement employable dans des logiciels ` la e e a dur´e de vie courte. e La capacit´ pour l’ordinateur ` tirer profit de l’environnement est aujour- e a d’hui un des ´l´ments cl´ en mati`re de strat´gie[9].Non seulement cela lui ee e e e permet de faire la diff´rence entre les bons et les mauvais endroits (”hum, e ceci est de la lave, et je sais que m’y immerger n’est pas une action souhai- table pour ma survie”), mais permet ´galement d’associer des notes ` un e a 11
  13. 13. emplacement (”je suis mort ici durant les 3 derni`res parties, donc je ne vais e pas retourner dans ce tunnel sans en savoir plus”) Dans cette cat´gorie de probl´matique se trouve ´galement des cas plus e e e traditionnels, comme la question de d´terminer le chemin optimal entre 2 e points. Aux difficult´ de la NP-completude s’ajoutent les param`tres ´voqu´s e e e e ci-dessus. Tout ce petit monde ´voluant naturellement constamment dans le e temps. Il existe deux fa¸ons d’appr´hender la gestion du terrain dans un jeu c e sur ordinateur : l’approche g´n´rique consistant ` d´finir des m´canismes e e a e e abstraits de perception et d’analyse de cartes, et l’approche sp´cifique o` e u l’ordinateur se base sur des informations construites lors de la cr´ation de la e carte[10]. S’il est commun´ment admis que l’id´al semble ˆtre de d´velopper e e e e des solutions de haut niveau afin de pouvoir les r´employer partout, comme e le ferait un ˆtre humain, dans la pratique les d´veloppeurs ajoutent souvent e e aux cartes des m´tadonn´es relatives ` l’environnement. Comment atteindre e e a rapidement un point difficile, dans quelle zone se trouve tel objet, etc. La simplification des calculs qui en r´sulte permet ` l’ordinateur de se consa- e a crer ` d’autres tˆches, permettant ainsi de ne pas s’engluer dans des d´tails a a e secondaires. l’inconv´nient de cette tactique est que si la carte est modifi´e e e apr la suite, ces m´tadonn´es risquent fort de devenir obsol`tes. La com- e e e plexit´ du d´veloppement est donc plus importante. La conception de cartes e e demandant ´norm´ment de temps, et n´cessitant diff´rents experts, on com- e e e e prend le besoin d’am´lioration de l’approche g´n´rique. Cependant, celle-ci e e e semble de nos jour encore loin d’ˆtre r´ellement exploitable. e e La majorit´ de ces probl`mes sont de nos jours peu trait´s, ou bien e e e na¨ıvement. Des pistes sont ´tudi´es du cˆt´ des syst`mes d’information e e oe e g´ographique pour en retirer de l’aide, mais les liaisons ne sont pas ´videntes. e e Le plus souvent, des heuristiques larges sont employ´es, avec des probabilit´s e e de succ`s fortement li´s ` un contexte pr´cis. e e a e 3.3 Acquisition et analyse d’informations La prise de position repose sur la connaissance d’informations. Elles peuvent ˆtre per¸ues ou d´duites, compl`tes ou partielles, certaines, impr´cises voir e c e e e 12
  14. 14. mˆme erron´es, mais toutes participent ` l’´laboration d’une repr´sentation e e a e e de la situation par l’ordinateur qui lui servira ` d´cider de ses prochaines a e actions. Tout comme le joueur, l’ordinateur commence par rassembler des infor- mations sur son environnement. L’ˆtre humain le fait de fa¸on intuitive et e c effectue ´norm´ment d’assomptions sur des implications de sens commun : e e les murs sont solides, le feu brˆle, une porte doit pouvoir s’ouvrir, etc. L’or- u dinateur, lui, part de z´ro. Le probl`me est donc de fournir ` l’ordinateur e e a ces renseignements, de les tester, de le remettre en cause et d’en apprendre de nouveaux. Une autre facette des connaissances que doit acqu´rir l’ordinateur est que e chaque joueur, humain ou informatique, influe sur l’environnement : une porte que l’on a laiss´e ferm´e pourra ˆtre retrouv´e ouverte, un objet que e e e e l’on a laiss´ pourra avoir disparu. Ces connaissances ne sont pas fig´es, elles e e ´voluent en fonction des ´v´nements. Par cons´quent, il faut trouver une e e e e m´thode pour attribuer un score de v´racit´ ` chaque information, avec un e e ea affaiblissement en fonction du temps : si on laisse de l’argent au milieu d’une rue fr´quent´e au temps t, il sera tr`s probablement encore l` au temps t+1 ; e e e a mais ` t+1000, ce n’est plus aussi certain... a Il peut ˆtre judicieux de faire la distinction entre 2 types de connaissances. e Les premi`res sont celles du monde, fixes, universelles et absolue. Ce sont e par exemple la gravit´, le fait que la pierre est plus r´sistante que le bois, que e e l’on se noie dans l’eau, etc. Ces informations sont habituellement fournie par le d´veloppeur, l’ordinateur n’ayant pas ici ` red´couvrir la roue, ce qui lui e a e permet de tenir tˆte ` l’humain. l’int´rˆt de ce type de connaissance r´side e a ee e dans leur g´n´ricit´. Si les ´l´ments ont un comportement identique d’un e e e ee terrain ` l’autre, voir d’un jeu ` l’autre, il est possible de d´finir des collec- a a e tions de connaissances pouvant servir de base ` de futurs d´veloppements. a e De plus, la d´finition commune permet d’assurer une coh´rence vis ` vis e e a du joueurs : dans un certain type de jeux, il est logique que des ´l´ments ee semblables adoptent des r´actions similaires face ` un stimulus r´p´t´. e a e ee Le second type d’information englobe le reste. Susceptibles d’´voluer, elles e devront ˆtre remise en question. L’ˆtre humain les per¸oit avec ses sens et les e e c 13
  15. 15. traduit en sch´mas mentaux ; l’ordinateur, lui, n’a pas d’action particuli`res e e a ` effectuer. La position d’un ´l´ment, le niveau d’un autre, qu’importe, il ee lui suffit de consulter sa m´moire. Une situation inacceptable pour le joueur e humain qui se sent ici l´s´ car il ne peut pas savoir ce qui se trouve derri`re le ee e mur, lui. Cette question d’´thique est en fait souvent ignor´e afin d’am´liorer e e e les performances de l’ordinateur. Au lieu de passer de nombreux cycles de calculs ` d´terminer ce que peux ”voir” un personnage contrˆl´ par l’ordi- a e oe nateur, il est plus rapide de prendre directement les informations dans le r´f´rentiel et de les exploiter. Le temps ici gagn´ sera employ´ ` d’autres ee e e a tˆches. a Dans le cas o` l’on dispose des ressources informatiques n´cessaires ` la u e a r´solution de ces calculs de perceptions, on rentre dans une optique d’ap- e prentissage. L’ordinateur doit donc poss´der des capacit´s ` comparer des e e a ´l´ments, ` reconnaˆ des sch´mas plus ou moins similaires et ` les associer. ee a ıtre e a Les r´seaux de neurones peuvent ici ˆtre employ´s, mais les contraintes de e e e r´activit´ font que souvent on leur pr´f`re des solutions plus rapides comme e e ee les classiques parcours d’arbres. Ces derniers font d’ailleurs des merveilles dans la gestions de petits nombres d’´l´ments, ce qui tend ` d´montrer que ee a e dans de tr`s nombreux cas des heuristiques suffisent ` r´soudre des probl`mes e a e e semblant n´cessit´ de ”l’intelligence”. e e La plupart du temps, l’ordinateur se basera donc sur les informations du monde pour prendre ses d´cision, et la petite partie d’apprentissage ne ser- e vira qu’` moduler l´g`rement ses d´cisions. Ce probl`me profite des avanc´es a e e e e e de l’intelligence artificielle en la mati`re, et trouve ici des domaines d’appli- e cations concrets. La limitation de l’acquisition des connaissances dans le domaine du jeu provient surtout du mat´riel, et non pas des m´thodes de calculs. D’avantage e e de puissance de calcul permettrait de r´aliser des progr`s sans remettre en e e question les m´thodes de raisonnement actuelles. e 14
  16. 16. Chapitre 4 Projection dans l’avenir 4.1 Support mat´riel e Un des goulets d’´tranglement actuel en mati`re d’intelligence artificielle e e ´tant la puissance de calcul disponible, on pourrait imaginer dans un futur e proche le d´veloppement de supports mat´riels d´di´s. Cette pratique a en e e e e effet permit aux technologies de l’imagerie de r´aliser des progr`s spectacu- e e laires il y a quelques ann´es grˆce ` des produits comme la 3Dfx1 . e a a Des supports tels que la NNPC-122 commencent ` apparaˆ a ıtre, mais dans des environnements sp´cialis´s. Je pense toutefois qu’il y a un avenir certain e e pour ces supports mat´riels. La sous-traitance des calculs r´p´titifs que sont e e e les parcours d’arbres ou les it´rations dans un r´seau de neurones pouvant e e ˆtre confi´ ` des processeurs sp´cialis´s, il serait ainsi possible d’am´liorer e ea e e e les capacit´s d’analyse du syst`me. e e Cependant, cela reviendrait ` figer des m´thodes de r´solutions, et les a e e jeux voulant exploiter ces supports devraient le faire avec des contraintes immuables. Il y aurait donc un risque de perdre le cˆt´ ´volutif de cette oe e solution. 1 http://www.nvidia.com 2 http://www.modulusfe.com/nnpc12/default.asp 15
  17. 17. 4.2 Gestion de profils Plusieurs jeux commencent ` int´grer la notion de profil d’utilisateur. a e Au fil ses parties, l’ordinateur en apprend de plus en plus sur celui-ci, lui permettant d’adapter ainsi sa fa¸on d’agir pour toujours renouveler l’int´rˆt c ee du jeu. Plus l’utilisateur progresse, plus l’ordinateur est capable de soutenir son niveau. Toutefois, un apprentissage est sp´cifique ` un jeu, pour un e a utilisateur donn´. e Il pourrait ˆtre int´ressant d’´tendre ce principe ` un ensemble de jeux, e e e a toujours pour un mˆme utilisateur. On aura donc un profil g´n´rique de lui e e e que pourraient interpr´ter diff´rents logiciels, afin de s’adapter d`s le d´but e e e e a ` ses caract´ristique. Un utilisateur mettant du temps ` progresser se verrait e a ainsi oppos´ d`s le d´but des adversaires informatiques adapt´s ` son niveau, e e e e a au lieu de se baser sur un mod`le relativement abstrait du joueur d´butant. e e Je vois apparaitre dans cette solution des questions d’´thiques : que se e passera-t’il si l’on essaye de d´duire les facult´s intellectuelles d’une per- e e sonne ` partir de ces informations ? Y’a-t’il des risques de d´rives possibles a e en extrapolant depuis une activit´ ludique, donc non productive, des capa- e cit´s de travail ? Mais si l’on tient compte de ces concid´rations, pourrait-on e e profiter de cette masse d’information afin d’accroˆ ıtre la connaissance sur l’ˆtre humain ? e 16
  18. 18. Chapitre 5 Conclusion Edward Fredkin disait que l’intelligence, c’est d’avoir un probl`me et de e savoir le r´soudre e 1 . S’il est vrai que d´sormais on comprend mieux les e probl´matiques qui se posent en mati`re de jeux sur ordinateurs, on sait e e ´galement que l’intelligence artificielle n’est pas la panac´e que l’on croyait. e e Les m´thodes de r´solutions classiques que sont les algorithmes de par- e e cours de graphes montrent aujourd’hui qu’elles ne sont pas prˆtes de partir. e Et d’ailleurs, pourquoi le feraient-elles ? Elles s’acquittent parfaitement des tˆches qui leur sont confi´es. a e Face ` la complexit´ croissante des jeux, la d´finition de cat´gories a per- a e e e mit la segmentation de probl`mes complexes en sous-ensemble de domaines e r´duits, ce qui a contribu´ ` la r´alisation d’approches plus fines en mati`res e ea e e de r´solution. Chaque cat´gories peut en effet ˆtre vue comme une appli- e e e cation concr`te des grandes probl´matiques d’intelligence artificielle. Re- e e cherche de parcours, prises de d´cision, apprentissage, tout est repris et ex- e ploit´. Les jeux commerciaux profitent tr`s rapidement des avanc´es des do- e e e maines, et en sont mˆme parfois les moteurs. Des logiciels comme Creatures 2 e ou plus r´cemment Black and White 3 ont surpris bon nombre de joueurs e grˆce ` leurs r´seaux de neurones. Mais apr`s une phase de d´couverte, a a e e e le temps pour l’ˆtre d’humain d’apprendre comment la machine r´agissait, e e ces jeux ont rapidement d´clin´s ; l’homme s’adaptant en effet plus vite e e que la machine. Trop pauvres pour ˆtre r´ellement amusants, leur int´rˆt e e ee 1 Sciences, 17 octobre 1980 2 de Creatures Labs 3 de Lionhead Studios 17
  19. 19. r´sidait surtout dans leur capacit´s ` apprendre de l’humain. Il faut peut- e e a ˆtre ´galement envisager le fait que le battage m´diatique autour d’eux a fini e e e par convaincre les joueurs qu’ils ´taient r´volutionnaires. Ils l’´taient sans e e e doute, mais pas dans une fa¸on qui soit perceptible par le grand publique. c De la mˆme fa¸on que les avions volent sans battre des ailes, les ordi- e c nateurs peuvent gagner sans suivre une logique humaine. Si DeeperBlue se d´brouille mieux aux ´checs que 99.99% de la population humaine, cela fait e e de lui un joueur d’´checs, malgr´ qu’il soit fait de silice et non de carbone. e e Le pi`ge concisterait donc ` m´langer le but ` atteindre et la fa¸on d’y e a e a c parvenir. La question du dicernement entre ce qui n´cessite r´ellement de e e l’intelligence, et ce qui peut se r´soudre d’une mani`re algorithmique est par e e cons´quent cruciale ` mes yeux. Ce qui nous renvoit ` l’´ternelle question : e a a e au fond, qu’est-ce que l’intelligence, et une machine peut-elle l’ˆtre ? John e Searl a clairement statu´ que le cerveau est le si`ge de la pens´e et qu’il e e e peut-ˆtre totalement d´crit par des m´canismes chimiques et physiques[11], e e e donnant l’espoir au futur de l’intelligence artificielle forte. Actuellement, il est difficile d’avoir du recul sur l’efficacit´ de l’intelligence e artificielle dans les jeux sur ordinateurs, car son apparition est encore trop r´cente. Mais l’identification des probl`mes ` r´soudre ayant ´t´ ´tablie par e e a e eee la recherche depuis de nombreuses ann´es, la difficult´ r´side surtout dans e e e le fait d’employer ces technologies dans des logiciels grands publiques. 18
  20. 20. Bibliographie [1] Daniel Crevier. ` A la recherche de l’intelligence artificielle. Champs/Flammarion, 1999. Origine et histoire de l’intelligence arti- ficielle. [2] John H. Conway. L’´chec de l’intelligence artificielle. Sciences et vie, e d´cembre 2002. e [3] John H. Conway. On Numbers and Games. Academic Press, 1976. [4] Levy and Bealjournal. Heuristic programming in artificial intelligence : The first computer olympiad. 1989. [5] G´rard Villemin. Intelligence artificielle. 2003. http://membres.lycos. e fr/villemingerard/Logique/IAintro.htm. [6] A.M. Turing, C. Strachey, M.A. Bates, and B.V. Bowden. Digital com- puters applied to games. In B.V. Bowden, editor, Faster Than Thought, pages 286–310. Pitman, London, 1953. [7] James P. Carse. Finite and Infinite Games. Ballantine Books, 1987. R´flexions philosophiques sur les jeux et la vie en g´n´ral. e e e [8] B. Girard and G. Robert. Intelligence artificielle situ´e et jeux vid´o. In e e Actes de Conf´rence du IV`me colloque Jeunes Chercheurs en Science e e Cognitives (CJC4), pages 157–160. ISC Lyon, 2001. [9] William van der Sterren. Terrain Reasoning for 3D Action Games. Proceedings of the 2001 Game Developer Conference, 2001. [10] J.M.P. van Waveren. The Quake 3 Arena Bot. PhD thesis, University of technology, Delft, 2001. Th`se portant sur la conception d’un adversaire e informatique pour le jeu Quake 3. [11] John R. Searle. Du cerveau au savoir. Hermann, 1985. 19

×