next up previous contents
suivant: La programmation orientée équipe monter: Le cas du jeu précédent: Communiquer en destination de   Table des matières

Coopérer contre un adversaire

Le jeu d'équipe fait intervenir deux équipes opposées, dont le but est de faire échouer celui de l'équipe adverse. Tout comme la modélisation d'un coéquipier facilite la coopération (prédiction de mouvements et élimination de certains besoins de communication), la modélisation de l'adversaire permet de se comporter de manière plus consistante contre lui. Une bonne stratégie est de modéliser l'adversaire et d'estimer qu'il se comportera de manière optimum en fonction de ses critères particuliers et en fonction de l'état du monde actuel supposément connu par lui. Ainsi, la prise de décision effectuée s'effectuera à l'échelle d'une réponse à l'hypothèse d'un comportement optimum et se repose sur la supposition que la décision prise restera acceptable si l'opposant ne joue pas un coup optimal. Cette stratégie est inspirée de l'algorithme minimax, très répandu en intelligence artificielle appliquée aux jeux, qui fait intervenir une notation du contexte du jeu en cours et de l'hypothèse que l'adversaire prendra le meilleur choix qui lui est offert. Elle fonctionne aussi dans le cas de la modélisation du comportement coopératif des coéquipiers.

Un exemple d'utilisation de cette modélisation est détaillé dans [#!stone-2000!#]. La méthode décrite, IMBBOP, consiste à résoudre dans une simulation informatique de football les dilemmes survenant près d'un but adverse. Typiquement, le joueur à le choix entre tenter de marquer un but lui-même ou passer la balle à un coéquipier qui pourrait avoir plus de chances que lui de marquer le but. L'algorithme général consiste à déterminer le moment $t$ où l'équipier $X$ aura la possibilité d'accomplir l'objectif $G$ (par exemple, marquer un but au temps $T$), que l'agent $A$ à besoin d'accomplir ou de voir accomplir, en considérant que l'agent $X$ adoptera un comportement optimal. Plus la différence $T-t$ est grande, plus l'agent $X$ aura de chances d'accomplir $G$ en adoptant un comportement non optimum. Ainsi, l'agent $A$ décide de déléguer l'action à l'agent $X$ lorsque $T-t$ dépasse un certain seuil.


next up previous contents
suivant: La programmation orientée équipe monter: Le cas du jeu précédent: Communiquer en destination de   Table des matières
Benjamin DRIEU 2001-10-12