next up previous contents
suivant: Le cas du jeu monter: La coop�ration comme base précédent: Adopter une attitude   Table des matières

Tol�rer les pannes

La d�tection des pannes est un des �l�ment les plus cruciaux pour chacun des agents lorsqu'il s'agit de manipuler son environnement. La d�tection des pannes et le contr�le des performances d'un agent permet d'�viter les probl�mes de dead-lock (boucle infinie bas�e sur l'attente d'une condition non r�alisable) et d'�viter les strat�gies non optimales. Un contr�le r�gulier et relativement simple de l'environnement suffit � r�soudre ces probl�mes. Mais dans la probl�matique des syst�mes multi-agents, la d�tection et le contr�le des pannes repose sur un m�canisme plus complexe. Une panne peut �tre de plusieurs natures: un agent oublie d'indiquer aux autres qu'il a termin� une action dont les autres ont besoin, un agent oublie d'ex�cuter une action dont les autres agents attendent le r�sultat, un agent oublie de demander � un autre agent d'ex�cuter une action dont il attend le r�sultat, un agent r�ussit de mani�re inattendue une action consid�r�e comme impossible mais les autres ne prennent pas en consid�ration cette r�ussite et se comportent de mani�re non optimale, un agent d�cide d'effectuer une action qu'un autre agent entame au m�me moment mais tous les deux renoncent � la continuer croyant que l'autre s'en chargera, etc. Milind TAMBE d�crit dans [#!tambe-1997b!#] quelques unes de ces probl�matiques appliqu�es � la simulation militaire.

La d�tection des pannes est un probl�me qu'on peut en partie r�soudre par une analyse constante du syst�me et par la mesure de ses performances (un agent du syst�me peut �tre d�di� � la d�tection des pannes). En revanche, la pr�diction des pannes est structurellement difficile. En effet, une panne est par nature un �chec non pr�dictible. Ainsi, un syst�me multi-agents aura tout int�r�t � �tre muni d'un syst�me performant de r�cup�ration d'�checs et de pannes. Notamment, la granularit� du traitement des pannes est un param�tre � prendre en compte: selon la gravit� de la panne, un agent tente de la r�soudre seul ou il d�cide que le syst�me tout entier est concern� et doit �tre mis au courant de la nature de la panne et des rem�des � y apporter. D'une mani�re g�n�rale et � condition que le co�t de la communication soit inf�rieur au b�n�fice, lorsqu'un agent du syst�me est incapable d'ex�cuter sa part du plan global, il est de sa responsabilit� d'avertir le reste du syst�me de la nature de l'�chec rencontr� et ainsi d'initier un processus de recouvrement concert�. Si le co�t de l'annonce d'un �chec est important, les agents d'un syst�me doivent prendre eux-m�mes en charge la surveillance des actions des membres de leur syst�me.

Le recouvrement implique � la fois une r��valuation totale ou partielle des plans engag�s, mais aussi une r�ponse, soit par le contournement du probl�me (adoption d'une solution annexe), soit par une nouvelle tentative d'ex�cution du plan. On trouve dans [#!tambe-1997b!#] un exemple de m�canisme de recouvrement de pannes: Milind TAMBE d�finit des « op�rateurs » d'�quipe, qui sont des actions jointes dans lesquelles chacun des agents du syst�me joue un r�le pr�cis (par exemple, l'op�rateur engager opposant trouve sa place dans le cas d'une simulation de combat a�rien). Chacun de ces op�rateurs est r�guli�rement �valu�: chaque agent engag� dans un op�rateur d�termine gr�ce � une heuristique critique s'il est possible de l'achever. Si ce n'est pas le cas et que la raison est l'�chec d'un des r�les (typiquement dans le cas de la simulation de combat a�rien, un h�licopt�re abattu), alors l'agent �valuateur prend en charge ce r�le s'il en est capable et communique ce changement. S'il en est incapable, il attend qu'un autre agent le fasse pour lui (et potentiellement, d�truit l'op�rateur si aucun n'en est capable).

Dans [#!parker-1998!#], Lynne E. PARKER d�finit la m�thode ALLIANCE, une m�thode alternative. Chacun de ses agents passe en revue les comportements possibles et estime le d�sir qu'il a d'adopter chaque comportement (en se basant sur les informations re�ues de ses r�cepteurs, de la communication avec les autres agents, des aspects inhibiteurs de son propre comportement ainsi que de ses motivations et buts). Le d�sir de chacun de ces comportements possibles augmente en fonction du temps et lorsque ce d�sir d�passe un certain seuil, le comportement est activ�. Dans le cas o� un agent $A$ est en charge d'un comportement (ce qui est d�termin� par la communication ou par l'observation de son comportement), le d�sir de l'agent $B$ de voir ce comportement activ� cro�t beaucoup plus lentement. Ainsi, si l'agent $A$ est incapable d'accomplir le comportement s�lectionn�, l'agent $B$ finira par activer ce comportement. Ce m�canisme est appel� l'impatience et permet une r�solution �mergente de pannes dans un syst�me multi-agents.


next up previous contents
suivant: Le cas du jeu monter: La coop�ration comme base précédent: Adopter une attitude   Table des matières
Benjamin DRIEU 2001-10-12