La d�tection des pannes est un des �l�ment les plus cruciaux pour
chacun des agents lorsqu'il s'agit de manipuler son environnement. La
d�tection des pannes et le contr�le des performances d'un agent permet
d'�viter les probl�mes de dead-lock (boucle infinie bas�e
sur l'attente d'une condition non r�alisable) et d'�viter les
strat�gies non optimales. Un contr�le r�gulier et
relativement simple de l'environnement suffit � r�soudre ces
probl�mes. Mais dans la probl�matique des syst�mes
multi-agents, la d�tection et le contr�le des pannes repose sur un
m�canisme plus complexe. Une panne peut �tre de plusieurs natures: un
agent oublie d'indiquer aux autres qu'il a termin� une action dont les
autres ont besoin, un agent oublie d'ex�cuter une action dont les
autres agents attendent le r�sultat, un agent oublie de demander � un
autre agent d'ex�cuter une action dont il attend le r�sultat, un agent
r�ussit de mani�re inattendue une action consid�r�e comme impossible
mais les autres ne prennent pas en consid�ration cette r�ussite et se
comportent de mani�re non optimale, un agent d�cide d'effectuer une
action qu'un autre agent entame au m�me moment mais tous les deux
renoncent � la continuer croyant que l'autre s'en chargera, etc.
Milind TAMBE d�crit dans [#!tambe-1997b!#] quelques
unes de ces probl�matiques appliqu�es � la simulation militaire.
La d�tection des pannes est un probl�me qu'on peut en partie r�soudre
par une analyse constante du syst�me et par la mesure de ses
performances (un agent du syst�me peut �tre d�di� � la d�tection des
pannes). En revanche, la pr�diction des pannes est structurellement
difficile. En effet, une panne est par nature un �chec non pr�dictible.
Ainsi, un syst�me multi-agents aura tout int�r�t � �tre muni d'un
syst�me performant de r�cup�ration d'�checs et de pannes. Notamment,
la granularit� du traitement des pannes est un param�tre � prendre en
compte: selon la gravit� de la panne, un agent tente de la
r�soudre seul ou il d�cide que le syst�me tout entier est
concern� et doit �tre
mis au courant de la nature de la panne et des rem�des � y apporter.
D'une mani�re g�n�rale et � condition que le co�t de la communication
soit inf�rieur au b�n�fice, lorsqu'un agent du syst�me est incapable
d'ex�cuter sa part du plan global, il est de sa responsabilit�
d'avertir le reste du syst�me de la nature de l'�chec rencontr� et
ainsi d'initier un processus de recouvrement concert�. Si le co�t de
l'annonce d'un �chec est important, les agents d'un syst�me doivent
prendre eux-m�mes en charge la surveillance des actions des membres de
leur syst�me.
Le recouvrement implique � la fois une r��valuation totale ou
partielle des plans engag�s, mais aussi une r�ponse, soit par le
contournement du probl�me (adoption d'une solution annexe), soit par
une nouvelle tentative d'ex�cution du plan. On trouve dans
[#!tambe-1997b!#] un exemple de m�canisme de recouvrement de pannes:
Milind TAMBE d�finit des « op�rateurs » d'�quipe, qui
sont des actions jointes dans lesquelles chacun des agents du syst�me
joue un r�le pr�cis (par exemple, l'op�rateur engager opposant
trouve sa place dans le cas d'une simulation de combat a�rien).
Chacun de ces op�rateurs est r�guli�rement �valu�: chaque agent engag�
dans un op�rateur d�termine gr�ce � une heuristique critique s'il est
possible de l'achever. Si ce n'est pas le cas et que la raison est
l'�chec d'un des r�les (typiquement dans le cas de la simulation de
combat a�rien, un h�licopt�re abattu), alors l'agent �valuateur prend
en charge ce r�le s'il en est capable et communique ce changement.
S'il en est incapable, il attend qu'un autre agent le fasse pour lui
(et potentiellement, d�truit l'op�rateur si aucun n'en est capable).
Dans [#!parker-1998!#], Lynne E. PARKER d�finit la m�thode
ALLIANCE, une m�thode alternative. Chacun de ses agents passe
en revue les comportements possibles et estime le d�sir qu'il
a d'adopter chaque comportement (en se basant sur les informations re�ues de ses
r�cepteurs, de la communication avec les autres agents, des
aspects inhibiteurs de son propre comportement ainsi que de ses
motivations et buts). Le d�sir de chacun de ces comportements
possibles augmente en fonction du temps et lorsque ce d�sir d�passe un
certain seuil, le comportement est activ�. Dans le cas o� un agent
est en charge d'un comportement (ce qui est d�termin� par la
communication ou par l'observation de son comportement), le d�sir de
l'agent
de voir ce comportement activ� cro�t beaucoup plus
lentement. Ainsi, si l'agent
est incapable d'accomplir le
comportement s�lectionn�, l'agent
finira par activer ce
comportement. Ce m�canisme est appel� l'impatience et permet une
r�solution �mergente de pannes dans un syst�me multi-agents.