Un agent interagissant avec un monde incomplètement connu doit
être capable de raisonner sur les effets de ses actions et
être capable d'obtenir des informations supplémentaires sur ce
monde. Cette problématique est particulièrement sensible dans le cas
d'un environnement dynamique. Malheureusement, les récepteurs d'un
agent (robotique notamment) sont très souvent imprécis et ne couvrent
qu'une fraction du monde. Dans l'exemple de la RoboCup, les robots
footballeurs simulés ne possèdent qu'une vision partielle, bruitée (la
précision de leur vue est faible) et conique (tout comme pour un oeil
réel) du monde.
Pour résoudre ce problème, une des solutions possibles est la mise en
place d'un mécanisme de quantification de la validité de croyances
(connaissances non vérifiées): l'agent décide
que les informations sensitives reçues ne sont pas sûres et convergera
vers une valeur précise et sûre au fur et à mesure que des informations
sensitives confirment sa mesure initiale. Cette solution règle en partie le
problème de l'imprécision des récepteurs.
Le problème de la perception partielle du monde est résolu par la mise au point d'hypothèses sur l'état de ce dernier. Lorsqu'un objet sort du champ de perception de l'agent, ce dernier émet une hypothèse sur sa position ainsi que sa nature, note la date d'émission de l'hypothèse et lui affecte une probabilité de vérité. Au fur et à mesure que le temps passe, la probabilité baisse graduellement jusqu'à atteindre un seuil en dessous duquel l'agent supprime cet objet de sa mémoire. C'est le cas des informations potentiellement changeantes comme la position de la balle sur le terrain dans le cas de la RoboCup. Les propriétés invariantes, telles que la taille d'un terrain de football dans l'exemple de la RoboCup, n'ont bien évidemment pas besoin d'un tel mécanisme de contrôle. De plus, une clause d'invalidation peut permettre de considérer une information comme obsolète et de supprimer l'objet de sa mémoire. C'est par exemple le cas de la trajectoire estimée d'un mobile sorti du champ de vision: si l'agent calcule que la trajectoire estimée de ce mobile devrait le faire réapparaître dans son champ de vision mais que ce n'est pas le cas, il en conclut donc que la trajectoire a été modifiée et que cette information n'est plus consistante. On trouve un exemple de ce mécanisme dans [#!stone-1999!#].