Un agente es cualquier cosa capaz
de percibir su medioambiente con
la ayuda de sensores y actuar en
ese medio utilizando actuadores.
Percepción: indicar que el agente puede recibir
entradas en cualquier instante. El comportamiento
del agente viene dado por la función del agente que
proyecta una percepción dada en una acción.(Tabla)
2.2 Buen comportamiento: el
concepto de racionalidad
Medidas de rendimiento
Incluyen los criterios que determinan el éxito en el
comportamiento del agente. Como regla general, es
mejor diseñar medidas de utilidad de acuerdo con lo que
se quiere para el entorno, más que de acuerdo con cómo
se cree que el agente debe comportarse.
Racionalidad
Depende de cuatro factores:
• La medida de rendimiento
que define el criterio de éxito.
• El conocimiento del medio
en el que habita acumulado
por el agente. • Las acciones
que el agente puede llevar a
cabo. • La secuencia de
percepciones del agente
hasta este momento.
Omnisciencia, aprendizaje y autonomía
Un agente omnisciente conoce el resultado de
su acción y actúa de acuerdo con él.(En realidad
la omnisciencia no es posible.) Recopilación de
información : Llevar a cabo acciones con la
intención de modificar percepciones futuras.
2.3 La naturaleza del entorno
Especificación del entorno de trabajo
REAS
(Rendimiento,Entorno,Actuadores,Sensores).
En el diseño el primer paso debe ser especificar
lo más completo posible el entorno de trabajo.
Propiedades de los entornos de trabajo
(Ayudan a determinar el diseño más
adecuado para el agente)
Totalmente observable vs
parcialmente observable
1. Totalmente: Si los sensores
detectan todos los aspectos que son
relevantes en la toma de decisiones.
2. Parcial = debido al ruido y a
sensores pocos exactos o que no
reciben info de parte del sistema
Determinista
vs estocástico
1. Determinista si el siguiente
estado del medio está totalmente
determinado por el estado actual y
la acción ejecutada por el agente.
Episódico vs
secuencial
1. Episódico si la experiencia del
agente se divide en episodios
atómicos, que no depende de las
acciones de los episodios previos.
2. Secuenciales si la desición
presente puede afectar a
decisiones futuras.
Estático vs dinámico
1. Dinamico si el entorno
puede cambiar cuando el
agente está deliberando.
2. Semindinámico si el
entorno no cambia con el
paso del tiempo, pero el
rendimiento del agente
cambia.
Discreto vs continuo
Aplicar al estado del medio, a
la forma en la que se maneja el
tiempo y las percepciones y
acciones del agente. Ajedrez
discreto porque tiene número
finito de estados, Taxista
continuo.
Agente individual vs
multiagente
La distinción clave está en iden-tificar si el
comportamiento de Bestá mejor descrito por la
maximización de una medida de rendimiento cuyo
valor depende del comportamiento de A
2.4 Estructura de los agentes
Programas de los agentes
Reciben las percepciones actuales como
entradas de los sensores y devuelven una
acción a los actuadores . Reciben sólo la
percepción actual como entrada porque no hay
nada más disponible en el entorno.
Tipos
Agentes reactivos simples
Seleccionan las acciones sobre la base de las
percepciones actuales, ignorando el resto de las
percepciones históricas
Agentes reactivos basados en modelos
El agente debe mantener algún tipo de estado interno que dependa
de la historia perci-bida y que de ese modo refleje por lo menos
alguno de los aspectos no observables del estado actual
Agentes basados en objetos
Además de la descripción del estado actual,
el agente necesita algún tipo de información
sobre su meta que describa las situaciones
que son deseables.
Agentes basados en utilidad
Indicar que se prefiere un estado del mundo a
otro es que un estado tiene más utilidad que
otro para el agente. Permite tomar decisiones
racionales en dos tipos de casos en los que las
metas son inadecuadas
Agentes que aprenden
Un agente que aprende se puede dividir en cuatro
componentes conceptuales. Crítica, elemento de aprendizaje,
generador de problemas y elemento de actuación.
Definición Agente racional: En cada
posible secuencia de percepciones, un
agente racional deberá emprender
aquella acción que supuestamente
maximice su medida de rendimiento,
basándose en las evi-dencias
aportadas por la secuencia de
percepciones y en el conocimiento que
el agente mantiene almacenado.