Tip:
Highlight text to annotate it
X
Es un buen momento para dar a conocer algunos términos básicos
que se utilizan comúnmente en la inteligencia artificial para distinguir los diferentes tipos de problemas.
La primera palabra que te enseñaré es totalmente contra parcialmente observable.
Un entorno es llamado completamente observable si lo que su agente puede detectar
en cualquier punto en el tiempo es información suficiente para tomar una decisión óptima.
Así, por ejemplo, en muchos juegos de cartas,
cuando todas las cartas están sobre la mesa, en este instante puede decirse que
la información es suficiente para tomar una decisión óptima.
Esto contrasta con algunos otros entornos donde se necesita que el agente
haga uso de su memoria para tomar la mejor decisión posible.
Por ejemplo, en el juego de póquer, las cartas no siempre están visibles sobre la mesa
y memorizar movimientos anteriores le ayudará a tomar una mejor decisión.
Para comprender plenamente la diferencia, tome en cuenta la interacción de un agente
con el entorno de sus sensores y sus actuadores,
y esta interacción tiene lugar a través de muchos ciclos,
que a menudo se les conoce como ciclo de percepción-acción.
Para muchos entornos, es conveniente asumir
que el entorno tiene algún tipo de estado interno.
Por ejemplo, en un juego de cartas donde las cartas no son visibles sobre la mesa,
el estado pudiera corresponderle a las cartas en su mano.
Un entorno es completamente observable si los sensores siempre pueden ver
todo el estado del entorno.
Es parcialmente observable si los sensores sólo pueden ver una parte del estado,
sin embargo, la memorización de las mediciones anteriores nos da información adicional del estado
que no es posible observar en todo momento.
Así que podemos decir que cualquier juego donde movimientos pasados tienen información acerca de
lo que podría estar en manos de una persona son juegos parcialmente observables,
y requieren un tratamiento diferente.
Muy a menudo los agentes que tienen que ver con entornos parcialmente observables
necesitan poseer memoria interna para comprender
el estado del entorno. Hablaremos extensivamente de éstos
dentro del tema de los modelos ocultos de Markov sobre cómo esta estructura
tiene una memoria interna.
Una segunda terminología para entornos se refiere a si el medio ambiente
es determinista o estocástico.
Un entorno determinista es uno donde el resultado es determinado
únicamente por las acciones del agente.
Así, por ejemplo, en el ajedrez, no hay realmente ninguna aleatoriedad cuando se mueve una pieza.
El efecto de mover una pieza está totalmente predeterminado,
y no importa donde vaya a mover la misma pieza, el resultado es el mismo.
A esto le llamamos determinista.
Los juegos con dados, como el backgammon, son estocásticos.
Aunque el jugador puede mover las piezas de forma determinista,
el resultado de una acción también depende del valor obtenido al lanzar los dados,
el cual no puede predecirse.
Hay una cierto nivel de aleatoriedad involucrado en el resultado de los dados
y por lo tanto, le llamamos estocástico.
Permítanme hablar de entornos discretos y continuos.
Un entorno discreto es aquel en el que las opciones de acción son finitas
y hay un número finito de elementos a detectar.
Así, por ejemplo, en el ajedrez, una vez más, hay un número finito de posiciones
y un número finito de cosas que usted puede hacer.
Que es diferente a un entorno continuo
donde el espacio de acciones posibles o cosas que se poden detectar tiende al infinito.
Así, por ejemplo, si usted lanza dardos, hay infinidad de maneras de apuntar
y acelerar los dardos.
Por último, debemos distinguir los entornos benignos de los competitivos.
En entornos benignos, el medio ambiente puede ser al azar.
Podría ser estocástica, pero no tiene un objetivo propio
que pudiera estar en conflicto con el objetivo del agente.
Así, por ejemplo, el clima es benigno.
Puede estar determinado por el azar. Podría afectar el resultado de sus acciones.
Pero en realidad no está en su contra.
Esto, en contraste con los entornos competitivos, que ocurren en muchos juegos, como el Ajedrez
donde su oponente intentará vencerlo.
Resulta que es mucho más difícil encontrar buenas acciones en entornos competitivos
donde el oponente le observa activamente, tratando de contraatacar cada una de sus acciones.
en comparación con un entorno benigno, donde el medio ambiente sólo puede ser estocástico
pero no está realmente interesado en hacer su vida mas difícil.
Ahora, veamos si pudo entender adecuadamente el significado de cada término
con ayuda del siguiente ejercicio.
Aquí están de nuevo estos 4 conceptos: Parcialmente observable vs. totalmente observable
estocástico vs. determinista, continuo vs. discreto,
competitivo vs. benigno.
Ahora, le preguntaré sobre el juego de Damas
Marque uno o todos los atributos que se aplican.
Si usted piensa que este juego es parcialmente observable, marque este círculo.
De lo contrario, no lo marque.
Si usted piensa que es estocástico, marque éste,
¿Continuo? Marque este ¿Competitivo? Marque este.
Si usted no sabe nada acerca del juego de damas, puede buscarlo en Google.
De esta forma, obtendrá un poco más de información sobre el juego.