Go_project_AI

Proyecto dedicado para programar un agente inteligente capaz de resolver la busqueda del camino mas corto y en un laberinto utilizando el tablero del clasico juego Go para simular el laberinto.

En el siguiente link se encuentra informacion hacerca del juego Go, junto con las reglas de una partida.

Reglas de Go, por ludoteka.com

Installation

Para instalar Go_project_AI primero será necesario instalar el entorno que nos proporciona [GymGo] con los siguientes comandos:

git clone https://github.com/aigagror/GymGo.git
cd GymGo
pip install -e .

La biblioteca de [GymGo] tambien depende de la la biblioteca sklearn, la que se puede instalar con el siguiente comando:

pip install sklearn

Luego instalaremos el proyecto con los siguientes comandos:

git clone https://github.com/christiangfv/Go_project_AI
cd Go_project_AI
pip install -e .

Environments

Para ejecutar el proyecto es necesario correr el programa mazeGo.py el cual busca del archivo maze.py los laberintos a recorrer, los cuales se pueden editar desde el mismo archivo maze.py. El programa nos mostrará por terminal el algoritmo utilizado para encontrar el camino mas corto, junto con su tiempo de ejecucion y itereaciones realizadas por el algoritmo y el costo del camino encontrado.

Uno de los resultados que se pueden obtener del laberinto 5 es el siguiente:

[GymGo]

Reporte de entrega

Utilizando un tablero de Go, se contruyeron diferentes laberintos los cuales fueron resueltos usando 2 algoritmos de búsqueda, greedy y A-star, ambos son algoritmos de búsqueda bastante parecidos, con la diferencia que A* evaluar el costo de la distancia mas corta del nodo actual al destino y tambien evalua el costo del nodo siguiente con el nodo de inicio.

Por lo mismo ambos suelen llegar a caminos similares, con la diferencia del numero de iteraciones al ejecutarse, Greedy suele tener mas iteraciones, ya que recorre mas camino antes de encontrar el indicado.

Reporte de entrega 2

Descripción

Utilizando un tablero de Go, se desarrolló un agente inteligente que predice a un máximo de n jugadas en el futuro y juega su mejor opción en función de esta, teniendo diferentes estrategias, con diferentes probabilidades de ocurrir a la hora de predecir la jugada:

Ofensiva (24.9%)
Defensiva (24.9%)
Mixta (50%)
Pasar turno (0.2%)

Desarrollo del programa

A la hora de iniciar el programa se le da bienvenida al usuario y se le pide que ingrese los siguientes datos para configurar el ambiente.

¿Qué quieres hacer?
- IA vs IA
- IA vs Human
Elegir el nivel de la maquina (cuantas jugadas podrá ver en el futuro)
- (Actualmente se tiene un maximo de 2 jugadas a futuro, por el nivel de tiempo que demora ver mas, pero este número puede ser cambiado dentro del código).

Obtención del puntaje y algoritmo predictivo

Para la obtención del puntaje el agente evalua en base al área quitada o ganada en el tablero, dependiendo de la estrategía del momento, por ejemplo, si la estrategia es agresiva entonces al agente se le premia más por quitar área al rival, en cambio una estrategia defensiva premia más por ganar territorio dentro del tablero.

El algoritmo de predicción visto arriba, recibe el estado actual del tablero y analiza las jugadas válidas posibles. Una vez obtenidas estas jugadas solo guarda las que le darán el mayor puntaje. Desde este punto si la profundidad es 1, el algoritmo guarda las jugadas de máximo puntaje y escoge al azar entre ellas. Para otro caso cuando el nivel de profundidad es mayor a 1 el algoritmo se comporta como una mezcla entre DFS(Deep First Search) y Greedy analizando las proximas jugadas desde las mejores jugadas obtenidas en el nivel de profundidad anterior, filtrando las más prometedoras(máximo puntaje obtenido en ese nivel) y repitiendo el análisis hasta el último nivel. Al llegar al último nivel, el algoritmo devuelve el valor máximo de puntaje que puede obtenerse dentro de las posibles jugadas, esto se reitera hasta analizar todos los niveles y jugadas, para luego devolver el puntaje máximo de cada uno de ellos, sobreescribiendo el puntaje máximo del nivel anterior si es mayor, en otro caso el puntaje del nivel anterior se mantiene. Al volver nuevamente al primer nivel de profundidad, el algoritmo devuelve una lista con las jugadas que prometen el puntaje más alto de todos los niveles explorados, en el caso de ser más de uno, la elección es aleatoria.

Cadena de Markov

A continuación la representación de la cadena de Markov que describe el funcionamiento del sistema.

En la cadena se encuentran dos estados que presentan incertidumbre, el estado de elección de estrategia para el agente y el siguiente estado, donde el agente intenta predecir la estrategia del oponente. Vale destacar que el estado de predicción de estrategia oponente se llama tantas veces como n-1 niveles de profundidad analice nuestro algoritmo. Esto es ya que para ver las jugadas futuras también es necesario saber cual será la jugada de nuestro oponente, por lo que cada vez que nuestro agente baja un nivel de profundidad, debe predecir una jugada oponente para que vuelva a ser su turno y siga buscando su mejor o mejores jugadas.

recursos

Nos basamos en los siguientes articulos: [Greedy/A*]

Obtuvimos el entorno de este repositorio: [GymGo]

Contributors

Christian Fuentes [GitHub]
Jorge fernandez [GitHub]
Mario Araya F. [GitHub (Entrega 2)

PD: El codigo fue escrito en conjunto utilizando la extension de vscode live-share

Name		Name	Last commit message	Last commit date
Latest commit History 63 Commits
Entrega 1		Entrega 1
Entrega 2		Entrega 2
Entrega_3		Entrega_3
GymGo		GymGo
images		images
.DS_Store		.DS_Store
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Go_project_AI

Content of this document

Installation

Environments

Reporte de entrega

Reporte de entrega 2

Descripción

Desarrollo del programa

Obtención del puntaje y algoritmo predictivo

Cadena de Markov

recursos

Contributors

About

Releases

Packages

Contributors 2

Languages

christiangfv/Go_project_AI

Folders and files

Latest commit

History

Repository files navigation

Go_project_AI

Content of this document

Installation

Environments

Reporte de entrega

Reporte de entrega 2

Descripción

Desarrollo del programa

Obtención del puntaje y algoritmo predictivo

Cadena de Markov

recursos

Contributors

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages