Materiales: [ Cód.: DP2dTests.mlx ] [ PDF ]
Este video resuelve un problema de programación dinámica sobre un modelo de
24 estados (laberinto 2D de 6x4 celdas) y cuatro acciones de control (arriba,
abajo, izquierda, derecha). El detalle del modelado y planteamiento del
problema aparece en el vídeo [
En este vídeo se presenta código para resolver de forma exacta el problema (calcular la función de valor óptima en los 24 estados) por:
Iteración de Valor (Value Iteration). Primero se esboza con ”tres bucles anidados” pero el código final se presenta vectorizado (paralelizado) para mayor eficiencia.
Programación Lineal. Se observa que el tiempo de cómputo es mayor, al menos con la implementación y versión de Matlab usadas aquí.
Colección completa [VER]:
Anterior Ejemplo Matlab Programación Dinámica (1): laberinto 2D, modelado y planteamiento del problema.
Siguiente Ejemplo Matlab Programación Dinámica (3): laberinto 2D, iteración de valor (policy iteration)