Materiales: [ Cód.: DP2dTests.mlx ] [ PDF ]
Este video plantea un problema de programación dinámica sobre un modelo de 24 estados (laberinto 2D de 6x4 celdas) y cuatro acciones de control (arriba, abajo, izquierda, derecha).
Se plantea el código Matlab del modelo, el coste inmediato, el factor de descuento () y el objetivo de coste a minimizar, y se construye una tabla de transiciones (estado origen)–(acción)–(estado destino), que será usada por los algoritmos posteriores.
La resolución del problema con programación dinámica se aborda en el
vídeo [
Colección completa [VER]:
Anterior Control óptimo (LQR) de procesos lineales con desigualdades matriciales lineales (LMI): teoría y ejemplo Matlab
Siguiente Ejemplo Matlab Programación Dinámica (2): laberinto 2D, iteración de valor, programación lineal.