Ejemplo Matlab Programacin Dinmica (2): laberinto 2D, iteracin de valor, programacin lineal.

Ejemplo Matlab Programación Dinámica (2): laberinto 2D, iteración de valor, programación lineal.

Antonio Sala, UPV

Diﬁcultad: *** , Relevancia:

, Duración: 13:29

Materiales: [ Cód.: DP2dTests.mlx ] [ PDF ]

Resumen:

Este video resuelve un problema de programación dinámica sobre un modelo de 24 estados (laberinto 2D de 6x4 celdas) y cuatro acciones de control (arriba, abajo, izquierda, derecha). El detalle del modelado y planteamiento del problema aparece en el vídeo [dp2d1], cuya visualización previa podría ser aconsejable.

En este vídeo se presenta código para resolver de forma exacta el problema (calcular la función de valor óptima en los 24 estados) por:

Iteración de Valor (Value Iteration). Primero se esboza con ”tres bucles anidados” pero el código ﬁnal se presenta vectorizado (paralelizado) para mayor eﬁciencia.
Programación Lineal. Se observa que el tiempo de cómputo es mayor, al menos con la implementación y versión de Matlab usadas aquí.

Colección completa [VER]:

Anterior Ejemplo Matlab Programación Dinámica (1): laberinto 2D, modelado y planteamiento del problema.
Siguiente Ejemplo Matlab Programación Dinámica (3): laberinto 2D, iteración de valor (policy iteration)

© 2024, A. Sala. Se reservan todos los derechos en materiales cuyo autor pertenezca a UPV.
Para condiciones de uso de material de terceros referenciado, consulte a sus autores.