Predicción lineal óptima: fórmulas basadas en matriz de varianzas-covarianzas

Antonio Sala, UPV

Dificultad: *** ,       Relevancia: PIC,      Duración: 13:55

Materiales:    [ FormulasPredOptimaLineal.pdf]

*Accede pulsando el enlace a la [ Colección completa] de vídeos docentes y materiales asociados.

Resumen:

Este vídeo demuestra que, dadas dos variables aleatorias x, y con medias μx, μy respectivamente, y con matriz de varianzas covarianzas:

E[(yx)] := ( Σy Σyx ΣyxT Σ x )

la mejor predicción lineal viene dada por:

p(x) = ΣyxΣx1(x μ x) + μy

Además, la varianza del error de predicción a posteriori viene dada por:

Σe = Σy ΣyxΣx1Σ yxT

Con ello, se justifica que si Σyx = 0 (variables no correladas) entonces la mejor predicción lineal es la media de y (exactamente igual al caso de no tener información), y no se reduce la incertidumbre, pero que si existe correlación entre x e y, la información permite refinar el estimado “a posteriori” y reducir la incertidumbre sobre y respecto al caso de no tener información: formalmente, Σe < Σy si Σx está acotada y Σyx0.

Nota: que la mejor predicción de y dado x sea, por ejemplo py|x = 2x no implica que la mejor predicción de x dado y sea px|y = 0.5y. El modelo “inverso” en sentido estadístico no coincide en la mayor parte de casos con el modelo inverso algebraico (el ruido hace que se “pierda información”, que aumente la entropía, etc.). Estas ideas son desarrolladas en los vídeos [vcinv1] y [vcinv2].

© 2024, A. Sala. Se reservan todos los derechos en los materiales cuyo autor pertenezca a la UPV.
Para condiciones de uso de material de terceros referenciado, consulte a sus autores.