Predicción lineal óptima: fórmulas basadas en matriz de varianzas-covarianzas

Antonio Sala, UPV

Dificultad: *** ,       Relevancia: PIC,      Duración: 13:55

Materiales:    [ FormulasPredOptimaLineal.pdf]

Resumen:

Este vídeo demuestra que, dadas dos variables aleatorias x, y con medias μx, μy respectivamente, y con matriz de varianzas covarianzas:

E[(yx)] := ( Σy Σyx ΣyxT Σ x )

la mejor predicción lineal viene dada por:

p(x) = ΣyxΣx1(x μ x) + μy

Además, la varianza del error de predicción a posteriori viene dada por:

Σe = Σy ΣyxΣx1Σ yxT

Con ello, se justifica que si Σyx = 0 (variables no correladas) entonces la mejor predicción lineal es la media de y (exactamente igual al caso de no tener información), y no se reduce la incertidumbre, pero que si existe correlación entre x e y, la información permite refinar el estimado “a posteriori” y reducir la incertidumbre sobre y respecto al caso de no tener información: formalmente, Σe < Σy si Σx está acotada y Σyx0.

Nota: que la mejor predicción de y dado x sea, por ejemplo py|x = 2x no implica que la mejor predicción de x dado y sea px|y = 0.5y. El modelo “inverso” en sentido estadístico no coincide en la mayor parte de casos con el modelo inverso algebraico (el ruido hace que se “pierda información”, que aumente la entropía, etc.). Estas ideas son desarrolladas en los vídeos [vcinv1] y [vcinv2].

Colección completa [VER]:

© 2024, A. Sala. Se reservan todos los derechos en materiales cuyo autor pertenezca a UPV.
Para condiciones de uso de material de terceros referenciado, consulte a sus autores.