Prediccin lineal ptima: frmulas basadas en matriz de varianzas-covarianzas

Predicción lineal óptima: fórmulas basadas en matriz de varianzas-covarianzas

Antonio Sala, UPV

Diﬁcultad: *** , Relevancia:

, Duración: 13:55

Materiales: [ FormulasPredOptimaLineal.pdf]

*Accede pulsando el enlace a la [ Colección completa] de vídeos docentes y materiales asociados.

Resumen:

Este vídeo demuestra que, dadas dos variables aleatorias $x$ , $y$ con medias $μ_{x}$ , $μ_{y}$ respectivamente, y con matriz de varianzas covarianzas:

E [(y x)] : = (\begin{matrix} Σ_{y} & Σ_{y} x \\ Σ_{y x}^{T} & Σ_{x} \end{matrix})

la mejor predicción lineal viene dada por:

p (x) = Σ_{y x} Σ_{x}^{- 1} (x - μ_{x}) + μ_{y}

Además, la varianza del error de predicción a posteriori viene dada por:

Σ_{e} = Σ_{y} - Σ_{y x} Σ_{x}^{- 1} Σ_{y x}^{T}

Con ello, se justiﬁca que si $Σ_{y x} = 0$ (variables no correladas) entonces la mejor predicción lineal es la media de $y$ (exactamente igual al caso de no tener información), y no se reduce la incertidumbre, pero que si existe correlación entre $x$ e $y$ , la información permite reﬁnar el estimado “a posteriori” y reducir la incertidumbre sobre $y$ respecto al caso de no tener información: formalmente, $Σ_{e} < Σ_{y}$ si $Σ_{x}$ está acotada y $Σ_{y x} \neq 0$ .

Nota: que la mejor predicción de $y$ dado $x$ sea, por ejemplo $p_{y | x} = 2 x$ no implica que la mejor predicción de $x$ dado $y$ sea $p_{x | y} = 0.5 y$ . El modelo “inverso” en sentido estadístico no coincide en la mayor parte de casos con el modelo inverso algebraico (el ruido hace que se “pierda información”, que aumente la entropía, etc.). Estas ideas son desarrolladas en los vídeos [vcinv1] y [vcinv2].

© 2024, A. Sala. Se reservan todos los derechos en los materiales cuyo autor pertenezca a la UPV.
Para condiciones de uso de material de terceros referenciado, consulte a sus autores.