Regresión por componentes principales (PCR, Princ. Component Regression)

Antonio Sala, UPV

Dificultad: **** ,       Relevancia: PIC,      Duración: 17:26

Materiales:    [ PCR.pdf]

Resumen:

Este vídeo describe la metodología de regresión por componentes principales (principal component regression, PCR, en literatura en lengua inglesa). Básicamente, se trata de utilizar para un modelo de regresión (estimar y a partir de x, siendo ambos vectores) sólo los componentes de x con una varianza “suficientemente alta”. Estos componentes tienen unos parámetros estimados con una exactitud bastante razonable (la desviación típica de los parámetros estimados es inversamente proporcional a la varianza de la información –excitación–), y si desechamos los componentes con varianza baja entonces evitamos problemas de un estimado mal condicionado y sensible a ruido (que requerirían muchas más muestras). El PCR se puede usar como técnica de “regularización” (eliminar componentes de varianza muy pequen~a, si se asume que son puro ruido), o bien como técnica de simplificación de modelos (escoger un número limitado de componentes de x con gran variabilidad y que expliquen suficientemente bien y).

Para la segunda de las tareas, no obstante, otras metodologías (PLS vídeo [pls1], CVA vídeo [cva1]) pueden estar más indicadas, dado que los componentes con más “varianza” de x no tienen por qué ser los que tengan más “covarianza” o “correlación” con la variable y a predecir.

Ejemplos Matlab de uso de PCR aquí explicado aparecen en los vídeos [impulidPCR] (caso monovariable 1 salida, estimar respuesta impulsional de un sistema discreto lineal) y [pcrm] (caso multivariable, estimar 2 salidas a partir de 4 entradas).

Colección completa [VER]:

© 2024, A. Sala. Se reservan todos los derechos en materiales cuyo autor pertenezca a UPV.
Para condiciones de uso de material de terceros referenciado, consulte a sus autores.