Materiales: [ CVA1.pdf]
Este vídeo aborda el planteamiento y justificación del significado de los objetivos del problema de regresión denominado “análisis de variables canónicas” (canonical variate analysis, CVA). Básicamente, la motivación es que el coeficiente de correlación monovariable es la covarianza dividido por el producto de desviaciones típicas. Con ello, si se escalan entradas y salidas a varianza unidad (desviación típica unidad), la covarianza coincide con la correlación y con el coeficiente del estimador de mínimos cuadrados de una variable dada la otra.
Este vídeo argumenta de que dichas ideas pueden ser generalizadas al caso multivariable. El CVA plantea un problema de regresión donde tanto la entrada como la salida están preblanqueadas (ortonormalizadas). Aunque el cambio de entradas es irrelevante (se mantiene el error de predicción inalterado), el cambio de variable en salidas sí cambia la ponderación relativa entre los distintos componentes de la salida (mínimos cuadrados ponderados). Si todo está a varianza unidad, el ajuste de todos los componentes de una salida se ha reescalado para que el error de predicción tenga la misma importancia “relativa” (base 1) o “porcentual” en todos los componentes.
La covarianza de unas variables blanqueadas
, en términos de las
variables originales
es ,
que en el caso monovariable es el coeficiente de correlación y, en el caso
multivariable, conforma lo que se denomina una matriz de correlación. El detalle
algorítmico de estas ideas se continua en el vídeo [
Colección completa [VER]:
Anterior Mínimos cuadrados parciales [3]: ideas básicas SIMPLS, comparativa con O-PLS, PCR, discusión, conclusiones.
Siguiente Análisis de variables canónicas: diagonalización de la correlación, interpretación del resultado