Análisis de variables canónicas (canonical variate analysis, CVA): planteamiento y justificación

Antonio Sala, UPV

Dificultad: *** ,       Relevancia: PIC,      Duración: 11:50

Materiales:    [ CVA1.pdf]

Resumen:

Este vídeo aborda el planteamiento y justificación del significado de los objetivos del problema de regresión denominado “análisis de variables canónicas” (canonical variate analysis, CVA). Básicamente, la motivación es que el coeficiente de correlación monovariable es la covarianza dividido por el producto de desviaciones típicas. Con ello, si se escalan entradas y salidas a varianza unidad (desviación típica unidad), la covarianza coincide con la correlación y con el coeficiente del estimador de mínimos cuadrados de una variable dada la otra.

Este vídeo argumenta de que dichas ideas pueden ser generalizadas al caso multivariable. El CVA plantea un problema de regresión donde tanto la entrada como la salida están preblanqueadas (ortonormalizadas). Aunque el cambio de entradas es irrelevante (se mantiene el error de predicción inalterado), el cambio de variable en salidas sí cambia la ponderación relativa entre los distintos componentes de la salida (mínimos cuadrados ponderados). Si todo está a varianza unidad, el ajuste de todos los componentes de una salida se ha reescalado para que el error de predicción tenga la misma importancia “relativa” (base 1) o “porcentual” en todos los componentes.

La covarianza de unas variables blanqueadas Σy~x~, en términos de las variables originales (x,y) es Σy12Σ yxΣx12, que en el caso monovariable es el coeficiente de correlación y, en el caso multivariable, conforma lo que se denomina una matriz de correlación. El detalle algorítmico de estas ideas se continua en el vídeo [cva2].

Colección completa [VER]:

© 2024, A. Sala. Se reservan todos los derechos en materiales cuyo autor pertenezca a UPV.
Para condiciones de uso de material de terceros referenciado, consulte a sus autores.