Análisis de Componentes Principales (parte 2: series de datos, teoría)

Antonio Sala, UPV

Dificultad: *** ,       Relevancia: PIC,      Duración: 18:59

Materiales:    [ PCA.pdf]

Resumen:

Los “componentes principales” están relacionados con los valores y vectores propios de las matrices de varianzas-covarianzas (diagonalización). De hecho, la idea se utiliza para “tirar el dado” de distribuciones de probabilidad multivariable con correlación entre ellas dada: podría ser aconsejable visualizar de forma previa a este vídeo el vídeo [dadonorm2d] donde se introduce dicha idea. El análisis de componentes principales está motivado por el hecho de dar una interpretación similar a las matrices de varianzas-covarianzas obtenidas de datos experimentales.

En este vídeo se discuten:

– Formación de la matriz de datos

– Descomposición SVD de la matriz de datos. Relación con matriz de varianzas covarianzas.

– Definición de los componentes principales como cambio ortogonal de coordenadas. En esas nuevas coordenadas, los componentes principales no tienen correlación entre sí.

– La desviación típica de los componentes principales clasifica en “perturbaciones (causas de variablilidad)” las de varianza alta, y en “modelos” las combinaciones lineales asociadas a varianzas bajas.

– Se esboza la utilidad para clasificación

– Cuestiones relacionadas con escalados y normalización de los datos previa al cálculo de los componentes principales en aplicaciones prácticas.

Colección completa [VER]:

© 2024, A. Sala. Se reservan todos los derechos en materiales cuyo autor pertenezca a UPV.
Para condiciones de uso de material de terceros referenciado, consulte a sus autores.