Análisis de datos socio-económicos de una serie de paises (1): preprocesado

Antonio Sala, UPV

Dificultad: ** ,       Relevancia: PIC,      Duración: 08:54

Materiales:    [ Cód.: paises123.zip ] [ PDF ]

Resumen:

Este es el primer vídeo de una serie de tres que abordan el caso de estudio de una serie de datos socio-económicos de 96 países, tomados de http://halweb.uc3m.es/esp/Personal/personas/agrane/libro/100PEM.htm, con permiso de la autora. Los siguientes son el [paises2] y [paises3] que abordan, propiamente, el análisis PCA; en este vídeo se detalla únicamente el preprocesado de los datos.

Las etapas del preprocesado son: lectura con el comando textscan, análisis de la asimetría de los histogramas (skewness) y transformación logarítmica para simetrizarlos; por último, se normalizan a media cero y desviación típica unidad, dado que los datos tienen orígenes y unidades muy diferentes.

El vídeo finaliza calculando la matriz de varianzas-covarianzas de los datos estandarizados (cov) que contiene las correlaciones dos a dos fuera de la diagonal. Los valores y vectores propios de dicha matriz darán lugar al cambio de variable que transforma a componentes principales ortogonales (interpretación geométrica), no correlados (interpretación estadística).

Colección completa [VER]:

© 2024, A. Sala. Se reservan todos los derechos en materiales cuyo autor pertenezca a UPV.
Para condiciones de uso de material de terceros referenciado, consulte a sus autores.