Materiales: [ PLS.pdf]
Este vídeo discute el detalle de lo que se denominan mínimos cuadrados parciales ortonormalizados, donde la información de entrada a un modelo ha sufrido un cambio de variable de modo que su matriz de varianzas-covarianzas sea la identidad (ortonormalización, preblanqueado: si , siendo la matriz de datos, entonces es la variable blanqueada buscada). En principio, ello no altera la capacidad de predecir : si el estimador de mínimos cuadrados de es , con un cambio de variable , el estimador será , siendo , con el mismo resultado. Por tanto existe libertad total en elegir las unidades de , en principio, y se escoge en PLS ortonormalizado una entrada preblanqueada.
Con estas entradas ortonormalizadas, el SVD de la matriz de covarianza
propone unas
direcciones de
dadas por
que se asocian a las “covarianzas principales”, en la diagonal de
. La mejor
predicción lineal de
será :
unos componentes monovariables sin interacción (sin correlación cruzada)
, que
cada uno contribuye a reducir la variabilidad total del error de predicción en
. La
propuesta PLS para obtener modelos “simplificados” es despreciar aquellos componentes
con
peque
Al obtenerse direcciones en entrada y salida a partir del SVD de la covarianza, las direcciones PLS no coinciden con las del PCA (componentes principales) ni de la entrada ni de la salida, pensando en unidades originales de las mismas.
Existen otras interpretaciones del PLS (SIMPLS,...), discutidas en el vídeo [
Colección completa [VER]:
Anterior Mínimos cuadrados parciales [1]: Introducción y objetivos de la metodología PLS
Siguiente Mínimos cuadrados parciales [3]: ideas básicas SIMPLS, comparativa con O-PLS, PCR, discusión, conclusiones.