Biplots robustos
- Hernandez Gonzalez, Sergio
- Purificación Galindo Villardón Director
Defence university: Universidad de Salamanca
Fecha de defensa: 12 May 2005
- Juan Antonio Castro Posada Chair
- M. Sol Díaz Leno Secretary
- José María Fuentes Blanco Committee member
- Purificación Vicente Galindo Committee member
- Isidro Rafael Amaro Martín Committee member
Type: Thesis
Abstract
Generalmente se presta atención a los posibles sesgos implícitos en una investigación, ya que es bien sabido que los sesgos comprometen la validez externa de los estudios; sin embargo, a pesar de que los sesgos se mantengan bajo control, y los datos sean de verdad representativos, los resultados del tratamiento estadístico pueden estar distorsionados por muchas razones, Esto no sucede en los análisis uni y bivariantes, sino también en el análisis multivariante, y especialmente en las técnicas factoriales. Este ha sido el punto de partida de nuestra investigación, ya que nuestro objetivo está centrado en los análisis Biplot propuestos por GABRIEL en 1971 y la pregunta que motivó esta investigación es: ¿Cómo afecta la presencia de datos discordantes a la estructura factorial asociada a un análisis Biplot? El objetivo principal de los Biplot, es proporcionar la reproducción gráfica aproximada de los datos, con una calidad en la representación que permita, gracias a sus propiedades geométricas, captar visualmente las interrelaciones entre conjuntos de individuos y variables, además de las relaciones entre los elementos de cada uno de esos conjuntos. Su fundamentación teórica se basa en la aproximación de una cierta matriz de datos de rango , por una de bajo rango, a través de la Descomposición en Valores Singulares, para luego hacer una factorización en marcadores filas y columnas. Los gráficos Biplot están basados en productos escalares y se interpretan en términos de proyecciones, ángulos y distancias al centro de gravedad y/o entre los marcadores, por tanto es de esperar un efecto distorsionante de la estructura de covariación, motivado por la presencia de datos discordantes (conocidos en la mayor parte de la literatura como outliers) con el patrón general, los cuales pueden deberse a un error de procedimiento, a una observación que ocurre como consecuencia de un acontecimiento extraordinario, como