Está en la página 1de 7

Reporte de investigación aplicación de Bootstrap en análisis de

componentes principales y representación biplot

Índice
Introducción (Johaly)
Marco teórico
1. Bootstrap (Evelyn)
2. Análisis de componentes principales (Johaly)
3. Biplot (Evelyn)
4. Análisis de Procrustes (Sammy)
El análisis de Procrustes también conocido como superposición de Procrustes o ajuste de
Procrustes es la serie de métodos estadísticos que aplican la teoría de grupos al análisis de
conjuntos de datos, para poder compararlos y realizar inferencias de dichas comparaciones.
El objetivo del AP es determinar si representaciones alternativas de los mismos n puntos
exhiben diferentes relaciones internas entre ellos.[ CITATION Tor12 \l 2058 ]

El nombre de Procrustes proviene de la mitología griega: Procrusto ofrecía alojamiento a


los viajeros solitarios quienes se convertían en sus víctimas, ya que los ataba a las cuatro
esquinas de la cama y si la víctima era más grande que el tamaño de su cama les cortaba las
partes que sobresalían de ésta, mientras que si la persona era más chica que el tamaño de la
cama los estiraba hasta ajustarse al tamaño de ésta. [ CITATION Zel04 \l 2058 ]

La teoría del análisis de Procrustes es un conjunto de herramientas matemáticas de mínimos


cuadrados para estimar directamente y realizar transformaciones de semejanza simultáneas
entre los puntos de coordenadas de un modelo matricial hasta su ajuste máximo. Se evita la
definición y la solución de los sistemas clásicos de ecuaciones normales. No se requiere
información geométrica previa entre los diferentes objetos componentes del modelo. En
este enfoque, los parámetros de transformación se calculan de una manera directa y
eficiente, basándose en un conjunto seleccionado de puntos de coordenadas
correspondientes. [ CITATION Tor12 \l 2058 ]
A continuación, se visualiza una representación gráfica de los tres pasos del Análisis de
Procrustes (el caso particular del ajuste por cuadrados mínimos) usando dos triángulos. Las
coordenadas resultantes después del análisis son denominadas coordenadas de forma
Procrustes.

Ilustración 1. Representación del Análisis de Procrustes


Existen operaciones que transforman un ordenamiento sin alterar las relaciones internas
entre los puntos representados.[ CITATION Tor12 \l 2058 ]

 Se debe desplazar todos los puntos a una distancia fija, a lo largo de una
determinada dirección. Esto constituye una traslación de la configuración.
 Una dilatación o una contracción fija de todos los puntos a lo largo de las
direcciones que unen a cada uno de ellos con el centroide de la configuración. Se
trata de un cambio de escala uniforme.
 Se debe desplazar todos los puntos usando un ángulo fijo alrededor de un eje. Esto
se realiza a través de una rotación/reflexión de la configuración.

El AP busca determinar entonces qué combinación de un cambio de escala y de


movimientos rígidos (la rotación/reflexión y la traslación lo son) permite superponer de
manera óptima ambas configuraciones, dejando a la vista las verdaderas diferencias entre
ambas representaciones. Este análisis resulta particularmente apropiado para estudiar las
diferencias de forma entre dos estructuras representadas por configuraciones de landmarks
y existen diferentes versiones del método.[ CITATION Tor12 \l 2058 ]

Tipos de análisis de Procrustes:


 Método de Procrustes Ortogonal: Schoenemann (1966).
 Método de Procrustes Ortogonal Extendido: Schoenemann and Carroll (1970).
 Método ortogonal generalizado de Procrustes (para más de dos matrices).
 Método de análisis de Procrustes ponderado que puede ser de tipo ponderado en las
columnas o a través de las columnas de una configuración matricial.

Base matemática

Los tres pasos de transformación Procrustes (escalamiento, rotación y traslación), en


términos matriciales, pueden ser expresados del siguiente modo:

Y k =p k C k H k + T k

Donde Y k representa la transformación Procrustes, pk el factor de escala, H k la matriz


ortogonal de rotación de dimensión pxp y T k la matriz traslación de dimensión nxp. Estos
tres últimos elementos son encontrados minimizando la Suma de Cuadrados Residuales
(SCR).

Considerando los puntos p(ij ) donde "i" = 1,2, 3, ...,"n" y "j" = 1,2,3, ...,"m" los cuales
proporcionan la ubicación en coordenadas cartesianas de los puntos mn en un espacio "p"-
dimensional y en el que "m" corresponde al número de configuraciones o escalas de cada
"n" puntos "p"-dimensionales. Así se pueden trasladar, rotar, reflejar o escalar las "m"
configuraciones para minimizar el criterio de máximo ajuste:

m n
SCR=∑ ∑ ∆2 ( p(i)
j G i)
i=1 j=1

Donde ∆ 2 (p(i) (i )
j G i) es la distancia Euclídea entre el punto p j y el centroide de los K puntos

análogos p(ij ) , denominado G i. En otras palabras, se minimizan las distancias con respecto a

un centroide G i elegido de manera consensuada, de los "m" puntos p(ij ). El caso especial de
"m" = 2 es el llamado análisis de Procrustes clásico.[CITATION Lóp15 \l 2058 ]

Aplicaciones
Las aplicaciones actuales de los métodos de Procrustes se realizan en morfometría para
establecer por ejemplo parecidos en los rostros de personas. También se utiliza en química
analítica, análisis sensoriales, entre otros.

Materiales y métodos (Sammy)


Tipo de estudio
La presente investigación se basa en un estudio de tipo observacional y descriptivo. El
análisis estadístico, es multivariado. Las técnicas estadísticas multivariadas posibilitan el
estudio simultáneo de un grupo de variables intercorrelacionadas medidas sobre un
conjunto de individuos u objetos, son utilizadas como herramientas para sintetizar la
información.
Diseño de investigación
Se realizó un diseño e investigación de un código que permita ejecutar las diferentes
versiones del Análisis de Componentes Principales clásico, así como el Análisis de
Componentes Principales con bootstrapping y la implementación del biplot en ambos
métodos, y comparar los resultados obtenidos con cada una. En dicha comparación se
ejemplificarán las diferencias entre las componentes principales clásicas, bootstrapping y la
representación.
Base de datos
Los datos recolectados para la etapa de ejemplificación se obtuvieron utilizando el software
R de la paquetería AER que incluía la base de datos del modelo I de la economía
estadounidense de Klein 1950 (KleinI). Esta base contiene 22 observaciones anuales desde
1920 a 1941. Las variables so

Nombre Etiqueta Descripción Rango


Consumo consumption El consumo de la 40 a 70
economía.
Los beneficios cprofits Ingresos generados por 7 a 26
empresariales las actividades.
Factura salarial pwage Es una estimación a 25.50 a 53.30
privada partir de 4 fuentes
obtenidas directamente
de las empresas
Inversión. invest Las inversiones -6.2 a 5.6
realizadas.
Capital social del capital El capital representa la 180 a 216
año anterior financiación procedente
de las aportaciones
realizadas por los
propietarios de la
empresa.
Producto nacional gnp Es un indicador que nos 44.30 a 88.40
bruto muestra la cantidad de
bienes y servicios finales
generados con los
factores de producción
Factura salarial del gwage Salario de prestación de 2.2 a 8.5
gobierno un servicio
Gastos gexpenditur Los gastos en bienes y 2.4 a 13.8
gubernamentales e servicios realizados por
el gobierno a todos los
niveles
Taxes taxes Son los impuestos que 3.4 a 11.6
todos como ciudadanos
responsables estamos
obligados a pagar por el
trabajo realizado,
independientemente de
nuestro estatus legal.
Paqueterías
 AER
El paquete AER incluye unos 100 conjuntos de datos de las principales revistas de
econometría aplicada y libros de texto de econometría populares. Se han obtenido muchos
conjuntos de datos del archivo de datos del Journal of Applied Econometrics y el (ahora
desaparecido) archivo de datos del Journal of Estadísticas económicas y comerciales.
Algunos de estos se utilizan en libros de texto recientes, entre ellos Baltagi (2002),
Davidson y MacKinnon (2004), Greene (2003), Stock y Watson (2007) y Verbeek (2004).
Información detallada sobre la fuente de cada conjunto de datos, descripciones de las
variables incluidas,

y normalmente también se proporcionan ejemplos de análisis típicos en las respectivas


páginas del manual.

Se puede obtener una lista completa de todos los conjuntos de datos en AER a través de R>
datos (paquete = "AER").

 BiplotbootGUI

El paquete biplotbootGUI es una interfaz gráfica de usuario para construir e interactuar con
Classical Biplots y, combinado con los métodos Bootstrap, proporciona intervalos de
confianza basados en percentiles, t-bootstrap y BCa para medir la precisión de los
estimadores de los parámetros dados por ellos.

Una GUI con la que el usuario puede construir e interactuar con métodos Bootstrap en
Classical Biplots y con Clustering y / o Disjoint Biplot. Esta GUI también está destinada a
estimar cualquier matriz de datos numéricos utilizando la metodología Clustering and
Disjoint Principal component (CDPCA).

Análisis estadístico
Los procesos descritos fueron efectuados en R versión 4.0.3. Para el análisis de la base, se
aplicó el análisis de componentes principales y su correspondiente biplot, tanto para el
método clásico y bootstrapping. Se obtuvo la distribución de cada variable para observar su
comportamiento. Se aplico ACP clásico, donde se obtuvo el estadístico que se utilizaría
posteriormente para bootstrap el cual es el primer eigenvalor y se realizó su biplot.
Asimismo, se hizo los remuestreos con remplazo por cada remuestreo se hace se obtiene
una muestra y se gráfica los puntos que corresponde a las coordenadas de cada variable.
También se graficó el histograma de la distribución bootstrap del eigenvalor. Se muestra la
comparación de los estadísticos obtenidos por ambos métodos. Para los intervalos de
confianza fue de tipo t y percentil. Para el biplot del método con bootstrapping se utilizó la
interfaz de biplotbootGUI.
Resultados (Juli)
Conclusiones (Juli y Sammy)
Bibliografía (las bibliografías que hayan obtenido)
López Galán, A. (2015). Morfometría geométrica: el estudio de la forma y su aplicación en biología.
Temas de Ciencia y Tecnología, vol. 19 ,n.55, pp 53 - 59.

Torcida, S., & Perez, I. (2012). ANÁLISIS DE PROCRUSTES Y EL ESTUDIO DE LA VARIACIÓN


MORFOLÓGICA. REVISTA ARGENTINA DE ANTROPOLOGÍA BIOLÓGICA, Volumen 14, N.1,
131-141.

Zelditch, M. (2004). Geometric morphometrics for biologists: A primer. Elsevier Academic Press.

Anexos (código)

También podría gustarte