Está en la página 1de 6

PRUEBA GENERAL DE ANÁLISIS ESTADÍSTICO MULTIVARIANTE. B2022.

APELLIDOS: __SOSA DE LA CRUZ_________________________________

NOMBRES: ___JOSÉ MIGUEL ___________________________________

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO


(UASD)
FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES

ASIGNATURA
ANALISIS MULTIVARIANTE

MAESTRO
GIAMPAOLO ORLANDONI MERLI

NOMBRE DEL ALUMNO


JOSÉ MIGUEL SOSA DE LA CRUZ

CEDULA
00118235605
1.Principales resultados de cada tarea
2.Un gráfico pertinente
3-Interpretación de los resultados

1. ACP_ANÁLISIS DE COMPONENTES PRINCIPALES

El

número de datos es 40 es decir hay 40 observaciones y el número de componentes es de 5


con una diagonal de 5 unidades en la matriz.
El eigenvalue entre el número de componentes nos da la proporción acumulativa la cual
hace referencia a explicar el 87.44% de la variabilidad del modelo, seguida de la segunda
proporción acumulativa del segundo componente la cual explica un 98.16% de la
variabilidad del modelo, en este caso los vectores 1 y 2 los más representativos por eso me
quedo con el primero y el segundo componente para la proporción acumulativa.

La siguiente tabla de datos muestra la


relación entre las variables y los
componentes, se puede apreciar en el
componente1 como todas las
variables muestran una relación
positiva y son importantes, en el
segundo componente o el
componente 2 la variable más
importante es la tasa de ocupación con un 93.31%, en el componente 3 el periodo y la
habitación son las más importantes, en el componente 4 el periodo y la tasa de ocupación
muestran más importancia y en el componente 5 la habitación y el ingreso en millones son
los más importantes, mostrando que el componente 1 y 2 muestran la mayor parte de la
explicación del modelo.
2. ACM_ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLE

En este grafico del 3_ACM_ té se puede ver que la edad de las personas que toman
más té son los que están entre los 25-35 años de edad y las personas que toman
menos té están entre 15-24 de edad son los que están más alejados, los no amigos
no toman te, los exóticos y los empleados y los que duran más de un día están
juntos, los administradores que tienen mas de 60, los exóticos con los refinados
toman muchos té, la gerencia no toman mucho ni los que duran mas de un día,
también están los que se encuentran el té estimulante, los no refinados están muy
alejado.
MCA(X = tea, quanti.sup = 22, quali.sup = c(19:21, 23:36))
Eigenvalues
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7 Dim.8 Dim.9 Dim.10 Dim.11 Dim.12
Variance 0.148 0.122 0.090 0.078 0.074 0.071 0.068 0.065 0.062 0.059 0.057 0.054
% of var. 9.885 8.103 6.001 5.204 4.917 4.759 4.522 4.355 4.123 3.902 3.805 3.628
Cumulative % of var. 9.885 17.988 23.989 29.192 34.109 38.868 43.390 47.745 51.867 55.769 59.574 63.202
Dim.13 Dim.14 Dim.15 Dim.16 Dim.17 Dim.18 Dim.19 Dim.20 Dim.21 Dim.22 Dim.23 Dim.24
Variance 0.052 0.049 0.048 0.047 0.046 0.040 0.038 0.037 0.036 0.035 0.031 0.029
% of var. 3.462 3.250 3.221 3.127 3.037 2.683 2.541 2.438 2.378 2.323 2.055 1.915
Cumulative % of var. 66.664 69.914 73.135 76.262 79.298 81.982 84.523 86.961 89.339 91.662 93.717 95.633
Dim.25 Dim.26 Dim.27
Variance 0.027 0.021 0.017
% of var. 1.821 1.407 1.139
Cumulative % of var. 97.454 98.861 100.000

Individuals (the 10 first)


Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr cos2
1 | -0.541 0.658 0.143 | -0.149 0.061 0.011 | -0.306 0.347 0.046 |
2 | -0.361 0.293 0.133 | -0.078 0.017 0.006 | -0.633 1.483 0.409 |
3 | 0.073 0.012 0.003 | -0.169 0.079 0.018 | 0.246 0.224 0.038 |
4 | -0.572 0.735 0.235 | 0.018 0.001 0.000 | 0.203 0.153 0.030 |
5 | -0.253 0.144 0.079 | -0.118 0.038 0.017 | 0.006 0.000 0.000 |
6 | -0.684 1.053 0.231 | 0.032 0.003 0.001 | -0.018 0.001 0.000 |
7 | -0.111 0.027 0.022 | -0.182 0.090 0.059 | -0.207 0.159 0.077 |
8 | -0.210 0.099 0.043 | -0.068 0.013 0.004 | -0.421 0.655 0.174 |
9 | 0.118 0.031 0.012 | 0.229 0.144 0.044 | -0.538 1.070 0.244 |
10 | 0.258 0.150 0.045 | 0.478 0.627 0.156 | -0.482 0.861 0.158 |
3. AFC_ANÁLISIS FACTORIAL DE CORRELACIONES.
Summarize
. factor TURISMO CUOTA ICC1 ICC2 ICC3 CULTURAL DEMOGRAF ECONOMIC RACTIVA TLFHABIT INNOHABI EGBHABIT TEXTILHA MADERHAB QUIMHAB CONSTHAB METALHAB MAQ
> UINHA
(obs=50)

Factor analysis/correlation Number of obs = 50


Method: principal factors Retained factors = 11
Rotation: (unrotated) Number of params = 143

Factor Eigenvalue Difference Proportion Cumulative

Factor1 8.25349 3.67175 0.5049 0.5049


Factor2 4.58174 2.69059 0.2803 0.7852
Factor3 1.89115 1.09524 0.1157 0.9009
Factor4 0.79591 0.42288 0.0487 0.9496
Factor5 0.37303 0.10777 0.0228 0.9724
Factor6 0.26526 0.09955 0.0162 0.9886
Factor7 0.16571 0.06174 0.0101 0.9988
Factor8 0.10397 0.03747 0.0064 1.0051
Factor9 0.06650 0.04902 0.0041 1.0092
Factor10 0.01748 0.00690 0.0011 1.0103
Factor11 0.01058 0.01158 0.0006 1.0109
Factor12 -0.00100 0.00068 -0.0001 1.0108
Factor13 -0.00169 0.00610 -0.0001 1.0107
Factor14 -0.00779 0.00220 -0.0005 1.0103
Factor15 -0.00999 0.01700 -0.0006 1.0097
Factor16 -0.02699 0.01931 -0.0017 1.0080
Factor17 -0.04630 0.03820 -0.0028 1.0052
Factor18 -0.08450 . -0.0052 1.0000

LR test: independent vs. saturated: chi2(153) = 1652.09 Prob>chi2 = 0.0000

Factor loadings (pattern matrix) and unique variances

Variable Factor1 Factor2 Factor3 Factor4 Factor5 Factor6 Factor7 Factor8 Factor9 Factor10 Factor11 Uniqueness

TURISMO 0.7358 -0.5548 0.0459 0.0313 0.0507 0.2771 0.0987 0.0978 -0.0659 0.0393 0.0105 0.0431
CUOTA 0.7411 -0.6201 0.1542 -0.0241 0.0923 0.1167 0.0787 0.0100 -0.0262 -0.0120 -0.0462 0.0105
ICC1 0.5805 0.0956 -0.7426 0.2321 0.1359 -0.0910 -0.0374 0.0002 -0.1035 0.0144 -0.0032 0.0095
ICC2 0.6663 0.2003 -0.7080 -0.0174 0.0821 0.0452 -0.0492 -0.0038 0.0332 0.0377 0.0228 0.0001
ICC3 0.7334 0.2119 -0.5707 -0.2201 0.0057 0.1247 -0.0274 -0.0156 0.1231 -0.0559 -0.0153 0.0081
CULTURAL 0.7322 -0.6444 0.1489 0.1218 0.0372 -0.0090 -0.0058 -0.0025 -0.0108 -0.0647 0.0513 0.0032
DEMOGRAF 0.7516 -0.6248 0.1625 0.0949 0.0390 -0.0610 -0.0174 0.0019 0.0381 -0.0168 0.0321 0.0010
ECONOMIC 0.8077 -0.5529 0.1466 0.0516 0.0286 -0.0912 -0.0263 -0.0555 0.0471 0.0306 -0.0344 0.0006
RACTIVA 0.7988 -0.5358 0.1507 0.0775 0.0004 -0.1475 -0.1069 -0.0830 0.0408 0.0253 -0.0202 0.0033
TLFHABIT 0.8421 0.0775 0.0316 -0.2290 -0.3578 -0.0292 0.0252 0.0304 0.0156 0.0360 0.0253 0.0988
INNOHABI 0.7598 0.2520 -0.1952 0.1093 -0.3366 -0.0851 0.1523 0.0233 -0.0391 -0.0282 -0.0259 0.1618
EGBHABIT -0.1251 0.2533 -0.0128 0.7227 -0.0808 -0.0124 0.0218 0.0381 0.0563 0.0042 0.0028 0.3859
TEXTILHA 0.5679 0.6506 0.3664 0.0133 0.0349 0.0639 -0.1089 0.1181 0.0726 0.0324 0.0008 0.0823
MADERHAB 0.7290 0.4226 0.2140 -0.0587 -0.0826 -0.0160 -0.2445 0.0235 -0.1189 -0.0227 -0.0029 0.1586
QUIMHAB 0.5155 0.6982 0.2088 0.0059 0.0565 0.0853 0.0545 -0.1839 -0.0594 0.0024 0.0048 0.1523
CONSTHAB 0.4727 0.6870 0.2534 0.2315 0.0126 0.2054 -0.0301 -0.0403 0.0254 -0.0206 -0.0114 0.1407
METALHAB 0.5997 0.5835 0.1593 -0.1016 0.2400 -0.2054 0.0907 0.1554 -0.0052 -0.0215 -0.0123 0.1313
MAQUINHA 0.6693 0.6010 0.2038 -0.0705 0.1267 -0.1044 0.1571 -0.0838 0.0225 0.0205 0.0261 0.0841

En este cuadro se puede ver los estadísticos de cada variable, mostrando valor
correspondiente, medias, desviacion estándar, mínimos y máximos de las variables en
conjunto con el número de datos los cuales son 50 observaciones, en la gran mayoría de los
casos promedios y desviacion estándar altos para el poco número de caso observados.
En esta prueba de factorial se puede ver 50 observaciones, 11 factores retenidos y en los
valores propios el primero aporta el 50.59% el segundo aporta el 28.03% y el tercero aporta
11.57% estos valores nos dicen que son valores consistentes porque estos aportan un
90.09% de la variabilidad del conjunto de datos observados.
Factor loading se puede ver que en el factores1 el turismo 73.58%, la economía80.77%,
Ractiva 79.88%, TLFHABIT 84.21% y DEMOGRAF 75.16% CULTURAL73.22% los
demás están por encima de 59%.
En el caso de la unicidad el valor mas alto es de 38.59% EGBHABIT el cual para el caso
del factoR da muy bajo mostrando un valor negativo de -0.1251.
Beware: solution is a Heywood case
(i.e., invalid or boundary values of uniqueness)

Factor Eigenvalue Difference Proportion Cumulative

Factor1 5.45188 2.94725 0.6516 0.6516


Factor2 2.50463 2.09405 0.2993 0.9509
Factor3 0.41058 . 0.0491 1.0000

LR test: independent vs. saturated: chi2(36) = 1018.01 Prob>chi2 = 0.0000


LR test: 3 factors vs. saturated: chi2(12) = 85.62 Prob>chi2 = 0.0000
(tests formally not valid because a Heywood case was encountered)

Factor loadings (pattern matrix) and unique variances

Variable Factor1 Factor2 Factor3 Uniqueness

TURISMO 0.8991 0.1824


CUOTA 0.9570 0.0654
ICC1 0.8591 0.0138
ICC2 0.9333 0.0000
ICC3 0.8657 0.0116
CULTURAL 0.9878 0.0119
DEMOGRAF 0.9947 0.0000
ECONOMIC 0.9906 0.0154
TLFHABIT 0.5960 0.4454 0.3323

(blanks represent abs(loading)<.4)

En este caso me puedo quedar con los 3 factores actuales sin la necesidad de retirar
ninguno, se puede observar que el factor dos explica el 95.09% de toda la variabilidad.
En el factor loading se puede apreciar que el facotor1 le muchísima más importancia a la
CULTUURAL, DEMOGRAF, ENOMIC, aunque las demás variables mostradas en este
factor tienen gran importación mostrando por encima de 89% con excepción de
TLFHABIT CON 59.60%.
En el segundo factor las variables con mucha importancia para este son ICC1 con 85.91%,
ICC2 con 93.33%, y por último ICC3 con 86.57%.
Para el factor 3 tenemos la variable TLFHABIT que también es mostrada en el factor 1 el
cual la califica con un grado de importancia de 59.60% para el factor 1, pero en el factor
dos en calificado con un grado de importancia de 44.54%.
4. AD_ANÁLISIS DISCRIMINANTE

En el análisis discriminante lineal tenemos el grupo vintage que esta clasificada en 1, 2,


3, mostrados en la tabla de clasificación, esta muestra que para la clasificación 1 hay 59
datos de los cuales no tenemos malas clasificaciones o no hay datos mal clasificados, para
la clasificación 2 hay un total de 71 datos de los cuales no hay datos mal clasificados,
siguiendo con la clasificación 3 puede ver que hay 48 datos los mismos no tienen valores mal
clasificados, con un proporcional apriors para la clasificación 1 de 0.3315 para la
clasificación 2 de 0.3989 seguido de la clasificación 3 con una proporción apriors de
0.2697, a través de estos resultados podemos ver que el modelo es bueno.

En el análisis discriminante cuadrático tenemos el grupo vintage que está clasificada en 1,


2, 3, mostrados en la tabla de clasificación, esta muestra que para la clasificación 1 hay
59 datos de los cuales no tenemos malas clasificaciones o no hay datos mal clasificados,
para la clasificación 2 hay un total de 70 datos de los cuales hay datos un 1 dato mal
clasificado, siguiendo con la clasificación 3 puede ver que hay 48 datos los mismos no
tienen valores mal clasificados, con un proporcional apriors para la clasificación 1 de
0.3315 para la clasificación 2 de 0.3989 seguido de la clasificación 3 con una proporción
apriors de 0.2697, a través de estos resultados podemos ver que el modelo no ha mejorado con
el análisis discriminante cuadrático.
En este punto podemos entender que la mejor clasificación de los datos usados en el análisis
discriminante es dada por el análisis discriminante lineal con una mínima diferencia de una
pérdida o mal clasificación de un dato o la unidad referente a los mismos.

También podría gustarte