Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Anexo wikipedia:
Estadística multivariante
Un vector aleatorio es un vector formado por una o más variables aleatorias escalares. La estadística
multivariante se ocupa de los vectores aleatorios que tienen aplicaciones en muchas ciencias y técnicas.
Podemos destacar entre ellas la econometría y la taxonomía. Un modelo explicativo para una variable
aleatoria se basa en explicar esta recurriendo a otras. Los vectores aleatorios nos sirven para construir
este tipo de modelos. Incluso en física, donde parece que los modelos determinan claramente el valor
de las variables, estas padecen errores producidos por variables no incluidos en el modelo o procesos
puramente aleatorios, lo que hace necesario recurrir a modelos estadísticos para estimar sus
parámetros.
1. Métodos de Dependencia:
1. Un estudio de la regresión nos permite averiguar hasta que punto una variable puede
ser prevista conociendo otra. Se utiliza para intentar predecir el comportamiento de
ciertas variables a partir de otras, como por ejemplo los beneficios de una película a
partir del gasto en márketing y del gasto en producción.
2. El análisis de la correlación canónica intenta analizar la posible existencia de relación
entre dos grupos de variables.
3. Un análisis discriminante nos puede dar una función discriminante que puede ser
utilizada para distinguir entre dos o más grupos, y de este modo tomar decisiones.
4. Un análisis multivariante de la varianza (MANOVA), extendiendo el análisis de la
varianza (ANOVA), cubre los casos en los que se conozca la existencia de más de
una variable dependiente sin poderse simplificar más el modelo.
5. La regresión logística permite la elaboración de un análisis de regresión para estimar y
probar la influencia de una variable sobre otra, cuando la variable dependiente o de
respuesta es de tipo dicotómico.
2. Métodos de Interdependencia:
1. El análisis de los componentes principales procura determinar un sistema más
pequeño de variables que sinteticen el sistema original.
2. El análisis clúster clasifica una muestra de entidades (individuos o variables) en un
número pequeño de grupos de forma que las observaciones pertenecientes a un
grupo sean muy similares entre sí y muy disimilares del resto. A diferencia del Análisis
discriminante se desconoce el número y la composición de dichos grupos.
3. La Iconografía de las correlaciones.
3. Métodos Estructurales:
EJERCICIO
Las variables deben estar correlaciondas
Se debe hacer la matriz de correlación
Se observa que existe correlación entre las variables, por lo tanto medidas de tendencia lineal
Si el determinante de la matriz de correlaciónes uno => no hay relación lineal entre las variables
SI determinante es distinto de 1=> implica que existe correlación entre las variables.
Habiendo correlación significa que hay variables que pueden ser explicadas en relación a otras.
Una variable es explicada en función de otra, y por lo tanto debe cumplirse la transitividad
Globalmente la dependencia línea explica el 77% de la variabilidad de este conjunto de datos, esto
hace que el análisis de componentes principales se pueda aplicar.
Dcr explica en menor grado con todo el resto, por lo tanto se eliminará el diámetro de cráneo y se
ver
Todo lo que están en diagonal son las varianzas, los software trabajan por matriz de varianza o
matriz de correlación
Si todas las variables tienen diferentes unidad de medida y fuerte dif entre valores de varianzas
también se ocupa matriz de covarianza???
Si todas las variables tienen la misma unidad de medida y fuerte dif entre valores de varianzas
también se ocupa matriz de correlación
En este caso hay una alta variabilidad entre las varianzas, por lo tanto debe hacerse por matriz de
correlación
Análisis de componentes principales es una técnica estadística que se conoce como
Matriz de correlación
A mayor potencia, m
dataautos;
input auto Pot acc pes cil lkm;
cards;
1 48 21.5 900.4 1474.9 5.5
2 66 14.4 816.5 1606 6.5
3 52 19.4 900.4 1278.3 7.2
4 70 18.6 938.9 1393 6
5 60 16.4 816.5 1491.3 6.5
6 110 15.5 1526.4 4260.9 11.8
7 140 13.2 1694.2 5211.4 12.1
8 139 12.8 1619.3 4949.2 11.6
9 105 19.2 1603.5 3785.6 12.3
10 95 18.2 1431.1 3277.6 11.5
;
run;
Z1 Z2
Esta gráfica esta con dos componentes. El primer vector propio determinado por el primer valor
propio. Si se observa, la potencia esta asociada con el primer componetes principal, , la
aceleración fuertemente con la segunda componetes, peso con la primera, cilindrara con la
primera, y kms/litro muy parecido con el peso.
Un grupo del 1 al 5=> (Se puede ver de la tabla original) Baja potencia, aceleración parecida, auto
liviano, menor rendimiento
Se pueden hacer rotación de ejes, como ortogonales u oblicuas por una mejor visión.