Está en la página 1de 9

ESCUELA PROFESIONAL DE ESTADISTICA

SEGUNDA PRÁCTICA CALIFICADA DE TÉCNICAS MULTIVARIANTES

Integrantes: Carhuallay Cervantes,Yohn


Tamayo Saavedra, Edgar

INDICACIONES

 En cada pregunta, al final del desarrollo, ingresar el código R que se utilizó.


 Además, colocar en casa subpregunta el resultado del RStudio.
 Adjuntar la PC2 en el Classroom, en la opción Tareas: Segunda Práctica
 Calificada
 Fecha de presentación: Sábado 10/12, hasta las 23:59 horas.
 Ingresar los nombres de los integrantes (puede ser grupal)

PREGUNTA 1
La tabla siguiente contiene datos sobre medidas de glucosa en la sangre para 55 mujeres
(O’Sullivan & Mahon 1966). Las Ys representan medidas de glucosa en ayunas en tres
ocasiones y las Xs son medidas de glucosa una hora después de ingerir azúcar. Investigue la
relación entre los dos conjuntos de variables usando análisis de correlación canónica.

Tabla. Medidas de glucosa en la sangre


a. Con un nivel de significación de 5%, verifique el supuesto de normalidad. (si no cumpliese el
supuesto, continue con el análisis) Use las pruebas de normalidad multivariante para las
variables Ys y Xs de Herzel - Zirkle y Royston.

Hipótesis

H0: los datos siguen una distribución normal


H1: los datos no siguen una distribución normal

Nivel de significancia

α = 0.05

PRUEBA DE HZ

PRUEBA DE ROYSTON

Como el p_valor de Hz =2.035039e-13 y p_value de Royston=5.160612e-13

<0.05, entonces rechazamos la H0, por lo tanto, los datos no siguen una distribución normal

b. Verifique la significación de las correlaciones canónicas. Use α = 0.05.

c. Realice el test de independencia. Use α = 0.05.


(Para las preguntas a,b y c presente hipótesis, nivel de significación, valor del estadístico de
prueba, p-valor, decisión y conclusión)

det(R)= 0.5634761
det(R11)= 0.8592284
det(R22)= 0.897227
Hipótesis

H 0 : 12  0, H1 : 12  0
α = 0.05

Estadístico de contraste

|R|
Λ= =0.7309111 Λ ( 3 ,51 , 3 )
|R 11||R 22|
n=55
p=3
q=3

El valor crítico para una F con 6 y 98 gl y para

α = 0.05. es de 0.2693523.

Fc= 2.771469> Ft=0.2693523 en conclusión, rechazamos la hipótesis de

independencia

d. Presente las matrices de correlación R, Rxx, Ryy, Rxy

R=

Rxx=

Ryy=

Rxy=
e. Presente los autovalores y los coeficientes de las correlaciones canónicas.

Λ1=1.8860920
Λ2=1.0976501
Λ3=1.0466798
Λ4=0.8495651
Λ5=0.6467529
Λ6=0.4732600

Correlaciones canonicas
r1=1.373351
r2=1.047688
r3=1.023074
r4=0.9217186
r5=0.8042095
r6=0.687939

f. Presente los vectores canónicos a y b; así como las variables canónicas, de las cuales
presente una interpretación breve.

Vectores canónicos deU1, U2, U3

a1= (0.00007.532114; -0.01966841; 0.03433415) U1


a2= (0.005840409; -0.043595287; 0.025692028) U2
a3= (-0.02022721; 0.00009.450016; 0.01151394) U3

Vectores canónicos V1, V2, V3

b1= (-0.052244724; -0.003189054; -0.090793305) V1


b2= (0.02673896; -0.12600741; 0.02014205) V2
b3= (-0.090491891; -0.002111647; 0.073073464) V3

Las variables canónicas con varianza 1 son:

U1= (0.00007532114X1 -0.01966841X2 -0.03433415X3)


U2= (0.005840409X1 -0.043595287X2+ 0.025692028X3)
U3=(-0.02022721X1+0.00009450016X2+0.01151394X3)

V1= (-0.052244724Y1-0.003189054Y2 -0.090793305Y3)


V2= (0.02673896Y1 -0.12600741Y2+ 0.02014205Y3)
V3= (-0.090491891; Y1-0.002111647Y2+ 0.073073464Y3)

Las Ys representan medidas de glucosa en ayunas en tres ocasiones y las Xs son medidas de
glucosa una hora después de ingerir azúcar. Investigue la relación entre los dos conjuntos de
variables usando análisis de correlación canónica.

La dependencia entre (X1, X2, X3) y (Y1, Y2, Y3) está dada principalmente por la relación entre
(U1, V1) con correlación 0.3747013, más alta que cualquier correlación entre una variable Xi y
una variable Yj. Se observa que presentan una relación inversa U1 con las variables X1, X2, X3;
mientras que V1 también presenta una relación inversa con las variables Y1, Y2, Y3

PREGUNTA 2
A 8 personas se les administró el medicamento AX23 y a otros 8, de manera independiente, el
medicamento BWW9. Se midió la frecuencia cardiaca de cada individuo cada 5 minutos,
durante 20 minutos. Los datos se muestran en la tabla siguiente:

Tabla. Frecuencia cardiaca bajo el efecto de dos tratamientos

Con un nivel de significación de 5%, se pide:

a. Verifique los supuestos en un análisis de varianza multivariado de dos factores. (Presente


las hipótesis correspondientes, nivel de significación, valor del estadístico de prueba, p-
valor, decisión y conclusión)

H 0 : Los datos de las frecuencias cardiacas en losdos grupos de personas


siguenuna distribución normal
H 1 : Los datos de las frecuencias cardiacas enlos dos grupos de personas
no siguenuna distribución normal .
Decisión:

Como p-valor (Persona1 y Persona2) < α = 0.05, se rechaza H 0 .


Los datos de las frecuencias cardiacas en los dos grupos de personas no siguen una
distribución normal multivariante.

b. Presente la descomposición de la matriz de covarianzas.

Matriz F A :

Matriz W :

Matriz T :

c. Realice la prueba de significación de los factores y de la interacción. (Presente las hipótesis


correspondientes, nivel de significación, valor del estadístico de prueba, p-valor, decisión y
conclusión)
H 0 :∝g=0 ; H 1 :∝g ≠0

Se rechaza H 0 puesto que p-valor = 0.0000 < ∝ = 0.05. Hay efecto principal del factor A.
Existen diferencias en las frecuencias cardiacas en los grupos de personas.
Código (Pregunta 1):
datos <- read.delim("clipboard")
summary(datos)
cor(datos)

###PRUEBA DE NORMALIDAD MULTIVARIADA


library(MVN)
#PRUEBA HZ
result<-mvn(datos,mvnTest="hz")
result$multivariateNormality
#prueba Royston
result<-mvn(datos,mvnTest="royston",desc=TRUE)
result

library(CCA)
X<-datos[,1:3]
Y<-datos[,-(1:3)]
# Realizamos el analisis con la funcion cc()
res<-cc(X,Y)
res$cor # da las correlaciones canónicas
res
###Gráfico de matriz de correlaciones:
chkc<-matcor(X,Y)
img.matcor(chkc,type=2)

###Gráfico para definición de las variables canónicas:


plt.cc(res,d1=1,d2=2,type="v",var.label=TRUE)
datos <- read.delim("clipboard")
summary(datos)
cor(datos)

library(CCA)
X<-datos[,1:3]
Y<-datos[,-(1:3)]
# Realizamos el analisis con la funcion cc()
res<-cc(X,Y)
res$cor # da las correlaciones canónicas
res
###Gráfico de matriz de correlaciones:
chkc<-matcor(X,Y)
img.matcor(chkc,type=2)

###Gráfico para definición de las variables canónicas:


plt.cc(res,d1=1,d2=2,type="v",var.label=TRUE)
Código (Pregunta 2):

t1 <- c(85,82,71,83,86,85,79,83,72,78,71,72,66,74,62,69)
t2 <- c(86,86,78,88,85,82,83,84,86,83,82,83,79,83,73,75)
t3 <- c(83,80,70,79,76,83,80,78,81,88,81,83,77,84,78,76)
t4 <- c(80,84,75,81,76,80,81,81,77,81,75,69,66,77,70,70)
persona <- c(rep(1,8),rep(2,8))
tipmed <- c(rep("BWW9",8),rep("AX23",8))
datos <- data.frame(t1,t2,t3,t4,persona,tipmed)
datos$persona <- factor(datos$persona)
datos$tipmed <- factor(datos$tipmed)
datos

####ESTIMANDO EL MODELO
modelo <- manova(cbind(t1,t2,t3,t4)~persona*tipmed,data=datos)
summary.manova(modelo,intercept=T)
d. ####Obteniendo las matrices T, F y W
e. summary.manova(modelo,intercept=T)$SS
f. #Matriz suma de cuadrados y productos cruzados del factor A
g. matFA <- summary(modelo)$SS[[1]]
h. #Matriz suma de cuadrados y productos cruzados del factor B
i. matFB <- summary(modelo)$SS[[2]]
j. #Matriz suma de cuadrados y productos cruzados del total
k. matT <- matFA + matFB
l. matT
m. #Calculando FAB + W
n.
o. suma <- matAB + matW
p.
q. ###Desagregando la base por grupos: tipo de medicamento
r. grupoBWW9 <- datos[1:8,1:4]
s. grupoAX23 <- datos[9:16,1:4]
t.
u. ###Transponiendo
v. grupoBWW9 <- t(grupoBWW9)
w. grupoAX23 <- t(grupoAX23)
x.
y. ###Desagregando la base por grupos: Personas
z. ###ordenamos la base por persona
aa. datos <- datos[order(datos$persona),]
bb. datos
cc. grupoPersona1 <- datos[1:8,1:4]
dd. grupoPersona2 <- datos[9:16,1:4]
ee. ###Transponiendo
ff. grupoPersona1 <- t(grupoPersona1)
gg. grupoPersona2 <- t(grupoPersona2)
hh.
ii. ###Prueba de normalidad multivariante
jj. library(mvnormtest)
kk. mshapiro.test(grupoBWW9)
ll. mshapiro.test(grupoAX23)
mm. mshapiro.test(grupoPersona1)
nn. mshapiro.test(grupoPersona2)

También podría gustarte