Está en la página 1de 11

## Taller 4

## Marli Yined Balaguera Prieto

## Tablas de contingencia

## Punto 1.

## Importar el block de notas futbol

futbol<-read.table(file.choose(),header = TRUE)

futbol

## a) Tabla de contingencia

t.futbol<-table(futbol)

tot.t.futbol<-addmargins(t.futbol)

tot.t.futbol

## INTERPRETACIÓN: De las 24 personas encuestadas 12 son mujeres y 12 son hombres

## se observa que 14 personas tienen el deseo de ver la final del campeonato de

## de futbol que será televisada. Por medio de la tabla de contingencia se encuentra

## que 4 hombres y 10 mujeres manifiestan el deseo de ver la final de futbol.

## b) Expresar la tabla de contingencia en frecuencias relativas y luego en porcentajes

porc.t.futbol<-prop.table(t.futbol)*100

porc.t.futbol

## INTERPRETACIÓN: el 33.3% de los hombre manifiestan el deseo de ver la final de futbol,

## por lo contrario el 16.6% de los hombres no desean ver la final. Para las mujeres
## el 41.6% quieren ver la final de futbol y solo el 8.3% no quiere verla.

## c) Determinar los perfiles fila y columna

## Perfil fila

fila<-round(prop.table(t.futbol,1)*100,2)

fila

## INTERPRETACIÓN: El 33.3% de los hombres tienen deseo de ver la final de futbol y

## el 66.6% no desa verlo; por otro lado el 16.6% de mujeres no desean ver la final

## de futbol, mientras el 83.3% de ellas si quieren verlo.

## Perfil columna

columna<-round(prop.table(t.futbol,2)*100,2)

columna

## INTERPRETACIÓN: el 80% que no desean ver la final de futbol son hombres, el otro 20%

## corresponde a las mujeres. Se obtiene que el 71.43% que desean ver la final de futbol

## son mujeres y el 28.57% son hombres.

## d) Crear la gráfica para la tabla de contingencia

barplot(prop.table(t.futbol)*100,beside=T,main="Clasificación del deseo de ver la final

del campeonato de futbol por género",

xlab="Futbol vs Género",ylab="Porcentaje",col= rainbow(2))

legend("top",legend=colnames(t(t.futbol)),horiz=T,fill=rainbow(2),bty="n",cex=0.8)
## e) Crear la gráfica para los perfiles fila

barplot(prop.table(t.futbol,1)*100,beside=T,main="Clasificación del deseo de ver la final

del campeonato de futbol por género",

xlab="Futbol vs Género",ylab="Porcentaje",col= rainbow(2))

legend("top",legend=colnames(t(t.futbol)),horiz=T,fill=rainbow(2),bty="n",cex=0.8)

## f) Crear la gráfica para los perfiles columna

barplot(prop.table(t.futbol,2)*100,beside=T,main="Clasificación del deseo de ver la final

del campeonato de futbol por género",

xlab="Futbol vs Género",ylab="Porcentaje",col= rainbow(2))

legend("top",legend=colnames(t(t.futbol)),horiz=T,fill=rainbow(2),bty="n",cex=0.8)

## Punto 2.

## a) Las frecuencias Marginales

### Construcción tabla de contingencia

t.trab<-matrix(c(335,402,38,1022,1429,841,2132,2427,2511),3)

## Rotulando las categorias de las variables

dimnames(t.trab)<-list(Salario=c("Bajo","Medio","Alto"),Edad=c("Joven","Medio","Mayor"))

t.trab

## INTERPRETACIÓN: 2132 trabajadores que son de edad mayor tienen un salario bajo, 1022

## trabajadores de edad medio tienen salario bajo, 335 trabajadores de edad joven tiene salario

## bajo, 2427 trabajadores de edad mayor tienen un salario medio, 1429 trabajadores de edad
medio

## tienen salario medio, 402 trabajadores de edad joven tienen salario medio, 2511 trabajadores

## de edad mayor tienen un salario alto, 841 trabajadores de edad medio tienen un salario alto
## y 38 trabajadores de edad joven tienen un salario alto.

## b) Las frecuencias condicionales del salario a la Edad (perfil columna)

columna<-round(prop.table(t.trab,2)*100,2)

columna

## INTERPRETACIÓN: El 30.16% de los trabajadores que son de edad mayor tienen un salario bajo,

## el 31.04% de los trabajadores de edad medio tienen salario bajo, el 43.23% de los trabajadores

## de edad joven tiene salario bajo, el 34.33% de los trabajadores de edad mayor tienen un

## salario medio, el 43.41% de los trabajadores de edad medio tienen salario medio, el 51.87%

## de los trabajadores de edad joven tienen salario medio, el 35.52% de los trabajadores

## de edad mayor tienen un salario alto, el 25.55% de los trabajadores de edad medio tienen un

## salario alto y el 4.9% de los trabajadores de edad joven tienen un salario alto.

## c) Las frecuencias condicionales de la Edad al Salario (perfil fila)

fila<-round(prop.table(t.trab,1)*100,2)

fila

## INTERPRETACIÓN: El 61.11% de los trabajadores que tienen un salario bajo son de edad

## mayor, el 29.29% de los trabajadores que tienen un salario bajo son de edad media,

## el 9.6% de los trabajadores que tienen un salario bajo son de edad joven,

## el 57% de los trabajadores que tienen un salario medio son de edad mayor,

## el 33.56% de los trabajadores que tienen un salario medio son de edad media,

## el 9.44% de los trabajadores que tienen un salario medio son de edad joven,

## el 74.07% de los trabajadores que tienen un salario alto son de edad mayor,

## el 24.81% de los trabajadores que tienen un salario alto son de edad media,

## y el 1.12% de los trabajadores que tienen un salario alto son de edad joven.
## d) Hacer la gráfica para el perfil fila

barplot(prop.table(t.trab,1)*100,beside=T,main="Clasificación de salario por edad",

xlab="Salario vs Edad",ylab="Porcentaje",col= rainbow(3))

legend("top",legend=colnames(t(t.trab)),horiz=T,fill=rainbow(3),bty="n",cex=0.8)

## e) Hacer la gráfica para el perfil columna

barplot(prop.table(t.trab,2)*100,beside=T,main="Clasificación de salario por edad",

xlab="Salario vs Edad",ylab="Porcentaje",col= rainbow(3))

legend("top",legend=colnames(t(t.trab)),horiz=T,fill=rainbow(3),bty="n",cex=0.8)

## f) Realizar la prueba de independencia:

## Sistema de hipótesis

## H0: El salario es independiente de la edad

## Vs

## H1: El salario no es independiente de la edad

## Estadistica de prueba

## Totales por fila y columna

addmargins(t.trab)

## Totales por fila

tot.f<- addmargins(t.trab,2)[,4]

## Totales por fila

tot.c<- addmargins(t.trab,1)[4,]
## Eij= Frecuencias esperadas

eij.t.trab<-(tot.f%*%t(tot.c))/sum(t.trab)

## Construcción de la estadistica de prueba

chi.t.trab<-sum((t.trab-eij.t.trab)^2/eij.t.trab)

## Calculo del p-valor

## Usando la distribución chi-cuadrado con (f-1)*(c-1)

## es decir 4 gl

## P(X>chi.t.trab)

1-pchisq(chi.t.trab,4)

## como el p-valor es menor que cualquier nivel de significancia alfa hay suficiente evidencia

## estadistica para rechazar Ho, Luego el salario depende de la edad

## Usando comando de R

chisq.test(t.trab)

## Con el comando de R hay suficiente evidencia estadistica que se rechaza H0 dado que el

## p-valor es menor que cualquier nivel de significancia alfa

## Punto 3.

## a) Importar a R usando el comando read_excel

## Instalar el paquete readxl


## Cargar la libreria

library(readxl)

turista<-read_excel(file.choose())

turista

## b) Con la variable edad formar una nueva variable categórica llamada ETAPA

## c) Construir las siguientes tablas de contingencia

## Etapas vs Estado Civil

t.ee<-table(turista$Etapa,turistas$`Estado Civil`)

t.ee

## Género vs Estado Civil

t.ge<-table(turista$Género,turistas$`Estado Civil`)

tt.ge

## d) Calcular los totales por fila y columna con su respectivo porcentaje

### Totales por fila y columna (Etapas vs Estado Civil)

tot.t.ee<-addmargins(t.ee)

tot.t.ee

### Porcentajes de los totales por fila y columna(Etapas vs Estado Civil)

porc.t.ee<-prop.table(tot.t.ee)*100

porc.t.ee<-addmargins(porc.t.ee)

porc.t.ee
### Totales por fila y columna (Género vs Estado Civil)

tot.t.ge<-addmargins(t.ge)

tot.t.ge

### Porcentajes de los totales por fila y columna(Género vs Estado Civil)

porc.t.ee<-prop.table(porc.t.ee)*100

porc.t.ee<-addmargins(porc.t.ee)

## RESULTADOS ENCONTRADOS: En la tabla de contingencia de las etapas vs el estado civil se

## observa que el 32.05% de personas en la adultez están casados, tambien que el 21.93%

## de personas en la juventud son solteros y solo el 0.24% de las personas en la vejez

## están solteros.

## En la tabla de contingencia del género vs el estado civil se muestra que la mayoria de

## las mujeres están casadas con un 19.52% y que los menores porcentajes son en el ser

## divorciada y viuda con un 2.65%. Por otro lado los hombres presentan un porcentaje del

## 20.48% en ser soltero y solo un 0.72% en ser viudo.

## e) Realizar la prueba de independencia

## Para Etapas vs Estado Civil

## Sistema de hipótesis

## H0: Las etapas son independientes del estado civil

## Vs

## H1: Las etapas no son independiente del estado civil

## Estadistica de prueba

## Totales por fila y columna


addmargins(t.ee)

## Totales por fila

tot.f<- addmargins(t.ee,2)[,6]

tot.f

## Totales por fila

tot.c<- addmargins(t.ee,1)[4,]

tot.c

## Eij= Frecuencias esperadas

eij.t.ee<-(tot.f%*%t(tot.c))/sum(t.ee)

eij.t.ee

## Como más del 20% de las frecuencias esperadas estimadas es menor que 5 no se puede

## utilizar el coeficiente de asociación de la Ji cuadrado, es necesario hacer uso de

## otro coeficiente.

## Género vs Estado Civil

## Sistema de hipótesis

## H0: El género es independiente del estado civil

## Vs

## H1: El género no es independiente del estado civil

## Estadistica de prueba

## Totales por fila y columna

addmargins(t.ge)
## Totales por fila

tot.f<- addmargins(t.ge,2)[,6]

tot.f

## Totales por fila

tot.c<- addmargins(t.trab,1)[3,]

tot.c

## Eij= Frecuencias esperadas

eij.t.ge<-(tot.f%*%t(tot.c))/sum(t.ge)

eij.t.ge

## Construcción de la estadistica de prueba

chi.t.ge<-sum((t.ge-eij.t.ge)^2/eij.t.ge)

chi.t.ge

## Calculo del p-valor

## Usando la distribucion chi-cuadrado con (f-1)*(c-1)

## es decir 4 gl

## P(X>chi.ge)

1-pchisq(chi.ge,4)

## como el p-valor es mayor que cualquier nivel de significancia alfa hay suficiente evidencia

## estadistica para no rechazar Ho, Luego el género no depende del estado civil.

## Usando comando de R

chisq.test(t.ge)
## Con el comando de R se observa que como el p-valor es mayor que cualquier nivel de

## significancia alfa hay suficiente evidencia estadistica para no rechazar Ho, Luego

## el género no depende del estado civil.

También podría gustarte