Está en la página 1de 10

UNIVERSIDAD POLITECNICA SALECIANA

ESTADISTICA
TAREA # 8
UNIDAD 4 TAREA 1
BYRON JAVIER GARCIA CARDENAS
GRUPO # 13

PAQUETES

rm(list=ls ())
setwd("C:/Users/USER/Downloads")

library(dplyr)

##
## Attaching package: ’dplyr’

## The following objects are masked from ’package:stats’:


##
## filter, lag

## The following objects are masked from ’package:base’:


##
## intersect, setdiff, setequal, union

library(readxl)
library(tidyr)

## Warning: package ’tidyr’ was built under R version 4.1.2

PREGUNTA 1
Respuesta: b) Error de tipo 2

PREGUNTA 2

1
Respuesta: a) La probabilidad de la hipotesis nula es 2 %

PREGUNTA3
setwd("C:/Users/USER/Downloads")
ventas <- read.csv2("ventasprepost.csv",sep=";",dec=",")
str(ventas)

## ’data.frame’: 100 obs. of 4 variables:


## $ NEGOCIO : chr "NEGOCIO1" "NEGOCIO2" "NEGOCIO3" "NEGOCIO4" ...
## $ SECTOR : chr "SECTOR1" "SECTOR1" "SECTOR2" "SECTOR1" ...
## $ VENTAS_PRECOVID : num 1857 1694 1758 2173 2010 ...
## $ VENTAS_POSTCOVID: num 1380 1358 1716 1309 1232 ...

attach(ventas)

a) Debido a que el p valor de la prueba de 0.2753 es superior a 0.05, se dice que el promedio de las ventas pre
emergencia es igual a $2000

t.test(VENTAS_PRECOVID,mu=2000,alternative="two. sided")

##
## One Sample t-test
##
## data: VENTAS_PRECOVID
## t = -1.0971, df = 99, p-value = 0.2753
## alternative hypothesis: true mean is not equal to 2000
## 95 percent confidence interval:
## 1907.686 2026.579
## sample estimates:
## mean of x
## 1967.132

b) Debido a que el p valor de la prueba de 0.02958 es inferior a 0.05, se rechaza la hipotesis nula, por lo tantola metia
del sector 1 es superior a la del sector 2

t.test(VENTAS_PRECOVID~SECTOR,alternative="greater")

##
## Welch Two Sample t-test
##
## data: VENTAS_PRECOVID by SECTOR
## t = 1.9102, df = 93.966, p-value = 0.02958
## alternative hypothesis: true difference in means between group SECTOR1 and group SECTOR2 is greater
## 95 percent confidence interval:
## 14.57122 Inf
## sample estimates:
## mean in group SECTOR1 mean in group SECTOR2
## 2020.796 1908.997

2
c)Debido a que el p valor de la prueba de 2.2e-16 es inferior a 0.05, se rechaza la hiptesis nula, por lo tanto sedice que
las ventas promedio post pandemia son inferiores a $2000
t.test(VENTAS_POSTCOVID,mu=2000,alternative="less")

##
## One Sample t-test
##
## data: VENTAS_POSTCOVID
## t = -27.176, df = 99, p-value < 2.2e-16
## alternative hypothesis: true mean is less than 2000
## 95 percent confidence interval:
## -Inf 1504.349
## sample estimates:
## mean of x
## 1472.095

d)
Debido a que el p valor de la prueba de 0.05916 es superior a 0.05, no se rechaza la hipotesis nula, por lo
tanto la media de las ventas en el sector 1 y 2 despues de la pandemia son iguales

t.test(VENTAS_PRECOVID~SECTOR,alternative="two.sided")

##
## Welch Two Sample t-test
##
## data: VENTAS_PRECOVID by SECTOR
## t = 1.9102, df = 93.966, p-value = 0.05916
## alternative hypothesis: true difference in means between group SECTOR1 and group SECTOR2 is not equa
## 95 percent confidence interval:
## -4.409132 228.005286
## sample estimates:
## mean in group SECTOR1 mean in group SECTOR2
## 2020.796 1908.997

e) Debido a que el p valor de la prueba de 5.436e-31 es unferior a 0.05, se rechaza la hipotesis nula, por lo tantolas ventas
pre emergencia sanitaria es mayor que el p valor de las ventas post pandemia

mean_pre<-mean(VENTAS_PRECOVID)
var_pre<-var(VENTAS_PRECOVID)
n_pre<-length(VENTAS_PRECOVID)

mean_post<-mean(VENTAS_POSTCOVID)
var_post<-var(VENTAS_POSTCOVID)
n_post<-length(VENTAS_POSTCOVID)

t<-(mean_pre-mean_post)/sqrt(var_pre/n_pre+var_post/n_post)
p_value<-2*pt(abs(t),n_pre+n_post-2,lower.tail=FALSE)
print(paste("t: ",round(t,2)," ","P valor: ",p_value))

## [1] "t: 13.86 P valor: 5.43669143309298e-31"

3
PREGUNTA 4

setwd("C:/Users/USER/Downloads")
pesos <- read.csv2("PESOS.csv",sep=";",dec=",")
str(pesos)

## ’data.frame’: 60 obs. of 3 variables:


## $ SEXO : chr "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" ...
## $ PREV_TRAT: num 80.4 77.4 68.7 70.2 64.6 ...
## $ POST_TRAT: num 67.9 54.4 71.9 61.1 66.6 ...

attach(pesos)

a)
Debido a que el p valor de la prueba de hipotesis de 0.6051 es superior a 0.05 por lo tanto no se rechaza la
hipotesis nula, es decir el promedio de los pesos de las mujeres previo al tratamiento es igual a 70Kg

t.test(PREV_TRAT[SEXO=="FEMENINO"],mu=70,alternative="two.sided")

##
## One Sample t-test
##
## data: PREV_TRAT[SEXO == "FEMENINO"]
## t = 0.52276, df = 29, p-value = 0.6051
## alternative hypothesis: true mean is not equal to 70
## 95 percent confidence interval:
## 66.87402 75.27264
## sample estimates:
## mean of x
## 71.07333

b)
Debido a que el p valor de 0.003405 es inferior al nivel de significancia de 0.05 se rechaza la hipotesis nula,
por lo tanto se dice que el peso de hombres y mujeres previos al tratamiento son distintos

t.test (PREV_TRAT~SEXO,alternative="two.sided")

##
## Welch Two Sample t-test
##
## data: PREV_TRAT by SEXO
## t = -3.0544, df = 57.911, p-value = 0.003405
## alternative hypothesis: true difference in means between group FEMENINO and group MASCULINO is not e
## 95 percent confidence interval:
## -14.401714 -2.998286
## sample estimates:
## mean in group FEMENINO mean in group MASCULINO
## 71.07333 79.77333

4
c) Debido a que el p valor de la prueba de 0.4547 es mayor a 0.05, no se rechaza la hipotesis nula, por lo
tanto se dice que el el peso promedio de los hombres antes del tratamiento es inferior a 80Kg

t.test(PREV_TRAT[SEXO=="MASCULINO"],mu=80,alternative="less")

##
## One Sample t-test
##
## data: PREV_TRAT[SEXO == "MASCULINO"]
## t = -0.11482, df = 29, p-value = 0.4547
## alternative hypothesis: true mean is less than 80
## 95 percent confidence interval:
## -Inf 83.12763
## sample estimates:
## mean of x
## 79.77333

d)
Debido a que el p valor de la prueba es de 2.124e-09 que es inferior a 0.05 se rechaza la hipotesis nula, por
lo tanto, el peso medio de las mujeres posterior al tratamiento es menor al peso promedio de los hombres
posterior al tratamiento

t.test(POST_TRAT~SEXO,alternative="less")

##
## Welch Two Sample t-test
##
## data: POST_TRAT by SEXO
## t = -6.932, df = 56.65, p-value = 2.124e-09
## alternative hypothesis: true difference in means between group FEMENINO and group MASCULINO is less
## 95 percent confidence interval:
## -Inf -7.46884
## sample estimates:
## mean in group FEMENINO mean in group MASCULINO
## 65.38367 75.22700

e) Debido a que el p valor de la prueba es inferior al nivel de significancia de 0.05, se rechaza la hiptesis nula,
por lo tanto se dice que el promedio de los pesos previos al tratamiento son superiores a los pesos posteriores
al tratamiento

mean_pre<-mean(PREV_TRAT)
var_pre<-var(PREV_TRAT)
n_pre<-length(PREV_TRAT)

mean_post<-mean(POST_TRAT)
var_post<-var(POST_TRAT)
n_post<-length(POST_TRAT)

t<-(mean_pre-mean_post)/sqrt(var_pre/n_pre+var_post/n_post)
p_value<-pt(abs(t),n_pre+n_post-2,lower.tail=FALSE)
print(paste("t: ",round(t,2)," ","P valor: ",p_value))

## [1] "t: 2.85 P valor: 0.00256652216303271"

5
PREGUNTA 5

setwd("C:/Users/USER/Downloads")
turismo<-read.csv2("tourism.csv”, sep=";",dec=",")
attach(turismo)
str(turismo)

## ’data.frame’: 150 obs. of 16 variables:


## $ guest : int 1 2 3 4 5 6 7 8 9 10 ...
## $ accommodation : int 3 4 3 2 2 1 3 3 3 3 ...
## $ stay : int 5 5 7 5 2 7 6 6 5 8 ...
## $ diversity : int 41 90 78 84 68 77 98 48 100 96 ...
## $ waitingtime : int 31 68 43 44 33 39 57 61 91 73 ...
## $ safety : int 91 76 76 61 76 94 68 90 78 100 ...
## $ quality : int 25 73 10 26 21 55 22 80 18 10 ...
## $ satisfaction : int 67 63 49 64 48 79 63 62 96 81 ...
## $ price : int 1 3 1 1 2 3 2 2 3 3 ...
## $ expenses : int 368 427 331 341 347 359 351 383 444 394 ...
## $ recommendation: int 1 3 4 3 3 2 3 3 1 1 ...
## $ skiholiday : int 1 1 0 0 1 0 1 1 1 0 ...
## $ sex : int 0 1 0 1 0 0 1 0 1 0 ...
## $ country : int 1 1 2 4 2 2 1 3 1 1 ...
## $ age : int 42 50 44 41 43 38 47 66 62 49 ...
## $ education : int 4 3 2 1 4 2 3 4 1 4 ...

a) Debido a que el p valor 0.005295 de la prueba es inferior a 0.05, se rechaza la hipotesis nula, por lo tanto
se dice que el indice de satisfaccion de los huespedes si ha aumentado

t.test(satisfaction,mu=60,alternative="greater")

##
## One Sample t-test
##
## data: satisfaction
## t = 2.5887, df = 149, p-value = 0.005295
## alternative hypothesis: true mean is greater than 60
## 95 percent confidence interval:
## 61.31265 Inf
## sample estimates:
## mean of x
## 63.64

b) Debido a que el p valor de la prueba es de 1, no se rechaza la hipotesis nula por lo tanto, el gasto de las
mujeres es menor que el de los hombres

t.test(expenses~sex,alternative="greater”, conf.level=0.9)

##
## Welch Two Sample t-test
##

6
## data: expenses by sex
## t = -5.7641, df = 141.56, p-value = 1
## alternative hypothesis: true difference in means between group 0 and group 1 is greater than 0
## 90 percent confidence interval:
## -52.21553 Inf
## sample estimates:
## mean in group 0 mean in group 1
## 349.3647 392.0462

PREGUNTA 6

library(mlbench)

## Warning: package ’mlbench’ was built under R version 4.1.2

pima<-data("PimaIndiansDiabetes2")
pima<-PimaIndiansDiabetes2
attach(pima)

## The following object is masked from turismo:


##
## age

## The following object is masked from package:datasets:


##
## pressure

a) Debido a que el p valor de la prueba de 2.2e-16 es menor a 0.05, se rechaza la hipotesis nula por lo tanto,
la media de la insulina en los pacientes es mayor que cero

t.test(insulin,mu=0,alternative="greater")

##
## One Sample t-test
##
## data: insulin
## t = 25.995, df = 393, p-value < 2.2e-16
## alternative hypothesis: true mean is greater than 0
## 95 percent confidence interval:
## 145.6824 Inf
## sample estimates:
## mean of x
## 155.5482

Debido a que el p valor de la prueba de 2.2e-16 es menor a 0.05, se rechaza la hipotesis nula por lo tanto, la
media de la masa en los pacientes es mayor que cero

7
t.test(mass,mu=0,alternative="greater")

##
## One Sample t-test
##
## data: mass
## t = 128.96, df = 756, p-value < 2.2e-16
## alternative hypothesis: true mean is greater than 0
## 95 percent confidence interval:
## 32.04296 Inf
## sample estimates:
## mean of x
## 32.45746

b) Debido a que el valor del cociente entre la varianza de mass y triceps es inferior a 1, se dice que las
varianzas son iguales

var_mass<-var(mass,na.rm=TRUE)
var_tricep<-var(triceps,na.rm=TRUE)

F_value<-var_mass/var_tricep

PREGUNTA 7
a)

programa<-data.frame(cliente=rep(1:16,times=2),
pesos=c(56,95,78,67,59,81,60,56,70,78,82,71,90,101,54,60,
52,91,77,65,54,78,54,55,65,76,82,66,88,94,53,55),
instante=c(rep("Antes",times=16),rep("Despues",times=16)))
attach(programa)

## The following object is masked _by_ .GlobalEnv:


##
## pesos

b) Debido a que el p valor de la prueba es superior al nivel de significancia de 0.05, no existe evidencia
significativa para rechazar la hipotesis nula, por lo tanto, no hubo una perdida de peso de por lo menos 3Kg

t.test(programa$pesos~instante,paired=TRUE,mu=3,alternative="greater")

##
## Paired t-test
##
## data: programa$pesos by instante
## t = 0.59847, df = 15, p-value = 0.2792
## alternative hypothesis: true difference in means is greater than 3
## 95 percent confidence interval:
## 2.397119 Inf
## sample estimates:
## mean of the differences
## 3.3125

8
PREGUNTA 8
a)

setwd("C:/Users/USER/Downloads")
sueldos<-read_excel("sueldos.xlsx") #Base en formato wide

## New names:
## * ‘‘ -> ...2
## * ‘‘ -> ...3
## * ‘‘ -> ...4
## * ‘‘ -> ...6
## * ‘‘ -> ...7
## * ...

grupo1 <- sueldos[,1:4]


grupo2 <- sueldos[,4:8]

colnames(grupo1)<-c("v1","v2","v3","v4")
colnames(grupo2) <-c("v1","v2","v3","v4")

x<-c(grupo1$v1,grupo1$v2,grupo1$v3, grupo1$v4)
y<-c(grupo2$v1,grupo2$v2,grupo2$v3,grupo2$v4)

base <- data.frame(grupo=c(rep ("Grupo 1",times=72),rep("Grupo


2",times=72)),sueldo=c(x,y)) # Base en formato long
attach(base)

b)Igualdad de varianzas
Debido a que el p valor de 0.3854 es superior al nivel de significancia de 0.05, no se rechaza la hipotesis nula,
por lo tanto la varianza entre los grupos es igual

bartlett.test(sueldo~grupo)

##
## Bartlett test of homogeneity of variances
##
## data: sueldo by grupo
## Bartlett’s K-squared = 0.79843, df = 1, p-value = 0.3716

Debido a que el p valor de la prueba de 0.03492 es inferior al nivel de significancia de 0.05, se rechaza la
hipotesis nula, por lo tanto se dice que la media poblacional del sueldo en ambos grupos es distinta

t.test(sueldo~grupo,alternative="two.sided")

##
## Welch Two Sample t-test
##
## data: sueldo by grupo
## t = -1.6517, df = 140.42, p-value = 0.1008

9
## alternative hypothesis: true difference in means between group Grupo 1 and group Grupo 2 is not equa
## 95 percent confidence interval:
## -4108.7929 368.3762
## sample estimates:
## mean in group Grupo 1 mean in group Grupo 2
## 17410.00 19280.21

10

También podría gustarte