Está en la página 1de 24

Estadística Aplicada II

Profesores del curso


Jaime Porras: jporras@ulima.edu.pe
Marycruz Silva: msilvap@ulima.edu.pe
Unidad 1: Análisis de Datos Experimentales

Diseño Completamente al Azar (DCA)


Contenido:

1. Conceptos Básicos
2. Diseño Experimental
3. Diseño Completamente al Azar (DCA)
3.1 Modelo Aditivo Lineal
3.2 Supuestos del modelo estadístico
3.3 Análisis de Varianza
3.4 Pruebas de Comparación

Uso del programa R

Aplicación
“Toda la vida es un experimento, cuantos
más experimentos hagas mejor.”

Ralph Waldo Emerson


Prueba de Hipótesis
H 0:
H 1:

pvalor

Conclusión

Si pvalor <  se rechaza H0


Si pvalor ≥  no se rechaza H0
1. Conceptos Básicos

Factor:
Es una variable independiente que afecta los resultados del
experimento, es controlado por el investigador y de interés estudiarlo.

Tratamiento:
Son los niveles del factor que se desean comparar.

Variable respuesta (Variable dependiente):


Es la característica que se desea analizar.

Unidad experimental:
Es la unidad básica de análisis a la cual se le aplica un tratamiento.
2. Diseño Experimental
Es la distribución de los tratamientos a las unidades experimentales.
Así, también involucra la elección del tamaño muestral y la
disposición de las unidades experimentales.

El uso del diseño experimental adecuado permite minimizar el error


experimental.

3. Diseño Completamente al Azar (DCA)


En este tipo de diseño, se espera que las unidades experimentales
sean homogéneas. Es decir solo los tratamientos puedan afectar los
cambios en la variable respuesta.
En este diseño no existe restricción en la aleatorización.
3. Diseño completamente al azar (DCA)
3.1 Modelo Aditivo Lineal
Es una representación matemática de las relaciones existentes entre los
factores o componentes considerados en un diseño experimental
Yij     i   ij
Yij: Variable respuesta obtenida al aplicar el tratamiento i en la unidad
experimental j.
: Media general
i: Efecto del tratamiento i
ij: Error experimental obtenida al aplicar el tratamiento i en la unidad
experimental j.
 i =1, 2, … , k (tratamiento o grupo)
 j = 1, 2, … , r (repetición)
 n = kr (número de observaciones)
3. Diseño completamente al azar (DCA)
3.2 Supuestos del modelo estadístico

● El valor esperado de los errores es E(ij) = 0

● La varianza de los errores es V(ij) =


(Homocedasticidad)

● Los errores aleatorios se ajustan a una distribución Normal: ij ~ N(0, )


(Normalidad)

● Los errores aleatorios ij son independientes


3. Diseño completamente al azar (DCA)
3.3 Análisis de varianza (ANVA o ANOVA)
Fuente de Grados de Suma de Cuadrados
Variación Libertad Cuadrados Medios
GL SC CM

k
y ∗2 j y 2∗∗
SCTrat=∑ − CMTrat =
SCTrat
F =
CMTrat
Entre grupos k–1 j=1 nj n k −1 c
CME

Dentro de los SCE


n–k SCE = SCTotal –SCTrat CME =
grupos (error) n −k

k nj 2
y
SCTotal=∑ ∑ 2
y − ∗∗
Total n –1 j =1 i=1
ij
n

Fc se compara con F(k-1; n-k ;α) criterio unilateral derecho


3. Diseño completamente al azar (DCA)
3.3 Análisis de varianza (ANVA o ANOVA)
Prueba de hipótesis principal
i) Planteamiento de hipótesis
(1 = 2 = ... = k)

ii) Fijar el nivel de significación ():


Supongamos que en el ejemplo desarrollado =0.05

iii) Estadística de prueba: 𝐶𝑀𝑇𝑟𝑎𝑡


𝐹 𝑐=
𝐶𝑀𝐸𝑟𝑟𝑜𝑟
iv) Valor crítico (Punto crítico): v) Regla de decisión
F(k-1; n-k ;α) criterio unilateral derecho
Fc F(k-1; n-k ;α) No se rechaza

Fc F(k-1; n-k ;α) Se rechaza


F(k-1; n-k ;α)

vi) Conclusión
3. Diseño completamente al azar (DCA)
3.4 Pruebas de Comparación

Prueba de Tukey
Esta prueba es útil para realizar todas las comparaciones de medias por
pares de tratamientos.

H 0 : i   j
H1 : i   j

Cuadro Resumen
Conclusión
APLICACIÓN
Aplicación

● Go App es un aplicativo móvil con el cual se pueden obtener


descuentos en muchos establecimientos comerciales.
● Por el momento, el aplicativo ofrece diversas promociones en
rubros como: closet, restaurantes, espectáculos y viajes.
Aplicación
● Antes de lanzar una segunda versión del aplicativo, los
desarrolladores de Go App contrataron los servicios de R&Dgo
Analytics para realizar un estudio de algunas variables que genera
este aplicativo. El público objetivo del estudio son los usuarios que
han utilizado el aplicativo durante estos últimos seis meses.

● Para poder cumplir con sus objetivos se seleccionaron muestras


aleatorias e independientes de usuarios provenientes de diferentes
distritos de Lima.
Aplicación
Entre las variables de interés que se desean analizar se tienen:

● distrito: Distrito de residencia del usuario.


● genero: Género del usuario (Masculino, Femenino).
● edad: Edad del usuario (en años)
● tiempo: Tiempo (en minutos) utilizado en su último ingreso al
aplicativo.
● monto: Monto de dinero (en soles) ahorrado por el uso del aplicativo.
● ofertasC: Número de promociones utilizadas en el rubro Closet.
● ofertasR: Número de promociones utilizadas en el rubro Restaurantes.
● ofertasE: Número de promociones utilizadas en el rubro Espectáculos.
● ofertasV: Número de promociones utilizadas en el rubro Viajes.
● nuevo: Nuevos rubros deseados en el aplicativo (automotriz,
educación y hogar salud)
Aplicación

El principal desarrollador de Go App afirma que el monto medio


ahorrado por el uso del App es diferente de los usuarios provenientes de
al menos uno de los siguientes distritos: “Miraflores”, “Surco” , “San
Borja” o “Los Olivos”.

A un nivel de significación de 0.05, verifique si la afirmación del


desarrollador es cierta.
Aplicación
Variable Factor: Distritos
Tratamientos: Miraflores, Surco , San Borja, Los Olivos; k = 4
Variable Respuesta: Monto ahorrado
Unidad Experimental: Un usuario n = 854

El modelo aditivo lineal:

𝑦 𝑖𝑗=𝜇+ 𝑗 + 𝜀𝑖𝑗 ∀ 𝑗=1, ⋯ , 𝑘;𝑖=1 , ⋯ , 𝑛 𝑗


yij Montos ahorrados
 El monto ahorrado medio global,
j es el efecto del j-ésimo distrito y
ij es el error aleatorio
Script
APLICACIÓN ##### Lectura de datos
DATA <- read.delim("clipboard")

##### Subconjunto de interés


dis=c("Miraflores", "Surco" ,
"San Borja","Los Olivos")

subconjunto <- subset(DATA,


DATA$distrito%in%dis)
PRUEBA DE NORMALIDAD DE ERRORES

APLICACIÓN
Planteamiento de hipótesis:

##### Modelo de DCA


modelo<-lm(monto~distrito, data=subconjunto)
pvalor  
0.107 0.05
##### Generando los residuales del modelo No se rechaza Ho

em <-residuals(modelo)
##### Prueba de normalidad de los errores del
modelo
library(nortest)
##### Prueba Anderson-Darling ”
ad.test(em)
PRUEBA DE HOMOCEDASTICIDAD DE
ERRORES
APLICACIÓN
Planteamiento de hipótesis:

##### Prueba de homocedasticidad de los


errores del modelo pvalor  
0.242 0.05
bartlett.test(em ~ subconjunto$distrito) No se rechaza Ho

##### Valor crítico


qchisq(0.05,3,lower.tail = F)


APLICACIÓN ANÁLISIS DE VARIANZA

##### Cuadro ANOVA


Planteamiento de hipótesis: anova(modelo)

pvalor < 
0.011 < 0.05
Se rechaza Ho
##### Valor crítico
qf(0.05,3,850,lower.tail = F)

3.727
APLICACIÓN
PRUEBA DE COMPARACIÓN DE MEDIAS:
TUKEY

library(agricolae)
HSD.test(modelo,"distrito",gr
oup=T,console=T, alpha=0.05)

También podría gustarte