Está en la página 1de 25

Diseño Completamente al Azar

Taller de Aplicaciones Estadísticas en las Distintas Areas

Dra. Katia García Alfaro

EP Matemática - UNSAAC

18 de febrero de 2021

(EP Matemática - UNSAAC) 18 de febrero de 2021 1 / 25


Diseño Completamente al Azar

Introducción
Es un diseño en el cual los tratamientos son designados
completamente al azar a las unidades experimentales y viceversa.
Este diseño no impone restricciones tales como el bloqueo en las
distribuciones de los tratamientos a las unidades experimentales.
Debido a su simplicidad es usado ampliamente, pero el investigador
debe ser cuidadoso y usarlo solo en los casos que solo se dispone de
unidades homogéneas de lo contrario no es posible hacer uso del
diseño completamente al azar. Pero utilizando algún bloqueo para
incrementar la eficiencia del diseño sería posible resolver problemas
en los cuales no se disponga de unidades experimentales
homogéneas.

(EP Matemática - UNSAAC) 18 de febrero de 2021 2 / 25


Modelo Estadístico

El modelo adecuado para los datos de un criterio de clasificación o


Diseño completamente aleatorio es el siguiente:

Yij = µ + τi + εij ; i = 1, 2, ..., t , j = 1, 2, ..., r (1)

Donde, µ es la media general; P


τi es el efecto del i-ésimo tratamiento sujeto a τi = 0
εij es el efecto del error, son variables aleatorias independientes con
distribución normal que tiene media cero y varianza común σ 2 .

(EP Matemática - UNSAAC) 18 de febrero de 2021 3 / 25


Análisis del Modelo del Diseño Completo al Azar

Arreglo Tabular
Este diseño es conveniente cuando la variabilidad está uniformemente
distribuida en las unidades experimentales, hecho que es la base para
poder hallar validamente una varianza común para todas las muestras
de los tratamientos en estudio.
El análisis del diseño experimental se inicia con el arreglo tabular de
los resultados.

A1 A2 ··· At
Y11 Y21 ··· Yt1
.. .. .. ..
. . . .
Y1r Y2r · · · Ytr
Y1 . Y2 . · · · Yt .
Pr
Y .. = ti=1 rj=1 Yij
P P
Yi . = j=1 Yij ;

(EP Matemática - UNSAAC) 18 de febrero de 2021 4 / 25


Análisis del Modelo del Diseño Completo al Azar
Estimadores del modelo por mínimos cuadrados
Sea εij = Yij − (µ + τi ) y se define
t X
X r
ϕ = (εij )2
i=1 j=1

Se debe encontrar
t X
X r
mı́n ϕ = mı́n (Yij − µ − τi )2
µ, τi µ, τi
i=1 j=1

Esto significa que debemos hallar la solución de las ecuaciones


formadas por las derivadas parciales con respecto a cada uno de los
componentes del modelo e igualar a cero:

∂ϕ ∂ϕ
= 0; = 0; , para cada i fijado; i = 1, · · · , t;
∂µ ∂ τi
(EP Matemática - UNSAAC) 18 de febrero de 2021 5 / 25
Análisis del Modelo del Diseño Completo al Azar

Estimadores del modelo por mínimos cuadrados


Así:
r
t X
∂ϕ X
= −2 (Yij − µ − τi ) = 0
∂µ
i=1 j=1

µ̂ = Ȳ ..

Para cada i fijado


r r
∂ϕ X X
= −2 (Yij − µ − τi ) = 0 ⇒ Yij − r Ȳ .. − r τi = 0
∂ τi
j=1 j=1

τ̂i = Ȳi . − Ȳ ..

(EP Matemática - UNSAAC) 18 de febrero de 2021 6 / 25


Análisis del Modelo del Diseño Completo al Azar
Para contrastar la hipótesis nula de que las medias de los tratamientos
son todas iguales usamos el análisis de varianza (proceso mediante el
cual la variación total se distribuye en componentes atribuibles a
diferentes fuentes), en este caso se distribuye esta variabilidad entre
tratamientos y dentro de tratamientos.
Analisis de Varianza
Es una técnica estadística que sirve para analizar la variación total de
los resultados experimentales de un diseño en particular,
descomponiéndolo en fuentes de variación independientes atribuibles
a cada uno de los efectos en que constituye el diseño experimental.
Es la descomposición de la variación total en varias fuentes de
variabilidad especificadas en el modelo aditivo lineal, expresadas por
una suma de las fuentes de variación.

Varianza total = Inter − varianza + Intra − varianza.

(EP Matemática - UNSAAC) 18 de febrero de 2021 7 / 25


Análisis del Modelo del Diseño Completo al Azar

Analisis de Varianza
En términos de suma de cuadrados se tiene:
t X
X r t
X t X
X r
2 2
(Yij − Ȳ ..) = r (Ȳi . − Ȳ ..) + (Yij − Ȳi .)2
i=1 j=1 i=1 i=1 j=1
SC Total = SC Tratamiento + SC Error

(EP Matemática - UNSAAC) 18 de febrero de 2021 8 / 25


Análisis del Modelo del Diseño Completo al Azar
Analisis de Varianza
El análisis de varianza se resume en la siguiente Tabla
Fuente de Grados de Suma de Cuadrado E(CM)
Variación Libertad Cuadrados Medio M. Fijo M. Azar
CMT = SCT r
σ 2 + t−1 τi2 σ 2 + r στ2
P
Tratamiento t −1 SCT t−1
SCE
Residual t(r − 1) SCE CME = t(r −1)
σ2 σ2
Total tr − 1 SCTot

Suma de cuadrados
r
t X
X Y··2
SCTot = Yij2 −
tr
i=1 j=1
Pt 2
Y··2
i=1 Yi·
SCT = −
r tr
t r Pt
XX
2 Y2
SCE = Yij − i=1 i· = SCTot − SCT
r
i=1 j=1
(EP Matemática - UNSAAC) 18 de febrero de 2021 9 / 25
Pruebas de los efectos de tratamientos
Para probar el efecto de los tratamientos se plantea las siguientes
hipótesis:

Ho : τ1 = τ2 = ... = τt = 0
Ha : no todas las τi son iguales a cero

Considerando Las esperanzas de los cuadrados medios el estadístico


de Prueba es el estadístico F
r P 2
σ 2 + t−1 τi
F = 2
σ
Por lo tanto
CMT
Fc =
CME
Tiene distribución F con t − 1 y t(r − 1) grados de libertad
(EP Matemática - UNSAAC) 18 de febrero de 2021 10 / 25
Pruebas de los efectos de tratamientos

Para tomar la decisión de aceptar o rechazar la hipótesis nula existen


dos alternativas:
1 Usar el punto crítico de la región de rechazo que consiste en
hallar el punto F0 tal que P(F > F0 ) = α, donde α es el nivel de
significación.
2 Usar el nivel crítico que consiste en encontrar la probabilidad
Pv = P(F > Fc )·
Por lo tanto
Si se halla el punto crítico F0 , entonces se rechaza la Hipótesis
nula si Fc > F0 , caso contrario se acepta H0
Si se halla el nivel crítico Pv , entonces se rechaza la Hipótesis
nula si Pv < α, caso contrario se acepta H0

(EP Matemática - UNSAAC) 18 de febrero de 2021 11 / 25


Ejemplo

Se administra una prueba de inglés a tres clases I, II, y III con la


finalidad de contrastar su nivel de aprendizaje en las tres aulas. Se
toman muestras aleatorias de 7 alumnos de cada clase obteniéndose
las siguientes puntuaciones.

Clase I 76 68 64 78 79 71 69
Clase II 79 79 77 73 81 78 80
Clase III 94 84 96 88 81 78 86

A qué conclusión se llega con un nivel de significación del 5 %?.

(EP Matemática - UNSAAC) 18 de febrero de 2021 12 / 25


Ejemplo
Modelo
Para analizar estos datos el modelo apropiado es el siguiente:

Yij = µ + τi + εij ; i = 1, 2, · · · , t; j = 1, 2, · · · , r ; t = 3, r = 7

En términos del problema: Es un modelo de efectos fijos y balanceado, pues, se quiere estudiar
nivel de aprendizaje en las tres aulas y se toman al azar 7 alumnos de cada clase
Yij es el puntaje de la prueba de inglés del j-ésimo alumno (unidad experimental) que
pertenece a la i-ésima clase (tratamiento).
µ es la media general
τi es el efecto del
Pi-ésimo tratamiento. es de efecto fijo pues solo son tres clases, entonces
está sujeto a τi = 0
εij es el efecto del error, son variables aleatorias independientes con distribución normal que
tiene media cero y varianza común σ 2 .
Sumas

Y1 . = 76 + 68 + ... + 69 = 505 ; Y2 . = 79 + 79 + ... + 80 = 547


Y3 . = 94 + 84 + ... + 86 = 607 ; Y .. = Y1 . + Y2 . + Y3 . = 1659
t X
X r
Yij2 = (76)2 + (68)2 + · · · + (78)2 + (86)2 = 132301
i=1 j=1
(EP Matemática - UNSAAC) 18 de febrero de 2021 13 / 25
Ejemplo

Análisis de Varianza
La descomposición de la variación total en varias fuentes de variabilidad especificadas en el
modelo aditivo lineal son expresadas por una suma de las fuentes de variación en este caso se
distribuye esta variabilidad entre tratamientos (Tratamiento o Factor)y dentro de tratamientos
(Error o Residual).
Las Suma de cuadrados de estas fuentes de variación halladas con los puntajes de las pruebas
de ingles en las tres clases son los siguientes:

t X
r 2
X 2 Y·· (1659)2
SCTot = Yij − = 132301 − = 132301 − 131061 = 1240
i=1 j=1
tr 21
Pt
i=1 Yi·2 2
Y·· (505)2 + (547)2 + (607)2 (1659)2
SCT = − = − = 131811,9 − 131061 = 750,9
r tr 7 21
t X
r Pt
X 2 i=1 Yi·2
SCE = Yij − = SCTot − SCT = 1240 − 750,9 = 489,1
i=1 j=1
r

Los cuadrados medios son los componentes de la variacion son:

SCT 750,9 SCE 489,1


CMT = = = 375,43 ; CME = = = 27,17
t −1 2 t(r − 1) 18

(EP Matemática - UNSAAC) 18 de febrero de 2021 14 / 25


Ejemplo
El análisis de varianza se resume en la siguiente Tabla
Fuente de Grados de Suma de Cuadrado Estadistico de
Variación Libertad Cuadrados Medio Prueba F
Tratamiento t −1=2 SCT = 750,9 CMT = 375,43 Fc = 13,82
Residual t(r − 1) = 18 SCE = 489,1 CME = 27,18
Total tr − 1 = 20 SCTot = 1240

Pruebas de los efectos de tratamientos


En el modelo de efectos fijos se plantea las siguientes hipótesis:

Ho : τ1 = τ2 = τ3 = 0 vs. Ha : No todas las τi son iguales a cero

Por lo tanto el estadístico de Prueba es el estadístico F

CMT 375,43
Fc = = = 13,82
CME 27,18

Tiene distribución F con t − 1 = 2 y t(r − 1) = 18 grados de libertad, así el punto crítico es

F0 = F[α, (t−1), (t(r −1))] = F[0,05; 2; 18] = 3,555

Como Fc = 13,82 > 3,555 = F0 entonces se rechaza la hipótesis nula lo que significa que si hay difrencias significativas en
los promedios de los puntajes de las pruebas de inglés entre las clases.

(EP Matemática - UNSAAC) 18 de febrero de 2021 15 / 25


Supuestos del modelo estadístico

1 Aditividad.- Los factores o componentes de una población tienen


efectos aditivos.
2 Linealidad.- La relación existente entre los factores o
componentes de una población es del tipo lineal.
3 Normalidad.- Los valores observados o resultados experimentales
provienen de una distribución normal con media µ y variancia σ 2 .
4 Independencia.- Los resultados observados de un experimento
son independientes entre sí.
5 Homogeneidad de Variancias.- Las diversas poblaciones
generadas por la aplicación de dos o más tratamientos tienen
variancias homogéneas. (Variancia común)
6 Los efectos del error experimental tienen una distribución normal
e independiente con media cero y variancia σε2 .

(EP Matemática - UNSAAC) 18 de febrero de 2021 16 / 25


Verificación de los supuestos
Análisis residual para evaluar los supuestos
Las suposiciones para el modelo en cuanto a la homogeneidad de las
varianzas y la distribución normal, se pueden evaluar con los
residuales.
Los residuales para el diseño completamente al azar se calculan
como la desviación de los valores observados con respecto a las
medias estimadas para cada tratamiento en el arreglo tabular; el
residual estimado de cualquier celda es eij = Yij − Ŷij = Yij − Ȳi .
Las gráficas de los residuales contra los valores estimados y de la
probabilidad normal de los residuales nos dan una muestra de la
evaluacion de la homocedasticidad y la normalidad respectivamente.
Las pruebas estadísticas para probar estos supuestos son las
pruebas de Bartlet o Levene para homogeneidad de varianzas, la
prueba de Smirnov para normalidad.
Para probar independencia se usa la prueba de aleatoriedad de
Rachas.
(EP Matemática - UNSAAC) 18 de febrero de 2021 17 / 25
Verificación de los supuestos

Prueba de normalidad
La prueba de Smirnov Kolmogorov (prueba K-S) se utiliza para probar la normalidad. Se trata de
una prueba de bondad de ajuste. Mide el grado de concordancia entre la distribución de un
conjunto de datos y una distribución teórica específica.
La hipótesis nula (H0 ) establece que la distribución empírica es similar a la distribución teórica.
La hipótesis alterna (H1 ) establece que la distribución de frecuencias observada no es
consistente con la distribución teórica.
El procedimiento para realizar esta prueba es el siguiente:
1 Especificar la distribución nula (distribución normal) y estimar sus parámetros (media, varianza y desviación estándar).
2 Ordenar los valores de la muestra en forma ascendente, de menor a mayor (X(1) , X(2) , · · · , X(n) ).
3 hallar su frecuencia acumulada relativa. (Función de distribución empirica Sn (Xi ))
X(i) − X̄
4 Para cada valor de la muestra X(i) calcular la variable aleatoria normal estándar : Zi = .
Sx
5 Calcular la función de distribución teórica F0 (Xi ) = F (Zi ).
6 Para cada valor de la muestra se calcula la diferencia entre F0 (Xi ) y Sn (Xi ), y se busca la máxima diferencia Dmax =
Max|F0 (Xi ) − Sn (Xi )|, i = 1, 2, ..., n.
7 Se busca en la tabla el valor crítico Dmax p(α, n) con el nivel de significancia α. Si el valor observado Dmax es menor o
igual que el valor crítico, entonces, se acepta la hipótesis nula de que no existen diferencias significativas entre la
distribución teórica y la distribución dada por los resultados muestrales.

(EP Matemática - UNSAAC) 18 de febrero de 2021 18 / 25


Verificación de los supuestos
Prueba de homogeneidad de varianzas
las pruebas de Bartlet o Levene se usan para probar la homogeneidad de varianzas de los
errores
Para las pruebas de varianzas iguales, las hipótesis son:
H0 : Todas las varianzas son iguales
H1 : No todas las varianzas son iguales
La prueba de Bartlett es exacta solo para datos distribuidos normalmente. El estadístico de
prueba de Bartlett calcula el promedio aritmético ponderado y el promedio geométrico
ponderado de cada varianza de muestra basada en los grados de libertad. Mientras mayor sea la
diferencia en los promedios, es más probable que las varianzas de las muestras no sean iguales.
El estadístico B sigue una distribución χ2 con k − 1 grados de libertad. Si el valor p es menor
que el nivel α, se rechaza la hipótesis nula de que las varianzas son iguales.

νi Si2 / νi − νi ln(Si2 )
P P P  P
νi ln
B =    (2)
1 P 1 1
1+ −P
3(k − 1) νi νi
Pni
j=1 (Xij − X̄ )2
Donde Si2 es la varianza de la i-ésima muestra, tal que Si2 =
ni − 1
k es el número de muestras
νi = ni − 1
ni es el número de observaciones de la i-ésima muestra
(EP Matemática - UNSAAC) 18 de febrero de 2021 19 / 25
Verificación de los supuestos
Prueba de independencia
Para probar independencia se usa la prueba de aleatoriedad de Rachas.
En una determinada secuencia de sucesos observables la interacción entre elementos iguales lo
denominaremos comoracha.
Por rachas o corrida se entiende a una sucesión de símbolos idénticos que estan separados por
otro tipo de símbolos.
El no de elementos de una racha se llama longitud
El Test de Rachas contrasta la aleatoriedad de una secuencia de eventos a partir del no de
rachas R de la misma.
Cuando los datos son cuantitativos para aplicar el test de rachas se realiza el siguiente
procedimiento:
1 Se calcula la media muestral u otro criterio de comparación, K
2 Se obtiene la diferencia entre cada valor y K , asignándole el signo correspondiente. Se
eliminan los valores cero
3 Se forman las rachas tomando en cuenta la sucesión de signos + ó -
4 Se calcula el número n1 de elementos de una clase identificadas por el signo - y n2 la
cantidad de elementos que tienen signo +.
5 Se distribuyen los datos con sus signos en el orden en que ocurrieron.
6 Se cuenta el número r de rachas.
7 Se calcula el estadistico de prueba Zc .

(EP Matemática - UNSAAC) r − µr 18 de febrero de 2021 20 / 25


Z = ∼ N(0 , 1) (3)
Verificación de los supuestos
Ejemplo
En el Ejemplo de la prueba de inglés aplicada a las clases (I, II y III): Las gráficas de los
residuales contra los valores estimados y de la probabilidad normal de los residuales nos dan
una muestra de la evaluación de la homocedasticidad y la normalidad respectivamente.

Figura 1: Gráficas de residuos para Puntaje

(EP Matemática - UNSAAC) 18 de febrero de 2021 21 / 25


Verificación de los supuestos
En la figura 1 podemos observar cuatro graficos: el primero superior
izquierda es el gráfico de la probabilidad normal donde se observa que los
puntos residuales se encuentran todos muy cerca o practicamente en la linea
de cuantiles del la normal, por lo que podemos decir que lod residuos tienen
distribución normal. El grafico superior derecha es el grafico de los residuos
vs. valores estimados y sirve para analizar la homogeneidad de varianzas, se
puede observar que el ultimo grupo pereciera que tiene una mayor
dispersion que los dos anteriores por lo que sera necesario hacer la prueba
de homogeneidad de varianzas. El grafico inferior derecho es el grafico de
residuos vs. el orden que fueron arreglados para su analisis en este grafico
se observa que no hay un patron regular de los datos por lo que se puede
aseverar que hay independencia de las observaciones.

Pruebas
1 Prueba de normalidad
2 Prueba de homogeneidad de varianzas
3 Prueba de independencia
(EP Matemática - UNSAAC) 18 de febrero de 2021 22 / 25
Verificación de los supuestos

Prueba de normalidad

Figura 2: Gráficas de residuos para Puntaje

En la figura 2 se comprueba la normalidad de los residuos pues Pvalor es


mayor a 0,05

(EP Matemática - UNSAAC) 18 de febrero de 2021 23 / 25


Verificación de los supuestos

Prueba de homogeneidad de varianzas


Prueba de igualdad de varianzas: RESID vs. clase Método
Hipótesis nula Todas las varianzas son iguales
Hipótesis alterna Por lo menos una varianza es diferente
Nivel de significancia α = 0,05
Se utiliza el método de Bartlett. Este método es exacto sólo para datos normales.
Intervalos de confianza de Bonferroni de 95 % para desviaciones estándar

CLASES N Desv.Est. IC
I 7 5.63999 (3.32415; 15.3034)
II 7 2.60951 (1.53801; 7.0806)
III 7 6.55017 (3.86060; 17.7730)

Nivel de confianza individual = 98,3333 %


Método: Prueba de Bartlett
Estadística de prueba B = 4,30 con Pvalor = 0,116
Como 0,116 es mayor que 0,05 se acepta la hipotesis nula esto es, hay
homogeneidad de varianzas.

(EP Matemática - UNSAAC) 18 de febrero de 2021 24 / 25


Verificación de los supuestos

Prueba de independencia
Prueba de corridas: RESID Estadísticas descriptivas

Número de observaciones
N K ≤K >K
21 0 11 10
K = media de la muestra

Prueba:
Hipótesis nula H0 : El orden de los datos es aleatorio
Hipótesis alterna H1 : El orden de los datos no es aleatorio
Número de corridas:
Número de corridas Observado = 12 ;
Número de corridas Esperado = 11,482 y Pvalor = 0,814
Como 0,814 es mayor que 0,05 se acepta la hipotesis nula esto es, hay
independencia de los errores.

(EP Matemática - UNSAAC) 18 de febrero de 2021 25 / 25

También podría gustarte