Está en la página 1de 34

CATEDRA: DISEÑO EXPERIMENTA

DISEÑO EXPERIMENTAL

ANALISIS DE VARIANZA
PARA UN DISEÑO COMPLETAMENTE ALEATORIZADO
(D.C.A.)

Lic. P. Morales

Febrero de 2003
EJERCICIO Nro. 1:

Sea el experimento relacionado con el Estudio del Efecto que produce cinco Variedades de
Maíz sobre el Rendimiento (Kg./parcela.), cuyos resultados son:

Tratamientos Repeticiones (Rendimiento Kg./ha.)


Variedades
de Maíz R1 R2 R3 R4 R5 R6
A 160 156 158 156 160 158
B 158 155 150 152 156 152
C 145 147 144 142 145 146
D 140 135 138 138 136 140
E 130 128 130 131 128 132

RESULTADO DEL ANÁLISIS DE VARIANZA:

Como se puede observar, este experimento unifactorial se plantea con 5 tratamientos y 6


repeticiones, dando un total de 30 Unidades Experimentales, es decir n = t x r = 30.

Luego la tabla resumen de datos, para inicial el análisis de varianza es:

TOTAL (
Repeticiones - Rendimiento Kg./ha.
Variedades y i ) PROMEDIO
R1 R2 R3 R4 R5 R6 TRATAMIE. TRATAM.
A 160 156 158 156 160 158 948 158,00
B 158 155 150 152 156 152 923 153,83
C 145 147 144 142 145 146 869 144,83
D 140 135 138 138 136 140 827 137,83
E 130 128 130 131 128 132 779 129,83

t= 5 G. TOTAL = y  = 4346
r = 6 n= txr = 30 M_GRAL= y  = 144,9

PASO 1: Modelo Lineal Estadístico Aditivo.

y ij     i   ij

donde  = Es la media general o global de los rendimientos (Kg./ha.) de las variedades de


Maíz.
i = Es el efecto verdadero asociado con el i-ésimo tratamiento o variedad de maíz.
 ij = Es el error aleatorio, o error experimental asociado con la i-ésima variedad de
maíz en la j-ésima repetición.
y ij = Es el rendimiento de maíz (Kg./ha) asociado con la i-ésima variedad de maíz en
la j-ésima repetición.

Además se debe cumplir para el modelo (Efecto Fijos):

1.- Aditividad en los términos del Modelo.


t 5
2.- 
i 1
i  0  1   2  3   4   5  0 , es decir, se supone de antemano que los efectos

de tratamientos (Variedades) tienen en mismo efecto (Rendimiento Kg./parcela).


3.-  ij ~ NIID(0 ;  2 ) , es decir, se debe cumplir que los errores experimentales se
deben distribuir de manera normal, Independientes (uno de otro) e Idénticamente
distribuidos en todas las unidades experimentales con media cero y varianza
común σ2, en otras palabras, el nivel de error que se genere en todas la unidades
experimentales deben ser iguales, es lo que se denomina Homocedastidad.
4.- Se supone normalidad e independencia entre los yij (valores observados-
Rendimiento).

COMPROBACIÓN DE SUPOUESTO:

 El supuesto de normalidad asociada a los datos fue realizada de forma gráfica y


mediante la prueba de Wilk Shapiro, dando como resultado esta última 0,9451,
indicando que los rendimientos de maíz obtenidos en el experimento se aproximan a
una distribución normal. Este resultado se obtuvo con la ayuda del programa
estadístico Statistix.
Wilk-Shapiro / Rankit Plot of RENDIMI1
160

152
Ordered Data

144

136

128

-3 -2 -1 0 1 2 3

Rankits
Approximate Wilk-Shapiro 0.9451 30 cases

Pruebas de Normalidad.
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Rendimiento
de Maíz 0,130 30 0,2* 0,921 30 ,038
(Kg./parcela)
* Este es un límite inferior de la significación verdadera.
a Corrección de la significación de Lilliefors

 Para comprobar el supuesto de igualdad de varianza (Homocedasticidad) de varianza


se utilizó la prueba de Bartlett dando como resultado que las varianzas de los errores
entre los niveles de tratamientos son estadísticamente iguales, con un p-valor de
0,1012.

Otro análisis gráfico didáctico, que permite visualizar de manera rápida el comportamiento de
los resultados en cada uno de los tratamientos son los gráficos de cajas, estos:

170
Rendimiento de Maíz (Kg./parcela)

160

150

140

130

120
N= 6 6 6 6 6

Variedad A Variedad B Variedad C Variedad D Variedad E

Variedades de Maíz

Observando dicha representación, se puede notar que el rendimiento promedio de maíz


(Kg./parcela) disminuye paulatinamente y de manera sistemática desde la variedad de maíz A
hasta la E. Siendo el nivel de variabilidad en cada uno de ellos es bastante parecido excepto en
la variedad C que es un poco reducido, entre tanto la forma de distribución de los datos se nota
una tendencia a la simetría. Tampoco se observan valores extremos.

PASO 2: Contrate de Hipótesis (Efectos Fijos).


H 0  1   2   3   4   5
vs.
H1   i   j para al menos un par i,j / i ≠ j  i,j = 1, 2, 3, 4, 5.

PASO 3: Cálculo de las Sumas de Cuadrados.

Sabemos por definición que: SCTOT. = SCTRAT. - SCE

1.- SUMA DE CUADRADOS DEL TOTAL:

5 6 y 2
La Suma de Cuadrados del Total viene expresada como: SC TOT .  y  2
ij
i 1 j1 n
Donde t = 5, r = 6  n = 30

5 6
y2 4.346,02
Luego, SCTOT .   y  2
ij  160  156  158    132 
2 2 2 2

i 1 j 1 n 30

18.887.716,0
SCTOT .  632.870,0   632.870,0  629.590,5
30
SCTOT .  3.279,4667

2.- SUMA DE CUADRADOS DE TRATAMIENTO: Variedades de Maíz

La Suma de Cuadrados de Tratamientos viene expresada algebraicamente como:

5 yi2 y2
SCTrat.   
i1 ri n

Luego,
5 yi2 y2 9482  9232  8692  8272  7792 4.346,02
SCTrat .     
i 1 ri n 6 30
3.796.564
SCTrat .   629.590,5  632.761  629.590,5  3.170,1
6
SCTrat .  3.170,1333

3.- SUMA DE CUADRADOS DEL ERROR:

Esta suma de cuadrados se obtiene por diferencia, también es llamada suma de cuadrados
dentro de tratamiento, es decir:

SCE = SCTOT. - SCTRAT.

Así, SCE = 3.279,5 - 3.170,1 = 109,3333

Luego, SCE = 109,3333

PASO 4: Grados de Libertad.

g.l(Trat.) = t - 1 = 4
g.l(Error) = t * (r - 1) =n-t 25
g.l(Total) = n-1 = 29

PASO 5: Cálculo de los Cuadrados Medios.

1.- CUADRADO MEDIO DE TRATAMIENTOS: CMTrat.:

CMtrat. = SCTrat/g.l(Trat.) = 792,5

2.- CUADRADO MEDIO DE TRATAMIENTOS: CMError:

CMError = SCError / g.l(Error) = 4,37


PASO 6: Cálculo del F calculado.

Fc = CMTrat. / CMError = 181,2

PASO 7: Determinación de los F tabulados.

α = 0,05

Fα; t-1,n-t = F0,05; t-1,n-t = 2,76

α = 0,01

Fα; t-1,n-t = F0,05; t-1,n-t = 4,18

Gráficamente:
g(F)

5%
1-α
Región de 1%
Aceptación

F
4,18
2,76
α
Región de
Rechazo

Gráfico de la Distribución F de Snedecor.


PASO 8: Tabla de Análisis de Varianza (ANAVAR).

Fuente de Grados de Sumas de Cuadrados Fc F tabulado


Variación Libertad Cuadrados Medios Calculado 5% 1%
Variedades 4 3.170,1 792,5 181,22 2,76 4,18
Error 25 109,3 4,37
Total 29 3.279,5

C.V. = 0,0144
C.V. % = 1,44

PASO 9: Conclusión e Interpretación.

a.- CONCLUSIÓN:

Se rechaza la hipótesis nula H0, al 1 por ciento de significación, por lo tanto existe diferencia
ALTAMENTE significativa entre al menos dos medias de tratamientos, Variedades de Maíz,
expresadas en rendimiento de maíz en Kg./parcela.

a.- INTERPRETACIÓN:

El análisis de los datos permite establecer que existe efecto de las variedades de maíz sobre el
rendimiento(Kg./parcela) de maíz, en al menos dos de las variedades estudiadas, es decir, las
variedades de maíz inciden directamente sobre el rendimiento, por lo que se motiva un estudio
a posterior para conocer cuáles de las variedades son las que difieren significativamente sobre
dicho rendimiento, en otras palabras se debe realizar una de las técnicas de comparación
múltiple de parejas de medias, en nuestro caso se realizará la prueba de medias MDS.

Entre tanto, el Coeficiente de Variación fue de 1,14%, el cual según el contecto teórico
referentes a experimentos con variedades de maíz puede considerarse bajo, indicando que
hubo un excelente manejo de las unidades experimentales, así como también un buen control
de las fuentes de variabilidad externas relacionadas con el fenómeno estudiado y el diseño
experimental utilizado fue el adecuado, en general se puede concluir que los datos son
confiables.

PASO 10: Pruebas de Medias (Método de la MDS).


Por definición la prueba de la Mínima Diferencia Significativa (MDS), es una metodología
donde se comparan todos los posibles pares de medias contra un valor crítico denominado
MDS; que en el caso que una pareja de medias, su diferencia en valor absoluto, sea mayor que
dicho valor crítico, se consideran estadísticamente diferente y en caso contrario, si es menor,
serán iguales. Este valor crítico se define algebraicamente como

2  CME
MDS  t 2 ; n t 
r

2  CME
Donde S Y  es el error estándar de las medias de tratamientos.
2

Así, con los datos suministrado por el análisis de varianza tenemos que.

Datos:

CME = 4,27
α= 0,05 → α/2 = 0,025
n-t = 25
r= 6

Luego, el t Tabulado es:

tα/2; n-t = t0,025; 25 = 2,05954

Por último, la MDS es:

2  CME 2  4,27
MDS  t 2 ; n t   2,05954 
r 6
MDS = 2,05954 x 1,2074 = 2,4867

MDS = = 2,49

Así, la diferencia en valor absoluto de cualquier pareja de medias que sea superior a MDS =
2,49, se considera estadísticamente diferente, es decir: y i  y j  MDS .

Para nuestro ejemplo, las medias de tratamientos son:

y1  158 ; y 2  153,83 ; y 3  144,83 , y 4  137,83 ; y 5  129,83

Luego, las 10 combinaciones de las comparaciones por parejas de medias son:


Comparaciones de Pares de Medias:

DIF.
Comp. MEDIAS MEDIAS MDS RESULTADO
1-2 ABS(A-B) = 4,17 2,49 Mayor
1-3 ABS(A-C) = 13,17 2,49 Mayor
1-4 ABS(A-D) = 20,17 2,49 Mayor
2-3 ABS(A-E) = 28,17 2,49 Mayor
2-4 ABS(B-C) = 9,00 2,49 Mayor
3-4 ABS(B-D) = 16,00 2,49 Mayor
2-4 ABS(B-E) = 24,00 2,49 Mayor
3-4 ABS(C-D) = 7,00 2,49 Mayor
2-4 ABS(C-E) = 15,00 2,49 Mayor
3-4 ABS(D-E) = 8,00 2,49 Mayor

Como se puede observar todas diferencias en valor absoluto entre las parejas de medias son
mayores que el valor crítico MDS, por lo tanto, todas las medias de tratamientos (Rendimiento
Kg./parcela) difieren significativamente. Siendo el rendimiento de la producción de maíz
mayor en la variedad de maíz A, seguido por la variedad B, por lo tanto se pudiera recomendar
el uso de la variedad A.
EJERCICIO Nro. 2:

Sea el experimento relacionado con el Estudio del Efecto que produce cinco Variedades
diferentes de Maíz sobre el Rendimiento (Kg./parcela.), cuyos resultados son:

Repeticiones (Rendimiento Kg./ha.)


Tratamientos
R1 R2 R3 R4 R5 R6
A 160 156 158 156 160 158
B 158 155 150 152 156 152
C 145 147 144 142 145 146
D 140 135 138 138 136 140
E 150 148 145 144 150 148

RESULTADO DEL ANÁLISIS DE VARIANZA:

Como se puede observar, este experimento se plantea con 5 tratamientos y 6 repeticiones,


dando un total de 30 Unidades Experimentales, es decir n = t x r = 30.

Luego la tabla resumen de datos, preliminar para el análisis de varianza es:

TOTAL (
Repeticiones - Rendimiento Kg./ha.
Variedades y i ) PROMEDIO
R1 R2 R3 R4 R5 R6 TRATAMIE. TRATAM.
A 160 156 158 156 160 158 948 158,00
B 158 155 150 152 156 152 923 153,83
C 145 147 144 142 145 146 869 144,83
D 140 135 138 138 136 140 827 137,83
E 150 148 145 144 150 148 885 147,50

t= 5 G. TOTAL = y  = 4452
r = 6 n= txr = 30 M_GRAL= y  = 148,4

PASO 1: Modelo Lineal Estadístico Aditivo.

y ij     i   ij

donde  = Es la media general o global de los rendimientos (Kg./ha.) de las variedades.


i = Es el efecto verdadero asociado con el i-ésimo tratamiento o variedad de maíz.
 ij = Es el error aleatorio, o error experimental asociado con la i-ésima variedad de
maíz en la j-ésima repetición.
y ij = Es el rendimiento asociado con la i-ésima variedad de maíz en la j-ésima
repetición.

Además se debe Cumplir para el modelo (Efecto Fijos):

1.- Aditividad en los términos del Modelo.


t 5
2.- 
i 1
i  0  1   2  3   4   5  0 , es decir, se supone de antemano que los efectos

de tratamientos (Variedades) tienen en mismo efecto (Rendimiento Kg./parcela).


3.-  ij ~ NIID(0 ;  2 ) , es decir, se debe cumplir que los errores experimentales se
deben distribuir de manera normal, Independientes (uno de otro) e Idénticamente
distribuidos en todas las unidades experimentales con media cero y varianza
común σ2, en otras palabras, el nivel de error que se genere en todas la unidades
experimentales deben ser iguales, es lo que se denomina Homocedastidad.
4.- Se supone normalidad e independencia entre los yij (valores observados-
Rendimiento).

COMPROBACIÓN DE SUPOUESTO:

 El supuesto de normalidad asociada a los datos fue realizada de forma gráfica y


mediante la prueba de Wilk Shapiro, dando como resultado esta última 0,9692,
indicando que los rendimientos de maíz obtenidos en el experimento se aproximan a
una distribución normal. Este resultado se obtuvo con la ayuda del programa
estadístico Statistix.
Wilk-Shapiro / Rankit Plot of RENDIMI2
160

155
Ordered Data

150

145

140

135

-3 -2 -1 0 1 2 3

Rankits
Approximate Wilk-Shapiro 0.9692 30 cases
Pruebas de Normalidad.
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Rendimiento
de Maíz 0,113 30 0,2* 0,950 30 0,264
(Kg./parcela)
* Este es un límite inferior de la significación verdadera.
a Corrección de la significación de Lilliefors

 Para comprobar el supuesto de igualdad de varianza (Homocedasticidad) de varianza


se utilizó la prueba de Bartlett dando como resultado que las varianzas de los errores
entre los niveles de tratamientos son estadísticamente iguales, con un p-valor de
0,7170.

Otro análisis gráfico didáctico, que permite visualizar de manera rápida el comportamiento de
los resultados en cada uno de los tratamientos son los gráficos de cajas, estos:

170
Rendimiento de Maíz (Kg./parcela)

160

150

140

130
N= 6 6 6 6 6

Variedad A Variedad B Variedad C Variedad D Variedad E

Variedades de Maíz

Observando dicha representación, se puede notar que el rendimiento promedio de maíz


(Kg./parcela) disminuye paulatinamente y de manera sistemática hasta la variedad de maíz D
incrementándose significativamente en la variedad de maíz E. Siendo el nivel de variabilidad
en cada uno de ellos es bastante parecido excepto en la variedad C que es un poco reducido,
entre tanto la forma de distribución de los datos se nota una tendencia a la simetría. Tampoco
se observan valores extremos.
PASO 2: Contrate de Hipótesis (Efectos Fijos).

H 0  1   2   3   4   5
vs.
H1   i   j para al menos un par i,j / i ≠ j  i,j = 1, 2, 3, 4, 5.

PASO 3: Cálculo de las Sumas de Cuadrados.

Sabemos por definición que: SCTOT. = SCTRAT. - SCE

1.- SUMA DE CUADRADOS DEL TOTAL:

La Suma de Cuadrados del Total viene expresada como:

5 6 y 2
SC TOT.  y  2
ij
i 1 j1 n
Donde t = 5, r = 6  n = 30

5 6 y 2 4.552 2
Luego, SC TOT .    y  2
ij  160  156  158    148 
2 2 2 2

i 1 j1 n 30
19.820.304
SC TOT .  662.286,0   662.286,0  660.676,8
30
SC TOT .  1.609,2

2.- SUMA DE CUADRADOS DE TRATAMIENTO: Variedades de Maíz

5 yi2 y2
La Suma de Cuadrados de Tratamientos viene expresada como: SCTrat.   
i1 ri n
2
5 iy y2 9482  9232 8692  8272  8552 4.4522
Luego, SC Trat.     
i1 ri n 6 30
3.972.948
SC Trat .   660.676,8  662.158  660.676,8  1.481,2
6
SC Trat .  1.481,2

3.- SUMA DE CUADRADOS DEL ERROR:

Esta suma de cuadrados se obtiene por diferencia, es decir:

SCE = SCTOT. - SCTRAT.

Así, SCE = 1.609,2 - 1.481,2 = 128,0

Luego, SCE = 128

PASO 4: Grados de Libertad.

g.l(Trat.) = t - 1 = 4
g.l(Error) = t * (r - 1) = 25
g.l(Total) = n-1 = 29

PASO 5: Cálculo de los Cuadrados Medios.

1.- CUADRADO MEDIO DE TRATAMIENTOS: CMTrat.:

CMtrat. = SCTrat/g.l(Trat.) = 370,3

2.- CUADRADO MEDIO DE TRATAMIENTOS: CMError:

CMError = SCError / g.l(Error) = 5,12

PASO 6: Cálculo del F calcula.


Fc = CMTrat. / CMError = 72,3

PASO 7: Determinación de los F tabulados.

α = 0,05

Fα; t-1,N-t = F0,05; t-1,n-t = 2,76

α = 0,01

Fα; t-1,N-t = F0,05; t-1,n-t = 4,18

Gráficamente:

g(F)

5%
1-α
Región de 1%
Aceptación

F
4,18
2,76

α
Región de FC = 72,32
Rechazo

PASO 8: Tabla de Análisis de Varianza (ANAVAR).

Fuente de Grados de Sumas de Cuadrados Fc F tabulado


Variación Libertad Cuadrados Medios Calculado 5% 1%
Variedades 4 1.481,2 370,3 72,32 2,76 4,18
Error 25 128 5,12
Total 29 1.609,2
C.V. = 0,0152
C.V. % = 1,52

PASO 9: Conclusión e Interpretación.

a.- CONCLUSIÓN:

Se rechaza la hipótesis nula H0, al 1 por ciento de significación, por lo tanto existe diferencia
ALTAMENTE significativa entre al menos dos medias de tratamientos, Variedades de Maíz,
expresadas en rendimiento de maíz en Kg./parcela.

a.- INTERPRETACIÓN:

El análisis de los datos permite establecer que existe efecto de las variedades de maíz sobre el
rendimiento(Kg./parcela) de maíz, en al menos dos de las variedades de maíz estudiadas, es
decir, las variedades de maíz influye directamente sobre el rendimiento, por lo que se motiva
un estudio a posterior para conocer cuáles de las variedades son las que difieren
significativamente sobre dicho rendimiento, en otras palabras se debe realizar una de las
técnicas de comparación múltiple de parejas de medias, en nuestro caso se realizará la prueba
de medias MDS.

Entre tanto, el Coeficiente de Variación fue de 1,52%, el cual según el contexto teórico
referentes a experimentos con variedades de maíz puede considerarse bajo; indicando que
hubo un excelente manejo de las unidades experimentales, así como también un buen control
de las fuentes de variabilidad externas relacionadas con el fenómeno estudiado y el diseño
experimental utilizado fue el adecuado, en general se puede concluir que los datos son
confiables.

PASO 10: Pruebas de Medias (Método de la MDS).

PRUEBA MDS:

α= 0,05 α/2 = 0,025

tα/2; (t-1)*(r-1) = t0,025; 25 = 2,05954

MDS = tα/2; (t-1)*(r-1)* RAIZ.CUA((2*CME)/ri)


RAIZ(2*CME/r)= 1,31

MDS = 2,69

Comparaciones de Pares de Medias:

DIF.
Comp. MEDIAS MEDIAS MDS RESULTADO
1-2 ABS(A-B) = 4,17 2,69** Mayor
1-3 ABS(A-C) = 13,17 2,69** Mayor
1-4 ABS(A-D) = 20,17 2,69** Mayor
2-3 ABS(A-E) = 10,50 2,69** Mayor
2-4 ABS(B-C) = 9,00 2,69** Mayor
3-4 ABS(B-D) = 16,00 2,69** Mayor
2-4 ABS(B-E) = 6,33 2,69** Mayor
3-4 ABS(C-D) = 7,00 2,69** Mayor
2-4 ABS(C-E) = 2,67 2,69** Mayor
3-4 ABS(D-E) = 9,67 2,69** Mayor
* Significativo 1%.

Como se puede observar todas diferencias en valor absoluto entre las parejas de medias son
mayores que el valor crítico MDS, excepto las parejas C y E las cuales no difieren
significativamente, indicando que el rendimiento de maíz obtenido en las variedas C y E son
estadísticamente iguales. Siendo el rendimiento de la producción de maíz mayor en la variedad
de maíz A, seguido por la variedad B, por lo tanto se pudiera recomendar el uso de la variedad
A.
Gráficamente, se puede representar:

y C  144,83 y E  147,83 y A  158 y B  153,83 y D  137,5,83


EJERCICIO Nro. 3:

Supongamos ahora que el experimento está relacionado con el Estudio del Efecto que produce
cinco Dosis de Abono Nitrogenado en una Variedad de Maíz sobre el Rendimiento
(Kg./parcela.), cuyos resultados son los mismos revisados en los ejercicios Nro 1 y 2:

Datos Ejercicio Nro 1.


TOTAL (
Repeticiones - Rendimiento Kg./ha.
Variedades y i ) PROMEDIO
R1 R2 R3 R4 R5 R6 TRATAMIE. TRATAM.
300 160 156 158 156 160 158 948 158,00
250 158 155 150 152 156 152 923 153,83
200 145 147 144 142 145 146 869 144,83
150 140 135 138 138 136 140 827 137,83
100 130 128 130 131 128 132 779 129,83

t= 5 G. TOTAL = y  = 4346
r = 6 n= txr = 30 M_GRAL= y  = 144,9

Datos Ejercicio Nro 2.


TOTAL (
Repeticiones - Rendimiento Kg./ha.
Variedades y i ) PROMEDIO
R1 R2 R3 R4 R5 R6 TRATAMIE. TRATAM.
100 140 135 138 138 136 140 827 137,83
150 145 147 144 142 145 146 869 144,83
200 158 155 150 152 156 152 923 153,83
250 160 156 158 156 160 158 948 158,00
300 150 148 145 144 150 148 885 129,83

t= 5 G. TOTAL = y  = 4452
r = 6 n= txr = 30 M_GRAL= y  = 148,4

RESULTADO DEL ANÁLISIS DE VARIANZA:

El análisis de Varianza sigue siendo el mismo, obtenido en los ejercicios analizados


anteriormente. Pero en estos casos, cuando la variable independiente está compuesta por
niveles que son cuantitativos el análisis de varianza puede ser acompañado por un análisis de
regresión Simple (en este caso), lo que permite hacer estimaciones dentro del rango de
variación de los niveles del factor, ente caso de 100 a 300 Kg. de nitrógeno por hectárea.
ASÍ, EL ANÁLISIS DE REGRESIÓN PARA EL
EJERCICIO 1 ES:

PASO 1: Modelo Lineal Estadístico Aditivo (Poblacional).

y i     0  1 x i   i

donde  = Es la media general o global de los rendimientos (Kg./ha.) de las


variedades de Maíz.
 0 y 1 = Son los Coeficientes de Regresión,  0 es el intercepto de la recta y 1
es la pendiente de la recta.
i = Es el error aleatorio, o error experimental asociado al i-ésima
observación.
yi = Es el rendimiento de maíz (Kg./ha) asociado con la i-ésima observación.

Además se debe cumplir los siguientes supuestos:

1.- Aditividad en los términos del Modelo.


2.-  ij ~ NIID(0 ;  2 ) , es decir, se debe cumplir que los errores experimentales se
deben distribuir de manera normal, Independientes (uno de otro) e Idénticamente
distribuidos en todas las unidades experimentales con media cero y varianza
común σ2, en otras palabras, el nivel de error que se genere en todas la unidades
experimentales deben ser iguales, es lo que se denomina Homocedastidad.
3.- Se supone normalidad e independencia entre los yi (valores observados-
Rendimiento).

PASO 2: Contrate de Hipótesis.

H 0  1  0 No Existe Regresión
vs.
H 1  1  0 Existe Regresión entre las variables

PASO 3: Cálculo de las Sumas de Cuadrados.

Sabemos por definición que: SCTOT. = SCREG. - SCE


S XX   x i2  n  x   1.350.000  30 * ( 200) 2  1.350.000  1.200.000  150.000
2

30
S YY   y i2  n  y   632.000  30 * (144,8667) 2  630.000  628.590,53  3.279,47
2

i 1
30
S XY   x i y i  n  x  y   847.500  30 * (200)(144,8667)  847.500  869.200  21.700
i 1

Para determinar las Sumas de Cuadrados antes de deben estimar los coeficientes de regresión
 0 y 1 , siendo los valores estimados a y b, respectivamente, es decir, el modelo estimado de
regresión se expresa por y i  a  b  x i . Así, en nuestro ejemplo son:

1.- Coeficiente b (pendiente de la recta):

S XY 21.700
b   0.1447
S XX 150.000

2.- Coeficiente a (Intercepto de la recta con el eje Y):

a  y  b  x  144.8667  (0.1447) * (200)  115,933

Luego, el Modelo de Regresión Estimado es:

yi  a  b  x i  y i  115,933  0.1447  x i

Lo que quiere decir, con a = 115,933, que cuando la dosis de nitrógeno es igual a cero el
rendimiento promedio del cultivo del maíz es aproximadamente de 115,933 Kg. por hectáreas,
mientras que el valor de b = 0,1447, indica que por cada unidad (Kg.) de abono que se
suministra al cultivo de maíz, el rendimiento se incrementa en promedio en 0,1447 Kg.

1.- SUMA DE CUADRADOS DEL TOTAL:

La Suma de Cuadrados del Total viene expresada como: SC TOT .  SC YY

Luego, SCTOT .  3.279,4667

2.- SUMA DE CUADRADO DE REGRESIÓN:

La Suma de Cuadrados de Tratamientos viene expresada algebraicamente como:


2
SC Re g.  1  S xx

SC Re g.  (0,1447) 2  150.000  3.139,2667

SC Re g .  3.139,2667

3.- SUMA DE CUADRADOS DEL ERROR:

Esta suma de cuadrados se obtiene por diferencia, también es llamada suma de cuadrados
dentro de tratamiento, es decir:

2
SCE = SYY  1  S xx = SCTOT. - SCREG.

Así, SCE = 3.279,5 - 3.139,2667 = 140,2

Luego, SCE = 140,2

PASO 4: Grados de Libertad.

g.l(Reg.) = 1 = 1
g.l(Error) = n-2 28
g.l(Total) = n-1 = 29

PASO 5: Cálculo de los Cuadrados Medios.

1.- CUADRADO MEDIO DE TRATAMIENTOS: CMTrat.:

CM regresión. = SCRegr/g.l(Reg.) = 3.139,2667

2.- CUADRADO MEDIO DE TRATAMIENTOS: CMError:

CMError = SCError / g.l(Error) = 5,0071


PASO 6: Cálculo del F calculado.

Fc = CMREGt. / CMError = 626,96

PASO 7: Determinación del F tabulado.

α = 0,05

Fα; 1,n-2 = F0,05; 1,28 = 4,2

α = 0,01

Fα; 1,n-2 = F0,05; 1,28 = 7,64

Gráficamente:

g(F)

5%
1-α
Región de 1%
Aceptación

F
7,64
4,2
FC = 626,96
α
Región de
Rechazo

Gráfico de la Distribución F de Snedecor.


PASO 8: Tabla de Análisis de Varianza (ANAVAR).

Fuente de Grados de Sumas de Cuadrados Fc F tabulado


Variación Libertad Cuadrados Medios Calculado 5% 1%
Regresión 1 3.139,2667 3.139,2667 626,96 4,20 7,64
Error 28 140,2 5,0071
Total 29 3.279,5

R2. = 0.9572
R2(Ajust.) = 0.9557

Como se puede observar el R 2 = 0,9575 es bastante alto, indicando que el nivel de ajuste del
modelo a los datos experimentales es buena, es decir, que el grado de variabilidad explicado
por el modelo de regresión es casi perfecto.

PASO 9: Conclusión e Interpretación.

a.- CONCLUSIÓN:

Se rechaza la hipótesis nula H0, al 1 por ciento de significación, por lo tanto el coeficiente de
regresión 1 es diferente de cero, indicando que existe regresión entre las dos variables
estudiadas.

ASÍ, EL ANÁLISIS DE REGRESIÓN PARA EL


EJERCICIO 2 ES:

En este segundo ejercicio para realizar un análisis de regresión se debe tomar en cuenta que
existe una relación entre las dosis de nitrógeno y el rendimiento de maíz que no es lineal, por
cuanto la dosis de 300 Kg. por hectárea disminuye, creando distorsión en la linealidad de los
datos, en el diagrama de dispersión se puede notar:
PASO 1: Modelo Lineal Estadístico Aditivo (Poblacional).

y i     0  1 x i   i

donde  = Es la media general o global de los rendimientos (Kg./ha.) de las


variedades de Maíz.
 0 y 1 = Son los Coeficientes de Regresión,  0 es el intercepto de la recta y 1
es la pendiente de la recta.
i = Es el error aleatorio, o error experimental asociado al i-ésima
observación.
yi = Es el rendimiento de maíz (Kg./ha) asociado con la i-ésima observación.

Además se debe cumplir los siguientes supuestos:

1.- Aditividad en los términos del Modelo.


2.-  ij ~ NIID(0 ;  2 ) , es decir, se debe cumplir que los errores experimentales se
deben distribuir de manera normal, Independientes (uno de otro) e Idénticamente
distribuidos en todas las unidades experimentales con media cero y varianza
común σ2, en otras palabras, el nivel de error que se genere en todas la unidades
experimentales deben ser iguales, es lo que se denomina Homocedastidad.
3.- Se supone normalidad e independencia entre los yi (valores observados-
Rendimiento).

PASO 2: Contrate de Hipótesis.

H 0  1  0 No Existe Regresión
vs.
H 1  1  0 Existe Regresión entre las variables

PASO 3: Cálculo de las Sumas de Cuadrados.


Sabemos por definición que: SCTOT. = SCREG. - SCE

S XX   x i2  n  x   1.350.000  30 * ( 200) 2  1.350.000  1.200.000  150.000


2

30
S YY   y i2  n  y   662.286  30 * (148,4) 2  662.286  660.676,8  1.609,2
2

i 1
30
S XY   x i y i  n  x  y   900.150  30 * (200)(148,4)  900.150  890.400  9.750,0
i 1

Para determinar las Sumas de Cuadrados antes de deben estimar los coeficientes de regresión
 0 y 1 , siendo los valores estimados a y b, respectivamente, es decir, el modelo estimado de
regresión se expresa por y i  a  b  x i . Así, en nuestro ejemplo son:

1.- Coeficiente b (pendiente de la recta):

S XY 9.750
b   0.065
S XX 150.000

2.- Coeficiente a (Intercepto de la recta con el eje Y):

a  y  b  x  148.4  (0.065) * ( 200)  135,4

Luego, el Modelo de Regresión Estimado es:

yi  a  b  x i  y i  135,4  0.065  x i

Lo que quiere decir, con a = 135,4, que cuando la dosis de nitrógeno es igual a cero el
rendimiento promedio del cultivo del maíz es aproximadamente de 135,4 Kg. por hectáreas,
mientras que el valor de b = 0,065, indica que por cada unidad (Kg.) de abono que se
suministra al cultivo de maíz, el rendimiento se incrementa en promedio en 0,065 Kg.

1.- SUMA DE CUADRADOS DEL TOTAL:

La Suma de Cuadrados del Total viene expresada como: SC TOT .  SC YY

Luego, SC TOT .  1.609,2


2.- SUMA DE CUADRADO DE REGRESIÓN:

La Suma de Cuadrados de Tratamientos viene expresada algebraicamente como:


2
SC Re g.  1  S xx

SC Re g.  (0,065) 2  150.000  633,75

SC Re g.  633,75

3.- SUMA DE CUADRADOS DEL ERROR:

Esta suma de cuadrados se obtiene por diferencia, también es llamada suma de cuadrados
dentro de tratamiento, es decir:

2
SCE = SYY  1  S xx = SCTOT. - SCREG.

Así, SCE = 1.609,2 - 633,75 = 975,45

Luego, SCE = 975,45

PASO 4: Grados de Libertad.

g.l(Reg.) = 1 = 1
g.l(Error) = n-2 28
g.l(Total) = n-1 = 29

PASO 5: Cálculo de los Cuadrados Medios.

1.- CUADRADO MEDIO DE TRATAMIENTOS: CMTrat.:

CM regresión. = SCRegr/g.l(Reg.) = 633,75


2.- CUADRADO MEDIO DE TRATAMIENTOS: CMError:

CMError = SCError / g.l(Error) = 34,8375

PASO 6: Cálculo del F calculado.

Fc = CMREGt. / CMError = 18,19

PASO 7: Determinación del F tabulado.

α = 0,05

Fα; 1,n-2 = F0,05; 1,28 = 4,2

α = 0,01

Fα; 1,n-2 = F0,05; 1,28 = 7,64

Gráficamente:
g(F)

5%
1-α
Región de 1%
Aceptación

F
7,64
4,2
FC = 18,19
α
Región de
Rechazo

Gráfico de la Distribución F de Snedecor.

PASO 8: Tabla de Análisis de Varianza (ANAVAR).

Fuente de Grados de Sumas de Cuadrados Fc F tabulado


Variación Libertad Cuadrados Medios Calculado 5% 1%
Regresión 1 633,75 633,75 18,19 4,20 7,64
Error 28 975,45,2 34,8375
Total 29 1.609,2

R2. = 0.3938
R2(Ajust.) = 0.3722

Como se puede observar el R2 = 0,3938 es bajo, indicando que el nivel de ajuste del modelo a
los datos experimentales no es bueno, es decir, que el grado de variabilidad explicado por el
modelo de regresión es malo, el modelo va por un lado y los datos experimentales por otro.
Esto sugiere que se deben transformar los datos experimentales, pudiera una transformación
cuadrática, quedando definido un modelo cuadrático.

PASO 9: Conclusión e Interpretación.

a.- CONCLUSIÓN:

Se rechaza la hipótesis nula H0, al 1 por ciento de significación, por lo tanto el coeficiente de
regresión 1 es diferente de cero, indicando que existe regresión entre las dos variables
estudiadas.
REPÚBLICA BOLIVARIANA DEVENEZUELA
UNIVERSIDAD NACIONAL EXPERIMENTAL DE LOS LLANOS
OCCIDENTALES “EZEQUIER ZAMORA”
SAN CARLOS, EDO. COJEDES
POSGRADO DE AGROINDUSTRIAL
CATEDRA: DISEÑO EXPERIMENTA

TRABAJO DE DISEÑO EXPERIMENTAL

EJERCICIOS DE INTERVALOES DE
CONFIANZA Y PRUEBAS DE HIPÓTESIS

Realizado por:
Lic. Pedro M. Morales V.

San Carlos, Febrero de 2003


1.- Intervalos de Confianza.

Intervalo de Confianza para la media.

Se quiere estimar un intervalo de confianza al nivel de significación   0,05 para la altura


media μ de los individuos de una ciudad. En principio sólo sabemos que la distribución de las
alturas es una v.a. X de distribución normal. Para ello se toma una muestra de n = 25 personas
y se obtiene:

x  170 cm
S  10 cm

Solución:

En primer lugar, en estadística inferencial, los estadísticos para medir la dispersión más
convenientes son los insesgados. Por ello vamos a dejar de lado la desviación típica muestral,
para utilizar la cuasidesviación típica o error estándar para media:

n 25
S  10  Ŝ  S   10   10,206
n 1 24

Si queremos estimar un intervalo de confianza para μ, es conveniente utilizar el estadístico:

y tomar como intervalo de confianza aquella región en la que:

es decir,

o dicho de forma más precisa: Con un nivel de confianza del 95% podemos decir que la media
poblacional está en el intervalo siguiente:
Lo que quiere decir que el verdadero valor de la media de la altura de los estudiantes está
comprendido entre 165,976 y 174,204 centímetros.

Intervalo de Confianza para la Varianza:

En el ejemplo anterior se estudiaba la altura de los individuos de una ciudad, obteniéndose en


una muestra de tamaño 25 los siguientes valores:

Calcular un intervalo de confianza con α =0,05 para la varianza σ2 de la altura de los


individuos de la ciudad.

Solución:

Para estimar un intervalo de confianza para σ2 (varianza poblacional) el estadístico que nos
resulta útil es:

Entonces el intervalo de confianza que buscamos lo obtenemos mediante:

24 10,206 2
 2n 1;   2   2n 1;1   224;0, 025  12,4    224;0 ,975  39,4
2 2 2
  2   63,45;201,60

Por tanto, para el valor poblacional de la desviación típica tenemos que

con una confianza del 95%, que por supuesto contiene a las estimaciones puntuales S = 10 y
Ŝ  10,206 calculados sobre la muestra. Lo que indica que el verdadero valor de la varianza
se encuentra entre 7,96 y 14,199
2.- Contrastes de Hipótesis.

Se desea saber si cierta enfermedad afecta del mismo modo a los hombres que a las mujeres.
Para ello se considera una muestra de n = 618 individuos que padecen la enfermedad, y se
observa que 341 son hombres y el resto son mujeres. ¿Qué conclusiones se obtiene de ello?.

Solución:

Contraste de una proporción:

Si p es el porcentaje de hombres en la población de enfermos, podemos considerar el


contraste:

Donde la hipótesis nula indica que la proporción de enfermos es igual al 50 %, versus


que es diferente al 50%.

De la muestra obtenemos la siguiente estimación puntual del porcentaje de enfermos


de sexo masculino:

Para ver si esto es un valor “coherente”' con la hipótesis nula, calculemos la


significatividad del contraste:

Por otro lado,

Como el contraste es de tipo bilateral, la significatividad del contraste es (buscando en


la tabla de la distribución normal):
Lo que nos indica que se ha de rechazar la hipótesis nula y aceptar la hipótesis alternativa, es
decir, afirmamos que existe una evidencia significativa a favor de la hipótesis de que la
enfermedad no afecta por igual a hombres y mujeres.

También podría gustarte