Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Dise Æos Experimentales Ucv
Dise Æos Experimentales Ucv
PRUEBA DE HIPOTESIS
Hiptesis
Es el enunciado acerca de una poblacin, elaborado con el propsito de ponerlo aprueba
Prueba de hiptesis
Procedimiento basado en la evidencia muestral y en la teora de probabilidad que se emplea para
determinar si la hiptesis es un enunciado razonable.
Procedimiento para probar una hiptesis:
1.- Plantear la hiptesis nula
Hiptesis nula
y la hiptesis alternativa
rechazarla. Tal hiptesis es una afirmacin que se aceptar si los datos muestrales no pueden proporcionar
evidencia convincente que es falsa.
Hiptesis alternativa
Afirmacin que se aceptar si los datos muestrales proporcionaron amplia evidencia de que
es
falsa
2.- Seleccionar el nivel de significancia.- Nivel de significancia es la probabilidad de rechazar la
hiptesis nula cuando es verdadera. Al nivel de significacin se le denomina
, tambin se le conoce
Hiptesis nula
Ho es verdadera
Ho es falsa
Se acepta
Decisin Correcta
Error
Se rechaza
Error
Decisin Correcta
3.-Calcular el valor estadstico de prueba.- Existen muchos valores estadsticos de prueba: z, t, chi
cuadrado, F, etc.
Es el valor obtenido a partir de la informacin muestral que se utiliza para determinar si se rechaza la
hiptesis nula.
4.- Formular la regla de decisin.- Es un enunciado de las condiciones segn las que se acepta o se
rechaza la hiptesis nula.
Valor crtico es el
valor que es el
cuando
Ha
Estadstico de prueba:
conocida
Z=
Estadstico de prueba:
desconocida:
Z=
Rechazar
si
- Z
Ejemplo
La tasa anual de resurtido de botellas de aspirinas es 6.0 (esto indica que las existencias del medicamento
tienen que renovarse en promedio 6 veces al ao en un establecimiento). La desviacin estndar es 0,50.
Se sospecha que el volumen de ventas promedio ha cambiado y no es 0,60. Se utilizar el nivel de
significancia de 0.05 para probar esta hiptesis.
a.- Plantee la hiptesis nula y alternativa
b.- Cul es la probabilidad de un error tipo I?
c.- Proporcione la frmula para el valor estadstico de la prueba.
d.- Enuncie la regla de decisin
e.- Se selecciona una muestra aleatoria de 64 frascos de tal producto, con una media de
5.84, Debe
rechazarse la hiptesis de que la media poblacional es 0.60? Interprete los resultados.
Solucin:
a.
Ho = 6
Ha
Z=
1.96
Si el valor del estadstico de prueba resulta mayor a 1.96 o menor a -1.96 se rechaza
hiptesis nula
Z=
- 2.56
la
Rechazar Ho si:
Z
- 2.576
2.576
El estadstico de la prueba:
Z
0.756
El valor de prueba est dentro de la zona de aceptacin, entonces se acepta Ho Es decir la media es 32
533
conocida
Z=
Estadstico de prueba:
desconocida:
Z=
Rechazar
Prueba
si
de
30) respecto a una media poblacional para pruebas de una cola (unilateral) de la forma
H 0:
H a:
Estadstico de prueba:
o
o
conocida
Z=
Estadstico de prueba:
desconocida:
Z=
Rechazar
Ejemplo.-
si
- Z
promedio de 6.8 DVD por mes. Una muestra aleatoria de 36 estudiantes universitarios de la facultad de
Agronoma, revel que el nmero medio de DVD observado el mes pasado fue de 6.2, con una
desviacin estndar de 0.5. En el nivel de significancia de 0.05. Puede concluirse que los estudiantes de
la facultad de Agronoma ven menos DVD al mes que los de la Universidad?
H 0:
H a:
6.8
6.8
Regla de la decisin
Rechazar
si
- 1.645
Valor de la prueba
Z=
- 7.2
Como el valor de la prueba est en la zona de rechazo se concluye rechazando la hiptesis nula, esto es,
que los estudiantes de la facultad de Agronoma ven menos DVD, en promedio, que los estudiantes de la
Universidad
Pruebas respecto a la proporcin poblacional.
La prueba de hiptesis sobre proporciones se usa cuando queremos determinar si la proporcin de los
elementos en una poblacin, que tiene cierta caracterstica, es mayor, igual o menor que algn valor
especifico.
Relacin proporcional:
Es la relacin por cociente, o porcin relativa, que tiene un atributo particular de inters.
Antes de probar una relacin proporcional debemos considerar algunos supuestos y cumplirse algunas
condiciones:
- Los datos muestrales recopilados son el resultado de conteo
- El resultado de un experimento se clasifica como xito o fracaso
- La probabilidad de xito se mantiene igual en cada ensayo
- Los ensayos son independientes
- La prueba es adecuada cuando n
y n( 1) valen al menos 5
El valor estadstico de prueba Z viene dado por:
Z
Donde:
Relacin proporcional poblacional
Relacin proporcional muestral
n Tamao de muestra
Prueba para la proporcin poblacional
Prueba de hiptesis respecto a una proporcin poblacional para pruebas de una cola (unilateral) de
la forma:
El estadstico de la prueba
Z
Ejemplo
Una investigacin en la Universidad de Toledo indica que el 50% de los estudiantes cambian su rea
principal de especializacin despus del primer ao en el programa de estudios. Una muestra de 100
alumnos en la escuela de Administracin revel que 48 de ellos cambi de dicha rea despus del lapso
mencionado. Ha habido un decremento significativo en la proporcin de estudiantes que cambian su rea
de especializacin despus del primer ao en el programa? Realice la prueba al nivel de significancia de
0.05.
n: 100
0.48
0.05
Regla de decisin
Rechazar
si
- 1.645
El estadstico de la prueba
Z
- 0.4
Estadstico de prueba
si
Rechazar
Ejemplo Un artculo en la publicacin Piura 21 report que solo hay un empleo disponible para uno de
cada tres egresados de la Universidad. Las principales razones aportadas fueron que existe una
sobrepoblacin de estos ltimos y una economa dbil. Suponga que una encuesta de 200 egresados
recientes de la Universidad de Jan revel que 80 tenan empleo. Al nivel de significancia de 0.02, Se
puede concluir que tienen trabajo una proporcin mayor de egresados de la Universidad de Jan?
n
Regla de la decisin.
Rechazar
si
2.054
Valor de la prueba:
Se acepta
Prueba de hiptesis respecto a una poblacin poblacional para pruebas de dos colas (bilateral) de la
forma:
Estadstico de prueba
Z
Rechazar
si
Ejemplo
Se establece la siguiente hiptesis:
: p = 0.4
:p
10
Rechazar
si Z
-1,96
1.96
c.- Se rechaza
= -2.24
desconocida
11
Donde
Tamao de muestra
Media muestral
Variancia poblacional
Poblacin 1
Poblacin 2
Z
2
Z
2
Ejemplo
Una importante compaa de transporte pblico de Chiclayo debe decidir entre dos marcas de llantas para
su parque automotor, con un nivel de confianza del 95%. Para tomar una decisin seleccion una muestra
aleatoria de 100 llantas de cada marca y encontr que la marca 1 tiene una vida til de 98 000 Km, en
promedio, con una desviacin estndar de 8 000 Km.
Por otro lado, las estadsticas calculadas para la marca 2 son, en promedio, de 101 000 Km y desviacin
estndar de 12 000 Km
Que marca de llantas debera adquirir la compaa de transporte si la diferencia de precios es mnima?
Solucin
Ho
1=2
H1
1 2
x 1 = 98 000
S 1=8 000
n1
100
x 2 = 101 000
S 2=12 000
n2
100
12
Regla de decisin
Rechazar
H o Z 1.96
Z 1.96
Valor de la prueba
98 000101000
8 0002 12 0002
+
100
100
= - 2.08
Ho
existe diferencia significativa entre la vida til promedio de ambas marcas. Sin embargo, no hemos
contestado a nuestra pregunta inicial de qu marca de llantas se debe adquirir. Realizamos una nueva
prueba de hiptesis suponiendo que la vida til media de la marca 2 es mayor que la de la marca 1. Para
lo cual establecemos la prueba de hiptesis para una cola
Prueba de hiptesis con muestras grandes (n
30
Ho :
1 2
H o : 12 0
H1 :
1 < 2
H o : 12 < 0
Estadstico de prueba
Conocida
desconocida
13
Rechazar
si Z
30
Ho :
1 2
H o : 12 0
H1 :
1 > 2
H o : 12 > 0
Estadstico de prueba
Conocida
desconocida
14
Rechazar
si Z
Del ejercicio anterior, para decidir qu marca comprar, realizamos una nueva prueba de hiptesis
suponiendo que la vida til promedio de la llanta de marca 2 es mayor que la vida til promedio de la
marca 1, esto es :
Ho
1 2
H1
1 < 2
=5
98 000101000
8 0002 12 0002
+
100
100
= - 2.08
Como 2.08 est en la zona de rechazo tenemos que la marca 2 tiene mayor vida til promedio que la
marca 1.Por lo tanto, la compaa de transporte debe abastecerse de la marca 2
Prueba de hiptesis con muestras grandes (n
La prueba de hiptesis para la diferencia entre dos proporciones se realiza cuando queremos determinar si
las proporciones de dos poblaciones son o no iguales. La lgica del procedimiento es idntica para la
diferencia de las medias poblacionales.
Tomamos una muestra aleatoria de cada poblacin y calculamos las proporciones muestrales; si la
diferencia entre estas proporciones se puede atribuir al azar, aceptamos la hiptesis de que las dos
poblaciones tienen igual proporciones.
15
p1 p2
Z=
p c (1 pc ) p c ( 1 pc )
+
n1
n2
Tamao de muestra
Proporcin
muestral
Proporcin
ponderada
p1
Poblacin 1
Poblacin 2
pc
p2
pc
Nmerototal de xitos
Nmero total en lasmuestras
X 1+ X 2
n1+ n2
Alternativamente
pc =
n1 p1 +n 2 p2
n1 +n 2
Ejemplo
El departamento de investigacin en la casa Matriz de una compaa aseguradora, realiza una
investigacin acera de las causas de accidentes automovilsticos, las caractersticas de los conductores,
etc. Se seleccion una muestra aleatoria de 400 plizas de seguros expedidas a personas solteras. Se
descubri que en el periodo anterior de tres aos, 120 sufrieron al menos un accidente automovilstico. En
forma semejante, una muestra de 600 plizas expedidas a personas casadas revel que 150 haban tenido
al menos un accidente. Al nivel de significancia de 0.05, Hay diferencia significativa en las personas
solteras y casadas que sufrieron un accidente durante un lapso de tres aos?
Solucin
2=
n 600
n1= 400
p1=
120
400
p2=
= 0.30
150
600
Ho
p1= p2
H1
p p2
= 0.25
16
Regla de decisin
Rechazar
H o Z 1.96
Z 1.96
Valor de la prueba
p1 p2
Z=
pc
Z=
p c (1 pc ) p c (1 pc )
+
n1
n2
Nmerototal de xitos
Nmero total en lasmuestras
0.300.25
( 0.27 ) (0.73) ( 0.27 ) (0.73)
+
400
600
120+150
400+600
= 0.27
= 1.74
Ho
significativa entre las proporciones de personas solteras y casadas que sufrieron un accidente durante un
lapso de tres aos.
Prueba de hiptesis para muestras pequeas
En los casos en los que se desconoce
distribucin de Z como valor estadstico de prueba. La t de Student o distribucin t, sirve como valor
estadstico de prueba.
Prueba para la media poblacional
Se utiliza el mismo procedimiento que en el caso de la muestra grande pero el valor estadstico de prueba
es el siguiente:
t n1,
x
s
n
Ejemplo
17
Por registros pasados se sabe que la vida til promedio de una pila elctrica que se utiliza en un reloj
digital es de 305 das. La vida til de las pilas se distribuye normalmente. Tal elemento elctrico fue
modificado recientemente para que tenga mayor duracin. Se prob una muestra de 20 pilas modificadas
y se encontr que la vida media era de 311 das con una desviacin estndar de la muestra de 12 das. Al
nivel de significancia de 0.05. La modificacin increment la duracin promedio de la pila?
a.- Plantear la hiptesis nula y alternativa.
b.- Ilustrar grficamente la regla de decisin.
c.- Calcular t y llegar a una decisin. Resuma la manera breve el resultado.
Solucin:
H o : 305
H 1 : >305
Grados de libertad (g.l.): 20 1 = 19
=0.05
Regla de decisin:
Rechazar
H o si t 1.729
Valor de prueba:
t=
x
s
n
311305
12
20
= 2.24
x 1x
s2p (
1 1
+ )
n1 n 2
18
t con
2
p
s =
n1
+n2
grados de libertad:
( n1 1 ) s 21+ ( n21 ) s 22
n1+ n22
Donde:
Tamao de muestra
Media muestral
Poblacin 1
n1
x1
Poblacin 2
n2
x2
Grados de libertad:
Varianza ponderada
s 2p
n1 +n2 2
Observacin
Las varianzas son desconocidas, pero iguales:
Donde
21= 22=
s p es un estimador insesgado de 2
Ejemplo:
Una muestra de calificaciones en un examen presentado en un curso de Estadstica (en escala 100) es:
Hombres: 72, 69, 98, 66, 85, 76,79 80,77
Mujeres: 87, 90, 78, 81, 80, 76
Al nivel de significancia de 0.01, La calificacin de las mujeres es ms alta que la calificacin de los
hombres?
H o : m h
Solucin:
H 1 : m > h
H
x
s
n
M
78
9.49
9
82
5.40
6
19
Regla de decisin:
Rechazar
H o si t 2.624
Valor de la prueba
2
p
s =
1 1
+ )
n1 n 2
n1 +n2 2
Ho
s2p (
Se acepta
x 1x
6+ 92
8278
1 1
66.6153( + )
7 9
= 66.6153
= 0.10
porque 0.42 est en la zona de aceptacin. Por lo tanto, no se puede afirmar que la
n1 <30 y n2 < 30
Variancias poblacionales desconocidas pero iguales
21= 22
Ha: d < 0
20
d0
sd / n =
t=
= x
d
sd / n
t> / 2
t<
/2
t>t
Ejemplo.- Antes de contratar la instalacin de un sistema que trasmita msica a las oficinas de una
empresa, el gerente selecciona al azar 7 oficinas para instalarles el nuevo sistema. El tiempo promedio en
minutos que pasaban los empleados fuera de esas oficinas, fue registrado antes y despus de instalarse el
sistema de msica, obtenindose los siguientes resultados
Numero de oficina
No msica
Con msica
8 9 5 6 5 10
5 6 7 5 6 7
7
8
= 0.05
Solucin
Ho: d = 0
Ha: d > 0
No msica
8
9
5
6
5
10
7
x 1 =7,14
t=
Con msica
5
6
7
5
6
7
8
x 2 =6,28
d0
sd / n =
d
sd / n
d =0,85
d
3
3
2
1
1
3
1
s d =2,6457
0,85
= 2,6457 / 7
=1,025
1,943
21
Conclusin: No hay una evidencia estadstica para afirmar que con la instalacin de la msica en las
oficinas, los empleados pasaran ms tiempo en estas.
b.. Caso II:
n1 <30 Y n2 <30
Variancias poblacionales desconocidas pero diferentes
21 22
t=
x 1x 2
s 21 s 22
+
n1 n 2
g.l.
[ ]
[] []
s 21 s 22
+
n1 n 2
2 2
s1
n1
2 2
s2
n2
+
n11 n21
Los dems pasos son los mismos
Prueba de hiptesis para la Varianza
Hay casos que se tiene el problema de desconocer la varianza, o desviacin estndar de la poblacin, en
donde las distribuciones son normales. Si se desea probar una hiptesis acerca de la varianza se puede
hacer utilizando la distribucin de Ji cuadrada (Chi cuadrada). As mismo, supngase que se tiene inters
en dos poblaciones normales independientes, donde las medias y las varianzas de la poblacin son
desconocidas. Se desea probar la igualdad de las dos varianzas, ya que para poder comparar las medias de
estas dos poblaciones se ha utilizado la distribucin de t de Student, en la cual podemos tener varianzas
iguales o diferentes en la poblacin.
Par conocer esto ltimo se requiere de la distribucin F de Fisher, y despus de utilizarla se tomar la
decisin de tener o no varianzas iguales en la poblacin, dando pie a realizar la comparacin de las dos
medias segn sea el caso. En un primer caso en el que las varianzas de la poblacin son desconocidas,
pero iguales, o en un segundo caso, donde se tiene varianzas desconocidas, pero diferentes
Prueba de hiptesis para la varianza de un distribucin normal
22
H o : 2= 2o
H1:
Estadstico de prueba:
H o si:
Rechazar
x >x
(n1,
)
2
x <x
2
(n1,
)
2
Ejemplo
Una manera de evaluar la eficacia de un profesor ayudante es analizar las calificaciones obtenidas por sus
estudiantes en un examen al final del curso. Evidentemente, es interesante la puntuacin media, sin
embargo, la varianza tambin contiene informacin til; algunos profesores tienen un estilo que funciona
muy bien con los estudiantes ms sobresalientes, pero es ineficiente con los estudiantes con menos
capacidad o menos motivados. Un profesor realiza un examen al final de cada semestre para todas las
secciones del curso, la varianza de las calificaciones de este examen suelen estar muy prximos a 300 :
Un nuevo ayudante tiene una clase de 30 estudiantes, cuyas calificaciones en el examen tuvieron una
varianza de 480; considerando estas calificaciones como una muestra aleatoria de una poblacin normal,
contrastar la hiptesis nula de que la varianza poblacional de sus calificaciones es 300 frente a una
alternativa bilateral con
0.05
H o : =300
H1:
2 300
23
Regla de decisin
Rechazar
H o si:
x <16.05
x > 45.72
Valor de prueba
=
( 29 ) (480) = 46.40
300
300
H o : 2 2o
H1:
> o
Estadstico de prueba
=
Rechazar
H o si:
x 2> x 2(n1, )
24
Ejemplo
Un producto, se debe maquinar determinada parte con tolerancias muy estrechas, para que los clientes la
puedan aceptar. Las especificaciones del producto piden que la varianza mxima de las longitudes de las
partes sea 0.0004. Suponga que en 30 partes, la varianza de la muestra result ser
Pruebe con un
s2
0.0005.
H o : 2 0.0004
H1:
2 >0.000
Estadstico de prueba
=
Rechazar
H o si:
( 29 ) (0.0005)
( 0.0004)
= 36.25
x 2> x 2(n1, )
Regla de decisin
Rechazar
H o si:
x > 42.56
x 2< 42.56
25
H o : 2 2o
2
H1:
< o
Estadstico de prueba
=
Rechazar
H o si:
x 2< x 2(n1,1 )
H o : 2x = 2y
H 1 : 2x 2y
2
s
2x
F
sy
Estadstico de prueba
H o s:
n11,n21,1
n11,n21,
26
H o : 2x 2y
2
H 1 : x > y
Estadstico de prueba
s 2x
2
F
sy
Regla de decisin a un nivel de significacin
Rechaza
H o s:
F
Fn 1,n 1,
1
F ( gl 1 , gl 2, 1 )=
1
F ( gl 2 , gl 1, )
Ejemplo:
27
La compaa Piura Com realiz un estudio acerca de los hbitos de escuchar radio por parte de los
hombres y las mujeres. Un aspecto del estudio comprendi el tiempo promedio de audicin. Se descubri
que tal tiempo para los varones es de 35 minutos al da. La desviacin estndar de la muestra de 11
personas de sexo masculino que se estudiaron fue de 10 minutos diarios. El tiempo promedio de audicin
para las 13 mujeres en el estudio fue tambin de 35 minutos, pero la desviacin estndar de la muestra,
result 12 minutos. Al nivel de significancia de 0.10, es posible concluir que existe diferencia en la
variacin del nmero de minutos que los hombres y las mujeres escuchan la radio?
nh=11
s h=10
nm =13 s m=12
=0.10
2
H o : m = h
H 1 : 2m 2h
Recuerde que
F ( 12.10,0 .95 )=
Rechaza
F 0.36
1
F ( 10,12,0.05 )
0.36
H o s:
F 2.91
Estadstico de prueba
s2m
2
F
sh
122
10 2
1.44
28
= 0.05
Solucin
Robot Fill
Automatic Fill
s RF =1.9 s AF=2.1
n RF=16
n AF =21
=0.05
H o : 2AF 2RF
H 1 : 2AF > 2RF
De acuerdo a la tabla de F:
F( 20,15,0.05)=2.33
H o s:
F
2.33
29
Estadstico de prueba
s2AF
2
F
s RF
2.12
1.92
1.22
Dado que el valor de F es 1.22 se acepta Ho. Por lo tanto, se elige el proceso Automatic Fill porque es el
que presenta mejor uniformidad de llenado.
Prueba de bondad de ajunte e independencia
Prueba de
x2
Una medida de la diferencia existente entre las frecuencias observadas y esperadas es suministrada por el
estadstico,
x 2 dado por:
(O j EJ )2
x =
Ej
2
Donde
O j= Frecuencia observada
j=
E Frecuencia esperada.
Ejemplo
La siguiente tabla muestra las frecuencias observadas al lanzar un dado 120 veces. Ensayar la hiptesis de
que el dado est bien hecho al nivel de dignificacin de 0.05
Cara
Frecuencia observada
1
25
2
17
3
15
4
23
5
24
6
16
Solucin
Hiptesis:
Cara
Frecuencia
observada
1
6
1
25
2
17
3
15
4
23
5
24
6
16
Total
120
30
Frecuencia
esperada
20
20
20
20
20
20
Regla de
decisin
H o si x2(5,0.05)
Rechazar
11.07
Valor de la prueba
(O j EJ )2
x =
Ej
2
x 2=
( 2520 )2
20
=5
Satisfaccin
En el
trabajo
Mucha
Regular
Poca
Profesor
Asistente
40
78
57
Categora
Profesor
auxiliar
60
87
63
Profesor
asociado
52
82
66
Profesor
principal
63
88
64
.
Solucin
31
Regla de decisin
H o si x2(6,0.05)
Rechazar
12.59
Ei j
j = columna
Profesor
asistente
Satisfaccin
En el
trabajo
E11
Mucha
Regular
Poca
Total
( 215 X 175 )
800
47.03
E12
= 56.44
categ
ora
Profesor
auxiliar
Profesor
asociado
60
87
63
210
52
82
66
200
40
78
57
175
E21
( 335 X 175 )
800
73.28
( 215 X 210 )
800
E22
87.94
Profesor
principa
l
63
88
64
215
E31
Total
215
335
250
800
( 250 X 175 )
800
( 250 X 175 )
800
54.69
( 335 X 210 )
800
E32
65.62
32
categ
ora
Satisfaccin
En el
trabajo
Mucha
Regular
Poca
Total
Profesor
asistente
Profesor
auxiliar
47.03
73.28
54.69
175
56.44
87.94
65.62
210
Profesor
asociado
53.75
83.75
62.50
200
Profesor
principa
l
57.78
90.03
67.19
215
Total
215
335
250
800
Valor de la prueba:
(O ij EiJ )2
x =
Eij
2
x 2=
( 4047.03 )2
47.03
( 6056.44 )2
( 5253.75 )2 ( 6467.19 )2
+ +
+
56.44
53.75
67.19
Como 2.75 es menor que el valor critico 12.59, por lo tanto, no se rechaza
= 2.75
H o y se concluye con un
33
Ejemplo
La empresa Rzuri Hnos. un negocio familiar que ha vendido al menudeo en Piura durante muchos aos,
se anuncia ampliamente por radio y televisin, destacando sus bajos precios y accesibles condiciones de
crdito. Al dueo le gustara analizar la relacin entre las ventas y lo que gasta en publicidad. A
continuacin se muestra la informacin acerca de las ventas y lso gastos de publicidad durante los ltimos
cuatro meses.
Mes
Julio
Agosto
Setiembre
Octubre
Gastos de publicidad
(miles de dlares)
2
1
3
4
Se plantea la hiptesis de que a medida que aumentan los gastos de publicidad, aumentan los ingresos por
ventas.
Debemos comenzar por el diagrama de dispersin, que nos permite tener una idea sobre el grado
(intensidad) y la naturaleza (forma) de la relacin entre las dos variables. Entonces podemos dar cuenta si
la relacin es lineal o no lineal, positiva o negativa, o simplemente no existe una relacin aparente.
34
x 2( x)2
Y
y 2
r=
n
n
n ( xy ) ( x )( y)
Donde:
n= Nmero de pares de observaciones
x = Suma de los valores de la variable x
y = Suma de los valores de la variable y
Total
2
1
3
4
10
xy
7
3
8
10
28
14
3
24
40
81
x2
4
1
9
16
30
y2
49
9
64
100
222
35
x 2( x)2
Y
y 2
r=
n
n
n ( xy ) ( x )( y)
r=
30(10)2
28
222
4
4
4 ( 81 )(10)(28)
= 0.96
Por lo tanto existe una fuerte correlacin entre el gasto en publicidad y el ingreso por ventas.
Anlisis de regresin
A travs del anlisis de regresin buscamos que la lnea de ajuste se aproxime lo mejor posible a todos los
puntos del diagrama de dispersin. La ecuacin para la lnea recta empleada para calcular y con base en
x se conoce como ecuacin de regresin.
Ecuacin de regresin
Expresin matemtica que define la relacin entre dos variables.
Principio de mnimos cuadrado
Tcnica empleada para obtener la ecuacin de la regresin, minimizando la suma de los cuadrados de las
distancias verticales entre los valores y verdaderos y los valores pronosticados
^y .
xi , yi
a esta recta. El siguiente grafico muestra, para un solo punto, como se mide esta
distancia.
36
Para el valor
e i= y i(a+b x i )
Ahora bien, cualquier estimador razonable de la recta de regresin verdadera dejar algunos de los datos
observados por debajo y otros por encima de la recta estimada. Por lo tanto, algunos de los
e i sern
b=
yb x
y
y i
( x ix )
n x i y i x y
i
b = n xi2 ( xi ) 2
La recta:
^y = a + bx
Se denomina recta de regresin muestral de y sobre x
El coeficiente b significa que cada unidad adicional de x incrementa el valor de y en b unidades
El valor a solo tiene interpretacin matemtica, indica el punto de corte de la recta con el eje y.
Ejemplo
37
Los datos siguientes muestran las ventas (en millones) de cajas y los gastos de publicidad (en millones de
dlares) para 7 marcas principales de refrescos:
Marca
Gastos de
publicidad
131.3
92.4
60.4
55.7
40.2
29.0
11.6
Coca cola
Pepsi
Kola real
Sprite
Inca cola
Concordia
7 up
Ventas de
cajas
1929.2
1384.6
811.4
541.5
536.9
535.6
219.5
a.- Trace un diagrama de dispersin para estos datos, con los gastos de publicidad como variable
independiente.
b.- Qu parece indicar este diagrama acerca de la relacin entre las dos variables? trace una recta que
pase por los datos, para aproximar una relacin lineal entre los gastos de publicidad y las ventas.
c.- Aplique el mtodo de mnimos cuadrados para plantear la ecuacin estimada de regresin
d.- Presente una interpretacin de la pendiente de esta ecuacin
Solucin:
Variable independiente: Gastos de publicidad
Variable dependiente: Ventas de cajas
Diagrama de dispersin.
El diagrama parece indicar que la relacin entre las variables es linealmente positiva.
Ahora encontraremos los valores de r, a y b
Gastos de
x
Publicidad
131.3
92.4
60.4
17 239.69
8 537.76
3 648.16
Ventas de
y
1929.2
1 384.6
811.4
cajas
3 721 812.64
1 917 117.16
658 369.96
xy
253 303.96
127 937.04
49 008.56
38
Sumas
55.7
40.2
29
11.6
420.6
3 102.49
1 616.04
841
134.56
35 119.7
541.5
536.9
535.6
219.5
5 958.7
293 222.25
288 261.61
286 867.36
48 180.25
7 213 831.23
30 161.55
21 583.38
15 532.4
2 546.2
500 073.09
x 2( x)2
Y
y 2
r=
n
n
n ( xy ) ( x )( y)
35119.7(420.6)2
5 958.7
7 213 831.23
r=
7
7
= 0.97810014
Como r se aproxima a uno, entonces diremos que la relacin que hay entre las dos variables es bastante
fuerte o intensa.
La ecuacin que mejor se ajusta a los datos es una recta, como se aprecia en el siguiente grfico.
b=
n x i y i x y
i
n xi ( xi )
39
= 14.42378282
yb x
a=
r R
Coeficiente de determinacin (
Es el estadstico que mide la proporcin de la variacin total en y que puede ser explicada por la
variacin en x.
El coeficiente de determinacin se calcula elevando al cuadrado el coeficiente de correlacin.
En el ejemplo anterior como r = 0.9781, el coeficiente de determinacin ser
r =
0.9567, luego
pude decirse que 95.67% de la variacin en el nmero de cajas vendidas se explica por la variacin en los
gastos de publicidad.
Prueba de significancia del coeficiente de correlacin
Es importante estudiar si r es significativo (distinto de cero) ya que ello implica que el modelo de
regresin lineal es significativo.
Planteamiento de hiptesis:
Estadstico de prueba
r n2
1r 2
40
H o si:
Rechazar
(n2, 2 )
(n2, 2 )
Del ejemplo anterior, pruebe la hiptesis de que no existe correlacin en la poblacin. Emplee 0.02 de
nivel de significancia
Solucin
Planteamiento de hiptesis
Regla de la decisin
Rechazar
H o si:
T
3.365
3.365
Estadstico de prueba
r n2
1r
0.9781 72
10.9781
2.1870
= 0.2081
= 10.5093
Se acepta la hiptesis alternativa, es decir existe relacin entre las variables en estudio
ERROR ESTNDAR DE LA ESTIMACIN:
Mide la dispersin de los valores observados, con respecto a la recta de regresin.
41
sy.x
Marca
( Y Y ' )
n 2
Gastos de
Publicidad
x
Ventas de
Cajas
y
Y 2 a ( Y ) b ( XY )
n2
Rendimiento
Pronosticad
o
Desviaciones
y -
'
y'
Coca cola
Pepsi
Kola real
Sprite
Inca cola
Concordia
7 up
131.3
92.4
60.4
55.7
40.2
29.0
11.6
sy.x
1929.2
1384.6
811.4
541.5
536.9
535.6
219.5
1878.45
1317.35
855.78
787.99
564.42
402.87
151.89
2
( Y Y ' )
n 2
50.75
67.25
- 44.38
- 246.49
- 27.52
132.73
67.61
92770.73
7 2
Desviaciones
al cuadrado
2
( y y ' )
2575.56
4522.56
1969.58
60757.32
757.35
17617.25
4571.11
= 136.21
Y ' t(Syx)
( X X )
1
+
n X 2 ( X )2 / n
De donde
Y' = es el valor pronosticado para cualquier valor X seleccionado
X = es cualquier valor seleccionado de X
x = es la media de X
n = en el nmero de observaciones
Syx = es el error estndar de la estimacin
t = es el valor de t tomado para n 2
Ejemplo
De acuerdo a los datos anteriores. Calcular los intervalos de confianza para la venta de cajas de gaseosas
cuando la inversin en publicidad es 100.00 (millones de dlares)
x = es 60.0857
n = es 7
Syx = 136.21
t (n 2) =t(7 -2)(0,05)= 2.571
( 10060.0857 )2
1
(2.571)(
136.21)
+
1426.98
7 35119.7 ( 420.6 )2 /7
1426.98
Interpretacin.Cuando se invierte 100 millones de dlares en publicidad, se espera que la venta de gaseosas est
comprendida entre1622.1091 y 1231.8509 miles de cajas
Pero cuando a se trata de un valor individual la frmula es:
'
t(Syx)
( X X )2
1
1+ +
n X 2( X )2 /n
Ejemplo.
- Cuanto ser la venta de cajas de Inca cola, cuando esta compaa invierta 100 millones en publicidad:
( 10060.0857 )2
1
(2.571)(
136.21)
1+
+
1426.98
7 35119.7 ( 420.6 )2 /7
1426.98
Interpretacin.Con una probabilidad del 0,95 se puede afirmar que cuando la Inca Cola invierta 100 millones en
publicidad sus ventas estarn comprendidas entre 1972.305 y 881.655 cajas..
RELACIN
ENTRE
COEFICIENTE
DE
CORRELACIN,
DETERMINACIN Y ERROR ESTANDAR DE ESTIMACIN
COEFICIENTE
DE
Un medio conveniente para mostrar la relacin entre estas tres medidas es la ANAVA, recordemos que:
El error estndar de la estimacin mide cun cerca de la recta de regresin se encuentra los valores reales.
Cuando el valor es pequeo indica que las dos variables estn relacionadas muy de cerca.
El coeficiente de correlacin mide la fuerza de la asociacin entre dos variables. Cundo los puntos del
diagrama de dispersin parecen cercanos a la lnea recta, se observa que el coeficiente de correlacin
tiende a ser grande. Luego el error estndar de la estimacin y coeficiente de correlacin indican la misma
informacin, pero utilizan escalas diferentes.
43
Fuentes de
Variacin
Suma de
Cuadrados
Grados de
Libertad
Cuadrado
Medio
( GL )
( SC )
Prueba de
significacin
( CM )
( F)
CM r /CM e
Regresin
SC r
SC r /GL r
Error
SC e
n2
SC e / GLe
Total
SC r
n1
Significacin
estadstica
Y
2
SC r = ( ' Y )
SC e=
( Y Y ' )2
SC t =
( Y Y )2
Y'
1929.
2
1384.
6
811.4
1878.4
5
1317.3
5
855.78
541.5
787.99
536.9
564.42
535.6
402.87
219.5
151.89
=SC t SC r
Y
851.242
8
851.242
8
851.242
8
851.242
8
851.242
8
851.242
8
851.242
8
( Y Y )2
(Y Y )
1077.957
2
533.3572
- 39.8428
309.7428
314.3428
315.6428
631.7428
( Y Y ' )
(Y ' Y )
1055154.632
(Y Y ' )
( Y ' Y )
1161991.72
5
284469.902
8
1587.4487
50.75
2575.5625
67.25
4522.5625
1027.207
2
466.1072
-44.38
1969.5844
4.5372
20.5861
95940.6021
-246.49
60757.3201
-63.2528
4000.9167
98811.3959
-27.52
757.3504
-286.8228
82267.3186
99630.3771
132.73
17617.2529
-448.3728
201038.1678
399098.965
4
67.61
4571.1121
-699.3528
489094.3389
CM
2048831.
882
18554.14
89
110.42
44
Sign.
Estad.
**
217255.9219
SC T SC e SC r
A
Fuentes de
Variacin
Regresin
Error
SC
2048831.
882
92770.74
49
GL
1
5
44
Total
2141530.
417
=0,01
Interpretacin:
Realizado el anlisis de variancia (ANAVA) para la regresin se encontr una alta significacin
estadstica para la regresin, por lo tanto podemos decir que existe asociacin entre ambas variables en
estudio
r2
2048831.882
r2 =
2141530.417
= 1
SCr
= SC t
= 1
92770.7449
2141530.417
SC e
Sct
= 0,9567 = 95.67%
El 95.67% de las variaciones de la venta de cajas de gaseosas (Y) es explicado por la inversin que se
hizo en publicidad (X)
0,9567
r=
S yx=
SC e
n2
92770.7449
7 2
= 136.2136
Por ltimo se como se observa que conforme la Suma de Cuadrado del error disminuye
ta y por el contrario, conforme disminuye el error estndar se incrementa r2
Anlisis de regresin mltiple
Estudia la influencia de dos o ms variables independientes sobre la dependencia de otra variable
dependiente.
La ecuacin ser:
'
= bo + b1X1 +b2X2
45
X 21 + b2X1X2
X1Y = boX1 + b1
X2
Este sistema de ecuaciones se puede resolver de diferentes maneras, una de ellas es empleando matrices
Ejemplo.- El director de personal de una empresa que tiene un importante grupo de vendedores, debe
entrevistar y seleccionar nuevo personal. Ha diseado una prueba que ayuda a seleccionar los mejores
aspirantes para su personal de ventas A fin de verificar la validez de una prueba como instrumento de
prediccin de las ventas semanales. Eligi al azar a cinco vendedores y aplic la prueba a cada uno. Los
importes de ventas semanales se aparearon con el puntaje obtenido en la prueba y con la calificacin que
se les hizo a su desempeo
1.- Cul ser la ecuacin de regresin mltiple?
2. Supngase que un solicitante de empleo en el departamento de ventas tuvo un puntaje de 6,0 en la
prueba y una calificacin de desempeo de 3,8. Cules son las ventas semanales estimadas del
solicitante?
Vendedor
Ventas semanales
(en miles de soles) Y
Puntaje de la
Prueba
( X1)
Juan
Milagritos
Ral
Steffany
Eduardo
5
12
4
8
11
Calificacin de
Desempeo
( x2)
4
7
3
6
10
2
5
1
4
6
Solucin:
1.- La ecuacin podr ser calculada de la siguiente forma:
n
x1
x2
2
x 1 x 1 x1 x 2
x 2 x 1 x2 x 22
][ ] []
y
x1 y
x2 y
b0
b1
b2
46
X1
Y
5
12
4
8
11
40
Total
X2
4
7
3
6
10
30
2
5
1
4
6
18
X1 X2
X1
X2
16
49
9
36
100
210
4
25
1
16
36
82
8
35
3
24
60
130
X1 Y
X2 Y
20
84
12
48
110
274
10
60
4
32
66
172
5 30 18
30 210 130
18 130 82
][ ] []
1
40
274
172
b0
b1
b2
5 30 18
30 210 130 =|160|
18 130 82
210 130
130 82
= 320
30 130
18 82
=120
= 120
30 210
18 130
30 18
130 82
= 120
5 18
18 82
= 86
5 30
18 130
= 110
= 120
5 18
30 130
= 110
5 30
30 210
= 150
30 18
210 130
]
][ ]
[]
bo
b1
b2
47
bo =
b1
110 x 172
( 120 x 40 ) ( 86 x 274 )
=
=0,975
b2
150 x 172
( 120 x 40 )( 110 x 274 )
=
= 2,875
= 3,5
Sy.12 =
(Y Y ' )2
n (K +1)
Puntaje de
Prueba
X1
Juan
Milagritos
Ral
Steffany
Eduardo
4
7
3
6
10
Calificacin
de
Desempeo
X2
2
5
1
4
6
Ventas
semanales
(miles
de
soles)
Ventas
semanales
Pronosticadas
(miles de soles)
(Y y )
( Y y' )
5
12
4
8
11
5,35
11,05
3,45
9,15
11,00
0,35
0,95
0,55
1,15
0,00
0,1225
0,9025
0,3025
1,3225
0,0000
0,00
2,6500
Total
48
Sy.12 =
2,65
5 (2+1)
Correlacin
pequea
Correlacin
moderada
Correlacin
grande
0,50
1,00
sin correlacion
correlacin perfecta
Fuentes de
Variacin
Suma de
Cuadrados
Grados de
Libertad
Cuadrado
Medio
( GL )
( SC )
Regresin
SC r
Error
SC e
Prueba
de
significacin
( CM )
( F)
SC r /GL r
CM r /CM e
Significacin
estadistica
SC e /GLe
( K1 )
SC r
Total
n1
r=
SC r
SC t
Sy.12 =
y
5
12
4
8
11
40
Y'
5,39
11,0
3,45
9,15
11
40
8
8
8
8
8
( Y Y ) ( Y Y )2
3
4
4
0
3
0
9
16
16
0
9
50
SC e
n ( K 1)
( Y Y ' )
0,35
0,95
0,55
1,15
0
0
(Y Y ' )
0,1225
0,9025
0,3025
1,3225
0
2,65
(Y ' Y )
2,65
3,05
4,55
1,15
3
0
( Y ' Y )
7,0225
9,3025
20,7025
1,3225 49
9
47,35
SC T SC e SC r
Total
A
Fuentes de
variacin
Regresin
Error
Total
SC
47.35
2.65
50
G
L
2
2
4
F(2,2)= 19,00 (
CM
SIG
23.675
1.325
17.87
N.S.
=0,05
99,50 ( =0,01
Coeficiente de determinacin:
r 2=
SC r
SC t
47,35
=94,70
%
50
0,9470
= 0,9731
Sy.12 =
SC e
n ( K 1)
2,65
5 (2+1)
= 1,1510
50
b)
Colaboradores.
c)
Formulacin de hiptesis.
d)
e)
f)
g)
Interpretacin de resultados.
h)
La biometra es primordial para analizar e interpretar los datos y se manifiesta en diversas formas:
a)
b)
c)
d)
e)
f)
En general, la experimentacin agrcola la deben realizar los profesionales relacionados con las ciencias
agronmicas y biolgicas.
Disear un experimento significa planear un trabajo de modo que rena la informacin aplicable al
problema en investigacin. Steel y Torrie consideran un experimento como una pregunta que detectar
nuevos hechos, confirmar los resultados de ensayos anteriores y dar recomendaciones de aplicacin
prctica.
El experimento es el conjunto de reglas usadas para obtener una muestra de la poblacin y al concluir el
ensayo obtener informacin acerca de la poblacin. Little y Jackson afirman que el experimento es un
elemento de investigacin utilizada para descubrir algo desconocido, o para probar un principio o una
hiptesis. Es un caso importante del mtodo cientfico, ya que las preguntas que el experimento pretende
contestar sern fundamentales para apoyar o rechazar una hiptesis.
TRATAMIENTO
Es una de las formas que, en cantidad o calidad, el factor a estudiar toma durante el experimento. Por
ejemplo, s el factor a estudiar es variedad de arroz, un tratamiento es la variedad NIR si el factor a
estudiar es cantidad de lisina, cada una de las dosis de lisina aplicada durante el experimento es un
tratamiento. Los tratamientos a estudiar durante el experimento pueden ser una combinacin de varios
factores simples: si quiere estudiarse la distancia entre hileras y la distancia entre plantas en un cultivo, se
pueden considerar tratamientos simples como 80 cm. entre hileras o 3 cm entre plantas, o tratamientos
combinados como 80 cm entre hileras y 3 cm entre plantas.
51
Por ejemplo, en la industria el productor de detergentes puede establecer como tratamiento el tipo de agua
(dura o suave), la temperatura del agua, la duracin del lavado, la marca y el tipo de lavadora. En los
estudios sociolgicos y psicolgicos, los tratamientos se pueden referir a edad, sexo, grado de educacin,
religin, etctera.
Unidad experimental
es el material experimental al que se aplica un tratamiento de manera uniforme. Puede ser un animal, un
conjunto de semillas, una parcela, una maceta, un rbol, un tubo de ensayo, etctera.
Tratamiento testigo
Es un tratamiento que se compara. Por ejemplo, si se quiere probar en una regin el grado de adaptacin y
rendimiento de una variedad nueva de pltano, se planear el ensayo de tal manera que se incluyen
variedades locales como testigos. Si la nueva variedad presenta mayor resistencia a enfermedades,
insectos, vientos, precipitacin, etc., y en consecuencia produce mayor rendimiento por hectrea, esa
variedad se recomendar para la zona.
En investigacin con animales se pueden probar sexos, localidades, raciones, pocas, sistemas de
pastoreo, carga de animal ptima, tipos de vacuna, uso de vitaminas y minerales, etc. En tales casos, se
forman grupos de animales tan homogneos como sea posible para la investigacin. Para formar los
grupos se deben considerar aspectos como edad, sexo y raza. Si a varios grupos de animales se les
administran diferentes dosis de vitaminas, pero no a un grupo testigo, el anlisis estadstico dar
informacin acerca del aumento de peso, altura y precocidad de los animales que recibieron la vitamina
comparados con los que no la recibieron.
REPETICIN
Cuando en un experimento se tiene un conjunto de tratamientos para poder estimar el error experimental,
es necesario que dichos tratamientos aparezcan ms de una vez en el experimento, para as aumentar la
precisin de ste, controlar el error experimental y disminuir la desviacin estndar de la media. Por lo
tanto, se entender por repeticin al nmero de veces que un tratamiento aparece en el experimento.
DISEO EXPERIMENTAL
Es el procedimiento que se sigue para asignar los tratamientos a las unidades experimentales. Es un
mtodo aleatorio, o sea, de asignacin al azar, porque se decide el tratamiento que corresponde a cada
unidad experimental mediante un sorteo o por medio de una tabla de nmeros aleatorios.
BLOQUE O REPETICIN
Es un conjunto de unidades experimentales lo ms homogneas posibles, en el cual aparecen todos los
tratamientos una sola vez; dicho bloque se debe colocar perpendicular al gradiente para tratar de
minimizar el error.
52
ERROR EXPERIMENTAL
Los resultados experimentales varean no solo por la accin de los tratamientos, sino tambin por
variaciones ambientales que tienden a enmascarar el efecto de los tratamientos. Por lo general. Para
expresar estas variaciones se usa el trmino error experimental. Pero el trmino error no quiere decir
equivocacin, sino que incluye todo tipo de variacin externa ajena al material experimental.
El error experimental es la medida de variacin que existe entre las observaciones de unidades
experimentales en el mismo tratamiento, es decir, la variacin no proviene de los tratamientos. Existen
dos clases de variaciones; la variacin inherente al material experimental, al que se aplican los
tratamientos, y la que proviene de la falta de uniformidad en la realizacin fsica del experimento. Si los
resultados obtenidos tienen la precisin necesaria para llegar a conclusiones validas, ninguna de las dos
fuentes de variacin deben preocupar al investigador.
El error experimental no se puede eliminar, pero sus efectos se pueden reducir para obtener una mejor
estimacin de los efectos de los tratamientos. Las modalidades ms recomendadas para disminuir error
son:
a.-Utilizar unidades experimentales muy uniformes, como suelo homogneo, riegos, densidad de
siembra, fertilizacin, control de plagas y hierbas, etctera.
b.- Tamao adecuado de la unidad experimental.
c.- Eliminacin del efecto de orilla y de la competencia entre tratamientos
d.- Distribucin adecuada de los tratamientos mediante sorteos.
e.- Usar el nmero adecuado de repeticiones para cada tratamiento.
f.- Poner todos los tratamientos en iguales condiciones, de manera que si alguno es superior a los
dems, se puede probar.
Existen ciertos detalles tcnicos al realizar los experimentos que parecen obvios, sin embargo, muchas
veces pasan inadvertidos. Una vez que se tiene listo el terreno para el experimento, es conveniente marcar
los contornos de los bloques y la posesin de las parcelas de acuerdo con el diseo experimental. Si el
campo est surcado y el nmero de surcos por parcela es impar se debe marcar el surco central de cada
parcela, y si es par el primer surco de la derecha. Adems, las bolsas que contengan las semillas, abonos,
etc., que se aplican a las parcelas, tendrn claramente indicado el nmero de bloque y parcela a que
pertenecen. Antes de empezar la siembra y su preparacin, el experimentador debe verificar que cada
bolsa est en el campo frente a la parcela correspondiente.
Durante la realizacin del experimento debe quedar claro que todas las labores se harn con uniformidad
para todo el lote experimental, excepto las que estn en estudio. Cuando se efectan experimentos de
abonamiento, variedades, etc., es importante conocer el origen de cada tratamiento, las caractersticas de
las variedades y el anlisis de los abonos. Los materiales para aplicar los tratamientos se deben conseguir
y preparar oportunamente, y nunca esperar hasta el da del inicio del experimento.
La siembra, abonamiento, labores culturales y otras, se deben realizar el mismo da para todo el
experimento. Lo anterior es necesario en los lugares lluviosos, porque las labores realizadas antes y
53
despus de llover encuentran el terreno en condiciones diferentes, lo cual puede causar variabilidad en la
germinacin, efecto de los abonos, etc. Si no es posible realizar las labor completa en un da se debe
evitar dejar bloques sin terminar
Si se trata de experimentos comparativos de variedades es til compara las caractersticas de las
variedades sembradas, con aquellas que se obtienen al momento de la cosecha, para determinar cmo se
adaptan a las condiciones ecolgicas de la localidad. Tambin es muy importante que una parte de la
semilla de las variedades introducidas se cultive aparte para mantener su pureza, adems de multiplicarla
y aclimatarla, ya sea para utilizarla en experimentos siguientes o para distribuirla entre los agricultores.
En ciertos casos, para mantener la pureza de la variedad es necesario ir al embolsado de las flores para
evitar la polinizacin cruzada.
Cuando se trabaja con varios obreros de campo es importante cuidar que ninguno se dedique a un mismo
tratamiento en todas las repeticiones del experimento. Ya que, un obrero puede trabajar mejor que otro y,
en consecuencia, el tratamiento que realice estar en ventaja.
Un experimento nunca se debe sembrar fuera de poca porque pierde su valor. En los experimentos de
abonamiento no debe descartarse el testigo sin abono, ni el testigo que representa la prctica de la
localidad. Debido a que muchos experimentos se pierden por los daos que causan los animales se debe
extremar la vigilancia, especialmente en la poca prxima a la cosecha.
En la toma de datos y observaciones en los experimentos, es importante que el experimentador se libere
de toda preferencia por determinado tratamiento para evitar falsear de manera inconsciente los resultados.
Tambin es importante que l mismo sea quien haga las observaciones y que anote slo los datos
debidamente comprobados. En los experimentos no deben interesar solamente los rendimientos, ya que de
proceder as no se conoceran las causas que determinan ciertos resultados de buena calidad del producto.
Se aconseja revisar los experimentos cuando menos una vez por semana, para hacer las observaciones
oportunamente. Todas las observaciones se deben anotar cuidadosamente sin dejan nada al azar ni confiar
en la memoria. Los datos deben estar en orden, de tal manera que otro experimentador pueda utilizarlos si
es necesario.
Para muchos investigadores el tamao y la forma de la unidad experimental es nicamente un problema
de control. Sin embargo, investigaciones realizadas en diferentes cultivos con datos de ensayo en blanco,
han indicado que el tamao adecuado se relaciona con el grado de precisin y con una mejor estimacin
de los efectos de los tratamientos, el aspecto del costo por unidad experimental y la precisin del
experimento: aqu se prefiere un mayor nmero de repeticiones que el tamao, y la unidad experimental
se orienta de manera que la mayor dimensin se dirija hacia donde est la mayor variacin del suelo.
ELECCIN DEL DISEO EXPERIMENTAL
Cuando el experimentador ya defini el objetivo del trabajo y los tratamientos por probar, el siguiente
paso es determinar el diseo experimental que se debe usar. Para un experimento especfico, el mejor
diseo es el ms sencillo y el que usa la menor cantidad de material para lograr el objetivo.
54
En la prctica, las unidades experimentales, las condiciones ambientales y de manejo no son iguales, y los
mtodos de medida son inexactos. Por ello, es necesario hacer repeticiones y utilizar un diseo
experimental.
Si se considera que el experimentador estudia un fenmeno complejo (como la produccin de trigo, de
leche o el crecimiento de una colonia de hongos), que mantiene fijos todos los factores que intervienen en
el fenmeno y que los mtodos de medida son exactos, el resultado ser el mismo cada vez que se realice
el experimento. Entonces, cada combinacin de factores determina un resultado que permanecer
constante si se repite el experimento. El experimentador, de acuerdo con su objetivo, vara uno o ms
factores para evaluar el efecto de tales variaciones en el resultado.
TCNICA DE ALEATORIEDAD
Debido a la variabilidad del suelo, para evitar que un tratamiento sea favorecido o puesto en desventaja en
forma sistemtica en sus repeticiones, Fisher ide la tcnica de aleatoriedad, cuya finalidad es dar una
estimacin insesgada del error experimental.
Las parcelas contiguas tienden a correlacionarse, por eso cualquiera de ellas debe recibir al azar algn
tratamiento. La aleatoriedad tiende a destruir la correlacin entre errores y hacer vlidas las pruebas de
significacin. El ejemplo ms comn de la tcnica de aleatoriedad est dado por la rifa de un objeto. Si se
colocan papeles o fichas numeradas en un nfora y se supone que estn completamente mezcladas,
cualquier secuencia en que salgan se considerar aleatoria. Cuando el investigador tiene pocos
tratamientos recurre a esta tcnica. Sin embargo, es preferible recurrir a una tabla de nmeros aleatorios.
ANLISIS DE VARIANZA
Anteriormente se analizaron datos provenientes de dos muestras o dos tratamientos. Se observ que por
medio de la prueba t de Student es posible determinar si la variedad A es estadsticamente ms productiva
que la variedad B, o si un forraje con fertilizante es mejor que un forraje sin fertilizante.
El trabajo del investigador pocas veces se limita a estudiar dos tratamientos a la vez. Para ahorrar tiempo
y esfuerzo, y para aumentar la precisin del experimento, por lo general, se estudian ms de dos factores a
la vez, con varios niveles dentro de cada factor.
Sir Ronald Fisher introdujo el anlisis de varianza (ANAVA), que es un procedimiento aritmtico que
consiste en desdoblar la suma de cuadrados total (variacin total) en fuentes de variacin reconocidas,
con todo y la variacin que no se pudo medir (proveniente de la variabilidad inherente al material
experimental o de la falta de homogeneidad del ambiente donde se realiz el experimento); fuente de
variacin que se conoce como residuo o error experimental. Por ejemplo, cuando se trat lo concerniente
a regresin, la suma de cuadrados total se descompuso en suma de cuadrados debido a la regresin, ms
la suma de cuadrados debido al error.
El ANAVA se utiliza en todos los campos de investigacin cuando los datos se miden cuantitativamente.
Su uso ha sido muy ventajoso en el diseo experimental. Las suposiciones bsicas del ANAVA son
55
a)
b)
GRADOS DE LIBERTAD
Los grados de libertad son el nmero de contrastes ortogonales menos el nmero de restricciones
impuestas, que se pueden hacer en un grupo de datos. Por ejemplo, si se supone que el rendimiento de
cinco variedades de un cultivo es de 25, 26, 27, 28 y 29 kg, la meda es 27 kg. Las desviaciones de los
nmeros con respecto a su medida (que deben sumar cero) son:
25
26
27
28
29
-2
-1
+1
+2
En esta muestra de cinco datos, uno queda fijo (la restriccin est dada por X= 27), porque X se utiliz
como el origen para las desviaciones. Entonces quedan cuatro valores (cuatro grados de libertad) que se
pueden comparar independientemente con la media, o sea que el nmero de grados de libertad de una
muestra de datos est dado por el total de observaciones menos uno (n - 1).
La varianza de la muestra est dada por:
2
( X i X )
n1
suma de cuadrados
grados de libertad
Es decir, la varianza es el cociente que resulta de dividir la suma de cuadrados entre el nmero de grados
de libertad. Dentro del ANAVA, y para obtener el valor F (que denota la significacin entre tratamientos)
se divide el cuadrado medio del tratamiento entre el cuadrado medio del error.
Al comparar el valor de F calculado con el F tabulado, se podr establecer si existe significancia. Habr
significancia en caso de que el valor F calculado sea mayor que el valor F tabulado. Este ltimo se
encuentra en la tabla de F, con el nivel de significancia apropiado, los grados de libertad del error en la
vertical. Si se rechaza la hiptesis nula de que no existen diferencias en los tratamientos, el siguiente paso
es efectuar la prueba de significancia entre medias de tratamiento, para conocer cules de ellos son
mejores.
DISEO COMPLETAMENTE AL AZAR
El diseo completamente al azar es el diseo ms simple y se usa cuando las unidades experimentales son
homogneas, y la variacin entre ellas es muy pequea. Tal es el caso de experimentos de laboratorios,
invernadero, gallineros, porcinas, etc. En experimentos
56
b.- Es flexible en cuanto al nmero de tratamientos y repeticiones, el lmite est dado por el nmero de
unidades experimentales en general.
c.- No es necesario que el nmero de tratamientos sea igual al nmero de repeticiones.
d.- No se estima parcelas perdidas.
e.- El nmero de grados de libertad para el error aumenta al no tener muchas restricciones.
Las desventajas del diseo son:
a.- No es eficiente con material experimental heterogneo.
b.- Puesto que no existen restricciones en cuanto a la aleatoriedad, el error experimental incluye la
variacin total entre unidades experimentales
A
FUENTE
DE
VARIACI
ON
SUMA DE
CUADRAD
OS
SC
Tratamie
x 2i.
r
SC tot.
nto
Error
Total
SCtra.
x 2ij
GRADOS
DE
LIBERTA
D
GL
t 1
CUADR
ADO
MEDIO
CM
PRUEBA
ESTADIS
TICA
F
SC /GL
CMt/cme
t(r 1)
SC /GL
tr 1
x 2ij
rt
Maceta
1
2
3
4
Total
Media
T R ATAM I E N T O S
1
2
3
4
5
101 51
83
67
29
93
61
68
40
45
93
59
72
46
51
96
58
75
52
42
383 229 298 205 167
93, 57, 74, 51, 41,
128
57
12822
= 82176
TC
20
2+ .+422
2+ 83
SC total
TC = 8168
2+ 51
101
2
205 2+167
2+
TC=
4
SC tratamientos =
7286
2+ 2292+ 298
383
Fuentes de
Tratamiento
Variacin
Error
Total
C.V.
SC
7286
882
8168
GL
4
15
19
CM
1821,5
58,15
SIG
**
F 0.05 = 3,06
0,01= 4,89
CMerror 882
X ..
F
30,98
64,1
100= 46,33%
El coeficiente de variabilidad o coeficiente de variacin indica la confiablidad en los datos, a medida que
su valor disminuye la confiabilidad es mayor.
Prueba de significacin de t
-
1 vs 2
1 vs 3
1 vs 4
1vs 5
Ho
1=2
Ho
1=3
Ho
1= 4
Ha
1 2
Ha
1 3
Ha
1 4
2 vs 3
2 vs 4
2=3
Ho
2= 4
Ho
2=5
Ha
2 3
Ha
2 4
Ha
2 5
Ho
Ha
1=5
1 5
2 vs 5
Ho
3 vs 4
Ho
3 vs 5
3= 4
Ho
3=5
58
3 4
Ha
3 5
Ha
4 vs 5
Ho
4 =5
Ha
4 5
S d
2 c .m . error
r
2 x 58,15
4
= 5, 39
( gl error )
( 15 )
0,05= 2,131
( 15 )
0,01= 2,947
Comparaciones
t=
d
sd
( 12 )
t=
( 13 )
t=
t=
t=
( 14 )
Sd
( 15 )
Sd
( 23 )
Sd
( 24 )
Sd
( 25 )
Sd
=
=
= 6, 77**
93,7574,50
5,39
Sd
t=
93,7557,25
5,39
Sd
t=
t=
= 3, 57**
93,7551,25
5,39
= 7, 88**
93,7541,75
5,39
= 9, 64**
57,2574,50
5,39
= 17, 25 *
57,2551,25
5,39
57,2541,75
5,39
= 1, 11 N.S.
= 2, 87*
59
( 34 )
t=
Sd
( 35 )
t=
Sd
( 4 5 )
t=
Sd
74,5051,25
5,39
= 4, 31**
74,5041,75
5,39
= 6, 07**
51,2541,75
5,39
= 1, 76 N.S.
Prueba de D. L. S.
D.L.S. = t . S d
= 2,131 x 5,39= 11.48
c . m. error
r
58 , 15
4
=3,81
P2= 3,01
P3= 3,16
P4 = 3,25
P5= 3,31
Encontramos la A.L.S.
A.L.S. =A.E.S. x S d
5
60
A.E.S.
S
A.L.S.
3.01
3.81
11.46
3.16
3.81
12.03
3.25
3.81
12.38
3.31
3.81
12.61
5
41,75
4
51,25
3
57,25
2
74,50
1
93,73
Otro mtodo
Tratamiento
Promedio
1
3
93,70
74,50
57,25
51,25
41,75
x =
c . m. error
r
58 , 15
4
=3,81
Buscamos en la tabla de Tukey con los grados de libertad del error y el nmero de tratamientos.
A.E.S. (T) = A.E.S. (15 y 5) = 4,37
61
A.L.S. = S
x . A.E.S. (T)
Promedio
2
4
93,70
74,50
57,25
51,25
41,75
Repeticione
1
2
3
4
5
6
7
8
9
Total
Media x
( X .. )2
TC =
n
1
45
46
49
44
2
35
33
184
46
68
54
R AC I O N E S
4
41
41
44
43
41
42
44
41
41
170
378
800
34
42
3
34
34
35
34
33
Gran Total
8002
= 20 =32000
2
62
SCtotal=
Fuentes de Variacin
Tratamiento
Error
Total
SC
432
32
464
GL
3
16
19
CM
72
,
2
F
36
SI
**
G
F 0.05 3,24
0,01 5,29
C.V. =
CM error x 100= 2
X ..
40
x 100= 3,52%
Como F es altamente significativo, nos permite rechazar la hiptesis nula de que no hay diferencias entre
los tratamientos
El coeficiente de variabilidad o coeficiente de variacin indica la confiablidad en los datos, a medida que
su valor disminuye la confiabilidad es mayor.
DISEO DE BLOQUES COMPLETOS AL AZAR
El objetivo del diseo bloques completos al azar es reunir las unidades experimentales a las cuales se
aplicaran los tratamientos, en bloques de cierto tamao, de tal modo de que los tratamientos se efecten
dentro de cada bloque. La variabilidad entre unidades experimentales de bloques diferentes ser mayor
que entre unidades dentro del mismo bloque, como consecuencia, las diferencias encontradas entre
unidades, se deben principalmente a discrepancias entre tratamientos. La disparidad que no se deba a
tratamientos, se elimina por el diseo y forma parte del error experimenta. De acuerdo con esto, es fcil
observar que la variabilidad entre bloques no afecta las diferencias entre medias de tratamientos, porque
en cada bloque aparece una vez por tratamiento, y as los bloques y tratamientos son ortogonales.
Durante el experimento todas las parcelas dentro del bloque se deben tratar igual, excepto cuando se
aplique un tratamiento cuyo efecto se quiere medir. Por ejemplo, si los tratamientos son niveles de
fertilizacin, todos los dems factores como preparacin del suelo, poca, densidad de siembra, labores de
cultivo, uso de plaguicidas, riegos y variedades deben ser exactamente iguales para todas las parcelas, si
no es as, se introduciran otras fuentes de variacin cuyo efecto no se podra medir, y ocultaran el efecto
de los tratamientos en estudio.
El diseo bloque completo al azar se caracteriza por su equilibrio, fcil planeacin y procedimiento de
clculo simple. Su nica desventaja es que cuando el nmero de tratamientos es alto, aumenta la
superficie del terreno dentro de cada bloque y tambin el error experimental.
REPETICIONES
Su
Med
J=1,2,3,r
ma
ia
63
Tratamie
nto
1
2
X 11 X 12
X 21 X 22
X 1 r X 1. X 1.
X 2 r X 2. X 2.
t
Suma
Media
Xt 1 Xt 2
X .1 X .2
x .1 X .2
X tr X t .
X . r x ..
X . r X ..
Xt .
A N A V A
Fuente de
SC
GL
CM
Variacin
TRATAMIENT
x 2i.
r2 TC
x
t. j TC
SC tot. SCtrat. SC
t1
SC /GL
CMt/cme
r1
SC /GL
CMr /cme
(t 1)(r
SC /GL
OS
REPETICIONE
S
ERROR
2
x ij TC
rep.
TOTAL
n 1)
1
( X .. )2
TC =
n
El siguiente ejemplo presenta los resultados de seis variedades de frijol (rendimiento expresado en
gr/parcela) en el que se usaron cuatro repeticiones por tratamiento.
Se quiere probar la siguiente hiptesis:
Ho No existe diferencias entre tratamientos
Ha Existe diferencias entre tratamientos, ms all de lo que puede
atribuirse al azar
Variedades
Bayo
Canario
Blanco
Testigo
De Palo
Panamito
Total
Promedio
1
42
32
25
18
35
36
188
31,3
3
TC =
REPETICIONES
2
3
4
46
38
41
38
31
30
32
28
26
20
26
24
42
46
40
25
22
26
203
191
187
33,8 31,8 31,1
3
( 1882 )
24
total
167
131
111
88
163
109
769
Promedi
41,75
o
32,75
27,75
22,00
40,75
27,25
32,04
=24640
64
SC total
SC repeticiones
SC tratamientos
24640 = 1251
Fuentes
de
Variacin
Tratamie
nto
Repetici
n
Error
Total
SC
GL
CM
Sig.
125
1
27
250
.2
9.0
13.
08
0.4
7
**
287
15
136
5
23
n.s.
19.
13
C.V. =
32,040
Los datos indican que se debe rechazar Ho, por lo tanto existe diferencia entre los tratamientos. La
prueba de significacin establecer la superioridad estadstica de una variedad respecto a otras.
Estimacin de parcela perdida:
Cuando se usa el diseo completamente al azar, la perdida de una parcela no afecta el procedimiento de
clculo. Con el diseo de bloques completos al azar, se pude presentar el caso que un ataque de pjaros, o
insectos haya destruido una parcela, o que en un ensayo con animales uno de ellos haya muerto. En tales
casos es necesario estimar el valor que falta, antes de aplicar el anlisis de variancia, mediante la
ecuacin:
ij=
rb +tT + g
( r 1 ) (t1)
Donde:
X ij
Parcela a estimar
65
r Nmero de repeticiones
B Total del bloque donde se perdi la parcela
t
Nmero de tratamientos
T Total del tratamiento donde se perdi la parcela
G Total general
Cuando ya se estima este valor, se coloca en la parcela faltante y se analiza el experimento normalmente,
slo que los grados de libertad del error y total se disminuyen en una unidad. Esto se debe a que dicho
valor o valores estimados no tienen desviaciones, por tal razn, no contribuyen a la suma de cuadrados
del error. Por lo tanto, en el total, la suma de cuadrados del tratamiento est aumentada en la cantidad
dada por la siguiente ecuacin (siempre y cuando el nmero de tratamientos sea mayor a diez)
[b ( t1 ) X ]
t (t 1)
Fuente de
Variacin
Tratamientos
Hileras
Columnas
Error
Total
SC
GL
CM
x2
t1
SC /GL
CMt/cme
r1
SC /GL
CMr /cme
c1
SC /GL
CMc /cme
(r 1)(r 2)
SC /GL
r2i. TC
x
t2. j TC
x .c
TC
SC tot. SCtrat. rSCHiler. SCcolum
x 2ij
TC
n1
( X .. )2
TC =
n
66
Ejemplo: Un experimento con cuatro variedades de arroz, con gradientes en dos sentidos, se muestran a
continuacin (el rendimiento se d en Kg/parcela)
B
2
A
7
D
5
C
6
20
Total
columna
Total de Tratamientos A = 32
( X .. )2
TC =
n
S96c total =
( 96 )2
=
16
D
3
C
5
B
4
A
9
21
B =16
A
6
B
5
C
9
D
5
25
C
8
D
7
A
10
B
5
30
C = 28
Total hilera
19
24
28
25
96
D = 20
= 576
576
10,5
576 = 15,5
Fuentes de
Tratamiento
Variabilidad
Hilera
Columna
Error
Total
SC
10
10.5
15.5
8
74
GL
3
3
3
6
15
CM
13.333
3.5
5.166
1.1333
F
10.00
2.625
3.875
SIG
**
N.S
N.S
F (0,05) = 4,76
(0,01) = 9,78
67
La significacin de hileras columnas indica en qu direccin del terreno est la fertilidad del suelo. En
este experimento no se detect dicha variabilidad en ninguna hilera ni en columna. El coeficiente de
variabilidad indicar la confiabilidad en los datos
C.V. =
x 100=17,90%
La prueba de significacin correspondiente indicar cul o cules tratamientos son los mejores.
ESTIMACIN DE PARCELAS PRDIDAS
Cuando en el diseo de cuadrado latino se pierde una unidad experimental, se puede estimar con la
siguiente ecuacin.
X=
r [ H +C+T ] 2 G
(r 1) (r 2)
Donde:
X = Parcela estimada
H = Total de hileras donde est la parcela perdida
C = Total de columnas donde est la parcela perdida
T = Total del tratamiento donde est la parcela perdida
G = Total general
r = Nmero de repeticiones
Igual que en el diseo de bloques al azar, la suma de cuadrados de los tratamientos se debe corregir
cuando el nmero de tratamientos sea mayor de 10, restndole el siguiente trmino
2
[G H C( r1 ) T ]
2
[ ( r 1 )( r 2 ) ]
68
2.- Todas las unidades experimentales intervienen en la determinacin de los efectos principales y de los
efectos de interaccin de los factores, por lo que el nmero de repeticiones es elevado para estos
casos.
3.- El nmero de grados de libertad del error es alto comparndolo con los experimentos simples de los
mismos factores, lo que contribuye a disminuir la variancia del error, aumentando por este motivo la
precisin del experimento.
Desventajas de los experimentos factoriales.
1.- Requiere mayor nmero de unidades experimentales en relacin con los experimentos simples y por
consiguiente mayor trabajo en la ejecucin del experimento. As, cuando el nmero de factores y
tratamientos es por ejemplo
de unidades experimentales requerido seria de 4 x 4 x5 = 320, nmero que es elevado para la mayor
parte de experimentos
2.- Como en los experimentos factoriales cada uno de los tratamientos de un factor debe combinarse con
todos los tratamientos de un factor debe combinarse con todos tratamientos de cada uno de los otros
factores a fin de que exista balance en el anlisis estadstico, el resultado es que algunas de las
combinaciones en algunos experimentos no tiene inters prctico, pero hay que incluirlas para
mantener el balance; por ejemplo, en un experimento de nmero de labranzas (sin labranza, una
labranza, dos labranzas) y dosis de encalado del suelo (sin encalado, 4 toneladas de encalado, 8
toneladas de encalado), resultan algunas combinaciones que no tienen inters practico para la
agricultura, tal por ejemplo la que combina encalado sin labranzas, ya que la cal quedara sin enterrar
3.- El anlisis estadstico es ms complicado que en los experimentos simples, y la interpretacin de los
resultados se hace ms difcil a medida que aumenta el nmero de factores y tratamientos en los
experimentos
Experimentos factoriales de dos factores (pq)
En los experimentos factoriales de dos factores pueden estudiarse los siguientes efectos (diferencias entre
niveles)
a.- Efectos principales de los factores; los que estn dados para un factor en promedio de los niveles del
otro factor.
b.- Efectos simples; los que estn dados para un factor en cada uno de los niveles del otro factor.
c.- Efecto de interaccin; que est dado por la variacin que tiene un efecto simple de un factor al pasar
de un nivel a otro del factor.
d.- Efectos cruzados; que estn dados por las combinaciones cruzadas de los dos factores.
Ejemplo.
Para explicar estos factores consideremos un experimento factorial de pq =
( 2 )( 2 ) =22 que es el ms
pequeo de los experimentos factoriales dona tiene dos niveles y el factor B tambin tiene dos niveles.
A 1=Variedad X de papa
A 2=Variedad Y de papa
69
A 1 B2
A 2 B1
A 1 B1
A 2 B2
A 1 B1
A 2 B2
A 1 B2
A 2 B1
A 2 B1
A 1 B2
A 2 B2
A 1 B1
A 2 B2
A 1 B1
A 2 B1
A 1 B2
BLOQUE
I
II
III
IV
AB
A
B
( 2 )( 2 )
A1
B1
1
2
3
2
8
A2
B2
2
4
6
4
16
A1 = 24
B1 = 20
B1
1
3
4
4
12
TOTAL
B2
4
7
7
10
28
A2 = 40
B2 = 44
8
16
20
20
64
64
64
64
TC = 16 =256
Sc total =
24 2 +40 2
256 = 16
SC de A =
8
20 2+ 44 2
SC de B =
8
256 =36
70
SC de combinado AB =
SC de la interaccin AB = 56 16 36 = 4
2
SC de block =
256 =24
Fuentes de
variabilidad
Block
A
B
AB
Error
Total
SC
GL
CM
24
16
36
4
10
90
3
1
1
1
9
15
8
16
36
4
1,11
F
7,21*
14,41**
32,43**
3,60N.S.
Se puede deducir las siguientes conclusiones, relacionadas con los efectos principales de A y B; tales
como: que la variedad Y supera a la variedad X en rendimiento, y que con el abonamiento nitrogenado
aumenta se aumenta la produccin. Por otra parte, por los resultados obtenidos, no se justifica estudiar los
efectos simples A ni de B
Ejemplo
Se tiene el siguiente experimento en el que se estudia tre variedades de soya y la cantidad de plantas por
golpe
Variedades
V1
V2
V3
71
BLOQUE
C1
9
10
11
11
14
55
I
II
II
IV
V
VC
V
C
V1
C2
10
13
15
16
15
69
V1 = 182
C1 = 157
C3
10
12
12
13
11
58
C1
10
9
12
12
15
58
V2
C2
12
10
9
16
13
60
V2 = 182
C2 = 195
C3
13
11
9
17
14
64
C1
6
7
9
12
10
44
V3
C2
10
12
14
16
14
66
V3 = 184
C3 = 196
C3
9
13
16
19
17
74
TOTAL
89
97
107
132
123
548
548
548
548 2
=6673,42
TC =
45
892+ 972 +1072 +1322 +1232
6673,42=141,24
SC de block =
9
2
6673,42 = 0,18
356,58
SC
GL
CM
Block
V
C
VC
Error
Total
141,24
0,18
65,91
56,09
93,16
356,58
4
2
2
4
32
144
35,31
0,09
32,95
14,02
2,91
C.V. =
F
12,13**
0,03NS
11,32**
4,81*.
12,18
72
Como es significativa la interaccin VC debe estudiarse los efectos simples del experimento. As, las SC
de los efectos simples de los niveles de C en cada nivel de V estn dadas por:
2
55 + 69 + 58
SC de C en V 1=
5
182
=21,7
15
=3,7
2
SC de C en
=
5
15
SC de C en V 3=
=96,5
15
15
A N A V A
Fuentes de variabilidad
Efectos simples de C
Efecto C en
Efecto C en
Efecto C en
Error
V1
V2
V3
SC
GL
CM
21,7
3,7
96,5
93,16
2
2
2
32
10,85
1,85
48,25
2,91
3,72*
0,63 NS
16,58**
Podemos observar que entre los niveles de C hay diferencias significativas en la variedad
diferencias altamente significativas en la variedad
Experimento factorial
V1 y
V3
23
A continuacin se dan los datos del rendimiento en tm/ ha de arroz obtenido del siguiente experimento:
Se tiene dos niveles de abonamiento nitrogenado (A),dos niveles de abonamiento fosforado(B) y dos de
potasio (C), y 5 repeticiones. y el estudio se realiz con el diseo bloque completamente randomizado
A0
BLOQUE
I
II
III
IV
V
ABC
AB
BC
AC
A
B
C
A1
B0
C0
5
7
3
3
2
20
B1
C1
5
10
5
4
1
25
C0
4
7
3
4
2
20
A0B0 = 45
B0B0 = 50
A0C0 = 40
C1
4
9
4
3
0
20
A0B0 = 40
B0C0 = 45
A0C0 = 45
A0 = 85
B0 = 95
C1 = 100
TO
B0
C0
6
7
6
5
6
30
B1
C1
3
7
5
3
2
20
C0
6
9
7
4
4
30
A1B0 = 50
B1C0 = 50
A1C0 = 60
C1
9
10
9
8
9
45
A1B1 = 75
B1C1 = 65
A1C1 = 65
A1 = 125
B1 = 115
C2 = 100
73
4
6
4
3
2
2
2
2
2
2
2
2
210 2
TC = 40 =1102,5
SC total =
5 +7 +3 + ..+8 +9 1102,5=259,5
SC de A =
852+ 1252
1102,5=40,0
20
SC de B =
952+ 1152
1102,5=10.0
20
100 2+100 2
1102,5=2,5
SC de C =
20
SC de AB =
452 + .+752
1102,5=72,5
10
10,0=22,5
SC de AC =
402 + +65 2
10
1102,5 =42,5
50 + ..+65
SC de BC =
10
1102,5 =22,5
20 2+25 2+ .+ 452
SC de ABC =
5
1102,5 = 107,5
SC de ABC (corregido) =107,5 40,0 10,0 2,5 22,5 0,0 10,0 = 22,5
SC de error = 259,5 40,0 10,0 2,5 22,5 0,0 10,0 22,5 112,0
40
AN AVA
74
SC
GL
CM
Bloques
Efecto principal A
Efecto principal B
Efecto principal C
Efecto de Int. AB
Efecto de Int. AC
Efecto de Int. BC
Efecto de Int. ABC
Error
total
112,0
40,0
10,0
2,5
22,5
0,0
10,0
22,5
40,0
259,5
4
1
1
1
1
1
1
1
28
39
28,8
40,0
10,0
2,5
22,5
0,0
10,0
22,5
1,4
20.00**
28,57**
7,14**
1,79**
16,07**
0,00 NS
7,14**
16,07**
Bibliografa:
Alvarado Pintado Luis y Agurto Mejia Hugo. Estadstica para Administradores y Economa
con
75
76