Está en la página 1de 76

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

PRUEBA DE HIPOTESIS
Hiptesis
Es el enunciado acerca de una poblacin, elaborado con el propsito de ponerlo aprueba
Prueba de hiptesis
Procedimiento basado en la evidencia muestral y en la teora de probabilidad que se emplea para
determinar si la hiptesis es un enunciado razonable.
Procedimiento para probar una hiptesis:
1.- Plantear la hiptesis nula

Hiptesis nula

y la hiptesis alternativa

.- Hiptesis planteada con el objetivo de ser probada. Podemos aceptarla o

rechazarla. Tal hiptesis es una afirmacin que se aceptar si los datos muestrales no pueden proporcionar
evidencia convincente que es falsa.
Hiptesis alternativa

.- Denominada tambin hiptesis de investigacin.

Afirmacin que se aceptar si los datos muestrales proporcionaron amplia evidencia de que

es

falsa
2.- Seleccionar el nivel de significancia.- Nivel de significancia es la probabilidad de rechazar la
hiptesis nula cuando es verdadera. Al nivel de significacin se le denomina

, tambin se le conoce

con el nombre de nivel de riesgo.


Generalmente se usa el nivel del 5% para proyectos de investigacin, 1% para el aseguramiento de
calidades y 10% para encuestas polticas.
En el proceso de probar una hiptesis podemos cometer dos tipos de errores: error del tipo I o del tipo II.
Error tipo I es rechazar la hiptesis nula (

cuando en realidad es verdadera.

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Error tipo II es aceptar la hiptesis nula (

Hiptesis nula
Ho es verdadera
Ho es falsa

cuando en realidad es falsa

Se acepta
Decisin Correcta
Error

Se rechaza
Error
Decisin Correcta

3.-Calcular el valor estadstico de prueba.- Existen muchos valores estadsticos de prueba: z, t, chi
cuadrado, F, etc.
Es el valor obtenido a partir de la informacin muestral que se utiliza para determinar si se rechaza la
hiptesis nula.
4.- Formular la regla de decisin.- Es un enunciado de las condiciones segn las que se acepta o se
rechaza la hiptesis nula.

Valor crtico es el

valor que es el

punto divisorio entre la regin de aceptacin y la regin de rechazo de la hiptesis nula


5.-Toma de decisin.- Es aceptar o rechazar la hiptesis nula.
Potencia de una prueba.- Es la probabilidad de tomar la decisin acertada de rechazar

esta es falsa o de aceptar

cuando

cuando esta es verdadera. La potencia de una prueba se calcula mediante

Prueba para la media de la poblacin: Muestra grande


Prueba de hiptesis con muestras grandes (n

30) respecto a una media de poblacin para una

prueba de dos colas (bilateral) de la forma:


Ho =

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Ha
Estadstico de prueba:

conocida
Z=

Estadstico de prueba:

desconocida:

Z=

Regla de rechazo a un nivel de significancia

Rechazar

si

- Z

Ejemplo
La tasa anual de resurtido de botellas de aspirinas es 6.0 (esto indica que las existencias del medicamento
tienen que renovarse en promedio 6 veces al ao en un establecimiento). La desviacin estndar es 0,50.
Se sospecha que el volumen de ventas promedio ha cambiado y no es 0,60. Se utilizar el nivel de
significancia de 0.05 para probar esta hiptesis.
a.- Plantee la hiptesis nula y alternativa
b.- Cul es la probabilidad de un error tipo I?
c.- Proporcione la frmula para el valor estadstico de la prueba.
d.- Enuncie la regla de decisin
e.- Se selecciona una muestra aleatoria de 64 frascos de tal producto, con una media de
5.84, Debe
rechazarse la hiptesis de que la media poblacional es 0.60? Interprete los resultados.
Solucin:
a.

Ho = 6
Ha

b.c.- El valor estadstico de la prueba es:

Z=

d.- El valor crtico de

1.96

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Si el valor del estadstico de prueba resulta mayor a 1.96 o menor a -1.96 se rechaza
hiptesis nula
Z=

- 2.56

Como el valor de la prueba est en la regin de rechazo, se rechaza

la

y, por lo tanto, se acepta

(la tasa media no es igual a 6).


Ejemplo
El supermercado local gast en una remodelacin miles de nuevos soles durante muchas semanas.
Aunque la interrupcin espant a los clientes temporalmente, el gerente espera que los clientes vuelvan a
disfrutar de las nuevas comodidades. Antes de remodelar, los recibos de la tienda promediaban $ 32 533
por semana. Ahora que se ha terminado la remodelacin, el gerente toma una muestra de 36 semanas para
ver si la construccin afect de alguna manera el negocio. Se report una media de $34 166 y una
desviacin estndar de $12 955 Qu puede decir el gerente a un nivel de significancia del 1%?
Solucin
Ho = 32 533
Ha

Rechazar Ho si:
Z

- 2.576

2.576

El estadstico de la prueba:
Z

0.756

El valor de prueba est dentro de la zona de aceptacin, entonces se acepta Ho Es decir la media es 32
533

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Prueba de hiptesis con muestras grandes (n

30) respecto a una media poblacional para

pruebas de una cola (unilateral) de la forma


H0
Ha:
Estadstico de prueba:

conocida
Z=

Estadstico de prueba:

desconocida:
Z=

Regla de rechazo a un nivel de significacin

Rechazar

Prueba

si

de

hiptesis con muestras grandes (n

30) respecto a una media poblacional para pruebas de una cola (unilateral) de la forma
H 0:
H a:
Estadstico de prueba:

o
o

conocida
Z=

Estadstico de prueba:

desconocida:
Z=

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Regla de rechazo a un nivel de significacin

Rechazar

Ejemplo.-

si

- Z

Una encuesta nacional reciente, encontr que estudiantes de la Universidad miraban un

promedio de 6.8 DVD por mes. Una muestra aleatoria de 36 estudiantes universitarios de la facultad de
Agronoma, revel que el nmero medio de DVD observado el mes pasado fue de 6.2, con una
desviacin estndar de 0.5. En el nivel de significancia de 0.05. Puede concluirse que los estudiantes de
la facultad de Agronoma ven menos DVD al mes que los de la Universidad?
H 0:
H a:

6.8
6.8

Regla de la decisin
Rechazar

si

- 1.645

Valor de la prueba
Z=

- 7.2

Como el valor de la prueba est en la zona de rechazo se concluye rechazando la hiptesis nula, esto es,
que los estudiantes de la facultad de Agronoma ven menos DVD, en promedio, que los estudiantes de la
Universidad
Pruebas respecto a la proporcin poblacional.

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

La prueba de hiptesis sobre proporciones se usa cuando queremos determinar si la proporcin de los
elementos en una poblacin, que tiene cierta caracterstica, es mayor, igual o menor que algn valor
especifico.
Relacin proporcional:
Es la relacin por cociente, o porcin relativa, que tiene un atributo particular de inters.

Antes de probar una relacin proporcional debemos considerar algunos supuestos y cumplirse algunas
condiciones:
- Los datos muestrales recopilados son el resultado de conteo
- El resultado de un experimento se clasifica como xito o fracaso
- La probabilidad de xito se mantiene igual en cada ensayo
- Los ensayos son independientes
- La prueba es adecuada cuando n
y n( 1) valen al menos 5
El valor estadstico de prueba Z viene dado por:
Z

Donde:
Relacin proporcional poblacional
Relacin proporcional muestral
n Tamao de muestra
Prueba para la proporcin poblacional
Prueba de hiptesis respecto a una proporcin poblacional para pruebas de una cola (unilateral) de
la forma:

El estadstico de la prueba
Z

Regla de rechazo a un nivel de significacin

Ejemplo

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Una investigacin en la Universidad de Toledo indica que el 50% de los estudiantes cambian su rea
principal de especializacin despus del primer ao en el programa de estudios. Una muestra de 100
alumnos en la escuela de Administracin revel que 48 de ellos cambi de dicha rea despus del lapso
mencionado. Ha habido un decremento significativo en la proporcin de estudiantes que cambian su rea
de especializacin despus del primer ao en el programa? Realice la prueba al nivel de significancia de
0.05.
n: 100

0.48

0.05

Regla de decisin
Rechazar

si

- 1.645

El estadstico de la prueba
Z

Como Z - 0.4, entonces se acepta

- 0.4

, es decir, la proporcin de estudiantes que cambian de carrera

despus del primer ao no ha tenido un decremento significativo.


Prueba de hiptesis respecto a una proporcin poblacional para prueba de una cola (unilateral) de
la forma:

Estadstico de prueba

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

si

Rechazar

Ejemplo Un artculo en la publicacin Piura 21 report que solo hay un empleo disponible para uno de
cada tres egresados de la Universidad. Las principales razones aportadas fueron que existe una
sobrepoblacin de estos ltimos y una economa dbil. Suponga que una encuesta de 200 egresados
recientes de la Universidad de Jan revel que 80 tenan empleo. Al nivel de significancia de 0.02, Se
puede concluir que tienen trabajo una proporcin mayor de egresados de la Universidad de Jan?
n

Regla de la decisin.
Rechazar

si

2.054

Valor de la prueba:

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Se acepta

por lo tanto, la proporcin de egresados que tienen trabajo es menor o igual a

Prueba de hiptesis respecto a una poblacin poblacional para pruebas de dos colas (bilateral) de la
forma:

Estadstico de prueba
Z

Regla de rechazo a un nivel de significancia

Rechazar

si

Ejemplo
Se establece la siguiente hiptesis:
: p = 0.4
:p

10

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Una muestra de 120 observaciones revel

al nivel de significacin de 0.05

Puede rechazarse la hiptesis nula?


a,. Establezca la regla de decisin.
b.- Calcule el valor estadstico de la prueba.
c.- Cul es su decisin respecto a la hiptesis nula?
Solucin
a.- Regla de decisin

Rechazar

si Z

-1,96

1.96

b.- Valor de prueba


Z

c.- Se rechaza

= -2.24

, pues el estadstico de prueba cae en la zona de rechazo.

Prueba de hiptesis con muestras grandes (n


Prueba de hiptesis con muestras grandes (n

respecto a dos medias poblacionales


30) respecto a dos medias poblacionales para una

prueba de dos colas (bilateral) de la forma


:
:
Estadstico de prueba
Conocida

desconocida

11

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Donde
Tamao de muestra

Media muestral

Variancia poblacional

Poblacin 1
Poblacin 2

Regla de rechazo a nivel de significancia Z

Z
2

Z
2

Ejemplo
Una importante compaa de transporte pblico de Chiclayo debe decidir entre dos marcas de llantas para
su parque automotor, con un nivel de confianza del 95%. Para tomar una decisin seleccion una muestra
aleatoria de 100 llantas de cada marca y encontr que la marca 1 tiene una vida til de 98 000 Km, en
promedio, con una desviacin estndar de 8 000 Km.
Por otro lado, las estadsticas calculadas para la marca 2 son, en promedio, de 101 000 Km y desviacin
estndar de 12 000 Km
Que marca de llantas debera adquirir la compaa de transporte si la diferencia de precios es mnima?
Solucin

Ho

1=2

H1

1 2

x 1 = 98 000

S 1=8 000

n1

100

x 2 = 101 000

S 2=12 000

n2

100

12

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Regla de decisin
Rechazar

H o Z 1.96

Z 1.96

Valor de la prueba

98 000101000

8 0002 12 0002
+
100
100

= - 2.08

Como -2.08 est en la zona de rechazo, se rechaza

Ho

a un nivel de significancia del 5%. Esto es,

existe diferencia significativa entre la vida til promedio de ambas marcas. Sin embargo, no hemos
contestado a nuestra pregunta inicial de qu marca de llantas se debe adquirir. Realizamos una nueva
prueba de hiptesis suponiendo que la vida til media de la marca 2 es mayor que la de la marca 1. Para
lo cual establecemos la prueba de hiptesis para una cola
Prueba de hiptesis con muestras grandes (n

30

respecto a dos medias poblacionales para

una prueba de 1 cola de la forma:

Ho :

1 2

H o : 12 0

H1 :

1 < 2

H o : 12 < 0

Estadstico de prueba
Conocida

desconocida

13

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Regla de rechazo a un nivel de significancia

Rechazar

si Z

Prueba de hiptesis con muestras grandes (n

30

respecto a dos medias poblacionales para

una prueba de 1 cola de la forma:

Ho :

1 2

H o : 12 0

H1 :

1 > 2

H o : 12 > 0

Estadstico de prueba
Conocida

desconocida

Regla de rechazo a un nivel de significacin

14

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Rechazar

si Z

Del ejercicio anterior, para decidir qu marca comprar, realizamos una nueva prueba de hiptesis
suponiendo que la vida til promedio de la llanta de marca 2 es mayor que la vida til promedio de la
marca 1, esto es :

Ho

1 2
H1

1 < 2

Usando los mismos datos anteriores tenemos

=5

Con los datos mostrados se calcula Z


Z

98 000101000

8 0002 12 0002
+
100
100

= - 2.08

Como 2.08 est en la zona de rechazo tenemos que la marca 2 tiene mayor vida til promedio que la
marca 1.Por lo tanto, la compaa de transporte debe abastecerse de la marca 2
Prueba de hiptesis con muestras grandes (n

30 para la diferencia entre dos proporciones:

La prueba de hiptesis para la diferencia entre dos proporciones se realiza cuando queremos determinar si
las proporciones de dos poblaciones son o no iguales. La lgica del procedimiento es idntica para la
diferencia de las medias poblacionales.
Tomamos una muestra aleatoria de cada poblacin y calculamos las proporciones muestrales; si la
diferencia entre estas proporciones se puede atribuir al azar, aceptamos la hiptesis de que las dos
poblaciones tienen igual proporciones.

15

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Valor estadstico de prueba.

p1 p2

Z=

p c (1 pc ) p c ( 1 pc )
+
n1
n2

Tamao de muestra

Proporcin
muestral

Proporcin
ponderada

p1

Poblacin 1
Poblacin 2

pc

p2

pc

Nmerototal de xitos
Nmero total en lasmuestras

X 1+ X 2
n1+ n2

Alternativamente

pc =

n1 p1 +n 2 p2
n1 +n 2

Ejemplo
El departamento de investigacin en la casa Matriz de una compaa aseguradora, realiza una
investigacin acera de las causas de accidentes automovilsticos, las caractersticas de los conductores,
etc. Se seleccion una muestra aleatoria de 400 plizas de seguros expedidas a personas solteras. Se
descubri que en el periodo anterior de tres aos, 120 sufrieron al menos un accidente automovilstico. En
forma semejante, una muestra de 600 plizas expedidas a personas casadas revel que 150 haban tenido
al menos un accidente. Al nivel de significancia de 0.05, Hay diferencia significativa en las personas
solteras y casadas que sufrieron un accidente durante un lapso de tres aos?
Solucin

2=
n 600

n1= 400

p1=

120
400

p2=

= 0.30

150
600

Ho

p1= p2

H1

p p2

= 0.25

16

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Regla de decisin
Rechazar

H o Z 1.96

Z 1.96

Valor de la prueba

p1 p2

Z=

pc

Z=

p c (1 pc ) p c (1 pc )
+
n1
n2

Nmerototal de xitos
Nmero total en lasmuestras

0.300.25
( 0.27 ) (0.73) ( 0.27 ) (0.73)
+
400
600

Como 1.74 est en la regin de aceptacin se acepta

120+150
400+600

= 0.27

= 1.74

Ho

, plotanto , no hay diferencia

significativa entre las proporciones de personas solteras y casadas que sufrieron un accidente durante un
lapso de tres aos.
Prueba de hiptesis para muestras pequeas
En los casos en los que se desconoce

y el nmero de observaciones en la muestra es menor a 30, se

puede utilizar la desviacin estndar muestral, s, como una estimacin de

, pero no puede utilizar la

distribucin de Z como valor estadstico de prueba. La t de Student o distribucin t, sirve como valor
estadstico de prueba.
Prueba para la media poblacional
Se utiliza el mismo procedimiento que en el caso de la muestra grande pero el valor estadstico de prueba
es el siguiente:

t n1,

x
s
n

Ejemplo

17

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Por registros pasados se sabe que la vida til promedio de una pila elctrica que se utiliza en un reloj
digital es de 305 das. La vida til de las pilas se distribuye normalmente. Tal elemento elctrico fue
modificado recientemente para que tenga mayor duracin. Se prob una muestra de 20 pilas modificadas
y se encontr que la vida media era de 311 das con una desviacin estndar de la muestra de 12 das. Al
nivel de significancia de 0.05. La modificacin increment la duracin promedio de la pila?
a.- Plantear la hiptesis nula y alternativa.
b.- Ilustrar grficamente la regla de decisin.
c.- Calcular t y llegar a una decisin. Resuma la manera breve el resultado.
Solucin:

H o : 305
H 1 : >305
Grados de libertad (g.l.): 20 1 = 19

=0.05
Regla de decisin:

Rechazar

H o si t 1.729

Valor de prueba:

t=

Por lo tanto se rechaza

x
s
n

311305
12
20

= 2.24

H o porque 2.24 est en la zona de rechazo.

Prueba de dos medias poblacionales: Muestras aleatorias independientes


Valor de prueba

x 1x

s2p (

1 1
+ )
n1 n 2

18

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

t con

2
p

s =

n1

+n2

grados de libertad:

( n1 1 ) s 21+ ( n21 ) s 22
n1+ n22

Donde:
Tamao de muestra

Media muestral

Poblacin 1

n1

x1

Poblacin 2

n2

x2

Grados de libertad:

Varianza ponderada

s 2p

n1 +n2 2

Observacin
Las varianzas son desconocidas, pero iguales:

Donde

21= 22=

s p es un estimador insesgado de 2

Ejemplo:
Una muestra de calificaciones en un examen presentado en un curso de Estadstica (en escala 100) es:
Hombres: 72, 69, 98, 66, 85, 76,79 80,77
Mujeres: 87, 90, 78, 81, 80, 76
Al nivel de significancia de 0.01, La calificacin de las mujeres es ms alta que la calificacin de los
hombres?

H o : m h

Solucin:

H 1 : m > h
H

x
s
n

M
78

9.49
9

82
5.40
6

19

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Regla de decisin:
Rechazar

H o si t 2.624

Valor de la prueba

2
p

s =

1 1
+ )
n1 n 2

n1 +n2 2

Ho

s2p (

( n1 1 ) s 21+(n21)s 22 ( 61 ) 5.40 2+(91) 9.492

Se acepta

x 1x

6+ 92

8278
1 1
66.6153( + )
7 9

= 66.6153

= 0.10

porque 0.42 est en la zona de aceptacin. Por lo tanto, no se puede afirmar que la

calificacin de las mujeres es ms alta que la calificacin de los hombres.


Prueba para la diferencia entre dos medias poblacionales: una prueba de diferencia pareada
Hay dos casos:
a.- Caso I:

n1 <30 y n2 < 30
Variancias poblacionales desconocidas pero iguales

21= 22

1.-Hiptesis nula: Ho: (12) = d = 0


2.- Hiptesis nula:
Prueba de una cola
Ha: d> 0

Prueba de dos colas


Ha: d

Ha: d < 0

20

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

3.- Estadstico de prueba

d0
sd / n =

t=

= x

d
sd / n

4.- Regin de rechazo: Rechazar Ho cuando


Prueba de una cola
t>t

Prueba de dos colas

t> / 2

t<

/2

t>t
Ejemplo.- Antes de contratar la instalacin de un sistema que trasmita msica a las oficinas de una
empresa, el gerente selecciona al azar 7 oficinas para instalarles el nuevo sistema. El tiempo promedio en
minutos que pasaban los empleados fuera de esas oficinas, fue registrado antes y despus de instalarse el
sistema de msica, obtenindose los siguientes resultados
Numero de oficina

No msica
Con msica

8 9 5 6 5 10
5 6 7 5 6 7

7
8

Sugerira Ud. que el ejecutivo proceda con la instalacin?

= 0.05

Solucin
Ho: d = 0
Ha: d > 0

No msica
8
9
5
6
5
10
7

x 1 =7,14

t=

Con msica
5
6
7
5
6
7
8

x 2 =6,28
d0
sd / n =

d
sd / n

En las tablas t (7-1) 0,05

d =0,85

d
3
3
2
1
1
3
1

s d =2,6457

0,85

= 2,6457 / 7

=1,025

1,943

21

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Conclusin: No hay una evidencia estadstica para afirmar que con la instalacin de la msica en las
oficinas, los empleados pasaran ms tiempo en estas.
b.. Caso II:

n1 <30 Y n2 <30
Variancias poblacionales desconocidas pero diferentes

21 22

Las hiptesis son las mismas, pero la prueba estadstica ser:

t=

x 1x 2

s 21 s 22
+
n1 n 2

Los grados de libertad se calculan de la siguiente manera:

g.l.

[ ]
[] []
s 21 s 22
+
n1 n 2

2 2

s1
n1

2 2

s2
n2

+
n11 n21
Los dems pasos son los mismos
Prueba de hiptesis para la Varianza
Hay casos que se tiene el problema de desconocer la varianza, o desviacin estndar de la poblacin, en
donde las distribuciones son normales. Si se desea probar una hiptesis acerca de la varianza se puede
hacer utilizando la distribucin de Ji cuadrada (Chi cuadrada). As mismo, supngase que se tiene inters
en dos poblaciones normales independientes, donde las medias y las varianzas de la poblacin son
desconocidas. Se desea probar la igualdad de las dos varianzas, ya que para poder comparar las medias de
estas dos poblaciones se ha utilizado la distribucin de t de Student, en la cual podemos tener varianzas
iguales o diferentes en la poblacin.
Par conocer esto ltimo se requiere de la distribucin F de Fisher, y despus de utilizarla se tomar la
decisin de tener o no varianzas iguales en la poblacin, dando pie a realizar la comparacin de las dos
medias segn sea el caso. En un primer caso en el que las varianzas de la poblacin son desconocidas,
pero iguales, o en un segundo caso, donde se tiene varianzas desconocidas, pero diferentes
Prueba de hiptesis para la varianza de un distribucin normal

22

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

A continuacin se desarrollar el procedimiento para contrastar hiptesis sobre la varianza poblacional

2 , a partir de una muestra aleatoria de n observaciones de una poblacin normal.


Prueba bilateral de la varianza de una poblacin

H o : 2= 2o
H1:
Estadstico de prueba:

Regla de decisin a un nivel de significancia

H o si:
Rechazar

x >x

(n1,

)
2

x <x

2
(n1,

)
2

Ejemplo
Una manera de evaluar la eficacia de un profesor ayudante es analizar las calificaciones obtenidas por sus
estudiantes en un examen al final del curso. Evidentemente, es interesante la puntuacin media, sin
embargo, la varianza tambin contiene informacin til; algunos profesores tienen un estilo que funciona
muy bien con los estudiantes ms sobresalientes, pero es ineficiente con los estudiantes con menos
capacidad o menos motivados. Un profesor realiza un examen al final de cada semestre para todas las
secciones del curso, la varianza de las calificaciones de este examen suelen estar muy prximos a 300 :
Un nuevo ayudante tiene una clase de 30 estudiantes, cuyas calificaciones en el examen tuvieron una
varianza de 480; considerando estas calificaciones como una muestra aleatoria de una poblacin normal,
contrastar la hiptesis nula de que la varianza poblacional de sus calificaciones es 300 frente a una
alternativa bilateral con

0.05

H o : =300
H1:

2 300

23

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Regla de decisin
Rechazar

H o si:

x <16.05

x > 45.72

Valor de prueba
=

Entonces dado que

( 29 ) (480) = 46.40
300

x 2> 45.72, se rechaza H o , lo cual significa que la varianza es diferente de

300

Prueba unilateral derecha de la varianza de una poblacin

H o : 2 2o
H1:

> o

Estadstico de prueba
=

Regla de decisin a un nivel de significancia

Rechazar

H o si:

x 2> x 2(n1, )

24

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Ejemplo
Un producto, se debe maquinar determinada parte con tolerancias muy estrechas, para que los clientes la
puedan aceptar. Las especificaciones del producto piden que la varianza mxima de las longitudes de las
partes sea 0.0004. Suponga que en 30 partes, la varianza de la muestra result ser
Pruebe con un

s2

0.0005.

0.05 si se ha violado la especificacin de varianza de la poblacin

H o : 2 0.0004
H1:

2 >0.000

Estadstico de prueba
=

Regla de decisin a un nivel de significancia

Rechazar

H o si:

( 29 ) (0.0005)
( 0.0004)

= 36.25

x 2> x 2(n1, )

Regla de decisin
Rechazar

H o si:

Entonces dado que

x > 42.56
x 2< 42.56

, se acepta la Ho, lo cual significa que las especificaciones del

producto no han sido violadas.


Prueba unilateral izquierda de la varianza de una poblacin

25

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

H o : 2 2o
2

H1:

< o

Estadstico de prueba
=

Regla de decisin a un nivel de significancia

Rechazar

H o si:

x 2< x 2(n1,1 )

Inferencia acerca de la varianza de dos poblaciones normales


Distribucin de F
Denominada as por sir Ronald Fisher, uno de los fundadores de la ciencia estadstica moderna. Esta
distribucin se utiliza como la entidad estadstica de prueba en varios casos, sirve para probar si dos
muestras proceden de poblaciones con varianzas iguales. Asimismo, tambin sirve cuando se desea
comparar simultneamente varias medias poblacionales, esta comparacin simultanea de varias de tales
medias se denomina anlisis de varianza (ANAVA) (ANOVA), en estos dos casos las poblaciones deben
ser normales.
Prueba de hiptesis bilateral respecto a la varianza de dos poblaciones

H o : 2x = 2y
H 1 : 2x 2y
2

s
2x
F
sy

Estadstico de prueba

Regla de decisin a un nivel de significacin


Rechaza

H o s:

n11,n21,1

n11,n21,

26

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Prueba unilateral derecha acerca de la varianza de dos poblaciones normales.

H o : 2x 2y
2

H 1 : x > y

Estadstico de prueba

s 2x
2
F
sy
Regla de decisin a un nivel de significacin
Rechaza

H o s:
F

Fn 1,n 1,
1

Observacin.- La varianza muestral ms grande se coloca en el numerador, en consecuencia, la razn F


siempre es mayor a 1. Por lo tanto, el valor crtico de la cola de valores superiores es el nico que se
necesita

F ( gl 1 , gl 2, 1 )=

1
F ( gl 2 , gl 1, )

Ejemplo:

27

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

La compaa Piura Com realiz un estudio acerca de los hbitos de escuchar radio por parte de los
hombres y las mujeres. Un aspecto del estudio comprendi el tiempo promedio de audicin. Se descubri
que tal tiempo para los varones es de 35 minutos al da. La desviacin estndar de la muestra de 11
personas de sexo masculino que se estudiaron fue de 10 minutos diarios. El tiempo promedio de audicin
para las 13 mujeres en el estudio fue tambin de 35 minutos, pero la desviacin estndar de la muestra,
result 12 minutos. Al nivel de significancia de 0.10, es posible concluir que existe diferencia en la
variacin del nmero de minutos que los hombres y las mujeres escuchan la radio?

nh=11

s h=10

nm =13 s m=12
=0.10
2

H o : m = h
H 1 : 2m 2h
Recuerde que

F ( 12.10,0 .95 )=

Rechaza
F 0.36

1
F ( 10,12,0.05 )

0.36

H o s:

F 2.91

Estadstico de prueba

s2m
2
F
sh

122
10 2

1.44

28

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

1.44 se acepta H o , lo cual significa que la variacin del nmero de minutos

Por lo tanto, al ser F

que escuchan radio los hombres es igual al de las mujeres.


Ejemplo
En su incansable bsqueda de un sistema de llenado adecuado, cierta empresa prueba dos mquinas.
Robot Fill se usa para llenar 16 tarros y resulta una desviacin estndar de 1.9 onzas en el llenado. Con
Automatic Fill se llenan 21 frascos que dan desviacin estndar de 2.1 onzas. Si la empresa tiene que
elegir uno de estos sistemas en funcin de la uniformidad de llenado, Cul deber seleccionar? Use un

= 0.05
Solucin
Robot Fill

Automatic Fill

s RF =1.9 s AF=2.1
n RF=16

n AF =21
=0.05

H o : 2AF 2RF
H 1 : 2AF > 2RF

De acuerdo a la tabla de F:

F( 20,15,0.05)=2.33

Regla de decisin a un nivel de significacin


Rechaza

H o s:
F

2.33

29

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Estadstico de prueba

s2AF
2
F
s RF

2.12
1.92

1.22

Dado que el valor de F es 1.22 se acepta Ho. Por lo tanto, se elige el proceso Automatic Fill porque es el
que presenta mejor uniformidad de llenado.
Prueba de bondad de ajunte e independencia
Prueba de

x2

Una medida de la diferencia existente entre las frecuencias observadas y esperadas es suministrada por el
estadstico,

x 2 dado por:
(O j EJ )2
x =
Ej
2

Donde

O j= Frecuencia observada
j=
E Frecuencia esperada.
Ejemplo
La siguiente tabla muestra las frecuencias observadas al lanzar un dado 120 veces. Ensayar la hiptesis de
que el dado est bien hecho al nivel de dignificacin de 0.05

Cara
Frecuencia observada

1
25

2
17

3
15

4
23

5
24

6
16

Solucin
Hiptesis:

H o : Las frecuencias observadas y esperadas son significativamente iguales (dado bien


hecho).

H 1 : La frecuencias observadas y esperadas son diferentes (dado cargado)


Primero se procede a encontrar los valores esperados. La probabilidad de obtener cualquier numero
en un dado no cargado es de

Cara
Frecuencia
observada

1
6
1
25

2
17

3
15

4
23

5
24

6
16

Total
120

30

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Frecuencia
esperada

20

20

20

20

20

20

Buscamos el valor en la tabla para K 1 = 6 1 = 5 grados de libertad

Regla de

decisin

H o si x2(5,0.05)

Rechazar

11.07

Valor de la prueba

(O j EJ )2
x =
Ej
2

x 2=

( 2520 )2
20

( 1720 )2 ( 1520 )2 ( 2320 )2 ( 2420 )2 ( 1620 )2


+
+
+
+
+
20
20
20
20
20

Como 5 es menor que 11.07 se acepta la

=5

H o y se concluye con una significacin de 0.05, que el dado

est bien hecho


Tabla de contingencia
En muchas ocasiones, los n elementos de una muestra tomada de una poblacin puede clasificarse con
dos criterios diferentes. Por tanto, es interesante saber si los dos mtodos de clasificacin son
estadsticamente independientes.
El inters recae en probar la hiptesis de que los dos mtodos de clasificacin rengln columna son
independientes. Si se rechaza esta hiptesis, entonces, se concluye que existe alguna interaccin entre los
dos criterios de clasificacin.
Ejemplo
Una asociacin de profesores universitarios quiere determinar si la clasificacin en el trabajo es
independiente de la categora acadmica. Para ello se realiz un estudio nacional entre los acadmicos
universitarios y encontr los resultados que se muestran a continuacin, Con al 0.05 haga una prueba
para saber si son dependientes la satisfaccin en el trabajo y la categora acadmica

Satisfaccin
En el
trabajo

Mucha
Regular
Poca

Profesor
Asistente
40
78
57

Categora
Profesor
auxiliar
60
87
63

Profesor
asociado
52
82
66

Profesor
principal
63
88
64

.
Solucin

31

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Planteamiento de las hiptesis

H o La satisfaccin en el trabajo y la categora acadmica son independientes


H 1 La satisfaccin en el trabajo y la categora acadmica no son independientes

Grados de libertad: (r 1)(c 1) = (3 -1)(4 -1) = 6

Regla de decisin

H o si x2(6,0.05)

Rechazar

12.59

Se procede a calcular los valores esperados de cada celda:


Donde: i= fila

Ei j

j = columna

Se toma en cuenta los totales del rengln y la columna

Profesor
asistente
Satisfaccin
En el
trabajo

E11

Mucha
Regular
Poca
Total

( 215 X 175 )
800

47.03

E12
= 56.44

categ
ora
Profesor
auxiliar

Profesor
asociado

60
87
63
210

52
82
66
200

40
78
57
175

E21

( 335 X 175 )
800

73.28

( 215 X 210 )
800

E22
87.94

Profesor
principa
l
63
88
64
215

E31

Total

215
335
250
800

( 250 X 175 )
800

( 250 X 175 )
800

54.69

( 335 X 210 )
800

E32
65.62

32

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

categ
ora

Satisfaccin
En el
trabajo

Mucha
Regular
Poca
Total

Profesor
asistente

Profesor
auxiliar

47.03
73.28
54.69
175

56.44
87.94
65.62
210

Profesor
asociado
53.75
83.75
62.50
200

Profesor
principa
l
57.78
90.03
67.19
215

Total

215
335
250
800

Valor de la prueba:

(O ij EiJ )2
x =
Eij
2

x 2=

( 4047.03 )2
47.03

( 6056.44 )2
( 5253.75 )2 ( 6467.19 )2
+ +
+
56.44
53.75
67.19

Como 2.75 es menor que el valor critico 12.59, por lo tanto, no se rechaza

= 2.75

H o y se concluye con un

= 0.05, que la satisfaccin en el trabajo y la categora acadmica son independiente.


Anlisis de regresin y correlacin
Anlisis de correlacin
Conjunto tcnicas estadsticas empleadas para medir la intensidad de la asociacin de dos variables.
Diagrama de dispersin
Grfica que presenta la relacin entre dos variables.
Variable dependiente
Es aquella cuyos datos dependen de otras variables.
Variable independiente
Son los valores que no tienen relacin de dependencia con otras variables.
Por convencin, la variable conocida o independiente se grafica en el eje de abscisas (x), y la variable
independiente o estimada en eje de las ordenadas (y)

33

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Ejemplo
La empresa Rzuri Hnos. un negocio familiar que ha vendido al menudeo en Piura durante muchos aos,
se anuncia ampliamente por radio y televisin, destacando sus bajos precios y accesibles condiciones de
crdito. Al dueo le gustara analizar la relacin entre las ventas y lo que gasta en publicidad. A
continuacin se muestra la informacin acerca de las ventas y lso gastos de publicidad durante los ltimos
cuatro meses.

Mes
Julio
Agosto
Setiembre
Octubre

Gastos de publicidad
(miles de dlares)
2
1
3
4

Ingreso por ventas


(miles de dlares)
7
3
8
10

Se plantea la hiptesis de que a medida que aumentan los gastos de publicidad, aumentan los ingresos por
ventas.
Debemos comenzar por el diagrama de dispersin, que nos permite tener una idea sobre el grado
(intensidad) y la naturaleza (forma) de la relacin entre las dos variables. Entonces podemos dar cuenta si

la relacin es lineal o no lineal, positiva o negativa, o simplemente no existe una relacin aparente.

Observando el diagrama podremos establecer lo siguiente:


1.- Existe una relacin lineal entre los gastos de publicidad y el ingreso por ventas en ese periodo de 4
meses. Por lo tanto, es posible trazar una lnea recta que se ajuste a los puntos graficados en el
diagrama de dispersin
2.- La relacin no es determinstica; vale decir, cualquiera que sea la lnea recta que se trace, la mayora
de los puntos estarn por encima o por debajo de dicha recta.
Coeficiente de correlacin
Medida de la intensidad de la relacin lineal entre dos variables. Para determinar el valor numrico del
coeficiente de correlacin se utiliza la siguiente expresin

34

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

x 2( x)2
Y

y 2

r=
n
n

n ( xy ) ( x )( y)

Donde:
n= Nmero de pares de observaciones
x = Suma de los valores de la variable x
y = Suma de los valores de la variable y

x 2 = Suma de los valores de x elevados al cuadrado


2

( x) = Cuadrado de la suma de los valores de x

y 2 = Suma de los valores de y elevados al cuadrado


( y )2 = Cuadrado de la suma de los valores de y

xy = Suma del producto de x e y


El coeficiente de correlacin ( r ) puede tomar cualquier valor de -1.00 a +1.00 inclusive. Un coeficiente
de correlacin -1.00 de +1.00 indica una correlacin perfecta
Un coeficiente cercano a cero indica que la relacin es dbil.
Con los datos del problema tenemos:

Total

2
1
3
4
10

xy

7
3
8
10
28

14
3
24
40
81

x2
4
1
9
16
30

y2
49
9
64
100
222

35

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

x 2( x)2
Y

y 2

r=
n
n

n ( xy ) ( x )( y)

r=

30(10)2
28

222

4
4

4 ( 81 )(10)(28)

= 0.96

Por lo tanto existe una fuerte correlacin entre el gasto en publicidad y el ingreso por ventas.
Anlisis de regresin
A travs del anlisis de regresin buscamos que la lnea de ajuste se aproxime lo mejor posible a todos los
puntos del diagrama de dispersin. La ecuacin para la lnea recta empleada para calcular y con base en
x se conoce como ecuacin de regresin.
Ecuacin de regresin
Expresin matemtica que define la relacin entre dos variables.
Principio de mnimos cuadrado
Tcnica empleada para obtener la ecuacin de la regresin, minimizando la suma de los cuadrados de las
distancias verticales entre los valores y verdaderos y los valores pronosticados

^y .

Dicha recta se define como:


y = a +bx
Par determinar la calidad estimadora de esta recta necesitamos alguna medida de la distancia de los
puntos (

xi , yi

a esta recta. El siguiente grafico muestra, para un solo punto, como se mide esta

distancia.

36

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Para el valor

x i el correspondiente valor y en nuestra recta es a + bx mientras que el valor realmente

observado para la variable dependiente es

y i .La diferencia entre los dos es:

e i= y i(a+b x i )

Ahora bien, cualquier estimador razonable de la recta de regresin verdadera dejar algunos de los datos
observados por debajo y otros por encima de la recta estimada. Por lo tanto, algunos de los

e i sern

positivos y otros negativos


a=

b=

yb x

y
y i

( x ix )

n x i y i x y
i

b = n xi2 ( xi ) 2
La recta:

^y = a + bx
Se denomina recta de regresin muestral de y sobre x
El coeficiente b significa que cada unidad adicional de x incrementa el valor de y en b unidades
El valor a solo tiene interpretacin matemtica, indica el punto de corte de la recta con el eje y.
Ejemplo

37

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Los datos siguientes muestran las ventas (en millones) de cajas y los gastos de publicidad (en millones de
dlares) para 7 marcas principales de refrescos:

Marca

Gastos de
publicidad
131.3
92.4
60.4
55.7
40.2
29.0
11.6

Coca cola
Pepsi
Kola real
Sprite
Inca cola
Concordia
7 up

Ventas de
cajas
1929.2
1384.6
811.4
541.5
536.9
535.6
219.5

a.- Trace un diagrama de dispersin para estos datos, con los gastos de publicidad como variable
independiente.
b.- Qu parece indicar este diagrama acerca de la relacin entre las dos variables? trace una recta que
pase por los datos, para aproximar una relacin lineal entre los gastos de publicidad y las ventas.
c.- Aplique el mtodo de mnimos cuadrados para plantear la ecuacin estimada de regresin
d.- Presente una interpretacin de la pendiente de esta ecuacin
Solucin:
Variable independiente: Gastos de publicidad
Variable dependiente: Ventas de cajas
Diagrama de dispersin.

El diagrama parece indicar que la relacin entre las variables es linealmente positiva.
Ahora encontraremos los valores de r, a y b

Gastos de
x

Publicidad

131.3
92.4
60.4

17 239.69
8 537.76
3 648.16

Ventas de
y
1929.2
1 384.6
811.4

cajas

3 721 812.64
1 917 117.16
658 369.96

xy
253 303.96
127 937.04
49 008.56
38

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Sumas

55.7
40.2
29
11.6
420.6

3 102.49
1 616.04
841
134.56
35 119.7

541.5
536.9
535.6
219.5
5 958.7

293 222.25
288 261.61
286 867.36
48 180.25
7 213 831.23

30 161.55
21 583.38
15 532.4
2 546.2
500 073.09

x 2( x)2
Y

y 2

r=
n
n

n ( xy ) ( x )( y)

35119.7(420.6)2
5 958.7

7 213 831.23

r=
7
7

7 ( 500 073.09 ) (420.6)( 5958.7)

= 0.97810014

Como r se aproxima a uno, entonces diremos que la relacin que hay entre las dos variables es bastante
fuerte o intensa.
La ecuacin que mejor se ajusta a los datos es una recta, como se aprecia en el siguiente grfico.

b=

n x i y i x y
i

n xi ( xi )

39

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

7 ( 500 073.09 ) ( 420.6)(5 958.7)


2
b=
7(35 119.7)( 420.6 )
a=

= 14.42378282

yb x

851.2428 (14.424 ) (60.0857) = - 15.42

a=

Por lo tanto la ecuacin de la recta seria:


y = a +bx
y = - 15.42 + 14.424x
La interpretacin que tiene a es solo matemtica, esto es el punto de corte con el eje y
El valor que toma b se interpreta como: por cada incremento en la variable dependiente se espera una
variacin de 14.424 en la variable dependiente
2

r R

Coeficiente de determinacin (

Es el estadstico que mide la proporcin de la variacin total en y que puede ser explicada por la
variacin en x.
El coeficiente de determinacin se calcula elevando al cuadrado el coeficiente de correlacin.
En el ejemplo anterior como r = 0.9781, el coeficiente de determinacin ser

r =

0.9567, luego

pude decirse que 95.67% de la variacin en el nmero de cajas vendidas se explica por la variacin en los
gastos de publicidad.
Prueba de significancia del coeficiente de correlacin
Es importante estudiar si r es significativo (distinto de cero) ya que ello implica que el modelo de
regresin lineal es significativo.
Planteamiento de hiptesis:

H o : = 0 (la correlacin en la poblacin es nula)


H1: 0

(la correlacin en la poblacin no es nula)

Estadstico de prueba

r n2
1r 2

, con n 2 grados de libertad

40

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

H o si:

Rechazar

(n2, 2 )

(n2, 2 )

Del ejemplo anterior, pruebe la hiptesis de que no existe correlacin en la poblacin. Emplee 0.02 de
nivel de significancia
Solucin
Planteamiento de hiptesis

H o : = 0 (la correlacin en la poblacin es nula)


H1: 0

(la correlacin en la poblacin no es nula)

Regla de la decisin

Rechazar

H o si:
T

3.365

3.365

Estadstico de prueba

r n2

1r

0.9781 72

10.9781

2.1870

= 0.2081

= 10.5093

Se acepta la hiptesis alternativa, es decir existe relacin entre las variables en estudio
ERROR ESTNDAR DE LA ESTIMACIN:
Mide la dispersin de los valores observados, con respecto a la recta de regresin.

41

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

sy.x

Marca

( Y Y ' )
n 2

Gastos de
Publicidad
x

Ventas de
Cajas
y

Y 2 a ( Y ) b ( XY )
n2

Rendimiento
Pronosticad
o

Desviaciones
y -

'

y'
Coca cola
Pepsi
Kola real
Sprite
Inca cola
Concordia
7 up

131.3
92.4
60.4
55.7
40.2
29.0
11.6

sy.x

1929.2
1384.6
811.4
541.5
536.9
535.6
219.5

1878.45
1317.35
855.78
787.99
564.42
402.87
151.89
2

( Y Y ' )
n 2

50.75
67.25
- 44.38
- 246.49
- 27.52
132.73
67.61

92770.73
7 2

Desviaciones
al cuadrado
2

( y y ' )
2575.56
4522.56
1969.58
60757.32
757.35
17617.25
4571.11

= 136.21

ESTIMACIN DE LOS INTERVALOS DE CONFIANZA


El error estndar de la estimacin es una medida vlida para utilizarla al fijar los intervalos de confianza
cuando el tamao de muestra es grande y de alguna forma la dispersin con respeto a la recta de la
regresin est distribuida de manera normal.
Un intervalo de confianza se determinar para:
1.- El valor medio de Y para un valor dado de X
2.- Un valor individual de Y para un valor dado de X

Y ' t(Syx)

( X X )
1
+
n X 2 ( X )2 / n

De donde
Y' = es el valor pronosticado para cualquier valor X seleccionado
X = es cualquier valor seleccionado de X

x = es la media de X
n = en el nmero de observaciones
Syx = es el error estndar de la estimacin
t = es el valor de t tomado para n 2
Ejemplo
De acuerdo a los datos anteriores. Calcular los intervalos de confianza para la venta de cajas de gaseosas
cuando la inversin en publicidad es 100.00 (millones de dlares)

y ' = es 1426.98 para un x igual a 100


42

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

x = es 60.0857
n = es 7
Syx = 136.21
t (n 2) =t(7 -2)(0,05)= 2.571

( 10060.0857 )2
1
(2.571)(
136.21)
+
1426.98
7 35119.7 ( 420.6 )2 /7
1426.98

195.1291 = 1622.1091 y 1231.8509

Interpretacin.Cuando se invierte 100 millones de dlares en publicidad, se espera que la venta de gaseosas est
comprendida entre1622.1091 y 1231.8509 miles de cajas
Pero cuando a se trata de un valor individual la frmula es:

'

t(Syx)

( X X )2
1
1+ +
n X 2( X )2 /n

Ejemplo.
- Cuanto ser la venta de cajas de Inca cola, cuando esta compaa invierta 100 millones en publicidad:

( 10060.0857 )2
1
(2.571)(
136.21)
1+
+
1426.98
7 35119.7 ( 420.6 )2 /7
1426.98

545.3250= 1972.305y 881.655

Interpretacin.Con una probabilidad del 0,95 se puede afirmar que cuando la Inca Cola invierta 100 millones en
publicidad sus ventas estarn comprendidas entre 1972.305 y 881.655 cajas..
RELACIN
ENTRE
COEFICIENTE
DE
CORRELACIN,
DETERMINACIN Y ERROR ESTANDAR DE ESTIMACIN

COEFICIENTE

DE

Un medio conveniente para mostrar la relacin entre estas tres medidas es la ANAVA, recordemos que:
El error estndar de la estimacin mide cun cerca de la recta de regresin se encuentra los valores reales.
Cuando el valor es pequeo indica que las dos variables estn relacionadas muy de cerca.
El coeficiente de correlacin mide la fuerza de la asociacin entre dos variables. Cundo los puntos del
diagrama de dispersin parecen cercanos a la lnea recta, se observa que el coeficiente de correlacin
tiende a ser grande. Luego el error estndar de la estimacin y coeficiente de correlacin indican la misma
informacin, pero utilizan escalas diferentes.

43

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

El coeficiente de determinacin mide el porcentaje de la variacin de Y que se explica por la variacin de


A N A V A

Fuentes de
Variacin

Suma de
Cuadrados

Grados de
Libertad

Cuadrado
Medio

( GL )

( SC )

Prueba de
significacin

( CM )

( F)
CM r /CM e

Regresin

SC r

SC r /GL r

Error

SC e

n2

SC e / GLe

Total

SC r

n1

Significacin
estadstica

Y
2
SC r = ( ' Y )

SC e=

( Y Y ' )2

SC t =

( Y Y )2

Y'

1929.
2
1384.
6
811.4

1878.4
5
1317.3
5
855.78

541.5

787.99

536.9

564.42

535.6

402.87

219.5

151.89

=SC t SC r

Y
851.242
8
851.242
8
851.242
8
851.242
8
851.242
8
851.242
8
851.242
8

( Y Y )2

(Y Y )
1077.957
2
533.3572
- 39.8428
309.7428
314.3428
315.6428
631.7428

( Y Y ' )

(Y ' Y )

1055154.632

(Y Y ' )

( Y ' Y )

1161991.72
5
284469.902
8
1587.4487

50.75

2575.5625

67.25

4522.5625

1027.207
2
466.1072

-44.38

1969.5844

4.5372

20.5861

95940.6021

-246.49

60757.3201

-63.2528

4000.9167

98811.3959

-27.52

757.3504

-286.8228

82267.3186

99630.3771

132.73

17617.2529

-448.3728

201038.1678

399098.965
4

67.61

4571.1121

-699.3528

489094.3389

CM

2048831.
882
18554.14
89

110.42
44

Sign.
Estad.
**

217255.9219

SC T SC e SC r
A

Fuentes de
Variacin
Regresin
Error

SC
2048831.
882
92770.74
49

GL
1
5

44

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Total

2141530.
417

F (1,5)= 6.61 ( =0,05


16.26 (

=0,01

Interpretacin:
Realizado el anlisis de variancia (ANAVA) para la regresin se encontr una alta significacin
estadstica para la regresin, por lo tanto podemos decir que existe asociacin entre ambas variables en
estudio

r2

2048831.882
r2 =
2141530.417

= 1

SCr

= SC t

= 1

92770.7449
2141530.417

SC e
Sct

= 0,9567 = 95.67%

El 95.67% de las variaciones de la venta de cajas de gaseosas (Y) es explicado por la inversin que se
hizo en publicidad (X)

0,9567

r=

= 0.9781 (Coeficiente de correlacin)

= 4.33% (Coeficiente de no determinacin)

El error estndar de la estimacin tambin puede ser calculado de la siguiente forma

S yx=

SC e
n2

92770.7449
7 2

= 136.2136

Por ltimo se como se observa que conforme la Suma de Cuadrado del error disminuye
ta y por el contrario, conforme disminuye el error estndar se incrementa r2
Anlisis de regresin mltiple
Estudia la influencia de dos o ms variables independientes sobre la dependencia de otra variable
dependiente.
La ecuacin ser:

'

= bo + b1X1 +b2X2

X 1,X2 = son las dos variables independientes


bo = es la interseccin en Y, es decir, la ordenada con el eje del punto de interseccin con el
eje Y
b 1= es el cambio neto en Y por cada cambio unitario de X 1 manteniendo x2 constante (o sea sin
cambios). Se denomina coeficiente de regresin parcial, coeficiente de regresin neta,
ms brevemente, coeficiente de regresin.

45

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

b 2 = Es el cambio neto en Y por unidad de cambio en X 2, manteniendo X1 constante (sin


cambios). Tambin se denomina coeficiente de regresin parcial o simplemente
coeficiente de regresin.
La ecuacin de la regresin mltiple se puede ampliar a ms variables independientes.
Y' = bo +b1X1 + b2X2 +b3X3 ++bkXk
El mtodo de mnimos cuadrados, minimiza la suma de cuadrados de las desviaciones verticales con
respecto a la lnea de la regresin, principios que se cumple para la regresin lineal como para la
regresin mltiple.
En el caso de dos variables independientes es necesario resolver las siguientes ecuaciones:
Y = na + b1X1 +b2X2

X 21 + b2X1X2

X1Y = boX1 + b1

X2Y = boX2 + b1X1X2 + b2

X2

Este sistema de ecuaciones se puede resolver de diferentes maneras, una de ellas es empleando matrices
Ejemplo.- El director de personal de una empresa que tiene un importante grupo de vendedores, debe
entrevistar y seleccionar nuevo personal. Ha diseado una prueba que ayuda a seleccionar los mejores
aspirantes para su personal de ventas A fin de verificar la validez de una prueba como instrumento de
prediccin de las ventas semanales. Eligi al azar a cinco vendedores y aplic la prueba a cada uno. Los
importes de ventas semanales se aparearon con el puntaje obtenido en la prueba y con la calificacin que
se les hizo a su desempeo
1.- Cul ser la ecuacin de regresin mltiple?
2. Supngase que un solicitante de empleo en el departamento de ventas tuvo un puntaje de 6,0 en la
prueba y una calificacin de desempeo de 3,8. Cules son las ventas semanales estimadas del
solicitante?

Vendedor

Ventas semanales
(en miles de soles) Y

Puntaje de la
Prueba

( X1)
Juan
Milagritos
Ral
Steffany
Eduardo

5
12
4
8
11

Calificacin de
Desempeo

( x2)
4
7
3
6
10

2
5
1
4
6

Solucin:
1.- La ecuacin podr ser calculada de la siguiente forma:

n
x1
x2
2
x 1 x 1 x1 x 2
x 2 x 1 x2 x 22

][ ] []
y
x1 y
x2 y

b0
b1
b2

46

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

X1

Y
5
12
4
8
11
40

Total

X2

4
7
3
6
10
30

2
5
1
4
6
18

X1 X2

X1

X2

16
49
9
36
100
210

4
25
1
16
36
82

8
35
3
24
60
130

X1 Y

X2 Y

20
84
12
48
110
274

10
60
4
32
66
172

Reemplazamos en el arreglo matricial

5 30 18
30 210 130
18 130 82

][ ] []
1

40
274
172

b0
b1
b2

Encontramos determinante de la matriz 3x3

5 30 18
30 210 130 =|160|
18 130 82

Procedemos a invertir la matriz cuadrada 3x3

210 130
130 82

= 320

30 130
18 82

=120

= 120

30 210
18 130

320 120 120


120 86 110
120 110 150

320 120 120 40


1
120
86
110 274
160
120 110 150 172

30 18
130 82

= 120

5 18
18 82

= 86

5 30
18 130

= 110

= 120

5 18
30 130

= 110

5 30
30 210

= 150

30 18
210 130

]
][ ]

[]
bo
b1
b2

Calculamos los coeficientes de la regresin mltiple

47

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

bo =

[( 320 x 40 ) ( 120 x 274 ) (120 x 172)]


160

b1

110 x 172
( 120 x 40 ) ( 86 x 274 )

=
=0,975

b2

150 x 172
( 120 x 40 )( 110 x 274 )

=
= 2,875

= 3,5

Luego la ecuacin ser igual a:

y ' = bo + b1X1 + b2X2


Y ' = 3,5 + ( 0,975) X1 + 2,875X2
2.- Y' = 3,5 + (0,975)6,0 + 2,875(3,8)
Y' = 8,575 miles de nuevos soles.
ERROR ESTNDAR MLTIPLE DE LA ESTIMACIN:
El error estndar de la estimacin en el anlisis de la regresin mltiple mide el error para valores de Y
con respecto al plano de regresin si es que intervienen dos variables independientes.

Sy.12 =

(Y Y ' )2
n (K +1)

Puntaje de
Prueba

X1
Juan
Milagritos
Ral
Steffany
Eduardo

4
7
3
6
10

Calificacin
de
Desempeo

X2
2
5
1
4
6

Ventas
semanales
(miles
de
soles)

Ventas
semanales
Pronosticadas
(miles de soles)

(Y y )

( Y y' )

5
12
4
8
11

5,35
11,05
3,45
9,15
11,00

0,35
0,95
0,55
1,15
0,00

0,1225
0,9025
0,3025
1,3225
0,0000

0,00

2,6500

Total

48

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Sy.12 =

2,65
5 (2+1)

= 1,151 miles de soles

COEFICIENTE DE CORRELACIN MULTIPLE. (r)


Es la medida de la fuerza de la asociacin entre la variable dependiente y dos o ms variables
independientes
Este coeficiente toma valores entre 0 y a 1 inclusive, siempre es positiva Ejemplo Un coeficiente de 0,94
indica una asociacin muy fuerte entre las variables dependiente e independiente. Un coeficiente de 0,09
revela una relacin muy dbil

Correlacin
pequea

Correlacin
moderada

Correlacin
grande

0,50

1,00

sin correlacion

correlacin perfecta

COEFICIENTE DE DETERMINACIN MLTIPLE (r2).-- Proporcin (porcentaje) de la variacin


total en la variable dependiente Y que se explica por medio del conjunto de variables independientes
COEFICIENTE DE NO DETERMINACIN MLTIPLE (1 r 2).- mide la proporcin de la
variacin total en la variable dependiente Y, que no se debe a las variables independiente.
A N A V A

Fuentes de
Variacin

Suma de
Cuadrados

Grados de
Libertad

Cuadrado
Medio

( GL )

( SC )
Regresin

SC r

Error

SC e

Prueba
de
significacin

( CM )

( F)

SC r /GL r

CM r /CM e

Significacin
estadistica

SC e /GLe

( K1 )
SC r

Total

n1

El coeficiente de determinacin se puede calcular de la siguiente manera:


2

r=

SC r
SC t

Error estndar de la estimacin mltiple ser igual a:

Sy.12 =
y
5
12
4
8
11
40

Y'

5,39
11,0
3,45
9,15
11
40

8
8
8
8
8

( Y Y ) ( Y Y )2
3
4
4
0
3
0

9
16
16
0
9
50

SC e
n ( K 1)

( Y Y ' )
0,35
0,95
0,55
1,15
0
0

(Y Y ' )

0,1225
0,9025
0,3025
1,3225
0
2,65

(Y ' Y )

2,65
3,05
4,55
1,15
3
0

( Y ' Y )

7,0225
9,3025
20,7025
1,3225 49
9
47,35

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

SC T SC e SC r

Total
A

Fuentes de
variacin
Regresin
Error
Total

SC
47.35
2.65
50

G
L
2
2
4

F(2,2)= 19,00 (

CM

SIG

23.675
1.325

17.87

N.S.

=0,05

99,50 ( =0,01
Coeficiente de determinacin:

r 2=

SC r
SC t

47,35
=94,70
%
50

Quiere decir que el 94,70% de la variacin es explicado por la regresin


Coeficiente de regresin mltiple
r=

0,9470

= 0,9731

Error estndar de la estimacin mltiple:

Sy.12 =

SC e
n ( K 1)

2,65
5 (2+1)

= 1,1510

FUNDAMENTOS DE LA EXPERIMENTACIN AGRCOLA;


DISEOS EXPERIMENTALES
La estadstica es uno de los elementos bsicos de la experimentacin agrcola, ya que mediante ella se
pueden obtener algunas conclusiones acerca de tales experimentos.
El desarrollo agrcola de un pas se basa en las investigaciones que se realizan en ese campo, valindose
de la experimentacin. Cualquier modalidad en las tcnicas de cultivo, al introducirse por primera vez a
una regin, necesita de la experimentacin para poder adaptarlo y divulgarlo entre los agricultores. Esto
se debe a que las condiciones de clima y suelo varan en cada regin, estacin y ao.
Para el aprovechamiento ptimo de los recursos disponibles, los experimentos se deben disear de
acuerdo con los principios estadsticos que permiten al experimentador llegar a conclusiones correctas
acerca de un problema especfico. Los experimentadores y estadsticos deben planear los experimentos
conjuntamente. Para ello el estadista debe tener un criterio prctico y el experimentador un criterio
estadstico.
Las etapas de todo trabajo de investigacin se pueden resumir de la siguiente manera:
a)

Enunciado del problema.

50

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

b)

Colaboradores.

c)

Formulacin de hiptesis.

d)

Seleccin del procedimiento y diseo experimentales.

e)

Realizacin del experimento.

f)

Aplicacin de los mtodos estadsticos a los resultados,

g)

Interpretacin de resultados.

h)

Anlisis econmico y su utilidad prctica para la comunidad.

La biometra es primordial para analizar e interpretar los datos y se manifiesta en diversas formas:
a)

Estudio de la variacin de una poblacin de seres vivos.

b)

Comparacin entre poblaciones y muestras para juzgar su semejanza.

c)

Interpretacin de resultados de experimentos biolgicos y agropecuarios, en donde se comparan


poblaciones o muestras sometidas a diferentes estudios o pertenecientes a diferentes variedades o
razas.

d)

Determinacin de la relacin entre dos o ms variedades (correlacin y regresin).

e)

Aplicacin de mtodos para reducir las fuentes de error en la correlacin de datos.

f)

En poblaciones segregadas, separacin de la variacin atribuible a la seccin de los genes debido


al medio, en estudios de herencia cuantitativa.

En general, la experimentacin agrcola la deben realizar los profesionales relacionados con las ciencias
agronmicas y biolgicas.
Disear un experimento significa planear un trabajo de modo que rena la informacin aplicable al
problema en investigacin. Steel y Torrie consideran un experimento como una pregunta que detectar
nuevos hechos, confirmar los resultados de ensayos anteriores y dar recomendaciones de aplicacin
prctica.
El experimento es el conjunto de reglas usadas para obtener una muestra de la poblacin y al concluir el
ensayo obtener informacin acerca de la poblacin. Little y Jackson afirman que el experimento es un
elemento de investigacin utilizada para descubrir algo desconocido, o para probar un principio o una
hiptesis. Es un caso importante del mtodo cientfico, ya que las preguntas que el experimento pretende
contestar sern fundamentales para apoyar o rechazar una hiptesis.

TRATAMIENTO
Es una de las formas que, en cantidad o calidad, el factor a estudiar toma durante el experimento. Por
ejemplo, s el factor a estudiar es variedad de arroz, un tratamiento es la variedad NIR si el factor a
estudiar es cantidad de lisina, cada una de las dosis de lisina aplicada durante el experimento es un
tratamiento. Los tratamientos a estudiar durante el experimento pueden ser una combinacin de varios
factores simples: si quiere estudiarse la distancia entre hileras y la distancia entre plantas en un cultivo, se
pueden considerar tratamientos simples como 80 cm. entre hileras o 3 cm entre plantas, o tratamientos
combinados como 80 cm entre hileras y 3 cm entre plantas.

51

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Por ejemplo, en la industria el productor de detergentes puede establecer como tratamiento el tipo de agua
(dura o suave), la temperatura del agua, la duracin del lavado, la marca y el tipo de lavadora. En los
estudios sociolgicos y psicolgicos, los tratamientos se pueden referir a edad, sexo, grado de educacin,
religin, etctera.
Unidad experimental
es el material experimental al que se aplica un tratamiento de manera uniforme. Puede ser un animal, un
conjunto de semillas, una parcela, una maceta, un rbol, un tubo de ensayo, etctera.
Tratamiento testigo
Es un tratamiento que se compara. Por ejemplo, si se quiere probar en una regin el grado de adaptacin y
rendimiento de una variedad nueva de pltano, se planear el ensayo de tal manera que se incluyen
variedades locales como testigos. Si la nueva variedad presenta mayor resistencia a enfermedades,
insectos, vientos, precipitacin, etc., y en consecuencia produce mayor rendimiento por hectrea, esa
variedad se recomendar para la zona.
En investigacin con animales se pueden probar sexos, localidades, raciones, pocas, sistemas de
pastoreo, carga de animal ptima, tipos de vacuna, uso de vitaminas y minerales, etc. En tales casos, se
forman grupos de animales tan homogneos como sea posible para la investigacin. Para formar los
grupos se deben considerar aspectos como edad, sexo y raza. Si a varios grupos de animales se les
administran diferentes dosis de vitaminas, pero no a un grupo testigo, el anlisis estadstico dar
informacin acerca del aumento de peso, altura y precocidad de los animales que recibieron la vitamina
comparados con los que no la recibieron.
REPETICIN
Cuando en un experimento se tiene un conjunto de tratamientos para poder estimar el error experimental,
es necesario que dichos tratamientos aparezcan ms de una vez en el experimento, para as aumentar la
precisin de ste, controlar el error experimental y disminuir la desviacin estndar de la media. Por lo
tanto, se entender por repeticin al nmero de veces que un tratamiento aparece en el experimento.

DISEO EXPERIMENTAL
Es el procedimiento que se sigue para asignar los tratamientos a las unidades experimentales. Es un
mtodo aleatorio, o sea, de asignacin al azar, porque se decide el tratamiento que corresponde a cada
unidad experimental mediante un sorteo o por medio de una tabla de nmeros aleatorios.
BLOQUE O REPETICIN
Es un conjunto de unidades experimentales lo ms homogneas posibles, en el cual aparecen todos los
tratamientos una sola vez; dicho bloque se debe colocar perpendicular al gradiente para tratar de
minimizar el error.

52

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

ERROR EXPERIMENTAL
Los resultados experimentales varean no solo por la accin de los tratamientos, sino tambin por
variaciones ambientales que tienden a enmascarar el efecto de los tratamientos. Por lo general. Para
expresar estas variaciones se usa el trmino error experimental. Pero el trmino error no quiere decir
equivocacin, sino que incluye todo tipo de variacin externa ajena al material experimental.
El error experimental es la medida de variacin que existe entre las observaciones de unidades
experimentales en el mismo tratamiento, es decir, la variacin no proviene de los tratamientos. Existen
dos clases de variaciones; la variacin inherente al material experimental, al que se aplican los
tratamientos, y la que proviene de la falta de uniformidad en la realizacin fsica del experimento. Si los
resultados obtenidos tienen la precisin necesaria para llegar a conclusiones validas, ninguna de las dos
fuentes de variacin deben preocupar al investigador.
El error experimental no se puede eliminar, pero sus efectos se pueden reducir para obtener una mejor
estimacin de los efectos de los tratamientos. Las modalidades ms recomendadas para disminuir error
son:
a.-Utilizar unidades experimentales muy uniformes, como suelo homogneo, riegos, densidad de
siembra, fertilizacin, control de plagas y hierbas, etctera.
b.- Tamao adecuado de la unidad experimental.
c.- Eliminacin del efecto de orilla y de la competencia entre tratamientos
d.- Distribucin adecuada de los tratamientos mediante sorteos.
e.- Usar el nmero adecuado de repeticiones para cada tratamiento.
f.- Poner todos los tratamientos en iguales condiciones, de manera que si alguno es superior a los
dems, se puede probar.
Existen ciertos detalles tcnicos al realizar los experimentos que parecen obvios, sin embargo, muchas
veces pasan inadvertidos. Una vez que se tiene listo el terreno para el experimento, es conveniente marcar
los contornos de los bloques y la posesin de las parcelas de acuerdo con el diseo experimental. Si el
campo est surcado y el nmero de surcos por parcela es impar se debe marcar el surco central de cada
parcela, y si es par el primer surco de la derecha. Adems, las bolsas que contengan las semillas, abonos,
etc., que se aplican a las parcelas, tendrn claramente indicado el nmero de bloque y parcela a que
pertenecen. Antes de empezar la siembra y su preparacin, el experimentador debe verificar que cada
bolsa est en el campo frente a la parcela correspondiente.
Durante la realizacin del experimento debe quedar claro que todas las labores se harn con uniformidad
para todo el lote experimental, excepto las que estn en estudio. Cuando se efectan experimentos de
abonamiento, variedades, etc., es importante conocer el origen de cada tratamiento, las caractersticas de
las variedades y el anlisis de los abonos. Los materiales para aplicar los tratamientos se deben conseguir
y preparar oportunamente, y nunca esperar hasta el da del inicio del experimento.
La siembra, abonamiento, labores culturales y otras, se deben realizar el mismo da para todo el
experimento. Lo anterior es necesario en los lugares lluviosos, porque las labores realizadas antes y

53

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

despus de llover encuentran el terreno en condiciones diferentes, lo cual puede causar variabilidad en la
germinacin, efecto de los abonos, etc. Si no es posible realizar las labor completa en un da se debe
evitar dejar bloques sin terminar
Si se trata de experimentos comparativos de variedades es til compara las caractersticas de las
variedades sembradas, con aquellas que se obtienen al momento de la cosecha, para determinar cmo se
adaptan a las condiciones ecolgicas de la localidad. Tambin es muy importante que una parte de la
semilla de las variedades introducidas se cultive aparte para mantener su pureza, adems de multiplicarla
y aclimatarla, ya sea para utilizarla en experimentos siguientes o para distribuirla entre los agricultores.
En ciertos casos, para mantener la pureza de la variedad es necesario ir al embolsado de las flores para
evitar la polinizacin cruzada.
Cuando se trabaja con varios obreros de campo es importante cuidar que ninguno se dedique a un mismo
tratamiento en todas las repeticiones del experimento. Ya que, un obrero puede trabajar mejor que otro y,
en consecuencia, el tratamiento que realice estar en ventaja.
Un experimento nunca se debe sembrar fuera de poca porque pierde su valor. En los experimentos de
abonamiento no debe descartarse el testigo sin abono, ni el testigo que representa la prctica de la
localidad. Debido a que muchos experimentos se pierden por los daos que causan los animales se debe
extremar la vigilancia, especialmente en la poca prxima a la cosecha.
En la toma de datos y observaciones en los experimentos, es importante que el experimentador se libere
de toda preferencia por determinado tratamiento para evitar falsear de manera inconsciente los resultados.
Tambin es importante que l mismo sea quien haga las observaciones y que anote slo los datos
debidamente comprobados. En los experimentos no deben interesar solamente los rendimientos, ya que de
proceder as no se conoceran las causas que determinan ciertos resultados de buena calidad del producto.
Se aconseja revisar los experimentos cuando menos una vez por semana, para hacer las observaciones
oportunamente. Todas las observaciones se deben anotar cuidadosamente sin dejan nada al azar ni confiar
en la memoria. Los datos deben estar en orden, de tal manera que otro experimentador pueda utilizarlos si
es necesario.
Para muchos investigadores el tamao y la forma de la unidad experimental es nicamente un problema
de control. Sin embargo, investigaciones realizadas en diferentes cultivos con datos de ensayo en blanco,
han indicado que el tamao adecuado se relaciona con el grado de precisin y con una mejor estimacin
de los efectos de los tratamientos, el aspecto del costo por unidad experimental y la precisin del
experimento: aqu se prefiere un mayor nmero de repeticiones que el tamao, y la unidad experimental
se orienta de manera que la mayor dimensin se dirija hacia donde est la mayor variacin del suelo.
ELECCIN DEL DISEO EXPERIMENTAL
Cuando el experimentador ya defini el objetivo del trabajo y los tratamientos por probar, el siguiente
paso es determinar el diseo experimental que se debe usar. Para un experimento especfico, el mejor
diseo es el ms sencillo y el que usa la menor cantidad de material para lograr el objetivo.

54

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

En la prctica, las unidades experimentales, las condiciones ambientales y de manejo no son iguales, y los
mtodos de medida son inexactos. Por ello, es necesario hacer repeticiones y utilizar un diseo
experimental.
Si se considera que el experimentador estudia un fenmeno complejo (como la produccin de trigo, de
leche o el crecimiento de una colonia de hongos), que mantiene fijos todos los factores que intervienen en
el fenmeno y que los mtodos de medida son exactos, el resultado ser el mismo cada vez que se realice
el experimento. Entonces, cada combinacin de factores determina un resultado que permanecer
constante si se repite el experimento. El experimentador, de acuerdo con su objetivo, vara uno o ms
factores para evaluar el efecto de tales variaciones en el resultado.
TCNICA DE ALEATORIEDAD
Debido a la variabilidad del suelo, para evitar que un tratamiento sea favorecido o puesto en desventaja en
forma sistemtica en sus repeticiones, Fisher ide la tcnica de aleatoriedad, cuya finalidad es dar una
estimacin insesgada del error experimental.
Las parcelas contiguas tienden a correlacionarse, por eso cualquiera de ellas debe recibir al azar algn
tratamiento. La aleatoriedad tiende a destruir la correlacin entre errores y hacer vlidas las pruebas de
significacin. El ejemplo ms comn de la tcnica de aleatoriedad est dado por la rifa de un objeto. Si se
colocan papeles o fichas numeradas en un nfora y se supone que estn completamente mezcladas,
cualquier secuencia en que salgan se considerar aleatoria. Cuando el investigador tiene pocos
tratamientos recurre a esta tcnica. Sin embargo, es preferible recurrir a una tabla de nmeros aleatorios.
ANLISIS DE VARIANZA
Anteriormente se analizaron datos provenientes de dos muestras o dos tratamientos. Se observ que por
medio de la prueba t de Student es posible determinar si la variedad A es estadsticamente ms productiva
que la variedad B, o si un forraje con fertilizante es mejor que un forraje sin fertilizante.
El trabajo del investigador pocas veces se limita a estudiar dos tratamientos a la vez. Para ahorrar tiempo
y esfuerzo, y para aumentar la precisin del experimento, por lo general, se estudian ms de dos factores a
la vez, con varios niveles dentro de cada factor.
Sir Ronald Fisher introdujo el anlisis de varianza (ANAVA), que es un procedimiento aritmtico que
consiste en desdoblar la suma de cuadrados total (variacin total) en fuentes de variacin reconocidas,
con todo y la variacin que no se pudo medir (proveniente de la variabilidad inherente al material
experimental o de la falta de homogeneidad del ambiente donde se realiz el experimento); fuente de
variacin que se conoce como residuo o error experimental. Por ejemplo, cuando se trat lo concerniente
a regresin, la suma de cuadrados total se descompuso en suma de cuadrados debido a la regresin, ms
la suma de cuadrados debido al error.
El ANAVA se utiliza en todos los campos de investigacin cuando los datos se miden cuantitativamente.
Su uso ha sido muy ventajoso en el diseo experimental. Las suposiciones bsicas del ANAVA son

55

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

a)

Los efectos de tratamientos y ambientales son aditivos.

b)

El error experimental es un elemento aleatorio, normal e independiente, distribuido con


media cero y varianza comn.

GRADOS DE LIBERTAD
Los grados de libertad son el nmero de contrastes ortogonales menos el nmero de restricciones
impuestas, que se pueden hacer en un grupo de datos. Por ejemplo, si se supone que el rendimiento de
cinco variedades de un cultivo es de 25, 26, 27, 28 y 29 kg, la meda es 27 kg. Las desviaciones de los
nmeros con respecto a su medida (que deben sumar cero) son:
25

26

27

28

29

-2

-1

+1

+2

En esta muestra de cinco datos, uno queda fijo (la restriccin est dada por X= 27), porque X se utiliz
como el origen para las desviaciones. Entonces quedan cuatro valores (cuatro grados de libertad) que se
pueden comparar independientemente con la media, o sea que el nmero de grados de libertad de una
muestra de datos est dado por el total de observaciones menos uno (n - 1).
La varianza de la muestra est dada por:
2

( X i X )
n1

suma de cuadrados
grados de libertad

Es decir, la varianza es el cociente que resulta de dividir la suma de cuadrados entre el nmero de grados
de libertad. Dentro del ANAVA, y para obtener el valor F (que denota la significacin entre tratamientos)
se divide el cuadrado medio del tratamiento entre el cuadrado medio del error.
Al comparar el valor de F calculado con el F tabulado, se podr establecer si existe significancia. Habr
significancia en caso de que el valor F calculado sea mayor que el valor F tabulado. Este ltimo se
encuentra en la tabla de F, con el nivel de significancia apropiado, los grados de libertad del error en la
vertical. Si se rechaza la hiptesis nula de que no existen diferencias en los tratamientos, el siguiente paso
es efectuar la prueba de significancia entre medias de tratamiento, para conocer cules de ellos son
mejores.
DISEO COMPLETAMENTE AL AZAR
El diseo completamente al azar es el diseo ms simple y se usa cuando las unidades experimentales son
homogneas, y la variacin entre ellas es muy pequea. Tal es el caso de experimentos de laboratorios,
invernadero, gallineros, porcinas, etc. En experimentos

en que las condiciones ambientales son

controladas, tal diseo es una prueba con un solo criterio de clasificacin.


Las ventajas de este diseo son:
a.- Es fcil de planear.

56

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

b.- Es flexible en cuanto al nmero de tratamientos y repeticiones, el lmite est dado por el nmero de
unidades experimentales en general.
c.- No es necesario que el nmero de tratamientos sea igual al nmero de repeticiones.
d.- No se estima parcelas perdidas.
e.- El nmero de grados de libertad para el error aumenta al no tener muchas restricciones.
Las desventajas del diseo son:
a.- No es eficiente con material experimental heterogneo.
b.- Puesto que no existen restricciones en cuanto a la aleatoriedad, el error experimental incluye la
variacin total entre unidades experimentales
A

FUENTE
DE
VARIACI
ON

SUMA DE
CUADRAD
OS
SC

Tratamie

x 2i.
r
SC tot.

nto
Error
Total

SCtra.
x 2ij

GRADOS
DE
LIBERTA
D
GL
t 1

CUADR
ADO
MEDIO
CM

PRUEBA
ESTADIS
TICA
F

SC /GL

CMt/cme

t(r 1)

SC /GL

tr 1

Termino de correccin (TC) =

x 2ij
rt

DISEO COMPLETAMENTE AL AZAR CON IGUAL NMERO DE UNIDADES POR


TRATAMIENTO
En un ensayo con macetas se aplicaron cinco tratamientos a clones de pasto estrella. Se tomaron cuatro
macetas por tratamiento. Los rendimientos se presentan a continuacin. Probar las hiptesis
correspondientes.

Maceta
1
2
3
4
Total
Media

T R ATAM I E N T O S
1
2
3
4
5
101 51
83
67
29
93
61
68
40
45
93
59
72
46
51
96
58
75
52
42
383 229 298 205 167
93, 57, 74, 51, 41,

128

H o No existe diferencia entre tratamientos


H a Si existe diferencia entre tratamientos

57

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

12822

= 82176
TC
20
2+ .+422
2+ 83
SC total
TC = 8168
2+ 51

101
2

205 2+167
2+
TC=
4
SC tratamientos =
7286
2+ 2292+ 298
383

SC error = SC total SC tratamientos


= 82176 7286 = 882
AN AVA

Fuentes de
Tratamiento
Variacin
Error
Total

C.V.

SC
7286
882
8168

GL
4
15
19

CM
1821,5
58,15

SIG
**

F 0.05 = 3,06
0,01= 4,89

CMerror 882
X ..

F
30,98

64,1

100= 46,33%

El coeficiente de variabilidad o coeficiente de variacin indica la confiablidad en los datos, a medida que
su valor disminuye la confiabilidad es mayor.
Prueba de significacin de t
-

Las pruebas de hiptesis sern:

1 vs 2

1 vs 3

1 vs 4

1vs 5

Ho

1=2

Ho

1=3

Ho

1= 4

Ha

1 2

Ha

1 3

Ha

1 4

2 vs 3

2 vs 4

2=3

Ho

2= 4

Ho

2=5

Ha

2 3

Ha

2 4

Ha

2 5

Ho

Ha

1=5
1 5

2 vs 5

Ho

3 vs 4

Ho

3 vs 5

3= 4

Ho

3=5

58

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

3 4

Ha

3 5

Ha

4 vs 5
Ho

4 =5

Ha

4 5

S d

El error estndar ser

2 c .m . error
r

2 x 58,15
4

= 5, 39

( gl error )

Se busca en las tablas de t


t

( 15 )

0,05= 2,131

( 15 )

0,01= 2,947

Comparaciones

t=

d
sd

( 12 )

t=

( 13 )

t=
t=

t=

( 14 )
Sd

( 15 )
Sd

( 23 )
Sd

( 24 )
Sd

( 25 )
Sd

=
=

= 6, 77**

93,7574,50
5,39

Sd

t=

93,7557,25
5,39

Sd

t=

t=

se repite para cada par de comparaciones

= 3, 57**

93,7551,25
5,39

= 7, 88**

93,7541,75
5,39

= 9, 64**

57,2574,50
5,39

= 17, 25 *

57,2551,25
5,39
57,2541,75
5,39

= 1, 11 N.S.
= 2, 87*

59

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

( 34 )

t=

Sd

( 35 )

t=

Sd

( 4 5 )

t=

Sd

74,5051,25
5,39

= 4, 31**

74,5041,75
5,39

= 6, 07**

51,2541,75
5,39

= 1, 76 N.S.

Prueba de D. L. S.
D.L.S. = t . S d
= 2,131 x 5,39= 11.48

1 vs 2 = 93,75 57,25 = 36,5*


1 vs 3 = 93,75 74,50 = 19,25*
1 vs 4 = 93,75 51,25 = 42,5*
1 vs 5 = 93,75 41,75 = 52,00*
2 vs 3 = 57,25 74,50 = 17,25*
2 vs 4 = 57,25 51,25 = 6,00 N.S.
2 vs 5 = 57,25 41,75 = 15,50*
3 vs 4 = 74,50 51,25 = 23,25*
3 vs 5 = 74,50 41,75 = 32,75*
4 vs 5 = 51,25 41,75 = 9,5 N.S.
Prueba de significacin de Duncan
Esta prueba tiene en cuenta el orden de los promedios de cada uno de los tratamientos.
S d

c . m. error
r

58 , 15
4

=3,81

Con los grados de libertad del error buscamos en la tabla de Duncan


(A.E.S)

P2= 3,01
P3= 3,16
P4 = 3,25
P5= 3,31
Encontramos la A.L.S.
A.L.S. =A.E.S. x S d

5
60

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

A.E.S.
S
A.L.S.

3.01
3.81
11.46

3.16
3.81
12.03

3.25
3.81
12.38

3.31
3.81
12.61

Ordenamos en orden creciente los promedios


Tratamiento
Promedio

5
41,75

4
51,25

3
57,25

2
74,50

1
93,73

Comparamos los promedios desde el mayor hasta el menor


1 5 = 93,73 41,75 = 51,98 > 12,61 *
1 4 = 93,73 51,25 = 42,48 > 12,38 *
1 2 = 93,73 57,25 = 36,48 > 12,03 *
1 3 = 93,73 74,50 = 19,23 > 11,46 *
3 5 = 74,50 41,74 = 32,76 > 12,38 *
3 4 = 74,50 51,25 = 23,25 > 12,03 *
3 2 = 74,50 57,25 = 17,00 > 11,46 *
2 5 = 57,25 41,75 = 15,50 > 12,03 *
2 4 = 57,25 51,25 = 6,00 < 11,46 N.S.
4 5 = 51,25 41,75 = 9,50 < 11,46 N.S.

Otro mtodo
Tratamiento

Promedio

1
3

93,70
74,50

57,25

51,25

41,75

Los tratamientos bajo la misma recta son estadsticamente iguales.


Prueba de significacin de Tukey
S

x =

c . m. error
r

58 , 15
4

=3,81

Buscamos en la tabla de Tukey con los grados de libertad del error y el nmero de tratamientos.
A.E.S. (T) = A.E.S. (15 y 5) = 4,37

61

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

A.L.S. = S

x . A.E.S. (T)

A.L.S. = 3,81 X 4,37 =16,64


Realizamos las comparaciones mltiples
Tratamiento

Promedio
2
4

93,70
74,50

57,25

51,25

41,75

Los promedios bajo la misma recta son estadsticamente iguales


DISEO COMPLETAMENTE AL AZAR CON DIFERENTE NMERO DE UNIDADES POR
TRATAMIENTO
A veces se presenta el caso de que por insuficiencia de material para todos los tratamientos, o porque se
han perdido unidades experimentales, no se dispone de igual nmero de observaciones por tratamiento.
Esta es una de las ventajas del diseo completamente al azar, ya que los datos se pueden analizar
directamente sin necesidad de estimar parcelas perdidas.
Por ejemplo se analiz un experimento de cuatro raciones para cerdos con nueve cerdos por racin.
Durante el experimento se present una enfermedad y murieron 16 cerdos.
La hiptesis a probar es:

H 0 No existe diferencia entre los tratamientos


Ha Si existe diferencia entre los tratamientos

Repeticione
1
2
3
4
5
6
7
8
9
Total

Media x

( X .. )2
TC =
n

1
45
46
49
44

2
35
33

184
46

68
54

R AC I O N E S
4
41
41
44
43
41
42
44
41
41
170
378
800
34
42
3
34
34
35
34
33

Gran Total

8002
= 20 =32000
2

184 68 170 378


+
+
+
32 000=432
SC trat. =
4
2
5
9

62

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

SCtotal=

452 + 462 +49 2+ 442 +352 + .+ 412+ 412 32 000=464

SC error = SC total SC tratamientos =464 432 = 32


AN AVA

Fuentes de Variacin
Tratamiento
Error
Total

SC
432
32
464

GL
3
16
19

CM
72
,
2

F
36

SI
**
G

F 0.05 3,24
0,01 5,29
C.V. =

CM error x 100= 2
X ..

40

x 100= 3,52%

Como F es altamente significativo, nos permite rechazar la hiptesis nula de que no hay diferencias entre
los tratamientos
El coeficiente de variabilidad o coeficiente de variacin indica la confiablidad en los datos, a medida que
su valor disminuye la confiabilidad es mayor.
DISEO DE BLOQUES COMPLETOS AL AZAR
El objetivo del diseo bloques completos al azar es reunir las unidades experimentales a las cuales se
aplicaran los tratamientos, en bloques de cierto tamao, de tal modo de que los tratamientos se efecten
dentro de cada bloque. La variabilidad entre unidades experimentales de bloques diferentes ser mayor
que entre unidades dentro del mismo bloque, como consecuencia, las diferencias encontradas entre
unidades, se deben principalmente a discrepancias entre tratamientos. La disparidad que no se deba a
tratamientos, se elimina por el diseo y forma parte del error experimenta. De acuerdo con esto, es fcil
observar que la variabilidad entre bloques no afecta las diferencias entre medias de tratamientos, porque
en cada bloque aparece una vez por tratamiento, y as los bloques y tratamientos son ortogonales.
Durante el experimento todas las parcelas dentro del bloque se deben tratar igual, excepto cuando se
aplique un tratamiento cuyo efecto se quiere medir. Por ejemplo, si los tratamientos son niveles de
fertilizacin, todos los dems factores como preparacin del suelo, poca, densidad de siembra, labores de
cultivo, uso de plaguicidas, riegos y variedades deben ser exactamente iguales para todas las parcelas, si
no es as, se introduciran otras fuentes de variacin cuyo efecto no se podra medir, y ocultaran el efecto
de los tratamientos en estudio.
El diseo bloque completo al azar se caracteriza por su equilibrio, fcil planeacin y procedimiento de
clculo simple. Su nica desventaja es que cuando el nmero de tratamientos es alto, aumenta la
superficie del terreno dentro de cada bloque y tambin el error experimental.

REPETICIONES

Su

Med

J=1,2,3,r

ma

ia
63

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Tratamie

nto
1
2

X 11 X 12
X 21 X 22

X 1 r X 1. X 1.
X 2 r X 2. X 2.

t
Suma
Media

Xt 1 Xt 2
X .1 X .2
x .1 X .2

X tr X t .
X . r x ..
X . r X ..

Xt .

A N A V A

Fuente de

SC

GL

CM

Variacin
TRATAMIENT

x 2i.
r2 TC
x
t. j TC
SC tot. SCtrat. SC

t1

SC /GL

CMt/cme

r1

SC /GL

CMr /cme

(t 1)(r

SC /GL

OS
REPETICIONE
S
ERROR

2
x ij TC
rep.

TOTAL

n 1)
1

( X .. )2
TC =
n
El siguiente ejemplo presenta los resultados de seis variedades de frijol (rendimiento expresado en
gr/parcela) en el que se usaron cuatro repeticiones por tratamiento.
Se quiere probar la siguiente hiptesis:
Ho No existe diferencias entre tratamientos
Ha Existe diferencias entre tratamientos, ms all de lo que puede
atribuirse al azar

Variedades
Bayo
Canario
Blanco
Testigo
De Palo
Panamito
Total
Promedio

1
42
32
25
18
35
36
188
31,3
3

TC =

REPETICIONES
2
3
4
46
38
41
38
31
30
32
28
26
20
26
24
42
46
40
25
22
26
203
191
187
33,8 31,8 31,1
3

( 1882 )
24

total
167
131
111
88
163
109
769

Promedi
41,75
o
32,75
27,75
22,00
40,75
27,25
32,04

=24640

64

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

SC total

422 +322 +252 + .+40 2+26 224640=1565

SC repeticiones

1882 +203 2+1912 +1872


24640=27
6

SC tratamientos

167 2+1312 +1112+ 882 +1632 +1092


4

24640 = 1251

SC error = 1565 27 1251 = 287


A

Fuentes
de
Variacin
Tratamie
nto
Repetici
n
Error
Total

SC

GL

CM

Sig.

125
1
27

250
.2
9.0

13.
08
0.4
7

**

287

15

136
5

23

n.s.

19.
13

F (0,05) (5,15) = 2,90 F(0,05) (3,15) = 3,29


F (0,01) (5,15) = 4,56 F(0,01) (3,15) = 5,42

C.V. =

CMerror x 100= 19,13


X ..

32,040

x 100= 28, 49%

Los datos indican que se debe rechazar Ho, por lo tanto existe diferencia entre los tratamientos. La
prueba de significacin establecer la superioridad estadstica de una variedad respecto a otras.
Estimacin de parcela perdida:
Cuando se usa el diseo completamente al azar, la perdida de una parcela no afecta el procedimiento de
clculo. Con el diseo de bloques completos al azar, se pude presentar el caso que un ataque de pjaros, o
insectos haya destruido una parcela, o que en un ensayo con animales uno de ellos haya muerto. En tales
casos es necesario estimar el valor que falta, antes de aplicar el anlisis de variancia, mediante la
ecuacin:

ij=

rb +tT + g
( r 1 ) (t1)

Donde:

X ij

Parcela a estimar

65

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

r Nmero de repeticiones
B Total del bloque donde se perdi la parcela
t
Nmero de tratamientos
T Total del tratamiento donde se perdi la parcela
G Total general
Cuando ya se estima este valor, se coloca en la parcela faltante y se analiza el experimento normalmente,
slo que los grados de libertad del error y total se disminuyen en una unidad. Esto se debe a que dicho
valor o valores estimados no tienen desviaciones, por tal razn, no contribuyen a la suma de cuadrados
del error. Por lo tanto, en el total, la suma de cuadrados del tratamiento est aumentada en la cantidad
dada por la siguiente ecuacin (siempre y cuando el nmero de tratamientos sea mayor a diez)

[b ( t1 ) X ]

t (t 1)

DISEO DE CUADRADO LATINO


En este diseo la restriccin para controlar la variabilidad est en dos direcciones, hileras y columnas. Los
tratamientos se arreglan en bloques de dos sentidos y cada tratamiento aparece una vez en cada hilera y
columna. El anlisis de los datos puede eliminar del erro la variabilidad debida a la hilera y columna. Por
ejemplo, considrese:
- Tratamiento con cinco niveles de vitamina para el crecimiento.
- Hileras con cinco camadas de cerdos de cinco cerdos cada una.
- Columnas con cinco sistemas de crianza.
Debe existir el mismo nmero de tratamientos, hileras y columnas, o sea, el nmero de tratamientos es
igual al nmero de repeticiones. Un arreglo para cuatro tratamientos podra ser:

Fuente de
Variacin
Tratamientos
Hileras
Columnas
Error
Total

SC

GL

CM

x2

t1

SC /GL

CMt/cme

r1

SC /GL

CMr /cme

c1

SC /GL

CMc /cme

(r 1)(r 2)

SC /GL

r2i. TC
x
t2. j TC
x .c

TC
SC tot. SCtrat. rSCHiler. SCcolum
x 2ij

TC

n1

( X .. )2
TC =
n
66

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Ejemplo: Un experimento con cuatro variedades de arroz, con gradientes en dos sentidos, se muestran a
continuacin (el rendimiento se d en Kg/parcela)

B
2
A
7
D
5
C
6
20

Total
columna
Total de Tratamientos A = 32

( X .. )2
TC =
n

S96c total =

( 96 )2
=
16

D
3
C
5
B
4
A
9
21

B =16

A
6
B
5
C
9
D
5
25

C
8
D
7
A
10
B
5
30

C = 28

Total hilera
19
24
28
25
96

D = 20

= 576

22+ 32+ 62 +82 + + 52 576 = 74

19 2+24 2 +282 +252


SC hileras =
4
2

20 +21 +25 +30


SC columna =
4

576

10,5

576 = 15,5

322 +16 2+28 2+20 2


SC tratamientos =
4

576 =40 9,78

Sc error = SC total SC tratamiento SC hilera SC columna


= 74 40 10,5 15,5 = 8

Fuentes de
Tratamiento
Variabilidad
Hilera
Columna
Error
Total

SC
10
10.5
15.5
8
74

GL
3
3
3
6
15

CM
13.333
3.5
5.166
1.1333

F
10.00
2.625
3.875

SIG
**
N.S
N.S

F (0,05) = 4,76
(0,01) = 9,78

67

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

La significacin de hileras columnas indica en qu direccin del terreno est la fertilidad del suelo. En
este experimento no se detect dicha variabilidad en ninguna hilera ni en columna. El coeficiente de
variabilidad indicar la confiabilidad en los datos
C.V. =

CM error x 100= 1,1545


X ..

x 100=17,90%

La prueba de significacin correspondiente indicar cul o cules tratamientos son los mejores.
ESTIMACIN DE PARCELAS PRDIDAS
Cuando en el diseo de cuadrado latino se pierde una unidad experimental, se puede estimar con la
siguiente ecuacin.
X=

r [ H +C+T ] 2 G
(r 1) (r 2)

Donde:
X = Parcela estimada
H = Total de hileras donde est la parcela perdida
C = Total de columnas donde est la parcela perdida
T = Total del tratamiento donde est la parcela perdida
G = Total general
r = Nmero de repeticiones
Igual que en el diseo de bloques al azar, la suma de cuadrados de los tratamientos se debe corregir
cuando el nmero de tratamientos sea mayor de 10, restndole el siguiente trmino
2

[G H C( r1 ) T ]
2
[ ( r 1 )( r 2 ) ]

Cuando se hace el ANAVA debe restarle un grado de libertad al total


EXPERIMENTOS FACTORIALES
Llmese experimentos factoriales aquellos experimentos en los que se estudian simultneamente dos o
ms factores, stos se diferencian de los experimentos simples en los que se estudia slo un factor.
Los experimentos factoriales en si no constituyen un diseo experimental como muchas veces se cree,
ms bien ellos deben ser llevados en cualquiera de los diseos, tal como el completamente randomizado,
bloque completamente randomizado, cuadrado latino, etc.
La informacin que se obtiene de los experimentos factoriales es ms amplia, debido a que permite
comparar los tratamientos o niveles de cada factor entre s, y adems, evaluar las interacciones que
resultan como consecuencia de las combinaciones de los factores.
En los experimentos factoriales todos los tratamientos de un factor se combinan con todos los
tratamientos de los otros factores.
Ventajas de los experimentos factoriales
1.- Permite el estudio de los factores principales, efectos de interaccin de los
y efectos cruzados.

factores, efectos simples

68

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

2.- Todas las unidades experimentales intervienen en la determinacin de los efectos principales y de los
efectos de interaccin de los factores, por lo que el nmero de repeticiones es elevado para estos
casos.
3.- El nmero de grados de libertad del error es alto comparndolo con los experimentos simples de los
mismos factores, lo que contribuye a disminuir la variancia del error, aumentando por este motivo la
precisin del experimento.
Desventajas de los experimentos factoriales.
1.- Requiere mayor nmero de unidades experimentales en relacin con los experimentos simples y por
consiguiente mayor trabajo en la ejecucin del experimento. As, cuando el nmero de factores y
tratamientos es por ejemplo

4 3 (3 factores con 4 niveles cada uno) con 5 repeticiones, el nmero

de unidades experimentales requerido seria de 4 x 4 x5 = 320, nmero que es elevado para la mayor
parte de experimentos
2.- Como en los experimentos factoriales cada uno de los tratamientos de un factor debe combinarse con
todos los tratamientos de un factor debe combinarse con todos tratamientos de cada uno de los otros
factores a fin de que exista balance en el anlisis estadstico, el resultado es que algunas de las
combinaciones en algunos experimentos no tiene inters prctico, pero hay que incluirlas para
mantener el balance; por ejemplo, en un experimento de nmero de labranzas (sin labranza, una
labranza, dos labranzas) y dosis de encalado del suelo (sin encalado, 4 toneladas de encalado, 8
toneladas de encalado), resultan algunas combinaciones que no tienen inters practico para la
agricultura, tal por ejemplo la que combina encalado sin labranzas, ya que la cal quedara sin enterrar
3.- El anlisis estadstico es ms complicado que en los experimentos simples, y la interpretacin de los
resultados se hace ms difcil a medida que aumenta el nmero de factores y tratamientos en los
experimentos
Experimentos factoriales de dos factores (pq)
En los experimentos factoriales de dos factores pueden estudiarse los siguientes efectos (diferencias entre
niveles)
a.- Efectos principales de los factores; los que estn dados para un factor en promedio de los niveles del
otro factor.
b.- Efectos simples; los que estn dados para un factor en cada uno de los niveles del otro factor.
c.- Efecto de interaccin; que est dado por la variacin que tiene un efecto simple de un factor al pasar
de un nivel a otro del factor.
d.- Efectos cruzados; que estn dados por las combinaciones cruzadas de los dos factores.
Ejemplo.
Para explicar estos factores consideremos un experimento factorial de pq =

( 2 )( 2 ) =22 que es el ms

pequeo de los experimentos factoriales dona tiene dos niveles y el factor B tambin tiene dos niveles.

A 1=Variedad X de papa
A 2=Variedad Y de papa

69

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

B 1=0 Kgs de N por Ha.


B 2=150 Kgs de N por Ha.
Supongamos que el diseo usado sea el completamente randomizado y los resultados se dan a
continuacin

A 1 B2

A 2 B1

A 1 B1

A 2 B2

A 1 B1

A 2 B2

A 1 B2

A 2 B1

A 2 B1

A 1 B2

A 2 B2

A 1 B1

A 2 B2

A 1 B1

A 2 B1

A 1 B2

Resultados ordenados de un experimento pq =

BLOQUE
I
II
III
IV
AB
A
B

( 2 )( 2 )

A1
B1
1
2
3
2
8

A2
B2
2
4
6
4
16

A1 = 24
B1 = 20

B1
1
3
4
4
12

TOTAL
B2
4
7
7
10
28

A2 = 40
B2 = 44

8
16
20
20
64
64
64

64
TC = 16 =256
Sc total =

12+ 22+3 2+ .+ 102256= 90

24 2 +40 2
256 = 16
SC de A =
8
20 2+ 44 2
SC de B =
8

256 =36

70

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

82+ 162 +122+ 282


256= 56
4

SC de combinado AB =

SC de la interaccin AB = 56 16 36 = 4
2

SC de block =

8 +16 +20 +20


4

256 =24

SC del error = SC total SC de A SC de B SC de AB SC de Block


= 90 16 36 4 24
= 10
A N A V A

Fuentes de
variabilidad
Block
A
B
AB
Error
Total

SC

GL

CM

24
16
36
4
10
90

3
1
1
1
9
15

8
16
36
4
1,11

F
7,21*
14,41**
32,43**
3,60N.S.

Se puede deducir las siguientes conclusiones, relacionadas con los efectos principales de A y B; tales
como: que la variedad Y supera a la variedad X en rendimiento, y que con el abonamiento nitrogenado
aumenta se aumenta la produccin. Por otra parte, por los resultados obtenidos, no se justifica estudiar los
efectos simples A ni de B
Ejemplo
Se tiene el siguiente experimento en el que se estudia tre variedades de soya y la cantidad de plantas por
golpe

Variedades

V1
V2
V3

C1 = 2 plantas cada 20 cm. en surcos de 80 cm. de ancho


Cantidad de plantas

C2 =3 plantas cada 20 cm. en surcos de 80 cm.de ancho

C3 = 4 plantas cada 20 cm. en surcos de 80 cm. de ancho


Se instal en 5 repeticiones o block y el diseo experimental usado fue block completamente
randomizado. Los datos ordenados son:

71

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

BLOQUE

C1
9
10
11
11
14
55

I
II
II
IV
V
VC
V
C

V1
C2
10
13
15
16
15
69
V1 = 182
C1 = 157

C3
10
12
12
13
11
58

C1
10
9
12
12
15
58

V2
C2
12
10
9
16
13
60
V2 = 182
C2 = 195

C3
13
11
9
17
14
64

C1
6
7
9
12
10
44

V3
C2
10
12
14
16
14
66
V3 = 184
C3 = 196

C3
9
13
16
19
17
74

TOTAL
89
97
107
132
123
548
548
548

548 2
=6673,42
TC =
45
892+ 972 +1072 +1322 +1232
6673,42=141,24
SC de block =
9
2

182 +182 +184


SC de V =
15
2

6673,42 = 0,18

157 +195 +196


6673,42=65,91
SC de C =
15
55 2+69 2+ +662 +74 2
6673,42= 122.18
SC de VC =
5
SC de VC = 122.18 65,91 0,18 = 56,09
SC total =

9 +10 + +19 +17 6673,42=

356,58

SC del error =356,58 141,24 0,18 65,91 56,09 = 93,16


A N A V A
Fuentes de

SC

GL

CM

Block
V
C
VC
Error
Total

141,24
0,18
65,91
56,09
93,16
356,58

4
2
2
4
32
144

35,31
0,09
32,95
14,02
2,91

C.V. =

F
12,13**
0,03NS
11,32**
4,81*.

CMe = 2,91 =14


x

12,18

72

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Como es significativa la interaccin VC debe estudiarse los efectos simples del experimento. As, las SC
de los efectos simples de los niveles de C en cada nivel de V estn dadas por:
2

55 + 69 + 58
SC de C en V 1=
5

182
=21,7

15

58 2+60 2+ 642 1822


V

=3,7
2
SC de C en
=
5
15

SC de C en V 3=

44 2+ 662 +742 1842

=96,5
15
15
A N A V A

Fuentes de variabilidad
Efectos simples de C
Efecto C en
Efecto C en
Efecto C en
Error

V1
V2
V3

SC

GL

CM

21,7
3,7
96,5
93,16

2
2
2
32

10,85
1,85
48,25
2,91

3,72*
0,63 NS
16,58**

Podemos observar que entre los niveles de C hay diferencias significativas en la variedad
diferencias altamente significativas en la variedad

Experimento factorial

V1 y

V3

23

A continuacin se dan los datos del rendimiento en tm/ ha de arroz obtenido del siguiente experimento:
Se tiene dos niveles de abonamiento nitrogenado (A),dos niveles de abonamiento fosforado(B) y dos de
potasio (C), y 5 repeticiones. y el estudio se realiz con el diseo bloque completamente randomizado
A0

BLOQUE
I
II
III
IV
V
ABC
AB
BC
AC
A
B
C

A1

B0
C0
5
7
3
3
2
20

B1
C1
5
10
5
4
1
25

C0
4
7
3
4
2
20

A0B0 = 45
B0B0 = 50
A0C0 = 40

C1
4
9
4
3
0
20
A0B0 = 40
B0C0 = 45
A0C0 = 45

A0 = 85
B0 = 95
C1 = 100

TO

B0
C0
6
7
6
5
6
30

B1
C1
3
7
5
3
2
20

C0
6
9
7
4
4
30

A1B0 = 50
B1C0 = 50
A1C0 = 60

C1
9
10
9
8
9
45
A1B1 = 75
B1C1 = 65
A1C1 = 65

A1 = 125
B1 = 115
C2 = 100

73

4
6
4
3
2
2
2
2
2
2
2
2

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

210 2
TC = 40 =1102,5
SC total =

5 +7 +3 + ..+8 +9 1102,5=259,5

422+ 662 + .+262


1102,5=112.0
SC de block =
8

SC de A =

852+ 1252
1102,5=40,0
20

SC de B =

952+ 1152
1102,5=10.0
20

100 2+100 2
1102,5=2,5
SC de C =
20

SC de AB =

452 + .+752
1102,5=72,5
10
10,0=22,5

SC de AB (corregida) = 72,5 40,0

SC de AC =

402 + +65 2
10

1102,5 =42,5

SC de AC (corregida) = 42,5 40,0 2,5 =0,0


2

50 + ..+65
SC de BC =
10

1102,5 =22,5

SC de BC (corregida) = 22,5 10,0 2,5 =10,0

20 2+25 2+ .+ 452
SC de ABC =
5

1102,5 = 107,5

SC de ABC (corregido) =107,5 40,0 10,0 2,5 22,5 0,0 10,0 = 22,5
SC de error = 259,5 40,0 10,0 2,5 22,5 0,0 10,0 22,5 112,0

40

AN AVA

74

DISEOS EXPERIMENTALES Ciclo 2013 I UCV


FUENTES DE VARIACION

SC

GL

CM

Bloques
Efecto principal A
Efecto principal B
Efecto principal C
Efecto de Int. AB
Efecto de Int. AC
Efecto de Int. BC
Efecto de Int. ABC
Error
total

112,0
40,0
10,0
2,5
22,5
0,0
10,0
22,5
40,0
259,5

4
1
1
1
1
1
1
1
28
39

28,8
40,0
10,0
2,5
22,5
0,0
10,0
22,5
1,4

20.00**
28,57**
7,14**
1,79**
16,07**
0,00 NS
7,14**
16,07**

Bibliografa:
Alvarado Pintado Luis y Agurto Mejia Hugo. Estadstica para Administradores y Economa

con

aplicaciones en Excel. Editorial San Marcos E.I.R.L. 2009 Per

75

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

76

También podría gustarte