Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Para la Investigación
Experimental
Elías A. Torres Armas Lic. Ms. C.
i
Métodos Estadísticos para la
Investigación Experimental
Elías Alberto Torres Armas, Lic. Ms. C.
Es propiedad del Autor, prohibida la producción total o parcial de esta obra, por
cualquier medio o método, sin autorización del autor.
Dirección postal: Grau 721
Chachapoyas, Amazonas, Perú
e-mail: allpachaki@hotmail.com
Diagramación
Elías A. Torres Armas
Impreso:
Compugraf S.R.L.
RUC. 20479787779
SEVILLANO GAYOSO JOSE LUIS
e-mail: sevillano16@hotmail.com
Jr. Ayacucho N° 1041
Amazonas / Chachapoyas / Chachapoyas
Perú – 2013.
Métodos Estadísticos para la Investigación
Contenido
Páginas
Carátula interior i
Depósito Legal de la Biblioteca Nacional ii
Presentación iii
Tablas Estadísticas iv
Índice vi
Tabla de números aleatorios
1
Tabla Binomial simple
2 -11
Tabla Binomial acumulada
12-21
Tabla Poisson simple
22-26
Tabla Poisson acumulada
27-30
Tabla Normal estandarizada
31-37
Tabla F 10%
38-39
Tabla F 5%
40-41
Tabla F 2.5%
42-43
Tabla F 1%
44-45
Tabla F 0.1%
46-47
Tabla F
48-65
Tabla t-Student
66
Tabla Chi cuadrado
67-68
Tabla Chi cuadrado cola derecha
69-70
Tabla Duncan
71-72
Tabla Tukey
73-74
Tabla Newman Keuls
75-76
Tabla Dunnett
77-80
Prefacio
En verdad, el propósito de este texto es el de ayudar al lector a entender los conceptos, ideas y
funciones de los métodos estadísticos aplicados a problemas de la ingeniería y de la ciencia en
general. Este texto deberá ser también útil para aquellos estudiosos quienes deseen hacer
aplicaciones de métodos estadísticos a problemas de la ingeniería en términos generales, así como
también a la investigación experimental.
Este texto estará diseñado para estudiantes de ingeniería y de la ciencia en general. Es decir, para
aquellos investigadores quienes deseen encontrar, prácticamente, todos los conceptos de la
probabilidad y de la estadística, que les pueda ayudar en el desarrollo de su profesión de
ingeniería, en la investigación o en cualquier otra área de la ciencia en general.
El texto tiene un enfoque de carácter científico, tecnológico centrado en métodos estadísticos
como herramientas útiles para la investigación experimental con repercusión en el desarrollo
económico, cultural y social de la región y del país.
CAPITOLO I
1. Introducción
En la vida diaria cada persona hace alguna observación de acontecimientos ordinarios, como
predicción del tiempo, precios de un producto, costo de vida etc. y compara sus observaciones
actuales con su valor promedio y concluye si su observación actual es habitual (no diferencia
significativa) o no habitual (diferencia significativa); utiliza la estadística con la que valúa
mentalmente su investigación; sin embargo la investigación formal es de importancia
infinitamente mayor y debe conducirse con mayor cuidado; pues, la investigación científica es un
estudio escudriñante o examen, análisis o experimentación crítica y exhaustiva cuya finalidad es el
descubrimiento de nuevos hechos y su correcta interpretación; revisión de conclusiones
aceptadas, teorías o leyes, a la luz de hechos descubiertos recientemente o la aplicación práctica
de tales conclusiones nuevas o revisadas; por consiguientes, la investigación científica es la
búsqueda continuada del conocimiento y entendimiento, compuesta de dos elementos: observación,
por la cual se obtiene el conocimiento de ciertos hechos a través de percepciones sensitivas; el
razonamiento, mediante el cual se determina el significado de esos hechos, su interrelación y su
relación con el acervo existente de conocimientos, en el grado que el presente estado del
conocimiento y la habilidad del investigador lo permiten. Además, la investigación implica que el
investigador esté interesado en generalidades, más que en resultados particulares, que esté
interesado en la reproducción de resultados y en su aplicación a situaciones más complicadas y
generales (Ostle, 1986, pp. 17, 18)
El método científico. Existen más definiciones de método científico que investigadores. Pero
para fines de este texto se usará la siguiente: El método científico es una estrategia para lograr el
ideal de la ciencia que es lograr una interrelación sistemática de hechos, mediante
experimentación, observación, argumentación lógica de los postulados aceptados y una
combinación de los mismos en proporciones variables (Ostle, 1986, pp. 18).
Experimento. Es una prueba o serie de pruebas en las que se hacen cambios deliberados en las
variables de entrada de un proceso o sistema para observar o identificar las razones de los
cambios que pudieran observarse en la respuesta de salida (Montgomery, 2004, pp.1). ¿Qué tipo
de estudio es la investigación experimental? En Sampieri y otros (1998) encontramos 4 tipos de
estudios: Exploratorios, descriptivos, correlacionales, explicativos. Los estudios explicativos
analizan relaciones entre una o más variables independientes, una o más variables dependientes y
los efectos causales de las primeras sobre las segundas. Las investigaciones experimentales se
pueden considerar del tipo explicativo.
Tipos de experimento.
Experimento cualitativo. Es aquel para el cual, las mediciones de las variables respuesta se hacen
en escala nominal u ordinal. Se usa las estadística no paramétrica.
Experimento cuantitativo. Es aquel en que las mediciones se hacen en una escala de razón e
intervalo. Se usa la estadística paramétrica.
Experimentos mixtos. Si algunas variables son cuantitativas y otras cualitativas.
7
Elías Alberto Torres Armas, Lic. Ms. C.
Simplicidad. Selección de tratamientos y disposición experimental lo más simple posible.
Grado de precisión. Capacidad para medir diferencias entre tratamientos con los grados de
precisión que el investigador desea. El número de repeticiones y el diseño deben ser
adecuados.
Ausencia de error sistemático. Procurar una estimación insesgado del efecto de
tratamientos.
Rango de validez de las conclusiones. El diseño deberá ser tan amplio posible, como los
experimentos replicados y experimentos con estructuras factoriales.
Cálculo del grado de incertidumbre. El experimento debe ser concebido de modo que sea
posible calcular la probabilidad de obtener los resultados observados debido únicamente al
azar.
Clases de diseño experimental: Se clasifica según el objetivo del diseño, τestudiar uno o más
factores (variables independientes).
o Parcelas apareadas
o Parcelas no apareadas o grupos sorteados o grupos sorteados (2 tratamientos)
o Diseño completamente al azar (DCA)
o Diseño en bloque completamente al azar (DBCA)
o Diseño cuadrado latino (DCL)
o Diseño cuadrado grecolatino
o Diseño cuadrado modificado
o Etc.
8
Métodos Estadísticos para la Investigación experimental
Cuasi-experimentos, Implican grupos intactos. No cumple con el principio básico del diseño:
No Aleatorización
Pre-experimentos (Tienen grado de control mínimo). Poco o nulo control local. No cumple
con dos principios básicos del diseño: No aleatorización. Medición en dos grupos no
equivalentes, Medición única en un solo grupo
Experimentos puros (verdaderos). Cumple con los tres principios básicos del diseño:
Repetición, Aleatorización, Control Local. Manipulación intencional de las variables
independientes. Medición del efecto en la variable(s) dependientes(s). Control y validez. Dos o
más grupos
Según Hinkelman K. & Kempthorne O. (1994) los pasos lógicos de la experimentación científica
se muestran en el siguiente esquema:
PROBLEMA
FORMULACIÓN DE PREGUNTAS E HIPÓTESIS
ANÁLISIS ESTADISTICO
INTERPRETACIÓN DE RESULTADOS
9
Elías Alberto Torres Armas, Lic. Ms. C.
A. Problema o experimento
a. Exposición del problema
b. Elección de la variable respuesta
c. Selección de factor(es).
d. Elección de niveles: Cuantitativos o cualitativos; fijos o aleatorios.
e. Combinación de niveles (tratamientos)
B. Diseño
a. Tamaño de la muestra: cantidad, variación, diferencia o precisión, riesgo.
b. Aleatorización. Método de aleatorización
c. Modelo matemático
C. Análisis
a. Recolección y procesamiento de datos
b. Cálculos de pruebas estadísticas
c. Interpretación de resultados
d. Conclusiones
En general se usa: Planteamiento del problema, Marco teórico, Metodología, Análisis de datos,
Conclusiones, Recomendaciones.
o Tipo de sustrato
o Tamaños de poda
o Sistema de riego
o Tipos de poda
o Densidad de siembra
o Tipos de herbicidas
o Temperatura
o Tiempo
o Alimentación
o Presentación de un producto
o Sistemas de enseñanza
o Formas de elaborar un producto
o Terapia de una enfermedad.
10
Métodos Estadísticos para la Investigación experimental
Unidad experimental (u.e.). Llamado también τParcela experimental” en donde se aplican los
tratamientos, en el cual se observan, se miden y se evalúan las variables respuesta (características)
que se investiga. El conjunto de unidades experimentales viene a ser el material experimental,
ejemplo: Una maceta, una planta, un animal, una persona, un árbol, una parcela, un conjunto de
semillas, etc.
AREA DE BORDES
PARCELA UTIL
Dato estadístico. Es el registro numérico, en un momento dado, de cada una de las unidades
experimentales ante la aplicación de los (tratamientos) niveles del factor en estudio. Ejemplo:
Factor: Dosis de nitrógeno. Niveles de factor (tratamentos): N1, N2, N3, … , Nk. Variable
respuesta: Rendimiento en Kg de una variedad de papa. Unidad experimental: Una parcela de 20
m2. Dato estadístico: 18 kg/parcela
11
Elías Alberto Torres Armas, Lic. Ms. C.
o El fenómeno de que se trate, de ser posible, debe aislarse para estudiarse mejor
o El experimento debe repetirse en las mismas circunstancias para probar y medir el error
experimental
o Las condiciones del experimento deben alterarse para investigar de qué grado modifican al
fenómeno.
o El experimento debe durar el tiempo suficiente para que se produzca el fenómeno deseado.
o El error experimental es la variación existente (involuntaria y/o extraña) entre los resultados
de las observaciones, realizados por dos o más unidades experimentales que recibieron el
mismo tratamiento y que por efectos aleatorios (factores no controlables) reportan ciertas
diferencias.
o Es el fracaso de llegar a resultados idénticos con dos o más unidades experimentales tratados
por igual.
a. La variabilidad propia del material experimental al cual se aplican los tratamientos. Ejemplo:
En una población de plantas de papaya, existen diferencias genéticas entre los individuos de
dicha población: Diferencias en tipo de fruto, tamaño de planta, color de fruto, etc.
b. Falta de uniformidad en la conducción física del experimento. Es decir, la deficiencia en poder
uniformizar la técnica experimental. Ejemplo: Heterogeneidad del suelo, error en la medición,
pérdida de la biomasa en la cosecha, etc.
c. Efecto combinado de factores extraños (estos efectos no pudieron ser controladas por el
investigador durante la conducción de experimento).
d. Error de medición y/u observación
12
Métodos Estadísticos para la Investigación experimental
Sx Sx
S2 S S2 S
n n r r
incrementa.
Además S 2 es estimador insesgado de 2
- A mayor número de repeticiones más preciso será el estimado del efecto de los factores
en estudio. El número óptimo de repeticiones depende de: El grado de precisión
requerido del estimado del efecto de los factores en estudio (diferencia entre
tratamientos), la magnitud del error experimental permisible, grado de precisión de la
prueba de significancia, disponibilidad de presupuesto (Lizarzaburu, 1984).
- Al incrementar el número de repeticiones se disminuya el error experimental, aumenta la
precisión y la exactitud.
- Ejerce un control sobre el error experimental
r 2 t1 t2
S
2
d
2
Donde:
r: Número de repeticiones
t1: Valor crítico de t-student para grados de libertad 2 y nivel de significación 1 =
13
Elías Alberto Torres Armas, Lic. Ms. C.
t2: Valor crítico de t-student para grados de libertad 2 y nivel de significación 2 =2(1-P).
r 2 2 1
kS
2
d
Donde:
k: Valor crítico que se puede encontrar en la tabla III-1 del libro de Federer, W. (1955).
τExperimental designs”, New York, The Macmillan Co.
r
S 2q 2
F( 2 , 1 )(1 P )
d2
Donde:
q: Valor crítico del rango estudentizado para el nivel 1= , grados de libertad 2 y para p
tratamientos.
F: Valor crítico de la distribución F para el nivel de significación 2=1-P y grados de
libertad 2 y 1.
Las tres fórmulas indicadas requieren de un proceso iterativo debido a que los valores de t, k
y F dependen del valor de los grados de libertad 2 que a su vez dependen del número de
repeticiones r del nuevo experimento. Pues, tenemos que dar un valor supuesto para obtener
el primer estimado, con el cual nuevamente obtenemos otro, y así sucesivamente hasta hallar
el menor valor conveniente de r (Lizarzaburu, 1984).
r 2 t1 t 2
S
2
d
2
10
r 2
t 2 ,0.05 t 2 , 0.20
2
5.5
2
1 0.05
2 2(1 P) 2(1 0.90) 1(0.10) 0.20
Damos un valor de r supuesto para obtener el primer estimado:
Sea r=6 2=(t-1)(r-1)=(5-1)(r-1)
2=(t-1)(r-1)=(5-1)(6-1)=20
14
Métodos Estadísticos para la Investigación experimental
Ahora:
10
r 2 t 2 ,0.05 t 2 , 0.20
2
5.5
2
t20,0.05 t20,0.20 2
10
r 2
2
5 .5
t20, 0.05 2.089 tabla t student dos colas
t20, 0.20 1.325 tabla t student dos colas
10
r 2 2.089 1.3252 7.69250975
2
5 .5
r 8
10
r 2
t 2 , 0.05 t 2 , 0.20
2
2
5. 5
5. 5
t 24, 0.05 2.064 tabla t student dos colas
t 24, 0.20 1.318 tabla t student dos colas
10
r 2 2.064 1.3182 7.5622638
2
5. 5
r 8
Tabla 1.3. Número óptimo de repeticiones
Tratamientos r inicial supuesto glerror t0.05 t0.20 ro
5 2 4 2.776 1.533 12.28
5 3 8 2.306 1.397 9.07
5 4 12 2.179 1.356 8.26
5 5 16 2.12 1.337 7.90
5 6 20 2.086 1.325 7.69
5 7 24 2.064 1.318 7.56
Según Tukey
r
S 2q 2
F( 2 , 1 )(1 P )
d2
q: Valor crítico del rango estudentizado para el nivel 1= , grados de libertad 2 y para p
tratamientos.
F: Valor crítico de la distribución F para el nivel de significación 2=1-P y grados de
libertad 2 y 1.
Sea r=6 2=(t-1)(r-1)=(5-1)(r-1)
2=(t-1)(r-1)=(5-1)(6-1)=20
q=4.23 1= =0.05 2=20 1=50
15
Elías Alberto Torres Armas, Lic. Ms. C.
r
S 2q 2
F( 2 , 1 )(1 P )
d2
r 1.57 9.28656298 9
10(4.23) 2
5.52
b. Aleatorización.-
c. Control local
Es una representación matemática de las relaciones existentes entre los diversos factores o
componentes considerados en un diseño experimental. Cada fenómeno natural tiene un modelo.
Los modelos más perfeccionados dependen de afirmaciones matemáticas y que estos nos
16
Métodos Estadísticos para la Investigación experimental
permiten explicar un fenómeno. Por ejemplo: Modelo lineal aditivo para un diseño completo al
Yij i ij
azar (DCA), es:
Aditivo: Porque los efectos o componentes que están incluidos en el modelo son aditivos (se
suman), para dar lugar al hecho observado a su valor.
Lineal: Porque sus componentes del modelo están elevados a la potencia uno.
Dependiendo de la forma en que son elegidos los niveles de los factores en estudio, los modelos
son de tres tipos:
Modelo I (Efectos fijos). Se presenta cuando los niveles son fijados por el experimentador.
Ejemplo. Se desea estudiar el efecto de dietas con diferente nivel energético en la ganancia de
peso en terneros de ganado vacuno, este factor es fijo. Las conclusiones del experimento son
solamente válidas para los niveles evaluados.
Modelo II (Efectos aleatorios). Se presenta cuando los niveles son escogidos aleatoriamente
desde una población. Las conclusiones del experimento serán válidas para la población de niveles
del factor. Ejemplo. Si además en el ejemplo anterior, de estudiar el efecto de las dietas, se desea
evaluar el efecto de la condición genética del padrillo en la ganancia de peso de los terneros, este
último es factor aleatorio.
Modelo III (Efectos mixtos). Se presenta cuando se tiene una combinación de los dos modelos
anteriores, es decir; cuando se tiene algunos factores con efectos fijos y algunos con efectos
aleatorios.
Es una técnica estadística que permite descomponer la variabilidad total de los resultados de un
experimento en sus distintas fuentes (tratamientos, interacciones entre factores, covariables, error
experimental), con la finalidad de compararlas e identificar su importancia relativa en la
explicación de la variabilidad total. Se entiende como análisis de varianza a las descomposición
de la variabilidad total que se en los datos en cada una de sus fuentes controladas y no
controladas. El análisis de varianza (ANVA) es una técnica que se puede utilizar para decidir si las
medidas de dos o mas poblaciones (tratamientos) son iguales o no.
- Estimar las diferencias entres los tratamientos que son de interés, de manera que el valor
estimado este lo más cercano posible al valor real.
- Obtener información acerca de la exactitud de los estimadores, lo cual se logra al determinar el
correspondiente error estándar.
- Proveer información necesaria y suficiente para efectuar pruebas de de comparación entre
promedios de tratamientos tal la prueba t-student, etc.
- Estimar los componentes de varianza.
17
Elías Alberto Torres Armas, Lic. Ms. C.
2. Investigación experimental
3. Según Sampieri y otros (1998). La investigación experimental es de 4 tipos ¿Cuáles son?
4. ¿Cuáles son los tipos de experimento?.
5. ¿Cuáles son las características del diseño experimental?.
6. Mencione las clases de diseño experimental según el objetivo del diseño, τestudiar uno o más
factores (variables independientes).
7. Eligiendo una situación práctica de interés en el campo de su especialidad, describa un
problema cuya solución deba ser determinada experimentalmente e indique: Factor(es),
nivel(es) de factor, variable respuesta, unidad experimental.
8. Mencione dos reglas para planear un experimento
9. En qué consiste el error experimental
10. Cuáles son las recomendaciones para realizar control del error experimental
11. ¿Qué se entiende por modelo estadístico?.
12. Dependiendo de la forma en que son elegidos los niveles de los factores en estudio, los
modelos son de tres tipos ¿cuáles son? Indique solamente cuáles son
13. Mencione al menos dos propósitos del análisis de varianza (ANVA)
14. Mediante un ejemplo describa y conceptualice los términos siguientes: Factor, niveles del
factor, tratamiento, testigo (si lo hubiera), unidad experimental, variable respuesta, diseño
experimental y conceptualice cada uno de los principios básicos del diseño experimental.
18
Métodos Estadísticos para la Investigación experimental
1. Utilizar 4 autos y en cada auto colocar las 4 cubiertas con el mismo tratamiento. Es decir, un
tratamiento por auto.
2. Utilizar 4 autos y en cada uno de ellos asignar a la cubierta delantera derecha el tratamiento 1,
a la delantera izquierda el tratamiento 2, a la trasera derecha el tratamiento 3 y a la trasera
izquierda el tratamiento 4.
3. Utilizar 4 autos y en cada uno asignar aleatoriamente un tratamiento a una cubierta.
4. Utilizar 4 autos y en cada uno asignar un tratamiento a una cubierta de modo que todos los
tratamientos estén una vez en cada posición (usando los 4 autos) y los 4 tratamientos estén
presentes en cada auto.
Ejercicio 3. Los tres principios básicos del diseño de experimentos son: replicación,
aleatorización y control de los efectos de variables externas. Considere cada uno de los siguientes
escenarios. ¿Se adhiere cada uno de ellos a todos los principios? En caso de respuesta afirmativa,
describa de qué manera. En caso de respuesta negativa indique cómo cambiaría el diseño para
incorporar el o los principios faltantes.
1. Un químico desea comparar un nuevo método de ensayo más simple con un método estándar.
Prepara una cierta solución y la divide en 40 tubos de ensayo. Aleatoriamente selecciona 20
tubos y le pide a su ayudante técnico que los analice usando el método estándar. Ella por su
parte analiza los restantes 20 usando el método nuevo. Al final los dos grupos de resultados de
estos ensayos serán comparados.
2. Un grupo de estudiantes universitarios cree que un cierto té de hierbas posee un remarcable
poder para levantar el ánimo. Para probar lo que creían realizaron visitas semanales a un hogar
de ancianos, visitando a los residentes y sirviéndoles de este té. El personal del hogar reportó
que luego de varios meses muchos de los residentes estaban más alegres y saludables.
Ejercicio 4. El tamaño final del fruto es un factor determinante de la calidad de los duraznos.
Algunas de las nuevas variedades de duraznero se caracterizan por su abundante fructificación lo
que origina una gran cantidad de frutos de pequeño tamaño con escasa calidad comercial. Una
práctica que puede mejorar el tamaño del fruto es el raleo (eliminación de frutos) químico o
manual. Con el objetivo de evaluar el impacto del raleo sobre el tamaño final de los frutos (peso
medio de fruto en gramos), se realizó el siguiente ensayo: Material experimental: plantas
homogéneas en desarrollo y estado sanitario. Repeticiones: 5 por tratamiento, cada repetición era
una planta y se muestrearon 100 frutos por planta. Tratamientos: un testigo sin ralear
(Tratamiento 1); raleo manual (Tratamiento 2); y raleo químico (Tratamiento 3). Los datos del
experimento se resumen en el siguiente tabla:
Tabla 1.4. Los calibres promedio por planta (mm) en cosecha
Repeticiones
Tratamiento 1 2 3 4 5
1 52.3 53.8 57.3 60.2 61.3
2 70.2 71.8 68.7 67.5 66.2
3 57.8 67.2 63.5 58.4 68.8
Indique: (a) Objetivo del estudio, b) Factor en estudio, (c) Unidad experimental , (d) Variable de
respuesta, e) Escriba el modelo estadístico adecuado para este estudio y explique sus componentes.
19
CAPITOLO II
Sean X1 ,X2, X3, …Xn una muestra aleatoria, seleccionada de una población N(µ 1, 21) y Sean Y1 ,Y2,
Y3, …Yn una muestra aleatoria, seleccionada de una población N(µ 2, 22). Supongamos que las
poblaciones son independientes y con medias maestrales: X y Y .
X1 X 2
Estadística de prueba
zc (0,1)
12 22
n1 n2
Decisión Rechazamos Ho Si Rechazamos Ho Si Rechazamos Ho Si
zc > Z zc < - Z | zc |> Z /2
Sean X1 ,X2, X3, …Xn una muestra aleatoria, seleccionada de una población N(µ1, 21) y Sean Y1 ,Y2,
Y3, ………Yn una muestra aleatoria, seleccionada de una población N(µ2, 22 ) donde µ1, µ2 , 21 y
2
2 , son desconocidas. Supongamos que las poblaciones son independientes.
n1 n2 2 n1 n2
t c - t (n1 + n 2 - 2)
Decisión Rechazamos Ho Si Rechazamos Ho Si Rechazamos Ho Si
t c > t (n1 + n 2 - 2) | t c | > t (n1 + n 2 - 2)
2
Métodos Estadísticos para la Investigación experimental
X1 X 2 n1 n2
tc t( v ) g .l . v 2
S12 S 22
2 2
S12 S22
n1 n2 n1 n2
n1 1 n2 1
Decisión Rechazamos Ho Si Rechazamos Ho Si Rechazamos Ho Si
t c > t (v) t c < - t (v) |t c | > t /2(v)
S12 S22
n1 n2
Decisión Rechazamos Ho Si Rechazamos Ho Si Rechazamos Ho Si
zc > Z zc < - Z |zc |> Z /2
Sean X1 , …Xn una m.a. seleccionada de una población N(µ1 , ²1) y Y1,…,Yn una muestra
aleatoria tomada de una población N(µ2 , ²2), de modo que las observaciones están pareadas,
esto es, la muestra está formada por los pares (X1 , Y1) , (X2 , Y2), ………………,(Xn , Yn).
Di Di D ² D2
n n
D i 1
S i 1
Asi, D N ( D ,
n 1
2
, D )
n n
21
Elías Alberto Torres Armas, Lic. Ms. C.
Tabla 2.5. Comparación de medias de dos poblaciones normales dependientes, muestra pequeña
(n<30)
Tabla 2.6. Comparación de medias de dos poblaciones normales dependientes, muestra grande
(n ≥ 30)
APLICACIONES
HOMBRES 7 6 8 7 5 6 4 9 9 8
MUJERES 6 5 6 5 4 4 4 6 4 8
a) Se trata de comparar las medias de hombres y de mujeres (6.9 y 5.2, respectivamente) con una
prueba t para muestras independientes (contraste bilateral o de dos colas): el SPSS nos da
t(18)0.05=2.53, p=0.021, luego la respuesta es sí.
b) Igual que en a) sólo cambia aquí que el hecho de que el contraste es ahora unilateral (una cola).
En este caso sólo hay que dividir la p que nos da el programa por 2. Luego quedaría así:
t(18)0.05=2.53, p=0.0105, siendo la respuesta también que sí.
Ejemplo 2. (Quevedo H, 2006. pp.303). En un estudio de la aplicación del pH (potencial
hidrógeno que tiene una escala de 0 a 14, donde 7 es neutral y abajo de 7 es ácido y arriba de 7 es
22
Métodos Estadísticos para la Investigación experimental
Ejemplo 3. (Di Rienzo, 2008. Pp183). Los siguientes resultados se obtuvieron al analizar los
registros de las precipitaciones ocurridas en dos zonas: A y B. Para conocer la precipitación
promedio de cada zona se construyeron los correspondientes intervalos de confianza al 95%.
23
Elías Alberto Torres Armas, Lic. Ms. C.
resultados de los dos equipos de control. Asúmase que el muestreo de selección fue
completamente al azar, sin emparejamiento y asumir que las poblaciones son normales.
Antes de comenzar, tenemos que hacer una decisión sobre cual prueba de t es la más apropiada.
Pudiéramos usar la versión de t para observación pares donde hay un aparejamiento deliberado.
Tal vez pudiéramos usar la función de t que asume que las varianzas de las poblaciones son
iguales y con muestras del mismo tamaño. La tercera opción, sería usar la versión de t para
varianzas desiguales. Sin embargo, si asumimos que se usó el método de selección completamente
aleatorio, sin emparejamiento, y si analizamos a simple vista los datos de la tabla de arriba,
podemos ver que hay mucha variación en las observaciones (se debe hacer una prueba de
hipótesis con el objeto de ver si las varianzas son iguales), lo que nos inclinaría a usar la tercera
opción.
24
Métodos Estadísticos para la Investigación experimental
Ho: 1 2
II. Prueba de la diferencia de medias
Ha: 1 2
Nivel de significación: 5%
Estadística de prueba: teniendo en cuenta que las varianzas poblacionales son desconocidas
pero distintas ( 21 ≠ 22), muestras pequeñas (n1; n 2 < 30)
S12 S 22
2
X1 X 2 n1 n2
T t ( v ) g .l . v 2
S12 S 22
2 2
S12 S 22
n1 n2 n1 n2
n1 1 n2 1
Tabla 2.8. Prueba t para dos muestras suponiendo varianzas desiguales
Concentración
de partículas
con el sistema Concentración de
de control partículas con el sistema
agregado el de control, el cual se le
filtro de vidrio agregó el ciclón
Media 414.8 165.2
Varianza 960.7 23839.7
Observaciones 5 5
Diferencia hipotética de las medias 0
Grados de libertad 4
Estadístico t 3.54405326
P(T<=t) una cola 0.01196303
Valor crítico de t (una cola) 2.13184679
P(T<=t) dos colas 0.02392606
Valor crítico de t (dos colas) 2.77644511
tc=3.544 t(4)0.05dos colas=2.77Rechazamos Ho Si |tc| > t /2(v) tc>t(4)0.05dos colas por tanto se
rechaza Ho.
Conclusión: con el equipo adicional, hubo diferencia en las reducciones de contaminantes.
25
CAPÍTULO III
- Es el diseño más simple y aplicable solo cuando las unidades experimentales son
homogéneas.
- Los tiramientos son asignados completamente al azar ( sin restricción en el azar) en las
unidades experimentales o viceversa.
- Los tratamientos pueden tener igual o diferente número de unidades experimentales.
- El número de tratamientos está en función del número de unidades experimentales que se
disponen, es conveniente tener menor número de tratamientos y más unidades
experimentales.
Ventajas
Desventajas
Usos
1. Diseño completamente al azar con una observación por unidad experimental para
cada tratamiento
Métodos Estadísticos para la Investigación experimental
Yij i ij
Análisis de varianza
Hipótesis:
H 0 : i 0 H 0 : i 0
H a : i 0 H a : i 0 ( No todos son iguales )
ó
Tabla 3.1 Cuadro de análisis de varianza para el diseño completo al azar con diferente
número de repeticiones por tratamiento
Fuente de Suma de Grados de Cuadrados Fc
Variación Cuadrados Libertad Medios
(ni 1)
Tratamiento SC tratamiento t-1 CM tratamiento CM tratamiento/CME
Error SC error t CME
i 1
n 1
Total SC total t
i 1
i
27
Elías Alberto Torres Armas, Lic. Ms. C.
r
TOTAL Y1. Y2. Y3. . Yt. Y..
Repeticiones r1 r2 r3 … ri t
i 1
i
SCtotal Y
r
t r
2 Y..2
Suma de cuadrados para el total
i 1 j 1
ij t
i 1
i
Y
t
2
Ejemplo:
28
Métodos Estadísticos para la Investigación experimental
% Conservante
Repetición 0.01 0.02 0.03 0.04
1 20 17 32 28
2 22 19 30 25
3 26 20 28 23
4 25 - - 26
5 21 - - -
6 23 - - -
Total 137 56 90 102 385
ri 6 3 3 4 16
Yij i ij
Análisis de varianza
H 0 : i 0
H a : i 0 ( No todos son iguales )
Cálculos:
262.93
( 385 ) 2
SC total = 202 + 222 + ... 262 -
16
210.44
137 2 562 902 1022 ( 385 ) 2
SC trat = + + + -
6 3 3 4 16
SC error = SC total - SC trat = 52.49
29
Elías Alberto Torres Armas, Lic. Ms. C.
Observe que Fc>Ft tanto para 5% (F0.05=3.49) como para 1% (F0.01=5.95), lo que
significa que al menos uno de los tratamientos es (*) significativo y/o (**) altamente
significativo
Yij i ij
30
Métodos Estadísticos para la Investigación experimental
2. Linealidad: Las relaciones entre los efectos del modelo son lineales
3. Normalidad: Los errores del modelo deben tener una distribución normal con
media µi y varianza 2
4. Independencia: Los resultados obtenidos en el experimento son independientes
entre si
5. Homogeneidad de varianzas: Las diferentes poblaciones generadas por la
aplicación de los diferentes tratamientos tienen varianzas iguales ( 2)
Análisis de varianza
H 0 : i 0 H 0 : i 0
Hipótesis:
Tabla 3.5. Cuadro de análisis de varianza para el diseño completo al azar con igual
número de repeticiones por tratamiento
Fuente de Suma de Grados de Cuadrados Fc
Variación Cuadrados Libertad Medios
Tratamiento SC tratamiento t-1 CM tratamiento CM tratamiento/CME
Error SC error t(r-1) CME
Total SC total rt-1
SCtotal Y
Calculo de las sumas de cuadrados
t r
Y..2 2
Suma de cuadrados para el total
i 1 j 1
ij
tr
Y
t
2
31
Elías Alberto Torres Armas, Lic. Ms. C.
Ejemplo:
Incremen to en peso de ganado porcino
20
15
10
1 2 3 4
32
Métodos Estadísticos para la Investigación experimental
Del gráfico interactivo: diagrama de cajas y bigotes, por simple inspección se puede
mencionar que no hay diferencia entre los niveles del factor, es decir entre los distintos
porcentajes de concentrado de maíz amarillo duro, aun cuando en las dietas B y C se
observen ganancias más altas. La dieta C se encuentra concentrado respecto a la media,
pero tiene valores anómalos, mediciones que afectan a la misma, así como la dieta D.
Obsérvese que en el diseño está presente cada uno de los siguientes elementos:
Yij i ij
Para i = 1, 2, 3,..., 4 tratamientos t=4, j = 1,2,3,..... 5 observaciones o repeticiones
r=5
Análisis de Varianza
H 0 : i 0
ó
33
Elías Alberto Torres Armas, Lic. Ms. C.
Y
Suma de cuadrados para tratamientos
t
SCtratamiento i 1
560.40
i.
r tr 5 4(5)
Observe que Fc<Ft tanto para 5% (F0.05 =3.24) como para 1%, (F0.01 =5.29) lo que
significa que no existe al menos uno de los tratamientos es significativo y/o altamente
significativo, por tanto, se acepta H0, es decir no hay diferencia entre los incrementos
promedio de peso del ganado porcino por efecto de las distintas dietas alimenticias de
maíz amarillo duro
34
Métodos Estadísticos para la Investigación experimental
Decisión
Aceptamos Ho porque Fc<Ft tanto para 5% (F0.05 =3.24) como para 1%, (F0.01 =5.29) ó
(p-valor=0,4202>0,05 y p-valor= 0,4202>0,01).
Conclusión
No existe evidencia suficiente para afirmar de que por lo menos uma de lãs dietas
alimentícias sea diferente de las demás.
Estadísticos descriptivos
Aun cuando la prueba F del análisis de varianza sea o no significativa, las Pruebas post
hoc (posterior al análisis de varianza), Duncan o Tukey se podrán aplicar para las
comparaciones múltiples de promedios de los tratamientos. Estas pruebas se evaluaran
más adelante.
2. Diseño completamente al azar con más de una observación por unidad experimental
2.1. Diseño completo al azar con sub-muestra con igual número de repeticiones e
igual número de unidades en la muestra
Cuando se tiene en cada unidad experimental varias observaciones. Un DCA con sub-
muestreo e igual número de subunidades por unidad experimental (u.e), puede ser usado
cuando se demandan unidades experimentales muy grandes debido a ello es posible dividirlas
en subunidades y ser estudiadas a partir de muestras pequeñas. También puede ser usado
cuando se presentan experimentos donde es muy tedioso tomar toda la unidad experimental,
siendo por esto, necesario sacar subunidades de cada unidad. Se debe tener claro que en éste
tipo de diseños existen dos tipos de análisis: Uno referente a las unidades y el otro referente
35
Elías Alberto Torres Armas, Lic. Ms. C.
Yijk i ij ijk
i 1,2,3,..., t j 1,2,3,..., r k 1,2,3,..., s
Yijk : Observación de la variable respuesta asociado a la k-ésimo sub-unidad experimental, j-
ijk : Efecto del k-ésimo sub-unidad experimental j-esimo unidad experimental del i-ésimo
experimental del i-ésimo tratamiento
tratamiento.
Hipótesis
Nivel de significación:
Decisión.
Para la hipótesis de tratamientos: Rechazar Ho: si Fc > F(gl tratamient o , glerror ) de lo contrario
aceptar.
Conclusión.
36
Métodos Estadísticos para la Investigación experimental
Y 2
Tyy
i ..
i Y...2
Suma de cuadrados de tratamientos
Y Y
rs rst
2 2
E yy
ij . i ..
i j
Suma de cuadrados del error experimental i
Y
s rs
S yy Y
2
ij .
Suma de cuadrados de sub-muestreo 2
ijk
i j
Wyy Yijk2
i j k s
Y...2
Suma de cuadrados del total
i j k rst
Ejemplo:
El cuadro siguiente muestra el análisis químico de tres variedades de pastos, donde se evaluó
el contenido de Mg en ppm, se tomó lecturas en duplicado para cada unidad experimental.
Realizar el análisis de varianza y ver si existe diferencia estadística entre las concentraciones
de Mg de los pastos en estudio.
Tyy 70.88
rs rst 4(2) 4(2)(3)
Y Y
Suma de cuadrados del error experimental
E yy 1.38
ij . i ..
i j i
s rs 2 4(2)
37
Elías Alberto Torres Armas, Lic. Ms. C.
Y
Suma de cuadrados de sub-muestreo
S yy Yijk2
6.82 8.9 2 16.12 14.82
2
i j k s 2
74.38
Y2 126.302
i j k rst 4(2)(3)
Decisión.
Conclusión.
2.2. Diseño completo al azar con sub-muestra con diferente número de repeticiones
e igual número de unidades en la muestra
Yijk i ij ijk
Donde : i 1,2,3,..., t j 1,2,3,..., ni k 1,2,3,..., nij
38
Métodos Estadísticos para la Investigación experimental
Tabla 3.9. Esquema para el registro de datos de un experimento con Diseño completo al
azar con sub-muestra con diferente número de repeticiones e igual número de unidades
en la muestra
TRATAMIENTO
Observación T1 Ti Tt
Y111 Yi11 Y1t1
Y112 Yi12 Y1t2
1 Y11. Yi1. Y1t.
Y121 Yi21 Y1t1
Y122 Yi22 Y1t2
2 Y12. Yi2. Y1t.
Y131 Yi31 Y1t1
Y132 Yi32 Y1t2
3 Y13. Yi3. Y1t.
. . .
. . Y ijk .
. . . .
.
Y1j. Yij. .
. . .
. . .
. . .
R . . .
TOTAL Y1.. Yi.. . Y…
Número de repeticiones n1.. ni.. . n
Número de unidades de sub-muestra n12. nij. .
Tabla 3.10. Esquema para el registro de datos de un experimento con Diseño completo al azar
con sub-muestra con diferente número de repeticiones e igual número de unidades en la
muestra
Tratamiento Repeticiones Observaciones de la Yij. nij. Yi.. ni.. Y
i ..
(i) (j) muestra (k)
1 1 …
2 …
3 …
4 …
2 1 …
2 …
3 …
3 1 …
2 …
. . …
. . …
…
Y
. .
Y…=
...
39
Elías Alberto Torres Armas, Lic. Ms. C.
: Es una constante
ij :
Están normalmente distribuidas con media cero y desviación estándar
ijk :
Están normalmente distribuidas con media cero y desviación estándar
Hipótesis
H o : i 0 (i 1,..., t )
H a : i 0
T1 = T2 = T3 =... = Tt
T1 T2 T3 ... Tt para i=1, 2, 3, ..., t tratamientos
Nivel de significación.
(n
Tratamiento Tyy t-1 T T/E
1)
t
i 1
i
(n
Error Eyy E E/S
1)
t ni
i 1 j 1
ij
Error de sub-muestreo Syy S
Total Wyy n-1 W
Decisión.
F(gl tratamient o , glerror )
Para la hipótesis de tratamientos: Rechazar Ho: si Fc > de lo contrario
aceptar
Conclusión.
Y
Cálculo de la suma de cuadrados
2
Tyy
i
i ..
Y...2
Suma de cuadrados de tratamientos
Y Y
ni.. n
2 2
E yy
ij . i ..
i j
Suma de cuadrados del error experimental i
Y
nij . ni..
S yy Yijk2
2
ij .
Suma de cuadrados de sub-muestreo i j
i j k nij .
40
Métodos Estadísticos para la Investigación experimental
Wyy Yijk2
Y...2
Suma de cuadrados del total
n
n ni..
i j k
t
i 1
Ejemplo:
Yijk i ij ijk
Donde :
i 3 tratamient os j 4, 3, 2 (ni ) repeticion es por tratamient o
k 2 unidades de la muestra
: Efecto de la media
unidad del sub-muestreo.
Hipótesis
41
Elías Alberto Torres Armas, Lic. Ms. C.
Ho: i 0 (i 1,..., t )
Ha: i 0
T1 = T 2 = T3
T1 T2 T3 para i=1, 2, 3 tratamientos t=3
Nivel de significación: 0,05
(n 1) =(4-1)+(3-1)+(2-1)=6
t
n1=4, n2=3, n3=2
i 1
i
(n 1) = (2-1)+(2-1)+(2-1)+(2-1)+(2-1)+(2-1)+(2-1)+(2-1)+ (2-1)=9
t ni
i 1 j 1
ij
n ni.. =8+6+4=18
nij=2 para todo i, j
t
n1..=8 n2..=6 n3..=4
i 1
Y
Suma de cuadrados de tratamientos
2
Y Y
Suma de cuadrados del error experimento
(6,8) 2 (7,1) 2 (7,8) 2 (7,7) 2 (8,9) 2 (9,0) 2 (8,9) 2 (16,1) 2 (15,9) 2
2 2
E yy 483,76
ij . i ..
i j i
ni j . ni.. 2
484,41 483,76 0,35
Y
Suma de cuadrados del error de sub-muestreo
S yy Yijk2
2
ni j .
485,70 484,41 1,59
i j k
Wyy Yijk2 ... (3,3)2 (3,5)2 (3,5)2 (3,6)2 (4,1)2 ... (8,0)2 432,18 53,52
Suma de cuadrados del total
Y2
i j k n
Análisis de varianza (ANVA)
Decisión.
Para la hipótesis de tratamientos: Rechazar Ho: si Fc > F(gl tratamient o , glerror ) de lo contrario
aceptar. Rechazar H0 porque Fc=429,38> F(2;6)0,05 = 5,14
Conclusión.
42
Métodos Estadísticos para la Investigación experimental
Por lo menos existe una diferencia significativa entre dos promedios atribuibles al efecto del
tratamiento después de separar el efecto de la sub-muestra.
2.3. Diseño completo al azar con sub-muestra con diferente número de repeticiones y
diferente número de unidades en la muestra
: Es una constante
se deberá cumplir también los siguientes supuestos:
H o : i 0 (i 1,..., t )
Hipótesis
H a : i 0
T1 = T2 = T3 =... = Tt
T1 T2 T3 ... Tt
Nivel de significación.
para i=1, 2, 3, ..., t tratamientos
(n
Tratamiento Tyy t-1 T T/E
1)
t
i 1
i
(n
Error Eyy E E/S
1)
t ni
i 1 j 1
ij
Error de sub-muestreo Syy S
Total Wyy n-1 W
Decisión.
F(gl tratamient o , glerror )
Para la hipótesis de tratamientos: Rechazar Ho: si Fc > de lo contrario
aceptar
Conclusión.
43
Elías Alberto Torres Armas, Lic. Ms. C.
Y
Cálculo de la suma de cuadrados
2
Tyy
i
i ..
Y...2
Suma de cuadrados de tratamientos
Y Y
ni.. n
2 2
E yy
ij . i ..
i j
Suma de cuadrados del error experimental i
Y
nij . ni..
S yy Yijk2
2
ij .
Suma de cuadrados de sub-muestreo i j
nij .
Wyy Yijk2
i j k
Y...2
Suma de cuadrados del total
n
n ni..
i j k
t
i 1
Ejemplo:
Tabla 3.14. Cantidad de azúcar no convertida en el substrato que sigue a una fermentación de 24
horas debida a dos diferentes microorganismos
Tratamiento Repeticiones Observaciones de la Yij. nij. Yi.. ni.. Y
i ..
(i) (j) muestra (k)
1 1 5,6 5,7 11,3 2
2 5,0 5,0 5,1 15,1 3
3 5,4 5,4 5,4 5,5 5,4 27,1 5
4 5,3 5,5 10,8 2 64,3 4
2 1 7,6 7,6 7,8 23,0 3
2 7,4 7,0 7,2 21,6 3
30,0 4 74,6 3
Y
3 7,5 7,6 7,5 7,4
Y…=138,9
...
Yijk i ij ijk
44
Métodos Estadísticos para la Investigación experimental
: Efecto de la media
(unidad experimental) y k-ésima unidad del sub-muestreo.
Hipótesis
Ho: i 0 (i 1,..., t )
Ha: i 0
T1 = T 2
T1 T2 para i=1, 2 tratamientos t=2
(n 1) =(4-1)+(3-1)=5
t
t=2r=7 m=22 n1=4, n2=3
i 1
i
(n 1) = (2-1)+(3-1)+(5-1)+(2-1)+(3-1)+(3-1)+(4-1)=15
t ni
i 1 j 1
ij
Y 2
Y 2
Y 2
E yy 901,0568
ij .
n
i ..
i j i (11,3) 2 (15,1) 2 (27,1) 2 (10,8) 2 (23,0) 2 (21,6) 2 (30,0) 2
ni
ni j . 2 3 5 2 3 3 4
j 1
i ..
Wyy Yijk2 (5,6) 2 (5,7) 2 (5,0) 2 (5,0) 2 (5,1) 2 ... (7,4) 2 876,9641
Y...2
n
902,07 876,9641 25,0059
i j k
45
Elías Alberto Torres Armas, Lic. Ms. C.
Decisión.
Para la hipótesis de tratamientos: Rechazar Ho: si Fc > F(gl tratamient o , glerror ) de lo contrario
aceptar. Rechazar H0 porque Fc=142,22>F(1;5)0,05 =6.61
Conclusión.
Por lo menos existe una diferencia significativa entre dos promedios atribuibles al efecto del
microorganismo.
Describir el modelo lineal aditivo del diseño en términos del enunciado.. Indique los
principios básicos del modelo. Realice el Análisis de Variancia y de sus conclusiones
a un nivel de significación del 5%
2.4.2. Con la finalidad de estudiar el efecto de 5 raciones para cerdos, se llevó a cabo un
experimento conducido en D.C.A. Los resultados del incremento de peso (en Kg.)
al final del experimento se presentan a continuación:
Observaciones. RACIONES (i)
(j) R1 R2 R3
1 4.228 4.529 4.994
2 4.330 4.956 4.373
3 3.791 4.160 5.642
4 4.008 4.650 5.124
5 3.910 3.891 4.562
46
Métodos Estadísticos para la Investigación experimental
A B C D E
60 ºC 65 º C 70 º C 75 ºC 78 ºC
TOTAL 9,243 9,177 9,190 9,076 7,880
PROMEDIO 1,027 1,020 1,021 1,008 0,876
REPETICION 9 9 9 9 9
ANVA
F.V GL SC CM FC
Tratamientos 4 0,150 0,037 0,00371
Error 40 403,580 10,090
Total 44 403,730
47
Elías Alberto Torres Armas, Lic. Ms. C.
DIETA
Observaciones
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
65 68 63
64
Total 244 330 340 366 1280
Promedio 61 66 68 61 64
Repeticiones 4 5 5 6 20
DIETA
Observaciones
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
Total 244 265 272 239 1020
Promedio 61 66.25 68 59.75 63.75
Desviación estándar 1.8257 3.5940 2.1602 2.6300
Repeticiones 4 4 4 4 16
48
Métodos Estadísticos para la Investigación experimental
Tabla 3.16. Peso final de los cerdos a tres tratamientos con diferentes niveles de energía
Tratamiento (i) Repetición (j) Muestras (k) Yij. nij. Yi.. ni..
A 1 70 90 160 2 600 8
2 60 90 90 240 3
3 50 60 90 200 3
B 4 100 120 220 2 430 5
5 80 70 60 210 3
C 6 50 40 50 140 3 240 5
7 50 50 100 2
49
CAPITULO IV
El rechazo de la hipótesis nula (H0) en la tabla del análisis de varianza (ANVA) del diseño, nos
indica que existe diferencia significativa (o altamente significativa) entre los tratamientos en
estudio, sin embargo no nos informa en qué tratamiento se da la mayor diferencia y en última
instancia cuál es el tratamiento óptimo en función de la naturaleza del problema (máx. ó min.).
En muchos experimentos entonces, en el planteamiento existirá específicamente el interés en
determinar los mejores tratamientos o en el tratamiento óptimo. Para solucionar el problema se
utiliza los métodos de comparaciones múltiples, entre los cuales tenemos: Prueba t-Student,
Prueba de la diferencia límite significativa, Prueba Duncan, Prueba Tukey, Prueba SHEFFE,
Prueba Dunnet, Entre otras como las de contrastes ortogonales, Bonferroni, Neuman Keuls, etc.
Estas pruebas se realizan posterior al análisis de varianza (ANVA).
1. Prueba t-student
Se usa para comparar dos medias poblacionales, para su análisis se debe tener en cuenta las
siguientes restricciones:
a. Las comparaciones a estudiar deberán ser seleccionadas antes de cualquier análisis de datos.
b. La prueba F del ANVA debe ser SIGNIFICATIVA
PROCEDIMIENTO:
1. Hipótesis
H0: µi=µj H0: µi=µj H0: µi=µj
H0: µi≠µj H0: µi>µj H0: µi<µj
2. Nivel se significación:
( xi x j ) ( i j )
3. Estadística de prueba
tc t ( g lerro r )
s xi x j
Donde :
s xi x j si ri r j
1 1
CME ( )
ri rj
s xi x j si ri r j
2CME
4. Región crítica
5. Decisión: Rechazar H0 si tc cae en región de rechazo ó
Rechazar Ho si:
xi x j DLS, Dos colas
xi x j DLS, Una cola derecha
xi x j DLS, Una cola izquierda
6. Conclusión.
Métodos Estadísticos para la Investigación experimental
Donde :
s xi x j si ri r j
1 1
CME ( )
ri rj
s xi x j si ri r j
2CME
r
4. Decisión:
Para dos colas
Si | xi x j |≥DLS, entonces rechazar H0
Si | x i x j |<DLS, entonces aceptar H0
Para una cola derecha
Si xi x j ≥DLS, entonces rechazar H0
Si x i x j <DLS, entonces aceptar H0
Para una cola izquierda
Si xi x j ≤DLS, entonces rechazar H0
Si x i x j >DLS, entonces aceptar H0
5. Conclusión.
EJERCICIO: Se desea antes de realizar el experimento, planear la comparación entre las dietas
alimenticias 3 y 5 para aumento de peso en pollos a los 28 días de edad; se piensa que la dieta 5
genera mayores pesos que la dieta 3: Los datos son los siguientes:
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T3 T4 T5
Promedio 1.241 1.258 1.265 1.273 1.308
Repetición 4 4 4 4 4
CUADRO N° 2: ANVA para el aumento de peso del pollo a los 28 dias de edad
F.de V GL SC CM Fc Ftab Sig
Tratamientos 4 0.01 0.0025 11.74 4.77 **
Error 15 0.0032 0.000213
Total 19 0.0132
51
Elías Alberto Torres Armas, Lic. Ms. C.
3. Prueba Duncan
Se llama también t-Student modificada, se realiza posterior al ANVA; se usa para efectuar
comparaciones múltiples entre dos medias de tratamientos del experimento. Con t tratamientos
se realiza t(t-1)/2 comparaciones posibles de promedios de tratamientos. La prueba de igualdad
de tratamientos (F en el ANVA) puede ser o no significativa. Cuando el número de repeticiones
es igual en los tratamientos, los cálculos son más precisos que cuando se tiene diferente número
de repeticiones por tratamiento. Tiene el inconveniente cuando se tiene un alto número de
tratamientos el nivel de significación remodifica en función a ellos.
PROCEDIMIENTO:
1. Hipótesis
H0: µi=µj
H0: µi≠µj
2. Nivel se significación:
Del ANVA tomamos CME y us grados de libertad aun cuando la H0 haya sido
aceptada, y calculamos:
s xi x j ( ) si ri r j
CME 1 1
2 ri rj
s xi x j si ri r j
CME
r
De la tabla Duncan obtenemos los AESD (amplitud estudentizado significativa de
Duncan), rangos para dado para 5% y 1% con grados de libertad del error y para
ALS D AES D (s xi x j )
2,3,4,…,t tratamientos (t-1) rangos
Calculamos ahora:
4. Decisión:
xi x j
Si | |≤ALSD, entonces aceptar H0
x x
Si | i j |≥ALSD, entonces rechazar H0
5. Comparaciones y significación
Comparaciones x x p ALSD Decisión Sig
H0 d=| i j |
6. Representación de los resultados: Por segmentos de recta, literal, cuadro de doble entrada,
por grupos homogéneos.
7. Conclusión.
Tratamientos A B C D
Promedios 71.5 85 76 62
r=6 t=4 CME=103.075 g.lERROR=6.4-4=20
Realizar la prueba Duncan para todas las comparaciones posibles.
52
Métodos Estadísticos para la Investigación experimental
1. Hipótesis
H0: µi=µj
H0: µi≠µj
2. Nivel se significación: =1%, ó 5%
Tratamientos B C A D
Del ANVA tomamos CME y sus grados de libertad aun cuando la H0 haya sido
Promedios 85 76 71.5 62
aceptada.
Calculamos:
CME=103.075 g.lERROR=6.4-4=20
s xi x j ( ) si ri r j
CME 1 1
2 ri r j
s xi x j si ri r j s xi x j 4.14
CME 103.075
r 6
De la tabla Duncan obtenemos los AESD (amplitud estudentizado significativa de
Duncan), rangos para dado para 5% y 1% con grados de libertad del error y para
2,3,4,…,t tratamientos (t-1) rangos
t 2 3 4
Tratamientos B C A D
53
Elías Alberto Torres Armas, Lic. Ms. C.
B X
C XX
A XX
D X
7. Conclusión. Se distinguen tres grupos de tratamientos con resultados similares. Un primer
grupo B con C con valores mayores, un segundo grupo C con A con valores intermedios
y un tercer grupo A con D con valores menores. Se recomienda el tratamiento B por
ocasionar mayor rendimiento en la variable respuesta, también podría recomendarse en
tratamiento C.
4. Prueba de Tukey
Es menos rigurosa que al prueba Duncan por tal motivo el nivel de significación debe ser más
amplio y las comparaciones que realmente son significativas, ésta prueba las podría declarar no
significativas. El nivel de significación se mantiene constante. F calculado en el ANVA puede
ser significativa o no. Es más precisa cuando los tratamientos tienen igual número de
repeticiones. No es necesario ordenar los promedios de tratamientos, sin embargo ello es muy
usual en la práctica. Utiliza un solo valor tabular para calcular la ALST (amplitud limite
significativa de Tukey)
PROCEDIMIENTO:
1. Hipótesis
H0: µi=µj i j
H0: µi≠µj
2. Nivel se significación:
Del ANVA tomamos CME y sus grados de libertad aún cuando la H 0 haya sido
aceptada. Calculamos:
s xi x j ( si ri r j
CME 1 1
)
2 ri rj
s xi x j si ri r j
CME
r
De la tabla Tukey obtenemos los AEST (amplitud estudentizado significativa de
Tukey) y tambén se obtiene de la tabla de Student_Neuman-Keul, para un nivel de
significación dado para 5% y 1%, con grados de libertad del error y para un solo
54
Métodos Estadísticos para la Investigación experimental
x x x x
4. Decisión: Si | i j |≤ALST, entonces aceptar H0. Si | i j |≥ALST, entonces rechazar
H0
5. Comparaciones y significación
Comparaciones xi x j ALST Decisión Sig
H0 d=| |
6. Representación de los resultados: Por segmentos de recta, literal, cuadro de doble entrada,
por grupos homogéneos.
7. Conclusión.
EJERCICIO: Se desea saber que tratamiento permite una mayor ganancia en el peso en pollos a
los 28 días de edad, mediante la prueba Tukey para comparaciones múltiples; se tiene los datos
son los siguientes:
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T3 T4 T5
Promedio 1.241 1.258 1.273 1.308 1.265
Repetición 4 4 4 4 4
CUADRO N° 2: ANVA para el aumento de peso del pollo a los 28 dias de edad
F.de V GL SC CM Fc Ftab Sig
Tratamientos 4 0.01 0.0025 11.74 4.77 **
Error 15 0.0032 0.000213
Total 19 0.0132
SOLUCIÓN:
1. Hipótesis
H0: µi=µj i j
H0: µi≠µj
2. Nivel se significación: =5%
Del ANVA tomamos CME y sus grados de libertad aún cuando la H 0 haya sido
Repetición 4 4 4 4 4
aceptada. Calculamos:
s xi x j ( ) si ri r j
CME 1 1
2 ri r j
s xi x j si ri r j s xi x j 0.0073
CME 0.000213
r 4
De la tabla Tukey obtenemos los AEST (amplitud estudentizado significativa de
Tukey) y tambén se obtiene de la tabla de Student_Neuman-Keul, para un nivel de
55
Elías Alberto Torres Armas, Lic. Ms. C.
significación dado para 5% y 1%, con grados de libertad del error y para un solo
valor de p (p: número de tratamientos propuestos en el experimento)
=5%, grados de libertad del error = 15 p=5 tratamientos
Tratamientos T1 T2 T5 T3 T4
Literal
Tratamientos grupos homogéneos.
T1 a
T2 ab
T5 abc
T3 bc
T1 T2 T5 T3 T4
T1 0.017 0.024 0.032* 0.067 *
T2 0.007 0.015 0.050 *
T5 0.008 0.043 *
T3 0.035 *
T1 X
T2 XX
T5 XXX
T3 XX
T4
56
Métodos Estadísticos para la Investigación experimental
7. Conclusión: En base a los resultados experimentales podemos decir que existen tres grupos
con resultados de diferencia de tratamientos similares (homogéneos). El grupo de los de
menor valor (el primero) de éste quien posee el menor rendimiento (más bajo) es el
tratamiento T1. El segundo grupo de mayor valor, de estos, el que posee rendimientos
medios superiores es el tratamiento T4. Por tanto se recomienda el tratamiento T4, puesto
que da un mayor incremento en el peso a los 28 días de edad en la alimentación de los pollos
para carne.
5. Prueba de Dunnett
Se usa cuando existe tratamiento testigo y se desea comparar éste testigo con los demás
tratamientos. La prueba F del ANVA debe ser significativa. Las comparaciones son planeadas
antes de realizar el experimento.
PROCEDIMIENTO:
1. Hipótesis
H0: µk=µj k j
H0: µk≠µj k: es la ubicación del tratamiento testigo
2. Nivel se significación:
Del ANVA tomamos CME y sus grados de libertad aun cuando la H0 haya sido
3. Estadística de prueba
Calculamos:
aceptada.
s xk x j CME ( ) si rk rj
1 1
rk rj
s xk x j si rk rj
2CME
r
De la tabla Dunnett obtenemos los t(DN), para un nivel de significación dado para
5% y 1%, con grados de libertad del error y para un valor de p=t-1 (p: número de
6. Representación de los resultados: Por segmentos de recta, literal, cuadro de doble entrada,
por grupos homogéneos.
7. Conclusión.
57
Elías Alberto Torres Armas, Lic. Ms. C.
EJERCICIO: Se desea saber que tratamiento permite una mayor ganancia en el peso en pollos a
los 28 días de edad, mediante la prueba Dunnett para comparaciones múltiples usando el
tratamiento 1 como testigo; se tiene los datos siguientes:
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T3 T4 T5
Promedio 1.241 1.258 1.273 1.308 1.265
Repetición 4 4 4 4 4
SOLUCIÓN:
1. Hipótesis
H0: µk=µj k j
H0: µk≠µj k: es la ubicación del tratamiento testigo
2. Nivel se significación: =5%
Del ANVA tomamos CME y sus grados de libertad aún cuando la H 0 haya sido
Repetición 4 4 4 4 4
Calculamos:
aceptada.
s xk x j si rk r j
2CME
De la tabla Dunnett obtenemos los t (DN), para un nivel de significación dado para
r
5% y 1%, con grados de libertad del error y para un valor de p=t-1 (p: número de
tratamientos propuestos en el experimento sin incluir el testigo o control)
=5%
Calculamos ahora: ALS ( DN ) (T( DN ) )(s xk x j ) 2.73(0.0103) 0.028119
p=t-1=4 grados de libertad del error = 15 t(DN)=2.73
4. Decisión:
Si | x x |≤ALS(DN), entonces aceptar H0. Si | x x |≥ALS(DN), entonces rechazar H0
k j k j
5. Comparaciones y significación
Comparaciones d=| x x |
k j
ALST Decisión Sig
H0
µ1=µ2 1.258 – 1.241=0.017 < 0.0319 Acepta o
µ1=µ5 1.265 – 1.241=0.024 < 0.0319 Acepta o
µ1=µ3 1.273 – 1.241=0.032 > 0.0319 Rechaza *
µ1=µ4 1.308 – 1.241=0.067 > 0.0319 Rechaza *
58
Métodos Estadísticos para la Investigación experimental
Tratamientos T1 T2 T5 T3 T4
Literal
Se llevó acabo un experimento para evaluar el efecto de 4 dietas alimenticias de concentrado con
diferentes dosis de maíz amarillo duro, en el incremento en peso de ganado porcino, utilizándose
para ello 20 camadas de cerdos de la misma raza, de la misma parición y del mismo día de
nacidos, obteniéndose los siguientes resultados:
B2 A1 C20 C15 D7 C9 B16 A11 B12 D3
D10 B19 A6 C14 D18 B4 A17 D5 A8 C13
A. 20%m.a.d. B. 30%m.a.d. C. 40%m.a.d. D. 50%m.a.d.
Realice el análisis estadístico pertinente y anuncie sus conclusiones para el investigador
59
Elías Alberto Torres Armas, Lic. Ms. C.
15
10
1 2 3 4
Por simple inspección se puede mencionar que no hay diferencia entre los niveles del factor, es
decir entre los distintos porcentajes de concentrado de maíz amarillo duro, aun cuando en las
dietas B y C se observen ganancias más altas. La dieta C se encuentra concentrado respecto a la
media, pero tiene valores anómalos, mediciones que afectan a la misma, así como la dieta D.
Yij i ij
Modelo Lineal Aditivo:
Supuestos básicos modelo estadístico: El modelo estadístico debe cumplir con los siguientes
supuestos:
1. Aditividad: Los efectos del modelo son aditivos
2. Linealidad: Las relaciones entre los efectos del modelo son lineales
3. Normalidad: Los errores del modelo deben tener una distribución normal con media Cero y
varianza 2 .
4. Independencia: Los resultados obtenidos en el experimento son independientes entre si.
5. Homogeneidad de varianzas: Las diferentes poblaciones generadas por la aplicación de los
diferentes tratamientos tienen varianzas iguales ( 2)
60
Métodos Estadísticos para la Investigación experimental
Estadísticos descriptivos
Variable dependiente: Incremento en peso de ganado porcino
Dieta alimenticia de concentrado a diferentes dosis de maíz amarillo duro Media Desv. típ. N
A:20%m.a.d. 8.60 5.941 5
B:30%m.a.d. 10.60 7.403 5
C:40%m.a.d. 14.20 3.962 5
D:50%m.a.d. 8.60 5.857 5
Total 10.50 5.916 20
Análisis de Varianza
MODELO I.- EFECTOS FIJOS
No existe evidencia suficiente para afirmar de que por lo menos uma de lãs dietas alimentícias sea
diferente de las demás.
Pruebas post hoc. Usando Duncan o Tukey, que son dos pruebas en las que la prueba F puede
ser o no significativa.
(I) Dieta alimenticia (J) Dieta alimenticia Interv alo de conf ianza al
de concentrado a de concentrado a Dif erencia 95%.
diferentes dosis de diferentes dosis de entre Límite
maíz amarillo duro maíz amarillo duro medias (I-J) Error típ. Significación Límite inf erior superior
DHS de Tukey A:20%m.a.d. B:30%m.a.d. -2.00 3.743 .949 -12.71 8.71
C:40%m.a.d. -5.60 3.743 .462 -16.31 5.11
D:50%m.a.d. .00 3.743 1.000 -10.71 10.71
B:30%m.a.d. A:20%m.a.d. 2.00 3.743 .949 -8.71 12.71
C:40%m.a.d. -3.60 3.743 .772 -14.31 7.11
D:50%m.a.d. 2.00 3.743 .949 -8.71 12.71
C:40%m.a.d. A:20%m.a.d. 5.60 3.743 .462 -5.11 16.31
B:30%m.a.d. 3.60 3.743 .772 -7.11 14.31
D:50%m.a.d. 5.60 3.743 .462 -5.11 16.31
D:50%m.a.d. A:20%m.a.d. .00 3.743 1.000 -10.71 10.71
B:30%m.a.d. -2.00 3.743 .949 -12.71 8.71
C:40%m.a.d. -5.60 3.743 .462 -16.31 5.11
Basado en las medias observ adas.
61
Elías Alberto Torres Armas, Lic. Ms. C.
Subconjuntos homogéneos
Incremento en peso de ganado porcino
Observese además que los niveles del factor son de naturaleza cuantitativa, es de interés,
conocer la naturaleza de la curva de respuesta al factor en estudio, esto implica realizar un análisis
de regresión, que puede ser lineal, cuadrática, y cúbica. Si los niveles del factor son t=4,
obtenemos t-1=3 componentes: la lineal, cuadrática, cúbica.
No hay evidencia suficiente para rechazar la hipótesis de que el modelo sea lineal, cuadrático o
cúbico.
62
Métodos Estadísticos para la Investigación experimental
Homogeneidad de varianzas
Una salida de statgraphics plus for v.5.1 muestra los siguientes contrastes
Contraste de Varianza
Contraste C de Cochran: 0.391149 P-valor = 0.681973
Contraste de Bartlett: 1.09633 P-valor = 0.721391
Contraste de Hartley: 3.49045
Test de Levene: 0.639354 P-valor = 0.600638
El estadístico mostrado en esta tabla, comprueba la hipótesis nula de que la desviación típica de
INCREPESO dentro de cada uno de los 4 niveles de Dieta, es la misma. De particular interés
están los tres p-valores. Dado que el menor de los p-valores es superior o igual a 0.05, no hay
diferencia estadísticamente significativa entre las desviaciones típicas para un nivel de confianza
del 95.0%.
10
5
Valor Normal esperado
-5
-10
-10 -5 0 5 10
Valor observado
Según el grafico Q-Q plot Normal, los puntos de las observaciones estan alineados respecto a la
recta, lo que significa que existe normalidad de los errores.
Gráfico Q-Q Normal sin tendencia de Residuo para INCREPESO
1
Desviación de Normal
-1
-10 -5 0 5 10
Valor observado
63
Elías Alberto Torres Armas, Lic. Ms. C.
Pruebas de normalidad
Kolmogorov-Smirnov(a) Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Residuo para
INCREPESO .098 20 .200(*) .959 20 .516
CONCLUSION FINAL
Se ha realizado los calculos y analisis de los resultados, se encontró que no hay evasión de
supuestos del diseño DCA, pero en el ANVA encontramos que la razón F es menor que 1 (.995).
La salida del Statgraphics Plus nos presenta la siguiente conclusión: grupos. El F-ratio, que en
este caso es igual a 0.995479, es el cociente de la estimación entre grupos y la estimación dentro
de los grupos. Puesto que el p-valor del test F es superior o igual a 0.05, no hay diferencia
estadísticamente significativa entre las INCREPESO medias de un nivel de Dieta a otro para un
95.0%. Siembargo, estaríamos en el caso presentado por Ostlle: La razon F resulta ser un
número menor que 1. (Ostle, 1986, pp335, 336) τ…es posible (y completamente probable) que el
valor calculado de F resultara menor que la unidad. ¿Cuál debería ser nuestra conclusión ante tal
situación?. Podemos, por supuesto, simplemente decir que F no era significante y de esta manera
la hipótesis no puede ser rechazada. Sin embargo, no es prudente una excusa tan simple del
problema, ya que podría causar que ignorásemos una advertencia tan valiosa. Supongamos, como
puede suceder, que F, con v1 y v2 grados de libertad, en tan pequeña que F’=1/F, con v2 y v1
grados de libertad, es significante. ¿Cuál sería nuestra conclusión en este caso? Parece que debería
rechazarse algo; ¿pero qué? En esta situación, parece razonable rechazar el modelo
estadístico postulado (el modelo utilizado no es el más idóneo). Si el modelo estadístico es
rechazado debido a un valor significante F’, entonces, βcuáles son los pasos que deberán tomarse?
Algunos de ellos son:
1. El procedimiento experimental deberá ser revisado para ver si se satisfacen las diferentes
suposiciones. Por ejemplo, si no se empleó la aleatorización debida, la validez de la
suposición de independencia es dudosa.
2. Si se dispone de suficientes observaciones, la suposición de normalidad podría revisarse
mediante la representación gráfica de los datos, bien sea en una hoja grafica regular o en
una hoja de papel normal.
3. La suposición de varianzas homogéneas deberá ser revisada, pero esto requerirá un gran
número de observaciones dentro de subclases.
4. El fenómeno básico deberá reestudiarse para ver si el modelo lineal supuesto es una
buena aproximación a la verdad de los hechos. Si, como resultado, el modelo supuesto es
rechazado deberá buscarse un nuevo modelo que describa mejor los datos observados y
el fenómeno bajo investigación.
1. Se quiere estudiar la influencia de cuatro tipos de riego en la producción de maíz. Para ello, se
seleccionan parcelas del mismo tamaño y con la misma calidad de terreno, y se prueban los
cuatro tipos de riego, en 6, 8, 9 y 7 parcelas respectivamente. Los datos de producción que se
obtienen son los siguientes:
64
Métodos Estadísticos para la Investigación experimental
a. Realice el ANVA
b. Analizar las diferencias entre pares de medias de tratamientos, usando el método de Duncan
con =0.01.
c. Describir el modelo lineal aditivo del diseño en términos del enunciado
d. Indique los principios básicos del modelo
2 1 2 5 2 1
3 1 1 0 0
1 0 5 1 1
3 1 2 2 1 3
1 0 4 3 3
1 1 3 3 3
4 2 2 3 0 0
3 0 3 0 1
0 1 4 2 1
TOTAL
a. Escriba el modelo lineal aditivo. Plantear las hipótesis del modelo
b. Realice el análisis de varianza correspondiente e intérprete sus resultados.
DESCRIBA LOS TÉRMINOS SIGUIENTES:
c. Factor
d. Niveles del factor
e. Tratamiento
f. Testigo (si lo hubiera)
g. Unidad experimental
h. Variable respuesta
i. Diseño experimental
j. Y conceptualice cada uno de los principios básicos del diseño experimental
k. Modelo estadístico
l. Y conceptualice cada uno de los supuestos básicos del modelo experimental
65
Elías Alberto Torres Armas, Lic. Ms. C.
5. Los datos que se presentan a continuación corresponden al análisis del tiempo de coagulación
(en segundos) de sangre extraída a 20 animales, asignados aleatoriamente a 4 dietas
diferentes, resultado de un experimento llevado en un diseño completamente al azar.
Source DF SS MS F P
Diets (trats) 3 200.52 66.84 8.10 0.002
Error 16 132.03 8.25
Total 19 332.55
Level N Mean
1 5 61.000
2 5 66.000
3 5 68.400
4 5 61.167
a) Al 1% de significación cuál es la conclusión del ANVA
b) Utilizando t-student al 5% probar que el tratamiento 3 es mayor que el 2.
c) Realice la prueba Tukey de comparación múltiple de promedios de los tratamientos
66
Métodos Estadísticos para la Investigación experimental
ANVA
F.V GL SC CM FC FT
Tratamientos 4 0,150 0,037 0,00371 2,021
Error 40 403,580 10,090
Total 44 403,730
a. Al 1% de significación cuál es la conclusión del ANVA
b. Utilizando t-student al 5% probar que el tratamiento A es mayor que el C.
c. Realice la prueba Duncan de comparación múltiple de promedios de los tratamientos
67
Elías Alberto Torres Armas, Lic. Ms. C.
8. Con el objeto de investigar el efecto de la harina del fríjol τcanario” en el sabor de las galletas,
se formularon las siguientes recetas A: Galletas, con 0% de harina de fríjol canario
(TESTIGO), B: Galletas, con 5% de harina de fríjol canario, C: Galletas, con 10% de harina
de fríjol canario, Galletas, con 15% de harina de fríjol canario. Intervinieron 18 panelistas
semi-entrenados, que recibieron una muestra testigo y tres muestras debidamente
codificadas; los panelistas evaluaron las muestras en relación al testigo, según la escala de
comparación múltiple de 9 puntos, donde extremadamente mejor que el testigo (9 puntos),
mucho mejor que el testigo (8 puntos), moderadamente mejor que el testigo (7 puntos),
ligeramente mejor que el testigo (6 puntos), igual que el testigo (5 puntos), ligeramente peor
que el testigo (4 puntos), moderadamente peor que el estigo (3 puntos), mucho peor que el
testigo (2 puntos), extremadamente peor que el testigo (1 puntos). Se indica que los
resultados obtenidos de la evaluación organoléptica, fueron previamente sorteados la
ubicación de las posiciones de las muestras que fueron servidos, los cuales fueron
procesados estadísticamente con el propósito de saber, si la harina de fríjol canario altera el
sabor de las galletas a un nivel del 5% de significación. Con la información del enunciado
anterior, determinar:
9. Sea un experimento con tres tratamientos T 1, T2, y T3, cuyos resultados experimentales se
indican a continuación:
T1 4 6 5 4 9 8 5
T2 10 9 7 10 8
T3 33 5 8 4 5 6 3
Determinar la variabilidad de cada tratamiento
¿Cuáles son los supuestos básicos del modelo lineal aditivo para el DCA que se deben
cumplir para el análisis de varianza? Realizar el ANVA y una prueba de comparaciones
múltiple de tratamientos apropiada
10. Se desea investigar si 4 máquinas alimentadoras (A, B, C, D) en cierta planta están llenando
envases a diferentes niveles de lo normalmente establecido. Las condiciones en las cuales se
lleva a cabo es estudio hacen que se utilice el Diseño completamente al Azar (DCA) para el
análisis de resultados. Por cada repetición se tomaron muestras aleatorias de 10 envases cada
una de la producción de cada máquina y al examinarse se obtuvieron los siguientes datos
estadísticos que expresan el número de envases por muestra, con llenado no conveniente o
fuera de lo normal.
Tratamientos Repeticiones Total
A 4 3 4 5
B 3 4 3 5 4
C 2 2 2
D 6 5 4 5 4 6
Identifique: La variable de respuesta, enuncie el modelo lineal aditivo, y efectúe el ANVA al
=0.05
68
Métodos Estadísticos para la Investigación experimental
1. La variable respuesta
2. Factor(es) y niveles de factor(es)
3. Nombre del diseño utilizado
4. Presente el modelo lineal aditivo y su interpretación de sus componentes en términos del
enunciado.
5. Proponga la Hipótesis de interés y cuadro simbólico ANVA
6. Efectúe el análisis de varianza
7. Mediante la prueba DLS compare T1 y T3
8. Realice la prueba de Tukey.
9. ¿Se justifica el uso de DCA? Explique brevemente.
10. ¿Es conveniente realizar la prueba Dunnett? ¿Por qué?
13. Con la finalidad de estudiar el efecto de 5 raciones para cerdos, se llevó a cabo un
experimento conducido en D.C.A.. Los resultados del incremento de peso (en Kg.) al final
del experimento se presentan a continuación:
69
Elías Alberto Torres Armas, Lic. Ms. C.
Y 554.42461
5 5
2
i 1 j 1
ij
utilice un =0.05
eficiente que la ración 1 en por lo menos 3 Kg. Realice la prueba más conveniente,
14. Un ingeniero está investigando el efecto que tienen cuatro métodos de ensamblaje (A, B, C y
D) sobre el tiempo de ensamblaje de un componente para computadoras. Se selecciona a
cuatro operadores para realizar este estudio con similares habilidades. Los resultados en
minutos se muestran a continuación:
METODO
REP. A B C D
1 5 6 9 7
2 4 7 8 6
3 6 6 10 5
4 4 5 11 8
Si. 0.9574 0.8165 1.2910 1.2910
Yi . 19 24 38 26
a. Presente el modelo aditivo lineal y describa cada uno de sus componentes en términos del
70
Métodos Estadísticos para la Investigación experimental
71
CAPÍTULO V
1. INTRODUCCIÓN
2. CARACTERISTICAS
- Las unidades experimentales se distribuyen en grupos o en bloques bajo el criterio de
homogeneidad dentro de grupos y heterogeneidad entre grupos.
- En cada bloque el número de unidades experimentales es igual al numero de
tratamientos (bloques completos).
- Los tratamientos son asignados aleatoriamente en las unidades experimentales dentro
de cada bloque.
- Los números de bloques, puede ser igual o diferente al numero de tratamientos.
3. VENTAJAS
- En general es más preciso que el diseño completamente al azar
- Es simple y fácil de planificar.
- Las unidades experimentales perdidas no causan mucha dificultad.
- Es flexible con relación al número de tratamientos y repeticiones.
4. DESVENTAJAS
- No es apropiado para un número elevado de tratamientos, debido a que aumenta el
tamaño del bloque y como consecuencia aumenta la variabilidad dentro de cada
bloque y por ende el error experimental.
- Si en la fuente de variabilidad para los bloques no existe diferencias estadísticas, no
hay ganancia en precisión con respecto al diseño completo randomizado, y por el
contrario puede haber perdida por la disminución de los grados de libertad del error.
5. USOS
- Son utilizados en experimentos de campo, laboratorio, etc.
- Se utilizan en cultivos anuales y perennes.
Yij t i j ij
Para i = 1,2,3,..... t tratamientos j= 1,2,3,..... r bloques
Donde:
j
ti = Efecto del i-ésimo tratamiento
= Efecto del j-ésimo bloque
Eij = Efectos aleatorio que pertenece a la Yij observación EE.
Métodos Estadísticos para la Investigación experimental
Para
i = 1,2,3,..... t tratamientos
J = 1,2,3,..... r bloques
CALCULO DE LAS SUMAS DE CUADRADOS
OBTENCIÓN DEL FACTOR DE CORRECCIÓN
C ..
(Total ) 2 Y2
( Número de respuestas( N de panelistas )).( N de tratamient os) B.T
B: Número de bloques
T: Número de tratamientos
S .C.total Yij2 C
SUMA DE CUADRADOS PARA EL TOTAL
t r
i 1 j 1
Y
SUMA DE CUADRADOS PARA TRATAMIENTOS
t
2
SCtratamiento i 1
C
i.
B
Y
SUMA DE CUADRADOS PARA BLOQUES
r
2
SC Panel SCbloques C
j 1
.j
T
SCerror SCTotal SCtratamiento SCbloque
SUMA DE CUADRADOS PARA EL ERROR
Ha : T1 T2 T3 ...... Tt
Ho : T1 = T2 = T3 = ...... = Tt
para i = 1,2,3, ................ , t tratamientos
Ho : 1 = 2 = 3 = .... = r
b. Plantear la hipótesis para bloques
EJERCICIO. UN DBCA.
73
Elías Alberto Torres Armas, Lic. Ms. C.
74
Métodos Estadísticos para la Investigación experimental
ANVA
Determinación de S y
i y j
0.1645127
CM error 0.48716
=
i y j
Sy
r 18
75
Elías Alberto Torres Armas, Lic. Ms. C.
Regla de decisión:
Si Y i Y j ALS (T ) se acepta Ho
Y i Y j ALS (T ) se rechaza HO
Número de comparaciones posibles: 8(8-1)/2=28
Comparación y significación
u4 u8
Comparación d ALS (T) Acepta/rechaza Signif = 0.05
I – II
u4 u1
0.8333 > 0.717386 *
I – III
u4 u7
1.0000 > 0.717386 *
I – IV
u4 u2
1.4444 > 0.717386 *
I–V
u4 u6
1.5555 > 0.717386 *
I – VI
u4 u3
1.8333 > 0.717386 *
I – VII
u4 u5
2.2778 > 0.717386 *
I – VIII 2.2778 > 0.717386 *
II – III
u8 u2
0.1667 < 0.717386 u8 = u7 n.s
II – IV
u8 u6
0.6111 < 0.717386 n.s
II –V
u8 u3
0.7222 > 0.717386 *
II – VI
u8 u5
1.0000 > 0.717386 *
II – VII 1.4445 > 0.717386 *
II – VIII 1.4445 > 0.717386 u1 = u7 *
III – IV
u1 u6
0.4444 < 0.717386 u1 = u2 n.s
III –V
u1 u3
0.5555 < 0.717386 n.s
III – VI
u1 u5
0.8333 > 0.717386 *
III – VII 1.2775 > 0.717386 *
III –VIII 1.2778 > 0.717386 u7 = u2 *
IV – V
u7 u3
0.1111 < 0.717386 u7 = u6 n.s
IV – VI
u7 u5
0.3889 < 0.717386 n.s
IV – VII 0.8334 > 0.717386 *
IV – VIII 0.8334 > 0.717386 u2 = u6 *
V –VI
u2 u3
0.2778 < 0.717386 u2 = u6 n.s
u2 u5
V-VII 0.7223 > 0.717386 *
V-VIII 0.7223 > 0.717386 *
V –VII 0.4445 < 0.717386 u6 = u3 n.s
VI-VIII 0.4445 < 0.717386 u6 = u5 n.s
VI –VIII 0 < 0.717386 u3 = u5 n.s
Tratamiento T4 T8 T1 T7 T2 T6 T3 T5
76
Métodos Estadísticos para la Investigación experimental
b) Literalmente.
Tratamiento T4 T8 T1 T7 T2 T6 T3 T5
A A A
B B B
C C C
D D
E E E
F F
c) Utilizando un cuadro de doble entrada:
T4 T8 T1 T7 T2 T6 T3 T5
T4 - 0.8333 * 1.000 * 1.444 * 1.556 * 1.833 * 2.278 * 2.278 *
T8 - 0.167 0.611 0.722 * 1.000 * 1.4445 * 1.4445 *
T1 - 0.444 0.556 0.833 * 1.278 * 1.2778 *
T7 - 0.111 0.389 0.833 * 0.833 *
T2 - 0.278 0.722 * 0.722 *
T6 - 0.445 0.445
T3 - 0
T5 -
Conclusiones.
Podemos afirmar a un nivel de 5% de probabilidad, que el encurtido T 3 y T5, son mejores que
los otros tratamientos, alcanzando el calificativo por los panelistas de gusten moderadamente.
1) Se quiere saber el grado de aceptación entre los panelistas del producto en evaluación
(yogurt ) los cuales dan la siguiente puntuación.
Bloque T1 T2 T3 TOTAL
1 8 8 9 25
2 10 9 8 27
3 7 10 6 23
4 8 9 8 25
5 9 8 9 26
6 9 7 7 23
7 8 8 6 22
8 7 7 8 22
9 8 10 9 27
10 9 9 9 27
TOTAL 83 85 79 247
Hipótesis:
Ha : T1 T2 T3 T4
Ho : T1= T2 = T3 = T4
77
Elías Alberto Torres Armas, Lic. Ms. C.
α= 5% C = ( 247 )2 = 2033.63
30
total
Cálculos:
SC Bloque = -C
= 43.37
Grados
Fuente de Suma de de Promedio de
variacion cuadrados libertad los cuadrados F Significancia
Bloque 12.70 9 1.41 0.88 ns
Tratamiento 1.87 2 0.935 0.58 0 ns
Error 28.80 18 1.6
Total 43.37 29
Decisión: Aceptamos Ho ya que el valor del f calculado es menor que el valor encontrado en la
tabla por lo tanto esta en el rango de significan cía.
Conclusión: No existe diferencia significativa entre los bloques ni tratamientos. Realice la
prueba Duncan de comparaciones múltiples
78
Métodos Estadísticos para la Investigación experimental
9 B 4 A 6 C 4 14
10 C 5 A 7 B 4 16
TOTAL 51 51 53 155
Ha : T1 T2 T3 T4
Hipótesis: Ho : T1= T2 = T3 = T4
Decisión: Aceptamos Ho ya que el valor del f calculado es menor que el valor encontrado en
la tabla por lo tanto esta en el rango de significan cía.
79
Elías Alberto Torres Armas, Lic. Ms. C.
3 X 5 3 4 12
4 4 3 4 5 16
TOTAL 10 14 13 16 53
Ha : T1 T2 T3 T4
Hipótesis: Ho : T1= T2 = T3 = T4
ANÁLISIS DE VARIANZA
Origen de las Grados de Promedio de los
variaciones Suma de cuadrados libertad cuadrados F Significancia
Bloque 1.20 3 0.4 0.303 O
Tratamiento 4.093 3 1.364 1.03 O
Error 10.5591 8 1.32
Total 15.8521 14
Decisión: Aceptamos Ho ya que el valor del f calculado es menor que el valor encontrado en
la tabla por lo tanto esta en el rango de significan cía.
Doce personas excedidas en pesos, participan en un estudio para comparar, tres regimenes
para reducir el peso, para lo cual utilizamos un producto con bajas calorías. Los sujetos se
distribuyeron en cuatro grupos de acuerdo a su peso inicial y cada uno de los tres sujetos de
cada grupo fue asignado aleatoriamente a uno de los tres regimenes reductores. Al final del
experimento se registraron las perdidas de peso en kilogramos.
80
Métodos Estadísticos para la Investigación experimental
Yi 59 51 50
Promedio Yi 14.75 2.75 12.5 Y.. = 160
A. HIPOTESIS
H0 : T1 =T2 = T3 = T4 = T5
Ha : T1 = T2 = T3 = T4 = T5
ANVA
FV GL SC CM Fc Ft Significancia
Bloques (peso 3 44.667 14.889 23.3065 9.73 **
inicial)
Tratamiento 2 12.167 6.0835 9.5228 10.92 Ns
(regimenes)
Error 6 3.833 0.6388
Total 11 60.667
C. CONCLUSION
En conclusión no hay evidencia estadística suficiente como para rechazar la hipótesis.
No existen diferencias significativas entre los efectos de los regimenes aplicados para
reducir de peso.
D. PRUEBA DE COMPARACIONES.
PRUEBA DE TUKEY
CME =0.6388
r = 4 AES(t)= 6.33
ALST AEST
CME
r
81
Elías Alberto Torres Armas, Lic. Ms. C.
ALS(T) = 2.5296
3. Comparación de los promedios y significación
Diferencias Conclusiones
ALS(D)
14.75 – 12.75 = 2
2.5296 Se acepta la Hp
14.75 – 12.50 = 2.25
2.5296 Se acepta la Hp
12.75 – 12.50 = 0.25 2.5296 Se acepta la Hp
4. CONCLUSIÓN
En conclusión no existen diferencias significativas entre ninguno de los efectos de los
regímenes aplicados para reducir el peso.
Para esto intervienen 18 panelistas entrenado que recibieron una muestra testigo de (40 0Brix )
y 3 muestras debidamente codificadas en relación al testigo, los panelistas evaluaron las
muestras según la escala de comparación múltiple de 9 puntos, donde: Escala:
82
Métodos Estadísticos para la Investigación experimental
Total 69 86 74 86 315
Se desea saber qué cantidad de grados Brix da un mejor sabor a la fruta confitada de mango a
un nivel de 5% de probabilidad. Para calcular el análisis de varianza, confeccionar el siguiente
cuadro auxiliar ordenados en función a los tratamientos.
B. HIPOTESIS
H0 = TA = TB = TC = TD
Ha = TA ≠ TB ≠ TC ≠ TD
CUADRO N° 3. ANVA
FV GL SC CM Fc Significancia
Tratamiento 3 29.815 9.9383 11.142 * *
Panelistas 17 47.875 2.816
Posición 5 12.375 4.125
Error 48 42.81 0.892
83
Elías Alberto Torres Armas, Lic. Ms. C.
Total 71 132.875
*: Existe diferencia significativa con una seguridad del 95% de probabilidad.
* *: Existe diferencia altamente significativa con una seguridad del 99% de
probabilidad.
D. CONCLUSION
Se observa que los tratamientos resultan altamente significativos que conlleva a una
comparación de promedios, como el testigo ha sido comprobado en tres minutos entonces la
prueba apropiada es la Dunnet. Complete el cálculo de la suma de cuadrados y realice la
prueba de comparación múltiple Dunnett.
84
Métodos Estadísticos para la Investigación experimental
CAPÍTULO VI
4. INTRODUCCIÓN
Es el diseño estadístico cuya aplicación cada día es mas frecuente, ya que los
investigadores, conociendo la sencillez en el planteamiento y análisis, hacen
conclusiones muy adecuadas.
5. CARACTERÍSTICAS
6. VENTAJAS.-
7. DESVENTAJAS.-
85
Elías Alberto Torres Armas, Lic. Ms. C.
- Número limitado de tratamientos, porque t=r=c. Rara vez se utiliza com más de 10
tratamientos.
- El diseño es rígido en el número de repeticiones y en agrupar los tratamientos en
filas y en columnas en tal forma que ningún tratamiento se repita en fila ni en
columna.
8. USOS
9. RESTRICCIONES
DCL 4x4
A B C D
B C D A
C D A B
D A B C
DCL 5x5
A B C D E
B C D E A
C D E A B
D E A B C
E A B C D
86
Métodos Estadísticos para la Investigación experimental
A D B C 3
B A C D 4
3º Permutación de filas (sortear las filas)
B A C D 4
C B D A 1
Filas
A D B C 3
D C A B 2
87
Elías Alberto Torres Armas, Lic. Ms. C.
Se podrá disponer de este último para llevar a cabo el experimento. Con cuadrados
latinos de mayor número de tratamientos se procede en forma similar.
11. ANALISIS
Donde:
j j
varianza , 2 , 2 respectivamente.
considera como variables aleatorias distribuidas normal e independiente con media cero y
2
88
Métodos Estadísticos para la Investigación experimental
ANALISIS DE VARIANZA
H0 : i 0 i
Hipótesis Modelo I
Respecto a En términos de los
tratamientos efectos de los H a : i 0 para almenos a lg ún i
tratamientos
En términos de las H 0 : i 0 i
medias de los H a : i 0 para almenos a lg ún i
H0 : j 0
tratamientos
Respecto a filas
Ha : j 0
Respecto a columnas H0 :i 0
H a :i 0
89
Elías Alberto Torres Armas, Lic. Ms. C.
CALCULO DE LAS SUMAS DE CUADRADOS
SCtotal Yij2
SUMA DE CUADRADOS PARA EL TOTAL
t r
Y..2
i 1 j 1 t
Y
SUMA DE CUADRADOS PARA TRATAMIENTOS
t
2
SCtratamiento i 1
2
(i )
Y..2
t t
Y
SUMA DE CUADRADOS PARA FILAS
t
2
SC filas i 1
j.
Y..2
t t2
Y
SUMA DE CUADRADOS PARA COLUMNAS
t
2
SC columnas i 1
2
.k
Y..2
t t
S.C.error SCtotal SCtratamiento SC filas SCcolumnas
SUMA DE CUADRADOS PARA EL ERROR
Y Y Y
También
S .C.total Y
t t t
2 2 2
i 1
i 1
i 1
2
(i ) j. .k
t r
2 Y..2
i 1 j 1
ij
t t t t
SOLUCION:
90
Métodos Estadísticos para la Investigación experimental
H0 : i 0 i
H a : i 0 para almenos a lg ún i
H 0 : i 0 i
H a : i 0 para almenos a lg ún i
Y
SUMA DE CUADRADOS PARA TRATAMIENTOS
t
SCtratamiento i 1
(i )
t2
10150175 10064756.25 85418.75
t 4 16
SCtratamiento
Y
SUMA DE CUADRADOS PARA FILAS (RAZAS)
t
SC filas i 1
j.
t2
10222775 10064756.25 158018.75
t 4 16
SC filas
Y
SUMA DE CUADRADOS PARA COLUMNAS (LACTACIONES)
t
SC columnas 2
i 1
.k
SCerror=250543.75-3618.75-158018.75-85418.75=3487.5
F de V SC gl CM Fc
Lactaciones 3618.75 3 1206.25 2.07526882
Razas 158018.75 3 52672.9167 90.6200717
Tratamientos 85418.75 3 28472.9167 48.9856631
Error 3487.5 6 581.25
Total 250543.75 15 16702.9167
91
Elías Alberto Torres Armas, Lic. Ms. C.
Decisión:
Conclusión
92
Métodos Estadísticos para la Investigación experimental
CAPÍTULO VII
1. Diagrama de dispersión: gráfica que describe la relación entre las dos variables de interés.
Variable dependiente: la variable que se pronostica o estima. Variable independiente: la
variable que proporciona la base para la estimación. Es la variable predictora.
2. Modelo de regresión lineal simple. Propósito: determinar la ecuación de regresión; se usa
El modelo es: Yi 0 1 X i i
para predecir el valor de la variable dependiente (Y) basado en la variable independiente (X).
Yˆ b0 b1 x , Donde:
Yˆ
b0: Es el estimador de 0 , es la intercepción en Y, o el valor estimado de Y cuando X = 0
Es el valor promedio pronosticado de Y para cualquier valor de X.
x y
xy y b x
b0
( x)
b1
SP. XY Suma de productos XY
x
n ,
2 1
2
SC. X suma de cuadrados de X n n
n
93
Elías Alberto Torres Armas, Lic. Ms. C.
( y ) 2
SCT y2
x y ) ( x) 2
n
SCR 1 ( xy ó SCR ( x 1
2 2
S y. x
(Y Yˆ ) 2
y 2
b0 y b1 xy
S y. x CME
n2 n2
SCE
n2
ó
Var (b1 ) s b1
CME CME
( x 2 )CME ( x 2 )CME
SCX SCX
Var (b0 ) s b1
nSCX nSCX
PARA 0 H1 : 0 0
Hipótesis
94
Métodos Estadísticos para la Investigación experimental
H 0 : 1 0
H 1 : 1 0
Hipótesis
x y
xy n
directa. Fórmula para r
r r 1
( x) 2 ( y ) 2
SCR SCE
( x )( y
ó
SCT SCT
2 2
)
n n
Correlación negativa perfecta
95
Elías Alberto Torres Armas, Lic. Ms. C.
H0 : 0
H1 : 0
Hipótesis
1 ( X X )2 1 ( X X )2
yˆ t CME ( Y ˆ
y t CME (
n 2;1 n SCX n 2;1 n SCX
2 2
El intervalo de predicción (de predicción) de 100(1- )% para un valor individual de Y dado
un valor de X se define por:
1 ( X X )2 1 ( X X )2
yˆ t CME (1 Y yˆ t CME (1
n 2;1 n SCX n 2;1 n SCX
2 2
Ejemplo. Se efectuó un experimento para evaluar el efecto el zinc en el peso de las cacatúas.
En el experimento, a 7 grupos de cacatúas adultas se les dio diferentes dosis de zinc y sus
pérdidas de peso tras la primera semana fueron registradas. Los datos de los pesos medios
por grupo al final de la semana están expresados como porcentajes sobre los pesos iniciales.
X(Ingesta Y(Peso
X2 Y2 XY
de zinc) medio %)
1 0 100 0 10000 0
2 2 92 4 8464 184
3 4 95 16 9025 380
4 8 90 64 8100 720
5 12 98 144 9604 1176
6 16 85 256 7225 1360
7 30 67 900 4489 2010
X Y
SUMA 72 627 1384 56907 5830
XY
72 627
5830
X 2
1 , 1 -0.96225577
72
n 7
X n 1384
2
2
Y X 627 0.96225577 72 ,
7
0
n
0 99.4689165
7
1
n 7
Ecuación: Y 0 1 X Y 99.4689165 - 0.96225577 X
X Y
XY
72 627
5830
X Y 2 Y
CORRELACIÓN:
627 2
n 7
X2 1384 56907
7 7
2 2 2
72
n n
96
Métodos Estadísticos para la Investigación experimental
0.89382905
Coeficiente de determinación: 2 - 0.893829052 2 0.79893037
Nota : El 80% de τY” depende de τX”
ANÁLISIS DE VARIANZA:
Hipótesis
Y
Y 56907 745.714286
2
627 2
X 2
2
SCTOTAL
n 7
1 X -0.962255771384 72
595.7737884
2
2
SC REGRESIÓN
n 7
SC ERROR SCTOTAL SC REGRESION 745.714286 - 595.7737884 149.9404973
Cuadro ANVA:
F.V. S.C. G.L. C.M. F.C. Sig.
Regresión 595.7737884 1 595.7737884 19.8670072 **
Error 149.9404973 5 29.98809947
TOTAL 745.7142857 6
Decisión: Ft = F (1,5)0.05 = 3.84. Fc > Ft entonces se rechaza H0.
Conclusión: Existe suficiente evidencia estadística de que existe regresión lineal entre x e
y.
97
Elías Alberto Torres Armas, Lic. Ms. C.
CAPÍTULO VIII
1.1. INTRODUCCIÓN:
REGRESIÓN: Consiste en determinar una relación funcional entre las variables con el fin de
que se pueda predecir el valor de una variable (dependiente) en base a otra(s) variables
(independientes).
Los modelos para un análisis de regresión múltiple son similares a los de regresión lineal simple,
excepto que contienen más términos y pueden servir para proponer relaciones más complejas que
una línea recta en lugar de usar un modelo de línea recta E(y) = 0 + 1 X , para modelar el
componente determinístico podríamos emplear el modelo cuadrático E(y) = 0 + 1X + 2X2
También conocido como modelo de segundo orden se representa gráficamente como una
parábola en contraste con los modelos de línea recta o modelos de primer orden.
Si por añadidura pensamos incluir en el modelo otra variable una gráfica de E(y) como función
de X1, X2 describe una superficie de respuesta en el plano (X 1,X2) y el modelo de primer orden
es: E(y) = 0 + 1 X1 + 1X2 (describe una superficie plana) sin embargo en la mayor parte de
98
Métodos Estadísticos para la Investigación experimental
Estos modelos e denominan modelos lineales generales porque E(y) es función lineal de los
PARÁMETROS desconocidos
0, 1, 2...
El modelo E ( y ) 0
1 X
no es un modelo lineal porque E(y) no es función lineal de los
parámetros 0 + 1
E(y) 0 1 X 1 2 X 2 3 X 3 4 X 4 5 X 5 6 X 6
Las variables ficticias introducen al parámetro apropiado ( de que puede ser positivo o
negativo) dependiendo del día de la semana. Así: En domingo X1= 1, X2 = X3, ...., = X6 = 0 y el
valor medio de Y es:
E(y) = 0 + 1(1)
E(y) = 0 + 1
En lunes E(y) = 0 + 2
En martes E(y) = 0 + 3
En miércoles E(y) = 0 + 4
En jueves E(y) = 0 + 5
En viernes E(y) = 0 + 6
En sábado se asigna 0 a todas las variables ficticias y el valor medio de Y es: E(y) = 0
99
Elías Alberto Torres Armas, Lic. Ms. C.
Y = E(y) + ε
Componente
aleatorio
Componente
Determinístico
El componente aleatorio ε debe obedecer los supuestos del modelo de regresión lineal:
Tenga distribución normal con media 0 y varianza 2. Esto implica que la media de Y
equivale al componente deterministico
E(y) 0 1 X 1 ... k X k
Para todos los valores de las variables independientes X1, X2, X3,..., Xk la varianza de ε es
constante.
Las relaciones entre la variable Y con las variables X1, X2, X3, ..., Xk, donde cada observación (Xi1
Xi2 Xi3 ... Xik , Y) satisface el modelo lineal general de regresión siguiente:
Yi 0 1 X i1 2 X i 2 3 X i3 ... k X ik i
100
Métodos Estadísticos para la Investigación experimental
X1, X2, X3, ..., Xk: variables independientes. Podrían en realidad representar los
cuadrados cubos productos cruzados u otras funciones
(sen, log. Etc.) de las variables de predicción. Lo esencial es
que se pueden medir sin error cuando se observe un valor
de Y y que no intervengan parámetros desconocidos.
j: Parámetros de la regresión . constantes desconocidas.
Expresan el incremento en la variable respuesta Y que se
Los coeficientes : 0,k son estimados por el método de mínimos cuadrados, así:
Yi 0 1 X i1 2 X i 2 3 X i3 ... k X ik i
j
El modelo:
Aplicando el operador de sumatoria en ambos miembros de la igualdad:
i 1 i 1
Derivando parcialmente con respecto a j e igualando a cero buscamos minimizar la suma de los
i2
n n
i 1 i 1
Obteniéndose un sistema de ecuaciones lineales simultaneas llamadas ecuaciones normales de
SSE
mínimos cuadrados del modelo:
0
0
SSE
0
1
SSE
0
2
.
.
SSE
.
0
k
Examinemos la primera ecuación:
101
Elías Alberto Torres Armas, Lic. Ms. C.
SSE
2 (Yi ( 0 1 X i1 2 X i 2 3 X i 3 ... k X ik ))(1)
n
0 i 1
Como puede verse, escribir k+1 ecuaciones lineales de mínimos cuadrados ya cuesta trabajo,
resolverlos simultáneamente a mano es todavía más difícil. Una forma fácil de expresar las
ecuaciones y resolverlos es mediante el álgebra de Matrices y obtener fórmulas para las
estimaciones de los coeficientes de regresión lineal de mínimos cuadrados, SSE, estadísticas de prueba, intervalos de
confianza y de predicción.
102
Métodos Estadísticos para la Investigación experimental
Datos Y X1 X2 X3... Xk ε
1 Y1 X11 X12 X13...X1K ε1
2 Y2 X21 X22 X23...X2K ε2
3 Y3 X31 X32 X33...X3K ε3
. . . . . ....
. . . . . ....
. . . . . ....
n Yn Xn1 Xn2 Xn3… Xnk εk
En notación matricial:
En forma desarrollada puede verse así:
. . . . .. .
.
. . . .
. . .
.
. . . .
. . .
. .
Y
X n3 X np k px1 n nx1
. . .
n nx1 1 X n1 X n2
nxp
Ynx1 = Xnxp . βpx1 + εnx1
103
Elías Alberto Torres Armas, Lic. Ms. C.
Con ésta notación el modelo lineal general se pude expresar en la forma de matriz como:
la matriz X.
Y=X +ε
La matriz contiene a los parámetros o, 1, 2, 3,…, p de modo que resolver el sistema
nos dará como resultado, las estimaciones de mínimos cuadrados de cada uno de ellos,
denotados por:
ˆ ( ˆ 0 ˆ1 ˆ 2 ˆ 3 ˆ ) '
y Xˆ , donde y Yˆ
y el modelo de estimación es
Ahora bien:
* El modelo: y Xˆ
Despejando ε
y Xˆ
104
Métodos Estadísticos para la Investigación experimental
Se obtiene:
Derivando con respecto a ̂ para minimizar ' que es la suma de cuadrados del
error:
'
2 X ' y 2 X ' Xˆ
ˆ
Igualando a cero:
Por tanto:
= (X’X)-1X’y
. . . . .. .
.
. . . .
. . .
.
. . . .
. . .
. .
Y
X n3 X np k px1 n nx1
. . .
n nx1 1 X n1 X n2
nxp
105
Elías Alberto Torres Armas, Lic. Ms. C.
SE ESCRIBE:
. . .
. . . .
1 X n3 X nk nxp
. . .
X1k X 2k X3k X nk pxn X n1 X n2
El producto resulta:
(X’X)-1 = (1/|X’X|)adjunta(X’X)
1 Y1 Yi1
X Y
1 1 1
X11 X 31 X n1 Y2 i1 1
X12 Y3
X 21
X i 2Y2
X 22 X32 X n2
X ' Y X13 . X i 3Y3
.
X n3
X 23 X33
. .
Y
X1k X 2k X3k X nk pxn n nx1 X ikYn px1
106
Métodos Estadísticos para la Investigación experimental
0
1
ˆ ( X ' X ) X ' Y 2
1
K
Yˆi ˆ 0 ˆ j X ij ; i 1, n j 1, k
k
j 1
Yˆ Xˆ
ESPERANZA MATEMÁTICA DE ̂
CUADRADOS
̂ )=
a.
E(
Var-cov( ̂ )= 2 ( X ' X ) 1
Demostración:
ˆ ( X ' X ) 1 X ' ( X )
ˆ ( X ' X ) 1 X ' X ( X ' X ) 1 X '
ˆ ( X ' X ) 1 X '
ˆ ( X ' X ) 1 X '
107
Elías Alberto Torres Armas, Lic. Ms. C.
Var-cov( ̂ j )=
estándar de los estimadores. De modo que:
2
c jj
Luego: Los errores estándar de los estimadores de ̂ j son:
Los elementos que están fuera de la diagonal proporcionan valores necesarios para calcular las
̂ j , ̂ i i j
covarianzas de los parámetros, digamos
Donde
cov( ˆ i ˆ j )= cij 2 c ji
2
Las varianzas de los estimadores de los parámetros y de Yˆ dependen del valor de (varianza
MÚLTIPLE
del error aleatorio ) que aparece en el modelo y casi nunca se se le conoce por adelantado,
2
108
Métodos Estadísticos para la Investigación experimental
SCT Y ' Y nY 2
Suma de cuadrados del total de Y.
SCR ˆX ' Y nY 2
Suma de cuadrados de la regresión
SCE Y 'Y ˆX 'Y
Suma de cuadrados del error (residual)
Hipótesis
H0: 1= 2= 3=…= K=0
H1: Por lo menos uno de los parámetros es distinto de cero
ANÁLISIS DE VARIANZA
Fuente de Suma de G. L. Cuadrados FC
Variación cuadrados medios
REGRESIÓN SCR K CMR CMR/CME
ERROR SCE n-p CME
TOTAL SCT n-1
El rechazo de H0 implica que al menos una de las variables de regresión tienen una contribución
significativa en el modelo.
H0 : ̂ j =0
Hipótesis
H1 : ̂ j ≠0
ESTADÍSTICA DE PRUEBA
109
Elías Alberto Torres Armas, Lic. Ms. C.
ˆ j
TO
ˆ 2 c jj
CONCLUSIÓN
Si no se rechaza la hipótesis H0 indica que el regresor Xj puede eliminarse del modelo
R2 1 0 R2 1
SSR SSE
,
SCT SCT
R2 grande no necesariamente implica que el modelo de regresión sea bueno, pues la adición de
una variable al modelo siempre aumenta R2 sin importar si la variable es o no estadísticamente
significativa.
R 2 R Es el coeficiente de correlación múltiple entre Y y el conjunto de variables de
regresión X1 X2 X3 … Xk
R es una mediad de asociación lineal que existe entre Y y X1 X2 X3 … Xk. Cuando k=1
tenemos el coeficiente de correlación simple entre Y y X
tamaño n=10. Probar si es significativo el aporte del ingreso al modelo. Como debería ser
el modelo? ( Usar 5% de significancia)
110
Métodos Estadísticos para la Investigación experimental
tamaño n=15. Probar si es significativo el aporte del ingreso al modelo. Como debería ser
el modelo? ( Usar 1% de significancia)
venta desempeño
conocimientos experiencia
vendedor semanal laboral
Y X1 X2 X3
1 5 4 2 3
2 12 7 5 4
3 4 3 1 6
4 8 6 4 4
5 11 10 6 7
111
Elías Alberto Torres Armas, Lic. Ms. C.
h) Encontrar los intervalos de confianza 1 y 2, con una confianza del 5%.
Usar los coeficientes de correlación parcial. Usar el nivel significancia de 5%.
i) Probar si la variable diámetro exterior debe estar en el modelo de regresión. Usar los
coeficientes de correlación parcial. Usar el nivel de significancia de 5%.
112
Métodos Estadísticos para la Investigación experimental
a) Qué sueldos estimaría usted para un profesor con 5 años de experiencia una
calificación del director de 72
b) Realice una prueba de hipótesis global para determinar alguno de los coeficientes de
regresión netos son diferentes de cero. Margen de error de 5%.
c) Realice una prueba de hipótesis para los coeficientes individuales de regresión
¿Considera usted eliminar cualquiera de las variables independientes usar un nivel de
significancia de 1% y 5%.
d) Determine los residuos.
e) Probar si la variable años de experiencia debe estar en el modelo de regresión usar los
113
Elías Alberto Torres Armas, Lic. Ms. C.
CAPÍTULO IX
ANALISIS DE COVARIANZA
Algunos ejemplos:
El peso inicial (X) de animales relaciona al peso final (Y), cuando estos animales están
sujetos a diferentes raciones. Se estudia el efecto de las raciones a través de los pesos
observados.
EL número de plantas (X) por parcela. Se estudia el rendimiento total (Y) de la parcela.
El Rendimiento (X) de las parcelas en una producción anterior y el rendimiento (Y) de las
mismas parcelas al finalizar el experimento. El estudio consiste en comparan variedades
de un determinado cultivo.
La incidencia de plagas (X) en el rendimiento de algunas variedades, el estudio es
comparar las variedades.
En cada caso, se entiende que la variable X tiene un efecto en la variable Y, sin embargo
esta dependencia deberá ser probada estadísticamente mediante el ANALISIS DE
REGRESION.
114
Métodos Estadísticos para la Investigación experimental
En algunos casos puede existir más de una variable externa caso multivariante, ejemplo
X1, X2, X3. Este caso puede resolverse matricialmente y con ayuda del computador
porque los procesos manuales son tediosos.
CARACTERISTICAS
a) Técnica estadística que asocia el análisis de varianza y el análisis de regresión con el objeto
de controlar, en forma indirecta el error experimental al tomar en cuenta la presencia de
una variable concomitante (X) o acompañante a la variable principal (Y) acerca de la cual
se debe obtener conclusiones. Debe recordarse que una posibilidad de controlar el error
experimental en forma directa es mediante formación de grupos homogéneos o bloques.
H 0 : 0 : No hay influencia de X en Y
Mediante la regresión se evalúa la influencia o no, de X en Y , la hipótesis es:
H a : 0 : Si hay influencia de X en Y
MODELO ESTADISTICO
115
Elías Alberto Torres Armas, Lic. Ms. C.
ANÁLISIS DE VARIANZA
Se utiliza los criterios respectivos de cada diseño. Esto es, se utiliza las reglas prácticas para la
obtención de las sumas de cuadrados. Teniendo en cuenta a las variables X e Y, analizaremos al
DCA pudiendo extender este criterio al DBCA y DCL.
Ejemplo: (Extraido del trabajo τLa nutrición minerales camote” realizado por Flor Milla A.
(1990) INIAA). Se desarrollo un DCA con desigual numero de repeticiones, su objetivo fue:
Comparar los rendimientos en parcela Kg/Parcela de las variedades Jonathan, Tiza y Urquirano
de camote. Se sospechó de la influencia de la profundidad de siembra en los rendimientos finales
la que de consideró como una covariable, por tanto se realizó un análisis de covarianza y el
modelo estadístico es el siguiente:
116
Métodos Estadísticos para la Investigación experimental
Y X T
35 21 1
39 26 1
36 22 1
45 28 1
43 29 1
44 34 2
38 26 2
39 29 2
27 18 2
24 23 3
32 29 3
40 30 3
21 16 3
28 29 3
19 14 3
Analizar/Modelo lineal general/univariante/ ingrese Y a variable dependiente, T a
factores fijos, X a covariable/modelopersonalizadopase factores y covariables a
modelo-efctos principalescontinuar/opciones-pase el factor a mostrar las medias
para-estadisticos descriptivos- estimaciones de los parámetros-comparar efectos
principales (selecciones DMS , bonferroni o sidack)-continuar/aceptar
Factores inter-sujetos
Etiqueta del valor N
Variedades de cammote 1 Variedad de camote Jonathan 5
2 Variedad de camote Tiza 4
3 Variedad de camote Urquiaro 6
117
Elías Alberto Torres Armas, Lic. Ms. C.
HIPÓTESIS
a) Para la regresión
H0: = 0
Ha: = 0
b) Para tratamientos
H0: i = 0 para i=1,2,....,t
Ha: i ≠ 0
Las evidencias muestrales indican que existe relación lineal entre profundidad de siembra y
rendimiento, se justifica entonces el ANCOVA.
Dado que p=0.000 es menor que 1% se afirma que las variedades en estudio son
significativamente diferentes en cuanto al rendimiento promedio (después de ajustar los datos
con la variable concomitante profundidad de siembra).
Para efectuar comparaciones de promedios éstos deben ajustarse o corregirse del efecto de la
variable concomitante
118
Métodos Estadísticos para la Investigación experimental
n
[T=1] 10.546 1.716 6.147 .000 6.770 14.322
[T=2] 6.377 1.864 3.420 .006 2.273 10.480
[T=3] 0(a) . . . . .
X 1.012 .135 7.520 .000 .716 1.309
a Al parámetro se le ha asignado el valor cero porque es redundante.
Variedades de camote
Estimaciones
Variable dependiente: Rendimiento en Kg/parcela
Intervalo de confianza
al 95%.
Variedades de camote Límite Límite
Media Error típ. inferior superior
Variedad de camote Jonathan 39.330(a) 1.256 36.565 42.095
Variedad de camote Tiza 35.161(a) 1.425 32.025 38.297
Variedad de camote Urquiaro 28.784(a) 1.162 26.226 31.343
a Las covariables que aparecen en el modelo se evalúan en los siguiente valores:
Profundidad de siembra en centímetros = 24.93.
119
Elías Alberto Torres Armas, Lic. Ms. C.
Grupos homogéneos
Conclusión: Existe un grupo homogéneo formado por la variedad Jonathan y Tiza que no
tienen diferencia significativa en el rendimiento medio, sin embargo la variedad Tiza tiene
rendimiento medio significativamente diferente a la variedad Urquiano que es de mínimo
rendimiento. La decisión será tomada entre tiza y Jonathan.
CAPÍTULO X
Los factoriales son combinaciones de factores (nitrógeno, fosforo, variedades, sustancias, niveles
de concentrado, etc.) para formar tratamientos, los cuales se aplican en los diseños
experimentales (DCA, DBCA, DCL). La información obtenida de estos experimentos es amplia,
ya que permiten comparar los niveles de cada factor entre si y evaluar las interacciones que
resulten como combinaciones de los factores, así como la comparación de niveles de un factor
bajo un nivel de otro factor.
En un experimento con factoriales, si todos los niveles de un factor se combinan con todos los
niveles de otro factor, entonces se dice que estos factores están cruzados. Si los niveles de un
factor se combinan con ciertos niveles de otro factor se dice que estos factores están anidados.
Ejemplo. Los niveles de un factor A a1, a2, y a3 se combinan con los niveles de un factor B b1,
b2 de la siguiente forma:
a1 a2 a3
b1 b2 b1 b2 b1 b2
Tratamientos: a1b1, a1b2, a2b1, a2b2, a3b1, a3b2
Los factores A y B están cruzados.
Ejemplo. Los niveles de un factor A: a1, a2, y a3 se combinan con los niveles de un factor B b 1,
b2, b3, b4, b5, b6 de la siguiente forma:
120
Métodos Estadísticos para la Investigación experimental
a1 a2 a3
b1 b2 b3 b4 b5 b6
Tratamientos: a1b1, a2b3, a2b4, a3b5, a3b6
El factor B esta anidado en A. Se representa como: B(A)
CONCEPTOS GENERALES
EFECTO PRINCIPAL.- Es el efecto promedio del factor sobre los otros niveles del mismo
factor independiente de los otros factores. Ejemplo: Efecto de nitrógeno en las unidades
experimentales al aplicar un abono formado por nitrógeno, fosforo y potasio.
EFECTO INTERACCION.- Es el efecto adicional debido a la influencia combinada de dos o
más factores. Ejemplo. Efecto conjunto Nitrógeno-Fosforo en la unidad experimental.
EFECTO SIMPLE.- Es el efecto de los niveles del factor en un nivel de otro factor. Ejemplo.
Efecto del nitrógeno bajo la presencia de 0.5 % de fosforo. Es un efecto derivado del efecto de la
interacción.
EFECTO SIMPLE.- Es el efecto de los niveles del factor a una combinación de los otros
factores, por ejemplo, el efecto del nitrógeno en las unidades experimentales, bajo la presencia de
0.5% de fosforo y 1% de Potasio.
TIPOS DE FACTORES
121
Elías Alberto Torres Armas, Lic. Ms. C.
b2: 0.1 µM
b3: 1.0 µM
b4:10.0 µM
Al combinar ambos factores A y B se tiene 3x4 = 12 tratamientos para ser evaluados.
Los factores se identifican con letras mayúsculas y los niveles con letras minúsculas, por ejemplo:
FORMACION DE FACTORIALES
Desventajas:
1. El número de unidades experimentales utilizadas es mayor que en experimentos simples y es
más difícil contar con un número suficiente de unidades que requiere el experimento.
2. El análisis se complica, a medida que el numero de factores y niveles aumenta.
122
Métodos Estadísticos para la Investigación experimental
3. Algunas combinaciones pueda que no sean de importancia, pero deben incluirse para
completar el factorial, esto obliga a usar mas unidades experimentales.
Factor A, con 3 niveles, factor B con 2 niveles. El numero de tratamientos son 3x2 = 6, con
grados de libertad igual a (6-1)= 5.
De lo efectos principales:
A con (2-1) = 1 gl.
B (3-1) = 2 gl.
C (2-1) = 1 gl.
De los efectos de la interaccion:
AB (2-1)(3-1) = 2 gl.
AC (2-1)(2-1) = 1 gl.
BC (3-1)(2-1) = 2 gl.
De los efectos de Doble interaccion:
ABC (2-1)(3-1)(2-1) = 2 gl.
La suma de grados de libertad son: 1+2+1+2+1+2+2 = 11; que son los correspondientes grados
de libertad de tratamientos.
Los cuadrados medios de estas fuentes se obtienen dividiendo la suma de cuadrados entre los
grados de libertad, y para la prueba de F, se divide cada CM con el CM del error, solo cuando se
tiene factores aleatorios o anidados, es necesario hallar los esperados cuadrados medios.
INTERACCION DE FACTORES
123
Elías Alberto Torres Armas, Lic. Ms. C.
La interacción de los factores juega un papel importante en el análisis, de ahí que las pruebas de
F, se realizan en el siguiente orden: primero la interacción de orden superior, luego la de menor
orden y por último los factores principales.
Si la interacción de mayor orden resulta significativa, termina las prueba del cuadro del ANVA y
se procede a los análisis de los efectos simples-simples, esto significa comparar los niveles de un
factor en la combinación de los otros factores.
Ejemplo.- ABC : ns
Continúan el análisis del ANVA.
AB : ns
AC : ns
BC : ns
Continúan el análisis del cuadro de ANVA, para los efectos principales de A, B y C.
Ejemplo.- ABC : ns
Continua el analisis del ANVA.
AB : *
AC : ns
BC : ns
Se prueban los efectos simples en cada factor (A y B), es decir comparar los niveles de A
bajo la presencia de cada nivel de B y comparar los niveles de B bajo la presencia de cada
nivel de A.
Luego continuar con el análisis en cuadro de ANVA solo para los efectos principales de
C.
Ejemplo.- ABC : ns
Continua el análisis del ANVA.
AB : *
AC : *
BC : ns
Se prueban los efectos simples en cada factor (A y B), en los factores (A y C) se
compararan los niveles de A bajo la presencia de cada uno de los niveles de C y en C se
comparan sus niveles bajo la presencia de cada uno de los niveles de A.
Ejemplo.- ABC : ns
Continua el análisis del ANVA.
AB : *
AC : *
124
Métodos Estadísticos para la Investigación experimental
BC : *
Se prueban los efectos simples en cada factor (A y B), en (A y C) y en (B y C).
El análisis de los efectos simples-simples y efectos simples pueden realizarse mediante la prueba
de F (las sumas de cuadrados) o una prueba comparativa de promedios (DLS, TUKEY).
Solo para los casos de factores fijos es válido el análisis de efectos simples-simples, simples o
promedios.
Ejemplo 6. A es fijo y B al azar, AB resulta (*), no procede los análisis de efectos simples.
Ejemplo 7. A es fijo y B es fijo, AB resulta (*), procede los análisis de efectos simples.
GRAFICO DE LA INTERACCION
En los siguientes gráficos se muestran los casos posibles de interacción en dos factores: A con 3
niveles y B con 2 niveles. En el eje X se registra los niveles de A y en el eje Y los promedios de la
interacción de A y B. Los puntos son unidos con una línea, para cada nivel de B.
EFECTOS SIMPLES
El análisis de los efectos simples se realiza cuando existe una interacción de dos factores por
ejemplo A y B. Los efectos simples se calculan a partir del cuadro de promedios de la
combinación de factores.
Los experimentos factoriales en si no constituyen un diseño experimental sino mas bien ellos
deben ser llevados a cualquiera de los diseños clásicos tales como DCA, DBCA, DCL etc. Por
diseño factorial se entiende aquel en el que se investigan todas las posibles combinaciones de los
niveles de los factores en cada ensayo completo o replica del experimento; es decir cuando los
factores están cruzados, cada combinación requiere al menos 1 repetición cada combinación.
Cada combinación se considera un tratamiento.
Debe usarse cuando existe homogeneidad en las unidades experimentales. El interés es comparar
el efecto de los tratamientos o el efecto de los niveles en cada uno de los factores y de la
interacción.
Esquema de campo
125
Elías Alberto Torres Armas, Lic. Ms. C.
a1 b1
A a2 B
a3 b2
niveles de A: 3
niveles de B: 2
t=3*2=6 tratam
si r=3
entonces:
n=t*r=18 unidades experimentales
Entonces:
Las combinaciones
a1 a2 a3
b1 b2 b1 b2 b1 b2
Los tratamientos
T1 T2 T3 T4 T5 T6
a1b1 a1b2 a2b1 a2b2 a3b1 a3b2
T4 T2 T1 T4 T2 T3
T1 T2 T6 T3 T6 T5
T5 T3 T1 T4 T5 T6
126
Métodos Estadísticos para la Investigación experimental
jB
i 1 2 … b Yi..
Y111 Y121
Y112
1
A …
Y11r
Y211
Y212
… Yijk
2 Y21r
…
Y.j. Y…
MODELO
A partir del modelo para el DCA con t tratamientos con dos factores
Ylk t l lk
Donde : l 1,2,3,..., t
k 1,2,..., r
Ai i
Bj j
ABij ij i j
ijk Yijk ij
PROCEDIMIENTO DE PRUEBA
i) Hipótesis
127
Elías Alberto Torres Armas, Lic. Ms. C.
H 0 : ij 0
H a : ij 0
H0: Todos los niveles del factor A tienen el mismo efecto
H 0 : Ai 0
Ha: Al menos uno de los niveles del factor A tiene efecto diferente
H a : Ai 0
H0: Todos los niveles del factor B tienen el mismo efecto
H0 : Bj 0
Ha: Al menos uno de los niveles del factor B tiene efecto diferente
Ha :Bj 0
H0: No existe interacción entre los factores
H 0 : ABij 0 ij
Ha: Si existe interacción entre los factores
Para determinar el cociente o razón F para un factor se debe apreciar la distribución de los
cuadrados medios esperados. Tanto el numerador como el denominador del cociente deben tener
las mismas componentes (con igual ponderación) a excepción del numerador, donde debe
aparecer una componente más, que corresponde al factor que se va a probar.
F de V Gl SC CM F
Tratam ab-1 Tyy T T/E
A a-1 Ayy A A/E
B b-1 Byy B B/E
AB (a-1)(b-1) AByy AB AB/E
Error ab(r-1) Eyy E
Total abr-1 Wyy W
La sumas de cuadrados
Tyy
Y 2
ij ..
Y...2
Ayy
Y 2
i ..
Y...2
B yy
Y 2
. j ..
Y...2
r abr br abr ar abr
128
Métodos Estadísticos para la Investigación experimental
AB yy
Y 2
ij .
Y 2
i ..
Y 2
. j ..
Y...2
Y
r br ar abr
E yy Yijk2
2
ij .
W yy Yijk2
r
2
Y...
abr
La sumas de cuadrados:
Tyy
Y 2
ijk .
Y....2
Ayy
Y 2
i ...
Y....2
Y Y Y Y....2
r abcr bcr abcr
Byy C yy
2 2 2
. j .. .... ..k .
AB yy
2 2 2 2
AC yy
2 2 2
BC yy
2 2 2
ABC yy ....
2 2
Y2
E yy Yijkl
Yijk .
r br ar cr bcr acr abr abcr
2
2
W yy Yijkl
r
...
2
2 Y
abcr
129
Elías Alberto Torres Armas, Lic. Ms. C.
Ejemplo I: Un ingeniero diseña uma bateria para su uso en un dispositivo que será sometido a
ciertas variaciones de temperatura. El único parâmetro de diseño que El puede seleccionar em
este punto ES El material de La cubierta de La bateria. El hace um ensayo de laboratório con 2
factores: tipo de material y temperatura(ºF), evaluando El resultado con La duración efectiva em
horas. Los datos ordenados se muestran a continuación:
3A3B
n=36 t=9 r=4
a1 a2 a3
b1 b2 b3 b1 b2 b3 b1 b2 b3
repeticiones a1b1 a1b2 a1b3 a2b1 a2b2 a2b3 a3b1 a3b2 a3b3
1 130 34 20 150 136 25 138 174 96
2 155 40 70 188 122 70 110 120 104
3 74 80 82 159 106 58 168 150 82
4 180 75 58 126 115 45 160 139 60
130
Métodos Estadísticos para la Investigación experimental
131
Elías Alberto Torres Armas, Lic. Ms. C.
Ahora reúna los ambos resultados, y se tendrá el cuadro ANVA resultante, así:
F(8,27)F(8,25)=2.34 al 5%
F(2,27)F(2,25)=3.39 al 5%
F(4,27)F(4,25)=2.76 al 5% Lo correcto será hacer una interpolación.
Otra forma para interpretar: Significación= p-Valor=pSi p es menor que α=5% (0.05) ó
[α=1% (0.01)] el efecto será significativo
Existe efecto altamente significativo del tipo de material sobre la duración de la batería.
Existe efecto altamente significativo de la temperatura sobre la duración de la batería.
132
Métodos Estadísticos para la Investigación experimental
133
Elías Alberto Torres Armas, Lic. Ms. C.
134
Métodos Estadísticos para la Investigación experimental
En un factorial en DBCA todos los tratamientos o combinación de niveles deben aparecer una
sola vez en cada bloque. El esquema de campo para un experimento 3A2B en 4 bloques:
El cuadro ANVA
F de V Gl SC CM F
Tratamientos ab-1 Tyy T T/E
A a-1 Ayy A A/E
B b-1 Byy B B/E
AB (a-1)(b-1) AByy AB AB/E
Bloques r-1 Ryy R R/E
Error (ab-1)(r-1) Eyy E
Total abr-1 Wyy W
La sumas de cuadrados
Tyy
Y 2
ij ..
...
Y2
Ayy
Y ...
Y2
2
i ..
B yy
Y 2
. j.
Y...2
r abr br abr ar abr
135
Y Y Y
Elías Alberto Torres Armas, Lic. Ms. C.
AB yy
2 2 2
ij . i .. . j. Y...2
Y
r br ar abr
R yy
2 2
..k Y ...
E yy Y
Y Y
ab abr
2 2
2 ij . ..k Y...2
ijk
W yy Yijk2
r ab abr
2
Y ...
abr
a1 a2 a3
Bloques Y..k
b1 b2 b1 b2 b1 b2
I 41 35 30 31 45 51 233 j 1 2
II 40 41 39 34 53 58 265 Y.j. 565 541
III 48 38 38 33 54 60 271
IV 60 50 52 45 65 65 337
Yij. 189 164 159 143 217 234
1106
Yi. 353 302 451
La sumas de cuadrados
Tyy
2
Y ij .. Y...2
r abr
Ayy
Y
Y...2
2
i ..
Y
br abr
2
Y...2
. j.
B yy
Y Y Y
ar abr
2 2 2
ij . i .. . j. Y...2
AB yy
Y
r br ar abr
2
Y...2
..k
Ryy
E yy Y
Y Y
ab abr
2 2
2 ij . ..kY...2
ijk
Wyy Y
r ab abr
Y...2 2
ijk
abr
136
Métodos Estadísticos para la Investigación experimental
En SPSS haga lo siguiente: Primero construyamos en cuadro de análisis de varianza con fuentes
de variación: Bloques/tratamientos/error/total:
137
Elías Alberto Torres Armas, Lic. Ms. C.
Total corregida 2631.833 23
Ahora reúna los ambos resultados, y se tendrá el cuadro ANVA resultante, así:
Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
BLOQ 952.5 3 317.5 47.86 0.0000001
TRATS 1579.833333 5 315.9666667 47.63 0.0000000
A 1433.583333 2 716.7916667 108.06 0.0000000
B 24 1 24 3.62 0.0765341
A*B 122.25 2 61.125 9.21 0.0024530**
Error 99.5 15 6.633333333
Total corregida 2631.833333 23
Como la interacción a salido altamente significativa, nos interesa ver los efectos simples de la
interacción
B dentro de a1
Datos/seleccionar casos/ si satisface la condición/si…/A=1 a la caja en blanco-
continuar/Aceptar.
Ahora:
Análisis/Comparar medias/anova de un factor/ Y a dependientes B a factor/Aceptar
ANOVA
Y
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-
78.125 1 78.125 1.231 .310
grupos
Intra-
380.750 6 63.458
grupos
Total 458.875 7
B dentro de a2
ANOVA
Y
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-
32.000 1 32.000 .522 .497
grupos
Intra-
367.500 6 61.250
grupos
138
Métodos Estadísticos para la Investigación experimental
Total 399.500 7
B dentro de a3
Datos/seleccionar casos/ si satisface la condicion/si…/A=3 a la caja en blanco-
continuar/Aceptar.
Ahora:
Analisis/Comparar medias/anova de un factor/ Y a dependientes B a factor/Aceptar
ANOVA
Y
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-
36.125 1 36.125 .714 .431
grupos
Intra-
303.750 6 50.625
grupos
Total 339.875 7
Ahora:
139
Elías Alberto Torres Armas, Lic. Ms. C.
Analisis/Comparar medias/anova de un factor/ Y a dependientes A pasa a factor/Aceptar
ANOVA
Y
Suma de Media
B cuadrados Gl cuadrática F Sig.
1 Inter-
420.667 2 210.333 2.680 .122
grupos
Intra-
706.250 9 78.472
grupos
Total 1126.917 11
2 Inter-
1135.167 2 567.583 14.774 .001
grupos
Intra-
345.750 9 38.417
grupos
Total 1480.917 11
Nótese que las F de los anovas últimos no son válidos para el análisis, pues hay que corregirlos
dividiendo los correspondientes cuadrados medios entre el CM del error=6.633333333 del anova
previo a estos cálculos.
140
Métodos Estadísticos para la Investigación experimental
CAPÍTULO XI
EXPERIMENTOS FACTORIALES 2k
Se refiere al estudio de k factores cada uno con dos niveles. Es un caso particular de los
experimentos factoriales; se puede realizar, además del método conocido, con otros métodos. Es
frecuentemente usado para estudios de sondeo.
Ejm.
A B t= 4 a0b0 a0b1 a1b0 a1b1 2A2B
22
a0 b0 = 4 (1) b a ab
a1 b1
A B C t= 8 a0 a1
23
a0 b 0 c0 = 8 b0 b1 b0 b1
a1 b 1 c1 c0 c1 c0 c1 c0 c1 c0 c1
a0
b0
c0 a0b0c1 a0b1c0 a0b1c1 a1b0c0 a1b0c1 a1b1c0 a1b1c1
1 C B BC A AC AB ABC
A B C D t= 16
24
a0 b 0 c0 d0 = 16
a1 b 1 c1 d1
141
Elías Alberto Torres Armas, Lic. Ms. C.
Y A B tratam
1 1 1 1
5 1 1 1
9 1 1 1
2 1 2 2
3 1 2 2
4 1 2 2
7 2 1 3
11 2 1 3
15 2 1 3
10 2 2 4
10 2 2 4
10 2 2 4
Luego ejecute el programa, así:
Primero resuelva el ANVA para los efectos de A, B y AB
142
Métodos Estadísticos para la Investigación experimental
Nota: La descomposición de la suma de cuadrados puede hacerse con otros métodos: Signos y
Yates.
Efectos Yi..
Tratam A B AB
a0b0 1 - - + 15
a1b0 a + - - 33
a0b1 b - + - 9
a1b1 ab + + + 30
Cj= 39 -9 3 87 r= 3
Efecto= 6.5 -1.5 0.5 k= 2
SC= 126.75 6.75 0.75 r*2^k-1= 6
r*2^k= 12
∑ {
+: Si el tratamiento incluye nivel alto del factor
-: Si el tratamiento incluye nivel bajo del factor
̂
A: Efecto de A=6,50
B: Efecto de B=-1,50
AB: Efecto de AB=0,50
Media
Si X es cuantitativa:
{ ; {
Usando statgrafics
Avanzado/diseño experimental/crear diseño/en pantalla/
Número de variables respuesta (1)
Número de factores experimentales (2)
Aceptar
factor: A Bajo(-1) Alto(+1)
B Bajo(-1) Alto(+1)
Aceptar
Variable respuesta: Nombre Y
143
Elías Alberto Torres Armas, Lic. Ms. C.
Aceptar
Vea las opciones y seleccione FACTORIAL 2^2/Aceptar
En la nueva pantalla: Puntos centrales (0)
Replica (2) (Nota: estas replicas se refiere a las replicas
adicionales a 1, pues por defecto considera 1, es decir cada tratamiento tiene 3 repeticiones
entonces sobra 2.
Desactivar ALEATORIO
ACEPTAR
Entrar al diseño creado, por la barra de herramientas/VENTANA/SIN NOMBRE/ Ingrese
los datos ahora.
F de V Gl SC CM F
Tratam 7 Tyy T T/E
A 1 Ayy A A/E
B 1 Byy B B/E
C 1 Cyy C C/E
AB 1 AByy AB AB/E
AC 1 ACyy AC AC/E
BC 1 BCyy BC BC/E
ABC 1 ABCyy ABC ABC/E
Error t(r-1) Eyy E
Total tr-1 Wyy W
El análisis puede realizarse con el método ordinario (muy laborioso) o con el método de los
signos.
EJEMPLO II. (DISEÑO FACTORIAL 23). Se desea analizar el efecto sobre el funcionamiento
de una bicicleta, al variar la altura del sillón (alto +, bajo -), la presión de los neumáticos (alta +,
baja -) y utilizar o no el dinamo (si +, no -). La variable respuesta que se mide es la diferencia
entre el pulso sanguíneo antes y después de realizar una determinada prueba.
C
A B No(-) Si(+) Total
Bajo(-) 56 58 68 67 249 498
Bajo(-)
Alta(+) 54 60 72 66 501 252
Bajo(-) 59 57 69 64 249 480
Alto(+)
Alta(+) 57 56 69 46 477 228
Total 457 521 978 b0=498 b1=480
144
Métodos Estadísticos para la Investigación experimental
Modelo de regresión:
̂
̂
145
Elías Alberto Torres Armas, Lic. Ms. C.
Tratam Yi… 1 2 3 ef SC
1 114 230 457 978 r= 2
a 116 227 521 -24 -3.00 36 k= 3
b 114 268 1 -18 -2.25 20.25 r*2^(k-1)= 8
c 113 253 -25 -24 -3.00 36 r*2^k= 16
ab 135 2 -3 64 8.00 256
ac 133 -1 -15 -26 -3.25 42.25
bc 138 -2 -3 12 1.50 9
abc 115 -23 -21 -18 -2.25 20.25
c. EXPERIMENTO 2k NO REPLICADO
EJEMPLO
Un producto químico se fabrica en un vaso fresurizado. Se lleva a cabo un experimento factorial
en la planta piloto, para estudiar los factores que se piensa, influyen en el índice de filtración de
este producto. Los cuatro factores son la temperatura (A), presión (B), concentración de
formaldehido (C) y la velocidad de agitación (D). Cada factor está presente con dos niveles. La
matriz del diseño y los datos de la respuesta obtenidos en una sola replica del experimento 24 se
muestran a continuación:
Trat A B C D Yi
1 - - - - 45
a + - - - 71
b - + - - 48
ab + + - - 65
c - - + - 68
ac + - + - 60
bc - + + - 80
abc + + + - 65
d - - - + 43
ad + - - + 100
bd - + - + 45
abd + + - + 104
cd - - + + 75
acd + - + + 86
bcd - + + + 70
abcd + + + + 96
146
Métodos Estadísticos para la Investigación experimental
b - + - - - + + - - + + + - + - 48
ab + + - - + - - - - + - - + + + 65
c - - + - + - + - + - + - + + - 68
ac + - + - - + - - + - - + - + + 60
bc - + + - - - + + - - - + + - + 80
abc + + + - + + - + - - + - - - - 65
d - - - + + + - + - - - + + + - 43
ad + - - + - - + + - - + - - + + 100
bd - + - + - + - - + - + - + - + 45
abd + + - + + - + - + - - + - - - 104
cd - - + + + - - - - + + + - - + 75
acd + - + + - + + - - + - - + - - 86
bcd - + + + - - - + + + - - - + - 70
abcd + + + + + + + + + + + + + + + 96
Cj= 173 25 79 117 1 -145 133 19 -3 -9 15 33 -13 -21 11 1121
Ef= 21,625 3,125 9,875 14,625 0,125 -18,125 16,625 2,375 -0,375 -1,125 1,875 4,125 -1,625 -2,625 1,375
SC= 1870,5625 39,0625 390,0625 855,5625 0,0625 1314,0625 1105,5625 22,5625 0,5625 5,0625 14,0625 68,0625 10,5625 27,5625 7,5625
SC= 1870,5625 39,0625 390,0625 855,5625 0,0625 1314,0625 1105,5625 22,5625 0,5625 5,0625 14,0625 68,0625 10,5625 27,5625 7,5625
Para conformar el error experimental se puede mancomunar algunas interacciones. Las de mayor
orden (3 y 4 factores) y aquellas que tienen poco valor, también existe el CRITERIO DE
DANIEL.
METODO DE DANIEL
Daniel propone graficar las interacciones de los efectos (de menor a mayor) frente a una
probabilidad pi, donde:
147
Elías Alberto Torres Armas, Lic. Ms. C.
El ANOVA puede considerar solamente a las interacciones AC y AD y las otras interacciones
conformaran el error experimental:
F de V SC g.l CM F p-VALOR
trat 15
A 1870,5625 1 1870,5625 107,87 0,0000
B 39,0625 1 39,0625 2,25 0,1676
C 390,0625 1 390,0625 22,49 0,0011
D 855,5625 1 855,5625 49,34 0,0001
AC 1314,0625 1 1314,0625 75,78 0,0000
AD 1105,5625 1 1105,5625 63,76 0,0000
Error 156,0625 9 17,34027778
Total 5730,9375 15
s2(+)=313,27
S2(-)=238,21 luego: ESTE VALOR ESTA DENTRO DE
LOS INTERVALOS, POR TANTO LA DISPERSION ESTA BAJO CONTROL.
148
Métodos Estadísticos para la Investigación experimental
F de V SC g.l
trat 15
A 1870,5625 1
B 39,0625 1
C 390,0625 1
D 855,5625 1
AB 0,0625 1
AC 1314,0625 1
AD 1105,5625 1
BC 22,5625 1
BD 0,5625 1
CD 5,0625 1
ABC 14,0625 1
ABD 68,0625 1
ACD 10,5625 1
BCD 27,5625 1
ABCD 7,5625 1
Error ¿?
Total 5730,9375 15
Se pueden conformar las interacciones despreciables y los de mayor orden para conformar el
error experimental. La tabla puede quedar así:
F de V SC g.l CM F p-VALOR
trat 15
A 1870,5625 1 1870,5625 107,87 0,0000
B 39,0625 1 39,0625 2,25 0,1676
C 390,0625 1 390,0625 22,49 0,0011
D 855,5625 1 855,5625 49,34 0,0001
AC 1314,0625 1 1314,0625 75,78 0,0000
AD 1105,5625 1 1105,5625 63,76 0,0000
Error 156,0625 9 17,34027778
Total 5730,9375 15
Cuando se usan diseños factoriales 2k (dos niveles) se debe suponer la linealidad en los efectos. Si
esto se cumple el sistema 2k funcionará bastante bien. Sin embargo si existe sospecha de no
linealidad existe un método para replicar ciertos puntos en un diseño factorial 2 k lo cual protegerá
contra la curvatura además de permitir obtener estimaciones de error independientes. Dicho
método consiste en agregar puntos centrales al diseño 2k, para lo cual se hacen replicas (n 0) en los
puntos Xi=0 (i=1,2,3,..,k). Se supone que los k factores son cuantitativos.
149
Elías Alberto Torres Armas, Lic. Ms. C.
El análisis de varianza para un diseño 2k (23) con n0 puntos centrales es:
F de V g.l. SC CM F(I)
A 1 Ayy A A/E
B 1 Byy B B/E
C 1 Cyy C C/E
AB 1 AByy AB AB/E
AC 1 ACyy AC AC/E
BC 1 BCyy BC BC/E
ABC 1 ABCyy ABC ABC/E
Curvatura 1 CUyy CU CU/E
Error nc-1 Eyy E
k
Total 2 +nc-1 Wyy
8+nc-1
∑ ̅
(̅ ̅)
̅
̅
Si CU/E resulta no significativa, entonces, no hay evidencia de curvatura en la respuesta en la
región explorada.
150
Métodos Estadísticos para la Investigación experimental
Efectos
Trat A B C AB AC BC ABC Y
1 - - - + + + - 18 324
a + - - - - + + 23 529
b - + - - + - + 21 441
ab + + - + - - - 27 729
c - - + + - - + 21 441
ac + - + - + - - 25 625
bc - + + - - + - 24 576
abc + + + + + + + 33 1089
Cj= 24 18 14 6 2 4 4 192 4754
Ef= 6,0 4,5 3,5 1,5 0,5 1,0 1,0 146
SC= 72,0 40,5 24,5 4,5 0,5 2,0 2,0
CUyy= 3,07692308
CUADRO ANOVA
F de V SC g.l. CM F
A 72 1 72 32.0000
B 40.5 1 40.5 18.0000
C 24.5 1 24.5 10.8889
AB 4.5 1 4.5 2.0000
AC 0.5 1 0.5 0.2222
BC 2 1 2 0.8889
ABC 2 1 2 0.8889
Curvatura 3.077 1 3.077 1.3676
Error 9 4 2.25
Total 158.077 12
También se conoce como fracción ½ porque solamente se usa la mitad de las corridas del
diseño completo (2k-1=2k/2).
151
Elías Alberto Torres Armas, Lic. Ms. C.
En un diseño factorial 24 con ½ repetición solo se deben usar 24-1=8 corridas, es decir 8
combinaciones de tratamientos y no las 16.
Para identificar las corridas o tratamientos a usar:
Construir una tabla de signos 2k=24 con los efectos principales y con la interacción que
se va confundir (la de mayor orden ABCD).
En la columna de la interacción confundida elegir los tratamientos que tienen el mismo
signo (positivo o negativo).
Combinación A B C D ABCD
tratamiento
(1) - - - - +
a + - - - -
b - + - - -
ab + + - - +
c - - + - -
ac + - + - +
bc - + + - +
abc + + + - -
d - - - + -
ad + - - + +
bd - + - + +
abd + + - + -
cd - - + + +
acd + - + + -
bcd - + + + -
abcd + + + + +
SC
(C j ) 2
2 k 1
En la tabla de tratamientos y efectos, solo se consideran los tratamientos elegidos (-) y los efectos
de un diseño 24 sin considerar el efecto ABCD por estar confundida.
152
Métodos Estadísticos para la Investigación experimental
La suma de cuadrados son iguales, de: A=BCD, B=ACD, …, AB=CD; estos son los llamados
pares aliados. En el ANVA de cada para aliado solo se elige a uno de ellos.
Los pares aliados se obtienen así:
AxABCD=A2BCD=BCD aliado de A
BxABCD=AB2CD=ACD aliado de B
ABxABCD=A2B2CD=CD aliado de AB
Estos son diseños en los que ningún efecto principal es aliado de otro principal pero si lo son de
DISEÑOS DE RESOLUSIÓN IV
Estos son diseños en los que ningún efecto principal es aliado de otro principal, ni de alguna
DISEÑOS DE RESOLUSIÓN V
Estos son diseños en los que ningún efecto principal es aliado de otro principal, ni de alguna
Un diseño es de resolución R si ningún efecto de p factores es aliado de otro efecto que tenga
menor de R-p factores. Se usa el numeral romano para indicar su resolución.
153
Elías Alberto Torres Armas, Lic. Ms. C.
EJEMPLO. Se desea iniciar una investigación experimental con 5 factores cada uno a dos niveles.
Sólo se dispone de una capacidad para 25-1=16 ensayos. Se puede construir el diseño de máxima
resolución y realizar el análisis con los datos registrados.
*: Tratamientos a usar:
A: Temperatura : -, +
B: Presión : -, +
C: Velocidad : -, +
D: pH : -, +
E: Humedad : -, +
Y: Dureza
E=ABCD generador
I=ABCDE relación definición
Aliados: EfectosxI ( 2V51 )
A=BCDE AB=CDE BD=ACE
B=ACDE AC=BDE BE=ACD
C=ABDE AD=BCE CD=ABE
D=ABCE AE=BCD CE=ABD
E=ABCD BC=ADE DE=ABC
C j CijYi
Para obtener los contrastes, efectos y suma de cuadrados por el método de los signos
t 16
i 1
154
Métodos Estadísticos para la Investigación experimental
En el análisis de varianza se puede optar por mancomunar los efectos de las interacciones a
excepción de AB que parece ser de importancia.
Combinación A B C D E AB AC AD AE BC BD BE CD CE DE Yi.
tratamiento
E - - - - + + + + - + + - + - - 8
A + - - - - - - - - + + + + + + 9
B - + - - - - + + + - - - + + + 34
Abe + + - - + + - - + - - + + - - 52
C - - + - - + - + + - + + - - + 16
Ace + - + - + - + - + - + - - + - 22
Bce - + + - + - - + - + - + - + - 45
Abc + + + - - + + - - + - - - - + 60
D - - - + - + + - + + - + - + - 6
Ade + - - + + - - + + + - - - - + 10
Bde - + - + + - + - - - + + - - + 30
Abd + + - + - + - + - - + - - + - 50
Cde - - + + + + - - - - - - + + + 15
Acd + - + + - - + + - - - + + - - 21
Bcd - + + + - - - - + + + - + - - 44
Abcde + + + + + + + + + + + + + + + 63
Cj 89 271 87 -7 5 55 3 9 9 5 -1 -1 7 3 -11 485
ef k 2
Cj
11.125
33.875
10.875
-0.875
-0.125
-0.125
-1.375
0.625
6.875
0.375
1.125
1.125
0.625
0.875
0.375
2
4590.0625
SC
495.0625
473.0625
189.0625
(C j ) 2
3.0625
1.5625
0.5625
5.0625
5.0625
1.5625
0.0625
0.0625
3.0625
0.5625
7.5625
2 k 1
El análisis de varianza
F de V gl SC CM F
A 1 495.0625 495.0625 189.10
B 1 4590.063 4590.0625 1753.23
C 1 473.0625 473.0625 180.69
D 1 3.0625 3.0625 1.17
E 1 1.5625 1.5625 0.60
AB 1 189.0625 189.0625 72.21
AC 1 0.5625
AD 1 5.0625
AE 1 5.0625
BC 1 1.5625
BD 1 0.0625
BE 1 0.0625
CD 1 3.0625
CE 1 0.5625
DE 1 7.5625
Error 9 23.5625 2.6181
Total 15 5775.4375
155
Elías Alberto Torres Armas, Lic. Ms. C.
Se conoce como fracción ¼ porque solamente puede usarse la cuarta parte de las corridas de
un diseño completo. En este diseño solo se dispone 2k-2 unidades experimentales. Para
construir este diseño primero se escriben las combinaciones para el diseño 2 k-2 y después se
agregan dos factores como generadores, cada uno como el producto de los signos de
interacciones del diseño 2k-2 elegidas adecuadamente, los mismos que generan dos relaciones
de definición I1, I2, de tal manera que la relación generalizada I3= I1xI2 sea de orden adecuado
(mod2). En este caso cada efecto tiene tres aliados, multiplicando cada efecto por I1, I2 y I3.
I1=ABCE I2=BCDF
I3=ABCExBCDF=AB2C2DEF=ADEF
A=BCE=DEF=ABCDF AD=EF=ABCF=BCDF
B=ACE=CDF=ABDEF AE=BC=DF=ABCDEF
C=ABE=BDF=ACDEF AF=DE=ABCD=BCDF
D=AEF=BCF=ABCDE BD=CF=ABDF=ACDE
E=ABC=ADF=BCDEF BF=CD=ABDE=ACEF
F=ADE=BCD=ABCEF ABD=CDE=ACF=BEF
AB=CE=ACDF=BDEF ACD=BDE=ABF=CEF
AC=BE=ABDF=CDEF
Existen tablas con generadores para obtener diseños de máxima resolución. Este diseño 2 6IV2
(Resolución IV). Resol: Longitud palabra más corta de I i.
156
Métodos Estadísticos para la Investigación experimental
ef k 3
Cj
13.875
35.625
11.875
-0.875
-1.625
-5.375
-1.875
-0.125
-0.125
-4.875
1.375
0.375
0.375
0.625
0.125
2
5076.5625
SC
770.0625
564.0625
115.5625
(C j ) 2
10.5625
14.0625
95.0625
3.0625
7.5625
0.5625
0.5625
0.5625
0.0625
0.0625
2 k 2 0.0625
El análisis de varianza
F de V gl SC CM F
A 1 770.0625 770.0625 25.99
B 1 5076.563 5076.563 171.36
C 1 3.0625 3.0625 0.10
D 1 7.5625 7.5625 0.26
E 1 0.5625 0.5625 0.02
F 1 0.5625 0.5625 0.02
AB 1 564.0625 564.0625 19.04
Error 8 237 29.625
157
Elías Alberto Torres Armas, Lic. Ms. C.
Total 15 6659.438
PROYECCION DEL FACTORIAL FRACCIONARIO
Cuando en experimentos 2k se desea usar bloques, entonces cada uno de los bloques debe tener
2k unidades experimentales, para que en dichos bloques puedan correrse todos los tratamientos;
sin embargo en experimentos 2k el número de factores crece rápidamente (23, 24, 25,…) por lo
que hacer una réplica completa en cada bloque resulta poco viable. Si cada bloque dispone de 2 k-1,
2k-2, 2k-3, unidades experimentales, se puede hacer uso de la técnica de la confusión (confundido).
La técnica de la confusión es aquella es aquella que nos permite acomodar un experimento
factorial completo en bloques incompletos, donde el tamaño de cada uno de estos bloques es de
2k-1, 2k-2, …, unidades experimentales; es decir el tamaño de cada bloque incompleto es la mitad, o
la cuarta parte, … , del bloque completo.
Al usar la técnica de la confusión se pierde la información de una o de más interacciones, las que
deben ser elegidas adecuadamente por el investigador; estas, generalmente son las que parecen
tener poco valor o poco interés.
Vamos a desarrollar la construcción y análisis del diseño factorial 2k en 2p bloques incompletos
cada réplica con p<k.
Si p=1 2k en 2 bloques incompletos cada replicación
Si p=2 2k en 4 bloques incompletos cada replicación
Si p=3 2k en 8 bloques incompletos cada replicación
El tamaño de cada bloque
p=1 2k-1 u.e, p=2 2k-2 u.e, p=3 2k-3 u.e
158
Métodos Estadísticos para la Investigación experimental
Efect k 1 SCefectos
Cj (C j ) 2
r2 r 2k
Si el experimento se realizó sin replicaciones, los bloques incompletos tienen 1 grado
de libertad y
Efect k 1 SCefectos k
Cj (C j ) 2
2 2
L 1 X 1 2 X 2 3 X 3 ... k X k con
- Se escribe el contraste de definición L
i : Exponente que aparece en i-ésimo factor del efecto que será confundido con:
i 0 Factor i no aparece en la interacción a confundirse
i 1 Factor i si aparece en la interacción a confundirse
1 1
1
Si 24=2A2B2C2D se confunde ABD (A1B1C0D1) 2
3 0
4 1
L=X1+X2+X4
Xi: Nivel del i-ésimo factor que aparece en una combinación de tratamiento
particular
Xi=1 Nivel alto
Xi=0 Nivel bajo
i: 1, 2, 3,…,k (1=factor A, 2=factor B, 3=factor C, …)
159
Elías Alberto Torres Armas, Lic. Ms. C.
SOLUCIÓN
a. El diseño
i. Tabla de signos
Trat A B C AB AC BC ABC
(1) - - - -
a + - - +
b - + - +
ab + + - -
c - - + +
ac + - + -
bc - + + -
abc + + + +
Dos bloques:
L 1 X 1 2 X 2 3 X 3 1 2 3 1
ii. Contraste de definición L
Bloques incompletes
160
Métodos Estadísticos para la Investigación experimental
b c abc a ac (1) ab bc
40 35 60 60 195 58 39 45 70 212
bc ab (1) ac a abc c b
64 60 38 70 232 45 69 45 47 206
a c b abc ac bc (1) ab
39 43 48 71 201 60 60 30 65 215
W yy 40 2 ... 65 2 3679.96
12612
24
Para obtener las sumas de cuadrados, con el método de los signos
Trat A B AB C AC BC Yi…
(1) - - + - + + 107
A + - - - - + 144
B - + - - + - 135
Ab + + + - - - 170
C - - + + - - 123
Ac + - - + + - 188
Bc - + - + - + 194
Abc + + + + + + 200
Cj 143 137 -61 149 -1 29 1261
Efect k 1
Cj Cj 11.916… -11.416… 5.083… 12.416… -0.083… 2.416…
r2 3 * 22
SCefectos
852.04 782.04 155.04 925.04 0.04 35.04
(C j ) 2 (C j ) 2
r 2k 3 * 23
=
161
Elías Alberto Torres Armas, Lic. Ms. C.
107=39+38+30
Se está estudiando el efecto que tienen 4 factores Temperatura (A), fusión (B), concentración de
los reactivos (C) y rapidez de mezclado (D) sobre la tasa de filtración de un producto en una
planta piloto. Suponga que no se pueden efectuar las 24 combinaciones de tratamientos en un
mismo día. Diariamente el experimentador puede ensayar 8 combinaciones por lo que un diseño
24 confundido en 2 bloques resulta apropiado. Es lógico confundir la interacción de mayor
orden ABCD.
SOLUCIÓN
a. Construcción del diseño
i. Usando tabla de signos
Combinación A B C D ABCD
tratamiento
(1) - - - - +
a + - - - -
b - + - - -
ab + + - - +
c - - + - -
ac + - + - +
bc - + + - +
abc + + + - -
d - - - + -
ad + - - + +
bd - + - + +
abd + + - + -
cd - - + + +
acd + - + + -
bcd - + + + -
abcd + + + + +
162
Métodos Estadísticos para la Investigación experimental
I (1) ab ac bc ad bd cd abcd
45 65 60 80 100 45 75 96 566
1121
II a b c d abc bcd acd abd
71 48 68 43 65 70 86 104 555
Para facilitar los cálculos puede usarse el algoritmo de YATES. El experimentador piensa que la
interacción de 3 factores son despreciables, las que al mancomunarse conforman el error
experimental.
ef , r 1 SC
Combinación Rpta 1 2 3 4 (C j ) 2 (C j ) 2 (C j ) 2
tratamiento (C j )
r 2 k 1
Cj r 2k 1* 2 4 16
(1) 45 116 229 502 1121
a 71 113 273 619 173 21.625 1870.5625
b 48 128 294 20 25 3.125 39.0625
ab 65 145 327 153 1 0.125 0.0625
c 68 143 43 14 79 9.875 390.0625
ac 60 149 -23 11 -145 -18.125 1314.0625
bc 80 161 116 -16 19 2.375 22.5625
abc 65 166 37 17 15 1.875 14.0625
d 43 26 -3 44 117 14.625 855.5625
ad 100 17 17 35 133 16.625 1105.5625
bd 45 -8 6 -66 -3 -0.375 0.5625
abd 104 -15 5 -79 33 4.125 68.0625
cd 75 57 -9 20 -9 -1.125 5.0625
acd 86 59 -7 -1 -13 -1.625 10.5625
bcd 70 11 2 2 -21 -2.625 27.5625
abcd 96 26 15 13 11 1.375 7.5625
W yy 45 2 ... 96 2 5730.9375
11212
16
163
Elías Alberto Torres Armas, Lic. Ms. C.
164
Métodos Estadísticos para la Investigación experimental
En este diseño 2k, cada bloque debe tener 2k-3 unidades experimentales. Deben seleccionarse
p=3 efectos independientes que serán confundidos. Por independiente se entiende que
ningún efecto elegido es igual a la interacción generalizada de los otros. Los bloques se
165
Elías Alberto Torres Armas, Lic. Ms. C.
pueden generar usando los contrastes de definición L 1, L2, L3, los otros 4 efectos serán
confundidos con los bloques, siendo estos las interacciones generalizadas de los 3 efectos
independientes elegidos originalmente. Los efectos que serán confundidos deben elegirse
cuidadosamente para no sacrificar alguna información importante. El análisis estadístico de
estos diseños es directo, las sumas de cuadrados de todos los efectos se calculan como si no
existieran los bloques. La suma de cuadrados de bloques puede determinarse sumando las
sumas de cuadrados de los efectos que se confunden con los bloques. (Ver tabla 7.8 de
Montgomery).
El uso de diseños de superficie de respuesta es una alternativa más adecuada que utiliza técnicas
matemáticas y estadísticas para establecer la relación entre los factores y la variable dependiente,
Aplicación de las técnicas de región múltiple para elegir la mejor para elegir la mejor ecuación
que representa a los datos
Determinar los valores de los factores o variables de control que producirán una respuesta
óptima
Describir gráficamente cómo es la superficie de respuesta en las inmediaciones de la respuesta
óptima.
Yˆ b0 b j X j b jj X 2j bij X i X j
que puede describir adecuadamente la región óptima:
k k k k
j 1 j 1 i 1 j 1
Yˆ b0 b j X j b jj X 2j bij X i X j
k k k k
j 1 j 1 i 1 j 1
Los coeficientes del modelo matemático de segundo orden pueden estimarse por mínimos
cuadrados, de manera matricial:
b ( X ' X ) 1 X 'Y
X 1, X 1 , X 2 , X 12 , X 22 , X 1 X 2
Donde:
b: Vector de coeficientes,
X: matriz del diseño,
166
Métodos Estadísticos para la Investigación experimental
Se hace a través del análisis de varianza. Por ejemplo para un diseño de dos factores
F de V SC gl CM F
A F1(yy) 1 F1 F1/E
B F2(yy) 1 F2 F2/E
AA F11(yy) 1 F11 F11/E
BB F22(yy) 1 F22 F22/E
AB F12(yy) 1 F12 F12/E
Error experimental Eyy n-6 E
Falta de ajuste Qyy n-nc-5 Q Q/P
Puro error Pyy nc-L P
Total Wyy n-1
W yy (Yij Y ) 2
C jj
n datos E yy W yy R yy
A partir del modelo de regresión, los valores óptimos de los factores se obtienen por métodos
analíticos de optimización. En los modelos matemáticos de segundo orden se construye el
sistema de ecuaciones:
Y Y Y
0 0 0
X 1 X 2 X k
...
167
Elías Alberto Torres Armas, Lic. Ms. C.
2Y 2Y 2Y
X 2 X 1 X 2 X 1 X k
1
2Y 2Y 2Y
H X 1 X 2 X 22 X 2 X k
2
Y 2Y
X X X k2
1 k
a. DISEÑOS ROTABLES
Un diseño experimental es rotable cuando se tiene igual facultad de predicción en todas las
direcciones a partir de un punto experimental centrado (X0) y donde los otros puntos
experimentales están a una distancia constante del punto central. Esto significa que la varianza
depende solamente de la distancia del punto (X 1, X2,…, Xk) al punto central del diseño
(X0). En un diseño rotable los contornos de la varianza son círculos concéntricos alrededor del
punto central. Así por ejemplo son diseños rotables para k=2:
1 1
9 0 0
X1 , X2
P P6
1 1
, valores codificado s; Z i : valores originales
168
Métodos Estadísticos para la Investigación experimental
Z max Z min
1 si Z i Min Zi
Z i Z1
A X1 Xi
1 si Z i Max Z max Z min Z max Z min
2
Z Z min
2 2
1 si Z i Min Z i max
Zi Z 2
B X2 Xi
1 si Z i Max Z max Z min Z max Z min
2
2 2
a.2. DISEÑO OCTOGONAL
Este diseño es más confiable, debido a que utiliza un mayor número de pruebas
experimentales. Este diseño consta de 8 vértices correspondientes a un octágono regular, más
los puntos centrales para estimar la varianza del error experimental. Ejemplo: Realizar el
análisis del siguiente experimento:
Variables originales
Variables Niveles
Inferior Superior
Z1=%Cal 23.9 85.9
Z2=Temperatura 663 83.7
Z1:%Cal
169
Elías Alberto Torres Armas, Lic. Ms. C.
2 2
Z2: Temperatura
Z Z min 837 663
Z i max Z1
Xi 0.707 Z 2 812
Z max Z min 837 663
2 2
2 2
j 1 j 1 i 1 j 1
F de V SC gl CM F p-valor
A 81.6436 1 81.6436 4.27 0.0937
B 17.9973 1 17.9973 0.94 0.3767
AA 47.3389 1 47.3389 2.47 0.1765
BB 0.1197 1 0.1197 0.01 0.9400
AB 25 1 25.0000 1.31 0.3048
Error experimental 95.6628 5 19.1326
Falta de ajuste 42.9961 3 14.3320 10.75 0.0863
Puro error 2.6667 2 1.3334
Total 220.727 10
170
Métodos Estadísticos para la Investigación experimental
171
Elías Alberto Torres Armas, Lic. Ms. C.
X1 X2 Z1 Z2 Y
-1 -1 80 170 76.5
-1 1 80 180 77.0
1 -1 90 170 78.0
1 1 90 180 79.5
0 0 85 175 79.5
0 0 85 175 80.3
0 0 85 175 80.0
0 0 85 175 79.7
0 0 85 175 79.8
1.414 0 92.07 175 78.4
-1.414 0 77.93 175 75.6
0 1.414 85 182.07 78.5
0 -1.414 85 167.93 77.0
Z 85
Z i Z1 para X 1 1.414 se tiene : 1.414 i Z1 92.07
Xi
Z max Z min Z 175
5
para X 1.414
,
se tiene : 1.414 i Z 2 167.93
2 2
5
Y
0 0.995 2.752 X 1 0.250 X 2 0
X 1
Y
0 0.515 2.002 X 2 0.250 X 1 0
X 2
2.752 X 1 0.250 X 2 0.995 X 1 0.3896 Z1 86.94
Yˆmáx 80.23
2.002 X 2 0.250 X 1 0.515 X 2 0.3051 Z 2 176.76
F de V SC gl CM F p-valor
A 7.9198 1 7.9198 111.93 0.00001
B 2.1232 1 2.1232 30.01 0.00093
AA 13.1761 1 13.1761 186.22 0.00000
BB 6.9739 1 6.9739 98.56 0.00002
AB 0.25 1 0.25 3.53 0.10221
Error experimental 0.4953 7 0.07076
Falta de ajuste 0.2833 3 0.0944 1.78 0.28969
Puro error 0.212 4 0.053
172
Métodos Estadísticos para la Investigación experimental
Total 12
EJERCICIO: Presentar un diseño compuesto central para 3 factores y n c=6 puntos centrales.
La región de exploración es: Z1(13, 17), Z2(80, 100) y Z3(300, 400). Z1:Velocidad, Z2: Tiempo y
Z3:Temperatura.
Si X1, X2, … , Xp denota las proporciones de una mezcla, éstas deben satisfacen ciertas
restricciones:
En experimentos con mezclas, los modelos que permiten pronosticar el valor de la variable
dependiente en función de sus componentes pueden expresarse de una manera especial:
Y i X i
Modelo lineal:
p
i 1
Y i X i ij X i X j
Modelo cuadrático
p
i 1 i j
Modelo cúbico
i 1 i j i j i j
173
Elías Alberto Torres Armas, Lic. Ms. C.
Y i X i ij X i X j
p
Xi X j Xk
i 1 i j i j k
ijk
Se puede agregar:
Puntos duplicados
Puntos de argumento (% para las p componentes)
1. EJEMPLO:
Pto Proporción Y
X1 X2 X3
1 1 0 0 11.7
2 0.5 0.5 0 15.3
3 0 1 0 9.4
4 0 0.5 0.5 10.5
5 0 0 1 16.4
6 0.5 0 0.5 16.9
El modelo matemático:
Valores óptimos
A=29.38%
B=0.0%
C=70.62%
Yˆ 17.38
174
Métodos Estadísticos para la Investigación experimental
2. EJEMPLO:
X1 : 0.3 X 1 0.4
X2 : 0.1 X 2 0.2
X3 : 0.5 X 3 0.6
Es otra alternativa para la estimación de superficies de respuesta. Estos diseños tienen ventajas
sobre los diseños compuestos centrales:
Existen solamente 3 niveles en cada factor (-1, 0, 1), mientras que en el diseño compuesto
central deben controlarse 5 niveles (- , 1, 0, 1, )
Para construir diseños de 3-5 factores, se forman todos los posibles pares factoriales 22,
manteniendo en cero o su nivel medio en cero o su nivel medio al factor no considerado,
añadiendo los puntos centrales; en los diseños de 6-9 factores se consideran factoriales 23,
completando con ceros los factores no considerados, agregando puntos centrales.
Corrida X1 X2 X3 Z1 Z2 Z3 Y1 Y2
1 -1 -1 0 80 7 310 13 87.6
2 1 -1 0 90 7 310 14 91.6
3 -1 1 0 80 7.4 310 7.3 71
4 1 1 0 90 7.4 310 6 69.8
5 -1 0 -1 80 7.2 300 12 83.1
6 1 0 -1 90 7.2 300 9.8 76
7 -1 0 1 80 7.2 320 7.5 72.4
8 1 0 1 90 7.2 320 5.7 68.5
9 0 -1 -1 85 7 300 11 82.2
10 0 1 -1 85 7.4 300 9.8 76.5
11 0 -1 1 85 7 320 13 90
175
Elías Alberto Torres Armas, Lic. Ms. C.
Donde:
Variables Niveles
Inferior Superior
Z1 80 (-1) 90 (1)
Z2 7.0 (-1) 7.4 (1)
Z3 300 (-1) 320 (1)
176
Métodos Estadísticos para la Investigación experimental
39 1 0 -1 0 0 1 1 22
40 1 0 1 0 0 1 1 25
41 1 -1 0 -1 0 0 -1 24
42 1 1 0 -1 0 0 -1 27
43 1 -1 0 1 0 0 -1 25
44 1 1 0 1 0 0 -1 35
45 1 -1 0 -1 0 0 1 21
46 1 1 0 -1 0 0 1 25
47 1 -1 0 1 0 0 1 20
48 1 1 0 1 0 0 1 25
49 1 0 0 0 0 0 0 18
50 1 0 0 0 0 0 0 19
51 1 0 0 0 0 0 0 20
52 1 0 0 0 0 0 0 20
53 1 0 0 0 0 0 0 18
54 1 0 0 0 0 0 0 15
El análisis se realiza de manera similar a los desarrollados anteriormente. Suponga que se realiza una
investigación con F=6 factores con la aplicación de Box-Behnken con 6 puntos centrales. Los
resultados se presentan en la última columna, junto al diseño. Realizar el análisis.
REFERENCIAS BIBLIOGRÁFICAS
BOX, HUNTER, HUNTER (1995). Estadística para Investigadores. Editorial Reverté S.A.
de Barcelona España.
LEE WAYNE (1975) Experimental Desing and Analysis W.H. Freedman and Company.
San Francisco USA.
OSTLE BERNARD (1973) Estadística Aplicada. Editorial Limusa Willey S.A. de México.
Tercera Reimpresión.
177
Elías Alberto Torres Armas, Lic. Ms. C.
178
Métodos Estadísticos para la Investigación experimental
179