Está en la página 1de 142

Estadística Inferencial 2

Contenido
Introducción: ..................................................................................... 3
Unidad 1: Regresión lineal simple y múltiple ................................... 5
1.1 Regresión Lineal simple .................................................................. 6
1.1.1 Prueba de hipótesis en la regresión lineal simple. .......................... 14
1.1.2 Calidad del ajuste en regresión lineal simple ................................. 17
1.1.3 Estimación y predicción por intervalo en regresión lineal simple ...... 22
1.1.4 Uso de un software estadístico .................................................... 24
1.2 Regresión lineal múltiple ............................................................... 27
1.2.1 Pruebas de hipótesis en regresión lineal múltiple ........................... 32
1.2.2 Intervalos de confianza y predicción en regresión múltiple .............. 34
1.2.3 Uso de un software estadístico .................................................... 35
Unidad 2: Diseño de experimentos de un factor.............................. 38
2.1 Familia de diseños para comparar tratamientos................................ 41
2.2 El modelo de efectos fijos .............................................................. 42
2.3 Diseño completamente aleatorio y ANOVA ....................................... 43
2.4 Comparaciones o pruebas de rangos múltiples ................................. 50
2.5 Verificación de los supuestos del Modelo ......................................... 53
2.6 Uso de un software estadístico ....................................................... 55
Unidad 3: Diseño de bloques........................................................... 60
3.1 Diseños en bloques completos al azar ............................................. 61
3.2 Diseño en cuadrado latino ............................................................. 64
3.3 Diseño en cuadrado grecolatino ..................................................... 71
3.4 Uso de un software estadístico ....................................................... 72
Unidad 4: Conceptos básicos en diseños factoriales ....................... 76
4.1 Diseños factoriales con dos factores ............................................... 78
4.2 Diseños factoriales con tres factores ............................................... 81
4.3 Diseño factorial general ................................................................ 83
4.4 Modelos de efectos aleatorios ........................................................ 87
4.5 Uso de un software estadístico ....................................................... 89
Unidad 5: Series de tiempo ............................................................. 93
5.1 Modelo clásico de series de tiempo ................................................. 94
5.2 Análisis de fluctuaciones ............................................................... 98
5.3 Análisis de tendencia .................................................................. 100

1
Estadística Inferencial 2

5.4 Análisis de variaciones cíclicas ..................................................... 101


5.5 Medición de variaciones estacionales e irregulares .......................... 102
5.6 Aplicación de ajustes estacionales ................................................ 104
5.7 Pronósticos basados en factores de Tendencia y estacionales ........... 105
Catapulta ........................................................................................ 107
Diseño de la catapulta ...................................................................... 128
Anexos ........................................................................................... 129
Tablas ............................................................................................ 130
Glosario .......................................................................................... 137
Diseño Experimental (DOE) ............................................................... 139
Bitácora .................................................. Error! Bookmark not defined.
Lista del Reporte ..................................... Error! Bookmark not defined.
Bibliografías .................................................................................... 141

2
Estadística Inferencial 2

Introducción:

La estadística inferencial es una parte de la estadística que comprende los


métodos y procedimientos que por medio de la inducción determina
propiedades de una población estadística, a partir de una pequeña parte de
la misma. Donde comprende:

 La toma de muestras o muestreo, que se refiere a la forma adecuada


de considerar una muestra que permita obtener conclusiones
estadísticamente válidas y significativas.
 La estimación de parámetros o variables estadísticas, que permite
estimar valores poblacionales a partir de muestras de mucho menor
tamaño.
 El contraste de hipótesis, que permite decidir si dos muestras son
estadísticamente diferentes, si un determinado procedimiento tiene un
efecto estadístico significativo, etc.
 El diseño experimental.
 La inferencia bayesiana.
 Los métodos no paramétricos

El enfoque sugerido para la materia requiere que las actividades prácticas


promuevan el desarrollo de habilidades para la experimentación, tales como:
identificación, manejo, control de variables y de datos relevantes; además
del planteamiento de una estructura de experimentación; se desarrollarán
prácticas de laboratorio de cómputo para introducir al estudiante en uso del
software estadístico disponible, como es el Minitab con la opción de ANOVA y
DOE e interpretación de resultados.

El enfoque de la asignatura se presenta para que el estudiante desarrolle las


competencias aplicando las bases estadísticas obtenidas en las materias
antecedentes, de tal forma que establezca el problema a resolver con el
diseño y análisis de experimentos más conveniente a una situación real.
Identificará, variables a controlar y registrar los elementos que le permitan
diseñar los problemas de manera más autónoma.

Uno de los objetivos particulares más importantes que en general tiene un


diseño factorial es determinar una combinación de niveles de los factores en
la cual es desempeño del proceso sea mejor que en las condiciones de
operación actuales, es decir, encontrar nuevas condiciones de operación que
eliminen o disminuyan cierto problema de calidad en la variable de salida.

Los factores pueden ser de tipo cualitativo (maquinas, tipo de material,


operador, presencia o ausencia de una operación previa etc.) o de tipo
cuantitativo (temperatura, humedad, velocidad, presión etc.)

3
Estadística Inferencial 2

Para poder estudiar de manera en que influye cada factor sobre una variable
de respuesta, es necesario elegir al menos dos niveles de prueba para cada
uno de ellos

4
Estadística Inferencial 2

Unidad 1:
Regresión lineal
simple y
múltiple

5
Estadística Inferencial 2

1.1 Regresión Lineal simple


El término regresión fue introducido por Francis Galton en su libro Natural
inheritance (1889) y fue confirmada por su amigo Karl Pearson. Su trabajo
se centró en la descripción de los rasgos físicos de los descendientes (variable
A) a partir de los de sus padres (variable B). Estudiando la altura de padres
e hijos a partir de más de mil registros de grupos familiares, se llegó a la
conclusión de que los padres muy altos tenían una tendencia a tener hijos
que heredaban parte de esta altura, pero que revelaban también una
tendencia a regresar a la media. Galton generalizó esta tendencia bajo la "ley
de la regresión universal": Cada peculiaridad en un hombre es compartida
por sus descendientes, pero en media, en un grado menor. La primera forma
de regresiones lineales documentada fue el método de los mínimos
cuadrados, el cual fue publicado por Legendre en 1805,1 y en dónde se incluía
una versión del teorema de Gauss-Márkov. Mínimos cuadrados Mínimos
cuadrados es una técnica de análisis numérico encuadrada dentro de la
optimización matemática, en la que, dados un conjunto de pares (o ternas,
etc), se intenta encontrar la función que mejor se aproxime a los datos (un
"mejor ajuste"), de acuerdo con el criterio de mínimo error cuadrático.
En su forma más simple, intenta minimizar la suma de cuadrados de las
diferencias ordenadas (llamadas residuos) entre los puntos generados por la
función y los correspondientes en los datos. Específicamente, se llama
mínimos cuadrados promedio (LMS) cuando el número de datos medidos es
1 y se usa el método de descenso por gradiente para minimizar el residuo
cuadrado. Se puede demostrar que LMS minimiza el residuo cuadrado
esperado, con el mínimo de operaciones (por iteración), pero requiere un
gran número de iteraciones para converger.

El término regresión se utilizó por primera vez en el estudio


de variables antropométricas: al comparar la estatura de padres e hijos,
donde resultó que los hijos cuyos padres tenían una estatura muy superior
al valor medio, tendían a igualarse a éste, mientras que aquellos cuyos
padres eran muy bajos tendían a reducir su diferencia respecto a la estatura
media; es decir, "regresaban" al promedio. La constatación empírica de esta
propiedad se vio reforzada más tarde con la justificación teórica de ese
fenómeno.
El término lineal se emplea para distinguirlo del resto de técnicas
de regresión, que emplean modelos basados en cualquier clase de función
matemática. Los modelos lineales son una explicación simplificada de la
realidad, mucho más ágiles y con un soporte teórico mucho más extenso por
parte de la matemática y la estadística.
Pero bien, como se ha dicho, se puede usar el término lineal para distinguir
modelos basados en cualquier clase de aplicación.
El análisis de regresión se usa con el propósito de predicción. La meta del
análisis de regresión es desarrollar un modelo estadístico que se pueda usar
para predecir los valores de una variable dependiente o de respuesta basados

6
Estadística Inferencial 2

en los valores de al menos una variable independiente o explicativa. Este


capítulo se centra en un modelo de regresión lineal simple, que usa una
variable numérica independiente para predecir la variable numérica
dependiente.
Para establecer una relación cuantitativa entre y es necesario disponer de
cierta información muestral. Esta información consiste de un conjunto de
pares de observaciones de y, donde cada uno de estos pares pertenece a una
unidad elemental particular de la muestra. Por ejemplo, suponga que el
rendimiento de un proceso químico está relacionado con la temperatura de
operación, o la experiencia profesional de los trabajadores y sus respectivos
sueldos, las estaturas y pesos de personas, la producción agraria y la cantidad
de fertilizantes utilizados, etc. Si mediante un modelo matemático es posible
describir tal relación, entonces este modelo puede ser usado para propósitos
de predicción, optimización o control.

Regresión Lineal Simple Planteamiento:

El comportamiento de una magnitud económica puede ser explicado a través


de otra

𝑦 = 𝐹(𝑥)

Si se considera que la relación puede ser de tipo lineal, la formalización


vendría determinada por una ecuación como la siguiente

𝑦 = 𝐵1 + 𝐵2 𝑋

Dado que las relaciones en las ciencias sociales no son exactas se incluye el
término de perturbación aleatoria

𝑦 = 𝛽1 + 𝛽 2 𝑋 + 𝑈

Supongamos que se dispone de T observaciones de las variable Y y X

𝑌1 = 𝛽1 + 𝛽 2 𝑋1 + 𝑈1

𝑌2 = 𝛽1 + 𝛽2 𝑋2 + 𝑈2

𝑌𝑛 = 𝐵1 + 𝐵2 𝑋𝑛 + 𝑈𝑛

De forma abreviada el sistema de ecuaciones se puede escribir de la siguiente


manera

𝑌 𝑡 = 𝐵1 + 𝐵2 𝑋 𝑡 + 𝑈𝑡

𝑇 = 1,2,3 … … … … . 𝑡

El objetivo del análisis de regresión es la estimación de los parámetros. El


primer paso es la representación gráfica de las variables (y,x) en un diagrama
de dispersión

7
Estadística Inferencial 2

Dado que la relación de dependencia entre ambas variables es aleatoria o


estocástica, las observaciones no se encontrarán a lo largo de una recta.

8
Estadística Inferencial 2

La relación del modelo matemático adecuado tiene influencia de la


distribución de los valores y en el diagrama de dispersión. Es sencillo ver esto
si se examinan las siguientes graficas:

A. Relación lineal positiva

B. Relación lineal negativa

C. No hay relación entre X y Y

D. Relación curvilínea positiva

9
Estadística Inferencial 2

E. Relación curvilínea en forma de U

F. Relación curvilínea negativa

En la gráfica A se observa que los valores de Y, en general, aumentan en


forma lineal cuando se incrementa X.
En la gráfica B es un ejemplo de una relación lineal negativa. Cuando X crece,
se observa que los valores de Y decrecen. Un ejemplo de este tipo de relación
puede ser el precio de un producto específico y la cantidad de ventas.
En la gráfica C se muestra un conjunto de datos en el que existe muy poca o
ninguna relación entre X y Y. Para cada valor de X aparecen valores altos y
bajos de Y.
En la gráfica D muestran una relación curvilínea entre X y Y. Los valores de
Y aumentan cuando crece, pero el incremento disminuye para valores altos
de un ejemplo de esta relación curvilínea puede ser la edad y el costo de
mantenimiento de una máquina. Cuando la máquina tiene muchos años, el
costo de mantenimiento se eleva con rapidez al principio, pero después de
cierto número de años se nivela.
En la gráfica E muestra una relación parabólica o en forma de U entre X y Y.
Conforme X aumenta, al principio Y disminuye; pero si aumenta más, Y no
sólo deja de disminuir sino que aumenta después de su valor mínimo. Un
ejemplo tipo de relación puede ser el número de errores por hora en una
tarea y número de horas trabajadas.
Por ultimo en la gráfica F indica una relación exponencial o curvilínea negativa
entre X y Y. en este caso, Y disminuye con rapidez al principio del incremento
de pero después, cuando X aumenta más, la velocidad de disminución es
mucho menor. Un ejemplo de esta relación exponencial puede ser el valor de
reventa de un tipo dado de automóvil y los años que tiene. El primer año el
valor baja en forma drástica respeto a su precio original; sin embargo, la
disminución es mucho más lenta en los años subsecuentes.

10
Estadística Inferencial 2

El análisis de regresión lineal simple se refiere a encontrar la línea recta que


mejor se ajuste a los datos. El mejor ajuste puede definirse de varias
maneras. Quizá la más sencilla sea encontrar la línea recta para la cual las
diferencias entre los valores reales y los valores pronosticados a partir de la
recta ajustada de regresión sean tan pequeñas como sea posible. Sin
embargo, como estas diferencias son positivas para algunas observaciones y
negativas para otras, en términos matemáticos se minimiza la suma de los
cuadrados de las diferencias.

Suponga que las variables X y Y están relacionadas linealmente y que para


cada valor de X, la variable dependiente, Y, es una variable aleatoria. Es decir,
que cada observación de Y puede ser descrita por el modelo

𝑌 = 𝛽0 + 𝛽1 𝑥 + 𝜀
Donde 𝜀 es un error aleatorio con media cero y varianza 𝜎 2 . También suponga
que los errores aleatorios no están correlacionados. La ecuación es conocida
como el modelo de regresión lineal simple. Bajo el supuesto de que este
modelo es adecuado y como el valor esperado del error es cero 𝐸(𝜀) = 0, se
puede ver que el valor esperado de la variable Y, para cada valor de está
dado por línea recta.

𝐸(𝑌⁄𝑋) = 𝛽0 + 𝛽1 𝑋

En donde 𝛽0 y 𝛽1 son los parámetros del modelo y son constantes


desconocidas. Por lo tanto, para tener bien especificada la ecuación que
relaciona las dos variables será necesario estimar los dos parámetros, que
tienen los siguientes significados:
𝛽0 = Es el punto en el cual la línea recta intercepta o cruza el eje Y.
𝛽1 = Es la pendiente de la línea, es decir, es la cantidad en que se
incrementa o disminuye la variable por cada unidad que se incrementa
X.
Un procedimiento para ajustar la mejor recta y, por lo tanto, para estimar 𝛽0
y 𝛽1 es mediante el método de mínimos cuadrados, el cual consiste si de la
ecuación despejamos los errores, los elevamos al cuadrado y los sumamos,
obtendremos lo siguiente
𝑛 𝑛

𝑆 = ∑(𝜀𝑖 ) = ∑[ 𝑦𝑖 − (𝛽0 + 𝛽1 𝑥𝑖 )]2


2

𝑖=1 𝑖=1

De esta forma, se quieren encontrar los valores de 𝛽0 y 𝛽1 que minimizan la


suma de los errores cuadrados. Es decir, se busca ajustar la recta de manera
que la suma de las distancias en forma vertical de los puntos a la recta se
minimice.

11
Estadística Inferencial 2

El procedimiento matemático para minimizar los errores de la ecuación y así


encontrar los estimadores de mínimos cuadrados de 𝛽0 y 𝛽1 , consiste en
𝜕𝑆
derivar a 𝑆 con respecto a 𝛽𝑂 , y derivar también a 𝑆 con respecto a 𝛽1 ,
𝜕𝛽0
𝜕𝑆
se obtiene:
𝜕𝛽1
𝑛
𝜕𝑆 2
= − ∑ 2[ 𝑦𝑖 − (𝛽0 + 𝛽1 𝑥𝑖 )]
𝜕𝛽0
𝑖=1

𝑛
𝜕𝑆 2
= − ∑ 2𝑥𝑖 [ 𝑦𝑖 − (𝛽0 + 𝛽1 𝑥𝑖 )]
𝜕𝛽1
𝑖=1

Al igualar a cero las dos ecuaciones y resolverlas en forma simultánea con


respecto a las dos incógnitas (𝛽0 y 𝛽1 ), se obtiene la solución única

𝑆𝑥𝑦
𝛽̂1 =
𝑆𝑥𝑥

𝛽̂0 = 𝑦̅ − 𝛽̂1 𝑥̅

Donde
𝑛 𝑛
(𝑥𝑖 − 𝑥̅ ) (∑𝑛𝑖=1 𝑥𝑖 ) (∑𝑛𝑖=1 𝑦𝑖 )
𝑆𝑥𝑦 =∑ ∑ 𝑥𝑖 𝑦𝑖 −
(𝑦1 − 𝑦̅) = 𝑛
𝑖=1 𝑖=1

𝑛 𝑛 2
(∑𝑛𝑖=1 𝑥𝑖 )
𝑆𝑥𝑥 = ∑(𝑥𝑖 − 𝑥̅ )2 = ∑ 𝑥𝑖 2 −
𝑛
𝑖=1 𝑖=1

Es decir 𝑥̅ y 𝑦̅ son las medias muéstrales de las dos variables

∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛

∑𝑛𝑖=1 𝑦𝑖
𝑦̅ =
𝑛

De esta forma, para obtener la recta ajustada es necesario aplicar las


fórmulas anteriores, lo cual es muy sencillo.

Ejemplo:

12
Estadística Inferencial 2

En esta tabla, se relaciona la cantidad de fibra (madera) en la pulpa con la


resistencia del producto (papel).

Procedimiento para realizar los cálculos para la regresión simple para los
datos de la resistencia de la pulpa.

𝑛
(∑𝑛𝑖=1 𝑥𝑖 ) (∑𝑛𝑖=1 𝑦𝑖 ) (238)(2216)
𝑆𝑥𝑦 = ∑ 𝑥𝑖 𝑦𝑖 − = 39150 − = 1478
𝑛 14
𝑖=1

𝑛 2
2
(∑𝑛𝑖=1 𝑥𝑖 ) (238)2
𝑆𝑥𝑥 = ∑ 𝑥𝑖 − = 4956 − = 910
𝑛 14
𝑖=1

13
Estadística Inferencial 2

𝑆𝑥𝑦 1478
𝛽̂1 = = = 1.624
𝑆𝑥𝑥 910

𝛽̂0 = 𝑦̅ − 𝛽̂1 𝑥̅ = 158.286 − (1.624)(17) = 130.678

Por lo tanto, la línea recta que mejor explica la relación entre porcentaje de
fibra y resistencia del papel, está dada por:

𝑌̂ = 𝛽0 + 𝛽1 𝑥 = 130.678 + 1.624𝑥

1.1.1 Prueba de hipótesis en la regresión lineal simple.


En cualquier análisis de regresión no basta hacer los cálculos que se
explicaron antes, sino que es necesario evaluar qué tan bien el modelo (la
línea recta) explica la relación entre X y Y . Una primera forma de hacer esto
es probar una serie hipótesis sobre el modelo. Para ello es necesario suponer
una distribución de probabilidad para el término de error 𝜀𝑖 , Es usual suponer
normalidad: se distribuye en forma normal 𝜀𝑖 , independiente, con media cero
y varianza 𝜎 2 .
Por lo general, la hipótesis de mayor interés plantea que la pendiente es
significativamente diferente de cero. Esto se logra al aprobar la siguiente
hipótesis
𝐻0 : 𝛽1 = 0
𝐻𝐴 : 𝛽1 ≠ 0
14
Estadística Inferencial 2

El estadístico de prueba es:


𝛽1
𝑡0 =
√𝐶𝑀𝐸 /𝑆𝑋𝑋

Si la hipótesis nula es verdadera él estadístico tiene una distribución t-


Student con 𝑛 − 2 grados de libertad. Se rechaza 𝐻0 si el valor absoluto de
este estadístico es mayor que el correspondiente valor crítico obtenido de
tablas, es decir, se rechaza 𝐻0 si:

|𝑡0 | > 𝑡(𝛼⁄


2,𝑛−2)

En caso contrario no se rechaza 𝐻0 . No rechazar que 𝛽1 = 0, en el caso del


modelo de regresión lineal simple, implica que no existe una relación lineal
significativa entre X y Y; por tanto, no existe relación entre estas variables o
ésta es de otro tipo.
La suma de cuadrados de los residuos o suma de cuadrados del error (𝑆𝐶𝐸 )y
se utiliza para estimar la varianza del error de ajuste de un modelo, y está
dada por:
𝑛

𝑆𝐶𝐸 = ∑(𝑦𝑖 − 𝑦̂𝑖 )2


𝑖=𝑛

A partir de la ecuación anterior se obtiene que el valor esperado de la suma


de cuadrados, 𝐸(𝑆𝐶𝐸 ) del error está dado por:

𝐸(𝑆𝐶𝐸 ) = (𝑛 − 2)𝜎 2

Por lo tanto, un estimador insesgado de 𝜎 2 está dado por:

(𝑆𝐶𝐸 )
𝜎2 = = 𝐶𝑀𝐸
𝑛−2

En el caso de los datos de resistencia de la pulpa, el planteamiento de


hipótesis sería el siguiente
𝐻0 : 𝛽1 = 0
𝐻𝐴 : 𝛽1 ≠ 0

Aplicando el estadístico de prueba

𝛽1 1.624
𝑡0 = = = 12.725
√𝐶𝑀𝐸 /𝑆𝑋𝑋 √14.82/910
15
Estadística Inferencial 2

El valor de -Student encontrado en tablas con 𝑛 − 2 grados de libertad y un


0,05 de nivel de significancia es
𝑡(𝛼⁄2,𝑛−2) = 𝑡(0.05/2,14−2) = 𝑡(0.025,12) = 2.179

|𝑡0 | > 𝑡(𝛼⁄ = |12.725| > 2.179 Se rechaza la Hipótesis nula


2,𝑛−2)

En ocasiones, en lugar de probar que 𝛽1 = 0 , puede ser de interés probar que


es igual a cierta constante (𝐻0 : 𝛽1 = 𝑐) , en este caso en el numerador del
estadístico de la expresión se resta c, es decir, el estadístico queda de la
siguiente manera (𝛽̂1 − 𝑐)/√𝐶𝑀𝐸 /𝑆𝑥𝑥 y el criterio de rechazo es el mismo.
Si se utiliza como criterio de rechazo la comparación de la significancia
observada (p-value o valor p) contra la significancia predefinida (𝛼), entonces
se rechaza 𝐻0 si el valor p< 𝛼.

Por otro lado, con respecto del parámetro suele ser de interés probar la
siguiente hipótesis:
𝐻0 : 𝛽0 = 0
𝐻𝐴 : 𝛽0 ≠ 0

El estadístico de prueba es el siguiente:


𝛽̂0
𝑡0 =
1 𝑥̅ 2
√𝐶𝑀𝐸 [ +
𝑛 𝑆𝑥𝑥 ]
16
Estadística Inferencial 2

El cual tiene una distribución t-Student con n-2 grados de libertad, por lo que
𝐻0 se rechaza si:
|𝑡0 | > 𝑡(𝛼⁄
2,𝑛−2)
o si se utiliza el criterio de la significancia observada se rechaza 𝐻0 si el valor-
p. No rechazar 𝛽0 = 0 que simplemente significa que el punto de corte de la
línea recta pasa por el origen, es decir pasa por (0,0). En ocasiones, en lugar
de probar que 𝛽0 = 0 , puede ser de interés probar que es igual a cierta
constante (𝐻0 : 𝛽0 = 𝑐) ; en ese caso, en el numerador del estadístico de la
expresión se resta c, es decir, el estadístico queda de la siguiente manera:
𝛽̂0 − 𝑐
𝑡0 =
1 𝑥̅ 2
√𝐶𝑀𝐸 [ +
𝑛 𝑆𝑥𝑥 ]
Y el criterio de rechazo es el mismo.

En el caso de los datos de resistencia de la pulpa, el planteamiento de


hipótesis sería el siguiente:
𝛽̂0 130.67
𝑡0 = = = 54.42
1 𝑥̅ 2
√𝐶𝑀𝐸 [ + √14.82 [ 1 + 289]
𝑛 𝑆𝑥𝑥 ] 14 910

El valor de t-Student encontrado en tablas con n-2 grados de libertad y un


0,05 de nivel de significancia es:
𝑡(𝛼⁄2,𝑛−2) = 𝑡(0.05/2,14−2) = 𝑡(0.025,12) = 2.179
|𝑡0 | > 𝑡(𝛼⁄ = |54.42| > 2.179 Se rechaza la Hipótesis nula
2,𝑛−2)

La estimación de los parámetros del modelo y las pruebas de hipótesis sobre


los mismos se sintetizan en la siguiente tabla:

1.1.2 Calidad del ajuste en regresión lineal simple


En la sección anterior estudiamos pruebas de hipótesis para verificar que hay
una relación significativa entre X y Y; sin embargo, no hemos visto si tal
relación permite hacer estimaciones con una precisión aceptable. Por

17
Estadística Inferencial 2

ejemplo, es de interés saber qué tanta de la variabilidad presente en fue


explicada por el modelo, además si se cumplen los supuestos de los residuos.
Indicador del grado de Correlación
0.00 0.21 0.41 0.71 0.91
0.20 0.40 0.70 0.90 1.00
Nula Baja Regular Alta Muy Alta

Coeficiente de determinación 𝑅 2: Un primer criterio para evaluar la calidad


del ajuste es observar la forma en que el modelo se ajustó a los datos. En el
caso de la regresión lineal simple esto se distingue al observar si los puntos
tienden a ajustarse razonablemente bien a la línea recta. Pero otro criterio
más cuantitativo es el que proporciona el coeficiente de determinación, el
cual está definido por:

𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑝𝑜𝑟 𝑒𝑙 𝑚𝑜𝑑𝑒𝑙𝑜


𝑅2 =
𝑉𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑡𝑜𝑡𝑎𝑙

𝑆𝐶𝑅
𝑅2 =
𝑆𝑦𝑦

Es claro que 0 < 𝑅 2 ≤ 1 . En general 𝑅 2 se interpreta como la proporción de la


variabilidad en los datos (y) que es explicada por el modelo. En el caso de los
datos de la resistencia de la pulpa tenemos

𝑆𝐶𝑅 = 𝛽̂1 𝑆𝑥𝑦 = 1.624 ∗ 1478 = 2400.272

𝑛 2
2
(∑𝑛𝑖=𝑛 𝑦) 22162
𝑆𝑦𝑦 = ∑ 𝑦𝑖 − = 353342 − = 2580.857
𝑛 14
𝑖=𝑛

𝑆𝐶𝑅 2400.272
𝑅2 = = = 0.93
𝑆𝑦𝑦 2580.857

Por lo tanto, podemos decir que 93% de la variación observada en la


resistencia es explicada por el modelo (línea recta), lo cual nos dice que la
calidad del ajuste es satisfactorio, X y Y que por ello, la relación entre es
descrita adecuadamente por una línea recta.

Nota. El resultado arrojado por Excel o Minitab, incluye el análisis de varianza


para el modelo de regresión simple cuyo cuadro sintético es el siguiente:

18
Estadística Inferencial 2

Coeficiente de determinación ajustado 𝑅𝑎𝑗


2
: Este coeficiente se calcula de la
siguiente manera:
2
𝐶𝑀𝑇𝑜𝑡𝑎𝑙 − 𝐶𝑀𝐸
𝑅𝑎𝑗 =
𝐶𝑀𝑇𝑜𝑡𝑎𝑙

Donde el cuadrado medio total, 𝐶𝑀𝑇𝑜𝑡𝑎𝑙 se obtiene al dividir la suma de


cuadrados total, 𝑆𝑦𝑦 entre sus grados de libertad. Cuando hay muchos
2
términos en un modelo, el estadístico 𝑅𝑎𝑗 se prefiere en lugar de 𝑅 2, puesto
que este último es engañoso al incrementarse en forma artificial con cada
término que se agrega al modelo, aunque sea un término que no contribuya
2
en nada a la explicación de la respuesta. En cambio, el 𝑅𝑎𝑗 incluso baja de
valor cuando el término que se agrega no aporta nada.

19
Estadística Inferencial 2

2
Se cumple que 0 < 𝑅𝑎𝑗 ≤ 𝑅 2 ≤ 1. En general, para fines de predicción se
recomienda un coeficiente de determinación ajustado de al menos 0,7.
En el caso de los datos de la resistencia de la pulpa, el coeficiente de
determinación ajustado está dado por:

𝑆𝑦𝑦 2580.6
𝐶𝑀𝑇𝑜𝑡𝑎𝑙 = = = 198.507
𝑛 − 1 14 − 1

𝐶𝑀𝐸 180.32
𝐶𝑀𝐸 = = = 15.026
𝑛 − 2 14 − 2

2
𝐶𝑀𝑇𝑜𝑡𝑎𝑙 − 𝐶𝑀𝐸 198.501 − 15.026
𝑅𝑎𝑗 = = = 0.9243
𝐶𝑀𝑇𝑜𝑡𝑎𝑙 198.501

Observe que estos coeficientes son arrojados automáticamente en Excel y


Minitab.

Coeficiente de correlación r: Es bien conocido que el coeficiente de


correlación r, mide la intensidad de la relación lineal entre dos variables X y
Y. Si se tiene n pares de datos de la forma (𝑥𝑖 , 𝑦𝑖 ) , entonces este coeficiente
se obtiene de la siguiente manera:
𝑆𝑥𝑦
𝑟=
√𝑆𝑥𝑥 𝑆𝑦𝑦

Se puede ver que −1 ≤ 𝑟 ≤ 1; si r es próximo a -1, entonces tendremos una


relación lineal negativa fuerte, y si r es próximo a cero, entonces diremos que
no hay correlación lineal, y finalmente r se es próximo a 1, entonces
tendremos una relación lineal positiva fuerte. Por ejemplo, para los datos de
la resistencia de la pulpa, el coeficiente de correlación es:

𝑛
(∑𝑛𝑖=1 𝑥𝑖 ) (∑𝑛𝑖=1 𝑦𝑖 ) (238)(2216)
𝑆𝑥𝑦 = ∑ 𝑥𝑖 𝑦𝑖 − = 39150 − = 1478
𝑛 14
𝑖=1

𝑛 2
(∑𝑛𝑖=1 𝑥𝑖 )
2
(238)2
𝑆𝑥𝑥 = ∑ 𝑥𝑖 − = 4956 − = 910
𝑛 14
𝑖=1

𝑛 2
(∑𝑛𝑖=𝑛 𝑦) 22162
𝑆𝑦𝑦 = ∑ 𝑦𝑖 2 − = 353342 − = 2580.857
𝑛 14
𝑖=𝑛
𝑆𝑥𝑦 1478
𝑟= = = 0.9644
√𝑆𝑥𝑥 𝑆𝑦𝑦 √(910)(2580.857)

Lo cual habla de una correlación lineal positiva fuerte.

20
Estadística Inferencial 2

Error estándar de estimación 𝜎̂: Una medición sobre la calidad del ajuste de
un modelo lo da el error estándar de estimación, que es una estimación de la
desviación estándar del error 𝜎. En el caso de la regresión lineal simple, está
dado por:

𝑆𝐶𝐸
𝜎̂ = √
𝑛−2

𝑆𝐶𝐸 180.32
𝜎̂ = √ = √ = 3.876
𝑛−2 14 − 2

Es claro que a medida que el modelo ajuste mejor, la 𝑆𝐶𝐸 será menor y en
consecuencia el error estándar de estimación también será menor.

Análisis gráfico de residuos: Como complemento a lo que se ha discutido


hasta aquí, un análisis adecuado de los residuos proporciona información
adicional sobre la calidad del ajuste del modelo de regresión y de esa manera
es posible verificar si el modelo es adecuado. Las gráficas que suelen hacerse
para completar el diagnóstico del modelo consisten en:
a) graficar los residuos en papel de probabilidad normal
b) graficar los residuos contra los predichos.

Por ejemplo, para los datos de la resistencia de la pulpa, se construye la


gráfica de probabilidad normal. En ésta se aprecia que el supuesto de
normalidad sobre los errores se cumple razonablemente bien, ya que los
puntos en esta gráfica tienden a ajustarse a la línea recta.

Cuando esto ocurre significa que el modelo se ajusta de igual manera a lo


largo de los valores de Y. Por el contrario, si se aprecia algún patrón habrá
que ver cuál es el tipo de patrón que se observa en la gráfica y diagnosticar
cuál es la falla que registra el modelo.

21
Estadística Inferencial 2

En particular no muestra ninguna anomalía, lo cual es una evidencia más a


favor del modelo de regresión simple para este ejemplo.

1.1.3 Estimación y predicción por intervalo en regresión


lineal simple
Una de las aplicaciones más importantes en un análisis de regresión es hacer
estimaciones de la respuesta media para un valor dado de X. En el caso
particular de la regresión lineal simple, sabemos que un estimador puntual
de la respuesta media lo da la recta de regresión:

𝑌̂ = 𝛽̂0 + 𝛽̂1
Además de esto, en ocasiones es de interés obtener una estimación por
intervalos para 𝑦̅ a partir de cualquier valor de X, para lo cual aplicamos la
siguiente ecuación:

1 (𝑥0 − 𝑥̅ )2 𝑦 1 (𝑥0 − 𝑥̅ )2
𝑦̂0 − 𝑡(𝛼 √𝐶𝑀𝐸 [ + ] ≤ 𝐸( ⁄𝑥 ) ≤ 𝑦
̂0 + 𝑡 𝛼 √𝐶𝑀𝐸 [ + ]
⁄2,𝑛−2) 𝑛 𝑆𝑥𝑥 0 ( ⁄2,𝑛−2) 𝑛 𝑆𝑥𝑥

A este intervalo se le conoce como intervalo para la recta de regresión. Note


que su amplitud depende del 𝐶𝑀𝐸 y de la distancia entre 𝑥0 y 𝑥̅ . La amplitud
es mínima cuando 𝑥0 = 𝑥̅ y se incrementa conforme |𝑥0 − 𝑥̅ | se hace más
grande.

22
Estadística Inferencial 2

Para ilustrar lo anterior consideremos el modelo ajustado a los datos del


ejemplo de la resistencia de la pulpa y obtenemos el intervalo de confianza
para la respuesta media en 𝑥0 = 12 (porcentaje de fibra)

Primeramente calculemos el estimador puntual para 𝑦̅ cuando 𝑥0 = 12, está


dado por:
𝑌̂ = 𝛽̂0 + 𝛽̂1 = 130.67 + (1.624)(12) = 150.158
Y un intervalo de confianza al 95% para 𝑦̅

1 (𝑥0 − 𝑥̅ )2 1 (12 − 17)2


𝑦̂0 − 𝑡(𝛼 √𝐶𝑀𝐸 [ + ] = 150.158 ± 2.179√15.026 [ + ]
⁄2,𝑛−2) 𝑛 𝑆𝑥𝑥 14 910

150.158 ± 2.656

De aquí que el intervalo de confianza para la respuesta media en 𝑥0 = 12 , está


dada por:
𝑦
147.504 ≤ 𝐸( ⁄𝑥0 ) = 12 ≤ 152.816

Además de la estimación puntual para la pendiente y la ordenada al origen


𝛽0 y 𝛽1 es posible obtener estimaciones de los intervalos de confianza para
estos parámetros. La anchura de estos intervalos de confianza es una medida
de la calidad global de la recta de regresión. Si los términos del error 𝜀𝑖 del
modelo de regresión tienen una distribución normal e independiente,
entonces tienen ambos una distribución igual a la de una variable aleatoria t
con n-2 grados de libertad. Esto lleva a la siguiente definición de los intervalos
de confianza del 100(𝑛 − 𝛼)% para la pendiente y la ordenada al origen.

𝜎2
𝛽̂1 − 𝑡(𝛼 √ ≤ 𝛽1 ≤ 𝛽̂1 + 𝑡(𝛼
⁄2,𝑛−2) 𝑆𝑥𝑥 ⁄2,𝑛−2)

1 𝑥̅ 2 1 𝑥̅ 2
𝛽̂0 − 𝑡(𝛼 √𝜎 2[ + ] ≤ 𝛽0 ≤ ̂0 + 𝑡 𝛼
𝛽 √𝜎 2[ + ]
⁄2,𝑛−2) 𝑛 𝑆𝑥𝑥 ( ⁄2,𝑛−2) 𝑛 𝑆𝑥𝑥

En el caso del intervalo de confianza para la pendiente de los datos del


porcentaje de fibra tenemos

𝜎2 (3.876)2
𝛽̂1 − 𝑡(𝛼 √ = 1.624 ± 2.179√ = 1.624 ± 0.279
⁄2,𝑛−2) 𝑆𝑥𝑥 910

1.345 ≤ 𝛽0 ≤ 1.903

Por lo que pendiente de forma puntual es 1.624 y por intervalos con un 95%
de nivel de confianza tenemos que esta se encuentra entre 1.345 y 1.903

23
Estadística Inferencial 2

1.1.4 Uso de un software estadístico


Excel: En la hoja de cálculo de Excel se incluye la regresión lineal simple y
múltiple; para ello, es necesario realizar la siguiente secuencia de opciones:

𝐷𝑎𝑡𝑜𝑠 → 𝐴𝑛á𝑙𝑖𝑠𝑖𝑠 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 → 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛


Generalmente Excel no trae instalado la herramienta de análisis de datos esta
debe instalarse con la siguiente secuencia:

1.- En la hoja de cálculo de Excel (pantalla principal) hacer clic con el puntero
en el símbolo del sistema localizado en el extremo superior izquierdo

2.- De la ventana desplegada hacer clic en opciones de Excel (parte inferior)

24
Estadística Inferencial 2

3.- De la ventana desplegada hacer clic en complementos

4.- De la ventana desplegada hacer clic en ir


5.- De esta ventana activar la casilla de herramientas para análisis
(palomearla) y dar clic en aceptar. De esta manera hemos activado la opción
de análisis de datos.

Para capturar la tabla de datos para el análisis de regresión lineal simple o


múltiple, primeramente capturamos los datos en la hoja de cálculo,
posteriormente activamos Datos seguido de Análisis de datos y
seleccionamos Regresión

𝐷𝑎𝑡𝑜𝑠 → 𝐴𝑛á𝑙𝑖𝑠𝑖𝑠 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 → 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛

25
Estadística Inferencial 2

En la ventana de captura se solicitará el rango de celdas donde se encuentran


los datos para la variable dependiente Rango Y de entrada y para la(s)
variable(s) regresora(s) Rango X de entrada

Activamos la casilla de rótulos, por default está indicado en una hoja nueva,
seleccionamos además cualquiera de las opciones de residuos, grafica de
residuales, y curva de regresión ajustada y aceptar

Minitab: En Minitab la secuencia de captura para la regresión lineal simple o


múltiple en la hoja de cálculo una vez capturada las columnas de datos
seleccionamos Estadísticas luego Regresión seguida de Regresión
nuevamente de la ventana desplegada en respuesta indicamos la variable de

26
Estadística Inferencial 2

respuesta, en este caso es resistencia y en predictor indicamos porcentaje de


fibra activando también cualquiera de las opciones posibles, terminando en
aceptar.

Nota: De la ventana de captura aparecen automáticamente en el cuadro de


la izquierda la información de la tabla, en respuesta, se indica con un clic del
ratón en resistencia y este automáticamente se manifiesta en el recuadro, en
predictores de igual manera se da un clic en porcentaje de fibra e igualmente
se manifiestan en el recuadro.

1.2 Regresión lineal múltiple


En muchas situaciones prácticas existen varias variables independientes que
se cree que influyen o están relacionadas con una variable de respuesta Y y
por lo tanto será necesario tomar en cuenta si se quiere predecir o entender
mejor el comportamiento de Y. Por ejemplo, para explicar o predecir el
consumo de electricidad en una casa habitación tal vez sea necesario
considerar el tipo de residencia, el número de personas que la habitan, la
temperatura promedio de la zona, etcétera.

27
Estadística Inferencial 2

Sea 𝑥1 , 𝑥2 , … . . 𝑥𝑘 variables independientes o regresoras, y sea Y una


variable de respuesta, entonces el modelo de regresión lineal múltiple con k
variables independientes es el polinomio de primer orden:

𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 +, , , , +𝛽𝐾 𝑋𝐾 + 𝜀

Donde los 𝛽𝐾 son los parámetros del modelo que se conocen como
coeficientes de regresión y 𝜀 es el error aleatorio, con media cero, 𝐸(𝜀) = 0 y
𝑉(𝜀) = 𝜎 2 . Si en la ecuación anterior 𝑘 = 1, estamos en el caso de regresión
lineal simple y el modelo es una línea recta; si 𝑘 = 2 , tal ecuación representa
un plano. En general, la ecuación anterior representa un hiperplano en el
espacio k de dimensiones generado por las variables {𝑋𝑘 }.

El término lineal del modelo de regresión se emplea debido a que la ecuación


es función lineal de los parámetros desconocidos 𝛽0 , 𝛽1 , 𝛽2 … 𝛽𝑘 . La
interpretación de éstos es muy similar a lo ya explicado para el caso de
regresión lineal simple: 𝛽0 es la ordenada al origen, y 𝛽𝑘 mide el cambio
esperado en por cambio unitario en cuando el resto de las variables
regresoras se mantienen fijas o constantes.
Para encontrar los coeficientes de regresión múltiple por el método de
mínimos cuadrados aplicamos el siguiente sistema de ecuaciones normales:
𝑛 𝑛 𝑛 𝑛

𝑛𝛽̂0 + 𝛽̂1 ∑ 𝑥𝑖1 + 𝛽̂2 ∑ 𝑥𝑖2 + ⋯ + 𝛽̂𝑘 ∑ 𝑥𝑖𝑘 = ∑ 𝑦𝑖 𝛽̂0


𝑖=1 𝑖=1 𝑖=1 𝑖=1

𝑛 𝑛 𝑛 𝑛 𝑛

𝛽̂0 ∑ 𝑥𝑖1 + 𝛽̂1 ∑ 𝑥𝑖1 + 𝛽̂2 ∑ 𝑥𝑖2 … + 𝛽̂𝑘 ∑ 𝑥𝑖1 𝑥𝑖𝑘 = ∑ 𝑥𝑖1 𝑦𝑖 𝛽̂1
𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1

𝑛 𝑛 𝑛 𝑛 𝑛

𝛽̂0 ∑ 𝑥𝑖𝑘 + 𝛽̂1 ∑ 𝑥𝑖𝑘 𝑥𝑖1 + 𝛽̂2 ∑ 𝑥𝑖𝑘 𝑥𝑖2 … + 𝛽̂𝑘 ∑ 𝑥𝑖𝑘
2
= ∑ 𝑥𝑖𝑘 𝑦𝑖 𝛽̂2
𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1

Estas ecuaciones se pueden resolver para 𝛽̂0 , 𝛽̂1 y 𝛽̂2 mediante cualquier
método apropiado para resolver sistemas de ecuaciones lineales
Por ejemplo La siguiente tabla muestra los pesos Y a la libra más cercana, las
estaturas 𝑥1 a la pulgada más cercana y las edades 𝑥2 al año más cercano de
12 muchachos.

28
Estadística Inferencial 2

Para encontrar los coeficientes de regresión (𝛽̂0 , 𝛽̂1 y 𝛽̂2 ) múltiple mediante el
método de mínimos cuadrados seria de la siguiente manera

Al sustituir las sumatorias calculadas en las ecuaciones normales, se obtiene:

𝑛 𝛽̂0 + ∑ 𝑥1 𝛽̂1 + ∑ 𝑥2 𝛽̂2 = ∑ 𝑦

∑ 𝑥1 𝛽̂0 + ∑ 𝑥12 𝛽̂1 + ∑ 𝑥1 𝑥2 ̂𝛽2 = ∑ 𝑥1 𝑦

∑ 𝑥2 𝛽̂0 + ∑ 𝑥1 𝑥2 𝛽̂1 + ∑ 𝑥22 𝛽̂2 = ∑ 𝑥2 𝑦

12𝛽̂0 + 643𝛽̂1 + 106𝛽̂2 = 753

643𝛽̂0 + 34843𝛽̂1 + 5779𝛽̂2 = 40830

106𝛽̂0 + 5779𝛽̂1 + 976𝛽̂2 = 6796

29
Estadística Inferencial 2

Resolver este sistema de tres ecuaciones lineales para 𝛽̂0 , 𝛽̂1 y 𝛽̂2 es por lo
menos tedioso. Es común emplear matrices para simplificar el proceso. Hoy
en día, esta clase de cálculos son realizados por la computadora.

El resultado sería el siguiente 𝛽̂0 = 3.6511, 𝛽̂1 = 0.8546 y 𝛽̂2 = 1.5063 por lo
tanto la ecuación de regresión es:

𝑦̂ = 3.6511 + 0.8546𝑥𝑖 + 1.5063𝑥2

La solución manual aplicando el sistema de tres ecuaciones lineales con tres


incógnitas (3x3) pudiera ser aplicando el métodos de eliminación de Gauss o
bien el método de Cramer. Para este tipo de planteamiento se recomienda el
método de Cramer el cual consiste en la siguiente secuencia:

Siguiendo la misma secuencia de la multiplicación para el denominador, así


como para 𝛽̂1 y 𝛽̂2

30
Estadística Inferencial 2

Sustituyendo los valores tendremos

Siguiendo el mismo procedimiento correspondiente para 𝛽̂1 y 𝛽̂2 tenemos los


coeficientes de regresión múltiple
𝛽̂0 = 3.6511, 𝛽̂1 = 0.8546 y 𝛽̂2 = 1.5063

Análisis de regresión: Peso vs. Estatura; Edad en Minitab

31
Estadística Inferencial 2

Resultados en Excel

1.2.1 Pruebas de hipótesis en regresión lineal múltiple


Las hipótesis sobre los parámetros del modelo son equivalentes a las
realizadas para regresión lineal simple, pero ahora son más necesarias
porque en regresión múltiple tenemos más parámetros en el modelo; sin
embargo, por lo general es necesario evaluar su verdadera contribución a la

32
Estadística Inferencial 2

explicación de la respuesta. También requerimos de la suposición de que los


errores se distribuyen en forma normal, independientes, con media cero y
varianza.
La hipótesis global más importante sobre un modelo de regresión múltiple
consiste en ver si la regresión es significativa. Esto se logra probando la
siguiente hipótesis:
𝐻0 : 𝛽1 = 𝛽2 … 𝛽𝑘 = 0
𝐻1 : 𝛽𝑗 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑗 = 1,2, … , 𝑘

Aceptar 𝐻0 significa que ningún término o variable en el modelo tiene una


contribución significativa al explicar la variable de respuesta Y. Mientras que
rechazar 𝐻0 implica que por lo menos un término en el modelo contribuye de
manera significativa a explicar Y. El procedimiento para probar esta hipótesis
es una generalización del procedimiento utilizado para probar la hipótesis
equivalente en regresión lineal simple.
El estadístico de prueba para la significancia del modelo de regresión lineal
múltiple está dado por:
𝑆𝐶𝑅 /𝑘 𝐶𝑀𝑅
𝐹0 = =
𝑆𝐶𝐸 /(𝑛 − 𝑘 − 1) 𝐶𝑀𝐸

Coeficiente de determinación: El que un modelo sea significativo no


necesariamente implica que sea bueno en términos de que explique la
variación de los datos. Por ello es importante tener mediciones adicionales de
la calidad del ajuste del modelo, como las gráficas de residuales y el
coeficiente de determinación. Con la información del análisis de varianza es
muy sencillo calcular el coeficiente de determinación 𝑅 2, y el coeficiente de
determinación ajustado 𝑅𝑎𝑗2
:
𝑆𝐶𝑅 𝑆𝐶𝐸
𝑅2 = =1−
𝑆𝑦𝑦 𝑆𝑦𝑦

2
𝑆𝑦𝑦 /(𝑛 − 1) − 𝐶𝑀𝐸 𝐶𝑀𝑇𝑜𝑡𝑎𝑙 − 𝐶𝑀𝐸
𝑅𝑎𝑗 = =
𝑆𝑦𝑦 /(𝑛 − 1) 𝐶𝑀𝑇𝑜𝑡𝑎𝑙

Ambos coeficientes se interpretan de forma similar al caso de regresión lineal


simple, es decir, como el porcentaje de variabilidad de los datos que son

33
Estadística Inferencial 2

explicados por el modelo. Se cumple que 0 < 𝑅𝑎𝑗


2
≤ 𝑅 2 < 1 ; en general, para
hablar de un modelo que tiene un ajuste satisfactorio es necesario que ambos
coeficientes tengan valores superiores a 0.7. Cuando en el modelo hay
términos que no contribuyen de manera significativa a éste, el 𝑅𝑎𝑗 2
tiende a
ser menor que el 𝑅 2. Por lo tanto, es deseable depurar el modelo y para ello
las siguientes pruebas de hipótesis son de mucha utilidad.

Coeficiente de correlación múltiple: Es la raíz cuadrada del coeficiente de


determinación 𝑅 2

𝑅 = √𝑅 2

Y es una medida de la intensidad de la relación entre la variable dependiente


𝑌 y el conjunto de variables o términos en el modelo (𝑋1 , 𝑋2 , … , 𝑋𝑘 )

Error estándar de estimación: Al igual que en regresión lineal simple, el error


estándar de estimación proporciona la medida del error de ajuste de un
modelo, éstas tienen una interpretación similar a la que se dio para el caso
de regresión lineal simple. En cuanto al cálculo en el caso múltiple, el error
estándar de estimación:

𝜎̂ = √𝑆𝐶𝐸 /(𝑛 − 𝑘 − 1)

1.2.2 Intervalos de confianza y predicción en regresión


múltiple
En los modelos de regresión múltiple con frecuencia es conveniente construir
estimaciones de intervalos de confianza para los coeficientes de regresión [𝛽𝑗 ]

𝛽̂𝑗 − 𝑡(𝛼 √𝐶𝑀𝐸 𝐶𝑗+1,𝑗+1 ≤ 𝛽𝑗 ≤ 𝛽̂𝑗 + 𝑡(𝛼⁄ √𝐶𝑀𝐸 𝐶𝑗+1,𝑗+1


⁄2,𝑛−𝑘−1) 2,𝑛−𝑘−1)

34
Estadística Inferencial 2

1.2.3 Uso de un software estadístico


Usando Excel: Para capturar la tabla de datos para el análisis de regresión
lineal múltiple, primeramente capturamos los datos en la hoja de cálculo,
posteriormente activamos Datos seguido de Análisis de datos y
seleccionamos Regresión, y aceptar
𝐷𝑎𝑡𝑜𝑠 → 𝐴𝑛á𝑙𝑖𝑠𝑖𝑠 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 → 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛

En la ventana de captura se solicitará el rango de celdas donde se encuentran


los datos para la variable dependiente Rango 𝑌 de entrada y para la(s)
variable(s) regresora(s) Rango 𝑋 de entrada (para los datos de 𝑥1 y 𝑥2 , se
sombrean ambos simultáneamente con el ratón, en este caso a partir de la
columna 2)

35
Estadística Inferencial 2

Activamos la casilla de rótulos, por default está indicado en una hoja nueva,
seleccionamos además cualquiera de las opciones de residuos, gráfica de
residuales, y curva de regresión ajustada y aceptar y tendremos el resultado.

Utilizando Minitab: En Minitab la secuencia de captura para la regresión lineal


simple o múltiple en la hoja de cálculo una vez capturada las columnas de
datos seleccionamos Estadísticas luego Regresión seguida de Regresión
nuevamente
𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎 → 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛

De la ventana desplegada en respuesta indicamos la variable de respuesta,


en este caso es resistencia y en predictor indicamos porcentaje de fibra
activando también cualquiera de las opciones posibles, terminando en
aceptar.

36
Estadística Inferencial 2

Nota: De la ventana de captura aparecen automáticamente en el cuadro de


la izquierda la información de la tabla, en respuesta , se indica con un clic del
ratón en peso y este automáticamente se manifiesta, en predictores de igual
manera se da un clic a cada uno y estos se manifiestan en el recuadro.

37
Estadística Inferencial 2

Unidad 2:
Diseño de
experimentos de
un factor

38
Estadística Inferencial 2

Experimentos con un solo factor. En este tipo de diseño de experimento se


considera un sólo factor de interés y el objetivo es comparar más de dos
tratamientos, con el fin de elegir la mejor alternativa entre las varias que
existen, o por lo menos para tener una mejor comprensión del
comportamiento de la variable de interés en cada uno de los distintos
tratamientos.
En esta unidad se presentan los diseños experimentales que se utilizan
cuando el objetivo es comparar más de dos tratamientos. Puede ser de
interés comparar tres o más máquinas, varios proveedores, cuatro procesos,
tres materiales, cinco dosis de un fármaco, etc.
Es obvio que, al hacer tales comparaciones, existe un interés y un objetivo
claro. Por ejemplo, una comparación de cuatro dietas de alimentación en la
que se utilizan ratas de laboratorio, se hace con el fin de estudiar si alguna
dieta que se propone es mejor o igual que las que ya existentes; en este
caso, la variable de interés es el peso promedio alcanzado por cada grupo de
animales después de ser alimentado con la dieta que le toco.
Por lo general, el interés del experimentador está centrado en comparar los
tratamientos en cuanto a sus medias poblacionales, sin olvidar que también
es importante compararlos con respecto a sus varianzas. Así, desde el punto
de vista estadístico, la hipótesis fundamental a probar cuando se comparan
varios tratamientos es:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑛
𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔𝑢𝑛 𝑖 ≠ 𝑗
Con la cual se quiere decidir si los tratamientos son iguales estadísticamente
en cuanto a sus medias, frente a la alternativa de que al menos dos de ellos
son diferentes.
La estrategia natural para resolver este problema es obtener una muestra
representativa de mediciones en cada uno de los tratamientos, y construir un
estadístico de prueba para decidir el resultado de dicha comparación
Se podría pensar que una forma de probar la hipótesis nula de la expresión
es mediante la prueba T de Student aplicadas a todos los posibles pares de
medias; sin embargo, esta manera de proceder incrementaría de manera
considerable el error tipo I (rechazar 𝐻0 siendo verdadera).

Ejemplo
En el caso de comparar varias máquinas, si cada máquina es manejada por
un operador diferente y se sabe que éste tiene una influencia en el resultado,
entonces, es claro que el factor operador debe tomarse en cuenta si se quiere
comparar a las máquinas de manera justa.
Un operador más hábil puede ver a su máquina (aunque ésta sea la peor)
como la que tiene el mejor desempeño, lo que impide una comparación
adecuada de los equipos. Para evitar este sesgo habría dos maneras de anular
el posible efecto del factor operador:

39
Estadística Inferencial 2

 Utilizando el mismo operador en las cuatro máquinas. Esta


estrategia no es aconsejable, ya que al utilizar el mismo
operador, se elimina el efecto del factor operador, pero restringe
la validez de la comparación a dicho operador, y es posible que
el resultado no se mantenga al utilizar otros operadores.

 Cada operador trabaje durante el experimento con cada una de


las máquinas, esta estrategia es más recomendable, ya que al
utilizar todos los operadores con todas las máquinas permite
tener resultados de la comparación que son válidos para todos
los operadores. Esta última de manera nulificar el efecto de
operadores, recibe el nombre de Bloqueo.

Factores de bloqueo. Son factores adicionales al factor de interés que se


incorporan de manera explícita en un experimento comparativo, para estudiar
de manera más adecuada y eficaz al factor de interés.
Observación. Cuando se comparan varias máquinas, manejadas por
operadores diferentes, es pertinente incluir explícitamente al factor
operadores (bloques) para lograr el propósito del estudio. También se podrían
controlar el tipo de material, lotes, tipo de producto, día, turno, etc. Se
controlan factores que por conocimiento del proceso o experiencia previa, se
sabe que pueden afectar en forma sensible el resultado de la comparación
En el campo de la industria es frecuente hacer experimentos o pruebas con
la intención de resolver un problema o comprobar una idea (conjetura,
hipótesis); por ejemplo, hacer algunos cambios en los materiales, métodos o
condiciones de operación de un proceso, probar varias temperaturas en una
máquina hasta encontrar la que del mejor resultado o crear un nuevo material
con la intención de lograr mejoras o eliminar algún problema.
Sin embargo, es común que estas pruebas o experimentos se hagan sobre la
marcha, con base en el ensayo y error, apelando a la experiencia y a la
intuición, en lugar de seguir un plan experimental adecuado que garantice
una buena respuesta a las interrogantes planteadas. Algo similar ocurre con
el análisis de los datos experimentales, donde más que hacer un análisis
riguroso de toda la información obtenida y tomar en cuenta la variación, se
realiza un análisis informal, ¨intuitivo¨ Es tal el poder de la experimentación
que, en ocasiones, se logra mejoras a pesar de que el experimento se hizo
con base en el ensayo y error.
El diseño estadístico de experimentos es precisamente la forma más eficaz
de hacer pruebas. El diseño de experimentos consiste en determinar cuáles
pruebas se deben realizar y de qué manera, para obtener datos que, al ser
analizados estadísticamente, proporcionen evidencias objetivas que permitan
responder las interrogantes planteadas, y de esa manera clarificar los
aspectos inciertos de un proceso, resolver un problema o lograr mejoras.
Algunos problemas típicos que pueden resolverse con el diseño y el análisis
de experimentos son los siguientes:

40
Estadística Inferencial 2

1. Comparar a dos o más materiales con el fin de elegir al que mejor


cumple los requerimientos.
2. Comparar varios instrumentos de medición para verificar si trabajan
con la misma precisión y exactitud.
3. Determinar los factores (las x vitales) de un proceso que tienen
impacto sobre una o más características del producto final.
4. Encontrar las condiciones de operación (temperatura, velocidad,
humedad, por ejemplo) donde se reduzcan los defectos o se logre un
mejor desempeño del proceso.
5. Reducir el tiempo de ciclo del proceso.
6. Hacer el proceso insensible o robusto a oscilaciones de variables
ambientales.
7. Apoyar el diseño o rediseño de nuevos productos o procesos
8. Ayudar a conocer y caracterizar nuevos materiales.

En general, cuando se requiere mejorar un proceso existen dos maneras


básicas de obtener la información necesaria para ello:
 Observar o monitorear vía herramientas estadísticas, hasta obtener
señales útiles que permitan mejorarlo; se dice que ésta es una
estrategia pasiva.
 La otra manera consiste en experimentar, es decir, hacer cambios
estratégicos y deliberados al proceso para provocar dichas señales
útiles.
Al analizar los resultados del experimento se obtienen las pautas a seguir,
que muchas veces se concretan en mejoras sustanciales del proceso. En este
sentido, experimentar es mejor que sentarse a esperar a que el proceso nos
indique por sí solo cómo mejorarlo. El diseño de experimentos es un conjunto
de técnicas activas, en el sentido de que no esperan que el proceso mande
las señales útiles, sino que éste se “manipulan” para que proporcione la
información que se requiere para su mejoría.
El saber diseño de experimentos y otras técnicas estadísticas, en combinación
con conocimientos del proceso, sitúan al responsable del mismo como un
observador perceptivo y proactivo que es capaz de proponer mejoras y de
observar algo interesante (oportunidades de mejora) en el proceso y en los
datos donde otra persona no ve nada.

2.1 Familia de diseños para comparar tratamientos


Los diseños experimentales más utilizados para comparar tratamientos son:
 Diseño completamente al azar (DCA)
 Diseño en bloque completamente al azar (DBCA)
 Diseño en cuadro latino (DCL)
 Diseño en cuadro grecolatino (DCGL)
La diferencia fundamental entre estos diseños es el número de factores de
bloque que incorporan o controlan de forma explícita durante el experimento.

41
Estadística Inferencial 2

La comparación de los tratamientos en cuanto a la respuesta media que


logran, en cualquiera de estos diseños, se hace mediante la hipótesis que se
prueba con la técnica estadística llamada Análisis de Varianza (ANOVA) con
uno, dos, tres o cuatro criterios de clasificación, dependiendo del número de
factores de bloques incorporados al diseño.
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑛
𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔𝑢𝑛 𝑖 ≠ 𝑗

Y es la variable de salida, 𝜇 la media global, 𝜏𝑖 el efecto del i-ésimo


tratamiento, 𝜀𝑖 error aleatorio, y 𝛾𝑖 , 𝛿𝑘 , 𝜑𝑙 , 𝜀𝑖𝑗𝑘 son los efectos de tres
factores de bloqueo.
El modelo estadístico que describe el comportamiento de la variable
observada Y en cada diseño, incorpora un término adicional por cada factor
de bloqueo controlado.
De acuerdo con los modelos dados en la tabla, para cada diseño comparativo
se tienen al menos dos fuentes de variabilidad: los tratamientos o niveles del
factor de interés y el error aleatorio. Se agrega una nueva fuente de
variabilidad por cada factor de bloque que se controla directamente. Se
observa que los diseños suponen que no hay efectos de interacción entre los
factores, lo cual sería lo deseable que ocurra; de no ocurrir así, tal efecto se
recarga al error y el problema de comparación no se resuelve con éxito.
Un efecto de interacción entre dos factores hace referencia a que el efecto de
cada factor depende del nivel en que se encuentra el otro.

2.2 El modelo de efectos fijos


El modelo de efectos fijos (es cuando se estudian todos los posibles
tratamientos) de análisis de la varianza se aplica a situaciones en las que el
experimentador ha sometido al grupo o material analizado a varios factores,
cada uno de los cuales le afecta sólo a la media, permaneciendo la "variable
respuesta" con una distribución normal.
Este modelo se supone cuando el investigador se interesa únicamente por los
niveles del factor presentes en el experimento, por lo que cualquier variación
observada en las puntuaciones se deberá al error experimental.
En caso que los tratamientos tengan efecto, las observaciones se podrán
describir con el modelo estadístico lineal dado por:

42
Estadística Inferencial 2

𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗
Donde 𝜇 es el parámetro de escala común a todos los tratamientos, llamado
media global, 𝜏𝑖 es un parámetro que mide el efecto del tratamiento i y 𝜀𝑖𝑗 es
el error atribuible a la medición 𝑌𝑖𝑗 . Este modelo implica que en el diseño
completamente al azar actuarían a lo más dos fuentes de variabilidad: Los
tratamientos y el error aleatorio. La media global 𝜇 de la variable de
respuesta no se considera una fuente de variabilidad por ser una constante
común a todos los tratamientos, que hace las veces de punto de referencia
con respecto al cual se comparan las respuestas medias de los tratamientos.
Si la respuesta media de un tratamiento particular 𝜇𝑖 es muy diferente de la
respuesta media global , es un síntoma de que existe un efecto de dicho
tratamiento, ya que como se verá más adelante, 𝜏𝑖 = 𝜇𝑖 − 𝜇. La diferencia que
debe tener las medias entre sí para concluir que hay un efecto (que los
tratamientos son diferentes), nos lo dice el análisis de varianza (ANOVA).
En la práctica puede suceder que los tratamientos que se desea comparar
sean demasiados como para experimentar con todos. Cuando esto sucede es
conveniente comparar sólo una muestra de la población de tratamientos, de
modo que 𝜏𝑖 pasa a ser una variable aleatoria con su propia varianza 𝜎𝜏2 que
deberá estimarse a partir de los datos. En este capítulo sólo se presenta el
caso en que todos los tratamientos que se tienen se prueban, es decir, se
supone una población pequeña de tratamientos, lo cual hace posible
compararlos a todos. En este caso, el modelo dado por la ecuación se llama
modelo de efectos fijos.

2.3 Diseño completamente aleatorio y ANOVA


Muchas comparaciones, como las antes mencionadas, se hacen con base en
el diseño completamente al azar (DCA), que es el más simple de todos los
diseños que se utilizan para comparar dos o más tratamientos, dado que sólo
consideran dos fuentes de variabilidad: los tratamientos y el error aleatorio.
En la siguiente unidad veremos diseños que consideran la influencia de otras
fuentes de variabilidad (bloques).
Este diseño se llama completamente al azar porque todas las corridas
experimentales se realizan en orden aleatorio completo. De esta manera, si
durante el estudio se hacen en total N pruebas, éstas se corren al azar, de
manera que los posibles efectos ambientales y temporales se vayan
repartiendo equitativamente entre los tratamientos.

Ejemplo 1 Comparación de cuatro métodos de ensamble. Un equipo de


mejora investiga el efecto de cuatro métodos de ensamble A, B, C y D, sobre
el tiempo de ensamble en minutos con un nivel de significancia de 0.05. En
primera instancia, la estrategia experimental es aplicar cuatro veces los

43
Estadística Inferencial 2

cuatro métodos de ensamble en orden completamente aleatorio (las 16


pruebas en orden aleatorio). Los tiempos de ensamble obtenidos se muestran
en la tabla siguiente. Si se usa el diseño completamente al azar (DCA), se
supone que, además del método de ensamble, no existe ningún otro factor
que influya de manera significativa sobre la variable de respuesta (tiempo de
ensamble)

Diseño completamente al azar


Para el ejemplo 1

Ejemplo 2 Comparación de cuatro tipos de cuero. Un fabricante de calzado


desea mejorar la calidad de las suelas, las cuales se pueden hacer con uno
de los cuatro tipos de cuero A, B, C y D disponibles en el mercado. Para ello,
prueba los cueros con una máquina que hace pasar los zapatos por una
superficie abrasiva; la suela de éstos se desgasta al pasarla por dicha
superficie. Como criterio de desgaste se usa la pérdida de peso después de
un número fijo de ciclos. Se prueban en orden aleatorio 24 zapatos, seis de
cada tipo de cuero. Al hacer las pruebas en orden completamente al azar se
evitan sesgos y las mediciones en un tipo de cuero resultan independientes
de las demás. Los datos (en miligramos) sobre el desgaste de cada tipo de
cuero se muestran en la tabla siguiente:

Comparación de cuatro tipos de cuero (cuatro tratamientos)

El análisis de la varianza de un criterio (ANOVA de un criterio) es una


metodología para analizar la variación entre muestras y la variación al interior
de las mismas con varianzas, en lugar de rangos. Como tal, es un método
estadístico útil para comparar dos o más medias poblacionales.
El objetivo del análisis de varianza en el DCA es probar las hipótesis de
igualdad de los tratamientos con respecto a la media de la correspondiente
variable de respuesta:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑛

44
Estadística Inferencial 2

𝐻1 : 𝜇𝑖 ≠ 𝜇2 ≠ 𝑝𝑎𝑟𝑎 𝑢𝑛𝑎
Nota: Primeramente explicare el cálculo manual tradicional para ANOVA,
posteriormente el simplificado y más práctico, así como su solución utilizando
un paquete computacional.
El método de ANOVA con un criterio requiere del cálculo de dos estimaciones
independientes para 𝜎 2 , la varianza poblacional común. Estas dos
estimaciones se denotan por 𝑆𝑏2 y 𝑆𝑤
2
.
𝑆𝑏 Se denomina estimación de la varianza entre muestras (Método entre)
2

𝑆𝑤2 Se denomina estimación de la varianza al interior de las muestras (Método


dentro)

𝑆𝑏2
El estadístico entonces resulta 2 y tiene una distribución muestral que sigue
𝑆𝑤
una distribución F.
𝑆2
𝐹 = 2𝑏
𝑆𝑤

El cual se contrastara con el valor de F encontrado en tablas en relación a


los grados de libertad del numerador entre grados de libertad del
denominador y con un nivel de significancia (𝛼) prefijado.

Método dentro. El método dentro de estimación de la varianza produce una


estimación válida sin importar si la hipótesis nula de las medias poblacionales
iguales es cierta. Esto se debe a que la variabilidad de los valores de la
muestra se determina comparando cada elemento en los datos con la media
muestral. Cada valor de la muestra obtenido de la población A se compara
con la media muestral A; cada elemento obtenido de la población B se
compara con la media muestral B, y así sucesivamente. La ecuación para
calcular la estimación de la varianza con el método dentro es:

∑(𝑋𝑗 − 𝑋̅𝑗 )2
𝑆𝑤2 =
𝐶(𝑛 − 1)
Donde:
𝑆𝑤2 = Estimación de la varianza muestral con el método entre.
𝑋𝑖𝑗 = i-ésimo elemento de los datos de grupo j.
𝑋̅𝑗 = media del grupo j
C = número de grupos
n = número de elementos de la muestra en cada grupo.

El número adecuado de grados de libertad para el método dentro se calcula


como c(n-1) si el número de observaciones en cada grupo es igual. Como a
cada elemento del grupo se le resta la media de ese grupo, sólo (n-1)
elementos de cada grupo pueden variar. Además como se tienen c grupos, c
45
Estadística Inferencial 2

se multiplica por (n-1) para obtener los grados de libertad para el método
dentro.
2
Grados de libertad para 𝑆𝑤
𝑔𝑙𝑤 = 𝐶(𝑛 – 1)
Método entre. El segundo método para estimar la varianza común de la
población produce una estimación válida sólo si la hipótesis nula es cierta.
Para entender el método entre recuerde el teorema del límite central. Este
importante teorema en estadística establece que la distribución de las medias
muestrales tiende a una distribución normal conforme crece el tamaño de la
muestra, con una media 𝜇 y una desviación estándar 𝛿 √𝑛. Si el error estándar
de la media es 𝛿 √𝑛, entonces la varianza de la distribución es igual al error
estándar al cuadrado, 𝛿 2 √𝑛.
Esta varianza es una medida de las diferencias entre todas las medias
muestrales que puedan obtenerse de la distribución y la media de la
población. La raíz cuadrada de esta varianza es el error estándar de la media,
es decir, la diferencia estándar entre una media muestral y la media
poblacional.
En ANOVA, para estimar la varianza de la distribución muestral de medias,
se debe estimar primero la media poblacional. La media de todos los valores
muestrales proporciona esa estimación. Después, se determina la diferencia
entre la media de cada grupo y esta media poblacional estimada, y estas
diferencias se elevan al cuadrado y se suman. Este valor, con frecuencia se
llama la suma de cuadrados entre (SCb). Esta suma se divide entonces entre
el número adecuado de grados de libertad para obtener la estimación de la
varianza de la distribución muestral. La ecuación siguiente da el cálculo de la
estimación de la varianza de la distribución muestral de las medias:

𝑛 ∑(𝑋̅𝑖 − 𝑋̅)2
𝑆𝑏2 =
(𝐶 − 1)
Donde
𝑆𝑏2 = Estimación del método entre de la varianza poblacional común.
𝑋̅𝑖 = media del grupo i.
𝑋̅ = media global (media de todos los valores), usada como estimación de 𝜇
C = número de grupos
n = número de elementos de la muestra en cada grupo si el número de
observaciones en cada uno es el mismo.

2
Grados de libertad para 𝑆𝑏
𝑔𝑙𝑏 = 𝐶(𝑛 – 1)

Tabla ANOVA. Los resultados del análisis de varianza se presentan en una


tabla ANOVA que resume los valores importantes de la prueba. Esta tabla
tiene un formato estándar que usan los libros y los problemas de
46
Estadística Inferencial 2

computadora que ejecutan ANOVA. La siguiente tabla muestra la forma


general de la tabla ANOVA.
En dicha tabla se resumen los cálculos necesarios para la prueba de igualdad
de las medias poblacionales usando análisis de varianza. Primero se usa el
método dentro para estimar 𝛿 2 . Cada valor de los datos se compara con su
propia media, y la suma de las diferencias al cuadrado se divide entre los
grados de libertad c(n-1)

Donde:
j= Número de la columna
i = Número de la fila
c = Número de columnas (grupos)
n = Número de elementos en cada grupo (tamaño de la muestra)

La tabla ANOVA contiene columnas con las fuentes de variación, las sumas
de cuadrados, los grados de libertad, las estimaciones de la varianza y el
valor F para el procedimiento de análisis de varianza.

Ahora veremos el procedimiento y notación más comúnmente utilizado para


la solución de ANOVA
Diseño completamente al azar (DCA)

Notación de puntos. Sirve para presentar de manera abreviada cantidades


numéricas que se pueden calcular a partir de los datos experimentales donde
𝑌𝑖𝑗 representa la 𝑗 − 𝑒𝑠𝑖𝑚𝑎 observación en el tratamiento 𝑖, 𝑖 = 1,2, … 𝑘 con y 𝑗 =
1,2, … 𝑛𝑖 . Las cantidades de interés son las siguientes:

𝑌𝑡 = 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒𝑙 𝑡𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑖

47
Estadística Inferencial 2

𝑌̅𝑡 = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒𝑙 𝑖 − 𝑒𝑠𝑖𝑚𝑜 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜


𝑌.. = 𝑠𝑢𝑚𝑎 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎𝑠 𝑁 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 𝑚𝑒𝑑𝑖𝑐𝑖𝑜𝑛𝑒𝑠
𝑌̅.. = 𝑚𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙 𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠

Note que el punto indica la suma sobre el correspondiente subíndice. Así,


algunas relaciones válidas son:

𝑛𝑖 𝑘 𝑛𝑖
∑𝑛𝑗=1
𝑖
𝑌𝑖𝑗 𝑌..
𝑌𝑖 = ∑ 𝑌𝑖𝑗 ; 𝑌̅𝑖 = ; 𝑌.. = ∑ ∑ 𝑌𝑖𝑗 ; 𝑌̅.. = ; 𝑖 = 1,2, … , 𝑘
𝑛𝑖 𝑁
𝑗=1 𝑖=1 𝑗=1

Donde 𝑁 = ∑𝑘𝑖=1 𝑛𝑖 es el total de observaciones.

ANOVA. Como ya lo mencionamos el objetivo del análisis de varianza en el


DCA es probar la hipótesis de igualdad de los tratamientos con respecto a la
media de correspondiente variable de respuesta.
Para probar la hipótesis dada por la relación:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑛
𝐻1 : 𝜇1 ≠ 𝜇2 ≠ 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑝𝑎𝑟𝑎 𝑢𝑛𝑎

Mediante la técnica de ANOVA, lo primero es descomponer la variabilidad


total de los datos en sus dos componentes: la variabilidad debida a
tratamientos y la que corresponde al error aleatorio (equivalente al método
entre y método dentro), como se hace a continuación.
Una medida de la variabilidad total presente en las observaciones de la tabla
siguiente es la suma total de cuadrados (𝑆𝐶𝑇 ) dada por:

𝑘 𝑛𝑖 𝑘 𝑛𝑖
2 𝑌..2
𝑆𝐶𝑇 = ∑ ∑(𝑌𝑖𝑗 − 𝑌̅.. ) = ∑ ∑ 𝑌𝑖𝑗2 −
𝑁
𝑖=1 𝑗=1 𝑖=1 𝑗=1

Donde 𝑌.. es la suma de los 𝑁 = ∑𝑘𝑖=1 𝑛𝑖 datos en el experimento.

La suma de cuadrados de tratamientos (𝑆𝐶𝑇𝑅𝐴𝑇 ) ésta dado por:

𝑘
𝑌𝑖.2 𝑌..2
𝑆𝐶𝑇𝑅𝐴𝑇 = ∑ −
𝑛𝑖 𝑁
𝑖=1

Donde apreciamos que la 𝑆𝐶𝑇𝑅𝐴𝑇 mide la variación o diferencias entre


tratamientos, ya que si éstos son muy diferentes 𝑌𝑖. − 𝑌.. entre sí, entonces la
diferencia tenderá a ser grande en valor absoluto, y con ello también será
grande la 𝑆𝐶𝑇𝑅𝐴𝑇

La suma de cuadrados del error (𝑆𝐶𝐸 ) ésta dado por:

48
Estadística Inferencial 2

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅𝐴𝑇

Donde 𝑆𝐶𝐸 la mide la variación dentro de tratamientos, ya que si hay mucha


variación entre las observaciones de cada tratamiento entonces 𝑌𝑖𝑗 − 𝑌̅𝑖.
tenderá a ser grande en valor absoluto. En forma abreviada, esta
descomposición de la suma total de cuadrados se puede describir como:

𝑆𝐶𝑇 = 𝑆𝐶𝑇𝑅𝐴𝑇 + 𝑆𝐶𝐸

La suma de cuadrados divididos entre sus respectivos grados de libertad se


llama cuadrados medios. Los dos que más interesan son el cuadrado medio
de tratamientos (𝐶𝑀𝑇𝑅𝐴𝑇 ) y el cuadrado medio del error (𝐶𝑀𝐸 ), que se denotan
por:
𝑆𝐶𝑇𝑅𝐴𝑇
𝐶𝑀𝑇𝑅𝐴𝑇 =
𝑘−1

𝑆𝐶𝐸
𝐶𝑀𝐸 =
𝑁−𝑘

Con base en este hecho se construye el estadístico de prueba como sigue: se


𝑆𝐶𝐸 𝑆𝐶𝑇𝑅𝐴𝑇
sabe que 𝑆𝐶𝐸 y 𝑆𝐶𝑇𝑅𝐴𝑇 son independientes, por lo que 𝜎2
y 𝜎2
son dos
variables son dos variables aleatorias independientes con distribución ji-
cuadrada con 𝑁 − 𝑘 y 𝑘 − 1 grados de libertad, respectivamente. Entonces,
bajo el supuesto de que la hipótesis 𝐻0 es verdadera, el estadístico

𝐶𝑀𝑇𝑅𝐴𝑇
𝐹0 =
𝐶𝑀𝐸

Sigue una distribución con F (𝑘 − 1) grados de libertad en el numerador y (𝑁 −


𝑘) grados de libertad en el denominador. De la ecuación anterior se deduce
que si 𝐹0 es grande, se contradice la hipótesis de que no hay efecto de
tratamientos.

Tabla de ANOVA para DCA

49
Estadística Inferencial 2

Diagrama de cajas simultáneos. Los diagramas de cajas es una herramienta


para describir el comportamiento e unos datos, y es de suma utilidad para
comparar procesos, tratamientos y, en general, para hacer análisis por
estratos (lotes, proveedores, turnos). En el resultado arrojado por Minitab se
observa en la figura e se muestra a continuación que el método C parece
diferente a los métodos A y B en cuanto a sus medias; la media del método
D también se ve diferente a la media del método A. Por otra parte, se observa
un poco más de variabilidad en el método C que en todos los demás. Lo que
sigue es verificar que lo que se observa en el diagrama de cajas implica
diferencias significativas entre los distintos tratamientos; por lo tanto, es
necesario hacer pruebas estadísticas porque los datos que se analizan en los
diagramas de cajas son muestras.
En general, cuando los diagramas no se traslapan es probable que los
tratamientos correspondientes sean diferentes entre sí, y la probabilidad es
mayor en la medida que los diagramas están basados en más datos. Cuando
se traslapan un poco puede ser que haya o no diferencias significativas, y en
cualquier caso es conveniente utilizar una prueba estadística para determinar
cuáles diferencias son significativas. Estas pruebas se verán en la siguiente
sección.
Diagrama de cajas para los métodos de ensamble

2.4 Comparaciones o pruebas de rangos múltiples


El análisis de varianza es un procedimiento poderoso para probar la
homogeneidad de un conjunto de medias. Sin embargo, si rechazamos la
hipótesis nula (𝐻0 ) y aceptamos la alterna (que no todas las medias son
iguales) aún no sabemos cuáles de las medias poblacionales son iguales y
cuáles son diferentes

Comparación de parejas de medias de tratamientos. Cuando no se rechaza


la 𝐻0 : 𝜇1 =, el objetivo del experimento está cubierto y la conclusión es que

50
Estadística Inferencial 2

los tratamientos no son diferentes. Si por el contrario se rechaza H0, y por


consiguiente se acepta la 𝐻1 : No todas las poblaciones tienen la misma media,
es necesario investigar cuáles tratamientos resultaron diferentes, o cuáles
provocan la diferencia.
Estas interrogantes se responden probando la igualdad de todos los posibles
pares de medias, para lo cual se han propuesto varios métodos, conocidos
como métodos de comparaciones múltiples o pruebas de rango múltiple. La
diferencia primordial entre los métodos radica en la potencia que tienen para
detectar las diferencias entre las medias. Se dice que una prueba es más
potente si es capaz de detectar diferencias más pequeñas.
Hay varios métodos estándar para realizar comparaciones pareadas que
apoyen la credibilidad de la tasa de error tipo I.

Método de la diferencia mínima significativa de Fisher (método LSD). Una vez


que se rechazo 𝐻0 en el ANOVA, el problema es probar la igualdad de todos
los posibles pares de medias con la hipótesis:
𝐻0 = 𝜇𝑖 = 𝜇𝑗
𝐻1 = 𝜇𝑖 ≠ 𝜇𝑗

Método de Tukey. Es el método más conservador para comparar pares de


medias de tratamientos, el cual consiste en comparar las diferencias entre
medias muestrales con el valor crítico dado por:

𝐶𝑀𝐸
𝑇𝛼 = 𝑞𝛼 (𝑘, 𝑁 − 𝑘)√
𝑛𝑖
Donde
𝐶𝑀𝐸 Es el cuadrado medio del error (𝑆𝑤2 /𝑔𝑙𝑏 )
𝑛𝑖 Es el número de observaciones por tratamiento
𝑘 Es el número de tratamientos
𝑁 − 𝑘 Es igual a los grados de libertad para el error
𝛼 Es el nivel de significancia prefijado
𝑞𝛼 (𝑘, 𝑁 − 𝑘) Son puntos porcentuales de la distribución del rango, que se
obtienen de la correspondiente tabla

Se declaran significativamente diferentes los pares de medias cuya diferencia


muestral en valor absoluto sea mayor que 𝑇𝛼 . A diferencia de los métodos
LSD y Duncan, el método Tukey trabaja con un error 𝛼 muy cercano al
declarado por el experimentador.

Método de Duncan. En este método para la comparación de medias, si las


muestras son de igual tamaño, los promedios se acomodan en orden
ascendente y el error estándar de los promedios se estima con:

51
Estadística Inferencial 2

𝐶𝑀𝐸
𝑆𝑌̅𝑖 = √
𝑛

Este procedimiento de Duncan también se llama prueba de rango múltiple de


Duncan. Este procedimiento también se basa en la notación general del
rango. El rango de cualquier subconjunto de p medias muestrales debe
exceder cierto valor antes de que se encuentre que cualquiera de las p medias
es diferente. Este valor se llama rango de menor significancia para las p
medias y se denota como:

Método de Dunnet (Comparación de tratamientos con un control). En muchos


problemas científicos y de ingeniería no interesa extraer inferencias con
respecto a todas las posibles comparaciones entre las medias de los
tratamientos. En su lugar, el experimento a menudo dicta la necesidad de
comparar de manera simultánea cada tratamiento con un control. Por
ejemplo, al comparar varios medicamentos para el resfriado es conveniente
que uno de los tratamientos sea que los pacientes no utilicen ningún
medicamento, esto sirve como referencia para decidir la posible utilidad de
los medicamentos.
Un procedimiento de prueba desarrollado por C.W. Dunnett determina
diferencias significativas entre cada media del tratamiento y el control, en un
solo nivel de significancia.
Por facilidad, denotemos como tratamiento control al k- ésimo tratamiento.
Hacer comparaciones con respecto al control implica probar las k-1 hipótesis
dadas por:
𝐻0 : 𝜇1 = 𝜇𝑘
𝐻1 : 𝜇1 ≠ 𝜇𝑘

Con 𝑖 = 1,2,3, … , 𝑘 − 1 , donde k es el tratamiento control. La hipótesis nula se


rechaza

52
Estadística Inferencial 2

2.5 Verificación de los supuestos del Modelo


La validez de los resultados obtenidos en cualquier análisis de varianza queda
supeditada a que los supuestos del modelo se cumplan. Estos supuestos son:
 Normalidad
 Varianza constante (igual varianza de los tratamientos)
 Independencia

Esto es, la respuesta (Y) se debe distribuir de manera normal, con la misma
varianza en cada tratamiento y las mediciones deben ser independientes.
Estos supuestos sobre Y se traducen en supuestos sobre el termino error (𝜀)
en el modelo
𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗
Es una práctica común utilizar la muestra de residuos para comprobar los
supuestos del modelo, ya que si los supuestos se cumplen, los residuos o
residuales se pueden ver como una muestra aleatoria de una distribución
normal con media cero y varianza constante.

Cuando se realiza el ANOVA, y sólo cuando éste resulta significativo, entonces


se procede a estimar el modelo ajustado o modelo de trabajo dado por:
𝑌̂𝑖𝑗 = 𝜇̂ + 𝜏̂ 𝑖
Los gorros indican que son estimadores, es decir, valores calculados a partir
de los datos del experimento. El término del error desaparece del modelo
estimado, por el hecho de que su valor esperado es igual a cero.
Para comprobar cada supuesto existen pruebas analíticas y gráficas que
veremos a continuación. Por sencillez, muchas veces se prefieren las pruebas
gráficas. Éstas tienen el inconveniente de que no son exactas, pero aun así
en la mayoría de las situaciones prácticas proporcionan la evidencia suficiente
en contra o a favor de los supuestos.

Normalidad. Un procedimiento gráfico para verificar el cumplimiento del


supuesto de normalidad de los residuos consiste en graficar los residuos en
papel o en la gráfica de probabilidad normal que se incluye casi en todos los
paquetes estadísticos. Esta gráfica del tipo 𝑥 − 𝑦 tiene las escalas de tal
manera que si los residuos siguen una distribución normal, al graficarlos
tienden a quedar alineados en una línea recta; por lo tanto, si claramente no
se alinean se concluye que el supuesto de normalidad no es correcto.
Cabe enfatizar el hecho de que el ajuste de los puntos a una recta no tiene
que ser perfecto, dado que el análisis de varianza resiste pequeñas y
moderadas desviaciones al supuesto de normalidad.

Varianza constante. Una forma de verificar el supuesto de varianza constante


(o que los tratamientos tienen la misma varianza) es graficado los predichos
contra residuos (𝑌𝑖𝑗 𝑣𝑠 𝑒𝑖 ), por lo general 𝑌𝑖𝑗 va en el eje horizontal y los
residuos en el eje vertical. Si los puntos en esta gráfica se distribuyen de

53
Estadística Inferencial 2

manera aleatoria en una banda horizontal (sin ningún patrón claro y


contundente), entonces es señal d que se cumple el supuesto de que los
tratamientos tienen igual varianza. Por el contrario, si se distribuyen con
algún patrón claro y contundente, como por ejemplo una forma de corneta o
embudo, entonces es señal de que no se está cumpliendo el supuesto de
varianza constante.

Independencia. La suposición de independencia en los residuos puede


verificarse si se grafica el orden en que se colectó un dato contra el residuo
correspondiente. De esta manera, si al graficar en el eje horizontal el tiempo
(orden de corrida) y en el eje vertical los residuos, se detecta una tendencia
o patrón no aleatorio claramente definido, esto es evidencia de que existe
una correlación entre los errores y, por lo tanto, el supuesto de independencia
no se cumple. Si el comportamiento de los puntos es aleatorio dentro de una
banda horizontal, el supuesto se está cumpliendo.
La violación de este supuesto generalmente indica deficiencias en la
planeación y ejecución del experimento; asimismo, puede ser un indicador
de que no se aplicó en forma correcta el principio de aleatorización, o de que
conforme se fueron realizando las pruebas experimentales aparecieron
factores que afectaron la respuesta observada. Por ello, en caso de tener
problemas con este supuesto, las conclusiones que se obtienen del análisis
son endebles y por ello es mejor revisar lo hecho y tratar de investigar por
qué no se cumplió con ese supuesto de independencia, a fin de reconsiderar
la situación.

Elección del tamaño de la muestra Una decisión importante en cualquier


diseño de experimentos es decidir el número de réplicas que se hará por cada
tratamiento (tamaño de muestra). Por lo general, si se esperan diferencias
pequeñas entre tratamientos será necesario un mayor tamaño de muestra.
Aunque existen varios métodos para estimar el tamaño muestral, muchas
veces tienen poca aplicabilidad porque requieren cierto conocimiento previo
sobre la varianza del error experimental.
Si recurrimos a la experiencia vemos que el número de réplicas en la mayoría
de las situaciones experimentales en las que se involucra un factor varía entre
cinco y diez; incluso, en algún caso puede llegar hasta 30. La tendencia podría
inclinarse por un extremo de este rango e incluso salirse de éste, de acuerdo
con las siguientes consideraciones:
 A menor diferencia que se espera en los tratamientos, mayor será la
cantidad de réplicas si se quieren detectar diferencias significativas, y
viceversa, es decir, si se esperan grandes diferencias quizá con pocas
replicas sea suficiente
 Si se espera mucha variación dentro de cada tratamiento, debido a la
variación de fuentes no controladas como métodos de medición, medio
ambiente, materia prima, etc., entonces se necesitarán más réplicas

54
Estadística Inferencial 2

 Si son varios tratamientos (cuatro o más), entonces éste es un punto


favorable para reducir el número de réplicas.
Además de lo anterior, es preciso considerar los costos y el tiempo global del
experimento. De aquí que si toman en cuenta las consideraciones antes
expuestas se podrá establecer el tamaño de muestra que permita responder
en una primera fase las preguntas más importantes que se plantearon con el
experimento

2.6 Uso de un software estadístico

Excel

1) En una hoja de Excel capturar primeramente la tabla de datos


2) En la misma hoja de cálculo seleccionar del cintillo superior Datos,
luego Análisis de datos
3) Seleccionar análisis de varianza de un factor en la ventana desplegada

4) d) En rango de entrada (en ventana de captura) seleccionar todos los


grupos, incluyendo su rótulo (sombrearlos con el mouse),
automáticamente se incluyen.
5) e) En el siguiente recuadro seleccionar si nuestros datos están
ordenados en filia o columnas, además indicar si tenemos rótulos en
los encabezados, e indicar que los resultados los arroje en una hoja
nueva

55
Estadística Inferencial 2

Nota: Si no aparece Análisis de datos en la parte superior derecha de la hoja


de cálculo, se deberá de activar de la siguiente manera:
 En el símbolo del sistema en la parte superior izquierda de los
encabezados dar clic.
 En la ventana desplegada seleccionar opciones de Excel en la parte
inferior dando un clic.
 De la ventana desplegada señalar en el menú del lado izquierdo
complementos
 De la ventana desplegada en el lado derecho, señalar en la parte
inferior de la misma ir con un clic.
 De la ventana desplegada palomear el recuadro de herramientas para
análisis, y aceptar
 Nota como no está instalada esta herramienta el sistema nos
preguntara si queremos instalarla

Minitab

1) En la hoja de cálculo que despliega Minitab capturar nuestra tabla de
datos indicando sus correspondientes rótulos en la primer fila que no
está numerada
2) En el cintillo superior indicar con el mouse Estadísticas
3) Del menú desplegado seleccionar ANOVA, en el menú desplegado
seleccionar Un solo factor (Desapilado) y dar clic con el mouse

56
Estadística Inferencial 2

4. En ventana de captura desplegada (Análisis de varianza- Un solo


factor), en la parte izquierda aparecerán automáticamente los
grupos de tabla de datos
5. En el cuadro superior derecho (Respuestas (en columnas
separadas)) indicar separando por un espacio (sin comas) los
nombres de las columnas que generalmente son letras, esto
también se logra dando doble clic en cada letra del cuadro de la
izquierda, automáticamente son capturadas
6. En nivel de confianza por default es 95%
7. Señalar Aceptar y nos arrojara el resultado ANOVA en la parte
superior de la hoja de calculo

57
Estadística Inferencial 2

8. Si queremos hacer comparaciones de rango múltiples, entonces


señalamos de la ventana anterior comparaciones dando un clic.
9. En la ventana desplegada señalaremos las comparaciones que
queramos, y en control nivel del grupo indicamos la A, y damos clic
en aceptar

58
Estadística Inferencial 2

10.Si queremos las gráficas del supuesto del modelo entonces, damos
clic a gráficas (antepenúltima ventana) y señalamos tres en uno y
damos clic en aceptar.

59
Estadística Inferencial 2

Unidad 3:
Diseño de
bloques.

60
Estadística Inferencial 2

3.1 Diseños en bloques completos al azar


Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un
factor, es deseable que las posibles diferencias se deban principalmente al
factor de interés y no a otros factores que no se consideran en el estudio.
Cuando esto no ocurre y existen otros factores que no se controlan o nulifican
para hacer la comparación, las conclusiones podrían ser afectadas
sensiblemente.
Por ejemplo, supongamos que se quieren comparar varias máquinas, si cada
máquina es manejada por un operador diferente y se sabe que éste tiene una
influencia en el resultado, entonces es claro que el factor operador debe
tomarse en cuenta si se quiere comparar a las máquinas de manera justa.
Un operador más hábil puede hacer ver a su máquina (aunque ésta sea la
peor) como la que tiene el mejor desempeño, lo cual impide hacer una
comparación adecuada de los equipos.
Para evitar este sesgo hay dos maneras de anular el posible efecto del factor
operador: la manera lógica es utilizar el mismo operador en las cuatro
maquinas; sin embargo, tal estrategia no siempre es aconsejable, ya que
utilizar el mismo sujeto elimina el efecto del factor operador pero restringe la
validez de la comparación con dicho operador, y es posible que el resultado
no se mantenga al utilizar a otros operadores. La otra forma de anular el
efecto operador en la comparación consiste en que cada operador trabaje
durante el experimento con cada una de las máquinas. Esta estrategia es la
más recomendable, ya que utilizar a todos los operadores con todas las
máquinas permite tener resultados de la comparación que son válidos para
todos los operadores. Esta forma de nulificar el efecto de operadores, recibe
el nombre de bloqueo.
Factores de bloque: A los factores adicionales al factor de interés que se
incorporan de manera explícita en un experimento comparativo se les llama
factores de bloque. Éstos tienen la particularidad de que no se incluyen en el
experimento porque interese analizar su efecto, sino como un medio para
estudiar de manera adecuada y eficaz al factor de interés.
Los factores de bloque entran al estudio en un nivel de importancia
secundaria con respecto al factor de interés y, en este sentido, se puede
afirmar que se estudia un solo factor, porque es uno el factor de interés.

En un diseño en bloques completos al azar (DBCA) se consideran tres fuentes


de variabilidad:
 El factor de tratamientos
 El factor de bloque
 El error aleatorio

Es decir, se tienen tres posibles “culpables” de la variabilidad presente en los


datos. La palabra completo en el nombre del diseño se debe a que en cada
bloque se prueban todos los tratamientos, o sea, los bloques están completos.

61
Estadística Inferencial 2

La aleatorización se hace dentro de cada bloque; por lo tanto, no se realiza


de manera total como en el diseño completamente al azar.
Los factores de bloqueo que aparecen en la práctica son: Turno, lote, día,
tipo de material, línea de producción, operador, maquina, método, etc.
Supongamos una situación experimental con k tratamientos y b bloques.

Modelo estadístico: Cuando se decide utilizar un DBCA, el experimentador


piensa que cada medición será el resultado del efecto del tratamiento donde
se encuentre, del efecto al que pertenece y de cierto error que se espera sea
aleatorio. El modelo estadístico para este diseño está dado por:

𝑌𝑖𝑗 = 𝜇 + 𝑡𝑖 + 𝛾𝑗 + 𝜀𝑖𝑗

𝑌𝑖𝑗 𝐸𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑐𝑖𝑜𝑛 𝑞𝑢𝑒 𝑐𝑜𝑟𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒 𝑎𝑙 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑖 𝑦 𝑎𝑙 𝑏𝑙𝑜𝑞𝑢𝑒 𝑗


𝜇 𝐸𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝑡𝑖 𝐸𝑠 𝑒𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒𝑏𝑖𝑑𝑜 𝑎𝑙 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑖
𝛾𝑖 𝐸𝑠 𝑒𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒𝑏𝑖𝑑𝑜 𝑎𝑙 𝑏𝑙𝑜𝑞𝑢𝑒 𝑗
𝜀𝑖𝑗 𝐸𝑠 𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜 𝑎𝑡𝑖𝑏𝑢𝑖𝑏𝑙𝑒 𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑐𝑖𝑜𝑛 𝑑𝑒 𝛾𝑖𝑗

Hipótesis a probar: La hipótesis de interés es la misma para todos los diseños


comparativos, y está pada por:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = ⋯ = 𝜇𝑘 = 𝜇
𝐻1 : 𝜇1 ≠ 𝜇𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔𝑢𝑛𝑎 𝑖 ≠ 𝑗

Que también se puede expresar como

𝐻0 : 𝜏1 = 𝜏2 = 𝜏3 = ⋯ = 𝜏𝑘 = 0
𝐻1 : 𝜏1 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔𝑢𝑛𝑎 𝑖

Análisis de varianza: La hipótesis dada se prueba con un análisis de varianza


con dos criterios de clasificación, porque se controlan dos fuentes de
variación: el factor de tratamientos y el factor de bloque. En la tabla 3.2 se
muestra el aspecto del ANOVA para diseño DBCA.

62
Estadística Inferencial 2

Los cálculos necesarios pueden ser manuales, pero siempre es más práctico
hacerlos con un software estadístico, porque además proporciona muchas
otras opciones gráficas y tabulares útiles (no sólo el ANOVA). Utilizando la
notación de puntos, las fórmulas más prácticas para calcular las sumas de
cuadrados son:
𝑏 𝑘
𝑌2
𝑆𝐶𝑇 = ∑ ∑ 𝑌𝑖𝑗2 −
𝑁
𝑗=1 𝑖=1

𝐾
𝑌𝑖2 𝑌 2
𝑆𝐶𝑇𝑅𝐴𝑇 =∑ −
𝑏 𝑁
𝐼=1

𝑏
𝑌𝑗2 𝑌 2
𝑆𝐶𝐵 = ∑ −
𝑘 𝑁
𝑘=1

Y la del error se obtiene por sustracción como:

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅𝐴𝑇 − 𝑆𝐶𝐵

Cálculo manual para Diseño de bloque: ANOVA para el diseño bloque

63
Estadística Inferencial 2

3.2 Diseño en cuadrado latino


Los tratamientos de un factor se manejarán como columnas, otro factor será
como hileras y el siguiente factor se sorteará entre columnas e hileras de tal
forma que en cada columna quede cada uno de los tratamientos de los que
se sortean
El diseño de Cuadro Latino se usa para eliminar dos fuentes de variabilidad
que no interesa estudiar por sí mismas .Se hace un bloqueo en dos
direcciones. Los renglones y las columnas representan dos restricciones en la
aleatorización. En general, un cuadro latino 𝑝 × 𝑝 es un cuadrado que contiene
p renglones y p columnas.

En el diseño en cuadro latino (DCL) se controlan dos factores de bloque y se


estudia un factor de tratamientos, por lo que se tienen cuatro fuentes de
variabilidad que pueden afectar la respuesta observada, estas son:
 Los tratamientos
 El factor de bloque I (renglones)
 El factor de bloque II (columnas)
 El error aleatorio
Se llama cuadro latino por dos razones: es un cuadro debido a que tiene la
restricción adicional de que los tres factores involucrados se prueban en la
misma cantidad de niveles, y es latino porque se utilizan letras latinas para
denotar a los tratamientos o niveles del factor de interés. Sean A, B, C, …, K,
los k tratamientos a comparar, por lo tanto ambos factores de bloques tienen
también k niveles cada uno. El aspecto de los datos se muestra en la siguiente
tabla.

64
Estadística Inferencial 2

Ahora se necesitan al menos tres subíndices, por ejemplo, la respuesta 𝑌313


se generó en el tratamiento tres (C), en el primer nivel del factor renglón y
en el tercer nivel del factor columna.
El modelo estadístico para describir el comportamiento de las observaciones
está dado por:

𝑌𝑖𝑗𝑙 = 𝜇 + 𝑡𝑖 + 𝛾𝑗 + 𝛿𝑙 + 𝜀𝑖𝑗𝑙

Donde 𝑌𝑖𝑗𝑙 es la observación del tratamiento, en el nivel, del factor renglón y


en el nivel del factor columna 𝜀𝑖𝑗𝑙 ; es el error atribuible a dicha observación.
De acuerdo con este modelo, la variabilidad total presente en los datos se
puede descomponer como

𝑆𝐶𝑇 = 𝑆𝐶𝑇𝑅𝐴𝑇 + 𝑆𝐶𝐵1 + 𝑆𝐶𝐵2 + 𝑆𝐶𝐵3

El ANOVA para el diseño en cuadro latino se muestra en la tabla siguiente.


En él se prueba la hipótesis sobre los efectos de tratamiento del factor renglón
y del factor columna. Otra vez, la hipótesis fundamental es la de los
tratamientos; las otras dos proporcionan un adicional al objetivo inicial y
permiten comprobar la relevancia de controlar los factores de bloque.

Selección y aleatorización de un cuadro latino. No cualquier arreglo de letras


latinas en forma de cuadro es cuadro latino, la regla fundamental es que cada
letra debe aparecer sólo una vez en cada renglón y en cada columna. Un
cuadro latino estándar es aquel en el que en la primera columna y en el primer
renglón aparecen las letras en orden alfabético. Por ejemplo, un cuadro latino
estándar de tamaño cuatro está dado por:

65
Estadística Inferencial 2

Existen además los siguientes tres cuadros latinos de dimensión cuatro:

Para cuatro tratamientos se pueden construir un total de 576 cuadros latinos


de los cuales cuatro son estándar. La selección del diseño debería ser elegir
uno al azar de los 576 posibles; no obstante, es prácticamente imposible
construirlos a todos para seleccionar uno al azar. Sin embargo, ocurre que
dado un cuadro latino, cualquier intercambio de columnas o de renglones es
también cuadro latino, por eso la estrategia de selección y aleatorización
recomendada en la práctica es la siguiente:

 Se construye el cuadro latino estándar más sencillo.


 Se aleatoriza el orden de los renglones (o columnas) y posteriormente
se aleatoriza el orden de las columnas (o renglones).
 Por último, los tratamientos a comparar se asignan en forma aleatoria
a las letras latinas.

El cuadro latino tiene dos restricciones a la aleatorización debido a los dos


factores de bloque, lo que implica que a la hora de correr el experimento no
hay ningún margen de aleatorización. Es decir, se puede correr por columna
o por renglón según convenga. Lo que no es correcto es hacer todas las
pruebas de un tratamiento, y luego todas las de otro, y así sucesivamente,
puesto que se puede introducir ruido adicional debido a factores no
controlables que cambian con el tiempo.

Ejemplo.
(Comparación de cuatro marcas de llantas) Una compañía de mensajería está
interesada en determinar cuál marca de llantas tiene mayor duración en
términos del desgaste. Para ello se planea un experimento en cuadro latino,
en el que se comparan las cuatro marcas de llantas sometiéndolas a una
prueba de 32 000 kilómetros de recorrido, utilizando cuatro diferentes tipos
de auto y las cuatro posiciones posibles de las llantas en el auto. Así, el factor
de interés es el tipo de llantas o marca, y se controlan dos factores de bloque:
el tipo de carro y la posición de la llanta en el auto. Estos factores de bloque
se controlan ya que, por experiencia, se sabe que el tipo de carro y la posición
de la llanta tienen efecto en el desgaste de la misma.
La elección del cuadro latino a utilizar se hace antes de obtener los datos.
Para ello, a partir de un cuadro latino inicial se aleatorizan las columnas y los
renglones; después, las diferentes marcas de llantas se asignan de manera
aleatoria a las letras latinas que denotan los niveles del factor de interés

66
Estadística Inferencial 2

Las pruebas se hacen al mismo tiempo con choferes, a quienes se les instruye
para que manejen de manera similar sobre el mismo terreno para los cuatro
automóviles. Al hacer las pruebas de los cuatro autos al mismo tiempo se
evita el efecto del ambiente en el desgaste; asimismo, el conductor y el tipo
de terreno podrían influir, pero se considera suficiente mantenerlos lo más
homogéneo posible durante el experimento. El diseño y los datos observados
se muestran en la tabla anterior. Se mide la diferencia máxima entre el grosor
de la llanta nueva y el grosor de la llanta después de recorrido los 32 000
kilómetros. Obviamente, a mayor diferencia en grosor mayor desgaste. Las
unidades de medición son milésimas de pulgada

Se observa que nuestro punto crítico tanto para la posición, el tipo de carro
y las marcas es de 4.76.
Concluimos que en las marcas y posición no existe evidencia de que esta
influya por lo que se acepta la hipótesis nula de que son iguales a un nivel de
significancia de 𝛼 = 0.05 En cuanto al tipo de carro observamos que este si
influye en el desgaste de las llantas por lo que rechazamos la hipótesis nula

Resultado arrojado en Minitab

67
Estadística Inferencial 2

Calculo manual para ANOVA de cuadro latino

𝑌𝑖 = 𝑆𝑢𝑚𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒𝑙 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑖


𝑌̅𝑖 = 𝑀𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑖 − 𝑒𝑠𝑖𝑚𝑜 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜
𝑌 = 𝑆𝑢𝑚𝑎 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎𝑠 𝑁 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 𝑚𝑒𝑑𝑖𝑐𝑖𝑜𝑛𝑒𝑠
𝑌̅ = 𝑀𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙 𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
𝑁̈ = 𝑁𝑢𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑚𝑒𝑐𝑖𝑜𝑛𝑒𝑠 (𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠, 𝑛𝑜 𝑠𝑢𝑚𝑎)
𝑛 = 𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑝𝑜𝑟 𝑡𝑎𝑟𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜

1.- Suma de cuadrados de tratamientos o variabilidad debida a la diferencia


entre las marcas de llantas, bloque 1 y bloque 2

𝐾
𝑌𝑖2 𝑌 2 (472 + 492 + 432 + 442 ) 1832
𝑆𝐶𝑇𝑅𝐴𝑇 =∑ − = − = 5.6875
𝑏 𝑁 4 16
𝐼=1

68
Estadística Inferencial 2

𝑏
𝑌𝑗2 𝑌 2 442 + 402 + 502 + 492 1832
𝑆𝐶𝐵1 = ∑ − = − = 16.1875
𝑘 𝑁 4 16
𝑘=1

𝑏
𝑌𝑗2 𝑌 2 562 + 512 + 47 + 292 1832
𝑆𝐶𝐵2 = ∑ − = − = 103.6875
𝑘 𝑁 4 16
𝑘=1

2.- Suma total de cuadrados o variabilidad total de los datos


𝑏 𝑘
𝑌2 1832
𝑆𝐶𝑇 = ∑ ∑ 𝑌𝑖𝑗2 − = 2249 − = 155.9375
𝑁 16
𝑗=1 𝑖=1

3.- Suma de cuadrados del error o variabilidad dentro de métodos de


ensamble

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅𝐴𝑇+𝐵1+𝐵2 = 155.9375 − (5.6875 + 16.1875 + 103.6875)


= 30.375

4.- Cuadrados medios de tratamientos, del bloque 1, del bloque 2 y del error

𝑠𝑐𝑇𝐴𝑅𝑇
𝐶𝑀𝑇𝑅𝐴𝑇 = = 1.893
𝐾−1
𝑠𝑐𝐵1
𝐶𝑀𝐵1 = = 5.39
𝐾−1
𝑠𝑐𝐵2
𝐶𝑀𝐵2 = = 34.395
𝐾−1

𝑠𝑐𝐸 30.37
𝐶𝑀𝐸 = = = 5.061
𝐺𝑙𝐸 6

5- Estadístico de prueba

𝐶𝑀𝑇𝐴𝑅𝑇 1.893
𝐹𝑇𝑅𝐴𝑇 = = = 0.37
𝐶𝑀𝐸 5.061

𝐶𝑀𝐵1 5.39
𝐹𝐵1 = = = 1.06
𝐶𝑀𝐸 5.061

𝐶𝑀𝐵2 34.395
𝐹𝐵2 = = = 6.83
𝐶𝑀𝐸 5.061

69
Estadística Inferencial 2

Comprobación de supuestos. Como se comentó antes, la validez del análisis


de varianza recae en tres supuestos que siempre deben verificarse:
 Normalidad
 Varianza constante
 Independencia de los residuos

Además de la ausencia de observaciones atípicas o aberrantes. También se


cumple el supuesto de varianza constante de acuerdo a la gráfica de residuos
vs valor ajustado, y en la gráfica de residuos vs orden de observación, en la
que los residuos se ubican aleatoriamente dentro de una banda horizontal;
su dispersión vertical es la misma a lo largo de los gráficos. No se comprobó
el supuesto de independencia porque no se conoce el orden en que se
realizaron las mediciones del desgaste.

Gráficas de residuos para la verificación de supuestos

70
Estadística Inferencial 2

3.3 Diseño en cuadrado grecolatino


Con el diseño en cuadro grecolatino (DCGL) se controlan tres factores de
bloque, además del factor de tratamiento. Se llama cuadro grecolatino porque
los cuatro factores involucrados se prueban en la misma cantidad de niveles,
de aquí que se pueda escribir como un cuadro; además, se utilizan letras
latinas para denotar a los tratamientos y letras griegas para nombrar a los
niveles del tercer factor de bloque.

Al igual que en el cuadro latino, cada letra (latinas y griegas) debe aparecer
sólo una vez en cada renglón y en cada columna. Además, cada par de letras
debe aparecer sólo una vez en todo el arreglo. El modelo estadístico que
describe a las mediciones en un cuadro grecolatino está dado por:

𝑌𝑖𝑗𝑙𝑚 = 𝜇 + 𝑡𝑖 + 𝛾𝑗 + 𝛿𝑙 + 𝜑𝑚 + 𝜀𝑖𝑗𝑙𝑚

𝑆𝐶𝑇 = 𝑆𝐶𝑇𝑅𝐴𝑇 + 𝑆𝐶𝐵1 + 𝑆𝐶𝐵2 + 𝑆𝐶𝐵3 + 𝑆𝐶𝐸

Un bosquejo del análisis de varianza se muestra en la tabla siguiente, en la


cual se prueban las hipótesis de igualdad de letras latinas (tratamientos), de
renglones, de columnas y de letras griegas

ANOVA para el diseño en cuadro grecolatino

71
Estadística Inferencial 2

3.4 Uso de un software estadístico


Para capturar los datos en Minitab para el diseño de bloques se sigue la
siguiente secuencia:
Primeramente en la hoja de cálculo de Minitab, se capturan los datos en las
columnas uno dos y tres de la siguiente manera:
a) En la columna uno se captura el método u tratamiento indicando de
que método se trata y cuantas repeticiones hay del mismo, repitiendo
el mismo número 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4
b) En la segunda columna se anota el operador, en la posición que le
corresponde. 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4
c) En la tercera columna se anota el dato numérico de la tabla de datos,
es decir el tiempo promedio para este caso. 6, 9, 7, 8, 7, 10, 11, 8,
10, 16, 11, 14, 10, 13, 11, 9
d) En el cuadro de captura será en ANOVA de dos factores, en la
ventana de captura se anotara en Respuestas el nombre de la tercer
columna, en este caso dato, en el cuadro del factor fila se anota el
nombre de la primera columna que corresponde al método o
tratamiento, en el factor columna se anota el nombre del factor bloque
que en este caso es operador
Nota, recordar que esto se hace en el cuadro principal de la izquierda dando
dos clics con el ratón.
e) Indicar aceptar y obtendremos el resultado.

Para capturar los datos en Minitab para el cuadro latino (ANOVA de dos
factores) se sigue la siguiente secuencia:
Primeramente en la hoja de cálculo de Minitab, se capturan los datos
en las columnas uno dos tres y cuatro de la siguiente manera:

72
Estadística Inferencial 2

a) En la columna uno, se captura la posición (para el problema de


comparación de llantas) indicando cuantas repeticiones hay de ese
número repitiendo el mismo número 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3,
3, 4, 4, 4
b) En la segunda columna se anota el carro, tal y como se indica en el
diseño del cuadro. 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4
c) En la tercera columna se anota la letra que corresponde a la marca
de las llantas en la secuencia que le corresponda según los números
de la columna anterior. C, D, A, B, B, C, D, A, A, B, C, D, D, A, B, C
d) En la cuarta columna se anota los valores correspondientes a la
respuesta, es decir, el desgaste. 12, 11, 13, 8, 14, 12, 11, 3, 17,
14, 10, 9, 13, 14, 13, 9
e) Ahora en Estadísticas de Minitab, seleccionar ANOVA, luego Modelo
linear general.
f) En respuesta seleccionar la columna cuatro (desgaste) dando dos
clics con el ratón, luego en Modelo, indicar con dos clics del ratón,
carro, marca y desgaste (recordar que esto se hace en el cuadro
principal de la izquierda quedando de manera continua sin comas,
pero con su espacio de separación)
g) En factores aleatorios se deja en blanco, y se indica aceptar, y
obtendremos el resultado

Para capturar los datos en Minitab para el cuadro grecolatino (ANOVA de tres
factores de bloque) se sigue la siguiente secuencia:
Primeramente en la hoja de cálculo de Minitab, se capturan los datos
en las columnas uno dos tres, cuatro y cinco de la siguiente manera:
a) En la columna uno se captura la tratamiento o método, indicando
con un número cuantas repeticiones hay de ese tratamiento, repitiendo
el mismo número 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4

73
Estadística Inferencial 2

b) En la segunda columna se anota el operador (para el ejemplo de


referencia), es decir si es repetición 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4, 1,
2, 3, 4
c) En la tercera columna se anota el número que representa a la letra
latina como se colocaron el diseño del cuadro (para este caso el orden
de las cuatro letras iníciales fue C, B, D, y A (C = 1, B = 2, D = 3 y A
= 4)). Anotando el número que represente a cada letra indicada en el
cuadro. 1, 2, 3 , 4, 2, 1, 4, 3, 4, 3, 2, 1, 3, 4, 1, 2

d) En la cuarta columna se anota el número que representa a la letra


griega como se colocaron el diseño del cuadro (para este caso el orden
de las cuatro letras iníciales fue 𝛽, 𝛾, 𝛿 y 𝛼 (𝛽 = 1, 𝛾 = 2 , 𝛿 = 3 y 𝛼 =
4)). Anotando el número que represente a cada letra indicada en el
cuadro. 1, 2, 3, 4, 4, 3, 2, 1, 3, 4, 1, 2, 2, 1, 4, 3
e) En la quinta columna se anota los valores correspondientes a la
respuesta, es decir, el tiempo o promedio (para este ejemplo), siendo:
10, 10, 12, 7, 8, 15, 7, 14, 6, 14, 11, 13, 11, 8, 10, 8
f) Ahora en Estadísticas de Minitab, seleccionar ANOVA, luego Modelo
linear general.

g) En respuesta seleccionar la columna quinta (tiempo o promedio)


dando dos clic con el ratón, luego en Modelo, indicar con dos clic del
ratón, método, operador, orden y lugar (recordar que esto se hace en
el cuadro principal de la izquierda)
h) En factores aleatorios se deja en blanco, y se indica aceptar, y
obtendremos el resultado

74
Estadística Inferencial 2

75
Estadística Inferencial 2

Unidad 4:
Conceptos
básicos en
diseños
factoriales

76
Estadística Inferencial 2

Es frecuente que en muchos procesos existan varios factores de los que es


necesario investigar de manera simultánea su influencia sobre una o varias
variables de respuesta, donde cada factor tiene la misma importancia a priori
desde el momento que se decide estudiarlo, y es poco justificable suponer de
antemano que los factores no interactúan entre sí. Los diseños
experimentales que permiten estudiar de manera simultánea el efecto de
varios factores son los llamados diseños factoriales.
El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre
una o varias respuestas o características de calidad y determinar una
combinación de niveles de los factores en la cual el desempeño del proceso
sea mejor que en las condiciones de operación actuales; es decir, encontrar
nuevas condiciones de operación del proceso que eliminen o disminuyan
ciertos problema de calidad en la variable de salida.
Los factores pueden ser de tipo cualitativo (máquinas, tipos de material,
operador, la presencia o ausencia de una operación previa, etc.), o de tipo
cuantitativo (temperatura, humedad, velocidad, presión, etc.). Para poder
estudiar la manera en que incluye cada factor sobre la variable respuesta, es
necesario elegir al menos dos niveles de prueba para cada uno de ellos (tres
máquinas, dos operadores, tres velocidades, dos temperaturas, etc.). Con el
diseño factorial completa se corren aleatoriamente en el proceso todas las
posibles combinaciones que pueden formarse con los niveles seleccionados.
Un diseño de experimentos factorial o arreglo factorial es el conjunto de
puntos experimentales o tratamientos que pueden formarse considerando
todas las posibles combinaciones de los niveles de los factores. Por ejemplo,
con k = 2 factores, ambos con dos niveles de prueba, se forma el diseño
factorial 2 ∗ 2 = 22 , que consiste de cuatro combinaciones o puntos
experimentales.
Considerando otra vez k = 2 factores, pero ahora uno con tres niveles y el
otro con dos niveles, se pueden construir 3 x 2 combinaciones que dan lugar
al diseño factorial 3 x 2. Observe que en el nombre del diseño factorial va
implícita el número de tratamientos que lo componen. Para obtener el número
de corridas experimentales se multiplica el número de tratamientos por el
número de réplicas, donde una réplica se lleva a cabo cada vez que se repite
el arreglo completo.
Más en general, la familia de diseños factoriales 2𝑘 consiste de k factores,
todos con dos niveles de prueba; y la familia de diseños factoriales 3𝑘 consiste
de k factores cada uno con tres niveles de prueba. Es claro que si los k
factores no tienen la misma cantidad de niveles, entonces no se puede
factorizar de esta forma, y debe escribirse el producto de manera más
explícita: por ejemplo con k = 3 factores, el primero con cuatro niveles y los
dos restantes con dos niveles, se tiene el diseño factorial 2 ∗ 2 ∗ 4 ∗ 𝑜 4 ∗ 22 ,
que consiste de 16 combinaciones de niveles diferentes

77
Estadística Inferencial 2

4.1 Diseños factoriales con dos factores


El experimento factorial más sencillo es en el que intervienen solamente dos
factores, por ejemplo, A y B. Hay a niveles del factor A y b niveles del factor
B. El experimento tiene n réplicas y cada réplica contiene todas las
combinaciones de tratamientos ab.
Considere los factores A y B con a y b (𝑎, 𝑏 ≥ 2) niveles de prueba,
respectivamente. Con ellos se puede construir el arreglo o diseño factorial
𝑎𝑥𝑏 , que consiste de tratamientos. Se llama réplica cada repetición completa
del arreglo factorial. Los diseños factoriales que involucran menos de cuatro
factores se corren replicados para poder tener la potencia necesaria en las
pruebas estadísticas sobre el efecto de interés, de tal forma que si se hacen
réplicas, el número total de corridas experimentales es 𝑛(𝑎𝑥𝑏 ).

Efecto principal y efecto de interacción El efecto de un factor se define como


el cambio observado en la variable de respuesta debido a un cambio de nivel
de tal factor. En particular, los efectos principales son los cambios en la media
de la variable de respuesta que se deben a la acción individual de cada factor.
En términos matemáticos, el efecto principal de un factor con dos niveles es
la diferencia entre la respuesta media observada cuando tal factor estuvo en
su primer nivel, y la respuesta media observada cuando el factor estuvo en
su segundo nivel.

𝑌𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + (𝛼𝛽)𝑖𝑗 + 𝜀𝑖𝑗𝑘

Donde 𝜇 es la media general, 𝛼𝑖 es el efecto debido al i-ésimo nivel del factor


A, 𝛽𝑗 es el efecto del j-ésimo nivel del factor B, (𝛼𝛽)𝑖𝑗 representa al efecto
de interacción en la combinación 𝑖𝑗 y 𝜀𝑖𝑗𝑘 es el error aleatorio que supone
sigue una distribución con media cero y varianza constante 𝜎 2 (𝑁(0, 𝜎 2 )) y son
independientes entre sí. Para que la estimación de los parámetros en este
modelo sea única, se introducen las restricciones:

78
Estadística Inferencial 2

𝑎 𝑏 𝑎 𝑏

∑ 𝛼𝑖 = 0 , ∑ 𝛽𝑖 = 0 𝑦 ∑ ∑ 𝛼𝛽𝑖𝑗 = 0
𝑖=1 𝑗=1 𝑖=1 𝑗=1

Es decir, los efectos dados en el modelo son desviaciones respecto de la


media global. Puede usarse el análisis de varianza para probar hipótesis
relativas a los efectos principales de los factores A y B y la interacción AB.
En este modelo, las hipótesis de interés para los tres efectos son:

Estas hipótesis se prueban mediante la técnica de análisis de varianza que


para un diseño factorial 𝑎𝑥𝑏 con 𝑛 réplicas resulta de descomponer la variación
total como
𝑆𝐶𝑇 = 𝑆𝐶𝐴 + 𝑆𝐶𝐵 + 𝑆𝐶𝐴𝐵 + 𝑆𝐶𝐸

Si el valor-p es menor al nivel de significancia 𝛼 prefijado, se rechaza la


hipótesis nula y se concluye que el correspondiente efecto está activo o
influye en la variable de respuesta.

Recordemos la notación de puntos para representar sumas y medias:

79
Estadística Inferencial 2

Con esta notación la suma de cuadrados totales es:


𝑎 𝑏 𝑛
2
𝑌…2
𝑆𝐶𝑇 = ∑ ∑ ∑ 𝑌𝑖𝑗𝑘 −
𝑁
𝑖=1 𝑗=1 𝑘=1
Donde N = abn es el total de observaciones en el experimento. Las sumas de
cuadrados de efectos son:
𝑎
𝑌𝑖..2 𝑌…2
𝑆𝐶𝐴 = ∑ −
𝑏𝑛 𝑁
𝑖=1

𝑏
𝑌.𝑗.2 𝑌…2
𝑆𝐶𝐵 = ∑ −
𝑎𝑛 𝑁
𝑗=1

𝑎 𝑏
𝑌𝑖𝑗2 𝑌…2
𝑆𝐶𝐴𝐵 = ∑ ∑ − − 𝑆𝐶𝐴 − 𝑆𝐶𝐵
𝑛 𝑁
𝑖=1 𝑗=1

Y al final, al restar éstas del total, se obtiene la suma de cuadrados del error
como:

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 − 𝑆𝐶𝐴𝐵

Comparación de medias. Las comparaciones de medias se introdujeron en la


sección “Diseño completamente al azar y ANOVA” de la unidad 2, para
después de un ANOVA en el que se rechaza 𝐻0 , investigar cuáles medias causa
las diferencias detectadas. El ANOVA sólo indica que al menos un par de
niveles del factor significativo son diferentes entre sí, pero no dice cuáles son.
Para probar estas hipótesis con el método LSD habría que calcular las
diferencias muéstrales en el valor absoluto y compararlas con la diferencia
mínima significativa. Cabe aclarar que este análisis es engañoso cuando el

80
Estadística Inferencial 2

efecto de interacción es significativo. Por ello, y sólo por ilustrar el método,


se prueban las hipótesis del factor A ignorando por el momento la interacción.
La diferencia mínima significativa para comparar los niveles i y l del factor A,
está dada por:

1 1
𝐿𝑆𝐷𝐴 = 𝑡𝛼,𝑎𝑏(𝑛−1) √𝐶𝑀𝐸 [ + ]
2 𝑛𝐴𝑖 𝑛𝐴𝑙

4.2 Diseños factoriales con tres factores


Cuando se quiere investigar la influencia de tres factores (A, B y C) sobre una
o más variables de respuesta, y el número de niveles de prueba en cada uno
de los factores es a, b y c, respectivamente, se puede construir el arreglo
factorial 𝑎 𝑥 𝑏 𝑥 𝑐 , que consiste 𝑎 𝑥 𝑏 𝑥 𝑐 de tratamientos o puntos
experimentales. Entre los arreglos de este tipo que se utilizan con frecuencia
en aplicaciones diversas se encuentran: el factorial 23 , el factorial 33 y los
factoriales mixtos con no más de cuatro niveles en dos de los factores, por
ejemplo, el factorial 4 x 3 x 2 y el factorial 4 x 4 x 2, por mencionar dos de
ellos.

Hipótesis de interés. El estudio factorial de tres factores (A, B y C) permite


investigar los efectos: A, B, C, AB, AC, BC y ABC, donde el nivel de desglose
o detalle con el que pueden estudiarse depende del número de niveles
utilizando en cada factor. Por ejemplo, si un factor se prueba en dos niveles,
todo su efecto marginal (individual) es lineal, o sea que su efecto individual
no se puede descomponer; pero, si tuviera tres niveles su efecto marginal se
puede descomponer en una parte lineal y otra cuadrática pura.
En resumen, se tienen siete efectos de interés sin considerar desglose, y con
ellos se pueden plantar las siete hipótesis nulas

Cada una aparejada con su correspondiente hipótesis alternativa. El ANOVA


para probar estas hipótesis se muestran en la siguiente tabla

81
Estadística Inferencial 2

Al efecto cuyo valor-p sea menor al valor especificado para alfa, se declara
estadísticamente significativo o se dice que está activo. Las sumas de
cuadrados son muy similares a las obtenidas para dos factores; habrá que
considerar un subíndice adicional para el tercer factor, y comenzando otra
vea, por la suma total de cuadrados, éstas resultan ser:

𝑎 𝑏 𝑐 𝑛
𝑌2…
𝑆𝐶𝑇 = ∑ ∑ ∑ ∑ 𝑌2𝑖𝑗𝑘 −
𝑁
𝑖=1 𝑗=1 𝑘=1 𝑙=1

Donde 𝑁 = 𝑎𝑏𝑐𝑛 es el total de observaciones en el experimento. Las sumas


de cuadrados de efectos son:

82
Estadística Inferencial 2

Al restar éstas del total, la suma de cuadrados del error resulta ser:

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 − 𝑆𝐶𝐶 − 𝑆𝐶𝐴𝐵 − 𝑆𝐶𝐴𝐶 − 𝑆𝐶𝐵𝐶 − 𝑆𝐶𝐴𝐵𝐶

Cuyos respectivos grados de libertad se dan en la tabla anterior. Una vez


hecho el ANOVA, se procede a interpretar los efectos activos, y luego (aunque
no necesariamente después) a diagnosticar la calidad del modelo.

4.3 Diseño factorial general


Los diseños factoriales son a ampliamente utilizados en experimentos en los
que intervienen varios factores para estudiar el efecto conjunto de estos
sobre una respuesta. Existen varios casos especiales del diseño factorial
general que resultan importantes porque. Se usan ampliamente en el trabajo
de investigación, y porque constituyen la base para otros diseños de gran
valor práctico.

El más importante de estos casos especiales ocurre cuando se tienen k


factores, cada uno con dos niveles. Estos niveles pueden ser cuantitativos
como sería el caso de dos valores de temperatura presión o tiempo. También
pueden ser cualitativos como sería el caso de dos máquinas, dos operadores,
los niveles "superior" e "inferior" de un factor, o quizás, la ausencia o
presencia de un factor.

Una réplica completa de tal diseño requiere que se recopilen 2 𝑥 2 𝑥 . . . . 𝑥 2 =


2𝑘 observaciones y se conoce como diseño general 2𝑘.

El segundo caso especial es el de k factores con tres niveles cada uno,


conocido como diseño factorial 3𝑘.

Se supone que:

 los factores son fijos


 los diseños son completamente aleatorios
 se satisface la suposición usual de normalidad

El diseño 2k es particularmente útil en las primeras fases del trabajo


experimental, cuando es probable que haya muchos factores por investigar.

Conlleva el menor número de corridas con las cuales pueden estudiarse k


factores en un diseño factorial completo. Debido a que sólo hay dos niveles
para cada factor, debe suponerse que la respuesta es aproximadamente lineal
en el intervalo de los niveles elegidos de los factores.

DISEÑO 22 El primer diseño de la serie 2k es aquel que tiene sólo dos


factores, A y B, cada uno con dos niveles. Arbitrariamente, los niveles
del factor pueden llamarse "inferior" y "superior".

83
Estadística Inferencial 2

DISEÑO 23 Suponga que se encuentran en estudio tres factores A, B y


C, cada uno con dos niveles. Este diseño se conoce como diseño
factorial, 23 y las ocho combinaciones de tratamientos pueden
representarse gráficamente mediante un cubo.

Existen en realidad tres notaciones distintas que se usan ampliamente para


las corridas o ejecuciones en el diseño 2k:

 La primera es la notación "+,-", llamada "geométrica".


 La segunda consiste en el uso de letras minúsculas para identificar las
combinaciones de tratamientos.
 En la tercera se utilizan los dígitos 1 y 0 para denotar los niveles alto
y bajo del factor, respectivamente.

Diseño Factorial General 3k Este diseño es una variación del diseño 2k y son
muy útiles como las que se emplean cuando todos los factores actúan a tres
niveles. En los últimos años se ha observado un creciente interés por algunas
de las ideas del profesor Genechi Taguchi acerca del diseño experimental y
su aplicación al mejoramiento de la calidad.

Este es un diseño que consta de k factores con tres niveles cada uno. Los
factores y las interacciones se representan mediante letras mayúsculas. Los
tres niveles de los factores pueden referirse como nivel inferior, intermedio y
superior. Estos niveles se representan mediante los dígitos 0 (nivel inferior),
1 (intermedio) y 2 (superior).

Cada combinación de tratamientos de un diseño 3k se presenta mediante k


dígitos, donde el primero incida el nivel de A, el segundo señale al nivel de B,
y el k-ésimo dígito, el nivel del factor k.

Por ejemplo, es un diseño 32 el 00 representa la combinación de tratamientos,


en la que tanto el factor A como el B están en el nivel inferior, y el 01
representa la combinación de tratamientos que corresponde al factor A en el
nivel inferior y a B en el nivel intermedio.

En éste, el sistema de notación que se prefiere usar es el de + - en virtud de


que facilita la interpretación geométrica del diseño y de que es directamente
aplicable al modelado por regresión, la formación de bloques y la construcción
de factoriales fraccionarios.

La adición de un tercer nivel permite modelar con una relación cuadrática la


relación entre la respuesta y cada factor.

DISEÑO 32 El diseño más simple es el 32 que consta de dos factores


con tres niveles cada uno.

Como hay 32 = 9 combinaciones de tratamientos, existen 8 grados de


libertad entre ellas, Los efectos principales A y B tienen dos grados de
libertad cada uno, y la interacción AB tiene cuatro grados de libertad.
Si hay n réplicas habrá un total de n 32 - 1 grado de libertad,
correspondiendo para el error 32 (n-1) grados de libertad.

84
Estadística Inferencial 2

DISEÑO 33 Si se supone que se están estudiando tres factores (A, B,


C) y que cada factor tiene tres niveles acomodados en un experimento
factorial. Este es un diseño 33 . Las 27 combinaciones tienen 26 grados
de libertad.

Lo que se ha dicho para los dos diseños factoriales con 2 y 3 factores puede
extenderse fácilmente para cuando se tienen mas factores. Considerarse f
factores A,B,C,….,K con niveles a, b, c,….,k, respectivamente, donde la letra
K denota al f-esimo o último factor del conjunto a estudiar, no
necesariamente el undécimo, que es el lugar de esta letra en el alfabeto. Con
estos niveles y factores se puede construir el diseño factorial general a x b
x…x k, que consiste de a x b x….. x k tratamientos o puntos de prueba. Con
este diseño se pueden estudiar f efectos principales, f(f-1)/2 interacciones
dobles, f(f-1) (f-2)/(3 x 2) interacciones triples, y asi sucesivamente hasta la
única interacción de los f factores (ABC….K). El cálculo del número de
interacciones de cierta cantidad m de factores se hace mediante la operación
‘’combinaciones de f en m’’

Que cuenta el número de diferentes maneras de seleccionar m factores de


los f, donde f! = (fx (f-1) x…. 2 x 1.

Por ejemplo, el diseño factorial 25 tiene cinco efectos principales, 10


interacciones dobles, 10 interacciones triples, cinco interacciones cuádruples
y una interacción quíntuple, lo cual da un total de 31 efectos. Por su parte, el
factorial 35 tambien tiene este mismo número de efectos, pero al contar con
tres niveles en cada factor, cada efecto principal se puede descomponer en
su parte lineal y cuadrática. Cabe destacar que mientras el diseño factorial 25
tiene 32 tratamientos, el factorial 35 tiene 243, una cantidad de tratamientos
difícil de manejar. Aun si pudiera correrse, representa una opción muy
ineficaz; además, existen arreglos experimentales más pequeños y eficientes.

De acuerdo con lo antes dicho, en el factorial general a x b x….x k, se pueden


plantear 2 𝑓 -1 hipótesis que se prueban mediante el análisis de varianza. Si
se tienen n replicas. Las primeras tres columnas de este ANOVA se muestran
en la siguiente tabla ANOVA para el diseño factorial general a x b x….x k

85
Estadística Inferencial 2

Donde N=a b c …..k n es el total de observaciones en el experimento. Las


sumas de cuadrados de efectos son:

86
Estadística Inferencial 2

Al final, la suma de cuadrados del error se calcula por sustracción.

En el ANOVA para el factorial general a x b x….x k se observa la necesidad de contar


con al menos dos réplicas del experimento para calcular la suma de cuadrados del error
(SCE), y completar toda la tabla ANOVA. Sin embrago, esta necesidad de réplicas (n-
2), que se ha mencionado. Es para el caso irreal de que interesan los 2 𝑓 - 1 efectos.
Pero resulta que, con excepción del factorial 22 , en un factorial completo prácticamente
nunca interesan todos sus posibles efectos, puesto que en términos generales solo
algunos de ellos están activos. El principio de Pareto, que en este contexto también se
llama principio de esparcida de efectos, dice que la mayoría de la variabilidad observada
se debe a unos pocos de los efectos posibles: por lo común se debe a algunos efectos
principales e interacciones dobles.

4.4 Modelos de efectos aleatorios


Hasta aquí los modelos de efectos que se han utilizado son modelos de efectos
o factores fijos, lo cual significa que todos los niveles de prueba en cada factor
son todos los disponibles para ese factor, o bien, se estudian todos los niveles
de interés en ese factor; es en este sentido que los niveles están fijos. Éste
es el caso, por ejemplo, cuando en el factor operador se toman los tres únicos
operadores como los niveles de prueba, o cuando los niveles del factor
máquinas son las cuatro máquinas existentes. O bien, cuando se comparan
tres tipos de material porque son los que interesa comprar aunque existan
otros materiales de ese tipo. Con factores fijos, las conclusiones obtenidas
sólo son válidas para los niveles de prueba que se estudian en el experimento.
En ocasiones, los niveles de prueba son una muestra aleatoria de la población
de niveles posibles. En este caso es más apropiado utilizar un modelo de
efectos o factores aleatorios. Un ejemplo de esta situación es cuando se
prueban cinco instrumentos de medición, pero la población de los mismos es
de 100 instrumentos; obviamente, no es posible experimentar con todos los
equipos. Entonces se experimenta sólo con cinco de ellos elegidos al azar, y
las conclusiones obtenidas se infieren como válidas para la población entera
de instrumentos.
La aplicación de un modelo de efectos aleatorios conlleva la necesidad de
considerar la incertidumbre asociada con la elección aleatoria de los niveles
de prueba. Es decir, ya no tiene sentido, para un factor A, preocuparse por el
efecto 𝑎𝑖 del nivel 𝑖
Como en efectos fijos. Lo que ahora (con efectos aleatorios) tiene sentido es
hablar de la varianza con la que el factor aleatorio contribuye a la variación
total; es decir, es preciso estimar dicha varianza y probar si su contribución
a la variabilidad total es significativa.

87
Estadística Inferencial 2

El caso de dos factores aleatorios. Si se consideran dos factores aleatorios A


y B, de los cuales se prueban 𝑎 𝑦 𝑏 niveles elegidos de una población grande
de niveles, entonces si 𝑎 𝑥 𝑏 los tratamientos se replican 𝑛 veces, el modelo
de efectos aleatorios es:

𝑌𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + (𝛼𝛽)𝑖𝑗 + 𝜀𝑖𝑗𝑘

De esta manera, si se calcula la varianza en ambos lados del modelo anterior,


se obtiene el modelo de componentes de varianza dado por:

𝑉𝑎𝑟(𝑌𝑖𝑗𝑘 ) = 𝜎𝛼2 + 𝜎𝛽2 + 𝜎𝛼𝛽


2
+ 𝜎2

Donde 𝜎𝛼2 , 𝜎𝛽2 , 𝜎𝛼𝛽


2
son las contribuciones de cada efecto a la variación total
y se llaman componentes de varianza; 𝜎 2 es el componente de varianza
debido al error aleatorio. Las hipótesis de interés son

Los cálculos necesarios para probar estas hipótesis involucran las mismas
sumas de cuadrados del modelo de efectos fijos (diseños factoriales con dos
factores), de las cuales se obtienen los correspondientes cuadrados medios.
Para obtener los estadísticos de prueba 𝐹0 apropiados debe tomarse en cuenta
que los valores esperados de los cuadrados medios son

De tal forma que para probar la hipótesis mencionadas, los estadísticos de


prueba apropiados en el ANOVA son respectivamente. Observe que en el
modelo de efectos aleatorios los cuadrados medios de los efectos principales
se comparan con el cuadrado medio de la interacción, y no con el cuadrado
medio del error, como se hace en el modelo de efectos fijos. En caso de
rechazar alguna de las hipótesis sobre las varianzas, se concluye que el efecto
correspondiente contribuye de manera significativa a la variación de la
respuesta. La conclusión práctica no consiste en determinar el mejor
tratamiento, sino que generalmente se traduce en tomar medidas para que
la contribución del componente de varianza se reduzca.

88
Estadística Inferencial 2

Al resolver las ecuaciones dadas por los valores esperados de cuadrados


medios para los componentes de varianza, se obtienen estimadores de éstos
en función de los cuadrados medios del error, esto es:

𝜎̂ 2 = 𝐶𝑀𝐸

2 𝐶𝑀𝐴𝐵 − 𝐶𝑀𝐸
𝜎̂𝛼𝛽 =
𝑛

𝐶𝑀𝐵 − 𝐶𝑀𝐴𝐵
𝜎̂𝛽2 =
𝑎𝑛

𝐶𝑀𝐴 − 𝐶𝑀𝐴𝐵
𝜎̂𝛼2 =
𝑏𝑛

4.5 Uso de un software estadístico


Utilizando Minitab:
1. El primer paso consisten en seleccionar la opción Estadísticas del
Menú Principal de Minitab y, dentro de esa opción, seleccionar la
opción DOE luego Factorial y Crear diseño factorial como se
presenta en la siguiente Figura.

2. Como consecuencia de la acción anterior le debe aparecer la


siguiente pantalla <<Crear diseño factorial>>. El paso en esta
pantalla será seleccionar en Tipo de diseño la casilla de Diseño
factorial completo general luego escoger el número de factores
considerados en el experimento (en nuestro ejemplo son dos
factores: A y B), por tanto en la casilla <<Número de factores>>
usted deberá tener el número 2. Luego debe oprimir el botón de la

89
Estadística Inferencial 2

opción <<Diseños>> para poder escoger su diseño, número de


repeticiones y otras opciones.

3. En la siguiente ventana escribir el nombre de nuestros factores A y


B, además de indicar el número de niveles para ambos (4 y 3
respectivamente), también indicará que realizamos tres
repeticiones por tratamiento, para esto en la casilla <<Número de
réplicas>>, usted deberá tener el valor de 3. Finalice esta pantalla
oprimiendo <<Aceptar>>. Esto lo devolverá a la pantalla anterior
<<Crear diseño factorial>>.

4. De vuelta en la pantalla <<Crear diseño factorial>>. Seleccionar


factores y aparecerá una siguiente ventana. En la casilla <<Tipo>>
seleccionar texto para ambos factores, <<Valores de nivel>> ,
indicar los valores correspondientes tanto para el factor A así como
para el factor B, luego indicar aceptar, lo que lo llevara nuevamente
a la pantalla <<Crear diseño factorial>>.

90
Estadística Inferencial 2

5. De vuelta a la pantalla <<Crear diseño factorial>> oprima


<<Aceptar>>. MINITAB le creará la siguiente pantalla. Minitab crea
las columnas de los tratamientos, lo único que usted tiene que
ingresar a MINITAB es una columna con la respuesta del
experimento. Proceda entonces a ingresar los datos en la columna
C7

6. Una vez capturados los datos (estos datos deberán corresponder al


factor A con respecto a factor B de acuerdo a la tabla original) en
su correspondiente renglón. El siguiente paso es regresar al paso 1.

sólo que esta vez seleccionaría la secuencia: <<Estadísticas>>


seguida de <<DOE>>, <<Factorial>> y <<Analizar diseño
factorial>>.

91
Estadística Inferencial 2

Esta acción resultará en la pantalla donde sólo es necesario indicar la columna


de la variable de respuesta <<Respuesta>> seguido de aceptar y MINITAB
le ofrecerá el resultado correspondiente.

Para capturar los datos en Minitab, de tres factores, es idéntico al de dos


factores, solo que en la ventana correspondiente indicar que se trata de tres
factores, y se aplica la misma secuencia.

92
Estadística Inferencial 2

Unidad 5: Series
de tiempo

93
Estadística Inferencial 2

5.1 Modelo clásico de series de tiempo


Toda institución, ya sea la familia, la empresa o el gobierno, tienen que hacer
planes para el futuro si ha de sobrevivir y progresar. Hoy en día diversas
instituciones requieren conocer el comportamiento futuro de ciertos
fenómenos con el fin de planificar, prever o prevenir.
Debido a que las condiciones económicas y comerciales varían en el tiempo,
los líderes de los negocios deben encontrar formas de mantenerse al día
respecto a los efectos que esos cambios tendrán en sus operaciones. Una
técnica que pueden usar los líderes de negocios como ayuda en la planeación
de las necesidades operativas en lo futuro es el pronóstico. Aunque se han
desarrollado numerosos métodos para pronosticar, todos tienen un objetivo
común, predecir los eventos futuros de manera que las proyecciones se
puedan incorporar en el proceso de toma de decisiones. Suponga que
necesitamos hacer pronósticos trimestrales para el volumen de ventas de
determinado producto durante el próximo año. Los programas de producción,
las compras de materias primas, las políticas de inventarios y las cuotas de
venta serán afectados, todos, por esos pronósticos. Entonces, los malos
pronósticos darán como resultado una mala planeación y, en consecuencia,
aumentarán los costos de la empresa. ¿Cómo se hace para elaborar los
pronósticos trimestrales del volumen de ventas? Desde luego que se deben
considerar los datos reales de ventas del producto en periodos pasados. Con
tales datos históricos podemos identificar el nivel general de ventas y
cualquier tendencia, como aumento o disminución en el volumen a través del
tiempo. Por ejemplo, un examen más detallado de los datos puede revelar un
comportamiento estacional, como el de los picos que se presentan en el tercer
trimestre de cada año y los mínimos durante el primer trimestre. Al repasar
los datos históricos se puede, con frecuencia, adquirir una mejor comprensión
de la tendencia de las ventas en el pasado para poder pronosticar las ventas del
producto en el futuro de una mejor manera. Las ventas históricas forman una
serie de tiempo que es un conjunto de observaciones de una variable medida
en puntos o periodos sucesivos en el tiempo. En esencia, existen dos
enfoques de pronósticos: cualitativo y cuantitativo. Los métodos de
pronóstico cualitativos son importantes en especial cuando no se dispone de
datos históricos, como sería el caso de un departamento de finanzas que
desea pronosticar los ingresos de una compañía nueva. Los métodos de
pronóstico cualitativos se consideran altamente subjetivos o basados en la
opinión. Incluyen el método de elaboración de escenarios, la opinión de
expertos y la técnica Delphi.
Método Delphi. El método délfico, desarrollado en principio por un grupo de
investigación de la Rand corporation. Trata de determinar pronósticos
mediante ¨consenso de grupo¨. En forma normal, a los miembros de un
equipo de expertos, todo sellos separados físicamente y desconocidos entre
sí, se les pide contestar una serie de cuestionarios. Se tabulan las respuestas
del primer cuestionario y éstas se usan para preparar un segundo
cuestionario que contiene la información y las opiniones de todo el grupo. A

94
Estadística Inferencial 2

continuación se pide a cada encuestado reconsiderar y, posiblemente,


corregir sus respuestas anteriores a la vista de la información obtenida con
el grupo.
Clasificación de los métodos de pronósticos

Opinión de expertos. Con frecuencia, los pronósticos se basan en el juicio de


un solo experto, o representan el consenso de un grupo de expertos. Por
ejemplo, cada año se reúne un grupo de expertos en Merrill Lynch con el fin
de pronosticar el nivel del promedio industrial Dow Jones y la tasa prima para
el siguiente año. Al hacerlo, los expertos se basan, de manera individual en
información que cree que influye en el mercado accionario y las tasas de
interés, a continuación combinan sus conclusiones en forma de un pronóstico.
No se usa modelo formal alguno, y es improbable que dos expertos cualesquiera
visualicen de la misma forma la misma observación. La opinión de expertos
es un método de pronóstico que se recomienda normalmente cuando es
probable que las condiciones en el pasado no rijan en el futuro. Aunque no
se usa modelo cuantitativo formal, el juicio experto ha producido buenos
pronósticos en muchos casos.

Elaboración de escenarios. Este método consiste en desarrollar un escenario


conceptual del futuro, basado en un conjunto bien definido de supuestos. Los
distintos conjuntos de supuestos producen diferentes escenarios. La tarea de
quien toma decisiones es decidir lo probable que es cada escenario y, a
continuación, tomar las decisiones pertinentes .Por otro lado, los métodos de
pronóstico cuantitativo utilizan los datos históricos. La meta es estudiar lo que
ocurrió en el pasado para entender mejor la estructura fundamental de los
datos y proporcionar los medios necesarios para predecirlos sucesos futuros.
Los métodos de pronóstico cuantitativos se dividen en dos tipos: series de
tiempo y causales. Los métodos de pronóstico de series de tiempo implican
la proyección de los valores futuros de una variable basada por completo en
las observaciones pasadas y presentes de esa variable.

95
Estadística Inferencial 2

Series de tiempo. Una serie de tiempo es un conjunto de valores numéricos


obtenidos en periodos iguales en el tiempo
Los métodos de pronóstico causales comprenden la determinación de
factores relacionados con la variable que se predice, e incluyen análisis con
variables retrasadas, modelado econométrico, análisis de indicador líder,
índice de difusión y otros medidores económicos más allá del alcance de este
libro.
Modelo clásico de series de tiempo. La suposición fundamental del análisis de
series de tiempo es que los factores que han influido en los patrones de
actividad en el pasado y el presente tendrán más o menos la misma influencia
en lo futuro. Entonces la meta principal del análisis de series de tiempo es:
identificar y aislar estos factores de influencia con el fin de realizar
predicciones (pronosticar), así como fines administrativos de planeación y
control. Para conseguir estas metas, se han desarrollado muchos modelos
matemáticos que exploran las fluctuaciones entre los factores que componen
una serie de tiempo. Tal vez el más esencial sea el modelo multiplicativo
clásico para datos registrados cada año, trimestre o mes. En principio, el
modelo multiplicativo clásico se usará para pronosticar. Otras aplicaciones
incluyen un análisis detallado de los componentes particulares mediante la
descomposición de las series de tiempo. Por ejemplo, con frecuencia los
economistas estudian una serie de tiempo anual, trimestral o mensual para
filtrar el componente cíclico y evaluar su movimiento respecto a la actividad
económica general. No obstante, las aplicaciones de la descomposición de
una serie de tiempo están fuera de los objetivos de este libro. Para exponer
el modelo multiplicativo clásico de series de tiempo.

Sin embargo, la tendencia no es el único factor componente que influye en


estos datos en particular o en otra serie de tiempo anual. Otros dos factores,
el componente cíclico y el componente irregular, están presentes en los datos.

96
Estadística Inferencial 2

El componente cíclico describe la oscilación o movimiento hacia arriba o hacia


abajo en una serie de tiempo. Los movimientos cíclicos varían en longitud, en
general, duran de 2 a 10 años; difieren en intensidad o amplitud, y a menudo
se relacionan con los ciclos de los negocios. En algunos años los valores serán
más altos que los pronosticados por una sencilla recta de tendencia lineal (es
decir, se encuentran en o cerca de un pico) de un ciclo; en otros años los
valores serán menores que el pronóstico de una recta de tendencia (esto es,
están en o cerca del fondo o depresión de un ciclo). Cualquier dato observado
que no siga la tendencia curva modificada por el componente cíclico es un
indicio del componente aleatorio o irregular. Cuando los datos se registran
por mes o trimestre, se considera un componente adicional llamado factor
estacional junto con los componentes de tendencia, cíclico e irregular.
El modelo multiplicativo clásico de series de tiempo establece que todo valor
observado en una serie de tiempo es el producto de estos factores de
influencia; es decir, cuando los datos se obtienen cada año, una observación

Factores que influyen en datos de series de tiempo

97
Estadística Inferencial 2

5.2 Análisis de fluctuaciones


El primer paso en un análisis de series de tiempo, consiste en graficar los
datos y observar sus tendencias en el tiempo. Primero debe determinarse si
parece haber un movimiento hacia arriba o hacia abajo a largo plazo en la
serie (una tendencia) o si la serie parece oscilar alrededor de una recta
horizontal en el tiempo. En este caso (es decir, no hay tendencia positiva o
negativa a largo plazo), puede emplearse el método de promedios móviles o
el de suavización exponencial para “emparejar” la serie y proporcionar un
panorama global a largo plazo. Por otro lado, si de hecho existe una
tendencia, se pueden aplicar varios métodos de pronóstico de series de
tiempo al manejar datos anuales, y otro método para los datos de series de
tiempo mensual o trimestral.
El patrón o comportamiento de los datos en una serie de tiempo tiene
diversos componentes. El supuesto usual es que se combinan cuatro
componentes separados: la tendencia, el cíclico, el estacional y el irregular
para definir valores específicos de la serie de tiempo. Examinaremos cada
uno de estos componentes. El gráfico de la serie permitirá:
 Detectar Outlier: se refiere a puntos de la serie que se escapan de lo
normal. Un outliers es una observación de la serie que corresponde a
un comportamiento anormal del fenómeno (sin incidencias futuras) o
a un error de medición. Se debe determinar desde fuera si un punto
dado es outlier o no. Si se concluye que lo es, se debe omitir o
reemplazar por otro valor antes de analizar la serie.

98
Estadística Inferencial 2

Los dos puntos enmarcados en una flecha parecen corresponder a un


comportamiento anormal de la serie. Al investigar estos dos puntos se
vio que correspondían a dos días de paro, lo que naturalmente afectó
la producción en esos días. El problema fue solucionado eliminando las
observaciones e interpolando.
 Permite detectar tendencia: la tendencia representa el
comportamiento predominante de la serie. Esta puede ser definida
vagamente como el cambio de la media a lo largo de un periodo.

 Variación estacional: la variación estacional representa un movimiento


periódico dela serie de tiempo. La duración de la unidad del periodo es
generalmente menor que un año. Puede ser un trimestre, un mes o un
día, etc.
Matemáticamente, podemos decir que la serie representa variación estacional
si existe un número s tal que 𝑥(𝑡) = 𝑥(𝑡 + 𝑘 ∙ 𝑠).
Las principales fuerzas que causan una variación estacional son las
condiciones del tiempo, como por ejemplo:
 en invierno las ventas de helado
 en verano la venta de lana
 exportación de fruta en marzo
Todos estos fenómenos presentan un comportamiento estacional (anual,
semanal, etc.)
 Variaciones irregulares (componente aleatoria): los
movimientos irregulares (al azar) representan todos los tipos de
movimientos de una serie de tiempo que no sea tendencia,
variaciones estacionales y fluctuaciones cíclicas. Un modelo
clásico para una serie de tiempo, supone que una serie x(1), ...,
x(n) puede ser expresada como suma o producto de tres
componentes: tendencia, estacionalidad y un término de error
aleatorio.

Existen tres modelos de series de tiempos, que generalmente se aceptan


como buenas aproximaciones a las verdaderas relaciones, entre los
componentes de los datos observados. Estos son:
 Aditivo: X(t) = T(t) + E(t) + A(t)

99
Estadística Inferencial 2

 Multiplicativo: X(t) = T(t) · E(t) · A(t)


 Mixto: X(t) = T(t) · E(t) + A(t)
Dónde:
X(t) serie observada en instante t
T(t) componente de tendencia
E(t) componente estacional
A(t) componente aleatoria (accidental)Una suposición usual es que
A(t) sea una componente aleatoria o ruido blanco con media cero y varianza
constante.

5.3 Análisis de tendencia


En el análisis de serie de tiempo, las mediciones pueden efectuarse cada hora,
día, semana, mes o año o en cualquier otro intervalo regular periódico.
Aunque los datos de serie de tiempo presentan, por lo general, fluctuaciones
aleatorias, esta serie puede mostrar también desplazamientos o movimientos
graduales hacia valores relativamente mayores o menores a lo largo de un
lapso importante de tiempo. El desplazamiento gradual de la serie de tiempo
se llama tendencia de esa serie; este desplazamiento o tendencia es, por lo
común, el resultado de factores a largo plazo, como cambios en la población,
características demográficas de la misma, la tecnología y/o las preferencias
del consumidor.
Por ejemplo, un fabricante de bicicletas podría detectar cierta variabilidad, de
año a año, en la cantidad de bicicletas vendidas. Sin embargo, al revisar las
ventas durante los últimos 10 años, puede encontrar que hay un aumento
gradual en el volumen anual de ventas. Suponga que sus ventas fueron:

Este crecimiento anual de las ventas a través del tiempo muestra una
tendencia creciente de la serie de tiempo. La figura siguiente presenta una
recta que puede ser una buena aproximación a la tendencia de las ventas de
bicicletas. Aunque esa tendencia parece ser lineal y aumentar con el tiempo
a veces, en una serie de tiempo, la tendencia se puede describir mejor
mediante otros patrones.

100
Estadística Inferencial 2

Si al graficar nuestros datos observamos de manera clara la tendencia lineal


a largo plazo (no importando si es positiva o negativa), entonces estaremos
en la posición de pronosticar con un buen nivel de confianza, con alguno de
los métodos que se indicaran más adelante.
Esa tendencia podría ser una buena aproximación de las ventas de un
producto, desde su introducción, pasando por un periodo de crecimiento y
llegando a una etapa de saturación del mercado. La tendencia lineal
decreciente en la sección B se aplica a una serie de tiempo que tenga una
disminución continua a través del tiempo. La recta horizontal de la sección C
representa una serie de tiempo que no tiene aumento o disminución
consistentes a través del tiempo y que, en consecuencia, no tiene tendencia.

5.4 Análisis de variaciones cíclicas


Aunque una serie de tiempo puede presentar una tendencia a través de
periodos grandes, sus valores no caerán con exactitud sobre la línea de
tendencia. De hecho, con frecuencia estas series temporales presentan
secuencias alternas de puntos abajo y arriba de la línea de tendencia. Toda
secuencia recurrente de puntos arriba y debajo de la línea de tendencia, que
dura más de un año, se puede atribuir a un componente cíclico de la serie.
En la gráfica de una serie de tiempo con un componente cíclico obvio. Las
observaciones se hicieron con intervalos de un año.

Muchas series se tiempo presentan comportamiento cíclico con tramos


regulares de observaciones abajo y arriba de la línea de tendencia. En
general, este comportamiento de la serie se debe a movimientos cíclicos de
la economía a través de varios años. Por ejemplo, los periodos de inflación

101
Estadística Inferencial 2

moderada seguidos de periodos de inflación rápida pueden determinar series


de tiempo que se alternan abajo y arriba de una línea de tendencia
ascendente en general (como la serie de tiempo de los costos de vivienda).
Diversas series de tiempo de principios de la década de los ochenta
presentaron este comportamiento.

5.5 Medición de variaciones estacionales e irregulares


Mientras que la tendencia y los componentes cíclicos de una serie de tiempo
se identifican analizando los movimientos de datos históricos a través de
varios años, hay muchas series de tiempo que muestran un patrón regular
dentro de un periodo de un año. Por ejemplo, un fabricante de albercas
inflables espera poca actividad de ventas durante los meses de otoño e
invierno, y ventas máximas en los de primavera y verano. Los fabricantes de
equipo para la nieve y de ropa de abrigo esperan un comportamiento anual
opuesto al del fabricante de albercas. No es de sorprender que el componente
de la serie de tiempo que representa la variabilidad en los datos, debida a
influencias de las estaciones, se llama componente estacional. Aunque uno
suele imaginarse que un movimiento estacional de una serie de tiempo
sucede dentro de un año, también se puede usar para representar cualquier
patrón regularmente repetitivo cuya duración sea menor de un año. Por
ejemplo, los datos diarios de intensidad de tráfico muestran un
comportamiento “estacional” dentro del mismo día, así se tiene que el flujo
máximo se presenta durante las horas de aglomeración, el moderado durante
el resto del día y al caer la noche, y el mínimo a partir de la medianoche hasta
temprano por la mañana.
𝑋 ̂_𝑡 = (𝐼) (𝑋 ̅_𝑔)

Donde:

𝑋̂𝑡 = pronostico del periodo t

t= índice o factor de estacionalidad

𝑋̅𝑔 = media o promedio general de las ventas

Donde:

𝑋̅𝑖
𝐼=
𝑋̅𝑔

𝑋̅𝑖 = media o promedio de las ventas de periodo

El componente irregular de la serie de tiempo es el factor residual, “mil usos”,


que explica las desviaciones de la serie de tiempo real respecto a los factores
determinados por los efectos de la tendencia y los componentes cíclicos y
estacionales. Se debe a factores a corto plazo, imprevisibles y no recurrentes
que afecta a la serie de tiempo. Como este componente explica la variabilidad
aleatoria de la serie, es impredecible; de esta manera, no se puede esperar
predecir su impacto sobre la serie de tiempo.

102
Estadística Inferencial 2

En esta gráfica se muestran los datos originales con tendencia y ciclos. En


este ejemplo se muestra el método para eliminar la tendencia en los datos
del modelo aditivo, dada una ecuación de regresión lineal que se deriva de
los mismos:

Datos Datos sin


originales Tendencia tendencia
t Y Yt=10+2t Y-Yt

1 12 12 0

2 15 14 1

3 18 16 2

4 19 18 1

5 20 20 0

6 21 22 -1

7 22 24 -2

8 25 26 -1

9 28 28 0

10 31 30 1

11 34 32 2

12 35 34 1

13 36 36 0

14 37 38 -1

15 38 40 -2

16 41 42 -1

17 44 44 0

18 47 46 1

103
Estadística Inferencial 2

19 50 48 2

20 51 50 1

5.6 Aplicación de ajustes estacionales


Un ajuste estacional es un método estadístico de eliminar el efecto de efectos
estacionales en una serie temporal que exhibe variaciones claramente
debidas a la estacionalidad o la época del año.

El objetivo de los ajustes estacionales es eliminar efectos estacionales con el


objetivo de analizar la tendencia de una serie temporal y hacer
comparaciones de la serie entre momentos arbitrarios, habiendo compensado
los efectos estacionales. Así, en muchos datos estadísticos de interés, es
común dar los datos desestacionalizados (con los efectos estacionales
eliminados), como por ejemplo en la tasa de desempleo, ya que se conoce
que las estaciones del año tienen impactos diferentes sobre la actividad
económica. Muchos fenómenos económicos tienen ciclos estacionales, como
la producción agrícola o los patrones de consumo (por ejemplo, el consumo
es mayor en Navidad). Es necesario ajustar esos componentes estacionales
para tratar de entender claramente las tendencias, y esa es la principal
motivación para desestacionalizar los datos en las estadísticas oficiales.

La investigación de muchas series temporales de datos económicos y de otro


tipo ha mostrado que muchas magnitudes presentan fluctuaciones
estacionales, atribuibles sólo a la época del año y no relacionada directamente
con la tendencia general de la magnitud estudiada. Ese hecho ya llevado a

104
Estadística Inferencial 2

analizar las series temporales considerando que están formadas por cuatro
componentes:

St: Componente estacional

Tt: Componente tendencial

Ct: Componente cíclico

It: Componente de error.

A diferencia de los componentes tendenciales y cíclicos, los componentes


estacionales, al menos en teoría, tienen una magnitud similar en cada
estación año tras año. Los componentes estacionales de una serie se
consideran a veces como poco interesantes además de que dificultan la
interpretación de series temporales cortas. Por esa razón su eliminación
permite analizar causalmente los otros componentes permitiendo un mejor
análisis de las causas que producen la variación dentro de una serie temporal.

Un ejemplo famoso de variable con efecto estacional es la tasa


de desempleo que habitualmente se representa mediante una serie temporal
a lo largo de años. Esta tasa depende muy especialmente de la estación del
año, por lo que los efectos estacionales son muy importantes cuando se
considera una serie temporal de la tasa de desempleo. Esas influencia
estacionales pueden deberse a las vacaciones escolares, las actividades de
ocio y otras aspectos de la actividad económica influidas por el calendario
civil o el tiempo atmosférico. Una vez la influencia estacional se elimina de la
serie temporal, la tasa de desempleo puede ser comparada a lo largo de
diferentes meses y se pueden hacer predicciones sobre su evolución futura.
Además eso permite comprobar qué efectos de una nueva política o
regulación puede tener sobre dicha tasa de empleo. Muchos institutos de
estadística usan algún tipo de software como Demetra+ para obtener los
ajustes estacionales.

Cuando el ajuste estacional no se realiza (desestacionalización de los datos


mensuales), se puede considerar el cambio interanual usando el mismo mes
como base como medio aproximado de compensar los efectos estacionales.

5.7 Pronósticos basados en factores de Tendencia y


estacionales
Como lo indicamos anteriormente el primer pasó en un análisis de series de
tiempo, consiste en graficar los datos y observar sus tendencias en el tiempo.
Primero debe determinarse si parece haber un movimiento hacia arriba o
hacia abajo a largo plazo en la serie (una tendencia) o si la serie parece oscilar
alrededor de una recta horizontal en el tiempo. En este caso (es decir, no hay
tendencia positiva o negativa a largo plazo), se recomienda antes de aplicar

105
Estadística Inferencial 2

alguno de los métodos de pronóstico suavizar nuestros datos a fin de que la


tendencia se observe de manera clara.

Los métodos que pueden emplearse para suavizar nuestros datos usualmente
son:
 El método de promedios móviles
 El método de suavización exponencial

El objetivo de ambos métodos es el de “emparejar” la serie y proporcionar un


panorama global a largo plazo. Por otro lado, si de hecho existe una
tendencia, se pueden aplicar varios métodos de pronóstico de series de
tiempo al manejar datos anuales, y otro método para los datos de series de
tiempo mensual o trimestral, los cuales se verán posteriormente.

106
Estadística Inferencial 2

Catapulta
Objetivo de la Competencia de la Catapulta

Ver cuál equipo puede lanzar la catapulta y dar en el blanco con la mayor
precisión

Desarrollar catapulta con capacidad para lanzar un objeto con precisión a una
distancia de 3 metros, 4 metros, 5 metros y 6 metros

Objetivo general: Realizar 10 lanzamientos a cada una de las diferentes


distancias, sacar datos estadísticos de los 10 lanzamientos así como su SPC,
determinar los factores de mayor influencia en el resultado y definir ventana
de parámetros

Procedimiento

 Cuando la competencia comience, cada equipo participará uno a la vez.

 El instructor pondrá una moneda (el blanco) a una distancia aleatoria


de la catapulta (entre 3, 4, 5 y 6 metros)

 El equipo medirá la distancia del blanco y efectuará 3 a 5 lanzamientos


hacia el mismo.

 Antes de hacer los lanzamientos, el equipo puede usar como referencia


el modelo predictivo de su DOE para establecer los niveles de los
factores necesarios para alcanzar la distancia previamente medida.

 Indicación: El optimizador de respuestas del Minitab puede ser


útil para esto.

 Después de los 3 o 5 lanzamientos, el instructor pondrá la moneda a


otra distancia (entre 3, 4, 5 y 6 metros)

 El equipo efectuará nuevamente 3 a 5 lanzamientos hacia la moneda.

 El instructor pondrá la moneda a una tercera distancia y el equipo


efectuará otros 3 o 5 lanzamientos.

 Cada equipo tendrá un total de 12 a 20 lanzamientos: 3 a 5


lanzamientos a 4 distancias diferentes.

Evaluación de equipos

 El instructor es el sistema de medición.

 En cada lanzamiento, el instructor medirá la distancia radial entre el


blanco y el punto de impacto del proyectil, en pulgadas o centímetros.

 ¡Esto significa que también es importante la precisión lateral!

 El puntaje del equipo es la suma de todas las mediciones.

 ¡Gana el equipo con el menor puntaje!

107
Estadística Inferencial 2

Aprendizaje

 Todas las fases del DOE pueden hacer o pueden romper el DOE

 Los DOE son muy eficaces

 Pueden crearse buenos modelos a partir de una información mínima

 Deben tenerse en cuenta los factores de ruido

 El factor apropiado y la selección del nivel es vital para el éxito

 Las decisiones iniciales afectan los resultados finales

Especificación

Como proyectil se usó una pelota de lana relleno con material desconocido
aproximadamente 20 gramos

En la catapulta se le agrego un soporte para evitar el rebote de la catapulta

Modificación

Se cambió proyectil a una bomba llena de harina para que la precisión fuera
más exacta igual aproximadamente 20 gramos

En la catapulta para evitar el rebote y fuera mucho más exacta, se decidió


dejar el soporte y agregar el peso de la persona a la hora de cada lanzamiento

108
Estadística Inferencial 2

109
Estadística Inferencial 2

Prueba 1:

Se realizaron 10 lanzamientos en total para cada distancia, divididos en 2


subgrupos de 5 muestras para 3, 4,5 y 6 metros respectivamente.

Prueba 2:

Se realizaron 8 lanzamientos en total para cada distancia, divididos en 2


subgrupos de 4 muestras para 3, 4,5 y 6 metros respectivamente.

110
Estadística Inferencial 2

Gráficos prueba 1

3 Metros
7

0
1 2 3 4 5 6 7 8 9 10
Muestra 1.25 0 3.5 6.125 5.25 1.88 0 2.75 5.25 2.75
Media 2.88 2.88 2.88 2.88 2.88 2.88 2.88 2.88 2.88 2.88
LES 4.88 4.88 4.88 4.88 4.88 4.88 4.88 4.88 4.88 4.88
LEI 0.88 0.88 0.88 0.88 0.88 0.88 0.88 0.88 0.88 0.88
LCS 4.64 4.64 4.64 4.64 4.64 4.64 4.64 4.64 4.64 4.64
LCI 1.11 1.11 1.11 1.11 1.11 1.11 1.11 1.11 1.11 1.11

Muestra Media LES LEI LCS LCI

111
Estadística Inferencial 2

4 Metros
12

10

-2

-4

-6
1 2 3 4 5 6 7 8 9 10
Muestra 0 2.5 0.5 6.75 2.5 1.5 0 2.125 3 4.125
Media 2.3 2.3 2.3 2.3 2.3 2.3 2.3 2.3 2.3 2.3
LES 4.3 4.3 4.3 4.3 4.3 4.3 4.3 4.3 4.3 4.3
LEI 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3
LCS 9.43 9.43 9.43 9.43 9.43 9.43 9.43 9.43 9.43 9.43
LCI -4.83 -4.83 -4.83 -4.83 -4.83 -4.83 -4.83 -4.83 -4.83 -4.83

Muestra Media LES LEI LCS LCI

5 Metros
14

12

10

-2
1 2 3 4 5 6 7 8 9 10
Muestra 2.5 0 0.75 1 4.75 5.5 0 1 3 0
Media 1.85 1.85 1.85 1.85 1.85 1.85 1.85 1.85 1.85 1.85
LES 3.85 3.85 3.85 3.85 3.85 3.85 3.85 3.85 3.85 3.85
LEI -0.15 -0.15 -0.15 -0.15 -0.15 -0.15 -0.15 -0.15 -0.15 -0.15
LCS 13.21 13.21 13.21 13.21 13.21 13.21 13.21 13.21 13.21 13.21
LCI 2.44 2.44 2.44 2.44 2.44 2.44 2.44 2.44 2.44 2.44
Muestra Media LES LEI LCS LCI

112
Estadística Inferencial 2

6 Metros
14

12

10

0
1 2 3 4 5 6 7 8 9 10
Muestra 9.5 9.5 4 0 9.25 1.5 2 0 10.25 8
Media 5.4 5.4 5.4 5.4 5.4 5.4 5.4 5.4 5.4 5.4
LES 7.4 7.4 7.4 7.4 7.4 7.4 7.4 7.4 7.4 7.4
LEI 3.4 3.4 3.4 3.4 3.4 3.4 3.4 3.4 3.4 3.4
LCS 13.21 13.21 13.21 13.21 13.21 13.21 13.21 13.21 13.21 13.21
LCI 2.44 2.44 2.44 2.44 2.44 2.44 2.44 2.44 2.44 2.44

Muestra Media LES LEI LCS LCI

113
Estadística Inferencial 2

ANOVA prueba 1

114
Estadística Inferencial 2

Gráficos prueba 2

3 Metros
25

20

15

10

0
1 2 3 4 5 6 7 8
Muestra 4 4.5 6.13 12 20.00 7.5 4 9
Media 8.39 8.39 8.39 8.39 8.39 8.39 8.39 8.39
LES 10.39 10.39 10.39 10.39 10.39 10.39 10.39 10.39
LEI 6.39 6.39 6.39 6.39 6.39 6.39 6.39 6.39
LCS 14.22 14.22 14.22 14.22 14.22 14.22 14.22 14.22
LCI 2.25 2.25 2.25 2.25 2.25 2.25 2.25 2.25

Muestra Media LES LEI LCS LCI

115
Estadística Inferencial 2

5 Metros
30

25

20

15

10

0
1 2 3 4 5 6 7 8
Muestra 26.25 26.38 26.88 18.25 15.75 12 11.75 7.75
Media 18.13 18.13 18.13 18.13 18.13 18.13 18.13 18.13
LES 20.13 20.13 20.13 20.13 20.13 20.13 20.13 20.13
LEI 16.13 16.13 16.13 16.13 16.13 16.13 16.13 16.13
LCS 25.1 25.1 25.1 25.1 25.1 25.1 25.1 25.1
LCI 11.15 11.15 11.15 11.15 11.15 11.15 11.15 11.15

Muestra Media LES LEI LCS LCI

4 Metros
40

35

30

25

20

15

10

0
1 2 3 4 5 6 7 8
Muestra 4.75 15.5 4 26 7 36.5 10 9
Media 14.09 14.09 14.09 14.09 14.09 14.09 14.09 14.09
LES 16.09 16.09 16.09 16.09 16.09 16.09 16.09 16.09
LEI 12.09 12.09 12.09 12.09 12.09 12.09 12.09 12.09
LCS 25.94 25.94 25.94 25.94 25.94 25.94 25.94 25.94
LCI 2.25 2.25 2.25 2.25 2.25 2.25 2.25 2.25

Muestra Media LES LEI LCS LCI

116
Estadística Inferencial 2

6 Metros
70

60

50

40

30

20

10

0
1 2 3 4 5 6 7 8
Muestra 6.25 38.13 19.5 18 21 33 24 51.63
Media 26.44 26.44 26.44 26.44 26.44 26.44 26.44 26.44
LES 28.44 28.44 28.44 28.44 28.44 28.44 28.44 28.44
LEI 24.44 24.44 24.44 24.44 24.44 24.44 24.44 24.44
LCS 61.91 61.91 61.91 61.91 61.91 61.91 61.91 61.91
LCI 9.9 9.9 9.9 9.9 9.9 9.9 9.9 9.9

Muestra Media LES LEI LCS LCI

ANOVA prueba 2

117
Estadística Inferencial 2

DOE

118
Estadística Inferencial 2

DOE

Nuestra catapulta no resultó ser un DOE, ya que el único factor que podíamos
manipular fue la distancia linear (ángulo), teniendo por entendido que DOE
necesita más de un factor para poder conocer cuáles de ellas afectaban a
nuestras pruebas y así, hacer nuestro prototipo más confiable respecto a sus
lanzamientos, además de reconocer que los demás factores, tales como la
superficie donde se efectuaron los lanzamientos, y el viento, resultaron ser
factores no controlables o manipulables. De igual manera no se consideró la
distancia como factor, sino como una constante.

Resultando así, ser un ANOVA de un factor, pues necesitábamos un


considerable número de corridas para DOE.

En tanto a ANOVA, fue de regresión simple, ya que hubo un factor de entrada


y una variable o factor de salida.

Resultado 1 finales:

119
Estadística Inferencial 2

A 3 metros

120
Estadística Inferencial 2

A 4 metros

121
Estadística Inferencial 2

A 5 metros

A 6 metros

122
Estadística Inferencial 2

Modificaciones Pruebas 1:

123
Estadística Inferencial 2

124
Estadística Inferencial 2

Resultado 2 final:
En este Proyecto, se contempló lo que son las mejoran continuas al igual que
se hace en un proceso de manufactura en la vida real, se aprendió a cómo
manejar la teoría de prueba y error. E incluso aplicamos (5 Porqués) para
mejor la catapulta y encontrar errores y repáralos para que en el proceso de
generar un tiro sea satisfactorio. Y sobre todo que Cumpla con las
especificaciones del cliente, ablando ya en la vida real.

125
Estadística Inferencial 2

126
Estadística Inferencial 2

Resumen:

Los gráficos para cada distancia se encuentran en el archivo Excel “Catapulta


1.1.1.xlsx”

127
Estadística Inferencial 2

Diseño de la catapulta

128
Estadística Inferencial 2

Anexos

129
Estadística Inferencial 2

Tablas

130
Estadística Inferencial 2

131
Estadística Inferencial 2

132
Estadística Inferencial 2

133
Estadística Inferencial 2

134
Estadística Inferencial 2

135
Estadística Inferencial 2

136
Estadística Inferencial 2

Glosario
Experimentación secuencial: Investigar o Revisar, Afinar y Optimizar

Investigar o Revisar: El propósito de revisar un diseño es examinar un


número relativamente grande de factores para establecer cuáles factores
tienen un efecto significativo sobre la variable de respuesta.

Afinar: Los diseños para refinar son lo mismo que los diseños para revisar,
excepto que se incluyen sólo algunos factores críticos tomados del diseño de
revisión.

Optimizar: Estos diseños nos permiten crear modelos matemáticos muy


exactos para unos pocos factores críticos.

Interacción: Ocurre cuando el efecto que un factor tiene sobre la respuesta


depende del nivel de otro factor

Confundidos (Confounding): que no pueden separarse los efectos de


algunos factores y/o interacciones

El bloqueo: es otro aspecto del DOE que está sujeto a confounding.

Repetición – Ejecutar varias muestras durante la ejecución de un mismo


montaje experimental

Replicación – Replicar (duplicar) el experimento completo en una secuencia


temporal

Ejecución – Un montaje individual en un DOE a partir del cual se recoge


información. Una factorial completa de 3 factores tiene 8 ejecuciones. A veces
se le llama Prueba o Combinación de Tratamientos.

Prueba – Ver Ejecución.

Combinación de Tratamientos – Ver Ejecución

Experimentación Diseñada – La manipulación de factores controlables


(variables independientes) a diversos niveles para ver su efecto sobre cierta
respuesta (variable dependiente).

Diseño factorial: Es estudiar el efecto de varios factores sobre una o varias


respuestas, es decir, busca estudiar la relación entre los factores y la
respuesta, y tiene la finalidad de conocer mejor como es esta relación y que
permita tomar acciones y decisiones que mejoren el desempeño del proceso.

Factor cualitativo: Sus niveles toman valores discretos o de tipo nominal


que no pueden ser fracciones.

Factor cuantitativo: Sus niveles de prueba pueden tomar cualquier nivel de


cierto intervalo. La escala es continua, cabe mencionar que en la materia solo
usamos este tipo de factores.

Experimento factorial: Un diseño de experimentos factorial o arreglo


factorial es el conjunto de puntos experimentales o tratamientos que pueden

137
Estadística Inferencial 2

formarse considerando todas las posibles combinaciones de los niveles de los


factores.

Efecto principal y efecto de interacción: El efecto de un factor se define


como el cambio observado en la variable de respuesta debido a un cambio de
nivel de tal factor. En particular los efectos principales son los cambios en la
media de la variable de respuesta debidos a la acción individual de cada
factor.

Unidad experimental: Unidad a la cual se le aplica un solo tratamiento (que


puede ser una combinación de muchos factores) en una reproducción del
experimento.

Variable de respuesta: Es la característica del producto cuyo valor interesa


mejorar mediante el diseño del experimento.

Factores de Ruido (N’s): Factores que son incontrolables, difíciles o muy


costosos de controlar, o preferentemente no controlados

Factores controlables: Son variables de proceso que se pueden fijar en un


punto o nivel de operación. Algunos de estos son los que usualmente se
controlan durante la operación normal del proceso, y se distinguen porque
para cada uno de ellos existe la manera o el mecanismo para cambiar o
manipular su nivel de operación.

Factores no controlables: Son variables que no se pueden controlar


durante la operación normal del proceso como la luz, la temperatura que se
investigan en el experimento para observar cómo afectan o influyen en la
variable de respuesta.

Entrada:

-Factores controlables

-Factores no controlables

Proceso:

-Características que se van a medir

-Factores controlables que debe incluirse en el experimento

-Niveles que se utilizaran en cada factor

-Diseño experimental adecuado

Salida: Característica de calidad o variable de respuesta.

Error aleatorio: Es la variabilidad observada que no se puede explicar por


los factores estudiados, y resulta del pequeño efecto de los factores no
estudiados y del error experimental.

Aleatorizacion: Consiste en hacer corridas experimentales en orden


aleatorio, este principio aumenta la posibilidad de que la independencia del
error se cumpla.

138
Estadística Inferencial 2

Bloqueo: Es nulificar o tomar en cuenta en forma adecuada todos los factores


que pueden afectar la respuesta observada.

Diseño de bloques completos al azar: En este diseño se consideran tres


fuentes de variabilidad. El factor de tratamientos, el factor de bloques y el
error aleatorio, es decir, se tienen tres posibles culpables de variabilidad
presente en los datos.

Diseño de cuadrado latino: Diseño en el que se controlan dos factores de


bloque y uno de tratamientos; los tres factores tienen la misma cantidad de
niveles. Los tratamientos se presentan por letras latinas y se distribuye en
forma adecuada en un cuadro.

Diseño de cuadrado greco-latino: Diseño en el que se controlan tres


factores de bloques y un factor de tratamientos; los cuatro factores utilizan
la misma cantidad de niveles.

Factores: Las variables independientes relacionadas con una variable de


respuesta y se denominan factores.

Nivel: Es el grado de intensidad de un factor.

Tratamiento: Es una combinación especifica de niveles de los factores que


intervienen en un experimento.

Resumen de pasos para el diseño de experimentos:

1-seleccionar los datos.

2-Escoger los tratamientos (combinaciones factor-nivel)

3-Determinar el tamaño de la muestra para cada tratamiento.

4-Asignar los tratamientos a las unidades experimentales.

Diseño Experimental (DOE)


Habitualmente la resolución se mide como III o mayor, donde los números
mayores indican aliasing menos significativo.

Si sospechamos que las interacciones son significativas, necesitamos ser


cuidadosos en nuestro uso de aliasing y por consiguiente en la resolución que
seleccionemos.

Resolución Tres (RIII)

 Un diseño que no alias los efectos principales unos con otros.

 Un diseño que sí alias los efectos principales con interacciones


de 2 vías.

 Se emplea al revisar un gran número de factores para encontrar


sólo los factores más importantes para experimentación futura.

139
Estadística Inferencial 2

 Puesto que estos diseños alias los efectos principales con


interacciones de 2 vías, tratamos de evitarlos

Resolución Cuatro (RIV)

 Un diseño que no alias efectos principales con interacciones de


2 vías.

 Un diseño que sí alias interacciones de 2 vías con otras


interacciones de 2 vías.

 Se emplea para revisar cuando no se sospecha que existen


fuertes interacciones de 2 vías.

 Es útil para las primeras revisiones, pero debe tenerse cuidado.

Resolución Cinco (RV)

 Es un diseño que no alias los efectos principales unos con otros


ni con interacciones de 2 vías

 Además, las interacciones de 2 vías no son aliased unas con


otras.

 Provee para efectos principales e interacciones de 2 vías


unconfounded.

 Es excelente para construir ecuaciones de pronóstico cuando no


hay factores con efectos no lineales.

 Es el diseño que se elige para la revisión secuencial y


especialmente el refinamiento.

 Esto es especialmente cierto si hay interacciones

 Un número grande de factores requerirá “trozos” más


pequeños y secuenciales

140
Estadística Inferencial 2

Bibliografías
Ordenamiento del proyecto María Deyanira Alvarado Grijalva

GUTIERREZ, P. H y DE LA VARA, S. R. 2008. Segunda edición. Análisis y


Diseño de Experimentos. Mc Graw Hill.

MONTGOMERY, C.D.; G.C, RUNGER. 2010. Segunda edición. Probabilidad y


Estadística. LIMUSA WILEY

MONTGOMERY, C.D. Diseño y Análisis de Experimentos. Segunda edición.

LIMUSA WILEY WALPOLE, R.; MAYERS, R.H.; MAYERS, S.L. 1998. Sexta
edición. Probabilidad y Estadística Para Ingenieros. Pearson Education

ANDERSON, D.R.; SWEENEY, D.J.; WILLIAMS, T.A.2005. Octava edición.


Estadística para Administración y Economía.

MATH LEARNING BERENSON, M.L.; LEVINE, D.M.; KREHBIEL, T.C. 2001.


Segunda edición. Estadística para Administración. Prentice Hall.

141