Está en la página 1de 44

“Quien estudia y no práctica lo que

aprendió, es como el hombre que labra


y no siembra”
¿QUÉ ES UN DISEÑO
de Experimentos?
¿QUÉ ES EL DISEÑO EXPERIMENTAL?

 Un diseño experimental es una


técnica estadística que permite
identificar y cuantificar las causas de
un efecto dentro de un estudio
experimental.
 En un diseño experimental se
manipulan deliberadamente una o
más variables, vinculadas a las
causas, para medir el efecto que
tienen en otra variable de interés.
¿QUÉ ES EL DISEÑO EXPERIMENTAL?

 El diseño experimental prescribe una


serie de pautas relativas a: qué variables
hay manipular, de qué manera, cuantas
veces hay que repetir el experimento y
en qué orden para establecer con un
grado de confianza predefinido la
necesidad de una presunta relación
causa-efecto.
¿QUÉ ES EL DISEÑO EXPERIMENTAL?

 El diseño de experimentos tiene dos


principios fundamentales:
 Los experimentos deben ser
conducidos para que ellos
representen la población que el
investigador tiene en mente.
 Los experimentos deben ser
diseñados en tal forma que las
observaciones constituyan evidencia
para probar.
¿QUÉ ES EL DISEÑO EXPERIMENTAL?

 Un experimento diseñado es una


prueba o serie de pruebas en las
cuales se inducen cambios
deliberados en las variables de
entrada de un proceso o sistema, de
manera que sea posible observar e
identificar las causas de los cambios
en la respuesta de la salida.
DISEÑO EXPERIMENTAL

 Tienen un cometido importante en el


desarrollo de procesos y en la
depuración de procesos para
mejorar el rendimiento
 Es una metodología ideal para
aprender acerca de la forma en que
funcionan los sistemas o procesos.
DISEÑO EXPERIMENTAL

 Durante todo el proceso es necesario


tener presente que la
experimentación es parte importante
del proceso de aprendizaje, en la
cual formulamos tentativamente
hipótesis acerca de un sistema,
realizamos experimentos para
investigar dichas hipótesis, y con
base en los resultados actuamos.
USO DE LOS MÉTODOS ESTADÍSTICOS

 Uso del conocimiento estadístico


 Mantener el diseño y el análisis tan
simples como sea posible
 Reconocer la diferencia entre el
significado práctico y la estadística
 Usualmente los experimentos son
interactivos
TIPOS DE VARIABLES EN LOS
EXPERIMENTOS

 Variable independiente.
 Variable dependiente.
 Variable extraña (no se puede
manipular pero influye en la variable
dependiente).
 Variable de bloqueo (es aquella que
interviene en los niveles de la variable
dependiente y se puede eliminar su
influencia mediante el control de la
misma).
TIPOS DE VARIABLES EN LOS
EXPERIMENTOS

 Con la creación de los bloques se


persigue dos objetivos:
 Aislar el efecto de los tratamientos,
eliminando la influencia de l variable de
bloqueo.
 Estimar los efectos de los bloques.
ANÁLISIS DE VARIANZA

 Se realiza para extraer los valores medidos la


información buscada y necesaria para
confirmar o rechazar la hipótesis inicial.
 Esta información consiste en establecer si los
valores de la variable dependiente
“dependen” efectivamente de los
tratamientos, es decir de los valores de la
variable independiente (supuesta causa), o si
predomina el efecto de otros factores
extraños “error”.
ANÁLISIS DE VARIANZA

 El análisis de varianza es una de las


técnicas del diseño de experimentos de
mayor aplicación, pues ofrece
resultados muy útiles para la toma de
decisiones.
 Consiste en una prueba de hipótesis
para la diferencia de más de dos
medias. En esta prueba se tiene k
parámetros poblacionales distribuidos
normalmente, cuya variación se estudia
dividiéndola en componentes.
DISTRIBUCIÓN F
 La distribución de probabilidad que se utiliza
es la distribución F
 Existe una familia de distribuciones F
DISTRIBUCIÓN F

La distribución F es una distribución


continua
F no puede ser negativa
La distribución F tiene un sesgo
positivo
A medida que aumentan los
valores, la curva se aproxima al
eje Y, pero nunca lo toca
TRES MARCAS DE ABONO
Probabilidad

Probabilidad
μ μ
μ
μ
HIPÓTESIS GENERAL

Ho: µ1 = µ2 = µ3
Ha: Al menos una µ es
diferente
HIPÓTESIS GENERAL

 En el análisis de variancia se presume


que cualquier variación existente
entre los promedios de una o más
variables categorizadas se debe a
una variación entre las observaciones
o a una variación entre las categorías.
 La variación interna se debe al azar
mientras que la variación externa se
debe a causas sistemáticas.
PROCEDIMIENTO

Consiste en comparar las dos


estimaciones de σ, una basada en la
varianza
2 entre medias muestrales y otra
basada en la varianza dentro de las
muestras.
La conclusión se obtiene una vez que se
compare el valor de F calculado como el
cociente de ambas varianzas con el F
teórico.
Se Rechaza la Ho cuando:

Fc > Ft
CÁLCULO DEL VALOR FISHER Y LA
RELACIÓN CON LA PROBABILIDAD
ANOVA

Anova o técnica de análisis de varianza


se utiliza para comparar tres o más
medias muéstrales para determinar si
provienen de poblaciones iguales.
Las poblaciones tienen una
distribución normal
Las poblaciones tienen σ iguales
Las muestras se seleccionan de
manera independiente
ANOVA

 Es el procedimiento estadístico que sirve para


medir la variación total de las observaciones,
las que se divide para sus componente,
quedando el residuo como error experimental
.
ANOVA
 El análisis de varianza tiene un esquema
básico, el mismo que se va modificando de
acuerdo al tipo de distribución, que puede ser
Completamente al Azar en el que se mide
únicamente, el efecto de los tratamientos;
 En Bloques Completos al Azar, donde se
evalúa el efecto de los bloques como también
el de los tratamientos y en Cuadrado Latino,
donde se mide o evalúa tres efectos, que
corresponden a hileras, columnas y
tratamientos.
El formato de análisis de varianza es
el siguiente:
Fuente de Grados Suma de Cuadrados F. cal F. tab
variación de cuadrados Medios
libertad
Tratamientos k-1 (n) SCt CMt CMt/CM 5%; 1%
E
Error n-k (d) SCE CME
Total n-1 SCT
C.V
𝐶𝑀𝐸
∗ 100
𝑋

 Los grados de libertad en el numerador equivalen al número de


tratamientos menos 1
 Los grados de libertad en el denominador son el número total de
observaciones menos el número de tratamientos.
Donde:
 Fuente de variación.- Es el lugar donde van las fuentes de
variación, la misma que consta de una variación total que
se descompone, en la variación conocida, que puede ser
dependiendo del tipo de diseño en tratamientos, etc y en la
variación no controlada que corresponde al error
experimental.
 Grados de libertad.- Es el denominador de las varianzas de
cada una de las fuentes de variación.
 Suma de cuadrados.- Es el numerador de la varianza de
cada fuente de variación.
 Cuadrado medio.- Es la varianza de cada fuente de
variación.
 F. Calculada.- Es la relación de las varianzas de las fuentes
de variación con la varianza del error experimental, la que
sirve para compararlas con el valor de la F tabular, de las
tablas de Fisher.
Donde:
 F. Tabular.- Valor que se encuentra en las
tablas de F (Fisher), las que están
conformadas por dos entradas una horizontal
para los grados de libertad del numerador,
que puede corresponder dependiendo del
tipo de diseño a tratamientos, etc. y una
vertical para los grados de libertad del error
experimental.
 El punto de coincidencia de estas dos
entradas es el valor de la F tabular, debiendo
el investigador establecer el nivel de
significancia, que puede ser al 1%, 5%, etc.
Donde:
 Coeficiente de variación.- No es más que la raíz cuadrada
de cuadrado medio del error experimental, que es la
varianza del error dividida para la media general y luego
expresada en porcentaje.
 El coeficiente de variación da una medida de la precisión
con que se ha llevado una investigación y por lo tanto
indica el nivel de confianza que se puede tener en los datos.
 Un bajo valor refleja que el ensayo ha sido bien planificado y
que ha tenido un buen manejo, en cambio un valor alto
puede ser un indicador en ciertos casos de que ha existido
una mala planificación, que el material no ha sido
seleccionado adecuadamente o que el experimento ha
sido mal manejado.
 Sin embargo hay experimentos en los que se registra un valor
elevado del coeficiente de variación el que se debe a la
naturaleza propia del material con que se ha trabajado.
(σ 𝑋)2
SCT = ෍ 𝑋 2 −
𝑛

𝑇𝑐 2 (σ 𝑋)2
SC𝑡 = ෍ −
𝑛𝑐 𝑛

SCE = SCT – SCt


 En donde:
 Tc es el total de la columna para cada
tratamiento
 nc es el número de observaciones (tamaño
de la muestra) para cada tratamiento
 n es el número total de observaciones
Para comparar la efectividad de tres
tipos diferentes de pintura fosforescente
usados para pintar cuadrantes de
indicadores de instrumentación náutica,
se pintan ocho cuadrantes con cada
una de las pinturas. Luego se iluminan los
cuadrantes con luz ultravioleta y se mide
el tiempo en segundos que los números
del cuadrante quedan iluminados
después de apagar la luz. La
información generada se presenta en el
siguiente cuadro.
¿Se puede afirmar con un α de 5% y 1%
que las diferencias observadas entre las
medias de los tipos de pintura son
significativas o se deben simplemente al
azar?
SCT = Σ(x2) - Σ(x)2
n

SCT = 64,411.04 - (1,233.40)2


24

SCT = 1,024.56
Tc 2
Σ(x)2
SCt = Σ
nc n

3782 386,62 468,82 (1,233.40)2


SCt = + +
8 8 8 24

SCt = 628,14
SCE = SCT - SCt

SCE = 1,024.56 – 628,145 = 396,415


Grados
Fuente de Suma de los de Media
Variación Cuadrados libertad Cuadrática Fc
Tratamientos 628,145 2 314,0725 16,64
Error 396,415 21 18,88
Total 1024,56 23
Fc Ft
16,64 > 5,78
 Se rechaza la hipótesis nula, no existe
suficiente evidencia estadística para
aceptar la Ho de igualdad de medias
con un α de 0,01. Por lo tanto, la
efectividad de cada tipo de pintura es
diferente.
GRADOS DE LIBERTAD DE LOS TRATAMIENTOS
G
R
A
D
O
S

D
E

LI
B
E
R
T
A
D

D
E
L

E
R
R
O
R
Comparaciones o pruebas
de Rango Múltiples
 Después de que se rechazó la hipótesis nula en
una análisis de varianza, es necesario ir a detalle
y ver cuáles tratamientos son diferentes.
 Cuando no se rechaza la hipótesis nula el
objetivo del análisis está cubierto y la conclusión
es que los tratamientos son iguales.
Método de Tukey
 Consiste en comparar las diferencias entre medias
muestrales con el valor crítico dado por:

Tα = qα (k, n-k) CME/nc


En donde CMe es el cuadrado medio del error, nc es el número
de observaciones por tratamiento, k es el número de
tratamientos, N-k es el número de grados de libertad para el
error, α es el nivel de significancia prefijado y el estadístico qα
(k, n-k) son puntos porcentuales de la distribución del rango
estudentizado.
Método de Tukey

Tα = qα (k, n-k) CME/nc

Tα = 3.56 x 18,8769/8

Tα = 5.47
Tipo de Pintura
Cuadrante 1 2 3
1 46.30 38.70 62.30
2 48.20 53.60 64.70
3 42.00 49.30 56.20
4 41.80 47.30 60.20
5 48.90 51.40 53.60
6 51.00 53.90 55.50
7 49.70 43.60 61.80
8 50.10 48.80 54.50
Total por tratamiento 378.00 386.60 468.80
n 8 8 8 Media global
Media muestral por
tratamiento 47.25 48.33 58.60 51.39
Desviación respecto a la
-4.14 -3.07 7.21
media global
Método de Tukey

Significativo ≠ tratamientos
No significativo = tratamientos
Pedro Oller es un mayorísta que distribuye
productos de consumo masivo a lo largo de
todo el país. La empresa está importando un
nuevo limpiador de múltiples propósitos que
desea comercializar colocando exhibidores de
venta en tres lugares diferentes de varios
supermercados. A continuación se ilustra el
número de botellas de 12 onzas que se
vendió en cada lugar del supermercado.
En el nivel de significancia de =0,05 ¿existe
diferencia en el número medio de botellas
que se vendió en los tres lugares?
Ubicación Ventas
Cerca del Pan 25 17 26 19
Cerca de la Cerveza 18 20 12 18
Con los demás Limpiadores 28 32 31 29