Está en la página 1de 97

DISEÑO COMPLETAMENTE AL AZAR

Es el diseño más sencillo

Consiste en asignar los niveles de un factor de interés a unidades experimentales previamente aleatorizadas.

Las unidades experimentales deben ser

homogéneas

CASOS DE ACUERDO AL NÚMERO DE

OBSERVACIONES POR CADA NIVEL

BALANCEADO: igual número de observaciones por cada nivel del factor de interés

DESBALANCEADO: el número de observaciones varía

por cada nivel del factor de interés

¿Cuál es el objetivo en un DCA de un solo factor?

Probar si la media de cada nivel del factor de interés es igual para todos, o bien, si el efecto de cada

nivel del factor es nulo sobre la

verdadera media poblacional.

DISEÑO COMPLETAMENTE AL AZAR 1. Consideraciones Previas Definición del Problema/objetivo del experimento(

DISEÑO COMPLETAMENTE AL AZAR

1. Consideraciones Previas

Definición del Problema/objetivo del experimento(

Identificación de la Variable de Respuesta

Selección del Factor de Interés

Selección de los Niveles del Factor de Interés(fijos o aleatorios)

Definición de las Unidades Experimentales

Estimar o Decidir el Tamaño de Muestra por cada nivel

EJEMPLO

1. En el siguiente experimento:

EMPAQUE DE CARNES

Defina el problema objeto de estudio

Identifique la variable de respuesta

Identifique el factor de interés (VI) y sus niveles

Número de observaciones por cada nivel

(VD), unidad experimental

de observaciones por cada nivel (VD), unidad experimental La vida de anaquel de las carnes almacenadas

La vida de anaquel de las carnes almacenadas es el tiempo que un corte previamente

empacado es sano y vendible. Un paquete normal expuesto al aire ambiental tiene

una vida aproximada de 48 horas, después de las cuales la carne comienza a

deteriorarse por contaminación de microbios, degradación del color y encogimiento. El empaque al vacío es efectivo para suprimir el desarrollo de microbios, sin

embargo, continúan siendo un problema los otros aspectos.

Algunos estudios recientes sugieren las atmósferas controladas de gas, como alternativa a los empaques actuales. Dos atmósferas que prometen combinar la capacidad de suprimir el desarrollo de microbios con la conservación de las cualidades de la carne son: dióxido de carbono puro (CO2) y mezcla de monóxido de carbono (CO), oxígeno (O2) y nitrógeno (N).

Continuación………….

Con base en esta nueva información , el investigador plantea la hipótesis de que

alguna forma de atmósfera controlada proporcionará un entorno más efectivo de

empaque para el almacenamiento de carne.

El diseño desarrollado por el investigador para evaluar la hipótesis incluyó empaques con:

1.

Aire del ambiente con un empaque comercial de plástico

2.

Empaque al vacío

3.

Una mezcla de gases con 1% CO, 40% O2,

y

59% N

4.

100% CO2

A cada conjunto de condiciones de empaque se le asignaron al azar 3 cortes del

mismo tamaño (75 kg). Cada corte se empacó por separado en las condiciones

asignadas y cada uno se le midió el número de bacterias sicotrópicas en la carne (el

crecimiento bacterial se expresa como el logaritmo del número de bacterias por

centímetro cuadrado). Las bacterias sicotrópicas se encuentran en la superficie de la

carne y se asocian con la carne deteriorada

Ejemplo 1

Problema

Determinar si hay diferencias significativas en el

número promedio de bacterias sicotrópicas en la carne

para diferentes condiciones de empaque.

Variable de respuesta

Número de bacterias sicotrópicas en cada paquete de

carne.

Factor de interés

Condiciones de Empaque

Niveles

1.

Aire del ambiente con un empaque comercial de

plástico

2.

Empaque al vacío

3.

Una mezcla de gases con 1% CO,40% O2, y 59% N

4.

100% CO2

Número de observaciones

3 cortes del mismo tamaño (75 kg)

por nivel

Unidad experimental

Cortes de Carne

COMO PLANTEA EN TERMINOS ESTADISTICO LA HIPOTESIS

FORMULADA POR EL

INVESTIGADOR?

COMO CONTRASTA ESA

HIPOTESIS?

COMO PLANTEA EN TERMINOS ESTADISTICO LA HIPOTESIS FORMULADA POR EL INVESTIGADOR? COMO CONTRASTA ESA HIPOTESIS?

2. LA ADICCION AL CELULAR

2. LA ADICCION AL CELULAR El problema es real. La adicción al celular no es una

El problema es real. La adicción al celular no es una teoría nueva o producto de la

imaginación de algunas personas.

Las personas adictas al celular padecen de una dependencia irracional que al momento de

ser separadas del móvil sienten inseguridad, miedo, angustia, vacío interno, que si no

reciben un mensaje, o un like o una llamada comienzan a deprimirse. El uso que le dan al dispositivo móvil es realmente excesivo, ya que no solo lo utilizan para llamar o

enviar/recibir mensajes/redes sociales, sino también para otras actividades. Todos estos

factores y otros son los que identifican a un adicto al celular.

Vivimos en una sociedad donde la tecnología se desarrolla cada vez más y toma un lugar

importante en la vida de cada individuo, todos los días somos bombardeados de

información por los medios de comunicación pidiéndonos a gritos ser consumidores de los

productos que anuncian, ante esto, pareciera imposible no actualizarse en cuanto a

tecnología se trata, pero debemos tener bien en claro que el problema no es usar el celular, sino la reacción que el uso de éste dispositivo genera en la persona.

Debemos darle el uso indicado a nuestro móvil, utilizarlo

solamente cuando realmente se necesita y poder entender

perfectamente la diferencia entre una necesidad y una adicción,

si usted como lector cree que padece de alguno de los síntomas

de la adicción al móvil o cualquier tecnología, se le recomienda

tome las medidas necesarias para romper ese mal hábito.

A pesar de que la cantidad de dinero utilizado en tarjetas de

saldo para el celular no es un factor determinante para poder

decir si una persona es adicta o no al teléfono móvil, si puede

indicar el tiempo que le dedican a éste y la importancia que le

dan.

En la siguiente tabla se muestran los resultados de un sondeo

aplicado a 21 personas: 7 estudiantes de nivel secundaria, 7 estudiantes de nivel media superior y 7 estudiantes de nivel superior.

DINERO INVERTIDO EN TARJETAS PARA EL CELULAR

 

MENSUALMENTE

 
   

NIVEL DE ESTUDIOS

OBSERVACIONES

SECUNDARIA

PREPARATORIA

UNIVERSIDAD

1

100

200

200

2

200

100

300

3

500

100

100

4

300

100

200

5

100

200

100

6

200

300

200

7

100

100

100

Defina el problema objeto de estudio

Identifique la variable de respuesta

Identifique el factor de interés (VI) y sus niveles

Número de observaciones por cada nivel

(VD), unidad experimental

Ejemplo 2

Problema

Determinar si hay diferencias significativas en el

número promedio del dinero invertido en tarjetas para el

celular mensualmente para diferentes niveles

académicos de estudio.

Variable de respuesta

Dinero invertido en tarjetas para el celular

mensualmente

Factor de interés

Niveles académicos de estudio

Niveles

1.

Secundaria

2. Preparatoria

3.

Universidad

Número de observaciones

7 estudiantes por nivel académico

por nivel

Unidad experimental

Tarjetas de celular

COMO PLANTEA VERBALMENTE

LA HIPOTESIS EN ESTA

SITUACION?

EN TERMINOS HIPOTESIS ?

ESTADISTICOS LA

PLANTEA VERBALMENTE LA HIPOTESIS EN ESTA SITUACION? EN TERMINOS HIPOTESIS ? ESTADISTICOS LA COMO CONTRASTA ESA

COMO CONTRASTA ESA HIPOTESIS?

Ejemplo 3

Un ingeniero de desarrollo de productos tiene interés en

investigar la resistencia a la tensión de una fibra sintética nueva

que se usará para hacer tela de camisas para caballero. El

ingeniero sabe por experiencia previa que la resistencia a la

tensión se afecta por el peso porcentual del algodón utilizando

en la mezcla de materiales de la fibra. Además, sospecha que al

aumentar el contenido de algodón se incrementará la resistencia,

al menos en un principio. Sabe así mismo que el contenido de

algodón deberá variar entre 10 y 40 por ciento para que el producto final tenga otras características de calidad que se

desean (como la capacidad de ser sometido a un tratamiento de

planchado permanente). El ingeniero decide probar ejemplares

en cinco niveles del peso porcentual del algodón: 15, 20, 25, 30

y 35 por ciento. También decide probar cinco ejemplares en cada nivel del contenido de algodón.

Ejemplo 3

Datos (lb/plg 2 ) del experimento de la resistencia a la tensión

Peso % del algodón

Observaciones

 

1

2

3

4

5

15

7

7

15

11

9

20

12

17

12

18

18

25

14

18

18

19

19

30

19

25

22

19

23

35

7

10

11

15

11

Ejemplo 3

Problema

Determinar si hay diferencias significativas en el

número promedio de la resistencia a la tensión de una

fibra sintética nueva para diferentes pesos porcentuales

del algodón.

Variable de respuesta

Resistencia a la tensión (lb/plg 2 )

Factor de interés

Peso porcentual del algodón

Niveles

1.

15% de algodón

2.

20% de algodón

3.

25% de algodón

4.

30% de algodón

5.

35% de algodón

Número de observaciones

cinco ejemplares en cada nivel del contenido de algodón

por nivel

Unidad experimental

Tela de camisas para caballero

No es una ecuación matemática, es una expresión simbólica que trata de llevar el fenómeno
No es una ecuación matemática, es una expresión simbólica que trata de llevar el fenómeno
No es una ecuación matemática, es una expresión simbólica que trata de llevar el fenómeno

No es una ecuación matemática, es una expresión simbólica

que trata de llevar el fenómeno biológico hacia una expresión matemáticas que ayude a operativizar lo que esta ocurriendo a través de las matemáticas y las estadísticas

expresión matemáticas que ayude a operativizar lo que esta ocurriendo a través de las matemáticas y
expresión matemáticas que ayude a operativizar lo que esta ocurriendo a través de las matemáticas y

Se utilizará i para las filas y j para las columnas

Utilizando las COLUMNAS para representar los niveles del factor

Utilizando las FILAS para

representar los niveles del factor

Y ij

= ++

j

ij

j

i

= 1

= 1

=

1

=

Y ij

k

n

++

i

ij

i = 1

k

j = 1

n

Utilizando las COLUMNAS para representar los niveles del factor Modelo Estadístico Lineal Y ij 
Utilizando las COLUMNAS para representar los niveles del factor Modelo Estadístico Lineal Y ij 
Utilizando las COLUMNAS para representar los niveles del factor Modelo Estadístico Lineal Y ij 
Utilizando las COLUMNAS para representar los niveles del factor Modelo Estadístico Lineal Y ij 
Utilizando las COLUMNAS para representar los niveles del factor Modelo Estadístico Lineal Y ij 

Utilizando las COLUMNAS para representar los niveles del factor

Modelo Estadístico Lineal

Y ij

Y ij

= ++

j

ij

j

= 1

k

i

=

1

n

es la i-ésima observación para el j-ésimo nivel del factor de

interés

media total

es el efecto del j-ésimo nivel del factor de interés sobre la

j variable de respuesta

representa el residuo que se distribuye normalmente con

ij

media cero y varianza σ 2

Si se utilizan las filas para representar los niveles del factor

como se escribe el modelo?

Modelo Estadístico Lineal

Y ij

= ++

i

ij

i

= 1

k

j

=

1

n

Y ij

es la j-ésima observación para el i-ésimo nivel del factor de

interés

media total

i es el efecto del i-ésimo nivel del factor de interés sobre la variable de respuesta

ij

es el error experimental

Cualquiera que sea la forma en que se escribe el modelo se puede representar en una tabla:

OBSERVACIONES 1 2 3 . . k Y . 11 Y 12 Y 13 .
OBSERVACIONES
1
2
3 .
.
k
Y
.
11 Y
12 Y
13 .
Y 1k
1 2

1

2

.

.

NIVELES DEL FACTOR DE INTERES . . 22 Y 23 Y 2k . . .
NIVELES DEL FACTOR DE INTERES . . 22 Y 23 Y 2k . . .
NIVELES DEL FACTOR DE INTERES
. .
22
Y 23
Y 2k
. .
. .
. .
. .
. .
. .
NIVELES DEL FACTOR DE INTERES . . 22 Y 23 Y 2k . . . .
Y Y 21 . . . . . . . n . . Y Y
Y
Y
21
.
.
.
.
.
.
.
n
.
.
Y
Y n1
Y n2
Y n3
nk

NIVELES DEL FI

1

2

3

.

.

K

OBSERVACIONES 1 2 . . . n Y Y . . . Y 11 12
OBSERVACIONES
1
2
.
.
.
n
Y
Y
.
.
.
Y
11
12
1n
Y
Y
.
.
.
Y
21
22
2n
Y
Y
.
.
.
Y
31
31
3n
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Y k1
Y k2
Y kn
Y Y . . . Y 21 22 2n Y Y . . . Y 31

Y ij

= ++

j

ij

j = 1

k

i = 1

n

Y ij

=

++

i

ij

i

= 1

k

j

= 1

n

Recordando la sesión 1…

Los factores pueden ser:

Fijos

Aleatorios

Mixto

El tipo de factor influye en como se plantean las hipótesis

En el caso de un DCA de un solo factor el modelo solo puede ser de efecto fijo o de efecto aleatorio

COMO SE PLANTEA EL CONTRASTE DE HIPOTESIS DE ACUERDO AL TIPO DE FACTOR? En este

COMO SE PLANTEA EL CONTRASTE DE HIPOTESIS

DE ACUERDO AL TIPO DE FACTOR?

En este punto es importante conocer o establecer que NIVEL DE SIGNIFICANCIA se usará para realizar el Análisis Estadístico:

Los más utilizados son 5% y 1%, sin

embargo depende del analista y del

diseñador.

También es posible utilizar otro que

no sean los mencionados

anteriormente

embargo depende del analista y del diseñador. También es posible utilizar otro que no sean los
Contraste de Hipótesis H ( Factor de Efectos Fijos ) H 1 = al menos

Contraste de Hipótesis

H

(Factor de Efectos Fijos)

H 1 = al menos una de las medias de los niveles del factor de interés es diferente

o :

1

=

=

2

k

F  F Regla de Decisión c  g , ln, gld Descartar Ho si
F
 F
Regla de Decisión
c
 g
,
ln,
gld
Descartar Ho si
donde
g
ln
= −
k
1
gld
=
k
(
n
1)
Región de Rechazo
F
F ,
g ln, gld

DE QUE OTRA MANERA SE PUEDE ESCRIBIR EL

CONTRASTE DE HIPOTESIS?

H 0 : τ 1 = τ 2 = τ 3 =

= τ k

= 0

H 1 : τ i

0

Al menos para una i

Contraste de Hipótesis (Factor Efectos aleatorios) H  = = : 2 2  2
Contraste de Hipótesis (Factor Efectos aleatorios)
Contraste de Hipótesis (Factor Efectos aleatorios)
H  = = : 2 2  2 0 1 2 k H 1
H  = =
:
2
2
2
0
1
2
k
H 1 : al menos una de las varianzas de los niveles del factor
de interés es diferente
Regla de Decisión
Descartar Ho si
Región de Rechazo
F
 F
c
 g
,
ln,
gld
donde
g
ln
= −
k
1
F ,
F
g ln, gld
gld =
k
(
n
1)

NOTA IMPORTANTE

Si se planteó el modelo estadístico con los niveles

en las filas, las hipótesis se plantean de la misma

forma, ya que siempre se utilizara k para los

niveles y n para las observaciones

Y ij

= ++

j

ij

j

= 1

k

i

=

1

n

niveles

observaciones

Y ij

= ++

i

ij

i

= 1

k

j

= 1

n

niveles

observaciones

Como se realiza el procedimiento de Aleatorización en un DCA? • Codificar las unidades experimentales

Como se realiza el procedimiento

de Aleatorización en un DCA?

Codificar las unidades experimentales desde 1

hasta nk

Establecer un orden aleatorio para las pruebas

que serán realizadas sobre las unidades

experimentales, utilizando la tabla de números

aleatorios

Asignar los niveles del factor de interés a las unidades experimentales aleatorizadas

de interés a las unidades experimentales aleatorizadas Los pasos son los mismos independientemente de cómo se

Los pasos son los mismos independientemente de cómo se haya

escrito el modelo

PROCEDIMIENTO DE ALEATORIZACION

CODIFICACION DE LAS

UNIDADES

EXPERIMENTALES

NUMEROS

ALEATORIOS

ASIGNACION

DE LOS

NIVELES DEL

FI

1

1

2

1

.

.

.

.

.

2

.

2

.

.

.

.

. . . . . . . . . . . k nk k
. . . . . . . . . . . k nk k
. . . . . . . . . . . k nk k
. . . . . . . . . . . k nk k
. . . . . . . . . . . k nk k
. . . . . . . . . . . k nk k

.

.

.

.

.

.

.

.

.

.

.

k

nk

k

nk k
Toma de datos: medición de la variable NIVELES DEL FACTOR DE INTERES OBSERVACIONES 1 2
Toma de datos: medición de la variable NIVELES DEL FACTOR DE INTERES OBSERVACIONES 1 2

Toma de datos: medición de la variable

NIVELES DEL FACTOR DE INTERES OBSERVACIONES 1 2 3 . . k 1 Y Y
NIVELES DEL FACTOR DE INTERES
OBSERVACIONES
1
2
3
.
.
k
1
Y
Y
Y
.
.
Y
11
12
13
1k
2
Y
Y
Y
.
.
Y
21
22
23
2k
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Y
.
.
.
.
.
.
.
ij
n
Y
Y
Y
.
.
Y
n1
n2
n3
nk
TOTALES/NIVEL
Y
Y
Y
Y
.1
.2
.3
.k
GRAN TOTAL
Y

Y ij

= ++

j

ij

j = 1

k

i = 1

n

Toma de datos: medición de la variable NIVELES OBSERVACIONES 1 Y 11 Y 21 Y

Toma de datos: medición de la variable

Toma de datos: medición de la variable NIVELES OBSERVACIONES 1 Y 11 Y 21 Y 31
Toma de datos: medición de la variable NIVELES OBSERVACIONES 1 Y 11 Y 21 Y 31

NIVELES

OBSERVACIONES

1

Y

11

Y

21

Y

31

.

2

Y

12

Y

22

Y

31

.

n

TOTALES/NIVEL

.

.

.

1

2

3

.

.

.

Y . ij .
Y
.
ij
.

.

Y

1n

Y

1.

.

.

Y

2n

Y

2.

.

.

Y

3n

Y

3.

.

. .

.

.

.

.

.

.

.

.

 

.

.

.

Y

K

Y k1

Y k2

kn

Y

K.

GRAN TOTAL Y
GRAN TOTAL
Y

Y ij

= ++

i

ij

i

= 1

k

j

= 1

n

A.Verificación de los Supuestos del Modelo

1. Normalidad

2. Homocedasticidad

3. Independencia

B. Análisis de Varianzas

1. Prueba F de Fisher

C. Otros Análisis

1. Calculo de Indicadores

2. Calculo de Intervalos de Confianza

A. VERIFICACION DE LOS SÚPUESTOS DEL MODELO

Esta variación total se descompone para probar si hay diferencias entre las medias de los niveles. Es un requisito que se satisfagan los siguientes supuestos, para que el ANOVA sea una prueba exacta de Hipótesis:

1. NORMALIDAD se refiere a que los datos de la variable de respuesta o los

residuos deben tener una distribución aproximadamente normal.

2. INDEPENDENCIA: los datos de la variable de respuesta o los residuos no

deben estar correlacionados. A través de la aplicación de un minucioso

procedimiento de aleatorización se puede asegurar el cumplimiento de este

supuesto

3. HOMOCEDASTICIDAD: las varianzas de cada nivel del factor de interés

deben ser aproximadamente iguales. A través de la selección de unidades experimentales homogéneas se puede garantizar el cumplimiento de este

supuesto

No es saludable confiar en el resultado del ANOVA si estos

supuestos no han sido verificados

Los supuestos pueden verificarse a través del examen de los residuales. En un DCA

unifactorial los residuos se estiman a partir de :

Y ij

e

ij

=

Y

ij

Y

ij

Estimación de los valores de la variable de respuesta correspondiente que se obtiene por:

e

Y

ij

Y ij

Y

ij

=

=

=

 

i

+

Y

+

(

Y

i

.

Y

i .

ij

= Y Y

ij

i.

Y

)

COMO SE VERIFICA EL SUPUESTO DE NORMALIDAD

a. HISTOGRAMA DE RESIDUALES

Si se cumple el supuesto este grafico debe aparecer en forma de campana con

centro en cero

Lamentablemente dado que se trabaja con muestras pequeñas pueden ocurrir

fluctuaciones significativas

Si la desviación es moderada no implica necesariamente que el supuesto se esta

violando

También este gráfico es de utilidad para detectar datos atípicos(outliers)

b. GRAFICO DE PROBABILIDAD NORMAL

Se puede hacer con los datos originales pero es más eficaz hacerlo con los residuales

Si la distribución de los errores es normal el grafico será un ajuste aproximadamente a una línea recta, o sea, es una evidencia para indicar que los datos provienen de una distribución normal. Es bueno complementar con

las pruebas analíticas

Las desviaciones moderadas de la normalidad no representan preocupación en el análisis e varianza de efectos

fijos, a diferencia del modelo de efectos fijos

En este grafico también se pueden detectar outliers, que es un punto atípico. Si hay varios puede

ocasionar distorsiones en el ANDEVA

c. PRUEBAS ESTADISTICAS PARA VERIFICAR LA NORMALIDAD

PRUEBA ESTADISTICA DE SHAPIRO WILK: se utiliza para muestras

pequeñas

PRUEBA ESTADISTICA DE RYAN-JOINER: se utiliza para muestras pequeñas

PRUEBA ESTADISTICA DE ANDERSON-DARLING

PRUEBA ESTADISTICA DE SMIRNOF-KOLMOROF: se utiliza para muestras

mayores de 50. Se puede aplicar a datos que son normales o no.

Todas estas pruebas se pueden realizar con el apoyo de un software estadístico, como

por ejemplo el MINITAB o el PASW

2. COMO SE VERIFICA EL SUPUESTO

DE HOMOCEDASTICIDAD

GRAFICA DE RESIDUOS VERSUS VALORES AJUSTADOS GRAFICA DE NIVELES DE FACTRO VS RESIDUOS

PRUEBA ESTADISTICA DE BARLETT:

es la más usada. Compara la varianza entre grupos.

Si hay confianza de que los datos de la variable de respuesta tienen una distribución normal, es la más recomendable.

PRUEBA ESTADISTICA DE LEVENE: es robusta al supuesto de normalidad. Si los datos no son normales y se cuenta con un tamaño de muestra grande es la recomendada

Todas estas pruebas se pueden realizar con el apoyo de un software estadístico, como

por ejemplo el MINITAB o el PASW

3. COMO SE VERIFICA EL SUPUESTO

DE INDEPEDENCIA

Gráfico de residuos versus el

orden en que se colectaron los

datos

Prueba de Durbin Watson

¿QUÉ SON LOS DIAGRAMAS DE CAJAS SIMULTÁNEOS?

¿PARA QUÉ SIRVEN?

¿CÓMO SE INTERPRETAN?

¿CÓMO SE HACEN LOS GRAFICOS

Y

PRUEBAS ANTERIORES?

¿CÓMO SE INTERPRETAN LOS

RESULTADOS DE AMBAS

HERRAMIENTAS?

¿CÓMO SE HACEN LOS GRAFICOS Y PRUEBAS ANTERIORES? ¿CÓMO SE INTERPRETAN LOS RESULTADOS DE AMBAS HERRAMIENTAS?
¿CÓMO SE HACEN LOS GRAFICOS Y PRUEBAS ANTERIORES? ¿CÓMO SE INTERPRETAN LOS RESULTADOS DE AMBAS HERRAMIENTAS?
¿CÓMO SE HACEN LOS GRAFICOS Y PRUEBAS ANTERIORES? ¿CÓMO SE INTERPRETAN LOS RESULTADOS DE AMBAS HERRAMIENTAS?

B. ANALISIS DE VARIANZA

(ANOVA)

Es la técnica en el análisis estadístico de datos experimentales

A través de la descomposición de la variabilidad se calcula la prueba

estadística F de Fisher que se utiliza para comprobar los contrastes de

hipótesis de los modelos de los diseños experimentales.

Es una potente herramienta estadística, de gran provecho para:

Industria

Control y mejora de los procesos Laboratorio de análisis

Control de métodos analíticos

de gran provecho para: Industria Control y mejora de los procesos Laboratorio de análisis Control de

ANALISIS DE VARIANZA EN UN DCA

En términos generales separa la variabilidad total en las partes con las que contribuye cada fuente de variación en el experimento

En un DISEÑO COMPLETAMENTE AL AZAR, tanto para un

experimento balanceado como para uno desbalanceado la siguiente ecuación es la base del ANALISIS DE VARIANZA es:

Variacion=Variacion+Variacion

Total

Entre

Niveles

Variabilidad debido al Nivel

dentro

de

Niveles

Variabilidad inherente de los datos

SCTo = SCN + SCEE

ECUACION DE SUMATORIAS

   

NIVELES DEL FACTOR DE INTERES

 

OBSERVACIONES

 

1

 

2

3

.

.

 

k

1

Y

11

Y

12

Y

13

.

.

Y

1k

2

Y

21

Y

22

Y

23

.

.

Y

2k

.

.

.

.

.

.

 

.

.

.

.

.

.

.

 

.

.

.

.

.

.

.

 

.

n

Y

n1

Y

n2

Y

n3

.

.

Y

nk

TOTALES/NIVEL

Y

.1

Y

.2

Y

.3

   

Y

.K

GRAN TOTAL

 

Y

Medias por nivel

Y

.1 /n

Y

.2 /n

Y

.3 /n

 

Y .k /n

MEDIA TOTAL

 
MEDIA TOTAL  

ANALISIS DE VARIANZA

Variacion=Variacion+Variacion

Total

SUMA DE CUADRADOS TOTAL: mide la variabilidad

total en los datos. Es la suma

de los cuadrados de las

desviaciones de cada dato respecto a la media general del experimento

Entre

Niveles

SUMA DE CUADRADOS DE LOS NIVELESD E FI: mide la variabilidad en los datos

asociada al efecto del factor de

interés sobre la media. Se

obtiene hallando la suma de los cuadrados de las desviaciones de

la media de cada nivel respecto

de la media general.

dentro

de

Niveles

SUMA DE CUADRADOS DEL

ERROR EXPERIMENTAL: mide la variabilidad que no es debida a las

diferencias entre los niveles del

factor(variabilidad interna de cada

nivel, errores de medida, etc). Se obtiene hallando la suma de cuadrados

de las desviaciones de cada dato

respecto ala media del nivel correspondiente

Cada suma de cuadrados tiene asociados

los grados de libertad correspondiente

Análisis de Varianza

Análisis de Varianza Y ij =  +  j +  ij   Grados de

Y

ij

=

+

j

+

ij

 

Grados de

Suma de

Cuadrado

F

Fuente de

Libertad

Cuadrados

Medio

Fc

Variación

gl

SC

CM

 

FV

 

Entre

k- 1

SCN

SCN

CMN

F ,

 

Niveles

 

CMEE

g

ln, gld

(N)

   

k 1

 

Error

     

Experimental

SCT SCN

SCEE

(EE)

k(n1)

0

k(n 1)

Total

nk1

SCT

0

 

To

SCN

=

k

j

=

1

2

Y

.j

n

Y

2

nk

SCT

0 =

n

k



i =

1

j

=

1

2

Y

ij

Y

2

nk

Análisis de Varianza

Análisis de Varianza Y ij =  +  +  i ij   Grados de

Y

ij

= ++

i

ij

 

Grados de

Suma de

Cuadrado

F

Fuente de

Libertad

Cuadrados

Medio

Fc

Variación

gl

SC

CM

 

FV

 

Entre

k- 1

SCN

SCN

CMN

F ,

 

Niveles

 

CMEE

g

ln, gld

(N)

   

k 1

 

Error

     

Experimental

SCT SCN

SCEE

(EE)

k(n1)

0

k(n 1)

Total

nk1

SCT

0

 

To

SCN

=

k

i

=

1

2

Y

i.

Y

2

n nk

SCT

0 =

k

n



i =

1

j

=

1

2

Y

ij

Y

2

nk

En el caso de experimentos unifactoriales el cálculo

de Fc es igual para un modelo de efectos fijos y uno

de efectos aleatorios

COMO SE INTERPRETAN LOS RESULTADOS OBTENIDOS EN UN

ANALISIS DE VARIANZA PARA UN DCA UNIFACTORIAL?

a. Si el Factor es FIJO

b. Si el Factores ALEATORIO

¿QUÉ SON LOS GRÁFICOS DE

MEDIAS?

¿PARA QUÉ SIRVEN?

¿CÓMO SE INTERPRETAN?

C. Otros Análisis Cálculo de Parámetros n k   Y ij i = 1
C. Otros Análisis Cálculo de Parámetros n k   Y ij i = 1
C. Otros Análisis Cálculo de Parámetros n k   Y ij i = 1
C. Otros Análisis Cálculo de Parámetros n k   Y ij i = 1
C. Otros Análisis Cálculo de Parámetros n k   Y ij i = 1

C. Otros Análisis

Cálculo de Parámetros

n k   Y ij i = 1 j = 1  = nk
n k
 
Y ij
i =
1
j =
1
=
nk

2 = CMEE

Conclusiones

Los cálculos son los

mismos

independientemente

del formato que se haya elegido para el

modelo

Cálculo del Coeficiente de Determinación

R

2 SCN

=

SCT

o

R

2

0

1

Interpretación

Es la variabilidad en los valores observados

en la variable de respuesta, explicada por el

modelo estadístico

Nota: el cálculo es el mismo para las dos

formas del modelo

Cálculo del Intervalo de Confianza del 100( 1 – α) % para

la Media μj

del j-ésimo nivel del factor de interés

Y ij

= ++

j

ij

j = 1

k

i = 1

n

Para Modelo

 +  j ij j = 1 k i = 1 n Para Modelo IC

IC

CMEE n

j

= y

. j

t

/ 2,k (n1)

 j = y . j  t  / 2, k ( n − 1)
 j = y . j  t  / 2, k ( n − 1)

Cálculo de los estimadores de los efectos de los niveles

. j

= y y

. j

Cálculo del Intervalo de Confianza del 100( 1 – α) % para

la Media μi

del i-ésimo nivel del factor de interés

Y ij

= ++

i

ij

i

= 1

k

j

= 1

n

Para Modelo

+  i ij i = 1 k j = 1 n Para Modelo IC CMEE

IC

CMEE n

i

=

y

i.

t

/ 2,k (n1)

i  = y i .  t  / 2, k ( n − 1)
i  = y i .  t  / 2, k ( n − 1)

Cálculo de los estimadores de los efectos de los niveles

i

.

=

y

i .

y

¿QUÉ UTILIDAD TIENEN LOS

INTERVALOS DE CONFIANZA EN EL ANALISIS DE DATOS DE UN

DCA?

¿QUÉ UTILIDAD TIENEN LOS INTERVALOS DE CONFIANZA EN EL ANALISIS DE DATOS DE UN DCA?
¿QUÉ UTILIDAD TIENEN LOS INTERVALOS DE CONFIANZA EN EL ANALISIS DE DATOS DE UN DCA?

Ejemplo:

Un fabricante de calzado de zapatos folclóricos (ZAPATOS ELISA)

desea mejorar la calidad de las suelas, las cuales se pueden hacer

con uno de los cuatro tipos de cuero A, B, C y D disponibles en el

mercado.

Para ello, prueba los cueros con una máquina que hace pasar los zapatos por una superficie abrasiva, la suela de los zapatos se

desgasta al pasarla por dicha superficie.

Como criterio de desgaste se usa la pérdida de peso después de un número fijo de ciclos. Se prueban en orden aleatorio 24 zapatos, seis de cada tipo de cuero.

Al hacer las pruebas en orden completamente al azar se evitan

sesgos y las mediciones en un tipo de cuero resultan

independientes de las demás.

Los datos (en miligramos) sobre el desgaste de cada tipo de cuero

se anotan en la hoja de verificación previamente diseñada

Cual es la primera interrogante

en este experimento?

Cual es la primera interrogante en este experimento?

DEFINICIÓN DEL PROBLEMA

Determinar si hay diferencias significativas

en la pérdida de peso promedio para cuatro tipos de cuero (A,B,C y D).

o

Determinar el efecto de cuatro tipos de cuero en la pérdida de peso promedio de la suela

de un zapato.

Modelo Estadístico

i

= 1

k

j

= 1

n

Y ij

=

++

i

Y ij =  +  +  i ij

ij

Y ij = es la j-ésima pérdida de peso de la suela del zapato para el i-ésimo tipo de cuero

= desgaste promedio (perdida de peso promedio)

i = es el efecto del i-ésimo tipo de cuero sobre la perdida de peso de la suela del

zapato

ij = es el error experimental

TIPO Observaciones DE CUERO A B C D
TIPO
Observaciones
DE
CUERO
A
B
C
D

Modelo Estadístico

Y ij

= ++

j

ij

j = 1

k

i = 1

n

Y ij = es la i-ésima pérdida de peso del zapato para el j-ésimo tipo de cuero

= desgaste promedio (perdida de peso promedio)

j = es el efecto del j-ésimo tipo de cuero sobre la perdida de peso

ij = es el error experimental

TIPO DE

       

CUERO

A

B

C

D

O

       

B

S

       

E

R

V

       

A

C

       

I

O

       

N

E

S

       

Planteamiento de Hipótesis

H

o

: ===

1

2

3

4

H 1 : al menos una de las pérdidas promedio es diferente Regla de Decisión:

F

c

F

0.05,3, 20

donde

g ln = − = 4 1 3 gld = 4(6 − 1) = 20
g ln = − =
4
1
3
gld =
4(6
1) = 20
Región de Rechazo
F
= 3.09
0.05,3,20
F
0.05,3,20

ALEATORIZACIÓN

Orden de las pruebas

Números aleatorios

Asignación

 

1

3

 

A

 

2

10

A

3

14

A

 

Tipo de

 

4

8

A

 

Orden de las pruebas

5

15

A

 

Cuero

6

1

A

             

7

11

B

 

A

3

10

14

8

15

1

8

18

B

             

9

23

B

 

B

11

18

23

7

22

12

10

7

B

 

C

2

24

4

6

13

5

11

22

B

12

12

B

             

13

2

C

 

D

17

16

19

9

20

21

14

24

C

 

15

4

C

16

6

C

 
16 6 C    
 

17

13

C

18

5

C

19

17

D

20

16

D

21

19

D

22

9

D

23

20

D

24

21

D

Toma de datos: Medición de la variable de respuesta

ZAPATOS ELISA

FORMULARIO DE EXPERIMENTOS

NOMBRE DEL EXPERIMENTADOR

FECHA

CALIBRACION DEL APARATO

TIPO DE

     

CUERO

 

OBSERVACIONES

 

SUMA

PROMEDIOS

A

264

260

258

241

262

255

1540

256.7

B

208

220

216

200

213

206

1263

210.5

C

220

263

219

225

230

228

1385

230.8

D

217

226

215

224

220

222

1324

220.7

C 220 263 219 225 230 228 1385 230.8 D 217 226 215 224 220 222

Verifique los supuestos del ANOVA

Verifique los supuestos del ANOVA

Supuesto de Normalidad MINITAB

FUNCIONES DE MINITAB

RESULTADO

INTERPRETACIÓN

ESTADÍSTICA

ESTADÍSTICA

BASICA

MOSTRAR

ESTADÍSTICA

BÁSICA

MEDIA

Si son aproximadamente

iguales es simétrica

MEDIANA

SESGO

Puede ser positiva

negativa o cero

CURTOSIS

Puede ser positiva negativa o cero.

GRÁFICO

PRUEBA DE

NORMALIDAD

Para que se verifique el

supuesto el gráfico debe ser aproximadamente una

línea recta.

PRUEBA DE RYAN JOINER

(SHAPIRO WILK)

Muestras menores de 50

PRUEBA DE KOLMOROV-

SMIRNOV

Muestras mayores de 50

GRÁFICA

HISTOGRAMA

FORMA

CAMPANA

TALLO Y HOJA

FORMA

CAMPANA

Verificación de supuestos y ANOVA (MINITAB)

 

FUNCIONES DE MINITAB

 

RESULTADO

INTERPRETACIÓN

       

ANOVA

Rechazar o no la Ho.

HISTOGRAMAS DE

Supuesto de normalidad

RESIDUOS

GRAFICA NORMAL

GRÁFICAS

RESPUESTA

DE RESIDUOS

Y FACTOR

RESIDUOS VS AJUSTES

Supuesto de homocedasticidad

ANOVA UN

   

ESTADISTICA

SOLO

RESIDUOS VS ORDEN

Supuesto de independencia

FACTOR

   

COMPARACIÓN POR

Rechazar o no la Ho.

COMPARACI

TUKEY

PARES

ONES

 

COMPARACIÓN POR

Rechazar o no la Ho.

DUNNET

PARES

PRUEBA DE

 

GRÁFICO ESTADISTICA DE

Comparar ancho de los interv

VARIANZAS

BARLETT

IGUALES

LEVINE

PRUEBA Y PVALUE

Rechazar o no la Ho.

Analisis de Varianza

FV

Entre tipos de cuero

ErrorExperimental

Total

FV Entre tipos de cuero ErrorExperimental Total
FV Entre tipos de cuero ErrorExperimental Total
FV Entre tipos de cuero ErrorExperimental Total SC GL CM Fc Probabilidad F  7072.33
FV Entre tipos de cuero ErrorExperimental Total SC GL CM Fc Probabilidad F  7072.33

SC

GL

CM

Fc

Probabilidad

F

7072.33

 

3

2357.44

23.24

1.0018E-06

3.098

2029

20

101.45

9101.33

23

Probabilidad F  7072.33   3 2357.44 23.24 1.0018E-06 3.098 2029 20 101.45 9101.33 23
Probabilidad F  7072.33   3 2357.44 23.24 1.0018E-06 3.098 2029 20 101.45 9101.33 23
Probabilidad F  7072.33   3 2357.44 23.24 1.0018E-06 3.098 2029 20 101.45 9101.33 23
Probabilidad F  7072.33   3 2357.44 23.24 1.0018E-06 3.098 2029 20 101.45 9101.33 23
Probabilidad F  7072.33   3 2357.44 23.24 1.0018E-06 3.098 2029 20 101.45 9101.33 23

Cálculo de los Parámetros del Modelo

Perdida de Peso Promedio

= Y = 5512/ 24 = 229.67

VARIANZA Y DESVIACION ESTANDAR

= Y = 5512/ 24 = 229.67 VARIANZA Y DESVIACION ESTANDAR  2 = CMEE =

2 = CMEE = 101.45

=

Y DESVIACION ESTANDAR  2 = CMEE = 101.45  = 101.45 ESCRIBA UNA FRASE QUE

101.45

ESCRIBA UNA FRASE QUE DESCRIBA LA

INTERPRETACION DE CADA RESULTADO

Cálculo del Intervalo de Confianza del 100( 1 – α) % para la Pérdida

de peso promedio de cada tipo de cuero

/ 2,

k

CMEE n ( n −1)
CMEE n
(
n
−1)

IC

=

t

i

y i .

IC = 256.7  t 101.45 6  0.025,20 1 IC = 210.5  t
IC
=
256.7
 t
101.45 6
0.025,20
1
IC
=
210.5
 t
101.45 / 6
0.025,20
2
IC
=
230.8
 t
101.45/ 6
0.025,20
3
IC
=
220.7
 t
101.45 / 6
0.025,20
4

CONCLUSIONES

F c es mayor que F α , por lo tanto se descarta H o .

Se concluye que existen

diferencias significativas en

la pérdida promedio de peso

(miligramos) de la suela de

los zapatos para los tipos de

cuero en estudio

en la pérdida promedio de peso (miligramos) de la suela de los zapatos para los tipos

ESRIBA UN PARRAFO QUE DESCRIBA LA

INTERPRETACIÓN DE CADA RESULTADO

DE LOS INTERVALOS DE CONFIANZA

ESRIBA UN PARRAFO QUE DESCRIBA LA INTERPRETACIÓN DE CADA RESULTADO DE LOS INTERVALOS DE CONFIANZA
ESRIBA UN PARRAFO QUE DESCRIBA LA INTERPRETACIÓN DE CADA RESULTADO DE LOS INTERVALOS DE CONFIANZA
• EN DIVERSAS RAZONES NO ES POSIBLE RECOLECTAR IGUAL CANTIDAD DE EXPERIMENTOS, POR ALGUNOS OBSERVACIONES
• EN DIVERSAS RAZONES NO ES POSIBLE RECOLECTAR IGUAL CANTIDAD DE EXPERIMENTOS, POR ALGUNOS OBSERVACIONES

EN

DIVERSAS RAZONES NO ES POSIBLE

RECOLECTAR IGUAL CANTIDAD DE

EXPERIMENTOS, POR

ALGUNOS

OBSERVACIONES EN CADA NIVEL

EXISTEN LIGERAS VARIACIONES EN CUANTO

AL ANÁLISISDE VARIANZA UTILIZADO PARA EL DISEÑO COMPLETAMENTE AL AZAR

BALANCEADO

Definición del problema Modelo Estadístico DCA =  + + Y ij j ij j
Definición del problema Modelo Estadístico DCA =  + + Y ij j ij j

Definición del problema

Modelo Estadístico DCA

=  + + Y ij j ij j = 1 k i = 1
=  + +
Y ij
j
ij
j
= 1
k
i
= 1
n
k

Y ij

es la i-ésima observación para el j-ésimo nivel del

factor de interés

media total

es el efecto del j-ésimo nivel del factor de interés sobre la variable de respuesta

es el error experimental

 j  ij
j
ij

Si se utilizan las filas para representar los niveles del factor el

modelo cambia a la siguiente expresión

Modelo Estadístico

Y ij

= ++

i

ij

i

= 1

k

j

= 1

n

k

Y ij

es la j-ésima observación para el i-ésimo nivel del factor de

interés

media total

i es el efecto del i-ésimo nivel del factor de interés sobre la variable de respuesta

ij

es el error experimental

Contraste de Hipótesis Factor de Efectos Fijos H o :  1 =  =

Contraste de Hipótesis

Factor de Efectos Fijos

H

o :

1

=

=

2

k

H 1 = al menos una de las medias de los niveles del factor de interés es diferente

Regla de Decisiónmedias de los niveles del factor de interés es diferente Descartar Ho si F c 

del factor de interés es diferente Regla de Decisión Descartar Ho si F c  F

Descartar Ho si

F

c

F

,

g ln, gld

donde

 

g

ln =

k 1

k

g ln, gld donde   g ln = k − 1 k gld = n 
g ln, gld donde   g ln = k − 1 k gld = n 
g ln, gld donde   g ln = k − 1 k gld = n 
gld = n  j j =1 Región de Rechazo  F F , 
gld =
n
j
j =1
Región de Rechazo
F
F ,
g ln, gld

k

Aleatorización Codificar los elementos de la población de 1 hasta N Donde N = n

Aleatorización

Codificar los elementos de la población de 1 hasta N

Donde

N =

n

1

+