Está en la página 1de 204

UNIVERSIDAD AUTONOMA DE NUEVO LEON

FACULTAD DE INGENIERIA MECANICA Y ELECTRICA

ALUMNO: ANGEL JULIAN BERLANGA CERDA

Matricula: 1752276

M.C. Rigoberto Américo Garza López

Hora: M3

Semestre: Agosto - Enero 2020


TEMARIO
  Regresión Lineal Simple y Correlación
1.
• Diagrama de Flujo
• Mejor Estimación de la Recta
• Error estándar en la mejor estimación de la recta
• Coeficiente de correlación de Pearson
• Coeficiente de correlación de Spearman
• Relación entre el coeficiente de correlación de Pearson y Spearman
• Varianza y Desviación Estándar
• Relación entre la desviación estándar y el error estándar en la mejor estimación de la recta
• Coeficiente de determinación
• Relación entre el coeficiente de determinación y el coeficiente de Pearson
• Intervalos de confianza
• Intervalo de Confianza para β
• Intervalo de Confianza para α
• Intervalo de Confianza para
• Prueba de Hipótesis para β
• Prueba de Hipótesis para α
2. Regresión Múltiple y correlación
• Regresión polinomial
• Coeficiente de Determinación
3. Regresión No Lineal Múltiple
• Ecuación de Potencia
• Coeficiente de determinación y gráfica
• Ecuación Exponencial
• Coeficiente de determinación y gráfica
• Ecuación logarítmica
• Coeficiente de determinación y gráfica

4. Diseño de Experimentos
• Análisis de varianza para un criterio
• Planteamiento mediante bloques aleatorios
• Planteamiento mediante tabla ANOVA de un solo factor
• Prueba de Tukey
• Prueba de Duncan
• Análisis de Varianza para dos criterios
• Prueba de Kruskal-Wallis
Regresión lineal simple y correlación.
Regresión lineal simple y correlación.

  Regresión Lineal
En estadística la regresión lineal es un modelo matemático usado para aproximar la
relación de dependencia entre una variable dependiente Y, las variables
independientes y un término aleatorio.
 Correlación
La correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad
entre dos variables estadísticas. Se considera que dos variables están correlacionadas
cuando los valores de una de ellas varían sistemáticamente con respecto a los valores
homónimos de la otra.
Planteamiento de problema

INVERSIÓN , X RENDIMIENTO, Y

11 2
 La información estadística obtenida de una muestra de tamaño 12 14 3
sobre la relación que existe entre la inversión realizada y el
16 5
rendimiento obtenido en cientos de miles de euros para la
explotación agrícola es la siguiente 15 6

16 5

18 3

20 7

21 10

14 6

20 10

19 5

11 6
Diagrama de flujo

Definición:

Diagrama de Flujo Un diagrama de flujo es una representación


12 gráfica de un proceso. Cada paso del proceso es
representado por un símbolo diferente que
10
contiene una breve descripción de la etapa de
8 proceso. Los símbolos gráficos del flujo del
proceso están unidos entre sí con flechas que
6
indican la dirección de flujo del proceso.
4

0
10 12 14 16 18 20 22
Bibliografía:
https://www.aiteco.com/que-es-un-diagrama-de-flujo/
Mejor estimación de la recta
Mejor estimación de la recta: Bibliografía:

Definición: Para estimar la línea de regresión poblacional a partir de la nube de puntos


se utiliza el método de los mínimos cuadrados ordinarios (MCO), que considera como http://www.ub.edu/aplica_in
recta que mejor se ajusta a la que minimiza la suma de los cuadrados de los residuos.
Si la recta de mejor ajuste es  𝛾 for/spss/cap7-2.htm/
 ^ =𝑎 + 𝑏 𝑋
𝑖 𝑖

12

10

0
10 12 14 16 18 20 22
X Y XY   Ecuación de la recta
11 121 22 3.27
Fórmulas
2
14 196 3 42 4.62
16 256 5 80 5.52
15 225 6 90 5.07
16 256 5 80 5.52
18 324 3 54 6.42
20 400 7 140 7.32   Sustitución
21 441 10 210 7.77
14 196 6 84 4.62
20 400 10 200 7.32 • b
19 361 5 95 6.87
11 121 6 66 3.27
195 3297 68 1163 62.07
Error de la mejor estimación de la recta
Definición:   Formulas: Y
2 3.27 1.61
El error estándar de estimación
3 4.62 2.62
mide la dispersión de los valores 5 5.52 0.27
6 5.07 0.86
observados alrededor de la línea de
5 5.52 0.27
regresión 3 6.42 11.69
Bibliografía:   Sustitución:
7 7.32 0.10
Libro: inferencia estadística 2.03 10 7.77 4.97
Autor: Profesores UNAM
Editorial: PAPIPEM 6 4.62 1.9
10 7.32 7.18
Diagrama de Flujo
5 6.87 3.496
15
6 3.27 7.45
10
68 62.07 41.58
5
0
10 12 14 16 18 20 22
COEFICIENTE DE RELACIÓN DE PEARSON
X Y XY Definición:
11 121 2 4 22
14 196 3 9 42 Los coeficientes de correlación son medidas
16 256 5 25 80 que indican la situación relativa de los mismos
15 225 6 36 90 sucesos respecto a las dos variables, es decir,
16 256 5 25 80 son la expresión numérica que nos indica el

18 324 54 grado de relación existente entre las 2


3 9
variables y en qué medida se relacionan.
20 400 7 49 140
21 441 10 100 210
Bibliografía:
14 196 6 36 84
20 400 10 100 200 Libro: Introducción a la probabilidad y
estadística.
19 361 5 25 95
Autor: William mendenhall.
11 121 6 36 66
195 3297 68 454 1163
  Fórmulas: Valor Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
  Sustitución:
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta
• 0.7285
Valor Significado
0.618 Correlación positiva moderada
COEFICIENTE DE RELACIÓN DE SPEARMAN
X Y Rango Rango d
X Y Definición:
11 2 1.5 1 0.5 0.25
14 3 3.5 2.5 1 1 Es una medida de la correlación (la asociación o

16 5 6.5 5 1.5 2.25 interdependencia) entre dos variables aleatorias


16 5 6.5 5 1.5 2.25
15 6 5 8 -3 9 continuas.
15 6 5 8 -3 9
16
16 5
5 6.5
6.5 5
5 1.5
1.5 2.25
2.25 Este coeficiente se emplea cuando una o ambas
18
18 3
3 8
8 2.5
2.5 5.5
5.5 30.25
30.25 escalas de medidas de las variables son
20
20 7
7 10.5
10.5 10
10 0.5
0.5 0.25
0.25 ordinales, es decir, cuando una o ambas escalas
21 10 12 11.5 1.5 2.25
21 10 12 11.5 1.5 2.25 de medida son posiciones.
14 6 3.5 8 4.5 20.25
14 6 3.5 8 4.5 20.25
20 10 20.5 11.5 9 81
20 10 20.5 11.5 9 81   Fórmulas:   Sustitución:
19 5 9 5 4 16
19 5 9 5 4 16
11 6 1.5 8 -6.5 42.25
11 6 1.5 8 -6.5 42.25
195 68 207 • 72
195 68 207

Bibliografía:
Libro: Estadística
Autor: Murray R. Spiegel
RELACIÓN ENTRE EL COEFICIENTE DE PEARSON Y SPEARMAN
Definición: Bibliografía: Inversión Rendimiento,
,X Y
En las variables podemos observar que son Libro: Introducción a la probabilidad y
estadística. 11 2
proporcionales en la mayoría.
Autor: William mendenhall. 14 3
Con estos datos se comprueba que la
correlación de Spearman es exactamente igual 16 5
al coeficiente de correlación de Pearson, 15 6
calculado sobre el rango de observaciones.
16 5
18 3
12 20 7
10 21 10
8 14 6
6 20 10
4 19 5
2 11 6
0
10 12 14 16 18 20 22
VARIANZA Y DESVIACIÓN ESTANDAR
Fórmula Sustitución Resultados

Bibliografía:
Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.

n-2
Definición:
Desviación estándar:
La desviación es una medida de dispersión para variables de razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.

Varianza:
En teoría de probabilidad, la varianza de una variable aleatoria es una medida de dispersión definida como
la esperanza del cuadrado de la desviación de dicha variable respecto a su media.
COEFICIENTE DE DETERMINACIÓN

Y   Definición Conclusión
2 3.27 13.44 1.61
Es un estadístico usado en el contexto de un modelo
3 4.62 7.11 2.62 estadístico cuyo principal propósito es predecir El resultado indica que el
5 5.52 0.44 0.27 futuros resultados o probar una hipótesis. 55.209% de los resultados
6 5.07 0.11 0.86 seguira siendo parecida a la
media, los datos pueden
5 5.52 7.11 0.27
Fórmula variar por muy poco
3 6.42 7.11 11.69
7 7.32 1.77 0.10
10 7.77 18.77 4.97
6 4.62 0.11 1.9 Bibliografía:
Sustitución
10 7.32 18.77 7.18
Libro: Introducción a la
5 6.87 0.44 3.496
probabilidad y estadística.
6 3.27 0.11 7.45 Autor: William mendenhall.
68 62.07 75.29 41.58
RELACIÓN ENTRE EL COEFICIENTE DE DETERMINACIÓN Y EL
COEFICIENTE DE CORRELACIÓN DE PEARSON
Datos Comprobando Conclusión

Coeficiente de correlación de Pearson 0.72 En el caso de la regresión lineal el


coeficiente de correlación de Pearson es
Coeficiente de Determinación 0.62 simplemente el cuadrado del
coeficiente de determinación

¿POR QUÉ COINCIDEN PEARSON Y SPERMAN?


TANTO EL COEFICIENTE DE RELACION DE PEARSON COMO EL DE SPERMAN TIENEN LAS MISMAS NORMAS
DE INTERPRETACION:
*SOLAMENTE TOMA VALORES ENTRE 1 Y -1
*EL CERO INDICA QUE NO EXISTE CORRELACION
*EL VALOR NUMERICO INDICA LA MAGNITUD DE LA CORRELACION
*EL COEFICIENTE DE CORRELACION CUANTIFICA LA CORRELACION ENTRE DOS VARIABLES, CUANDO
ESTAS REALMENTE EXISTEN
*EL SIGNO INDICA LA DIRECCION DE LA CORRELACION
Intervalos de confianza.

  INTERVALOS DE CONFIANZA PARA :

1) Datos: 2) Formulas: 5) Sustitución:


 𝑏 − 𝑇
 
b=0.45
=128.25
( 𝛼
2
) 𝑠 < 𝛽 < 𝑏 +( 𝑇 ) 𝑠𝛼
2
 

S=2.06 √ 𝑆 𝑥𝑥 √ 𝑆 𝑥𝑥
n=12
6) Resultado:
4) Tabla de distribución  
  3) Calculando : T
𝛾  =n − 2=10
  I.C.=95%
γ 0.05
10 2.22 =

𝜏  𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
 
• INTERVALOS DE CONFIANZA PARA :
1) Datos: 2) Formulas y sustitución :
 
a=-1.68  
=128.25
S=2.06 Sustitución:
n=12
3297

Tabla de distribución T
  3) Calculando :
  I.C.=95%
𝛾  =n − 2=10
γ 0.05
10 2.22 =

𝜏  𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
 
• INTERVALOS DE CONFIANZA PARA :
1) Datos: 2) Formulas y sustitución :
 
=128.25  
S=2.06
n=12 Sustitución:
Muestra x= 11 = 0.775.76
=3.27
=16.25

  3) Calculando : Tabla de distribución T


  I.C.=95%
𝛾  =n − 2=10
γ 0.05
10 2.22 =

𝜏  𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
 
• INTERVALOS DE CONFIANZA PARA:
1) Datos: 2) Formulas y sustitución :
 
=128.25  
S=2.06
n=12 Sustitución:
Muestra x= 11 = -1.94
=3.27
=16.25

  3) Calculando : Tabla de distribución T


  I.C.=95%
𝛾  =n − 2=10
γ 0.05
10 2.22 =

𝜏  𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
• RESULTADOS DE INTERVALOS DE CONFIANZA:

  Intervalo de confianza
para
−0.364
  < 𝛽 <0.443
  Intervalo de confianza  −8.37 <𝛼 < 5.01
para
  Intervalo de confianza
 0.77 < 𝜇 𝑌 <5.76
para 𝑋𝑜

  Intervalo de confianza
 −1.94<𝑌 𝑜 <8.48
para
  PRUEBA DE HIPÓTESIS PARA

DATOS FÓRMULA SUSTITUCIÓN Tabla: A.4


= 10

b=0.45 γ 0.05
S=2.06 2.22 =
10

GRÁFICA CONCLUSIONES

Se rechaza , el valor calculado resulto


ser menor a 1 esto implica que hay
una correlación lineal significativa
entre la variable ¨y¨ y la variable
independiente
  PRUEBA DE HIPÓTESIS PARA

DATOS FÓRMULA SUSTITUCIÓN Tabla: Valores críticos de la


distribución t

= 10
a=-1.68
γ 0.05
3297
S=2.06 10 2.22 =

GRÁFICA CONCLUSIONES

Se rechaza , el valor calculado resulto


ser diferente a 0 esto implica que hay
una correlación lineal significativa
entre la variable ¨y¨ y la variable
independiente
PLANTEAMIENTO DE PROBLEMA 2
Años Ventas
• Un gerente de ventas reunió los datos Experiencia Anuales(y)
(x)
siguientes relacionados con las ventas anuales
1 80
en miles de pesos y los años de experiencia de 3 97
diez vendedores. Estime las ventas anuales 4 92
para un vendedor con 7 años de experiencia. 4 102
6 103
8 111
10 119
10 123
11 117
DIAGRAMA DE FLUJO

Definición:
140 Diagrama de flujo
120
• Es un diagrama que describe un proceso,
100
sistema o algoritmo informático. Se usan
80
ampliamente en numerosos campos para
60
documentar, estudiar, planificar, mejorar y
comunicar procesos que suelen ser complejos
40
en diagramas claros y fáciles de comprender.
20

0
0 2 4 6 8 10 12 14
Bibliografía:
https://www.lucidchart.com/pages/es/qué-es-un-
diagrama-de-flujo
Mejor estimación de la recta
Mejor estimación de la recta: Bibliografía:

Definición: Para estimar la línea de regresión poblacional a partir de la nube de puntos


se utiliza el método de los mínimos cuadrados ordinarios (MCO), que considera como http://www.ub.edu/aplica_in
recta que mejor se ajusta a la que minimiza la suma de los cuadrados de los residuos.
Si la recta de mejor ajuste es  𝛾 for/spss/cap7-2.htm/
 ^ =𝑎 + 𝑏 𝑋
𝑖 𝑖

140

120

100

80

60

40

20

0
0 2 4 6 8 10 12 14
X Y XY
  Ecuación de la recta
1 1 80 80 84
Fórmulas
3 9 97 291 92
4
4 16
16 92
92 368
368 96
96
4
4 16
16 102
102 408
408 96
96
6
6 36
36 103
103 618
618 104
104
8
8 64
64 111
111 888
888 112
112
10
10 100
100 119
119 1190
1190 120
120
10 100 123 1230 120   Sustitución
10 100 123 1230 120
11 121 117 1287 123
11 121 117 1287 123
13 169 136 1768 132
13 169 136 1768 132
• b

70 632 1080 8128 1079


70 632 1080 8128 1079
 = 80 + 4(x)
ERROR DE LA MEJOR ESTIMACIÓN DE LA RECTA
Definición:   Formulas: Y
80 84 16
• El error estándar de estimación 97 92 25
representado por el símbolo Syx 92 96 16
mide la dispersión de los 102 96 36
valores observados alrededor de 103 104 1
la línea de regresión. 111 112 1
Bibliografía:   Sustitución: 119 120 1
https://www.gerencie.com/error- 123 120 9
estandar-de-estimacion-en-excel-
2007.html 4.61 117 123 36
136 132 16
Diagrama de Flujo
15
10
1080 1079 157
5
0
10 12 14 16 18 20 22
COEFICIENTE DE RELACIÓN DE PEARSON

X Y XY Definición:
1 1 80 80 84 6400
3 9 97 291 92 9409 Los coeficientes de correlación son medidas
que indican la situación relativa de los mismos
4 16 92 368 96 8464
sucesos respecto a las dos variables, es decir,
4 16 102 408 96 10404
son la expresión numérica que nos indica el
6 36 103 618 104 10609
grado de relación existente entre las 2
8 64 111 888 112 1231
variables y en qué medida se relacionan.
10 100 119 1190 120 114161
10 100 123 1230 120 15129
Bibliografía:
11 121 117 1287 123 13689
Libro: Introducción a la probabilidad y
13 169 136 1768 132 18496
estadística.
195 3297 68 454 1163 119082 Autor: William mendenhall.
  Fórmulas: Valor Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
  Sustitución:
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta
Valor Significado
0.618 Correlación positiva moderada
COEFICIENTE DE RELACIÓN DE SPEARMAN
Definición:
X Y Rango Rango d
X Y Es una medida de la correlación (la asociación o
1 80 1 1 0 0 interdependencia) entre dos variables aleatorias
3 97 2 2 0 0 continuas.
4 92 3.5 3 0.5 0.25
4 102 3.5 4 -0.5 -0.25 Este coeficiente se emplea cuando una o ambas
4 102 3.5 4 -0.5 -0.25
6 103 5 5 0 0 escalas de medidas de las variables son
6 103 5 5 0 0
8
8 111
111 6
6 6
6 0
0 0
0
ordinales, es decir, cuando una o ambas escalas
10
10 119
119 7.5
7.5 7
7 0.5
0.5 0.25
0.25 de medida son posiciones.
10
10 123
123 7.5
7.5 8
8 -0.5
-0.5 -0.25
-0.25
11
11 117
117 9
9 9
9 0
0 0
0
  Fórmulas:   Sustitución:
13
13 136
136 10
10 10
10 0
0 0
0

70
70 180
180 0
0

Bibliografía:
 
Interpretación: es correlación
Libro: Estadística
muy alta
Autor: Murray R. Spiegel
RELACIÓN ENTRE EL COEFICIENTE DE PEARSON Y SPEARMAN

Definición:
• El coeficiente de correlación de Pearson permite medir la fuerza y la dirección de la asociación de dos variables
cuantitativas aleatorias con una distribución bivariada conjunta. En este caso sólo buscaremos comprobar que
cada una por sí solas presenten una distribución normal univariada. Los valores de la correlación de Pearson van
desde -1 hasta 1, siendo los valores extremos los que indican mayor correlación entre variables, y siendo el 0 el
punto que indica la no existencia de correlación.
• Para la interpretación de los resultados, tanto para Pearson y Spearman hay que considerar lo siguiente: Si el
coeficiente de correlación arrojado va entre 0 y 0,2, entonces la correlación es mínima; si va entre 0,2 y 0,4, es
una correlación baja; si va entre 0,4 y 0,6, entonces es una correlación moderada, ya entre 0,6 y 0,8 es una
correlación buena; finalmente, entre 0,8 y 1, es una correlación muy buena. Esto mismo aplica en negativo.
• El coeficiente de correlación de Spearman, al igual que el de Pearson, muestra una asociación
entre variables. A diferencia del anterior, permite obtener un coeficiente de asociación ente variables que
no se comportan normalmente, entre variables ordinales. Se calcula en base a una serie de rangos
asignados. Tal como en Pearson, los valores van de - 1 a 1, siendo 0 el valor que indica no correlación, y los
signos indican correlación directa e inversa
Bibliografía:
Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
VARIANZA Y DESVIACIÓN ESTANDAR

Fórmula Sustitución Resultados


4.63 Bibliografía:
107.41
568 Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.

4.61

Definición:
Desviación estándar:
La desviación es una medida de dispersión para variables de razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.

Varianza:
En teoría de probabilidad, la varianza de una variable aleatoria es una medida de dispersión definida como
la esperanza del cuadrado de la desviación de dicha variable respecto a su media.
Relación entre desviación estándar y el error
estándar en la mejor estimación de la recta
En este caso como el error estándar depende de el tamaño muestral, a los datos representados son
iguales a la distribución de la media, por ende los valores deben ser igualadas o cercanos, ya que si no hay
un crecimiento en el tamaño muestral el error será parecido a la desviación estándar pero el error siempre
debe ser menor que la desviación estándar. El error estándar es un aproximado a la desviación estándar
como referencia de la media de muestra que se tomó de una población.
Mide la dispersión de los valores observados de la línea.
Como se aplicaba en la desviación estándar, mientras más grande sea el error estándar de
estimación, mayor será la dispersión de los puntos alrededor de la línea de regresión. De manera
que inversa, si Se = 0, esperemos que la ecuación de estimación sea un estimador perfecto de la
variable dependiente.
BIBLIOGRAFIA:
www.dm.uba.ar/materias/estadistica_Q/2011/1/clase
%20regresion%20simple.pdf
COEFICIENTE DE DETERMINACIÓN
Y   Definición Conclusión
84 80 100 16
Es un estadístico usado en el contexto de un modelo
92 97 49 25 • El resultado indica que el
estadístico cuyo principal propósito es predecir
96 92 4 16 futuros resultados o probar una hipótesis. 92.1% de los resultados
seguira siendo parecida a
96 102 144 36
la media, los datos pueden
104 103 169 1 variar por muy poco
Fórmula
112 111 441 1
120 119 841 1
120 123 1089 9
123 117 729 36 Bibliografía:
Sustitución
132 136 2116 16
Libro: Introducción a la
probabilidad y estadística.
107 1080 5682 157 Autor: William mendenhall.
9
RELACIÓN ENTRE EL COEFICIENTE DE DETERMINACIÓN
Y EL COEFICIENTE DE CORRELACIÓN DE PEARSON

Datos Comprobando Conclusión

Coeficiente de correlación de Pearson 0.96 En ambos casos el R² adquiere


valores entre 0 y 1. Existen casos
Coeficiente de Determinación 0.951 dentro de la definición computacional
de R² donde este valor puede tomar
valores negativos.
INTERVALOS DE CONFIANZA.
 
• INTERVALOS DE CONFIANZA PARA :
1) Datos: 2) Formulas y sustitución :
 
a=80  
=142
S=4.61 Sustitución:
n=12

Tabla de distribución T
  3) Calculando :
  I.C.=95%
𝛾  =n − 2=10
γ 0.05
10 2.22 =

𝜏  𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
 
• INTERVALOS DE CONFIANZA PARA :
1) Datos: 2) Formulas: 5) Sustitución:
 
B=4.63  𝑏 − 𝑇 𝑠 𝑏+ 𝑇 𝑠  
=142
( 𝛼
2
) <𝛽<
( 𝛼
2
)
S=4.61 √ 𝑆 𝑥𝑥 √ 𝑆 𝑥𝑥
n=12
6) Resultado:
4) Tabla de distribución  
  3) Calculando : T
𝛾  =n − 2=10
  I.C.=95%
γ 0.05
10 2.22 =

𝜏  𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
 
• INTERVALOS DE CONFIANZA PARA :
1) Datos: 2) Formulas y sustitución :
 
=142  
S=4.61
n=12 Sustitución:
Muestra x= 11 84= 36.66
=84
=15.83

  3) Calculando : Tabla de distribución T


  I.C.=95%
𝛾  =n − 2=10
γ 0.05
10 2.22 =

𝜏  𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
 
• INTERVALOS DE CONFIANZA PARA:
1) Datos: 2) Formulas y sustitución :
 
=142  
S=4.61
n=12 Sustitución:
Muestra x= 11 84= 110.43
=84
=15.83

  3) Calculando : Tabla de distribución T


  I.C.=95%
𝛾  =n − 2=10
γ 0.05
10 2.22 =

𝜏  𝛼 /2 =2.22
  PRUEBA DE HIPÓTESIS PARA
DATOS FÓRMULA SUSTITUCIÓN Tabla: Valores críticos de la
distribución t

= 10
a=80
γ 0.05
S=4.61 10 2.22 =

GRÁFICA
GRÁFICA CONCLUSIONES

Se rechaza , el valor calculado resulto


ser diferente a 0 esto implica que hay
una correlación lineal significativa
entre la variable ¨y¨ y la variable
independiente
  PRUEBA DE HIPÓTESIS PARA
DATOS FÓRMULA SUSTITUCIÓN Tabla: Valores críticos de la
distribución t

= 10
b=4.63 γ 0.05
S=4.61 2.22 =
10

GRÁFICA CONCLUSIONES

Se rechaza , el valor calculado resulto


ser menor a 1 esto implica que hay
una correlación lineal significativa
entre la variable ¨y¨ y la variable
independiente
TEMA 2
REGRESIÓN LINEAL MÚLTIPLE Y CORRELACIÓN
• Regresión Lineal Múltiple
• Cuando existe una posible relación entra varias variables independientes y otra dependiente se hace necesario el
uso de la REGRESIÓN MULTIPLE.
La regresión múltiple se usa con mayor frecuencia en las publicaciones de las investigaciones cuando se requiere
crear un modelo donde se seleccionan variables que pueden influir en la respuesta, descartando aquellas que no
aportan información, cuando se requiere detectar la interacción entre variables independientes que afectan a la
variable y cuando se requiere identificar variables confesoras.

• Correlación
• La correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables
estadísticas. Se considera que dos variables están correlacionadas cuando los valores de una de ellas varían
sistemáticamente con respecto a los valores homónimos de la otra.

• https://es.wikipedia.org/wiki/Correlaci%C3%B3n
• http://estadisticauazteca.blogspot.mx/2010/07/regresion-multiple.html
REGRESIÓN POLINOMIAL

Planteamiento
Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:

Estatura
Pesos (Y)
(X)
186 85
189 85
190 86
192 90
193 87
193 91
198 93
201 103
203 100
205 101
X Y XY Y
1.86 85 3.45 6.43 11.96 158.1 294.06
1.89 85 3.57 6.75 12.75 160.65 303.62
1.90 86 3.61 6.85 13.03 163.4 310.46
1.92 90 3.68 7.07 13.58 172.8 324.06
1.93 87 3.72 7.18 13.87 167.91 324.24
1.93 91 3.72 7.18 13.87 175.63 338.96
1.98 93 3.92 7.76 15.36 184.14 364.59
2.01 103 4.04 8.12 16.32 207.03 416.13
2.03 100 4.12 8.36 16.98 203 412.09
2.05 101 4.20 8.61 17.66 2.05 424.45
19.50 921 34.31 74.31 145.38 1594.71 3512.66
Formulas:

  Δ 𝑏0
𝑏0 =
Δ𝐷
  Δ 𝑏1
𝑏1 =
Δ𝐷

  Δ 𝑏2
𝑏2 =
Δ𝐷

9
RESOLVER ECUACIONES POR
CRAMER

∆ D=1042.083
 
 
SOLUCIÓN PARA

  −7298.96
∆ 𝑏𝑜= =−7.004
1042.083
 
SOLUCION PARA

  522071102
∆ 𝑏1= =50.098
1042.083
 
SOLUCION PARA

  216.01
∆ 𝑏2= =0.207
1042.083
ECUACIÓN DE LA RECTA POLINOMIAL

  X
1.86 86.85
1.89 88.34
1.90 88.89
1.92 89.91
91 1.93 90.41
90.5
P 1.93 90.41
90
E 1.98 92.96
89.5
S
89 2.01 94.48
O
88.5 S 2.03 95.50
88 (y) 2.05 95.52
87.5
19.50 913.27
87
1.89 1.9 1.92 1.93

Estatura (x)
COEFICIENTE DE DETERMINACIÓN
 FÓRMULA DEFINICIÓN

• el coeficiente de determinación, denominado R² y pronunciado R


cuadrado, es un estadístico usado en el contexto de un modelo
estadístico cuyo principal propósito es predecir futuros resultados o
SUSTITUCIÓN probar una hipótesis.

El coeficiente determina la calidad del modelo para replicar los


resultados, y la proporción de variación de los resultados que puede
explicarse por el modelo.
CONCLUSION
El resultado indica que el 98.14% de los resultados seguira
siendo parecida a la media, los datos pueden variar por muy
poco • Bibliografía
• https://es.wikipedia.org/wiki/Coeficiente_de_determinaci%C3%B3n
REGRESIÓN POLINOMIAL

Planteamiento (ejemplo 2)
Dados los datos siguientes:
(X) (Y)
0 9.1
1 7.37
2 3.2
3 4.6
4 4.8
5 2.9
6 5.7
7 7.1
8 8.8 BIBLIOGRAFIA:
9 10.2 Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
X Y XY Y

0 9.1 0 0 0 0 0
1 7.37 1 1 1 7.37 7.37
2 3.2 4 8 64 6.4 12.8
3 4.6 9 27 81 13.8 41.4
4 4.8 16 64 256 19.2 76.8
5 2.9 25 125 625 14.5 72.5
6 5.7 36 216 1296 34.2 199.5
7 7.1 49 343 2401 49.7 347.9
8 8.8 64 512 4096 70.4 536.2

9 10.2 81 729 6561 81.6 826.2

45 63.77 285 2025 15133 307.3 2153.3


Ahora suponga que se desea ajustar la ecuación
polinomial

  = 

Predicción de una variable de respuesta


cuantitativa a partir de una variable
predictora cuantitativa, donde la relación se
modela como una función polinomial de
orden n
Formulas:

  Δ b0
b0 =
ΔD
  Δ b1
b1 =
ΔD

  Δ b2
b2 =
ΔD

10
285
307.3
307.3
15,133 2153.3
2153.3
RESOLVER ECUACIONES POR CRAMER

285
2153.3

285
15133

∆ D=2289.524
 
63.77
285

15,333

 2 85 2025
- 45  3 07.3 2025
+ 285  3 07.3 285
63.77 2025 1533 2153.3 1533 2153.3 2025

63.77   [ -   ] = -233635.42
45 [   - ] = -175020372

  285 [ - ] = 24730875

  = -233635.42 – 175020372+ 24730875


  = 8.698
10
307.3

15,333

 3 07.3 2025  4 5 2025


- 63.7 285 + 285  4 5 307.3
10 2153.3 1533 1533 285 2153.3

10   [ -  ] = -38893416
63.7 [  - ] = -32368518

  285 [ - ] = 2655630

  = -38893416- 32368518 + 2655630


  = -2.341
10
285

2153.3

10  2 85 307.3
- 45  4 5 307.3 + 63.77  4 5 285
2025 2153.3 285 2153.3 285 2025

  10 [ - ] = -86775

  45 [ - ] = 419310

  63.77 [ - ] = 631323

  = 0. 288
ECUACIÓN DE LA RECTA POLINOMIAL

  (X)
(X)
0 8.989
01 8.989
6.645
21 6.645
5.168
3
2 4.267
5.168
4
3 3.942
4.267
5
4 4.193
3.942
6
5 5.02
4.193
8 7 6.423
6 5.02
8
7 8.402
6.423
6
9
8 10.957
8.402
4
9 10.957
2

0
1 2 3 4   = 8.698 − (2.341)(2) + (0.288)(2 = 5.168.
COEFICIENTE DE DETERMINACIÓN
 FÓRMULA DEFINICIÓN

• el coeficiente de determinación, denominado R² y pronunciado R


cuadrado, es un estadístico usado en el contexto de un modelo
estadístico cuyo principal propósito es predecir futuros resultados o
SUSTITUCIÓN
probar una hipótesis.

El coeficiente determina la calidad del modelo para replicar los


resultados, y la proporción de variación de los resultados que puede
explicarse por el modelo.
CONCLUSION
El resultado indica que el 85.11% de los resultados seguira
siendo parecida a la media, los datos pueden variar por muy
poco • Bibliografía
• https://es.wikipedia.org/wiki/Coeficiente_de_determinaci%C3%B3n
TEMA 3
REGRESIÓN NO LINEAL MÚLTIPLE

TEMARIO:

• Ecuación de Potencia
• Coeficiente de determinación y gráfica
• Ecuación Exponencial
• Coeficiente de determinación y gráfica
• Ecuación logarítmica
• Coeficiente de determinación y gráfica
TEMA 3.
REGRESIÓN NO LINEAL MÚLTIPLE

• Genera una ecuación para describir la relación no lineal entre una variable de respuesta
continua y una o más variables productoras, y predice nuevas observaciones. 

Bibliografía
https://es.slideshare.net/jjgibaja/regresin-lineal-mltiple
ECUACIÓN DE POTENCIA
Definición

La regresión examina la relación entre dos variables, pero restringiendo una de ellas con
el objeto de estudiar las variaciones de una variable cuando la otra permanece constante.

En otras palabras, la regresión es un método que se emplea para predecir el valor de una
variable en función de valores dados a la otra variable.
 
Ecuación:

Bibliografía
http://www.monografias.com/trabajos89/regresion-potencial-metodo-minimos-cuadrados/regresion-potencial-
metodo-minimos-cuadrados.shtml
PLANTEAMIENTO:

• Sea el siguiente conjunto de valores, las lecturas de un experimento donde X


es el volumen (variable independiente) e Y es la presión de una masa dada
de gas (variable resultante).

X Volumen 1 2 3 4 5 6 7
Y Presión 7 30 90 170 290 450 650

BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y estadística.
Autor: William mendenhall.
x y Log x Log y Log x log y

1 7 0 0.845 0 0

2 30 0.301 1.447 0.09 0.44

3 90 0.477 1.954 0.227 0.932

4 170 0.602 2.23 0.362 1.342

5 290 0.698 2.462 0.488 1.721

6 450 0.778 2.653 0.605 2.064

7 650 0.845 2.812 0.714 2.377

28 1687 3.702 14.435 2.489 8.882


PROCEDIMIENTO:

1) Datos: 2) Formulas: 3) Sustitución:


7
     
Grafica:

 𝑌
^ =𝑎 𝑥 𝑏 Tabla:
y
700
7 6.572 54956.48 54756
600 30 33.482 43063.72 44521

500 90 86.787 4958.97 22801


170 170.58 2401 5041
400

290 288.12 2209 2401


300
450 442.16 40465.34 43681
200
650 635.09 155306.9 167281
100
1687 1662.79 241
303361.41 340482
0
0 1 2 3 4 5 6 7 8
COEFICIENTE DE DETERMINACIÓN
 FÓRMULA
DEFINICIÓN

• el coeficiente de determinación, denominado R² y pronunciado R


cuadrado, es un estadístico usado en el contexto de un modelo
SUSTITUCIÓN estadístico cuyo principal propósito es predecir futuros resultados o
probar una hipótesis.

El coeficiente determina la calidad del modelo para replicar los


resultados, y la proporción de variación de los resultados que puede
CONCLUSION explicarse por el modelo.

El resultado indica que el 89.09% de los resultados seguira


siendo parecida a la media, los datos pueden variar por muy
poco

BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y
estadística.
PLANTEAMIENTO (EJEMPLO 2):
En determinados experimentos, en su mayoría biológicos, la
dependencia entre las variables X e Y es de forma exponencial, en cuyo
caso interesa ajustar a la nube de puntos ax la mejor función.
y
1 3
1.2 3.4
1.5 5
2 2
3 4.1
3.7 5
4 7
BIBLIOGRAFIA: 4.5 6.5
Libro: Introducción a la probabilidad y
estadística. Σ 20.9 Σ 36
Autor: William mendenhall.
1 3 0 0.477121255 0 0

1.2 3.4 0.07918125 0.531478917 0.00626967 0.04208316

1.5 5 0.17609126 0.698970004 0.03100813 0.12308251

2 2 0.30103 0.301029996 0.09061906 0.09061906

3 4.1 0.47712125 0.612783857 0.22764469 0.2923722

3.7 5 0.56820172 0.698970004 0.3228532 0.39715596

4 7 0.60205999 0.84509804 0.36247623 0.50879972

4.5 6.5 0.65321251 0.812913357 0.42668659 0.53100518


Procedimiento:

3) Sustitución:
1) Datos: 2) Formulas:  
b
    b
Grafica:

Tabla:

𝑦 = 𝑎𝑙𝑛𝑥 +𝑏
 ^

7
ŷ

6 3 2.867324958
4.5 2.66562779 2.25
3.4 3.12009764
5 4.5 1.90413052 1.21
5 3.45998862
4.5 1.08162367 0.25
4
2 3.953385811
4.5 0.29878707 6.25

3 4.1 4.770533551
4.5 0.0731884 0.16
5 5.257413385
4.5 0.57367504 0.25
2
7 5.450815515
4.5 0.90405014 6.25
1 6.5 5.756582194
4.5 1.57899881 4
(y)= 36 (ŷ)= 34.6361417 =9.08008145 =20.62
0
0 1 2 3 4 5 6 7 8 9
COEFICIENTE DE DETERMINACIÓN
 FÓRMULA
DEFINICIÓN

• el coeficiente de determinación, denominado R² y pronunciado R


cuadrado, es un estadístico usado en el contexto de un modelo
SUSTITUCIÓN estadístico cuyo principal propósito es predecir futuros resultados o
probar una hipótesis.

El coeficiente determina la calidad del modelo para replicar los


resultados, y la proporción de variación de los resultados que puede
CONCLUSION explicarse por el modelo.
• El resultado indica que el 44.3% de los resultados
seguira siendo parecida a la media, los datos pueden
variar por muy poco

BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
ECUACIÓN EXPONENCIAL

 
Definición
• Una regresión exponencial es el proceso de encontrar la ecuación de la función
exponencial que se ajuste mejor a un conjunto de datos. Como un resultado,
obtenemos una ecuación
• La potencia predictiva relativa de un modelo exponencial está denotada por .
El valor de varía entre 0 y 1. Mientras más cercano el valor esté de 1, más
preciso será el modelo.
 Ecuación:

Bibliografía
https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/exponential-
regression
Planteamiento:
El volumen de ventas mensuales (y) y los años de experiencia en ventas
(x) registradas de una muestra aleatoria de 6 vendedores de la Empresa
“LOZANO” procesadora de alimentos, se dan en la siguiente tabla.
Estime la ecuación de regresión exponencial.

x y

1 10

2 40

3 120

4 300

5 800 Libro: probabilidad y estadística para ingeniería y


administración.
6 500 Autor: William W. Hines.
1 10
2.30258509 1 2.302585093

2 40
3.68887945 4 7.377758908

3 120
4.78749174 9 14.36247523

4 300
5.70378247 16 22.8151299

5 800
6.68461173 25 33.42305864

6 500
6.2146081 36 37.28764859
PROCEDIMIENTO:

1) Datos: 2) Formulas: 3) Sustitución:


     

b
Grafica:

Tabla:

𝑦= 𝑎
 ^ 𝑒 𝑏𝑥
8
ŷ
7

10 16.32096
6 1770 3075390.18 3097600

40 37.87409
5 1770 3000260.16 2992900

120 87.88986
4 1770 2829494.51 2722500

300 203.9555
3 1770 2452495.46 2160900

800 473.295
2 1770 1681443.79 940900

500 1098.319
1770 451155.315 1612900
1
(y)=1770 (ŷ)=1098.319 =13490239.4 =13527700
0
140 160 180 200 220 240 260 280 300
COEFICIENTE DE DETERMINACIÓN
 FÓRMULA
DEFINICIÓN

• el coeficiente de determinación, denominado R² y pronunciado R


cuadrado, es un estadístico usado en el contexto de un modelo
SUSTITUCIÓN estadístico cuyo principal propósito es predecir futuros resultados o
probar una hipótesis.

El coeficiente determina la calidad del modelo para replicar los


resultados, y la proporción de variación de los resultados que puede
CONCLUSION explicarse por el modelo.
• El resultado indica que el 99.72% de los resultados
seguira siendo parecida a la media, los datos pueden
variar por muy poco

BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
PLANTEAMIENTO (EJEMPLO 2):

• Sea el siguiente conjunto de valores, las lecturas de un experimento donde X


es el volumen (variable independiente) e Y es la presión de una masa dada
de gas (variable resultante).

X Volumen 1 2 3 4 5 6 7
Y Presión 7 30 90 170 290 450 650

BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y estadística.
Autor: William mendenhall.
x y Log x Log y Log x log y

1 7 0 0.845 0 0

2 30 0.301 1.447 0.09 0.44

3 90 0.477 1.954 0.227 0.932

4 170 0.602 2.23 0.362 1.342

5 290 0.698 2.462 0.488 1.721

6 450 0.778 2.653 0.605 2.064

7 650 0.845 2.812 0.714 2.377

28 1687 3.702 14.435 2.489 8.882


PROCEDIMIENTO:

2) Formulas: 3) Sustitución:
   
Grafica:

Tabla:

𝑦= 𝑎
 ^ 𝑒 𝑏𝑥
y

675 7 6.572 54956.48 54756

600
30 33.482 43063.72 44521
525
90 86.787 4958.97 22801
450

375 170 170.58 2401 5041

300
290 288.12 2209 2401
225
450 442.16 40465.34 43681
150

75 650 635.09 155306.9 167281

0
0 1 2 3 4 5 6 7
1687 1662.79 241

303361.41 340482
COEFICIENTE DE DETERMINACIÓN

 FÓRMULA
DEFINICIÓN

• el coeficiente de determinación, denominado R² y pronunciado R


cuadrado, es un estadístico usado en el contexto de un modelo
SUSTITUCIÓN estadístico cuyo principal propósito es predecir futuros resultados o
probar una hipótesis.

El coeficiente determina la calidad del modelo para replicar los


resultados, y la proporción de variación de los resultados que puede
CONCLUSION explicarse por el modelo.

El resultado indica que el 89.09% de los resultados seguira


siendo parecida a la media, los datos pueden variar por muy
poco

BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y
estadística.
ECUACIÓN LOGARITMICA

Definición
• Este modelo de regresión es una alternativa cuando el modelo lineal no logra un
coeficiente de determinación apropiado, o cuando el fenómeno en estudio tiene un
comportamiento que puede considerarse potencial o logarítmico.

• La forma más simple de tratar de establecer la tendencia es a través de un diagrama de


dispersión o nube de puntos.
 Ecuación:

Bibliografía
http://reyesestadistica.blogspot.mx/2011/07/analisis-de-regresion-
logaritmica.html
PLANTEAMIENTO:
• En la producción de herramientas, el método para deformar acero a temperatura normal
mantiene una relación inversa con la dureza del mismo ya que, a medida que la
deformación crecer, se afectada la dureza del acero. Para investigar esta relación se ha
tomado la siguiente muestra
X: Deformación en (mm) Y: Dureza Brinell (en
6 68
9 67
11 65
13 53
22 44
26 40
28 37 BIBLIOGRAFIA:
Libro: Introducción a la
33 34 probabilidad y estadística.
35 32 Autor: William mendenhall.
PROCEDIMIENTO:

1) Datos: 2) Formulas:
 1183.132   3) Sustitución:
 
440

76.506

25.685
Grafica:

Tabla:

𝑦 = 𝑎𝑙𝑛𝑥 +𝑏
 ^

80

70

60

50

40

30

20

10

0
0 5 10 15 20 25 30 35 40
COEFICIENTE DE DETERMINACIÓN

 FÓRMULA
DEFINICIÓN

• el coeficiente de determinación, denominado R² y pronunciado R


cuadrado, es un estadístico usado en el contexto de un modelo
SUSTITUCIÓN estadístico cuyo principal propósito es predecir futuros resultados o
probar una hipótesis.

El coeficiente determina la calidad del modelo para replicar los


resultados, y la proporción de variación de los resultados que puede
CONCLUSION explicarse por el modelo.
• El resultado indica que el 94.1% de los resultados
tiene un buen coeficiente y se podria considerar buen
modelo para el metodo para deformar acero.

BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
PLANTEAMIENTO (EJEMPLO 2):

En determinados experimentos, en su mayoría biológicos, la


dependencia entre las variables X e Y es de forma exponencial, en cuyo
caso interesa ajustar a la nube de puntos a la mejor
x
función. y
1 3
1.2 3.4
1.5 5
2 2
3 4.1
3.7 5
4 7
BIBLIOGRAFIA: 4.5 6.5
Libro: Introducción a la probabilidad y
estadística. Σ 20.9 Σ 36
Autor: William mendenhall.
x y ln x ln  (ln x) y y2

1 3 0 0 0 9

1.2 3.4 0.1823 0.364 0.6198 11.56

1.5 5 0.4054 0.81 2.027 25

2 2 0.6931 1.386 1.3862 4

3 4.1 1.0986 2.197 4.5042 16.81

3.7 5 1.3083 2.616 6.5415 25

4 7 1.3862 2.772 9.7034 49

4.5 6.5 1.5040 3.008 9.776 42.25

Σ 20.9 36 4.5 6.5779 13.153 34.5581 182.62


PROCEDIMIENTO:

1) Datos: 2) Formulas: 3) Sustitución:


     
n=8
Grafica:

Tabla:

𝑦 = 𝑎𝑙𝑛𝑥 +𝑏
 ^
y
7

3 2.7811 2.25 2.954


6
3.4 3.162 1.21 1.79
5
5 3.628 0.25 0.76
4
2 4.229 6.25 0.073
3 4.1 5.077 0.16 0.332

2 5 5.515 0.25 1.03


7 5.678 6.25 1.387
1

6.5 5.924 4 2.02


0
0 1 2 3 4 5 6 7 8 9
36 35.994 4.5 20.62 10.346
COEFICIENTE DE DETERMINACIÓN
 FÓRMULA
DEFINICIÓN

• el coeficiente de determinación, denominado R² y pronunciado R


cuadrado, es un estadístico usado en el contexto de un modelo
SUSTITUCIÓN estadístico cuyo principal propósito es predecir futuros resultados o
probar una hipótesis.

El coeficiente determina la calidad del modelo para replicar los


resultados, y la proporción de variación de los resultados que puede
CONCLUSION explicarse por el modelo.
• El resultado indica que el 50.10% de los resultados
seguira siendo parecida a la media, los datos pueden
variar por muy poco

BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
Problema hecho por exponencial,
potencial y logaritmica

Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas


por cierto fabricante que aún pueden usarse después de recorrer cierto número
de millas:

Miles de millas recorridas (X) 1 2 5 15 25 30 35 40


Porcentaje útil (Y) 15 20 24 30 55 85 95 99
Ecuación Exponencial

Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas


por cierto fabricante que aún pueden usarse después de recorrer cierto número
de millas:
Miles de millas recorridas (X) 1 2 5 15 25 30 35 40
Porcentaje útil (Y) 15 20 24 30 55 85 95 99

 Fórmulas:

 
1 15 2.70 1 19.125 2.7
2 20 2.99 4 19.125 5.98
5 24 3.17 25 19.125 15.85
15 30 3.40 225 19.125 51
25 55 4 625 19.125 100
30 85 4.44 900 19.125 133.2
35 95 4.55 1225 19.125 159.25
40 99 4.59 1600 19.125 183.6
 Sustitución:

( 0.048 ) ( 1 ) ( 0.048 ) ( 25 )
𝑦 = ( 16.64 ) 𝑒
 ^ =17.45 𝑦= ( 16.64 ) 𝑒
 ^ =55.24
𝑦 = ( 16.64 ) 𝑒( 0.048 ) ( 2 ) =18.31
 ^ 𝑦= ( 16.64 ) 𝑒( 0.048 ) ( 30 ) =70.23
 ^
( 0.048 ) ( 5 ) ( 0.048 ) ( 35 )
𝑦 = ( 16.64 ) 𝑒
 ^ =21.15 𝑦= ( 16.64 ) 𝑒
 ^ =89.28
( 0.048 ) ( 15 ) ( 0.048 ) ( 40 )
𝑦= ( 16.64 ) 𝑒
 ^ =34.18 𝑦= ( 16.64 ) 𝑒
 ^ =113.5
17.45 15 52.875 1254.93 1434.51
18.31 20 52.875 1194.73 1080.76
21.15 24 52.875 1006.47 833.76
34.18 30 52.875 349.5 523.26
55.24 55 52.875 5.59 4.51
70.23 85 52.875 301.19 1032.01
89.28 95 52.875 1325.32 1774.51
113.5 99 52.875 3675.39 2127.51
COEFICIENTE DE DETERMINACIÓN
 Fórmula:
120

Sustitución
100

80

60
1 17.45
1 17.45
2 18.31
2 18.31 40
5 21.15
5 21.15
15 34.18
15 34.18 20
25 55.24
25 55.24
30 70.23
30 70.23
35 89.28 0
0 2 4 6 8 10 12 14
35 89.28
40 113.5
40 113.5
Ecuación Potencial

Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas


por cierto fabricante que aún pueden usarse después de recorrer cierto número
de millas:
Miles de millas recorridas (X) 1 2 5 15 25 30 35 40
Porcentaje útil (Y) 15 20 24 30 55 85 95 99

  Fórmulas:
 
   

 
log y log x log y

1 15 0 1.176 0 0
2 20 0.3 1.3 0.6 0.39
5 24 0.698 1.38 1.39 0.96
15 30 1.17 1.47 2.35 1.72
25 55 1.39
log 1.74y
log
2.79
log log2.41
x log y
30 85 1.47 1.93 2.95 2.83
35 95 1.54 1.97 3.08 3.03
40 99 1.6 1.99 3.2 3.184
 Sustitución:

27.96

0.16 0.16
𝒚 =( 27.96 ) (1 )
 ^ =27.96 𝒚 = ( 27.96 ) ( 25 )
 ^ = 46.8
0.16 0.16
𝒚 = ( 27.96 ) ( 2 )
 ^ =3 1.23  ^
𝒚 = ( 27.96 ) ( 30 ) =4 8
0.16
𝒚 =( 27.96 ) (5 )
 ^
0.16
=36.17 𝒚= ( 27.96 ) (35 )
 ^ = 49.38
0.16
𝒚 =( 27.96 ) (15 )
 ^
0.16 𝒚= ( 27.96 ) ( 40 )
= 43.12 ^ =50.45
27.96 15 52.875 620.75 1434.51

31.23 20 52.875 468.5 1080.76

36.17 24 52.875 279.05 833.76

43.12 30 52.875 95.16 523.26

46.8 55 52.875 36.9 4.51

48 85 52.875 23.76 1032.01

49.38 95 52.875 12.21 1774.51

50.45 99 52.875 5.88 2127.51


COEFICIENTE DE DETERMINACIÓN
 Fórmula: 60

Sustitución
50

40

30
1 27.96
1 27.96
2 31.23
2 31.23 20
5 36.17
5 36.17
15 43.12
15 43.12
25 46.8 10
25 46.8
30 48
30 48
35 49.38
35 49.38 0
40 50.45 0 2 4 6 8 10 12 14
40 50.45
Ecuación logaritmica

Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas


por cierto fabricante que aún pueden usarse después de recorrer cierto número
de millas:
Miles de millas recorridas (X) 1 2 5 15 25 30 35 40
Porcentaje útil (Y) 15 20 24 30 55 85 95 99

 Fórmulas:

 
 

 
In x (y)

1 15 0 0 0 2.7
2 20 0.693 1.38 13.86 5.98
5 24 1.609 3.21 38.61 15.85
15 30 2.708 5.41 81 51
25 55 6.437 6.43
In 354.03
In x (y) 100
30 85 6.8 6.8 76500 133.2
35 95 7.11 7.11 19.125 159.25
40 99 7.37 7.37 19.125 183.6
 Sustitución:

 
154.55 15 52.875 10337.8 1434.51
124.64 20 52.875 5150.21 1080.76
85.11 24 52.875 1039.09 833.76
37.72 30 52.875 229.67 523.26
15.68 55 52.875 1383.46 4.51
7.82 85 52.875 2029.95 1032.01
1.172 95 52.875 2673.2 1774.51
-4.58 99 52.875 3301.07 2127.51

26144.45
COEFICIENTE DE DETERMINACIÓN
 Fórmula:
180

Sustitución 160

140

120

100

80

1 154.55 60
1 154.55
2 124.64 40
2 124.64
5 85.11 20
5 85.11
15 37.72 0
15 37.72 0 2 4 6 8 10 12 14
25 15.68
25 15.68 -20
30 7.82
30 7.82
35 1.172
35 1.172
40 -4.58
40 -4.58
Diagrama de flujo Logaritmico Potencial Exponencial

120 180

160
100
140

120
80

100

60 80

60
40
40

20 20

0
0 5 10 15 20 25 30 35 40 45
0
0 2 4 6 8 10 12 14 16 -20
TEMA 4
DISEÑO DE EXPERIMENTOS
Análisis de varianza para un criterio
Es una metodología para analizar la variación entre muestras y la variación al interior de las
mismas mediante la determinación de varianzas. Es llamado de un criterio porque analiza una
variable dependiente.
Https://www.icicm.com/estadistica.net

Distingo entre
bloques aleatorios y No aleatorios
Los niveles de un factor se definen como los valores reales que se utilizan en el experimento.
Para cada uno de estos casos es importante determinar no sólo si cada uno de los 2 factores
influye en la respuesta, sino también si hay una interacción significativa entre ellos. En lo que
se refiere a la terminología, el experimento descrito aquí es de 2 factores,
y el diseño experimental podría ser uno completamente aleatorizado, en el que las distintas
combinaciones de tratamiento se asignan al azar a todas las unidades experimentales, o bien,
un diseño de bloques completos aleatorizados, donde las combinaciones de factores se
asignan al azar dentro de los bloques.
Ronald E. Walpole. Sexta Edicion
Tabla ANOVA para un criterio

FUENTE DE LA SUMA DE CUADRADOS GRADOS DE LIBERTAD CUADRADOMEDIO CALCULADA


VARIACIÓN

TRATAMIENTOS SSA

ERROR SSE

TOTAL SST

Tabla ANOVA para dos criterios

Fuente de Variación Suma de Grados de libertad Cuadrados de medios Calculada


Cuadrados
A SSA

B SSB
B SSB
AB SS(AB) ()

AB
Error SS(AB)
SSE )

Total SAT
Error SSE

Total SAT
Tema 4: Diseño de Experimentos
Planteamiento mediante tabla ANOVA de un factor
• Los modelos de ANOVA (ANalysis Of VAriance) son técnicas de Análisis
Multivariante de dependencia, que se utilizan para analizar datos
procedentes de diseños con una o más variables independientes
cualitativas (medidas en escalas nominales u ordinales) y una variable
dependiente cuantitativa (medida con una escala de intervalo o de razón).
• Los modelos ANOVA permiten, básicamente, comparar los valores medios
que toma la variable dependiente en J poblaciones en las que los niveles de
factores son distintos, con la finalidad de determinar si existen diferencias
significativas según dichos niveles o si, por el contrario, la respuesta en
cada población es independiente de los niveles de factores. Se trata, por
tanto, de un contraste paramétrico que extiende al caso de J poblaciones el
contraste de la igualdad de medias entre dos poblaciones independientes.
Prueba de Tukey
•  Permite la formación de intervalos de confianza de 100 (1-a)%
simultáneos para todas las comparaciones pareadas. El método se basa
en la distribución del rango studentizado .El punto percentil apropiado
es la función de a, K y v = grados de libertad para .Una lista de puntos
porcentuales superiores para =0.05 como se muestra en la tabla
(puntos porcentuales superiores de la distribución de rango
studentizado: valores de q(0.05; k, v ) El método de comparaciones
pareadas de tukey implica encontrar una diferencia significativa entre las
medias i y j (i  j) si excede.
• Este método solo se aplica si se rechaza Ho

Fuente : probabilidad y estadística para ingenieros, Ronal E. Walpole, 6 edición


Prueba de Duncan
 • Procedimiento de Duncan o prueba de rango múltiple de Duncan. Este
procedimiento también se basa en la noción general del rango studentizado. El
rango de cualquier subconjunto de p medias muéstrales debe excede cierto
valor de que se encuentre que cualquier de las p medias es diferente. Este velos
se llama rango de menor significancia par las p medias y se denota
• Los valores de cantidad que se denominan rango studentizado de menor
significancia, depende del nivel de significancia que se desea y del numero de
grados de libertad del cuadrado medio error. Estos valores se pueden obtener
de la tabla (Rangos studentizados significativos mínimos ) para P= 2, 3 … 10
medias

Fuente : probabilidad y estadística para ingenieros, Ronal E. Walpole, 6 edición


ANALISIS DE VARIANZAS PARA DOS CRITERIOS
Interaccion que indica efectos de ambos criterios cuando no son aditivos: cuando se dan
juntos, su efecto no es la suma de los efectos que tienen cuando estan por separado, por lo
que si en un determinado estudio se encuentra interaccion entre dos factores, no tiene
sentido estimar los efectso de los factores por separado. A la interaccion positiva, es decir
cuando el efecto de los factores actuando juntos es mayor se le llama energia de
potenciacion y si es menor se le llama interaccion negativa inhibicion.
www.hrc.es/Anova_10

PRUEBA DE KRUSKAL-WALLIS
En estadística, la prueba de Kruskal-Wallis (de William Kruskal y W. Allen Wallis) es un
método no paramétrico para probar si un grupo de datos proviene de la misma
población.
Ya que es una prueba no paramétrica, la prueba de Kruskal-Wallis no asume
normalidad en los datos.

https://es.wikipedia.org/wiki/Prueba_de_Kruskal-Wallis
Planteamiento
• Suponga que un experimento industrial un ingeniero está interesado en
cómo la absorción media de humedad en concreto varía entre cinco
mezclas diferentes de concreto. Las muestras se exponen a la humedad
por 48 horas y se decide que se prueben seis muestras para cada mezcla,
por lo que se requiere probar un total de 30 muestras. Los datos de este
experimento se muestran en la siguiente tabla.

 Humedad absorbida en mezclas de concreto.

Mezcla 1 2 3 4 5

1 551.00 595.00 639.00 417.00 563.00 553

2 457.00 580.00 615.00 449.00 631.00 546.4

3 450.00 508.00 511.00 517.00 522.00 501.6

4 731.00 583.00 573.00 438.00 613.00 587.6

5 499.00 633.00 648.00 415.00 656.00 570.2


Bibliografía:
6 632.00 517.00 677.00 555.00 679.00 612

Total 3320.00 3416.00 3663.00 2791.00 3664.00 3370.8 16854.0 Libro: Introducción a la
probabilidad y estadística.
553.33 569.33 610.50 465.17 610.67 561.80 Autor: William mendenhall.
Analisis de Varianza para la classification unilateral
Fuente de Suma de Grados de Cuadrados Calculada
Variación Cuadrados libertad de medios
Tratamiento SCT K-1 f
s
Error SCE K(n-1)
Total STC n k-1

SST Suma Total de Cuadrados


SSA Suma de Cuadrados de Tratamientos
SSE Suma de Cuadrados de Error
Cuadrado
Cuadrado Medio
Medio del
del Tratamiento
Tratamiento
Cuadrado
Cuadrado Medio
Medio del
del Error
Error
Datos Formulas

H0: µ1 = µ2 = µ3
= µ 4 = µ5 = µ 6
H1: Al menos
dos no son
significativas.

α=0.05
n=6
k=5

Sustitucion
Análisis de Varianza para la clasificación unilateral
Fuente de Suma de Grados de Cuadrados Calculada
Variación Cuadrados libertad de medios
Tratamiento 8536.6 4 21339.15 F=4.30
s
Error 124021 25 4960.84
Total 209377 29 26299.99

Valor Critico Formula Sustitución Valor Critico


Tabla puntos
porcentuales
(A.22)

Bibliographic
Bibliographic Conclusión

https://olicarrillo.files.wordpress.co
https://olicarrillo.files.wordpress.co Se rechaza la hipótesis nula . Se acepta
m/2013/02/estadistica-ii.pdf
m/2013/02/estadistica-ii.pdf que al menos dos mezclas no son iguales.
Prueba de Tukey
• El método de Tukey se utiliza en ANOVA para crear intervalos
de confianza para todas las diferencias en parejas entre las
medias de los niveles de los factores mientras controla la tasa de
error por familia que especifique. Es importante considerar la
tasa de error por familia cuando se realizan múltiples
comparaciones debido a que la probabilidad de cometer un
error tipo I para una serie de comparaciones es mayor que la
tasa de error para cualquier comparación individual.

• Bibliografía
• https://es.slideshare.net/JaimeIncaGuerrero/anova-prueba-de-
tukey
(Continuación del problema
anterior)
 Humedad absorbida en mezclas de concreto.

Mezcla 1 2 3 4 5

1 551.00 595.00 639.00 417.00 563.00 553

2 457.00 580.00 615.00 449.00 631.00 546.4

3 450.00 508.00 511.00 517.00 522.00 501.6

4 731.00 583.00 573.00 438.00 613.00 587.6

5 499.00 633.00 648.00 415.00 656.00 570.2

6 632.00 517.00 677.00 555.00 679.00 612

Total 3320.00 3416.00 3663.00 2791.00 3664.00 3370.8 16854.0

553.33 569.33 610.50 465.17 610.67 561.80


Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17
553.33
569.33
569.33
610.5
610.5
610.67
610.67

Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17 145.5 145.33 104.16 88.16
553.33
553.33 57.34
57.34 57.17
57.17 16
16
569.33
569.33 41.34
41.34 41.17
41.17
610.5
610.5 0.17
0.17
610.67
610.67
Datos Formulas

H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
H1: Al menos dos no son
significativas.
No. De comparaciones=

Sustitucion Grado de Valor de


Se interpola el valor
con el grado de Libertad Tablas
libertad 25 24 4.17
25 X
30 4.11

 
Comparando el resultado con q
 • Condición
• Tras obtener el resultado de q, si una media es <q se considera igual, si es >q se
considera diferente
Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17 145.5 145.33 104.16 88.16
553.33 57.34 57.17 16
569.33 41.34 41.17
610.5 0.17 Media Igual
610.67 Media Diferente

• Conclusión
• Se rechaza la hipótesis nula , las medias no son iguales. Se acepta , las diferencias
de medias y son diferentes
Prueba de Duncan
• El Test de Duncan es un test de comparaciones múltiples.
Permite comparar las medias de los t niveles de un factor
después de haber rechazado la Hipótesis nula de igualdad de
medias mediante la técnica ANOVA. Todos los test de
comparaciones múltiples son test que tratan de perfilar, tratan
de especificar, tratan de concretar, una Hipótesis alternativa
genérica como la de cualquiera de los Test ANOVA.

• Bibliografía:
https://estadisticaorquestainstrumento.wordpress.com/2013/
01/28/test-de-duncan/
• Planteamiento
• Suponga que un experimento industrial un ingeniero está interesado en cómo la absorción
media de humedad en concreto varía entre cinco mezclas diferentes de concreto. Las
muestras se exponen a la humedad por 48 horas y se decide que se prueben seis muestras
para cada mezcla, por lo que se requiere probar un total de 30 muestras. Los datos de este
experimento se muestran en la siguiente tabla.

 Humedad absorbida en mezclas de concreto.

Mezcla 1 2 3 4 5

1 551.00 595.00 639.00 417.00 563.00 553

2 457.00 580.00 615.00 449.00 631.00 546.4

3 450.00 508.00 511.00 517.00 522.00 501.6

4 731.00 583.00 573.00 438.00 613.00 587.6

5 499.00 633.00 648.00 415.00 656.00 570.2


Bibliografía:
6 632.00 517.00 677.00 555.00 679.00 612

Total 3320.00 3416.00 3663.00 2791.00 3664.00 3370.8 16854.0 Libro: Introducción a la
probabilidad y estadística.
553.33 569.33 610.50 465.17 610.67 561.80 Autor: William mendenhall.
Analisis de Varianza para la clasificacion unilateral
Fuente de Suma de Grados de Cuadrados Calculada
Variación Cuadrados libertad de medios
Tratamiento 8536.6 4 21339.15 F=4.30
s
Error 124021 25 4960.84
Total 209377 29 26299.99
Mezcla

1 553.33

2 569.33

3 610.5

4 465.17

5 610.67
Datos Formulas

H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
H1: Al menos dos no son
significativas.

Se entra con la Tabla de rangos Sustitucion


estudentizados

γ P
2 3 4 5
24 2.919 3.066 3.16 3.226
25 2.9125 3.060 3.155 3.221
30 2.88 3.035 3.131 3.199
Se interpola los valores del 25*
Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17
Se compara con
553.33
Se compara con
569.33 Condición
Se compara con Si el valor de Rp es menor que
610.5 el valor de la diferencia de
Se compara con medias, estas medias son
610.67 diferentes

Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17 145.5 > 92.61 145.33 > 90.7 104.16 > 87.98 88.16 > 83.74
553.33 57.34 < 90.71 57.17 < 87.98 16 < 83.74
569.33 41.34  
41.34 <
< 87.98
87.98 41.17
41.17 <
< 83.74
83.74
610.5 0.17 < 83.74
0.17 < 83.74
610.67 Media Diferente
Media Igual
Planteamiento mediante bloques
aleatoriosTiempo en segundos para ensamblar un producto
Máquina Operador 1 2 3 4 5 6 Total Medias
1 42.5 39.3 39.6 39.9 42.9 43.6 247.8 41.3
2 39.8 40.1 40.5 42.5 42.5 43.1 248.5 41.42
3 40.2 40.5 41.3 43.4 44.9 45.1 255.4 42.57
4 41.3 42.2 43.5 44.2 45.9 42.3 259.4 43.23
Total 163.8 162.1 164.9 170 176.2 174.1
Medias 40.95 40.525 41.225 42.5 44.05 43.525

Fuente de Suma de Grados de Cuadrado F


Variación Cuadrado Libertad Medio calculada
s
Máquinas 15.93 3 5.31 3.34
Operadores 42.09 5 8.42
Error 23.84 15 1.59
Total 81.86 23
Valor Critico Formula Sustitución Valor Critico
TABLA PUNTOS
PORCENTUALES

Conclusión

Se rechaza la hipótesis nula . En el valor critico de 0.05 se acepta que al menos


una maquina no trabaja a la misma velocidad que las demás.
Prueba de Tukey Máquina Medias
1 41.3
2 41.42
3 42.57
Diferencia de
Medias 43.23 42.57 41.42 41.43 4 43.23

41.3
41.42
41.42
42.57
42.57
43.23
43.23

Diferencia de
Medias 43.23 42.57 41.42 41.43
41.3 1.93 1.27 0.12
41.42
41.42 1.81
1.81 1.15
1.15
42.57
42.57 0.66
0.66
43.23
43.23
Datos Formulas

H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
H1: Al menos dos no son
significativas.
No. De comparaciones=

Sustitucion
Comparando el resultado con q
 • Condición
• Tras obtener el resultado de q, si una media es <q se considera igual, si es >q se
considera diferente
Diferencia de
Medias 43.23 42.57 41.42 41.43
41.3 1.93 1.27 0.12
41.42 1.81 1.15
42.57 0.66
43.23 Media Igual
Media Diferente

• Conclusión
• Con el resultado arrojado por la prueba de Tukey, obtuvimos que todas las medias
eran iguales.
Tiempo en segundos para ensamblar un
producto (Duncan)
Máquina Operador 1 2 3 4 5 6 Total Medias
1 42.5 39.3 39.6 39.9 42.9 43.6 247.8 41.3
2 39.8 40.1 40.5 42.5 42.5 43.1 248.5 41.42
3 40.2 40.5 41.3 43.4 44.9 45.1 255.4 42.57
4 41.3 42.2 43.5 44.2 45.9 42.3 259.4 43.23
Total 163.8 162.1 164.9 170 176.2 174.1
Medias 40.95 40.525 41.225 42.5 44.05 43.525

Fuente de Suma de Grados de Cuadrado F


Variación Cuadrado Libertad Medio calculada
s
Máquinas 15.93 4 5.31 3.34
Operadores 42.09 5 8.42
Error 23.84 15 1.59
Total 81.86 23
Datos Formulas
H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
H1: Al menos dos no son
significativas.

Se entra con la Tabla de rangos Sustitucion


estudentizados

γ P
2 3 4
15 3.014 3.16 3.25
Diferencia de
Medias 43.23 42.57 41.42 41.43
41.3

41.42 Condición
Si el valor de Rp es menor que
42.57 el valor de la diferencia de
medias, estas medias son
43.23 diferentes

Diferencia de Medias
43.23 42.57 41.42 41.43
41.3 1.93>1.67 1.62<1.89 0.12<1.55
41.42 1.81>1.62 1.15<1.55
42.57 0.66<1.55  
43.23
Media Diferente
Media Igual
 

• Conclusion
• Aplicando la prueba de Duncan, comparando diferencias de medias
obtuvimos el resultado donde las medias son diferentes, por lo tanto dos
maquinas operan a diferente velocidad
 Tipo de propulsor
Sistem
a de
Misil Análisis de Varianza
34
32.7
30.1
32.8
29.8
26.7
29
28.9
para el experimento de
32 30.2 28.7 27.6 dos factores con n
33.2 29.8 28.1 27.8
28.4 27.3 29.7 28.8  
replicas
29.3 28.9 27.3 29.1

En un experimento realizado
para determinar cuál de 3
sistemas de misiles distintos es Tasas de consumo de los propulsores En donde;
preferible, se midió la tasa de Sistem n=2 (Datos pro
Tipo de
combustión del propulsor para a de Total celda)
propulsor a=3 (misiles)
24 arranques estáticos. Se Misil
emplearon 4 tipos de 66.7 62.9 56.5 57.9 244 b=4 (propulsores)
combustible diferentes y el 65.2 60 56.8 55.4 237.4
experimento generó 57.7 56.2 57 57.9 228.8
observaciones duplicadas Total 189.6 179.1 170.3 171.2  710.2
de las tasas de combustión para Medias 31.6 29.85 28.38 28.53  
cada combinación de los
tratamientos. Es necesario realizar las siguiente tabla para poder resolver el problema.
Tabla ANOVA para dos criterios
Analisis de Varianza para la clasificacion unilateral
Fuente de Suma de Grados de Cuadrados de Calculada
Variación Cuadrados libertad medios
A SSA
B SSB
AB
B SS(AB)
SSB ()
Error SSE )
Total
AB SAT
SS(AB)

Error SSE

Total SAT
Suma de Cuadrados de A

Tasas de consumo de los propulsores


Tipo de
Sistema
propulso Total
de Misil
r
66.7 62.9 56.5 57.9 244
65.2 60 56.8 55.4 237.4
57.7 56.2 57 57.9 228.8
Total 189.6 179.1 170.3 171.2  710.2
n
Medias 31.6 29.85 28.38 28.53  
T i 1
2
 710.2 2

168,244.2 710.22
a SSA    14.52
T
i 1
i
2
 2442  237.42  228.82  168,244.2 (4)(2) (3)(4)(2)

SSA 14.52
s 
2
1 s 
2
 7.26
a 1 1
2
Suma de Cuadrados de B

Tasas de consumo de los propulsores


Sistem Tipo de
b
a de propulso Total
T
j 1
j
2
 189.6  179.1  ...  171.2  126,336.5
2 2 2
Misil r
66.7
66.7 62.9
62.9 56.5
56.5 57.9
57.9 244
244
n 65.2
65.2 60
60 56.8
56.8 55.4
55.4 237.4
237.4
 T 2
 710.2 2
Total
57.7
57.7
189.6
56.2
56.2
179.1
57
57
170.3
57.9
57.9
171.2
228.8
228.8
 710.2
i 1 Total 189.6 179.1 170.3 171.2  710.2
126,336.5 710.22 Medias
Medias 31.6
31.6 29.85
29.85 28.38
28.38 28.53
28.53   
SSB    40.08
(3)(2) (3)(4)(2)

SSB
s 
2
2 s 
2 40.08
 13.36
b 1 2
3
Suma de Cuadrados de AB

Tasas de consumo de los propulsores

Sistema Tipo de
de Misil propulsor
Total

66.7 62.9 56.5 57.9 244


65.2 60 56.8 55.4 237.4
57.7 56.2 57 57.9 228.8
n Total 189.6 179.1 170.3 171.2  710.2
 T 2  710.22
i 1 Medias 31.6 29.85 28.38 28.53  
b

T
j 1
j
2
 189.62  179.12  ...  171.22  126,336.5
a

T
i 1
i
2
 2442  237.42  228.82  168,244.2

SS ( AB) 22.16
 ij
T 2
 66.7 2
 65.2 2
 ...  57.9 2
42,185.54 s 
2
3
s 
2
3  3.69
(a  1)(b  1) (2)(3)
42,185.54 168244.2 126,336.5 504,384.04
SS ( AB)      22.16
2 8 6 24
Suma de Cuadrados Totales

b a n

 y
i 1 j 1 k 1
2
ijk 342  32.72  322  ...  29.12  21,107.68

n   710.22
𝑆𝑆𝑇 =21,107.68 −

=91.67
T 2
 710.2 2
24
i 1

 Tipo de propulsor
Sistema de
Misil
34 30.1 29.8 29
32.7 32.8 26.7 28.9
32 30.2 28.7 27.6
33.2 29.8 28.1 27.8
28.4 27.3 29.7 28.8
29.3
29.3 28.9
28.9 27.3
27.3 29.1
29.1
Suma del Error

SSE  SST  SSA  SSB  SS ( AB)


𝑆𝑆𝐸=91.67
  −14.52− 40.08 − 22.16=14.91

168,244.2 710.22 126,336.5 710.22


SSA    14.52 SSB    40.08
(4)(2) (3)(4)(2) (3)(2) (3)(4)(2)

42,185.54 168244.2 126,336.5 504,384.04


SS ( AB)      22.16
2 8 6 24

SSE   2 14.91   710.22


s 
2
𝑆 = =1.24 𝑆𝑆𝑇 =21,107.68 − =91.67
ab(n  1) (3)( 4)(2− 1) 24
F calculada
s12 14.52 𝑓  1=
7.26
f1  2 s 
2
1  7.26 1.24
=5.84
s 2

s22 40.08  𝑓 = 13.36 =10.77


f2  2 s 
2
2  13.36 2
1.24
s 3
22.16 3.7
s32 s 
2
 3.69 𝑓  3= =2.98
f3  2 3
(2)(3) 1.24
s

26.75
s 
2
 2.22
12
Tabla ANOVA para dos criterios
Fuente Suma de Grados de Cuadrado
Calculada
varianza cuadrados libertad s medios

A SSA= 14.52 3-1=2 𝑺𝟐𝟏 = 7.26 𝒇𝟏 = 5.84

B SSB= 40.08 4-1 =3 𝑺𝟐𝟐 = 13.36 𝒇𝟐 = 10.77

AB SS(AB)= 22.16 (3-1)(4-1) =6 S23 = 3.69 𝒇𝟑 = 2.98

ERROR SSE= 14.91 (3)(4)(2-1)= 12 𝑺𝟐 = 1.24

Total SST = 103.51 23


A B C
2 3 6

3.89 3.49 3.00


12
12 12
12 12
12

5.84>3.89 10.77>3.49
2.98<3
Se rechaza H0 Se rechaza
Se acepta H0
H0

Valor Critico Formula Sustitución Valor


Critico
Se entra con tablas de 2
distribución f
6
Condicion:

La hipótesis nula se
rechaza cuando
Conclusión
• Al menos una de las
  es diferente de cero

PRUEBA DE KRUSTAL-WALLIS
 Tipo de propulsor
Sistem
El primer paso consiste en
a de
Misil ordenar los datos de menor a
34 30.1 29.8 29 𝑯𝟎: µ𝟏 = µ𝟐 … … . = µ4 mayor y darles un rango. Si los
32.7 32.8 26.7 28.9 𝑯𝟏: µ𝟏 ≠ µ𝟐 … … . ≠ µ4 valores se repiten, se saca la
media entre los rangos. Tal y
32 30.2 28.7 27.6
como se hizo en las pruebas de
33.2 29.8 28.1 27.8
Suma de Rangos
28.4 27.3 29.7 28.8
29.3 28.9 27.3 29.1 En estadística, la prueba de Kruskal-
Wallis (de William Kruskal y W. Allen
Wallis) es un método no paramétrico
para probar si un grupo de datos
proviene de la misma población.
Bibliografía
Ya que es una prueba no paramétrica,
https://es.slideshare.net/Jaime
la prueba de Kruskal-Wallis no asume
IncaGuerrero/anova-prueba-
normalidad en los datos.
de-krustal-wallis
https://es.wikipedia.org/wiki/Prueba_
de_Kruskal-Wallis
Rangos
 Tipo de propulsor
Sistem
a de
Misil
34 24 30.1 18 29.8 16.5 29 12
32.7 21 32.8 22 26.7 1 28.9 10.5
32 20 30.2 19 28.7 8 27.6 4
33.2 23 29.8 16.5 28.1 6 27.8 5
28.4 7 27.3 2.5 29.7 15 28.8 9
29.3 14 28.9 10.5 27.3 2.5 29.1 13
Total 109 88.5 49 53.5
Una vez ordenados
n los valores y darles

i
R 2

i 0
 109 9
 88.5 2
 ...  53.5 2
 24,976.5 un rango, sustituir
el valor por el
rango dado y hacer
una sumatoria por
cada columna.
Datos
N=24
n=6

Formula Sustitucion
Tabla de Distribución de chi cuadrada Conclusión
  0.025 0.975 Conclusión
La hipótesis nula se acepta, por lo tanto se dice que a un nivel de
3 9.348 3 0.216 significancia de 0.05 no existe diferencia en los niveles por el uso de
propulsores.

Gráfica
 

  0.216   8.255   9.348

Libro: Introducción a la probabilidad y estadística.


Autor: William mendenhall
Kruskal-Wallis
• Planteamiento Calculadoras

• Los siguientes datos representan los tiempos de A B C

operación en horas para tres tipos de calculadoras 4.9 5.5 6.4


científicas de bolsillo antes de que requieran 6.1 5.4 6.8
recarga. 4.3 6.2 5.6

• Utilice la prueba de Kruskal-Wallis, en el nivel de 4.6 5.8 6.5


significancia de para probar la hipótesis de que 5.3 5.5 6.3
los tiempos de operación para las tres 5.2 6.6
calculadoras son iguales
4.8
𝑯𝟎: µ𝟏 = µ𝟐 … … . = µ4
𝑯𝟏: µ𝟏 ≠ µ𝟐 … … . ≠ µ4
Rangos
Calculadoras
A B C  𝑛 2 2
𝑅
∑ 𝑖 =¿ 25 =625 ¿
4.9 4 5.5 8.5 6.4 15 𝑖=1
6.1 12 5.4 7 6.8 18 𝑛
 
4.3 1 6.2 13 5.6 10 ∑ 𝑅 2𝑖 =¿562 =3136 ¿
𝑖=1
4.6 2 5.8 11 6.5 16  𝑛
2 2
5.3 6 5.5 8.5 6.3 14 ∑ 𝑅 𝑖 =¿90 =8100 ¿
𝑖=1
5.2 5 6.6 17
4.8 3
25 56 90
Datos Formula
N=18
n=5,6,7

Sustitucion
Tabla de Distribución de chi cuadrada Conclusión
  0.005 0.995 Conclusión
En un nivel de significancia de 0.01 se comprobó que los tiempos
2 10.597 2 0.01 de operación para las tres calculadores son iguales

Gráfica
 

  0.01  6.3266  10.597

Libro: Introducción a la probabilidad y estadística.


Autor: William mendenhall
PLANTEAMIENTO (ejemplo 2)

Se tienen tres especies de cítricos a los cuales se mide la razón entre el área de las hojas y el peso
seco, bajo 3 condiciones de sombra (sol, semisombra y sombra).

Encuentre si existe una diferencia entre los valores obtenidos con una significancia del 5%
ANÁLISIS DE VARIANZA PARA UN CRITERIO
POR BLOQUES

Naranj Pomel Mandarina Totales


a o H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
SOL 112 90 123 325 H1: Al menos dos no son
SEMISOMBRA 86 73 89 248 significativas.
SOMBRA 80 62 81 223 Donde:
Total 278 225 293 796 a=3
b=3
N=9
SUMA DE CUADRADOS TOTAL

Naranj Pomel Mandarina Totales


a o
SOL 112 90 123 325
SEMISOMBRA 86 73 89 248
SOMBRA 80 62 81 223
Total 278 225 293 796

  y 
2
2 Y
SSA  ij 
i j
N
2
796
SSA  (1122  862  ...  812 )   2,822.23
9
SUMA DE CUADRADOS DEL TRATAMIENTO

Naranj Pomel Mandarina Totales


a o
SOL 112 90 123 325
SEMISOMBRA 86 73 89 248
2
1 Y
SSA   i yi 
2 SOMBRA 80 62 81 223
Total 278 225 293 796
a N
1 796 2
SSA
SSA  (3252  2482  2232 )   1,884.23 S  1
2
3 9 k 1

1884.23
S 
1
2
 942.115
2
SUMA DE CUADRADOS DEL BLOQUE

Naranj Pomel Mandarina Totales


2
1 Y a o
SSB   j y j 
2
SOL 112 90 123 325
b N
SEMISOMBRA 86 73 89 248
SOMBRA 80 62 81 223
Total 278 225 293 796

2
1 796
SSB  (2782  2252  2932 )   850.89 SSB
3 9 S  2
2
k 1

850.89
S  2
2  425.44
2
SUMA DE CUADRADOS DEL ERROR

Naranj Pomel Mandarina Totales


a o
SSE  SST  SSA  SSB SOL 112 90 123 325
SEMISOMBRA 86 73 89 248
SOMBRA 80 62 81 223
2 Total 278 225 293 796
796
SSA  (112  86  ...  81 ) 
2 2 2
 2,822.23 SSE
9 S32 
1 796 2 (b  1)(a  1)
SSA  (3252  2482  2232 )   1,884.23
3 9 2 87.11
1 796 S 
2
 9.67
SSB  (278  225  293 ) 
2 2 2
 850.89 3
9
3 9
S12 942.11
SSE  2822.23  1884.23  850.89  87.11 f  2   97.42
S3 9.67
Fuente de Suma de Grados de Cuadrados medios
Calculada
varianza cuadrados libertad

Tratamientos 𝑺𝑺𝑨 = 1884.23 2 𝑺𝟐𝟏 = 942.11

 Bloques  SSB = 850.89  2 𝑺𝟐𝟐 = 425.44


𝒇 = 97.42
Error 𝑺𝑺𝑬 = 87.11 4 𝑺𝟐 3= 9.67  

Total 8
𝑺𝑺𝑻 = 2822.23
TOMA DE DECISIÓN
La hipótesis nula H0 se rechaza en el nivel de significancia
 tabla de distribución F: cuando
 γ1
2
4 6.94 97.42  6.94
  =4.94 CONCLUSIÓN
Se rechaza H0, por lo menos 2 de los tamaños
si varían.

BIBLIOGRAFÍA
Libro: Estadística
Autor: Murray R. Spiegel
PRUEBA DE TUKEY

Sirve para probar todas las diferencias entre las medidas de tratamientos de un experimento es decir cuando
H0 ha sido rechazada. La única exigencia es que el número de repeticiones sea constante en todos los
tratamientos. Sirve para comprobar las medidas de los tratamientos dos a dos.
Ahora para realizar la prueba de Tukey utilizamos las medias de cada muestra ordenadas de menor a mayor ,
las cuales pondremos a continuación:

Naranja Pomelo Mandarina Totales Medias


SOL 112 90 123 325 108.33
SEMISOMB 86 73 89 248 82.66
RA
SOMBRA 80 62 81 223 74.33
Total 278 225 293 796

M1 M2 M3
108.33 82.66 74.33
APLICACIÓN DE LA FORMULA TABLA PUNTOS
PORCENTUALES DE RANGOS
ESTUDENTIZADOS
Después aplicamos la fórmula de la ley de Tukey la cual es la
siguiente:
1
2
3

4 6.50

Fuente de Suma de Grados de Cuadrados medios


varianza cuadrados libertad
Calculada
SUSTITUCIÓN

𝑺𝑺𝑨 = 1884.23 𝑺𝟐𝟏 =


Tratamientos 2
9.67 942.11
q  6.5  11.66
3  Bloques  SSB = 850.89  2
𝑺𝟐𝟐 = 425.44
𝒇 = 97.42
Error 𝑺𝑺𝑬 = 87.11 4 𝑺 3= 9.67
𝟐  

Total 𝑺𝑺𝑻 = 2822.23 8


OBTENCIÓN DE MEDIAS DIFERENTES
Comparaciones = k(k-1)/2
Comparaciones = 3(3-1)/2 = 3

M1 M2 M3
108.33 82.66 74.33

M1
108.33
M2
82.66
M3
74.33 q  11.66
M3 74.33 34 8.33 - Si q es menor que el valor
de la diferencia de las
M2 82.66 25.37 -
medias, las medias son
M1 108.33 - diferentes.

M1 M2 M3
108.33 82.66 74.33 Se puede concluir que hay una variación
entre las siguientes medias con una
M3 74.33 34 8.33 -
significancia mayor al 0.5
M2 82.66 25.37 -
M1 108.33 - • M1-M3
• M1-M2
PRUEBA DE DUNCAN

Este procedimiento se basa en la noción general de un rango utilizado. El rango de cualquier subconjunto
de p medias muéstrales debe exceder cierto valor antes de que encuentre que cualquiera de las p medias
es diferente. Este valor se llama rango de menor significancia para las p medias y se denota como Rp.

Los siguientes datos se obtienen de la tabla de la prueba de Duncan con una


significancia del .05 y 4 grados de libertad.

M1 M2 M3
108.33 82.66 74.33

S22 rp= Es el dato obtenido de la tabla


D  rp
n
SUSTITUCIÓN

Se procede a realizar los cálculos para cada uno de los rangos.

Tabla de Duncan (Rangos


estandarizados para rp)
2
S 2 3
D  rp 2
3.92 4.01
n
Fuente de Suma de Grados de Cuadrados medios
varianza cuadrados libertad Calculada

9.67 𝑺𝟐𝟏 =
D2  3.92  7.03 Tratamientos 𝑺𝑺𝑨 = 1884.23 2
942.11

3  Bloques  SSB = 850.89  2 𝑺𝟐𝟐 = 425.44


𝒇 = 97.42
Error 𝑺𝑺𝑬 = 87.11 4 𝑺 3= 9.67
𝟐  

9.67
D3  4.01  7.19 Total 𝑺𝑺𝑻 = 2822.23 8

3
Si el valor de D es menor que el
valor de la diferencia de medias,
estas medias son diferentes

Método de Comparación Comparación de Medias


M1 M2 M3 M1 M2 M3

145.6 142 129 108.33 82.66 74.33


M 128 D3 D2 - M3 74.33 34 8.33 -
3
M2 82.66 25.37 -
M 128 D2 -
2 M1 108.33 -
M1 128.3 -
Se puede concluir que hay una variación
entre las siguientes medias con una
significancia mayor al 0.5
D2=7.03
M1-M3
D3=7.19 M1-M2
M2-M3
ANÁLISIS DE VARIANZA PARA UN CRITERIO POR NO
BLOQUES
PLANTEAMIENTO (ejemplo 2)

Se realizan 3 pruebas de la resistencia a la compresión en seis muestras de tubo de acero 2-20. La


fuerza que fractura cada muestra esta medida en pascales y está dada en la siguiente tabla:

1 2 3 4 5 6

127 126 130 139 128 140

129 130 128 138 127 137

128 128 129 145 130 150

Realice el análisis de variancia a nivel de significancia de .05, e identifique si las


resistencias promedio a la compresión difieren o no significativamente para las 6
máquinas.
TABLA ANOVA H0: µ1 = µ2 = µ3 = µ4
= µ 5 = µ6
Fuente de Suma de cuadrados Grados de Cuadrados
H1: Al menos dos no
Calculada
varianza libertad medios son significativas.

Maquinas K-1
Donde “k” es igual al
número de muestras
Error 𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝐴 k(n-1)
𝒌=𝟔
Donde “n” es igual al
número de pruebas
Total nk-1 𝒏=𝟑
    MUESTRAS    
1 2 3 4 5 6

127 126 130 145 128 150


129 130 128 140 127 137

128 128 129 141 130 150

total 384 384 387 426 385 437 2403

media 128 128 129 142 128.3 145.6 800.9


SUMA DE CUADRADOS TOTAL

    MUESTR    
AS

 T
2 1 2 3 4 5 6
k n 127 126 130 145 128 150
SST   y
i j ij
2
ij  129 130 128 140 127 137
i 0 j 0 nk 128 128 129 141 130 150

 T 
total 384 384 387 426 385 437 2403
  2403
2 2
i j ij media 128 128 129 142 128. 145.6 800.9
3

k n

 ij
y 2
 127
i 0 j 0
2
 129 2
 128 2
 ...  150 2
 321927

24032
SST  321927   1126.5
18
SUMA DE CUADRADOS DEL TRATAMIENTO

SSA  
k
Ti 2

 
i
T  j ij
2  
1
 
2
MUESTRAS

3 4
 
5
 
6

i 0 k nk 127 126 130 145 128 150

 T 
129 130 128 140 127 137

  2403
2 2
128 128 129 141 130 150
i j ij

k total 384 384 387 426 385 437 2403

i
T
i
2
 384 2
 384 2
 ...  437 2
 965351 media 128 128 129 142 128.3 145.6 800.9

SSA
965351 24032 S  1
2

SSA    983.16 k 1
3 18
983.16
S 
1
2
 196.63
5
SUMA DE CUADRADOS DEL ERROR

    MUESTRA    
S

SSE  SST  SSA 1


127
2
12
6
3
130
4
145
5
128 150
6

129 13 128 140 127 137

24032 0

SST  321927   1126.5 128 12


8
129 141 130 150

18 total 384 38 387 426 385 437 2403


4
2 media 128 12 129 142 128. 145.6 800.9
965351 2403 8 3
SSA    983.16 SSE
3 18 S 
2
2 S 
143.34
2
 11.94
k (n  1) 2
12
SSE  1126.5  983.16  143.34 S12 196.63
f  2   16.46
S1 11.94
TABLA ANOVA PARA UN CRITERIO

Fuente de Suma de Grados de Cuadrados


varianza cuadrados libertad medios Calculada

Maquinas 𝑺𝑺𝑨 = 983.16 5 𝑺𝟐𝟏 =196.63


𝒇 = 16.46
Error 𝑺𝑺𝑬 = 143.34 12 𝑺𝟐𝟐 = 11.94  

Total
𝑺𝑺𝑻 = 1126.5
17
Tabla valores
TOMA DE DECISIÓN
críticos de la La hipótesis nula H0 se rechaza en el nivel de significancia
distribución f cuando
 γ1

12
5
3.11
16.46  3.11
  =3.11 CONCLUSIÓN
Se rechaza H0, las resistencias si varían, por lo
menos 2.

BIBLIOGRAFÍA
Libro: Estadística
Autor: Murray R. Spiegel
PRUEBA DE TUKEY
Sirve para probar todas las diferencias entre las medidas de tratamientos de un experimento es decir cuando
H0 ha sido rechazada. La única exigencia es que el número de repeticiones sea constante en todos los
tratamientos. Sirve para comprobar las medidas de los tratamientos dos a dos.
Ahora para realizar la prueba de Tukey utilizamos las medias de cada muestra ordenadas de menor a mayor ,
las cuales pondremos a continuación:

       
MUESTR
A
1 2 3 4 5 6
𝑴́𝟏 𝑴́
𝟐 𝑴́
𝟑 𝑴́
𝟒 𝑴́𝟓 𝑴́𝟔
Media 128 128 129 142 128.3 145.6 800.9
TABLA PUNTOS
APLICACIÓN DE LA FORMULA PORCENTUALES DE RANGOS
ESTUDENTIZADOS

Después aplicamos la fórmula de la ley de Tukey la cual


es la siguiente: 1
2
6

12 3.00

Fuente de Suma de Grados de Cuadrados medios


varianza cuadrados libertad
Calculada

SUSTITUCIÓN
𝑺𝑺𝑨 = 983.16

11.94 Maquinas 5 𝑺𝟐𝟏 =196.63

q3  5.98 𝒇 = 16.46


3 Error 𝑺𝑺𝑬 = 143.34 12 𝑺 = 11.94
𝟐
𝟐  

𝑺𝑺𝑻 = 1126.5
Total 17
OBTENCIÓN DE MEDIAS DIFERENTES

𝑴́𝟏 𝑴́𝟐 𝑴́𝟑 𝑴́𝟒 𝑴́𝟓 𝑴́𝟔


128 128 129 142 128.3 145.6

M6 M4 M3 M5 M2 M1
145.6 142 129 128.3 128 128
M1
M2
128
128
17.6*
17.6*
14*
14*
1
1
0.3
0.3
0
-
-
-
q  5.98
M5 128.3 17.3* 13.7* 0.7 - - -
Si q es menor que el valor
M3 129 16.6* 13* - - - - de la diferencia de las
M4 142 3.6 - - - - - medias, las medias son
diferentes.
M6 145.6 - - - - - -

CONCLUSIÓN • M6-M1
Se puede concluir que hay una variación entre • M6-M2
las siguientes medias con una significancia • M6-M5 • M4-M1
mayor al 0.5 • M6-M3 • M4-M2
• M4-M5
PRUEBA DE DUNCAN

Este procedimiento se basa en la noción general de un rango utilizado. El rango de cualquier subconjunto
de p medias muéstrales debe exceder cierto valor antes de que encuentre que cualquiera de las p medias
es diferente. Este valor se llama rango de menor significancia para las p medias y se denota como Rp.

𝑴́𝟏 𝑴́𝟐 𝑴́𝟑 𝑴́𝟒 𝑴́𝟓 𝑴́𝟔


128 128 129 142 128.3 145.6

S22 rp= es el dato obtenido de la tabla


D  rp
n
SUSTITUCIÓN

Se procede a realizar los cálculos para cada uno de los rangos.

11.94
S 2 D5  3.36  6.68
D  rp 2 3
n 11.94
D6  3.40  6.76 TABLA DE VALORES ESTUDENTIZADOS DE
3 Rp
11.94
D2  3.06  6.10 2 3 4 5 6
3 D2=6.10 3.06 3.29 3.33 3.36 3.40
11.94 D3=6.54
D3  3.29  6.54 D4=6.62
3 D5=6.68
11.94 D6=6.76
D4  3.33  6.62
3
M6 M4 M3 M5 M2 M1 D2=6.10
145.6 142 129 128. 128 128 D3=6.54
3
D4=6.62 Si el valor de D es menor que el
M1 128 D6 D5 D4 D3 D2 -
D5=6.68 valor de la diferencia de medias,
M 128 D5 D4 D3 D2 - -
2 D6=6.76 estas medias son diferentes
M 128.3 D4 D3 D2 - - -
5
M 129 D3 D4 - - - -
CONCLUSIÓN
3
Se puede concluir que hay
M 142 D2 - - - - - una variación entre las
4
siguientes medias con una
M 145.6 M6
- -M4 -M3 - M5 - M2 - M1 significancia mayor al 0.5
6 145.6 142 129 128. 128 128
3
• M6-M1
M 128 17.6* 14* 1 0.3 0 - • M6-M2
1
• M6-M5
M 128 17.6* 14* 1 0.3 - - • M6-M3
2
M 128.3 17.3* 13.7* 0.7 - - - • M4-M1
5
• M4-M2
M 129 16.6* 13* - - - - • M4-M5
3
• M4-M3
M 142 3.6 - - - - -
ANÁLISIS DE VARIANZA PARA DOS
CRITERIOS
PLANTEAMIENTO (ejemplo 2)
ANÁLISIS DE VARIANZA PARA DOS CRITERIOS
Suponga que usted haya experimentado con levadura para una receta de panes dulces. Parece ser
que la cantidad de azúcar y la temperatura del agua afectan el tamaño de los panes. Basándose en
los siguientes datos, usted realiza un análisis de varianza para averiguar lo que es significativo de
estas recetas.

Tamaño de los panes dulces


Levadura:
Agua Fría Agua Tibia Agua caliente
76 87 60
Poco azúcar
75 85 55
70 79 52
Mucho azúcar
69 78 50
Tabla de sumas y medias. Y Tabla de sumas por grupos.

  B1 B2 B3  
76 87 60  
A1
75 85 55  
70 79 52  
A2
69 78 50 TOTAL
TOTAL 290 329 217 836
MEDIAS 72.5 82.25 54.25 209

  B1 B2 B3 TOTAL
A1 151 172 115 438
A2 139 157 102 398
TOTAL 290 329 217  
 Planteamiento

1. El Factor A no influye o afecta al tamaño de los panes


El Factor A influye o afecta al tamaño de los panes
El Factor B no influye o afecta al tamaño de los panes
El Factor B influye o afecta al tamaño de los panes
3. No hay efecto de interacción
Sí hay efecto de interacción
TABLA ANOVA PARA DOS CRITERIOS

Fuente de Suma de Grados de


Cuadrados Medios Calculada
Variación Cuadrados Libertad

A SSA a-1

B SSB b-1

AB SS(AB) (a-1)(b-1)

Error SSE ab(n-1)  

Total SST abn-1    


 
Suma de cuadrados Cálculos (Fórmulas y Sustitución)

  B1 B2 B3 TOTAL
A1 151 172 115 438
A2 139 157 102 398
TOTAL 290 329 217  

  B1 B2 B3  
76 87 60  
A1
75 85 55  
70 79 52  
A2
69 78 50 TOTAL
TOTAL 290 329 217 836
MEDIAS 72.5 82.25 54.25 209
SUSTITUCIÓN
 
SUSTITUCIÓN

𝑎 𝑏 𝑛 2
 
𝑆𝑆𝑇 = ∑
𝑎 𝑏

∑∑
𝑛
2
𝑦 𝑖𝑗𝑘 −
(∑ ∑ ∑ )
𝑖=1 𝑗 =1 𝑘 =1
𝑦 𝑖𝑗𝑘
=60 010 −
698 896
=1768.66
𝑖=1 𝑗=1 𝑘 =1 𝑎𝑏𝑛 (2) (3) (2)

𝑆𝑆𝐸=𝑆𝑆𝑇
  − 𝑆𝑆𝐴 − 𝑆𝑆𝐵 − 𝑆𝑆 ( 𝐴𝐵 ) =1768.66 −133.33 −1 616.16 −1.16=18.01
 Cuadrados Medios
  Calculada
Tabla Valores Críticos de la Distribución F
Resultados en Tabla ANOVA  

Fuente de Suma de Grados de Cuadrados


Variación Cuadrados Libertad Medios Calculada

1 2
A 1 5.99 5.14
6
B 2

AB 2

Error 6   ′
𝑯 :𝟓.𝟗𝟗
 
Total 11   𝒐(𝑨)
 Conclusiones:

 Se Rechaza . La cantidad de azúcar influye significativamente en el tamaño de los panes


dulces.
 Se Rechaza . La temperatura del agua influye significativamente en el tamaño de los panes
dulces.
 Se Acepta. Sí hay efecto de interacción entre la cantidad de azúcar y la temperatura del
agua. Es decir, el efecto de la cantidad de azúcar depende de cual sea la temperatura del
agua al momento de hacer los panes, afectando a su tamaño.
PRUEBA DE KRUSKAL-WALLIS
PROBLEMA 1
 PLANTEAMIENTO
Las medias de cada muestra son idénticas en términos del tamaño de pan
Por lo menos una de las medias no es idéntica en términos del tamaño del pan

  B1 RANGO B2 RANGO B3 RANGO


76 8 87 12 60 4
A1
75 7 85 11 55 3
70 6 79 10 52 2
A2
69 5 78 9 50 1
TOTAL 290 26 329 42 217 10
n 72.5 4 82.25 4 54.25 4
  12
𝑘
𝑅 𝑖2 12
2
26 42 10
2 2
𝐻 1= ∑
𝑛 ( 𝑛+1 ) 𝑖=1 𝑛𝑖
− 3 ( 𝑛+ 1 )= [
12 ( 12+1 ) 4
+
4
+
4 ] −3 ( 12+1 𝑯) 1=9.84
 
 Para obtener utilizamos Regla de decisión
la tabla de distribución ji cuadrada Si se rechaza la hipótesis nula
Se usa la tabla α Si se acepta la hipótesis nula
Como:
0.05

11 19.67

  Conclusión: Se acepta Ho. Las medias de cada muestra


  son idénticas en términos del tamaño de pan. Esto quiere
decir que provienen de muestras idénticas o “de la misma
población de panes”.

También podría gustarte