Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Matricula: 1752276
Hora: M3
4. Diseño de Experimentos
• Análisis de varianza para un criterio
• Planteamiento mediante bloques aleatorios
• Planteamiento mediante tabla ANOVA de un solo factor
• Prueba de Tukey
• Prueba de Duncan
• Análisis de Varianza para dos criterios
• Prueba de Kruskal-Wallis
Regresión lineal simple y correlación.
Regresión lineal simple y correlación.
Regresión Lineal
En estadística la regresión lineal es un modelo matemático usado para aproximar la
relación de dependencia entre una variable dependiente Y, las variables
independientes y un término aleatorio.
Correlación
La correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad
entre dos variables estadísticas. Se considera que dos variables están correlacionadas
cuando los valores de una de ellas varían sistemáticamente con respecto a los valores
homónimos de la otra.
Planteamiento de problema
INVERSIÓN , X RENDIMIENTO, Y
11 2
La información estadística obtenida de una muestra de tamaño 12 14 3
sobre la relación que existe entre la inversión realizada y el
16 5
rendimiento obtenido en cientos de miles de euros para la
explotación agrícola es la siguiente 15 6
16 5
18 3
20 7
21 10
14 6
20 10
19 5
11 6
Diagrama de flujo
Definición:
0
10 12 14 16 18 20 22
Bibliografía:
https://www.aiteco.com/que-es-un-diagrama-de-flujo/
Mejor estimación de la recta
Mejor estimación de la recta: Bibliografía:
12
10
0
10 12 14 16 18 20 22
X Y XY Ecuación de la recta
11 121 22 3.27
Fórmulas
2
14 196 3 42 4.62
16 256 5 80 5.52
15 225 6 90 5.07
16 256 5 80 5.52
18 324 3 54 6.42
20 400 7 140 7.32 Sustitución
21 441 10 210 7.77
14 196 6 84 4.62
20 400 10 200 7.32 • b
19 361 5 95 6.87
11 121 6 66 3.27
195 3297 68 1163 62.07
Error de la mejor estimación de la recta
Definición: Formulas: Y
2 3.27 1.61
El error estándar de estimación
3 4.62 2.62
mide la dispersión de los valores 5 5.52 0.27
6 5.07 0.86
observados alrededor de la línea de
5 5.52 0.27
regresión 3 6.42 11.69
Bibliografía: Sustitución:
7 7.32 0.10
Libro: inferencia estadística 2.03 10 7.77 4.97
Autor: Profesores UNAM
Editorial: PAPIPEM 6 4.62 1.9
10 7.32 7.18
Diagrama de Flujo
5 6.87 3.496
15
6 3.27 7.45
10
68 62.07 41.58
5
0
10 12 14 16 18 20 22
COEFICIENTE DE RELACIÓN DE PEARSON
X Y XY Definición:
11 121 2 4 22
14 196 3 9 42 Los coeficientes de correlación son medidas
16 256 5 25 80 que indican la situación relativa de los mismos
15 225 6 36 90 sucesos respecto a las dos variables, es decir,
16 256 5 25 80 son la expresión numérica que nos indica el
Bibliografía:
Libro: Estadística
Autor: Murray R. Spiegel
RELACIÓN ENTRE EL COEFICIENTE DE PEARSON Y SPEARMAN
Definición: Bibliografía: Inversión Rendimiento,
,X Y
En las variables podemos observar que son Libro: Introducción a la probabilidad y
estadística. 11 2
proporcionales en la mayoría.
Autor: William mendenhall. 14 3
Con estos datos se comprueba que la
correlación de Spearman es exactamente igual 16 5
al coeficiente de correlación de Pearson, 15 6
calculado sobre el rango de observaciones.
16 5
18 3
12 20 7
10 21 10
8 14 6
6 20 10
4 19 5
2 11 6
0
10 12 14 16 18 20 22
VARIANZA Y DESVIACIÓN ESTANDAR
Fórmula Sustitución Resultados
Bibliografía:
Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
n-2
Definición:
Desviación estándar:
La desviación es una medida de dispersión para variables de razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.
Varianza:
En teoría de probabilidad, la varianza de una variable aleatoria es una medida de dispersión definida como
la esperanza del cuadrado de la desviación de dicha variable respecto a su media.
COEFICIENTE DE DETERMINACIÓN
Y Definición Conclusión
2 3.27 13.44 1.61
Es un estadístico usado en el contexto de un modelo
3 4.62 7.11 2.62 estadístico cuyo principal propósito es predecir El resultado indica que el
5 5.52 0.44 0.27 futuros resultados o probar una hipótesis. 55.209% de los resultados
6 5.07 0.11 0.86 seguira siendo parecida a la
media, los datos pueden
5 5.52 7.11 0.27
Fórmula variar por muy poco
3 6.42 7.11 11.69
7 7.32 1.77 0.10
10 7.77 18.77 4.97
6 4.62 0.11 1.9 Bibliografía:
Sustitución
10 7.32 18.77 7.18
Libro: Introducción a la
5 6.87 0.44 3.496
probabilidad y estadística.
6 3.27 0.11 7.45 Autor: William mendenhall.
68 62.07 75.29 41.58
RELACIÓN ENTRE EL COEFICIENTE DE DETERMINACIÓN Y EL
COEFICIENTE DE CORRELACIÓN DE PEARSON
Datos Comprobando Conclusión
S=2.06 √ 𝑆 𝑥𝑥 √ 𝑆 𝑥𝑥
n=12
6) Resultado:
4) Tabla de distribución
3) Calculando : T
𝛾 =n − 2=10
I.C.=95%
γ 0.05
10 2.22 =
𝜏 𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
• INTERVALOS DE CONFIANZA PARA :
1) Datos: 2) Formulas y sustitución :
a=-1.68
=128.25
S=2.06 Sustitución:
n=12
3297
Tabla de distribución T
3) Calculando :
I.C.=95%
𝛾 =n − 2=10
γ 0.05
10 2.22 =
𝜏 𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
• INTERVALOS DE CONFIANZA PARA :
1) Datos: 2) Formulas y sustitución :
=128.25
S=2.06
n=12 Sustitución:
Muestra x= 11 = 0.775.76
=3.27
=16.25
𝜏 𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
• INTERVALOS DE CONFIANZA PARA:
1) Datos: 2) Formulas y sustitución :
=128.25
S=2.06
n=12 Sustitución:
Muestra x= 11 = -1.94
=3.27
=16.25
𝜏 𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
• RESULTADOS DE INTERVALOS DE CONFIANZA:
Intervalo de confianza
para
−0.364
< 𝛽 <0.443
Intervalo de confianza −8.37 <𝛼 < 5.01
para
Intervalo de confianza
0.77 < 𝜇 𝑌 <5.76
para 𝑋𝑜
Intervalo de confianza
−1.94<𝑌 𝑜 <8.48
para
PRUEBA DE HIPÓTESIS PARA
b=0.45 γ 0.05
S=2.06 2.22 =
10
GRÁFICA CONCLUSIONES
= 10
a=-1.68
γ 0.05
3297
S=2.06 10 2.22 =
GRÁFICA CONCLUSIONES
Definición:
140 Diagrama de flujo
120
• Es un diagrama que describe un proceso,
100
sistema o algoritmo informático. Se usan
80
ampliamente en numerosos campos para
60
documentar, estudiar, planificar, mejorar y
comunicar procesos que suelen ser complejos
40
en diagramas claros y fáciles de comprender.
20
0
0 2 4 6 8 10 12 14
Bibliografía:
https://www.lucidchart.com/pages/es/qué-es-un-
diagrama-de-flujo
Mejor estimación de la recta
Mejor estimación de la recta: Bibliografía:
140
120
100
80
60
40
20
0
0 2 4 6 8 10 12 14
X Y XY
Ecuación de la recta
1 1 80 80 84
Fórmulas
3 9 97 291 92
4
4 16
16 92
92 368
368 96
96
4
4 16
16 102
102 408
408 96
96
6
6 36
36 103
103 618
618 104
104
8
8 64
64 111
111 888
888 112
112
10
10 100
100 119
119 1190
1190 120
120
10 100 123 1230 120 Sustitución
10 100 123 1230 120
11 121 117 1287 123
11 121 117 1287 123
13 169 136 1768 132
13 169 136 1768 132
• b
X Y XY Definición:
1 1 80 80 84 6400
3 9 97 291 92 9409 Los coeficientes de correlación son medidas
que indican la situación relativa de los mismos
4 16 92 368 96 8464
sucesos respecto a las dos variables, es decir,
4 16 102 408 96 10404
son la expresión numérica que nos indica el
6 36 103 618 104 10609
grado de relación existente entre las 2
8 64 111 888 112 1231
variables y en qué medida se relacionan.
10 100 119 1190 120 114161
10 100 123 1230 120 15129
Bibliografía:
11 121 117 1287 123 13689
Libro: Introducción a la probabilidad y
13 169 136 1768 132 18496
estadística.
195 3297 68 454 1163 119082 Autor: William mendenhall.
Fórmulas: Valor Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
Sustitución:
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta
Valor Significado
0.618 Correlación positiva moderada
COEFICIENTE DE RELACIÓN DE SPEARMAN
Definición:
X Y Rango Rango d
X Y Es una medida de la correlación (la asociación o
1 80 1 1 0 0 interdependencia) entre dos variables aleatorias
3 97 2 2 0 0 continuas.
4 92 3.5 3 0.5 0.25
4 102 3.5 4 -0.5 -0.25 Este coeficiente se emplea cuando una o ambas
4 102 3.5 4 -0.5 -0.25
6 103 5 5 0 0 escalas de medidas de las variables son
6 103 5 5 0 0
8
8 111
111 6
6 6
6 0
0 0
0
ordinales, es decir, cuando una o ambas escalas
10
10 119
119 7.5
7.5 7
7 0.5
0.5 0.25
0.25 de medida son posiciones.
10
10 123
123 7.5
7.5 8
8 -0.5
-0.5 -0.25
-0.25
11
11 117
117 9
9 9
9 0
0 0
0
Fórmulas: Sustitución:
13
13 136
136 10
10 10
10 0
0 0
0
70
70 180
180 0
0
Bibliografía:
Interpretación: es correlación
Libro: Estadística
muy alta
Autor: Murray R. Spiegel
RELACIÓN ENTRE EL COEFICIENTE DE PEARSON Y SPEARMAN
Definición:
• El coeficiente de correlación de Pearson permite medir la fuerza y la dirección de la asociación de dos variables
cuantitativas aleatorias con una distribución bivariada conjunta. En este caso sólo buscaremos comprobar que
cada una por sí solas presenten una distribución normal univariada. Los valores de la correlación de Pearson van
desde -1 hasta 1, siendo los valores extremos los que indican mayor correlación entre variables, y siendo el 0 el
punto que indica la no existencia de correlación.
• Para la interpretación de los resultados, tanto para Pearson y Spearman hay que considerar lo siguiente: Si el
coeficiente de correlación arrojado va entre 0 y 0,2, entonces la correlación es mínima; si va entre 0,2 y 0,4, es
una correlación baja; si va entre 0,4 y 0,6, entonces es una correlación moderada, ya entre 0,6 y 0,8 es una
correlación buena; finalmente, entre 0,8 y 1, es una correlación muy buena. Esto mismo aplica en negativo.
• El coeficiente de correlación de Spearman, al igual que el de Pearson, muestra una asociación
entre variables. A diferencia del anterior, permite obtener un coeficiente de asociación ente variables que
no se comportan normalmente, entre variables ordinales. Se calcula en base a una serie de rangos
asignados. Tal como en Pearson, los valores van de - 1 a 1, siendo 0 el valor que indica no correlación, y los
signos indican correlación directa e inversa
Bibliografía:
Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
VARIANZA Y DESVIACIÓN ESTANDAR
4.61
Definición:
Desviación estándar:
La desviación es una medida de dispersión para variables de razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.
Varianza:
En teoría de probabilidad, la varianza de una variable aleatoria es una medida de dispersión definida como
la esperanza del cuadrado de la desviación de dicha variable respecto a su media.
Relación entre desviación estándar y el error
estándar en la mejor estimación de la recta
En este caso como el error estándar depende de el tamaño muestral, a los datos representados son
iguales a la distribución de la media, por ende los valores deben ser igualadas o cercanos, ya que si no hay
un crecimiento en el tamaño muestral el error será parecido a la desviación estándar pero el error siempre
debe ser menor que la desviación estándar. El error estándar es un aproximado a la desviación estándar
como referencia de la media de muestra que se tomó de una población.
Mide la dispersión de los valores observados de la línea.
Como se aplicaba en la desviación estándar, mientras más grande sea el error estándar de
estimación, mayor será la dispersión de los puntos alrededor de la línea de regresión. De manera
que inversa, si Se = 0, esperemos que la ecuación de estimación sea un estimador perfecto de la
variable dependiente.
BIBLIOGRAFIA:
www.dm.uba.ar/materias/estadistica_Q/2011/1/clase
%20regresion%20simple.pdf
COEFICIENTE DE DETERMINACIÓN
Y Definición Conclusión
84 80 100 16
Es un estadístico usado en el contexto de un modelo
92 97 49 25 • El resultado indica que el
estadístico cuyo principal propósito es predecir
96 92 4 16 futuros resultados o probar una hipótesis. 92.1% de los resultados
seguira siendo parecida a
96 102 144 36
la media, los datos pueden
104 103 169 1 variar por muy poco
Fórmula
112 111 441 1
120 119 841 1
120 123 1089 9
123 117 729 36 Bibliografía:
Sustitución
132 136 2116 16
Libro: Introducción a la
probabilidad y estadística.
107 1080 5682 157 Autor: William mendenhall.
9
RELACIÓN ENTRE EL COEFICIENTE DE DETERMINACIÓN
Y EL COEFICIENTE DE CORRELACIÓN DE PEARSON
Tabla de distribución T
3) Calculando :
I.C.=95%
𝛾 =n − 2=10
γ 0.05
10 2.22 =
𝜏 𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
• INTERVALOS DE CONFIANZA PARA :
1) Datos: 2) Formulas: 5) Sustitución:
B=4.63 𝑏 − 𝑇 𝑠 𝑏+ 𝑇 𝑠
=142
( 𝛼
2
) <𝛽<
( 𝛼
2
)
S=4.61 √ 𝑆 𝑥𝑥 √ 𝑆 𝑥𝑥
n=12
6) Resultado:
4) Tabla de distribución
3) Calculando : T
𝛾 =n − 2=10
I.C.=95%
γ 0.05
10 2.22 =
𝜏 𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
• INTERVALOS DE CONFIANZA PARA :
1) Datos: 2) Formulas y sustitución :
=142
S=4.61
n=12 Sustitución:
Muestra x= 11 84= 36.66
=84
=15.83
𝜏 𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.
• INTERVALOS DE CONFIANZA PARA:
1) Datos: 2) Formulas y sustitución :
=142
S=4.61
n=12 Sustitución:
Muestra x= 11 84= 110.43
=84
=15.83
𝜏 𝛼 /2 =2.22
PRUEBA DE HIPÓTESIS PARA
DATOS FÓRMULA SUSTITUCIÓN Tabla: Valores críticos de la
distribución t
= 10
a=80
γ 0.05
S=4.61 10 2.22 =
GRÁFICA
GRÁFICA CONCLUSIONES
= 10
b=4.63 γ 0.05
S=4.61 2.22 =
10
GRÁFICA CONCLUSIONES
• Correlación
• La correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables
estadísticas. Se considera que dos variables están correlacionadas cuando los valores de una de ellas varían
sistemáticamente con respecto a los valores homónimos de la otra.
• https://es.wikipedia.org/wiki/Correlaci%C3%B3n
• http://estadisticauazteca.blogspot.mx/2010/07/regresion-multiple.html
REGRESIÓN POLINOMIAL
Planteamiento
Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:
Estatura
Pesos (Y)
(X)
186 85
189 85
190 86
192 90
193 87
193 91
198 93
201 103
203 100
205 101
X Y XY Y
1.86 85 3.45 6.43 11.96 158.1 294.06
1.89 85 3.57 6.75 12.75 160.65 303.62
1.90 86 3.61 6.85 13.03 163.4 310.46
1.92 90 3.68 7.07 13.58 172.8 324.06
1.93 87 3.72 7.18 13.87 167.91 324.24
1.93 91 3.72 7.18 13.87 175.63 338.96
1.98 93 3.92 7.76 15.36 184.14 364.59
2.01 103 4.04 8.12 16.32 207.03 416.13
2.03 100 4.12 8.36 16.98 203 412.09
2.05 101 4.20 8.61 17.66 2.05 424.45
19.50 921 34.31 74.31 145.38 1594.71 3512.66
Formulas:
Δ 𝑏0
𝑏0 =
Δ𝐷
Δ 𝑏1
𝑏1 =
Δ𝐷
Δ 𝑏2
𝑏2 =
Δ𝐷
9
RESOLVER ECUACIONES POR
CRAMER
∆ D=1042.083
SOLUCIÓN PARA
−7298.96
∆ 𝑏𝑜= =−7.004
1042.083
SOLUCION PARA
522071102
∆ 𝑏1= =50.098
1042.083
SOLUCION PARA
216.01
∆ 𝑏2= =0.207
1042.083
ECUACIÓN DE LA RECTA POLINOMIAL
X
1.86 86.85
1.89 88.34
1.90 88.89
1.92 89.91
91 1.93 90.41
90.5
P 1.93 90.41
90
E 1.98 92.96
89.5
S
89 2.01 94.48
O
88.5 S 2.03 95.50
88 (y) 2.05 95.52
87.5
19.50 913.27
87
1.89 1.9 1.92 1.93
Estatura (x)
COEFICIENTE DE DETERMINACIÓN
FÓRMULA DEFINICIÓN
Planteamiento (ejemplo 2)
Dados los datos siguientes:
(X) (Y)
0 9.1
1 7.37
2 3.2
3 4.6
4 4.8
5 2.9
6 5.7
7 7.1
8 8.8 BIBLIOGRAFIA:
9 10.2 Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
X Y XY Y
0 9.1 0 0 0 0 0
1 7.37 1 1 1 7.37 7.37
2 3.2 4 8 64 6.4 12.8
3 4.6 9 27 81 13.8 41.4
4 4.8 16 64 256 19.2 76.8
5 2.9 25 125 625 14.5 72.5
6 5.7 36 216 1296 34.2 199.5
7 7.1 49 343 2401 49.7 347.9
8 8.8 64 512 4096 70.4 536.2
=
Δ b0
b0 =
ΔD
Δ b1
b1 =
ΔD
Δ b2
b2 =
ΔD
10
285
307.3
307.3
15,133 2153.3
2153.3
RESOLVER ECUACIONES POR CRAMER
285
2153.3
285
15133
∆ D=2289.524
63.77
285
15,333
2 85 2025
- 45 3 07.3 2025
+ 285 3 07.3 285
63.77 2025 1533 2153.3 1533 2153.3 2025
63.77 [ - ] = -233635.42
45 [ - ] = -175020372
285 [ - ] = 24730875
15,333
10 [ - ] = -38893416
63.7 [ - ] = -32368518
285 [ - ] = 2655630
2153.3
10 2 85 307.3
- 45 4 5 307.3 + 63.77 4 5 285
2025 2153.3 285 2153.3 285 2025
10 [ - ] = -86775
45 [ - ] = 419310
63.77 [ - ] = 631323
= 0. 288
ECUACIÓN DE LA RECTA POLINOMIAL
(X)
(X)
0 8.989
01 8.989
6.645
21 6.645
5.168
3
2 4.267
5.168
4
3 3.942
4.267
5
4 4.193
3.942
6
5 5.02
4.193
8 7 6.423
6 5.02
8
7 8.402
6.423
6
9
8 10.957
8.402
4
9 10.957
2
0
1 2 3 4 = 8.698 − (2.341)(2) + (0.288)(2 = 5.168.
COEFICIENTE DE DETERMINACIÓN
FÓRMULA DEFINICIÓN
TEMARIO:
• Ecuación de Potencia
• Coeficiente de determinación y gráfica
• Ecuación Exponencial
• Coeficiente de determinación y gráfica
• Ecuación logarítmica
• Coeficiente de determinación y gráfica
TEMA 3.
REGRESIÓN NO LINEAL MÚLTIPLE
• Genera una ecuación para describir la relación no lineal entre una variable de respuesta
continua y una o más variables productoras, y predice nuevas observaciones.
Bibliografía
https://es.slideshare.net/jjgibaja/regresin-lineal-mltiple
ECUACIÓN DE POTENCIA
Definición
La regresión examina la relación entre dos variables, pero restringiendo una de ellas con
el objeto de estudiar las variaciones de una variable cuando la otra permanece constante.
En otras palabras, la regresión es un método que se emplea para predecir el valor de una
variable en función de valores dados a la otra variable.
Ecuación:
Bibliografía
http://www.monografias.com/trabajos89/regresion-potencial-metodo-minimos-cuadrados/regresion-potencial-
metodo-minimos-cuadrados.shtml
PLANTEAMIENTO:
X Volumen 1 2 3 4 5 6 7
Y Presión 7 30 90 170 290 450 650
BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y estadística.
Autor: William mendenhall.
x y Log x Log y Log x log y
1 7 0 0.845 0 0
𝑌
^ =𝑎 𝑥 𝑏 Tabla:
y
700
7 6.572 54956.48 54756
600 30 33.482 43063.72 44521
BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y
estadística.
PLANTEAMIENTO (EJEMPLO 2):
En determinados experimentos, en su mayoría biológicos, la
dependencia entre las variables X e Y es de forma exponencial, en cuyo
caso interesa ajustar a la nube de puntos ax la mejor función.
y
1 3
1.2 3.4
1.5 5
2 2
3 4.1
3.7 5
4 7
BIBLIOGRAFIA: 4.5 6.5
Libro: Introducción a la probabilidad y
estadística. Σ 20.9 Σ 36
Autor: William mendenhall.
1 3 0 0.477121255 0 0
3) Sustitución:
1) Datos: 2) Formulas:
b
b
Grafica:
Tabla:
𝑦 = 𝑎𝑙𝑛𝑥 +𝑏
^
7
ŷ
6 3 2.867324958
4.5 2.66562779 2.25
3.4 3.12009764
5 4.5 1.90413052 1.21
5 3.45998862
4.5 1.08162367 0.25
4
2 3.953385811
4.5 0.29878707 6.25
3 4.1 4.770533551
4.5 0.0731884 0.16
5 5.257413385
4.5 0.57367504 0.25
2
7 5.450815515
4.5 0.90405014 6.25
1 6.5 5.756582194
4.5 1.57899881 4
(y)= 36 (ŷ)= 34.6361417 =9.08008145 =20.62
0
0 1 2 3 4 5 6 7 8 9
COEFICIENTE DE DETERMINACIÓN
FÓRMULA
DEFINICIÓN
BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
ECUACIÓN EXPONENCIAL
Definición
• Una regresión exponencial es el proceso de encontrar la ecuación de la función
exponencial que se ajuste mejor a un conjunto de datos. Como un resultado,
obtenemos una ecuación
• La potencia predictiva relativa de un modelo exponencial está denotada por .
El valor de varía entre 0 y 1. Mientras más cercano el valor esté de 1, más
preciso será el modelo.
Ecuación:
Bibliografía
https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/exponential-
regression
Planteamiento:
El volumen de ventas mensuales (y) y los años de experiencia en ventas
(x) registradas de una muestra aleatoria de 6 vendedores de la Empresa
“LOZANO” procesadora de alimentos, se dan en la siguiente tabla.
Estime la ecuación de regresión exponencial.
x y
1 10
2 40
3 120
4 300
2 40
3.68887945 4 7.377758908
3 120
4.78749174 9 14.36247523
4 300
5.70378247 16 22.8151299
5 800
6.68461173 25 33.42305864
6 500
6.2146081 36 37.28764859
PROCEDIMIENTO:
b
Grafica:
Tabla:
𝑦= 𝑎
^ 𝑒 𝑏𝑥
8
ŷ
7
10 16.32096
6 1770 3075390.18 3097600
40 37.87409
5 1770 3000260.16 2992900
120 87.88986
4 1770 2829494.51 2722500
300 203.9555
3 1770 2452495.46 2160900
800 473.295
2 1770 1681443.79 940900
500 1098.319
1770 451155.315 1612900
1
(y)=1770 (ŷ)=1098.319 =13490239.4 =13527700
0
140 160 180 200 220 240 260 280 300
COEFICIENTE DE DETERMINACIÓN
FÓRMULA
DEFINICIÓN
BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
PLANTEAMIENTO (EJEMPLO 2):
X Volumen 1 2 3 4 5 6 7
Y Presión 7 30 90 170 290 450 650
BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y estadística.
Autor: William mendenhall.
x y Log x Log y Log x log y
1 7 0 0.845 0 0
2) Formulas: 3) Sustitución:
Grafica:
Tabla:
𝑦= 𝑎
^ 𝑒 𝑏𝑥
y
600
30 33.482 43063.72 44521
525
90 86.787 4958.97 22801
450
300
290 288.12 2209 2401
225
450 442.16 40465.34 43681
150
0
0 1 2 3 4 5 6 7
1687 1662.79 241
303361.41 340482
COEFICIENTE DE DETERMINACIÓN
FÓRMULA
DEFINICIÓN
BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y
estadística.
ECUACIÓN LOGARITMICA
Definición
• Este modelo de regresión es una alternativa cuando el modelo lineal no logra un
coeficiente de determinación apropiado, o cuando el fenómeno en estudio tiene un
comportamiento que puede considerarse potencial o logarítmico.
Bibliografía
http://reyesestadistica.blogspot.mx/2011/07/analisis-de-regresion-
logaritmica.html
PLANTEAMIENTO:
• En la producción de herramientas, el método para deformar acero a temperatura normal
mantiene una relación inversa con la dureza del mismo ya que, a medida que la
deformación crecer, se afectada la dureza del acero. Para investigar esta relación se ha
tomado la siguiente muestra
X: Deformación en (mm) Y: Dureza Brinell (en
6 68
9 67
11 65
13 53
22 44
26 40
28 37 BIBLIOGRAFIA:
Libro: Introducción a la
33 34 probabilidad y estadística.
35 32 Autor: William mendenhall.
PROCEDIMIENTO:
1) Datos: 2) Formulas:
1183.132 3) Sustitución:
440
76.506
25.685
Grafica:
Tabla:
𝑦 = 𝑎𝑙𝑛𝑥 +𝑏
^
80
70
60
50
40
30
20
10
0
0 5 10 15 20 25 30 35 40
COEFICIENTE DE DETERMINACIÓN
FÓRMULA
DEFINICIÓN
BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
PLANTEAMIENTO (EJEMPLO 2):
1 3 0 0 0 9
Tabla:
𝑦 = 𝑎𝑙𝑛𝑥 +𝑏
^
y
7
BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y
estadística.
Autor: William mendenhall.
Problema hecho por exponencial,
potencial y logaritmica
Fórmulas:
1 15 2.70 1 19.125 2.7
2 20 2.99 4 19.125 5.98
5 24 3.17 25 19.125 15.85
15 30 3.40 225 19.125 51
25 55 4 625 19.125 100
30 85 4.44 900 19.125 133.2
35 95 4.55 1225 19.125 159.25
40 99 4.59 1600 19.125 183.6
Sustitución:
( 0.048 ) ( 1 ) ( 0.048 ) ( 25 )
𝑦 = ( 16.64 ) 𝑒
^ =17.45 𝑦= ( 16.64 ) 𝑒
^ =55.24
𝑦 = ( 16.64 ) 𝑒( 0.048 ) ( 2 ) =18.31
^ 𝑦= ( 16.64 ) 𝑒( 0.048 ) ( 30 ) =70.23
^
( 0.048 ) ( 5 ) ( 0.048 ) ( 35 )
𝑦 = ( 16.64 ) 𝑒
^ =21.15 𝑦= ( 16.64 ) 𝑒
^ =89.28
( 0.048 ) ( 15 ) ( 0.048 ) ( 40 )
𝑦= ( 16.64 ) 𝑒
^ =34.18 𝑦= ( 16.64 ) 𝑒
^ =113.5
17.45 15 52.875 1254.93 1434.51
18.31 20 52.875 1194.73 1080.76
21.15 24 52.875 1006.47 833.76
34.18 30 52.875 349.5 523.26
55.24 55 52.875 5.59 4.51
70.23 85 52.875 301.19 1032.01
89.28 95 52.875 1325.32 1774.51
113.5 99 52.875 3675.39 2127.51
COEFICIENTE DE DETERMINACIÓN
Fórmula:
120
Sustitución
100
80
60
1 17.45
1 17.45
2 18.31
2 18.31 40
5 21.15
5 21.15
15 34.18
15 34.18 20
25 55.24
25 55.24
30 70.23
30 70.23
35 89.28 0
0 2 4 6 8 10 12 14
35 89.28
40 113.5
40 113.5
Ecuación Potencial
Fórmulas:
log y log x log y
1 15 0 1.176 0 0
2 20 0.3 1.3 0.6 0.39
5 24 0.698 1.38 1.39 0.96
15 30 1.17 1.47 2.35 1.72
25 55 1.39
log 1.74y
log
2.79
log log2.41
x log y
30 85 1.47 1.93 2.95 2.83
35 95 1.54 1.97 3.08 3.03
40 99 1.6 1.99 3.2 3.184
Sustitución:
27.96
0.16 0.16
𝒚 =( 27.96 ) (1 )
^ =27.96 𝒚 = ( 27.96 ) ( 25 )
^ = 46.8
0.16 0.16
𝒚 = ( 27.96 ) ( 2 )
^ =3 1.23 ^
𝒚 = ( 27.96 ) ( 30 ) =4 8
0.16
𝒚 =( 27.96 ) (5 )
^
0.16
=36.17 𝒚= ( 27.96 ) (35 )
^ = 49.38
0.16
𝒚 =( 27.96 ) (15 )
^
0.16 𝒚= ( 27.96 ) ( 40 )
= 43.12 ^ =50.45
27.96 15 52.875 620.75 1434.51
Sustitución
50
40
30
1 27.96
1 27.96
2 31.23
2 31.23 20
5 36.17
5 36.17
15 43.12
15 43.12
25 46.8 10
25 46.8
30 48
30 48
35 49.38
35 49.38 0
40 50.45 0 2 4 6 8 10 12 14
40 50.45
Ecuación logaritmica
Fórmulas:
In x (y)
1 15 0 0 0 2.7
2 20 0.693 1.38 13.86 5.98
5 24 1.609 3.21 38.61 15.85
15 30 2.708 5.41 81 51
25 55 6.437 6.43
In 354.03
In x (y) 100
30 85 6.8 6.8 76500 133.2
35 95 7.11 7.11 19.125 159.25
40 99 7.37 7.37 19.125 183.6
Sustitución:
154.55 15 52.875 10337.8 1434.51
124.64 20 52.875 5150.21 1080.76
85.11 24 52.875 1039.09 833.76
37.72 30 52.875 229.67 523.26
15.68 55 52.875 1383.46 4.51
7.82 85 52.875 2029.95 1032.01
1.172 95 52.875 2673.2 1774.51
-4.58 99 52.875 3301.07 2127.51
26144.45
COEFICIENTE DE DETERMINACIÓN
Fórmula:
180
Sustitución 160
140
120
100
80
1 154.55 60
1 154.55
2 124.64 40
2 124.64
5 85.11 20
5 85.11
15 37.72 0
15 37.72 0 2 4 6 8 10 12 14
25 15.68
25 15.68 -20
30 7.82
30 7.82
35 1.172
35 1.172
40 -4.58
40 -4.58
Diagrama de flujo Logaritmico Potencial Exponencial
120 180
160
100
140
120
80
100
60 80
60
40
40
20 20
0
0 5 10 15 20 25 30 35 40 45
0
0 2 4 6 8 10 12 14 16 -20
TEMA 4
DISEÑO DE EXPERIMENTOS
Análisis de varianza para un criterio
Es una metodología para analizar la variación entre muestras y la variación al interior de las
mismas mediante la determinación de varianzas. Es llamado de un criterio porque analiza una
variable dependiente.
Https://www.icicm.com/estadistica.net
Distingo entre
bloques aleatorios y No aleatorios
Los niveles de un factor se definen como los valores reales que se utilizan en el experimento.
Para cada uno de estos casos es importante determinar no sólo si cada uno de los 2 factores
influye en la respuesta, sino también si hay una interacción significativa entre ellos. En lo que
se refiere a la terminología, el experimento descrito aquí es de 2 factores,
y el diseño experimental podría ser uno completamente aleatorizado, en el que las distintas
combinaciones de tratamiento se asignan al azar a todas las unidades experimentales, o bien,
un diseño de bloques completos aleatorizados, donde las combinaciones de factores se
asignan al azar dentro de los bloques.
Ronald E. Walpole. Sexta Edicion
Tabla ANOVA para un criterio
TRATAMIENTOS SSA
ERROR SSE
TOTAL SST
B SSB
B SSB
AB SS(AB) ()
AB
Error SS(AB)
SSE )
Total SAT
Error SSE
Total SAT
Tema 4: Diseño de Experimentos
Planteamiento mediante tabla ANOVA de un factor
• Los modelos de ANOVA (ANalysis Of VAriance) son técnicas de Análisis
Multivariante de dependencia, que se utilizan para analizar datos
procedentes de diseños con una o más variables independientes
cualitativas (medidas en escalas nominales u ordinales) y una variable
dependiente cuantitativa (medida con una escala de intervalo o de razón).
• Los modelos ANOVA permiten, básicamente, comparar los valores medios
que toma la variable dependiente en J poblaciones en las que los niveles de
factores son distintos, con la finalidad de determinar si existen diferencias
significativas según dichos niveles o si, por el contrario, la respuesta en
cada población es independiente de los niveles de factores. Se trata, por
tanto, de un contraste paramétrico que extiende al caso de J poblaciones el
contraste de la igualdad de medias entre dos poblaciones independientes.
Prueba de Tukey
• Permite la formación de intervalos de confianza de 100 (1-a)%
simultáneos para todas las comparaciones pareadas. El método se basa
en la distribución del rango studentizado .El punto percentil apropiado
es la función de a, K y v = grados de libertad para .Una lista de puntos
porcentuales superiores para =0.05 como se muestra en la tabla
(puntos porcentuales superiores de la distribución de rango
studentizado: valores de q(0.05; k, v ) El método de comparaciones
pareadas de tukey implica encontrar una diferencia significativa entre las
medias i y j (i j) si excede.
• Este método solo se aplica si se rechaza Ho
PRUEBA DE KRUSKAL-WALLIS
En estadística, la prueba de Kruskal-Wallis (de William Kruskal y W. Allen Wallis) es un
método no paramétrico para probar si un grupo de datos proviene de la misma
población.
Ya que es una prueba no paramétrica, la prueba de Kruskal-Wallis no asume
normalidad en los datos.
https://es.wikipedia.org/wiki/Prueba_de_Kruskal-Wallis
Planteamiento
• Suponga que un experimento industrial un ingeniero está interesado en
cómo la absorción media de humedad en concreto varía entre cinco
mezclas diferentes de concreto. Las muestras se exponen a la humedad
por 48 horas y se decide que se prueben seis muestras para cada mezcla,
por lo que se requiere probar un total de 30 muestras. Los datos de este
experimento se muestran en la siguiente tabla.
Mezcla 1 2 3 4 5
Total 3320.00 3416.00 3663.00 2791.00 3664.00 3370.8 16854.0 Libro: Introducción a la
probabilidad y estadística.
553.33 569.33 610.50 465.17 610.67 561.80 Autor: William mendenhall.
Analisis de Varianza para la classification unilateral
Fuente de Suma de Grados de Cuadrados Calculada
Variación Cuadrados libertad de medios
Tratamiento SCT K-1 f
s
Error SCE K(n-1)
Total STC n k-1
H0: µ1 = µ2 = µ3
= µ 4 = µ5 = µ 6
H1: Al menos
dos no son
significativas.
α=0.05
n=6
k=5
Sustitucion
Análisis de Varianza para la clasificación unilateral
Fuente de Suma de Grados de Cuadrados Calculada
Variación Cuadrados libertad de medios
Tratamiento 8536.6 4 21339.15 F=4.30
s
Error 124021 25 4960.84
Total 209377 29 26299.99
Bibliographic
Bibliographic Conclusión
https://olicarrillo.files.wordpress.co
https://olicarrillo.files.wordpress.co Se rechaza la hipótesis nula . Se acepta
m/2013/02/estadistica-ii.pdf
m/2013/02/estadistica-ii.pdf que al menos dos mezclas no son iguales.
Prueba de Tukey
• El método de Tukey se utiliza en ANOVA para crear intervalos
de confianza para todas las diferencias en parejas entre las
medias de los niveles de los factores mientras controla la tasa de
error por familia que especifique. Es importante considerar la
tasa de error por familia cuando se realizan múltiples
comparaciones debido a que la probabilidad de cometer un
error tipo I para una serie de comparaciones es mayor que la
tasa de error para cualquier comparación individual.
• Bibliografía
• https://es.slideshare.net/JaimeIncaGuerrero/anova-prueba-de-
tukey
(Continuación del problema
anterior)
Humedad absorbida en mezclas de concreto.
Mezcla 1 2 3 4 5
Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17 145.5 145.33 104.16 88.16
553.33
553.33 57.34
57.34 57.17
57.17 16
16
569.33
569.33 41.34
41.34 41.17
41.17
610.5
610.5 0.17
0.17
610.67
610.67
Datos Formulas
H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
H1: Al menos dos no son
significativas.
No. De comparaciones=
Comparando el resultado con q
• Condición
• Tras obtener el resultado de q, si una media es <q se considera igual, si es >q se
considera diferente
Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17 145.5 145.33 104.16 88.16
553.33 57.34 57.17 16
569.33 41.34 41.17
610.5 0.17 Media Igual
610.67 Media Diferente
• Conclusión
• Se rechaza la hipótesis nula , las medias no son iguales. Se acepta , las diferencias
de medias y son diferentes
Prueba de Duncan
• El Test de Duncan es un test de comparaciones múltiples.
Permite comparar las medias de los t niveles de un factor
después de haber rechazado la Hipótesis nula de igualdad de
medias mediante la técnica ANOVA. Todos los test de
comparaciones múltiples son test que tratan de perfilar, tratan
de especificar, tratan de concretar, una Hipótesis alternativa
genérica como la de cualquiera de los Test ANOVA.
• Bibliografía:
https://estadisticaorquestainstrumento.wordpress.com/2013/
01/28/test-de-duncan/
• Planteamiento
• Suponga que un experimento industrial un ingeniero está interesado en cómo la absorción
media de humedad en concreto varía entre cinco mezclas diferentes de concreto. Las
muestras se exponen a la humedad por 48 horas y se decide que se prueben seis muestras
para cada mezcla, por lo que se requiere probar un total de 30 muestras. Los datos de este
experimento se muestran en la siguiente tabla.
Mezcla 1 2 3 4 5
Total 3320.00 3416.00 3663.00 2791.00 3664.00 3370.8 16854.0 Libro: Introducción a la
probabilidad y estadística.
553.33 569.33 610.50 465.17 610.67 561.80 Autor: William mendenhall.
Analisis de Varianza para la clasificacion unilateral
Fuente de Suma de Grados de Cuadrados Calculada
Variación Cuadrados libertad de medios
Tratamiento 8536.6 4 21339.15 F=4.30
s
Error 124021 25 4960.84
Total 209377 29 26299.99
Mezcla
1 553.33
2 569.33
3 610.5
4 465.17
5 610.67
Datos Formulas
H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
H1: Al menos dos no son
significativas.
γ P
2 3 4 5
24 2.919 3.066 3.16 3.226
25 2.9125 3.060 3.155 3.221
30 2.88 3.035 3.131 3.199
Se interpola los valores del 25*
Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17
Se compara con
553.33
Se compara con
569.33 Condición
Se compara con Si el valor de Rp es menor que
610.5 el valor de la diferencia de
Se compara con medias, estas medias son
610.67 diferentes
Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17 145.5 > 92.61 145.33 > 90.7 104.16 > 87.98 88.16 > 83.74
553.33 57.34 < 90.71 57.17 < 87.98 16 < 83.74
569.33 41.34
41.34 <
< 87.98
87.98 41.17
41.17 <
< 83.74
83.74
610.5 0.17 < 83.74
0.17 < 83.74
610.67 Media Diferente
Media Igual
Planteamiento mediante bloques
aleatoriosTiempo en segundos para ensamblar un producto
Máquina Operador 1 2 3 4 5 6 Total Medias
1 42.5 39.3 39.6 39.9 42.9 43.6 247.8 41.3
2 39.8 40.1 40.5 42.5 42.5 43.1 248.5 41.42
3 40.2 40.5 41.3 43.4 44.9 45.1 255.4 42.57
4 41.3 42.2 43.5 44.2 45.9 42.3 259.4 43.23
Total 163.8 162.1 164.9 170 176.2 174.1
Medias 40.95 40.525 41.225 42.5 44.05 43.525
Conclusión
41.3
41.42
41.42
42.57
42.57
43.23
43.23
Diferencia de
Medias 43.23 42.57 41.42 41.43
41.3 1.93 1.27 0.12
41.42
41.42 1.81
1.81 1.15
1.15
42.57
42.57 0.66
0.66
43.23
43.23
Datos Formulas
H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
H1: Al menos dos no son
significativas.
No. De comparaciones=
Sustitucion
Comparando el resultado con q
• Condición
• Tras obtener el resultado de q, si una media es <q se considera igual, si es >q se
considera diferente
Diferencia de
Medias 43.23 42.57 41.42 41.43
41.3 1.93 1.27 0.12
41.42 1.81 1.15
42.57 0.66
43.23 Media Igual
Media Diferente
• Conclusión
• Con el resultado arrojado por la prueba de Tukey, obtuvimos que todas las medias
eran iguales.
Tiempo en segundos para ensamblar un
producto (Duncan)
Máquina Operador 1 2 3 4 5 6 Total Medias
1 42.5 39.3 39.6 39.9 42.9 43.6 247.8 41.3
2 39.8 40.1 40.5 42.5 42.5 43.1 248.5 41.42
3 40.2 40.5 41.3 43.4 44.9 45.1 255.4 42.57
4 41.3 42.2 43.5 44.2 45.9 42.3 259.4 43.23
Total 163.8 162.1 164.9 170 176.2 174.1
Medias 40.95 40.525 41.225 42.5 44.05 43.525
γ P
2 3 4
15 3.014 3.16 3.25
Diferencia de
Medias 43.23 42.57 41.42 41.43
41.3
41.42 Condición
Si el valor de Rp es menor que
42.57 el valor de la diferencia de
medias, estas medias son
43.23 diferentes
Diferencia de Medias
43.23 42.57 41.42 41.43
41.3 1.93>1.67 1.62<1.89 0.12<1.55
41.42 1.81>1.62 1.15<1.55
42.57 0.66<1.55
43.23
Media Diferente
Media Igual
• Conclusion
• Aplicando la prueba de Duncan, comparando diferencias de medias
obtuvimos el resultado donde las medias son diferentes, por lo tanto dos
maquinas operan a diferente velocidad
Tipo de propulsor
Sistem
a de
Misil Análisis de Varianza
34
32.7
30.1
32.8
29.8
26.7
29
28.9
para el experimento de
32 30.2 28.7 27.6 dos factores con n
33.2 29.8 28.1 27.8
28.4 27.3 29.7 28.8
replicas
29.3 28.9 27.3 29.1
En un experimento realizado
para determinar cuál de 3
sistemas de misiles distintos es Tasas de consumo de los propulsores En donde;
preferible, se midió la tasa de Sistem n=2 (Datos pro
Tipo de
combustión del propulsor para a de Total celda)
propulsor a=3 (misiles)
24 arranques estáticos. Se Misil
emplearon 4 tipos de 66.7 62.9 56.5 57.9 244 b=4 (propulsores)
combustible diferentes y el 65.2 60 56.8 55.4 237.4
experimento generó 57.7 56.2 57 57.9 228.8
observaciones duplicadas Total 189.6 179.1 170.3 171.2 710.2
de las tasas de combustión para Medias 31.6 29.85 28.38 28.53
cada combinación de los
tratamientos. Es necesario realizar las siguiente tabla para poder resolver el problema.
Tabla ANOVA para dos criterios
Analisis de Varianza para la clasificacion unilateral
Fuente de Suma de Grados de Cuadrados de Calculada
Variación Cuadrados libertad medios
A SSA
B SSB
AB
B SS(AB)
SSB ()
Error SSE )
Total
AB SAT
SS(AB)
Error SSE
Total SAT
Suma de Cuadrados de A
168,244.2 710.22
a SSA 14.52
T
i 1
i
2
2442 237.42 228.82 168,244.2 (4)(2) (3)(4)(2)
SSA 14.52
s
2
1 s
2
7.26
a 1 1
2
Suma de Cuadrados de B
SSB
s
2
2 s
2 40.08
13.36
b 1 2
3
Suma de Cuadrados de AB
Sistema Tipo de
de Misil propulsor
Total
T
j 1
j
2
189.62 179.12 ... 171.22 126,336.5
a
T
i 1
i
2
2442 237.42 228.82 168,244.2
SS ( AB) 22.16
ij
T 2
66.7 2
65.2 2
... 57.9 2
42,185.54 s
2
3
s
2
3 3.69
(a 1)(b 1) (2)(3)
42,185.54 168244.2 126,336.5 504,384.04
SS ( AB) 22.16
2 8 6 24
Suma de Cuadrados Totales
b a n
y
i 1 j 1 k 1
2
ijk 342 32.72 322 ... 29.12 21,107.68
n 710.22
𝑆𝑆𝑇 =21,107.68 −
=91.67
T 2
710.2 2
24
i 1
Tipo de propulsor
Sistema de
Misil
34 30.1 29.8 29
32.7 32.8 26.7 28.9
32 30.2 28.7 27.6
33.2 29.8 28.1 27.8
28.4 27.3 29.7 28.8
29.3
29.3 28.9
28.9 27.3
27.3 29.1
29.1
Suma del Error
26.75
s
2
2.22
12
Tabla ANOVA para dos criterios
Fuente Suma de Grados de Cuadrado
Calculada
varianza cuadrados libertad s medios
5.84>3.89 10.77>3.49
2.98<3
Se rechaza H0 Se rechaza
Se acepta H0
H0
La hipótesis nula se
rechaza cuando
Conclusión
• Al menos una de las
es diferente de cero
•
PRUEBA DE KRUSTAL-WALLIS
Tipo de propulsor
Sistem
El primer paso consiste en
a de
Misil ordenar los datos de menor a
34 30.1 29.8 29 𝑯𝟎: µ𝟏 = µ𝟐 … … . = µ4 mayor y darles un rango. Si los
32.7 32.8 26.7 28.9 𝑯𝟏: µ𝟏 ≠ µ𝟐 … … . ≠ µ4 valores se repiten, se saca la
media entre los rangos. Tal y
32 30.2 28.7 27.6
como se hizo en las pruebas de
33.2 29.8 28.1 27.8
Suma de Rangos
28.4 27.3 29.7 28.8
29.3 28.9 27.3 29.1 En estadística, la prueba de Kruskal-
Wallis (de William Kruskal y W. Allen
Wallis) es un método no paramétrico
para probar si un grupo de datos
proviene de la misma población.
Bibliografía
Ya que es una prueba no paramétrica,
https://es.slideshare.net/Jaime
la prueba de Kruskal-Wallis no asume
IncaGuerrero/anova-prueba-
normalidad en los datos.
de-krustal-wallis
https://es.wikipedia.org/wiki/Prueba_
de_Kruskal-Wallis
Rangos
Tipo de propulsor
Sistem
a de
Misil
34 24 30.1 18 29.8 16.5 29 12
32.7 21 32.8 22 26.7 1 28.9 10.5
32 20 30.2 19 28.7 8 27.6 4
33.2 23 29.8 16.5 28.1 6 27.8 5
28.4 7 27.3 2.5 29.7 15 28.8 9
29.3 14 28.9 10.5 27.3 2.5 29.1 13
Total 109 88.5 49 53.5
Una vez ordenados
n los valores y darles
i
R 2
i 0
109 9
88.5 2
... 53.5 2
24,976.5 un rango, sustituir
el valor por el
rango dado y hacer
una sumatoria por
cada columna.
Datos
N=24
n=6
Formula Sustitucion
Tabla de Distribución de chi cuadrada Conclusión
0.025 0.975 Conclusión
La hipótesis nula se acepta, por lo tanto se dice que a un nivel de
3 9.348 3 0.216 significancia de 0.05 no existe diferencia en los niveles por el uso de
propulsores.
Gráfica
Sustitucion
Tabla de Distribución de chi cuadrada Conclusión
0.005 0.995 Conclusión
En un nivel de significancia de 0.01 se comprobó que los tiempos
2 10.597 2 0.01 de operación para las tres calculadores son iguales
Gráfica
Se tienen tres especies de cítricos a los cuales se mide la razón entre el área de las hojas y el peso
seco, bajo 3 condiciones de sombra (sol, semisombra y sombra).
Encuentre si existe una diferencia entre los valores obtenidos con una significancia del 5%
ANÁLISIS DE VARIANZA PARA UN CRITERIO
POR BLOQUES
y
2
2 Y
SSA ij
i j
N
2
796
SSA (1122 862 ... 812 ) 2,822.23
9
SUMA DE CUADRADOS DEL TRATAMIENTO
1884.23
S
1
2
942.115
2
SUMA DE CUADRADOS DEL BLOQUE
2
1 796
SSB (2782 2252 2932 ) 850.89 SSB
3 9 S 2
2
k 1
850.89
S 2
2 425.44
2
SUMA DE CUADRADOS DEL ERROR
Total 8
𝑺𝑺𝑻 = 2822.23
TOMA DE DECISIÓN
La hipótesis nula H0 se rechaza en el nivel de significancia
tabla de distribución F: cuando
γ1
2
4 6.94 97.42 6.94
=4.94 CONCLUSIÓN
Se rechaza H0, por lo menos 2 de los tamaños
si varían.
BIBLIOGRAFÍA
Libro: Estadística
Autor: Murray R. Spiegel
PRUEBA DE TUKEY
Sirve para probar todas las diferencias entre las medidas de tratamientos de un experimento es decir cuando
H0 ha sido rechazada. La única exigencia es que el número de repeticiones sea constante en todos los
tratamientos. Sirve para comprobar las medidas de los tratamientos dos a dos.
Ahora para realizar la prueba de Tukey utilizamos las medias de cada muestra ordenadas de menor a mayor ,
las cuales pondremos a continuación:
M1 M2 M3
108.33 82.66 74.33
APLICACIÓN DE LA FORMULA TABLA PUNTOS
PORCENTUALES DE RANGOS
ESTUDENTIZADOS
Después aplicamos la fórmula de la ley de Tukey la cual es la
siguiente:
1
2
3
4 6.50
M1 M2 M3
108.33 82.66 74.33
M1
108.33
M2
82.66
M3
74.33 q 11.66
M3 74.33 34 8.33 - Si q es menor que el valor
de la diferencia de las
M2 82.66 25.37 -
medias, las medias son
M1 108.33 - diferentes.
M1 M2 M3
108.33 82.66 74.33 Se puede concluir que hay una variación
entre las siguientes medias con una
M3 74.33 34 8.33 -
significancia mayor al 0.5
M2 82.66 25.37 -
M1 108.33 - • M1-M3
• M1-M2
PRUEBA DE DUNCAN
Este procedimiento se basa en la noción general de un rango utilizado. El rango de cualquier subconjunto
de p medias muéstrales debe exceder cierto valor antes de que encuentre que cualquiera de las p medias
es diferente. Este valor se llama rango de menor significancia para las p medias y se denota como Rp.
M1 M2 M3
108.33 82.66 74.33
9.67 𝑺𝟐𝟏 =
D2 3.92 7.03 Tratamientos 𝑺𝑺𝑨 = 1884.23 2
942.11
9.67
D3 4.01 7.19 Total 𝑺𝑺𝑻 = 2822.23 8
3
Si el valor de D es menor que el
valor de la diferencia de medias,
estas medias son diferentes
1 2 3 4 5 6
Maquinas K-1
Donde “k” es igual al
número de muestras
Error 𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝐴 k(n-1)
𝒌=𝟔
Donde “n” es igual al
número de pruebas
Total nk-1 𝒏=𝟑
MUESTRAS
1 2 3 4 5 6
MUESTR
AS
T
2 1 2 3 4 5 6
k n 127 126 130 145 128 150
SST y
i j ij
2
ij 129 130 128 140 127 137
i 0 j 0 nk 128 128 129 141 130 150
T
total 384 384 387 426 385 437 2403
2403
2 2
i j ij media 128 128 129 142 128. 145.6 800.9
3
k n
ij
y 2
127
i 0 j 0
2
129 2
128 2
... 150 2
321927
24032
SST 321927 1126.5
18
SUMA DE CUADRADOS DEL TRATAMIENTO
SSA
k
Ti 2
i
T j ij
2
1
2
MUESTRAS
3 4
5
6
T
129 130 128 140 127 137
2403
2 2
128 128 129 141 130 150
i j ij
i
T
i
2
384 2
384 2
... 437 2
965351 media 128 128 129 142 128.3 145.6 800.9
SSA
965351 24032 S 1
2
SSA 983.16 k 1
3 18
983.16
S
1
2
196.63
5
SUMA DE CUADRADOS DEL ERROR
MUESTRA
S
24032 0
Total
𝑺𝑺𝑻 = 1126.5
17
Tabla valores
TOMA DE DECISIÓN
críticos de la La hipótesis nula H0 se rechaza en el nivel de significancia
distribución f cuando
γ1
12
5
3.11
16.46 3.11
=3.11 CONCLUSIÓN
Se rechaza H0, las resistencias si varían, por lo
menos 2.
BIBLIOGRAFÍA
Libro: Estadística
Autor: Murray R. Spiegel
PRUEBA DE TUKEY
Sirve para probar todas las diferencias entre las medidas de tratamientos de un experimento es decir cuando
H0 ha sido rechazada. La única exigencia es que el número de repeticiones sea constante en todos los
tratamientos. Sirve para comprobar las medidas de los tratamientos dos a dos.
Ahora para realizar la prueba de Tukey utilizamos las medias de cada muestra ordenadas de menor a mayor ,
las cuales pondremos a continuación:
MUESTR
A
1 2 3 4 5 6
𝑴́𝟏 𝑴́
𝟐 𝑴́
𝟑 𝑴́
𝟒 𝑴́𝟓 𝑴́𝟔
Media 128 128 129 142 128.3 145.6 800.9
TABLA PUNTOS
APLICACIÓN DE LA FORMULA PORCENTUALES DE RANGOS
ESTUDENTIZADOS
12 3.00
SUSTITUCIÓN
𝑺𝑺𝑨 = 983.16
𝑺𝑺𝑻 = 1126.5
Total 17
OBTENCIÓN DE MEDIAS DIFERENTES
M6 M4 M3 M5 M2 M1
145.6 142 129 128.3 128 128
M1
M2
128
128
17.6*
17.6*
14*
14*
1
1
0.3
0.3
0
-
-
-
q 5.98
M5 128.3 17.3* 13.7* 0.7 - - -
Si q es menor que el valor
M3 129 16.6* 13* - - - - de la diferencia de las
M4 142 3.6 - - - - - medias, las medias son
diferentes.
M6 145.6 - - - - - -
CONCLUSIÓN • M6-M1
Se puede concluir que hay una variación entre • M6-M2
las siguientes medias con una significancia • M6-M5 • M4-M1
mayor al 0.5 • M6-M3 • M4-M2
• M4-M5
PRUEBA DE DUNCAN
Este procedimiento se basa en la noción general de un rango utilizado. El rango de cualquier subconjunto
de p medias muéstrales debe exceder cierto valor antes de que encuentre que cualquiera de las p medias
es diferente. Este valor se llama rango de menor significancia para las p medias y se denota como Rp.
11.94
S 2 D5 3.36 6.68
D rp 2 3
n 11.94
D6 3.40 6.76 TABLA DE VALORES ESTUDENTIZADOS DE
3 Rp
11.94
D2 3.06 6.10 2 3 4 5 6
3 D2=6.10 3.06 3.29 3.33 3.36 3.40
11.94 D3=6.54
D3 3.29 6.54 D4=6.62
3 D5=6.68
11.94 D6=6.76
D4 3.33 6.62
3
M6 M4 M3 M5 M2 M1 D2=6.10
145.6 142 129 128. 128 128 D3=6.54
3
D4=6.62 Si el valor de D es menor que el
M1 128 D6 D5 D4 D3 D2 -
D5=6.68 valor de la diferencia de medias,
M 128 D5 D4 D3 D2 - -
2 D6=6.76 estas medias son diferentes
M 128.3 D4 D3 D2 - - -
5
M 129 D3 D4 - - - -
CONCLUSIÓN
3
Se puede concluir que hay
M 142 D2 - - - - - una variación entre las
4
siguientes medias con una
M 145.6 M6
- -M4 -M3 - M5 - M2 - M1 significancia mayor al 0.5
6 145.6 142 129 128. 128 128
3
• M6-M1
M 128 17.6* 14* 1 0.3 0 - • M6-M2
1
• M6-M5
M 128 17.6* 14* 1 0.3 - - • M6-M3
2
M 128.3 17.3* 13.7* 0.7 - - - • M4-M1
5
• M4-M2
M 129 16.6* 13* - - - - • M4-M5
3
• M4-M3
M 142 3.6 - - - - -
ANÁLISIS DE VARIANZA PARA DOS
CRITERIOS
PLANTEAMIENTO (ejemplo 2)
ANÁLISIS DE VARIANZA PARA DOS CRITERIOS
Suponga que usted haya experimentado con levadura para una receta de panes dulces. Parece ser
que la cantidad de azúcar y la temperatura del agua afectan el tamaño de los panes. Basándose en
los siguientes datos, usted realiza un análisis de varianza para averiguar lo que es significativo de
estas recetas.
B1 B2 B3
76 87 60
A1
75 85 55
70 79 52
A2
69 78 50 TOTAL
TOTAL 290 329 217 836
MEDIAS 72.5 82.25 54.25 209
B1 B2 B3 TOTAL
A1 151 172 115 438
A2 139 157 102 398
TOTAL 290 329 217
Planteamiento
A SSA a-1
B SSB b-1
AB SS(AB) (a-1)(b-1)
B1 B2 B3 TOTAL
A1 151 172 115 438
A2 139 157 102 398
TOTAL 290 329 217
B1 B2 B3
76 87 60
A1
75 85 55
70 79 52
A2
69 78 50 TOTAL
TOTAL 290 329 217 836
MEDIAS 72.5 82.25 54.25 209
SUSTITUCIÓN
SUSTITUCIÓN
𝑎 𝑏 𝑛 2
𝑆𝑆𝑇 = ∑
𝑎 𝑏
∑∑
𝑛
2
𝑦 𝑖𝑗𝑘 −
(∑ ∑ ∑ )
𝑖=1 𝑗 =1 𝑘 =1
𝑦 𝑖𝑗𝑘
=60 010 −
698 896
=1768.66
𝑖=1 𝑗=1 𝑘 =1 𝑎𝑏𝑛 (2) (3) (2)
𝑆𝑆𝐸=𝑆𝑆𝑇
− 𝑆𝑆𝐴 − 𝑆𝑆𝐵 − 𝑆𝑆 ( 𝐴𝐵 ) =1768.66 −133.33 −1 616.16 −1.16=18.01
Cuadrados Medios
Calculada
Tabla Valores Críticos de la Distribución F
Resultados en Tabla ANOVA
1 2
A 1 5.99 5.14
6
B 2
AB 2
Error 6 ′
𝑯 :𝟓.𝟗𝟗
Total 11 𝒐(𝑨)
Conclusiones:
11 19.67