Trabajo Final Segunda Parte

UNIVERSIDAD AUTONOMA DE NUEVO LEON
FACULTAD DE INGENIERIA MECANICA Y ELECTRICA
ALUMNO: ANGEL JULIAN BERLANGA CERDA
Matricula: 1752276
M.C. Rigoberto Américo Garza López
Hora: M3
Semestre: Agosto - Enero 2020

TEMARIO
Regresión Lineal Simple y Correlación
1.
• Diagrama de Flujo
• Mejor Estimación de la Recta
• Error estándar en la mejor estimación de la recta
• Coeficiente de correlación de Pearson
• Coeficiente de correlación de Spearman
• Relación entre el coeficiente de correlación de Pearson y Spearman
• Varianza y Desviación Estándar
• Relación entre la desviación estándar y el error estándar en la mejor estimación de la recta
• Coeficiente de determinación
• Relación entre el coeficiente de determinación y el coeficiente de Pearson
• Intervalos de confianza
• Intervalo de Confianza para β
• Intervalo de Confianza para α
• Intervalo de Confianza para
• Prueba de Hipótesis para β
• Prueba de Hipótesis para α
2. Regresión Múltiple y correlación
• Regresión polinomial
• Coeficiente de Determinación
3. Regresión No Lineal Múltiple
• Ecuación de Potencia
• Coeficiente de determinación y gráfica
• Ecuación Exponencial
• Ecuación logarítmica
4. Diseño de Experimentos
• Análisis de varianza para un criterio
• Planteamiento mediante bloques aleatorios
• Planteamiento mediante tabla ANOVA de un solo factor
• Prueba de Tukey
• Prueba de Duncan
• Análisis de Varianza para dos criterios
• Prueba de Kruskal-Wallis
Regresión lineal simple y correlación.
Regresión lineal simple y correlación.
 Regresión Lineal
En estadística la regresión lineal es un modelo matemático usado para aproximar la
relación de dependencia entre una variable dependiente Y, las variables
independientes y un término aleatorio.
 Correlación
La correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad
entre dos variables estadísticas. Se considera que dos variables están correlacionadas
cuando los valores de una de ellas varían sistemáticamente con respecto a los valores
homónimos de la otra.
Planteamiento de problema
INVERSIÓN , X RENDIMIENTO, Y
11 2
 La información estadística obtenida de una muestra de tamaño 12 14 3
sobre la relación que existe entre la inversión realizada y el
16 5
rendimiento obtenido en cientos de miles de euros para la
explotación agrícola es la siguiente 15 6
16 5
18 3
20 7
21 10
14 6
20 10
19 5
11 6
Diagrama de flujo
Definición:
Diagrama de Flujo Un diagrama de flujo es una representación

12 gráfica de un proceso. Cada paso del proceso es
representado por un símbolo diferente que
10
contiene una breve descripción de la etapa de
8 proceso. Los símbolos gráficos del flujo del
proceso están unidos entre sí con flechas que
6
indican la dirección de flujo del proceso.
4
0
10 12 14 16 18 20 22
Bibliografía:
https://www.aiteco.com/que-es-un-diagrama-de-flujo/
Mejor estimación de la recta
Mejor estimación de la recta: Bibliografía:
Definición: Para estimar la línea de regresión poblacional a partir de la nube de puntos

se utiliza el método de los mínimos cuadrados ordinarios (MCO), que considera como http://www.ub.edu/aplica_in
recta que mejor se ajusta a la que minimiza la suma de los cuadrados de los residuos.
Si la recta de mejor ajuste es 𝛾 for/spss/cap7-2.htm/
^ =𝑎 + 𝑏 𝑋
𝑖 𝑖
12
10
0
10 12 14 16 18 20 22
X Y XY Ecuación de la recta
11 121 22 3.27
Fórmulas
2
14 196 3 42 4.62
16 256 5 80 5.52
15 225 6 90 5.07
16 256 5 80 5.52
18 324 3 54 6.42
20 400 7 140 7.32 Sustitución
21 441 10 210 7.77
14 196 6 84 4.62
20 400 10 200 7.32 • b
19 361 5 95 6.87
11 121 6 66 3.27
195 3297 68 1163 62.07
Error de la mejor estimación de la recta
Definición: Formulas: Y
2 3.27 1.61
El error estándar de estimación
3 4.62 2.62
mide la dispersión de los valores 5 5.52 0.27
6 5.07 0.86
observados alrededor de la línea de
5 5.52 0.27
regresión 3 6.42 11.69
Bibliografía: Sustitución:
7 7.32 0.10
Libro: inferencia estadística 2.03 10 7.77 4.97
Autor: Profesores UNAM
Editorial: PAPIPEM 6 4.62 1.9
10 7.32 7.18
Diagrama de Flujo
5 6.87 3.496
15
6 3.27 7.45
10
68 62.07 41.58
5
0
10 12 14 16 18 20 22
COEFICIENTE DE RELACIÓN DE PEARSON
X Y XY Definición:
11 121 2 4 22
14 196 3 9 42 Los coeficientes de correlación son medidas
16 256 5 25 80 que indican la situación relativa de los mismos
15 225 6 36 90 sucesos respecto a las dos variables, es decir,
16 256 5 25 80 son la expresión numérica que nos indica el
18 324 54 grado de relación existente entre las 2

3 9
variables y en qué medida se relacionan.
20 400 7 49 140
21 441 10 100 210
Bibliografía:
14 196 6 36 84
20 400 10 100 200 Libro: Introducción a la probabilidad y
estadística.
19 361 5 25 95
Autor: William mendenhall.
11 121 6 36 66
195 3297 68 454 1163
Fórmulas: Valor Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
Sustitución:
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta
• 0.7285
Valor Significado
0.618 Correlación positiva moderada
COEFICIENTE DE RELACIÓN DE SPEARMAN
X Y Rango Rango d
X Y Definición:
11 2 1.5 1 0.5 0.25
14 3 3.5 2.5 1 1 Es una medida de la correlación (la asociación o
16 5 6.5 5 1.5 2.25 interdependencia) entre dos variables aleatorias

16 5 6.5 5 1.5 2.25
15 6 5 8 -3 9 continuas.
15 6 5 8 -3 9
16
16 5
5 6.5
6.5 5
5 1.5
1.5 2.25
2.25 Este coeficiente se emplea cuando una o ambas
18
18 3
3 8
8 2.5
2.5 5.5
5.5 30.25
30.25 escalas de medidas de las variables son
20
20 7
7 10.5
10.5 10
10 0.5
0.5 0.25
0.25 ordinales, es decir, cuando una o ambas escalas
21 10 12 11.5 1.5 2.25
21 10 12 11.5 1.5 2.25 de medida son posiciones.
14 6 3.5 8 4.5 20.25
14 6 3.5 8 4.5 20.25
20 10 20.5 11.5 9 81
20 10 20.5 11.5 9 81 Fórmulas: Sustitución:
19 5 9 5 4 16
19 5 9 5 4 16
11 6 1.5 8 -6.5 42.25
11 6 1.5 8 -6.5 42.25
195 68 207 • 72
195 68 207
Bibliografía:
Libro: Estadística
Autor: Murray R. Spiegel
RELACIÓN ENTRE EL COEFICIENTE DE PEARSON Y SPEARMAN
Definición: Bibliografía: Inversión Rendimiento,
,X Y
En las variables podemos observar que son Libro: Introducción a la probabilidad y
estadística. 11 2
proporcionales en la mayoría.
Autor: William mendenhall. 14 3
Con estos datos se comprueba que la
correlación de Spearman es exactamente igual 16 5
al coeficiente de correlación de Pearson, 15 6
calculado sobre el rango de observaciones.
16 5
18 3
12 20 7
10 21 10
8 14 6
6 20 10
4 19 5
2 11 6
0
10 12 14 16 18 20 22
VARIANZA Y DESVIACIÓN ESTANDAR
Fórmula Sustitución Resultados
Bibliografía:
Libro: Introducción a la probabilidad y
estadística.
n-2
Definición:
Desviación estándar:
La desviación es una medida de dispersión para variables de razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.
Varianza:
En teoría de probabilidad, la varianza de una variable aleatoria es una medida de dispersión definida como
la esperanza del cuadrado de la desviación de dicha variable respecto a su media.
COEFICIENTE DE DETERMINACIÓN
Y Definición Conclusión
2 3.27 13.44 1.61
Es un estadístico usado en el contexto de un modelo
3 4.62 7.11 2.62 estadístico cuyo principal propósito es predecir El resultado indica que el
5 5.52 0.44 0.27 futuros resultados o probar una hipótesis. 55.209% de los resultados
6 5.07 0.11 0.86 seguira siendo parecida a la
media, los datos pueden
5 5.52 7.11 0.27
Fórmula variar por muy poco
3 6.42 7.11 11.69
7 7.32 1.77 0.10
10 7.77 18.77 4.97
6 4.62 0.11 1.9 Bibliografía:
Sustitución
10 7.32 18.77 7.18
Libro: Introducción a la
5 6.87 0.44 3.496
probabilidad y estadística.
6 3.27 0.11 7.45 Autor: William mendenhall.
68 62.07 75.29 41.58
RELACIÓN ENTRE EL COEFICIENTE DE DETERMINACIÓN Y EL
COEFICIENTE DE CORRELACIÓN DE PEARSON
Datos Comprobando Conclusión
Coeficiente de correlación de Pearson 0.72 En el caso de la regresión lineal el

coeficiente de correlación de Pearson es
Coeficiente de Determinación 0.62 simplemente el cuadrado del
coeficiente de determinación
¿POR QUÉ COINCIDEN PEARSON Y SPERMAN?

TANTO EL COEFICIENTE DE RELACION DE PEARSON COMO EL DE SPERMAN TIENEN LAS MISMAS NORMAS
DE INTERPRETACION:
*SOLAMENTE TOMA VALORES ENTRE 1 Y -1
*EL CERO INDICA QUE NO EXISTE CORRELACION
*EL VALOR NUMERICO INDICA LA MAGNITUD DE LA CORRELACION
*EL COEFICIENTE DE CORRELACION CUANTIFICA LA CORRELACION ENTRE DOS VARIABLES, CUANDO
ESTAS REALMENTE EXISTEN
*EL SIGNO INDICA LA DIRECCION DE LA CORRELACION
Intervalos de confianza.
 INTERVALOS DE CONFIANZA PARA :
1) Datos: 2) Formulas: 5) Sustitución:

𝑏 − 𝑇

b=0.45
=128.25
( 𝛼
2
) 𝑠 < 𝛽 < 𝑏 +( 𝑇 ) 𝑠𝛼
2

S=2.06 √ 𝑆 𝑥𝑥 √ 𝑆 𝑥𝑥
n=12
6) Resultado:
4) Tabla de distribución
3) Calculando : T
𝛾 =n − 2=10
I.C.=95%
γ 0.05
10 2.22 =
𝜏 𝛼 /2 =2.22
INTERVALOS DE CONFIANZA.

• INTERVALOS DE CONFIANZA PARA :
1) Datos: 2) Formulas y sustitución :

a=-1.68
=128.25
S=2.06 Sustitución:
n=12
3297
Tabla de distribución T
3) Calculando :
I.C.=95%
𝛾 =n − 2=10
γ 0.05
10 2.22 =
𝜏 𝛼 /2 =2.22


=128.25
S=2.06
n=12 Sustitución:
Muestra x= 11 = 0.775.76
=3.27
=16.25
3) Calculando : Tabla de distribución T

I.C.=95%
𝛾 =n − 2=10
γ 0.05
10 2.22 =
𝜏 𝛼 /2 =2.22

• INTERVALOS DE CONFIANZA PARA:

=128.25
S=2.06
n=12 Sustitución:
Muestra x= 11 = -1.94
=3.27
=16.25

I.C.=95%
𝛾 =n − 2=10
γ 0.05
10 2.22 =
𝜏 𝛼 /2 =2.22
• RESULTADOS DE INTERVALOS DE CONFIANZA:
Intervalo de confianza
para
−0.364
< 𝛽 <0.443
Intervalo de confianza −8.37 <𝛼 < 5.01
para
0.77 < 𝜇 𝑌 <5.76
para 𝑋𝑜
−1.94<𝑌 𝑜 <8.48
para
PRUEBA DE HIPÓTESIS PARA
DATOS FÓRMULA SUSTITUCIÓN Tabla: A.4

= 10
b=0.45 γ 0.05
S=2.06 2.22 =
10
GRÁFICA CONCLUSIONES
Se rechaza , el valor calculado resulto

ser menor a 1 esto implica que hay
una correlación lineal significativa
entre la variable ¨y¨ y la variable
independiente
DATOS FÓRMULA SUSTITUCIÓN Tabla: Valores críticos de la

distribución t
= 10
a=-1.68
γ 0.05
3297
S=2.06 10 2.22 =

ser diferente a 0 esto implica que hay
independiente
PLANTEAMIENTO DE PROBLEMA 2
Años Ventas
• Un gerente de ventas reunió los datos Experiencia Anuales(y)
(x)
siguientes relacionados con las ventas anuales
1 80
en miles de pesos y los años de experiencia de 3 97
diez vendedores. Estime las ventas anuales 4 92
para un vendedor con 7 años de experiencia. 4 102
6 103
8 111
10 119
10 123
11 117
DIAGRAMA DE FLUJO
Definición:
140 Diagrama de flujo
120
• Es un diagrama que describe un proceso,
100
sistema o algoritmo informático. Se usan
80
ampliamente en numerosos campos para
60
documentar, estudiar, planificar, mejorar y
comunicar procesos que suelen ser complejos
40
en diagramas claros y fáciles de comprender.
20
0
0 2 4 6 8 10 12 14
Bibliografía:
https://www.lucidchart.com/pages/es/qué-es-un-
diagrama-de-flujo
Mejor estimación de la recta
Mejor estimación de la recta: Bibliografía:
Definición: Para estimar la línea de regresión poblacional a partir de la nube de puntos

se utiliza el método de los mínimos cuadrados ordinarios (MCO), que considera como http://www.ub.edu/aplica_in
recta que mejor se ajusta a la que minimiza la suma de los cuadrados de los residuos.
Si la recta de mejor ajuste es 𝛾 for/spss/cap7-2.htm/
^ =𝑎 + 𝑏 𝑋
𝑖 𝑖
140
120
100
80
60
40
20
0
0 2 4 6 8 10 12 14
X Y XY
Ecuación de la recta
1 1 80 80 84
Fórmulas
3 9 97 291 92
4
4 16
16 92
92 368
368 96
96
4
4 16
16 102
102 408
408 96
96
6
6 36
36 103
103 618
618 104
104
8
8 64
64 111
111 888
888 112
112
10
10 100
100 119
119 1190
1190 120
120
10 100 123 1230 120 Sustitución
10 100 123 1230 120
11 121 117 1287 123
11 121 117 1287 123
13 169 136 1768 132
13 169 136 1768 132
• b
70 632 1080 8128 1079

70 632 1080 8128 1079
= 80 + 4(x)
ERROR DE LA MEJOR ESTIMACIÓN DE LA RECTA
Definición: Formulas: Y
80 84 16
• El error estándar de estimación 97 92 25
representado por el símbolo Syx 92 96 16
mide la dispersión de los 102 96 36
valores observados alrededor de 103 104 1
la línea de regresión. 111 112 1
Bibliografía: Sustitución: 119 120 1
https://www.gerencie.com/error- 123 120 9
estandar-de-estimacion-en-excel-
2007.html 4.61 117 123 36
136 132 16
Diagrama de Flujo
15
10
1080 1079 157
5
0
10 12 14 16 18 20 22
COEFICIENTE DE RELACIÓN DE PEARSON
X Y XY Definición:
1 1 80 80 84 6400
3 9 97 291 92 9409 Los coeficientes de correlación son medidas
que indican la situación relativa de los mismos
4 16 92 368 96 8464
sucesos respecto a las dos variables, es decir,
4 16 102 408 96 10404
son la expresión numérica que nos indica el
6 36 103 618 104 10609
grado de relación existente entre las 2
8 64 111 888 112 1231
variables y en qué medida se relacionan.
10 100 119 1190 120 114161
10 100 123 1230 120 15129
Bibliografía:
11 121 117 1287 123 13689
13 169 136 1768 132 18496
estadística.
195 3297 68 454 1163 119082 Autor: William mendenhall.
Fórmulas: Valor Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
Sustitución:
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta
Valor Significado
0.618 Correlación positiva moderada
COEFICIENTE DE RELACIÓN DE SPEARMAN
Definición:
X Y Rango Rango d
X Y Es una medida de la correlación (la asociación o
1 80 1 1 0 0 interdependencia) entre dos variables aleatorias
3 97 2 2 0 0 continuas.
4 92 3.5 3 0.5 0.25
4 102 3.5 4 -0.5 -0.25 Este coeficiente se emplea cuando una o ambas
4 102 3.5 4 -0.5 -0.25
6 103 5 5 0 0 escalas de medidas de las variables son
6 103 5 5 0 0
8
8 111
111 6
6 6
6 0
0 0
0
ordinales, es decir, cuando una o ambas escalas
10
10 119
119 7.5
7.5 7
7 0.5
0.5 0.25
0.25 de medida son posiciones.
10
10 123
123 7.5
7.5 8
8 -0.5
-0.5 -0.25
-0.25
11
11 117
117 9
9 9
9 0
0 0
0
Fórmulas: Sustitución:
13
13 136
136 10
10 10
10 0
0 0
0
70
70 180
180 0
0
Bibliografía:

Interpretación: es correlación
Libro: Estadística
muy alta
RELACIÓN ENTRE EL COEFICIENTE DE PEARSON Y SPEARMAN
Definición:
• El coeficiente de correlación de Pearson permite medir la fuerza y la dirección de la asociación de dos variables
cuantitativas aleatorias con una distribución bivariada conjunta. En este caso sólo buscaremos comprobar que
cada una por sí solas presenten una distribución normal univariada. Los valores de la correlación de Pearson van
desde -1 hasta 1, siendo los valores extremos los que indican mayor correlación entre variables, y siendo el 0 el
punto que indica la no existencia de correlación.
• Para la interpretación de los resultados, tanto para Pearson y Spearman hay que considerar lo siguiente: Si el
coeficiente de correlación arrojado va entre 0 y 0,2, entonces la correlación es mínima; si va entre 0,2 y 0,4, es
una correlación baja; si va entre 0,4 y 0,6, entonces es una correlación moderada, ya entre 0,6 y 0,8 es una
correlación buena; finalmente, entre 0,8 y 1, es una correlación muy buena. Esto mismo aplica en negativo.
• El coeficiente de correlación de Spearman, al igual que el de Pearson, muestra una asociación
entre variables. A diferencia del anterior, permite obtener un coeficiente de asociación ente variables que
no se comportan normalmente, entre variables ordinales. Se calcula en base a una serie de rangos
asignados. Tal como en Pearson, los valores van de - 1 a 1, siendo 0 el valor que indica no correlación, y los
signos indican correlación directa e inversa
Bibliografía:
estadística.
VARIANZA Y DESVIACIÓN ESTANDAR
Fórmula Sustitución Resultados

4.63 Bibliografía:
107.41
568 Libro: Introducción a la probabilidad y
estadística.
4.61
Definición:
Desviación estándar:
La desviación es una medida de dispersión para variables de razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.
Varianza:
En teoría de probabilidad, la varianza de una variable aleatoria es una medida de dispersión definida como
la esperanza del cuadrado de la desviación de dicha variable respecto a su media.
Relación entre desviación estándar y el error
estándar en la mejor estimación de la recta
En este caso como el error estándar depende de el tamaño muestral, a los datos representados son
iguales a la distribución de la media, por ende los valores deben ser igualadas o cercanos, ya que si no hay
un crecimiento en el tamaño muestral el error será parecido a la desviación estándar pero el error siempre
debe ser menor que la desviación estándar. El error estándar es un aproximado a la desviación estándar
como referencia de la media de muestra que se tomó de una población.
Mide la dispersión de los valores observados de la línea.
Como se aplicaba en la desviación estándar, mientras más grande sea el error estándar de
estimación, mayor será la dispersión de los puntos alrededor de la línea de regresión. De manera
que inversa, si Se = 0, esperemos que la ecuación de estimación sea un estimador perfecto de la
variable dependiente.
BIBLIOGRAFIA:
www.dm.uba.ar/materias/estadistica_Q/2011/1/clase
%20regresion%20simple.pdf
Y Definición Conclusión
84 80 100 16
Es un estadístico usado en el contexto de un modelo
92 97 49 25 • El resultado indica que el
estadístico cuyo principal propósito es predecir
96 92 4 16 futuros resultados o probar una hipótesis. 92.1% de los resultados
seguira siendo parecida a
96 102 144 36
la media, los datos pueden
104 103 169 1 variar por muy poco
Fórmula
112 111 441 1
120 119 841 1
120 123 1089 9
123 117 729 36 Bibliografía:
Sustitución
132 136 2116 16
107 1080 5682 157 Autor: William mendenhall.
9
RELACIÓN ENTRE EL COEFICIENTE DE DETERMINACIÓN
Y EL COEFICIENTE DE CORRELACIÓN DE PEARSON
Datos Comprobando Conclusión
Coeficiente de correlación de Pearson 0.96 En ambos casos el R² adquiere

valores entre 0 y 1. Existen casos
Coeficiente de Determinación 0.951 dentro de la definición computacional
de R² donde este valor puede tomar
valores negativos.


a=80
=142
S=4.61 Sustitución:
n=12
Tabla de distribución T
3) Calculando :
I.C.=95%
𝛾 =n − 2=10
γ 0.05
10 2.22 =
𝜏 𝛼 /2 =2.22


B=4.63 𝑏 − 𝑇 𝑠 𝑏+ 𝑇 𝑠
=142
( 𝛼
2
) <𝛽<
( 𝛼
2
)
S=4.61 √ 𝑆 𝑥𝑥 √ 𝑆 𝑥𝑥
n=12
6) Resultado:
4) Tabla de distribución
3) Calculando : T
𝛾 =n − 2=10
I.C.=95%
γ 0.05
10 2.22 =
𝜏 𝛼 /2 =2.22


=142
S=4.61
n=12 Sustitución:
Muestra x= 11 84= 36.66
=84
=15.83

I.C.=95%
𝛾 =n − 2=10
γ 0.05
10 2.22 =
𝜏 𝛼 /2 =2.22

• INTERVALOS DE CONFIANZA PARA:

=142
S=4.61
n=12 Sustitución:
Muestra x= 11 84= 110.43
=84
=15.83

I.C.=95%
𝛾 =n − 2=10
γ 0.05
10 2.22 =
𝜏 𝛼 /2 =2.22
distribución t
= 10
a=80
γ 0.05
S=4.61 10 2.22 =
GRÁFICA

ser diferente a 0 esto implica que hay
independiente
distribución t
= 10
b=4.63 γ 0.05
S=4.61 2.22 =
10

ser menor a 1 esto implica que hay
independiente
TEMA 2
REGRESIÓN LINEAL MÚLTIPLE Y CORRELACIÓN
• Regresión Lineal Múltiple
• Cuando existe una posible relación entra varias variables independientes y otra dependiente se hace necesario el
uso de la REGRESIÓN MULTIPLE.
La regresión múltiple se usa con mayor frecuencia en las publicaciones de las investigaciones cuando se requiere
crear un modelo donde se seleccionan variables que pueden influir en la respuesta, descartando aquellas que no
aportan información, cuando se requiere detectar la interacción entre variables independientes que afectan a la
variable y cuando se requiere identificar variables confesoras.
• Correlación
• La correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables
estadísticas. Se considera que dos variables están correlacionadas cuando los valores de una de ellas varían
sistemáticamente con respecto a los valores homónimos de la otra.
• https://es.wikipedia.org/wiki/Correlaci%C3%B3n
• http://estadisticauazteca.blogspot.mx/2010/07/regresion-multiple.html
REGRESIÓN POLINOMIAL
Planteamiento
Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:
Estatura
Pesos (Y)
(X)
186 85
189 85
190 86
192 90
193 87
193 91
198 93
201 103
203 100
205 101
X Y XY Y
1.86 85 3.45 6.43 11.96 158.1 294.06
1.89 85 3.57 6.75 12.75 160.65 303.62
1.90 86 3.61 6.85 13.03 163.4 310.46
1.92 90 3.68 7.07 13.58 172.8 324.06
1.93 87 3.72 7.18 13.87 167.91 324.24
1.93 91 3.72 7.18 13.87 175.63 338.96
1.98 93 3.92 7.76 15.36 184.14 364.59
2.01 103 4.04 8.12 16.32 207.03 416.13
2.03 100 4.12 8.36 16.98 203 412.09
2.05 101 4.20 8.61 17.66 2.05 424.45
19.50 921 34.31 74.31 145.38 1594.71 3512.66
Formulas:
Δ 𝑏0
𝑏0 =
Δ𝐷
Δ 𝑏1
𝑏1 =
Δ𝐷
Δ 𝑏2
𝑏2 =
Δ𝐷
9
RESOLVER ECUACIONES POR
CRAMER
∆ D=1042.083

SOLUCIÓN PARA
−7298.96
∆ 𝑏𝑜= =−7.004
1042.083

SOLUCION PARA
522071102
∆ 𝑏1= =50.098
1042.083

SOLUCION PARA
216.01
∆ 𝑏2= =0.207
1042.083
ECUACIÓN DE LA RECTA POLINOMIAL
X
1.86 86.85
1.89 88.34
1.90 88.89
1.92 89.91
91 1.93 90.41
90.5
P 1.93 90.41
90
E 1.98 92.96
89.5
S
89 2.01 94.48
O
88.5 S 2.03 95.50
88 (y) 2.05 95.52
87.5
19.50 913.27
87
1.89 1.9 1.92 1.93
Estatura (x)
FÓRMULA DEFINICIÓN
• el coeficiente de determinación, denominado R² y pronunciado R

cuadrado, es un estadístico usado en el contexto de un modelo
estadístico cuyo principal propósito es predecir futuros resultados o
SUSTITUCIÓN probar una hipótesis.
El coeficiente determina la calidad del modelo para replicar los

resultados, y la proporción de variación de los resultados que puede
explicarse por el modelo.
CONCLUSION
El resultado indica que el 98.14% de los resultados seguira
siendo parecida a la media, los datos pueden variar por muy
poco • Bibliografía
• https://es.wikipedia.org/wiki/Coeficiente_de_determinaci%C3%B3n
REGRESIÓN POLINOMIAL
Planteamiento (ejemplo 2)
Dados los datos siguientes:
(X) (Y)
0 9.1
1 7.37
2 3.2
3 4.6
4 4.8
5 2.9
6 5.7
7 7.1
8 8.8 BIBLIOGRAFIA:
9 10.2 Libro: Introducción a la probabilidad y
estadística.
X Y XY Y
0 9.1 0 0 0 0 0
1 7.37 1 1 1 7.37 7.37
2 3.2 4 8 64 6.4 12.8
3 4.6 9 27 81 13.8 41.4
4 4.8 16 64 256 19.2 76.8
5 2.9 25 125 625 14.5 72.5
6 5.7 36 216 1296 34.2 199.5
7 7.1 49 343 2401 49.7 347.9
8 8.8 64 512 4096 70.4 536.2
9 10.2 81 729 6561 81.6 826.2
45 63.77 285 2025 15133 307.3 2153.3

Ahora suponga que se desea ajustar la ecuación
polinomial
=
Predicción de una variable de respuesta

cuantitativa a partir de una variable
predictora cuantitativa, donde la relación se
modela como una función polinomial de
orden n
Formulas:
Δ b0
b0 =
ΔD
Δ b1
b1 =
ΔD
Δ b2
b2 =
ΔD
10
285
307.3
307.3
15,133 2153.3
2153.3
RESOLVER ECUACIONES POR CRAMER
285
2153.3
285
15133
∆ D=2289.524

63.77
285
15,333
2 85 2025
- 45 3 07.3 2025
+ 285 3 07.3 285
63.77 2025 1533 2153.3 1533 2153.3 2025
63.77 [ - ] = -233635.42
45 [ - ] = -175020372
285 [ - ] = 24730875
= -233635.42 – 175020372+ 24730875

= 8.698
10
307.3
15,333
3 07.3 2025 4 5 2025

- 63.7 285 + 285 4 5 307.3
10 2153.3 1533 1533 285 2153.3
10 [ - ] = -38893416
63.7 [ - ] = -32368518
285 [ - ] = 2655630
= -38893416- 32368518 + 2655630

= -2.341
10
285
2153.3
10 2 85 307.3
- 45 4 5 307.3 + 63.77 4 5 285
2025 2153.3 285 2153.3 285 2025
10 [ - ] = -86775
45 [ - ] = 419310
63.77 [ - ] = 631323
= 0. 288
ECUACIÓN DE LA RECTA POLINOMIAL
(X)
(X)
0 8.989
01 8.989
6.645
21 6.645
5.168
3
2 4.267
5.168
4
3 3.942
4.267
5
4 4.193
3.942
6
5 5.02
4.193
8 7 6.423
6 5.02
8
7 8.402
6.423
6
9
8 10.957
8.402
4
9 10.957
2
0
1 2 3 4 = 8.698 − (2.341)(2) + (0.288)(2 = 5.168.
FÓRMULA DEFINICIÓN

estadístico cuyo principal propósito es predecir futuros resultados o
SUSTITUCIÓN
probar una hipótesis.

explicarse por el modelo.
CONCLUSION
poco • Bibliografía
• https://es.wikipedia.org/wiki/Coeficiente_de_determinaci%C3%B3n
TEMA 3
REGRESIÓN NO LINEAL MÚLTIPLE
TEMARIO:
• Ecuación de Potencia
• Ecuación Exponencial
• Ecuación logarítmica
TEMA 3.
REGRESIÓN NO LINEAL MÚLTIPLE
• Genera una ecuación para describir la relación no lineal entre una variable de respuesta
continua y una o más variables productoras, y predice nuevas observaciones.
Bibliografía
https://es.slideshare.net/jjgibaja/regresin-lineal-mltiple
ECUACIÓN DE POTENCIA
Definición
La regresión examina la relación entre dos variables, pero restringiendo una de ellas con
el objeto de estudiar las variaciones de una variable cuando la otra permanece constante.
En otras palabras, la regresión es un método que se emplea para predecir el valor de una
variable en función de valores dados a la otra variable.

Ecuación:
Bibliografía
http://www.monografias.com/trabajos89/regresion-potencial-metodo-minimos-cuadrados/regresion-potencial-
metodo-minimos-cuadrados.shtml
PLANTEAMIENTO:
• Sea el siguiente conjunto de valores, las lecturas de un experimento donde X

es el volumen (variable independiente) e Y es la presión de una masa dada
de gas (variable resultante).
X Volumen 1 2 3 4 5 6 7
Y Presión 7 30 90 170 290 450 650
BIBLIOGRAFIA:
Libro: Introducción a la probabilidad y estadística.
x y Log x Log y Log x log y
1 7 0 0.845 0 0
2 30 0.301 1.447 0.09 0.44
3 90 0.477 1.954 0.227 0.932
4 170 0.602 2.23 0.362 1.342
5 290 0.698 2.462 0.488 1.721
6 450 0.778 2.653 0.605 2.064
7 650 0.845 2.812 0.714 2.377
28 1687 3.702 14.435 2.489 8.882

PROCEDIMIENTO:

7

Grafica:
𝑌
^ =𝑎 𝑥 𝑏 Tabla:
y
700
7 6.572 54956.48 54756
600 30 33.482 43063.72 44521
500 90 86.787 4958.97 22801

170 170.58 2401 5041
400
290 288.12 2209 2401

300
450 442.16 40465.34 43681
200
650 635.09 155306.9 167281
100
1687 1662.79 241
303361.41 340482
0
0 1 2 3 4 5 6 7 8
FÓRMULA
DEFINICIÓN

SUSTITUCIÓN estadístico cuyo principal propósito es predecir futuros resultados o

CONCLUSION explicarse por el modelo.

poco
BIBLIOGRAFIA:
estadística.
PLANTEAMIENTO (EJEMPLO 2):
En determinados experimentos, en su mayoría biológicos, la
dependencia entre las variables X e Y es de forma exponencial, en cuyo
caso interesa ajustar a la nube de puntos ax la mejor función.
y
1 3
1.2 3.4
1.5 5
2 2
3 4.1
3.7 5
4 7
BIBLIOGRAFIA: 4.5 6.5
estadística. Σ 20.9 Σ 36
1 3 0 0.477121255 0 0
1.2 3.4 0.07918125 0.531478917 0.00626967 0.04208316
1.5 5 0.17609126 0.698970004 0.03100813 0.12308251
2 2 0.30103 0.301029996 0.09061906 0.09061906
3 4.1 0.47712125 0.612783857 0.22764469 0.2923722
3.7 5 0.56820172 0.698970004 0.3228532 0.39715596
4 7 0.60205999 0.84509804 0.36247623 0.50879972
4.5 6.5 0.65321251 0.812913357 0.42668659 0.53100518

Procedimiento:
3) Sustitución:
1) Datos: 2) Formulas:
b
b
Grafica:
Tabla:
𝑦 = 𝑎𝑙𝑛𝑥 +𝑏
^
7
ŷ
6 3 2.867324958
4.5 2.66562779 2.25
3.4 3.12009764
5 4.5 1.90413052 1.21
5 3.45998862
4.5 1.08162367 0.25
4
2 3.953385811
4.5 0.29878707 6.25
3 4.1 4.770533551
4.5 0.0731884 0.16
5 5.257413385
4.5 0.57367504 0.25
2
7 5.450815515
4.5 0.90405014 6.25
1 6.5 5.756582194
4.5 1.57899881 4
(y)= 36 (ŷ)= 34.6361417 =9.08008145 =20.62
0
0 1 2 3 4 5 6 7 8 9
FÓRMULA
DEFINICIÓN


• El resultado indica que el 44.3% de los resultados
seguira siendo parecida a la media, los datos pueden
variar por muy poco
BIBLIOGRAFIA:
estadística.
ECUACIÓN EXPONENCIAL

Definición
• Una regresión exponencial es el proceso de encontrar la ecuación de la función
exponencial que se ajuste mejor a un conjunto de datos. Como un resultado,
obtenemos una ecuación
• La potencia predictiva relativa de un modelo exponencial está denotada por .
El valor de varía entre 0 y 1. Mientras más cercano el valor esté de 1, más
preciso será el modelo.
Ecuación:
Bibliografía
https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/exponential-
regression
Planteamiento:
El volumen de ventas mensuales (y) y los años de experiencia en ventas
(x) registradas de una muestra aleatoria de 6 vendedores de la Empresa
“LOZANO” procesadora de alimentos, se dan en la siguiente tabla.
Estime la ecuación de regresión exponencial.
x y
1 10
2 40
3 120
4 300
5 800 Libro: probabilidad y estadística para ingeniería y

administración.
6 500 Autor: William W. Hines.
1 10
2.30258509 1 2.302585093
2 40
3.68887945 4 7.377758908
3 120
4.78749174 9 14.36247523
4 300
5.70378247 16 22.8151299
5 800
6.68461173 25 33.42305864
6 500
6.2146081 36 37.28764859
PROCEDIMIENTO:

b
Grafica:
Tabla:
𝑦= 𝑎
^ 𝑒 𝑏𝑥
8
ŷ
7
10 16.32096
6 1770 3075390.18 3097600
40 37.87409
5 1770 3000260.16 2992900
120 87.88986
4 1770 2829494.51 2722500
300 203.9555
3 1770 2452495.46 2160900
800 473.295
2 1770 1681443.79 940900
500 1098.319
1770 451155.315 1612900
1
(y)=1770 (ŷ)=1098.319 =13490239.4 =13527700
0
140 160 180 200 220 240 260 280 300
FÓRMULA
DEFINICIÓN


variar por muy poco
BIBLIOGRAFIA:
estadística.
• Sea el siguiente conjunto de valores, las lecturas de un experimento donde X

es el volumen (variable independiente) e Y es la presión de una masa dada
de gas (variable resultante).
X Volumen 1 2 3 4 5 6 7
Y Presión 7 30 90 170 290 450 650
BIBLIOGRAFIA:
x y Log x Log y Log x log y
1 7 0 0.845 0 0
2 30 0.301 1.447 0.09 0.44
3 90 0.477 1.954 0.227 0.932
4 170 0.602 2.23 0.362 1.342
5 290 0.698 2.462 0.488 1.721
6 450 0.778 2.653 0.605 2.064
7 650 0.845 2.812 0.714 2.377
28 1687 3.702 14.435 2.489 8.882

PROCEDIMIENTO:
2) Formulas: 3) Sustitución:

Grafica:
Tabla:
𝑦= 𝑎
^ 𝑒 𝑏𝑥
y
675 7 6.572 54956.48 54756
600
30 33.482 43063.72 44521
525
90 86.787 4958.97 22801
450
375 170 170.58 2401 5041
300
290 288.12 2209 2401
225
450 442.16 40465.34 43681
150
75 650 635.09 155306.9 167281
0
0 1 2 3 4 5 6 7
1687 1662.79 241
303361.41 340482
FÓRMULA
DEFINICIÓN



poco
BIBLIOGRAFIA:
estadística.
ECUACIÓN LOGARITMICA
Definición
• Este modelo de regresión es una alternativa cuando el modelo lineal no logra un
coeficiente de determinación apropiado, o cuando el fenómeno en estudio tiene un
comportamiento que puede considerarse potencial o logarítmico.
• La forma más simple de tratar de establecer la tendencia es a través de un diagrama de

dispersión o nube de puntos.
Ecuación:
Bibliografía
http://reyesestadistica.blogspot.mx/2011/07/analisis-de-regresion-
logaritmica.html
PLANTEAMIENTO:
• En la producción de herramientas, el método para deformar acero a temperatura normal
mantiene una relación inversa con la dureza del mismo ya que, a medida que la
deformación crecer, se afectada la dureza del acero. Para investigar esta relación se ha
tomado la siguiente muestra
X: Deformación en (mm) Y: Dureza Brinell (en
6 68
9 67
11 65
13 53
22 44
26 40
28 37 BIBLIOGRAFIA:
33 34 probabilidad y estadística.
35 32 Autor: William mendenhall.
PROCEDIMIENTO:
1) Datos: 2) Formulas:
1183.132 3) Sustitución:

440
76.506
25.685
Grafica:
Tabla:
^
80
70
60
50
40
30
20
10
0
0 5 10 15 20 25 30 35 40
FÓRMULA
DEFINICIÓN


tiene un buen coeficiente y se podria considerar buen
modelo para el metodo para deformar acero.
BIBLIOGRAFIA:
estadística.
En determinados experimentos, en su mayoría biológicos, la

dependencia entre las variables X e Y es de forma exponencial, en cuyo
caso interesa ajustar a la nube de puntos a la mejor
x
función. y
1 3
1.2 3.4
1.5 5
2 2
3 4.1
3.7 5
4 7
BIBLIOGRAFIA: 4.5 6.5
estadística. Σ 20.9 Σ 36
x y ln x ln (ln x) y y2
1 3 0 0 0 9
1.2 3.4 0.1823 0.364 0.6198 11.56
1.5 5 0.4054 0.81 2.027 25
2 2 0.6931 1.386 1.3862 4
3 4.1 1.0986 2.197 4.5042 16.81
3.7 5 1.3083 2.616 6.5415 25
4 7 1.3862 2.772 9.7034 49
4.5 6.5 1.5040 3.008 9.776 42.25
Σ 20.9 36 4.5 6.5779 13.153 34.5581 182.62

PROCEDIMIENTO:

n=8
Grafica:
Tabla:
^
y
7
3 2.7811 2.25 2.954

6
3.4 3.162 1.21 1.79
5
5 3.628 0.25 0.76
4
2 4.229 6.25 0.073
3 4.1 5.077 0.16 0.332
2 5 5.515 0.25 1.03

7 5.678 6.25 1.387
1
6.5 5.924 4 2.02

0
0 1 2 3 4 5 6 7 8 9
36 35.994 4.5 20.62 10.346
FÓRMULA
DEFINICIÓN


variar por muy poco
BIBLIOGRAFIA:
estadística.
Problema hecho por exponencial,
potencial y logaritmica
Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas

por cierto fabricante que aún pueden usarse después de recorrer cierto número
de millas:
Miles de millas recorridas (X) 1 2 5 15 25 30 35 40

Porcentaje útil (Y) 15 20 24 30 55 85 95 99
Ecuación Exponencial

de millas:
Fórmulas:

1 15 2.70 1 19.125 2.7
2 20 2.99 4 19.125 5.98
5 24 3.17 25 19.125 15.85
15 30 3.40 225 19.125 51
25 55 4 625 19.125 100
30 85 4.44 900 19.125 133.2
35 95 4.55 1225 19.125 159.25
40 99 4.59 1600 19.125 183.6
Sustitución:
( 0.048 ) ( 1 ) ( 0.048 ) ( 25 )
𝑦 = ( 16.64 ) 𝑒
^ =17.45 𝑦= ( 16.64 ) 𝑒
^ =55.24
𝑦 = ( 16.64 ) 𝑒( 0.048 ) ( 2 ) =18.31
^ 𝑦= ( 16.64 ) 𝑒( 0.048 ) ( 30 ) =70.23
^
( 0.048 ) ( 5 ) ( 0.048 ) ( 35 )
𝑦 = ( 16.64 ) 𝑒
^ =21.15 𝑦= ( 16.64 ) 𝑒
^ =89.28
( 0.048 ) ( 15 ) ( 0.048 ) ( 40 )
𝑦= ( 16.64 ) 𝑒
^ =34.18 𝑦= ( 16.64 ) 𝑒
^ =113.5
17.45 15 52.875 1254.93 1434.51
18.31 20 52.875 1194.73 1080.76
21.15 24 52.875 1006.47 833.76
34.18 30 52.875 349.5 523.26
55.24 55 52.875 5.59 4.51
70.23 85 52.875 301.19 1032.01
89.28 95 52.875 1325.32 1774.51
113.5 99 52.875 3675.39 2127.51
Fórmula:
120
Sustitución
100
80
60
1 17.45
1 17.45
2 18.31
2 18.31 40
5 21.15
5 21.15
15 34.18
15 34.18 20
25 55.24
25 55.24
30 70.23
30 70.23
35 89.28 0
0 2 4 6 8 10 12 14
35 89.28
40 113.5
40 113.5
Ecuación Potencial

de millas:
Fórmulas:

log y log x log y
1 15 0 1.176 0 0
2 20 0.3 1.3 0.6 0.39
5 24 0.698 1.38 1.39 0.96
15 30 1.17 1.47 2.35 1.72
25 55 1.39
log 1.74y
log
2.79
log log2.41
x log y
30 85 1.47 1.93 2.95 2.83
35 95 1.54 1.97 3.08 3.03
40 99 1.6 1.99 3.2 3.184
Sustitución:
27.96
0.16 0.16
𝒚 =( 27.96 ) (1 )
^ =27.96 𝒚 = ( 27.96 ) ( 25 )
^ = 46.8
0.16 0.16
𝒚 = ( 27.96 ) ( 2 )
^ =3 1.23 ^
𝒚 = ( 27.96 ) ( 30 ) =4 8
0.16
𝒚 =( 27.96 ) (5 )
^
0.16
=36.17 𝒚= ( 27.96 ) (35 )
^ = 49.38
0.16
𝒚 =( 27.96 ) (15 )
^
0.16 𝒚= ( 27.96 ) ( 40 )
= 43.12 ^ =50.45
27.96 15 52.875 620.75 1434.51
31.23 20 52.875 468.5 1080.76
36.17 24 52.875 279.05 833.76
43.12 30 52.875 95.16 523.26
46.8 55 52.875 36.9 4.51
48 85 52.875 23.76 1032.01
49.38 95 52.875 12.21 1774.51
50.45 99 52.875 5.88 2127.51

Fórmula: 60
Sustitución
50
40
30
1 27.96
1 27.96
2 31.23
2 31.23 20
5 36.17
5 36.17
15 43.12
15 43.12
25 46.8 10
25 46.8
30 48
30 48
35 49.38
35 49.38 0
40 50.45 0 2 4 6 8 10 12 14
40 50.45
Ecuación logaritmica

de millas:
Fórmulas:

In x (y)
1 15 0 0 0 2.7
2 20 0.693 1.38 13.86 5.98
5 24 1.609 3.21 38.61 15.85
15 30 2.708 5.41 81 51
25 55 6.437 6.43
In 354.03
In x (y) 100
30 85 6.8 6.8 76500 133.2
35 95 7.11 7.11 19.125 159.25
40 99 7.37 7.37 19.125 183.6
Sustitución:

154.55 15 52.875 10337.8 1434.51
124.64 20 52.875 5150.21 1080.76
85.11 24 52.875 1039.09 833.76
37.72 30 52.875 229.67 523.26
15.68 55 52.875 1383.46 4.51
7.82 85 52.875 2029.95 1032.01
1.172 95 52.875 2673.2 1774.51
-4.58 99 52.875 3301.07 2127.51
26144.45
Fórmula:
180
Sustitución 160
140
120
100
80
1 154.55 60
1 154.55
2 124.64 40
2 124.64
5 85.11 20
5 85.11
15 37.72 0
15 37.72 0 2 4 6 8 10 12 14
25 15.68
25 15.68 -20
30 7.82
30 7.82
35 1.172
35 1.172
40 -4.58
40 -4.58
Diagrama de flujo Logaritmico Potencial Exponencial
120 180
160
100
140
120
80
100
60 80
60
40
40
20 20
0
0 5 10 15 20 25 30 35 40 45
0
0 2 4 6 8 10 12 14 16 -20
TEMA 4
DISEÑO DE EXPERIMENTOS
Análisis de varianza para un criterio
Es una metodología para analizar la variación entre muestras y la variación al interior de las
mismas mediante la determinación de varianzas. Es llamado de un criterio porque analiza una
variable dependiente.
Https://www.icicm.com/estadistica.net
Distingo entre
bloques aleatorios y No aleatorios
Los niveles de un factor se definen como los valores reales que se utilizan en el experimento.
Para cada uno de estos casos es importante determinar no sólo si cada uno de los 2 factores
influye en la respuesta, sino también si hay una interacción significativa entre ellos. En lo que
se refiere a la terminología, el experimento descrito aquí es de 2 factores,
y el diseño experimental podría ser uno completamente aleatorizado, en el que las distintas
combinaciones de tratamiento se asignan al azar a todas las unidades experimentales, o bien,
un diseño de bloques completos aleatorizados, donde las combinaciones de factores se
asignan al azar dentro de los bloques.
Ronald E. Walpole. Sexta Edicion
Tabla ANOVA para un criterio
FUENTE DE LA SUMA DE CUADRADOS GRADOS DE LIBERTAD CUADRADOMEDIO CALCULADA

VARIACIÓN
TRATAMIENTOS SSA
ERROR SSE
TOTAL SST
Tabla ANOVA para dos criterios
Fuente de Variación Suma de Grados de libertad Cuadrados de medios Calculada

Cuadrados
A SSA
B SSB
B SSB
AB SS(AB) ()
AB
Error SS(AB)
SSE )
Total SAT
Error SSE
Total SAT
Tema 4: Diseño de Experimentos
Planteamiento mediante tabla ANOVA de un factor
• Los modelos de ANOVA (ANalysis Of VAriance) son técnicas de Análisis
Multivariante de dependencia, que se utilizan para analizar datos
procedentes de diseños con una o más variables independientes
cualitativas (medidas en escalas nominales u ordinales) y una variable
dependiente cuantitativa (medida con una escala de intervalo o de razón).
• Los modelos ANOVA permiten, básicamente, comparar los valores medios
que toma la variable dependiente en J poblaciones en las que los niveles de
factores son distintos, con la finalidad de determinar si existen diferencias
significativas según dichos niveles o si, por el contrario, la respuesta en
cada población es independiente de los niveles de factores. Se trata, por
tanto, de un contraste paramétrico que extiende al caso de J poblaciones el
contraste de la igualdad de medias entre dos poblaciones independientes.
Prueba de Tukey
• Permite la formación de intervalos de confianza de 100 (1-a)%
simultáneos para todas las comparaciones pareadas. El método se basa
en la distribución del rango studentizado .El punto percentil apropiado
es la función de a, K y v = grados de libertad para .Una lista de puntos
porcentuales superiores para =0.05 como se muestra en la tabla
(puntos porcentuales superiores de la distribución de rango
studentizado: valores de q(0.05; k, v ) El método de comparaciones
pareadas de tukey implica encontrar una diferencia significativa entre las
medias i y j (i  j) si excede.
• Este método solo se aplica si se rechaza Ho
Fuente : probabilidad y estadística para ingenieros, Ronal E. Walpole, 6 edición

Prueba de Duncan
• Procedimiento de Duncan o prueba de rango múltiple de Duncan. Este
procedimiento también se basa en la noción general del rango studentizado. El
rango de cualquier subconjunto de p medias muéstrales debe excede cierto
valor de que se encuentre que cualquier de las p medias es diferente. Este velos
se llama rango de menor significancia par las p medias y se denota
• Los valores de cantidad que se denominan rango studentizado de menor
significancia, depende del nivel de significancia que se desea y del numero de
grados de libertad del cuadrado medio error. Estos valores se pueden obtener
de la tabla (Rangos studentizados significativos mínimos ) para P= 2, 3 … 10
medias
Fuente : probabilidad y estadística para ingenieros, Ronal E. Walpole, 6 edición

ANALISIS DE VARIANZAS PARA DOS CRITERIOS
Interaccion que indica efectos de ambos criterios cuando no son aditivos: cuando se dan
juntos, su efecto no es la suma de los efectos que tienen cuando estan por separado, por lo
que si en un determinado estudio se encuentra interaccion entre dos factores, no tiene
sentido estimar los efectso de los factores por separado. A la interaccion positiva, es decir
cuando el efecto de los factores actuando juntos es mayor se le llama energia de
potenciacion y si es menor se le llama interaccion negativa inhibicion.
www.hrc.es/Anova_10
PRUEBA DE KRUSKAL-WALLIS
En estadística, la prueba de Kruskal-Wallis (de William Kruskal y W. Allen Wallis) es un
método no paramétrico para probar si un grupo de datos proviene de la misma
población.
Ya que es una prueba no paramétrica, la prueba de Kruskal-Wallis no asume
normalidad en los datos.
https://es.wikipedia.org/wiki/Prueba_de_Kruskal-Wallis
Planteamiento
• Suponga que un experimento industrial un ingeniero está interesado en
cómo la absorción media de humedad en concreto varía entre cinco
mezclas diferentes de concreto. Las muestras se exponen a la humedad
por 48 horas y se decide que se prueben seis muestras para cada mezcla,
por lo que se requiere probar un total de 30 muestras. Los datos de este
experimento se muestran en la siguiente tabla.
Humedad absorbida en mezclas de concreto.
Mezcla 1 2 3 4 5
1 551.00 595.00 639.00 417.00 563.00 553
2 457.00 580.00 615.00 449.00 631.00 546.4
3 450.00 508.00 511.00 517.00 522.00 501.6
4 731.00 583.00 573.00 438.00 613.00 587.6
5 499.00 633.00 648.00 415.00 656.00 570.2

Bibliografía:
6 632.00 517.00 677.00 555.00 679.00 612
Total 3320.00 3416.00 3663.00 2791.00 3664.00 3370.8 16854.0 Libro: Introducción a la
553.33 569.33 610.50 465.17 610.67 561.80 Autor: William mendenhall.
Analisis de Varianza para la classification unilateral
Fuente de Suma de Grados de Cuadrados Calculada
Variación Cuadrados libertad de medios
Tratamiento SCT K-1 f
s
Error SCE K(n-1)
Total STC n k-1
SST Suma Total de Cuadrados

SSA Suma de Cuadrados de Tratamientos
SSE Suma de Cuadrados de Error
Cuadrado
Cuadrado Medio
Medio del
del Tratamiento
Tratamiento
Cuadrado
Cuadrado Medio
Medio del
del Error
Error
Datos Formulas
H0: µ1 = µ2 = µ3
= µ 4 = µ5 = µ 6
H1: Al menos
dos no son
significativas.
α=0.05
n=6
k=5
Sustitucion
Análisis de Varianza para la clasificación unilateral
Tratamiento 8536.6 4 21339.15 F=4.30
s
Error 124021 25 4960.84
Total 209377 29 26299.99
Valor Critico Formula Sustitución Valor Critico

Tabla puntos
porcentuales
(A.22)
Bibliographic
Bibliographic Conclusión
https://olicarrillo.files.wordpress.co
https://olicarrillo.files.wordpress.co Se rechaza la hipótesis nula . Se acepta
m/2013/02/estadistica-ii.pdf
m/2013/02/estadistica-ii.pdf que al menos dos mezclas no son iguales.
Prueba de Tukey
• El método de Tukey se utiliza en ANOVA para crear intervalos
de confianza para todas las diferencias en parejas entre las
medias de los niveles de los factores mientras controla la tasa de
error por familia que especifique. Es importante considerar la
tasa de error por familia cuando se realizan múltiples
comparaciones debido a que la probabilidad de cometer un
error tipo I para una serie de comparaciones es mayor que la
tasa de error para cualquier comparación individual.
• Bibliografía
• https://es.slideshare.net/JaimeIncaGuerrero/anova-prueba-de-
tukey
(Continuación del problema
anterior)
Mezcla 1 2 3 4 5
1 551.00 595.00 639.00 417.00 563.00 553
2 457.00 580.00 615.00 449.00 631.00 546.4
3 450.00 508.00 511.00 517.00 522.00 501.6
4 731.00 583.00 573.00 438.00 613.00 587.6
5 499.00 633.00 648.00 415.00 656.00 570.2
6 632.00 517.00 677.00 555.00 679.00 612
Total 3320.00 3416.00 3663.00 2791.00 3664.00 3370.8 16854.0
553.33 569.33 610.50 465.17 610.67 561.80

Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17
553.33
569.33
569.33
610.5
610.5
610.67
610.67
Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17 145.5 145.33 104.16 88.16
553.33
553.33 57.34
57.34 57.17
57.17 16
16
569.33
569.33 41.34
41.34 41.17
41.17
610.5
610.5 0.17
0.17
610.67
610.67
Datos Formulas
H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
H1: Al menos dos no son
significativas.
No. De comparaciones=
Sustitucion Grado de Valor de

Se interpola el valor
con el grado de Libertad Tablas
libertad 25 24 4.17
25 X
30 4.11

Comparando el resultado con q
• Condición
• Tras obtener el resultado de q, si una media es <q se considera igual, si es >q se
considera diferente
Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17 145.5 145.33 104.16 88.16
553.33 57.34 57.17 16
569.33 41.34 41.17
610.5 0.17 Media Igual
610.67 Media Diferente
• Conclusión
• Se rechaza la hipótesis nula , las medias no son iguales. Se acepta , las diferencias
de medias y son diferentes
Prueba de Duncan
• El Test de Duncan es un test de comparaciones múltiples.
Permite comparar las medias de los t niveles de un factor
después de haber rechazado la Hipótesis nula de igualdad de
medias mediante la técnica ANOVA. Todos los test de
comparaciones múltiples son test que tratan de perfilar, tratan
de especificar, tratan de concretar, una Hipótesis alternativa
genérica como la de cualquiera de los Test ANOVA.
• Bibliografía:
https://estadisticaorquestainstrumento.wordpress.com/2013/
01/28/test-de-duncan/
• Planteamiento
• Suponga que un experimento industrial un ingeniero está interesado en cómo la absorción
media de humedad en concreto varía entre cinco mezclas diferentes de concreto. Las
muestras se exponen a la humedad por 48 horas y se decide que se prueben seis muestras
para cada mezcla, por lo que se requiere probar un total de 30 muestras. Los datos de este
experimento se muestran en la siguiente tabla.
Mezcla 1 2 3 4 5
1 551.00 595.00 639.00 417.00 563.00 553
2 457.00 580.00 615.00 449.00 631.00 546.4
3 450.00 508.00 511.00 517.00 522.00 501.6
4 731.00 583.00 573.00 438.00 613.00 587.6
5 499.00 633.00 648.00 415.00 656.00 570.2

Bibliografía:
6 632.00 517.00 677.00 555.00 679.00 612
Total 3320.00 3416.00 3663.00 2791.00 3664.00 3370.8 16854.0 Libro: Introducción a la
553.33 569.33 610.50 465.17 610.67 561.80 Autor: William mendenhall.
Analisis de Varianza para la clasificacion unilateral
Tratamiento 8536.6 4 21339.15 F=4.30
s
Error 124021 25 4960.84
Total 209377 29 26299.99
Mezcla
1 553.33
2 569.33
3 610.5
4 465.17
5 610.67
Datos Formulas
H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
significativas.
Se entra con la Tabla de rangos Sustitucion

estudentizados
γ P
2 3 4 5
24 2.919 3.066 3.16 3.226
25 2.9125 3.060 3.155 3.221
30 2.88 3.035 3.131 3.199
Se interpola los valores del 25*
Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17
Se compara con
553.33
Se compara con
569.33 Condición
Se compara con Si el valor de Rp es menor que
610.5 el valor de la diferencia de
Se compara con medias, estas medias son
610.67 diferentes
Diferencia de
Medias 610.67 610.5 569.33 553.33 465.17
465.17 145.5 > 92.61 145.33 > 90.7 104.16 > 87.98 88.16 > 83.74
553.33 57.34 < 90.71 57.17 < 87.98 16 < 83.74
569.33 41.34
41.34 <
< 87.98
87.98 41.17
41.17 <
< 83.74
83.74
610.5 0.17 < 83.74
0.17 < 83.74
610.67 Media Diferente
Media Igual
Planteamiento mediante bloques
aleatoriosTiempo en segundos para ensamblar un producto
Máquina Operador 1 2 3 4 5 6 Total Medias
1 42.5 39.3 39.6 39.9 42.9 43.6 247.8 41.3
2 39.8 40.1 40.5 42.5 42.5 43.1 248.5 41.42
3 40.2 40.5 41.3 43.4 44.9 45.1 255.4 42.57
4 41.3 42.2 43.5 44.2 45.9 42.3 259.4 43.23
Total 163.8 162.1 164.9 170 176.2 174.1
Medias 40.95 40.525 41.225 42.5 44.05 43.525
Fuente de Suma de Grados de Cuadrado F

Variación Cuadrado Libertad Medio calculada
s
Máquinas 15.93 3 5.31 3.34
Operadores 42.09 5 8.42
Error 23.84 15 1.59
Total 81.86 23
Valor Critico Formula Sustitución Valor Critico
TABLA PUNTOS
PORCENTUALES
Conclusión
Se rechaza la hipótesis nula . En el valor critico de 0.05 se acepta que al menos

una maquina no trabaja a la misma velocidad que las demás.
Prueba de Tukey Máquina Medias
1 41.3
2 41.42
3 42.57
Diferencia de
Medias 43.23 42.57 41.42 41.43 4 43.23
41.3
41.42
41.42
42.57
42.57
43.23
43.23
Diferencia de
Medias 43.23 42.57 41.42 41.43
41.3 1.93 1.27 0.12
41.42
41.42 1.81
1.81 1.15
1.15
42.57
42.57 0.66
0.66
43.23
43.23
Datos Formulas
H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
significativas.
No. De comparaciones=
Sustitucion
Comparando el resultado con q
• Condición
• Tras obtener el resultado de q, si una media es <q se considera igual, si es >q se
considera diferente
Diferencia de
Medias 43.23 42.57 41.42 41.43
41.3 1.93 1.27 0.12
41.42 1.81 1.15
42.57 0.66
43.23 Media Igual
Media Diferente
• Conclusión
• Con el resultado arrojado por la prueba de Tukey, obtuvimos que todas las medias
eran iguales.
Tiempo en segundos para ensamblar un
producto (Duncan)
Máquina Operador 1 2 3 4 5 6 Total Medias
1 42.5 39.3 39.6 39.9 42.9 43.6 247.8 41.3
2 39.8 40.1 40.5 42.5 42.5 43.1 248.5 41.42
3 40.2 40.5 41.3 43.4 44.9 45.1 255.4 42.57
4 41.3 42.2 43.5 44.2 45.9 42.3 259.4 43.23
Total 163.8 162.1 164.9 170 176.2 174.1
Medias 40.95 40.525 41.225 42.5 44.05 43.525
Fuente de Suma de Grados de Cuadrado F

Variación Cuadrado Libertad Medio calculada
s
Máquinas 15.93 4 5.31 3.34
Operadores 42.09 5 8.42
Error 23.84 15 1.59
Total 81.86 23
Datos Formulas
H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
significativas.
Se entra con la Tabla de rangos Sustitucion

estudentizados
γ P
2 3 4
15 3.014 3.16 3.25
Diferencia de
Medias 43.23 42.57 41.42 41.43
41.3
41.42 Condición
Si el valor de Rp es menor que
42.57 el valor de la diferencia de
medias, estas medias son
43.23 diferentes
Diferencia de Medias
43.23 42.57 41.42 41.43
41.3 1.93>1.67 1.62<1.89 0.12<1.55
41.42 1.81>1.62 1.15<1.55
42.57 0.66<1.55
43.23
Media Diferente
Media Igual

• Conclusion
• Aplicando la prueba de Duncan, comparando diferencias de medias
obtuvimos el resultado donde las medias son diferentes, por lo tanto dos
maquinas operan a diferente velocidad
Tipo de propulsor
Sistem
a de
Misil Análisis de Varianza
34
32.7
30.1
32.8
29.8
26.7
29
28.9
para el experimento de
32 30.2 28.7 27.6 dos factores con n
33.2 29.8 28.1 27.8
28.4 27.3 29.7 28.8
replicas
29.3 28.9 27.3 29.1
En un experimento realizado
para determinar cuál de 3
sistemas de misiles distintos es Tasas de consumo de los propulsores En donde;
preferible, se midió la tasa de Sistem n=2 (Datos pro
Tipo de
combustión del propulsor para a de Total celda)
propulsor a=3 (misiles)
24 arranques estáticos. Se Misil
emplearon 4 tipos de 66.7 62.9 56.5 57.9 244 b=4 (propulsores)
combustible diferentes y el 65.2 60 56.8 55.4 237.4
experimento generó 57.7 56.2 57 57.9 228.8
observaciones duplicadas Total 189.6 179.1 170.3 171.2 710.2
de las tasas de combustión para Medias 31.6 29.85 28.38 28.53
cada combinación de los
tratamientos. Es necesario realizar las siguiente tabla para poder resolver el problema.
Analisis de Varianza para la clasificacion unilateral
Fuente de Suma de Grados de Cuadrados de Calculada
Variación Cuadrados libertad medios
A SSA
B SSB
AB
B SS(AB)
SSB ()
Error SSE )
Total
AB SAT
SS(AB)
Error SSE
Total SAT
Suma de Cuadrados de A
Tasas de consumo de los propulsores

Tipo de
Sistema
propulso Total
de Misil
r
66.7 62.9 56.5 57.9 244
65.2 60 56.8 55.4 237.4
57.7 56.2 57 57.9 228.8
Total 189.6 179.1 170.3 171.2 710.2
n
Medias 31.6 29.85 28.38 28.53
T i 1
2
 710.2 2
168,244.2 710.22
a SSA    14.52
T
i 1
i
2
 2442  237.42  228.82  168,244.2 (4)(2) (3)(4)(2)
SSA 14.52
s 
2
1 s 
2
 7.26
a 1 1
2
Suma de Cuadrados de B

Sistem Tipo de
b
a de propulso Total
T
j 1
j
2
 189.6  179.1  ...  171.2  126,336.5
2 2 2
Misil r
66.7
66.7 62.9
62.9 56.5
56.5 57.9
57.9 244
244
n 65.2
65.2 60
60 56.8
56.8 55.4
55.4 237.4
237.4
 T 2
 710.2 2
Total
57.7
57.7
189.6
56.2
56.2
179.1
57
57
170.3
57.9
57.9
171.2
228.8
228.8
710.2
i 1 Total 189.6 179.1 170.3 171.2 710.2
126,336.5 710.22 Medias
Medias 31.6
31.6 29.85
29.85 28.38
28.38 28.53
28.53
SSB    40.08
(3)(2) (3)(4)(2)
SSB
s 
2
2 s 
2 40.08
 13.36
b 1 2
3
Suma de Cuadrados de AB
Sistema Tipo de
de Misil propulsor
Total
66.7 62.9 56.5 57.9 244

65.2 60 56.8 55.4 237.4
57.7 56.2 57 57.9 228.8
n Total 189.6 179.1 170.3 171.2 710.2
 T 2  710.22
i 1 Medias 31.6 29.85 28.38 28.53
b
T
j 1
j
2
 189.62  179.12  ...  171.22  126,336.5
a
T
i 1
i
2
 2442  237.42  228.82  168,244.2
SS ( AB) 22.16
 ij
T 2
 66.7 2
 65.2 2
 ...  57.9 2
42,185.54 s 
2
3
s 
2
3  3.69
(a  1)(b  1) (2)(3)
42,185.54 168244.2 126,336.5 504,384.04
SS ( AB)      22.16
2 8 6 24
Suma de Cuadrados Totales
b a n
 y
i 1 j 1 k 1
2
ijk 342  32.72  322  ...  29.12  21,107.68
n 710.22
𝑆𝑆𝑇 =21,107.68 −

=91.67
T 2
 710.2 2
24
i 1
Tipo de propulsor
Sistema de
Misil
34 30.1 29.8 29
32.7 32.8 26.7 28.9
32 30.2 28.7 27.6
33.2 29.8 28.1 27.8
28.4 27.3 29.7 28.8
29.3
29.3 28.9
28.9 27.3
27.3 29.1
29.1
Suma del Error
SSE  SST  SSA  SSB  SS ( AB)

𝑆𝑆𝐸=91.67
−14.52− 40.08 − 22.16=14.91
168,244.2 710.22 126,336.5 710.22

SSA    14.52 SSB    40.08
(4)(2) (3)(4)(2) (3)(2) (3)(4)(2)
42,185.54 168244.2 126,336.5 504,384.04

SS ( AB)      22.16
2 8 6 24
SSE 2 14.91 710.22

s 
2
𝑆 = =1.24 𝑆𝑆𝑇 =21,107.68 − =91.67
ab(n  1) (3)( 4)(2− 1) 24
F calculada
s12 14.52 𝑓 1=
7.26
f1  2 s 
2
1  7.26 1.24
=5.84
s 2
s22 40.08 𝑓 = 13.36 =10.77

f2  2 s 
2
2  13.36 2
1.24
s 3
22.16 3.7
s32 s 
2
 3.69 𝑓 3= =2.98
f3  2 3
(2)(3) 1.24
s
26.75
s 
2
 2.22
12
Fuente Suma de Grados de Cuadrado
Calculada
varianza cuadrados libertad s medios
A SSA= 14.52 3-1=2 𝑺𝟐𝟏 = 7.26 𝒇𝟏 = 5.84
B SSB= 40.08 4-1 =3 𝑺𝟐𝟐 = 13.36 𝒇𝟐 = 10.77
AB SS(AB)= 22.16 (3-1)(4-1) =6 S23 = 3.69 𝒇𝟑 = 2.98
ERROR SSE= 14.91 (3)(4)(2-1)= 12 𝑺𝟐 = 1.24
Total SST = 103.51 23

A B C
2 3 6
3.89 3.49 3.00

12
12 12
12 12
12
5.84>3.89 10.77>3.49
2.98<3
Se rechaza H0 Se rechaza
Se acepta H0
H0
Valor Critico Formula Sustitución Valor

Critico
Se entra con tablas de 2
distribución f
6
Condicion:
La hipótesis nula se
rechaza cuando
Conclusión
• Al menos una de las
es diferente de cero
•
PRUEBA DE KRUSTAL-WALLIS
Tipo de propulsor
Sistem
El primer paso consiste en
a de
Misil ordenar los datos de menor a
34 30.1 29.8 29 𝑯𝟎: µ𝟏 = µ𝟐 … … . = µ4 mayor y darles un rango. Si los
32.7 32.8 26.7 28.9 𝑯𝟏: µ𝟏 ≠ µ𝟐 … … . ≠ µ4 valores se repiten, se saca la
media entre los rangos. Tal y
32 30.2 28.7 27.6
como se hizo en las pruebas de
33.2 29.8 28.1 27.8
Suma de Rangos
28.4 27.3 29.7 28.8
29.3 28.9 27.3 29.1 En estadística, la prueba de Kruskal-
Wallis (de William Kruskal y W. Allen
Wallis) es un método no paramétrico
para probar si un grupo de datos
proviene de la misma población.
Bibliografía
Ya que es una prueba no paramétrica,
https://es.slideshare.net/Jaime
la prueba de Kruskal-Wallis no asume
IncaGuerrero/anova-prueba-
normalidad en los datos.
de-krustal-wallis
https://es.wikipedia.org/wiki/Prueba_
de_Kruskal-Wallis
Rangos
Tipo de propulsor
Sistem
a de
Misil
34 24 30.1 18 29.8 16.5 29 12
32.7 21 32.8 22 26.7 1 28.9 10.5
32 20 30.2 19 28.7 8 27.6 4
33.2 23 29.8 16.5 28.1 6 27.8 5
28.4 7 27.3 2.5 29.7 15 28.8 9
29.3 14 28.9 10.5 27.3 2.5 29.1 13
Total 109 88.5 49 53.5
Una vez ordenados
n los valores y darles
i
R 2
i 0
 109 9
 88.5 2
 ...  53.5 2
 24,976.5 un rango, sustituir
el valor por el
rango dado y hacer
una sumatoria por
cada columna.
Datos
N=24
n=6
Formula Sustitucion
Tabla de Distribución de chi cuadrada Conclusión
0.025 0.975 Conclusión
La hipótesis nula se acepta, por lo tanto se dice que a un nivel de
3 9.348 3 0.216 significancia de 0.05 no existe diferencia en los niveles por el uso de
propulsores.
Gráfica

0.216 8.255 9.348

Autor: William mendenhall
Kruskal-Wallis
• Planteamiento Calculadoras
• Los siguientes datos representan los tiempos de A B C
operación en horas para tres tipos de calculadoras 4.9 5.5 6.4

científicas de bolsillo antes de que requieran 6.1 5.4 6.8
recarga. 4.3 6.2 5.6
• Utilice la prueba de Kruskal-Wallis, en el nivel de 4.6 5.8 6.5

significancia de para probar la hipótesis de que 5.3 5.5 6.3
los tiempos de operación para las tres 5.2 6.6
calculadoras son iguales
4.8
𝑯𝟎: µ𝟏 = µ𝟐 … … . = µ4
𝑯𝟏: µ𝟏 ≠ µ𝟐 … … . ≠ µ4
Rangos
Calculadoras
A B C 𝑛 2 2
𝑅
∑ 𝑖 =¿ 25 =625 ¿
4.9 4 5.5 8.5 6.4 15 𝑖=1
6.1 12 5.4 7 6.8 18 𝑛

4.3 1 6.2 13 5.6 10 ∑ 𝑅 2𝑖 =¿562 =3136 ¿
𝑖=1
4.6 2 5.8 11 6.5 16 𝑛
2 2
5.3 6 5.5 8.5 6.3 14 ∑ 𝑅 𝑖 =¿90 =8100 ¿
𝑖=1
5.2 5 6.6 17
4.8 3
25 56 90
Datos Formula
N=18
n=5,6,7
Sustitucion
Tabla de Distribución de chi cuadrada Conclusión
0.005 0.995 Conclusión
En un nivel de significancia de 0.01 se comprobó que los tiempos
2 10.597 2 0.01 de operación para las tres calculadores son iguales
Gráfica

0.01 6.3266 10.597

Autor: William mendenhall
PLANTEAMIENTO (ejemplo 2)
Se tienen tres especies de cítricos a los cuales se mide la razón entre el área de las hojas y el peso
seco, bajo 3 condiciones de sombra (sol, semisombra y sombra).
Encuentre si existe una diferencia entre los valores obtenidos con una significancia del 5%
ANÁLISIS DE VARIANZA PARA UN CRITERIO
POR BLOQUES
Naranj Pomel Mandarina Totales

a o H0: µ1 = µ2 = µ3 = µ4 = µ5 = µ6
SOL 112 90 123 325 H1: Al menos dos no son
SEMISOMBRA 86 73 89 248 significativas.
SOMBRA 80 62 81 223 Donde:
Total 278 225 293 796 a=3
b=3
N=9
SUMA DE CUADRADOS TOTAL

a o
SOL 112 90 123 325
SEMISOMBRA 86 73 89 248
SOMBRA 80 62 81 223
Total 278 225 293 796
  y 
2
2 Y
SSA  ij 
i j
N
2
796
SSA  (1122  862  ...  812 )   2,822.23
9
SUMA DE CUADRADOS DEL TRATAMIENTO

a o
SOL 112 90 123 325
2
1 Y
SSA   i yi 
2 SOMBRA 80 62 81 223
Total 278 225 293 796
a N
1 796 2
SSA
SSA  (3252  2482  2232 )   1,884.23 S  1
2
3 9 k 1
1884.23
S 
1
2
 942.115
2
SUMA DE CUADRADOS DEL BLOQUE

2
1 Y a o
SSB   j y j 
2
SOL 112 90 123 325
b N
SOMBRA 80 62 81 223
Total 278 225 293 796
2
1 796
SSB  (2782  2252  2932 )   850.89 SSB
3 9 S  2
2
k 1
850.89
S  2
2  425.44
2
SUMA DE CUADRADOS DEL ERROR

a o
SSE  SST  SSA  SSB SOL 112 90 123 325
SOMBRA 80 62 81 223
2 Total 278 225 293 796
796
SSA  (112  86  ...  81 ) 
2 2 2
 2,822.23 SSE
9 S32 
1 796 2 (b  1)(a  1)
SSA  (3252  2482  2232 )   1,884.23
3 9 2 87.11
1 796 S 
2
 9.67
SSB  (278  225  293 ) 
2 2 2
 850.89 3
9
3 9
S12 942.11
SSE  2822.23  1884.23  850.89  87.11 f  2   97.42
S3 9.67
Fuente de Suma de Grados de Cuadrados medios
Calculada
varianza cuadrados libertad
Tratamientos 𝑺𝑺𝑨 = 1884.23 2 𝑺𝟐𝟏 = 942.11
Bloques SSB = 850.89 2 𝑺𝟐𝟐 = 425.44

𝒇 = 97.42
Error 𝑺𝑺𝑬 = 87.11 4 𝑺𝟐 3= 9.67
Total 8
𝑺𝑺𝑻 = 2822.23
TOMA DE DECISIÓN
La hipótesis nula H0 se rechaza en el nivel de significancia
tabla de distribución F: cuando
γ1
2
4 6.94 97.42  6.94
=4.94 CONCLUSIÓN
Se rechaza H0, por lo menos 2 de los tamaños
si varían.
BIBLIOGRAFÍA
Libro: Estadística
PRUEBA DE TUKEY
Sirve para probar todas las diferencias entre las medidas de tratamientos de un experimento es decir cuando
H0 ha sido rechazada. La única exigencia es que el número de repeticiones sea constante en todos los
tratamientos. Sirve para comprobar las medidas de los tratamientos dos a dos.
Ahora para realizar la prueba de Tukey utilizamos las medias de cada muestra ordenadas de menor a mayor ,
las cuales pondremos a continuación:
Naranja Pomelo Mandarina Totales Medias

SOL 112 90 123 325 108.33
SEMISOMB 86 73 89 248 82.66
RA
SOMBRA 80 62 81 223 74.33
Total 278 225 293 796
M1 M2 M3
108.33 82.66 74.33
APLICACIÓN DE LA FORMULA TABLA PUNTOS
PORCENTUALES DE RANGOS
ESTUDENTIZADOS
Después aplicamos la fórmula de la ley de Tukey la cual es la
siguiente:
1
2
3
4 6.50

Calculada
SUSTITUCIÓN
𝑺𝑺𝑨 = 1884.23 𝑺𝟐𝟏 =

Tratamientos 2
9.67 942.11
q  6.5  11.66
3 Bloques SSB = 850.89 2
𝑺𝟐𝟐 = 425.44
𝒇 = 97.42
Error 𝑺𝑺𝑬 = 87.11 4 𝑺 3= 9.67
𝟐
Total 𝑺𝑺𝑻 = 2822.23 8

OBTENCIÓN DE MEDIAS DIFERENTES
Comparaciones = k(k-1)/2
Comparaciones = 3(3-1)/2 = 3
M1 M2 M3
108.33 82.66 74.33
M1
108.33
M2
82.66
M3
74.33 q  11.66
M3 74.33 34 8.33 - Si q es menor que el valor
de la diferencia de las
M2 82.66 25.37 -
medias, las medias son
M1 108.33 - diferentes.
M1 M2 M3
108.33 82.66 74.33 Se puede concluir que hay una variación
entre las siguientes medias con una
M3 74.33 34 8.33 -
significancia mayor al 0.5
M2 82.66 25.37 -
M1 108.33 - • M1-M3
• M1-M2
PRUEBA DE DUNCAN
Este procedimiento se basa en la noción general de un rango utilizado. El rango de cualquier subconjunto
de p medias muéstrales debe exceder cierto valor antes de que encuentre que cualquiera de las p medias
es diferente. Este valor se llama rango de menor significancia para las p medias y se denota como Rp.
Los siguientes datos se obtienen de la tabla de la prueba de Duncan con una

significancia del .05 y 4 grados de libertad.
M1 M2 M3
108.33 82.66 74.33
S22 rp= Es el dato obtenido de la tabla

D  rp
n
SUSTITUCIÓN
Se procede a realizar los cálculos para cada uno de los rangos.
Tabla de Duncan (Rangos

estandarizados para rp)
2
S 2 3
D  rp 2
3.92 4.01
n
varianza cuadrados libertad Calculada
9.67 𝑺𝟐𝟏 =
D2  3.92  7.03 Tratamientos 𝑺𝑺𝑨 = 1884.23 2
942.11
3 Bloques SSB = 850.89 2 𝑺𝟐𝟐 = 425.44

𝒇 = 97.42
Error 𝑺𝑺𝑬 = 87.11 4 𝑺 3= 9.67
𝟐
9.67
D3  4.01  7.19 Total 𝑺𝑺𝑻 = 2822.23 8
3
Si el valor de D es menor que el
valor de la diferencia de medias,
estas medias son diferentes
Método de Comparación Comparación de Medias

M1 M2 M3 M1 M2 M3
145.6 142 129 108.33 82.66 74.33

M 128 D3 D2 - M3 74.33 34 8.33 -
3
M2 82.66 25.37 -
M 128 D2 -
2 M1 108.33 -
M1 128.3 -
Se puede concluir que hay una variación
entre las siguientes medias con una
significancia mayor al 0.5
D2=7.03
M1-M3
D3=7.19 M1-M2
M2-M3
ANÁLISIS DE VARIANZA PARA UN CRITERIO POR NO
BLOQUES
Se realizan 3 pruebas de la resistencia a la compresión en seis muestras de tubo de acero 2-20. La

fuerza que fractura cada muestra esta medida en pascales y está dada en la siguiente tabla:
1 2 3 4 5 6
127 126 130 139 128 140
129 130 128 138 127 137
128 128 129 145 130 150
Realice el análisis de variancia a nivel de significancia de .05, e identifique si las

resistencias promedio a la compresión difieren o no significativamente para las 6
máquinas.
TABLA ANOVA H0: µ1 = µ2 = µ3 = µ4
= µ 5 = µ6
Fuente de Suma de cuadrados Grados de Cuadrados
H1: Al menos dos no
Calculada
varianza libertad medios son significativas.
Maquinas K-1
Donde “k” es igual al
número de muestras
Error 𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝐴 k(n-1)
𝒌=𝟔
Donde “n” es igual al
número de pruebas
Total nk-1 𝒏=𝟑
MUESTRAS
1 2 3 4 5 6
127 126 130 145 128 150

129 130 128 140 127 137
128 128 129 141 130 150
total 384 384 387 426 385 437 2403
media 128 128 129 142 128.3 145.6 800.9

SUMA DE CUADRADOS TOTAL
MUESTR
AS
 T
2 1 2 3 4 5 6
k n 127 126 130 145 128 150
SST   y
i j ij
2
ij  129 130 128 140 127 137
i 0 j 0 nk 128 128 129 141 130 150
 T 
total 384 384 387 426 385 437 2403
  2403
2 2
i j ij media 128 128 129 142 128. 145.6 800.9
3
k n
 ij
y 2
 127
i 0 j 0
2
 129 2
 128 2
 ...  150 2
 321927
24032
SST  321927   1126.5
18
SUMA DE CUADRADOS DEL TRATAMIENTO
SSA  
k
Ti 2

 
i
T  j ij
2
1

2
MUESTRAS
3 4

5

6
i 0 k nk 127 126 130 145 128 150
 T 
129 130 128 140 127 137
  2403
2 2
128 128 129 141 130 150
i j ij
k total 384 384 387 426 385 437 2403
i
T
i
2
 384 2
 384 2
 ...  437 2
 965351 media 128 128 129 142 128.3 145.6 800.9
SSA
965351 24032 S  1
2
SSA    983.16 k 1
3 18
983.16
S 
1
2
 196.63
5
SUMA DE CUADRADOS DEL ERROR
MUESTRA
S
SSE  SST  SSA 1

127
2
12
6
3
130
4
145
5
128 150
6
129 13 128 140 127 137
24032 0
SST  321927   1126.5 128 12

8
129 141 130 150
18 total 384 38 387 426 385 437 2403

4
2 media 128 12 129 142 128. 145.6 800.9
965351 2403 8 3
SSA    983.16 SSE
3 18 S 
2
2 S 
143.34
2
 11.94
k (n  1) 2
12
SSE  1126.5  983.16  143.34 S12 196.63
f  2   16.46
S1 11.94
TABLA ANOVA PARA UN CRITERIO
Fuente de Suma de Grados de Cuadrados

varianza cuadrados libertad medios Calculada
Maquinas 𝑺𝑺𝑨 = 983.16 5 𝑺𝟐𝟏 =196.63

𝒇 = 16.46
Error 𝑺𝑺𝑬 = 143.34 12 𝑺𝟐𝟐 = 11.94
Total
𝑺𝑺𝑻 = 1126.5
17
Tabla valores
TOMA DE DECISIÓN
críticos de la La hipótesis nula H0 se rechaza en el nivel de significancia
distribución f cuando
γ1
12
5
3.11
16.46  3.11
=3.11 CONCLUSIÓN
Se rechaza H0, las resistencias si varían, por lo
menos 2.
BIBLIOGRAFÍA
Libro: Estadística
PRUEBA DE TUKEY
Sirve para probar todas las diferencias entre las medidas de tratamientos de un experimento es decir cuando
H0 ha sido rechazada. La única exigencia es que el número de repeticiones sea constante en todos los
tratamientos. Sirve para comprobar las medidas de los tratamientos dos a dos.
Ahora para realizar la prueba de Tukey utilizamos las medias de cada muestra ordenadas de menor a mayor ,
las cuales pondremos a continuación:

MUESTR
A
1 2 3 4 5 6
𝑴́𝟏 𝑴́
𝟐 𝑴́
𝟑 𝑴́
𝟒 𝑴́𝟓 𝑴́𝟔
Media 128 128 129 142 128.3 145.6 800.9
TABLA PUNTOS
APLICACIÓN DE LA FORMULA PORCENTUALES DE RANGOS
ESTUDENTIZADOS
Después aplicamos la fórmula de la ley de Tukey la cual

es la siguiente: 1
2
6
12 3.00

Calculada
SUSTITUCIÓN
𝑺𝑺𝑨 = 983.16
11.94 Maquinas 5 𝑺𝟐𝟏 =196.63
q3  5.98 𝒇 = 16.46

3 Error 𝑺𝑺𝑬 = 143.34 12 𝑺 = 11.94
𝟐
𝟐
𝑺𝑺𝑻 = 1126.5
Total 17
OBTENCIÓN DE MEDIAS DIFERENTES
𝑴́𝟏 𝑴́𝟐 𝑴́𝟑 𝑴́𝟒 𝑴́𝟓 𝑴́𝟔

128 128 129 142 128.3 145.6
M6 M4 M3 M5 M2 M1
145.6 142 129 128.3 128 128
M1
M2
128
128
17.6*
17.6*
14*
14*
1
1
0.3
0.3
0
-
-
-
q  5.98
M5 128.3 17.3* 13.7* 0.7 - - -
Si q es menor que el valor
M3 129 16.6* 13* - - - - de la diferencia de las
M4 142 3.6 - - - - - medias, las medias son
diferentes.
M6 145.6 - - - - - -
CONCLUSIÓN • M6-M1
Se puede concluir que hay una variación entre • M6-M2
las siguientes medias con una significancia • M6-M5 • M4-M1
mayor al 0.5 • M6-M3 • M4-M2
• M4-M5
PRUEBA DE DUNCAN
Este procedimiento se basa en la noción general de un rango utilizado. El rango de cualquier subconjunto
de p medias muéstrales debe exceder cierto valor antes de que encuentre que cualquiera de las p medias
es diferente. Este valor se llama rango de menor significancia para las p medias y se denota como Rp.
𝑴́𝟏 𝑴́𝟐 𝑴́𝟑 𝑴́𝟒 𝑴́𝟓 𝑴́𝟔

128 128 129 142 128.3 145.6
S22 rp= es el dato obtenido de la tabla

D  rp
n
SUSTITUCIÓN
Se procede a realizar los cálculos para cada uno de los rangos.
11.94
S 2 D5  3.36  6.68
D  rp 2 3
n 11.94
D6  3.40  6.76 TABLA DE VALORES ESTUDENTIZADOS DE
3 Rp
11.94
D2  3.06  6.10 2 3 4 5 6
3 D2=6.10 3.06 3.29 3.33 3.36 3.40
11.94 D3=6.54
D3  3.29  6.54 D4=6.62
3 D5=6.68
11.94 D6=6.76
D4  3.33  6.62
3
M6 M4 M3 M5 M2 M1 D2=6.10
145.6 142 129 128. 128 128 D3=6.54
3
D4=6.62 Si el valor de D es menor que el
M1 128 D6 D5 D4 D3 D2 -
D5=6.68 valor de la diferencia de medias,
M 128 D5 D4 D3 D2 - -
2 D6=6.76 estas medias son diferentes
M 128.3 D4 D3 D2 - - -
5
M 129 D3 D4 - - - -
CONCLUSIÓN
3
Se puede concluir que hay
M 142 D2 - - - - - una variación entre las
4
siguientes medias con una
M 145.6 M6
- -M4 -M3 - M5 - M2 - M1 significancia mayor al 0.5
6 145.6 142 129 128. 128 128
3
• M6-M1
M 128 17.6* 14* 1 0.3 0 - • M6-M2
1
• M6-M5
M 128 17.6* 14* 1 0.3 - - • M6-M3
2
M 128.3 17.3* 13.7* 0.7 - - - • M4-M1
5
• M4-M2
M 129 16.6* 13* - - - - • M4-M5
3
• M4-M3
M 142 3.6 - - - - -
ANÁLISIS DE VARIANZA PARA DOS
CRITERIOS
ANÁLISIS DE VARIANZA PARA DOS CRITERIOS
Suponga que usted haya experimentado con levadura para una receta de panes dulces. Parece ser
que la cantidad de azúcar y la temperatura del agua afectan el tamaño de los panes. Basándose en
los siguientes datos, usted realiza un análisis de varianza para averiguar lo que es significativo de
estas recetas.
Tamaño de los panes dulces

Levadura:
Agua Fría Agua Tibia Agua caliente
76 87 60
Poco azúcar
75 85 55
70 79 52
Mucho azúcar
69 78 50
Tabla de sumas y medias. Y Tabla de sumas por grupos.
B1 B2 B3
76 87 60
A1
75 85 55
70 79 52
A2
69 78 50 TOTAL
TOTAL 290 329 217 836
MEDIAS 72.5 82.25 54.25 209
B1 B2 B3 TOTAL
A1 151 172 115 438
A2 139 157 102 398
TOTAL 290 329 217
Planteamiento
1. El Factor A no influye o afecta al tamaño de los panes

El Factor A influye o afecta al tamaño de los panes
El Factor B no influye o afecta al tamaño de los panes
El Factor B influye o afecta al tamaño de los panes
3. No hay efecto de interacción
Sí hay efecto de interacción
TABLA ANOVA PARA DOS CRITERIOS
Fuente de Suma de Grados de

Cuadrados Medios Calculada
Variación Cuadrados Libertad
A SSA a-1
B SSB b-1
AB SS(AB) (a-1)(b-1)
Error SSE ab(n-1)
Total SST abn-1

Suma de cuadrados Cálculos (Fórmulas y Sustitución)
B1 B2 B3 TOTAL
A1 151 172 115 438
A2 139 157 102 398
TOTAL 290 329 217
B1 B2 B3
76 87 60
A1
75 85 55
70 79 52
A2
69 78 50 TOTAL
TOTAL 290 329 217 836
MEDIAS 72.5 82.25 54.25 209
SUSTITUCIÓN

SUSTITUCIÓN
𝑎 𝑏 𝑛 2

𝑆𝑆𝑇 = ∑
𝑎 𝑏
∑∑
𝑛
2
𝑦 𝑖𝑗𝑘 −
(∑ ∑ ∑ )
𝑖=1 𝑗 =1 𝑘 =1
𝑦 𝑖𝑗𝑘
=60 010 −
698 896
=1768.66
𝑖=1 𝑗=1 𝑘 =1 𝑎𝑏𝑛 (2) (3) (2)
𝑆𝑆𝐸=𝑆𝑆𝑇
− 𝑆𝑆𝐴 − 𝑆𝑆𝐵 − 𝑆𝑆 ( 𝐴𝐵 ) =1768.66 −133.33 −1 616.16 −1.16=18.01
Cuadrados Medios
Calculada
Tabla Valores Críticos de la Distribución F
Resultados en Tabla ANOVA
Fuente de Suma de Grados de Cuadrados

Variación Cuadrados Libertad Medios Calculada
1 2
A 1 5.99 5.14
6
B 2
AB 2
Error 6 ′
𝑯 :𝟓.𝟗𝟗

Total 11 𝒐(𝑨)
Conclusiones:
 Se Rechaza . La cantidad de azúcar influye significativamente en el tamaño de los panes

dulces.
 Se Rechaza . La temperatura del agua influye significativamente en el tamaño de los panes
dulces.
 Se Acepta. Sí hay efecto de interacción entre la cantidad de azúcar y la temperatura del
agua. Es decir, el efecto de la cantidad de azúcar depende de cual sea la temperatura del
agua al momento de hacer los panes, afectando a su tamaño.
PRUEBA DE KRUSKAL-WALLIS
PROBLEMA 1
PLANTEAMIENTO
Las medias de cada muestra son idénticas en términos del tamaño de pan
Por lo menos una de las medias no es idéntica en términos del tamaño del pan
B1 RANGO B2 RANGO B3 RANGO

76 8 87 12 60 4
A1
75 7 85 11 55 3
70 6 79 10 52 2
A2
69 5 78 9 50 1
TOTAL 290 26 329 42 217 10
n 72.5 4 82.25 4 54.25 4
12
𝑘
𝑅 𝑖2 12
2
26 42 10
2 2
𝐻 1= ∑
𝑛 ( 𝑛+1 ) 𝑖=1 𝑛𝑖
− 3 ( 𝑛+ 1 )= [
12 ( 12+1 ) 4
+
4
+
4 ] −3 ( 12+1 𝑯) 1=9.84

Para obtener utilizamos Regla de decisión
la tabla de distribución ji cuadrada Si se rechaza la hipótesis nula
Se usa la tabla α Si se acepta la hipótesis nula
Como:
0.05
11 19.67
Conclusión: Se acepta Ho. Las medias de cada muestra

son idénticas en términos del tamaño de pan. Esto quiere
decir que provienen de muestras idénticas o “de la misma
población de panes”.

Trabajo Final Segunda Parte

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Trabajo Final Segunda Parte

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD AUTONOMA DE NUEVO LEON

FACULTAD DE INGENIERIA MECANICA Y ELECTRICA

ALUMNO: ANGEL JULIAN BERLANGA CERDA

M.C. Rigoberto Américo Garza López

Semestre: Agosto - Enero 2020

Diagrama de Flujo Un diagrama de flujo es una representación

Definición: Para estimar la línea de regresión poblacional a partir de la nube de puntos

18 324 54 grado de relación existente entre las 2

16 5 6.5 5 1.5 2.25 interdependencia) entre dos variables aleatorias

Coeficiente de correlación de Pearson 0.72 En el caso de la regresión lineal el

¿POR QUÉ COINCIDEN PEARSON Y SPERMAN?

 INTERVALOS DE CONFIANZA PARA :

1) Datos: 2) Formulas: 5) Sustitución:

3) Calculando : Tabla de distribución T

3) Calculando : Tabla de distribución T

DATOS FÓRMULA SUSTITUCIÓN Tabla: A.4

Se rechaza , el valor calculado resulto

DATOS FÓRMULA SUSTITUCIÓN Tabla: Valores críticos de la

Se rechaza , el valor calculado resulto

Definición: Para estimar la línea de regresión poblacional a partir de la nube de puntos

70 632 1080 8128 1079

Fórmula Sustitución Resultados

Datos Comprobando Conclusión

Coeficiente de correlación de Pearson 0.96 En ambos casos el R² adquiere

3) Calculando : Tabla de distribución T

3) Calculando : Tabla de distribución T

Se rechaza , el valor calculado resulto

Se rechaza , el valor calculado resulto

• el coeficiente de determinación, denominado R² y pronunciado R

El coeficiente determina la calidad del modelo para replicar los

9 10.2 81 729 6561 81.6 826.2

45 63.77 285 2025 15133 307.3 2153.3

Predicción de una variable de respuesta

= -233635.42 – 175020372+ 24730875

3 07.3 2025 4 5 2025

= -38893416- 32368518 + 2655630

• el coeficiente de determinación, denominado R² y pronunciado R

El coeficiente determina la calidad del modelo para replicar los

• Sea el siguiente conjunto de valores, las lecturas de un experimento donde X

2 30 0.301 1.447 0.09 0.44

3 90 0.477 1.954 0.227 0.932

4 170 0.602 2.23 0.362 1.342

5 290 0.698 2.462 0.488 1.721

6 450 0.778 2.653 0.605 2.064

7 650 0.845 2.812 0.714 2.377

28 1687 3.702 14.435 2.489 8.882

1) Datos: 2) Formulas: 3) Sustitución:

500 90 86.787 4958.97 22801

290 288.12 2209 2401

• el coeficiente de determinación, denominado R² y pronunciado R

El coeficiente determina la calidad del modelo para replicar los

El resultado indica que el 89.09% de los resultados seguira

1.2 3.4 0.07918125 0.531478917 0.00626967 0.04208316

1.5 5 0.17609126 0.698970004 0.03100813 0.12308251

2 2 0.30103 0.301029996 0.09061906 0.09061906

3 4.1 0.47712125 0.612783857 0.22764469 0.2923722

3.7 5 0.56820172 0.698970004 0.3228532 0.39715596

4 7 0.60205999 0.84509804 0.36247623 0.50879972

4.5 6.5 0.65321251 0.812913357 0.42668659 0.53100518

• el coeficiente de determinación, denominado R² y pronunciado R

El coeficiente determina la calidad del modelo para replicar los

5 800 Libro: probabilidad y estadística para ingeniería y

1) Datos: 2) Formulas: 3) Sustitución:

• el coeficiente de determinación, denominado R² y pronunciado R