Documentos de Académico
Documentos de Profesional
Documentos de Cultura
10 18
Aplicación en mi problema:
10 16 Al realizar los cálculos nos
encontramos con que la proyección
10 15 de la recta se mantiene de manera
ascendente y coincide con el
10 20
diagrama de flujo
50 86
50 90
50 88
50 88
50 92
∑x=300 ∑y=526
MEJOR ESTIMACION DE LA RECTA
X Y (XY) X2 Y2 FORMULAS
10 13 130 100 169
∑X2 ∑𝑦 − (∑𝑥)(∑𝑥𝑦)
𝑎=
10 18 180 100 324 𝑛 ∑𝑥2 − ∑𝑥 2
10 16 160 100 256 𝑛 ∑Xy − (∑𝑥)(∑𝑦)
𝑏=
10 15 150 100 225 𝑛 ∑𝑥2 − ∑𝑥 2
ŷ = 𝜶 + 𝒃𝒙
10 20 200 100 400
50 86 4300 2500 7396 INTERPRETACION
50 90 4500 2500 8100 𝑎=
13000 526 −(300)(23020)
=-1.7
2
10 13000 − 300
50 88 4400 2500 7744 10 23020 −(300)(526)
𝑏= =1.81
10 13000 − 300 2
50 88 4400 2500 7744
50 92 4600 2500 8464 ŷ = −𝟏. 𝟕𝟕 + 𝟏. 𝟖𝟏𝒙
Relación entre: ŷ=𝜶+𝒃𝒙 y Lectura en la
Presión (X)
ŷ=𝜷+𝒃𝒙 escala (Y)
Se espera que la recta ajustada
esté mas cerca de la verdadera 10 13
línea de regresión cuando se
dispone de una gran cantidad
10 18
de datos esto en comparación
a cada formula de la recta
10 16
10 15
Aplicación en mi problema: 10 20
Una vez realizados los cálculos
se mantiene la misma recta 50 86
“ascendente”.
50 90
Diagrama de flujo
50 88
50 88
50 92
∑x=300 ∑y=526
ERROR ESTÁNDAR EN LA MEJOR ESTIMACIÓN DE LA RECTA
x y y' y-y'2
10 13 16.33 216.09
10 18 16.33 388.09
10 16 16.33 313.29 FORMULA
10 15 16.33 278.89 2
∑ 𝑦−ŷ
10 20 16.33 470.89 S𝑦𝑥 =
50 86 88.73 7691.29 𝑛−2
50 90 88.73 8408.89 SUSTITUCIÓN
50 88 88.73 8046.09 42639.3
50 88 88.73 8046.09 S𝑦𝑥 =
10−2
50 92 88.73 8779.69
42639.3
Sumatoria (y-y')2 42639.3 S𝑦𝑥 = = 5329.91
Aplicación en mi problema:
8
Indica que tanto se desvían los datos de la media, si el
dato es grande la variación o diferencia (error) puede S𝑦𝑥 = 5329.91 = 73.006
ser proporcional a esta.
COEFICIENTE DE CORRELACIÓN DE PEARSON
X Y (XY) X2 Y2
10 13 130 100 169 Formulas
∑ 2∑ 2
10 18 180 100 324 2 𝑦 𝑦
𝑆𝑦𝑦 𝑆𝑦𝑦∑=
= 2
𝑦 −∑𝑦[ − [ ] ]
10 16 160 100 256 𝑛 𝑛
∑ 2
∑ 2
10 15 150 100 225 𝑥 𝑥
𝑆𝑥𝑥 𝑆=𝑥𝑥∑=𝑥2∑−𝑥2[ − [ ] ]
10 20 200 100 400 𝑛 𝑛
50 86 4300 2500 7396
𝑆(Ʃ𝑥)(Ʃ𝑦)
Sxy= 𝑟Ʃxy=− [ 𝑥𝑦 ]
50 90 4500 2500 8100 𝑛
50 88 4400 2500 7744
𝑆𝑥𝑥𝑆𝑦𝑦
𝑆𝑥𝑦
50 88 4400 2500 7744 𝑟= (Ʃ𝑥)(Ʃ𝑦)
50 92 4600 2500 8464 Sxy= Ʃ𝑆xy𝑥𝑥−𝑆𝑦𝑦
[ ]
𝑛
300 526 23020 13000 40822
Interpretación
2
526
𝑆𝑦𝑦 = 40822 − [ 10 ]=13154.4
2
300
𝑆𝑥𝑥 = 13000 − [ 10 ]=4000
(300)(526)
Sxy= 23020− [ ]=7240
10
7240
𝑟= =0.998≅ 1
4000∗13154.4
Aplicación en mi problema:
FORMULAS SUSTITUCIÓN
526 2
𝛿𝑦𝑦 = 40822 − [ ] = 13154.4
10
2
300
𝑆𝑥𝑥 = 13000 − [ 10 ]=4000
(300)(526)
Sxy= 23020− [ ]=7240
10
52417600
𝑟2 = = 0.996
4000 ∗ 13154.4
𝑟 = 0.996 = 0.998
RELACIÓN ENTRE EL COEFICIENTE DE DETERMINACIÓN EL
COEFICIENTE DE CORRELACIÓN DE PEARSON
DATOS FORMULAS
𝐻0 : 𝛽 = 1
𝐻1 : 𝛽 < 1
𝑏 = 1.81
𝑛 = 10
𝛼 = 0.05 Sustitución
SUSTITUCIÓN
𝑆𝑥𝑥 = 4000
𝑆 = 6.51
𝐼. 𝐶 = 95%
Conclusión Interpretación
Valores críticos de El intervalo de confianza para β y con un 95%
la distribución "𝑡" nos indica que se H0 rechaza debido a que la
Y 0.025 pendiente se encuentra por encima de 1 o es igual
a 1 tal y como se muestra en la grafica inferior.
8 2.306
α = 0.025
H0 𝑦 = 2.306
DATOS FORMULAS
𝐻0 : 𝛽 = 1 𝒕𝜶ൗ 𝑺 𝒕𝜶ൗ 𝑺
𝐻1 : 𝛽 < 1 𝒃− 𝟐 <𝜷<𝒃+ 𝟐
𝑺𝒙𝒙 𝑺𝒙𝒙
𝑏 = 1.81
𝑛 = 10
𝛼 = 0.05 Sustitución
SUSTITUCIÓN
𝑆𝑥𝑥 = 4000
𝑆 = 6.51
𝐼. 𝐶 = 95%
Valores críticos de la Conclusión
El intervalo de confianza para β y con un 95%
distribución "𝑡" nos indica que la pendiente es menor a 1 como se
Y 0.025 puede apreciar en la gráfica que está debajo.
8 2.306
α = 0.025
H0 𝑦 = 2.306
Se rechaza H0
La pendiente es menor a 1
Relacion entre los intervalos de confianza para a y
b
Datos Fórmulas y'=-
𝑛 = 10
1 𝑥0 − 𝑥 2 1 𝑥0 − 𝑥 2 x 1.77+1.81
𝑎 = −1.77 𝜇0
𝑦ො0 − 𝑡𝛼Τ2 𝛿 + < ൗ𝑥0 < 𝑦ො0 + 𝑡𝛼Τ2 𝛿 + x
𝛽 = 1.81 𝑛 𝑆𝑥𝑥 𝑛 𝑆𝑥𝑥
𝑆𝑥𝑥 = 4000
𝑦ො = 𝑎 + 𝑏𝑥 𝛼=
1 − 𝐼𝐶
𝑦 =𝑛−2
10 16.33
𝑆 = 6.51 2
𝐼. 𝐶 = 95% 10 16.33
𝛼 = 0.05 10 16.33
Valores críticos de 1 − 0.95 ∑ 𝑥 300 10 16.33
𝛼= = 0.025 𝑥ҧ = =
la distribución "𝑡" 2 𝑛 10 10 16.33
𝛾 = 10 − 2 = 2 𝑡𝛼Τ2 = 2.306
𝜸 0.025 50 88.73
8 2.306
50 88.73
𝜇𝑦 50 88.73
Intervalos de confianza para 50 88.73
𝑥0
50 88.73
Sustitución
1 10 − 30 2
525.3 − 2.306 6.51 + = 510.2879
10 4000
1 10 − 30 2
525.3 + 2.306 6.51 + = 532.0136
10 4000
1 10 − 30 2 1 10 − 30 2
𝜇
525.3 − 2.306 6.51 + < 0ൗ𝑥0 < 525.3 + 2.306 6.51 +
10 4000 10 4000
𝑦ො = −1.77 + 1.81 10
𝜇
510.2879 < 0ൗ𝑥0 < 532.0136
Datos Fórmulas y'=-
𝑛 = 10 1 𝑥0 − 𝑥 2 𝜇0 1 𝑥0 − 𝑥 2 x 1.77+1.81
𝑎 = −1.77 𝑦ො0 − 𝑡𝛼Τ2 𝛿 1 + + < ൗ𝑥0 < 𝑦ො0 + 𝑡𝛼Τ2 𝛿 1 + +
𝑛 𝑆𝑥𝑥 𝑛 𝑆𝑥𝑥 x
𝛽 = 1.81
1 − 𝐼𝐶
𝑆𝑥𝑥 = 4000 𝑦ො = 𝑎 + 𝑏𝑥 𝛼= 𝑦=𝑛−2 10 16.33
2
𝑆 = 6.51
𝐼. 𝐶 = 95% 10 16.33
𝛼 = 0.05 10 16.33
Valores críticos de 1 − 0.95 ∑ 𝑥 300 10 16.33
𝛼= = 0.025 𝑥ҧ = =
la distribución "𝑡" 2 𝑛 10 10 16.33
𝛾 = 10 − 2 = 2 𝑡𝛼Τ2 = 2.306
𝜸 0.025 50 88.73
8 2.306
50 88.73
50 88.73
Intervalos de confianza para 𝜇𝑦 50 88.73
50 88.73
Sustitución
1 10 − 30 2
525.3 − 2.306 6.51 + = 558.992
10 4000
1 10 − 30 2
525.3 + 2.306 6.51 + = 591.882
10 4000
1 10 − 30 2 1 10 − 30 2
𝜇
525.3 − 2.306 6.51 1+ + < 0ൗ𝑥0 < 525.3 + 2.306 6.51 1+ +
10 4000 10 4000
𝑦ො = −1.77 + 1.81 10
𝜇
558.992 < 0ൗ𝑥0 < 591.882
Prueba de hipótesis para 𝜶
PLANTEAMIENTO
𝐻0: 𝛼 = 0
𝐻1: 𝛼 ≠ 0
PRUEBA DE HIPÓTESIS PARA 𝜷
Datos Fórmulas Sustitución
1.81 − 1
𝑛 = 10 𝑏−𝛽
𝑎 = −1.77 t = 6.51 =
t= 𝛿
Cuando la hipótesis nula es falsa y usted 4000
𝛽 = 1.81 𝐻1 = −0.490
no la rechaza, comete un error de tipo II.
𝑆𝑥𝑥 = 4000
La probabilidad de cometer un error de
𝑆 = 6.51
𝛿𝑥𝑥
tipo II es β, que depende de la potencia de
𝐼. 𝐶 = 95%
la prueba. Puede reducir el riesgo de
𝛼 = 0.05
cometer un error de tipo II al asegurarse
de que la prueba tenga suficiente
potencia. Para ello, asegúrese de que el 1 − 0.95
PLANTEAMIENTO
tamaño de la muestra sea lo 𝛼= = 0.025 Valores críticos de
𝐻0: 𝛼 = 0 2
suficientemente grande como para 𝛾 = 10 − 2 = 8 la distribución "𝑡"
𝐻1: 𝛼 ≠ 0
detectar una diferencia práctica cuando 𝑡𝛼Τ2 = 2.306
ésta realmente exista. 𝜸 0.05
8 2.306
𝐻0 = 2.306
MÉTODO DE ANÁLISIS DE LA VARIANZA
•Análisis de la Varianza ( ANOVA ) es una fórmula estadística que se utiliza para comparar las
varianzas entre las medias (o el promedio) de diferentes grupos. Una variedad de contextos lo
utilizan para determinar si existe alguna diferencia entre las medias de los diferentes grupos.
•Este método permite contrastar la hipótesis nula de que la media de más de dos poblaciones es
igual, frente a la hipótesis alternativa de que por lo menos una es diferente.
Analisis de Varianza para la classification unilateral
Fuente de Suma de Cuadrados Grados de Cuadrados de medios Calculada
Variación libertad
Tratamientos SCR(Tratamiento) K-1 𝐶M(tratameinto) 𝐶M(tratameinto)
𝑓=
Error SCE N-k 𝐶𝑀(𝐸𝑟𝑟𝑜𝑟) 𝐶𝑀(𝐸𝑟𝑟𝑜𝑟)
Total STCC n -1
Sustitución
826
𝑌ത = = 41.3
(10)(2)
2 2 2 2
8262
𝑆𝑆𝑇 = 6 + 7 + 11 + ⋯ 9 − = 19708.2
20
3002 + 5262 8262
𝑆𝑆𝐴 = − = 2553.8
10 10 2
𝑆𝑆𝐸 = 19708.2 − 2553.8 = 17154.4
2553.8 17154.4 2553.80
𝑆𝑖 2 = = 2553.80 𝑆2 = = 953.02 𝑓= = 2.679
1 2(10 − 1) 953.02
Analisis de Varianza para la classification unilateral
Fuente de Suma de Cuadrados Grados de Cuadrados de medios Calculada
Variación libertad
Tratamientos 2553.4 2-1=1 2553.4 2553.4
𝐶𝑀𝑡𝑟𝑎𝑡 = 2553.4 𝑓= = 2.679
1 953.02
Error 17154.4 20-2=18 17154.4
𝐶𝑀𝐸 = = 953.02
2(10 − 1)
Total 19708.2 10 -1=9
Conclusión
• Regresión polinomial
• El coeficiente de determinación R² se utiliza para medir cuánta • Ambos conceptos son fundamentales
variación en una variable dependiente puede explicarse por una en estadística inferencial y son útiles
variable independiente en un modelo de regresión, mientras en la ingeniería para comprender y
que la correlación (r) evalúa la relación lineal entre dos modelar relaciones entre variables.
variables.
PLANTEAMIENTO Presión Lectura en
(X) la escala (Y)
10 13
10 18
Para fines de calibración se
10 16
recabaron las siguientes datos , los
10 15
cuales permitirían determinar la
10 20
presión y la lectura
correspondiente en la escala. 50 86
50 90
50 88
50 88
50 92
FORMULAS
𝑦ො = 𝑏0 + 𝑏1 𝑥 + 𝑏2 𝑥 2
REGRESION POLINOMIAL
𝒏 𝑿 Y 𝑿𝒀 𝑿𝟐 𝑿𝟑 𝑿𝟐 𝒀 𝑿𝟒
Fila 3
1 ∗ 14400000 − 60 ∗ 240000 = 0
1 0 −500 −1.7 𝑎0 1 ∗ 434400 − 0 = 434400
0 1 60 1.81 𝑎1
0 0 0 434400 𝑎2
𝑎0 Calculos para resolver matriz 3x3
1 0 −500 −1.7
0 1 60 1.81 𝑎1
𝑎2 Fila 3
0 0 0 434400
0 434400
= 𝑖𝑛𝑑𝑡. = 𝑖𝑛𝑑𝑡.
0 0
𝑦ො = 𝑏0 + 𝑏1 𝑥 + 𝑏2 𝑥 2
Entonces, la ecuación de regresión estimada
𝑦ො = −1.7 − 1.81𝑥 + 𝑥 2
TEMA #3: REGRESIÓN NO LINEAL MÚLTIPLE
TEMARIO
• Regresión No Lineal Múltiple
• Ecuación de Potencia
• Ecuación Exponencial
• Ecuación logarítmica
DEFINICION
REGRESIÓN LINEAL MÚLTIPLE
•Como la el modelo de regresión lineal es un modelo que explica la relación entre variables, a
diferencia de la primera esta utiliza más variables independientes llamadas regresores para
explicar la relación de la variable dependiente denominada como regresión.
•Esta es lineal debido a que las variables independientes siguen ese mismo orden.
•Es múltiple porque su ecuación es única compuesta de varias variables independientes.
SIMILITUDES
•Describen matemáticamente la relación entre una variable de
respuesta y una o más variables predictoras.
•Pueden modelar una relación curva.
•Minimizan la suma de los cuadrados del error residual (SSE).
•Tienen los mismos supuestos que usted puede verificar utilizando las
gráficas de residuos.
DIFERENCIAS
La diferencia fundamental entre las regresiones lineal y no lineal, y la base para los nombres de
los análisis, son las formas funcionales aceptables del modelo. Específicamente, la regresión
lineal requiere parámetros lineales mientras que la no lineal no. Utilice la regresión no lineal en
lugar de la regresión lineal cuando no pueda modelar adecuadamente la relación con
parámetros lineales.
REGRESIÓN POTENCIAL
Problema No. 1 X Y
Sea el siguiente conjunto de 10 13
valores, las lecturas de un
experimento donde X es la
10 18
variable independiente e Y la 10 16
variable resultante. 10 15
10 20
50 86
50 90
50 88
50 88
50 92
Formulas:
𝑦ො = 𝑎𝑥 𝑏
𝑛 ∑ log 𝑋 log 𝑌 − (∑ log 𝑋)(∑ log 𝑌)
𝑏=
𝑛 ∑ log 𝑋 2 − ∑ log 𝑋 2
𝑎=
∑ log 𝑌 − (𝑏)(∑ log 𝑋) ECUACION POTENCIAL
𝑛
n x y log(x) log(y) log(x*y) log(x2)
∑ log 𝑌
log 𝑦 = = 1 10 13 1 1.11 1.11 1
𝑛
∑ log X 10 18 1 1.26 1.26 1
log 𝑥 = 2
𝑛
3 10 16 1 1.20 1.20 1
Sustitución:
15.79 4 10 15 1 1.18 1.18 1
log 𝑦 = = 1.579
10 5 10 20 1 1.30 1.30 1
13.49
log 𝑥 = = 1.349 50 86 1.70 1.93 3.29 2.89
10 6
10 22.60 − (13.49)(15.79) 7 50 90 1.70 1.95 3.32 2.89
𝑏= = 1.054
10(19.43) − 19.43 50 88 1.70 1.94 3.30 2.89
8
15.79 − (1.054)(13.49)
𝑎= = −0.1571 50 88 1.70 1.94 3.30 2.89
10 9
𝑦ො = 0.1571𝑥 1.054
10 50 92 1.70 1.96 3.34 2.89
𝑎 = 101.579−(1.054)(1.349) = 1.436
15.79
log 𝑦 = = 1.579
10
13.49
log 𝑥 = = 1.349
10
𝐴′ = 𝑌´ഥ − 𝐵 𝑋ത
𝑛 ∑ 𝑥𝑦´ −( ∑ 𝑋 ∗ ∑ 𝑌´ ) 547.58 300
𝐵= 𝐴′ = 10 − −0.4858 ∗ 10
𝑛 ∑ 𝑥 2 − (∑ 𝑥)2
𝐴′ = 40.184
10 965.15 − (300 ∗ 547.58) 𝐴′ = 𝐿𝑛𝐴′
𝐵= 𝐿𝑛𝐴′ = 40.184
10(40822) − (300)2
𝑒 𝐿𝑛𝐴´ = 𝑒 40.184
−26.041 𝐴 = 𝑒 −.14795
𝐵= 𝐴 = 2.82𝑥1017
−747.7925
𝐵 = −0.4858 𝑌 = 𝐴 ∗ 𝑒 𝐵𝑥
Nomenclatura Referencias
X̅= Media =Desviación Libro -Probabilidad y estadística para ingeniería y ciencias.
muestra. estándar. 9na edición. Ronald E. Walpole, Raymond Myers.
=Media de n= 30 = Media
población. grande.
Libro -Probabilidad y estadística para ingenieros.
N= 30 = Media 8va edición. Miller y Freud.
=Nivel de pequeña
significación.
Libro -Probabilidad y aplicaciones estadísticas.
6ta edición. Paul Meyer.