Está en la página 1de 74

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN

FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA


COORDINACIÓN GENERAL DE CIENCIAS BÁSICAS

UNIDAD DE APRENDIZAJE: ESTADISTICA INFERENCIAL


SEMESTRE: ENERO–JUNIO 2024
ACTIVIDAD FUNDAMENTAL: Trabajo Final
CATEDRÁTICO: M.C. Rigoberto Américo Garza López

OP. MATRÍCULA NOMBRE (COMPLETO) HORA GRUPO CARRERA

1 1986724 Jorge Luis Mondragon Hernandez M1 007 IMA

1967152 Mario David Bravo Torres IMA

1722560 Hiram Emmanuel Reyna García IMA


TEMARIO
Tema 1: Regresión lineal simple y correlación
Diagrama de flujo
Mejor estimación de la recta
Relación entre ŷ = 𝜶 + 𝒃𝒙 y ŷ = 𝜷 + 𝒃𝒙
Error estándar en la mejor estimación de la recta
Coeficiente de correlación de Pearson.
Coeficiente de correlación de Spearman.
Relación entre el coeficiente de correlación de Pearson y Spearman.
Varianza y desviación estándar
Relación entre desviación estándar y el error estándar en la mejor estimación de la recta.
Coeficiente de determinación.
Relación entre el coeficiente de determinación y el coeficiente de correlación de Pearson.
TEMARIO
Intervalos de confianza
Intervalo de confianza para 𝜶
Intervalo de confianza para 𝜷
Relación entre los intervalos de confianza para 𝜶 y 𝜷
Intervalo de confianza para 𝜇𝑦Τ𝑥0
Intervalo de confianza para 𝑦0
Prueba de hipótesis para β
Prueba de hipótesis para α
Tema 2: Regresión lineal múltiple y correlación
Regresion polinomial
Coeficiente de determinación y correlación
TEMA #3: REGRESIÓN NO LINEAL MÚLTIPLE
TEMARIO
• Diferencias entre la regresión no lineal múltiple y la regresión
lineal múltiple
• Ecuación Potencial
• Coeficiente de determinación, correlación y gráfica
• Ecuación Exponencial
• Coeficiente de determinación, correlación y gráfica
• Ecuación logarítmica
• Coeficiente de determinación, correlación y gráfica
TEMA #4: DISEÑO DE EXPERIMENTOS
• Análisis de varianza para un criterio
• Planteamiento mediante bloques aleatorios
• Planteamiento mediante tabla ANOVA de un solo factor
• Prueba de Tukey
• Prueba de Duncan
• Análisis de varianza para dos criterios
• Prueba de Kruskal-Wallis
GLOSARIO
• Regresión lineal: En estadística la regresión lineal homónimos de la otra: si tenemos dos variables
o ajuste lineal es un modelo matemático usado (A y B) existe correlación entre ellas si al disminuir
para aproximar la relación de dependencia entre los valores de A lo hacen también los de B y
una variable dependiente Y, las variables viceversa. La correlación entre dos variables no
independientes Xi y un término aleatorio ε. implica, por sí misma, ninguna relación de
causalidad.
• Correlación: En probabilidad y estadística, la
correlación indica la fuerza y la dirección de una
relación lineal y proporcionalidad entre dos
variables estadísticas. Se considera que dos
variables cuantitativas están correlacionadas
cuando los valores de una de ellas varían
sistemáticamente con respecto a los valores
Cantidad de lluvia Partículas
PLANTEAMIENTO diaria eliminadas
X Y
2.1 141
Un estudio sobre la cantidad de 3.8 132
lluvia y la contaminación del aire 4.3 126
eliminada produjo los siguientes 4.5 121
datos: 5.2 118
5.6 118
5.9 116
6.1 114
7.5 108
Cantidad de Partículas
lluvia diaria eliminadas
X Y
DIAGRAMA DE FLUJO
Diagrama de flujo

2.1 141 150

145

3.8 132 140


141

^3
135
4.3 126

Partículas eliminadas µg/m


130 132

4.5 121 125


126
120
5.2 118 115
121
118 118
116
114
5.6 118 110

105 108

5.9 116 100


2 3 4 5 6 7 8

6.1 114 Cantidad de lluvia diaria (0.01 cm)

7.5 108 Aplicación en mi problema:


Al realizar los cálculos nos encontramos con que la proyección de la
∑x=45 ∑y=1094
recta se mantiene de manera descendente y coincide con el
diagrama de flujo
MEJOR ESTIMACION DE LA RECTA
X Y (XY) X2 Y2 FORMULAS
2.1 141 296.1 4.41 19881 ∑X2 ∑𝑦 − (∑𝑥)(∑𝑥𝑦)
𝑎=
3.8 132 501.6 14.44 17424 𝑛 ∑𝑥2 − ∑𝑥 2

4.3 126 541.8 18.49 15876 𝑛 ∑Xy − (∑𝑥)(∑𝑦)


𝑏=
𝑛 ∑𝑥2 − ∑𝑥 2
4.5 121 544.5 20.25 14641 ŷ = 𝜶 + 𝒃𝒙
5.2 118 613.6 27.04 13924
5.6 118 660.8 31.36 13924 INTERPRETACION
5.9 116 684.4 34.81 13456
6.1 114 695.4 37.21 12996
7.5 108 810 56.25 11664
2.1 141 296.1 4.41 19881
Relación entre: ŷ=𝜶+𝒃𝒙 y Cantidad de Partículas
ŷ=𝜷+𝒃𝒙 lluvia diaria eliminadas
Aplicación en mi problema:
Se espera que la recta ajustada
Una vez realizados los cálculos
esté mas cerca de la verdadera
se mantiene la misma recta
X Y
línea de regresión cuando se
“descendente”. 2.1 141
dispone de una gran cantidad
de datos esto en comparación
3.8 132
a cada formula de la recta
Diagrama de flujo
4.3 126
150
4.5 121
145

140
141
5.2 118
^3

135
5.6 118
Partículas eliminadas µg/m

130 132

125
126 5.9 116
120

115
121
118 118
6.1 114
116
114
110
7.5 108
105 108
∑x=45 ∑y=1094
100
2 3 4 5 6 7 8
Cantidad de lluvia diaria (0.01 cm)
ERROR ESTÁNDAR EN LA MEJOR ESTIMACIÓN DE LA RECTA
x y y' y-y'2
2.1 141 139.895 1.2210
3.8 132 129.144 8.1550
4.3 126 125.982 0.0003 FORMULA
4.5 121 124.718 13.820 2
∑ 𝑦−ŷ
5.2 118 120.291 5.2480
S𝑦𝑥 =
5.6 118 117.761 0.0570 𝑛−2
5.9 116 115.864 0.0190 SUSTITUCIÓN
6.1 114 114.599 0.3590
33.9610
7.5 108 105.746 5.0820 S𝑦𝑥 =
Sumatoria (y-y')2 33.9610 9−2
33.9610
S𝑦𝑥 = = 4.851
Aplicación en mi problema:
7
Indica que tanto se desvían los datos de la media, si el
dato es grande la variación o diferencia (error) puede S𝑦𝑥 = 4.851 = 2.202
ser proporcional a esta.
COEFICIENTE DE CORRELACIÓN DE PEARSON
X Y (XY) X2 Y2
2.1 141 296.1 4.41 19881 Formulas
∑ 2∑ 2
3.8 132 501.6 14.44 17424 2 𝑦 𝑦
𝑆𝑦𝑦 𝑆𝑦𝑦∑=
= 2
𝑦 −∑𝑦[ − [ ] ]
4.3 126 541.8 18.49 15876 𝑛 𝑛
∑ 2
∑ 2
4.5 121 544.5 20.25 14641 𝑥 𝑥
𝑆𝑥𝑥 𝑆=𝑥𝑥∑=𝑥2∑−𝑥2[ − [ ] ]
5.2 118 613.6 27.04 13924 𝑛 𝑛
5.6 118 660.8 31.36 13924 𝑆
(Ʃ𝑥)(Ʃ𝑦)
5.9 116 684.4 34.81 13456
Sxy= 𝑟Ʃxy=− [ 𝑥𝑦 ]
𝑛
𝑆𝑥𝑥𝑆𝑦𝑦
6.1 114 695.4 37.21 12996
𝑆𝑥𝑦
7.5 108 810 56.25 11664 𝑟= (Ʃ𝑥)(Ʃ𝑦)
2.1 141 296.1 4.41 19881 Sx= Ʃxy𝑆𝑥𝑥
−𝑆[𝑦𝑦 ]
𝑛
45 1094 5348.2 244.26 133786
Interpretación

1094 2
𝑆𝑦𝑦 = 133,786 − 9
= 804.222
45 2
𝑆𝑥𝑥 = 244.26 − 9
= 19.26

45 1094
Sxy= 5348.2− = −121.8
9

−121.8
𝑟= = −0.978 ≈ −1
19.26 ∗ 804.222
Aplicación en mi problema:

Por el valor obtenido, nos indica


que se tiene una correlación
negativa perfecta, esto nos indica
que hay una buena relación entre
las variables.

r = -0.978≅ −1.00 Negativa perfecta


COEFICIENTE DE RELACIÓN DE SPEARMAN
Rango Rango
Y Formula
X (x) Rx (Y) Ry dR di2
2.1 1 141 9 -8 64 6Ʃdi2
𝑟𝑠 = 1-
3.8 2 132 8 -6 36 𝑛(𝑛2 −1)
4.3 3 126 7 -4 16
4.5 4 121 6 -2 4
5.2 5 118 4.5 0.5 0.25 Sustitución
5.6 6 118 4.5 1.5 2.25 (6)(238.5)
5.9 7 116 3 4 16 𝑟𝑠 = 1-
9(81 −1)
6.1 8 114 2 6 36
7.5 9 108 1 8 64 𝑟𝑠 = -0.987
Sumatoria de 𝑑𝑖𝑅2 238.5
Aplicación en mi problema:
Por el valor obtenido, nos indica que
se tiene una correlación negativa
perfecta, esto nos indica que hay
una buena relación entre las
variables.

𝑟𝑠 = -0.987 ≅ −1 negativa perfecta


RELACIÓN ENTRE EL COEFICIENTE DE PEARSON Y SPEARMAN
Diagrama de flujo
x y'=153.175-6.324x 150
145

^3
140
139.895

Partículas eliminadas µg/m


141
2.1 135
130
132
125

3.8 129.144 120


126
121
115 118 118
116
110 114

4.3 125.982 105 108


100
2 3 4 5 6 7 8

4.5 124.718 Cantidad de lluvia diaria (0.01 cm)

120.291 En las variables podemos observar que son proporcionales en la mayoría.


5.2 Con estos valores se puede comprobar que la relación entre ambos
117.761 coeficientes (Spearman y el de Pearson) son exactamente iguales.
5.6
Las 2 interpretaciones son similares ya que los valores son
5.9 115.864 aproximadamente a 1, ya que indican una correlación perfecta y
negativa.
6.1 114.599 Si la relación es variable una aumenta cuando la otra lo hace, esto nos
dice que son proporcionables dependientes de manera directa, viéndolo
7.5 105.746 de la manera algebraica.
VARIANZA Y DESVIACIÓN ESTÁNDAR
X Y (XY) X2 Y2
2.1 141 296.1 4.41 19881 Formulas
FORMULAS
∑ 2
3.8 132 501.6 14.44 17424 (Ʃ𝑦)2
2 𝑦
𝛿 = Ʃ𝑦𝑆2𝑦𝑦− =
[ ∑𝑦 ]− [ 𝛿𝑥𝑦 ] (Ʃ𝑥)(Ʃ𝑦)
𝑛= Ʃ𝑥𝑦 - [ 𝑛 ]
4.3 126 541.8 18.49 15876 𝑛

4.5 121 544.5 20.25 14641


5.2 118 613.6 27.04 13924 𝛿𝑦𝑦 − 𝑏𝛿𝑥𝑦 𝑛 Ʃ𝑥𝑦 −(Ʃ𝑥)(Ʃ𝑦)
𝛿= 𝑏=[ ]
5.6 118 660.8 31.36 13924 𝑛−2 𝑛 Ʃ𝑥2 − Ʃ𝑥 2

5.9 116 684.4 34.81 13456


6.1 114 695.4 37.21 12996 𝛿𝑦𝑦 − 𝑏𝛿𝑥𝑦
7.5 108 810 56.25 11664 𝑥2 =
𝑛−2
2.1 141 296.1 4.41 19881
45 1094 5348.2 244.26 133786
SUSTITUCIÓN
1094 2 Aplicación en mi problema:
𝛿𝑦𝑦 = 133786 − = 804.22 Al dar un valor de −3582.59 como
9
desviación estándar, se interpreta que
los datos pueden presentar un riesgo
45 1094
𝛿𝑥𝑦 244.26 − = −5225.74 de cambio.
= 9

804.22−(−6.324)(−5225.74)
𝛿= =61.329
9

10 23020 − 300 526


𝑏= = −6.324
10 13000 − 300 2

804.22 − (−6.324)(−5225.74)
𝑥2 = = −3582.59
9
COEFICIENTE DE DETERMINACIÓN

FORMULAS SUSTITUCIÓN
1094 2
𝛿𝑦𝑦 = 133786 − = 804.22
9
2
45
𝑆𝑥𝑥 = 244.26 − 9 =19.26

(45)(1094)
Sxy= 5348.2 − [ ]=-121.8
9

Sxy2 = (−121.8)2 = 14835.24

14835.24
𝑟2 = = 0.957
19.26 ∗ 804.22
𝑟 = 0.957 = 0.978
RELACIÓN ENTRE EL COEFICIENTE DE DETERMINACIÓN EL
COEFICIENTE DE CORRELACIÓN DE PEARSON

Datos Comprobado Conclusión


Coeficiente de correlación de Pearson 0.978 En el caso de la regresión lineal el
coeficiente de correlación de Pearson
es simplemente el cuadrado del
coeficiente de determinación:

Coeficiente de determinación 0.956 -0.9782 ≈ -0.956


INTERVALOS DE CONFIANZA
FORMULAS
INTERVALOS DE CONFIANZA PARA 𝛼

DATOS FORMULAS

𝐻0 : 𝛽 = 1
𝐻1 : 𝛽 < 1
𝑏 = −6.324
𝑛=9 Sustitución
SUSTITUCIÓN
𝛼 = 0.05
𝑆𝑥𝑥 = 19.26
𝑆 =61.329
𝐼. 𝐶 = 95%
Conclusión Interpretación
Valores críticos de El intervalo de confianza para β y con un 95%
la distribución "𝑡" nos indica que se H0 rechaza debido a que la
Y 0.025 pendiente se encuentra por encima de 1 o es igual
a 1 tal y como se muestra en la grafica inferior.
7 1.833
α = 0.025
H0 𝑦 = 1.833

Se rechaza H0. Grafica


La pendiente es igual o
mayor que 1.

-2.685 -1.833 1.833 2.685


INTERVALOS DE CONFIANZA PARA Β

DATOS FORMULAS

𝐻0 : 𝛽 = 1 𝒕𝜶ൗ 𝑺 𝒕𝜶ൗ 𝑺
𝐻1 : 𝛽 < 1 𝒃− 𝟐 <𝜷<𝒃+ 𝟐
𝑺𝒙𝒙 𝑺𝒙𝒙
𝑏 = −6.324
𝑛=9 Sustitución
SUSTITUCIÓN
𝛼 = 0.05
𝑆𝑥𝑥 = 19.26
𝑆 =61.329
𝐼. 𝐶 = 95%
Valores críticos de la
distribución "𝑡"
Y 0.025
Conclusión
El intervalo de confianza para β y con un 95%
7 1.833
nos indica que la pendiente es menor a 1 como se
α = 0.025 puede apreciar en la gráfica que está debajo.
H0 𝑦 = 1.833

Se rechaza H0
La pendiente es menor a 1

-2.865 -1.833
Datos Fórmulas y'=153.175-
x
𝑛=9 6.324x
1 𝑥0 − 𝑥 2 1 𝑥0 − 𝑥 2
𝑎 = 153.175 𝜇
𝑦ො0 − 𝑡𝛼Τ2 𝛿 + < 0ൗ𝑥0 < 𝑦ො0 + 𝑡𝛼Τ2 𝛿 + 139.895
𝛽 = −6.324 𝑛 𝑆𝑥𝑥 𝑛 𝑆𝑥𝑥 2.1
𝑆𝑥𝑥 = 19.26 1 − 𝐼𝐶
𝑦ො = 𝑎 + 𝑏𝑥 𝛼= 𝑦 =𝑛−2 3.8 129.144
𝑆 = −121.8 2
𝐼. 𝐶 = 95%
4.3 125.982
𝛼 = 0.05

4.5 124.718
Valores críticos de 1−0.95 ∑𝑥 45
𝛼= = 0.025 𝑥ҧ = = =5
la distribución "𝑡" 2 𝑛 9
5.2 120.291
𝜸 0.025 𝛾 =9−2=7 𝑡𝛼Τ2 = 1.833
5.6 117.761
7 1.833

5.9 115.864
𝜇𝑦
Intervalos de confianza para 6.1 114.599
𝑥0 105.746
7.5
Sustitución

1 2.1 − 45 2
153.175 − 1.833 −121.8 + = 2336.866
9 19.26

1 2.1 − 45 2
153.175 + 1.833 −121.8 + = −2030.516
9 19.26

1 2.1 − 45 2 1 2.1 − 45 2
𝜇
153.175 − 1.833 −121.8 + < 0ൗ𝑥0 < 153.175 + 1.833 −121.8 +
9 19.26 9 19.26

𝑦ො = 153.175 − 6.324 9
𝜇
2336.866 > 0ൗ𝑥0 > −203.516
Datos Fórmulas
y'=153.175-
𝑛=9 x
1
𝑦ො0 − 𝑡𝛼Τ2 𝛿 1 + +
𝑥0 − 𝑥 2 𝜇0 1
< ൗ𝑥0 < 𝑦ො0 + 𝑡𝛼Τ2 𝛿 1 + +
𝑥0 − 𝑥 2 6.324x
𝑎 = 153.175 𝑛 𝑆𝑥𝑥 𝑛 𝑆𝑥𝑥
𝛽 = −6.324
1 − 𝐼𝐶 2.1 139.895
𝑆𝑥𝑥 = 19.26 𝑦ො = 𝑎 + 𝑏𝑥 𝛼= 𝑦=𝑛−2
2
𝑆 = −121.8
3.8 129.144
𝐼. 𝐶 = 95%
𝛼 = 0.05 125.982
4.3
4.5 124.718
Valores críticos de 1 − 0.95 ∑ 𝑥 300
𝛼= = 0.025 𝑥ҧ = =
la distribución "𝑡" 2 𝑛 10 5.2 120.291
𝛾 =9−2=7 𝑡𝛼Τ2 = 2.306
𝜸 0.025
5.6 117.761
7 1.833
5.9 115.864
114.599
Intervalos de confianza para 𝜇𝑦 6.1
7.5 105.746
Sustitución

1 2.1 − 45 2
153.175 − 1.833 −121.8 + = 2336.866
9 19.26

1 2.1 − 45 2
153.175 + 1.833 −121.8 + = −2030.516
9 19.26

1 2.1 − 45 2 1 2.1 − 45 2
𝜇
153.175 − 1.833 −121.8 + < 0ൗ𝑥0 < 153.175 + 1.833 −121.8 +
9 19.26 9 19.26

𝑦ො = 153.175 − 6.324 9
𝜇
2336.866 > 0ൗ𝑥0 > −203.516
Prueba de hipótesis para 𝜶

• Si usted rechaza la hipótesis nula cuando es verdadera, comete un error de


tipo. La probabilidad de cometer un error de tipo I es α, que es el nivel de
significancia que usted establece para su prueba de hipótesis. Un α de 0.05
indica que usted está dispuesto a aceptar una probabilidad de 5% de estar
equivocado al rechazar la hipótesis nula.
• Para reducir este riesgo, debe utilizar un valor menor para α. Sin embargo,
usar un valor menor para alfa significa que usted tendrá menos
probabilidad de detectar una diferencia si ésta realmente existe.
Valores críticos de
Datos Fórmulas Sustitución la distribución "𝑡"
𝑛=9 𝑎−𝛼 t=
153.175 − 0.05
= −0.892
𝑎 = 153.175 t= −121.8
244.26 𝜸 0.05
𝛽 = −6.324 9(19.26) 7 1.833
𝑆𝑥𝑥 = 19.26 ∑ 𝑥2 𝐻1 = −0.892
𝛿 𝐻0 = 1.833
𝑆 = −121.8 𝑛(𝑆𝑥𝑥 ) 1 − 0.95
2
෍ 𝑥 = 244.26 𝛼= = 0.025
2
𝛾 =9−2=7 PLANTEAMIENTO
𝐼. 𝐶 = 95% 𝑡𝛼Τ2 = 1.833 𝐻0: 𝛼 = 0
𝛼 = 0.05 𝐻1: 𝛼 ≠ 0

Conclusión
Se acepta 𝐻0 , esto implica que hay
una correlación lineal significativa
entre la cantidad de lluvia y las
particulas eliminadas
-1.833 -0.892 0.892 1.833
PRUEBA DE HIPÓTESIS PARA 𝜷
Datos Fórmulas Sustitución
153.175 − (−6.324)
𝑛=9 𝑏−𝛽 −121.8
𝑎 = 153.175 t=
t= 𝛿
Cuando la hipótesis nula es falsa y usted 19.26
𝛽 = −6.324 𝐻1 = −0.298
no la rechaza, comete un error de tipo II.
𝑆𝑥𝑥 = 19.26
La probabilidad de cometer un error de
𝑆 = −121.8
𝛿𝑥𝑥
tipo II es β, que depende de la potencia de
𝐼. 𝐶 = 95%
la prueba. Puede reducir el riesgo de
𝛼 = 0.05
cometer un error de tipo II al asegurarse
de que la prueba tenga suficiente
potencia. Para ello, asegúrese de que el 1 − 0.95
PLANTEAMIENTO
tamaño de la muestra sea lo 𝛼= = 0.025 Valores críticos de
𝐻0: 𝛼 = 0 2
suficientemente grande como para 𝛾 = 10 − 2 = 8 la distribución "𝑡"
𝐻1: 𝛼 ≠ 0
detectar una diferencia práctica cuando 𝑡𝛼Τ2 = 2.306
ésta realmente exista. 𝜸 0.05
7 1.833
𝐻0 = 1.833
1.833 -0.298

Conclusión
Se acepta 𝐻0 , esto implica que hay
una correlación lineal significativa
entre la cantidad de lluvia y las
particulas eliminadas
MÉTODO DE ANÁLISIS DE LA VARIANZA
•Análisis de la Varianza ( ANOVA ) es una fórmula estadística que se utiliza para comparar las
varianzas entre las medias (o el promedio) de diferentes grupos. Una variedad de contextos lo
utilizan para determinar si existe alguna diferencia entre las medias de los diferentes grupos.
•Este método permite contrastar la hipótesis nula de que la media de más de dos poblaciones es
igual, frente a la hipótesis alternativa de que por lo menos una es diferente.
Analisis de Varianza para la classification unilateral
Fuente de Suma de Cuadrados Grados de Cuadrados de medios Calculada
Variación libertad
Tratamientos SCR(Tratamiento) K-1 𝐶M(tratameinto) 𝐶M(tratameinto)
𝑓=
Error SCE N-k 𝐶𝑀(𝐸𝑟𝑟𝑜𝑟) 𝐶𝑀(𝐸𝑟𝑟𝑜𝑟)

Total STCC n -1

SST Suma Total de Cuadrados


SSA Suma de Cuadrados de Tratamientos
SSE Suma de Cuadrados de Error
𝑆𝑖2 Cuadrado Medio del Tratamiento
𝑆2 Cuadrado Medio del Error
Cantidad de lluvia Partículas
PLANTEAMIENTO diaria eliminadas
X Y
2.1 141
Un estudio sobre la cantidad de 3.8 132
lluvia y la contaminación del aire 4.3 126
eliminada produjo los siguientes 4.5 121
datos: 5.2 118
5.6 118
5.9 116
6.1 114
7.5 108
Datos Formulas
𝑌ത𝑖
ത 2
𝑆𝑆𝑇 = ෍ ෍(𝑌𝑖𝑗 −𝑌) ത 2
𝑆𝑆𝐴 = ෍( − 𝑌)
H0: 𝛽1 = 0 𝑛
𝑗=1 𝑖=1 𝑖=1
H1: 𝛽1 ≠ 0
𝑆𝑖 2
α=0.01 𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝐴 𝑓= 2
n=9 𝑆
∑𝑖=1(𝑌𝑖𝑗 ) 𝑆𝑆𝐴 𝑆𝑆𝐸
k=2 𝑌ത = 𝑆𝑖2 = 𝑆2 =
𝑛𝑘 𝑘−1 𝑘(𝑛 − 1)

Sustitución
134030.26
𝑌ത = = 7446.125
(9)(2)
2 2 2 2
11392
𝑆𝑆𝑇 = 2.1 + 3.8 + 4.3 + ⋯ 108 − = 61956.87111
18
452 + 10942 11392
𝑆𝑆𝐴 = − = 1.848210273
9 9 2
𝑆𝐶𝐸 = 61956.87111 − 1.848210273 = 61955.0229
61955.0229 1.848210273 1.848210273
𝑆2 = = 3872.188 𝑓= = 0.000477𝑆𝑖 2 = = 1.848210273
2(9 − 1) 3872.188 1
Analisis de Varianza para la classification unilateral
Fuente de Suma de Cuadrados Grados de Cuadrados de medios Calculada
Variación libertad
Tratamientos 1.848210273 2-1=1 1.848210273 𝑓
𝐶𝑀𝑡𝑟𝑎𝑡
1 = 1.848210273/3872.188
= 1.848210273 = 0.000477
Error 61955.0229 18-2=16 61955.0229
𝐶𝑀𝐸 = = 953.02
2(9 − 1)
Total 61956.87111 9-1=8

Valor Critico 𝐻0 Formula Sustitución Valor Critico


Se entra con tablas de 𝑉1 = 2 − 1 𝑉1 = 2 − 1 = 1 𝑓∝ = 𝑓0.05 = 0.000477
distribución f 𝑉2 = 2(9 − 1) 𝑉2 = 2 9 − 1 = 16

Conclusión

Se rechaza la hipótesis nula 𝐻0 .


REGRESIÓN LINEAL MÚLTIPLE Y CORRELACIÓN

• Regresión polinomial

• Coeficiente de determinación y correlación.


REGRESION POLINOMIAL
• La regresión polinomial es una técnica utilizada en
estadística para modelar la relación entre una
variable independiente (X) y una variable
dependiente (Y) cuando esta relación no es lineal,
es decir, cuando los datos no siguen una tendencia
recta.

• La idea básica es que, en lugar de ajustar una línea


recta, usamos un polinomio de grado superior para
ajustar la relación entre X e Y. El grado del
polinomio se determina según la complejidad de
los datos.

• La regresión polinomial permite capturar relaciones


más complejas entre las variables. Esto es útil
cuando los datos muestran una curvatura, un
aumento o disminución no lineal en Y a medida que
X cambia.
COEFICIENTE DE DETERMINACION Y
CORRELACION.
• El coeficiente de determinación, a menudo denotado como R²,
es una medida que indica cuánta variabilidad en una variable
dependiente (la que estamos tratando de predecir) puede ser
explicada por una variable independiente (la que estamos
utilizando para hacer la predicción).

• La correlación es una medida que evalúa la relación entre dos


variables. En estadística, comúnmente se utiliza el coeficiente de
correlación de Pearson (r) para cuantificar esta relación. La
correlación de Pearson se encuentra entre -1 y 1.

• El coeficiente de determinación R² se utiliza para medir cuánta • Ambos conceptos son fundamentales
variación en una variable dependiente puede explicarse por una en estadística inferencial y son útiles
variable independiente en un modelo de regresión, mientras en la ingeniería para comprender y
que la correlación (r) evalúa la relación lineal entre dos modelar relaciones entre variables.
variables.
Cantidad de lluvia Partículas
PLANTEAMIENTO diaria eliminadas
X Y
2.1 141
Un estudio sobre la cantidad de 3.8 132
lluvia y la contaminación del aire 4.3 126
eliminada produjo los siguientes 4.5 121
datos: 5.2 118
5.6 118
5.9 116
6.1 114
7.5 108
FORMULAS

𝑦ො = 𝑏0 + 𝑏1 𝑥 + 𝑏2 𝑥 2
REGRESION POLINOMIAL

𝒏 𝑿 Y 𝑿𝒀 𝑿𝟐 𝑿𝟑 𝑿𝟐 𝒀 𝑿𝟒
1 2.1 141 296.1 4.41 9.261 621.81 19.45
2 3.8 132 501.6 14.44 54.872 1906.08 208.51
3 4.3 126 541.8 18.49 79.507 2329.74 341.88
4 4.5 121 544.5 20.25 91.125 2450.25 410.06
5 5.2 118 613.6 27.04 140.608 3190.72 731.16
6 5.6 118 660.8 31.36 175.616 3700.48 983.45
7 5.9 116 684.4 34.81 205.379 4037.96 1211.74
8 6.1 114 695.4 37.21 226.981 4241.94 1384.58
9 7.5 108 810 56.25 421.875 6075 3164.06
Sumatoria 45 1094 5348.2 244.26 1405.22 28554 8454.90
METODO DE ELIMINACION GAUSS-
JORDAN

El Método de Eliminación de Gauss consiste en


utilizar reiteradas veces las propiedades de los
sistemas lineales, que hemos visto anteriormente,
para transformar un sistema de ecuaciones
lineales en otro equivalente (con las mismas
soluciones) pero que sea triangular.
𝑦ො = 𝑏0 + 𝑏1 𝑥 + 𝑏2 𝑥 2
Calculos para resolver matriz 3x3
2.1 45 244.26 1094 𝑎0
45 244.26 1405.22 5348.2 𝑎1 Fila 1
244.26 1405.22 8454.9 28554 𝑎2 2.1 45
=1 = 21.43
2.1 2.1
244.26 1094
= 116.31 = 520.95
2.1 2.1
Fila 2
45 − 45 ∗ 1 = 0
1 21.43 116.31 520.95 𝑎0 244.26 − 45 ∗ 21.43 = −720.03
45 244.26 1405.22 5348.2 𝑎1 1405.22 − (45 ∗ 116.31) = −3828.92
244.26 1405.22 8454.9 28554 𝑎2 5438.2 − 45 ∗ 520.95 = −18094.66

Fila 3
244.26 − 244.26 ∗ 1 = 0
1405.22 − 244.26 ∗ 21.43 = −3829.27
𝑎
1 21.43 116.31 520.95 𝑎0 8454.2 − (244.26 ∗ 116.31) = −19954.98
0 −720.03 −3828.92 −18094.66 1 28554 − 244.26 ∗ 520.95 = −98693.25
𝑎
0 −3829.27 −19954.98 −98693.25 2
Calculos para resolver matriz 3x3
1 21.43 116.31 520.95 𝑎0
0 −720.03 −3828.92 −18094.66 𝑎1 Fila 2
0 −3829.27 −19954.98 −98693.25 𝑎2 −720.03 −3828.92
=1 = 5.32
−720.03 −720.03
−18094.66
= 25.13
−720.03

1 21.43 116.31 520.95 𝑎0 Fila 3


0 1 5.32 25.13 𝑎1 −3829.27 − 1 ∗ −3829.27 = 0
0 −3829.27 −19954.98 −98693.25 𝑎2 −19954.98 − −3829.27 ∗ 5.32 = 408.16
−98693.25 − −3829.27 ∗ 25.23 = −2461.46

Fila 3 (para el 1)
408.16
𝑎0 =1
1 21.43 116.31 520.95 408.16
0 1 5.32 25.13 𝑎1
0 0 408.16 −2461.46 𝑎2 −2461.46
= −6.03
408.16
Calculos para resolver matriz 3x3
𝑎0
1 21.43 116.31 520.95
𝑎1
0 1 5.32 25.13 Fila 2 (para el 0)
0 0 1 𝑎2
−6.03
5.32 − 5.32 ∗ 1 = 0
25.13 − (5.32 ∗ −6.03) = 57.20

Fila 1 (para el 0)
𝑎0
1 21.43 116.31 520.95
𝑎1 116.31 − 116.31 ∗ 1 = 0
0 1 0 57.20
𝑎2 520.95 − (116.31 ∗ −6.03) = 1222.37
0 0 1 −6.03
Fila 1 (para el segundo 0)

21.43 − 21.43 ∗ 1 = 0
𝑎0 1222.37 − (21.43 ∗ 57.20) = −3.42
1 21.43 0 1222.37
𝑎1
0 1 0 57.20
0 0 1 −6.03 𝑎2
1 0 0 1222.37 𝑎0
0 1 0 57.20 𝑎1
0 0 1 −6.03 𝑎2
𝑦ො = 𝑏0 + 𝑏1 𝑥 + 𝑏2 𝑥 2
Entonces, la ecuación de regresión estimada
𝑦ො = 153.175 − 6.324𝑥 + 𝑥 2
REGRESIÓN NO LINEAL MÚLTIPLE
• La regresión no lineal genera una ecuación para describir la relación no lineal entre una variable de
respuesta continua y una o más variables predictoras y predice nuevas observaciones.
• Utilice la regresión no lineal en lugar de la regresión de mínimos cuadrados ordinarios cuando no pueda
modelar adecuadamente la relación con parámetros lineales. Los parámetros son lineales cuando cada
término del modelo es aditivo y contiene solo un parámetro que multiplica el término.
REGRESIÓN LINEAL MÚLTIPLE
•Como la el modelo de regresión lineal es un modelo que explica la relación entre variables, a
diferencia de la primera esta utiliza más variables independientes llamadas regresores para
explicar la relación de la variable dependiente denominada como regresión.
•Esta es lineal debido a que las variables independientes siguen ese mismo orden.
•Es múltiple porque su ecuación es única compuesta de varias variables independientes.
SIMILITUDES
•Describen matemáticamente la relación entre una variable de
respuesta y una o más variables predictoras.
•Pueden modelar una relación curva.
•Minimizan la suma de los cuadrados del error residual (SSE).
•Tienen los mismos supuestos que usted puede verificar utilizando las
gráficas de residuos.
DIFERENCIAS
La diferencia fundamental entre las regresiones lineal y no lineal, y la base para los nombres de
los análisis, son las formas funcionales aceptables del modelo. Específicamente, la regresión
lineal requiere parámetros lineales mientras que la no lineal no. Utilice la regresión no lineal en
lugar de la regresión lineal cuando no pueda modelar adecuadamente la relación con
parámetros lineales.
Cantidad de lluvia Partículas
diaria eliminadas
REGRESIÓN POTENCIAL X Y
Un estudio sobre la 2.1 141

cantidad de lluvia y la 3.8 132


4.3 126
contaminación del aire
4.5 121
eliminada produjo los
5.2 118
siguientes datos:
5.6 118
5.9 116
6.1 114
7.5 108
Formulas:
𝑦ො = 𝑎𝑥 𝑏
𝑛 ∑ log 𝑋 log 𝑌 − (∑ log 𝑋)(∑ log 𝑌)
𝑏=
𝑛 ∑(𝑙𝑜𝑔𝑋 2 ) − ∑ log 𝑋 2

𝑎=
∑ log 𝑌 − (𝑏)(∑ log 𝑋) ECUACION POTENCIAL
𝑛

∑ log 𝑌
log 𝑦 =
𝑛
∑ log X
log 𝑥 =
𝑛 ECUACIÓN POTENCIAL
Sustitución: N X Y LOG (X) LOG (Y) LOG(X*Y) LOG(X^2)
18.75150 1 2.1 141 0.32222 2.14922 0.69252 0.10383
log 𝑦 = = 2.08350
9
2 3.8 132 0.57978 2.12057 1.22947 0.33615
6.08412
log 𝑥 = = 0.67601 3 4.3 126 0.63347 2.10037 1.33052 0.40128
9
4 4.5 121 0.65321 2.08279 1.36050 0.42669
9 12.63276 − (6.08412)(18.75150)
𝑏= = −0.21312 5 5.2 118 0.71600 2.07188 1.48347 0.51266
9(6.08412) − (6.084122 )
18.75150 − (−0.21312)(6.08412) 6 5.6 118 0.74819 2.07188 1.55016 0.55979
𝑎= = 2.22757
9
𝑦ො = 2.22757𝑥 −0.21312 7 5.9 116 0.77085 2.06446 1.59139 0.59421
8 6.1 114 0.78533 2.05690 1.61535 0.61674
9 7.5 108 0.87506 2.03342 1.77937 0.76573
SUM 45 1094 6.08412 18.75150 12.63276 4.31708
GRÁFICA SIN LÍNEA DE TENDENCIA
POTENCIAL
Gráfica Ec. Potencial
0.80000

0.70000

0.60000
Partículas eliminadas

0.50000

0.40000

0.30000

0.20000

0.10000

0.00000
0 1 2 3 4 5 6 7 8

Cantdad de lluvia diaria


GRÁFICA CON
LINEA DE Gráfica Ec. Potencial
TENDENCIA 0.8

POTENCIAL 0.7

n x y'=2.227569005x^-0.213115756 0.6

Partículas eliminadas
1 2.1 0.719783173
0.5

2 3.8 0.634323321
0.4
3 4.3 0.617830849
y = 0.8431x-0.213
4 4.5 0.611873746 0.3
R² = 1
5 5.2 0.593307863
0.2

6 5.6 0.584011019
0.1
7 5.9 0.577551863

0
8 6.1 0.573463177
0 1 2 3 4 5 6 7 8

9 7.5 0.548759884 Cantdad de lluvia diaria


COEFICIENTE DE DETERMINACIÓN
Formula:

∑ 𝑦ො − 𝑦ത 2 COEFICIENTE DE DETERMINACIÓN
2
𝑅 = 2 y y' ഥ
𝒚 (𝒚′ − 𝒚
ഥ)𝟐 ഥ)𝟐
(𝒚 − 𝒚
∑ 𝑦 − 𝑦ത
141 0.71978 121.55556 14601.28389 378.08642
132 0.63432 121.55556 14621.94441 109.08642
Sustitución
126 0.61783 121.55556 14625.93326 19.75309
131,657.50433 121 0.61187 121.55556 14627.37417 0.30864
𝑅2 = = 163.70786
804.22222 118 0.59331 121.55556 14631.86537 12.64198
Definición: El coeficiente de 118 0.58401 121.55556 14634.11459 12.64198
determinación es una medida 116 0.57755 121.55556 14635.67738 30.86420
estadística de la bondad del ajuste o
fiabilidad del modelo estimado a los 114 0.57346 121.55556 14636.66668 57.08642
datos
108 0.54876 121.55556 14642.64460 183.75309
1094 5.46090 1094 131657.50433 804.22222
Cantidad de lluvia Partículas
diaria eliminadas
REGRESIÓN EXPONENCIAL X Y
2.1 141
Un estudio sobre la 3.8 132
cantidad de lluvia y la 4.3 126
contaminación del aire 4.5 121
eliminada produjo los 5.2 118
siguientes datos: 5.6 118
5.9 116
6.1 114
7.5 108
Sustitución Formulas
2.08350− −0.21312 0.67601
𝑎=e = 9.27730
18.75150 𝑎 = 𝑒 ln 𝑦−𝑏𝑥ҧ
log y = = 2.08350
9 𝑛 ∑ log(𝑥 ∗ 𝑦) − ∑ log 𝑥 ∑ log 𝑦
6.08412 𝑏=
log x = = 0.67601 𝑛 ∑ log 𝑥 2 − (∑ log 𝑥)2
9 ∑ ln 𝑥
9 12.63276 − (6.08412)(18.75150) l𝑛 𝑥 =
b= = −0.21312 𝑛
9(6.08412) − (6.08412 ) 2 ∑ ln 𝑦
l𝑛 𝑦 =
yො = 9.27730e−0.21312x 𝑛
𝑏𝑥
𝑦ො = 𝑎𝑒
ECUACIÓN EXPONENCIAL
N Y LOG (X) LOG (Y) LOG(X*Y) LOG(X^2)
1 141 0.32222 2.14922 0.69252 0.10383
2 132 0.57978 2.12057 1.22947 0.33615
3 126 0.63347 2.10037 1.33052 0.40128
4 121 0.65321 2.08279 1.36050 0.42669
5 118 0.71600 2.07188 1.48347 0.51266
6 118 0.74819 2.07188 1.55016 0.55979
7 116 0.77085 2.06446 1.59139 0.59421
8 114 0.78533 2.05690 1.61535 0.61674
9 108 0.87506 2.03342 1.77937 0.76573
SUM 1094 6.08412 18.75150 12.63276 4.31708
GRÁFICA SIN LÍNEA DE TENDENCIA
EXPONENCIAL
Gráfica Ecuación Exponencial
7.00000

6.00000
Partículas eliminadas

5.00000

4.00000

3.00000

2.00000

1.00000

0.00000
0 1 2 3 4 5 6 7 8
Cantidad de lluvia diaria
GRÁFICA CON LÍNEA DE TENDENCIA
EXPONENCIAL
Gráfica Ecuación Exponencial
7.00000
N X y'=9.27730e^(-0.21312*x)
1 2.1 5.92997 6.00000

2 3.8 4.12768

Partículas eliminadas
5.00000
3 4.3 3.71046
4 4.5 3.55562 4.00000

5 5.2 3.06285
3.00000
6 5.6 2.81257 y = 9.2773e-0.213x
2.00000
7 5.9 2.63837 R² = 1
8 6.1 2.52828 1.00000

9 7.5 1.87605
0.00000
0 1 2 3 4 5 6 7 8
Cantidad de lluvia diaria
COEFICIENTE DE DETERMINACIÓN
Formula: COEFICIENTE DE DETERMINACIÓN
y y' ഥ
𝒚 (𝒚′ − 𝒚
ഥ)𝟐 ഥ)𝟐
(𝒚 − 𝒚
∑ 𝑦ො − 𝑦ത 2 141 5.92997 121.55556 13369.27685 378.08642
2
𝑅 = 2 132 4.12768 121.55556 13789.30688 109.08642
∑ 𝑦 − 𝑦ത
126 3.71046 121.55556 13887.46769 19.75309
121 3.55562 121.55556 13923.98386 0.30864
Sustitución: 118 3.06285 121.55556 14040.52076 12.64198
118 2.81257 121.55556 14099.89669 12.64198
125742.42482
𝑅2 = = 156.35284 116 2.63837 121.55556 14141.29623 30.86420
804.22222
114 2.52828 121.55556 14167.49273 57.08642
Definición: El coeficiente de
determinación es una medida 108 1.87605 121.55556 14323.18313 183.75309
estadística de la bondad del 1094 30.24185 1094.00000 125742.42482 804.22222
ajuste o fiabilidad del modelo
estimado a los datos
Cantidad de lluvia Partículas
diaria eliminadas
REGRESIÓN LOGARÍTMICA X Y
2.1 141
Un estudio sobre la 3.8 132
cantidad de lluvia y la 4.3 126
contaminación del aire 4.5 121
eliminada produjo los 5.2 118
siguientes datos: 5.6 118
5.9 116
6.1 114
7.5 108
Formulas
𝑛 ∑ l𝑛 𝑥 ∗ 𝑦 − ∑ ln 𝑥 ∑ 𝑦
𝑎=
𝑛 ∑ 𝑙𝑛 𝑥 2 − ∑ ln 𝑥 2

𝑏 = 𝑦ത − 𝑎 ln 𝑥
ECUACION LOGARÍTMICA
∑ ln 𝑥
l𝑛 𝑥 = ECUACIÓN LOGARITMICA
𝑛 N X Y ln(x) ln(x^2) y^2 ln(x)*y
1 2.1 141 0.74194 0.55047 19881 104.61317
2 3.8 132 1.33500 1.78223 17424 176.22014
Sustitución 3 4.3 126 1.45862 2.12756 15876 183.78549
4 4.5 121 1.50408 2.26225 14641 181.99337
9 1674.08926 − 14.00920 1094 5 5.2 118 1.64866 2.71808 13924 194.54172
𝑎=
9 22.88870 − (14.00920)2 6 5.6 118 1.72277 2.96792 13924 203.28646
7 5.9 116 1.77495 3.15046 13456 205.89447
𝑎 = 1.5022 8 6.1 114 1.80829 3.26991 12996 206.14492
9 7.5 108 2.01490 4.05983 11664 217.60953
𝑏 = 121.55556 − 1.5022 1.55657 SUM 45 1094 14.00920 22.88870 133786 1674.08926
𝑏 = 119.21728
14.00920
l𝑛 𝑥 = = 1.55657
9
GRÁFICA SIN LÍNEA DE TENDENCIA
LOGARÍTMICA
Gráfica Ec. Logarítmica
122.5

122
Partículas eliminadas

121.5

121

120.5

120
0 1 2 3 4 5 6 7 8

Cantidad de lluvia diaria


GRÁFICA CON LÍNEA DE TENDENCIA
LOGARÍTMICA
Gráfica Ec. Logarítmica
122.5

122

y = 1.5522ln(x) + 119.22
Partículas eliminadas

121.5
R² = 1

121

120.5

120
0 1 2 3 4 5 6 7 8

Cantidad de lluvia diaria


Formula:
COEFICIENTE DE DETERMINACIÓN
COEFICIENTE DE DETERMINACIÓN

∑ 𝑦ො − 𝑦ത 2 x y' ഥ
𝒚 (𝒚′ − 𝒚
ഥ)𝟐 ഥ)𝟐
(𝒚 − 𝒚
2
𝑅 = 2 2.1 120.368915 121.555556 1.40812 378.08642
∑ 𝑦 − 𝑦ത
3.8 121.289469 121.555556 0.07080 109.08642
4.3 121.481342 121.555556 0.00551 19.75309
Sustitución: 4.5 121.551909 121.555556 0.00001 0.30864
5.2 121.776328 121.555556 0.04874 12.64198
2.66214
𝑅2 = = 0.0033102 5.6 121.891358 121.555556 0.11276 12.64198
804.22222
5.9 121.972361 121.555556 0.17373 30.86420
Definición: El coeficiente de 6.1 122.024106 121.555556 0.21954 57.08642
determinación es una medida
estadística de la bondad del 7.5 122.344812 121.555556 0.62293 183.75309
ajuste o fiabilidad del modelo 45 1094.700601 1094 2.66214 804.22222
estimado a los datos
Nomenclatura Referencias
X̅= Media =Desviación Libro -Probabilidad y estadística para ingeniería y ciencias.
muestra. estándar. 9na edición. Ronald E. Walpole, Raymond Myers.
=Media de n=  30 = Media
población. grande.
Libro -Probabilidad y estadística para ingenieros.
N=  30 = Media 8va edición. Miller y Freud.
=Nivel de pequeña
significación.
Libro -Probabilidad y aplicaciones estadísticas.
6ta edición. Paul Meyer.

Libro –Introducción a la probabilidad y estadística.


13va edición. Mendenhall y Beaver.

También podría gustarte