Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Semana 13, 14, 15 y 16
Semana 13, 14, 15 y 16
Unidad IV
REGRESION SIMPLE Y MULTIPLE
Sesión 13
DISPERSION Y REGRESION
El éxito leve puede ser explicado por las habilidades y el trabajo. El éxito salvaje es atribuible a la varianza.
-Nassim Taleb-
PRESENTACIÓN
𝟓 𝟓
𝟎 𝟐 𝒙 𝟎 𝟐 𝒙
COVARIANZA ó VARIACIÓN CONJUNTA
Cuando la nube de puntos se concentra alrededor de una línea recta, se dice que la asociación entre e es lineal.
Puede ocurrir, sin embargo, que el diagrama de dispersión no sugiera una recta, sino que los puntos pueden
aparecer aproximadamente dispuestos sobre una curva. En tal caso, la asociación entre las variables es no
lineal.
Finalmente, también es posible que la nube de puntos indique la no existencia de asociación entre las
variables.
COVARIANZA ó VARIACIÓN CONJUNTA
El método gráfico de análisis de la covariación sirve no sólo para detectar la posible relación entre
dos variables sino también para conocer sus características.
El procedimiento, en el caso de dos variables, es muy eficaz y, sumamente sencillo.
Pero, aunque el diagrama de dispersión ofrece información acerca de la asociación entre dos
variables, basada en la observación visual, en la práctica se acude a instrumentos más precisos que
permiten la obtención de una cuantificación numérica de la intensidad y las características de dicha
asociación.
La covarianza es uno de estos instrumentos que se basa en las diferencias observadas entre los
valores de e respecto a sus correspondientes medias.
COVARIANZA ó VARIACIÓN CONJUNTA
Para obtener el valor de la covarianza, se calcula para cada par de valores
observados de e el producto de desviaciones respecto a sus medias, que
dejan por debajo de ellas los valores menores y por encima de ellas los
valores mayores de las variables, de tal manera que para los valores
pequeños de las variables estas diferencias son negativas y para los valores
elevados son positivas.
El signo y la magnitud de los productos obtenidos para todos los valores de
y de determinan el valor de la covarianza.
COVARIANZA ó VARIACIÓN CONJUNTA
Cuando la relación entre e es lineal y creciente, a los valores mas Cuando la relación entre e es lineal y decreciente, a los valores mas
pequeños de les corresponden los valores mas pequeños de y a pequeños de les corresponden los valores mas elevados de y a los
los valores mas elevados de les corresponden los valores mas valores mas elevados de les corresponden los valores mas pequeños
elevados de , de tal manera que la mayoría de estos productos de , de tal manera que la mayoría de estos productos son negativos y
son positivos y es positiva su suma. es negativa su suma.
Además, cuanto mas intensa sea la relación, mayor será la Además, cuanto mas intensa sea la relación, mayor será la proporción
proporción de productos positivos en el total y, por tanto, la suma de productos negativos en el total y, por tanto, la suma de los
de los productos es elevada, productos es negativa, pero elevada en valor absoluto,
COVARIANZA ó VARIACIÓN CONJUNTA
A partir de esta idea, la covarianza se define como la media aritmética de los productos de las desviaciones de las
variables e respecto a sus respectivas medias; es decir, se define por el cociente entre la suma de los productos
de las variables en desviaciones respecto a sus medias y el número de observaciones:
1 2 3 4
1 3 5 7 9
2 1 7 4 8
El signo de la covarianza indica que la relación entre las variables es directa si es positivo, que es inversa si es
negativo y que no existe asociación lineal si es nula.
APLICACIÓN
Covarianza
Se tienen las notas de un examen de Matemáticas y otro de
Física. Se desea saber sobre la covarianza asociada a tales
notas
Calculamos la media de e :
11 12 3 33 36 396
13 14 4 52 56 728
15 13 3 45 39 585
15 15 4 60 60 900 Hallamos la Covarianza
16 17 4 64 68 1088
17 16 3 51 48 816
17 17 4 68 68 1156
18 17 2 36 34 612
19 18 1 19 18 342
20 20 2 40 40 800
30 468 467 7423
CORRELACIÓN
CORRELACIÓN
El coeficiente de correlación lineal es una medida adimensional de la intensidad de la asociación lineal entre e que toma los
valores comprendidos entre y , porque la covarianza de las variables puede ser positiva o negativa, pero en valor absoluto es
menor o igual que el producto de las desviaciones típicas. Cuando esta próximo a sus valores extremos indica fuerte
asociación lineal, que es perfecta si es exactamente igual a uno o a menos uno (positiva, si es positivo; negativa, si es
negativa). Cuando esta próximo a cero, indica que la asociación lineal entre las variables es débil, siendo nula cuando es
exactamente igual a cero.
± 0.96 ,± 1.00 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖 ó 𝑛 𝑃𝑒𝑟𝑓𝑒𝑐𝑡𝑎
± 0.85 , ± 0.95 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖 ó 𝑛 𝐹𝑢𝑒𝑟𝑡𝑒
± 0.70 , ± 0.84 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖 ó 𝑛𝑆𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎
± 0.50 , ± 0.69 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖 ó 𝑛 𝑀𝑜𝑑𝑒𝑟𝑎𝑑𝑎
± 0.20 , ± 0.49 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖 ó 𝑛 𝐷 é 𝑏𝑖𝑙
± 0.10 , ± 0.19 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖 ó 𝑛 𝑀𝑢𝑦 𝐷 é 𝑏𝑖𝑙
± 0.09 , ± 0.00 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖 ó 𝑛 𝑁𝑢𝑙𝑎
-0.96 -0.85 -0.70 -0.50 -0.20 -0.10 0.10 0.20 0.50 0.70 0.85 0.96
-1.00 -0.90 -0.80 -0.70 -0.60 -0.50 -0.40 -0.30 -0.20 -0.10 0 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00
APLICACIÓN
Se tienen las notas de un examen de Matemáticas y otro de Física. Se
Desviaciones típicas
desea saber sobre la covarianza asociada a tales notas
7470 2
¿ − 15 .60 =5 . 64
30
11 12 3 33 36 396 363 432
13 14 4 52 56 728 676 784
15 13 3 45 39 585 675 507 7405 2
¿ − 15 .57 =4 . 41
15 15 4 60 60 900 900 900 30
16 17 4 64 68 1088 1024 1156
17 16 3 51 48 816 867 768
17 17 4 68 68 Coeficiente de correlación:
1156 1156 1156
18 17 2 36 34 612 648 578
19 18 1 19 18 342 361 324
20 20 2 40 40 800 800 800
30 468 467 7423 7470 7405
La Covarianza C El coeficiente de correlación de la covarianza entre las
La media de e notas de Matemáticas y de Física es 0.92, lo que
indica que la relación es positiva fuerte.
APLICACIÓN
CASO 2 CASO 3
Los valores de dos variables X e Y se distribuyen Se han observado, durante un mes determinado, el gasto en el
teléfono móvil y el ingreso total en seis familias. Los resultados
según la tabla siguiente: obtenidos expresados en unidades monetarias corrientes, han sido:
GRACIAS
ESTADISTICA INFERENCIAL
Unidad IV
REGRESION SIMPLE Y MULTIPLE
Sesión 14
INFERENCIA EN LA REGRESION MULTIPLE
El éxito leve puede ser explicado por las habilidades y el trabajo. El éxito salvaje es atribuible a la varianza.
-Nassim Taleb-
PRESENTACIÓN
n xi x
2 2
n y j y
2 2 n 2 2
n
2 2
i x nx yi ny
i 1 j 1 i 1 i 1
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
CORRELACIÓN NEGATIVA PERFECTA
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
NO HAY CORRELACIÓN
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
CORRELACIÓN POSITIVA FUERTE
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
UTILIDAD DE COEFICIENTE DE CORRELACION
r DE PEARSON
180 En el gráfico de
160 dispersión se
140 observa una relación
120 lineal directa entre el
100 peso y la presión
80 arterial
60
65 75 85 95 105 115 125 135
Peso (kg)
INTERPRETACION DEL COEFICIENTE DE CORRELACIÓN R DE PEARSON
El Coeficiente de Correlación r de Pearson mide la fuerza y dirección de relación entre dos variables
cuantitativas en una escala que varía entre -1 a +1. Cuanto mas se aleja del 0 el valor del
coeficiente muestra una relación mas fuerte. El signo nos indica si la relación es directa o inversa.
r=0.98642594 Correlación Correlación Correlación Correlación Correlación Correlación Correlación Correlación Correlación Correlación
negativa negativa negativa negativa negativa positiva positiva positiva positiva positiva
muy fuerte fuerte moderada débil muy débil muy débil débil moderada fuerte muy fuerte
Muy alta Alta Moderada Baja Muy baja Muy baja Baja Moderada Alta Muy alta
Ejemplos:
Estimar el peso de una persona a partir de su estatura.
Estimar el gasto en una familia en función de sus ingresos.
Estimar el precio de una PC en función de la velocidad del procesador.
Predecir la calificación de una asignatura según el número de horas de estudio
a la semana.
Estimar el precio de una vivienda en función de su superficie
REGRESIÓN LINEAL SIMPLE
El modelo de regresión lineal simple se define:
Yi 0 1x i eij
Donde:
Yi : valor de la variable dependiente para la i-ésima observación
Xi : valor de la variable independiente para la i-ésima observación
Eij : error aleatorio para la i-ésima observación que se asume normal
Β0 : intercepto con el eje Y
Β1 : mide el cambio de Y cuando varía X, llamado pendiente
Los parámetros (β0, β1) deben ser estimados:
GRAFICO DE DISPERSIÓN
Es la representación de pares de valores observados en el plano cartesiano,
describe la relación existente entre las variables a partir de:
Datos: a b
Xi Yi
x1 y1
x2 y2
c d
: :
xn yn
REGRESIÓN LINEAL SIMPLE
Cómo reconocer relación directa e inversa
330 100
Incorrelación
Para valores de X por encima 90 Fuerte relación
280
de la media tenemos valores 80 directa.
230
de Y por encima y por debajo 70
180
en proporciones similares. 60
130
Incorrelación. 50
80 40
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
50
40
30
20
10
0
0 5 10 15 20 25 30
Años de Practica
MODELO DE REGRESIÓN LINEAL SIMPLE
200
ˆ0
ŷ ˆ 1x 100
80
60
¿Cuál es el mejor ajuste a partir de los datos? 65 75 85 95 105 115 125 135
Peso (kg)
INTERPRETACIÓN DE LOS
COEFICIENTES DE REGRESIÓN LINEAL
La ecuación estimada:
Y= 0 + 1 X o también Y= a + bX
El coeficiente 1 indica el cambio promedio en la variable respuesta (y),
cuando la variable predictora (x) aumenta en una unidad adicional.
El intercepto 0 indica el valor promedio de la variable respuesta (y),
cuando la variable predictora (x) es igual a cero. Sin embargo carece de
interpretación práctica si dicho valor está fuera del rango del conjunto de
valores X.
RECTA DE MINIMOS CUADRADOS. Para poder obtener la recta de re
ESTIMACIONES DE LOS COEFICIENTES
utilizaremos la siguiente ecuación de estimación:
x 2
i
nx 2
i 1
1 13 26
2 16 33
3 30 36
4 2 16
5 8 26
6 6 19
7 31 38
Según el diagrama de
dispersión existe una
relación aproximadamente
lineal.
EJEMPLO - REGRESIÓN LINEAL SIMPLE
b) Hallando los coeficientes de regresión
N°
Experiencia Ventas(miles)
XY X2 Y2 𝒏=𝟕
(X) (Y)
x nx
2390
2
i
7(15.14) 𝑥
0.688 2
0.688 2
x 2
i
nx 2
i 1
R
2
r 2
xi2 nx 2 yi2 ny 2
Características:
i. Es un valor no negativo ya que se encuentra entre 0 y 1
ii. Es un valor muy importante en cualquier análisis de regresión, ya que muestra el grado hasta el cual
están relacionadas la variabilidad de e .
Ejemplo:
Del ejemplo sobre la regresión entre los años de experiencia y la ventas tenemos:
, por lo cual
Interpretación: El 88.3% de las variaciones de las ventas (Y) son explicados por los años de experiencia.
Existe además un no es explicado por los años de experiencia.
EJEMPLO - REGRESIÓN LINEAL SIMPLE
Una empresa pesquera quiere estimar el precio de venta por kilo, para ello ha registrado la
producción promedio de pesca de sardinas en toneladas y el precio de venta por kilo en un periodo
de 10 meses. Los datos son:
Mes Producción Precio Variable dependiente: Precio
1 2.5 3.0 Variable independiente: Producción
2 3.5 5.0
3 1.5 4.0 Preguntas:
4 1.0 6.0 1. Elabore el gráfico de dispersión y explique la tendencia de los datos.
5 1.2 6.7 2. Estime el mejor modelo de regresión e interprete el coeficiente de
6 0.8 7.0 regresión.
7 2.7 2.8 3. Evalúe el modelo: coeficiente de correlación y coeficiente de
8 3.8 2.1 determinación.
9 1.1 6.2 4. Estime el precio de venta de sardina cuando la producción de pesca en
10 0.6 8.1 cierto mes fue de 4.5 ton.
EJEMPLO - REGRESIÓN LINEAL SIMPLE
Una empresa pesquera quiere estimar el precio de venta por kilo, para ello ha registrado la producción promedio de pesca de sardinas en toneladas y el precio de venta
por kilo en un periodo de 10 meses. Los datos son: Preguntas:
1. Elabore el gráfico de dispersión y explique la tendencia de los datos.
0
PRODUCCIÓN
EJEMPLO - REGRESIÓN LINEAL SIMPLE
Una empresa pesquera quiere estimar el precio de venta por kilo, para ello ha registrado la producción promedio de pesca de sardinas en toneladas y el precio de venta
por kilo en un periodo de 10 meses. Los datos son:
Preguntas:
Mes Producción Precio Estime el mejor modelo de regresión e interprete el coeficiente de regresión.
1 2.5 3.0
2 3.5 5.0
3 1.5 4.0
4 1.0 6.0
5 1.2 6.7
6 0.8 7.0
7 2.7 2.8
8 3.8 2.1
9 1.1 6.2
PRECIO
10 0.6 8.1
^
𝑦 =7.753762 −1.42447 𝑥
2
𝑅 =0.664963 0 PRODUCCIÓN
EJEMPLO - REGRESIÓN LINEAL SIMPLE
Una empresa pesquera quiere estimar el precio de venta por kilo, para ello ha registrado la producción promedio de pesca de sardinas en toneladas y el precio de venta
por kilo en un periodo de 10 meses. Los datos son: Preguntas:
Mes Producción Precio Estime el precio de venta de sardina cuando la producción de pesca en cierto mes fue de 4.5
1 2.5 3.0 ton.
2 3.5 5.0
3 1.5 4.0
4 1.0 6.0
5 1.2 6.7
6 0.8 7.0
7 2.7 2.8
8 3.8 2.1
9 1.1 6.2
PRECIO
10 0.6 8.1
^
𝑦 =7.753762 −1.42447 𝑥
^
𝑦 =7.753762 −1.42447 (4.5)
0 PRODUCCIÓN
2
𝑅 =0.664963
SOLUCIÓN PASO A PASO
Ejemplo
Se llevó a cabo un proyecto de investigación para determinar si existe alguna relación entre los años
de servicio en un hospital y la eficiencia de las enfermeras. Se recogieron los datos siguientes. Se
desea predecir la eficiencia del empleado.
n
xi yi nxy
r i 1
n 2 2
n
2 2
xi nx yi ny
i 1 i 1
r = 0.994235, lo que tiende a indicar que existe una correlación positiva intensa.
RECTA DE MINIMOS CUADRADOS. Para poder obtener la recta de regresión Y en X
utilizaremos la siguiente ecuación de estimación:
Nota: Para hallar las formulas anteriores se deriva la sumatoria de errores al cuadrado con
nxy respecto a b0 y b1 . (Investigación del alumno)
b 0 y b1 x
2
MATEMATICA FISICA n
11 12 3
13 14 4
15 13 3
15 15 4
16 17 4
17 16 3
17 17 4
18 17 2
19 18 1
20 20 2
CONCLUSIONES
• Cuando entre las dos variables hay una relación directa, la covarianza da un valor positivo.
• Cuando entre las dos variables hay una relación inversa, la covarianza da un valor negativo.
• Cuando entre las dos variables no hay una relación, la covarianza da un valor en torno a cero.
• El coeficiente de correlación lineal no tiene unidades.
BIBLIOGRAFÍA RECOMENDADA
Correa Morales, J. C. y Barrera Causil, C. J. (2019). Introducción a la estadística Bayesiana. Instituto Tecnológico Metropolitano.
https://elibro.net/es/lc/biblioua/titulos/105716
Horra Navarro, J. D. L. (2018). Estadística aplicada (3a. ed.). Ediciones Díaz de Santos. https://elibro.net/es/lc/biblioua/titulos/57542
García Ramos, J. A. Ramos González, C. D. y Ruiz Garzón, G. (2016). Estadística empresarial. Servicio de Publicaciones de la Universidad de Cádiz.
https://elibro.net/es/lc/biblioua/titulos/33881
Gutiérrez González, E. y Vladimirovna Panteleeva, O. (2016). Estadística inferencial 1 para ingeniería y ciencias. Grupo Editorial Patria.
https://elibro.net/es/lc/biblioua/titulos/40474
Llinás Solano, H. (2017). Estadística descriptiva y distribuciones de probabilidad. Universidad del Norte. https://elibro.net/es/lc/biblioua/titulos/70059
Llinás Solano, H. (2018). Introducción a la estadística matemática. Universidad del Norte. https://elibro.net/es/lc/biblioua/titulos/70063
GRACIAS
ESTADISTICA INFERENCIAL
Unidad IV
REGRESION SIMPLE Y MULTIPLE
Sesión 15
EXAMEN FINAL
El éxito leve puede ser explicado por las habilidades y el trabajo. El éxito salvaje es atribuible a la varianza.
-Nassim Taleb-
PRESENTACIÓN
GRACIAS
ESTADISTICA INFERENCIAL
Unidad IV
REGRESION SIMPLE Y MULTIPLE
Sesión 16
EXAMEN SUSTITUTORIO
El éxito leve puede ser explicado por las habilidades y el trabajo. El éxito salvaje es atribuible a la varianza.
-Nassim Taleb-
PRESENTACIÓN
GRACIAS