Está en la página 1de 6

Clase 11 /10/2022

Participante Tiempo de Actitud hacia la


residencia(X) ciudad(Y)
1 10 6
2 12 9
3 12 8
4 4 3
5 12 10
6 6 4
7 8 5
8 2 2
9 18 11
10 9 9
11 17 10
12 2 2

Diagrama de dispersión
El diagrama de dispersión es una gráfica de los valores de dos variables para
todos los casos u observaciones
Se acostumbra graficar la variable dependiente sobre el eje vertical y la
variable independiente sobre el eje horizontal. Un diagrama de dispersión sirve
para determinar forma de la relación entre las variables. La gráfica puede
alertar al investigador sobre patrones en los datos o sobre problemas
potenciales. (Malhotra, 2008 pp.543-548)

Chart Title
12

10

0
0 2 4 6 8 10 12 14 16 18 20
En el diagrama de dispersión se observa una relación directa entre Tiempo
de residencia(X) y Actitud hacia la ciudad(Y)

Coeficiente de correlación lineal de Pearson

Cuando los datos se distribuyen con una distribución normal.


El coeficiente de correlación se expresa como:
S C xy
R=
√ S Cx S C y

Para nuestro ejemplo el coeficiente de correlación =r=0.936


La correlación entre el tiempo de residencia y actitud hacia la ciudad es
muy alta

Modelo de regresión Lineal simple


En el modelo de regresión bivariado, la forma general de una línea
recta es:
Y = β0 + β1 X + e
Ecuación de regresión poblacional

Y = variable dependiente o de criterio


X = variable independiente o predictiva
β0 = intersección de la línea

β1 = pendiente de la línea

e = Error de estimación
Estimación de parámetros
Ecuación de regresión muestral

Y^ i=a+b X i

variables coefficients
Intercept bo=1.0793
Tiempo de residencia(X) b1=0.5897

Y^ i=1.0793+ 0.5897 X i

*bo=Constante es la distancia que hay entre el origen del plano cartesiano


con la intersección de la ecuación de la recta y el eje Y

*b1=pendiente de la línea de regresión que indica el cambio esperado en Y


cuando X se modifica en una unidad.
Por el incremento de un punto de la actitud hacia la ciudad, habrá un
incremento de 0.5897 años respecto al tiempo de residencia

Error Estándar
Cuando se realiza una predicción, es importante determinar
el error estándar, el cual se representa por Sy.x y mide la
dispersión de los datos observados con respecto a la línea
de regresión.

Para nuestro ejemplo Sy.x=1.223


Coeficiente de determinación = R2

La fuerza de la asociación se mide con el coeficiente de

determinación, R2 , el cual varía entre 0 y 1, e indica la proporción


de la variación total en Y que se explica por la variación en X.
El coeficiente de determinación o bondad de ajuste mide cuanta
varianza explica un modelo cualquiera; en el caso de tener un
modelo lineal; el coeficiente de determinación coincide con el
cuadrado del coeficiente de Pearson.

Para nuestro ejemplo


R2 es 0.876 =87.6%

Y^ i=1.0793+ 0.5897 X i + No explica


100% =
87.6% + 12.4%

El 87.6% de la variabilidad total del tiempo de residencia esta explicada


por la actitud hacia la ciudad por lo tanto la bondad de ajuste es buena

Interpretación: El 87.92 % de variación de la variable dependiente


es explicada por el modelo de regresión lineal por lo que a la
diferencia con el 100% (100% - 87.92% = 12.08%) se le denomina
variación residual
Practica de regresión y correlación
1. Los datos de la producción de trigo en toneladas (X) y el precio
del kilo de harina en soles (Y) en la década de los 80 en Lim a
fueron:

Producción de trigo (X) 30 28 32 25 25 25 22 24 35 40


Precio de la harina (Y) 25 30 27 40 42 40 50 45 30 25

a) Realice un diagrama de dispersión e interprete los resultados


Chart Title
60

50

40

30

20

10

0
20 25 30 35 40 45

En el diagrama de dispersión se observa una relación


inversa entre la producción de trigo y el precio de la
harina

b) Realice la ecuación de regresión e interprete la pendiente.


Y=1.1495X
Por el incremento de una tonelada en la producción de trigo
habrá una disminución en el precio de 1.1495 en el kilo de
harina
c) Calcule e interprete el error estándar de estimación
Las dispersiones de los puntos observados respecto a la
línea de regresión estimada es 5.098

d) Calcule e interprete el coeficiente de determinación


R2=0.718=71.8%

Y =1.1495X +No lo explica


100% = 71.8% + 28.2%
El 71.8% de la variabilidad total del precio de la harina esta explicada por
la ecuación de regresión

También podría gustarte