Está en la página 1de 14

19/05/2023

Regresión Lineal Simple


Al iniciar el estudio de la correlación y la regresión lineal, te darás cuenta
que en el campo de la estadística existen situaciones que requieren el
análisis de más de una variable estadística. Por ejemplo, te has
preguntado si alguna vez:

¿existe una relación entre la estatura y el peso?

¿están relacionadas la edad y la resistencia física?,

¿El numero de llamadas telefónicas de un vendedor y el numero de


artículos vendidos?

¿tienden a tener mayor escolaridad las personas con altos ingresos en


comparación con las de bajos ingresos?

¿Las personas con mas ingresos mensuales tienden a gastar mas en


actividades de ocio?
Estas situaciones cotidianas necesitan analizarse estadísticamente
utilizando por lo menos dos variables estadísticas.

Relación entre dos variables


El modelo de regresión lineal simple nos permite construir un modelo para
explicar la relación entre dos variables.

El objetivo es explicar el comportamiento de una variable Y a la que se le


refiere como variable explicada, dependiente o endógena a partir de otra
variable X a la cual se le llama explicativa, independiente o exógena

Ejemplo de relación entre dos variables:

Si las dos variables son los ingresos mensuales y los gastos en actividades
de ocio, entonces podríamos escoger la segunda como variable explicada
Y y la primera como variable explicativa X, ya que, en principio, los gastos
en ocio dependerán mucho de los ingresos:

Cuanto más dinero ganemos, mayor será la parte que gastaremos en ocio.

1
19/05/2023

Variables
Otro ejemplo son el numero de llamadas telefónicas de un vendedor de
copiadoras y el numero de copiadoras vendidas.

La primera se le conoce como variable independiente y la segunda


dependiente, ya que a medida que aumentan las llamadas telefónicas
crece la cantidad de unidades vendidas.

En el estudio de estos temas puede hacerse desde el caso mas simple


(regresión Lineal simple) hasta el mas complejo en donde intervienen
mas de dos factores.

Queremos construir modelos que describan la relación entre las


variables con el propósito, principalmente, de predecir los valores de
una variable a partir de los valores de la otra. Para ello se utiliza el
modelo de regresión lineal simple.

Análisis de Correlación
Un análisis de correlación es el estudio de la relación entre las
variables.

También lo podemos definir como un conjunto de técnicas estadísticas


empleadas para medir la intensidad de la asociación entre dos
variables.

Objetivo

El principal objetivo de un análisis de correlación es determinar que tan


intensa es esa relación entre las dos variables. Comúnmente el primer
paso es mostrar los datos en un diagrama de dispersión

Diagrama de Dispersión

Grafica que representa la relación entre dos variables

2
19/05/2023

Correlacion Negativa Perfecta


10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X

Correlacion Positiva Perfecta

10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X

3
19/05/2023

Cero Correlacion

10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X

Correlacion Positiva y fuerte


(X y Y tienen una relacion positiva intensa)

10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X

4
19/05/2023

Ejemplo
La compañia Copier Sales of America, es una empresa que tiene una
gran fuerza de ventas en E.U, por lo que desea determinar si existe
relación entre el número de llamadas telefonicas de ventas hechas
en un mes y la cantidad de copiadoras vendidas durante ese lapso.

El gerente selecciona al azar una muestra de 10 representantes y


determina el número de tales llamadas que hizo cada uno en el mes
anterior asi como la cantidad de productos vendidos.

La informacion es la siguiente:

Regresión Lineal Simple

Hacer un diagrama de dispersión.

5
19/05/2023

Diagrama de dispersión

Parece haber cierta relación entre el numero de llamadas y la


cantidad de unidades vendidas. Sin embargo esta relación no es
perfecta ya que el empleado Jones realizo solo 30 llamadas y
vendio mas.

El diagrama de dispersión indica gráficamente que los


representantes de ventas que hacen mas llamadas telefónicas,
tienden a vender mas copiadoras.

En la grafica parece existir una relación positiva entre las dos


variables, pero NO todos los puntos aparecen en una misma línea
recta.

Para medir la intensidad y dirección de esta relación entre las dos


variables Se utilizara el coeficiente de correlación

6
19/05/2023

Coeficientes de correlación
El coeficiente de correlación describe la intensidad entre dos
variables. Se denota con r o r de pearson. Puede tomar cualquier
valor de -1.0 a +1.0

Un coeficiente de correlación de -1 ó + 1 indica una correlación


perfecta. Si NO existe en absoluto alguna relación entre los dos
conjuntos de variables la r será cero.

Si la r = 0.08 indicaría que la relación es muy débil, correlación de -


0.91 a + 0.91 la relación es muy intensa.

Formula para r

n(XY ) − (X )(Y )


r=
n(X ) − (X ) n(Y )− (Y ) 
2 2 2 2

7
19/05/2023

Donde:

n es el numero de observaciones

ΣX es la suma de los valores de la variable x

ΣY es la suma de los valores de la variable

(ΣX²) es la suma de los cuadrados de los valores de la variable x

(ΣX)² es el cuadrado de la suma de los valores de la variable x

(ΣY²) es la suma de los cuadrados de los valores de la variable Y

(ΣX)² es el cuadrado de la suma de los valores de la variable x

ΣXY suma de los productos X y Y

n(XY ) − (X )(Y )


r=
n(X 2

) − (X ) 2 n(Y 2 ) − (Y )
2

8
19/05/2023

n(XY ) − (X )(Y )


r=
n(X 2
 ( )
) − (X ) 2 n Y 2 − (Y )
2

10(10,800) − (220)(450)
=
10(5,600) − (220) 10(22,100) − (450) 
2 2

n(XY ) − (X )(Y )


r=
n(X 2
 ( )
) − (X ) 2 n Y 2 − (Y )
2

10(10,800) − (200)(450)
=
10(5,600) − (220) 10(22,100) − (450) 
2 2

r = 0.759

Interpretación:

Primero es positivo, de manera que hay una relación directa entre el


número de llamadas y el número de ventas. El valor es cercano al
uno por lo que la relación es buena.

9
19/05/2023

Relacion fuerte Entre 0.85 y 0.99

Relacion buena Entre 0.75 y 0.84

Relacion moderada entre 0.50 y 0.74

Relacion débil menor a 0.50

Cuando es 0 no hay relación

Coeficiente de determinacion
El coeficiente de determinacion se interpreta como una proporcion
o porcentaje.

La porcion de la variacion total en la variable dependiente Y, se


explica por la variacion en la variable independiente X.

El coeficiente de determinacion se calcula elevando a cuadrado el


coeficiente de determinacion:

r² = coeficiente de determinacion

Entonces (0.759)² = 0.576 este valor es una proporcion o


porcentaje

Puede decirse que un 57.6% de la variacion en el número de


copiadoras vendidas se explica por la variacion en el numero de
llamadas a los clientes.

10
19/05/2023

Ejercicio 1
Un estudiante de universidad desea conocer acerca de los costos
en libros de textos.

Él cree que hay una relación entre el número de páginas en el texto


y el precio de venta del libro. Para ello investigar mas de fondo el
problema el estudiante selecciona una muestra de ocho libros de
textos actualmente en venta en la librería.

Dibuje un diagrama de dispersión.

Calcule el coeficiente de correlación.

Calcule el coeficiente de determinación y se interprete

Conclusiones

Dibuje un diagrama de dispersión.

1) Calcule el coeficiente de correlación.

2) Calcule el coeficiente de determinación y


se interprete

Conclusiones

11
19/05/2023

Prueba de Significancia del Coeficiente de Correlación

En el ejemplo anterior de las copiadoras encontramos una correlación de 0.759, lo cual


significa una buena relación entre las variables.

Sin embargo solo se tomaron 10 muestras de la población. ¿Pudiera ser que la correlación
en la población fuera cero?

Resolver este dilema exige una prueba para contestar la pregunta: Podría haber una
correlación cero entre la población que se tomo la muestra? Se realizara la prueba con un
nivel de significancia 0.05

Para ello se formulan las siguientes hipótesis:

H0: La correlación en la población es cero (nula)


H1: La correlación en la población es diferente de cero

Prueba t para el Coeficiente de Correlación


Para localizar el valor critico utilizar tabla de distribución t de
student

Con n – 2 grados
de libertad

12
19/05/2023

Prueba de Hipótesis

Pruebe la hipótesis que no hay correlación en la


población.

Utilice un 0.05 nivel de la significación.

Paso 1: H0: La correlación en la población es cero.


H1: La correlación en la población no es cero.

Paso 2: Se rechaza H0 si t > 2.306 o si t < - 2.306

Grados de libertad = n -2 10-2 = 8

Nivel de significancia 0.05

Valor critico = 2.306

Prueba de Hipótesis

Región de rechazo Región de rechazo


(hay correlación) (hay correlación)

H0 no se rechaza
(no hay correlación)

-2.306 0 2.306 Escala de t

13
19/05/2023

Calcular el valor de t

Para encontrar el valor de la estadistica de la prueba que utilizamos:

Paso 4: Tomar la decisión

H0 Se rechaza. Lo cual significa que la correlación en la población no


es nula.

Ejercicio 2
Una determinada empresa de
iluminación analiza la relación entre Número de Consumo
el consumo de energía eléctrica y el habitación (miles/kws)
número de habitaciones en una 12 9
residencia privada familiar. 9 7
14 10
Se toma una muestra aleatoria de 10
casos. 6 5
10 8
Existe relación entre las variables? 8 6
10 8
Al realizar una prueba de hipótesis
10 10
con un nivel de significancia del 5%
¿Cuál hipótesis acepta? 5 4
7 7

14

También podría gustarte