Está en la página 1de 36

zegelipae.edu.

pe
Estadística para los Negocios

Sesión nº 12
Indicador de logro nº 3: Estadística Descriptiva 2
Resuelve situaciones problemáticas mediante la determinación e interpretación de
indicadores de dispersión y el análisis de la correlación y regresión lineal con miras a
optimizar los procesos de toma de decisiones vinculadas al ámbito de los negocios en MS
EXCEL y PSPP.
Tema de la clase: Correlación y regresión lineal
Al finalizar la clase, el estudiante resuelve situaciones problemáticas
mediante la interpretación del coeficiente de correlación, determinación
y regresión lineal con miras a optimizar los procesos de toma de
decisiones vinculadas al ámbito empresarial, con el apoyo de las
herramientas de Microsoft EXCEL y PSPP.
Contenido temático:
• Coeficiente de correlación,
• Coeficiente de determinación,
• Recta de regresión lineal y pronóstico
Conexión
¡Siento curiosidad y deseo por aprender!

zegelipae.edu.pe
Dialogamos
¿Qué es una correlación?
¿Podría dar ejemplos?
Exploración
¡Utilizo mis conocimientos previos y experiencia para asimilar lo nuevo!

zegelipae.edu.pe
Análisis Año Venta en millones Gastos en
de euros publicidad en
millones de euros
2010 200 30
2011 400 50
2012 800 50
2013 1200 60
2014 900 60

• ¿Existe relación entre las variables de ventas y gastos en publicidad?

• ¿Quién es la variable dependiente e independiente?

• Según la gráfica, ¿qué influencia tienen los gastos de publicidad sobre el


volumen de facturación o las ventas de la empresa?
Construcción
¡Construyo nuevos conocimientos!

zegelipae.edu.pe
Correlación El método estadístico que estudia y define el grado de afinidad o
relación entre las variables se denomina “correlación simple”; la cual
simple (r) también expresa el grado de bondad del ajuste de las líneas de
regresión.

Decimos que dos variables, X e Y, están correlacionadas cuando


existe:

Variable
Independiente X Relación cuantitativa
entre ellas Y Variable
Dependiente

Ejemplo:

• Altura y peso de niños.


• Velocidad máxima que alcanza un coche y potencia de su motor.
Nubes de Sea un conjunto de pares de valores de las variables X e Y. Si
Puntos los representamos en un diagrama de dispersión obtendremos
una “nube de puntos” que nos dará una idea gráfica de la
posible correlación entre ambas variables.

Y Y Y

X X X

No hay Correlación Correlación


correlación positiva negativa
 •El índice de correlación se define mediante fórmulas específicas (dependiendo del
Índice o modelo de regresión)
coeficiente •El valor de “r” varía entre -1 y +1, es decir: -1 1
•Para la interpretación clásica el índice de correlación de todo modelo de regresión
de se tiene la siguiente tabla de categorías:
correlación ESCALA CATEGORIAS ESCALA

-0,2 r 0,0 Existe correlación no significativa 0,0 < r 0,2

-0,4 r ≤ -0,2 Existe baja correlación 0,2 ≤ r 0,4

-0,7 r ≤-0,4 Existe una significativa correlación 0,4 ≤ r 0,7

-1,0 r≤-0,7 Existe alto grado de correlación 0,7 ≤ r 1,0

r = -1 Existe perfecta correlación r=1


r=0 Los datos están incorrelacionados r=0

La categorización mostrada en la tabla es arbitraria ya que dependerá de la naturaleza


de la investigación o definición especifica del investigador.
Coeficiente
de Fórmula:
correlación
n x y   x y
r
n x    x  n y    y 
2 2 2 2

Donde:

n : Número de datos.
X : Variable independiente.
Y : Variable dependiente.
r : Coeficiente de correlación o de Pearson.
 
El Coeficiente de Determinación: Proporción de la variación
Coeficiente total en la variables dependiente “Y” que se explica, o contabiliza ,
de por la variación en la variable independiente “X ”. Es el coeficiente
de correlación elevado al cuadrado.
Determina-
ción  Por ejemplo: Si resulta r = 0.80 → = *100
Entonces el coeficiente de determinación es 64%, que de los
datos de la variable “x” condiciona a los datos de la variable “y” en
un 64% de los casos.

Su valor oscila entre 0 y 1. El coeficiente se expresa normalmente


en porcentaje. Así mientras más cercano este a 100% se entiende
que la bondad del ajuste nos indica que la mayor cantidad de los
puntos de la distribución se pueden explicar mediante la recta de
regresión. Por el contrario su cercanía al cero % nos indica la poca
fiabilidad de la recta de tendencia.
Es un modelo matemático de pronóstico que relaciona dos conjuntos de
Regresión datos, función, que permite calcular una variable aleatoria cuando otra
Lineal toma un valor determinado. Su aplicación implica suponer un
comportamiento lineal creciente o decreciente, por tal razón, debe de
existir un análisis previo de correlación entre ambas variables que nos
indique la intensidad de dicha relación.

Y • Variable Aleatoria
Y=a + bX
X • Variable explicativa b

n • Muestra de individuos

b Pendiente de la recta

a Punto en que la recta corta el eje vertical



Ecuación Y  a  b*(X ) Fórmulas
de
regresión  Donde:
: Es el valor estimado de la variable a
 y  b x
“Y” (pronóstico). n
a : Es la intersección con el eje Y.
b : Es la pendiente de la recta n xy   x  y
b
n x    x 
X : Es cualquier valor de la variable 2 2
independiente que se seleccione.

Pendiente “b” de la Recta de Regresión ( Aplicando Mínimos Cuadrados)

Si b > 0 Esto significa que la relación es lineal positiva o directa, es


o r>0 decir, aumenta “y” en la medida que aumenta “x”
Si b < 0 Esto significa que la relación es lineal negativa o inversa, es decir,
o r<0 aumenta “y” en la medida que disminuye “x”
Año 5 15 24 16 19 3 6 12 27 13
Caso 1 Ingresos 40 40 90 70 60 20 30 30 70 50

Primer paso: Utilizar el método de los mínimos cuadrados.


Los siguientes datos
representan los años de
experiencia y el ingreso anual
(en miles de soles) para un
conjunto de profesionales.
Resolución
Segundo paso: Con los resultados
de la tabla anterior reemplaza los
datos en la fórmula del coeficiente
de correlación, determinación y
ecuación de la recta.

n      
10 140 500
     
     
8 360 2 530 29 400
n x y   x  y
r
n x    x  n y    y 
2 2 2 2
Resolución

10 8360 140 500

2530 140 10 29400 500


10
Coeficiente
de El coeficiente de determinación como es el cuadrado del
determina- coeficiente de correlación.
ción
 
Ecuación
  2
de 𝑟 =73.7 5 %
regresión

n xy   x  y 10 8360 140 500


b
n x    x 
2 2

10 2530 140
Coeficiente
de
determina-
ción

Ecuación a
 y  b x
de n
regresión 500 B 140

10
Con la
ayuda de la
calculadora
1. 2.
Colocar los datos

3. 4.
5. 6.
7. 8.
Con la
ayuda de la 9.
calculadora
10.
CLASSWIZ

1. 2. 3.
4. 5.
6. 7.
En Excel

Coeficiente
de
correlación
=COEF.DE.CORREL( )
=PENDIENTE( )

Coeficiente de
determinación

=COEFICIENTE.R2( )
=INTERSECCION.EJE( )
Ecuación Año 5 15 24 16 19 3 6 12 27 13
de Ingresos 40 40 90 70 60 20 30 30 70 50
regresión
mediante
gráficos de
EXCEL
1. Seleccione las dos columnas de
datos a relacionar.
2. En EXCEL, seleccionar en el menú
INSERTAR.
3. Escoger Gráfico de Dispersión y
dentro del menú desplegable
escoger “Dispersión”
Ecuación
de
regresión

Damos clic en Títulos en los


ejes y en Línea de Tendencia

Abrimos el menú desplegable

Damos clic en más opciones


Ecuación
de Año vs Ingresos
regresión 100

90

80
f(x) = 2.39 x + 16.6
70 R² = 0.74

60

50

40

30

20

10

0
0 5 10 15 20 25 30

Marcamos las casillas Presentar


ecuación y R cuadrado
Ahora mediante PSPP:
PSPP

𝑟=0.86
 
𝑟  2= 0.7375
PSPP

𝑌
  =16.60+2.39 𝑋
Interpreta-
ción
El coeficiente de correlación es 0.8587665945 lo que
indica que existe alto grado de correlación entre años
de experiencias e ingreso anual (en miles de soles).

El coeficiente de determinación es igual a 0.7375 lo


que significa que el 73.75 % de los datos pueden ser
explicados por la recta de Regresión Lineal, por el
contrario el 26.25% no pueden ser explicados. En
resumen esta línea de tendencia nos permite
pronosticar un futuro valor solo con el 73.75% de
seguridad
Interpreta- Año vs Ingresos

ción 100

90

80
f(x) = 2.39 x + 16.6
R² = 0.74
70

60

50

40

30

20

10

0
0 5 10 15 20 25 30

Para 20 años de experiencia


laboral se espera un valor por

INGRESOS de:
y  Pero con una fiabilidad del 73.75%
Ejecución
¡Pongo en práctica los nuevos aprendizajes!

zegelipae.edu.pe
Actividad CASO: A partir de los siguientes datos referentes a horas
trabajadas en un taller (X) y unidades producidas (Y),
presencial determinar, el coeficiente de correlación lineal e
interprétalo.
Actividad virtual

Tipo de actividad: Tarea

Tiempo: 5 días

Indicaciones:
Resuelve individualmente:

• Una conocida marca de leche del Perú, estudió la relación entre las ventas y la cantidad que gastaba
en publicidad. A continuación se muestra la información de las ventas de los últimos cuatro meses.

• Hallar e interpretar el coeficiente de correlación y determinación.

• Subir el archivo al Campus Virtual.


zegelipae.edu.pe

También podría gustarte