Está en la página 1de 26

SESIÓN 13: Análisis

Correlacional: evaluación de
patrones lineales.
Determinación de la ecuación
de regresión lineal simple.
INTRODUCCIÓN RELACIONANDO
VARIABLES

El presupuesto de una universidad, cuya


variación puede ser predicha por la variable
explicativa número de alumnos.
RELACIONANDO
VARIABLES

El consumo de gasolina de un vehículo,


cuya variación puede ser explicada por
la velocidad media del mismo.
ANÁLISIS DE
REGRESIÓN
• Propósito: determinar
la ecuación de
regresión; se usa para
predecir el valor de la
variable dependiente
(Y) basado en la
variable
independiente (X).
Es una técnica estadística que sirve para analizar la
dependencia de una variable respecto a otra
variable, es decir, conociendo los valores de una
variable independiente se trata de estimar los
valores de una variable dependiente.

Las funciones que persigue el Análisis de Regresión son:


Determinar si las variables independientes y la variable
dependiente presentan fuerzas de relación.
Determinar la estructura o la ecuación matemática
que relaciona las variables independientes con las
dependientes.
Pronosticar o predecir los valores de la variable
dependiente en función de la variable independiente.
Controlar otras variables independientes al evaluar las
contribuciones de una variable especifica o un conjunto
de variables.
Procedimiento:
• Seleccionar una muestra de la población
• Enumerar los datos por pares para cada
observación.
• Dibujar un diagrama de dispersión para
visualizar la relación.
• Determinar la ecuación de regresión.
DIAGRAMA DE DISPERSIÓN:
(NUBES DE PUNTOS- ESPARCIMIENTO)

• Es el primer paso a realizar para determinar si


existe una relación entre dos variables.
• Este grafico consiste en un conjunto de puntos
(x, y) presentados en un plano cartesiano.
• Este diagrama permite visualizar el patrón de
comportamiento de estas variables y por ende
conocer la ecuación de regresión que describen
dichos datos.
Gráficos de Dispersión
MODELO DE REGRESIÓN
LINEAL

𝑌 = 𝛽0 + 𝛽1 𝑋
Vamos a llamar a
“X: VARIABLE INDEPENDIENTE o
EXPLICATIVA”,
y a la otra la llamaremos
“Y: VARIABLE DEPENDIENTE o
EXPLICADA”.
CÁLCULO DE LOS COEFICIENTES β0 y β1:
Ecuación de regresión poblacional
Y   0  1 X  
Ecuación de regresión muestral
Yˆ  ˆ0  ˆ1 X

 0 , 1 = Parámetros de la ecuación
_ _

1°  1 
 XY  n X Y 2° ˆ  y  ˆ x
_

X n X
2 2 0 1

Luego se sustituyen los valores en la


ecuación de la recta para obtener la
ecuación estimada o predicha.
ECUACION DE REGRESIÒN MUESTRAL:

3°   
y   0 1 X
¿Cómo se interpretan los parámetros?
Se interpretan según lo siguiente:

•  0 ,es el valor estimado de la variable Y


cuando la variable X = 0


• 1 ,es el coeficiente de regresión que está
expresado en las mismas unidades de Y por
cada unidad de X que se incremente,
entonces el valor de Y también varia, puede
decrecer o crecer, depende del sigo de + -1
CORRELACIÓN (r)
• El coeficiente de correlación (r) mide el grado de
relación lineal (intensidad) de la relación entre dos
variables cuantitativas. El coeficiente r puede
tomar valores entre -1.00 y 1.00.
• Básicamente, esta información se refiere a dos
características de la relación lineal: la dirección o
sentido y la cercanía o fuerza.
Como se calcula? ASÍ

• El coeficiente de correlación se expresa como:


n XY   X  Y
r
n X  ( X )
2 2
n  Y  ( Y )
2 2

EJEMPLO:
Cinco empresas de 2, 3, 5, 7 y 8 años de
funcionamiento en el mercado tienen ganancias
anuales en miles de soles: 14, 20, 32, 42 y 44
respectivamente. Determine el coeficiente de
correlación entre las variables e interprete sus
resultados.
Correlación negativa
Gráficos deperfecta Correlación Positiva
Dispersión, analizando la perfecta
(r=-1) (r=1)
correlación.

Correlación Negativa Perfecta Correlación Positiva Perfecta

Correlación Nula
EL COEFICIENTE DE
DETERMINACIÓN “R ”
2

La proporción de la variación total en la variable


dependiente Y que está explicada por o se debe a
la variación en la variable independiente X. El
coeficiente de determinación es el cuadrado del
coeficiente de correlación, y toma valores de 0 a
1.
𝑹𝟐 % = 𝑹𝟐 × 𝟏𝟎𝟎

• Donde:
R: Coeficiente de Correlación.
EJEMPLO 1
El departamento de producción de Celltronics
International desea explorar la relación entre el
número de empleados que trabajan en una línea
de ensamblado parcial y la cantidad de unidades
producida. Parte de las observaciones pareadas
se muestra a continuación:

N° DE ENSAMBLADORES 2 4 1 5 3

PRODUCCIÓN EN UNA HORA 15 25 10 40 30


(UNIDADES)
a. Cuáles son las variables?
b. En base al diagrama de dispersión
que tipo de relación sugiere el
comportamiento de las variables en
estudio.
c. ¿Cuál será el grado de correlación de
las variables?
d. ¿Cuál es la ecuación de recta que
mejor se ajuste a los datos?
EJEMPLO 2
INVESTIGACIÓN DESARROLLO Y GANANCIAS
El vicepresidente de una gran compañía opina
que las ganancias anuales de la empresa
dependen de la cantidad gastada en investigación
y desarrollo. El presidente de la compañía no está
de acuerdo y ha solicitado pruebas.
1.¿Qué herramienta puede presentar el
vicepresidente que sustenten su teoría?
2.¿Qué variables tendrá que medir?
3.¿Qué ecuación ayudará a predecir las
ganancias anuales en función de la
cantidad presupuestada en I y D?
4.¿Será esta ecuación lineal o no lineal?
5.¿Existirá relación entre ambas variables?
6.¿Qué precisión se puede esperar al usar
esta herramienta de toma de decisiones?
INVESTIGACIÓN DESARROLLO Y GANANCIAS

Gasto en Ganancia
Año IyD anual
(ciento de (millones)
60
miles )
1999 2 20 40
2000 4 25 20
2001 5 34 0
2002 4 30 0 5 10
2003 6 33
2004 5 34 ¿Una línea recta podría ser lo
2005 5 36 más adecuado para relacionar
estas variables?
2006 7 35
2007 8 40
2008 7 37
2009 8 41
INVESTIGACIÓN DESARROLLO Y
GANANCIAS
1. ¿Qué herramienta puede presentar el
vicepresidente que sustenten su teoría?
Puede presentar un Análisis de Correlación y
Regresión.
2. ¿Qué variables tendrá que medir?
Variable Independiente X: Cantidad gasta en
Investigación y Desarrollo.
Variable Dependiente Y: Ganancias anuales.
3. ¿Qué ecuación ayudará a predecir las ganancias
anuales en función de la cantidad presupuestada
en I y D?

y  16.2696  3.0497 X
INVESTIGACIÓN DESARROLLO Y GANANCIAS
4. ¿Será esta ecuación lineal o no lineal?
Es una ecuación lineal, en el diagrama de dispersión se
aprecia mejor que el modelo se ajusta a una regresión
lineal ( X crece , Y crece)   
y   0 1 X

5. ¿Existirá relación entre ambas variables? r  0.9152


La relación directa observada cuantificada por el
diagrama de dispersión, resultó igual a 0.9152, que
representa una “alta correlación positiva” entre los
gastos en investigación y desarrollo y las
ganancias anuales de la empresa.
INVESTIGACIÓN DESARROLLO Y
GANANCIAS
6. ¿Qué precisión se puede esperar al usar esta
herramienta de toma de decisiones?
Coeficiente de Determinación = r2 = (0.9152)2 = 0.8376
Como el coeficiente de determinación es un valor
cercano a 1, indica que los valores se ajustan a una
recta de regresión lineal simple.
La variabilidad de las ganancias anuales de la empresa
se explican en un 83.76% por regresión lineal de
los gastos invertidos en Investigación y Desarrollo
y las ganancias anuales de la empresa.
Ejemplo 3:
Se tienen información de los costos de mantenimiento de 06
maquinas llenadoras de gaseosas de distintas edades (vida útil
de las maquinas en años) de la Empresa Enrique Cassinelli e
Hijos S.A. La Gerencia desea hacer estimaciones o pronósticos
acerca del costo de mantenimiento (Y) en función del tiempo
operativo de la máquina (X). La información que se tienen es la
siguiente:

Maquina 1 2 3 4 5 6

Tiempo operativo en Años (X) 1 1 2 2 3 3

Costo de mantenimiento $ (Y) 30 40 70 80 100 100


1.Determinar la ecuación de regresión.
Interpretar sus coeficientes
2.Pronosticar el costo de mantenimiento para
una máquina que tienen 4 años operativos.
3.Calcule e interprete el coeficiente de
determinación.

También podría gustarte