Está en la página 1de 5

Estadística 2017 Carrera: Contaduría Pública

UNIDAD X
REGRESIÓN Y CORRELACIÓN LINEAL

INTRODUCCION
Todos los días un Gerente toma decisiones personales y profesionales que
se basan en predicciones de hechos futuros. Para hacer tales pronósticos debe
confiar en la relación (intuitiva y calculada) entre lo que ya se conoce y lo que va a
estimarse, si puede determinar cómo se relaciona lo conocido con el evento futuro,
contribuirá de manera importante al proceso de toma de decisiones, es decir la
manera de determinar la relación entre variables.

En la investigación estadística es muy frecuente encontrar variables que


están relacionados o asociados entre si de alguna manera, por ejemplo, el gasto
familiar depende del ingreso. Existen muchas variables en especial cuantitativas
que dependen en algún grado de otras, entonces es posible que una de las
variables pueda ser relacionada matemáticamente en función de otra. Por
ejemplo, el peso de las personas dependen en general de la estatura; el ingreso o
salario depende frecuentemente del nivel educativo; el ahorro familiar tiene
relación con los ingresos; la demanda dependerá de los precios, etc.

Cuando se encuentra que las variables están relacionadas entre sí, suele
ser útil averiguar cuan estrecha es la relación. Para determinar la relación entre las
variables y el grado de asociación entre ellas utilizamos el análisis de regresión y
correlación.

La relación y la correlación son en realidad dos conceptos diferentes, pero


que guardan una intima relación. La regresión es el método estadístico que
investiga y define la relación funcional entre dos variables y la ecuación
matemática constituye la ecuación de regresión o modelo de regresión. Por el
contrario, la correlación se utiliza para medir la fuerza de asociación entre las
variables, el análisis de correlación nos dice que tan bien la regresión describe la
relación.

DEFINICION
Es la rama de la Teoría Estadística que permite ajustar una ecuación de algún tipo
al conjunto de datos dado, con el propósito de obtener una ecuación de predicción
que relacione las variables de estudio.

El término de análisis de regresión simple indica que se estima el valor de la


variable dependiente con base en una variable independiente, en tanto que el
análisis de regresión múltiple se ocupa de la estimación del valor de la variable
dependiente con base en dos o más variables independientes.

La técnica de regresión se refiere al procedimiento de obtener una ecuación con


fines de estimar o predecir. La variable a estimar o a predecir se denomina
VARIABLE DEPENDIENTE y la otra variable que proporciona la base (o
información) para estimar o predecir se denomina VARIABLE INDEPENDIENTE.

Y  a  bX en donde: Y = variable dependiente


X = variable independiente

1
Estadística 2017 Carrera: Contaduría Pública

ECUACIÓN: Es un modelo matemático que representa la relación entre las


variables dependientes e independientes.

Relaciones:
a) Directa: las variables se incrementan o disminuyen a la vez.
b) Inversa: al aumentar una, disminuye la otra y viceversa.

Observación:
a) Para la relación directa, la pendiente de la recta es positiva, es decir, conforme
aumenta la variable independiente (X), también lo hace la variable dependiente
(Y).
b) Para la relación inversa, la pendiente de la recta es negativa, es decir, conforme
aumenta la variable independiente (X), disminuye la variable dependiente (Y).

REGRESION SIMPLE: en donde existe solamente una variable independiente y


una sola variable dependiente. Y  a  bX

REGRESION MULTIPLE: implica dos o más variables independientes y una sola


variable dependiente.
Y  a  bX  cX 2  dX 3  ...............

DIAGRAMA DE DISPERSION:
Un diagrama de dispersión proporciona una imagen visual del tipo de relación
involucrada y sugiere el tipo de ecuación que mejor se ajusta a los datos o a las
observaciones (también lo llaman nube de puntos).

El diagrama de dispersión permite realizar un primer análisis del comportamiento


de los datos. Es el primer paso a determinar si existe una relación entre dos
variables, consiste en examinar la gráfica de los datos observados (o
desconocidos). Puede brindar dos tipos de información:
1) Visualmente podemos buscar patrones que indican que las variables están
relacionadas.
2) Si existe una relación entre ellas, podemos decir que clase de línea o ecuación
de estimación, describe dicha relación.

METODO DE MINIMOS CUADRADOS: El método de ajustar una línea a pares de


observaciones en base a este criterio se conoce como método de mínimos
cuadrados.
El criterio de mínimos cuadrados implica que la recta elegida para ajustar los
puntos del diagrama de dispersión sea tal que la suma de los cuadrados de las
distancias verticales entre los puntos y la recta sea la más pequeña posible.
Las fórmulas utilizadas son:

Y  a  bX (Recta de mínimos cuadrados)


en donde: Y = variable dependiente
X = variable independiente
a = coeficiente de intersección
b = coeficiente dependiente

2
Estadística 2017 Carrera: Contaduría Pública

Y  n a  b  X
 XY  a  X  b  X 2

X 2
 Y   X  XY n  XY   X  Y
a b
 X   X 
2 2
n X 2 2
n X

ANALISIS DE CORRELACIÓN: Se ocupa de la medición de la cercanía de la


relación entre las dos variables (X e Y) involucrada en la ecuación de regresión.

COEFICIENTE DE CORRELACIÓN: La medida usual del grado de correlación


basándose en una muestra de n pares de observaciones es el coeficiente de
correlación, comúnmente denotado por “r”.

n  XY   X  Y
r
n  X 2
 X 
2
 n  Y 2
  Y 
2

GRADO DE CORRELACION: El grado de exactitud en la predicción depende de
la cercanía de la relación entre X y Y. Cuando la correlación es insignificante, se
obtiene poca precisión utilizando la recta de mínimos cuadrados para realizar
predicciones; pero cuando la correlación es fuerte; esto es, cuando la recta de
mínimos cuadrados es cercana a todos los puntos del diagrama, se logra grande
exactitud utilizando la recta con fines de estimación y predicción.

Si la correlación entre X y Y es fuerte, la mayor parte de la variabilidad de Y puede


atribuirse a la relación con X y “r” será cercano a 1 o a –1. El valor de “r” varía de –
1 a 1. Si r = 1 o –1 esto significa que existe un ajuste perfecto; estos son, los
puntos observados caen todos sobre la recta de regresión. Si la correlación entre
X e Y es débil, muy poco de la variabilidad de Y puede atribuirse a su relación con
X y “r” será cercano a 0. Cuando r = 0, indica que no existe correlación; esto es,
nada de la variabilidad de Y puede atribuirse a su relación con X.

Cuando r esta entre 0 y 1, existe una correlación positiva entre las dos variables X
e Y, esto es los valores se mueven en la misma dirección. Por otra parte, cuando
“r” esta entre –1 y 0, existe una correlación negativa entre X y Y. Entonces los
valores de X y Y tienden a moverse en dirección opuesta; cuando uno aumenta, el
otro tiende a disminuir y viceversa.

Si r > 0, existe correlación directa positiva


Si r < 0, existe correlación inversa negativa
Si r = +1, existe correlación perfecta positiva
Si r = -1, existe correlación perfecta negativa
Si r = 0 , no hay correlación

ESTIMACIÓN: Mediante la recta de REGRESIÓN permite obtener los valores de


la variable dependiente para determinados valores de la variable independiente.

3
Estadística 2017 Carrera: Contaduría Pública

PREDICCIÓN: Consiste en obtener los valores posteriores para la serie analizada


proyectando a través de la recta estimada.

X Y XY X2 Y2
1 1 1 1 1 1
2 3 2 6 9 4
3 4 4 16 16 16
4 6 4 24 36 16
5 8 5 40 64 25
6 9 7 63 81 49
7 11 8 88 121 64
8 14 9 126 196 81
 56 40 364 524 256

X 2
 Y   X  XY n  XY   X  Y
a b
 X   X 
2 2
Y  a  bX n X 2 2
n X

40(524)  56(364)
a = 0,55
8(524)  (56) 2

8(364)  56( 40)


b = 0,64
8(524)  (56) 2

Y= 0,55 + 0,64 X

Estimación:

Estimar el valor de Y, para X = 10 y 15


Y = 0,55 + 0,64(10) = 6,85
Y = 0,55 + 0,64(15) = 10,00

Ejercicios Propuestos
1- Para el siguiente conjunto de datos:
a) Graficar el diagrama de dispersión.
b) Desarrolle la ecuación de estimación que mejor describa los datos.
c) Determine Y para X = 10, 15, 20
X 13 16 14 11 17 9 13 17 18 12
Y 1,0 2,0 1,4 0,8 2,2 0,5 1,1 2,8 3,0 1,2

2- Usando los datos de la siguiente tabla:


a) Desarrolle la ecuación de estimación que mejor describa los datos.
b) Determine Y para X = 5, 6, 7
c) Calcular el coeficiente de correlación.
X 15 6 10 5 12 14
Y 6 16 15 18 9 10

3- Si tenemos el siguiente conjunto de datos:


a) Encuentre la línea del mejor ajuste.
b) Estime el valor de la variable dependiente, cuando X = 44
X 56 48 42 58 40 39 50
4
Estadística 2017 Carrera: Contaduría Pública

Y 9,5 7,5 7,0 9,5 6,2 6,6 8,7

4- Un estudio, efectuado por el departamento de transporte de Atlanta sobre el


efecto que los precios de los boletos de autobús tienen en el número de pasajeros,
produjo los siguientes resultados:
Precio de boleto (cts.) 15 20 25 30 35 40 45 50
Cantidad de Pasajeros 440 430 430 370 360 340 350 350
a) Graficar los datos.
b) Desarrolle la ecuación de estimación que mejor describa estos datos.
c) Determine el número de pasajeros, si el precio del boleto costase 35
centavos de dólar.
d) Calcular el coeficiente de correlación.

5- En economía, la función demanda de un producto se estima a menudo


calculando la regresión de la cantidad vendida (Q) sobre el precio (P). Una
empresa está tratando de estimar dicha función para su nueva muñeca “Mary”
y ha recabado los siguientes datos:

P 10,0 4,7 8,5 8,0 4,5 4,0 3,0 2,0


Q 100 150 128 120 162 170 180 200
a) Calcule la línea de regresión de mínimos cuadrados.
b) Trace la línea de regresión ajustada.

También podría gustarte