Está en la página 1de 22

Estadística

Regresión lineal y no lineal.

Guía de Conceptos
Unidad IV
Estadística – Unidad IV

Contenido
INTRODUCCIÓN ................................................................................................................................... 2
1. REGRESIÓN LINEAL SIMPLE ........................................................................................................ 3
1.1. DESCRIPCIÓN ..................................................................................................................... 3
1.2. DIAGRAMA DE DISPERSIÓN O NUBE DE PUNTOS .................................................................... 3
1.3. LÍNEA DE REGRESIÓN .......................................................................................................... 4
1.4. AJUSTE DE UNA RECTA DE REGRESIÓN................................................................................. 4
1.5. CORRELACIÓN LINEAL ......................................................................................................... 5
1.6. COEFICIENTE DE CORRELACIÓN LINEAL O DE PEARSON ........................................................ 5
1.7. APLICACIONES DE LA REGRESIÓN LINEAL Y DEL COEFICIENTE DE CORRELACIÓN LINEAL .......... 6
2. REGRESIÓN SIMPLE NO LINEAL................................................................................................. 10
3. SERIES TEMPORALES ............................................................................................................... 11
3.1. DEFINICIÓN Y CARACTERIZACIÓN ....................................................................................... 11
3.2. AJUSTE DE UNA FUNCIÓN DE TENDENCIA ............................................................................ 12
3.3. TENDENCIA LINEAL............................................................................................................ 13
3.3.1. CONVERSIÓN DEL TIEMPO CALENDARIO EN ESCALA DE “X” .......................................... 14
3.4. APLICACIONES DE LA TENDENCIA LINEAL ............................................................................ 15
REFERENCIAS BIBLIOGRÁFICAS ......................................................................................................... 21

Guía de Conceptos – Material Básico pág. 1


Estadística – Unidad IV

Introducción
En esta Unidad se estudiará la regresión lineal, así como la correlación lineal, y aunque
existen otros modelos no lineales para relacionar variables, se focaliza el estudio en la
representación lineal conociendo dos variables que están en dependencia una de la otra, y
precisamente para medir dicha relación es utilizado el coeficiente de correlación.

Así también se expondrá las series cronológicas, donde se relacionan dos variables una de
ellas el tiempo, se ajustará la información conocida a la denominada línea de tendencia.

Ambos modelos lineales referidos, resultan muy útiles para hacer estimaciones o pronósticos
futuros en las áreas de estudios que lo precisen.

Guía de Conceptos – Material Básico pág. 2


Estadística – Unidad IV

1. Regresión Lineal Simple


1.1. Descripción
Refiere Gorgas (2011), que dentro del estudio de las variables estadísticas bidimensionales
se encuentra el análisis de la existencia de relaciones o dependencias entre las dos variables
“x” (variable independiente); “y” (variable dependiente) que forman la variable bidimensional.
Básicamente, la relación entre las dos variables podrá ser de dos tipos: funcional, cuando
exista una relación matemática exacta que combine ambas variables (ejemplo el radio y el
área de un círculo), o aleatoria, cuando, aunque no exista entre las variables una relación
exacta, se puede observar (aunque no siempre es el caso) una cierta tendencia entre los
comportamientos de ambas (ejemplo el peso y la altura de un individuo).

1.2. Diagrama de dispersión o nube de


puntos
Dado “n” observaciones bidimensionales, cada par de valores (x, y) en el plano cartesiano
está representado por un punto, y habrá tantos puntos como pares de observaciones se
tenga. Esta representación da origen a una nube de puntos que se denomina diagrama de
dispersión; este diagrama puede tomar diferentes formas, como se observa en las figuras 1
y 2.

La construcción del diagrama de dispersión constituye el primer paso para investigar la


relación existente entre dos variables, la posición y forma de esta nube proporciona una idea
del tipo de relación existente entre ambas variables, de este modo se facilita la elección de la
correspondiente función matemática.

I LUSTRACIÓN 1: D IAGRAMA DE DISPERSIÓN

. (Ávila, 2007)

Guía de Conceptos – Material Básico pág. 3


Estadística – Unidad IV

I LUSTRACIÓN 2: D IAGRAMA DE DISPERSIÓN .

(Ávila, 2007)

En la Figura 1, se observa que los diagramas A y B tienen una forma alargada, que está
indicando la existencia de una relación lineal, y por tanto podrá representarse por una línea
recta ascendente (pendiente positiva) y descendente (pendiente negativa) respectivamente;
en cambio en la figura 2 – C se vislumbra una relación no lineal o curvilínea, que podría
expresarse a través de una curva parabólica o una exponencial. Por su parte el diagrama de
la figura 2 – D presenta puntos muy dispersos, que no pueden expresarse por una recta o
una curva, es decir, que corresponde a variables no relacionadas. (Ávila, 2007)

1.3. Línea de regresión


Se conoce como línea de regresión a la representación gráfica de la función que se ajusta a
la nube de puntos del diagrama de dispersión. Un primer problema para el estudio de la
regresión es la elección del tipo de línea de regresión. Efectivamente, esta podrá adoptar
diferentes formas funcionales, y el tipo de línea se elegirá a partir de la forma de la nube de
puntos. Cuando dicha nube se distribuya aproximadamente a lo largo de una línea recta
ajustaremos una recta de regresión. Será el caso particular de la regresión lineal. En este
caso importante, la regresión de “y” sobre “x” es la siguiente expresión:

donde “a” y “b” son dos parámetros que deben ser determinados. Gráficamente “b” será la
ordenada de la recta en el origen (es decir el valor de y para x = 0) y “a” la pendiente de ésta.
(Gorgas, 2011)

1.4. Ajuste de una recta de regresión


Dentro del estudio de la regresión lineal se analizará cómo se pueden determinar los
parámetros “a” y “b” de la recta de regresión dada, es decir, en el caso de la regresión de “y”

Guía de Conceptos – Material Básico pág. 4


Estadística – Unidad IV

sobre “x” (el caso contrario es similar). Dicha recta de regresión permitirá obtener valores
aproximados de “y” conocidos los de “x”, y viceversa. (Gorgas, 2011 y Ávila, 2007)

Para obtener la recta que mejor se ajusta a la nube de puntos observada en la figura 1. A –
B, se usa el método de mínimos cuadrados, este es un criterio que establece que la mejor
curva posible es aquella que minimiza la suma de los cuadrados de las desviaciones entre
los puntos dados, y los correspondientes a dicha curva. (Diaz Mata, 2013)

Así, para expresar la recta

Se calculan

1.5. Correlación lineal


La correlación expresa el grado de asociación o afinidad entre las variables consideradas; la
correlación también explica el grado de la bondad del ajuste de las líneas de regresión.

Cuando se determina que las variables están íntimamente asociadas, la ecuación de la


función de regresión se utiliza para estimar o explicar el comportamiento de la variable
dependiente (explicada) en términos de las variaciones que experimentan las variables
independientes (explicativas). La interdependencia, se observa por ejemplo en el
comportamiento de las ventas de artículos para el hogar, que puede ser explicado por el
aumento de los niveles de ingresos, o por variación de los precios, o por modificaciones
técnicas en el artículo, etc. (Ávila, 2007)

1.6. Coeficiente de correlación lineal o


de Pearson
El coeficiente de correlación, es el estadígrafo que expresa o mide el grado de asociación o
afinidad entre las variables relacionadas, se denota por “r” y se define como:

Guía de Conceptos – Material Básico pág. 5


Estadística – Unidad IV

El coeficiente de correlación lineal es un número real comprendido entre −1 y 1:

De donde se deduce que:

El signo de “r” es el mismo que el signo de la pendiente “a”. (Ávila, 2007)

1.7. Aplicaciones de la regresión lineal y


del coeficiente de correlación lineal
Ejercicio 1
Supongamos que se quiere estimar la relación entre ingreso (miles $) y consumo (miles $),
para el efecto se eligió una muestra de 6 familias, tal se muestra en la tabla.

1) Elabora el diagrama de dispersión


2) Escribe la recta de regresión que se ajuste a los datos aplicando el método de los
mínimos cuadrados (utiliza en los cálculos hasta dos cifras decimales)
3) Grafica la recta sobre el diagrama de dispersión
4) Estima a cuánto ascenderá el ingreso, si el consumo es de $ 36
5) Estima cuál debería ser el consumo para un ingreso de $ 50
6) ¿Cuál es el coeficiente de correlación? Interpreta

Solución
1º) Diagrama de dispersión

A partir de la información presentada en la tabla se elabora el diagrama de dispersión o nube


de untos.

Guía de Conceptos – Material Básico pág. 6


Estadística – Unidad IV

I LUSTRACIÓN 3: D IAGRAMA DE DISPERSIÓN

Fuente: Elaboración propia, 2022

Este diagrama ya orienta la posición de la línea recta que se ajustará a los datos, la misma
será ascendente, con pendiente positiva.

2º) Recta de regresión

Se completa la tabla dada:

N=6

Guía de Conceptos – Material Básico pág. 7


Estadística – Unidad IV

Se calcula ahora los valores de los parámetros,

Entonces la Recta de regresión lineal es:

3º) Trazado de la recta de regresión sobre el diagrama de dispersión


Se construye la Tabla de valores (para graficar la recta de regresión sobre el diagrama de
dispersión) escogiendo dos valores arbitrarios para la variable “x”, de preferencia en la
cercanía de los valores dados en la tabla inicial.

I LUSTRACIÓN 4: L ÍNEA DE REGRESIÓN TRAZADA SOBRE EL DIAGRAMA DE DISPERSIÓN

Fuente: Elaboración propia, (2022)

Guía de Conceptos – Material Básico pág. 8


Estadística – Unidad IV

4º) Estimación del ingreso, si el consumo es de $ 36

x = ¿? Si y = 36 $

Se sustituye el valor dado de “y” en la ecuación de la recta

5º) Estimación del consumo para un ingreso de $ 50

Si x = 50 $ y = ¿?

Se sustituye el valor dado de “x” en la ecuación de la recta

5º) Obtención del coeficiente de correlación lineal o coeficiente de Pearson

Se aplica

Se utiliza la tabla anterior y se completa los elementos que se precisan:

N=6

Llevando lo calculado en la tabla sobre la relación del coeficiente de correlación lineal, se


tiene:

Guía de Conceptos – Material Básico pág. 9


Estadística – Unidad IV

Conclusión: La correlación es positiva, entonces existe una correlación es directa positiva


entre las variables, esto es, a medida que aumenta el ingreso aumenta el consumo.

2. Regresión Simple No Lineal


Siguiendo con Ávila (2007), en el ajuste de funciones de regresión simple, además de la línea
recta, se pueden utilizar las siguientes funciones matemáticas:

Cada una de estas funciones tiene una forma particular para un conjunto determinado de
valores (x, y), y definido por el valor de los parámetros o coeficientes de la respectiva
ecuación.

Por una nube de puntos puede pasar una infinidad de líneas o funciones, de esta familia
habrá una que es la función que mejor se ajusta a la nube de puntos. La operación para
determinar la función de regresión optima, se conoce como “ajuste de una función de
regresión”.

El problema de ajuste de una función de regresión a un conjunto de “n” valores (x, y),
comprende tres pasos:

1) Graficar el diagrama de dispersión o nube de puntos.


2) Definir la forma de la función de regresión (recta, parábola, exponencial, etc.)
3) Determinar el valor numérico de los parámetros de la función elegida.

Observación 1. Generalmente, es casi imposible que una línea o curva pase exactamente
por el lugar geométrico de los puntos (x, y).

Guía de Conceptos – Material Básico pág. 10


Estadística – Unidad IV

3. Series Temporales
3.1. Definición y caracterización
Una serie temporal o cronológica es un conjunto de datos estadísticos, recopilados,
observados o registrados a intervalos regulares y ordenados del tiempo. (Montiel, 2003)

Algunos ejemplos de series de tiempo son los datos diarios de los precios de alguna acción
que cotiza en la bolsa de valores, o los datos mensuales de la inflación o los datos anuales
de ventas de una empresa. (Diaz Mata, 2013)

La principal característica de los datos temporales es la dependencia de las observaciones.


Así, al estudiar los pedidos, la producción o las ventas de una empresa en distintas semanas
es muy probable que, aunque las magnitudes varíen las variaciones, s i las hay, tengan una
cierta regularidad. A largo plazo se apreciará por lo general una evolución que puede ser:

▪ Creciente (Ver figura 5)


▪ Decreciente (Ver figura 6)
▪ Otras series presentan variaciones que no muestran un claro crecimiento o
decrecimiento a largo plazo
I LUSTRACIÓN 5: R ELACIÓN SALARIOS / AÑOS

. Fuente: Elaboración propia a partir de Montiel, 2003

Guía de Conceptos – Material Básico pág. 11


Estadística – Unidad IV

I LUSTRACIÓN 6: T RABAJADORES CONTRATADOS / AÑOS .

(Elaboración propia a partir de Montiel, 2003)

3.2. Ajuste de una función de tendencia


El ajuste de una función a una serie cronológica consiste en elegir una función matemática
que mejor represente a la tendencia de la serie. Se trata de sustituir la línea poligonal (Ver
figuras 1 y 2) por una función matemática conocida y que facilite analizar la tendencia y
perspectiva de la serie cronológica; esta función proporcionará una idea del comportamiento
histórico de las variables, y lo más importante hacer pronósticos sobre el posible
comportamiento futuro de las dichas variables. (Ávila, 2007 y Diaz Mata, 2013)

Ese movimiento general a largo plazo de una serie temporal es lo que se denomina tendencia.
La tendencia se manifiesta en muchas series económicas mediante un movimiento regular a
largo plazo tal se presentaron en las figuras 1 y 2. (Diaz Mata, 2013)

En general, dice Ávila (2007), para definir la función de ajuste es recomendable:

▪ Graficar la línea poligonal o gráfico de líneas de la serie (Ver figuras 5 y 6)


▪ Analizar gráficamente la tendencia y forma de la poligonal
▪ Definir la función de ajuste, calcular los parámetros y escribir la ecuación respectiva

Las funciones de tendencia más conocidas son: la línea recta, la parábola, la curva
exponencial y la función logística (utilizada para crecimientos poblacionales).

Las series cronológicas tienen dos variables (t, y), entonces son funciones de la forma:

Guía de Conceptos – Material Básico pág. 12


Estadística – Unidad IV

3.3. Tendencia lineal


El ajuste de un conjunto de datos a una línea recta es muy utilizado, siendo la misma:

Donde los parámetros son,

La pendiente puede ser positiva (línea ascendente) o negativa (línea descendente).

Con esta ecuación se obtiene la línea de tendencia que permite estimar, por ejemplo,
producción, consumo, población, etc. en función del tiempo.

El procedimiento para determinar las líneas rectas de tendencia es similar al seguido en el


caso de las líneas de regresión.

Los parámetros se calculan aplicando las siguientes relaciones:

I LUSTRACIÓN 7: G RÁFICO DE LÍNEAS Y RECTA ASCENDENTE AJUSTADA SOBRE EL MISMO

Fuente: Elaboración propia, (2022)

Guía de Conceptos – Material Básico pág. 13


Estadística – Unidad IV

I LUSTRACIÓN 8:. G RÁFICO DE LÍNEAS Y RECTA DESCENDENTE AJUSTADA SOBRE EL MISMO

Fuente: Elaboración propia, (2022)

3.3.1. Conversión del tiempo calendario en


escala de “x”
En toda serie cronológica, cuando se trabaja con una función

Donde el tiempo calendario, que puede ser meses, trimestres, años, etc., debe convertirse
en una escala o valor de “x”, que generalmente es un número entero.

Así, la serie de los años calendarios:

Puede expresarse como:

También siguiendo a Kazmier (1998) puede elegirse cualquier año como origen, de manera
a trabajar ordenadamente se podría escoger 1988 (x = 0), entonces:

𝒙: 0 1 2 3 4 5 6

Es importante elegir una escala, para que el año calendario se exprese en valores de “x”,
denominado año codificado.

Esta última referencia será utilizada en los ejercicios de aplicación en el curso que se presenta
en la asignatura en estudio.

Guía de Conceptos – Material Básico pág. 14


Estadística – Unidad IV

Observación 2. Si los periodos analizados corresponden a años, éstos deben ser periodos
constantes, mostrándose los ejemplos siguientes:

3.4. Aplicaciones de la tendencia lineal


Ejercicio 2

La tabla muestra las ventas netas anuales (en millones de dólares) de una fábrica de
golosinas en el periodo 1997 – 2006. Codificando 1997 como año base (cero):

1) Dibuja la gráfica de líneas para los datos


2) Determina la ecuación de tendencia lineal para esos datos mediante el método de los
mínimos cuadrados, designando 1997 como el año base (cero) con el propósito de
codificar los años, y llevando todos los valores con dos cifras decimales
3) Dibuja la línea de tendencia sobre la gráfica de línea
4) ¿Cuáles fueron los pronósticos para los años 2007 y 2008, cuál sería para el 2022?

Solución

1º) Gráfica de líneas para los datos

Se construye una tabla con los años codificados tal se muestra, tomando 1997 como año
base (cero) tal indica el enunciado, y luego se diseña el gráfico de líneas utilizando un sistema
de ejes coordenados.

Guía de Conceptos – Material Básico pág. 15


Estadística – Unidad IV

I LUSTRACIÓN 9:. G RÁFICA DE LÍNEAS

Fuente: Elaboración propia, (2022)

2º) Línea de tendencia

Se completa la tabla de datos para poder calcular el valor de cada parámetro.

Guía de Conceptos – Material Básico pág. 16


Estadística – Unidad IV

N = 10

Entonces,

La línea de tendencia es

Guía de Conceptos – Material Básico pág. 17


Estadística – Unidad IV

3º) Trazado de la línea de tendencia sobre el gráfico de líneas

Se construye la Tabla de valores (para graficar la línea de tendencia sobre la gráfica de líneas)
escogiendo dos valores arbitrarios para la variable “x”, de preferencia en la cercanía de los
valores indicados en la columna de año codificado.

A continuación, la línea de tendencia sobre el gráfico de líneas diseñado en el punto 1º).


I LUSTRACIÓN 10: L ÍNEA DE TENDENCIA TRAZADA SOBRE LA GRÁFICA DE LÍNEAS

Fuente: Elaboración propia, (2022)

4º) Estimación de las ventas para los años 2007, 2012 y 2022

A los efectos de conocer el valor del año codificado para las estimaciones de los años
señalados, se muestra su obtención siguiendo la codificación de manera consecutiva a 2006.

Guía de Conceptos – Material Básico pág. 18


Estadística – Unidad IV

Amplia los conocimientos de esta unidad c on la


visualización del siguiente v ídeo:

Guía de Conceptos – Material Básico pág. 19


Estadística – Unidad IV

Como interpretar el modelo de regresión lineal

Recuperado de YouTube

Guía de Conceptos – Material Básico pág. 20


Estadística – Unidad IV

Referencias Bibliográficas
▪ Ávila, R. (2007). Estadística Elemental. Nueva edición. Lima, Perú: Estudios y
Ediciones RA.
▪ Diaz Mata, A. (2013). Estadística aplicada a la Administración y la Economía. México:
McGraw Hill.
▪ Gorgas, J. (2011). Estadística básica para estudiantes de Ciencias. España:
Universidad Complutense de Madrid.
▪ Kazmier, L. (1998). Estadística aplicada a la Administración y a la Economía. México:
McGraw Hill Interamericana SA.
▪ Montiel, A. (2003). Elementos básicos de Estadística Económica y Empresarial.
Madrid: Prentice Hall.

Guía de Conceptos – Material Básico pág. 21

También podría gustarte