Está en la página 1de 10

UNIVERSIDAD AUTÓNOMA DE BUCARAMANGA

VICERRECTORÍA ACADÉMICA. DPTO. DE MATEMÁTICAS Y C. N.


ESTADÍSTICA GENERAL. PROFESORA: CECILIA BRICEÑO P.
RESUMEN DE CLASE.

REGRESIÓN LINEAL SIMPLE

En este proceso se estudia la relación lineal que puede existir entre dos
variables. Esta relación puede ser directa o inversa. Los diferentes tipos de
relaciones lineales que pueden presentarse, se muestran en estos gráficos:

Tomada de: http://galeon.hispavista.com/metodoscuantitativo2/img/cuatro.jpg

Es importante encontrar la ecuación de la recta que mejor exprese la


relación entre las dos variables. El método que permite hallar la ecuación de
regresión lineal se llama de “mínimos cuadrados”.
Si la ecuación lineal es: Y = mx + b

Entonces,

 X Y  nXY
i i
m= b= Y  mX
 X  nX 2 2
i

Donde ( Xi, Yi) son los diferentes valores que toman las variables.

SUPOSICIONES DE LA REGRESIÓN LINEAL

 Los valores de la variable independiente X son fijos, medidos sin error.


 La variable Y es aleatoria.
 Para cada valor de X, existe una distribución normal de valores de Y
(subpoblaciones Y)
 Las varianzas de las subpoblaciones Y son todas iguales.
 Todas las medias de las subpoblaciones de Y están sobre la recta.
 Los valores de Y están normalmente distribuidos y son
estadísticamente independientes.

ANÁLISIS DE CORRELACIÓN

Proceso que permite medir si las variables están correlacionadas o nó y qué


tan fuerte es este grado de asociación.

Coeficiente de correlación(r): Parámetro utilizado para medir el grado de


relación lineal que existe entre dos variables. Este valor, simbolizado por r,
puede asumir valores entre –1 y 1.

X Y i i  nXY
r=
(X
2 2
i
2
 n X )(Yi 2  nY )

Coeficiente de determinación (r2): Es la porción de variación que es


explicada por la variable independiente del modelo de regresión. Porcentaje
de Y, que puede explicarse mediante la variación de X.

b Yi  m X i Yi  nY
2
2
r =
Y
2
i
2
 nY
EJEMPLOS

1. En el negocio de la publicidad, la circulación es una parte vital.


Cuantas más ventas registre una revista, mas anunciantes podrá tener.
Recientemente, surgió una diferencia entre los reportes de los editores
sobre las ventas de revistas en puestos de periódicos y las
subsiguientes auditorías que realizó la Oficina de Auditorias de
Circulación. Los siguientes datos representan las ventas reportadas y
las ventas auditadas (en miles) de los puestos de periódicos en 2018
para las siguientes 10 revistas.

REVISTA VENTAS VENTAS


REPORTADAS AUDITADAS(Reales
(miles de ejemplares) )
x (miles de ejemplares)
y
YM 621.0 299.6
COSMOGIRL 359.7 207.7
ROSIE 530.0 325.0
PLAYBOY 492.1 336.3
ESQUIRE 70.5 48.6
TEENPEOPLE 567.0 400.3
MORE 125.5 91.2
SPIN 50.6 39.1
VOGUE 353.3 268.6
ELLE 263.6 214.3

a. Construya un diagrama de dispersión y analícelo

El conjunto de puntos permite observar una alta tendencia lineal y


la relación entre las dos variables es directa.
b. Utilice el método de los mínimos cuadrados para encontrar la
ecuación de la recta de regresión lineal.

Ecuación de la recta de regresión lineal: Y= 0.5719X + 26.724

c. Interprete el significado de la pendiente.

La pendiente es como afecta un mínimo aumento de X en el


aumento o disminución de Y.

m= Δy / Δx = (Y2- Y1) /(X2- X1)

En este problema m= 0.5719

Si las ventas reportadas aumentan en un (1) ejemplar, las ventas


auditadas (reales) aumentan en 0.5719 ejemplares vendidos.

Las revistas están reportando casi el doble de ventas…


d. Prediga las ventas auditadas para la revista que reporta ventas
en los puestos de periódicos de 400000 ejemplares.

Ecuación: Y=0.5719X + 26.724

Si X=400, entonces reemplazamos este valor en la ecuación


hallada:
Y=0.5719 (400)+26.724 = 255,484.
Es decir, pasado a miles da 255484 ejemplares.

Es decir, si una revista reporta que vendió 400000 ejemplares,


realmente sus ventas fueron de 255484 ejemplares, según este
modelo lineal.

e. Determine el coeficiente de correlación e interprete su significado.

Si r2= 0.9015, entonces sacando raíz, r= 0.9494 = 94.94%.

Puesto que r es positivo y muy cercano a 1, se puede decir que


existe una relación lineal directa y muy estrecha entre las ventas
reportadas y las ventas auditadas.

f. ¿Qué tan útil cree usted que es este modelo de regresión para
predecir las ventas auditadas?

Coeficiente de determinación: r2= 0.9015.

La variabilidad de las ventas auditadas (reales) es explicada en


un 90.15% por la variabilidad de las ventas reportadas.
2. ¿Esperaría que los carros más confiables fueran los más costosos?
Consumer Reports evaluó 15 de los mejores autos sedán. La
confiabilidad se valuó con una escala de 5 puntos: mala(1), regular(2),
buena(3), muy buena(4) y excelente(5). Los precios y la evaluación
sobre la confiabilidad de estos 15 autos se representa en la tabla
siguiente (Consumer Reports, febrero de 2014).

MARCA Y MODELO CONFIABILIDAD PRECIO($)


(X) (Y)
Acura TL 4 33150
BMW 330i 3 40570
Lexus IS300 5 35105
Lexus ES330 5 35174
Mercedes Bens C320 1 42230
Lincoln LS Premium(V6) 3 38225
Audi A4 3.0 Quattro 2 37605
Cadillac CTS 1 37695
Nisssan Maxima 3.5 SE 4 34390
Infiniti I35 5 33845
Saab 9-3 Aero 3 36910
Infiniti G35 4 34695
Jaguar X-Type 3.0 3 37995
Saab 9-5 Arc 4 36955
Volvo S60 2.5T 3 33890

a. Construya un diagrama de dispersión y analícelo

Se observa una tendencia lineal no muy estrecha en el conjunto


de puntos, una relación inversa.
b. Halle la ecuación de regresión obtenida por el método de los
mínimos cuadrados

Y= -1406.9X + 41252

Precio = -1406.9 Confiabilidad + 41252

c. De acuerdo con este análisis, ¿cree usted que los autos más
confiables sean más costosos?

m= -1406.9

No, porque si la confiabilidad aumenta en un punto, el precio


disminuye en 1406.9 dólares

d. Estime el precio de un auto sedán cuya evaluación de


confiabilidad sea 4.

Precio = -1406.9 (4) + 41252 = $35624.4

e. ¿Proporcionó un buen ajuste la ecuación de regresión estimada?

r2= 0.491 = 49.1%. El modelo no ofrece un buen ajuste para el


precio con base en la calificación de la confiabilidad.
La variabilidad del precio es explicada por la variabilidad de la
confiabilidad en un 49.1%.

f. ¿Qué tan fuerte es el grado de asociación lineal entre las dos


variables?

r = 0.70 = 70%

Si se presenta una relación lineal suavemente estrecha entre el


precio y la calificación de confiabilidad de los autos.

ESTADISTICA PARA ADMINISTRACION. LEVINE. 4ª EDICION. 2006.

SECUENCIA 466
a. Construya el correspondiente diagrama de dispersión y analícelo
b. Halle la ecuación de la recta de regresión obtenida por el
método de los mínimos cuadrados
c. ¿Cómo explica la variabilidad de la distancia de apisonado a la
variabilidad del tiempo de separación?
d. Estime la predicción del tiempo de separación para una distancia
de apisonado de 0.50 pulgadas.
e. ¿Proporcionó un buen ajuste la ecuación de regresión estimada?
Justifique su respuesta
f. ¿Qué tan fuerte es el grado de asociación lineal entre las dos
variables? Explique
Profundización: http://www.monografias.com/trabajos27/regresion-simple/regresion-simple.shtml
Nota: Problemas tomados de:
 ESTADISTICA para Administración y Economía, ANDERSON, SWEENEY, WILLIAMS. Cengage
Learning Editores. 10ª Edicion. 2008
 ESTADISTICA para Administración, LEVIN, KREHBIEL, BERENSON. Pearson Prentice Hall editores.
4ª Edicion. 2006

También podría gustarte