Está en la página 1de 25

Curso de Estadística Básica

SESION 7
REGRESIÓN LINEAL

MCC. Manuel Uribe Saldaña


MCC. José Gonzalo Lugo Pérez

Estadística Básica
Objetivo
Representar datos de dos variables de forma
tabular y gráfica. Comprender la distinción entre los
propósitos básicos del análisis de correlación y
regresión lineal. (Sesión 6 y 7)

Estadística Básica
Agenda Sesión 7

• Datos de dos
variables
• Correlación lineal
(Sesión 6)
• Regresión lineal
(Sesión 7)
• Evaluación
(Sesión 7)

Estadística Básica
Problema

Estadística Básica
Tabla de extensiones
No. Incremento en horas (x) Incremento en Ventas (y) x2 y2 xy
1 40 $ 500.00 1600 250000 20000
2 65 $ 1,000.00 4225 1000000 65000
3 84 $ 500.00 7056 250000 42000
4 40 $ 4,000.00 1600 16000000 160000
5 70 $ 2,000.00 4900 4000000 140000
6 68 $ 5,000.00 4624 25000000 340000
7 110 $ 2,000.00 12100 4000000 220000
8 90 $ 4,000.00 8100 16000000 360000
9 65 $ 1,000.00 4225 1000000 65000
10 35 $ 10,000.00 1225 100000000 350000
11 30 $ 8,500.00 900 72250000 255000
12 85 $ 2,000.00 7225 4000000 170000
13 90 $ 3,500.00 8100 12250000 315000
14 90 $ 1,000.00 8100 1000000 90000
15 50 $ 2,500.00 2500 6250000 125000
16 75 $ 5,000.00 5625 25000000 375000
17 90 $ 9,000.00 8100 81000000 810000
18 70 $ 3,000.00 4900 9000000 210000
19 70 $ 4,000.00 4900 16000000 280000
20 40 $ 500.00 1600 250000 20000
Suma 1357 $ 69,000.00 101605 394500000 4412000

Estadística Básica
Cálculos

SC ( x)   x 2 
 x 2  9532.55
n

SC ( y )   y 2 
 y 2  156450000
n

SC ( xy )   xy   x y
 269650
n

SC ( xy )
r  0.22080459
SC ( x) SC ( y )

Estadística Básica
Conclusiones

No están correlacionadas las variables “incremento


en horas” e “incremento en ventas” ya que el
coeficiente de correlación r = -0.22, lo que indica
una correlación muy débil o nula.

Estadística Básica
Regresión Lineal

• El análisis de regresión lineal encuentra la


ecuación de la recta que describe mejor la relación
entre las dos variables. Una aplicación de esta
ecuación es hacer predicciones.

Estadística Básica
Ejemplos

• El éxito que tendrá un estudiante en la universidad


con base en los resultados que obtuvo en el
bachillerato.
• Averiguar la distancia necesaria para detener un
automóvil conociendo su velocidad.
• El peso que debe tener un niño con base en la
estatura.
• El número de sentadillas que realizará un
estudiante con base en el número de lagartijas que
realizó

Estadística Básica
Modelos o ecuaciones de predicción

La relación entre estas dos variables es una


expresión algebraica que describe la relación
matemática entre x y y. A continuación se presentan
algunos ejemplos de varias relaciones posibles:

Lineal: yˆ  b0  b1 x
Cuadrática: yˆ  a  bx  cx 2

Exponencial: yˆ  a (b )
x

Logarítmica: yˆ  a log b x
Estadística Básica
Patrones de datos de dos variables

Estadística Básica
Método de mínimos cuadrados

Si un modelo de línea recta parece idóneo, la recta del


mejor ajuste se encuentra aplicando el método de
mínimos cuadrados. Suponga que yˆ  b0  b1 x
es la ecuación de una recta, donde ŷ representa
el valor estimado de y que corresponde a un valor
particular de x
El método de mínimos cuadrados requiere encontrar
las constantes 0 y b1 tales que la sumatoria
b  y  ŷ 2

sea lo más pequeña posible.

Estadística Básica
Método de mínimos cuadrados

y yˆ  b0  b1 x
( x, yˆ )
y  yˆ
ŷ ( x, y )
y

Estadística Básica
Recta del mejor ajuste

La ecuación de la recta del mejor ajuste es


determinada por su pendiente b1 y su ordenada al
origen b0 . Los valores de las constantes, pendiente
y ordenada al origen, que satisfacen el criterio de
mínimos cuadrados se encuentran aplicando las
siguientes fórmulas:

b1 
 ( x  x )( y  y )
 y  (b   x)
b0  1

 (x  x) 2
n

Estadística Básica
Recta del mejor ajuste

Para encontrar la pendiente b1 se usará una


equivalencia matemática que utilice la suma de los
cuadrados determinados en los cálculos
preliminares de correlación:

SC ( xy )
b1 
SC ( x)

Estadística Básica
Clase de educación física del Sr. Torres

Tomando en cuenta el ejemplo de la sesión 6 sobre


los 10 estudiantes que realizaron pruebas de
condición física, ahora el objetivo es predecir las
“sentadillas” efectuadas por un estudiante con base
en el número de “lagartijas” hechas. Se quiere
encontrar la recta del mejor ajuste, yˆ  b0  b1 x
De esta manera se realizan los cálculos tomando los
datos correspondientes de la tabla de extensiones
generada:

Estadística Básica
Tabla de extensiones

Estudiante Lagartijas (x) x2 Sentadillas (y) y2 xy


1 27 729 30 900 810
2 22 484 26 676 572
3 15 225 25 625 375
4 35 1225 42 1764 1470
5 30 900 38 1444 1140
6 52 2704 40 1600 2080
7 35 1225 32 1024 1120
8 55 3025 54 2916 2970
9 40 1600 50 2500 2000
10 40 1600 43 1849 1720
Sumatoria 351 13717 380 15298 14257

Estadística Básica
Cálculos

Se toman los cálculos correspondientes a SC(x) y


SC(xy) y se calcula la pendiente:

SC ( x)   x 
2
 x 2
 13717 
(351) 2
 1396.9
n 10

SC ( xy )   xy  
x y (351)(380)
 14257   919.0
n 10

SC ( xy ) 919.0
b1    0.6579  0.66
SC ( x) 1396.9

Estadística Básica
Cálculos

Se calcula la ordenada al origen, b0 con los datos


de la tabla de extensiones:

b0   y  (b   x) 380  (0.6579)(351)
1
  14.9077  14.9
n 10

Estadística Básica
Ecuación del mejor ajuste

yˆ  b0  b1 x

b0  14.9 b1  0.66

yˆ  14.9  0.66 x

Notas
1. Recuerde mantener por lo menos tres cifras decimales
extra al efectuar los cálculos para asegurar una respuesta
exacta.
2. Al redondear los valores calculados de bo y b1, preserve
por lo menos dos cifras significativas en la respuesta final

Estadística Básica
Cálculo de los puntos de la recta

Se eligen dos valores convenientes de x, cada uno


cerca de cada extremo del dominio (x=10 y x=60) y
se encuentran sus valores y correspondientes.

yˆ  14.9  0.66 x  14.9  0.66(10)  21.5 (10,21.5)

yˆ  14.9  0.66 x  14.9  0.66(60)  54.5 (60,54.5)

Estadística Básica
Trazado de la recta

(60,54.5)

(10,21.5)

Estadística Básica
Ejercicio

A ocho estudiantes universitarias, elegidas de forma


aleatoria, se les preguntó su estatura (cerrada a la
pulgada más próxima) y su peso (cerrado a las
cinco libras más próximas). Calcule el coeficiente de
correlación lineal r, y la ecuación para predecir el
peso de una universitaria con base en su estatura y
trácela sobre un diagrama de dispersión.
Datos de las estaturas y pesos de las estudiantes universitarias
1 2 3 4 5 6 7 8
Estatura (x) 65 65 62 67 69 65 61 67
Peso (y) 105 125 110 120 140 135 95 130

Estadística Básica
Respuestas

r  0.7979  0.80

SC ( x)  48.875 b1  4.706  4.71


SC ( xy )  230.0 b0  186.478  186.5

yˆ  186.5  4.71x

Estadística Básica
Observaciones en la elaboración de
predicciones
1. La ecuación debe usarse para hacer predicciones sólo acerca de la
población de la cuál se extrajo la muestra. Por ejemplo, sería cuestionable
usar la relación entre la estatura y el peso de las estudiantes
universitarias para predecir el peso de atletas profesionales, dadas sus
estaturas.
2. La ecuación debe usarse sólo dentro del dominio muestral de la variable
de entrada. Por ejemplo, la predicción de que una universitaria de
estatura cero pesa -186.5 libras no tiene sentido. Tal vez, y de manera
ocasional, se quiera usar la recta del mejor ajuste para estimar valores
que están fuera del intervalo del dominio de la muestra. Esto es posible,
pero debe hacerse con precaución y sólo para valores cercanos al
intervalo del dominio.
3. Si la muestra fue tomada en 1994, no espere que los resultados sean
válidos para 1929 o 2010. Las mujeres actuales pueden ser diferentes a
las de 1929 y a las de 2010.

Estadística Básica

También podría gustarte