Está en la página 1de 5

Estadı́stica Inferencial

INFERENCIA ACERCA DEL COEFICIENTE DE


REGRESIÓN β

Logro de sesión
Al finalizar la sesión el estudiante estima y realiza pruebas de hipótesis para el coeficiente de
regresión poblacional.

1. Modelo de regresión poblacional


Consideremos la variable aleatoria Y dependiente de una sola variable independiente X. La
relación lineal que suponemos que existe entre X y Y es la especificada por el modelo estadı́stico
(modelo probabilı́stico):
Y = α + βx + 
Donde:
X: Variable independiente.
Y : Variable dependiente.
α: Es la ordenada en el origen o termino constante.
β: Es la pendiente de la regresión.
: Es el error o residuo del modelo.
Los supuestos que se hacen sobre la variable aleatoria error  del modelo de regresión general son
los supuestos del modelo de regresión lineal simple. Estos supuestos son:
1. Normalidad: Se supone que cada variable Yi tiene una distribución normal.
2. Independencia: Se supone que las Yi son variables aleatorias estadı́sticamente independientes.
3. Linealidad: Se supone que la relación de Y con X es lineal.
4. Igualdad de varianzas (Homoscedasticidad): Se supone que las varianzas de Yi en cada Xi
son iguales a la varianza común σ 2 , denominada varianza de la regresión.
La estimación del modelo de regresión poblacional es la ecuación de la regresión muestral Y =
a + bX. Donde a y b son las estimaciones de los parámetros α, β.

2. Estimación de la varianza de la regresión poblacional


La varianza de la regresión poblacional, denotada por σ 2 se define por:
PN
2 (yi − µY )2
σ = i=1
N

UTP sede Arequipa Guı́a N◦ 18


Estadı́stica Inferencial

Este número mide el grado o nivel de variabilidad de los datos en torno a la lı́nea de regresión.
La estimación de la varianza σ 2 es la varianza de la regresión muestral denotada por s2 y está dada
por: Pn 2 Pn Pn
2 SCE i=1 yi − a i=1 yi − b i=1 xi yi
s = =
n−2 n−2
La desviación estándar s de la regresión muestral o error estándar de estimación, está dado por la
raı́z cuadrada de la varianza de la regresión muestral:

r
SCE
s = s2 =
n−2
Mide de manera descriptivamente el ajuste del modelo de regresión estimado a los datos de la
muestra, cuanto más pequeño sea el valor de s, mejor será el ajuste del modelo de regresión
estimado a los datos de la muestra. Este error tiene las mismas unidades de Y .

2.1. Distribución muestral de b


La estadı́stica b del modelo de regresión muestral, tiene un distribución t con n − 2 grados de
libertad, esto es:
b−β
∼ t(n−2)
σ
bb
Donde, σbb = √Pn s 2 2
i=1 xi −nx

2.2. Intervalo de confianza de β


El intervalo de estimación de β con un nivel de confianza de 1 − α es dado por:
h i
IC(β, 1 − α) = b − t(1− α2 ,n−2) σ
bb ; b + t(1− α2 ,n−2) σ
bb

bb = √Pn
Donde, σ s
2 2
i=1 xi −nx

2.3. Prueba de hipótesis para β


1. Hipótesis: Plantear adecuadamente la hipótesis H0 contra la hipótesis alternativa H1 .
a) H0 : β = β0 vs H1 : β 6= β0
b) H0 : β ≥ β0 vs H1 : β < β0
c) H0 : β ≤ β0 vs H1 : β > β0
2. Nivel de significación: Seleccionar un nivel de significación α.
3. Estadı́stica de prueba:
b − β0
tc = ∼ t(n−2)
σ
bb
bb = √Pn
Donde, σ s
i=1 x2i −nx2

4. Región crı́tica:
5. Calculo del estadı́stica de prueba: Calcular el valor de tc .
6. Conclusión: Tomar la decisión de aceptar o rechazar H0 .

UTP sede Arequipa Guı́a N◦ 18


Estadı́stica Inferencial

EJERCICIOS EXPLICATIVOS
1. Un comerciante mayorista encargó un estudio para determinar la relación entre los gastos de
publicidad semanal por radio y las ventas de sus productos. En el estudio se obtuvieron los
siguientes resultados:

Gastos de publicidad ($) 30 20 40 50 70 60 80 70 80


Ventas ($) 300 250 400 550 750 630 930 700 840

a) Haga una estimación por intervalo para β, con un nivel de confianza del 95 %. ¿Existe
relación entre las variables?

UTP sede Arequipa Guı́a N◦ 18


Estadı́stica Inferencial

b) Realice una prueba de hipótesis sobre β, para determinar si existe relación entre las dos
variables, utilizando un nivel de significación de 5 %.

EJERCICIOS ADICIONALES
1. Un profesor de estadı́stica se interesa en la relación entre las horas de estudio y los puntos
obtenidos en el curso. A continuación vemos los datos reunidos de 9 alumnos que acaban de
tomar el curso.

Horas de estudio 45 30 90 60 105 65 90 80 55


Total de puntos obtenidos 40 35 75 65 90 50 90 80 45
Haga una estimación por intervalo para β, con un nivel de confianza del 99 %. ¿Existe relación

UTP sede Arequipa Guı́a N◦ 18


Estadı́stica Inferencial

entre las variables?

2. Se supone que el alargamiento de un cable de acero está relacionado linealmente con la in-
tensidad de la fuerza aplicada. Cinco especı́menes idénticos de cable dieron los resultados
siguientes:

Fuerza (X) 1 1.5 2 2.5 3


Alargamiento (Y) 3 3.5 5.4 6.9 8.4
Con un nivel de significación del 5 % probar si existe una relación lineal positiva entre la
fuerza aplicada y el alargamiento.

3. El banco ”PRESTAMO.estudia la relación entre las variables ingresos y ahorros mensuales


de sus clientes. Una muestra aleatoria de sus clientes reveló los siguientes datos en dólares:

Ingresos 350 400 450 500 950 850 700 900 600
Ahorros 100 110 130 160 350 350 250 320 130

a) Ajuste a los datos un modelo de regresión lineal simple y comente la pendiente.


b) Estime el monto del ahorro para un ingreso de $1200.
c) Determine el intervalo de confianza del 95 % para β, ¿se puede afirmar que existe relación
entre las variables?

4. Una compañı́a de alimentos maneja una cadena de tiendas al menudeo. Para medir la efi-
ciencia de las tiendas se estudió la relación del número de empleados (X) y el promedio del
volumen de ventas mensuales (Y ) expresadas en cientos de dólares para todas las tiendas
durante el año pasado. La gráfica de los datos sugiere una relación lineal entre las variables.
Se tiene laPsiguiente información:
n = 100, ni=1 xi = 600, ni=1 yi = 1600, ni=1 xi yi = 13600, ni=1 x2i = 5200, ni=1 yi2 =
P P P P
37700
Utilizando una prueba de hipótesis para β verificar si existe relación las variables.

UTP sede Arequipa Guı́a N◦ 18

También podría gustarte