Está en la página 1de 6

17/11/23, 11:02 ALEKS

Nombre del estudiante: CESAR Fecha: 17/11/2023 11:02


ANTONIO CASTILLO MARTINEZ
Nombre de usuario: Clase: Estadística II - III-PAC 2023 -
CCASTILLOMARTI34 Sección #2 Campus Virtual III PAC-2023

Pruebas de ji-cuadrada, interpretación de la regresión y ANOVA


Intervalos de confianza e intervalos de predicción a partir de regresión
lineal simple
EJEMPLO DE PREGUNTA

Supongamos que estamos analizando la relación entre los puntajes obtenidos en una prueba
estandarizada común y el desempeño en la universidad. Hemos elegido una muestra aleatoria
de 47 estudiantes que acaban de terminar su primer año de estudios universitarios, y hemos
registrado el puntaje que cada estudiante ha obtenido en esta prueba estandarizada (de 400 a
1600) y el promedio de calificaciones (en una escala de cuatro puntos) que obtuvieron en su
primer año de estudios. Si x denota el puntaje obtenido en la prueba estandarizada y y denota
el promedio de calificaciones en los cursos universitarios, la ecuación de regresión de mínimos
cuadrados que se calcula a partir de los datos es y = 0.9026 + 0.0012x.
Ahora queremos predecir el promedio de calificaciones de primer año de un estudiante que
obtuvo un puntaje de 1000 en la prueba estandarizada. También queremos realizar un intervalo
de predicción para este promedio de calificaciones y un intervalo de confianza para la media del
promedio de calificaciones de primer año de estudiantes que obtuvieron un puntaje de 1000 en
la prueba estandarizada. Ya hemos calculado lo siguiente:

error cuadrático medio E C M ≈ 0.329


2
1 1000 − x
+ ≈ 0.0383, donde x1 , x2 , …, x47 denotan los puntajes de las
47 47

Σ
i=1
xi − x
2

pruebas estandarizadas en la muestra y x denota su media

Según esta información y suponiendo que se cumplen los supuestos de regresión, responder las
preguntas presentadas a continuación:

EXPLICACIÓN

La ecuación de regresión de mínimos cuadrados se puede utilizar para predecir el valor de una
variable (llamada la variable dependiente, a menudo indicada con y) basado en un valor dado
de otra variable (llamada la variable independiente, a menudo indicada con x). Cuando
hacemos una predicción tal, es útil obtener un intervalo de predicción para un valor individual
de y dado un valor de x. Por ejemplo, un intervalo de predicción del 90% para un valor
individual de y, dado que x = 10, es un intervalo que se construye por un método que va a
capturar el valor actual de y (cuando x = 10) alrededor del 90% de las veces. Además, puede
ser útil obtener un intervalo de confianza para la media de la distribución de y dado un valor de

https://latam-awu.aleks.com/alekscgi/x/Isl.exe/1RdETQYsYQUFqMoDKM3qgbwdnAJb1W5ClwnSR5PX7ogPlACqit3JOKN8pYYNUikO8Sv7mrzx… 1/6
17/11/23, 11:02 ALEKS

x. Por ejemplo, un intervalo de confianza del 90% para la media del valor de y, dado que
x = 10, es un intervalo que se construye por un método que va a capturar la media de la
distribución de y (cuando x = 10) alrededor del 90% de las veces.

Dada la ecuación de regresión de mínimos cuadrados y = b0 + b1 x, el intervalo de predicción


de 1 − α 100% para un valor individual de y, dado que x = x0 , es:

2
1 x0 − x
Intervalo de predicción: b0 + b1 x0 ± tα/2 ·s 1+ +
n n

Σ
2
xi − x
i=1

El intervalo de confianza de 1 − α 100% para la media del valor de y, dado que x = x0 , es:

2
1 x0 − x
Intervalo de confianza: b0 + b1 x0 ± tα/2 ·s +
n n

Σ
i=1
xi − x
2

En cada una de estas fórmulas, n denota el tamaño de la muestra, s es el error estándar de la


estimación, y tα/2 es el valor que acota un área de α/2 en la cola derecha de una distribución t

con n − 2 grados de libertad. Observemos que la única diferencia entre las dos fórmulas es que
la fórmula del intervalo de predicción tiene 1 en la suma dentro de la raíz cuadrada, mientras
que la fórmula del intervalo de confianza no lo tiene. Observemos además que los dos
intervalos están centrados en el mismo valor, b0 + b1 x0 . Esto significa que b0 + b1 x0 es la

mejor estimación de un valor individual de y cuando x es igual a x0 , y de la media del valor de


y cuando x es igual a x0 .

Podemos utilizar estas fórmulas para responder las preguntas dadas en el problema.

(a) Los datos de los 47 estudiantes nos dan la ecuación de regresión y = 0.9026 + 0.0012x,
donde x denota el puntaje en la prueba estandarizada y y denota el promedio de
calificaciones estimado para el primer año. Nos piden construir un intervalo de predicción
del 90% para la media del promedio de calificaciones del primer año cuando el puntaje
obtenido en la prueba es 1000. La primera parte de la fórmula del intervalo de predicción,
b0 + b1 x0 , es solamente el valor de y para el puntaje obtenido en la prueba dado, x0 .

Cuando x0 = 1000, tenemos lo siguiente:

b0 + b1 x0 = 0.9026 + 0.0012 1000 = 2.1026

Por consiguiente, el intervalo de predicción está centrado en 2.1026 , que es la mejor


estimación de la media del promedio de calificaciones del primer año cuando el puntaje

https://latam-awu.aleks.com/alekscgi/x/Isl.exe/1RdETQYsYQUFqMoDKM3qgbwdnAJb1W5ClwnSR5PX7ogPlACqit3JOKN8pYYNUikO8Sv7mrzx… 2/6
17/11/23, 11:02 ALEKS

obtenido en la prueba es 1000.

La siguiente parte de la fórmula del intervalo de predicción, tα/2 , es el valor que acota un

área deα/2 en la cola derecha de una distribución t con n − 2 grados de libertad. Ya que
estamos calculando un intervalo de predicción del 90%, tenemos α = 1 − 0.9 = 0.10 .
Además, en este problema, n = 47, así que utilizamos la distribución t con 47 − 2 = 45
grados de libertad. Obtenemos lo siguiente:

tα/2 = t0.05 ≈ 1.6794

El próximo término en la fórmula del intervalo de predicción es el error estándar de la


estimación, s. Se puede calcular del error cuadrado medio E C M , que viene dado como
0.329.

s = M S E = 0.329
La última parte de la fórmula del intervalo de predicción consiste en la raíz cuadrada de la
suma de 1 y una expresión bastante larga. Sin embargo, no necesitamos calcular la
expresión larga, porque nos indican que su valor es: 0.0383. Tenemos lo siguiente:

2 2
1 x0 − x 1 1000 − x
1+ + = 1+ + ≈ 1 + 0.0383 = 1.0383
n n 47 47

Σ
i=1
xi − x
2
Σ
i=1
xi − x
2

Con esta información podemos calcular el intervalo de predicción del 90% del promedio de
calificaciones del primer año dado el puntaje obtenido en la prueba de 1000.

2.1026 ± 1.6794 0.329 1.0383

Una vez simplificado, este es el intervalo cuyo límite inferior es aproximadamente 1.12 y
cuyo límite superior es aproximadamente 3.08.

https://latam-awu.aleks.com/alekscgi/x/Isl.exe/1RdETQYsYQUFqMoDKM3qgbwdnAJb1W5ClwnSR5PX7ogPlACqit3JOKN8pYYNUikO8Sv7mrzx… 3/6
17/11/23, 11:02 ALEKS

(b) Dado que la estimación de la media de una


distribución involucra mayor precisión que la
predicción de una observación particular de
esa distribución, esperamos que el intervalo de
confianza sea más estrecho que el intervalo de
predicción. Podemos verificar esto comparando
las fórmulas para el cálculo de los intervalos
(que se muestran cerca del inicio de esta
explicación). Como señalamos anteriormente,
la única diferencia entre las fórmulas del y
intervalo de predicción y del intervalo de
confianza es que la fórmula del intervalo de
predicción tiene 1 en la suma dentro de la raíz bandas de confianza

cuadrada, mientras que el intervalo de


confianza no lo tiene. Esto hace que el margen
de error (el término que le sigue a " ± ") sea línea de mínimos cuadrados

mayor en la fórmula del intervalo de


predicción que en la fórmula del intervalo de
confianza, lo que quiere decir que el intervalo
de predicción va a ser más amplio. Sin
embargo, como hemos mencionado, los dos
intervalos van a estar centrados en el mismo bandas de predicción

valor, b0 + b1 x0 .
x
0
La Figura 1 describe los límites (mediante x
"bandas de predicción") de los intervalos de
predicción de valores individuales de y dados Figura 1
distintos valores de x. La figura también
describe los límites (mediante "bandas de
confianza") de los intervalos de confianza de
las medias de los valores de y dados distintos
valores de x. Observemos que para cada valor
de x, el intervalo de predicción es más amplio
que el intervalo de confianza correspondiente.

(c) Observemos, en la fórmula del intervalo de y


predicción, que el intervalo de predicción
banda de predicción superior
depende no solo de los datos de la muestra,
sino también del valor x0 a partir del cual se

predice el valor individual de y. El valor x0


línea de mínimos cuadrados
afecta el intervalo de predicción de dos
formas. Primero, x0 afecta el valor b0 + b1 x0
que es el centro del intervalo (y la estimación
de un valor individual de y dado el valor x0 de

x). Entonces, para los mismos datos de


banda de predicción inferior
muestra, los intervalos de predicción
correspondientes a distintos valores de x0 x
0
tendrán centros distintos. En segundo lugar, el x
valor x0 afecta el ancho del intervalo. Cuanto
Figura 2
más cerca está x0 de la media x , más

https://latam-awu.aleks.com/alekscgi/x/Isl.exe/1RdETQYsYQUFqMoDKM3qgbwdnAJb1W5ClwnSR5PX7ogPlACqit3JOKN8pYYNUikO8Sv7mrzx… 4/6
17/11/23, 11:02 ALEKS

2
pequeño es x0 − x y, por lo tanto, más
estrecho es el intervalo. (El intervalo es más
estrecho cuando x0 es igual a x ). Por lo tanto,
ya que1000 está más cerca de la media x
que 890 , el intervalo de predicción del 90%
para un valor individual del promedio de
calificaciones cuando el puntaje obtenido en la
prueba estandarizada es 1000 sería más
estrecho y tendría un centro distinto del
intervalo de predicción del 90% para un valor
individual del promedio de calificaciones
cuando el puntaje obtenido en la prueba
estandarizada es 890.

La Figura 2 describe los límites inferiores


(mediante la "banda inferior de predicción") y
los límites superiores (mediante la "banda
superior de predicción") de los intervalos de
predicción de un valor individual de y dados
distintos valores x0 de x. Observemos que los
intervalos de predicción más estrechos
suceden cuando x0 es igual a x . Observemos
también que los intervalos de predicción
aumentan en amplitud a medida que x0 se

aleja de x.

RESPUESTA

(a) ¿Cuál es el intervalo de predicción del 90% para un valor individual de el promedio de
calificaciones cuando el puntaje obtenido en la prueba estandarizada es 1000? (Llevar
los cálculos intermedios al menos a cuatro posiciones decimales. Redondear la
respuesta al menos a dos posiciones decimales).

Límite inferior: 1.12

Límite superior: 3.08

https://latam-awu.aleks.com/alekscgi/x/Isl.exe/1RdETQYsYQUFqMoDKM3qgbwdnAJb1W5ClwnSR5PX7ogPlACqit3JOKN8pYYNUikO8Sv7mrzx… 5/6
17/11/23, 11:02 ALEKS

(b) Considerar (sin calcular realmente) el intervalo de confianza del 90% para la media
de el promedio de calificaciones cuando el puntaje obtenido en la prueba
estandarizada es 1000. ¿Cómo se compararía este intervalo de predicción con el
intervalo de confianza calculado anteriormente (suponiendo que ambos intervalos se
calculan a partir de los mismos datos de muestra)?

El intervalo de predicción se colocaría a la izquierda del intervalo de confianza.

El intervalo de predicción sería idéntico al intervalo de confianza.

El intervalo de predicción tendría el mismo centro pero sería más amplio que el
intervalo de confianza.

El intervalo de predicción tendría el mismo centro pero sería más estrecho que
el intervalo de confianza.

El intervalo de predicción se colocaría a la derecha del intervalo de confianza.

(c) Para los valores del puntaje obtenido en la prueba estandarizada en esta muestra,
890 es más extremo que 1000 o sea, 890 está más lejos de la media de la muestra
del puntaje obtenido en la prueba estandarizada que 1000. ¿Cómo sería el intervalo
de predicción del 90% para la media del promedio de calificaciones cuando el puntaje
obtenido en la prueba estandarizada es 1000 en comparación con el intervalo de
predicción del 90% para la media del promedio de calificaciones cuando el puntaje
obtenido en la prueba estandarizada es 890?

El intervalo calculado a partir de un puntaje obtenido en la prueba estandarizada


de 1000 sería más estrecho y tendría un centro distinto.
El intervalo calculado a partir de un puntaje obtenido en la prueba estandarizada
de 1000 sería más amplio pero tendría el mismo centro.
El intervalo calculado a partir de un puntaje obtenido en la prueba estandarizada
de 1000 sería más estrecho pero tendría el mismo centro.
El intervalo calculado a partir de un puntaje obtenido en la prueba estandarizada
de 1000 sería más amplio y tendría un centro distinto.
Los intervalos serían idénticos.

https://latam-awu.aleks.com/alekscgi/x/Isl.exe/1RdETQYsYQUFqMoDKM3qgbwdnAJb1W5ClwnSR5PX7ogPlACqit3JOKN8pYYNUikO8Sv7mrzx… 6/6

También podría gustarte