Está en la página 1de 6

17/11/23, 11:02 ALEKS

Nombre del estudiante: CESAR Fecha: 17/11/2023 11:02


ANTONIO CASTILLO MARTINEZ
Nombre de usuario: Clase: Estadística II - III-PAC 2023 -
CCASTILLOMARTI34 Sección #2 Campus Virtual III PAC-2023

Pruebas de ji-cuadrada, interpretación de la regresión y ANOVA


Intervalos de confianza e intervalos de predicción a partir de regresión
lineal simple
EJEMPLO DE PREGUNTA

Una reconocida psicóloga ha establecido lo que ella llama su escala de Ansiedad Generalizada
(AG). La escala AG, que es una escala de 0 a 10, mide la "ansiedad general" de un individuo,
donde puntajes más altos de AG corresponden a más ansiedad.

Nos gustaría hacer predicciones sobre el comportamiento del sueño de las personas según sus
puntajes de AG. Hemos recopilado datos bivariados que indican el puntaje AG (denotado por x)
y la cantidad de horas de sueño anoche (denotado por y) de cada uno de los 11 adultos que
participan en un estudio. La ecuación de regresión de mínimos cuadrados para los datos es
y = 8.79 − 0.28x. Hemos utilizado esta ecuación para predecir las horas de sueño de esta
noche para una mujer cuyo puntaje AG es 5.7 . Ahora queremos obtener tanto un intervalo de
predicción para su tiempo de sueño, como un intervalo de confianza para la media del tiempo
de sueño de las personas con su puntaje de AG. Hemos calculado lo siguiente:

error cuadrático medio E C M ≈ 0.572


2
1 5.7 − x
+ ≈ 0.0964, donde x1 , x2 , …, x11 denotan los puntajes de AG en
11 11

Σ
i=1
xi − x
2

la muestra y x denota su media

Según esta información y suponiendo que se cumplen los supuestos de regresión, responder las
preguntas presentadas a continuación:

EXPLICACIÓN

La ecuación de regresión de mínimos cuadrados se puede utilizar para predecir el valor de una
variable (llamada la variable dependiente, a menudo indicada con y) basado en un valor dado
de otra variable (llamada la variable independiente, a menudo indicada con x). Cuando
hacemos una predicción tal, es útil obtener un intervalo de predicción para un valor individual
de y dado un valor de x. Por ejemplo, un intervalo de predicción del 90% para un valor
individual de y, dado que x = 10, es un intervalo que se construye por un método que va a
capturar el valor actual de y (cuando x = 10) alrededor del 90% de las veces. Además, puede
ser útil obtener un intervalo de confianza para la media de la distribución de y dado un valor de
x. Por ejemplo, un intervalo de confianza del 90% para la media del valor de y, dado que
x = 10, es un intervalo que se construye por un método que va a capturar la media de la

https://latam-awu.aleks.com/alekscgi/x/Isl.exe/1MFjngoMZgtp6pSTJWjnWdvIo7W37NXkdof_rJh6yG8DdLLnTcjQCBcUDyosz8wr31BU4hbvCUZ9… 1/6
17/11/23, 11:02 ALEKS

distribución de y (cuando x = 10) alrededor del 90% de las veces.

Dada la ecuación de regresión de mínimos cuadrados y = b0 + b1 x, el intervalo de predicción


de 1 − α 100% para un valor individual de y, dado que x = x0 , es:

2
1 x0 − x
Intervalo de predicción: b0 + b1 x0 ± tα/2 ·s 1+ +
n n

Σ
i=1
xi − x
2

El intervalo de confianza de 1 − α 100% para la media del valor de y, dado que x = x0 , es:

2
1 x0 − x
Intervalo de confianza: b0 + b1 x0 ± tα/2 ·s +
n n

Σ
i=1
xi − x
2

En cada una de estas fórmulas, n denota el tamaño de la muestra, s es el error estándar de la


estimación, y tα/2 es el valor que acota un área de α/2 en la cola derecha de una distribución t

con n − 2 grados de libertad. Observemos que la única diferencia entre las dos fórmulas es que
la fórmula del intervalo de predicción tiene 1 en la suma dentro de la raíz cuadrada, mientras
que la fórmula del intervalo de confianza no lo tiene. Observemos además que los dos
intervalos están centrados en el mismo valor, b0 + b1 x0 . Esto significa que b0 + b1 x0 es la

mejor estimación de un valor individual de y cuando x es igual a x0 , y de la media del valor de


y cuando x es igual a x0 .

Podemos utilizar estas fórmulas para responder las preguntas dadas en el problema.

(a) Los datos de los 11 adultos nos dan la ecuación de regresión y = 8.79 − 0.28x, donde x
denota el puntaje AG y y denota el tiempo estimado de sueño (en horas). Nos piden
construir un intervalo de confianza del95% para la media del tiempo de sueño cuando el
puntaje AG es 5.7 . La primera parte de la fórmula del intervalo de confianza, b0 + b1 x0 , es

solamente el valor de y para el puntaje AG dado, x0 . Cuando x0 = 5.7, tenemos lo


siguiente:

b0 + b1 x0 = 8.79 − 0.28 5.7 = 7.194

7.194, que es la mejor


Por consiguiente, el intervalo de confianza está centrado en
estimación de la media del tiempo de sueño cuando el puntaje AG es 5.7 .

La siguiente parte de la fórmula del intervalo de confianza, tα/2 , es el valor que acota un

área de α/2 en la cola derecha de una distribución t con n − 2 grados de libertad. Ya que
https://latam-awu.aleks.com/alekscgi/x/Isl.exe/1MFjngoMZgtp6pSTJWjnWdvIo7W37NXkdof_rJh6yG8DdLLnTcjQCBcUDyosz8wr31BU4hbvCUZ9… 2/6
17/11/23, 11:02 ALEKS

estamos calculando un intervalo de confianza del 95%, tenemos α = 1 − 0.95 = 0.05.


Además, en este problema, n = 11 , así que utilizamos la distribución t con 11 − 2 = 9
grados de libertad. Obtenemos lo siguiente:

tα/2 = t0.025 ≈ 2.2622

El próximo término en la fórmula del intervalo de confianza es el error estándar de la


estimación, s. Se puede calcular del error cuadrado medio E C M , que viene dado como
0.572.

s = M S E = 0.572
La última parte de la fórmula del intervalo de confianza consiste en la raíz cuadrada de una
expresión bastante larga. No necesitamos calcular la expresión larga porque nos indican
que su valor es 0.0964 . Tenemos

2 2
1 x0 − x 1 5.7 − x
+ = + ≈ 0.0964
n n 11 11

Σ
i=1
xi − x
2
Σ
i=1
xi − x
2

Con esta información podemos calcular el intervalo de confianza del 95% del tiempo de
sueño dado el puntaje AG de 5.7.

7.194 ± 2.2622 0.572 0.0964

Una vez simplificado, este es el intervalo cuyo límite inferior es aproximadamente 6.66 y
cuyo límite superior es aproximadamente 7.73.

https://latam-awu.aleks.com/alekscgi/x/Isl.exe/1MFjngoMZgtp6pSTJWjnWdvIo7W37NXkdof_rJh6yG8DdLLnTcjQCBcUDyosz8wr31BU4hbvCUZ9… 3/6
17/11/23, 11:02 ALEKS

(b) Dado que la estimación de la media de una


distribución involucra mayor precisión que la
predicción de una observación particular de
esa distribución, esperamos que el intervalo de
confianza sea más estrecho que el intervalo de
predicción. Podemos verificar esto comparando
las fórmulas para el cálculo de los intervalos
(que se muestran cerca del inicio de esta
explicación). Como señalamos anteriormente,
la única diferencia entre las fórmulas del y
intervalo de predicción y del intervalo de
confianza es que la fórmula del intervalo de
predicción tiene 1 en la suma dentro de la raíz bandas de confianza
cuadrada, mientras que el intervalo de
confianza no lo tiene. Esto hace que el margen
de error (el término que le sigue a " ± ") sea
mayor en la fórmula del intervalo de
predicción que en la fórmula del intervalo de línea de mínimos cuadrados
confianza, lo que quiere decir que el intervalo
de predicción va a ser más amplio. Sin
embargo, como hemos mencionado, los dos
intervalos van a estar centrados en el mismo
valor, b0 + b1 x0 . bandas de predicción
x
0
La Figura 1 describe los límites (mediante x
"bandas de predicción") de los intervalos de
predicción de valores individuales de y dados Figura 1
distintos valores de x. La figura también
describe los límites (mediante "bandas de
confianza") de los intervalos de confianza de
las medias de los valores de y dados distintos
valores de x. Observemos que para cada valor
de x, el intervalo de predicción es más amplio
que el intervalo de confianza correspondiente.

(c) En la fórmula del intervalo de confianza, y


veamos que el intervalo de confianza depende
no solo de los datos de la muestra, sino
también del valor x0 a partir del cual se banda de confianza superior

estima la media del valor de y. El valor x0


afecta el intervalo de confianza de dos formas.
Primero, x0 afecta el valor b0 + b1 x0 , que es
línea de mínimos cuadrados
el centro del intervalo (y la estimación de la
media del valor de y dado el valor x0 de x).
Así que para los mismos datos de muestra, los banda de confianza inferior
intervalos de confianza correspondientes a
distintos valores de x0 tendrán centros x

distintos. En segundo lugar, el valor x0 afecta 0


x
la amplitud del intervalo. Cuanto más cerca
Figura 2
está x0 de la media, más pequeño es
2
x0 − x y, por lo tanto, más estrecho es el

https://latam-awu.aleks.com/alekscgi/x/Isl.exe/1MFjngoMZgtp6pSTJWjnWdvIo7W37NXkdof_rJh6yG8DdLLnTcjQCBcUDyosz8wr31BU4hbvCUZ9… 4/6
17/11/23, 11:02 ALEKS

intervalo. (El intervalo es más estrecho cuando


x0 es igual a x ). Por lo tanto, ya que 8.2 está

más lejos de la media x que 5.7 , el intervalo


de confianza del95% para la media de las
horas de sueño cuando el puntaje AG es 8.2
sería más amplio y tendría un centro distinto
que el intervalo de confianza del 95% para la
media de las horas de sueño cuando el puntaje
AG es 5.7 .

La Figura 2 describe los límites inferiores


(mediante la "banda inferior de confianza") y
los límites superiores (mediante la "banda
superior de confianza") de los intervalos de
confianza para la media de los valores de y
dados distintos valores de x. Observemos que
los intervalos de confianza más estrechos
suceden cuando x es igual a x . Observemos
también que los intervalos de confianza
aumentan en amplitud a medida que x se aleja
de x.

RESPUESTA

(a) ¿Cuál es el intervalo de confianza del 95% para la media de tiempo de sueño (en
horas) cuando el puntaje AG es 5.7 ? (Llevar los cálculos intermedios al menos a
cuatro posiciones decimales. Redondear la respuesta al menos a dos posiciones
decimales).

Límite inferior: 6.66

Límite superior: 7.73

https://latam-awu.aleks.com/alekscgi/x/Isl.exe/1MFjngoMZgtp6pSTJWjnWdvIo7W37NXkdof_rJh6yG8DdLLnTcjQCBcUDyosz8wr31BU4hbvCUZ9… 5/6
17/11/23, 11:02 ALEKS

(b) Considerar (sin calcular realmente) el intervalo de predicción del 95% para un valor
individual de las horas de sueño cuando el puntaje AG es 5.7 . ¿Cómo se compararía
este intervalo de predicción con el intervalo de confianza calculado anteriormente
(suponiendo que ambos intervalos se calculan a partir de los mismos datos de
muestra)?

El intervalo de predicción sería idéntico al intervalo de confianza.

El intervalo de predicción se colocaría a la derecha del intervalo de confianza.

El intervalo de predicción se colocaría a la izquierda del intervalo de confianza.

El intervalo de predicción tendría el mismo centro pero sería más estrecho que
el intervalo de confianza.

El intervalo de predicción tendría el mismo centro pero sería más amplio que el
intervalo de confianza.

(c) Para los valores del puntaje AG en esta muestra, 8.2 es más extremo que 5.7 o sea,
8.2 está más lejos de la media de la muestra del puntaje AG que 5.7. ¿Cómo sería el
95% para la media de las horas de sueño cuando el puntaje
intervalo de confianza del
AG es 8.2 en comparación con el intervalo de confianza del 95% para la media de las
horas de sueño cuando el puntaje AG es 5.7 ?

El intervalo calculado a partir de un puntaje AG de 8.2 sería más estrecho pero


tendría el mismo centro.

El intervalo calculado a partir de un puntaje AG de 8.2 sería más amplio y tendría


un centro distinto.
Los intervalos serían idénticos.

El intervalo calculado a partir de un puntaje AG de 8.2 sería más estrecho y


tendría un centro distinto.

El intervalo calculado a partir de un puntaje AG de 8.2 sería más amplio pero


tendría el mismo centro.

https://latam-awu.aleks.com/alekscgi/x/Isl.exe/1MFjngoMZgtp6pSTJWjnWdvIo7W37NXkdof_rJh6yG8DdLLnTcjQCBcUDyosz8wr31BU4hbvCUZ9… 6/6

También podría gustarte