Está en la página 1de 10

UD 3 ANÁLISIS DE VARIANZA Y DISEÑO DE EXPERIMENTOS

__v__ 1. El análisis de varianza puede utilizarse para probar si las medias de más de dos
poblaciones pueden considerarse iguales.
__v__ 2. El análisis de varianza está basado en la comparación de dos estimaciones de la
varianza de la población completa que contiene a todas las muestras.
__f__ 3. Al comparar las varianzas de dos poblaciones, es conveniente observar la diferencia
entre las varianzas muestrales, del mismo modo en que observamos la diferencia entre
las medias muestrales para hacer inferencias sobre medias de población.
__v___4. Cuando se utiliza la distribución ji-cuadrada como prueba de independencia, el número
de grados de libertad se relaciona tanto con el número de columnas como con el
número de renglones de la tabla de contingencia.
__v___5. La ji-cuadrada puede usarse como una prueba para decidir si una distribución dada es
una aproximación cercana de una muestra de alguna población. Nos referimos a este
tipo de pruebas como prueba de bondad de ajuste.
__f___6. Si se toman muestras de dos poblaciones que son aproximadamente normales, entonces
el cociente de todos los conjuntos posibles de las dos varianzas muestrales también
tiene distribución normal.
__v___7. Al usar una prueba ji-cuadrada debemos asegurar que tenemos un tamaño de muestra
adecuado, de modo que podamos evitar cualquier tendencia a sobrestimar el valor del
estadístico ji-cuadrada.
__v ___8. Cuando probamos hipótesis acerca de la varianza de alguna población, podemos
formar intervalos de confianza usando la distribución ji-cuadrada.
__v___9. La forma específica de una distribución F depende del número de grados de libertad en
el numerador y en el denominador del cociente F.
___f__10.Un aspecto conveniente de la prueba de hipótesis usando el estadístico F es que todas
ésas son pruebas de cola superior.
__v___11. Las pruebas ji-cuadrada nos permiten probar si más de dos proporciones de
población pueden considerarse iguales.
__f___12.Una “tabla de contingencia de 3 × 5” tiene tres columnas y cinco renglones.
__v__13. El área total bajo la curva de una distribución ji-cuadrada, como la de otras
distribuciones, es 1.
__f___14.La frecuencia esperada de cualquier celda de una tabla de contingencia puede
calcularse de manera inmediata, con sólo conocer los totales por renglón y por columna
para esa celda.
___f__15.Si el valor ji-cuadrada de una observación es cero, sabemos que nunca habrá diferencia
entre las frecuencias observadas y las esperadas.
__v___16. Los tamaños de las muestras en el análisis de varianza no necesitan ser iguales.
__f___17.Cuanto más pequeño sea el valor del estadístico F, más tenderemos a creer que existe
2

una diferencia entre las distintas muestras.


__v___18. La precisión y la utilidad de una prueba ji-cuadrada son altamente dependientes de
la calidad de los datos de la prueba.
__v___19. La tabla F que se presenta en la tabla 6 del apéndice da valores para pruebas de
cola superior solamente, pero los valores apropiados para pruebas de cola inferior y de
dos colas pueden calcularse a partir de los elementos de la tabla.
__f___20.Al determinar el número de grados de libertad para una prueba ji-cuadrada de bondad
de ajuste, la estimación de los parámetros de la población a partir de los datos de las
muestras no tiene ningún impacto.

__v___21. Para ambas pruebas, ji-cuadrada y F, rechazamos H0 si el valor P es menor que α,


el nivel de significancia de la prueba.

22. Suponga que ha observado proporciones de tres regiones geográficas diferentes. Usted
desea probar si las regiones tienen proporciones significativamente diferentes.
Suponiendo que p1, p2 y p3 son las proporciones verdaderas, ¿cuál de las siguientes sería la
hipótesis nula?
a) p1 ≠ p2 ≠ p3.
b) p1 = p2 = p3.
c) p1, p2 y p3 no son todas iguales.
d) Ninguno de los anteriores.
23. Un valor ji-cuadrada nunca puede ser negativo porque:
a) Las diferencias entre las frecuencias observadas y esperadas están elevadas al
cuadrado.
b) Un valor negativo significaría que las frecuencias observadas son negativas.
c) Se calcula el valor absoluto de las diferencias.
d) Ninguno de los anteriores.
e) a) y b), pero no e).
24. Suponga que existen ocho clases posibles a considerar en una prueba de bondad de ajuste.
¿Cuántos grados de libertad deberá utilizar?
a) 8.
b) 7.
c) 6.
d) No se puede determinar con la información dada.
25. ¿Cuál de los siguientes es un paso a seguir en la realización del análisis de varianza?
a) Determinar una estimación de la varianza de la población desde el interior de las
muestras.
b) Determinar una estimación de la varianza de población entre las medias de las
muestras.
c) Determinar la diferencia entre las frecuencias observadas y esperadas para cada clase.
d) Todos los anteriores.
e) a) y b), pero no c).
3

26. Suponga que se calculan las siguientes varianzas para varios grupos diferentes de muestras,
y que todos los grupos tienen los mismos grados de libertad. ¿Para cuál cociente estaría más
dispuesto aceptar la hipótesis nula de medias iguales, a un nivel dado de significancia?
a) Varianza entre columnas = 8, varianza dentro de columnas = 3.
b) Varianza entre columnas = 6, varianza dentro de columnas = 3.
c) Varianza entre columnas = 4, varianza dentro de columnas = 3.
d) Varianza entre columnas = 30, varianza dentro de columnas = 20.

27. Suponga que la σ2 hipotética para cierta población es 25. Toma una muestra de tamaño 16 y
encuentra que s2 es 15. ¿Qué haría para realizar una prueba de varianza de dos colas?
a) Comparar χ2 = 9 con valores críticos tomados de una distribución ji-cuadrada con 16
grados de libertad.
b) Comparar χ2 = 9 con valores críticos tomados de una distribución ji-cuadrada con 15
grados de libertad.
c) Comparar χ2 = 25 con valores críticos tomados de una distribución ji-cuadrada con 15
grados de libertad.
d) Comparar χ2 = 25 con valores críticos tomados de una distribución ji-cuadrada con 16
grados de libertad.

28. Se hará una prueba de dos colas para las muestras 1 y 2, con n1 = 15 y n2 = 12. Si α = 0.10,
¿cuál de los siguientes representa el valor superior con el cual deberá compararse s12/s22?
a) 1 .
F(14, 11, 0.05)
b) 1 .
F(14, 11, 0.95)
c) F(11, 14, 0.05)
d) F(14, 11, 0.05)
e) Ninguno de los anteriores.
29. Suponga que se va a realizar una prueba ji-cuadrada sobre una tabla de contingencia con
cuatro renglones y cuatro columnas. ¿Cuántos grados de libertad deberán utilizarse?
a) 16.
b) 8.
c) 9.
d) 6.
30. Las distribuciones ji-cuadrada y t, ambas:
a) Son siempre simétricas.
b) Se usan para pruebas de hipótesis.
c) Son dependientes del número de grados de libertad.
d) Todas las anteriores.
e) b) y c), pero no a).
f) Ninguno de los anteriores.
4

31. ¿Cómo puede calcularse la frecuencia esperada en una celda de una tabla de contingencia a
partir de la proporción esperada para dicha celda?
a) Multiplicando por el total de esa columna.
b) Multiplicando por el total de ese renglón.
c) Multiplicando por el tamaño total de la muestra.
d) Usando la proporción; la frecuencia esperada y la proporción esperada son las mismas.
e) Ninguno de los anteriores.
32. El cociente F contiene:
a) Dos estimaciones de la varianza de la población.
b) Dos estimaciones de la media de población.
c) Una estimación de la media de la población y una estimación de la varianza de la
población.
d) Tanto a) como b).
e) Ninguno de los anteriores.
33. Si tenemos tamaños de muestra suficientemente grandes, ¿qué suposiciones asociadas con
la prueba de ANOVA podemos descartar?
a) Las muestras se toman de una población normal.
b) Cada población tiene la misma varianza.
c) Tanto a) como b).
d) Ninguno de los anteriores.
34. Cuando se realiza una prueba de hipótesis ji-cuadrada, ¿qué sucede cuando las frecuencias
esperadas en varias celdas son demasiado pequeñas?
a) El valor de ji-cuadrada estará sobrestimado.
b) Será más probable de lo que debería ser que se rechace la hipótesis nula.
c) Los grados de libertad se reducen mucho.
d) Ninguno de los anteriores.
e) a) y b), pero no c).
35. Suponga que está comparando cinco grupos expuestos a diferentes métodos de tratamiento
y ha tomado una muestra de 10 elementos de cada grupo. Usted calcula el valor de x para
cada muestra. ¿Cómo calcularía la gran media?
a) Multiplica cada media de muestra por 1/5 y suma estos valores. Luego divide esta suma
entre 50.
b) Suma las 5 medias muestrales y divide entre 50.
c) Suma las 5 medias muestrales y multiplica por 1/5.
d) Suma las 5 medias muestrales.
e) Ninguno de los anteriores.
36. Si deseamos probar si las proporciones de más de dos poblaciones son iguales, utilizamos:
a) Análisis de varianza.
b) Estimación.
c) La varianza.
d) Estimaciones de intervalo.
e) Ninguno de los anteriores.
37. ¿Cuáles de estas distribuciones tiene un par de grados de libertad?
5

a) Poisson.
b) Normal.
c) Ji-cuadrada.
d) Binomial.
e) Todas las anteriores.
f) Ninguna de las anteriores.
38. La media para el grupo completo de sujetos de todas las muestras de un experimento se
conoce como ______________ media.
39. Una técnica estadística utilizada para probar la igualdad de tres o más medias de población
se conoce como ______________.
40. Una prueba de ______________ se usa para determinar si la pertenencia a las categorías de
una variable es diferente como función de la pertenencia a las categorías de una segunda
variable.
41. Una familia de distribuciones diferenciadas por dos parámetros y que se usa principalmente
para probar hipótesis de varianzas se llama distribución ______________.
42. La prueba ______________ determina si existe una diferencia significativa entre las
distribuciones observada e hipotética para una muestra.
43. El análisis de varianza compara la ______________con la ______________para obtener el
estadístico______________.
44. La región de aceptación para una hipótesis nula en una prueba ji-cuadrada va de la cola
______________de la curva al valor ji-cuadrada. Esta región contiene el ______________
% del área bajo la curva.
45. El número de grados de libertad en el denominador del cociente F se calcula restando el
______________de ______________.
6

Prueba de conceptos
Capítulo 12
Imprima este texto y escriba sobre la línea, una V si el enunciado es verdadero o una F si es falso.
Las respuestas correctas se encuentran en el archivo correspondiente en este mismo CD.

_____ 1. El análisis de regresión se usa para describir qué tan bien una ecuación de estimación
describe la relación que se está estudiando.
_____ 2. Dado que la ecuación para una recta es Y = 26 – 24X, podemos decir que la relación de
Y con X es directa y lineal.
_____ 3. Un valor r2 cercano a cero indica una fuerte correlación entre X y Y.
_____ 4. Los análisis de regresión y correlación se usan para determinar relaciones de causa y
efecto.

_____ 5. El coeficiente de correlación de la muestra, r, es simplemente √r2, y no podemos


interpretar su significado directamente como un porcentaje de algún tipo.
_____ 6. El error estándar de la estimación mide la variabilidad de los valores observados
alrededor de la ecuación de regresión.
_____ 7. La recta de regresión se deriva de una muestra y no de toda la población.
_____ 8. Podemos interpretar el coeficiente de determinación de la muestra como la cantidad de
la variación en Y que explica la recta de regresión.
_____ 9. Las líneas trazadas a cada lado de la recta de regresión a ±1, ±2 y ±3 veces el valor del
error estándar de la estimación se denominan líneas de confianza.
_____10. La ecuación de estimación es válida sólo en el mismo intervalo que el dado por los
datos originales de la muestra para los cuales se desarrolló.
_____11. En la ecuación Y = a + bX para la variable dependiente Y y la variable independiente X,
la ordenada Y es b.
_____12. Si una línea se ajusta a un conjunto de puntos mediante el método de mínimos
cuadrados, los errores individuales positivos y negativos respecto a la línea suman
cero.
_____13. Si se = 0 para una ecuación de estimación, debe estimar perfectamente la variable
dependiente en los puntos observados.
_____14. Supongamos que la pendiente de una ecuación de estimación es positiva. Entonces el
valor de r debe ser la raíz cuadrada positiva de r2.
_____15. Si r = 0.8, entonces la ecuación de regresión explica el 80% de la variación total en la
variable dependiente.
_____16. El coeficiente de correlación es el porcentaje de la variación total de la variable
dependiente explicada por la regresión.
7

_____17. El error estándar de la estimación se mide perpendicularmente desde la recta de


regresión más que sobre el eje Y.
_____18. Al elevar al cuadrado los errores individuales, el método de mínimos cuadrados
magnifica todas las desviaciones respecto a la recta de regresión estimada.
_____19. Una ecuación de regresión no puede ser válida al ampliarse fuera del intervalo de la
muestra de la variable independiente.
_____20. Un valor r2 mide sólo la fuerza de una relación lineal entre las dos variables X y Y.
_____21. Un valor pequeño de r2 implica que no existe una relación de causa-efecto significativa
entre X y Y.

22. Suponga que conocemos la estatura de una estudiante, pero no su peso. Usamos una
ecuación de estimación para determinar una estimación de su peso, basándonos en su
estatura. Por tanto, podemos concluir que:
a) El peso es la variable independiente.
b) La altura es la variable dependiente.
c) La relación entre peso y altura es inversa.
d) Ninguna de las anteriores.
e) b) y c), pero no a).
23. Suponga que le dicen que existe una relación directa entre el precio de las alcachofas y la
cantidad de lluvia que cayó durante la época de cultivo. Puede concluirse que:
a) Los precios tienden a ser altos cuando la lluvia es alta.
b) Los precios tienden a ser bajos cuando la lluvia es alta.
c) Una gran cantidad de lluvia ocasiona que los precios suban.
d) La falta de lluvia ocasiona que los precios suban.
24. Suponga que se calcula que a es 4 y b es 2 para una línea de estimación particular con una
variable independiente. Si la variable independiente tiene un valor de 2, ¿qué valor debe
esperarse para la variable dependiente?
a) 8.
b) 10.
c) –1.
d) 0.
25. Suponga que se calculó la ecuación de estimación Ŷ = 5 – 2X para un conjunto de datos.
¿Qué es cierto de lo siguiente para esta situación?
a) La ordenada Y de la recta es 2.
b) La pendiente de la recta es negativa.
c) La recta representa una relación inversa.
d) Todos los anteriores.
e) b) y c), pero no a).
26. Sabemos que el error estándar es el mismo en todos los puntos de una recta de regresión
porque supusimos que:
a) Los valores observados de Y están normalmente distribuidos alrededor de cada valor
estimado de Y.
8

b) Las varianzas de la distribución alrededor de cada valor posible de Y son iguales.


c) Se tomaron en cuenta todos los datos disponibles cuando se calculó la recta de
regresión.
d) Ninguno de los anteriores.
27. La variación de los valores de Y alrededor de la recta de regresión se expresa mejor como:
a) Σ(Y + Y)2 .

b) Σ(Y – Y)2 .

c) Σ(Y – Ŷ)2 .

d) Σ(Y + Ŷ)2 .

28. El valor de r2 para una situación particular es 0.49. ¿Cuál es el coeficiente de correlación?
a) 0.49.
b) 0.7.
c) 0.07.
d) No puede determinarse de la información dada.

29. La fracción Σ(Y – Ŷ)2/Σ(Y – Y)2 representa:


a) La fracción de la variación total en Y que no está explicada.
b) La fracción de la variación total en Y que está explicada.
c) La fracción de la variación total en Y que fue ocasionada por cambios en X.
d) Ninguna de las anteriores.
30. En la ecuación Y = A + BX + e, la e representa:
a) La ordenada X de los datos observados.
b) El valor de Y con el cual se comparan otros para determinar el “mejor ajuste”.
c) Variaciones aleatorias respecto a la recta de regresión de la población.
d) Ninguno de los anteriores.
31. Suponga que desea comparar el valor hipotético de B con un valor de la muestra de la b
calculada. ¿Cuál de los siguientes valores se debe calcular antes que los otros?
a) sb.
b) se.
c) sp.
d) Los cálculos se pueden hacer en cualquier orden.
32. Para que la ecuación de estimación sea un estimador perfecto de la variable dependiente, de
lo siguiente, ¿qué tendría que ser cierto?
a) El error estándar de la estimación es cero.
b) Todos los puntos están en la recta de regresión.
c) El coeficiente de determinación es –1.
d) a) y b), pero no c).
e) Todos los anteriores.
33. Si la variable dependiente aumenta cuando la variable independiente aumenta en una
ecuación de estimación, el coeficiente de correlación estará en el intervalo de:
9

a) 0 a –1.
b) 0 a –0.05.
c) 0 a –2.
d) Ninguno de los anteriores.
34. Supongamos que la fracción de variación en Y que no está explicada por la variable
independiente X es 1/4 . Entonces r2 es:
a) 1/4.
b) 3/4.
c) 15/16.
d) Ninguna de las anteriores.
35. El coeficiente de determinación de la muestra se desarrolla a partir de la variación de los
valores de Y observados alrededor de:
a) La media de las variables independientes observadas.
b) La media de las variables dependientes observadas.
c) La recta de regresión ajustada.
d) b) y c), pero no a).
e) a), b) y c).
36. Si Y = a + bX, la recta de regresión de la muestra, y Y = A + BX, la ecuación de regresión
verdadera de población desconocida, son equivalentes, entonces lo siguiente debe ser
cierto:
a) La ecuación de estimación es un estimador perfecto de la variable dependiente.
b) Todos los puntos están sobre la recta de regresión.
c) r2 = 1.
d) Todos los anteriores.
e) Ninguno de los anteriores.
37. Si la variable dependiente en una relación disminuye al aumentar la variable independiente,
la relación es ______________.
38. Una asociación entre dos variables descrita por una línea curva es una ______________.
39. Toda línea recta tiene una ______________ que representa cuánto cambia la variable de-
pendiente con cada cambio unitario de la variable independiente.
40. El grado en el que los valores observados difieren de sus valores pronosticados sobre la
línea de regresión se mide por ______________.
41. ______________es una medida de la proporción de variación en la variable dependiente
que explica la recta de regresión.
42. Si el 75% de la variación en la variable dependiente es explicada por la recta de regresión,
entonces el valor de r será de alrededor de ______________.
43. ______________ se utiliza para medir qué tan bien la recta de regresión explica la
variación de la variable dependiente.
44. El signo de r indica el ______________de la relación entre las dos variables X y Y.
45. El método de mínimos cuadrados encuentra la línea de “mejor ajuste” a través de un
conjunto de puntos, esto es, la recta que ______________el error entre los puntos
observados y los puntos estimados sobre esa recta.
10

También podría gustarte