Está en la página 1de 122

LECCIONES BIOESTA A

Lección 1

1. Los datos continuos se diferencian de los discretos en que: Las clases de datos continuos pueden representarse
por fracciones
2. Si usted tiene una tabla

¿Cuál es la media, la mediana? R// 21-30


3. La secuencia es 20, 30, 12, 32, 45, 50 y se hace una tabla. El promedio de la tabla es {X}: R// 30,5
4. Hay una secuencia de 5, 6, 7, 9, 10, 19, 21, 25, 75 y haga una tabla de frecuencias y saque la mediana: R// 10 u
11
5. ¿Cuál de los siguientes métodos representa el esquema más preciso para clasificar datos? Un esquema puede
ser determinado sólo con información específica acerca de la situación
6. ¿Cuál de las siguientes afirmaciones sobre la muestra es incorrecta? Para que nuestro estudio estadístico sea
válido, la muestra tiene que tener más elementos que la población
7. Las variables discretas son aquellas que admiten solamente valores: Enteros
8. ¿Cuál de las siguientes afirmaciones acerca de los rectángulos de un histograma es correcta? Los rectángulos
tienen una altura proporcional al número de elementos que entran en las clases
9. ¿Qué es una muestra? ¿Qué una muestra? Conjunto de individuos según UNA característica en común
10. El diseño más poderoso de la investigación es: Cuantitativo
11. El polígono de Frecuencias acumuladas se usa para representar variables: Cuantitativas continuas
12. Las variables continuas son aquellas que admiten solamente valores: Fraccionados y no enteros
13. En la tabla anterior se registra el número de hijos por familia

El promedio de los hijos por familia es: 4,3

EXAMEN PRIMER PARCIAL

1. Si la media del conjunto de datos es 6 monedas, encuentra en número de monedas que encontró Julia. R// 5
2. Esta fórmula corresponde a: Desviación estándar de la población

3. Al rango se le conoce también como: Recorrido


4. Según la tabla que contiene el número de ventas de los productos A, B, C, D. ¿Qué gráfico representa los datos?

R//
5. Si el conjunto de datos formado por 12, 6, 7, 10, 11, 12, 6, 11, 14, 11, corresponde a una población, calcular la
varianza: 6, 8
6. ¿Cuál es la media aritmética de los siguientes números? R// 3
7. Si el conjunto de datos formado por 1, 3, 5, 7 corresponde a una población, calcular la desviación estándar: R//
2,236
8. Si la media del conjunto de datos equivale a 3 títeres. Hallar cuántos títeres le corresponden a Marco: R// 4

9. Una población de alumnos tiene una estatura media de 180 cm con una desviación estándar de 18 cm. Estos
mismos alumnos tienen un peso medio de 60 kg con una desviación estándar de 12 kg. ¿Cuál de las 2 variables
presenta mayor dispersión? El peso
10. Si el coeficiente de variación es mayor al 25% se entiende que: Los datos están en promedio muy alejados de la
media aritmética
11. La fórmula se utiliza para hallar: R// Desviación respecto a la media

12. ¿Cuál es la varianza en los datos 4, 5, 3, 4, 8? R// 4,4


13. Para calcular la varianza es indispensable hallar primero: El promedio
14. La fórmula se utiliza para hallar: R// Varianza

15. El espacio muestral de lanzar dos monedas al aire es: R// E={CC, EE, CE, EC}
16. ¿Cuál es la media aritmética de los siguientes números? 8, 10, 8, 5, 4, 7, 5, 10, 8: R// 7,2
17. Hallar la desviación media del siguiente conjunto de datos 1, 3, 5, 7: R// 2
18. Las ganancias de la primera mitad del año pasado de una empresa que vende ositos de peluche en lata se
muestran en la tabla. Calcular el rango de las ganancias. R// 22000

19. ¿A cuál de los siguientes eventos independientes corresponde la probabilidad de P=1/4? Lanzar dos monedas al
aire y obtener dos caras

Lección 1 2p

1. El error de tipo I consiste en: Rechazar H0 cuando es cierta


2. El factor z a/2 que da un nivel de confianza del 99% para una muestra de 100 datos es: +- 2,5758
3. Una nueva compañía dedicada al control de peso Weight Reducers International anuncia que quienes ingresan
perderán en promedio 10 libras las primeras dos semanas, con una desviación estándar de 2,8 libras. Una
muestra aleatoria de 50 personas que iniciaron el programa de reducción de peso reveló que el peso medio
perdido fue de 9 libras. Con un nivel de significancia de 0.05 ¿puede concluir que quienes ingresan a Weight
Reducers perderán en promedio más de 10 libras? La pérdida media de peso es menor a 10 libras con z=-2,53
4. Se sabe que la desviación típica de los volúmenes de las botellas de 710 ml de agua mineral embotellada por
una empresa es de 6ml. Se ha tomado una muestra aleatoria de 90 botellas y se han medido. Con un nivel de
confianza del 95% el margen de error es: 1,2396
5. Una muestra aleatoria de 85 líderes de grupo, supervisores y personal similar de Imcruz reveló que en promedio
pasan 6,5 años en su trabajo antes de ascender. La desviación estándar de la muestra fue de 1,7 años.
Construya un intervalo de confianza de 95% el límite inferior: 6,13 < u < 6,86
6. Si la media real poblacional es 6 y la hipótesis es que la media es 5,5 y se rechaza cuando se observa un valor
por arriba de 6,5 el error tipo II se calcula: P(x<6.5|u=6|)

7. Un estudio de 25 graduados de universidades de cuatro años llevado a cabo por una asociación reveló que la
cantidad media que debía un estudiante por concepto de crédito estudiantil era de 14381$. La desviación
estándar de la muestra fue de 1892$. Construya el intervalo de confianza de 90% de la media poblacional. ¿Es
razonable concluir que la media de la población en realidad es de 15000$? Indique: 657,44
8. En una muestra aleatoria de 95 empresas manufactureras, 67 han indicado que su empresa ha obtenido la
certificación ISO en los dos últimos años. Halle un intervalo de confianza al 99%: 0,5848 – 0,8258
9. Si queremos reducir los límites del intervalo de confianza se debe: Aumentar el tamaño de la muestra
10. De acuerdo con la Oficina del Censo 3,13 personas residen en un típico hogar estadounidense. Una muestra de
25 hogares de las comunidades de retirados de Arizona mostró que el número medio de residentes por hogar
era de 2,86 personas. La desviación estándar de esta muestra es de 1,20 residentes. A un nivel de significancia
de 0.05 ¿es razonable concluir que el número medio de residentes en los hogares de las comunidades de
retirados es menor a 3,13 personas? El número medio de residentes no necesariamente es menor a 3,13 con
t=-1,13
11. La compañía de teléfonos afirma en su informe anual que el consumidor habitual gasta 60$ mensual en el
servicio local y de larga distancia. Una muestra de 12 abonados reveló las cantidades que gastaron el mes
pasado:
64$ - 66$ - 64$ - 66$ - 59$ - 62$ - 67$ - 61$ - 64$ - 58$ - 54$ - 66$
Construir el intervalo de confianza de 90% de la media poblacional: 62,583 +- 2,043
12. No es una característica de las hipótesis: Los términos o variables de una hipótesis deben ser observables o
medicables

Lección 2 2p

1. El test de chi cuadrado es para variables: Cualitativas


2. ¿Para qué utilizamos a chi cuadrado? Para saber si las poblaciones son homogéneas
3. En un C de Salud analizamos las historias de enfermería (292 hombres y 192 mujeres). De ellos tienen úlcera 10
hombres y 24 mujeres y no tienen 282 y 168 respectivamente. Nivel de significación 0,05. Las hipótesis serían:
- H0: No existe relación entre tener úlcera y el sexo
- H1: Sí existe relación entre tener úlcera y el sexo

¿Cuál es el valor calculado? R// 14, 61


4. En un grupo de enfermos que se quejaban de que no dormían se les dio somníferos y placebos. Con los
siguientes resultados. Nivel de significación 0,05. ¿El valor calculado es? R// 2,57
5. Las puntuaciones en un test que mide la variable creatividad siguen, en la población general de a dolescentes,
una distribución normal de media 11,5. En un centro escolar que ha implantado un programa de estimulación
de la creatividad una muestra de 30 alumnos ha proporcionado las siguientes puntuaciones: 11, 9, 12, 17, 8, 11,
9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15. A un nivel de confianza del 95%,
¿cuál es el valor t? R// 2,66
6. Realice este ejercicio en los datos que se les brinda en Excel, de datos que se obtuvieron de las 50 personas
encuestadas de las cuáles se les preguntó, ¿considera usted que también utilizaba el cell con gran frecuencia
antes de la cuarentena? El valor de P es: R// 0,254
7. De acuerdo al resultado de la prueba T de student para muestras relacionadas que obtuviste en Excel: La
diferencia entre ambas calificaciones es significativa debido a que el valor de la significancia es <0,05 por lo
tanto se acepta la hipótesis alterna, es decir, la intervención educativa fue efectiva
8. Para probar la H0: u=u0 se utiliza el siguiente estadístico de prueba: T de student
9. Para comprobar la utilidad de una técnica de enriquecimiento motivacional un investigador pasa una prueba de
rendimiento académico a una muestra de 16 sujetos. Después aplica su técnica de enriquecimiento y tras ello,
vuelve a pasar la prueba de rendimiento. Los resultados fueron los siguientes:

A un nivel de confianza del 95%, ¿cuál es su T de la tabla con los grados de libertad? R// 1,75
10. Cuando interesa conocer la relación o independencia entre dos variables en una población se utiliza como
estadístico de prueba: X2

EXAMEN SEGUNDO PARCIAL

1. En una encuesta preelectoral realizada a 500 personas se obtuvo la siguiente distribución en función de sus
edades y de su intención de voto:

¿A un nivel 95% de confianza el chi2 cuánto es? R// 12,5915872


2. Las puntuaciones en un test que mide la variable creatividad siguen, en la población general de adolescentes,
puntuaciones de los 28 alumnos que están en el mismo colegio, pero diferentes cursos:
El valor p de esa prueba de T de student fue: R// 0,109267
3. ¿Cuál es la utilidad de la prueba T de student para muestras relacionadas? Comparar una característica de una
sola muestra, pero en dos circunstancias distintas
4. Para probar la H0: u=u0 se utiliza el siguiente estadístico de prueba: T de student
5. Distribución normal. Se calculó que el promedio de enfriamiento de todas las neveras para una línea de cierta
compañía, emplean una temperatura de -4°C con una desviación típica de 1.2°C. ¿Cuál es la probabilidad de que
una nevera salga con una temperatura superior a -3°C? R// 20,33%
6. La independencia se da cuando: A y B no están interceptados
7. ¿Cuál es el tipo de error que tiene un defecto del instrumento de medición? Sistemático
8. El 80% del alumnado de una determinada universidad accede a los estudios que marca como primera opción.
De ellos, el 75% termina el Grado, mientras que sólo el 40% de los que acceden a estudios que no han marcado
como primera opción termina el Grado. Se elige un alumno al azar de esa universidad. Calcule la probabilidad de
que no accediera a los estudios marcados como primera opción, sabiendo que no ha terminado el grado: R//
0,375
9. En una partida de Rol se lanza 200 veces un dado de cuatro caras obteniéndose 60 veces el número 1, 45 veces
el número 2, 38 veces el número 3 y 57 veces el número 4. Se puede aceptar a un nivel de confianza del 95%
que estos resultados corresponden a un dado homogéneo.
H0: Son homogéneos o uniformes, o sea que todos tienen la misma probabilidad
H1: No es uniforme, o sea distinto
¿Cuál es el valor de chi2 de este ejercicio? R// 7,81

10. ¿En qué consiste la prueba de homogeneidad? Extraer muestras independientes de varias poblaciones y se
prueban para ver si son homogéneas.
11. ¿Qué es una estimación? Una aproximación
12. Si tengo una distribución con un n< de 30 y una probabilidad <0,05 dicotómicamente qué distribución usar:
Bernoulli
13. Un campus universitario dispone de 300 plazas numeradas de aparcamiento para vehículo, distribuidos en tres
zonas A, B y C. La zona A está constituida por las plazas del 1 al 1500, estando 1350 de ellas protegidas del sol.
La zona B la conforman las plazas numeradas desde 1501 a 2500, estando el 80% protegidas del sol. La zona C
contiene plazas numeradas desde 2501 hasta 3000, estando protegidas solamente 250 protegidas del sol.
Aleatoriamente se elige una de las plazas del aparcamiento del campus. Si se ha elegido una plaza protegida del
sol, ¿cuál es la probabilidad de que esté ubicada en la zona B? R// 0,3334
14. ¿Qué significa que 170 mmHg corresponde a un valor z=+2? Que el valor supera a los 10 mmHg es 2,3%
15. La distribución de chi cuadrado se deriva de la distribución: Normal
16. Las puntuaciones en un test que mide la variable matemáticas siguen, en la población general de adolescentes,
puntuaciones de los 28 alumnos que están mismo colegio pero diferentes cursos:

El valor P de esa prueba de T de student fue: 0,00252474


17. La fórmula del intervalo de confianza es: Estimador +/- EE del estimador
18. Si se trabaja con un 95% de confianza, eso quiere decir que alfa es: 0,05
19. Los tiempos de respuesta de 9 sujetos en una tarea de reconocimiento de palabras, previamente presentadas,
han sido los siguientes: 115, 98, 123, 109, 112, 87, 118, 104, 116. A un nivel de confianza del 95%, ¿cuál es el
resultado o valor P de test Z en esta tarea sigue una distribución normal de media 110 y desviación típica 10?
R// 0,660513709
20. ¿En qué consiste la prueba de bondad de ajuste? Se utiliza para la comparación de la distribución de una
muestra con alguna distribución teórica que se supone describe a la población de la cuál se extrajo.
Que es una regresión?
Se adapta a una amplia variedad de situaciones. … también prestaremos atención a otras
cuestiones como el cheque supuestos del análisis de regresión y la forma de proceder
cuando se incumplen
la regresión lineal permite trabajar con una variable a nivel de intervalo o razón. de la
misma manera, es posible analizar la relación entre 2 o más variables a través de ecuaciones,
lo que se denomina regresión múltiple o regresión lineal múltiple
el pronóstico de regresión lineal simple es un modelo óptimo para patrones de demanda con
tendencia (creciente o decreciente) es decir patrones que presenten una relación de
linealidad entre demanda y el tiempo
otra

Que es una correlación de Spearman?


El coeficiente de correlación es una medida que permite conocer el grado de asociación
lineal entre dos variables cuantitativas (X,Y). … Entonces podemos decir que la relación
lineal del diagrama A es más débil con comparación A la relación que existe en el diagrama
B
es una medida no paramétrica de la correlación de rango (dependencia estadística del
ranking entre dos variables). se utiliza principalmente para el análisis de datos. mide la
fuerza y la dirección de la asociación entre dos variables clasificadas

Se acepta Ho, por lo que se concluye que el anterior año la organización trabajo
con los parámetros de excelencia, es decir, dar solución a una queja por debajo del
promedio de 55 días.
Se rechaza Ho, por lo que se concluye que el anterior año la organización trabajo
con los parámetros de excelencia, es decir, dar solución a una queja por debajo del
promedio de 55 días.
Se acepta Ho, por lo que se concluye que el anterior año la organización no está
dentro de los parámetros de excelencia, es decir, estar por debajo de 55 días para
solucionar una queja.
Se rechaza Ho, por lo que se conc+luye que el anterior año la organización no está
dentro de los parámetros de excelencia, es decir, estar por debajo de 55 días para
solucionar una queja.

Una encuesta en cierta ciudad muestra una tasa de desempleo del 18%. para
averiguar si ese resultado es válido el alcalde toma una muestra y se plantean las
hipótesis :
H0: la tasa del desempleo en la ciudad es del 18%
H1: la tasa del desempleo en la ciudad es significativamente diferente del 18%
En cual de las condiciones siguientes el alcalde comete un error tipo I:

Concluye que la tasa de desempleo no es del 18% cuando en realidad no es


Concluye que la tasa de desempleo en la ciudad es del 18% cuando en realidad no es
Concluye que la tasa de desempleo en la ciudad es del 18% cuando en realidad sí es
concluye que la tasa de desempleo no es del 18% cuando en realidad sí es

Las variables independientes también puede ser conocidas como:


variables de control
variables efecto
variables causa
variables dicotómicas

Uno de los aspectos que más se descuida al ajustar un modelo de regresión lineal
simple es revisar que se cumplan los _____________del modelo
supuestos
datos
números
ninguna

El modelo de la imagen, se ha corregido la autocorrelación?, Qué tipo?, valor de


rho?
Sí, AR (1). 0,629
SI, AR(2) , 0,42 y 0,629
No, no tiene, 0,629
Si, AR(1), 0,42

Una correlación moderada pero no estadísticamente significativa nos indica


todas
una correlación moderada en la población
una correlación igual a cero en la población
una relación distinta de cero en la población

Una máquina dispensadora de bebidas está diseñada para servir 360 ml de líquido
por vaso. el dueño sospecha que la máquina podría estar sirviendo líquido en
exceso. para verificar su sospecha, toma una muestra de 30 vasos
cuáles son las hipótesis adecuadas para este caso?
Ho: P = 360
H1: P < 360

Ho: P = 360
H1: P > 360

Ho: μ = 360
H1: μ <360

Ho: μ = 360
H1: μ > 360

El nivel de significación en una prueba de hipótesis, ...


(indique lo que considere correcto, puede ser más de una opción)
Suele ser pequeño
Lo fija el investigador.
Da la probabilidad de declarar significativo el resultado de un test, cuando éste es
falso.
Depende del tamaño de la muestra.

Señale los enunciados que son verdaderos:


La hipótesis nula puede ser rechazada.
La hipótesis alternativa puede ser aceptada.
Si no se rechaza la hipótesis nula, los resultados no son concluyentes
La hipótesis alternativa se opone a la nula.
La hipótesis nula es aquella para la que se busca evidencia a favor.

Al rechazar la Hipótesis Nula cuando ésta es verdadera, se comete un...


Error del Tipo I
Error del Tipo II
Error de Muestreo
Error de Población

Una Hipótesis Estadística es:


Cualquier afirmación acerca de la distribución de la población.
Una regla de decisión que nos indica cuando debe aceptarse o rechazarse el valor
de un parámetro.
Una región del espacio muestral que lleva asociada una alternativa
Un valor que se asigna provisionalmente a un estadístico en tanto no se demuestre
cuál es su valor verdadero.

Señale el paso que no corresponde al procedimiento para probar una


hipótesis:
Se establecen las hipótesis nula y alternativa.
Se selecciona un nivel de significancia.
Se establecen la desviación estándar de la población

Usted está tratando de demostrar que las lecciones de música tienen un


efecto positivo en la autoestima de un niño. ¿Cuál es la hipótesis nula en el
enunciado?
música tienen un efecto positivo en la autoestima de un niño
música tienen un efecto negativo en la autoestima de un niño

La prueba es de una cola si la H1, afirma que:


u >o u<
u >o u=
u >= o u <

Una prueba de hipótesis es:


Una afirmación a partir de unos datos
Procedimiento basado en evidencias

¿Cuál es el muestreo aleatorio simple?


Es un tipo de muestreo probabilístico donde se hace una selección aleatoria del
primer elemento para la muestra
Es la técnica de muestreo que todos los elementos forman el universo
Es una técnica de muestreo probabilístico en donde el investigador divide a toda la
población en diferentes subgrupos o estratos

Usted está investigando la relación entre el género de la persona y el


automóvil que conduce; específicamente desea demostrar que los hombres
tienden a manejar vehículos del tipo de camiones más que las mujeres. En el
enunciado cual es la hipótesis alternativa.
Los hombres tienden a manejar vehículos del tipo de camiones menos que las
mujeres.
Los hombres tienden a manejar vehículos del tipo de camiones más que las
mujeres.

El símbolo para el nivel de significancia es:


α
1- α
1- α/2
α/2

¿Las hipótesis siempre son verdaderas?


Falso
Vedadero

Se define como proposiciones tentativas acerca de las posibles relaciones


entre dos o más variables, y deben cumplir con los cinco requisitos
mencionados.
Hipótesis estadística
Hipótesis alternativa
Hipótesis de investigación
Hipótesis nula

¿Cuales son los tipos de hipótesis que se pueden establecer?


Investigación, nula, descriptiva, correlacional.
Investigación,nula,alternativa, estadística.
De diferencia de grupos, correlacional, descriptiva, causales.
Correccional, causales, descriptiva, nula.

La hipótesis de prueba es la que se somete a un escrutinio empírico para


determinar si es apoyada o refutada, de acuerdo con lo que el investigador
observa.
Verdadero
Falso

Se realizara una encuesta a una variedad de clientes, en este caso una persona de
cada 10 que pasan en la tienda, para ver el grado de satisfacción que tienen
conforme a los servicios que se ofrecen, ¿esto corresponde a que tipo de
muestreo?
Muestreo aleatorio simple
Muestreo sistemático
Muestreo estratificado
Muestreo por conglomerados
En 1909, los Pastelitos Miss May tenía 316 empleados. Veinte años después,
en 1929, la compañía tenía 790 empleados. ¿Cuál es la diferencia entre el
número de empleados que tenía la compañía en 1929 y en 1909?
A. aproximadamente 400
B. aproximadamente 500
C. aproximadamente 600
D. aproximadamente 700

Cada día, una compañía de bicicletas tiene a 10 personas armando 48


bicicletas. La compañía necesita saber cuántas bicicletas armarían en un
período de 47 días. ¿Cuál es la estimación más razonable?
A. 250,000
B. 25,000
C. 2,500
D. 1,050

La biblioteca acaba de recibir 2,040 libros nuevos. Quitaron los libros de 7


estantes para colocarlos en ese lugar. Si en cada estante cabe el mismo
número de libros, aproximadamente, ¿cuántos libros caben en cada estante?
A. 20 libros
B. 30 libros
C. 200 libros
D. 300 libros
En una bolsa se depositaron tres balotas rojas y siete verdes, todas del
mismo tamaño. Alejandra estima que al sacar una balota de la bolsa sin ver,
tiene más probabilidad de sacar una balota roja que una verde. ¿ Es correcta
está estimación?. ¿Por qué ?

No es correcta la estimación de Alejandra porque tiene mayor probabilidad de


sacar una balota azul.
No es correcta la estimación de Alejandra porque tiene mayor probabilidad de
sacar una balota verde.
No es correcta la estimación de Alejandra porque tiene mayor probabilidad de
sacar una balota roja.

Una encuesta en cierta ciudad muestra una tasa de desempleo del 18%. Para
averiguar si ese resultado es válido, el alcalde toma una muestra y se plantea
las hipótesis:
Ho: La tasa de desempleo en la ciudad es del 18%
H1: La tasa de desempleo en la ciudad es significativamente diferente del
18%.
En cuál de las condiciones siguientes el alcalde comete un Error Tipo I ?:
Concluye que la tasa de desempleo no es del 18%, cuando en realidad sí es.
Concluye que la tasa de desempleo no es del 18%, cuando en realidad no es.
Concluye que la tasa de desempleo en la ciudad es del 18%, cuando en realidad sí
es.
Concluye que la tasa de desempleo en la ciudad es del 18%, cuando en realidad
no es.

El Gerente de una empresa desea contratar un nuevo Contador para que se


haga cargo de los movimientos contables. Entrevista a un postulante, y se
plantea la siguiente Hipótesis: “El postulante está totalmente capacitado para
desenvolverse en el cargo”
Luego de la entrevista, toma la decisión de contratarlo porque lo considera
competente. Sin embargo, la realidad es que el postulante es un
irresponsable que falsificó sus títulos.
En esta situación, señale lo que hizo el Gerente:
El Gerente cometió un Error Tipo I
El Gerente cometió un Error Tipo II
El Gerente tomó la decisión acertada, no cometió error.
El Gerente cometió los dos errores, Tipo I y Tipo II

Las autoridades de la UCB quieren averiguar si deben construir otra cafetería


en el campus. Para ello, realizan una encuesta a algunos estudiantes, para
verificar qué proporción de ellos consumirían en la cafetería. Si esta
proporción es mayor que el 40%, se consideraría la construcción. Se
plantean las hipótesis:
Ho: P = 0.4
Ha: P > 0.4
Qué implicaciones tendría un error tipo II en este caso?
No se considera construir la nueva cafetería a pesar de que se la requiere.
No se considera construir la nueva cafetería pues no se la requiere
Se considera construir la nueva cafetería a pesar de que no se la requiere.
Se considera construir la nueva cafetería pues se la requiere.

Usted está investigando la relación entre el género de la persona y el


automóvil que conduce; específicamente desea demostrar que los hombres
tienden a manejar vehículos del tipo de camiones más que las mujeres. En el
enunciado cual es la hipótesis alternativa.
Los hombres tienden a manejar vehículos del tipo de camiones menos que las
mujeres.
Los hombres tienden a manejar vehículos del tipo de camiones más que las
mujeres.

Una entidad territorial quiere hacer un estudio para conocer el tipo de


actividades deportivas que más realizan en una determinada población, con
el fin de estructurar un plan de ingeniería civil en espacios públicos. Para ello
van a ser encuestados 1.000 individuos al azar.
El proceso de recolección de información y muestreo más adecuado para
llevar a cabo en este caso es
El muestreo aleatorio sin reposición, de forma que la población sea idéntica en
todas las extracciones.
El muestreo aleatorio con reposición, de forma que la población sea idéntica en
todas las extracciones.
el muestreo aleatorio con reposición, de forma que la población no sea idéntica en
todas las extracciones.
El muestreo aleatorio sin reposición, de forma que la población no sea idéntica en
todas las extracciones.

Se sabe que la desviación típica de las notas de un examen de matemáticas


aplicado para un concurso de retos académicos es 2,4. Para una muestra de
36 estudiantes se obtuvo una nota media de 5,6 y se plantean las siguientes
hipótesis:
Ho : μ = 6 (La nota media no ha variado)
Ha: μ = 6 (La nota media ha variado)
De las siguientes afirmaciones, ¿cuál plantea que la nota media del examen
fue 6 con nivel de confianza del 95%?
Se acepta la hipótesis nula Ho, con una nota media de 5,6.
Se acepta la hipótesis alternativa Ha, con un nivel de significación del 5%.
Se acepta la hipótesis nula Ho, con un nivel de significación del 5%.
Se acepta la hipótesis alternativa Ha, con una nota media de 5,6.

En el gráfico se muestra los consumos de leche en Estados Unidos desde


1909 hasta 2000.

Del gráfico se puede concluir que

En el 2000 las personas han consumido 3 veces más leche que en años años
anteriores.
En 1958 las personas dejaron de consumir leche para consumir crema de leche.
En 1986 hubo un alto consumo de leche entera comparado con otras leches.
En 1944 fue el año de más alto consumo de leche comparado con otras leches.

Mónica ha anotado los kilómetros recorridos por su furgón en estos últimos


días: 66 km, 145 km, 126 km, 145 km, 88 km, 145 km, 66 km, 112 km, 145 km,
210 km Calcula su moda y su media.
Moda: 155
Media: 135

Moda: 145
Media: 124,8

Si se tiene un nivel de significancia del 3.89%, entonces el nivel de confianza


es:
0.711
0.9611
0.09711
0.9711

Si se tiene un nivel de confianza del 94% ¿Cuál es el valor de Z para una


hipótesis a una cola?
Z=09599
Z= 1.555
Z= 1.56
Z= 1.55

Para una prueba de hipótesis alternativa H 1: μ≠μ0 . Si se tiene 20 grados de


libertad, el valor de t es:
0.95
1.645
2.086
1.96

Tipo de hipótesis que niegan o refutan hipótesis de investigación.


Hipótesis alternativa
Hipótesis Estadística
Hipótesis Cero
Hipótesis Nula

A un grupo de estudiantes se les ha practicado un examen de conocimientos


en el área de matemáticas, para ello se ha establecido un puntaje mínimo de
0 y máximo de 10. Los resultados de la prueba son: 2, 5, 1, 6, 7, 2, 4, 6, 1, 6. Si
el docente desea conocer el valor esperado de calificaciones obtenidas por
los estudiantes el debe:
sumar los resultados de la prueba y multiplicar el resultado por 100
sumar los resultados de la prueba y dividir el resultado por el total de estudiantes
sumar los resultados de la prueba y multiplicar el resultado por el total de
estudiantes
sumar los resultados de la prueba y dividir el resultado por 100

El nuevo alcalde de una localidad va a poner en práctica sus propuestas de


gobierno establecidas en el periodo comprendido entre el año 2020 y 2024.
Una de las propuestas está encaminada a mejorar la movilidad de la
localidad, ya que en los últimos años han aumentado las cifras de
accidentalidad, para ello identifica que uno de los factores a estudiar es el
número de luces defectuosas de los semáforos de la ciudad. Frente a la
situación planteada se puede aseverar que:
La población de este estudio son los habitantes de la localidad que cruzan las
calles que tienen semáforos.
La población de este estudio son las luces de los semáforos.
La población de este estudio son los semáforos de la localidad.
En esta situación no se realiza ningún estudio estadístico

Una empresa de publicidad en televisión va a realizar un estudios de los


estudiantes de secundaria de la Institución La Aurora para conocer el número
de horas que ven televisión al día y sus programas de televisión preferidos.
Elige la respuesta correcta:
Se está estudiando una variable estadística
Se están estudiando dos variables estadísticas cuantitativas
Se están estudiando dos variables estadísticas cualitativas
Se estudia una variable estadística cualitativa y otra variable estadística
cuantitativa

“En las noticias de ayer se presentó una gráfico que indicaba la cantidad de
nacimientos por mes durante el año 2018”.

En la situación anterior ¿Qué tipo de estadística está siendo representada?


Estadística descriptiva
Estadística Inferencial
Estadística Integral
Estadística Diferencial

“si de una caja de 50 fósforos, 5 funcionan, entonces podríamos decir que


todos los demás también funcionan”.

En la situación anterior ¿Qué tipo de estadística está siendo representada?


Estadística descriptiva
Estadística Inferencial
Estadística Integral
Estadística Diferencial

En una encuesta realizada a un grupo de empleados de cierta empresa se les


ha preguntado sobre aspectos relacionados con: tiempo que lleva laborando
en la empresa, actividades de ocio que realiza, medidas de peso y estatura,
medio de transporte entre otras. El jefe de producción desea realizar gráficos
estadísticos con los resultados obtenidos en la encuesta, para lo cual le
solicita a usted que identifique de las preguntas de la encuesta una variable
cualitativa, su respuesta sería:
EDAD
VELOCIDAD
ESTADO CIVIL
NUMERO DE HIJOS

El profesor de Educación Física desea realizar el plan de trabajo del siguiente


año, en el cual debe incluir un deporte, una actividad de recreación,
formación de hábitos deportivos, aspectos del movimiento, entre otros. En la
situación anterior ¿Cuál es la variable?
La escuela
Los estudiantes
Deporte Favorito
Un estudiante

En una encuesta realizada a un grupo de empleados de cierta empresa se les


ha preguntado sobre aspectos relacionados con: tiempo que lleva laborando
en la empresa, actividades de ocio que realiza, medidas de peso y estatura
entre otras. El jefe de producción desea calcular las medidas estadísticas con
los resultados obtenidos en la encuesta, para lo cual le solicita a usted que
identifique de las preguntas de la encuesta una variable cuantitativa
continua, su respuesta sería:
NUMERO DE PAGINAS
MESES LABORADOS
COLOR FAVORITO
ESTATURA

En un concurso, el concursante escoge una puerta entre tres, y su premio


consiste en lo que se encuentra detrás. Una de ellas oculta un coche, y tras
las otras dos hay una cabra. Sin embargo, antes de abrirla, el presentador,
que sabe donde esta el premio, abre una de las otras dos puertas y muestra
que detrás de ella hay una cabra. Ahora tiene el concursante una última
oportunidad de cambiar la puerta escogida ¿Debe el concursante mantener
su elección original o escoger la otra puerta?
Quedarse con la puerta inicial
Cambiar a la otra puerta
Es irrelevante cambiar o no cambiar
Todas las respuestas son incorrectas.

Don Rubén, por cada 10 unidades que vende de un nuevo producto gana
2500 pesos. En la gráfica se muestra la ganancia que don Rubén obtuvo
algunos días de la semana.

De acuerdo con la información de la gráfica, la venta del día domingo fue de:

90 unidades
100 unidades
22500 unidades
2500 unidades

En el gráfico se muestra los consumos de leche en Estados Unidos desde


1909 hasta 2000.

En 1986 se consumieron

20 galones de leche por persona


15 galones de leche por persona.
25 galones de leche por persona
10 galones de leche por persona

A un grupo de estudiantes se les ha practicado un examen de conocimientos


en el área de matemáticas, para ello se ha establecido un puntaje mínimo de
0 y máximo de 10. Los resultados de la prueba son: 2, 4, 1, 6, 7, 2, 4, 6, 2, 6.
Después de hacer algunos cálculos el docente afirma que el valor esperado
de calificaciones obtenidas por los estudiantes es 4,5. La afirmación del
docente es:
falsa, porque el valor esperado es igual a la moda que es 6.
verdadera, porque el valor esperado es igual al promedio entre el valor máximo y
mínimo.
falsa, porque el valor esperado es igual a la mediana que es 4.
verdadera, porque el valor esperado es igual la desviación estándar que es 4,5

En el área de salud en una clínica, el número de pacientes afectados de


cataratas que precisan una intervención quirúrgica en los primeros seis
meses del 2007, está reflejado en la tabla.
según la información presentada, ¿cuántos pacientes reportaron ser
afectados por cataratas en los últimos 10 años?

5 pacientes reportaron ser afectados.


45 pacientes reportaron ser afectados.
53 pacientes reportaron ser afectados.
42 pacientes reportaron ser afectados.

Se debe aplicar una encuesta que contenga 6 preguntas que incluyan


variables estadísticas de la siguiente forma:
(P=Pregunta)
P1=Cuantitativa
P2=Cuantitativa discreta
P3=Cualitativa
P4=Cualitativa ordinal
P5=Cuantitativa continua
P2=Cuantitativa discreta

La opción que muestra preguntas aplicadas de la forma en que se solicita en


el enunciado es:
edad - número de hijos - sexo - nivel de estudios - peso - salario
nivel de estudios - edad - número de hijos - sexo - peso - salario
salario - nivel de estudios - edad - número de hijos - sexo - peso
número de hijos - edad - sexo - nivel de estudios - peso – salario

La variable "altura de los deportistas de la selección femenina de fútbol sigue


una distribución normal de media 1,62m y la desviación típica 0,12.
¿Cuál es la probabilidad de que la media de una muestra aleatoria de 100
alumnas sea superior a 1,60m?
0,9615
0,9625
0,9515
0,8515

En un estudio de seguridad e higiene en el trabajo se contrastó la incidencia


del tabaquismo en la gravedad de los accidentes laborales. Considerando
una gradación de Muy fumador hasta No fumador como medida del
tabaquismo, y una gradación Muy grave a Leve en el tipo de accidente. Se
extrajo una muestra de 525 individuos que habían sufrido un accidente
laboral. Los resultados se presentan en la tabla de contingencia.
La tabla que muestra las distribuciones marginales para cada una de las
variables de estudio es:
ESTA ES LA TABLA

DE RESPUESTAAAA

En un estudio de seguridad e higiene en el trabajo se contrastó la incidencia


del tabaquismo en la gravedad de los accidentes laborales. Considerando
una gradación de Muy fumador hasta No fumador como medida del
tabaquismo, y una gradación Muy grave a Leve en el tipo de accidente. Se
extrajo una muestra de 525 individuos que habían sufrido un accidente
laboral. Los resultados se presentan en la tabla de contingencia.
La tabla que muestra la distribución de frecuencias porcentuales y las
distribuciones de la variable de Tipo Lesión condicionada a cada una de las
variables del Fumador es:

ESTA ES

LA TABLA DE RESPUESTA

En general los suelos del trópico son ácidos y con baja disponibilidad de
nutrientes, por lo que los cultivos en estas zonas requieren de grandes
cantidades de fertilizantes. El uso excesivo de fertilizantes produce
salinización y deterioro de los suelos y de las fuentes de agua. En la
actualidad, un grupo de investigación está investigando una variedad de frijol
silvestre, originario de una localidad de suelos ácidos y pobres en nutriente,
que produce abundantes vainas con frijoles pequeños.
Con base a la anterior información, ¿cuál pregunta de investigación
permitiría abordar el estudio de esta variedad de frijol?
¿Cuál es la productividad de la variedad de frijol silvestre bajo el régimen de
fertilización de las variedades comerciales?
¿Cuáles son las características fisiológicas y genéticas que hacen que esta
variedad produzca semillas pequeñas?
¿Cuáles son las características fisicoquímicas del suelo que permiten que esta
variedad se haya adaptado a este suelo?
¿Cuáles son las características morfológicas y fisiológicas que le permiten a esta
especie crecer en este suelo?

Para datar la edad de las rocas sedimentarias es común el uso de fósiles,


este método da como resultado intervalos de tiempo. La gráfica muestra la
edad en millones de años (m.a.), en la cual aparecen y se extinguen ciertos
fósiles.

Después de tomar 500 muestras en una capa de rocas se encuentran los


fósiles F1, F2 y F3. Con base en estos resultados, se propone que la edad de
esta capa es de

entre 10 y 90 millones de años.


entre 20 y 40 millones de años.
entre 20 y 50 millones de años.
entre 10 y 60 millones de años.

Colombia se caracteriza por la producción y exportación de flores para


fechas especiales, como el día de la madre que se celebra en mayo. Pero las
ganancias o pérdidas por motivo de las exportaciones están sujetas a la
variación del precio del dólar.
Los empresarios de flores en Colombia desean contratar a un analista
económico para que en base a los valores del dólar determine la mejor fecha
para realizar las ventas de flores a países europeos y norteamericanos. El
analista económico observa la variación de los precios de venta entre el 8 y
22 de abril del presente año para tomar una decisión, además, se sabe que el
costo de producción promedio mensual es de 1.780 millones de pesos. La
información se representa en la figura 1.

De acuerdo con la gráfica es correcto afirmar que: ¿las ventas generadas en


el mes de abril son beneficiosas para los empresarios de flores?

Sí, porque las ventas tienden a mejorar al finalizar el mes de abril donde se
estabilizan.
Sí, porque las ventas tienden a estabilizarse al finalizar el mes de abril al presentar
mayor variabilidad.
No, porque los días con valores inferiores son mayores a los superiores, tomando
como referencia el valor de 1.780 millones.
No, porque se desconoce las ventas de los primeros días del mes de abril.
Colombia se caracteriza por la producción y exportación de flores para
fechas especiales, como el día de la madre que se celebra en mayo. Pero las
ganancias o pérdidas por motivo de las exportaciones están sujetas a la
variación del precio del dólar.
Los empresarios de flores en Colombia desean contratar a un analista
económico para que en base a los valores del dólar determine la mejor fecha
para realizar las ventas de flores a países europeos y norteamericanos. El
analista económico observa la variación de los precios de venta entre el 8 y
22 de abril del presente año para tomar una decisión, además, se sabe que el
costo de producción promedio mensual es de 1.780 millones de pesos. La
información se representa en la figura 1.

Después de realizar el análisis de la gráfica, el analista económico le sugiere


al grupo de empresarios que las fechas más convenientes para realizar las
ventas de las flores debe estar entre el 9 y el 13 de abril. Usted considera que
la afirmación del economista...

es correcta, porque en ese periodo el promedio del precio de venta es el más


elevado.
es incorrecta, porque existen otros periodos en los que las ventas son estables.
es correcta, porque contiene las ventas más altas en comparación a otros
periodos.
es incorrecta, porque el promedio de ventas es superado en otro periodo.

Colombia se caracteriza por la producción y exportación de flores para


fechas especiales, como el día de la madre que se celebra en mayo. Pero las
ganancias o pérdidas por motivo de las exportaciones están sujetas a la
variación del precio del dólar.
Los empresarios de flores en Colombia desean contratar a un analista
económico para que en base a los valores del dólar determine la mejor fecha
para realizar las ventas de flores a países europeos y norteamericanos. El
analista económico observa la variación de los precios de venta entre el 8 y
22 de abril del presente año para tomar una decisión, además, se sabe que el
costo de producción promedio mensual es de 1.780 millones de pesos. La
información se representa en la figura 1.

El grupo de empresarios productores y exportadores de flores, afirman que


en abril del año anterior les fue mejor, porque el valor más alto de venta fue
de 1.805 y el más bajo de 1755, por el contrario, el analista dice que no es así,
porque:
El promedio entre el valor más alto y bajo del mes es igual en los dos periodos de
tiempo.
En el presente análisis no se tuvo en cuenta los valores de venta intermedios.
El promedio entre el valor más alto y bajo del mes fue inferior en el análisis del
presente periodo de tiempo.
El promedio entre el valor más alto y bajo del mes fue superior en el análisis del
presente periodo de tiempo.

Colombia se caracteriza por la producción y exportación de flores para


fechas especiales, como el día de la madre que se celebra en mayo. Pero las
ganancias o pérdidas por motivo de las exportaciones están sujetas a la
variación del precio del dólar.
Los empresarios de flores en Colombia desean contratar a un analista
económico para que en base a los valores del dólar determine la mejor fecha
para realizar las ventas de flores a países europeos y norteamericanos. El
analista económico observa la variación de los precios de venta entre el 8 y
22 de abril del presente año para tomar una decisión, además, se sabe que el
costo de producción promedio mensual es de 1.780 millones de pesos. La
información se representa en la figura 1.

Si usted es el economista contratado por los empresarios y teniendo en


cuenta la información de la gráfica y los costos de producción, consideraría
que abril es un mes...

de gran importancia, ya que los ingresos son altamente positivos para los
empresarios.
de tendencia a la baja, ya que las utilidades generadas no son positivas sino
negativas.
de poca importancia, ya que los empresarios obtuvieron un punto de equilibrio.
de tendencia al alta, ya que los picos de venta son superiores al costo de
producción.
El conjunto 5,10,12,15,15,18,22 corresponde a los datos de una variable
cuantitativa, ¿cuál es el primer cuartil?
10
11
12
15

El conjunto 154,284,315,318,452,469,750,950 corresponde a los datos de una


variable cuantitativa, ¿cuál es el primer cuartil?
284
299,5
315
385

El conjunto 4,8,15,17,17,19,23,54,60,62,62 corresponde a los datos de una


variable cuantitativa, ¿cuál es el tercer cuartil?
57
60
61
62

A continuación se muestra la gráfica de una distribución


de datos para una variable cuantitativa. Entonces, con certeza el valor de a
corresponde a:

La media aritmética.
La moda.
La mediana.
El máximo.

¿Cuál de las siguientes afirmaciones es verdadera?


La distribución es asimétrica positiva porque hay muchos
estudiantes con notas altas que aumentan el promedio
La distribución es asimétrica negativa porque hay
muchos estudiantes con notas altas que aumentan el
promedio.
La distribución es asimétrica positiva porque hay muchos
estudiantes con notas bajas que disminuyen el promedio
La distribución es asimétrica negativa porque hay
muchos estudiantes con notas bajas que disminuyen el
promedio.

Qué tabla de frecuencias pertenece al gráfico .


ESTA ESSS

¿Cuántos estudiantes hay en 7°?

35
30
31
10

La herramienta que permite organizar la información obtenida de una


encuesta es:
Tablas de frecuencias
Gráficas estadísticas

Cuando se construye una tabla de frecuencia en la primera columna debe ir:


Frecuencia absoluta
Frecuencia acumulada
Variable de estudio

¿Cuáles son variables cuantitativas?


N° de Hermanos
Red social usada
Color favorito
Estatura (cm)
Curso favorito

28%
35%
56%
42%

¿Qué es estadística?
Es la mediana y análisis de tablas
Ciencia matemática
Ciencia que estudia la recolección e interpretación de datos

Se usa para representar las frecuencias de una variable cuantitativa continua.


En uno de los ejes se ubican las clases de la variable y en el otro, las
frecuencias.
Histograma
Pastel
Ojiva
Polígono de frecuencias
Barras

Representación gráfica de las frecuencias de una variable cualitativa o


discreta. Funciona para comparar magnitudes de varias categorías.
Histograma
Pastel
Ojiva
Polígono de frecuencias
Barras

De las siguientes variables cuantitativas seleccione cuáles son discretas


La estatura de todos los miembro de su familia.
Temperaturas registradas cada hora por usted
El tiempo que invierte un estudiante en hacer una actividad
Número de hijos de 50 familias
Número de estudiantes por salón en el colegio Evergreen

La muestra es..
Un conjunto de elementos con una característica en común.
Una parte de algo
Un subconjunto de la población

Indica si esta variable es cuantitativa discreta, cuantitativa continua o


cualitativa:
Un científico estudia la altura de los volcanes del pacífico.
Cuantitativa discreta.
Cuantitativa continua.
Cualitativa.

Es un ejemplo de muestra estadística:


Personas infectadas con el SARS COV 2.
2356 Personas infectadas con SARS COV 2 en la ciudad de Lima.
La población peruana en el año 2020.
La comunidad educativa del Colegio El Buen Pastor.

Seleccione la frase que brinda la definición correcta del concepto de


"variable" en estadística:
Magnitud fija que se conoce con anticipación.
Medida que se mantiene constante a través del tiempo.
Magnitud que puede tomar un valor cualquiera.
Unidad con la que se mide un evento, elemento o individuo.

Las variables discretas son aquellas que admiten solamente valores ......
enteros o fraccionarios
enteros y fraccionarios
enteros
fraccionarios

De un grupo de familias considerando el número de hijos, se obtuvieron los


datos de la tabla... seleccionar la opción incorrecta
el 35% de las familias tienen 4 hijos
una muestra de 20 familias
el 20% de las familias tiene de 4 a 6 hijos
el 80% de las familias tienen de 0 a 4 hijos

La frecuencia absoluta acumulada ( Fi ) es...


La suma de las frecuencias absolutas
El porcentaje de cada variable
El nº de personas a los que has preguntado
El nº de veces que se repite cada variable

La frecuencia absoluta ( fi ) es...


La suma de todos los valores
El porcentaje de cada variable
El nº de personas a los que has preguntado
El nº de veces que se repite cada variable

Señale la afirmación correcta:


El test U-Mann Whitney y Kruskal Wallis son utilizados para comprara la media de
dos poblaciones.
El test U-Mann Whitney se utiliza cuando queremos comprara mas de dos grupos
El test de Kruskal Wallis no proporciona entre que grupos experimentales existen
diferencias
El test U-Mann Whitney y de Kruskal Wallis son pruebas de contraste parametrico

¿Cuál es el muestreo sistemático?


Es la técnica de muestreo en la que todos los elementos forman el universo
Es una técnica utilizada cuando hay agrupamientos "naturales" relativamente
homogéneos en una población estadística.
Es una técnica de muestreo probabilístico en donde el investigador divide a toda la
población en diferentes subgrupos o estratos.
Es un tipo de muestreo probabilístico donde se hace una selección aleatoria del
primer elemento para la muestra,

¿Cuál es el muestreo estratificado?


Es una técnica de muestreo probabilístico en donde el investigador divide a toda la
población en diferentes subgrupos o estratos.
Es una técnica utilizada cuando hay agrupamientos "naturales" relativamente
homogéneos en una población estadística.
La muestra se escoge convengo al investigador ya que escoge a los individuos
para hacer la investigación.
El investigador influye ara que el resultado de la investigación salga a su
conveniencia

¿Cuál es el muestreo por conglomerados?


Es una técnica utilizada cuando hay agrupamientos "naturales" relativamente
homogéneos en una población estadística.
Se utiliza en el seguimiento de egresados en la escuela
Cada uno de estos muestreos, se escogen dependiendo de la situación que se va
a realizar y a la que mejor se apegue

¿Que es el estudio sesgado?


Recabar, organizar, presentar, analizar e inferir información de un fenómeno
problema para tomar decisiones de un fenómeno o problema
El investigador influye para que el resultado de la investigación salga a su
conveniencia
Es el conjunto de individuos, objetos o fenómenos de los cuales se desea estudiar
una o varias características.
Cada uno de estos muestreos, se escogen dependiendo de la situación que se va
a realizar y a la que mejor se apegue

¿Que es el estudio no sesgado?


Cada uno de estos muestreos, se escogen dependiendo de la situación que se va
a realizar y a la que mejor se apegue
El investigador influye para que el resultado de la investigación salga a su
conveniencia
Acerca del cual se busca información es el valor “promedio” de todos los
automóviles en la población.

Es un muestreo probabilístico...
Sistemático
Por cuotas
Discrecional
Bola de nieve
Es utilizado para crear muestras de acuerdo a la facilidad de acceso, donde
los sujetos son seleccionados dada la conveniente accesibilidad.
Muestreo no sesgado
Muestreo por conveniencia
Muestreo por conglomerado

Los elementos de la población son seleccionados al azar en forma natural


por agrupaciones.
Muestreo estratificado
Muestreo por conglomerado
Variabilidad

Es un procedimiento de muestreo probabilístico que da a cada elemento de la


población objetivo y a cada posible muestra de un tamaño determinado, la
misma probabilidad de ser seleccionado.
Muestreo sistemático
Muestreo por conglomerados
Muestreo estratificado
Muestreo aleatorio simple

El estudio o muestreo no sesgado es cuando el investigador no actúa de


forma ética, manipulando los datos o resultados obtenidos.
Verdadero
Falso

En cualquier estudio debe de presentarse este aspecto, porque no siendo así


no sirve de mucho lo que se desea obtener de él siendo todo positivo, en si
manipulado.
Estadística inferencial
Estadística
Variabilidad
Muestreo

¿cuál es el muestreo probabilístico?


Es un procedimiento de muestreo probabilístico que da a cada elemento de la
población objetivo y a cada posible muestra de un tamaño determinado, la misma
probabilidad de ser seleccionado
Es una técnica de muestreo en virtud de la cual las muestras son recogidas en un
proceso que brinda a todos los individuos de la población las mismas
oportunidades de ser seleccionados.
Encuesta de satisfacción, se utiliza en tiendas de comercio.
cuando las poblaciones pertenecen a distintas regiones. Por ejemplo, el impacto de
la reforma a nivel nacional.

Forma parte del muestreo no probabilístico


Muestreo bola de nieve
Muestreo conglomerado
Muestreo por cuotas
Muestreo sistemático

Criterio habitual para para definir conglomerados


Geográfico
Muestra seleccionada previamente
Factor
Analitico estadístico
A menudo, el muestreo por conglomerados se lleva a cabo en más de una
muestra
Verdadero
Falso

En el muestreo de una sola etapa...


Se realiza una sola muestra al final de la investigación
Se realizan dos etapas
Se realiza la muestra una sola vez

El Muestreo Conglomerado se utiliza cuando los grupos son muy


heterogéneos y no existen muchas diferencias entre conglomerados
Falso
Verdadero

corremos un riesgo importante: que los conglomerados no sean realmente


homogéneos entre ellos...
Verdadero
Falso

Ventaja del muestreo conglomerado


Datos muy precisos
Se realiza de manera automatica
Ahorras tiempo, dinero y esfuerzo
Tienes que abarcar un gran sector de población

¿El muestreo aleatorio simple es como una rifa?


Verdadero
Falso

¿El muestreo por conveniencia es cuando el investigador elige el muestreo a


su beneficio?
verdadero
Falso

Corresponde a una técnica para seleccionar los elementos de una muestra.


Tabla de números aleatorios
Población
Estratos
Marco de Muestreo

Una muestra es aleatoria cuando las unidades se seleccionan según una de


las siguientes opciones
De tal manera que todas las unidades tengan la misma probabilidad de selección.
Por cuotas
Por conveniencia
A través de un censo cuidadosamente planeado

Muestreo Probabilístico
En este método la persona por experiencia y capacidad selecciona a los individuos
u otros elementos de la población.
En este método los elementos se selecciona por conveniencia.
Es aquel en que cada uno de los elementos de la población objeto de estudio,
tienen una probabilidad matemática conocida para ser elegido en la muestra.
Es un método para seleccionar la muestra.

Los elementos que reportan la información y sobre los cuales se realizan las
mediciones de las variables en un estudio sobre inferencia estadística
corresponde a
Error del muestreo
Las unidades de muestreo
El marco de muestreo
Las unidades de observación

Elija la afirmación correcta sobre la teoría de muestreo.


El muestreo aleatorio simple es normalmente el mas económico en la práctica.
El uso del muestreo no aleatorio se debe preferir por muestreo aleatorio en un
estudio por muestreo.
La población de estudio es aquella de la que finalmente se extrae una muestra
aleatoria.
El sesgo de selección es la diferencia existente entre la población de estudio y la
muestra.

Es un conjunto de sujetos o elementos que presentan características


comunes.
Población estadística
Muestra estadística
Población finita
Población infinita

Un estudio sobre la efectividad de un fármaco llega a la conclusión de que


éste es mejor que el placebo con p<0,05 ¿Cuál es la interpretación correcta
de este resultado?
Con toda seguridad, el tratamiento es mejor que el placebo.
La probabilidad de que el nuevo tratamiento sea mejor que el placebo es superior
al 95%.cEl tratamiento es un 95% más efectivo que el placebo.
El tratamiento es un 95% más efectivo que el placebo.
La probabilidad de que el placebo sea mejor que el nuevo fármaco es menor de
5%.
Si el tratamiento no fuese efectivo, existe menos del 5% de probabilidad de
observar unas muestras tan contrarias a dicha hipótesis como las obtenidas.

Prueba de hipótesis de medias, para una muestra menor de 30.

normal z
t de Student
F de Fisher
binomial z

Distribución que consiste en una prueba de hipótesis medias, para una


muestra grande

normal z
t de Student
F de Fisher
binomial z

Es el número de individuos que constituyen la población. Según el número


de sujetos, el tamaño puede ser finito o infinito
Tamaño poblacional
Población finita
Población infinita
Muestra estadística

Tipos de muestreo
Probabiistico y aleatorio
No probabilistico
Probabilístico y no probabilístico
Ninguno

Muestreo por cuotas:


Probabilístico
No probabilístico
Estatificado
No estratificado

Muestreo Bola de Nieve


No probabilistico
Probabilistico
Estatificado
No estratificado

Muestreo aleatorio sistemático


No probabilistico
Probabilistico
Estratificado
No estratificado
Muestreo aleatorio por conglomerados
Estratificado
No estratificado
Probabilístico
No probabilístico

Se considera como una selección de elementos para conocer algo sobre una
población.
Población
Selección
Muestra
Monstruo

Son los tres puntos más importantes al determinar un muestreo.


Representabilidad, error y tamaño
Tamaño, impacto y propósito
Error, tamaño e impacto
Tamaño, propósito y selección

Cuál es la utilidad de la prueba t de student para muestras relacionadas?


Comparar una característica de una sola muestra pero en dos circunstancias distintas

De acuerdo al resultado obtenido en la prueba t de student para muestras


relacionadas que obtuviste en Excel:
La diferencia entre ambas calificaciones es significativa debido a que el valor de
significancia es menor 0.05 por lo tanto se acepta la hipótesis alterna es decir la
intervención educativa fue efectiva

Errores pueden clasificarse en dos tipos: Sistemático y aleatorio

• En qué consiste la prueba de bondad de ajuste:


Se utiliza para la comparación de la distribución de una muestra con alguna distribució n
teórica que se supone describe a la población de la cual se extrajo

• Fue y en qué año se propuso lo que se conoce actualmente como el test de chi
cuadrado?
Karl pearson 1900

• Si se trabaja con un 95% de confianza Eso quiere decir que Alfa es:
0,05

• Sexo sistólica significancia H 11 4,8 181818


m 11 2,1 363636
Qué resultado obtuviste?
0, 265

• Qué es simétrico en el intervalo de confianza?


Qué es la misma distancia

• Se aplicó una estrategia de enseñanza a un grupo para ver si se podía mejorar


el aprendizaje de una asignatura específica. Al aplicarse el examen
departamental la calificación del grupo fue de 8 y el promedio normal de años
anteriores es de 7.8. Al aplicar el estadístico de prueba se obtiene un valor de 3.4
437 y el valor de la tabla es de 3.373. La interpretación es:
Hay evidencia suficiente para decir que la estrategia mejora al aprendizaje

• Que es una estimación?


Una aproximación

Sexo Significancia sistólica H M


baja 1 4
normal 5 31
alta 5 9
Esta tabla le hice chi2 y salió:
2,4557E-06

• Qué prueba de normalidad es conveniente utilizar para muestras mayores a 30?


Kolmogorov-Smimov

• Estadísticos de prueba para comparar poblaciones con variables numéricas?


t de student

• Para probar la Ho: u=uo se utiliza el siguiente estadístico de prueba: t de student

• Estadístico(s) de prueba para comparar poblaciones con variables categóricas


X2 y Z

• Estadístico de prueba utilizado para la comparación de una media muestral


respecto a una poblacional: t de student

• Para probar la Ho: p= ρo se utiliza el siguiente estadístico de prueba: Z

• Estadístico de prueba en la que únicamente se considera una cola para la


decisión estadística: X2

• Si se desea comparar la homogeneidad de dos poblaciones con respecto a una


variable se utiliza como estadístico de prueba: X2

• En una tabla de contingencia de 2 X 2 los grados de libertad a considerar para


buscar en tablas corresponde a: 1

• Cuando se tienen varias muestras independientes de n individuos que se


clasifican respecto a una variable cualitativa y se desea conocer a partir de datos
muestrales, si provienen de la misma población se utiliza como estadístico de
prueba: X2

• Al plantear como "Hipótesis nula: Las muestras son homogéneas" , para


probarla se utilizará como estadístico de prueba: X2

• Se aplicó una estrategia lúdica a un grupo para ver si se podía mejorar el


aprendizaje de una asignatura específica. Para medir el aprendizaje su utilizará
un examen y se compararán las calificaciones numéricas del grupo con relación
a la de todos los grupos del mismo nivel que realizaron la prueba el año anterior.
El estadístico de prueba a utilizar es: T de student
• es la fórmula para calcular: X2

• Se estudió la cantidad de niños que aprobó un examen con S, B y MB y se


comparó con la cantidad de niñas que obtuvieron las mismas calificaciones. El
estadístico de prueba a utilizar corresponde a: X2

• Se estudió la cantidad de niños que aprobó un examen con S, B y MB y se


comparó con la cantidad de niñas que obtuvieron las mismas calificaciones. La
hipótesis a probar corresponde a:

• Para obtener el valor Z de tablas se requiere. Considerar el valor de α

• Condiciones para el cálculo de la t de student


Tamaño de muestra mayor a 30
Distribución normal
variable numérica

Que es riesgo alfa


Es umbral de probabilidad establecido a priori como regla de decisión

• Si el valor de Z de tablas es de -1.964 y el Zcalculado corresponde a -3.22, la


decisión estadística es: Se rechaza Ho

• Realice este ejercicio e los datos que se le brinda en Excel, de dat os que se
obtuvieron de las 50 personas encuestadas de las cuales se les pregunto
¿considera usted que ta utilizaba el cel con gran frecuencia antes de la
cuarentena?
El valor de P es? 0,254

• La elección de un sujeto es independiente de cualquier otra sería:


Muestreo aleatorio simple

Valor p que significa?


Probabilidad de observar diferencias mayores o iguales a las observadas en la muestra si
la Ho fuera cierta.

• Para qué utilizamos a chi cuadrado? Para saber si las poblaciones son homogéneas
/ ninguna

• Cuando interesa conocer la relación o Independencia entre dos variables en una


población se utiliza como estadístico de prueba: X2

• Cuál es el problema práctico de una muestra? La representatividad

• Un error estándar= intervalo de confianza al 95%? No porque sumas y restas dos


estimadores

• En qué consiste la prueba de homogeneidad? Extraer muestras independientes de


varias poblaciones y se prueba para ver si son homogéneas

• Se cuantifican las ayudas visuales que contiene el libro de texto gratuito del
cuarto año de primaria por ejemplo diafragmas fotos esquemas y mapas y se
compara con respecto a lo recomendado en otros países en los que el estándar
indica que al menos el 30% del libro contenga este tipo de ayudas visuales. El
estadístico de prueba a utilizar es: Z

• Cuál es la utilidad de la prueba t de student para muestras relacionadas?


Comparar una característica de una sola muestra pero en dos circunstancias distintas.

• Cuál de los siguientes se considera un requisito para realizar la prueba de


T student? Qué las variables a comparar tengan una distribución normal.

• Distribución de chi cuadrado se deriva de la distribución? Normal

• En la prueba de hipótesis para determinar si dos variables cualitativas


son independientes o no, se plantea de la siguiente forma:
H0= las variables son independientes H1= las variables no son independientes

• El intervalo de confianza de la media requiere: Distribución T de student

• La fórmula de intervalos de confianza es: Estimador +/- EE del estimador

• Cuál es el tipo de error que tiene un defecto del instrumento de medición?


Sistemático

• Completa la frase: el error estándar es al estimador muestral lo que la desviación


estándar es: Individuo

• Qué es validez interna? Lo hallado coincida en la muestra que se estudie.

• Al realizar lo siguiente en minitab mediante los datos del archivo de Excel, que
datos que se obtuvieron de las 50 personas encuestadas de las cuales se les
pregunto ¿es el celular el dispositivo tecnológico que mas usa con mayor
frecuencia últimamente?
Con un 95% de confianza
No se rechaza H0

• El primer paso de la investigación consiste en : Medir

• 5. La "t" de student es el estadístico de prueba utilizado en: Muestras


independientes / muestras pareadas

• Cual es chi2
Se rechaza la hipótesis nula con valor de 12

• Saque el T de student del siguiente valor:

No rechazamos la hipótesis nula

• Distribución que consiste en una prueba de hipótesis medias, para una muestra
menor de 30. T de student
• Tenemos la siguiente tabla que refleja los datos de asignaturas de religión en los
centros escolares ¿influye el tipo de colegio en la nota obtenida? Con UM
margen de error 0,05

Se rechaza hipótesis nula dado que el Chi calculado es mayor

• A qué decisión se llega cuando el valor p es mayor que el nivel de significancia.


No rechazar la hipótesis nula

• Distribución que resulta de medir una variable aleatoria continua que resulta de
la suma de varias variables independientes. Chi cuadrado

• UNA MUESTRA ES REPRESENTATIVA CUANTO SE OBTIENE DE UN MUESTREO


...... aleatorio

• el intervalo de confianza es la región de: no rechazo a la hipótesis nula

• La hipótesis nula: es Ho / contradice a la hipótesis de investigación


1. Si la edad de una población sigue una distribución normal, con una media de 40
años, y la varianza de la edad es de 25, ¿cuál es aproximadamente la
probabilidad de encontrar un individuo que tenga una edad superior a 30 años e
inferior a 50?
1. >0,99999.
2. 0,025.
3. 0,95.
4. <0,001.
5. Nada de lo anterior.
2. Los pacientes que desarrollan cardiopatía isquémica (CI) habían sido previamente
diagnosticados de hipertensión con más frecuencia (odds = 1,5) que los que no
desarrollan CI. En cambio, hay un hipertenso por cada nueve personas sin
hipertensión entre los que no desarrollan cardiopatía isquémica. Si el riesgo de
desarrollar cardiopatía isquémica a lo largo de la vida es del 20%, ¿qué porcentaje
de los hipertensos desarrollarán cardiopatía isquémica?
1. 0,6%.
2. 20%.
3. 80%.
4. Es imposible calcularlo con estos datos.
5. Nada de lo anterior.
Enunciado común para las preguntas 3-5. En un estudio llevado a cabo por Henquet
et al. y publicado en la revista BMJ en 2005, se valora, tras 4 años de seguimiento, si
la exposición a cannabis se asocia o no al desarrollo de síntomas psicóticos

3. La probabilidad marginal de padecer algún síntoma psicótico es:


1. 0,21.
2. 0,17.
3. 0,19.
4. 0,13.
5. Nada de lo anterior.
4. La probabilidad de padecer algún síntoma psicótico condicionada a haber fumado
cannabis ≥5 veces en la vida es:
1. 0,033.
2. 0,19.
3. 0,256.
4. 0,345.
5. Nada de lo anterior.
5. La odds de padecer algún síntoma psicótico condicionada a NO haber fumado
nunca cannabis es:
1. 0,33.
2. 1/5,26.
3. 1/0,19.
4. 0,45.
5. Nada de lo anterior
6. Se mide el IMC de todos los niños de un colegio y se obtiene una media de 21
kg/m2 y una desviación estándar de 3,1 kg/m2. Asumiendo que la variable IMC
siguiese una distribución normal, ¿entre qué dos valores de IMC estaría
aproximadamente el 90% central de los niños de ese colegio?
1. Entre 20,7 y 21,3 kg/m2.
2. Entre 15,9 y 26,1 kg/m2.
3. Entre 20,5 y 21,5 kg/m2.
4. Entre 16,9 y 21,8 kg/m2.
5. Entre 14,8 y 27,2 kg/m2.
Enunciado común para las preguntas 7-8. Se compara el diagnóstico clínico de
úlcera gastroduodenal y su hallazgo en la autopsia en una serie de 10.000 pacientes.
Al comenzar a analizar los datos, se construye la siguiente tabla:

7. De las siguientes cifras, ¿cuál es la más cercana a la probabilidad (en %) de


obtener un diagnóstico clínico de úlcera condicionada a que la autopsia hubiese
sido positiva?
1. 3%.
2. 43%.
3. 87%.
4. 98%.
5. 100%.
8. Si se considera que la autopsia proporciona la verdad sobre la presencia de
úlcera, ¿cuánto valdría aproximadamente el factor Bayes para un diagnóstico clínico
positivo?
1. 210.
2. 3/197.
3. 50,22.
4. 32,3.
5. 0,76.
9. ¿Cuál es la probabilidad de encontrar 90 o más pacientes nuevos de una
enfermedad rara en una población de 2.500 habitantes en la que se esperaba
observar 70 casos?
1. Únicamente es posible aplicar la binomial. En Excel: =DISTR.BINOM(90;2,5;0,7;
verdadero).
2. Se puede usar tanto la binomial como la Poisson, pero no puede usarse la
aproximación normal. 3. Se puede usar sólo la Poisson, ya que no nos dan el valor
de n, y para calcular la binomial hace falta n.
4. Podemos aproximarnos a la distribución de Poisson usando la normal y
obteniendo una z = +2,39.
5. Nada de lo anterior es correcto.

10. Si en un grupo de 400 pacientes la media de la hemoglobina es 14 g/l y su


desviación estándar es 2, ¿cuál es la probabilidad de encontrar un paciente que
tenga un valor de hemoglobina superior o igual a 18 g/l?
1. 0,028.
2. El correspondiente a un valor z = +2.
3. 1) y 2) son ciertas.
4. 0,001.
5. Faltan datos para contestar.
Enunciado común para las preguntas 11-15. A una muestra de 8.000 mujeres se les
realiza una mamografía. La probabilidad de que la mamografía dé positiva si tienen
cáncer de mama es del 83%, y la probabilidad de que la mamografía resulte negativa
condicionada a no tener cáncer de mama es del 95%. Si se asume que de cada
1.000.000 mujeres hay 8.125 que realmente tienen cáncer de mama:
11. ¿Cuál es la probabilidad marginal de no tener cáncer de mama?
1. 0,942.
2. 0,992.
3. 0,943.
4. 0,049.
5. 0,052.
12. ¿Cuál es la probabilidad de no tener cáncer de mama condicionada a que la
mamografía resulte negativa?
1. 0,99.
2. 0,126.
3. 0,136.
4. 4,9.
5. Ninguna de las anteriores
13. ¿Cuál es el factor Bayes para una mamografía positiva?
1. 15,2.
2. 54.
3. 64%.
4. 16,6.
5. 0,87
14. ¿Cuál es la odds previa de desarrollar cáncer de mama?
1. 0,0082.
2. 1/0,0082.
3. p(CM | nCM).
4. 0,00145.
5. 0,059.
15. ¿Cuál es la odds posterior (a un test positivo) de desarrollar cáncer de mama?
1. 0,88.
2. 0,88/0,12.
3. 0,137.
4. 0,67.
5. 0,12.
16. En una población del norte de Europa, el 33% de los habitantes sufren depresión.
El 45% de los depresivos come menos de cinco piezas de fruta a la semana; en
cambio, entre los no depresivos, únicamente el 15% come menos de cinco piezas de
fruta a la semana. ¿Cuál es la probabilidad de que una persona que come menos de
cinco piezas de fruta a la semana tenga depresión? Aplique el teorema de Bayes.
1. 40%.
2. 45%.
3. 65%.
4. 55%.
5. 60%.
17. ¿Qué devuelve STATA cuando se ejecuta display normal ( –1.89)?
1. El valor z correspondiente a ese valor (x).
2. La distancia (medida en número de desviaciones estándar) a la que se
encuentra ese valor de la media.
3. El porcentaje de valores inferiores a z = 1,89 en una distribución normal perfecta.
4. La probabilidad de estar a 1,89 o más desviaciones estándar por debajo de la
media en una distribución normal.
5. Un área bajo la curva correspondiente a 1 − 0,89 = 0,11.
18. ¿Cómo se interpreta el valor −1,175 que devuelve STATA cuando se le pide
display invnormal(0.12)?
1. Hay un 12% de los valores que están al menos a 1,175 desviaciones estándar
por debajo de la media.
2. El 76% de los valores están en el rango comprendido por la media ±1,175
desviaciones estándar.
3. El 88% de valores están por encima del valor z = −1,175.
4. La probabilidad de encontrar un valor separado (en uno u otro sentido) 1,175 o
más desviaciones estándar de la media es del 0,24.
5. Todas las anteriores.
19. En una población el glaucoma tiene una incidencia del 2%. ¿Cuál es la
probabilidad exacta de encontrar un sujeto con glaucoma en una muestra aleatoria
de tamaño n = 200
1. di poisson(4,1).
2. di poissonp(4,1).
3. di binomialp(200,1,4).
4. di binomial(200,1,0.02).
5. di binomialp(200,1,0.02).
Enunciado común para las preguntas 20-23. Se han registrado un total de 3.700
accidentes de tráfico. Había 2.600 accidentados que no habían consumido drogas.
Sin embargo, iban a más velocidad de la permitida 3.150 conductores, de los cuales
783, además, también habían consumido drogas.
20. ¿Cuál es la probabilidad de que un conductor no hubiese consumido drogas ni
que tampoco condujese a más velocidad de la permitida?
1. 0,063.
2. 0,083.
3. 0,073.
4. 0,94.
5. Nada de lo anterior
21. ¿Cuál es la probabilidad de que un conductor hubiese consumido drogas pero
condujese a la velocidad permitida?
1. 0,063.
2. 0,086.
3. 0,09.
4. 0,5.
5. Nada de lo anterior.
22. ¿Cuál es la probabilidad de que un conductor hubiese consumido drogas o
condujese a más velocidad de la permitida?
1. 0,063.
2. 0,083.
3. 0,21.
4. 0,94.
5. Nada de lo anterior.
23. ¿Ir drogado e ir a más velocidad de la permitida son sucesos independientes?
1. Sí, porque la probabilidad condicionada es igual a la marginal.
2. Sí, porque p(D | V) ≈ p(D | nV).
3. Sí, porque ir a más velocidad no influye sobre haberse drogado.
4. No, puesto que p(D | V) ≠ p(D).
5. Sí, puesto que .
24. Si en un estudio donde la probabilidad marginal de fumar es del 23,5%, el 20% de
los hombres fuma y el 25% de las mujeres fuma. ¿Cuál es la proporción de hombres
del estudio?
1. 70%.
2. 40-60%.
3. 35%.
4. 30%.
5. No lo podemos saber.
25. El 33% de las personas de una población tiene hipertensión. ¿Cómo se obtendría
con STATA la probabilidad de encontrar al menos ocho hipertensos de 30 personas
seleccionadas al azar?
1. di binomialp(30,7,0.33).
2. di 1-binomial(0.33,30,8).
3. di binomial(30,8,0.33).
4. di binomial(30,7,0.33).
5. di 1-binomial(30,7,0.33)
26. Si en STATA se ejecuta la orden sktest peso y se obtiene la siguiente salida:.
1. El test de normalidad resultó significativo: Pr(skewness) = 0,5398; por tanto, la
variable peso sigue una distribución normal.
2. El test de normalidad no es significativo (p = 0,3); por tanto, no se puede asumir
que la variable peso siga una distribución normal.
3. Como el valor p es significativo [Pr(skewness) = 0,5398], se asume que la
variable peso sigue una distribución normal.
4. Como p > 0,05, no hay evidencia para rechazar la hipótesis nula de normalidad.
5. Como p > 0,05, no hay evidencia para rechazar la hipótesis nula; por tanto, no
puede asumirse que la variable peso siga una distribución normal

________________________________________________________________________
1. Se estudia un nuevo método de menor coste para valorar la concentraci ón de un
biomarcador en plasma. Para ello se comparan los resultados con la técnica de
referencia, más laboriosa, compleja y costosa. Indique cuál es la afirmación
verdadera:
1. Si la nueva prueba mide valores que son un 30% superiores a la técnica de ref erencia,
se trata de un error de precisión.
2. Si las mediciones obtenidas con la nueva técnica tienen un coeficiente de variación del
50% intersujetos, a la nueva técnica le faltará validez.
3. Para obtener el coeficiente de variación es preciso dividir la varianza entre la media de
las mediciones.
4. La presencia de errores sistemáticos implica una falta de precisión.
5. Todas son falsas.

2. Indique la respuesta verdadera:


1. El coeficiente de variación no es una medida útil para valorar errores aleatorios.
2. Un coeficiente de variación elevado implica la ausencia de validez.
3. Una falta de validez conlleva obligatoriamente una falta de precisión.
4. Un bajo coeficiente de variación intrasujetos no es indicativo de falta de precisión.
5. Todas las afirmaciones son verdaderas.

3. Indique cuál es la afirmación verdadera:


1. La estadística estudia y ofrece métodos para valorar la validez externa de los estudios.
2. La epidemiología estudia y ofrece métodos para valorar la validez interna de los
estudios.
3. El error de muestreo es sistemático.
4. Para valorar la validez externa de un estudio debe aplicarse el conocimiento biológico
sobre el objeto y las asociaciones de estudio y, por tanto, no siempre la ausencia de
representatividad implica la ausencia de validez externa.
5. Todas las afirmaciones son verdaderas.

4. Indique la afirmación FALSA sobre la aleatorización (randomization):


1. Implica que se distribuye la muestra del estudio al azar en dos o más grupos.
2. Tras una aleatorización simple 1:1, los grupos presentarán un número exactamente
similar de sujetos.
3. Se aplica en los ensayos clínicos.
4. La aleatorización de 100 sujetos en cinco grupos (placebo y cinco dosis diferentes) en
un ensayo clínico garantiza que los grupos sean similares y, por tanto, los sujetos en cada
uno de los grupos únicamente se diferenciarán en la intervención aplicada.
5. Es equivalente a la selección aleatoria de una muestra.

5. En relación con los intervalos de confianza, indique cuál es la afirmación FALSA:


1. El intervalo de confianza contiene una serie de valores que se confía en que contengan
el verdadero parámetro poblacional.
2. Para calcular el intervalo de confianza es preciso calcular en la muestra el estimador
apropiado y el error estándar.
3. El error estándar empleado para calcular intervalos de confianza y contrastes de
hipótesis es un indicador de la variabilidad de los individuos.
4. Un intervalo de confianza al 95% se suele obtener al restar y sumar el error estándar
multiplicado por 1,96.
5. Para calcular un intervalo de confianza al 90% se suele restar y sumar el error estándar
multiplicado por 1,645.

6. Se está estudiando si los traumatismos craneales incrementan el riesgo de


desarrollar demencia. ¿Cuál de las siguientes afirmaciones es FALSA?
1. La hipótesis nula (H0) es que los traumatismos craneales no incrementan el riesgo de
presentar demencia.
2. Un error tipo 2 consiste en concluir que los traumatismos craneales no incrementan el
riesgo de demencia cuando fuese cierto que sí lo incrementan, y su probabilidad equivale
a la potencia.
3. La hipótesis alternativa (H1) es que los traumatismos craneales incrementan el riesgo
de presentar demencia.
4. Un error tipo 1 consiste en concluir que los traumatismos craneales incrementan el
riesgo de demencia cuando esto fuese falso y su probabilidad equivale a α.
5. Para poder rechazar la hipótesis nula, el valor de p debe ser inferior a α.

7. Indique la afirmación verdadera al valorar los resultados de un estudio:


1. Se rechaza la hipótesis nula y se acepta la hipótesis alternativa cuando el valor de p
obtenido es inferior a α, independientemente del número de comparaciones.
2. En general, está indicado realizar test estadísticos a una cola.
3. El intervalo de confianza ofrece información sobre la significación estadística y la
potencia estadística del estudio.
4. Al aumentar la confianza, se estrechará un intervalo de confianza.
5. Los valores p suelen ser más informativos que los intervalos de confianza.

8. Sobre el valor p, indique la afirmación FALSA.


1. El valor p depende del tamaño de la muestra.
2. El valor p depende de la magnitud del efecto.
3. El valor p no indica si los resultados son clínicamente significativos.
4. El valor p indica la probabilidad de que la hipótesis nula sea FALSA.
5. El valor p no es directamente indicativo de la magnitud del efecto hallado.

9. Un artículo de una revista científica informa de que el intervalo de confianza al


95% del nivel medio de colesterolemia en los adultos atendidos en un centro de
salud es 192-208. Se aceptó que la variable tenía una distribución normal y el
número de pacientes estudiados fue 100. ¿Cuál de las siguientes afirmaciones es
FALSA?
1. La confianza de que el nivel medio poblacional esté comprendido entre 192 y 208 es del
95%.
2. Si la media poblacional coincidiese con la muestral y se repitiese el estudio muchas
veces, en un 95% de ellas se obtendría una media muestral comprendida entre 192 y 208.
3. El 95% de los adultos de la población tiene un nivel de colesterolemia comprendido
entre 192-208.
4. La media muestral encontrada en el estudio es de 200.
5. La desviación típica muestral encontrada en el estudio es aproximadamente 40.

10. Se trató con un suplemento dietético más dieta a 15 pacientes con insuficiencia
renal, y solamente con dieta a 16. Se compararon entre ambos grupos unas 100
variables y en seis de tales comparaciones se encontraron diferencias significativas,
para el nivel nominal del 5%, a favor del suplemento. ¿Cómo interpretaría estos
resultados?
1. El estudio parece no concluyente, ya que con tantas comparaciones es esperable que
unas pocas resulten significativas para el nivel nominal del 5%, aunque no haya diferencia
entre los tratamientos.
2. El suplemento dietético es moderadamente eficaz.
3. Este estudio no demuestra nada, ya que a priori se sabe que la hipótesis nula es cierta.
4. Aunque el número de pacientes fuese pequeño, lo inocuo del tratamiento y la
consistencia de los resultados aconsejan prescribir el suplemento en la insuficiencia renal.
5. Este estudio no demuestra nada, ya que hay más variables que pacientes.

11. En un ensayo clínico se asignaron 132 pacientes con linfoma no hodgkiniano a


dos pautas distintas de tratamiento. Con una de ellas se obtuvo un 64% de
remisiones y con la otra un 63%. Los límites del intervalo de confianza al 95% de la
reducción del riesgo absoluto oscilaron entre –19,8 y 15,5%. ¿Cómo interpretaría
usted este resultado?
1. El estudio ha demostrado que ambos tratamientos son similares.
2. El estudio ha demostrado que uno de los tratamientos es superior.
3. El estudio no ha sido capaz de dilucidar si alguno de los tratamientos es superior.
4. El estudio es ininterpretable, ya que no indica si las diferencias son estadísticamente
significativas.
5. El estudio es ininterpretable sin conocer si se hizo a doble ciego o no.

12. Se comparan dos tratamientos A y B. El valor p de significación estadística (a


dos colas) resulta ser p = 0,09. ¿Cuál es la interpretación?
1. Se ha demostrado la igualdad de ambos tratamientos, pues las diferencias no son
estadísticamente significativas.
2. El intervalo de confianza para la diferencia entre A y B excluirá el valor 0.
3. La hipótesis nula tiene una baja probabilidad de ser verdad; esta probabilidad es del 9%.
4. Si se hubiese usado un test a una cola (poco aconsejable), el resultado probablemente
sería significativo.
5. Hay un 91% de probabilidades de que uno de los dos tratamientos sea mejor.

________________________________________________________________________

1. Un grupo de investigación en oftalmología desea comparar dos tip os de colirios


administrando uno en cada ojo de un mismo paciente. Señale el test estadístico más
apropiado que debería emplearse en este estudio.
1. Test de la ji cuadrado (χ2) de Pearson.
2. Test de la χ2 de tendencia lineal.
3. Test exacto de Fisher.
4. Test de la t de Student.
5. Test de McNemar.

2. Se desea comparar si la existencia de deterioro del estado general en una serie de


pacientes con cáncer de próstata [Columnas: 1 (sí); 2 (no)] difiere en función de que
se hayan desarrollado o no metástasis [Filas: 1 (sí); 2 (no)]. Se hace un análisis
estadístico con el programa STATA y el resultado es:

¿Cuál es la interpretación más adecuada de este resultado?


1. Las diferencias no son estadísticamente significativas y, por tanto, el mayor deterioro del
estado general de los pacientes con metástasis es debido al azar.
2. Si el hecho de tener metástasis influyera en el deterioro del estado general de un
paciente, la probabilidad de encontrar estos resultados sería del 5,7%.
3. El porcentaje de pacientes sin metástasis que tienen deterioro del estado general es
inferior al 6%.
4. La probabilidad de que las metástasis no tengan influencia en el deterioro del estado
general es del 5,7%.
5. Si las metástasis y el deterioro del estado general no estuviesen relacionados, la
probabilidad de encontrar estos resultados u otros todavía más alejados de la hipótesis
nula sería del 5,7%.

3. ¿Cuál de las condiciones siguientes debe cumplirse en la comparación de una


proporción entre más de dos grupos, en la que se aplicará el test de la χ2?
1. Que no haya ninguna casilla con un valor esperado por debajo de 5.
2. Que el 90% de los valores esperados estén por encima de 5.
3. Que el 80% de los valores esperados estén por encima de 5.
4. Ninguna es verdadera.
5. Todas pueden ser ciertas, en función de la situación.

4. ¿De cuántos grados de libertad consta una tabla de contingencia en la que se


compara una proporción entre tres grupos?
1. Un grado de libertad.
2. Dos grados de libertad.
3. Ningún grado de libertad.
4. No puede saberse, porque no se ofrece suficiente información.
5. Seis grados de libertad.

5. ¿Cuál es el test estadístico que debería utilizarse para comparar las proporciones
de pacientes con cáncer de pulmón entre cinco categorías de pacientes en función
de su consumo de cannabis (nunca lo han probado; menos de 5 veces; de 5-50
veces; más de 50 veces, pero no a diario; fuman a diario)?
1. Test exacto de Fisher.
2. Test de tendencia lineal.
3. Test de la χ2 de Pearson.
4. Test de McNemar.
5. Ninguno.

6. Al estudiar los factores de riesgo del cáncer de cuello uterino en mujeres de la


India se encontró una mayor frecuencia de relaciones sexuales extramaritales en las
mujeres con este cáncer (n = 134) que en los controles sanos (n = 134). Si los casos
y controles no se buscaron por parejas, sino separadamente, ¿qué método
estadístico es más adecuado para tratar estos datos?
1. χ2 de Pearson.
2. Test de McNemar.
3. U de Mann-Whitney.
4. Test de Friedman.
5. Test de la t de Student para medidas repetidas.

7. Los datos del estudio de los factores de riesgo del cáncer de cuello uterino en
mujeres de la India (v. cuestión 6) se muestran en la siguiente tabla generada
mediante el programa STATA:
Columnas: 1 (casos), 2 (controles); filas: 1 (relaciones extramaritales), 2 (sin
relaciones extramaritales).
Calcule el valor del test más adecuado teniendo en cuenta que no existe
emparejamiento entre casos y controles.
1. 6,74.
2. 12,7.
3. 81,92.
4. 105,3.
5. 2,032.

8. En un estudio de casos y controles sobre anticonceptivos orales e infarto de


miocardio en mujeres de 30 a 45 años, para cada caso de infarto se ha buscado otra
mujer control de la misma edad. Se averigua su exposición a anticonceptivos orales.
¿Cuál es el valor del test de la χ2 de McNemar?
1. χ2 = 0,16.
2. χ2= 0,45.
3. χ2= 63,9.
4. χ2= 71,8.
5. χ2= 0,24.

9. Un grupo de pacientes con déficit inmunitario ingresados en tres plantas distintas


de un hospital presentan la siguiente distribución de infección oportunista:
¿Es estadísticamente significativa la diferencia ob servada?
1. Sí, ya que χ2 = 6,7 con una p < 0,05.
2. No, ya que χ2 = 1,7 con una p > 0,05.
3. Sí, ya que χ2 = 7,5 con una p < 0,01.
4. No, ya que χ2 = 2,92 con una p > 0,05.
5. Sí, ya que χ2 = 0,56 con una p < 0,01.

10. En un estudio de casos y controles sobre leucemia y exposición a benceno, para


cada caso de leucemia se ha buscado un control de la misma edad y sexo. Se
averigua su exposición a benceno. En la siguiente tabla, ¿cuál es el valor del test de
la χ2 de McNemar?
1. χ2= 1,29.
2. χ2= 2,77.
3. χ2= 3,48.
4. χ2= 4,66.
5. χ2= 7,23.

Enunciado común para las preguntas 11-15. Se ha obtenido con STATA el siguiente
resultado al relacionar el consumo de alcohol (1 = bebedores, 0 = abstemios) con el
riesgo de enfermedad cardiovascular (ECV , 1 = sí, 0 = no).

11. ¿A qué tipo de test estadístico pertenecen estos resultados?


1. Comparación de más de dos proporciones.
2. χ2 de tendencia lineal.
3. Test exacto de Fisher.
4. Comparación de dos proporciones emparejadas.
5. Nada de lo anterior.

12. ¿Cuánto vale la diferencia de proporciones de enfermedad cardiovascular entre


bebedores y abstemios?
1. 204-430.
2. 430-204.
3. 0,0391-0,0317.
4. 0,0391-0,0227.
5. Faltan datos para contestar.

13. Si se calculase un test de la χ2 de Pearson, ¿cuánto valdría el valor esperado


para la casilla de abstemios con enfermedad cardiovascular?
1. <5.
2. 5-50.
3. 51-100.
4. 101-500.
5. >500.

14. ¿Qué orden se ha dado a STATA para lograr este análisis?


1. di chi2tail (1,43.5017).
2. tab alcohol ECV; chi2 row.
3. tab alcohol ECV; chi2 col.
4. prtest ECV ,by (alcohol).
5. Ninguna de ellas.

15. ¿Qué orden habría que dar a STATA para lograr el intervalo de confianza al 95%
para la diferencia de proporciones de enfermedad cardiovascular entre bebedores y
abstemios?
1. di chi2tail (1,43.5017).
2. tab alcohol ECV; chi2 row.
3. tab alcohol ECV; chi2 col.
4. prtest ECV , by (alcohol).
5. Ninguna de ellas.
1. Se compara el colesterol total sérico de un grupo de obesos (grupo obeso = 1)
con el colesterol total sérico de individuos no obesos (grupo obeso = 0). El
resultado que aparece en el ordenador es:

1. Señale la interpretación correcta de los resultados:

1. Si los obesos tuviesen la misma concentración de colesterol total en sangre que los no
obesos, la probabilidad de hallar al menos tanta diferencia entre las medias de ambos
grupos como la observada sería del 2,9%.
2. La probabilidad de que los obesos no tengan la misma concentración de colesterol total
en sangre que los no obesos es del 98,55%.
3. Solo un 2,9% de la población de no obesos tiene iguales concentraciones de colester ol
sérico que la población de obesos.
4. Solo un 2,9% de la población de no obesos tiene igual o más concentración de
colesterol sérico que la población de obesos.
5. Solo en un 2,9% de las muestras tomadas de una población donde la mitad fuesen
obesos y la otra mitad no lo fuesen, se encontrarían tales o mayores diferencias en la
concentración de colesterol sérico.

2. En un ensayo clínico, a una serie de pacientes (n = 200) se les trata con un nuevo
fármaco para estudiar si, en un período de tiempo después de la administración de
dicho fármaco, el nivel de ácido úrico en sangre (mg/dl) ha disminuido. Para este
diseño, ¿cuál es la prueba estadística de elección?
1. t de Student para muestras independientes.
2. Test de Wilcoxon.
3. t de Student para muestras relacionadas.
4. U de Mann-Whitney.
5. Es imprescindible comprobar la normalidad de la variable ácido úrico para contestar a
esta pregunta.

3. Se desea saber si los niveles de adhesión a la dieta mediterránea (bajo/medio/alto)


son iguales entre una muestra de sujetos hipertensos (n = 55) y una muestra de
controles no hipertensos extraídos de la población general (n = 110). ¿Qué prueba
estadística se empleará?
1. U de Mann-Whitney.
2. t de Student para muestras relacionadas.
3. Test de Wilcoxon.
4. t de Student para muestras independientes.
5. Es imprescindible comprobar la normalidad de la variable dependiente para contestar a
esta pregunta.

4. Se compara la tensión arterial sistólica (mmHg) en unos pacientes (n = 20)


asignados para seguir un programa de cambios en el estilo de vida al inicio del
estudio y al cabo de 3 meses. Para analizar los datos emplearemos:
1. U de Mann-Whitney.
2. t de Student para muestras relacionadas.
3. Test de Wilcoxon.
4. t de Student para muestras independientes.
5. Es imprescindible comprobar antes la normalidad de la variable tensión arterial sistólica
para poder contestar a esta pregunta.

Las preguntas 5-10 se refieren a los siguientes datos: se desea determinar si existen
diferencias entre la media de índice de masa corporal (IMC) en una muestra de 500
sujetos en función de la variable estado civil (1 = casado/2 = no casado). Asumiendo
que la variable IMC sigue una distribución normal, y tras comprobar que las
varianzas son homogéneas, se obtiene la siguiente tabla en STATA.

5. En la comparación anterior, si se emplease un test paramétrico, ¿cuántos grados


de libertad tendría?
1. 289.
2. 209.
3. 499.
4. 498.
5. Nada de lo anterior.

6. ¿Cuál sería el test indicado?


1. U de Mann-Whitney.
2. t de Student para muestras relacionadas.
3. Test de Wilcoxon.
4. t de Student para muestras independientes.
5. Ninguno de los anteriores.

Con los datos de la pregunta anterior se ha obtenido el siguiente listado con STATA,
donde se han sustituido algunas de las cantidades del resultado por letras.
7. ¿Cuánto vale a?
1. 0,29.
2. 10,22.
3. 3,20.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.

8. ¿Cuánto vale b?
1. 2,35.
2. 6,14.
3. 1,21.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.

9. ¿Cuánto vale c?
1. 2,35.
2. 6,14.
3. 1,21.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.

10. ¿Cuánto vale d?


1. 2,35.
2. 6,14.
3. 1,21.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.

Enunciado común para las preguntas 11-12: se desea comparar si una determinada
mutación (mutado = 1 si tiene la mutación y mutado = 0 si no la tiene) se asocia a
consumir un mayor porcentaje de grasa en la dieta (grasa = % de calorías que
proceden de grasa). No se puede asumir la normalidad. Hay 25 sujetos mutados y 40
no mutados en la muestra. Se han obtenido los siguientes resultados con STATA:
11. Se deberá aplicar:
1. U de Mann-Whitney.
2. t de Student para muestras relacionadas.
3. Test de Wilcoxon.
4. t de Student para muestras independientes.
5. Ninguno de los anteriores.

12. Se concluirá que:


1. Hay diferencias estadísticamente significativas (z = –5,15) y podrá concluirse que
consumen significativamente mayor porcentaje de grasa los mutados que los no mutados.
2. Las diferencias se aproximan a la significación estadística (p = 0,121), pero no llegan a
estar por debajo del 5%, y por eso el intervalo de confianza al 95% incluirá el valor nulo.
3. No hay evidencias para rechazar la hipótesis nula de igualdad de medias.
4. El intervalo de confianza al 95% indica que los mutados consumen entre un 3,7 y un
6,9% más de grasa, con diferencias estadísticamente significativas (t = –6,7).
5. Los no mutados consumen significativamente más grasa, con p < 0,0001 (z = –7,026),
de modo que, si las poblaciones de mutados y no mutados consumiesen realmente
idéntico porcentaje de grasas, habría una probabilidad inferior al 0,01% de observar estas
diferencias u otras todavía mayores.

Hipótesis exclusivas de un enfoque cuantitativo


hipótesis correlacionales
hipótesis explicativa
hipótesis estadísticas
hipótesis descriptivas

• Cuando decimos termino a priori es cuando:


a. Es un resultado medible
b. Un resultado dicotómico
c. Es un resultado no medible
d. Es un resultado politómico

• La independencia se da cuando:
a. A y B no está unidas
b. A y B están unidas
c. A y B están interceptadas
d. A y B no están interceptadas

• A que se refiere casos favorables y casos posibles:


a. Ley de Laplace
b. Ninguna
c. La probabilidad condicionada
d. La probabilidad de intersección

• El diseño mas poderoso de la investigación es


a. Cualitativo y con base cuantitativo
b. Cualitativo
c. Mixto
d. Cuantitativo

• La distribución que se trata de sucesos mutuamente excluyentes se llama:


a. Binomiales
b. Gaussiana
c. Bernoulli
d. Poisson

Cual de los siguientes enunciados es una definición correcta de población?


Característica o propiedad objeto del estudio estadístico
Los individuos que entrevistaremos al realizar un estudio estadístico
Conjunto de todos los elementos (individuos) sobre los que realiza un estudio
estadistico

• El teorema central de limite que implica en este ejemplo n=35, Media=50


desviación estándar= 4 y sale la distribución ……. Asimetría a la izquierda:
a. Que con este teorema va hacer media se mueva hacia centro
b. Que con este teorema va hacer error estándar salga menor
c. Que con este teorema va hacer desviación estándar salga mayor
d. Que con este teorema va hacer error estándar salga mayor

• Factor bayes equivale a la razón de probabilidades de presentar la condición


entre los que tiene el evento y los que no, esto es
a. Odds ratio
b. Prevalencia
c. Riesgo relativo
d. Incidencia

• El primer axioma de probabilidad es:


a. Es suceso seguro es igual a 1
b. La probabilidad es 0 a 1
c. Dos sucesos A y B son excluyentes o incompatibles
d. La probabilidad esta en 1 a 100

• Si tengo un N(0,1) tengo una media 60 y una desviación estándar de 4


encuentro en valor 70 cual es la Z de este valor?
a. 2
b. 1.8
c. 2.5
d. 1.5

• Por que en su pensmaiente puro niega toda probabilidad individual la


frecuentista
a. Por que es subjetiva
b. Por que es objetiva
c. Ninguna
d. Es teorema de Bayes
• Esta definición viene de que concepto:
Este ciclo es interativo y así va avanzando poco a poco el conocimiento:
a. Proceso de investigación
b. Medicina basada en la evidencia
c. Epidemiologia
d. Bioestadística

• A que denomina distribución de probabilidad:


a. A aquella presenta el conjunto de ciertos valores que teóricamente podría tomar
una variable
b. A aquella presenta el conjunto de todos valores que teóricamente podría tomar
una variable
c. A aquella presenta el conjunto de ciertos valores que teóricamente no podría
tomar una variable
d. A aquella no presenta el conjunto de ciertos valores que teóricamente podría
tomar una variable

• Teóricamente que significa la ley de Laplace


a. Si el dado tiene la probabilidad es 3/6
b. Probabilidad no depende de cada una de las posibles respuestas
c. Si el dado tiene la probabilidad de 1/6
d. Probabilidad de depende de cada una de las posibles respuestas

• ¿Qué es una muestra?


a. Conjunto de individuos según una característica en común
b. Conjunto de individuos según una característica en común
c. Conjunto de cosas según sus criterios
d. Conjunto de individuos con criterios

• la probabilidad de no ser diabética y tener glucosuria?

a. Es 10%
b. Es 20%
c. Es 40%
d. Es 1%

• Haciendo bayes tenemos esta tabla, cual implica B(nD/nG)= 0.85


a. Valor predictivo positivo
b. Valor predictivo negativo
c. Sensibilidad
d. especificidad

• Que significa que 170 mmhg corresponde a un valor Z= +2


Seleccione una:
a. Que valor supera a los 170 mmHg. es 2.3%
b. Que valor supera a los 170 mmHg. es 4.3%
c. Que valor Z es 3.4% inferior a 170 mmHg.
d. Que valor Z es 2.3% inferior a 170 mmHg.
• ¿Cual es la probabilidad de ser glucosuria y no tener diabetes?

a. Es 1%
b. Es 20%
c. Es 50%
d. Es 11%

• ¿Cual es la probabilidad de ser diabético y no glucosuria?


a. Es 70%
b. Es 50
c. Es 30
d. Es 80

• Si tengo una distribución con un n 30 y una probabilidad 0.05


dicotonomicamente que distribución usar:
a. Poisson
b. Gaussiana
c. Binomiales
d. Bernouilli

• El concepto a que evidencia proviene


Acumulación de pruebas cada vez mas convincentes de que un determinado factor se
asocia a un determinado efecto
a. Medicina basada en evidencia
b. Epidemiologia
c. Bioestadística
d. Proceso de investigación

• Cual es el problema practico de una muestra


a. La representatividad
b. El tamaño
c. El numero
d. La diversidad

• Los datos continuos se diferencian de los datos discretos, en que:


a. La clase de datos continuos pueden representarse por fracciones
b. Los datos discretos pueden tomar cualquier valor

• Que es simétrico el intervalo de confianza


a. Que es la misma distancia

• La formula del intervalos de confianza es:


a. Estimador +/- EE del estimador

• Las variables continuas son aquellas que admiten solamente valores…


a. Fraccionados y no enteros

• En una determinada población residen 5000 personas en el centro y 10000 en


la periferia. Se sabe que el 95% de los residentes en el centro y que el 20% de
los que viven en la periferia opina que el Ayuntamiento debería restringir el
acceso de vehículos privados al centro urbano. Se elige al azar un residente
de la población
a) ¿Cuál es la probabilidad de que esté a favor de restringir el acceso de
vehículos privados al centro de la ciudad?
0.45

B) ¿Cuál es la probabilidad de que resida en el centro y esté a favor de la


restricción de acceso?
0.317
c) Si la persona elegida opina que se debería restringir el acceso, ¿cuál es la
probabilidad de que resida en el centro de la ciudad?
0.704

• El polígono de frecuencias acumuladas se usa para representar variables:


a. cuantitativas continuas

• Si el rango es 250 y el numero de intervalo es 7, el tamaño de clase con un


decimal es:
a. 35.7

• Que es una estimación


a. una aproximación

• que es una validez interna


a. lo hallado coincida en la muestra que se estudie

• la bioestadística en que se divide


a. descriptiva y analítica

• la elección de un sujeto es independiente de cualquier otro seria:


a. muestreo aleatorio simple

• Un error estándar = intervalo de confianza al 95%


a. no porque sus sumas y restas 2 estimadores

• Un campus universitario dispone de 3000 plazas numeradas de aparcamiento


para vehículos, distribuidas en tres zonas A, B y C. La zona A está constituida
por las plazas del 1 al 1500, estando 1350 de ellas protegidas del sol. La zona
B la conforman las plazas numeradas desde 1501 a 2500, estando el 80%
protegidas del sol. La zona C contiene las plazas numeradas desde 2501
hasta 3000, estando solamente 250 protegidas del sol. Aleatoriamente se
elige una de las plazas de aparcamiento del campus.
a) (0,75 puntos) ¿Cuál es la probabilidad de que esté en la zona A o en la B? 0,83 /
83,33% / 0.8334
b) (0,75 puntos) ¿Cuál es la probabilidad de que no esté protegida del sol? 20%
c) (1 punto) Si se ha elegido una plaza protegida del sol, ¿cuál es la probabilidad de que
esté ubicada en la zona B? 33,33% / 0.3334

• De un grupo de familias considerando el numero de hijos se obtuvieron los


datos de la tabla… seleccionar la opción incorrecta
a. El 80% de las familias tienen de 0 a 4 hijos

• Completa la frase: el error estándar es al estimador muestral lo que la


desviación estándar es…
a. Individuo
• El 80% del alumnado de una determinada universidad accede a los estudios
que marca como primera opción. De ellos, el 75% termina el Grado, mientras
que sólo el 40% de los que acceden a estudios que no han marcado como
primera opción termina el Grado. Se elige un alumno al azar de esa
universidad.
a) Calcule la probabilidad de que no haya terminado el grado. 0,32
b) Calcule la probabilidad de que no accediera a los estudios marcados como primera
0,375

• En distribución normal de media 4 y desviación típica 2, el valos P(4 -A X 4+a)


= 0,5934
a. 1,66
L diferencia entre Ho se :
Ninguna
Ho dice que el evento que tiene que demostrarse
No se postula ante de hacer experimentos
Postula antes de hacer experimentos

• ¿cuál es el tipo de error que tiene un defecto del instrumento de medición?


a. Sistemático

• ¿cuál es el problema práctico de una muestra?


a. la representatividad

• el primer paso de la investigación consiste:


a. medir

• Errores pueden clasificarse en dos tipos:


Sistemático y aleatorio

• Cual de las siguientes afirmaciones sobre la muestra es incorrecta


a. Para que nuestro estudio estadístico sea válido, la muestra tiene que tener mas
elementos que la población

• La distribución de frecuencias:
a. Es un método que organiza datos

• En un centro de enseñanza secundaria el 48% de los estudiantes son chicos. El 85%


de los chicos del centro y el 82% de las chicas supera todas las asignaturas. Se elige
al azar un estudiante del centro.
a) ¿Cuál es la probabilidad de que supere todas las asignaturas? 0,8344
b) Si ha superado todas las asignaturas, ¿cuál es la probabilidad de que sea una chica?
0,511
• Distribución de alumnos por mes de nacimiento
a. Cualitativa

• El cociente de la frecuencia relativa y la muestra


Ninguna

• Errores pueden clasificarse en dos tipos


a. Sistémico y aleatorio

• En la anterior tabla se registra el numero de hijos por familia.


El promedio de hijos por familia es:
Seleccione una:
a. 4,3

• Cual de las siguientes afirmaciones acerca de los rectángulos de un


histograma es correcta:
a. Los rectángulos tienen una altura proporcional al numero de elementos que
entran en las clases

• Las variables discretas son aquellas que admiten solamente:


a. Enteros

• Cual de los siguientes métodos representa el esquema mas preciso pa ra


clasificar datos:
a. Un esquema puede ser determinado solo con información especifica acerca de
la situación

• Queremos realizar un estudio sobre los hábitos de lectura del alumno del
colegio Calasanz. Suponiendo que en cada clase hay un numero de chicos y
chicas ¿Cuál de las siguientes afirmaciones seria errónea?
a. Una muestra correcta seria elegir a los cinco alumnos y cinco alumnas con
mejor nota media de cada clase

• La grafica muestra la cantidad de personas atendidas en un centro medico


durante una semana
De acuerdo con la información de la grafica es correcto afirmar que:
a. El viernes se atendieron mas personas que el miércoles pero menos que el
jueves

1. Número de ciclos de quimioterapia administrados. Es una cantidad que no


admite decimales.
2. Fármaco antihipertensivo administrado
(diuréticos/βbloqueantes/inhibidores de la enzima de conversión de
angiotensina [IECA]/otros). No puede afirmarse a priori que un tratamiento sea
superior que otro.
3. Índice de masa corporal del paciente (peso [kg]/talla [m2]). Teóricamente
admitirá todos los decimales.
4. Antecedentes familiares de obesidad (Sí/No). Solo admite dos posibles
respuestas.
5. Nivel de seguimiento de la dieta mediterránea (bajo/medio/alto). Las
categorías se encuentran jerarquizadas u ordenadas.
6. Porcentaje de masa grasa del paciente. Admite teóricamente todos los
decimales.
7. Glucemia en sangre (mg/dl). Admite teóricamente todos los decimales.
8. Grupo sanguíneo (0/A/B/AB). No siguen un orden o jerarquía.
9. Tensión arterial sistólica (mmHg). Admite teóricamente todos los decimales
10. Estado civil (soltero/casado/viudo/divorciado/otros).
Las categorías no siguen un orden o jerarquía.
11. ¿De qué tipo de variable se trata?
1. Cualitativa nominal dicotómica.
2. Cualitativa nominal policotómica.
3. Cualitativa ordinal.
4. Cuantitativa continua.
5. Cuantitativa discreta.

12. ¿Con qué nombre se conoce al estadístico correspondiente al recuadro A?


1. Media aritmética.
2. Media geométrica.
3. Media armónica.
4. Mediana.
5. Moda

13. ¿Cuánto vale dicho estadístico A?


1. 0.
2. 1.
3. 1,5.
4. 2.
5. 2,4.

14. ¿Qué valor encontraríamos en el recuadro B?


1. 0.
2. 1.
3. 1,5.
4. 2.
5. 2,4.

15. ¿Cuánto valdría la desviación estándar (C)?


1. >0 y ≤1.
2. >1 y ≤2.
3. >2 y ≤3.
4. >3.
5. Faltan datos

16. ¿Podría calcular el valor de D?


1. 6.
2. 8.
3. 10.
4. 10,2.
5. 15,2

17. ¿Cuánto vale el error estándar de la media?


1. >0 y ≤0,5.
2. >0,5 y ≤1.
3. >1 y ≤1,5.
4. >1,5.
5. Faltan datos.

18. ¿Qué podría decir de la forma de esta distribución?


1. Es simétrica y mesocúrtica.
2. Tiene asimetría positiva y es platicúrtica.
3. Tiene asimetría positiva y es ligeramente leptocúrtica.
4. Tiene asimetría negativa y es mesocúrtica.
5. Es simétrica y platicúrtica

19. ¿Qué valor tiene el punto de corte correspondiente al cuarto quintil?


1. 5.
2. 5,8.
3. 6.
4. 10.
5. 12,8.

20. ¿Podría decir cuáles son los límites del rango intercuartílico?
1. 0-5.
2. 1-5.
3. 1-6.
4. 1-4.
5. 0-4.

21. ¿A qué concepto corresponde Obs = 15?


1. Grados de libertad.
2. Tamaño de muestra.
3. Sumatorio de las observaciones.
4. Valor a partir del cual se consideran outliers.
5. Varianza.

22. ¿Cuánto valdría el coeficiente de variación (%)?


1. >0 y ≤0,5.
2. >0,5 y ≤1.
3. >1 y ≤2.
4. >2 y ≤3.
5. >3.

23. Se recoge la edad de los participantes de un estudio de seguimiento. Al inicio


del estudio tienen una media de 45 años y una desviación estándar de 10
años. Se vuelve a preguntar la edad al cabo de 5 años (se asume que no ha
existido ninguna pérdida). ¿Qué resultados esperaría para la media y la
desviación estándar de la edad?
1. 45 y 10.
2. 50 y 15.
3. 45 y 15.
4. 50 y 10.
5. Tendría que tener los datos completos para calcularlo.

24. Se desea obtener un estimador de tendencia central de los siguientes siete


valores: 8, 16, 16, 16, 32, 64, 128 y se hace la siguiente operación: (2,08 + (3 ×
2,77) + 3,47 + 4,16 + 4,85)/7 = 3,27; después se calcula: e3,27 = 26,25. ¿Qué se
ha calculado?
1. Media aritmética.
2. Media geométrica.
3. Media armónica.
4. Transformación logarítmica.
5. Cambio de escala.
25. Leemos que una talla de 130 cm es el percentil 70 en niños de 8 años. ¿Cuál
es la interpretación correcta?
1. Hay una probabilidad del 70% de que un niño de 8 años mida 130 cm.
2. El 70% de los niños de 8 años miden por lo menos 130 cm.
3. El 70% de los niños de 8 años miden más de 130 cm.
4. El 70% de los niños de 8 años miden menos de 130 cm.
5. Hay una probabilidad del 30% de que un niño de 8 años mida 130 cm.

Enunciado común para las preguntas 26-29. La distribución de la edad se ha


representado mediante el siguiente gráfico:

26. ¿Qué nombre recibe este gráfico?


1. Es un gráfico de barra simple.
2. Es un histograma.
3. Es un gráfico de sectores.
4. Es un gráfico de caja.
5. Es un gráfico de tallo y hojas.

27. ¿Qué representa la línea horizontal que está dentro de la caja?


1. El percentil 25 o primer cuartil.
2. El percentil 50 o mediana.
3. La moda.
4. La media aritmética.
5. El tercer cuartil.

28. En este caso, el bigote superior del gráfico se sitúa en:


1. El primer cuartil más 1,5 veces el rango intercuartílico.
2. El segundo cuartil más 1,5 veces el rango intercuartílico.
3. El valor observado que sea igual o inferior al primer cuartil más 1,5 veces el rango
intercuartílico.
4. El valor observado que sea igual o superior al tercer cuartil más 1,5 veces el rango
intercuartílico, que en este caso coincide con el valor máximo observado.
5. El valor máximo observado.

29. ¿Qué porcentaje de la muestra se encuentra situado dentro de los dos límites
de la caja? 1. El 25%.
2. El 50%.
3. El 75%.
4. Toda la muestra.
5. Es imposible saberlo

30. Se obtuvieron los siguientes resultados de una distribución de frecuencias en


STATA.
¿Cuánto vale el percentil 75?
1. 70.
2. 65.
3. 75.
4. 67,5.
5. 68

1. Los pesos corporales (kg) en un grupo de pacientes son:

1. Tabule para hacer un histograma.

2. Dibuje el histograma.
3. Represente un gráfico de tallo y hojas.

2. Se han tomado las edades de 10 pacientes. Calcule la media aritmética, la


media geométrica, la media armónica, la mediana y la moda.

Media X = 43.1
Media geométrica: 39.6
Media armónica: 36.1
Mediana: el valor central del conjunto ordenado de los datos. Al ser 10
observaciones, la mediana sería la media de la 5.ª y la 6.ª observación. Como
ambas son 44, la mediana = 44. Moda: se trata de una distribución bimodal.
Las modas (los valores que más se repiten) son 44 y 46

2. Se presenta en el gráfico a continuación la incidencia (casos nuevos) de


una determinada enfermedad en los últimos 4 años. Interpret e el gráfico.
¿Qué podría decirse acerca de la aparente epidemia de esta enfermedad?
En este gráfico de barras se representa la incidencia de una enfermedad a lo largo
de los últimos 4 años. A simple vista, parece que los casos se duplican de año
en año. Sin embargo, fijándose en el eje de ordenadas, se puede observar que
empieza en 100.000, con lo cual esos aparentes incrementos en la incidencia
no son de tanta magnitud como parecen a primera vista. Si se representase
correctamente la gráfica, empezando el eje de ordenadas en 0, podría verse
que, aunque los casos han aumentado, este aumento es muy pequeño.
1. Si la edad de una población sigue una distribución normal, con una media de 40
años, y la varianza de la edad es de 25, ¿cuál es aproximadamente la
probabilidad de encontrar un individuo que tenga una edad superior a 30 años e
inferior a 50?
1. >0,99999.
2. 0,025.
3. 0,95.
4. <0,001.
5. Nada de lo anterior.
2. Los pacientes que desarrollan cardiopatía isquémica (CI) habían sido previamente
diagnosticados de hipertensión con más frecuencia (odds = 1,5) que los que no
desarrollan CI. En cambio, hay un hipertenso por cada nueve personas sin
hipertensión entre los que no desarrollan cardiopatía isquémica. Si el riesgo de
desarrollar cardiopatía isquémica a lo largo de la vida es del 20%, ¿qué porcentaje
de los hipertensos desarrollarán cardiopatía isquémica?
1. 0,6%.
2. 20%.
3. 80%.
4. Es imposible calcularlo con estos datos.
5. Nada de lo anterior.
Enunciado común para las preguntas 3-5. En un estudio llevado a cabo por Henquet
et al. y publicado en la revista BMJ en 2005, se valora, tras 4 años de seguimiento, si
la exposición a cannabis se asocia o no al desarrollo de síntomas psicóticos

3. La probabilidad marginal de padecer algún síntoma p sicótico es:


1. 0,21.
2. 0,17.
3. 0,19.
4. 0,13.
5. Nada de lo anterior.
4. La probabilidad de padecer algún síntoma psicótico condicionada a haber fumado
cannabis ≥5 veces en la vida es:
1. 0,033.
2. 0,19.
3. 0,256.
4. 0,345.
5. Nada de lo anterior.
5. La odds de padecer algún síntoma psicótico condicionada a NO haber fumado
nunca cannabis es:
1. 0,33.
2. 1/5,26.
3. 1/0,19.
4. 0,45.
5. Nada de lo anterior
6. Se mide el IMC de todos los niños de un colegio y se obtiene una media de 21
kg/m2 y una desviación estándar de 3,1 kg/m2. Asumiendo que la variable IMC
siguiese una distribución normal, ¿entre qué dos valores de IMC estaría
aproximadamente el 90% central de los niños de ese colegio?
1. Entre 20,7 y 21,3 kg/m2.
2. Entre 15,9 y 26,1 kg/m2.
3. Entre 20,5 y 21,5 kg/m2.
4. Entre 16,9 y 21,8 kg/m2.
5. Entre 14,8 y 27,2 kg/m2.
Enunciado común para las preguntas 7-8. Se compara el diagnóstico clínico de
úlcera gastroduodenal y su hallazgo en la autopsia en una serie de 10.000 pacientes.
Al comenzar a analizar los datos, se construye la siguiente tabla:

7. De las siguientes cifras, ¿cuál es la más cercana a la probabilidad (en %) de


obtener un diagnóstico clínico de úlcera condicionada a que la autopsia hubiese
sido positiva?
1. 3%.
2. 43%.
3. 87%.
4. 98%.
5. 100%.
8. Si se considera que la autopsia proporciona la verdad sobre la presencia de
úlcera, ¿cuánto valdría aproximadamente el factor Bayes para un diagnóstico clínico
positivo?
1. 210.
2. 3/197.
3. 50,22.
4. 32,3.
5. 0,76.
9. ¿Cuál es la probabilidad de encontrar 90 o más pacientes nuevos de una
enfermedad rara en una población de 2.500 habitantes en la que se esperaba
observar 70 casos?
1. Únicamente es posible aplicar la binomial. En Excel: =DISTR.BINOM(90;2,5;0,7;
verdadero).
2. Se puede usar tanto la binomial como la Poisson, pero no puede usarse la
aproximación normal. 3. Se puede usar sólo la Poisson, ya que no nos dan el valor
de n, y para calcular la binomial hace falta n.
4. Podemos aproximarnos a la distribución de Poisson usando la normal y
obteniendo una z = +2,39.
5. Nada de lo anterior es correcto.

10. Si en un grupo de 400 pacientes la media de la hemoglobina es 14 g/l y su


desviación estándar es 2, ¿cuál es la probabilidad de encontrar u n paciente que
tenga un valor de hemoglobina superior o igual a 18 g/l?
1. 0,028.
2. El correspondiente a un valor z = +2.
3. 1) y 2) son ciertas.
4. 0,001.
5. Faltan datos para contestar.
Enunciado común para las preguntas 11-15. A una muestra de 8.000 mujeres se les
realiza una mamografía. La probabilidad de que la mamografía dé positiva si tienen
cáncer de mama es del 83%, y la probabilidad de que la mamografía resulte negativa
condicionada a no tener cáncer de mama es del 95%. Si se asume que de ca da
1.000.000 mujeres hay 8.125 que realmente tienen cáncer de mama:
11. ¿Cuál es la probabilidad marginal de no tener cáncer de mama?
1. 0,942.
2. 0,992.
3. 0,943.
4. 0,049.
5. 0,052.
12. ¿Cuál es la probabilidad de no tener cáncer de mama condicionada a que la
mamografía resulte negativa?
1. 0,99.
2. 0,126.
3. 0,136.
4. 4,9.
5. Ninguna de las anteriores
13. ¿Cuál es el factor Bayes para una mamografía positiva?
1. 15,2.
2. 54.
3. 64%.
4. 16,6.
5. 0,87
14. ¿Cuál es la odds previa de desarrollar cáncer de mama?
1. 0,0082.
2. 1/0,0082.
3. p(CM | nCM).
4. 0,00145.
5. 0,059.
15. ¿Cuál es la odds posterior (a un test positivo) de desarrollar cáncer de mama?
1. 0,88.
2. 0,88/0,12.
3. 0,137.
4. 0,67.
5. 0,12.
16. En una población del norte de Europa, el 33% de los habitantes sufren depresión.
El 45% de los depresivos come menos de cinco piezas de fruta a la semana; en
cambio, entre los no depresivos, únicamente el 15% come menos de cinco piezas de
fruta a la semana. ¿Cuál es la probabilidad de que una persona que come menos de
cinco piezas de fruta a la semana tenga depresión? Aplique el teorema de Bayes.
1. 40%.
2. 45%.
3. 65%.
4. 55%.
5. 60%.
17. ¿Qué devuelve STATA cuando se ejecuta display normal (–1.89)?
1. El valor z correspondiente a ese valor (x).
2. La distancia (medida en número de desviaciones estándar) a la que se
encuentra ese valor de la media.
3. El porcentaje de valores inferiores a z = 1,89 en una distribución normal perfecta.
4. La probabilidad de estar a 1,89 o más desviaciones estándar por debajo de la
media en una distribución normal.
5. Un área bajo la curva correspondiente a 1 − 0,89 = 0,11.
18. ¿Cómo se interpreta el valor −1,175 que devuelve STATA cuando se le pide
display invnormal(0.12)?
1. Hay un 12% de los valores que están al menos a 1,175 desviaciones estándar
por debajo de la media.
2. El 76% de los valores están en el rango comprendido por la media ±1,175
desviaciones estándar.
3. El 88% de valores están por encima del valor z = −1,175.
4. La probabilidad de encontrar un valor separado (en uno u otro sentido) 1,175 o
más desviaciones estándar de la media es del 0,24.
5. Todas las anteriores.
19. En una población el glaucoma tiene una incidencia del 2%. ¿Cuál es la
probabilidad exacta de encontrar un sujeto con glaucoma en una muestra aleatoria
de tamaño n = 200
1. di poisson(4,1).
2. di poissonp(4,1).
3. di binomialp(200,1,4).
4. di binomial(200,1,0.02).
5. di binomialp(200,1,0.02).
Enunciado común para las preguntas 20-23. Se han registrado un total de 3.700
accidentes de tráfico. Había 2.600 accidentados que no habían consumido drogas.
Sin embargo, iban a más velocidad de la permitida 3.150 conductores, de los cuales
783, además, también habían consumido drogas.
20. ¿Cuál es la probabilidad de que un conductor no hubiese consumido drogas ni
que tampoco condujese a más velocidad de la permitida?
1. 0,063.
2. 0,083.
3. 0,073.
4. 0,94.
5. Nada de lo anterior
21. ¿Cuál es la probabilidad de que un conductor hubiese consumido drogas pero
condujese a la velocidad permitida?
1. 0,063.
2. 0,086.
3. 0,09.
4. 0,5.
5. Nada de lo anterior.
22. ¿Cuál es la probabilidad de que un conductor hubiese consumido drogas o
condujese a más velocidad de la permitida?
1. 0,063.
2. 0,083.
3. 0,21.
4. 0,94.
5. Nada de lo anterior.
23. ¿Ir drogado e ir a más velocidad de la permitida son sucesos independientes?
1. Sí, porque la probabilidad condicionada es igual a la marginal.
2. Sí, porque p(D | V) ≈ p(D | nV).
3. Sí, porque ir a más velocidad no influye sobre haberse drogado.
4. No, puesto que p(D | V) ≠ p(D).
5. Sí, puesto que .
24. Si en un estudio donde la probabilidad marginal de fumar es del 23,5%, el 20% de
los hombres fuma y el 25% de las mujeres fuma. ¿Cuál es la proporción de hombres
del estudio?
1. 70%.
2. 40-60%.
3. 35%.
4. 30%.
5. No lo podemos saber.
25. El 33% de las personas de una población tiene hipertensión. ¿Cómo se obtendría
con STATA la probabilidad de encontrar al menos ocho hipertensos de 30 personas
seleccionadas al azar?
1. di binomialp(30,7,0.33).
2. di 1-binomial(0.33,30,8).
3. di binomial(30,8,0.33).
4. di binomial(30,7,0.33).
5. di 1-binomial(30,7,0.33)
26. Si en STATA se ejecuta la orden sktest peso y se obtiene la siguiente salida:.
1. El test de normalidad resultó significativo: Pr(skewness) = 0,5398; por tanto, la
variable peso sigue una distribución normal.
2. El test de normalidad no es significativo (p = 0,3); por tanto, no se puede asumir
que la variable peso siga una distribución normal.
3. Como el valor p es significativo [Pr(skewness) = 0,5398], se asume que la
variable peso sigue una distribución normal.
4. Como p > 0,05, no hay evidencia para rechazar la hipótesis nula de normalidad.
5. Como p > 0,05, no hay evidencia para rechazar la hipótesis nula; por tanto, no puede
asumirse que la variable peso siga una

Elige la opción incorrecta las hipótesis de investigación se dividen en


descriptivas
correlacionales
de casualidad
exploratorias

Si contamos con nuestra pequeña al estimar la significación de la variable de forma


individual…
disminuye
aumentó
depende de la variable exógena
igual

Qué parámetros se incluyen en la fórmula de la covarianza


producto xy, número total de datos
Media de X, media de Y, producto de xy, n total de datos
desviaciones típicas y medias
medias de x e y, y sus desviaciones típicas

Cuando sólo podemos garantizar un nivel ordinal de medida de las variables de


medida en las variables para estimar la correlación entre ellas debemos acudir a
Spearman
coeficiente de contingencia
pearson
tau
ninguna

El diseño mas poderoso de la investigación es?


Mixto
Cualitativo
Cuantitativo
Cualitativo
Cualitativo y con base cuantitativo

Cuando un investigador formula un objetivo una hipótesis se debe asegurar de que


la hipótesis sea contrastable y el objetivo comprobable
ninguna de las dos anteriores desierta
la hipótesis sea comprobable y el objetivo contrastable

Hemos medido la ansiedad mediante un test estandarizado con un recorrido de 20 a


300 puntos el nivel de medida de esta variable es
Razón
intervalo
nominal

el 45% De una clase ha votado como delegado a Pedro sabiendo que la frecuencia
absoluta de esa opción de voto es 18 cuál sería el número total de alumnos de la
clase
33
40
Con estos datos no se puede determinar

Un percentil conceptualmente es análogo a


la frecuencia del total
la frecuencia absoluta
la frecuencia acumulada

Qué significa que la desviación típica de las notas de un examen sea cero
ninguna de las dos opciones es correcta
que todos los alumnos han obtenido la misma nota
sus notas se distribuyen alrededor de la media de manera perfectamente homogénea

diez sujetos contestan a una variable dicotómica de respuesta no/si codificada


como 0/1), y 7 contestan que sí. El valor p+q es:
7
10
1

La distribución de puntuaciones, típicas tienen como desviación típica


depende de cada distribución
cero
uno

Las calificaciones de una clase siguen la distribución normal. por tanto, podemos
afirmar que la proporción de alumnos por encima de una puntuación típica de 2.05
sera:
0.9798
0.0202
0.0101

En el siguiente gráfico se muestra el diagrama de dispersión de dos variables. en

vista del diagrama, la relación entre ambas es:


una relación lineal imperfecta negativa
una relación lineal perfecta positiva
una relación lineal perfecta negativa

A un mismo grupo de sujetos se le aplica dos veces un instrumento de medida en


momentos diferentes. este procedimiento nos permitiría estudiar la fiabilidad
como consistencia interna
como equivalencia
como estabilidad

El área ocupada bajo la curva normal es


Cero
la unidad
depende de la curva normal

Cuando una muestra seleccionada con un tamaño suficiente y mediante un


procedimiento aleatorio decimos que
es representativa
es fiable
es adecuada
Para un nivel de confianza del 99%, el intervalo confidencial de la estimación de la
nota media del rendimiento escolar en secundaria en España es: (5.8 6.5) Esto
significa que
es improbable que la nota media de la población se encuentra dentro del intervalo
la nota media de la población podría no encontrarse en este intervalo
la nota media de la población se encuentra en este intervalo

Una investigadora indica que el valor de p para diferencia de medias es 0.12. por
tanto
la diferencia de medias estadísticamente significativa siempre
la diferencia de medias estadísticamente significativa para un nivel de significación de 0.05
la diferencia de medias no es estadísticamente significativa para un nivel de significación
de 0.05

A la vista de los datos, la escala de medida del HPI será:

de intervalo
ordinal
nominal

La variable independiente es:


el país
no hay variable independiente
la calidad de vida

La desviación típica insesgada es:


4.28
6.52
2.14

La varianza insesgada de la muestra es


14.67
18.33
4.28

Este problema se debe solucionar mediante la aplicación de


la estadística descriptiva
la estadística correlacionar
estadística inferencial

La muestra y la población en este problema son , respectivamente:


en este caso coinciden la muestra de la población
todos los países de Europa y todos los países del mundo
los cinco países indicados el conjunto de países de Europa

Suponiendo que el error típico de la muestra es 1.915 ,el error muestral para un nivel
de confianza del 95% será
7.50
no se puede calcular con estos datos
3.75

Si se aumenta el nivel de confianza, el intervalo en el que, con esa probabilidad, se


encuentra la media poblacional
será más amplio
no se altera
será más estrecha

La puntuación típica en España sería


-0.976
0.976
1.163

Para investigar una posible relación entre el HPI y el índice de pobreza de los países,
se lleva a cabo un análisis de correlación entre ambas variables obteniendo un
coeficiente de 0.52 con p=0.04. por tanto, las variables:
no correlaciona significativamente
correlacionan significativamente
depende del nivel de significación fijado

Escoja el supuesto que NO corresponde a la inferencia para la diferencia en medias


se tiene una muestra aleatoria de tamaño n1 para la población 1
ambas poblaciones son normales o cumplen con el teorema del límite central
las poblaciones son dependientes una de otra
se tiene una muestra aleatoria de tamaño n2 para la población 2

Señale la afirmación falsa:


la prueba de chi cuadrado es una prueba de contraste de medias para nada métricas
la prueba de wilcoxon es una prueba de contraste de medias no paramétricas
la prueba de u de Man Whitney es una prueba de contraste de medias paramétricas
todas

Qué distribución corresponde a la gráfica

chi cuadrado

El uso de la prueba de Kruskall-wallis


no se calcula tamaño del efecto como ETA cuadrado parcial y se requiere
normalidad
no se requiere igualdad de varianzas y se calcula tamaño del efecto como ETA
cuadrado parcial
no se asumen normalidad y requiere homocedasticidad
todas
ninguna

H0: U1=U2 HA: U1<U2 HA: U1 =U2


Bilateral nula y alternativa
nula bilateral bilateral
todas
nula unilateral bilateral

Es una distribución de probabilidad que surge el problema de estimar la


media de una población normalmente distribuida cuando el tamaño de la
muestra es pequeño. seleccione una:
distribución chi cuadrado
distribución binomial
distribución F
distribución T student

Qué prueba no paramétrica usa un método de ordenar los datos por fila o
bloques:
prueba u de Mann Whitney
t de wilcoxon
prueba de Friedman
prueba de kruskal wallis

Porque la curva de distribución T es más achatada que la distribución normal


todas
tiene mayor dispersión
se encuentra dividida por sus grados de libertad (SI, SON DOS RESPUESTAS)
su campo de variabilidad es infinito

Si tuviera que analizar si existen diferencias significativas entre cinco


variables qué test de hipótesis utilizaría?
Anova One way
Kruskall wallis
Anova two way
shapiro wilk

Si tuviera que analizar si existen diferencias significativas entre más de dos


variables no normales qué test de hipótesis utilizaría?
test de Anova
test de t de students
test de Mann Whitney
test De kruskal-wallis
debo consultar el test Shapiro-wilk

Es una distribución continua que se especifica por los grados de libertad y el


parámetro de no centralidad:
distribución F
distribución binomial
distribución normal
distribución chi cuadrada

Si hablamos de suficiencia y representatividad nos referimos a


Muestra
tipos de muestra
población
variables

Para ver la correlación entre 2 variables (cuantitativa + cualitativa) que no


cumplen los criterios de normalidad realizaremos…
Tau
Spearman
pearson
todas
Si tuviera que correlacionar dos variables cuantitativas continuas qué
método estadístico utilizaría?
correlación de tau kendall
correlación de pearson
correlación de spearman
correlación v. de Crammer

Hipótesis de una cola (con dirección)

y ambas son correctas

Se desea probar que el uso de composta (A) mejora la productividad de haba


comparado con el fertilizante actual (B). La hipótesis a probar es:

Una correlación nula indica que:


No hay asociación lineal de variables

Si tenemos un R= 0.25 eso implica:


Que tenemos una relación lineal baja bajo Pearson

Si tenemos antes de hacer estudio pesaban 70 kg y el promedio tendremos 76 con


desviación estándar 1,2. Entonces:
Rechazar H0

Según la tabla calcular el valor de "x"

0,2

Si se selecciona al azar un dígito (0,1,2,3,4,5,6,7,8,9) ¿Cuál es la probabilidad de que


se obtenga un número mayor que 3?
0.6

Si una persona participa en un experimento aleatorio en el que se realizan 3 sorteos


a la vez y sus opciones son ganar o perder, ¿Cuántos posibles resultados forman el
espacio muestral?
8

1. Una correlación nula indica que: No hay asociación lineal de variables


2. Si tenemos un R= 0.25 eso implica: Que tenemos una relación lineal baja bajo
Pearson
3. Si tenemos un Rs= 0.50 eso implica: Que tenemos una relación lineal baja media
Spearman’s
4. Si tenemos antes de hacer estudio pesaban 70 kg y el promedio
tendremos 76 con desviación estándar 1,2. Entonces: Rechazar H0
5. Si tengo un kappa de 0.56 eso quiero decir: Ninguna
6. Si tenemos valor crítico de 0.586 para un N=10 y tenemos que resultado salió
0.467 entonces que hacer? es No significativa
7. La correlación de Spearman’s en qué situación se hace? Ninguna
8. La covarianza se aplica en que test? Pearson
9. Donde se tiene que corregir la fórmula cuando tiene distintos totales? Kappa
10. Estadístico(s) de prueba para comparar poblaciones con variables
numéricas t de student
11. Estadístico(s) de prueba para comparar poblaciones con variables
categóricas: Z y X2
12. Estadístico de prueba utilizado para la comparación de una media
muestral respecto a una poblacional: t de student
13. Si se desea comparar la homogeneidad de dos poblaciones con respecto a
una variable se utiliza como estadístico de prueba: χ2
14. Para probar la Ho: μ=μo se utiliza el siguiente estadístico de prueba: t de
student

15. Cuando interesa conocer la relación o indepedencia entre dos


variables en una población se utiliza como estadístico de prueba: χ2
16. Al plantear como "Hipótesis nula: Las muestras son homogéneas" , para
probarla se utilizará como estadístico de prueba: χ2
17. Se aplicó una estrategia de enseñanza a un grupo para ver si se podía
mejorar el aprendizaje de una asignatura específica. Al aplicarse el
examen departamental la calificación del grupo fue de 8 y el promedio
normal de años anteriores es de 7.8. Al aplicar el estadístico de prueba
se obtiene un valor de 3.4437 y el valor de tabla es de 3.373. La
interpretación es...: Hay evidencia suficiente para decir que la estrategia mejora
el aprendizaje
18. Se aplicó una estrategia lúdica a un grupo para ver si se podía mejorar
el aprendizaje de una asignatura específica. Para medir el aprendizaje
su utilizará un examen y se compararán las calificaciones numéricas
del grupo con relación a la de todos los grupos del mismo nivel que
realizaron la prueba el año anterior. El estadístico de prueba a utilizar
es: t de student
19. Estadístico de prueba en la que únicamente se considera una cola para la
decisión estadística: χ2

20. es la fórmula para calcular: χ2


21. Se cuantifican las ayudas visuales que contiene el libro de texto
gratuito del cuarto año de primaria por ejemplo: diagramas, fotos,
esquemas y mapas y se compara con respecto a lo recomedado en
otros países en los que el estándar indica que al menos el 30% del libro
contenga este tipo de ayudas visuales. El estadístico de prueba a
utilizar es...: Z
22. Para probar la Ho: p= ρo se utiliza el siguiente estadístico de prueba: Z
23. En una tabla de contingencia de 2 X 2 los grados de libertad a considerar
para buscar en tablas corresponde a: 1
24. Cuando se tienen varias muestras independientes de n individuos que se
clasifican respecto a una variable cualitativa y se desea conocer a partir de
datos muestrales, si provienen de la misma población se utiliza como
estadístico de prueba: χ2
25. Se estudió la cantidad de niños que aprobó un examen con S, B y MB y se
comparó con la cantidad de niñas que obtuvieron las mismas calificaciones.
El estadístico de prueba a utilizar corresponde a: χ2
26. Se estudió la cantidad de niños que aprobó un examen con S, B y MB
y se comparó con la cantidad de niñas que obtuvieron las mismas
calificaciones. La hipótesis a probar corresponde a:
27. Para obtener el valor Z de tablas se requiere..: Considerar el α
28. Condiciones para el cálculo de la t de student: Tamaño de muestra mayor a 30,
Distribución normal, variable numérica
29. Si el valor de Z de tablas es de -1.964 y el Zcalculado corresponde a -3.22, la
decisión estadística es: Se rechaza Ho
30. ¿Qué es una variable independiente? Es aquella que no depende de ninguna
variable
31. ¿Qué es una variable dependiente? Es aquella que depende de alguna variable
32. ¿Valor que se encuentra entre -1 y 1 e indica el grado de asociación entre dos
variables cuantitativas? Coeficiente de correlación de Pearson
33. ¿Qué es un diagrama de dispersión? Representación gráfica del grado de
relación entre dos variables
34. La hipótesis H0: μ1 =μ2 se utiliza en: muestras independientes y muestras
pareadas
35. La hipótesis H0: μ1 =μ2=μn se utiliza en: ANOVA simple y ANOVA por
bloques
36. el término "muestras pareadas" en estadística se refiere a la(s) siguiente(s)
situación(es)...:
• cuando a una muestra se le aplica una tratamiento y se mide la respuesta
de la variable antes y después
• cuando se integran dos muestras con individuos con caraacterísticas
semejantes
37. La "F" de Fisher es el estadístico de prueba utilizado en:
• de igualdad de varianzas
• muestras pareadas
• ANOVA
38. La "t" de student es el estadístico de prueba utilizado en:
• muestras independientes
• muestras pareadas
39. "Q" es el estadístico de prueba utilizado en: Tukey
40. Cuando en un ANOVA por bloques se rechaza la Hipótesis nula...
• Se procede a aplicar la prueba de Tukey para ver cuál para de medias es
diferente
• No hay igualdad en las medias y se concluye que hay diferencias
estadísticas
41. Condiciones que se tienen que cumplir para la aplicación de un
ANOVA
• Igualdad de varianzas
• Variable continua
• Distribución normal
42. Condiciones que se tienen que cumplir para la aplicación de la prueba de
Tukey
• Igualdad de varianzas
• Distribución normal
• Diferencia de medias de 3 o más muestras
43. Se desea investigar si existen diferencias en el promedio de los niños de
cuatro escuelas de una zona escolar en las que se aplicó la Prueba PISA. La
prueba estadística a aplicar es: ANOVA de una vía
44. Se desea investigar si existen diferencias en el promedio de los niños de las
escuelas del estado de Hidalgo en las que se aplicó la Prueba PISA. Como se
sospecha que hay variaciones entre las escuelas públicas, privadas y
multigrado, se aplica la prueba estadística ...: ANOVA por bloques
45. Una docente sospecha que la causa de reprobación de la asignatura
de matemáticas se debe a la falta de conocimientos previos del área.
Para ello aplica un examen diagnóstico en el que pone a los
estudiantes diversos problemas. Al detectar las deficiencias, aplica
una estrategia para que resuelvan los problemas y luego aplica otro
examen. Para conocer si la estrategia funcionó, compara las
calificaciones mediante la prueba...: t para muestras pareadas
46. Una docente mide el tiempo que tardan sus estudiantes en resolver un
examen de comprensión de lectura en inglés. Por ello, revisa la literatura y
encuentra una metodología que considera puede serle útil. Trabaja con sus
estudiantes con este método y mide el tiempo que emplean sus alumnos para
resolver un examen de comprensión lectora en dicho idioma. Para conocer el
efecto que tuvo el método en sus estudiantes, deberá emplear la prueba... : t
para muestras pareadas / Ninguna
47. Al analizar los resultados sobre el grupo sanguíneo de los estudiantes de una
escuela primaria, descubren que hay predominancia de grupo"O+" y que el
menos común es el "A-". Si compara la misma variable en otra escuela, la
prueba estadística para ver la diferencia entre los grupos s anguíneos es…:
Otra.
48. Se comparan las estaturas de los niños de una escuela rural de Oaxaca y de
otra urbana para seleccionar a los niños que participarán en los equipos de
basquetbol. Para determinar si hay diferencias estadísticas en las estaturas,
la prueba estadística a utilizar es.: t para muestras independientes
49. Para la elección de estudiantes que participarán en la olimpiada de
Biología, se aplica un examen a los estudiantes de una secundaria.
Para ello, se realizará una primera selección del grupo con mayor
aprovechamiento, por lo que comparan los promedios de los diferentes
grupos de la escuela y de los dos turnos. Para conocer si hay
diferencias estadísticas entre los grupos y turnos, se debe aplicar..:
ANOVA por bloques
50. De acuerdo con el problema anterior, una vez que se seleccionó un turno, se
aplica otro examen a cada grupo y se compara en cuál están los estudiantes
con las calificaciones más altas y ver si estas diferencias son significativas o
no, para ello se utiliza la prueba de...: ANOVA de una vía
51. Al analizar los resultados de las calificaciones de un examen, y comparar con
el estadístico de prueba, se obtiene que Ft = 1.45 , Fc= 3.22 por lo que la
decisión estadística es: Se rechaza la Hipótesis nula
52. Para buscar cuáles diferencias son significativas, al aplicar la prueba de
Tukey:
• se comparan los diferentes pares de medias posibles
• se calcula Qc y se compara con Qt
53. La intensidad de la relación entre dos variables cuyo coeficiente de
correlación lineal es r=-0.76 se puede decir que es: igual que la de r=0.76
54. El error de tipo I consiste en: rechazar H0 cuando es cierta.
55. Señale la respuesta falsa en lo que concierne a los contrastes de hipótesis :
La hipótesis nula es aquella para la que buscamos evidencia a favor.
56. Elija la afirmación falsa: Un contraste debe ser declarado significativo antes de
recoger los datos.
57. Una hipótesis estadística es un enunciado que se hace sobre el
comportamiento de un: Parámetro poblacional o de una variable aleatoria y su
distribución de probabilidad
58. La hipótesis nula es un enunciado que se hace referente al comportamiento
del valor de un parámetro: Poblacional para ser probada a través de la
información de la muestra
59. La hipótesis alternativa es un enunciado que se hace para contrastar el
comportamiento del valor de un: Parámetro poblacional definido en la hipótesis
nula, dependiendo de los resultados obtenidos de los valores de la muestra
60. Nivel de significancia es la probabilidad de: No aceptar la hipótesis nula cuando
es verdadera; se utiliza para determinar el valor crítico, toma valores entre 0 y 1
61. El valor crítico es un: Cálculo para determinar el punto que divide a la región en la
cual se rechaza la hipótesis nula y la zona en la que no se rechaza
62. Un estadístico de prueba es una regla expresada con una fórmula que
involucra los valores: De la muestra
63. La región de rechazo son los valores de la prueba donde: Se rechaza la
hipótesis nula
64. porcentaje que la variable predictora explica de la variable respuesta:
Coeficiente de determinación
65. Método de estimación para la mejor recta: Mínimos cuadrados.
66. Un ajuste del 0.89 en la recta de regresión lineal indica: Una relación fuerte
entre X e Y
67. En una ecuación lineal el valor de "a" corresponde a: La intersección con el eje
y
68. El coeficiente de correlación de la variables se representa por: r
69. El coeficiente de determinación en una regresión lineal se le representa con:
r2
70. El rango de valores posibles para el coeficiente de determinación es: De 0 a 1
71. ¿Valor que se encuentra entre -1 y 1 e indica el grado de asociación
entre dos variables cuantitativas? Coeficiente de correlación de Pearson
72. Una regresión lineal simple busca: Establecer la relación entre una variable
independiente y otra dependiente
73. En la expresión Y = B0 + B1 X, el término B0 representa: La intersección con el
eje Y
74. y=15.5+2.7x De acuerdo al siguiente modelo de regresión lineal ¿Cuál será el
valor estimado de "y" si "x" es igual a 3? 23.6
75. Que es la prueba no parametrica: Son aquella que no presuponen una
distribución de probabilidad para los datos.
76. La Prueba No Parametrica es conocida tambien como: Distribución Libre
77. La Prueba de Friedman de que trata: De varias muestras con datos relacionados
78. La prueba de U de Mann-Whitney cuantas muestras lleva: 2
79. La prueba de T de Wilcoxon tiene dos muestra con datos: Relacionados
80. Que es una ANOVA: Prueba de hipótesis
81. Que prueba no parametrica usa un método de ordenar los datos por fila o
bloques: Prueba de Friedman
82. Para probar la Hipótesis nula: "las tendencias centrales de las dos
poblaciones son iguales" se puede utilizar:
• U de Mann-Whitney
• T de Wilcoxon
83. El primer paso para el establecimiento de rangos es: Ordenar los datos del más
pequeño al más grande
84. Con relación al problema 1 del examen. La Ho es...: Las tendencias centrales
son iguales
85. El estadístico de prueba a utilizar corresponde a..: U de Mann- Whitney
86. Para calcular el estadístico de prueba, utilizas un α de: dos colas
87. La decisión estadística es...: Rechazar o mantener la Ho
88. La interpretación corresponde a: Los maestros y las maestras de primaria de esa
zona escolar manifiestan distinto grado de interés por su grupo
89. Con relación al problema 2 del examen. La Ho es..: La tendencia central de los
hijos es menor o igual al de las hijas
90. El estadístico de prueba a utilizar corresponde a: T de Wilcoxon
91. Para calcular el estadístico de prueba, utilizas un α de: una cola
92. La intepretación es: No hay evidencia suficiente para afirmar que los hijos
adolescentes estén más enterados que las hijas
93. Con relación al problema 3 del examen. La Ho es: Las tendencias centrales de
las tres poblaciones son iguales
94. El estadístico de prueba a utilizar corresponde a: H de Kruskall-Wallis
95. La interpretación es: Se puede afirmar que la frecuencia con que asisten los
estudiantes de las carreras científicas, técnicas y humanísticas a los eventos
culturales organizados por su Universidad difiere
96. La correlación entre desigualdad y bienestar es de -0,28. Esto significa que
hay una tendencia baja que: a mayor desigualdad menor bienestar y
viceversa
97. Suponiendo que se cumple el supuesto de homocedsticidad, para calcular la
correlación entre la variable desigualdad y bienestar medidos en escala,
debemos acudir el coeficiente de: debemos comprobar el supuesto de
normalidad para responder

98. que resultado obtuviste? 0,265


99. Que es validez interna? Lo hallado coincida en la muestra que se estudie
100. Realice este ejercicio en los datos que se les brinda en Excel, de
datos que se obtuvieron de las 50 persona encuentadas de las cuales
se les preguntó ¿considera usted que ta utilizaba el cel con gran
frecuencia antes de la cuarentena? El valor de P es? 0,254
101. Para que utilizamos el chi cuadrado? Para saber si las poblaciones
son homogéneas, ninguna
102. ¿La chi cuadrada es una medida de la divergencia entre la distribución
de los datos y la distribución esperada o hipotética? Cierto
103. Se utiliza la distribución de chi-cuadrada cuando el experimento ofrece
________________ posibles: Mas de 2 resultados
104. La distribución de chi-cuadrado se deriva de la distribución: Normal
105. En que consiste la prueba de homogeneidad: Extraer muestras
independientes de varias poblaciones y se prueban para ver si son homogéneas
106. Para que utilizamos a chi-cuadrada:
a. Para saber si las poblaciones son heterogéneas
b. Para saber si las poblaciones son homogéneas
c. A y B son correctas
107. El test de chi cuadrada es para variables: cualitativas
108. Para realizar un test chi cuadrada en una tabla de contingencia con m
filas y n columnas, los grados de libertad del estadístico chi-cuadrado son:
(m-1)(n-1)
109. Es una medida estadística que cuantifica la dependencia lineal entre
dos variables: Correlación lineal
110. Cierto o Falso. La regresión lineal es una técnica estadística que se
utiliza para estudiar la relación entre variables cuantitativas : cierto
111. esta tabla le hice el chi2 y salió:
2,0E-6
112. El intervalo de confianza de la media requiere: Distribución T-
Student
113. si no conozco la desviaciòn estandar y el tamaño de muestra es
pequeño, que distribucion debo usar para estimar la media poblacional : t
student
114. la formula del intervalo de confianza es: Estimador +/- EE del
estimador
115. Estadisticos de pruba para comparar poblaciones, con variables
numéricas. Seleccione una: T de student
116. Que prueba de normalidad es conveniente utilizar para muestras
mayores a 30? Kolmogorov-Smimov
117. ¿Cuál es la utilidad de la prueba t de student para muestras
relacionadas? Comparar una característica de una sola muestra, pero en dos
circunstancias distintas
118. ¿Cuál de los siguientes se considera un requisito para realizar la
prueba de t-student? Que las variables a comparar tengan una distribución
normal
119. En que consiste la prueba de bondad de ajuste: se utiliza para la
comparación de la distribución de una muestra con alguna distribución
teórica que se supone describe a la población de la cual se extrajo
120. De acuerdo al resultado de la prueba t de student para muestras
relacionadas que obtuviste en Excel: la diferencia entre ambas
calificaciones es significativa debido a que el valor de significancia es <0.05,
por lo tanto, se acepta la hipótesis alterna, es decir, la intervención educativa fue
efectiva
121. La elección de un sujeto es independiente de cualquier otro
sería: muestreo aleatorio simple
122. Cual es el problema práctico de una muestra? La
representatividad
123. Si se trabaja con un 95% de confianza, eso quiere decir que el
alfa es? 0,05
124. Cuando interesa conocer la relación o independencia entre dos
variables en una población se utiliza como estadístico de prueba: t de
student
125. El test del chi cuadrado es para variables: cualitativas
126. Que es una validez interna? Lo hallado coincida en la muestra que
se estudie
127. Errores pueden clasificarse en dos tipos: sistemático y alateorio
128. Que tipos de errores se pueden cometer en el contraste de
hipótesis? Error tipo I y II
129. En que consiste el error tipo II: acepta la hipótesis nula siendo falsa

130. ¿Qué tipo de variable puede observar en la gráfica?


R: No existe relación aparente

131. ¿Qué tipo de variable puede observar en la gráfica?

R: Relación directa

132. ¿Qué tipo de variable puede observar en la gráfica?

R: Relación inversa

133. ¿Qué puede concluir sobre el siguiente gráfico?

R: El nivel de ansiedad es la variable


independiente

134. ¿Cuál de las siguientes afirmaciones es correcta?

R: A mayor nivel de ansiedad menor nota

135. ¿Cuál de los siguientes diagramas representa una correlación


positiva?
136. Indique el tipo de correlación que se observa en el diagrama de
dispersión

R: Negativa

137. El coeficiente de correlación del siguiente grupo de datos indica que:

R: Existe una relación lineal negativa y fuerte

138. Que diagrama de dispersión corresponde a estos datos?

R:

139. ¿Que podemos decir este gráfico?


R: Qué hay correlación nula

140. ¿Qué tipo de correlación representa?

R: Positiva

141. Si tenemos un Mediana eso se gráfica así:

142. ¿Cuál de las siguientes gráficas representa a la F de Fisher?

143. La siguiente imagen muestra que existe una relación lineal:

R: Directamente proporcional entre X e


Y

144. ¿Como es correlación entre las variables x e y en la siguiente


distribución estadística?
R: débil

145. ¿Como es correlación entre las variables x e y en la siguiente


distribución estadística?

R: fuerte directa

146. ¿Como es correlación entre las variables x e y en la siguiente


distribución estadística?

R: fuerte inversa

147. Dada la siguiente distribución bidimensional, halla el valor de la


covarianza

R: 13,64

148. Dada la siguiente distribución bidimensional, como es la relación entre


las dos variables

R: fuerte directa

149. Dada la siguiente distribución bidimensional, halla la recta de


regresión de y sobre x
R: y = 1,52x + 6,9

150. Qué nota esperaremos que saque un alumno en Inglés, si en


matemáticas ha sacado un 5,5. ¿podemos esperar o no que esta estimación
sea fiable?

R: 4.94 ==> fiable

Si hablamos de Suficiencia y Representatividad nos referimos a: Muestra

10.Si tras realizar Pearson nos da una correlación de 0,76 y p<0,02 entonces: Hay una
correlación alta positiva

11.¿Qué prueba no paramétrica usa un método de ordenar los datos por fila o bloques?
Prueba de Kruskal-Wallis o Prueba de Friedman

12.Escoja el supuesto que NO corresponde a la indiferencia para la diferencia en medias:


Las poblaciones son dependientes una de otra

13.Si tuviera que analizar si existen diferencias significativas entre cinco variables. Que
test de hipótesis utilizaría? Shapiro-Wilk

14.H0: u1=u2 HA: u1<u2 HA: u1?=u2. De acuerdo con el planteamiento de las hipótesis
anteriores. De qué tipo es cada una correspondientemente? Nula, Unilateral, Bilateral

15.Para ver la correlación entre dos variables (Cuantitativa + Cualitativa) que no cumplen
los criterios de normalidad realizaremos: Spearman

16.Si tuviera que correlacionar dos variables cuantitativas continuas. ¿Qué método
estadístico utilizaría? Correlacion de Pearson

17.El uso de la prueba Kruskall-Wallis: Ninguna

Si una caja contiene bolas numeradas del 1 al 10, ¿cuál es el suceso A = "obtener
múltiplo de 3"?
Ninguna de las respuestas es correcta.

En la teoría de probabilidad, la actividad que origina uno de dichos eventos se


conoce como:
Experimento

¿CUÁL ES LA PROBABILIDAD DE QUE AL TIRAR UN DADO OBTENGAMOS UN


NÚMERO DIVISIBLE ENTRE 3?
1/3

La correlación entre desigualdad y bienestar es -0.28 esto significa que hay una
tendencia baja a que
a mayor desigualdad menor bienestar y viceversa
Dada la siguiente distribución bidimensional el valor de la covarianza
13.64

Las varianzas en la variable desigualdad para los países europeos y americanos son
respectivamente 54 y 22 . la prueba f de Levene es f= .448 con una p asociada de
.522. Por tanto como un nivel de confianza del 95% dan datos demás para despistar
Las varianzas son estadísticamente iguales

Y= 15.5+2.7x De acuerdo al siguiente modelo de regresión lineal cuál será el valor


estimado de Y si X es igual a 3
23.6

Suponiendo que se cumple el supuesto de homocedasticidad para calcular la


correlación entre la variable desigualdad y bienestar medidos en escala debemos
acudir al coeficiente de pregunta trampa a pensarla muy bien sobre todo los
supuestos para trabajar cada correlación
Debemos comprobar el supuesto de normalidad para responder

cuál de las siguientes afirmaciones es correcta


a mayor nivel de ansiedad menor nota

Sean A y B dos sucesos tales que p (A ) = 0.7 , p(B) = 0.6 p (A U B) = 0.9

Calcula p (A/B´) y p ( B / A´)

Prueba PAU

p (A/B´) = 0.75; p ( B / A´) = 0.66

De dos tiradores se sabe que uno de ellos acierta 2 de cada 3 disparos,


mientras que el otro acierta 3 de cada 4 disparos. Si los dos disparan
simultáneamente, hallar la probabilidad de que:
a) Acierten ambos b) Uno de los dos acierte c) Ninguno de los dos acierte d)
Alguno acierte.
Prueba PAU

a) 0.5 b) 0.42 c) 0.083 d) 0.917

Se supone que el tiempo de una conversación en un teléfono móvil se puede


aproximar por una variable aleatoria con distribución normal de desviación típica
igual a 1,32 minutos. Se desea estimar la media del tiempo de las conversaciones
mantenidas con un error inferior o igual en valor absoluto a 0,5 minutos y con un
grado de confianza del 95%. Calcúlese el tamaño mínimo de la muestra que es
necesario observar para llevar a cabo dicha estimación mediante la media muestral.
27

Si tengo un kappa de 0.56 eso quiero decir:


Ninguna

La correlación de Spearman’s en qué situación se hace?


Ninguna

La definición de error tipo 1 corresponde a:


La hipótesis nula, es en realidad, cierta, pero a pesar de todo se rechaza.

Tenemos la siguiente tabla que refleja los datos de asignaturas de religión en los
centros escolares ¿influye el tipo de colegio en la nota obtenida? Con UM margen de
error 0,05
Se rechaza hipótesis nula dado que el Chi calculado es mayor

Obtención de la covarianza entre cinco pares de puntuaciones para los mismos


sujetos en ansiedad y depresión medidos en dos cuestionarios diferentes (X, Y) y
(V,W)

Sxy= 2,053

Cual es correlación de pearson en este ejemplo

0.86

Cual la fórmula de correlación de Pearson


Rxy=Sxy/Sx.Sy

Cual es fórmula para calcular chi2


X2= (O-E)2/O

La probabilidad de tener Osteopenia u Oteoporosis

0,53

A partir de la representación gráfica del porcentaje de la población económica


activa, en una muestra de 150 hombres y mujeres de 20 a 70 años de edad, ¿Cuál es
la marca de clase de intervalo inicial?
25

Las variables continuas son aquellas que admiten solamente valores ......
Reales

En estadística a menudo se habla de muestras. Una muestra:


Es una selección de datos sobre el total de la población a estudiar

¿Que funcion tienen las distribuciones o tablas de frecuencias?


permiten resumir los datos en una tabla

Si tenemos un Rs= 0.50 eso implica


Que tenemos una relación lineal baja media Spearman’s

Si tenemos valor crítico de 0.586 para un N=10 y tenemos que resultado salió 0.467
entonces que hacer?
es No significativa

La covarianza se aplica en que test?


Pearson

Etapa del método estadístico donde se usan parámetros estadísticos como el


promedio, desviación estándar, porcentaje, frecuencia, etc.
Síntesis

¿Cuándo se usa el intervalo de confianza?


Estimar la diferencia entre dos porporciones poblacionales

Existen dos tipos de muestro:


basados en el juicio de una persona y aleatoria.

¿Qué es la distribución muestral de medias?


Distribución de probabilidad de todas las posibles medidas de las muestras

SI la variable es el número de hermanos ¿cuántas personas tienen menos de 2


hermanos?
13

Donde se tiene que corregir la fórmula cuando tiene distintos totales?


Kappa

La diferencia entre los coeficientes de variación del grupo de las mujeres y del
grupo de los varones corresponde a
0,93%

¿Cuál de los siguientes diagramas representa una correlación positiva?

PERMITE PRESENTAR LOS DATOS DE UNA TABLA EN FORMA ORDENADA Y


FÁCIL DE VISUALIZAR
GRÁFICO ESTADÍSTICO
“Es cada uno de los elementos, unidades, individuos o entes que componen
una investigación.”

La definición anterior corresponde a


DATO ESTADÍSTICO

¿La frecuencia relativa se calcula?


Dividiendo el conteo entre el total

El consumo familiar diario de electricidad (en kW) en cierta ciudad se puede


aproximar por una variable aleatoria con distribución normal de media μ y
desviación típica 1’2 kW. Se toma una muestra aleatoria simple de tamaño 50.
Calcúlese la probabilidad de que la media muestral esté co mprendida entre 6 kW y
6,6 kW, si μ=6,3 kW.
0,9232

Tiene esta situación haces un estudio que va del presente a hacia el pasado que
tipos de diseño es?
Casos y controles

Cohorte retrospectiva es similar a


Ninguna

Que tipo de casos y controles es el mejor


Casos y cohorte

Que tipo de Cohorte tiene recambio de población


Dinámica

Que medidas se usan primordialmente en casos y controles


OR

Cual es el sesgo de Berkson


Utilizar pacientes que estén bajo algún tratamiento

Para que se utiliza el diseño transversal


Ninguna

Para buscar cuáles diferencias son significativas, al aplicar la prueba de Tukey...


se calcula Qc y se compara con Qt
se comparan los diferentes pares de medias posibles

Al analizar los resultados de las calificaciones de un examen, y comparar con el


estadístico de prueba, se obtiene que Ft= 1.45 , Fc= 3.22 por lo que la decisión
estadística es...
Se rechaza la Hipótesis nula

De acuerdo con el problema anterior, una vez que se seleccionó un turno, se aplica
otro examen a cada grupo y se compara en cuál están los estudiantes con las
calificaciones más altas y ver si estas diferencias son significativas o no, para ello
se utiliza la prueba de...
ANOVA de una vía

La hipótesis H0: u1 = u2 se utiliza en...


a. muestras independientes
b. muestras pareadas
c. ANOVA por bloques
d. ANOVA simple

La hipótesis H0: u1 = u2 = u se utilizan en…


a. muestras independientes
b. ANOVA simple
c. muestras pareadas
d. ANOVA por bloque

el término "muestras pareadas" en estadística se refiere a la(s) siguiente(s)


situación(es)...
a. cuando a una muestra se le aplica una tratamiento y se mide la respuesta de la variable
antes y después
b. cuando varias muestras se integran por los individuos seleccionados al al azar
c. cuando se integran dos muestras con individuos con caraacterísticas semejantes
d. cuando tenemos dos pares de muestras integradas por parejas aleatorias

La "F" de Fisher es el estadístico de prueba utilizado en


a. de igualdad de varianzas
b. muestras pareadas
c. ANOVA
muestras independientes
Tukey

La "t" de student es el estadístico de prueba utilizado en:


A .de igualdad de varianzas
b. muestras pareadas
c. muestras independientes
d. ANOVA
e. Tukey

"Q" es el estadístico de prueba utilizado en:


de igualdad de varianzas
a. muestras pareadas
b. muestras independientes
c. ANOVA
d. Tukey

Cuando en un ANOVA por bloques se rechaza la Hipótesis nula...


Hay igualdad en las medias y se concluye que no hay diferencias estadísticas
No hay igualdad en las medias y se concluye que hay diferencias estadísticas
Se procede a aplicar la prueba de Tukey para ver cuál para de medias es diferente
Al no haber diferencias, se aplica la prueba de Tukey para confirmar la conclusión

Condiciones que se tienen que cumplir para la aplicación de un ANOVA


a . Igualdad de varianzas
b. Distribución normal
c. Distribución en F de Fisher
d. Variable categórica
e. Variable continua

9. Condiciones que se tienen que cumplir para la aplicación de la prueba de Tukey


a. Igualdad de varianzas
b. Distribución normal
c. Igualdad de medias de 3 o más muestras
d. Diferencia de medias de 3 o más muestras
Estadísticamente la hipótesis de investigación se representa como
H1 o Ha
la hipótesis alternativa

Problema 1. En un estudio efectuado en un país, se afirma que 3 de 10 estudiantes


universitarios trabajan por lo que no es necesario flexibilizar los horarios de clase.

Un artículo reciente, publicado por un en USA, indica que solo a uno de cada tres
egresados de una universidad les espera un puesto de trabajo. Las hipótesis
estadísticas son:

¿Cuál de las siguientes gráficas representa a la F de Fisher?

Para probar la Hipótesis nula: "las tendencias centrales de las dos poblaciones son
iguales" se puede utilizar:

T de Wilcoxon
U de Mann-Whitney

El primer paso para el establecimiento de rangos es


Ordenar los datos del más pequeño al más grande

El estadístico de prueba a utilizar corresponde a...


U de Mann- Whitney

Para calcular el estadístico de prueba, utilizas un α de..


dos colas

La decisión estadística es...


Rechazar Ho

Condiciones que se tienen que cumplir para la aplicación de la prueba de Tukey


Diferencia de medias de 3 o más muestras
Igualdad de varianzas
Distribución normal

Condiciones que se tienen que cumplir para la aplicación de un ANOVA


Variable continua
Igualdad de varianzas
Distribución normal

¿Cuál de las siguientes gráficas representa a la F de Fisher?


Se desea investigar si existen diferencias en el promedio de los niños de cuatro
escuelas de una zona escolar en las que se aplicó la Prueba PISA. La prueba
estadística a aplicar es...
a. ANOVA por bloques
b. ANOVA de una vía
c. t para muestras pareadas
d. t para muestras independientes
e. otra

Se desea investigar si existen diferencias en el promedio de los niños de las


escuelas del estado de Hidalgo en las que se aplicó la Prueba PISA. Como se
sospecha que hay variaciones entre las escuelas públicas, privadas y
multigrado, se aplica la prueba estadística ...
ANOVA por bloques
ANOVA de una vía
t para muestras pareadas
t para muestras independientes
otra

Una docente sospecha que la causa de reprobación de la asignatura de matemáticas


se debe a la falta de conocimientos previos del área. Para ello aplica un examen
diagnóstico en el que pone a los estudiantes diversos problemas. Al detectar las
deficiencias, aplica una estrategia para que resuelvan los problemas y luego aplica
otro examen. Para conocer si la estrategia funcionó, compara las calificaciones
mediante la prueba...
ANOVA por bloques
ANOVA de una vía
t para muestras pareadas
t para muestras independientes
otra

Una docente mide el tiempo que tardan sus estudiantes en resolver un examen de
comprensión de lectura en inglés. Por ello, revisa la literatura y encuentra una
metodología que considera puede serle útil. Trabaja con sus estudiantes con este
método y mide el tiempo que emplean sus alumnos para resolver un examen de
comprensión lectora en dicho idioma. Para conocer el efecto que tuvo el método en
sus estudiantes, deberá emplear la prueba...
ANOVA por bloques
ANOVA de una vía
t para muestras pareadas
t para muestras independientes
otra

Al analizar los resultados sobre el grupo sanguíneo de los estudiantes de una


escuela primaria, descubren que hay predominancia de grupo"O+" y que el
menos común es el "A-". Si compara la misma variable en otra escuela, la
prueba estadística para ver la diferencia entre los grupos sanguíneos es...
ANOVA por bloques
ANOVA de una vía
t para muestras pareadas
t para muestras independientes
otra

Se comparan las estaturas de los niños de una escuela rural de Oaxaca y de


otra urbana para seleccionar a los niños que participarán en los equipos de
basquetbol. Para determinar si hay diferencias estadísticas en las estaturas,
la prueba estadística a utilizar es...
t para muestras independientes
t para muestras pareadas
ANOVA de una vía
ANOVA por bloques
Otra

Para la elección de estudiantes que participarán en la olimpiada de Biología,


se aplica un examen a los estudiantes de una secundaria. Para ello, se
realizará una primera selección del grupo con mayor aprovechamiento, por lo
que comparan los promedios de los diferentes grupos de la escuela y de los
dos turnos. Para conocer si hay diferencias estadísticas entre los grupos y
turnos, se debe aplicar...
t para muestras independientes
t para muestras pareadas
ANOVA de una vía
ANOVA por bloques
Otra

¿Cuál es el test estadístico que debería utilizarse para comparar las


proporciones de pacientes con cáncer de pulmón entre cinco categorías de
pacientes en función de su consumo de cannabis (nunca lo han probado;
menos de 5 veces; de 5-50 veces; más de 50 veces, pero no a diario; fuman a
diario)?

a. Test exacto de Fisher


b. Ninguno
c. Test de McNemar.
d. Test de la χ2 de Pearson.
e. Test de tendencia lineal.

En qué consiste el error tipo II :


a. rechazar la hipótesis nula siendo falsa
b. aceptar la hipótesis nula siendo verdadera
c. aceptar la hipótesis nula siendo falsa
d. rechazar la hipótesis nula siendo verdadera

De acuerdo con el problema anterior, una vez que se seleccionó un turno, se


aplica otro examen a cada grupo y se compara en cuál están los estudiantes
con las calificaciones más altas y ver si estas diferencias son significativas o
no, para ello se utiliza la prueba de...
t para muestras independientes
t para muestras pareadas
ANOVA de una vía
ANOVA por bloques
Otra

Al analizar los resultados de las calificaciones de un examen, y comparar con


el estadístico de prueba, se obtiene que Ft = 1.45 , Fc = 3.22 por lo que la
decisión estadística es...
Se acepta la Hipótesis nula
Se rechaza la Hipótesis nula

Para buscar cuáles diferencias son significativas, al aplicar la prueba de


Tukey...
se comparan los diferentes pares de medias posibles
se calcula Q c y se compara con Q t
Se calcula la Fc y se compara con la Ft
se compara la media más alta contra la más baja

Seleccione una:
si va hacia abajo es negativa

Correlación
Negativa
Sin relación
Positiva

Seleccione una:
si estan todos dispersos es nula

Que hay correlación negativa


Que hay correlación nula
Ninguna
Que hay correlación positiva

la prueba no paramétrica es también conocida como:


a. Distribución por dos vías
b. distribución directa
c. distribución indirecta
d. distribución libre

la prueba no paramétrica es Kuskal Wallisde varias muestras con datos:


a. independientes
b. intermediarios
c. dependientes
d. relacionados

Que es una ANOVA


a. prueba de hipótesis
b. prueba de vías
c. pruebas de un ajustes
d. prueba de vías reversas

Que tipo/s de error/es se puede/n cometer en el contraste de hipótesis.


a. error tipo I y tipo II.
El primer paso para el establecimiento de rangos es
a. Numerar los datos.
b. Ordenar los datos del más grande al más pequeño.
c. Ordenar los datos del más pequeño al más grande.
d. Agrupar los datos repetidos.
Valor que se encuentra entre -1 y 1 e indica el grado de asociación entre dos
variables cuantitativas
a. Coeficiente de correlación de Pearson.
b. Coeficiente de correlación de Spearman.
c. Coeficiente de determinación.
a. Coeficiente de variación.

Con que test no paramétrico corresponde el test de ANOVA:


a. U DE Mann-Whitney.
b. Correlación Rho de Spearman.
a. Kruskal-Walls.
b. Test de Fisher.
En que consiste el error tipo II?
a. Rechazar la hipótesis nula siendo falsa.
c. Aceptar la hipótesis nula sinedo verdadera.
d. Aceptar la hipótesis nula siendo falsa.
e. Rechazar la hipótesis nula siendo verdadera.

Si tuviera que analizar si dos sucesos son aleatorios ¿Qué test de hipótesis
utilizaria?
a. Debo consultar el test de rachas

El coeficiente de correlacion del siguiente grupo de datos indica que:

a. Existe una relación lineal negativa y fuerte

¿Qué diagrama de dispersión corresponde a estos datos?


Que hay correlación nula

• Cuál es la utilidad de la prueba t de student para muestras relacionadas?


Comparar una característica de una sola muestra pero en dos circunstancias distintas

• De acuerdo al resultado obtenido en la prueba t de student para muestras


relacionadas que obtuviste en Excel:
La diferencia entre ambas calificaciones es significativa debido a que el valor de
significancia es menor 0.05 por lo tanto se acepta la hipótesis alterna es decir la
intervención educativa fue efectiva

• Errores pueden clasificarse en dos tipos: Sistemático y aleatorio

• En qué consiste la prueba de bondad de ajuste:


Se utiliza para la comparación de la distribución de una muestra con alguna distribución
teórica que se supone describe a la población de la cual se extrajo

• Fue y en qué año se propuso lo que se conoce actualmente como el test de chi
cuadrado?
Karl pearson 1900
• Si se trabaja con un 95% de confianza Eso quiere decir que Alfa es:
0,05

• Sexo sistólica significancia H 11 4,8 181818


m 11 2,1 363636
Qué resultado obtuviste?
0, 265

• Qué es simétrico en el intervalo de confianza?


Qué es la misma distancia

• Se aplicó una estrategia de enseñanza a un grupo para ver si se podía mejorar


el aprendizaje de una asignatura específica. Al aplicarse el examen
departamental la calificación del grupo fue de 8 y el promedio normal de años
anteriores es de 7.8. Al aplicar el estadístico de prueba se obtiene un valor de 3.4
437 y el valor de la tabla es de 3.373. La interpretación es:
Hay evidencia suficiente para decir que la estrategia mejora al aprendizaje

• Que es una estimación?


Una aproximación

Sexo Significancia sistólica H M


baja 1 4
normal 5 31
alta 5 9
Esta tabla le hice chi2 y salió:
2,4557E-06

• Qué prueba de normalidad es conveniente utilizar para muestras mayores a 30?


Kolmogorov-Smimov

• Estadísticos de prueba para comparar poblaciones con variables numéricas?


t de student

• Para probar la Ho: u=uo se utiliza el siguiente estadístico de prueba: t de student

• Estadístico(s) de prueba para comparar poblaciones con variab les categóricas


X2 y Z

• Estadístico de prueba utilizado para la comparación de una media muestral


respecto a una poblacional: t de student

• Para probar la Ho: p= ρo se utiliza el siguiente estadístico de prueba: Z

• Estadístico de prueba en la que únicamente se considera una cola para la


decisión estadística: X2

• Si se desea comparar la homogeneidad de dos poblaciones con respecto a una


variable se utiliza como estadístico de prueba: X2

• En una tabla de contingencia de 2 X 2 los grados de libertad a considerar para


buscar en tablas corresponde a: 1

• Cuando se tienen varias muestras independientes de n individuos que se


clasifican respecto a una variable cualitativa y se desea conocer a partir de datos
muestrales, si provienen de la misma población se utiliza como estadístico de
prueba: X2

• Al plantear como "Hipótesis nula: Las muestras son homogéneas" , para


probarla se utilizará como estadístico de prueba: X2

• Se aplicó una estrategia lúdica a un grupo para ver si se podía mejorar el


aprendizaje de una asignatura específica. Para medir el aprendizaje su utilizará
un examen y se compararán las calificaciones numéricas del grupo con relación
a la de todos los grupos del mismo nivel que realizaron la prueba el año anterior.
El estadístico de prueba a utilizar es: T de student

• es la fórmula para calcular: X2

• Se estudió la cantidad de niños que aprobó un examen con S, B y MB y se


comparó con la cantidad de niñas que obtuvieron las mismas calificaciones. El
estadístico de prueba a utilizar corresponde a: X2

• Se estudió la cantidad de niños que aprobó un examen con S, B y MB y se


comparó con la cantidad de niñas que obtuvieron las mismas calificaciones. La
hipótesis a probar corresponde a:

• Para obtener el valor Z de tablas se requiere. Considerar el valor de α

• Condiciones para el cálculo de la t de student


Tamaño de muestra mayor a 30
Distribución normal
variable numérica

• Si el valor de Z de tablas es de -1.964 y el Zcalculado corresponde a -3.22, la


decisión estadística es: Se rechaza Ho

• Realice este ejercicio e los datos que se le brinda en Excel, de datos que se
obtuvieron de las 50 personas encuestadas de las cuales se les pregunto
¿considera usted que ta utilizaba el cel con gran frecuencia antes de la
cuarentena?
El valor de P es? 0,254

• La elección de un sujeto es independiente de cualquier otra sería:


Muestreo aleatorio simple

• Para qué utilizamos a chi cuadrado? Para saber si las poblaciones son homogéneas
/ ninguna

• Cuando interesa conocer la relación o Independencia entre dos variables en una


población se utiliza como estadístico de prueba: X2

• Cuál es el problema práctico de una muestra? La representatividad

• Un error estándar= intervalo de confianza al 95%? No porque sumas y restas dos


estimadores
• En qué consiste la prueba de homogeneidad? Extraer muestras independientes de
varias poblaciones y se prueba para ver si son homogéneas

• Se cuantifican las ayudas visuales que contiene el libro de texto gratuito del
cuarto año de primaria por ejemplo diafragmas fotos esquemas y mapas y se
compara con respecto a lo recomendado en otros países en los que el estándar
indica que al menos el 30% del libro contenga este tipo de ayudas visuales. El
estadístico de prueba a utilizar es: Z

• Cuál es la utilidad de la prueba t de student para muestras relacionadas?


Comparar una característica de una sola muestra pero en dos circunstancias distintas.

• Cuál de los siguientes se considera un requisito para realizar la prueba de


T student? Qué las variables a comparar tengan una distribución normal.

• Distribución de chi cuadrado se deriva de la distribución? Normal

• En la prueba de hipótesis para determinar si dos variables cualitativas


son independientes o no, se plantea de la siguiente forma:
H0= las variables son independientes H1= las variables no son independientes

• El intervalo de confianza de la media requiere: Distribución T de student

• La fórmula de intervalos de confianza es: Estimador +/- EE del estimador

• Cuál es el tipo de error que tiene un defecto del instrumento de medición?


Sistemático

• Completa la frase: el error estándar es al estimador muestral lo que la desviación


estándar es: Individuo

• Qué es validez interna? Lo hallado coincida en la muestra que se estudie.

• Al realizar lo siguiente en minitab mediante los datos del archivo de Excel, que
datos que se obtuvieron de las 50 personas encuestadas de las cuales se les
pregunto ¿es el celular el dispositivo tecnológico que mas usa con mayor
frecuencia últimamente?
Con un 95% de confianza
No se rechaza H0

• El primer paso de la investigación consiste en : Medir

• 5. La "t" de student es el estadístico de prueba utilizado en: Muestras


independientes / muestras pareadas

• Cual es chi2

Se rechaza la hipótesis nula con valor de 12

• Saque el T de student del siguiente valor:


No rechazamos la hipótesis nula

• Distribución que consiste en una prueba de hipótesis medias, para una muestra
menor de 30. T de student

• Tenemos la siguiente tabla que refleja los datos de asignaturas de religión en los
centros escolares ¿influye el tipo de colegio en la nota obtenida? Con UM
margen de error 0,05

Se rechaza hipótesis nula dado que el Chi calculado es mayor

• A qué decisión se llega cuando el valor p es mayor que el nivel de significancia.


No rechazar la hipótesis nula

• Distribución que resulta de medir una variable aleatoria continua que resulta de
la suma de varias variables independientes. Chi cuadrado

• UNA MUESTRA ES REPRESENTATIVA CUANTO SE OBTIENE DE UN MUESTREO


...... aleatorio

• el intervalo de confianza es la región de: no rechazo a la hipótesis nula

• La hipótesis nula: se representa como Ho / contradice a la hipótesis de investigación

“Indique la afirmación FALSA sobre el ANOVA de una vía:

a. El test de Bartlett y el test de Levene no indican si se puede rechazar la hipótesis nula


(H0).”
b. Los residuales se obtienen restando el valor individual de cada sujeto de la media de
su grupo.
c. Los grados de libertad intragrupos (within) se obtienen restando el número total de
grupos (k) del número total de sujetos incluidos en el análisis (N).
d. La suma de cuadrados (SC) residual es el sumatorio de los residuales elevado al
cuadrado.
e. El cociente F se obtiene dividiendo la varianza intra (within) grupo entre la varianza
entre (between) grupos.

“Indique la afirmación FALSA sobre el ANOVA de una vía:

a. Se trata de un método paramétrico


b. Se utiliza cuando la variable independiente es cuantitativa y consta de al menos tres
valores diferentes.
c. Se cumplen los requisitos de aplicación cuando los residuales siguen una distribución
normal.
d. Los grados de libertad entre grupos (between) se obtienen restando 1 al número total
de grupos (k).” Incorrecta
e. Requiere homogeneidad de varianzas de la variable dependiente.

Indique la afirmación FALSA sobre el ANOVA de una vía:


Seleccione una:

a. Si el valor de p observado en el test de Bartlett o el de Levene es >0,05, se cumple uno


de los requisitos para poder utilizar el ANOVA de una vía.
b. En el caso de que la variable dependiente no siga una distribución normal, incluso si los
residuales siguen una distribución normal, no podemos utilizar el ANOVA de una vía.
c. Es el método paramétrico más habitualmente usado para comparar medias cuand o la
variable predictora consta de más de dos grupos.
d. El cociente F se obtiene dividiendo la varianza entre (between) grupos entre la varianza
intra (within) grupo.”
e. Precisa homogeneidad de varianzas

Indique la afirmación VERDADERA sobre el ANOVA de una vía:


Seleccione una:

a. Si utilizamos el ANOVA de una vía con una variable predictora con dos grupos en un
paquete estadístico, los resultados que obtendremos serán los mismos que si hubiésemos
utilizado una t de Student para dos muestras.
b. Si el valor de p observado en el test de Bartlett o el test de Levene es <0,05, esto indica
que podemos rechazar la hipótesis nula (H0) de igualdad de medias.
c. Si se tiene un tamaño muestral inferior a 30 sujetos, la presencia de heteroscedasticidad
indica que podemos utilizar el ANOVA de una vía.
d. Los grados de libertad intragrupos (within) se obtienen restando 1 al número total de
grupos (k).
e. Es el equivalente de la U de Mann-Whitney cuando la variable predictora consta de más
de dos grupos.”

“Cuál de las condiciones siguientes debe cumplirse en la comparación de una


proporción entre más de dos grupos, en la que se aplicará el test de la χ2?

a. Que no haya ninguna casilla con un valor esperado por debajo de 5.


b. Todas pueden ser ciertas, en función de la situación.”
c. Que el 80% de los valores esperados estén por encima de 5.
d. Ninguna es verdadera.
e. Que el 90% de los valores esperados estén por encima de 5.

¿De cuántos grados de libertad consta una tabla de contingencia en la que se


compara una proporción entre tres grupos?

Seleccione una:
a. Un grado de libertad.
b. No puede saberse, porque no se ofrece suficiente información.
c. Seis grados de libertad.
d. Dos grados de libertad.
e. Ningún grado de libertad.
A continuación se muestran las salidas correspondientes al test paramétrico y
no paramétrico que se pueden aplicar en esta muestra. En las siguientes
preguntas, el estudiante deberá completar los listados, independientemente de
que puede que no sea correcto aplicar ambos test. Finalmente, deberá decidir
cuál es la opción analítica adecuada.
Primera salida:”

Segunda salida

Indique cuál es la afirmación VERDADERA:

a. La primera salida corresponde a un ANOVA de una vía y la segunda, al test de Kruskal-


Wallis.
b. La primera salida corresponde al test de Kruskal-Wallis y la segunda, a un ANOVA de
una vía.
c. Ninguna
d. La primera salida corresponde a una t de Student y la segunda, a la U de Mann-
Whitney.
e. La primera salida corresponde a la U de Mann-Whitney y la segunda, a una t de
Student.
2. Si la edad de una población sigue una distribución normal, con una media de 40
años, y la varianza de la edad es de 25, ¿cuál es aproximadamente la
probabilidad de encontrar un individuo que tenga una edad superior a 30 años e
inferior a 50?
1. >0,99999.
2. 0,025.
3. 0,95.
4. <0,001.
5. Nada de lo anterior.
2. Los pacientes que desarrollan cardiopatía isquémica (CI) habían sido previamente
diagnosticados de hipertensión con más frecuencia (odds = 1,5) que los que no
desarrollan CI. En cambio, hay un hipertenso por cada nueve personas sin
hipertensión entre los que no desarrollan cardiopatía isquémica. Si el riesgo de
desarrollar cardiopatía isquémica a lo largo de la vida es del 20%, ¿qué porcentaje
de los hipertensos desarrollarán cardiopatía isquémica?
1. 0,6%.
2. 20%.
3. 80%.
4. Es imposible calcularlo con estos datos.
5. Nada de lo anterior.
Enunciado común para las preguntas 3-5. En un estudio llevado a cabo por Henquet
et al. y publicado en la revista BMJ en 2005, se valora, tras 4 años de seguimiento, si
la exposición a cannabis se asocia o no al desarrollo de síntomas psicóticos

3. La probabilidad marginal de padecer algún síntoma psicótico es:


1. 0,21.
2. 0,17.
3. 0,19.
4. 0,13.
5. Nada de lo anterior.
4. La probabilidad de padecer algún síntoma psicótico condicionada a haber fumado
cannabis ≥5 veces en la vida es:
1. 0,033.
2. 0,19.
3. 0,256.
4. 0,345.
5. Nada de lo anterior.
5. La odds de padecer algún síntoma psicótico condicionada a NO haber fumado
nunca cannabis es:
1. 0,33.
2. 1/5,26.
3. 1/0,19.
4. 0,45.
5. Nada de lo anterior
6. Se mide el IMC de todos los niños de un colegio y se o btiene una media de 21
kg/m2 y una desviación estándar de 3,1 kg/m2. Asumiendo que la variable IMC
siguiese una distribución normal, ¿entre qué dos valores de IMC estaría
aproximadamente el 90% central de los niños de ese colegio?
1. Entre 20,7 y 21,3 kg/m2.
2. Entre 15,9 y 26,1 kg/m2.
3. Entre 20,5 y 21,5 kg/m2.
4. Entre 16,9 y 21,8 kg/m2.
5. Entre 14,8 y 27,2 kg/m2.
Enunciado común para las preguntas 7-8. Se compara el diagnóstico clínico de
úlcera gastroduodenal y su hallazgo en la autopsia en una serie de 10.000 pacientes.
Al comenzar a analizar los datos, se construye la siguiente tabla:

7. De las siguientes cifras, ¿cuál es la más cercana a la probabilidad (en %) de


obtener un diagnóstico clínico de úlcera condicionada a que la autopsia hubiese
sido positiva?
1. 3%.
2. 43%.
3. 87%.
4. 98%.
5. 100%.
8. Si se considera que la autopsia proporciona la verdad sobre la presencia de
úlcera, ¿cuánto valdría aproximadamente el factor Bayes para un diagnóstico clínico
positivo?
1. 210.
2. 3/197.
3. 50,22.
4. 32,3.
5. 0,76.
9. ¿Cuál es la probabilidad de encontrar 90 o más pacientes nuevos de una
enfermedad rara en una población de 2.500 habitantes en la que se esperaba
observar 70 casos?
1. Únicamente es posible aplicar la binomial. En Excel: =DISTR.BINOM(90;2,5;0,7;
verdadero).
2. Se puede usar tanto la binomial como la Poisson, pero no puede usarse la
aproximación normal. 3. Se puede usar sólo la Poisson, ya que no nos dan el valor
de n, y para calcular la binomial hace falta n.
4. Podemos aproximarnos a la distribución de Poisson usando la normal y
obteniendo una z = +2,39.
5. Nada de lo anterior es correcto.

10. Si en un grupo de 400 pacientes la media de la hemoglobina es 14 g/l y su


desviación estándar es 2, ¿cuál es la probabilidad de encontrar un paciente que
tenga un valor de hemoglobina superior o igual a 18 g/l?
1. 0,028.
2. El correspondiente a un valor z = +2.
3. 1) y 2) son ciertas.
4. 0,001.
5. Faltan datos para contestar.
Enunciado común para las preguntas 11-15. A una muestra de 8.000 mujeres se les
realiza una mamografía. La probabilidad de que la mamografía dé positiva si tienen
cáncer de mama es del 83%, y la probabilidad de que la mamografía resulte negativa
condicionada a no tener cáncer de mama es del 95%. Si se asume que de cada
1.000.000 mujeres hay 8.125 que realmente tienen cáncer de mama:
11. ¿Cuál es la probabilidad marginal de no tener cáncer de mama?
1. 0,942.
2. 0,992.
3. 0,943.
4. 0,049.
5. 0,052.
12. ¿Cuál es la probabilidad de no tener cáncer de mama condicionada a que la
mamografía resulte negativa?
1. 0,99.
2. 0,126.
3. 0,136.
4. 4,9.
5. Ninguna de las anteriores
13. ¿Cuál es el factor Bayes para una mamografía positiva?
1. 15,2.
2. 54.
3. 64%.
4. 16,6.
5. 0,87
14. ¿Cuál es la odds previa de desarrollar cáncer de mama?
1. 0,0082.
2. 1/0,0082.
3. p(CM | nCM).
4. 0,00145.
5. 0,059.
15. ¿Cuál es la odds posterior (a un test positivo) de desarrollar cáncer de mama?
1. 0,88.
2. 0,88/0,12.
3. 0,137.
4. 0,67.
5. 0,12.
16. En una población del norte de Europa, el 33% de los habitantes sufren depresión.
El 45% de los depresivos come menos de cinco piezas de fruta a la semana; en
cambio, entre los no depresivos, únicamente el 15% come menos de cinco piezas de
fruta a la semana. ¿Cuál es la probabilidad de que una persona que come menos de
cinco piezas de fruta a la semana tenga depresión? Aplique el teorema de Bayes.
1. 40%.
2. 45%.
3. 65%.
4. 55%.
5. 60%.
17. ¿Qué devuelve STATA cuando se ejecuta display normal ( –1.89)?
1. El valor z correspondiente a ese valor (x).
2. La distancia (medida en número de desviaciones estándar) a la que se
encuentra ese valor de la media.
3. El porcentaje de valores inferiores a z = 1,89 en una distribución normal perfecta.
4. La probabilidad de estar a 1,89 o más desviaciones estándar por debajo de la
media en una distribución normal.
5. Un área bajo la curva correspondiente a 1 − 0,89 = 0,11.
18. ¿Cómo se interpreta el valor −1,175 que devuelve STATA cuando se le pide
display invnormal(0.12)?
1. Hay un 12% de los valores que están al menos a 1,175 desviaciones estándar
por debajo de la media.
2. El 76% de los valores están en el rango comprendido por la media ±1,175
desviaciones estándar.
3. El 88% de valores están por encima del valor z = −1,175.
4. La probabilidad de encontrar un valor separado (en uno u otro sentido) 1,175 o
más desviaciones estándar de la media es del 0,24.
5. Todas las anteriores.
19. En una población el glaucoma tiene una incidencia del 2%. ¿Cuál es la
probabilidad exacta de encontrar un sujeto con glaucoma en una muestra aleatoria
de tamaño n = 200
1. di poisson(4,1).
2. di poissonp(4,1).
3. di binomialp(200,1,4).
4. di binomial(200,1,0.02).
5. di binomialp(200,1,0.02).
Enunciado común para las preguntas 20-23. Se han registrado un total de 3.700
accidentes de tráfico. Había 2.600 accidentados que no habían consumido drogas.
Sin embargo, iban a más velocidad de la permitida 3.150 conductores, de los cuales
783, además, también habían consumido drogas.
20. ¿Cuál es la probabilidad de que un conductor no hubiese consumido drogas ni
que tampoco condujese a más velocidad de la permitida?
1. 0,063.
2. 0,083.
3. 0,073.
4. 0,94.
5. Nada de lo anterior
21. ¿Cuál es la probabilidad de que un conductor hubiese consumido drogas pero
condujese a la velocidad permitida?
1. 0,063.
2. 0,086.
3. 0,09.
4. 0,5.
5. Nada de lo anterior.
22. ¿Cuál es la probabilidad de que un conductor hubiese consumido drogas o
condujese a más velocidad de la permitida?
1. 0,063.
2. 0,083.
3. 0,21.
4. 0,94.
5. Nada de lo anterior.
23. ¿Ir drogado e ir a más velocidad de la permitida son sucesos independientes?
1. Sí, porque la probabilidad condicionada es igual a la marginal.
2. Sí, porque p(D | V) ≈ p(D | nV).
3. Sí, porque ir a más velocidad no influye sobre haberse drogado.
4. No, puesto que p(D | V) ≠ p(D).
5. Sí, puesto que .
24. Si en un estudio donde la probabilidad marginal de fumar es del 23,5%, el 20% de
los hombres fuma y el 25% de las mujeres fuma. ¿Cuál es la proporción de hombres
del estudio?
1. 70%.
2. 40-60%.
3. 35%.
4. 30%.
5. No lo podemos saber.
25. El 33% de las personas de una población tiene hipertensión. ¿Cómo se obtendría
con STATA la probabilidad de encontrar al menos ocho hipertensos de 30 personas
seleccionadas al azar?
1. di binomialp(30,7,0.33).
2. di 1-binomial(0.33,30,8).
3. di binomial(30,8,0.33).
4. di binomial(30,7,0.33).
5. di 1-binomial(30,7,0.33)
26. Si en STATA se ejecuta la orden sktest peso y se obtiene la siguiente salida:.
1. El test de normalidad resultó significativo: Pr(skewness) = 0,5398; por tanto, la
variable peso sigue una distribución normal.
2. El test de normalidad no es significativo (p = 0,3); por tanto, no se puede asumir
que la variable peso siga una distribución normal.
3. Como el valor p es significativo [Pr(skewness) = 0,5398], se asume que la
variable peso sigue una distribución normal.
4. Como p > 0,05, no hay evidencia para rechazar la hipótesis nula de normalidad.
5. Como p > 0,05, no hay evidencia para rechazar la hipótesis nula; por tanto, no
puede asumirse que la variable peso siga una distribución normal

________________________________________________________________________
1. Se estudia un nuevo método de menor coste para valorar la concentraci ón de un
biomarcador en plasma. Para ello se comparan los resultados con la técnica de
referencia, más laboriosa, compleja y costosa. Indique cuál es la afirmación
verdadera:
1. Si la nueva prueba mide valores que son un 30% superiores a la técnica de ref erencia,
se trata de un error de precisión.
2. Si las mediciones obtenidas con la nueva técnica tienen un coeficiente de variación del
50% intersujetos, a la nueva técnica le faltará validez.
3. Para obtener el coeficiente de variación es preciso dividir la varianza entre la media de
las mediciones.
4. La presencia de errores sistemáticos implica una falta de precisión.
5. Todas son falsas.

2. Indique la respuesta verdadera:


1. El coeficiente de variación no es una medida útil para valorar errores aleatorios.
2. Un coeficiente de variación elevado implica la ausencia de validez.
3. Una falta de validez conlleva obligatoriamente una falta de precisión.
4. Un bajo coeficiente de variación intrasujetos no es indicativo de falta de precisión.
5. Todas las afirmaciones son verdaderas.

3. Indique cuál es la afirmación verdadera:


1. La estadística estudia y ofrece métodos para valorar la validez externa de los estudios.
2. La epidemiología estudia y ofrece métodos para valorar la validez interna de los
estudios.
3. El error de muestreo es sistemático.
4. Para valorar la validez externa de un estudio debe aplicarse el conocimiento biológico
sobre el objeto y las asociaciones de estudio y, por tanto, no siempre la ausencia de
representatividad implica la ausencia de validez externa.
5. Todas las afirmaciones son verdaderas.

4. Indique la afirmación FALSA sobre la aleatorización (randomization):


1. Implica que se distribuye la muestra del estudio al azar en dos o más grupos.
2. Tras una aleatorización simple 1:1, los grupos presentarán un número exactamente
similar de sujetos.
3. Se aplica en los ensayos clínicos.
4. La aleatorización de 100 sujetos en cinco grupos (placebo y cinco dosis diferentes) en
un ensayo clínico garantiza que los grupos sean similares y, por tanto, los sujetos en cada
uno de los grupos únicamente se diferenciarán en la intervención aplicada.
5. Es equivalente a la selección aleatoria de una muestra.

5. En relación con los intervalos de confianza, indique cuál es la afirmación FALSA:


1. El intervalo de confianza contiene una serie de valores que se confía en que contengan
el verdadero parámetro poblacional.
2. Para calcular el intervalo de confianza es preciso calcular en la muestra el estimador
apropiado y el error estándar.
3. El error estándar empleado para calcular intervalos de confianza y contrastes de
hipótesis es un indicador de la variabilidad de los individuos.
4. Un intervalo de confianza al 95% se suele obtener al restar y sumar el error estándar
multiplicado por 1,96.
5. Para calcular un intervalo de confianza al 90% se suele restar y sumar el error estándar
multiplicado por 1,645.

6. Se está estudiando si los traumatismos craneales incrementan el riesgo de


desarrollar demencia. ¿Cuál de las siguientes afirmaciones es FALSA?
1. La hipótesis nula (H0) es que los traumatismos craneales no incrementan el riesgo de
presentar demencia.
2. Un error tipo 2 consiste en concluir que los traumatismos craneales no incrementan el
riesgo de demencia cuando fuese cierto que sí lo incrementan, y su probabilidad equivale
a la potencia.
3. La hipótesis alternativa (H1) es que los traumatismos craneales incrementan el riesgo
de presentar demencia.
4. Un error tipo 1 consiste en concluir que los traumatismos craneales incrementan el
riesgo de demencia cuando esto fuese falso y su probabilidad equivale a α.
5. Para poder rechazar la hipótesis nula, el valor de p debe ser inferior a α.

7. Indique la afirmación verdadera al valorar los resultados de un estudio:


1. Se rechaza la hipótesis nula y se acepta la hipótesis alternativa cuando el valor de p
obtenido es inferior a α, independientemente del número de comparaciones.
2. En general, está indicado realizar test estadísticos a una cola.
3. El intervalo de confianza ofrece información sobre la significación estadística y la
potencia estadística del estudio.
4. Al aumentar la confianza, se estrechará un intervalo de confianza.
5. Los valores p suelen ser más informativos que los intervalos de confianza.

8. Sobre el valor p, indique la afirmación FALSA.


1. El valor p depende del tamaño de la muestra.
2. El valor p depende de la magnitud del efecto.
3. El valor p no indica si los resultados son clínicamente significativos.
4. El valor p indica la probabilidad de que la hipótesis nula sea FALSA.
5. El valor p no es directamente indicativo de la magnitud del efecto hallado.

9. Un artículo de una revista científica informa de que el intervalo de confianza al


95% del nivel medio de colesterolemia en los adultos atendidos en un centro de
salud es 192-208. Se aceptó que la variable tenía una distribución normal y el
número de pacientes estudiados fue 100. ¿Cuál de las siguientes afirmaciones es
FALSA?
1. La confianza de que el nivel medio poblacional esté comprendido entre 192 y 208 es del
95%.
2. Si la media poblacional coincidiese con la muestral y se repitiese el estudio muchas
veces, en un 95% de ellas se obtendría una media muestral comprendida entre 192 y 208.
3. El 95% de los adultos de la población tiene un nivel de colesterolemia comprendido
entre 192-208.
4. La media muestral encontrada en el estudio es de 200.
5. La desviación típica muestral encontrada en el estudio es aproximadamente 40.

10. Se trató con un suplemento dietético más dieta a 15 pacientes con insuficiencia
renal, y solamente con dieta a 16. Se compararon entre ambos grupos unas 100
variables y en seis de tales comparaciones se encontraron diferencias significativas,
para el nivel nominal del 5%, a favor del suplemento. ¿Cómo interpretaría estos
resultados?
1. El estudio parece no concluyente, ya que con tantas comparaciones es esperable que
unas pocas resulten significativas para el nivel nominal del 5%, aunque no haya difere ncia
entre los tratamientos.
2. El suplemento dietético es moderadamente eficaz.
3. Este estudio no demuestra nada, ya que a priori se sabe que la hipótesis nula es cierta.
4. Aunque el número de pacientes fuese pequeño, lo inocuo del tratamiento y la
consistencia de los resultados aconsejan prescribir el suplemento en la insuficiencia renal.
5. Este estudio no demuestra nada, ya que hay más variables que pacientes.

11. En un ensayo clínico se asignaron 132 pacientes con linfoma no hodgkiniano a


dos pautas distintas de tratamiento. Con una de ellas se obtuvo un 64% de
remisiones y con la otra un 63%. Los límites del intervalo de confianza al 95% de la
reducción del riesgo absoluto oscilaron entre –19,8 y 15,5%. ¿Cómo interpretaría
usted este resultado?
1. El estudio ha demostrado que ambos tratamientos son similares.
2. El estudio ha demostrado que uno de los tratamientos es superior.
3. El estudio no ha sido capaz de dilucidar si alguno de los tratamientos es superior.
4. El estudio es ininterpretable, ya que no indica si las diferencias son estadísticamente
significativas.
5. El estudio es ininterpretable sin conocer si se hizo a doble ciego o no.

12. Se comparan dos tratamientos A y B. El valor p de significación estadística (a


dos colas) resulta ser p = 0,09. ¿Cuál es la interpretación?
1. Se ha demostrado la igualdad de ambos tratamientos, pues las diferencias no son
estadísticamente significativas.
2. El intervalo de confianza para la diferencia entre A y B excluirá el valor 0.
3. La hipótesis nula tiene una baja probabilidad de ser verdad; esta probabilidad es del 9%.
4. Si se hubiese usado un test a una cola (poco aconsejable), el resultado probablemente
sería significativo.
5. Hay un 91% de probabilidades de que uno de los dos tratamientos sea mejor.

________________________________________________________________________

1. Un grupo de investigación en oftalmología desea comparar dos tip os de colirios


administrando uno en cada ojo de un mismo paciente. Señale el test estadístico más
apropiado que debería emplearse en este estudio.
1. Test de la ji cuadrado (χ2) de Pearson.
2. Test de la χ2 de tendencia lineal.
3. Test exacto de Fisher.
4. Test de la t de Student.
5. Test de McNemar.

2. Se desea comparar si la existencia de deterioro del estado general en una serie de


pacientes con cáncer de próstata [Columnas: 1 (sí); 2 (no)] difiere en función de que
se hayan desarrollado o no metástasis [Filas: 1 (sí); 2 (no)]. Se hace un análisis
estadístico con el programa STATA y el resultado es:

¿Cuál es la interpretación más adecuada de este resultado?


1. Las diferencias no son estadísticamente significativas y, por tanto, el mayor deterioro del
estado general de los pacientes con metástasis es debido al azar.
2. Si el hecho de tener metástasis influyera en el deterioro del estado general de un
paciente, la probabilidad de encontrar estos resultados sería del 5,7%.
3. El porcentaje de pacientes sin metástasis que tienen deterioro del estado general es
inferior al 6%.
4. La probabilidad de que las metástasis no tengan influencia en el deterioro del estado
general es del 5,7%.
5. Si las metástasis y el deterioro del estado general no estuviesen relacionados, la
probabilidad de encontrar estos resultados u otros todavía más alejados de la hipótesis
nula sería del 5,7%.

3. ¿Cuál de las condiciones siguientes debe cumplirse en la comparación de una


proporción entre más de dos grupos, en la que se aplicará el test de la χ2?
1. Que no haya ninguna casilla con un valor esperado por debajo de 5.
2. Que el 90% de los valores esperados estén por encima de 5.
3. Que el 80% de los valores esperados estén por encima de 5.
4. Ninguna es verdadera.
5. Todas pueden ser ciertas, en función de la situación.

4. ¿De cuántos grados de libertad consta una tabla de contingencia en la que se


compara una proporción entre tres grupos?
1. Un grado de libertad.
2. Dos grados de libertad.
3. Ningún grado de libertad.
4. No puede saberse, porque no se ofrece suficiente información.
5. Seis grados de libertad.

5. ¿Cuál es el test estadístico que debería utilizarse para comparar las proporciones
de pacientes con cáncer de pulmón entre cinco categorías de pacientes en función
de su consumo de cannabis (nunca lo han probado; menos de 5 veces; de 5 -50
veces; más de 50 veces, pero no a diario; fuman a diario)?
1. Test exacto de Fisher.
2. Test de tendencia lineal.
3. Test de la χ2 de Pearson.
4. Test de McNemar.
5. Ninguno.

6. Al estudiar los factores de riesgo del cáncer de cuello uterino en mujeres de la


India se encontró una mayor frecuencia de relaciones sexuales extramaritales en las
mujeres con este cáncer (n = 134) que en los controles sanos (n = 134). Si los casos
y controles no se buscaron por parejas, sino separadamente, ¿qué método
estadístico es más adecuado para tratar estos datos?
1. χ2 de Pearson.
2. Test de McNemar.
3. U de Mann-Whitney.
4. Test de Friedman.
5. Test de la t de Student para medidas repetidas.

7. Los datos del estudio de los factores de riesgo del cáncer de cuello uterino en
mujeres de la India (v. cuestión 6) se muestran en la siguiente tabla generada
mediante el programa STATA:

Columnas: 1 (casos), 2 (controles); filas: 1 (relaciones extramaritales), 2 (sin


relaciones extramaritales).
Calcule el valor del test más adecuado teniendo en cuenta que no existe
emparejamiento entre casos y controles.
1. 6,74.
2. 12,7.
3. 81,92.
4. 105,3.
5. 2,032.
8. En un estudio de casos y controles sobre anticonceptivos orales e infarto de
miocardio en mujeres de 30 a 45 años, para cada caso de infarto se ha buscado otra
mujer control de la misma edad. Se averigua su exposición a anticonceptivos orales.
¿Cuál es el valor del test de la χ2 de McNemar?
1. χ2 = 0,16.
2. χ2= 0,45.
3. χ2= 63,9.
4. χ2= 71,8.
5. χ2= 0,24.

9. Un grupo de pacientes con déficit inmunitario ingresados en tres plantas distintas


de un hospital presentan la siguiente distribución de infección oportunista:
¿Es estadísticamente significativa la diferencia observada?
1. Sí, ya que χ2 = 6,7 con una p < 0,05.
2. No, ya que χ2 = 1,7 con una p > 0,05.
3. Sí, ya que χ2 = 7,5 con una p < 0,01.
4. No, ya que χ2 = 2,92 con una p > 0,05.
5. Sí, ya que χ2 = 0,56 con una p < 0,01.

10. En un estudio de casos y controles sobre leucemia y exposición a benceno, para


cada caso de leucemia se ha buscado un control de la misma edad y sexo. Se
averigua su exposición a benceno. En la siguiente tabla, ¿cuál es el valor del test de
la χ2 de McNemar?

1. χ2= 1,29.
2. χ2= 2,77.
3. χ2= 3,48.
4. χ2= 4,66.
5. χ2= 7,23.

Enunciado común para las preguntas 11-15. Se ha obtenido con STATA el siguiente
resultado al relacionar el consumo de alcohol (1 = bebedores, 0 = abstemios) con el
riesgo de enfermedad cardiovascular (ECV , 1 = sí, 0 = no).

11. ¿A qué tipo de test estadístico pertenecen estos resultados?


1. Comparación de más de dos proporciones.
2. χ2 de tendencia lineal.
3. Test exacto de Fisher.
4. Comparación de dos proporciones emparejadas.
5. Nada de lo anterior.

12. ¿Cuánto vale la diferencia de proporciones de enfermedad cardiovascular entre


bebedores y abstemios?
1. 204-430.
2. 430-204.
3. 0,0391-0,0317.
4. 0,0391-0,0227.
5. Faltan datos para contestar.

13. Si se calculase un test de la χ2 de Pearson, ¿cuánto va ldría el valor esperado


para la casilla de abstemios con enfermedad cardiovascular?
1. <5.
2. 5-50.
3. 51-100.
4. 101-500.
5. >500.

14. ¿Qué orden se ha dado a STATA para lograr este análisis?


2. di chi2tail (1,43.5017).
2. tab alcohol ECV; chi2 row.
3. tab alcohol ECV; chi2 col.
4. prtest ECV ,by (alcohol).
5. Ninguna de ellas.

15. ¿Qué orden habría que dar a STATA para lograr el intervalo de confianza al 95%
para la diferencia de proporciones de enfermedad cardiovascular entre bebedores y
abstemios?
1. di chi2tail (1,43.5017).
2. tab alcohol ECV; chi2 row.
3. tab alcohol ECV; chi2 col.
4. prtest ECV , by (alcohol).
5. Ninguna de ellas.
________________________________________________________________________
1. Se compara el colesterol total sérico de un grupo de obesos (grupo obeso = 1)
con el colesterol total sérico de individuos no obesos (grupo obeso = 0). El
resultado que aparece en el ordenador es:

1. Señale la interpretación correcta de los resultados:

1. Si los obesos tuviesen la misma concentración de colesterol total en sangre que los no
obesos, la probabilidad de hallar al menos tanta diferencia entre las medias de ambos
grupos como la observada sería del 2,9%.
2. La probabilidad de que los obesos no tengan la misma concentración de colesterol total
en sangre que los no obesos es del 98,55%.
3. Solo un 2,9% de la población de no obesos tiene iguales concentraciones de colesterol
sérico que la población de obesos.
4. Solo un 2,9% de la población de no obesos tiene igual o más concentración de
colesterol sérico que la población de obesos.
5. Solo en un 2,9% de las muestras tomadas de una población donde la mitad fuesen
obesos y la otra mitad no lo fuesen, se encontrarían tales o mayores diferencias en la
concentración de colesterol sérico.
2. En un ensayo clínico, a una serie de pacientes (n = 200) se les t rata con un nuevo
fármaco para estudiar si, en un período de tiempo después de la administración de
dicho fármaco, el nivel de ácido úrico en sangre (mg/dl) ha disminuido. Para este
diseño, ¿cuál es la prueba estadística de elección?
1. t de Student para muestras independientes.
2. Test de Wilcoxon.
3. t de Student para muestras relacionadas.
4. U de Mann-Whitney.
5. Es imprescindible comprobar la normalidad de la variable ácido úrico para contestar a
esta pregunta.

3. Se desea saber si los niveles de adhesión a la dieta mediterránea (bajo/medio/alto)


son iguales entre una muestra de sujetos hipertensos (n = 55) y una muestra de
controles no hipertensos extraídos de la población general (n = 110). ¿Qué prueba
estadística se empleará?
1. U de Mann-Whitney.
2. t de Student para muestras relacionadas.
3. Test de Wilcoxon.
4. t de Student para muestras independientes.
5. Es imprescindible comprobar la normalidad de la variable dependiente para contestar a
esta pregunta.

4. Se compara la tensión arterial sistólica (mmHg) en unos pacientes (n = 20)


asignados para seguir un programa de cambios en el estilo de vida al inicio del
estudio y al cabo de 3 meses. Para analizar los datos emplearemos:1. U de Mann-
Whitney.
2. t de Student para muestras relacionadas.
3. Test de Wilcoxon.
4. t de Student para muestras independientes.
5. Es imprescindible comprobar antes la normalidad de la variable tensión arterial sistólica
para poder contestar a esta pregunta.

Las preguntas 5-10 se refieren a los siguientes datos: se desea determinar si existen
diferencias entre la media de índice de masa corporal (IMC) en una muestra de 500
sujetos en función de la variable estado civil (1 = casado/2 = no casado). Asumiendo
que la variable IMC sigue una distribución normal, y tras comprobar que las
varianzas son homogéneas, se obtiene la siguiente tabla en STATA.

5. En la comparación anterior, si se emplease un test paramétrico, ¿cuántos grados


de libertad tendría?
1. 289.
2. 209.
3. 499.
4. 498.
5. Nada de lo anterior.
6. ¿Cuál sería el test indicado?
1. U de Mann-Whitney.
2. t de Student para muestras relacionadas.
3. Test de Wilcoxon.
4. t de Student para muestras independientes.
5. Ninguno de los anteriores.

Con los datos de la pregunta anterior se ha obtenido el siguiente listado con STATA,
donde se han sustituido algunas de las cantidades del resultado por letras.

7. ¿Cuánto vale a?
1. 0,29.
2. 10,22.
3. 3,20.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.

8. ¿Cuánto vale b?
1. 2,35.
2. 6,14.
3. 1,21.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.

9. ¿Cuánto vale c?
1. 2,35.
2. 6,14.
3. 1,21.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.

10. ¿Cuánto vale d?


1. 2,35.
2. 6,14.
3. 1,21.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.
Enunciado común para las preguntas 11-12: se desea comparar si una determinada
mutación (mutado = 1 si tiene la mutación y mutado = 0 si no la tiene) se asocia a
consumir un mayor porcentaje de grasa en la dieta (grasa = % de calorías que
proceden de grasa). No se puede asumir la normalidad. Hay 25 sujetos mutados y 40
no mutados en la muestra. Se han obtenido los siguientes resultados con STATA:

11. Se deberá aplicar:


1. U de Mann-Whitney.
2. t de Student para muestras relacionadas.
3. Test de Wilcoxon.
4. t de Student para muestras independientes.
5. Ninguno de los anteriores.

12. Se concluirá que:


1. Hay diferencias estadísticamente significativas (z = –5,15) y podrá concluirse que
consumen significativamente mayor porcentaje de grasa los mutados que los no mutados.
2. Las diferencias se aproximan a la significación estadística (p = 0,121), pero no llegan a
estar por debajo del 5%, y por eso el intervalo de confianza al 95% incluirá el valor nulo.
3. No hay evidencias para rechazar la hipótesis nula de igualdad de medias.
4. El intervalo de confianza al 95% indica que los mutados consumen entre un 3,7 y un
6,9% más de grasa, con diferencias estadísticamente significativas (t = –6,7).
5. Los no mutados consumen significativamente más grasa, con p < 0,0001 (z = –7,026),
de modo que, si las poblaciones de mutados y no mutados consumiesen realmente
idéntico porcentaje de grasas, habría una probabilidad inferior al 0,01% de observar estas
diferencias u otras todavía mayores.
1. Queremos estimar el porcentaje de vacunados contra la gripe en una región. En
otras regiones encontramos que la proporción de vacunados es del 40%. Si fijamos
un error alfa (bilateral) del 5%, ¿cuál será el tamaño de la muestra más aproximado
al necesario para dicha estimación, si se desea tener una precisión de ±10%?
1. 93.
2. 48.
3. 100.
4. 30.
5. Nada de lo anterior.
2. Supongamos que la proporción (prevalencia) estimada de caries de un colegio es
de 500 por 1.000 y de 300 por 1.000 en otro. ¿Cuál será el número de niños de cada
colegio que más se aproxime al tamaño muestral necesario para determinar si la
diferencia entre ambos es significativa con un error alfa (bilateral) del 5%?
Deseamos tener un 80% de probabilidades de encontrar esa diferencia si fuese real.
1. 81.
2. 93.
3. 124.
4. 190.
5. 1.805.

3. Se diseña un estudio para medir el efecto de una dieta baja en sodio sobre la
presión arterial sistólica. En un estudio piloto se observó que la desviación estándar
del cambio en presión sistólica en ambos tipos de pacientes era de 12 mmHg. Si α
(bilateral) = 0,05 y β = 0,1, ¿cuál será el tamaño mínimo de muestra en cada grupo
necesario para detectar una diferencia mínima de al menos 2 mmHg en la presión
sistólica?
1. 1.314.
2. 328.
3. 756.
4. 120.
5. 55.

4. Se desea conocer el tamaño de muestra de un estudio para poder estimar el peso


(en kilogramos) medio de los habitantes de una población. La media y la desviación
estándar esperadas son 80 y 10, respectivamente. Establecemos un margen de error
de 2 y un error alfa bilateral de 0,05. ¿Cuál de los siguientes resultados es el
correcto?
1. 30.
2. 90.
3. 98.
4. 192.
5. 200.

5. En un estudio en el que se investigaba el efecto de una técnica analgésica sobre


el dolor (escala de dolor) de los pacientes se afirmaba que, después de un estudio
piloto, la desviación estándar fue de 13 puntos en la escala de dolor. Con un error
alfa bilateral de 0,05 y un error beta de 0,1, 35 pacientes fueron requeridos en cada
grupo para completar el estudio. ¿Cuál es la diferencia mínima que se deseaba
encontrar?
1. 3 puntos.
2. 51 puntos.
3. 9 puntos.
4. 30 puntos.
5. 10 puntos.

6. Se desea comparar en un ensayo clínico el efecto de dos fármacos sobre la media


de la presión arterial sistólica. Los supuestos son: • Se d ecide que la mínima
diferencia que nos interesa detectar es de 4 mmHg. • El error alfa (bilateral) se fija en
el 5%. • La potencia se fija en el 80%. • La desviación estándar(s)que se espera que
va a tener el cambio en la presión arterial sistólica es de 1 0 mmHg. El tamaño
muestral requerido encada uno de los dos grupos será:
1. 100 en cada grupo.
2. 95 en cada grupo.
3. 52 en cada grupo.
4. 39 en cada grupo.
5. Nada de lo anterior.

7. El tamaño muestral para comparar dos proporciones sería menor si


disminuyéramos:
1. La potencia.
2. El tamaño de la población diana.
3. La diferencia entre proporciones.
4. El error alfa.
5. Son ciertas 1 y 2.

8. En una operación quirúrgica murió un 10% de los pacientes. Una nueva técnica
puede reducir esta proporción. Para ello, asignamos a los nuevos pacientes, de
forma aleatoria, a la técnica estándar o a la nueva. ¿A cuántos sujetos se necesitaría
estudiar para detectar, con una potencia del 80% y un riesgo α = 0,1 (0,05 en cada
cola), una reducción de la mortalidad al menos a la mitad (mortalidad = 5% con la
nueva técnica)?
1. 344.
2. 345.
3. 686.
4. 254.
5. Nada de lo anterior.

9. En un estudio de seguimiento se detectaron 25 muertes en el grupo control (n =


50) y 22 en el grupo experimental (n = 50). Si el error alfa es de 0,025 en cada cola
(alfa bilateral = 0,05), ¿cuál de las siguientes se aproximaría más a la potencia
estadística para esta comparación?
1. 0%.
2. 8,7%.
3. 5,2%.
4. 80%.
5. 91,2%.

10. Se comparan 100 controles (pacientes hipertensos sin dislipemia) frente a otros
100 con hipertensión e hiperlipemia tratados con un fármaco que puede tener acción
frente a la proteína C reactiva (PCR). Se espera una media en el cambio de PCR = –
0,17 (desviación estándar 0,2) mg/l en el grupo sometido a tratamiento y de +0,14
(desviación estándar 0,2) mg/l en el grupo control. Asumiendo un error alfa del 0,05
(bilateral), ¿cuál es la potencia del estudio para detectar esta diferencia?
1. <10%.
2. Entre el 10 y el 25%.
3. Entre el 26 y el 50%.
4. Entre el 50 y el 80%.
5. >80%.

11. Se obtiene la siguiente salida de STATA:

¿Cuál es la interpretación correcta de esta salida?


1. Se ha calculado el tamaño de la muestra para una potencia del 78,37%.
2. El tamaño de la muestra total necesario es 240.
3. Se asume un error alfa del 50%.
4. Se ha establecido que el número sea igual en ambos grupos.
5. La diferencia de proporciones es de 0,15.

12. Leemos un artículo donde se estudió a 500 mujeres con cáncer de mama (CM) de
entre las cuales 250 consumían anticonceptivos orales (AO). En las 500 mujeres
control (sin CM) estudiadas, había 100 expuestas a AO. Las diferencias resultaron
estadísticamente significativas (p = 0,015). Asumiendo un error alfa bilateral del 5%,
¿cuál es el valor más aproximado a la potencia de este estudio?
1. 8%.
2. 20%.
3. 40%.
4. 80%.
5. 100%.
__________________________________________________________
1. Indique la afirmación FALSA sobre el ANOVA de una vía:
1. Se utiliza cuando la variable independiente es cuantitativa y consta de al menos tres
valores diferentes.
2. Se cumplen los requisitos de aplicación cuando los residuales siguen una distribució n
normal.
3. Se trata de un método paramétrico.
4. Requiere homogeneidad de varianzas de la variable dependiente.
5. Los grados de libertad entre grupos (between) se obtienen restando 1 al número total de
grupos (k).

2. Indique la afirmación VERDADERA sobre el ANOVA de una vía:


1. Si el valor de p observado en el test de Bartlett o el test de Levene es <0,05, esto indica
que podemos rechazar la hipótesis nula (H0) de igualdad de medias.
2. Los grados de libertad intragrupos (within) se obtienen restando 1 al número total de
grupos (k).
3. Si se tiene un tamaño muestral inferior a 30 sujetos, la presencia de heteroscedasticidad
indica que podemos utilizar el ANOVA de una vía.
4. Si utilizamos el ANOVA de una vía con una variable predictora con dos gr upos en un
paquete estadístico, los resultados que obtendremos serán los mismos que si hubiésemos
utilizado una t de Student para dos muestras.
5. Es el equivalente de la U de Mann-Whitney cuando la variable predictora consta de más
de dos grupos.

3. Indique la afirmación FALSA sobre el ANOVA de una vía:


1. Los grados de libertad intragrupos (within) se obtienen restando el número total de
grupos (k) del número total de sujetos incluidos en el análisis (N).
2. Los residuales se obtienen restando el valor individual de cada sujeto de la media de su
grupo.
3. La suma de cuadrados (SC) residual es el sumatorio de los residuales elevado al
cuadrado.
4. El cociente F se obtiene dividiendo la varianza intra (within) grupo entre la varianza
entre (between) grupos.
5. El test de Bartlett y el test de Levene no indican si se puede rechazar la hipótesis nula
(H0).

4. Indique la afirmación FALSA sobre el ANOVA de una vía:


1. Es el método paramétrico más habitualmente usado para comparar medias cuand o la
variable predictora consta de más de dos grupos.
2. Precisa homogeneidad de varianzas.
3. En el caso de que la variable dependiente no siga una distribución normal, incluso si los
residuales siguen una distribución normal, no podemos utilizar el ANOVA de una vía.
4. Si el valor de p observado en el test de Bartlett o el de Levene es >0,05, se cumple uno
de los requisitos para poder utilizar el ANOVA de una vía.
5. El cociente F se obtiene dividiendo la varianza entre (between) grupos entre la varianza
intra (within) grupo.

5. Indique la afirmación VERDADERA sobre el test de Kruskal-Wallis:


1. Se trata de un test paramétrico.
2. Compara las medias de los grupos.
3. Se debe utilizar cuando la variable dependiente es ordinal.
5. Permite estimar de manera directa intervalos de confianza.

Enunciado común para las cuestiones 6-15. Para los siguientes problemas se
utilizarán datos de un biomarcador (proteína tau fosforilada, p -tau) medido en el
líquido cefalorraquídeo de controles cognitivamente normales, pacientes con
deterioro cognitivo ligero (DCL) y pacientes con enfermedad de Alzheimer (EA) en
laAlzheimer’s Disease Neuroimaging Initiative(ADNI). El objetivo de la investigación
era evaluar si los valores de p-tau difieren en los tres grupos.
6. Indique la afirmación FALSA en relación con el objetivo del estudio:
1. La variable independiente es categórica y consta de tres grupos.
2. La variable dependiente es cuantitativa.
3. Para describir estos datos se debería emplear la mediana y cuartiles.
4. Los datos indican que el supuesto de heteroscedasticidad puede no cumplirse.
5. En cada uno de los tres grupos, el valor de p-tau parece seguir una distribución normal.

7. Para analizar estos datos debería emplearse el siguiente test:


1. La t de Student si se cumplen los supuestos de normalidad y homoscedasticidad.
2. La U de Mann-Whitney si se cumplen los supuestos de normalidad y
homoscedasticidad.
3. Un ANOVA de una vía si se cumplen los supuestos de normalidad y homoscedasticidad.
4. El test de Kruskal-Wallis si se cumplen los supuestos de normalidad y
homoscedasticidad.
5. Ninguno de los anteriores.

9. Indique cuál es la afirmación VERDADERA:


1. Ninguno de los valores sustituidos por una letra tiene el mismo valor en ambas salidas.
2. A y D son iguales.
3. A y F son iguales.
4. A y B son iguales.
5. A y E son iguales.

10. Indique cuál es el valor de A:


1. 410.
2. 3.
3. 2.
4. 314.
5. 412.

11. Indique cuál es el valor de B:


1. 410.
2. 412.
3. 3.
4. 314.
5. 2.
12. Indique cuál es el valor de C:
1. 410.
2. 7.979.
3. 3.
4. 304.
5. 39,1.

13. Indique cuál es el valor de D:


1. 410.
2. 7.979.
3. 64.315,5.
4. 304.
5. 26,2.

14. Indique cuál es el valor de E:


1. 410.
2. 0,039.
3. 2.
4. 314.
5. 26,2.

15. El siguiente grafico muestra la distribución de los valores del biomarcadores (p -


tau) y los residuales en cada uno de los grupos:

Indique cuál es la afirmación VERDADERA:


1. Tanto los valores originales como los residuales tienen una asimetría positiva y, por
tanto, no siguen una distribución normal.
2. La varianza difiere en los distintos grupos del estudio.
3. El test de Kruskal-Wallis podría ser preferible si no se procediera a transformar los
datos.
4. Debido a la distribución de los datos, para poder utilizar el ANOVA de una vía debería
emplearse una transformación de los datos para corregir la asimetría positiva y realizar el
test.
5. Todas las respuestas son verdaderas.

1. El diseño de un ANOVA de dos vías está equilibrado cuando:


1. Las variables independientes tienen el mismo número de categorías.
2. El número de categorías de la variable dependiente coincide con el número de
categorías de las variables independientes.
3. Un diseño de un ANOVA nunca puede estar equilibrado.
4. Se encuentra el mismo número de sujetos en cada posible combinación de los dos
factores.
5. No se incluye ningún término de interacción.

2. Los factores de un ANOVA de dos vías:


1. Son siempre dicotómicos.
2. Nunca son dicotómicos.
3. Pueden ser policotómicos.
4. La 2) y la 3) son ciertas.
5. Suelen corresponder a variables cuantitativas continuas que se usan como var iable
independiente.

3. Respecto al ANOVA de dos vías, señale la respuesta FALSA:


1. Los efectos de los factores son los efectos principales.
2. La combinación de factores puede originar el fenómeno denominado interacción.
3. Entre los componentes de la variabilidad total se encuentra la variabilidad debida a la
interacción.
4. Todas son verdaderas.
5. Todas son falsas.

4. Se dice que existe interacción cualitativa cuando:


1. El efecto es significativamente más fuerte en un grupo que en otro.
2. Lo que sucede cuando se combinan ambos factores es lo esperado por la suma de
ambos factores.
3. Se observan efectos opuestos en los subgrupos.
4. Las asociaciones observadas en cada subgrupo sugieren en todos los casos una
relación inversa (menor respuesta a mayor valor del factor).
5. No existe significación estadística para la interacción, pero los efectos de un factor no
son idénticos en los distintos niveles del otro factor.

5. Ante la presencia de interacción en los resultados de un ANOVA de dos vías,


señale el paso más apropiado entre los siguientes:
1. Realizar un nuevo análisis por métodos no paramétricos.
2. Realizar un análisis de subgrupos.
3. Interpretar directamente los resultados obtenidos.
4. Penalizar el valor p de la interacción.
5. Realizar una transformación logarítmica.

6. ¿Cuántos grados de libertad tiene el componente residual de un ANOVA de


medidas repetidas de un estudio con 48 pacientes en los que se han realizado
cuatro mediciones en cada uno de dichos pacientes?
1. 52.
2. 192.
3. 190.
4. 139.
5. 141.

7. Se ha ajustado el siguiente modelo de ANOVA para valorar el efecto de una


intervención de estilo de vida (grupo) sobre la presión arterial sistólica, pero se
deseaba tener en cuenta también si el efecto se modificaba en función de que los
participantes fuesen veganos o vegetarianos (veg). Se encontró el siguiente
resultado.
Señale cuál de las siguientes afirmaciones es cierta:
1. El efecto de los grupos de intervención es el único estadísticamente significativo.
2. El hecho de ser vegetariano o vegano modifica el efecto de los grupos de intervención.
3. Había tres grupos de intervención y tres categorías según vegetarianismo.
4. Los vegetarianos presentaban menor presión arterial sistólica, pero las diferencias no
eran significativas. 5. Había en total 89 participantes en el estudio.

8. En el listado anterior, ¿cuántos grados de libertad tendrá el test F de la


interacción?
1. 81.
2. 2 en el numerador y 81 en el denominador.
3. 4 en el numerador y 81 en el denominador.
4. 4 en el numerador y 89 en el denominador.
5. 8 en el numerador y 81 en el denominador.

9. En el siguiente listado se ha valorado si el tratamiento recibido y el sexo influyen


en el cambio del colesterol total (mg/dl).

Indique cuál de las siguientes afirmaciones es cierta:


1. El efecto del tratamiento y del sexo son estadísticamente significativos y no se requiere
de modo imprescindible separar estos resultados por sexo.
2. El sexo modifica significativamente el efecto del tratamiento.
3. Había dos grupos de tratamiento.
4. Los varones experimentaron un menor descenso de colesterol con el tratamiento que
las mujeres, por lo que sería interesante desagregar los resultados en subgrupo de sexo.
5. No se encontraron diferencias significativas para el tratamiento, una vez que se tuvieron
en cuenta las fuertes diferencias entre hombres y mujeres.
10. Se ha medido el colesterol en tres ocasiones (time = 1, time = 2 y time = 3). Se
obtienen los siguientes resultados con STATA:

1. No hubo cambios estadísticamente significativos en la media del colesterol durante el


período de observación.
2. Se ha olvidado introducir la interacción en el modelo, ya que la variabilidad intersujetos
(id) puede modificar significativamente el efecto del tiempo sobre el colesterol.
3. Había 360 sujetos en el estudio.
4. La hipótesis nula principal mantiene que no existió variabilidad intersujetos y se
contrasta con la F = 5,49.
5. Hay evidencias suficientes para rechazar la hipótesis nula principal.

11. En el mismo ejemplo anterior, se ha valorado, además, si el cambio del


colesterol con el tiempo se modifica en función de que se aplique o no un
tratamiento (tratam = 1 = sí, tratam = 2 = no). Se obtuvo el siguiente resultado:

¿Qué valor de F de los anteriormente mostrados es el que corresponde a la


hipótesis de que el tratamiento modifica el cambio de colesterol con el tiempo?
1. 13,07.
2. 29,28.
3. 289,71.
4. 50,66.
5. 29,28 + 50,66.

1. Para comprobar la concordancia entre dos métodos de medida de una misma


variable cuantitativa; por ejemplo, para estimar la concordancia entre el peso
autorreferido y el peso determinado en la balanza, se usará:
1. Test de MacNemar.
2. t de Student para datos emparejados.
3. Regresión lineal simple.
4. Correlación.
5. Nada de lo anterior.

2. En regresión lineal, los residuales en cada individuo se calculan como:


1. La suma de cuadrados total menos la de regresión.
2. La suma de cuadrados total menos la de regresión, dividido todo por los grados de
libertad de la regresión.
3. La suma de cuadrados total menos la de regresión, dividido todo por la diferencia de
grados de libertad entre los totales y los de la regresión.
4. La diferencia entre la media de la muestra y el valor de cada individuo.
5. La diferencia entre lo predicho por la recta y lo observado para cada individuo.

3. ¿Con qué método no paramétrico se pueden calcular intervalos de confianza?


1. Rho de Spearman.
2. Kruskal-Wallis.
3. Wilcoxon.
4. t de Student.
5. Ji cuadrado.

4. Para valorar la relación entre tabaco (0 = nunca fuman; 1 = exfumadores; 2 =


fumadores activos) e índice de masa corporal (IMC, kg/m2) se han creado tres
variables que valen 1 si el sujeto está en esa categoría de tabaco y 0 para las demás.
Se ha ajustado esta regresión:
¿Cómo se interpreta el coeficiente b3 = –0,08?
1. No es fácilmente interpretable, ya que se ha especificado mal el modelo.
2. Existe una asociación débil e inversa entre el tabaco y el IMC.
3. Los fumadores activos tienen un IMC que es 0,08 kg/m2 inferior al de los nunca
fumadores.
4. Los fumadores activos tienen un IMC que es 0,08 kg/m2 inferior al de los exfumadores.
5. No está indicada la regresión para este análisis, sino el ANOVA.

5. Si encontramos un valor de 1 para el coeficiente de determinación, SIEMPRE se


cumple que:
1. La regresión predice el 100% de la variabilidad de Y .
2. El grado de asociación lineal entre las variables es el máximo posible.
3. Todos los residuales valen 0, sea cual sea el valor observado.
4. 1 y 2 son ciertas.
5. Todas las afirmaciones anteriores son ciertas.

6. Uno de los siguientes índices estadísticos resulta clave para estimar intervalos de
confianza a las predicciones que pueden hacerse a partir de un modelo de regresión
lineal:
1. Varianza de la regresión.
2. Varianza residual.
3. Grados de libertad de la regresión.
4. Grados de libertad totales.
5. Ninguno de los índices anteriores resulta necesario.
7. Una de las siguientes proposiciones es FALSA:
1. Siempre que el coeficiente de determinación asume su valor máximo, tiene que tomarlo
también el coeficiente de correlación.
2. Aunque b valga 0, puede haber relación entre las variables examinadas.
3. Siempre que a valga 0, la recta de regresión cortará al centro de coordenadas.
4. Cuando r valga 0, la pendiente de la recta valdrá también 0.
5. El enunciado es incorrecto, todas ellas son ciertas.

8. Para calcular un intervalo de confianza al 95% a un coeficiente de correlación r de


Pearson:
1. Se deberá sumar y restar aproximadamente dos veces su error estándar al valor
encontrado.
2. Se deberá sumar y restar aproximadamente dos veces su desviación estándar al valor
encontrado.
3. Se deberá multiplicar y dividir aproximadamente por dos veces su error estándar.
4. No es posible calcularle intervalos de confianza a la r de Pearson.
5. Nada de lo anterior.

Enunciado común para las preguntas 9-10. Se ha ajustado un modelo de regresión


lineal para relacionar la edad (años) con el estado de salud percibido (escala de 0 =
pésima salud a 100 = salud óptima).
9. Es cierto que:
1. La muestra se componía de pocos sujetos (<100).
2. El intervalo de confianza al 95% para el coeficiente de correlación de Pearson incluiría
el 0.
3. Por cada año más de edad se produce una mejora de la salud percibida de 0,012
puntos.
4. La división de 0,0121074 entre –0,3258123 daría lugar a la cantidad marcada como
«B?».
5. «A?» es exactamente el cuadrado de «B?».

10. Es cierto que:


1. Se habría debido hacer un ANOVA en vez de este análisis.
2. No hay significación estadística para esta asociación, por lo que no se puede rechazar
la hipótesis nula principal.
3. Con estos resultados puede descartarse que la relación entre edad y salud percibida
pueda ser un tipo distinto a la lineal.
4. La edad explica un porcentaje inferior al 5% en la variabilidad de la salud percibida.
5. No se puede conocer exactamente el valor de A? ni de B? a partir de estos resultados.

También podría gustarte