Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lección 1
1. Los datos continuos se diferencian de los discretos en que: Las clases de datos continuos pueden representarse
por fracciones
2. Si usted tiene una tabla
1. Si la media del conjunto de datos es 6 monedas, encuentra en número de monedas que encontró Julia. R// 5
2. Esta fórmula corresponde a: Desviación estándar de la población
R//
5. Si el conjunto de datos formado por 12, 6, 7, 10, 11, 12, 6, 11, 14, 11, corresponde a una población, calcular la
varianza: 6, 8
6. ¿Cuál es la media aritmética de los siguientes números? R// 3
7. Si el conjunto de datos formado por 1, 3, 5, 7 corresponde a una población, calcular la desviación estándar: R//
2,236
8. Si la media del conjunto de datos equivale a 3 títeres. Hallar cuántos títeres le corresponden a Marco: R// 4
9. Una población de alumnos tiene una estatura media de 180 cm con una desviación estándar de 18 cm. Estos
mismos alumnos tienen un peso medio de 60 kg con una desviación estándar de 12 kg. ¿Cuál de las 2 variables
presenta mayor dispersión? El peso
10. Si el coeficiente de variación es mayor al 25% se entiende que: Los datos están en promedio muy alejados de la
media aritmética
11. La fórmula se utiliza para hallar: R// Desviación respecto a la media
15. El espacio muestral de lanzar dos monedas al aire es: R// E={CC, EE, CE, EC}
16. ¿Cuál es la media aritmética de los siguientes números? 8, 10, 8, 5, 4, 7, 5, 10, 8: R// 7,2
17. Hallar la desviación media del siguiente conjunto de datos 1, 3, 5, 7: R// 2
18. Las ganancias de la primera mitad del año pasado de una empresa que vende ositos de peluche en lata se
muestran en la tabla. Calcular el rango de las ganancias. R// 22000
19. ¿A cuál de los siguientes eventos independientes corresponde la probabilidad de P=1/4? Lanzar dos monedas al
aire y obtener dos caras
Lección 1 2p
7. Un estudio de 25 graduados de universidades de cuatro años llevado a cabo por una asociación reveló que la
cantidad media que debía un estudiante por concepto de crédito estudiantil era de 14381$. La desviación
estándar de la muestra fue de 1892$. Construya el intervalo de confianza de 90% de la media poblacional. ¿Es
razonable concluir que la media de la población en realidad es de 15000$? Indique: 657,44
8. En una muestra aleatoria de 95 empresas manufactureras, 67 han indicado que su empresa ha obtenido la
certificación ISO en los dos últimos años. Halle un intervalo de confianza al 99%: 0,5848 – 0,8258
9. Si queremos reducir los límites del intervalo de confianza se debe: Aumentar el tamaño de la muestra
10. De acuerdo con la Oficina del Censo 3,13 personas residen en un típico hogar estadounidense. Una muestra de
25 hogares de las comunidades de retirados de Arizona mostró que el número medio de residentes por hogar
era de 2,86 personas. La desviación estándar de esta muestra es de 1,20 residentes. A un nivel de significancia
de 0.05 ¿es razonable concluir que el número medio de residentes en los hogares de las comunidades de
retirados es menor a 3,13 personas? El número medio de residentes no necesariamente es menor a 3,13 con
t=-1,13
11. La compañía de teléfonos afirma en su informe anual que el consumidor habitual gasta 60$ mensual en el
servicio local y de larga distancia. Una muestra de 12 abonados reveló las cantidades que gastaron el mes
pasado:
64$ - 66$ - 64$ - 66$ - 59$ - 62$ - 67$ - 61$ - 64$ - 58$ - 54$ - 66$
Construir el intervalo de confianza de 90% de la media poblacional: 62,583 +- 2,043
12. No es una característica de las hipótesis: Los términos o variables de una hipótesis deben ser observables o
medicables
Lección 2 2p
A un nivel de confianza del 95%, ¿cuál es su T de la tabla con los grados de libertad? R// 1,75
10. Cuando interesa conocer la relación o independencia entre dos variables en una población se utiliza como
estadístico de prueba: X2
1. En una encuesta preelectoral realizada a 500 personas se obtuvo la siguiente distribución en función de sus
edades y de su intención de voto:
10. ¿En qué consiste la prueba de homogeneidad? Extraer muestras independientes de varias poblaciones y se
prueban para ver si son homogéneas.
11. ¿Qué es una estimación? Una aproximación
12. Si tengo una distribución con un n< de 30 y una probabilidad <0,05 dicotómicamente qué distribución usar:
Bernoulli
13. Un campus universitario dispone de 300 plazas numeradas de aparcamiento para vehículo, distribuidos en tres
zonas A, B y C. La zona A está constituida por las plazas del 1 al 1500, estando 1350 de ellas protegidas del sol.
La zona B la conforman las plazas numeradas desde 1501 a 2500, estando el 80% protegidas del sol. La zona C
contiene plazas numeradas desde 2501 hasta 3000, estando protegidas solamente 250 protegidas del sol.
Aleatoriamente se elige una de las plazas del aparcamiento del campus. Si se ha elegido una plaza protegida del
sol, ¿cuál es la probabilidad de que esté ubicada en la zona B? R// 0,3334
14. ¿Qué significa que 170 mmHg corresponde a un valor z=+2? Que el valor supera a los 10 mmHg es 2,3%
15. La distribución de chi cuadrado se deriva de la distribución: Normal
16. Las puntuaciones en un test que mide la variable matemáticas siguen, en la población general de adolescentes,
puntuaciones de los 28 alumnos que están mismo colegio pero diferentes cursos:
Se acepta Ho, por lo que se concluye que el anterior año la organización trabajo
con los parámetros de excelencia, es decir, dar solución a una queja por debajo del
promedio de 55 días.
Se rechaza Ho, por lo que se concluye que el anterior año la organización trabajo
con los parámetros de excelencia, es decir, dar solución a una queja por debajo del
promedio de 55 días.
Se acepta Ho, por lo que se concluye que el anterior año la organización no está
dentro de los parámetros de excelencia, es decir, estar por debajo de 55 días para
solucionar una queja.
Se rechaza Ho, por lo que se conc+luye que el anterior año la organización no está
dentro de los parámetros de excelencia, es decir, estar por debajo de 55 días para
solucionar una queja.
Una encuesta en cierta ciudad muestra una tasa de desempleo del 18%. para
averiguar si ese resultado es válido el alcalde toma una muestra y se plantean las
hipótesis :
H0: la tasa del desempleo en la ciudad es del 18%
H1: la tasa del desempleo en la ciudad es significativamente diferente del 18%
En cual de las condiciones siguientes el alcalde comete un error tipo I:
Uno de los aspectos que más se descuida al ajustar un modelo de regresión lineal
simple es revisar que se cumplan los _____________del modelo
supuestos
datos
números
ninguna
Una máquina dispensadora de bebidas está diseñada para servir 360 ml de líquido
por vaso. el dueño sospecha que la máquina podría estar sirviendo líquido en
exceso. para verificar su sospecha, toma una muestra de 30 vasos
cuáles son las hipótesis adecuadas para este caso?
Ho: P = 360
H1: P < 360
Ho: P = 360
H1: P > 360
Ho: μ = 360
H1: μ <360
Ho: μ = 360
H1: μ > 360
Se realizara una encuesta a una variedad de clientes, en este caso una persona de
cada 10 que pasan en la tienda, para ver el grado de satisfacción que tienen
conforme a los servicios que se ofrecen, ¿esto corresponde a que tipo de
muestreo?
Muestreo aleatorio simple
Muestreo sistemático
Muestreo estratificado
Muestreo por conglomerados
En 1909, los Pastelitos Miss May tenía 316 empleados. Veinte años después,
en 1929, la compañía tenía 790 empleados. ¿Cuál es la diferencia entre el
número de empleados que tenía la compañía en 1929 y en 1909?
A. aproximadamente 400
B. aproximadamente 500
C. aproximadamente 600
D. aproximadamente 700
Una encuesta en cierta ciudad muestra una tasa de desempleo del 18%. Para
averiguar si ese resultado es válido, el alcalde toma una muestra y se plantea
las hipótesis:
Ho: La tasa de desempleo en la ciudad es del 18%
H1: La tasa de desempleo en la ciudad es significativamente diferente del
18%.
En cuál de las condiciones siguientes el alcalde comete un Error Tipo I ?:
Concluye que la tasa de desempleo no es del 18%, cuando en realidad sí es.
Concluye que la tasa de desempleo no es del 18%, cuando en realidad no es.
Concluye que la tasa de desempleo en la ciudad es del 18%, cuando en realidad sí
es.
Concluye que la tasa de desempleo en la ciudad es del 18%, cuando en realidad
no es.
En el 2000 las personas han consumido 3 veces más leche que en años años
anteriores.
En 1958 las personas dejaron de consumir leche para consumir crema de leche.
En 1986 hubo un alto consumo de leche entera comparado con otras leches.
En 1944 fue el año de más alto consumo de leche comparado con otras leches.
Moda: 145
Media: 124,8
“En las noticias de ayer se presentó una gráfico que indicaba la cantidad de
nacimientos por mes durante el año 2018”.
Don Rubén, por cada 10 unidades que vende de un nuevo producto gana
2500 pesos. En la gráfica se muestra la ganancia que don Rubén obtuvo
algunos días de la semana.
De acuerdo con la información de la gráfica, la venta del día domingo fue de:
90 unidades
100 unidades
22500 unidades
2500 unidades
En 1986 se consumieron
DE RESPUESTAAAA
ESTA ES
LA TABLA DE RESPUESTA
En general los suelos del trópico son ácidos y con baja disponibilidad de
nutrientes, por lo que los cultivos en estas zonas requieren de grandes
cantidades de fertilizantes. El uso excesivo de fertilizantes produce
salinización y deterioro de los suelos y de las fuentes de agua. En la
actualidad, un grupo de investigación está investigando una variedad de frijol
silvestre, originario de una localidad de suelos ácidos y pobres en nutriente,
que produce abundantes vainas con frijoles pequeños.
Con base a la anterior información, ¿cuál pregunta de investigación
permitiría abordar el estudio de esta variedad de frijol?
¿Cuál es la productividad de la variedad de frijol silvestre bajo el régimen de
fertilización de las variedades comerciales?
¿Cuáles son las características fisiológicas y genéticas que hacen que esta
variedad produzca semillas pequeñas?
¿Cuáles son las características fisicoquímicas del suelo que permiten que esta
variedad se haya adaptado a este suelo?
¿Cuáles son las características morfológicas y fisiológicas que le permiten a esta
especie crecer en este suelo?
Sí, porque las ventas tienden a mejorar al finalizar el mes de abril donde se
estabilizan.
Sí, porque las ventas tienden a estabilizarse al finalizar el mes de abril al presentar
mayor variabilidad.
No, porque los días con valores inferiores son mayores a los superiores, tomando
como referencia el valor de 1.780 millones.
No, porque se desconoce las ventas de los primeros días del mes de abril.
Colombia se caracteriza por la producción y exportación de flores para
fechas especiales, como el día de la madre que se celebra en mayo. Pero las
ganancias o pérdidas por motivo de las exportaciones están sujetas a la
variación del precio del dólar.
Los empresarios de flores en Colombia desean contratar a un analista
económico para que en base a los valores del dólar determine la mejor fecha
para realizar las ventas de flores a países europeos y norteamericanos. El
analista económico observa la variación de los precios de venta entre el 8 y
22 de abril del presente año para tomar una decisión, además, se sabe que el
costo de producción promedio mensual es de 1.780 millones de pesos. La
información se representa en la figura 1.
de gran importancia, ya que los ingresos son altamente positivos para los
empresarios.
de tendencia a la baja, ya que las utilidades generadas no son positivas sino
negativas.
de poca importancia, ya que los empresarios obtuvieron un punto de equilibrio.
de tendencia al alta, ya que los picos de venta son superiores al costo de
producción.
El conjunto 5,10,12,15,15,18,22 corresponde a los datos de una variable
cuantitativa, ¿cuál es el primer cuartil?
10
11
12
15
La media aritmética.
La moda.
La mediana.
El máximo.
35
30
31
10
28%
35%
56%
42%
¿Qué es estadística?
Es la mediana y análisis de tablas
Ciencia matemática
Ciencia que estudia la recolección e interpretación de datos
La muestra es..
Un conjunto de elementos con una característica en común.
Una parte de algo
Un subconjunto de la población
Las variables discretas son aquellas que admiten solamente valores ......
enteros o fraccionarios
enteros y fraccionarios
enteros
fraccionarios
Es un muestreo probabilístico...
Sistemático
Por cuotas
Discrecional
Bola de nieve
Es utilizado para crear muestras de acuerdo a la facilidad de acceso, donde
los sujetos son seleccionados dada la conveniente accesibilidad.
Muestreo no sesgado
Muestreo por conveniencia
Muestreo por conglomerado
Muestreo Probabilístico
En este método la persona por experiencia y capacidad selecciona a los individuos
u otros elementos de la población.
En este método los elementos se selecciona por conveniencia.
Es aquel en que cada uno de los elementos de la población objeto de estudio,
tienen una probabilidad matemática conocida para ser elegido en la muestra.
Es un método para seleccionar la muestra.
Los elementos que reportan la información y sobre los cuales se realizan las
mediciones de las variables en un estudio sobre inferencia estadística
corresponde a
Error del muestreo
Las unidades de muestreo
El marco de muestreo
Las unidades de observación
normal z
t de Student
F de Fisher
binomial z
normal z
t de Student
F de Fisher
binomial z
Tipos de muestreo
Probabiistico y aleatorio
No probabilistico
Probabilístico y no probabilístico
Ninguno
Se considera como una selección de elementos para conocer algo sobre una
población.
Población
Selección
Muestra
Monstruo
• Fue y en qué año se propuso lo que se conoce actualmente como el test de chi
cuadrado?
Karl pearson 1900
• Si se trabaja con un 95% de confianza Eso quiere decir que Alfa es:
0,05
• Realice este ejercicio e los datos que se le brinda en Excel, de dat os que se
obtuvieron de las 50 personas encuestadas de las cuales se les pregunto
¿considera usted que ta utilizaba el cel con gran frecuencia antes de la
cuarentena?
El valor de P es? 0,254
• Para qué utilizamos a chi cuadrado? Para saber si las poblaciones son homogéneas
/ ninguna
• Se cuantifican las ayudas visuales que contiene el libro de texto gratuito del
cuarto año de primaria por ejemplo diafragmas fotos esquemas y mapas y se
compara con respecto a lo recomendado en otros países en los que el estándar
indica que al menos el 30% del libro contenga este tipo de ayudas visuales. El
estadístico de prueba a utilizar es: Z
• Al realizar lo siguiente en minitab mediante los datos del archivo de Excel, que
datos que se obtuvieron de las 50 personas encuestadas de las cuales se les
pregunto ¿es el celular el dispositivo tecnológico que mas usa con mayor
frecuencia últimamente?
Con un 95% de confianza
No se rechaza H0
• Cual es chi2
Se rechaza la hipótesis nula con valor de 12
• Distribución que consiste en una prueba de hipótesis medias, para una muestra
menor de 30. T de student
• Tenemos la siguiente tabla que refleja los datos de asignaturas de religión en los
centros escolares ¿influye el tipo de colegio en la nota obtenida? Con UM
margen de error 0,05
• Distribución que resulta de medir una variable aleatoria continua que resulta de
la suma de varias variables independientes. Chi cuadrado
________________________________________________________________________
1. Se estudia un nuevo método de menor coste para valorar la concentraci ón de un
biomarcador en plasma. Para ello se comparan los resultados con la técnica de
referencia, más laboriosa, compleja y costosa. Indique cuál es la afirmación
verdadera:
1. Si la nueva prueba mide valores que son un 30% superiores a la técnica de ref erencia,
se trata de un error de precisión.
2. Si las mediciones obtenidas con la nueva técnica tienen un coeficiente de variación del
50% intersujetos, a la nueva técnica le faltará validez.
3. Para obtener el coeficiente de variación es preciso dividir la varianza entre la media de
las mediciones.
4. La presencia de errores sistemáticos implica una falta de precisión.
5. Todas son falsas.
10. Se trató con un suplemento dietético más dieta a 15 pacientes con insuficiencia
renal, y solamente con dieta a 16. Se compararon entre ambos grupos unas 100
variables y en seis de tales comparaciones se encontraron diferencias significativas,
para el nivel nominal del 5%, a favor del suplemento. ¿Cómo interpretaría estos
resultados?
1. El estudio parece no concluyente, ya que con tantas comparaciones es esperable que
unas pocas resulten significativas para el nivel nominal del 5%, aunque no haya diferencia
entre los tratamientos.
2. El suplemento dietético es moderadamente eficaz.
3. Este estudio no demuestra nada, ya que a priori se sabe que la hipótesis nula es cierta.
4. Aunque el número de pacientes fuese pequeño, lo inocuo del tratamiento y la
consistencia de los resultados aconsejan prescribir el suplemento en la insuficiencia renal.
5. Este estudio no demuestra nada, ya que hay más variables que pacientes.
________________________________________________________________________
5. ¿Cuál es el test estadístico que debería utilizarse para comparar las proporciones
de pacientes con cáncer de pulmón entre cinco categorías de pacientes en función
de su consumo de cannabis (nunca lo han probado; menos de 5 veces; de 5-50
veces; más de 50 veces, pero no a diario; fuman a diario)?
1. Test exacto de Fisher.
2. Test de tendencia lineal.
3. Test de la χ2 de Pearson.
4. Test de McNemar.
5. Ninguno.
7. Los datos del estudio de los factores de riesgo del cáncer de cuello uterino en
mujeres de la India (v. cuestión 6) se muestran en la siguiente tabla generada
mediante el programa STATA:
Columnas: 1 (casos), 2 (controles); filas: 1 (relaciones extramaritales), 2 (sin
relaciones extramaritales).
Calcule el valor del test más adecuado teniendo en cuenta que no existe
emparejamiento entre casos y controles.
1. 6,74.
2. 12,7.
3. 81,92.
4. 105,3.
5. 2,032.
Enunciado común para las preguntas 11-15. Se ha obtenido con STATA el siguiente
resultado al relacionar el consumo de alcohol (1 = bebedores, 0 = abstemios) con el
riesgo de enfermedad cardiovascular (ECV , 1 = sí, 0 = no).
15. ¿Qué orden habría que dar a STATA para lograr el intervalo de confianza al 95%
para la diferencia de proporciones de enfermedad cardiovascular entre bebedores y
abstemios?
1. di chi2tail (1,43.5017).
2. tab alcohol ECV; chi2 row.
3. tab alcohol ECV; chi2 col.
4. prtest ECV , by (alcohol).
5. Ninguna de ellas.
1. Se compara el colesterol total sérico de un grupo de obesos (grupo obeso = 1)
con el colesterol total sérico de individuos no obesos (grupo obeso = 0). El
resultado que aparece en el ordenador es:
1. Si los obesos tuviesen la misma concentración de colesterol total en sangre que los no
obesos, la probabilidad de hallar al menos tanta diferencia entre las medias de ambos
grupos como la observada sería del 2,9%.
2. La probabilidad de que los obesos no tengan la misma concentración de colesterol total
en sangre que los no obesos es del 98,55%.
3. Solo un 2,9% de la población de no obesos tiene iguales concentraciones de colester ol
sérico que la población de obesos.
4. Solo un 2,9% de la población de no obesos tiene igual o más concentración de
colesterol sérico que la población de obesos.
5. Solo en un 2,9% de las muestras tomadas de una población donde la mitad fuesen
obesos y la otra mitad no lo fuesen, se encontrarían tales o mayores diferencias en la
concentración de colesterol sérico.
2. En un ensayo clínico, a una serie de pacientes (n = 200) se les trata con un nuevo
fármaco para estudiar si, en un período de tiempo después de la administración de
dicho fármaco, el nivel de ácido úrico en sangre (mg/dl) ha disminuido. Para este
diseño, ¿cuál es la prueba estadística de elección?
1. t de Student para muestras independientes.
2. Test de Wilcoxon.
3. t de Student para muestras relacionadas.
4. U de Mann-Whitney.
5. Es imprescindible comprobar la normalidad de la variable ácido úrico para contestar a
esta pregunta.
Las preguntas 5-10 se refieren a los siguientes datos: se desea determinar si existen
diferencias entre la media de índice de masa corporal (IMC) en una muestra de 500
sujetos en función de la variable estado civil (1 = casado/2 = no casado). Asumiendo
que la variable IMC sigue una distribución normal, y tras comprobar que las
varianzas son homogéneas, se obtiene la siguiente tabla en STATA.
Con los datos de la pregunta anterior se ha obtenido el siguiente listado con STATA,
donde se han sustituido algunas de las cantidades del resultado por letras.
7. ¿Cuánto vale a?
1. 0,29.
2. 10,22.
3. 3,20.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.
8. ¿Cuánto vale b?
1. 2,35.
2. 6,14.
3. 1,21.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.
9. ¿Cuánto vale c?
1. 2,35.
2. 6,14.
3. 1,21.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.
Enunciado común para las preguntas 11-12: se desea comparar si una determinada
mutación (mutado = 1 si tiene la mutación y mutado = 0 si no la tiene) se asocia a
consumir un mayor porcentaje de grasa en la dieta (grasa = % de calorías que
proceden de grasa). No se puede asumir la normalidad. Hay 25 sujetos mutados y 40
no mutados en la muestra. Se han obtenido los siguientes resultados con STATA:
11. Se deberá aplicar:
1. U de Mann-Whitney.
2. t de Student para muestras relacionadas.
3. Test de Wilcoxon.
4. t de Student para muestras independientes.
5. Ninguno de los anteriores.
• La independencia se da cuando:
a. A y B no está unidas
b. A y B están unidas
c. A y B están interceptadas
d. A y B no están interceptadas
a. Es 10%
b. Es 20%
c. Es 40%
d. Es 1%
a. Es 1%
b. Es 20%
c. Es 50%
d. Es 11%
• La distribución de frecuencias:
a. Es un método que organiza datos
• Queremos realizar un estudio sobre los hábitos de lectura del alumno del
colegio Calasanz. Suponiendo que en cada clase hay un numero de chicos y
chicas ¿Cuál de las siguientes afirmaciones seria errónea?
a. Una muestra correcta seria elegir a los cinco alumnos y cinco alumnas con
mejor nota media de cada clase
20. ¿Podría decir cuáles son los límites del rango intercuartílico?
1. 0-5.
2. 1-5.
3. 1-6.
4. 1-4.
5. 0-4.
29. ¿Qué porcentaje de la muestra se encuentra situado dentro de los dos límites
de la caja? 1. El 25%.
2. El 50%.
3. El 75%.
4. Toda la muestra.
5. Es imposible saberlo
2. Dibuje el histograma.
3. Represente un gráfico de tallo y hojas.
Media X = 43.1
Media geométrica: 39.6
Media armónica: 36.1
Mediana: el valor central del conjunto ordenado de los datos. Al ser 10
observaciones, la mediana sería la media de la 5.ª y la 6.ª observación. Como
ambas son 44, la mediana = 44. Moda: se trata de una distribución bimodal.
Las modas (los valores que más se repiten) son 44 y 46
el 45% De una clase ha votado como delegado a Pedro sabiendo que la frecuencia
absoluta de esa opción de voto es 18 cuál sería el número total de alumnos de la
clase
33
40
Con estos datos no se puede determinar
Qué significa que la desviación típica de las notas de un examen sea cero
ninguna de las dos opciones es correcta
que todos los alumnos han obtenido la misma nota
sus notas se distribuyen alrededor de la media de manera perfectamente homogénea
Las calificaciones de una clase siguen la distribución normal. por tanto, podemos
afirmar que la proporción de alumnos por encima de una puntuación típica de 2.05
sera:
0.9798
0.0202
0.0101
Una investigadora indica que el valor de p para diferencia de medias es 0.12. por
tanto
la diferencia de medias estadísticamente significativa siempre
la diferencia de medias estadísticamente significativa para un nivel de significación de 0.05
la diferencia de medias no es estadísticamente significativa para un nivel de significación
de 0.05
de intervalo
ordinal
nominal
Suponiendo que el error típico de la muestra es 1.915 ,el error muestral para un nivel
de confianza del 95% será
7.50
no se puede calcular con estos datos
3.75
Para investigar una posible relación entre el HPI y el índice de pobreza de los países,
se lleva a cabo un análisis de correlación entre ambas variables obteniendo un
coeficiente de 0.52 con p=0.04. por tanto, las variables:
no correlaciona significativamente
correlacionan significativamente
depende del nivel de significación fijado
chi cuadrado
Qué prueba no paramétrica usa un método de ordenar los datos por fila o
bloques:
prueba u de Mann Whitney
t de wilcoxon
prueba de Friedman
prueba de kruskal wallis
0,2
R: Relación directa
R: Relación inversa
R: Negativa
R:
R: Positiva
R: fuerte directa
R: fuerte inversa
R: 13,64
R: fuerte directa
10.Si tras realizar Pearson nos da una correlación de 0,76 y p<0,02 entonces: Hay una
correlación alta positiva
11.¿Qué prueba no paramétrica usa un método de ordenar los datos por fila o bloques?
Prueba de Kruskal-Wallis o Prueba de Friedman
13.Si tuviera que analizar si existen diferencias significativas entre cinco variables. Que
test de hipótesis utilizaría? Shapiro-Wilk
14.H0: u1=u2 HA: u1<u2 HA: u1?=u2. De acuerdo con el planteamiento de las hipótesis
anteriores. De qué tipo es cada una correspondientemente? Nula, Unilateral, Bilateral
15.Para ver la correlación entre dos variables (Cuantitativa + Cualitativa) que no cumplen
los criterios de normalidad realizaremos: Spearman
16.Si tuviera que correlacionar dos variables cuantitativas continuas. ¿Qué método
estadístico utilizaría? Correlacion de Pearson
Si una caja contiene bolas numeradas del 1 al 10, ¿cuál es el suceso A = "obtener
múltiplo de 3"?
Ninguna de las respuestas es correcta.
La correlación entre desigualdad y bienestar es -0.28 esto significa que hay una
tendencia baja a que
a mayor desigualdad menor bienestar y viceversa
Dada la siguiente distribución bidimensional el valor de la covarianza
13.64
Las varianzas en la variable desigualdad para los países europeos y americanos son
respectivamente 54 y 22 . la prueba f de Levene es f= .448 con una p asociada de
.522. Por tanto como un nivel de confianza del 95% dan datos demás para despistar
Las varianzas son estadísticamente iguales
Prueba PAU
Tenemos la siguiente tabla que refleja los datos de asignaturas de religión en los
centros escolares ¿influye el tipo de colegio en la nota obtenida? Con UM margen de
error 0,05
Se rechaza hipótesis nula dado que el Chi calculado es mayor
Sxy= 2,053
0.86
0,53
Las variables continuas son aquellas que admiten solamente valores ......
Reales
Si tenemos valor crítico de 0.586 para un N=10 y tenemos que resultado salió 0.467
entonces que hacer?
es No significativa
La diferencia entre los coeficientes de variación del grupo de las mujeres y del
grupo de los varones corresponde a
0,93%
Tiene esta situación haces un estudio que va del presente a hacia el pasado que
tipos de diseño es?
Casos y controles
De acuerdo con el problema anterior, una vez que se seleccionó un turno, se aplica
otro examen a cada grupo y se compara en cuál están los estudiantes con las
calificaciones más altas y ver si estas diferencias son significativas o no, para ello
se utiliza la prueba de...
ANOVA de una vía
Un artículo reciente, publicado por un en USA, indica que solo a uno de cada tres
egresados de una universidad les espera un puesto de trabajo. Las hipótesis
estadísticas son:
Para probar la Hipótesis nula: "las tendencias centrales de las dos poblaciones son
iguales" se puede utilizar:
T de Wilcoxon
U de Mann-Whitney
Una docente mide el tiempo que tardan sus estudiantes en resolver un examen de
comprensión de lectura en inglés. Por ello, revisa la literatura y encuentra una
metodología que considera puede serle útil. Trabaja con sus estudiantes con este
método y mide el tiempo que emplean sus alumnos para resolver un examen de
comprensión lectora en dicho idioma. Para conocer el efecto que tuvo el método en
sus estudiantes, deberá emplear la prueba...
ANOVA por bloques
ANOVA de una vía
t para muestras pareadas
t para muestras independientes
otra
Seleccione una:
si va hacia abajo es negativa
Correlación
Negativa
Sin relación
Positiva
Seleccione una:
si estan todos dispersos es nula
Si tuviera que analizar si dos sucesos son aleatorios ¿Qué test de hipótesis
utilizaria?
a. Debo consultar el test de rachas
• Fue y en qué año se propuso lo que se conoce actualmente como el test de chi
cuadrado?
Karl pearson 1900
• Si se trabaja con un 95% de confianza Eso quiere decir que Alfa es:
0,05
• Realice este ejercicio e los datos que se le brinda en Excel, de datos que se
obtuvieron de las 50 personas encuestadas de las cuales se les pregunto
¿considera usted que ta utilizaba el cel con gran frecuencia antes de la
cuarentena?
El valor de P es? 0,254
• Para qué utilizamos a chi cuadrado? Para saber si las poblaciones son homogéneas
/ ninguna
• Se cuantifican las ayudas visuales que contiene el libro de texto gratuito del
cuarto año de primaria por ejemplo diafragmas fotos esquemas y mapas y se
compara con respecto a lo recomendado en otros países en los que el estándar
indica que al menos el 30% del libro contenga este tipo de ayudas visuales. El
estadístico de prueba a utilizar es: Z
• Al realizar lo siguiente en minitab mediante los datos del archivo de Excel, que
datos que se obtuvieron de las 50 personas encuestadas de las cuales se les
pregunto ¿es el celular el dispositivo tecnológico que mas usa con mayor
frecuencia últimamente?
Con un 95% de confianza
No se rechaza H0
• Cual es chi2
• Distribución que consiste en una prueba de hipótesis medias, para una muestra
menor de 30. T de student
• Tenemos la siguiente tabla que refleja los datos de asignaturas de religión en los
centros escolares ¿influye el tipo de colegio en la nota obtenida? Con UM
margen de error 0,05
• Distribución que resulta de medir una variable aleatoria continua que resulta de
la suma de varias variables independientes. Chi cuadrado
a. Si utilizamos el ANOVA de una vía con una variable predictora con dos grupos en un
paquete estadístico, los resultados que obtendremos serán los mismos que si hubiésemos
utilizado una t de Student para dos muestras.
b. Si el valor de p observado en el test de Bartlett o el test de Levene es <0,05, esto indica
que podemos rechazar la hipótesis nula (H0) de igualdad de medias.
c. Si se tiene un tamaño muestral inferior a 30 sujetos, la presencia de heteroscedasticidad
indica que podemos utilizar el ANOVA de una vía.
d. Los grados de libertad intragrupos (within) se obtienen restando 1 al número total de
grupos (k).
e. Es el equivalente de la U de Mann-Whitney cuando la variable predictora consta de más
de dos grupos.”
Seleccione una:
a. Un grado de libertad.
b. No puede saberse, porque no se ofrece suficiente información.
c. Seis grados de libertad.
d. Dos grados de libertad.
e. Ningún grado de libertad.
A continuación se muestran las salidas correspondientes al test paramétrico y
no paramétrico que se pueden aplicar en esta muestra. En las siguientes
preguntas, el estudiante deberá completar los listados, independientemente de
que puede que no sea correcto aplicar ambos test. Finalmente, deberá decidir
cuál es la opción analítica adecuada.
Primera salida:”
Segunda salida
________________________________________________________________________
1. Se estudia un nuevo método de menor coste para valorar la concentraci ón de un
biomarcador en plasma. Para ello se comparan los resultados con la técnica de
referencia, más laboriosa, compleja y costosa. Indique cuál es la afirmación
verdadera:
1. Si la nueva prueba mide valores que son un 30% superiores a la técnica de ref erencia,
se trata de un error de precisión.
2. Si las mediciones obtenidas con la nueva técnica tienen un coeficiente de variación del
50% intersujetos, a la nueva técnica le faltará validez.
3. Para obtener el coeficiente de variación es preciso dividir la varianza entre la media de
las mediciones.
4. La presencia de errores sistemáticos implica una falta de precisión.
5. Todas son falsas.
10. Se trató con un suplemento dietético más dieta a 15 pacientes con insuficiencia
renal, y solamente con dieta a 16. Se compararon entre ambos grupos unas 100
variables y en seis de tales comparaciones se encontraron diferencias significativas,
para el nivel nominal del 5%, a favor del suplemento. ¿Cómo interpretaría estos
resultados?
1. El estudio parece no concluyente, ya que con tantas comparaciones es esperable que
unas pocas resulten significativas para el nivel nominal del 5%, aunque no haya difere ncia
entre los tratamientos.
2. El suplemento dietético es moderadamente eficaz.
3. Este estudio no demuestra nada, ya que a priori se sabe que la hipótesis nula es cierta.
4. Aunque el número de pacientes fuese pequeño, lo inocuo del tratamiento y la
consistencia de los resultados aconsejan prescribir el suplemento en la insuficiencia renal.
5. Este estudio no demuestra nada, ya que hay más variables que pacientes.
________________________________________________________________________
5. ¿Cuál es el test estadístico que debería utilizarse para comparar las proporciones
de pacientes con cáncer de pulmón entre cinco categorías de pacientes en función
de su consumo de cannabis (nunca lo han probado; menos de 5 veces; de 5 -50
veces; más de 50 veces, pero no a diario; fuman a diario)?
1. Test exacto de Fisher.
2. Test de tendencia lineal.
3. Test de la χ2 de Pearson.
4. Test de McNemar.
5. Ninguno.
7. Los datos del estudio de los factores de riesgo del cáncer de cuello uterino en
mujeres de la India (v. cuestión 6) se muestran en la siguiente tabla generada
mediante el programa STATA:
1. χ2= 1,29.
2. χ2= 2,77.
3. χ2= 3,48.
4. χ2= 4,66.
5. χ2= 7,23.
Enunciado común para las preguntas 11-15. Se ha obtenido con STATA el siguiente
resultado al relacionar el consumo de alcohol (1 = bebedores, 0 = abstemios) con el
riesgo de enfermedad cardiovascular (ECV , 1 = sí, 0 = no).
15. ¿Qué orden habría que dar a STATA para lograr el intervalo de confianza al 95%
para la diferencia de proporciones de enfermedad cardiovascular entre bebedores y
abstemios?
1. di chi2tail (1,43.5017).
2. tab alcohol ECV; chi2 row.
3. tab alcohol ECV; chi2 col.
4. prtest ECV , by (alcohol).
5. Ninguna de ellas.
________________________________________________________________________
1. Se compara el colesterol total sérico de un grupo de obesos (grupo obeso = 1)
con el colesterol total sérico de individuos no obesos (grupo obeso = 0). El
resultado que aparece en el ordenador es:
1. Si los obesos tuviesen la misma concentración de colesterol total en sangre que los no
obesos, la probabilidad de hallar al menos tanta diferencia entre las medias de ambos
grupos como la observada sería del 2,9%.
2. La probabilidad de que los obesos no tengan la misma concentración de colesterol total
en sangre que los no obesos es del 98,55%.
3. Solo un 2,9% de la población de no obesos tiene iguales concentraciones de colesterol
sérico que la población de obesos.
4. Solo un 2,9% de la población de no obesos tiene igual o más concentración de
colesterol sérico que la población de obesos.
5. Solo en un 2,9% de las muestras tomadas de una población donde la mitad fuesen
obesos y la otra mitad no lo fuesen, se encontrarían tales o mayores diferencias en la
concentración de colesterol sérico.
2. En un ensayo clínico, a una serie de pacientes (n = 200) se les t rata con un nuevo
fármaco para estudiar si, en un período de tiempo después de la administración de
dicho fármaco, el nivel de ácido úrico en sangre (mg/dl) ha disminuido. Para este
diseño, ¿cuál es la prueba estadística de elección?
1. t de Student para muestras independientes.
2. Test de Wilcoxon.
3. t de Student para muestras relacionadas.
4. U de Mann-Whitney.
5. Es imprescindible comprobar la normalidad de la variable ácido úrico para contestar a
esta pregunta.
Las preguntas 5-10 se refieren a los siguientes datos: se desea determinar si existen
diferencias entre la media de índice de masa corporal (IMC) en una muestra de 500
sujetos en función de la variable estado civil (1 = casado/2 = no casado). Asumiendo
que la variable IMC sigue una distribución normal, y tras comprobar que las
varianzas son homogéneas, se obtiene la siguiente tabla en STATA.
Con los datos de la pregunta anterior se ha obtenido el siguiente listado con STATA,
donde se han sustituido algunas de las cantidades del resultado por letras.
7. ¿Cuánto vale a?
1. 0,29.
2. 10,22.
3. 3,20.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.
8. ¿Cuánto vale b?
1. 2,35.
2. 6,14.
3. 1,21.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.
9. ¿Cuánto vale c?
1. 2,35.
2. 6,14.
3. 1,21.
4. 1,78.
5. Es imposible calcularlo con los datos proporcionados.
3. Se diseña un estudio para medir el efecto de una dieta baja en sodio sobre la
presión arterial sistólica. En un estudio piloto se observó que la desviación estándar
del cambio en presión sistólica en ambos tipos de pacientes era de 12 mmHg. Si α
(bilateral) = 0,05 y β = 0,1, ¿cuál será el tamaño mínimo de muestra en cada grupo
necesario para detectar una diferencia mínima de al menos 2 mmHg en la presión
sistólica?
1. 1.314.
2. 328.
3. 756.
4. 120.
5. 55.
8. En una operación quirúrgica murió un 10% de los pacientes. Una nueva técnica
puede reducir esta proporción. Para ello, asignamos a los nuevos pacientes, de
forma aleatoria, a la técnica estándar o a la nueva. ¿A cuántos sujetos se necesitaría
estudiar para detectar, con una potencia del 80% y un riesgo α = 0,1 (0,05 en cada
cola), una reducción de la mortalidad al menos a la mitad (mortalidad = 5% con la
nueva técnica)?
1. 344.
2. 345.
3. 686.
4. 254.
5. Nada de lo anterior.
10. Se comparan 100 controles (pacientes hipertensos sin dislipemia) frente a otros
100 con hipertensión e hiperlipemia tratados con un fármaco que puede tener acción
frente a la proteína C reactiva (PCR). Se espera una media en el cambio de PCR = –
0,17 (desviación estándar 0,2) mg/l en el grupo sometido a tratamiento y de +0,14
(desviación estándar 0,2) mg/l en el grupo control. Asumiendo un error alfa del 0,05
(bilateral), ¿cuál es la potencia del estudio para detectar esta diferencia?
1. <10%.
2. Entre el 10 y el 25%.
3. Entre el 26 y el 50%.
4. Entre el 50 y el 80%.
5. >80%.
12. Leemos un artículo donde se estudió a 500 mujeres con cáncer de mama (CM) de
entre las cuales 250 consumían anticonceptivos orales (AO). En las 500 mujeres
control (sin CM) estudiadas, había 100 expuestas a AO. Las diferencias resultaron
estadísticamente significativas (p = 0,015). Asumiendo un error alfa bilateral del 5%,
¿cuál es el valor más aproximado a la potencia de este estudio?
1. 8%.
2. 20%.
3. 40%.
4. 80%.
5. 100%.
__________________________________________________________
1. Indique la afirmación FALSA sobre el ANOVA de una vía:
1. Se utiliza cuando la variable independiente es cuantitativa y consta de al menos tres
valores diferentes.
2. Se cumplen los requisitos de aplicación cuando los residuales siguen una distribució n
normal.
3. Se trata de un método paramétrico.
4. Requiere homogeneidad de varianzas de la variable dependiente.
5. Los grados de libertad entre grupos (between) se obtienen restando 1 al número total de
grupos (k).
Enunciado común para las cuestiones 6-15. Para los siguientes problemas se
utilizarán datos de un biomarcador (proteína tau fosforilada, p -tau) medido en el
líquido cefalorraquídeo de controles cognitivamente normales, pacientes con
deterioro cognitivo ligero (DCL) y pacientes con enfermedad de Alzheimer (EA) en
laAlzheimer’s Disease Neuroimaging Initiative(ADNI). El objetivo de la investigación
era evaluar si los valores de p-tau difieren en los tres grupos.
6. Indique la afirmación FALSA en relación con el objetivo del estudio:
1. La variable independiente es categórica y consta de tres grupos.
2. La variable dependiente es cuantitativa.
3. Para describir estos datos se debería emplear la mediana y cuartiles.
4. Los datos indican que el supuesto de heteroscedasticidad puede no cumplirse.
5. En cada uno de los tres grupos, el valor de p-tau parece seguir una distribución normal.
6. Uno de los siguientes índices estadísticos resulta clave para estimar intervalos de
confianza a las predicciones que pueden hacerse a partir de un modelo de regresión
lineal:
1. Varianza de la regresión.
2. Varianza residual.
3. Grados de libertad de la regresión.
4. Grados de libertad totales.
5. Ninguno de los índices anteriores resulta necesario.
7. Una de las siguientes proposiciones es FALSA:
1. Siempre que el coeficiente de determinación asume su valor máximo, tiene que tomarlo
también el coeficiente de correlación.
2. Aunque b valga 0, puede haber relación entre las variables examinadas.
3. Siempre que a valga 0, la recta de regresión cortará al centro de coordenadas.
4. Cuando r valga 0, la pendiente de la recta valdrá también 0.
5. El enunciado es incorrecto, todas ellas son ciertas.