1.
Introducción a la Estadística
Determine cuál de los siguientes enunciados es verdadero o falso. En caso de ser falso,
explique por qué lo es.
1. La probabilidad se utiliza como base para la estadística inferencial. Verdadero
2. Cuando la muestra no representa a la población, se llama muestra sesgada.
Verdadero
3. La diferencia entre una medida muestral y una medida de la población se denomina
error no muestral. Falso, se denomina error de muestreo
4. Suponga el escenario donde una población de profesores universitarios se divide en
grupos según su rango (instructor, profesor asistente, etc.) y luego se seleccionan
varios de cada grupo para conformar una muestra, ¿la muestra se denomina muestra
por conglomerados? Falso, Se llama muestra estratificada
5. La variable temperatura es un ejemplo de una variable cuantitativa. Verdadero
6. La estatura de los jugadores de baloncesto se considera una variable continua
Verdadero
7. El límite de un valor como el de 6 pulgadas sería de 5.9 - 6.1 pulgadas. Falso, el
límite es de 5,5-6,5
Seleccione la mejor respuesta.
8. El número de anuncios en un programa de televisión de una hora es una variable
a. Nominal b. Cualitativa c. Discreta d. Continua
9. ¿Cuáles son los límites de 25.6 onzas?
a. 25-26 onzas b. 25.55-25.65 onzas c. 25.5-25.7 onzas d. 20-39 onzas
10. Un investigador dividió a los sujetos de un estudio en dos grupos según el género y
luego seleccionó a los miembros de cada grupo para su muestra. ¿Qué tipo de
muestreo utilizó el investigador?
a. Grupo temático b. Aleatorio c. Sistemático d. Estratificado
11. Los datos que se pueden clasificar según el color se miden ¿en qué escala?
a. Nominal b. Razón c. Ordinal d. Intervalo
12. Un estudio que no involucra la intervención del investigador se llama
a. Experimental b. Sin participación. c. De observación. d. Cuasiexperimental.
13. Una variable que interfiere con otras variables del estudio se llama
a. Variable de confusión. b. Variable explicativa.
c. Variable de resultado. d. Variable de interferencia.
Utilice la mejor respuesta para completar los siguientes enunciados.
14. Dos ramas principales de la estadística son Descriptivo e Inferencial
15. Dos usos de la probabilidad son Juegos de azar y Seguros
16. El grupo de todos los sujetos bajo estudio se llama Población
17. Un grupo de sujetos seleccionados del grupo de todos los sujetos bajo estudio se
llama Muestra
18. Tres razones por las que se usan muestras en estadística:
a. Ahorrar Tiempo b. Ahorrar Dinero c. Se utiliza cuando la población es infinita
19. Los cuatro métodos básicos de muestreo son:
a. Aleatorio b. Conglomerado c. Sistemático d. Estratificado
20. Un estudio que utiliza grupos intactos cuando no es posible asignar al azar los
participantes a los grupos se llama estudio Cuasiexperimental.
21. En un estudio de investigación, los participantes deben ser asignados a grupos
utilizando los métodos Aleatorio, si es posible.
22. Para cada afirmación, decida si se utiliza estadística descriptiva o inferenciale.
a) La esperanza de vida promedio en Nueva Zelanda es de 78.49 años (Fuente:
World Factbook). Descriptivo
b) Una dieta alta en frutas y verduras disminuirá la presión arterial (Fuente:
Instituto de Medicina). Inferencial
c) El monto total de las pérdidas estimadas por el huracán Katrina fue de $125
mil millones (Fuente: El Mundo Almanaque y Libro de los Hechos).
Descriptivo
d) Los investigadores afirmaron que la forma de las orejas de una persona es
relativa a la agresión de la persona (Fuente: American Journal of Human
Biology). Inferencial
e) Se estima que en 2050 habrá 18 millones de estadounidenses mayores de 85
años (Fuente: Oficina del Censo de los Estados Unidos). Inferencial
23. Clasificar las siguientes variables como nivel nominal, ordinal, de intervalo o
razón:
a. Clasificación de las películas como G, PG y R Ordinal
b. Número de barras de caramelo vendidas en una campaña de recaudación de fondos
Razón
c. Clasificación de los automóviles como subcompactos, compacto, estándar y de lujo
Ordinal
d. Temperaturas de los secadores de pelo Intervalo
e. Pesos de las maletas en un avión comercial Razón
24. Clasifique las siguientes variables como discreta o continua:
a. Edades de las personas que trabajan en una fábrica Continuo
b. Número de tazas de café servidas en un restaurante Discreto
c. La cantidad de droga que se inyecta a un conejillo de indias en un laboratorio
Continuo
d. El tiempo que le toma a un estudiante caminar hasta la escuela Continuo
e. El número de galones de leche que se venden cada día en una tienda de
comestibles Discreto
25. Dé los límites de cada uno de los siguientes datos:
a. 32 minutos 31.5-32.5 minutos b. 0.48 milímetros 0.475-0.485 milímetros
c. 6.2 pulgadas 6.15-6.25 pulgadas d. 19 libras 18.5-19.5 libras
e. 7 pies 6.5-7.5 pies
Tema 2. Distribuciones de frecuencia y gráficos
Determine cuál de los siguientes enunciados es verdadero o falso. En caso de ser falso,
explique por qué lo es.
1. En la construcción de una distribución de frecuencia, es una buena idea tener límites de
clase superpuestos, como 10-20, 20-30, 30-40. Verdadero
2. Se pueden dibujar gráficos de barras usando barras verticales u horizontales. Verdadero
3. No es importante mantener el ancho de cada clase igual en una distribución de frecuencia.
Falso, porque habría problemas en la realización del gráfico.
4. Las distribuciones de frecuencias pueden ayudar al investigador en la construcción de
tablas y gráficos. Verdadero
5. El tipo de gráfico utilizado para representar los datos está determinado por el tipo de
datos recogidos y por el propósito del investigador. Verdadero
6. En la construcción de un polígono de frecuencias, los límites de clase se utilizan para el
eje x. Verdadero
7. Los datos recogidos durante un período de tiempo pueden ser graficados utilizando un
gráfico de pastel. Falso, se utiliza grafico de líneas para datos temporales.
Seleccione la mejor respuesta.
8. ¿Cuál otro nombre se utiliza para el gráfico de la ojiva?
a. Histograma b. Polígono de frecuencia
c. Gráfico de frecuencia acumulativa d. Gráfico de Pareto
9. ¿Cuáles son los límites para 8.6 - 8.8?
a. 8-9 b. 8.5-8.9 c. 8.55-8.85 d. 8.65-8.75
10. ¿Qué gráfico debe usarse para mostrar la relación entre las partes y el todo?
a. Histograma b. Gráfico de pastel c. Gráfico de Pareto d. Ojiva
11. Excepto por los errores de redondeo, las frecuencias relativas deben sumar
a. 0 b. 1 c. 50 d. 100
Utilice la mejor respuesta para completar los siguientes enunciados.
12. Los tres tipos de distribuciones de frecuencia son Relativo, Acumulada y Absoluta
13. En una distribución de frecuencia, el número de clases debe estar entre 5 y 20.
14. Los datos que corresponde a la variable tipos de sangre (A, B, AB, O) pueden organizarse
en tabla de frecuencia para datos categóricos.
15. Los datos recogidos durante un período de tiempo pueden ser presentados usando un
gráfico de datos temporales.
16. Un gráfico común que se usa para explorar el patrón de los datos para muestras pequeñas
se llama Tallo y Hoja
17. En un gráfico de Pareto, las frecuencias deben ser representadas en el eje vertical.
18. Se aplicó un cuestionario sobre arreglos de vivienda a 25 encuestado. La información
obtenida se muestra a continuación, donde H = casa, A = apartamento, M = casa móvil y
C = condominio)
H C H M H A C A M C M C A M A C C M C C H A H H M
Construya una distribución de frecuencias para los datos
Clase f Porcentaje
Casa (H) 6 24%
Apartamento (A) 5 20%
Casa móvil (M) 6 24%
Condominio (C) 8 32%
19. Construya un gráfico de pastel para los datos del ejercicio anterior.
20. A 30 clientes seleccionados al azar al salir de una tienda de conveniencia, se le preguntó a
cada uno el número de artículos que compró. Construya una distribución de frecuencia no
agrupada para los datos presentados a continuación.
2 9 4 3 6
6 2 8 6 5
7 5 3 8 6
6 2 3 2 4
6 9 9 8 9
4 2 1 7 4
21. Construya un histograma, un polígono de frecuencia y una ojiva de los datos del ejercicio
anterior.
22. El New England Journal of Medicine predijo el número de muertes innecesarias debido a
la obesidad infantil. Dibuja un gráfico de serie de tiempo para los datos.
Año 2020 2025 2030 2035
Muertes 130 550 1500 3700
Tema 3. Descripción de datos
Determine cuál de los siguientes enunciados es verdadero o falso. En caso de ser falso,
explique por qué lo es.
1. Cuando se calcula la media para datos no agrupados, se utilizan todos los valores del
conjunto de datos. Verdadero
2. No se puede encontrar la media para datos agrupados cuando hay una clase abierta
Verdadero
3. Un solo valor extremadamente grande puede afectar la mediana más que la media.
Falso, la mediana es una medida de tendencia central resistente por lo que no
resulta tan afectada por valores grandes.
4. La mitad de todos los valores de los datos estarán por encima de la moda y la otra
mitad por debajo de la misma. Falso, son características únicas de la mediana
5. En un conjunto de datos, la moda siempre será único Falso, ya que la moda de un
conjunto de datos puede ser bimodal o simplemente no existir.
6. El rango y el rango medio son medidas de variación Falso, el rango medio es de
tendencia central
7. Una desventaja de la mediana es que no es única Falso, la mediana es única
8. La moda y el rango medio son ambas medidas de variación Falso, son medidas de
tendencia central
9. Si la puntuación de una persona en un examen corresponde al percentil 75, entonces
esa persona obtuvo 75 respuestas correctas de 100 preguntas. Falso, ya que el 75% de
los datos se encuentran por debajo de 75
Seleccione la mejor respuesta
10. ¿Cuál es el valor de la moda cuando todos los valores del conjunto de datos son
diferentes?
a. 0
b. 1
c. No hay moda
d. No se puede determinar a menos que se den los valores de los datos.
11. Cuando los datos se clasifican, por ejemplo, como lugares de residencia (rural,
suburbano, urbano), la medida más apropiada de tendencia central es la
a. Media b. Mediana c. Moda d. Rango medio
12. P50 corresponde a
a. Q2 b. D5 c. RIQ d. Rango medio
13. ¿Qué no es parte del resumen de cinco números?
a. Q1 y Q3 b. La media c. La mediana
d. Los valores más pequeños y más grandes de los datos
14. Indica el número de desviaciones estándar que un valor de datos está por encima o por
debajo de la media
a. Cuartil b. Percentil c. Coeficiente de variación d. Puntaje z
15. Cuando una distribución tiene forma de campana, ¿aproximadamente qué porcentaje
de los valores de los datos caerá dentro de una desviación estándar de la media?
a. 50% b. 95% c. 68% d. 99.7%
Utilice la mejor respuesta para completar los siguientes enunciados
16. Una medida obtenida de los datos de la muestra se llama Estadístico.
17. Generalmente, las letras griegas se usan para representar Parámetros de Población, y
las letras romanas para representar Estadísticos Muestrales.
18. La raíz cuadrada positiva de la varianza se llama Desviación Estándar.
19. El símbolo de la desviación estándar de la población es σ
20. Cuando la suma del valor más bajo y el valor más alto de los datos se divide por 2, la
medida se llama Mitad del Rango o Rango medio
21. Si la moda está a la izquierda de la mediana y la media está a la derecha de la
mediana, entonces la distribución es Simetría Positiva
22. . Un valor en los datos extremadamente alto o extremadamente bajo se llama Valor
Atípico
23. A continuación, se muestra el número de millas de carretera por galón de los 10
peores vehículos. 12 15 13 14 15 16 17 16 17 18
Encuentre las siguientes medidas:
a. Media
b. Mediana c. Moda d. Rango medio
e. Rango f. Varianza g. Desviación estándar
24. A continuación, se muestra la distribución del número de errores que 10 estudiantes
cometieron en un examen de mecanografía.
Errores Frecuencia
0–2 1
3–5 3
6–8 4
9 – 11 1
12–14 1
Encuentre las siguientes medidas:
a. Media =6.4 b. Clase modal= 6-8 c. Varianza= 11.6 d. Desviación estándar=
3.41
25. En un anuncio, una tienda minorista declaró que sus empleados tenían un promedio de
9 años de servicio.
Número de Años de
empleados servicios
8 2
2 6
3 10
Utilizando la media ponderada, calcule la media correcta.
4.5
26. El número promedio de periódicos en venta en un quiosco del aeropuerto es de 56 con
una desviación estándar de 6. El número promedio de periódicos en venta en una
tienda de conveniencia es de 44 con una desviación estándar de 5. ¿Qué conjunto de
datos es más variable?
Cv= 0.107
Cv= 0.11 (la variabilidad es mayor es la tienda de conveniencia)
27. El cargo promedio de entrega de un refrigerador es de $32. La desviación estándar es
de $4. Encuentre el porcentaje mínimo que caerá en el rango de $20 a $44. Use el
teorema de Chebyshev. 89%
28. El promedio de la puntuación nacional del SAT es 1019. Si asumimos una
distribución en forma de campana y una desviación estándar igual a 110, ¿qué
porcentaje de resultados esperas que caiga por encima de 1129? ¿Por encima de 799?
Por encima de 1129 es un 16%
Por encima de 799 es un 97.5%
29. Si el rango de un conjunto de datos es 18, estime la desviación estándar de los datos.
D.E= 18/4
D.E= 4.5
30. Un estudiante obtuvo una puntuación de 76 en una prueba de ciencias generales en la
que la media de la clase y la desviación estándar fueron 82 y 8, respectivamente;
también obtuvo una puntuación de 53 en una prueba de psicología en la que la media
de la clase y la desviación estándar fueron 58 y 3, respectivamente. ¿En qué clase su
posición relativa era más alta?
Z= 82-76/8 = 0.75
Z= 58-53/3= 1.6