Está en la página 1de 12

Estadı́stica para Ciencias Sociales

Ejercicios exámenes anteriores


Profesor: Mauricio Grotz

Ejercicios

1. A continuación se presentan las estadı́sticas descriptivas y un box-plot de la variable “Mor-


talidad infantil”, medida como la probabilidad de que un niño muera durante los primeros
5 años de vida (entre 1 a 5 años de edad), para 185 paı́ses.

variable N p50 sd min max


Mortalidad infantil 185 71.36 27.36 9.15 100

1
a) ¿Cuál es el nivel de medición de la variable? ¿Nomial, Ordinal o Intervalar discreta,
Intervalar continua?

b) ¿Que forma tiene la distribución? ¿Simétrica, sesgada a la derecha, sesgada a la iz-


quierda? Justifique brevemente.

c) ¿Cuál de las siguientes opciones le parece una buena aproximación de la media?


a) 10 b) 65 c) 71 d) 75 e) 91

2. La distribución de la cantidad promedio de calorı́as que consumen por dı́a los adolescentes
en un paı́s, se distribuye en forma normal, con una media de 2500 calorı́as y un desvı́o
estándar de 750 calorı́as

a) Si se considera que no es saludable para un adolescente que consuma menos de 1200


calorı́as por dı́a ¿Qué porcentaje de todos los adolescentes de ese paı́s se encuentran
por debajo de ese nivel?

b) Un adolescente tiene una dieta saludable y consume la cantidad de calorı́as tı́pica (2500)
durante el dı́a. Sin embargo, al final del dı́a consume una hamburguesa en Mc Donalds.
Esta comida extra incrementa su ingesta de calorı́as desde el percentil 50 al percentil
80. Utilice esta información para determinar cuántas calorı́as tiene la hamburguesa.

3. De acuerdo con un estudio el 44 % de los estudiantes universitarios consume alcohol en


forma excesiva, mientras que el 56 % restante no consume alchool o lo hace de manera
moderada. Adicionalmente, se detectó que entre los estudiantes que consumen alcohol en
exceso, el 17 % estuvo involucrado en accidentes automovilı́sticos. Por su parte, entre los
estudiantes que no tienen problemas de alcohol, el 9 % estuvo involucrado en ese tipo de
accidentes.

a) ¿Estan los eventos “consumo excesivo de alcohol” y “estar involucrado en un accidente


automovilı́stico” relacionados? Justifique.

b) ¿Cuál es la probabilidad de elegir al azar un estudiante que consuma alcohol en forma


excesiva y esté involucrado en un accidente automovilı́stico?

2
4. A continuación se presentan las estadı́sticas descriptivas y un histograma de la variable
“Tasa de inflación anual ( %)”, medida a través de la variación interanual del ı́ndice de precios
al consumidor, para 170 paı́ses.

variable N mean min max p25 p75


inflación 170 4.47 -0.92 40.64 1.40 5.83

a) ¿Que forma tiene la distribución? ¿Simétrica, sesgada a la derecha, sesgada a la iz-


quierda? Justifique brevemente.

b) ¿Cuál es el rango de la variable?

c) ¿Cuál de las siguientes opciones le parece una buena aproximación del desvı́o estándar?
a) 0 b) 1 c) 4 d) 6 e) 42

d) ¿Cuál serı́a un valor razonable para la mediana? Justifique brevemente.

3
5. En base a datos de una encuesta de opinión pública usted desea testear la siguiente hipóte-
sis: “a mejor expectativas sobre el futuro de la economı́a mayor probabilidad de votar por el
partido polı́tico en el gobierno”. Las expectativas sobre la situación económica se miden me-
diante la siguiente pregunta: ¿Considera usted que dentro de 12 meses la situación económica
del paı́s erá mejor, igual o peor que la de ahora?. El voto por el partido en el gobierno se
mide a través de la siguiente pregunta: Si esta semana fueran las próximas elecciones presi-
denciales, ¿qué harı́a usted? (1) No votarı́a; (2) Votarı́a por el candidato o partido del actual
presidente; (3) Votarı́a por algún candidato o partido diferente del actual gobierno; (4) Irı́a
a votar pero dejarı́a la boleta en blanco o la anuları́a. Identifique lo siguiente:

...situación económica...
¿Si esta semana fueran las próximas elecciones...? Mejor Igual Peor Total
1. No votarı́a 24 86 103 213
2. Votarı́a por el candidato o partido del actual presidente 51 59 44 154
3. Votarı́a por algún candidato o partido diferente 66 240 195 501
4. Irı́a a votar pero... 10 53 43 106
Total 151 438 385 974

a) Tipo de estudio.

b) Unidad de análisis.

c) La variable dependiente.

d) Nivel de medición del indicador de la variable dependiente.

e) Nivel de medición del indicador de la variable independiente.

f) En base a los resultados ¿cuál es la probabilidad de no votar por el candidato/partido


del presidente? ¿conocer las expectativas de los entrevistados sobre la situación económi-
ca afecta la probabilidad del voto por el partido en el gobierno? Justifique brevemente.

6. Una cierta variable tiene una distribución normal estándar (µ = 0 y σ = 1)

a) ¿Cuál es el valor del cuartil superior (o tercer cuartil)?

b) Si se sigue el criterio del 1,5*(rango intercuartil) ¿a más de cuántos desvı́os estándar


por sobre o por debajo de la media deberı́a encontrarse una observación para ser
considerada “outlier” ?

c) Siguiendo el criterio de la pregunta anterior. ¿Cuál es la probabilidad de que usted


obtenga una observación al azar y sea un outlier?

4
7. A continuación se presenta la tabla de frecuencias de la variable “Cantidad de veces que
alguien entró en su casa o departamento sin permiso y robó o intentó robar algo (en 2016)”,
que surge de la Encuesta Nacional de Victimización realizada por INDEC en 2017.

Cantidad de veces... Frecuencia Porcentaje


1 1743 64.75
2 565 20.99
3 208 7.73
4 79 2.93
5 58 2.15
6 8 0.30
7 3 0.11
8 3 0.11
9 3 0.11
10 20 0.74
28 1 0.04
30 1 0.04
Total 2692 100

a) ¿Cuál es el nivel de medición de la variable? ¿Nominal, Ordinal o Intervalar discreta,


Intervalar continua?

b) Grafique el boxplot o diagrama de cajas (incluyendo posibles outliers o casos desviados)

c) ¿Que forma tiene la distribución? ¿Bimodal, sesgada a la derecha, sesgada a la izquier-


da, simétrica? Justifique brevemente.

d) Suponga que un investigador decide no considerar los outliers ¿cuál serı́a la mediana
del nuevo conjunto de datos? a) -1; b) 0; c) 1; d) 2; e) no puede calcularse

8. En una encuesta a estudiantes se les pide que reporten su sexo y la velocidad máxima
a la que alguna vez han conducido un automóvil. La pregunta respecto a la velocidad fue
categorizada en tres categorı́as: 1. Nunca he conducido; 2. Lento (nunca más de 90km/h); 3.
Rápido (más de 90 km/h). A continuación se presenta la tabla de frecuencias absolutas.

Velocidad
Sexo Nunca Lento Rápido
1. Mujer 8 24 7
2. Varón 4 16 21

En base a estos resultados

a) Identifique la variable dependiente; la variable independiente y especifique para cada


una su nivel de medición.

5
b) Entre las mujeres ¿cuál es la probabilidad de que una estudiante tomada al azar haya
conducido rápido?

c) Los eventos “velocidad” y “sexo”¿son independientes? Justifique brevemente.

9. A continuación se presentan las estadı́sticas descriptivas y un histograma de la variable


“edad del partido polı́tico del presidente o primer ministro” (medida en cantidad de años)
para 150 paı́ses del mundo.

variable n media desv. est. min max


Edad del partido... 150 37.62 34.25 0 164

a) ¿Cuál es el nivel de medición de la variable? ¿Nominal, Ordinal, Intervalar discreta ó


Intervalar continua?

b) ¿Qué forma tiene la distribución? ¿Aproximadamente simétrica, sesgada a la derecha,


sesgada a la izquierda? Justifique brevemente.

10. Para ingresar a una universidad se requiere que los aspirantes tengan un promedio mı́ni-
mo, en el nivel secundario, de 8 (en una escala de 0 a 10). A nivel nacional los promedios de
los alumnos que egresaron en el último año se distribuyen en forma normal con una media
µ = 8, 5 y desvı́o estándar σ = 1, 5.

a) ¿Cuál es la proporción, a nivel nacional, de egresados de la escuela secundaria que en


el último año tuvieron un promedio inferior a 8?

b) Si el rector de la universidad decide cambiar la polı́tica y elevar a 9 el puntaje mı́nimo


para ingresar ¿a qué proporción de estudiantes afectarı́a esta decisión?

6
c) La universidad argumenta que el 56 % de sus estudiantes tuvieron en la secundaria un
promedio de 9,2 o más. A nivel nacional, ¿cuál deberı́a ser el promedio de un alumno
para encontrarse por debajo del promedio del 56 % de todos los estudiantes del paı́s?

11. Indique si las siguientes afirmaciones son Verdaderas (V) o Falsas (F).

a) La mitad de las observaciones en una muestra tienen un valor superior a la media


muestral.

b) Los outliers tienen mayor impacto en el desvı́o estándar que en el rango intercuartil.

c) Un puntaje-z =0,25 significa que el 25 % de la distribución normal se encuentra por


debajo de ese valor.

d) La observación directa no controlada es posible en los estudios observacionales pero no


en los experimentales.

e) La mediana de una variable que se distribuye en forma normal tiene un puntaje-z=0,5.

c) Una de las ventajas del muestreo no aleatorio es que permite realizar

d) Inferencia cientı́fica e inferencia estadı́stica pueden utilizarse como términos intercam-


biables.

e) El rango intercuartil es una medida de variabilidad sensible a la presencia de outliers.

7
12. Marque la respuesta correcta.

a) El universo hipotético es:

a. El conjunto de todas las unidades de análisis entre las cuales se selecciona una mues-
tra.
b. Un conjunto de unidades de análisis imaginadas por el investigador contrafáctica-
mente.
c. El conjunto de unidades de análisis existentes y posibles a las cuales se aplica una
teorı́a.
d. El conjunto de unidades de análisis que no fueron seleccionadas en una muestra.
e. El conjunto de unidades de análisis que confirman una cierta teorı́a.

b) En un examen de estadı́stica con media 76 % y desvı́o estandar de 12 %. Tomás se


ubicó un desvı́o estándar por sobre la media. Marı́a obtuvo un puntaje de 79 %, y José
tuvo un puntaje-z de z=-0,5. Ordene estos tres estudiantes de menor a mayor.
Circule la respuesta correcta.

a. José, Marı́a, Tomás


b. Marı́a, Tomás, José
c. Tomás, José, Maria
d. Tomás, Maria, Jose
e. No es posible determinar el orden con la información suministrada.

c) Cuál de los siguientes NO ES un criterio que se ha propuesto para lidiar con los
problemas de validez y confiabilidad de la observación participante:
a. Contrastar las perspectivas de varios observadores.
b. Aumentar el número de casos o instancias del fenómeno observado.
c. Buscar deliberadamente casos que contradigan las inferencias preliminares del ob-
servador.
d. Llevar un registro de la variabilidad de los fenómenos en el espacio y el tiempo.
e. Ninguna de las anteriores.

d) La altura de las mujeres universitarias tiene una distribución aproximadamente normal


con media 165 centı́metros y un desvı́o estándar de 7,6 centı́metros. ¿Aproximadamen-
te qué proporción de mujeres miden entre 165 centı́metros y 170 centı́metros?:

a. 0.75
b. 0.50
c. 0.25
d. 0.17
e. 0.10

8
e) Suponga que un investigador desea conocer si la cantidad de ejercicio fı́sico que realizan
los fumadores es menor que el que realizan los no fumadores. los datos recolectados
muestran la existencia de algunos outliers. ¿Cual serı́a un modo adecuado para pre-
sentar en forma gráfica los datos?

a. Un gráfico de barras
b. Un box-plot
c. Un gráfico de dispersión
d. Un gráfico de torta
e. Mostrarlos en un iPhone X

f) Un investigador calculó los valores y las probabilidades de una variable aleatoria X,


como se muestra en la siguiente tabla. Desafortunadamente borró el último valor y
necesita saber cual es. Si la media de la variable fue 4 ¿cuál es el último valor?:

X 0 1 5 ?
P(X) 0.4 0.2 0.2 0.2

a. 6
b. 10
c. 14
d. 18
e. no es posible calcularlo

g) Indique que NO es la inferencia estadı́stica :


a. Un tipo de inferencia cientı́fica.
b. Una herramienta auxiliar de la inferencia cientı́fica.
c. Un tipo de inferencia que se interesa en pasar de proporciones particulares a propo-
siciones generales.
d. Una herramienta que en muchas situaciones es útil para poner a prueba hipótesis
cientı́ficas.
e. Un tipo de inferencia que formalmente se asemeja a cualquier otro tipo de inferencia.

h) En Cea D’Ancona (1998) se mencionan los siguientes criterios para evaluar la calidad
de una fuente de información excepto :

a. Autenticidad.
b. Credibilidad.
c. Aleatoriedad.
d. Representatividad.
e. No menciona ningún criterio.

9
i) Utilizando la tabla de la distribución normal estándar, la proporción de observaciones
entre z=-1,8 y z=1,6 es:
a. 0,0359
b. 0,0548
c. 0,097
d. no puede calcularse.
e. ninguna de las anteriores.

j) Indique cual NO es una propiedad del desvı́o estándar:


a. Sólo puede tomar valores positivos.
b. A diferencia de la varianza, no está afectado por casos extremos.
c. Si la distribución es normal, el rango intercuartil es aproximadamente 4/3 del desvı́o
estándar.
d. Describe la distancia tı́pica de los datos respecto a la media.
e. El valor del desvı́o estándar está afectado por la unidad de medida de la variable.

k) Tres estudiantes viven juntos en un departamento. Si X es una variable aleatoria que


mide la cantidad de personas que se encuentran en el departamento en el horario del
almuerzo con la siguiente distribución de probabilidad:

X 1 2 3
P(X) 0.2 0.2 0.6

a. La media es igual a la mediana.


b. La media es menor a la mediana.
c. La media es mayor a la mediana.
d. Es posible calcular la media pero no la mediana.
e. No es posible calcular ni media ni mediana.

l) De acuerdo con Piovani, cual de las siguientes NO es una caracterı́stica de la observa-


ción cientı́fica:

a. Sistematicidad.
b. Significancia estadı́stica.
c. Constancia.
d. Orientación teórica.
e. Se atiene a reglas y procedimientos.

10
Soluciones

1a. Intervalar continua.


1b. Sesgada a la izquierda.
1c. 65

2a.
P (X < 1200) = P ( X−µ
σ
< 1200−2500
750
= P (Z < −1, 73) = 0, 0418 = 4, 18 %

2b.

valor z del precentil 80 → P (z < 0, 84) = 0, 80


Esto se corresponde con un valor de la variable de:
X = µ + z(σ) = 2500 + 0, 84 ∗ (750) = 3130
Esto significa que la hamburguesa tiene 3130-2500=630 calorı́as

3a. A: accidente de auto; B: consumo excesivo de alcohol

P (A | B) = 0, 17; P (A | B c ) = 0, 09; P (B) = 0, 44. Las probabilidad de A, al conocer B,


cambian. Los eventos son dependientes.

3b. P (AyB) = P (A | B) ∗ P (B) = 0, 44(0, 17) = 0, 0748

4a. Sesgada a la derecha.


4b. 40.64-(-0.92)=41.56
4c. 6
4d. Entre 1.4 y 5.83. Debe ser un número igual o mayor a 1.4 o menor o igual a 5.83. Por el
sesgo se puede intuir que la media se encuentra a la derecha de la mediana.

5a. Observacional.
5b. Personas.
5c. Voto por el partido en el gobierno.
5d. Nominal.
5e. Ordinal.
5f. Probabilidad de no votar por el partido/candidato del presidente: 84.19 Sı́. Las pro-
babilidades condicionales son: 51/151=33.77; 59/438=13.47; 44/385=11.43. Distintas a la
probabilidad total: 154/974=15.81

6a. P (Z < q3) = 0, 25 → z = 0, 67


6b. irq = 0, 67 − (−0, 67) = 1, 34 → outiler > 0, 67 + 1, 5 ∗ 1, 34 > 2, 68
6c. P (z > 2,68) = 0, 3 % → P (z < −2, 68) + P (z > 2, 68) = 2 ∗ 0, 3 ≈ 0, 7 %

7a. Intervalar discreta.


7b. min=q1=q2=1; q3=2; iqr=1; outliers: valores mayores a 3; máximo sin outliers: 3.
7c. Sesgada a la derecha.
7d. 1.

11
8a. VD: velocidad (ordinal); VI: sexo (nominal)
8b. 7/(8+24+7)=7/39=0.179
8c. No. Son dependientes. Las probabilidades condicionales cambian.

9a. Intervalar discreta.


9b. Sesgada a la derecha.

10a. P (X < 8) = P (Z < (8 − 8,5)/1,5)) = P (Z < −0,33) = P (Z > 0,33) = 0, 3707 =


37, 07 %
10b. P (8 < X < 9) = P (X < 9) − P (X < 8) = P (Z < 0, 33) − (Z < −0, 33) =
0, 6293 − 0, 3703 = 0, 2586 = 25, 86 %
10c. P ercentil(1 − 0,56 = 0,44) → puntaje − z = −0,15 → X = mu + x ∗ sigma =
8, 5 − 0,15 ∗ 1,5 = 8, 275

11a. F
11b. V
11c. F
11d. F
11e. F
11f. F
11g. F
11h. F
11i. F

12a. c
12b. a
12c. b
12d. c
12e. b
12f. c
12g. a
12h. c
12i. e
12j. b
12k. b
12l. b

12

También podría gustarte