Está en la página 1de 6

Prof.

Francisca González Guı́a Nº1 Segundo semestre 2023


Ayud. Isaac Iligaray Estadı́stica descriptiva

1. Lo siguiente es el detalle de la metodologı́a utilizada por Plaza Pública Cadem disponible en su página
web.

Técnica. Encuestas Telefónicas aplicadas a través de sistema Cati a celulares de prepago y postpago.

Universo. Hombres y mujeres de 18 años o más, habitantes en las 16 regiones del paı́s.

Muestreo. Muestreo probabilı́stico con selección aleatoria de individuos y estratificado previamente por
región.

Muestra y cobertura semanal. 705 casos. Margen de error de ±3, 7 puntos porcentuales al 95% de
confianza. Se alcanzó una cobertura total de 175 comunas. El 90% de la muestra fue aplicada en
población urbana y el 10% en población rural.

Tasa de logro semanal. Para lograr los 705 casos efectivos se realizaron un total de 7.223 llamados, lo
que representa una tasa de éxito del 9,8%.

Ponderación. Los datos fueron ponderados a nivel de sujetos por zona, género y edad, obteniendo una
muestra de representación nacional para el universo en estudio.

a) Indique qué variables de las unidades muestrales se deben tener para realizar el muestreo que se
indica.
b) Indique qué variables creen ustedes que se deberı́an considerar además para lograr representar a la
población de referencia.
c) Se ha discutido que la metodologı́a de esta encuesta no es adecuada. ¿Qué tipo de muestreo creen
que se está aplicando?
d) ¿Qué efecto podrı́a tener en los resultados la tasa de logro de esta encuesta?

2. El reporte financiero del año anterior muestra las estadı́sticas descriptivas de los 3 productos con mayor
venta (en unidades monetarias).

Producto Media Mediana Moda DE P25 P60 P75


A 690 729 1200 180 685 1100 1220
B 500 640 840 200 480 730 870
C 460 465 469 130 360 480 570

a) Identifique las variables que se muestran en la tabla y clasifı́quelas.

b) ¿Es la media la mejor medida de resumen de para las ventas del producto B?

c) ¿Qué tipo de asimetrı́a presenta la distribución de las ventas del producto A?

d) ¿Qué grupo presenta mayor homogeneidad en las ventas?

e) Indique qué producto presenta una mayor concentración de las ventas en torno a la mediana.

1
3. En la publicación Diagnóstico del consumo de tabaco en estudiantes de pregrado de la Pontificia Uni-
versidad Católica de Valparaı́so (2015) el principal objetivo es diagnosticar la situación de consumo de
tabaco en los estudiantes de pregrado de una universidad chilena.

Se realizó un estudio descriptivo utilizando metodologı́a cuantitativa y cualitativa. La población en


estudio correspondió a los estudiantes de pregrado de la PUCV matriculados en el segundo semestre del
año 2013 (11.770 estudiantes, 54 % sexo masculino).

Para la recolección de datos se utilizó un cuestionario semi-estructurado con instrumentos validados y


otras preguntas de interés, entre ellas; sexo, rango etario, carrera y año de ingreso a la universidad. El
cuestionario fue enviado por la DAE a 11.679 estudiantes a través de sus correos electrónicos personales.
Un total de 1.008 estudiantes contestaron la encuesta.

Se presenta la Tabla 1 del estudio antes mencionado:

a) ¿Qué tipo de muestro se utilizó?

b) Considerando lo expuesto en el texto y la información de la tabla 1, ¿qué elementos podrı́an sesgar


los resultados en consideración con los objetivos del estudio?

c) ¿Qué porcentaje de los encuestado es de sexo femenino?

d) ¿Cuál es el rango de edad con mayor frecuencia en la muestra? Indique los estadı́sticos que justifican
su respuesta.

e) Calcule el promedio de la edad de los participantes. Explicı́te los valores utilizados para dicho
cálculo y comente el resultado obtenido.

f) La varianza de la edad de los participantes 7,8. Comente brevemente acerca de la dispersión de


esta variable.

g) Respecto de la edad de los participantes de este estudio, ¿qué podemos decir acerca de la simetrı́a
de esta variable? Indique los estadı́sticos que justifican su respuesta.

h) ¿Qué porcentaje de los fumadores es de sexo femenino?

i) Indique una distribución condicional que se presente en esta tabla, señalando las variables involu-
cradas.

2
4. Se tienen los datos x1 , x2 , ..., xn de una variable X e y1 , y2 , ..., yn , valores que toma la variable Y . Si se
hace la transformación ui = mxi + n, comparar los valores de corr(X, Y ) y corr(U, Y ).

5. A continuación se entrega una tabla en la que se muestra la información de 12 proyectos de construcción


donde se muestra el tamaño del proyecto (en miles de m2 ) y las horas hombre utilizadas.

Tamaño del proyecto 20 5 27 3 14 12 7 34 12 21 7 9


Horas hombre 1200 720 820 400 390 900 257 1200 790 890 450 710

a) Esboce una gráfica de dispersión. ¿Es adecuado suponer que las variables se relacionan linealmente?

b) Calcule la covarianza y la correlación entre estas dos variables. ¿Es adecuado suponer que las variables
se relacionan linealmente?

6. Usted trabaja en una compañı́a de telecomunicaciones y es el encargado de las campañas de fidelización


de clientes. Dadas las condiciones actuales del mercado, necesita conocer el nivel de satisfacción de sus
clientes y estimar las probabilidades de que se cambien de compañı́a. Para esto, usted planea llevar a
cabo un estudio que le permita estudiar en una muestra de clientes algunas variables socioeconómicas
como el sexo, edad, ocupación, estado civil e ingresos, además de las siguientes preguntas:

Del 1 al 10 ¿qué probabilidad hay que recomiendes nuestro servicio?, para medir satisfacción con la
empresa.
Del 1 al 10 ¿qué probabilidad hay que deje nuestra empresa?, para medir intención de dejar la empresa.

donde 10 significa muy probable y 1, nada probable.

Del total de clientes, un 60% corresponden a personas de sexo femenino, el 45% están casados y el 70%
tienen edades entre 24 y 45 años.
Además, se sabe por experiencias anteriores que los clientes con mayor edad (sobre 45 años) tienden a
recomendar el servicio en mayor proporción que aquellos de menor edad.

a) Proponga una estrategia de muestreo que sea óptima. Indique los insumos que requiere y la informa-
ción que utiliza.

b) Identifique dos variables que medirı́a cualitativamente. Justifique su elección.

c) Identifique dos variables que medirı́a cuantitativamente. Justifique su elección.

d) ¿Qué tipo de variable es la satisfacción con la empresa? Justifique su elección.

3
7. El estudio “Manifestaciones clı́nicas y predictores de gravedad en pacientes adultos con infección
respiratoria aguda por coronavirus SARS-CoV-2”(Saldı́as F, et al. 2020) tiene como objetivo describir las
caracterı́sticas clı́nicas, los factores de riesgo y los predictores de hospitalización en pacientes adultos
tratados por infecciones respiratorias agudas asociadas a coronavirus SARS-CoV-2.
La siguiente tabla es un extracto de la Tabla 3

a) Describa la distribución de la edad en ambos grupos (manejo ambulatorio y manejo en el hospital).

b) ¿Qué condiciones se deben cumplir para poder comparar los promedios de ambos grupos?

c) ¿Hay diferencias en la distribución de la variable sexo entre ambos grupos?

d) Indique una distribución condicional que se presente en esta tabla, señalando las variables involucra-
das.

8. El estudio “Manifestaciones clı́nicas y predictores de gravedad en pacientes adultos con infección


respiratoria aguda por coronavirus SARS-CoV-2”(Saldı́as F, et al. 2020) tiene como objetivo describir las
caracterı́sticas clı́nicas, los factores de riesgo y los predictores de hospitalización en pacientes adultos
tratados por infecciones respiratorias agudas asociadas a coronavirus SARS-CoV-2.

a) Identifique el tipo de muestreo utilizado. Justifique.

b) Identifique dos variables cuantitativas y dos variables cualitativas medidas en los participantes del
estudio.

c) Describa la distribución de la variable edad. Justifique sus comentarios utilizando los estadı́sticos
descriptivos entregados en la publicación.

d) Describa la distribución de la variable consumo de tabaco. Justifique sus comentarios utilizando los
estadı́sticos descriptivos entregados en la publicación.

e) Describa la distribución de la variable dı́as de estadı́a en el hospital. Justifique sus comentarios


utilizando los estadı́sticos descriptivos entregados en la publicación.

f) ¿Qué gráfica escogerı́a para mostrar la distribución de los dı́as de estadı́a en el hospital?

4
9. Su empresa está trabajando en el plan de negocios del año siguiente y le piden que analice las ventas
diarias de un producto en los últimos quince meses. Para esto, usted recopila toda la información
disponible del perı́odo enero 2022 - marzo 2023 que equivale al volumen de ventas de 455 dı́as.
En planes de negocios pasados, se ha eliminado del análisis el 3% de las ventas más altas y el 3% de las
ventas más bajas. Con este criterio, su muestra tendrı́a 427 observaciones.

a) ¿Es posible calificar la muestra de 427 observaciones como aleatoria? Justifique su respuesta.

b) ¿Qué ventajas tendrı́a utilizar esta estrategia de construcción de la muestra?

c) El analista a cargo reporta la mediana como medida de centralidad y los percentiles 25 y 75 como
medidas de dispersión, ¿por qué habrı́a decidido mostrar estas estadı́sticas de resumen?

d) Si el percentil 10 del volumen de ventas es igual a 225 unidades monetarias (u.m.) y máximo es
398 u.m., ¿es correcto afirmar que el 10% son volúmenes de ventas mayores a 398?

Usted construye la siguiente gráfica para los volúmenes de ventas para dı́as de semana (L-V) y fines de
semana (S-D).

a) Describa la distribución de las ventas en dı́as de fin de semana.

b) ¿Qué podemos decir de la distribución del volumen de ventas en dı́as de semana comparado con
dı́as de fin de semana?

c) ¿Cuál de los dos grupos le parece más homogéneo?

d) Usted calcula además la correlación entre los volúmenes de venta y el número de visitas diarias a la
página web, obteniendo un valor de 0,82. ¿Esta información es suficiente para suponer que estas
variables se asocian linealmente?

5
10. Su empresa está trabajando en el plan de negocios del año siguiente y le piden que analice las ventas
diarias de un producto en los últimos quince meses. Para esto, usted recopila toda la información
disponible del perı́odo enero 2022 - marzo 2023 que equivale al volumen de ventas de 455 dı́as.
En planes de negocios pasados, se ha eliminado del análisis el 3% de las ventas más altas y el 3% de las
ventas más bajas. Con este criterio, su muestra tendrı́a 427 observaciones.

a) ¿Es posible calificar la muestra de 427 observaciones como aleatoria? Justifique su respuesta.

b) ¿Qué ventajas tendrı́a utilizar esta estrategia de construcción de la muestra?

c) El analista a cargo reporta la mediana como medida de centralidad y los percentiles 25 y 75 como
medidas de dispersión, ¿por qué habrı́a decidido mostrar estas estadı́sticas de resumen?

d) Si el percentil 10 del volumen de ventas es igual a 225 unidades monetarias (u.m.) y máximo es
398 u.m., ¿es correcto afirmar que el 10% son volúmenes de ventas mayores a 398?

11. Un estudio de la relación entre la edad y varias funciones visuales, por ejemplo, agudeza y percepción de
la profundidad, reportó las siguientes observaciones sobre el área de la lámina esclerótica (mm2 ) de
cabezas de nervios ópticos humanos:

2.75 2.62 2.74 3.85 2.34 2.74 3.93 4.21 3.88


4.33 3.46 4.52 2.43 3.65 2.78 3.56 3.01

a) Calcule la media y desviación estándar de la variable.

b) Determine los cuartiles inferior y superior (P25 y P75).

c) A partir a) y b), ¿qué puede inferir acerca de la distribución de los datos?

d) Si los dos valores muestrales más grandes, 4.33 y 4.52 hubieran sido 5.33 y 5.52, ¿cómo afecta esto a
la media, mediana y desviación estándar? Explique.

e) Si a la muestra original se agrega una décimo octava observación correspondiente a 4.60, ¿cómo
varı́an la media, mediana y desviación estándar? Explique.

También podría gustarte