Está en la página 1de 11

Guía Nª 1: Estadística Descriptiva

Profesor: Gonzalo Cruz R.

1.-Determine si las siguientes variables son discretas o continuas:

a) Número de habitantes por kilómetro cuadrado

b) Número de bacterias de cierto tipo, por mililitro

c) Densidad de diferentes muestras de un mismo líquido

d) Número de frutos de un árbol de la misma especie

e) Velocidad de un vehículo al pasar por un determinado punto

f) Puntuaciones obtenidas en un test por un grupo de personas

g) Superficie dedicada a cierto cultivo, por hectáreas, en un municipio

h) Peso de un niño al cumplir 3 años

2. Determine si las siguientes afirmaciones son verdaderas o falsas, justificando su


aseveración:

a) “Cuando las variables son medidas a nivel intervalar pueden recategorizarse para
expresarlas en una escala ordinal, sin embargo no se puede hacer a la inversa”

b) “Es imposible graficar cuando los datos están medidos en nivel nominal ya que no hay
registros de frecuencia para construir los gráficos.”

3. Comente: "La mejor medida de tendencia central es la media aritmética, por eso la
utilizaremos siempre salvo que no se conozcan los valores extremos de la variable"

4. El tiempo de espera de 322 pacientes, para ser atendidos en cierto ambulatorio médico, es
el que se muestra en la siguiente tabla:

Tiempo de Número de
espera (minutos) pacientes
[0, 5) 3
[5, 10) 35
[10, 15) 98
[15, 20) 63
[20, 25) 55
[25, 30) 44
[30, 35) 12
[35, 40) 6
[40, 45) 5
[45, 50] 1

a) Calcule los cuartiles y deciles 2 y 7

b) Si consideramos a los pacientes que esperan media hora o más, ¿Qué porcentaje
representan del total?

c) ¿Cuántos pacientes esperan entre 7 y 23 minutos?, ¿Qué porcentaje representan del total?

5. Los siguientes datos corresponden a los pesos de los bebés nacidos durante un cierto
intervalo de tiempo en un hospital:

1,814 3,629 1,814 2,722 3,629 2,722 3,175 3,175 3,175 3,629
4,536 4,082 3,175 2,722 4,536 3,629 2,268 4,082 2,722 1,361
3,175 2,722 1,814 3,175 2,722 4,082 3,175 1,814 3,175 2,722
3,629 3,629 4,082 4,99 3,629 3,175 4,536 3,629 2,268 3,175
3,175 2,722 2,268 4,536 3,629 4,082 3,175 2,268 2,722 2,268

(a) Construir una distribución de frecuencias de estos pesos.

(b) Encontrar las frecuencias relativas.

(c) Encontrar las frecuencias acumuladas.

(d) Encontrar las frecuencias relativas acumuladas.

(e) Dibujar un histograma con los datos.

(f) Calcular las medidas de tendencia central.

(g) Encontrar el percentil 24.

6. A continuación se dan los resultados obtenidos con una muestra de 50 universitarios. la


característica es el tiempo de reacción ante un estímulo auditivo:

0,111 0,111 0,11 0,113 0,118 0,112 0,136 0,107 0,122


0,112 0,097 0,098 0,106 0,102 0,12 0,1 0,118 0,113
0,123 0,119 0,117 0,109 0,116 0,12 0,106 0,124 0,109
0,117 0,112 0,111 0,1 0,111 0,111 0,119 0,103 0,1
0,107 0,121 0,119 0,102 0,128 0,115 0,121 0,129 0,133
0,117 0,105 0,106 0,095 0,1114
(a) ¿Cuál es la amplitud total de la distribución de los datos?

(b) Obtenga la distribución de frecuencias absolutas y relativas.

(c) Obtenga la distribución de frecuencias acumuladas, absolutas y relativas.

(d) Calcular la media, varianza y coeficiente de variación.

(e) Dibuje el polígono de frecuencias relativas.

(f) Dibuje el polígono de frecuencias relativas acumuladas.

7. Con el fin de observar la relación entre la inteligencia y el nivel socioeconómico (medido por
el salario mensual familiar) se tomaron dos grupos, uno formado con sujetos de cociente
Intelectual inferior a 95 y otro formado por los demás; De cada sujeto se anotó el salario
mensual familiar. Teniendo en cuenta los resultados que se indican en la tabla:

Nivel Socioeconómico CI<95 CI≥95


Intervalos n1 n2
($200.000 , $500.000] 75 19
($500.000 , $800.000] 35 26
($800.000 , $1.100.000] 20 25
($1.100.000 , $1.400.000] 30 30
($1.400.000 , $1.700.000] 25 54
($1.700.000 , $2.000.000] 15 46

(a) Dibuje un gráfico que permita comparar ambos grupos.

(b) Calcule las medidas de tendencia central para aquellos sujetos con CI < 95.

(c) Calcular las medidas de dispersión para aquellos sujetos con CI ≥ 95.

8. Un estudio consistió en anotar el número de palabras leídas en 15 segundos por un grupo de


120 sujetos disléxicos y 120 individuos normales. Teniendo en cuenta los resultados de la tabla:

Nº palabras Disléxicos Normales


25 o menos 56 1
26 24 9
27 16 21
28 12 29
29 10 28
30 o más 2 32

Calcule:
(a) Las medias aritméticas de ambos grupos.

(b) Las medianas de ambos grupos.

(c) El porcentaje de sujetos disléxicos que superaron la mediana de los normales.

(d) Compare la variabilidad relativa de ambos grupos.

9. La tabla siguiente muestra la composición por edad, sexo y trabajo de un grupo de personas
con tuberculosis pulmonar en una provincia:

Trabajadores No Trabajadores Totales


Edad
Varón Mujer Total Varón Mujer Total Varón Mujer Total
14–19 2 1 3 25 40 65 27 41 68
19–24 10 4 14 20 36 56 30 40 70
24–29 32 10 42 15 50 65 47 60 107
29–34 47 12 59 13 34 47 60 46 106
34–39 38 8 46 10 25 35 48 33 81
39–44 22 4 26 7 18 25 29 22 51

(a) Representar gráficamente la distribución de frecuencias de aquellas personas trabajadoras


que padecen tuberculosis.

(b) Representar gráficamente la distribución de frecuencias de los varones no trabajadores que


padecen tuberculosis.

(c) Representar gráficamente la distribución de frecuencias del número total de mujeres que
padecen tuberculosis.

(d) ¿Por debajo de qué edad está el 50 % de los varones?

(e) ¿Por encima de qué edad se encuentra el 80 % de las mujeres?

(f) Obtener la media, mediana y desviación estándar de la distribución de las edades de la


muestra total.

10. En una epidemia de escarlatina, se ha recogido el número de muertos en 40 ciudades de un


país, obteniéndose la siguiente tabla:

Decesos 0 1 2 3 4 5 6 7
Ciudades 7 11 10 7 1 2 1 1

(a) Representar gráficamente estos datos.

(b) Obtener la distribución acumulada y representarla.

(c) Calcular media, mediana y moda.

(d) Calcular la varianza y la desviación estándar.


(e) Porcentaje de ciudades con al menos 2 muertos.

(f) Porcentaje de ciudades con más de 3 muertos.

(g) Porcentaje de ciudades con a lo sumo 5 muertos.

11. Se le ha tomado la temperatura corporal a un grupo de pacientes afectados de gripe, con


los resultados siguientes:

Temperatura (ºC) 37 37,2 37,5 38 38,1 38,5 39


Nº pacientes 1 5 15 6 10 5 2

Calcule:

(a) Media aritmética.

(b) Moda y mediana.

(c) Coeficiente de variación de Pearson. ( se calcula dividiendo la Desv. Estándar por la Media)

12. Un ecólogo está interesado en el tamaño de la hoja de una determinada especie vegetal.
Para ello recoge una muestra con los siguientes resultados:

centímetros 2,5 3,2 4 5,5 5,8 6,1


Nº hojas 2 4 9 6 6 3

Determine los valores de:

(a) Primer y tercer cuartiles.

(b) Moda y mediana.

(c) Percentiles 42 y 86

13. La siguiente distribución de frecuencias se refiere a las edades de los empleados de una
empresa:

Edad (años) ni
16-22 11
22-28 15
28-34 32
34-40 28
40-46 16
46-52 25
52-58 14
58-64 10
64-70 6

Calcule:
(a) Media aritmética, intervalo mediano, mediana, intervalo modal, cuartiles de primer y tercer
orden, percentiles 32 y 81.

(b) Desviación estándar, coeficiente de variación (= S/Media) y rango intercuartilico.

14. Dadas las observaciones siguientes:

11 23 26 20 20 27 15 26 21 31
15 13 20 24 10 33 29 25 16 27
19 25 27 22 28 29 29 20 18 20

(a) Agrupe los datos en cinco intervalos de longitud constante, comenzando por el valor 10.

(b) Utilizando los intervalos anteriores, calcule: media, intervalo mediano, mediana, intervalo
modal,

(c) cuartiles de primer y tercer orden y el percentil 82.

(d) desviación estándar, coeficiente de variación y rango intercuartílico.

15. Al examinar 158 casos de parálisis de Bell se anotaron las diferentes terapias seguidas por
estos pacientes, resultando el conjunto de datos:

C : Corticoides
DQ : Descomprensión quirúrgica
ET : Electroterapia
NT : Ningún tratamiento
OT : Otras modalidades

Tratamiento C DQ ET NT OT
Nº de pacientes 73 36 19 21 9

(a) Obtenga la tabla de frecuencias e indique qué porcentaje de pacientes toma corticoides.

(b) Construya el diagrama de sectores.

16. Los siguientes datos representan el número de días de hospitalización por una
apendicectomía:

Nº de días 3 4 5 6 7 8 más de 8
Nº de casos 15 58 43 22 8 3 1

(a) Obtener la media y la varianza, así como los coeficientes de asimetría, curtosis y variación.

(b) Representar el correspondiente diagrama de barras.


17. La siguiente tabla muestra la distribución de edades de 75 casos de una determinada
enfermedad durante un año y en un hospital determinado:

Edad ni
5-15 5
15-25 10
25-35 20
35-45 22
45-55 13
55-65 5

(a) Calcular la media, mediana, varianza, desviación estándar y coeficiente de variación.

18. Como parte de un proyecto de investigación, cierto investigador obtuvo los siguientes
niveles de SLP de una muestra de 10 individuos adultos bajo tratamiento de Diabetes Mellitus:

5,85 6,17 6,09 7,7 3,17 3,83 5,17 4,31 3,09 5,24

(a) Calcular la media, mediana, varianza y desviación estándar.

(b) ¡Qué puede concluir respecto de la media y la mediana?

19. Se ha realizado con 100 mujeres un estudio sobre la edad en la que comenzaron a utilizar
anticonceptivos orales.

Los datos, agrupados en clases, están en el siguiente cuadro:

Consumo [0,50] [50,100) [100,150) [150,200) [200,250]


Ni 25 60 90 98 100

(a) Calcule el porcentaje de mujeres que consume más de 120 mg


(b) Calcule la media, la mediana y la moda

20. Se ha realizado un estudio para valorar el efecto del alcohol sobre los niveles de colesterol
en suero. Para ello, se ha recogido la cantidad de alcohol consumido por semana (en gr.) de 100
sujetos, obteniéndose la siguiente tabla de frecuencias absolutas acumuladas:

Clases ni Ni fi
13-25 23
25-37 33
37-49 72
49-61 90
61-73 10
(a) Calcular el porcentaje de sujetos que consumen entre 20 y 40 gr. de alcohol a la semana.

(b) Calcular el consumo medio.

(c) Calcular el número de sujetos que hay entre el percentil 15 y el cuartil tercero.

(d) Obtener la mediana de la distribución de frecuencias.

21. Se ha medido la tasa de glucosa en sangre a un grupo de 350 individuos. Los datos
agrupados en 7 intervalos de amplitud 10 mg /100 ml se presentan en la siguiente tabla:

Intervalos n
65-75 14
75-85 42
85-95 63
95-105 84
105-115 70
115-125 56
125-135 21

(a) Calcular la desviación estándar de los datos, sabiendo que la media es 101, 6 mg/100 ml.

(b) ¿Qué valor de tasa de glucosa es superado por el 40 % de los datos?

22. Para realizar un estudio que pretende valorar el proceso de crecimiento en 250 niños de
edad similar, se ha utilizado el índice de masa corporal (IMC = kg/m2). Los datos agrupados en 6
intervalos junto con la mayoría de sus frecuencias relativas ( fi ), se presentan en la siguiente
tabla:

Peso Intervalos fi
Bajo [15−18) 0,04
Normal-Bajo [18−20) 0,12
Normal [20−25) 0,4
Normal-Alto [25−27)
Sobrepeso [27−30) 0,16
Obesidad [30−35] 0,12

(a) ¿Cuál es el IMC que superan el 50 % de los niños de este estudio?

(b) ¿Qué% de niños tienen un IMC superior a 22 kg/m2?

23. Con el objetivo de determinar la presencia de anemia en mujeres embaraza- das, se


midieron los valores de hemoglobina (gr/dl) al final del primer trimestre en un grupo de 200
embarazadas que no seguían ningún tratamiento paralelo.

La siguiente tabla presenta los porcentajes de embarazadas que se incluyeron en cada una de
las categorías:
Hemoglobina (g/dl) fi
[9,0−9,8) 10%
[9,8−10,6) 40%
[10,6−11,4) 30%
[11,4−12,2) 15%
[12,2−13,0) 5%

A partir de estos datos:

(a) El porcentaje de mujeres que presentaban anemia es decir, que tenían valores de
hemoglobina por debajo de 11 gr/dl

(b) Determinar la media, la mediana y la desviación estándar de los datos. ¿Es la media un
buen representante de los datos?

24. La siguiente tabla nos muestra (en miles) el número de embarazos registrados en un país a
lo largo del año 1996, según los diferentes grupos de edad:

Edad <20 [20−25) [25−30) [30−35) [35−40) [40−45)


Fi% 4,49 17,23 48,69 83,15 97,00 100,00

(a) Calcular la edad media de los embarazos así como los cuartiles.

(b) ¿Qué porcentaje quedó embarazada con más de 28 años de edad?

Obs: aproxime a números enteros al calcular frecuencias absolutas.

25. En un reconocimiento médico realizado a los 1000 trabajadores de una factoría industrial,
se ha medido la tensión arterial sistólica (mm Hg) obteniendo la siguiente distribución de
frecuencias. Completar la tabla sabiendo que la mediana de los datos es 138 mm Hg

Categoría Intervalo n
Óptima [110 , 120]
Normal (120 , 130] 120
Normal-Elevada (130 , 140] 350
HTA-Leve (140 , 160] 260
HTA-Moderada (160 , 180] 120
HTA-Severa (180 , 220]

26. La siguiente tabla recoge la distribución de frecuencias de triglicéridos (en mg/dl) en el


suero de un grupo de niños con 6 años. Completar la tabla sabiendo que el percentil 20 de esta
distribución es 32 mg/dl.

Nivel de 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90


triglicéridos
n 10 15 24 18 12 4 2
27. Uno de los medicamentos antivirales que se utilizan para combatir el virus de la gripe es la
Amantadina. En un estudio sobre este medicamento se han administrado por vía oral dosis
únicas de 100 mg a 60 individuos adultos sanos. La variable estudiada (Tmax) es el tiempo
requerido en minutos para alcanzar la concentración máxima de plasma. La siguiente tabla
recoge frecuencia relativas acumuladas (Fi ) de los datos del estudio:

[100 − 120] 0,25


[120 − 140] 0,75
[140 − 160] 0,90
[160 − 180] 0,95
[180 − 200]

(a) Determinar media, mediana y desviación estándar de esta distribución.

(b) Determinar todas las medidas de dispersión y comente.

28. La ictericia neonatal es un fenómeno biológico complejo, resultado de un desequilibrio


transitorio entre la producción y eliminación de la bilirrubina. En el curso de una investigación,
se determinaron los niveles de bilirrubina a través de bilirrubinometría transcutánea (BTc) de
una muestra de neonatos con ictericia, obteniéndose los siguientes resultados:

(a) ¿Entre qué valores se encuentran el 30 % central de los datos de esta distribución?

(b) Calcular todas las medidas de tendencia central.

29. En 50 niños de 12 años de edad se anotó el número de dientes permanentes cariados u


obturados, obteniéndose que 8, 12, 10, 6, 4, 4, 4, 0 y 2 niños tenían 0, 1, 2, . . ., 7 y 8 dientes en
esas condiciones. Calcular la media, mediana y desviación estándar de la distribución.

30. Se determinó 20 veces el contenido de glucosa en sangre de una misma muestra por medio
de dos métodos, A y B, de determinación rápida de la misma. Comparar la dispersión de ambos
métodos.
Método A 140 141 142 127 138 136 135 142 126 148 139 142 141 151 144 146 145 148 147 136
Método B 130 132 146 138 145 148 147 135 136 137 141 146 138 131 134 146 139 140 148 146
31. Los siguientes datos corresponden a observaciones del número de camas diarias
disponibles en el servicio de Ginecología durante 30 días.

1 3 1 1 0 1 0 1 1 0
2 2 0 0 0 1 2 1 2 0
0 1 6 4 3 3 1 2 4 0

a) Construir la tabla de distribución de frecuencias, absolutas y relativas, y un gráfico de barras

b) Calcular la mediana, las desviaciones respecto a la Media y la Mediana.

d) Calcular el rango y el rango intercuartílico.

e) ¿Cómo cambian las respuestas anteriores si la observación igual a 6 es un error de


transcripción y es en realidad igual a cero?

f) Calcular la media y la desviación estándar en cada uno de los casos (con el 6 y sin el 6).

32. A un grupo de 30 personas se les ha tomado el número de pulsaciones por minuto (ritmo
cardiaco) obteniéndose los siguientes resultados:

87 85 61 51 64 75 80 70 69 82
80 79 82 74 90 76 72 73 63 65
67 71 88 76 68 73 70 76 71 86

a) Agrupa los datos en cinco intervalos y construye la tabla de frecuencias.

b) Representa gráficamente esta distribución.

c) Calcula la media, mediana y moda.

d) Calcula la desviación estándar.

33. Dada las siguientes escalas:

i. Escala Nominal

ii. Escala Ordinal

iii. Cuantitativa Discreta

iv. Cuantitativa Continua (Escala de Razón)

Clasifique las variables :

a) Número de accidentes de tránsito ocurridos en Santiago durante 1 año


b) Colesterol en Sangre (mg/dl)
c) Grado funcional de un paciente cardiópata (I/II/III/IV)
d) Grupo de tratamiento con 4 fármacos distintos (A/B/C/D)
e) Grupo de tratamiento para perder peso
(control/dieta/dieta+ejercicio/dieta+ejercicio+fármaco)

También podría gustarte