Está en la página 1de 3

Taller análisis exploratorio de datos

Andres Montoya Bolaños

1. Para establecer la edad predominante de sus pacientes. Un médico preguntó la edad de 20 de sus
pacientes obteniendo los siguientes resultados:
1 18 19 22 20 18 22 20 21 22 18 23 22 19 22 22 21 18 19 18.
a. Calcule los indicadores de tendencia central. ¿Cuál es la edad predominante?

Media 20,1904762
Mediana 20
Moda 22
Desviación estandar muestral 1,69171651
Varianza muestral 2,86190476

La edad mas predominante es 22 años.

b. Calcule el porcentaje de estudiantes con más de 20 años .

%
  Frecuencia acumulado
18 5 23,81%
19 3 38,10%
20 4 57,14%
21 2 66,67%
22 6 95,24%
23 1 100,00%
y mayor... 0 100,00%

El porcentaje de estudiantes con mas de 20 años son 42,86%

c. ¿Cuál es la forma de la distribución de los datos según estos indicadores?

Es una distribución asimétrica. Aunque se mantiene cierta simetría en dos campos: mas de 20 años
y menos de 20 años.

2. Dada las siguientes calificaciones de 25 exámenes:


4 3 4 5 4 5 4 4 3 5 5 2 1 4 5 4 3 5 1 3 2 5 1 3 2
a. Construya una distribución de frecuencias. Interprete tres frecuencias relativas
0 Frecuencia % acumulado
1 3 12,00%
2 3 24,00%
3 5 44,00%
4 7 72,00%
5 7 100,00%
y mayor... 0 100,00%

b. Elabore el gráfico más adecuado para representar los datos

Histograma
8 120.00%
6
Frecuencia

80.00% Frecuencia
4
40.00% % acumulado
2
0 0.00%
1 2 3 4 5 y mayor...
0

3. Los datos que se presentan a continuación fueron recopilados por un estudiante investigador
de las ciencias sociales, en una prueba piloto de una investigación sobre la vida social y
familiar de los estudiantes de una universidad: Dos de las variables incluidas en el estudio
fueron: Número de habitaciones que posee el hogar, calificación para la satisfacción con sus
relaciones familiares, la cual puntúa en una escala de 0 a 10 puntos. Adicionalmente el
investigador preguntó entre otras variables por el estrato socioeconómico, nivel de estudios del
padre, ingresos familiares, edad del padre, barrio, número de hermanos y por el tipo de
vivienda donde vive la familia (propia o alquilada).

Número de habitaciones que posee el hogar


6 5 2 3 2 5 7 1 5 4 6 7 2
4 3 1 6 5 1 5 7 7 4 4 4 6

Calificación para la satisfacción con sus relaciones familiares

6 5 10 3 2 5 7 10 5 4 6 7 0
4 8 10 6 5 1 5 8 0 4 4 4 6

A partir de esta información resuelva:


a. Identifique las variables medidas (nombre, tipo de variable y escala de medición).

Se están midiendo el número de habitaciones que posee el hogar (1-7) y la calificación para la
satisfacción con sus relaciones familiares (0-10).
b. Construya una distribución de frecuencias para la variable número de habitaciones por
hogar.
Frecuencia % acumulado
2 6 23,08%
3 2 30,77%
4 5 50,00%
5 5 69,23%
6 4 84,62%
7 4 100,00%
y mayor... 0 100,00%
c. ¿Qué porcentaje de estudiantes tienen en su hogar máximo 4 habitaciones?

50%

d. ¿Qué proporción de estudiantes tienen en su hogar exactamente 3 habitaciones?

7,69%

También podría gustarte