Está en la página 1de 43

Tema N° 2: Organización de Datos

Ing. Walter Sánchez Casimiro


waltersanc@hotmail.com
Ordenando la Información

Al ordenar datos muy numerosos, es


usual agruparlos en clases o categorías.
Al determinar cuántos pertenecen a
cada clase, establecemos la frecuencia.
Construimos así una tabla de datos
llamada tabla de frecuencias.
¿Para qué se construyen las
tablas de frecuencias ?

1. ORDENAR
2. AGRUPAR
3. RESUMIR información
tablas de frecuencias
El formato general de una tabla estadística , llamada también
TABLA DE FRECUENCIAS O TABLA DE DISTRIBUCIÓN DE
FRECUENCIAS es la siguiente:

Nombre de la variable Frecuencia

Categorías o Frecuencias
Recorrido de la variable Observadas

TOTAL N
EJEMPLO

En una clase de 30 alumnos se ha preguntado el


número de hermanos que tienen, el resultado ha
sido el siguiente:

2 1 1 0 1 2 1 5 3 6
3 2 0 3 0 1 1 2 3 4
4 2 1 1 1 2 0 3 1 1
Si presentamos esta información en una tabla de
frecuencias , queda como sigue:

N ° de Frecuencia
hermanos
0 4
Interpretar la
1 12 tabla, para llegar a
2 6 una conclusión.
3 4
4 2
5 1
6 1
Total 30
ORGANIZACIÓN DE DATOS N DE DATOS
VARIABLE CUALITATIVA

Nota: Si trabajamos con escala


nominal las categorías pueden ser
colocadas en cualquier orden. En el
caso de escala ordinal las
categorías deberán ser colocadas
en orden
EJEMPLO:
En una planta embotelladora se registraron 54 accidentes y
de acuerdo con la parte del cuerpo lesionada, dedos (D),
ojos (O), brazo (B), y piernas (P); se registraron los datos
(cuadro 1). Se pide organizar los datos.
Confeccionando la tabla de dos columnas: Variable y frecuencia

Variable frecuencia

Interpretar de acuerdo a la variable y tomar una posible decisión


Gráficas
Si además de registrar la parte lesionada se
registra el sexo de los trabajadores se podría
tener un gráfico de este tipo
Ejemplo
En la siguiente tabla se presenta el motivo de la
consulta médica, durante una semana.

Motivo Consulta Número de pacientes


Bronquitis 19
Otitis 13
Heridas 7
Fracturas 18
Vacunas 20
TOTAL 77
Interpretar de acuerdo a la variable y tomar una posible decisión
Variable Cuantitativa Discreta Variable
Cuantitativa Discreta
(Pocos valores diferentes de la variable)

TOTAL
Ejemplo
Los siguientes datos corresponden a las notas obtenidas por
un curso de 24 alumnos en un trabajo de matemáticas:

3,2 4,2 5,6 6,0 2,8 3,9 4,2 4,2 5,0


5,0 3,9 3,9 3,2 3,2 4,2 5,6 6,0 6,0
3,2 6,0 4,2 5,0 5,6 5,0

Ordenemos estos datos en una tabla:


Anota en tu cuaderno una tabla de frecuencias que
considere
• Nombre de variable: Notas
• Frecuencia Absoluta
• Frecuencia relativa (ambas)
Si tu resultado es un decimal, usa 3 dígitos
después de la coma
Ejemplo
Nota Frecuencia Frecuencia Frecuencia Relativa
Absoluta Relativa Porcentual (%)

2,8
3,2
3,9
4,2
5,0
5,6
6,0
Ejemplo
Nota Frecuencia Frecuencia Frecuencia Relativa
(variable) Absoluta Relativa Porcentual (%)

2,8 1 0,041 4,166


3,2 4 0,166 16,666
3,9 3 0,125 12,500
4,2 5 0,208 20,833
5,0 4 0,166 16,666
5,6 3 0,125 12,500
6,0 4 0,166 16,666
TOTAL 24 1,00 100%

Interpretar de acuerdo a la variable y tomar una posible decisión


Ejemplo
Construir la distribución de frecuencias del número de trabajadores
que se ausentaron en 20 días laborales:
TOTAL

Interpretar de acuerdo a la variable y tomar una posible decisión


Ejercicio
Frecuencia
Nº de Frecuencia Frecuencia
Porcentual
hijos absoluta Porcentual (%)
Acumulada
Preguntas:
0 419 27.8 27.8 1.- ¿Cuántos individuos
1 255 16.9 44.7 tienen menos de 2 hijos?
2 375 24.9 69.5 • 674 individuos
2.- ¿Qué porcentaje de
3 215 14.2 83.8 individuos tiene 6 hijos o
4 127 8.4 92.2 menos?
5 54 3.6 95.8 • 97,3%
3.- ¿Qué cantidad de hijos
6 24 1.6 97.3 es tal que al menos el 50%
7 23 1.5 98.9 de la población tiene una
cantidad inferior o igual?
Ocho 17 1.1 100.0
• 2 hijos
+
Total 1509 100%
Tabla de Frecuencias de datos agrupados

Hasta el momento sólo hemos trabajado con una pequeña


cantidad de datos. ¿Qué crees que deberíamos hacer si tenemos
muchos datos?

Tabla de Frecuencias de datos agrupados


(también llamadas tabla de frecuencias con clase)
En ocasiones, el agrupar los datos en
intervalos,
intervalos nos puede ayudar para realizar un
mejor análisis de ellos.
Definiciones
•Rango: Diferencia entre el máximo y el mínimo
valor de una variable.

•Marca de clase: Representante de un intervalo, y


corresponde al promedio entre los extremos de éste.
(Li+Ls)/2.
•Tamaño de un intervalo: Es el cociente entre el
valor del rango y la cantidad de intervalos que se
desea obtener. Se recomienda tomar como longitud
de los intervalos un valor entero que sea mayor o
igual al cociente obtenido.
Tabla de Frecuencias
Para estas tablas debemos considerar cada intervalo con
límites cerrado y abierto, o sea [ - [
La tabla siguiente la vamos a elaborar con:
frecuencias absolutas(fi o ni): estas frecuencias son las
que se obtienen directamente del conteo
frecuencias relativas(hi): corresponden a los porcentajes
de cada frecuencia absoluta. hi = fi/n
frecuencia absoluta acumulada(Fi): corresponde a la
frecuencia absoluta del intervalo más la suma de las
frecuencias absolutas de todos los valores anteriores.
frecuencia relativa acumulada(Hi): corresponde al
porcentaje de la frecuencia relativa del intervalo más la
suma de las frecuencias relativas de todos los valores
anteriores.
La Distribución de Frecuencias, en tablas para datos
agrupados: Método de Espiguel

Se recomienda su uso cuando se tienen pequeñas cantidades de


datos (N), aproximadamente 30.

Pasos

1.- En primer lugar, la selección de los límites de los intervalos de


clase:
Xmax=dato Máximo ; Xmin=Dato Mínimo

2.- Rango (R); R= X2 – X1

3.- Para definir la cantidad de intervalos de clase (k), se puede


usar:
4≤K≥20 (asumiendo)

4.- Luego determinar la amplitud (C): C= R/K


La Distribución de Frecuencias, en tablas para datos
agrupados: Método de Esturger
Se recomienda su uso cuando se tienen grandes cantidades de datos
(N).

1.- En primer lugar, la selección de los límites de los intervalos de


clase:
Xmax=dato Máximo ; Xmin=Dato Mínimo

2.- Rango (R);


• V. discreta : (X2 – X1)+1
• V. continua. X2 – X1

3.- Para definir la cantidad de intervalos de clase (k), se puede usar:


La regla de Sturges: k = 1 + 3.3log(N)

4.- Luego determinar la amplitud (C): C= R/K

5.- Finalmente se determina el Exceso (E) : E= K*C-R


La cantidad de clases no puede ser tan pequeño (menos de 5) o tan
grande (más de 20), que la verdadera naturaleza de la distribución sea
imposible de visualizar.
Variables Nominales y Ordinales

Sarcoma de Número de
Kaposi individuos
Si 246
No 2314
Variables Cuantitativas
discretas o continuas
tabuladas en intervalos
Variables Cuantitativas Nivel de Colesterol Cantidad de
Discretas (mg/100 ml) hombres
Número de Número de 80-120 13
hermanos alumnos
120-160 150
0 4
160-200 442
1 6
200-240 299
2 8
240-280 115
3 10
280-320 34
4 7
320-360 9
5 5
360-400 5
Ejemplo de confección de una tabla de distribución de
frecuencias para datos continuos
Interpretar de acuerdo a la variable y tomar una posible decisión
Ejemplo
Nivel de colesterol en la sangre de una muestra de hombres
estadounidenses que tienen entre 25 y 34 años de edad , que fueron
atendidos en centros médicos de New York y sufren de hipertensión
arterial , en el año 2001

Nivel de Colesterol ¿Cuál es la variable de


(mg/100 ml) Cantidad de hombres interés?
80-120 13
120-160 15
160-200 44
200-240 29
¿Qué se mide?
240-280 9

Observa: El rango de cada intervalo es de 40.


Determinar el % de personas con un nivel de colesterol por
encima del máximo permitido (buscar información), llegar
a una conclusión y plantear un decisión .
Ejemplo
Consideremos los siguientes datos, expresados en metros,
correspondientes a las estaturas de 80 estudiantes de Cuarto
año de Educación Secundaria.

1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92


1,75 1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77
1,73 1,75 1,78 1,77 1,67 1,83 1,83 1,72 1,71
1,85 1,84 1,93 1,82 1,69 1,70 1,81 1,66 1,76
1,75 1,80 1,79 1,84 1,86 1,80 1,77 1,80 1,76
1,88 1,75 1,79 1,87 1,79 1,77 1,67 1,74 1,75
1,78 1,77 1,74 1,73 1,83 1,76 1,83 1,77 1,75
1,77 1,77 1,84 1,83 1,79 1,82 1,76 1,76 1,76
1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77
Ejemplo
Con los datos del problema anterior contestar las siguientes preguntas:
a)Utilizando el método de Espigel construir una tabla de distribución de
frecuencias.
b)Hallar el porcentaje de alumnos con estatura menor o igual a 1.80
metros.
c)Considerando el promedio del año anterior de 1:75 metros determinar el
porcentaje de alumnos que se encuentran por encima del promedio del
año anterior.
d)Considerando que los alumnos de la muestra son parte de una población
que participo de un programa para el aumento de estatura, con la finalidad
de superar 1:80 metros. Determinar su conclusión y la decisión que
tomaría:
Ejercicio
A continuación se presentan las calificaciones de 60 estudiantes que
presentaron a una prueba internacional en el año 2009, con una
calificación centesimal:

23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61

a) Construya una distribución de frecuencias.


b) Aplicando la metodología estadística llegar a tomar una decisión en
función a los datos del problema.
Ejercicios

1.-Una revista conocida del medio, efectuó una encuesta respecto a la protección
policial en la ciudad, se selecciona 419 personas y se obtiene la siguiente respuesta en
base a la pregunta:
¿Es adecuada la protección policial en su urbanización?

•Indique el tipo de variable.


•que porcentaje de personas responde que si.

RESPUESTA Nº PERSONAS
SI 293
NO 80
NO OPINA 46
TOTAL 419
2.- La nacionalidad de los participantes en una reunió del Grupo Andino
fueron los siguientes:
C P E P P V V
B P P V E V P
B B P C V P C
P C B
C: Colombiano P: Peruano E: Ecuatoriano
B: Boliviano V : Venezolano

a) Indique el tipo de variable.


b) Elabore la tabla de frecuencias.
c) Elabore una grafica circular.

3.- Se tiene la siguiente información, donde consigna el numero de animales


enfermos, con una enfermedad “X”, en 25 regiones diferentes : 15 ,20 ,25 ,15 ,18 ,
16 , 17 , 18 ,20 ,18 , 18 , 18 , 19 , 16 , 17 , 19 , 16 ,17 , 17 ,17 , 19 , 18 , 19 , 18 , 15
a) Construya una tabla de distribución de frecuencias adecuada.
b) ¿Cuántas regiones tienen a lo mas 20 animales enfermos?
c) ¿Qué porcentaje de regiones tienen 18 o menos animales enfermos?
4.- Los siguientes datos indican el numero de minutos que ocuparon sus asientos 50
alumnos de 1º año de una institución educativa, en el laboratorio de computo,
durante una semana de practica.
73 75 58 43 49 65 67 75 51 47 82 65 89 59 55 70
60 70 38 60 45 75 73 65 76 50 87 55 71 75 70 83 61
75 69 54 40 78 85 35 32 72 89 65 45 75 64 93 85
63

Construir un cuadro de distribución de frecuencias escogiendo un numero de clases


adecuado para contestar las siguientes preguntas:
a) ¿Cuántos cadetes ocuparon entre 35 y 52 minutos sus asientos?
b) ¿Cuántos cadetes ocuparon mas de una hora los asientos?
c) Asumiendo un optimo de 70 minutos de permanencia, indicar el porcentaje de
cadetes preparados óptimamente.
d) En función de los datos presentados cual seria su análisis, conclusión y que
decisión tomaría.
5.- Se tiene la siguiente tabla de frecuencias relativas de 300 empleados según
su edad.
a) Cuantos empleados tienen edades entre 22 y 32 años.
b) Que porcentaje tiene 25 años o más.
C) Que porcentaje tiene 34 años o más.
Edades 19-22 22-25 25-28 28-31 31-40

hi 0,15 0,25 0,40 0,10 0,10

6.- En base a la siguiente información:


Y’2 = 550 Y’5 = 850 h6 = 4/100 = H1
k=6 h2 = 0,14 H4 = 0,76
h5 = 0,20 H3 – h2 = 0,26
y C = constante.
Construir la tabla de distribución de frecuencias.
7.- Completar los datos que faltan en la siguiente tabla;
Variable fi hi Fi Hi
1 4 0.08
2 4
3 0.16 16
4 7 0.14
5 5 28
6 38
7 7 0.14 45
8

8.- Los siguientes datos son las velocidades (en Km/h) de 30 carros que pasaron por
un punto de control de velocidad.
Clasificar estos datos convenientemente. Construir la tabla de distribución de
Frecuencias Relativas y graficar el histograma y el polígono de frecuencias
correspondiente. Asimismo graficar la ojiva para la frecuencia acumulada relativa
menor que.30 38 60 45 20 35 20 40
54 38 35 40 10 45 60 49 49
30 55 46 29 38 80 40 28 15
8272 105 60
Asimismo contestar las siguientes preguntas:
a) Numero de carros que pasaron por el puesto de control con velocidades
superiores a 58Km/h.
b)Asumiendo un optimo de velocidad entre 42 y70 Km/h hallar el porcentaje de
vehículos que cumplen óptimamente el reglamento.

También podría gustarte