Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1.4 Organización de Los Datos PDF
1.4 Organización de Los Datos PDF
Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos,
desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna
modificación al tamaño de las unidades originales. En estas distribuciones los valores de
cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus
respectivas frecuencias.
La distribución de frecuencias no agrupadas o tabla con datos no agrupados se emplea si las
variables toman un número pequeño de valores o la variable es discreta (siempre se asocia
con valores enteros).
Tipos de frecuencias.
fi1 + fi 2 + fi 3 ...fi n = N
Frecuencia relativa (fri).
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor
y el número total de datos.
fi
fri = La suma de las frecuencias relativas es igual a 1.
N
fai
frai =
N
Ejemplo resuelto.
Los siguientes datos corresponden al número de libros leídos por un grupo de 30 alumnos,
en un lapso de 2 años. Elaborar la tabla de distribución de frecuencias.
3 2 1 4 5 3 2 1 3 1
2 3 5 1 2 2 1 3 4 2
3 4 0 1 2 2 0 1 2 3
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la
segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
N° de libros Frecuenci Frecuencia Frecuencia Frecuencia
leídos. a relativa acumulada relativa
fi fri fai acumulada
frai
2 2
0 2 = 0.066 2 = 0.066
30 30
7 9
1 7 = 0.23 2+7=9 = 0. 3
30 30
9 18
2 9 = 0. 3 9+9=18 = 0.66
30 30
7 25
3 7 = 0.23 18+7=25 = 0.83
30 30
3 28
4 3 = 0.1 25+3=28 = 0.93
30 30
2 30
5 2 = 0.066 28+2=30 =1
30 30
Total 30 1 30
Nota. Los valores de la frecuencia relativa y la frecuencia relativa acumulada al multiplicarse
por 100%, nos daría el porcentaje que representa la variable que se analiza.
Aun cuando la selección de los intervalos de clase es un arte y depende de los datos
involucrados, los siguientes pasos resultaran útiles:
Paso 1.
Paso 2.
Calcular el rango (R) de los datos, es decir, la longitud del intervalo (I) que los contiene:
R=Rango.
I= Intervalo numérico.
Paso 3.
Definir el número de clases (Nc), el cual no deberá ser tan pequeño (menos de 6) o tan
grande (más de 20) que la verdadera naturaleza de la distribución sea imposible visualizar.
1er. Método.
Método de la raíz, el cual consiste en extraer la raíz cuadrada del tamaño de la muestra y
redondear el resultado así obtenido al entero mayor.
Nc = n
Nc=Número de clases.
n= Tamaño de la muestra.
2do. Método.
Método de Sturges. Este método puede darnos una aproximación razonable para determinar
el número de clases; éste se obtiene con el siguiente modelo matemático.
n= Tamaño de la muestra.
Paso 4.
R
Ac =
Nc
R=Rango.
Nc = Número de clases.
Paso 5.
A continuación clasifiquemos los datos en cada una de las clases definiendo el límite
inferior (Li) y el límite superior (Ls) de cada clase. En el caso en que se llegue a presentar
un exceso o faltante con respecto al dato de mayor valor numérico (Xmáx) se deberá repartir
el exceso o faltante de la manera más equitativa posible entre los extremos del intervalo.
Paso 6.
Paso 7.
Definir las frecuencias de cada clase (fi), los cuales son el número de datos que quedan
incluidos en cada intervalo de clase.
Paso 8.
Definir las frecuencias relativas de cada clase (fri), éstas son porcentajes de los datos que
hay en cada intervalo de clase con respecto al tamaño de la muestra, por lo que para
obtenerlas se divide la frecuencia de cada intervalo de clase entre el tamaño de la muestra.
fi
fri =
n
n=Tamaño de la muestra.
Paso 9.
Li + Ls
mi = mi= marca de clase de la clase i.
2
Paso 10.
Paso 11.
Definir la frecuencia relativa acumulada (frai), Se obtiene dividiendo cada una de las
frecuencias acumuladas entre el tamaño de la muestra (n)
fai
frai =
n
n=Tamaño de la muestra.
Ejemplo resuelto 1.
30 35 15 21 18 32 39 20 19 20
20 34 13 13 20 35 30 17 30 31
10 32 22 14 30 36 23 14 20 34
20 28 20 16 31 38 22 12 28 13
10 12 13 13 13 14 14 15 16 17 18 19 20 20 20 20 20 20 20 21 22 22 23 28 28
30 30 30 30 31 31 32 32 34 34 35 35 36 38 39.
29
Ac = = 4.8 = 5
6
frecuencia
Frecuencia marca de frecuencia relativa
Clase Límites de clase Límites reales de clase Frecuencia relativa clase acumulada acumulada
N° Li Ls Lri Lrs fi fri mi fai frai
1 10 14 9.5 14.5 7 0.175 12 7 0.175
2 15 19 14.5 19.5 5 0.125 17 12 0.3
3 20 24 19.5 24.5 11 0.275 22 23 0.575
4 25 29 24.5 29.5 2 0.05 27 25 0.625
5 30 34 29.5 34.5 10 0.25 32 35 0.875
6 35 39 34.5 39.5 5 0.125 37 40 1
Como llenar la tabla.
Para la clase 1.
Para saber cuántos datos quedan incluidos en el intervalo I= [10,14], se deberá contar en los
datos ordenados, para esta primera clase fi= 7, que corresponde a los datos 10, 12, 13,
13, 13, 14 y 14
Para la clase 2.
Para saber cuántos datos quedan incluidos en el intervalo I= [15,19], se deberá contar en los
datos ordenados, para esta primera clase fi= 5, que corresponde a los datos 15, 16, 17, 18
y 19.
Li + Ls
mi =
2
Para la clase 1.
fai=7
Para la clase 2.
fai= 5+7=12
Para la clase 3.
fai= 11+5+7=23
fai
frai =
n
3 8 2 3 8 4 10 15 4 5
7 12 6 1 9 6 4 4 7 13
8 18 9 2 11 9 7 2 14 2
1 24 10 4 2 7 6 6 1 8
frecuencia
Frecuencia marca de frecuencia relativa
Clase Límites de clase Límites reales de clase Frecuencia relativa clase acumulada acumulada
N° Li Ls Lri Lrs fi fri mi fai frai
1 1 4 0.5 4.5 15 0.375 2.5 15 0.375
2 5 8 4.5 8.5 13 0.325 6.5 28 0.7
3 9 12 8.5 12.5 7 0.175 10.5 35 0.875
4 13 16 12.5 16.5 3 0.075 14.5 38 0.95
5 17 20 16.5 20.5 1 0.025 18.5 39 0.975
6 21 24 20.5 24.5 1 0.025 22.5 40 1
40
1.- ¿Cuál fue el menor número de goles que se anoto en la liga durante los 40 días?