Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MATERIA: ESTADISTICA I
UNIDAD III
Distribuciones de frecuencias
3.1 - INTRODUCCION
Todo análisis estadístico se inicia con una primera fase descriptiva de los datos. éste tiene
por objeto sintetizar la información mediante la elaboración de tablas de frecuencias,
representaciones gráficas y el cálculo de medidas estadísticas (o estadísticos). Estos
procedimientos descriptivos dependen de la naturaleza de la variable o atributo que se
analiza y, en este sentido, hay SOFTWARES que sintetizan datos cualitativos o datos
cuantitativos.
(tabla de frecuencias)
La organización de los datos constituye la primera etapa de su tratamiento, puesto que
facilita los cálculos posteriores y evita posibles confusiones. Realmente, la organización
de la información tiene una raíz histórica y, actualmente, con el desarrollo de los
medios informáticos, tiene menos importancia desde un punto de vista aplicado.
Cuando no existían ordenadores, o ni siquiera calculadoras, si se disponía de un
conjunto de datos, era necesario dotarlos de alguna estructura que permitiera
resumirlos y comprenderlos de una forma más o menos sencilla, esta técnica es la
Tabla de Frecuencias.
Las tablas de distribución de frecuencias se utilizan cuando se recolectan datos, con ellas
se pueden representar los datos de manera que es más fácil analizarlos.
Se pueden elaborar tablas de distribución de frecuencias para datos no agrupados (Tabla
de Frecuencias Agrupación Puntual) y para datos agrupados (Tabla de Frecuencias
Agrupación Por Intervalos). Estas últimas se utiliza cuando se tienen muchos datos.
Para elaborar tablas de distribuciones de frecuencia se debe tener en cuenta lo siguiente:
Cuando hay muchos datos se agrupan en clases. Esto consiste en agrupar los datos en
una distribución de frecuencias, que puede definirse como una ordenación o arreglo de
datos en clases o categorías que muestran para cada una de ellas, el número de
elementos que contiene, denominada frecuencia.
ESTRUCTURA DE LA DISTRIBUCION DE FRECUENCIAS O TABLA DE FRECUENCIAS
(Tabla de Frecuencias Agrupación Por Intervalos)
Xi = (Límite Inferior del Intervalo + Limite Superior del intervalo) / 2 = (LII + LSI) /2
v. El rango(R): Es la diferencia entre el valor mayor y el valor menor de la variable
en estudio de una distribución de datos pertenecientes a una variable en una N o
n.
vi. La frecuencia absoluta acumulada(FA) : Es la frecuencia total hasta el límite
superior de cada intervalo. Se simboliza con FA.
vii. La frecuencia relativa(fiR): Es el primer cálculo de probabilidad que se hace de
los datos pertenecientes a una variable, da información sobre qué parte de la N o
n en estudio corresponde a cada intervalo. Se obtiene dividiendo la frecuencia
absoluta entre el número total de datos y se puede expresar como una fracción,
como un decimal o como un porcentaje. Se simboliza como fiR y se calcula como:
¿ENCABEZADO?
Explicaciones:
a. Obsérvese que para el cálculos del Numero de clases K, NO SE UTILIZÓ LA FÓRMULA
DE STURGES (K = 1+ 3,322 log((n), el analista tomo a K de manera subjetiva,
dividiendo o segmentando la muestra n, en siete(7)clases
OBSERVE QUE EL Límite Inferior (Li) al igual que el Limite Superior (Ls), van saltando(cambiando)
de 0,5
K Li Ls fi Xi FA fiR fiRA
1 1,5 1,9 4 1,7 4 0,073 0,073
2 2,0 2,4 6 2,2 10 0,109 0,182
3 2,5 2,9 7 2,7 17 0,127 0,309
4 3,0 3,4 11 3,2 28 0,2 0,509
5 3,5 3,9 15 3,7 43 0,2727 0,7817
6 4,0 4,4 8 4,2 51 0,145 0,9267
7 4,5 4,9 4 4,7 55 0,073 1,000
Σfi= 55
Rta: El 69,1% de los estudiantes obtuvo una nota mínima de 3,0 punto
NOTA: También se pueden construir Tablas de frecuencias (Distribución de frecuencias),
en donde los datos NO SE AGRUPAN POR INTERVALOS, en este caso la Tabla de
frecuencias se construye tomando todos los valores de la variable en análisis para la N o
n, y se cuenta cuantas veces se repiten cada uno de los valores. A esta Distribución de
frecuencia algunos la llaman TABLA DE DATOS NO AGRUPADOS (Tabla de
Frecuencias Agrupación Puntual). Modelo de tabla muy útil cuando se analiza variable
cuantitativa discreta y los datos se repiten muchas veces
¿ENCABEZADO?
Xi
3 4 5 6 2 3 4 3 7 3 2 5 4 4 3 3
6 5 4 5 7 6 1 2 4 4 5 5 5 4 4 4 2
2 6 4 2 1 3 5 5 4 5 3 4 5 2 2 3
3 4 2 3 3 4 4 4 4 5 3 4 3 3 4 5
6 5 5 4 4 3 2 1 2 4
ORDENAMIENTO DE LOS DATOS
1 1 1 2 2 2 2 2 2 2 2 2 2
2 3 3 3 3 3 3 3 3 3 3 3 3 3
3 3 3 4 4 4 4 4 4 4 4 4 4
4 4 4 4 4 4 4 4 4 4 4 4 4
5 5 5 5 5 5 5 5 5 5 5 5 5 5
5 6 6 6 6 6 7 7
(DATOS NO AGRUPADOS)
K Xi fi FA fiR fiRA
1 1 3 3 0,040 0,04
2 2 11 14 0,147 0,187
3 3 16 30 0,213 0,400
4 4 23 53 0,307 0,707
5 5 15 68 0,200 0,907
6 6 5 73 0,067 0,973
7 7 2 75 0,027 1,000
75
Explicaciones:
a. Obsérvese que NO HAY INTERVALOS, NO HAY MARCA DE CLASES, si no que
se coge cada valor que toma la variable(Xi) y se cuenta cuantas veces se repite
ese mismo valor, es decir, con qué frecuencia(fi) se repite dicho valor en la N o n.
b. Los demás conceptos (FA, fiR, fiRA) se calculan de la misma manera en cualquier tipo de
distribución de frecuencias
III. EL Supermercado Eco- Mar, realizo un estudio para conocer cuántos clientes son
atendidos por hora en cada una de las siete(7) cajas donde se pagan las compras.
Para el estudio se analizaron de manera aleatoria 45 horas de servicio, en días y
jornadas diferentes. Los valores encontrados fueron:
16 23 24 20 17 14 19 33 31 29
38 24 22 25 27 26 30 34 28 18
21 23 26 24 23 27 32 25 26 23 22
24 20 29 27 24 21 26 34 27 24 25
26 23 26
¿ENCABEZADO?
Xi =
Xi =
N=
n=
K = Se aproxima a siete(7)
El intervalo de clase o el ancho de la clase(I) I = (Dato Mayor – dato menor)/ K
K Li Ls fi Xi FA FiR fiRA
1 14,0 17,5 4
2 17,5 21,0 5
3 21,0 24,5 13
4 24,5 28,0 14
5 28,0 31,5 4
6 31,5 35,0 4
7 35,0 38,5 1
La marca de clases(Xi)
EJERCICIOS PROPUESTOS
2710,3
2730,31 2 2698,00 2701,56 2782,37 2713,43 2659,51 2739,93 2716,91
2785,7
2799,42 9 2737,24 2749,56 2713,86 2747,16 2825,34 2777,23 2816,85
2686,9
2745,72 1 2800,87 2667,10 2803,99 2697,54 2811,72 2734,79 2796,44
2779,4
2670,77 6 2770,02 2722,69 2747,65 2789,71 2761,99 2805,57 2785,96
2716,5
2787,57 7 2744,23 2765,14 2818,61 2798,47 2744,00 2756,43 2717,69
2783,2
2766,65 8 2779,85 2812,21 2755,32 2739,36 2785,52 2733,25 2810,39
2743,4
2703,16 7 2770,96 2726,80 2728,48 2741,63 2673,21 2804,11 2696,37
Hacer?
a. Encabezado
b. Tabla de frecuencias (distribución de frecuencias)
c. Que % de los días la tasa de cambio supero 2800 E
Número de nacimientos
23 29 22 21 37 48 25 28 27
34 24 29 28 24 23 39 24 37
22 34 25 41 28 37 21 25 33
36 25 22 31 29 21 32 33 26
17 27 28 29 29 30 27 35 20
23 32 25 37 28 26 24 17 30
39 32 34 27 23 24 26 27 31
19 35 40 24 16 12 27 38 25
36 25 33 24 21 25 30 38 23
27 30 25 31 31 27 30 23 29
Peso de los recién nacidos
a. Encabezado
b. Tabla de frecuencias (distribución de frecuencias)
c. Que % de los niños pesaron al nacer Mínimo 4,00 Kilogramos?
d. Que % de los días nacieron máximo 30 bebes?
3.3- GRAFICAS
Un gráfico estadístico es una representación visual de una serie de datos estadísticos que
pertenecen a una variable o conjuntos de variables para una N o n.
Es una herramienta muy eficaz, ya que un buen gráfico:
• Capta la atención del lector
• Presenta la información de forma sencilla, clara y precisa
• No induce a error
• Facilita la comparación de datos y destaca las tendencias y las diferencias
• Ilustra el mensaje, tema o trama del texto al que acompaña.
En primer lugar, vamos a empezar definiendo los tipos de datos que existen y a continuación
veremos cómo se pueden representar a través de los gráficos.
TIPOS DE DATOS
A. Cualitativos: se refieren a cualidades o modalidades que no pueden expresarse
numéricamente. Pueden ser:
• Ordinales: si siguen un orden o secuencia (ej. el abecedario, los meses del año).
• Categóricos: si no siguen ningún orden (ej. el estado civil de las personas: solteros, casados,
viudos, divorciados y separados).
TIPOS DE GRAFICOS