Está en la página 1de 15

UNIVERSIDAD DE COSTA RICA

ESCUELA DE ESTADSTICA
Prof. Olman Ramrez Moreira

DISTRIBUCIN DE
FRECUENCIAS

FUENTE:
Gmez, Elementos de Estadstica Descriptiva
Levin & Rubin. Estadstica para
Administradores

DEFINICIN Y USO


Necesidad de resumir la informacin. Para que los datos


sean tiles deben organizarse para distinguir patrones y
tendencias y llegar as a conclusiones lgicas
Una forma de organizar un conjunto de datos es
clasificarlos en categoras o clases y luego contar cuntas
observaciones quedan dentro de cada categora.
Para el anlisis e interpretacin de datos es valioso
conocer:
La forma o patrn de distribucin de los datos
La posicin de la distribucin: alrededor de qu valor se tienden a concentrar
los datos
 Variabilidad: la dispersin de los datos alrededor de los valores centrales



Ordenamiento o arreglo de los datos en clases o


categoras indicando para cada una de ellas, el nmero de
elementos que contiene o frecuencia

VISITAS DIARIAS HECHAS AL SITIO WEB DE


ESTUDIOS SOBRE DIVERSIDAD CULTURAL EN
EL PRIMER CUATRIMESTRE DEL 2007
22
22
23
24
25
26
26
26
27
27
27
28
28
28
29

30
30
30
30
30
30
30
31
31
31
31
31
32
32
33

33
33
33
34
34
34
34
35
35
35
35
35
35
35
35

35
35
35
35
36
36
36
37
37
37
37
38
38
38
38

38
38
38
38
38
38
39
39
39
40
40
40
40
40
40

40
41
41
42
42
42
42
43
43
43
44
44
45
45
45

45
45
45
46
46
47
47
47
47
47
48
48
48
49
49

49
50
50
52
52
52
52
53
53
54
55
61
62
64
72

MANIPULACIN DE LOS DATOS


Conclusiones obtenidas de estos datos:
 Edad mxima: 72
 Edad mnima: 22
 Amplitud general: 50
 Mayora de valores est entre 30 y 50
Una visin ms clara se puede obtener
construyendo una distribucin de frecuencias.
Requiere definir:
Valor de inicio de la primer clase
Amplitud o intervalo a usar
Conociendo ambas queda definida la cantidad
de clases a contruir

EL NMERO DE CLASES
Depende de la cantidad de datos u observaciones y de la amplitud general
Muchas observaciones  permiten un mayor nmero de clases
Pocos datos  no conviene hacer muchas clases
Buscar un balance entre necesidad de resumir la informacin y mantener suficientes detalles para
apreciar las caractersticas de los datos
Partir de la amplitud general y probar con diferente nmero de clases hasta alcanzar un nmero
de clases y un intervalo adecuado (rango / # clases)
Decidir si usar clases iguales o desiguales
El nmero de clases recomendable est asociado con la cantidad de datos.

Clases abiertas:

 Ubicadas al principio o al final de la distribucin de frecuencias,


 Necesarias cuando unos pocos datos se alejan mucho de la mayora (hacia arriba o hacia abajo),
 Evitar construir clases intermedias vacas (para clases de igual amplitud)

Recomendaciones:

 Las clases deben ser exhaustivas y mutuamente excluyentes


 Procurar que el nmero de clases oscile entre 5 y 10
 Evitar, hasta donde sea posible, clases de diferente amplitud

COMPONENTES DE LA DISTRIBUCIN DE
FRECUENCIAS
FRECUENCIAS ABSOLUTAS:


Nmero de elementos u observaciones


pertenecientes a una misma clase.

FRECUENCIA RELATIVA:


Se obtiene dividiendo la frecuencia absoluta por el


nmero de observaciones

Denota la importancia de la clase, al expresarse en


trminos porcentuales

Facilitan el anlisis de los datos, en especial para


comparar distribuciones de frecuencias basadas en
diferentes nmero de observaciones

FRECUENCIA ACUMULADA



Nmero de observaciones que son menores que el


lmite superior de la clase
Se obtiene sumando las frecuencias (absolutas o
relativas) en sentido descendente

PUNTO MEDIO:

Valor central de la clase


Promedio entre el lmite inferior de entre dos clases


sucesivas

Es el valor representativo de la clase

CLASIFICACIN VISITAS DIARIAS AL SITIO WEB ESTUDIOS SOBRE


DIVERSIDAD. PRIMER CUATRIMESTRE 2007.
VISITAS DIARIAS

Punto
medio

FRECUENCIA

ACUMULADA

Absoluta

Relativa

Absoluta

Relativa

20 -

29

25

15

12,5

15

12,5

30 -

39

35

54

45,0

69

57,5

40 -

49

45

37

30,8

106

88,3

50 -

59

55

10

8,3

116

96,7

60 -

69

65

2,5

119

99,2

70 -

79

75

0,8

120

100,0

120

100,0

Total

Interpretacin:
f3: en 37 das del primer cuatrimestre del 2007 las visitas diarias al
sitio WEB estuvieron entre 40 y 49
f%3: el 30.8% de los das del primer cuatrimestre de 2007 las visitas
diarias al sitio WEB oscilaron entre 40 y 49 aos
F3: 106 das del primer cuatrimestre del 2007 las visitas diarias al
sitio WEB fueron 59 visitas o menos
F%3: el 88.3% de los das del primer cuatrimestre del 2007 las
visitas diarias al sitio WEB fueron 59 visitas o menos

REPRESENTACIN GRFICA

La representacin grfica contribuye a un mejor


anlisis de los datos
Facilita la comprensin del fenmeno considerado
Pierde detalle de informacin pero se obtiene otro tipo
de informacin
Grficos utilizados: histograma, polgono de
frecuencia y ojiva son tiles pues resaltan los
patrones de los datos y atraen la atencin

HISTOGRAMA


Grfico de barras verticales, las barras no guardan separacin entre s

Definidas las escalas en el eje cartesiano se dibuja un rectngulo acorde a la


frecuencia de la clase (altura)

En clases de igual amplitud las barras son proporcionales a la frecuencia de la


clase

POLGONO DE FRECUENCIAS





La altura de cada punto la determina el punto medio (abscisa) y la frecuencia simple


(ordenada) de la clase
Los puntos se unen con secciones de rectas
Se procede como si existiera una clase adicional al principio y al final, ambas con
frecuencia cero
tiles para representar dos distribuciones de frecuencia en un mismo grfico

OJIVAS




Para representar la frecuencia acumulada


La ordenada se levanta sobre el lmite superior
Tiene forma de S alargada

TENGA PRESENTE QUE:


HISTOGRAMA:



La altura debe ser proporcional al nmero de elementos de la


clase
En ocasiones puede resultar ms til el histograma elaborado
con la frecuencia relativa porque permite comparar conjuntos
de datos de tamao diferente

POLIGONO DE FRECUENCIAS




Es ms sencillo que el histograma correspondiente


Traza con mayor claridad el perfil del patrn de los datos
Se vuelve cada vez ms liso y parecido a una curva al
agregar cada vez ms y ms datos

SUGERENCIA


Aadir siempre dos clases en los grficos: una al inicio y otra


al final con frecuencia cero

EJERCICIO PRCTICO


En el Hospital de la Mujer se dispone de los siguientes datos


del peso en libras de 200 bebs prematuros nacidos en 2006.
0,5
1,0
1,5
2,0
2,5
3,0
3,5
4,0

0,9
1,4
1,9
2,4
2,9
3,4
3,9
4,4

10
19
24
27
29
34
40
17

Construya una distribucin de frecuencias completa:





Cul es el valor medio aproximado del conjunto de datos original?


Si los bebs prematuros que pesan menos de 3.0 libras se les suele mantener en incubadora
durante varios das como medida precautoria, aproximadamente qu porcentaje de bebs
prematuros nacidos en el Hospital de la Mujer en 2006 necesitaron incubadora?
Qu forma (patrn) tiene la distribucin de los datos?

DISTRIBUCIN DE LOS PESOS DE LOS 200 BEBES PREMATUROS


NACIDOS EN EL HOSPITAL DE LA MUJER EN 2006
PESO (lbs)
0,5
1,0
1,5
2,0
2,5
3,0
3,5
4,0

0,9
1,4
1,9
2,4
2,9
3,4
3,9
4,4

TOTAL

Promedio:

P unt o
m e d io

0,8
1,3
1,8
2,3
2,8
3,3
3,8
4,3

FRECUENCIA
A b s o lut a

R e la t i v a

10
19
24
27
29
34
40
17

5,0
9,5
12,0
13,5
14,5
17,0
20,0
8,5

200

100,0

547,35 / 200 = 2,74

ACUMULADA
A b s o lut a

10
29
53
80
109
143
183
200

R e lat iv a

5,0
14,5
26,5
40,0
54,5
71,5
91,5
100,0

PESO EN LIBRAS DE LOS 200 BEBES PREMATUROS NACIDOS EN EL HOSPITAL DE LA MUJER EN 2006
25

FRECUENCIA

20

15

10

0
0,3

0,8

1,3

1,8

2,3

2,8

PESO EN LIBRAS

3,3

3,8

4,3

5,3

También podría gustarte