Está en la página 1de 52

ORGANIZACIN Y DISTRIBUCIN

DE FRECUENCIAS

UNIVERSIDAD MARIANO GALVEZ DE GUATEMALA

Estadstica I
Ingenieria en Sistemas de Informacin
ORGANIZACIN DE DATOS
Siendo el dato la materia prima de la estadstica, el
primer paso es la recoleccin de datos, para lo cual se
emplean diferentes tcnicas, como la entrevista
personal, el cuestionario, la observacin, la toma de
muestras, entre otras.
El segundo paso es la organizacin y ordenamiento de
los datos, lo que se hace a travs de tablas, las cuales
pueden ser por medio de una distribucin de
frecuencias simples o una distribucin de frecuencias
con intervalos, en ambos casos agrupando todos
aquellos que corresponden a una mismo dato nominal o
variable y expresando en una columna el nmero de
veces que aparece esa variable.
DISTRIBUCIN DE
FRECUENCIAS
Distribuciones o Tabla de Frecuencias
Es un formato que se usa para organizar
y resumir datos.
Clasificacin.
Cronolgica o histrica.
El nmero de casos de malaria en Guatemala por ao.
AO CASOS
2000 45,000
2001 39,000
2002 31,000
2003 22,000
2004 31,500
2005 7,500
2006 18,500
2007 30,000
2008 31,000
2009 25,500
Cualitativa
Referida a algn atributo o cualidad de los
elementos que se va a analizar.

Ejemplo: mujeres que laboran en una


maquiladora segn su estado civil.

Estado Civil No. de mujeres


Solteras 54
Casadas 63
Divorciadas 32
Viudas 12
GEOGRAFICA
Esta toma en cuenta a los pases, Departamentos,
municipios, otros.
Ejemplo:

Tasa de Analfabetismo de la poblacin de 15 aos y mas


ambos sexos
PAIS 1995 2000 2005 2012
Costa Rica 5.2 4.4 3.8 2.4
El Salvador 24.1 21.3 18.9 11.7
Guatemala 35.1 31.5 28.2 16.15
Honduras 28.3 25 22 16
Nicaragua 35.4 33.5 31.9 30
Panam 9.4 8.1 7 5.5
Fuente: UNESCO.
Cuantitativa
Esta toma como base de agrupacin una variable
numrica dividida en intervalos de amplitud
constante o variable.

Ejemplo: Los salarios semanales de 80 empleados


de un supermercado.
Salarios No. de
Empleados
1,200 1,249 8
1,250 1,299 16
1,300 1,349 26
1,350 1,399 22
1,400 1,499 5
1,450 1,499 3
Presentacin de informacin en cuadros
TABLAS DE
FRECUENCIA
Distribucin de Frecuencias

La tabla de frecuencias tiene como objeto


presentar en forma ordenada los valores o
datos que toman las diferentes caractersticas
obtenidas en una investigacin. Los datos se
clasifican y ordenan de acuerdo a las
caractersticas cualitativas o cuantitativas,
indicando el nmero de veces (frecuencia) que
se repite el atributo o variable. Esta puede ser
simple o por intervalos
Frecuencias
Es el nmero de datos o elementos de la
muestra, que caen en un mismo intervalo de
clase. Es decir, que sus valores quedan
totalmente comprendidos dentro de los linderos
de ese mismo intervalo.
Tipos de Frecuencias
Absoluta: La frecuencia absoluta de una variable
estadstica es el nmero de veces que aparece en la
muestra dicho valor de la variable, la representaremos porn i
Relativa: que es el cociente entre la frecuencia absoluta y
el tamao de la muestra. La denotaremos porf i

fi = ni/N
DondeN= Tamao de la muestra
Frecuencia Absoluta Acumulada : Es la suma de los
distintos valores de la frecuencia absoluta tomando como
referencia un individuo dado. La ltima frecuencia absoluta
acumulada es igual al nmero de casos. Se denota por Ni
Frecuencia Relativa Acumulada : Es el resultado de
dividir cada frecuencia absoluta acumulada por el nmero
total de datos. Se denota por Fi
Interpretacin Tabla de
Frecuencias
FREC.
FREC. FREC. FREC.
Peso RELATIVA
ABSOLUT ABSOLUTA RELATIVA
(kg) ACUMULADA
A ACUMULADA %
%
1.2 1 1 1 1
1.4 2 3 2 3
1.6 3 6 3 6
3.6 8 14 8 14
5.2 14 28 14 28
6.2 18 46 18 46
6.6 19 65 19 65
6.8 22 87 22 87
7.2 13 100 13 100
TOTAL 100
Interpretacin Tabla de
Frecuencias
Tablas de Frecuencia
Datos Cualitativos
Estado Civil Nmero de Porcentaje
(clase) ocurrencias (frecuencia
(frecuencia) relativa)
Soltero 22 22 %
Casado 45 45 %
Divorciado 20 20 %
Viudo 8 8%
Otro 5 5%
Total 100 personas 100 %
Tablas de Frecuencia
Datos Cuantitativos
1. Distribucin de frecuencias
simples
Ejemplo: organizar en una distribucin de
frecuencias simples, los punteos obtenidos en un
examen de estadstica por 30 alumnos

Listamos todos los nmeros en forma ascendente


de menor a mayor.
Distribucin de frecuencias simples

Punteos obtenidos en un examen de Estadstica por treinta alumnos


Punteos f
45 1
48 1
50 1
53 2
55 1
57 2
58 3
60 4
65 1
68 1
72 1
75 1
76 2
78 2
79 1
80 2
82 3
88 f1
= 30
Distribucin de frecuencias acumuladas

En una distribucin de frecuencia acumulada


(fa) escribiremos al principio de cada
posibilidad (x), el total de frecuencias
correspondientes a sta x mas todas las
correspondientes a las x menores, por lo que
f (sumatoria de las frecuencias)
corresponder siempre a las fa que figuran
enfrente de la ltima posibilidad indicada en
la comuna de las x
Distribucin de frecuencias acumuladas
Ejemplo:
En la distribucin de los punteos obtenidos en un examen de Estadstica por treinta
alumnos, tendremos la siguiente distribucin de frecuencias acumuladas.
Punteos f fa
45 1 1
48 1 2
50 1 3
53 2 5
55 1 6
57 2 8
58 3 11
60 4 15
65 1 16
68 1 17
72 1 18
75 1 19
76 2 21
78 2 23
79 1 24
80 2 26
82 3 29
88 1 30

f = 30
Distribucin de frecuencias de valores agrupados en
intervalos de amplitud constante
Son utilizados cuando los datos estadsticos de que se disponen
son numerosos (mayor de 30 datos)

Ejemplo:
Con los resultados obtenidos de un examen de estadstica de 45
alumnos del nivel medio; haremos una distribucin de frecuencias
de valores agrupados en intervalos de amplitud constante.
Distribucin de frecuencias de valores
agrupados en intervalos de amplitud constante

Se construyen intervalos de clase:


1. Rango: Es la diferencia que existe
entre el valor mas grande y el mas
pequeo.

rango max min


90 34 = 56
Distribucin de frecuencias de valores
agrupados en intervalos de amplitud constante

2. Nmero de Intervalos:
o Se aconsejan no menos de 6 ni mas de
15

INTERVALO = RANGO/ NUMERO DE CLASES

Intervalo = 56/8 = 7, por lo que la amplitud del


intervalo es de 7.
Distribucin de frecuencias de valores
agrupados en intervalos de amplitud constante

3. Formaremos los intervalos de clase, o sea


7 al lmite inferior de cada clase,
empezando por la primera: 34 + 7 = 41.
El lmite inferior de la clase siguiente es
el valor consecutivo al mximo de la
clase anterior 42 + 7 = 49 y as
sucesivamente.
Distribucin de frecuencias de valores agrupados
en intervalos de amplitud constante
4. Determinamos las frecuencias de clase contando el nmero
de observaciones que caen dentro de cada intervalo de
clase y elaboramos el cuadro de la distribucin.
X (notas) f (frecuencia)
34 41 2
42 49 3
50 57 5
58 65 8
66 73 9
74 81 9
82 89 7
90 97 2
f = 45
Distribucin de frecuencias de valores agrupados en
intervalos de amplitud constante
x Tabulacin f
34 41 // 2
42 49 /// 3
50 57 ///// 5
58 65 ///// /// 8
66 73 ///// //// 9
74 81 ///// //// 9
82 89 ///// // 7
90 97 // 2
f = 45
En el cuadro podemos observar lo siguiente:
Cada clase o intervalo est determinado por dos nmeros llamados lmites aparentes.
En el primer intervalo, 34 es el lmite aparente inferior y 41 el lmite aparente superior.
La distancia entre los lmites de cada clase o intervalo siempre es la misma.
Los lmites reales del primer intervalo son 33.5 y 41.5, del segundo 41.5 y 49.5 y as
sucesivamente.
El ancho de clase o longitud del intervalo es el nmero de los posibles valores que los
datos pueden tener para pertenecer al intervalo, as en el intervalo 34 41 el ancho es 7,
estos valores son: 35, 36, 37, 38, 39, 40, 41. Por lo que la amplitud del intervalo es 7.
Si aumenta el ancho del intervalo, disminuye el nmero de intervalos, o si disminuye el
ancho de los intervalos, aumenta el nmero de los intervalos.
Distribucin de frecuencias de valores agrupados
en intervalos de amplitud constante

6. Marca de Clase: Es el punto medio del


intervalo de clase. Se usa en los
mtodos estadsticos como valor
estimado de las observaciones que
cayeron dentro de ese intervalo
LI = 34 34 + 41 / 2 = 37.5
LS = 41
Una forma prctica de calcular las marcas de clase es sumar a
la primera marca de clase encontrada, el intervalo de clase
utilizado.
Distribucin de frecuencias de valores
agrupados en intervalos de amplitud
constante
Si a la distribucin anterior se le ponen las columnas de
lmites reales, marca de clase y frecuencias acumuladas queda
as:
X (notas) Intervalo Marca de f fa %f %fa
real clase (x)
34 41 33.5 41.5 37.5 2 2 4.4 4.44
42 49 41.5 49.5 45.5 3 5 6.7 11.11
50 57 49.5 57.5 53.5 5 10 11.1 22.22
58 65 57.5 65.5 61.5 8 18 17.8 40.00
66 73 65.5 73.5 69.5 9 27 20.0 60.00
74 81 73.5 81.5 77.5 9 36 20.0 80.00
82 89 81.5 89.5 85.5 7 43 15.6 95.56
90 97 89.5 97.5 93.5 2 45 4.4 100.00
=45
ANALISIS DE LA TABLA DE FRECUENCIAS
X (notas) Intervalo real Marca de f fa %f %fa
clase (Mc)
34 41 33.5 41.5 37.5 2 2 4.44 4.44
42 49 41.5 49.5 45.5 3 5 6.67 11.11
50 57 49.5 57.5 53.5 5 10 11.11 22.22
58 65 57.5 65.5 61.5 8 18 17.78 40.00
66 73 65.5 73.5 69.5 9 27 20.00 60.00
74 81 73.5 81.5 77.5 9 36 20.00 80.00
82 89 81.5 89.5 85.5 7 43 15.56 95.56
90 97 89.5 97.5 93.5 2 45 4.44 100.00
=45 100%
Cul es la puntuacin ms alta? __________________________
90
Cul es la puntuacin ms baja? _________________________
34
Cul es el rango? ______________________________________
8
Cules son los lmites reales del cuarto intervalo? ____________
57.5 65.5
Cul es el porcentaje de los estudiantes que obtuvieron una puntuacin menor de 65?
17.78 %
____________
66 73
Cules son los lmites aparentes del quinto intervalo? ________________________
9
mero de estudiantes que obtuvieron notas entre 66 y 73 ________________________
20%
orcentaje de estudiantes que obtuvieron notas entre 74 y 81 ________________________
36
mero de estudiantes que obtuvieron notas entre 34 y 81. ________________________
40%
orcentaje de estudiantes que obtuvieron notas entre 34 y 65. ________________________
49.5 57.5
Cules son los Lmites reales del tercer intervalo?: ________________________
8
mero de personas que tuvieron notas promedio de 61.5 puntos. ________________________
Distribucin de frecuencias de valores agrupados
en intervalos de amplitud variable
Algunas veces los datos que se obtienen de una
variable cuantitativa no se pueden clasificar en
grupos que posean igual intervalo, por lo que
debemos aplicar la AGRUPACIN CON
INTERVALO VARIABLE, la cual como su nombre
lo indica, es la clasificacin de la informacin
en grupos con distintos intervalos o amplitud.
Para hacer los grupos seguimos los pasos de la
distribucin de frecuencias de valores
agrupados en intervalos de amplitud constante,
pero eliminando los intervalos en donde no se
encuentren valores, por lo que algunos grupos
tendran diferente amplitud
Distribucin de frecuencias de valores agrupados
en intervalos de amplitud variable

Ejemplo: Con los precios de 25 artculos


vendidos este da por una aceitera, hacer
una distribucin de frecuencias.

Datos:

17.00 14.00 16.00 17.50 31.00 16.00 18.00 31.00


32.50 8.25 19.00 18.00 4.10 4.60 17.00 34.00
7.00 10.00 17.50 32.50 31.00 33.00 34.00 32.10
32.45
Distribucin de frecuencias de valores agrupados
en intervalos de amplitud variable
Procedimiento:
1. Obtenemos la amplitud = 34 4.10/6 =
4.98
2. Hacemos la distribucin con una
intervalo
amplitud de 5 conteo f
1 5 // 2
6 10 /// 3
11 15 / 1
16 20 ///// //// 9
21 25 - 0
26 30 - 0
31 35 ///// ///// 10
Distribucin de frecuencias de valores agrupados
en intervalos de amplitud variable

3. Eliminaremos los grupos con cero


frecuencia, porque en una agrupacin no
es conveniente a que aparezcan grupos
sin algn dato.
intervalo f
1 5 2
6 10 3
11 15 1
16 25 9
26 35 10
f = 25
REPRESENTACION GRFICA
Es la manera de expresar los datos estadsticos. Esta es
importante porque nos permite asimilar las principales
caractersticas de las series estadsticas. Por lo que el fin
de una grfica ser el de mostrar por medio de puntos,
segmentos, curvas, superficies, volmenes, etc.
Las variaciones que acusan los fenmenos que pueden
medirse o contarse.
En general las grficas ponen de relieve las variaciones
de la serie estadstica, favorecer las consultas y
permitir las comparaciones.
UTILIDAD DE LAS GRAFICAS
Sntesis: se puede percibir de una ojeada por principales
caractersticas de una serie de nmeros.
Destacan caractersticas: hacen resaltar los hechos esenciales,
demarcan las tendencias, muestran los hechos accidentales,
establecen las rdenes de importancia, precisan los mximos y
los mnimos.
Control: permiten ver a simple vista las anomalas que pueden
tener las informaciones.
Comparacin: las graficas permiten hacer confrontaciones de
dos o ms series.
Hay que tener en cuenta que las grficas no sustituyen a los
cuadros, ya que ambos deben complementarse en una
publicacin.

Entre las desventajas de las grficas podemos


mencionar:
Prdida de detalle de la informacin
Pueden tener errores involuntarios de construccin.
REGLAS DE CONSTRUCCION

1. Ttulo general
2. Elementos de referencia
con expresin de la variable
representada sobre cada uno.
3. Fuente de procedencia de
los datos representados
El eje que representar la
frecuencia debe empezar de
cero.
4. La parte ms alta de la
grfica debe ser
aproximadamente tres
cuartos de su ancho total.
5.Todas las barras deben
tener el mismo ancho.
DIAGRAMA DE BARRAS SIMPLES

Son representaciones grficas que estn


formadas por barras horizontales o verticales del
mismo ancho (rectngulo de igual base) y cuya
longitud guarda proporcin con la magnitud de la
variable presentada.
Para construir el diagrama, la anchura de las
barras no tienen significacin y pueden elegirse
el tamao que se desee, de acuerdo con el
nmero de datos a presentar, teniendo cuidado
de que las barras no se solapen.
DIAGRAMA DE BARRAS SIMPLES
Densidad
350
300
250
200
150
Densidad
HABITANTES 100
Pases Densida 50
d 0

El 296
salvador
China 128 PAISES
Francia 109
119
Guatemal Densidad
a
Costa 74
Rica
Egipto 70
Densidad
57 PAISES

Honduras
USA 29
Panam 38 0 50 100 150 200 250 300 350

38
Nicaragua HABITANTES
DIAGRAMA DE BARRAS
COMPUESTAS
Poblacin de los municipios de Quezaltepeque, San Jacinto, Olopa,
Jocotan y Camotn, pero adems, clasificada por sexo; las categoras,
hombres y mujeres, son los componentes de cada una de las barras.

100
90
80
70
60
50
40
PORCENTAJES 30
20 % Mujeres
10 % Hombres
0
Camotn

Olopa

MUNICIPIOS MUNICIPIOS
San Jacinto % Mujeres
% Hombres

Quezaltepeque

0 20 40 60 80 100 120

PORCENTAJES
DIAGRAMA DE BARRAS COMPARATIVAS
Compara cada una de las categoras de la caracterstica principal, los
componentes de otra caracterstica secundaria; no permite hacer
comparaciones entre los totales de la caracterstica principal.

Grfico: presenta la poblacin de 12 aos, para el perodo del 2010 al


2015, clasificada por regin de residencia.

70

60

50

40
POBLACION
30 % HOMBRES
% MUJERES
20

10

0
QUEZALTEPEQUE SAN JACINTO OLOLA JOCOTAN CAMOTAN

MUNICIPIOS
HISTOGRAMA
Es una forma de representacin grfica de las frecuencias de
clase.
Consiste en representar las frecuencias por medio de las
reas de los rectngulos (barras). Estos son diferentes a los
diagramas de barras, porque en un diagrama de barras las
alturas de stas miden el tamao de la variable y
normalmente se dibujan separadas. En un histograma las
frecuencias quedan representadas por el rea de los
rectngulos, no por sus alturas y las barras se dibujan sin
dejar espacios entre ellas.
En su elaboracin los intervalos de clase estn marcados
sobre el eje horizontal, utilizando para el efecto los lmites
reales y las frecuencias en el eje vertical. Se construye por
medio de rectngulos unidos cuyos anchos son los de los
intervalos de clase que ellos representan y cuyas alturas
equivalen a las frecuencias.
Con la tabla de punteos obtenidos por 50 alumnos en un
examen de estadstica, haremos el histograma

INTERVALO LIMITES REALES f

10 24 1
25 39 2
40 54 6
55 69 10
70 84 18
85 99 13
Con la tabla de punteos obtenidos por 50 alumnos en un
examen de estadstica, haremos el histograma
Formas de los histogramas
Formas de los histogramas
POLIGONO DE FRECUENCIAS
Se utiliza, al igual que el histograma, para
representar distribuciones de frecuencias de
variables cuantitativas continuas, pero como no se
utilizan barras en su confeccin sino segmentos de
recta, de ah el nombre de polgono. Habitualmente
se usa cuando se quiere mostrar en el mismo grfico
ms de una distribucin o una clasificacin cruzada
de una variable cuantitativa continua con una
cualitativa o cuantitativa discreta, ya que por la
forma de construccin del histograma slo se puede
representar una distribucin.
POLIGONO DE FRECUENCIA SIMPLE
Para su construccin se puede realizar trazando los puntos que
representan las frecuencias y unindolos mediante segmentos.

Ejemplo
Las temperaturas en un da de invierno en la ciudad de Guatemala han sufrido
las siguientes Variaciones:
Poligono de Frecuencia Datos Agrupados.

Polgono de frecuencias Velocidad en Km/h de 35 automviles


16

velocidad f 14

60 69 5
12

70 79 6
10
80 89 14
8
90 99 8 Vehculos

100 109 1 6

110 119 1 4

0
59.5 69.5 79.5 89.5 99.5 109.5 119.5 119.5

Velocidad
Polgonos de frecuencia para datos agrupados

Es un grfico de lneas trazado sobre las marcas de clase.


Ejemplo
El peso en libras de 65 personas adultas viene dado por la siguiente tabla:
Ejemplo: con la tabla de frecuencias de las velocidades en Km/h de
varios automviles, haremos el polgono de frecuencia acumulada

40

35
Velocidad f fa
60 69 5 5 30

70 79 6 11 25

80 89 14 25
20
90 99 8 33
15
100 109 1 34
10
110 119 1 35
5

0
69.5 79.5 89.5 99.5 109.5 119.5
DIAGRAMA DE SECTORES

Esta grfica se utiliza para representar variables


cualitativas y sirve para hacer notar las diferencias de
las proporciones o porcentajes en que est dada la
distribucin.
La comparacin es efectiva, siempre que los
segmentos sean suficientemente grandes para
permitir comparaciones.
Representacin grfica

Lneas Telefnicas

24%

41%

Zacapa
35%
Chiquimula

Jutiapa

=
EXAMEN CORTO #1
Materiales y Equipo a utilizar:
1. Hoja de laboratorio
2. Lpiz o Lapicero

3. Calculadora
4. Computadora

También podría gustarte