Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Para el caso de la o r g a n i z a c i n d e l a i n f o r m a c i n r e c o l e c t a d a ,
s e e s t a b l e c e u n m t o d o denominado distribucin de frecuencias.
La distribucin de frecuencias es un mtodo para organizar y resumir datos.
Captulo 3:
Estadstica. Organizacin de la informacin
ORGANIZACIN DE LA INFORMACIN
15 Por qu hay que ORGANIZAR la Informacin?
Porque la cantidad de informacin que muchas veces se tiene, por las
diferentes mediciones que se hacen en un proceso, es demasiado grande y
nuestra mente no logra resumirlos en forma tal que le trasmitan un
conocimiento exacto de ese proceso. Una persona puede pasar, horas y
horas, leyendo y releyendo la informacin bruta sin que pueda llegar a
conocer las caractersticas fundamentales del proceso en estudio. Si los
datos se ORGANIZAN, se hace fcil conocer el comportamiento de un
proceso.
16 Cmo se organiza la informacin?
Hay tres maneras de ORGANIZAR la informacin:
TABULACIN: presentar los datos del proceso en una tabla o cuadro.
GRAFICACIN: presentar grficos de los datos que han sido tabulados.
PARMETROS: utilizar unos pocos datos representativos del proceso.
17 Cules son los GRFICOS ESTADSTICOS ms utilizados?
Los grficos son utilizados en Estadstica porque un grfico dice ms que mil
palabras. Mediante un grfico se puede observar visualmente el
comportamiento de un proceso.
Los grficos ms utilizados en Estadstica son: 1) HISTOGRAMA, 2)
POLGONO DE FRECUENCIAS, 3) OJIVA.
En los Apndices se explica la Tabulacin de Datos (Tablas de Frecuencia) y
la Graficacin (Histograma, Polgono de Frecuencia y Ojiva).
Datosagrupadosynoagrupados
Datos Agrupados
Los datos agrupados son como lo indica su nombre, una cantidad dada de
datos que puede clasificarse, ya sea por sus cualidades cualitativas o
cuantitativas, y por tal agruparse para su anlisis.
Los datos agrupados por intervalos son los que se organizan dentro de un
rango y se delimita su amplitud por lmites establecidos. As, por medio de
esta, es fcil identificar la cantidad de elementos en un determinado
rango de valores.
Edad..........Frecuencia
1..................2
2..................4
3..................7
4..................4
5..................2
6..................1
Total............20
Agrupacin en intervalos, por ejemplo, de 2 aos para este caso.
Edad..........Frecuencia
1-2...............6
3-4...............11
5-6...............3
Total.............20
DATOS NO AGRUPADOS
Los datos no agrupados son el conjunto de datos que no se ha clasificado
y se es presentada en su forma de aparicin en una tabla de datos donde
cada valor se representa de forma individual. Por lo general este conjunto
comprende una cantidad de elementos menor a 30 (n<30) con poca o
nula repeticin.
2400 2599
2600 2799
20
2800 2999
33
3000 3199
25
3200 3399
11
3400 3599
2399.50 2599.50
2599.50 2799.50
20
2799.50 2999.50
33
2999.50 3199.50
25
3199.50 3399.50
11
3399.50 3599.50
[2400 2600[
[2600 2800[
20
[2800 3000[
33
[3000 3200[
25
[3200 3400[
11
[3400 3600[
De 2600 a menos de
2800
20
De 2800 a menos de
3000
33
De 3000 a menos de
3200
De 3200 a menos de
3400
De 3400 a menos de
3600
25
11
4
Fi
57
8 10
10
11 13
15
14 16
18
17 19
11
20 22
Totales
64
Clase desigual de tamao Los intervalos de clase son desiguales no son frecuentes
en el anlisis estadstico, la utilizacin de los mismos se debe evitar; sin embargo,
en algunas
investigaciones es indispensable su utilizacin; tal es el caso de las investigaciones
que tienen como propsito particular analizar valores que varan en un amplio
recorrido de la variable. Cuando se utiliza este tipo de clase de los intervalos de
clase deberan ser incrementados de una forma ordenada, de ser posible. Este tipo
de clases se utiliza algunas veces para reportar datos relacionados con valuaciones
de activos o ingresos personales.
Ejemplo: CLASE
fi
Menos de
150,000
67
150,000
239,000
36
194,500
340,000
429,000
10
384,500
430,000
519,000
474,500
520,000
609,000
564,500
610,000
699,000
654,500
700,000
789,000
744,500
790,000 y
ms
TOTALES
135
NCRIc
La amplitud de clase, longitud o ancho de una clase Es el nmero de valores o
variables que concurren a una clase determinada. La amplitud de clase se designa
con las letras Ic. Existen diversos criterios para determinar la amplitud de clases,
ante esa diversidad de criterios, se ha considerado que lo ms importante es dar un
ancho de longitud de clase a todos los intervalos de tal manera que respondan a la
naturaleza de los datos y al objetivo que se persigue y esto se logra con la prctica.
Existe una frmula para determinar Ic y se expresa as: Ic=R/NC
Donde:
Ic = Amplitud de clase
R= Rango
NC = Nmero de clases
Con la frmula anterior se puede determinar
Ic=R/1+322.3(LOG,N)
Sturges el cual establece que:
Donde:
Ic = Amplitud de clase
R = Rango
N = Nmero total de datos
Nota: Normalmente el resultado final es un nmero fraccionario, el cual no es
adecuado para la prctica, sin embargo, se puede aplicar la tcnica de redondeo
para convertirlo en un nmero entero.
Nosotros utilizaremos el mtodo de Sturges para determinar el
Ejemplo:
Sean los siguientes datos horas extras laboradas por obreros en un mes. Calcule el
rango y el intervalo de clase.
22 39 37 28 23 39 24 38 31 35 36 28 23 27 38 40 22 23 36 27
32 33 26 60 39 33 40 27 34 22 30 31 37 33 41 39 58 59 56 41
54 56 57 58 39 40 34 45 53 52 52 28 36 37 40 26 34 25 23 32
56 33 58 40 36 25 42 33 45 55 29 52 38 28 38 38 32 42 53 58
45 43 40 28 60 41 37 42 31 45 30 28 40 37 28 44 40 39 57 60
=100 DATOS R = X
R = 60 22 + 1
R = 38+1
R = 39
Ic=R/1+322.3(LOG,N)
ic=39/1+322.3(log,100)
ic=39/1+322.3(2)
ic=39/7.644
ic=5.1020.
MARCA DE CLASE
La marca de clase es el punto medio de
cada intervalo.
La marca de clase es el valor que representa a todo
el intervalo para el clculo de algunosparmetros como
la media artmtica o la desviacin tpica.
Se representa por ci o xi.
Ejemplo
xi
fi
xi
fi
xi2
fi
[10,
20)
15
15
225
[20,
30)
25
20
0
500
0
[30, 40
)
35
10
35
0
12
250
[40,
50)
45
40
5
18
225
[50,
55
44
24
60)
200
[60, 70
)
65
26
0
16
900
[70,
80)
75
15
0
11
250
42
1
82
0
88
050
Frecuencia
Estadstica
La frecuencia es la cantidad de veces que se repite un suceso en un rango de
un espacio muestral dado.
Por ejemplo, una profesora en su informe anual, sealar que para el curso de 35
alumnos, la frecuencia de notas es la siguiente.
Tabla 1: Ejemplo Frecuencia Estadstica
De la tabla 1 se observa que: 3 alumnos obtuvieron nota bajo 4.0, y el resto tienen nota
igual o superior a 4.0, resaltndose que la mayora de los escolares estn en el rango
5.0 a 5.9, y slo uno sobresaliente con la nota 7.0.
TIPOS DE FRECUENCIAS
De lo expuesto hasta ahora se ha mostrado el concepto de frecuencia, sin embargo
existen ms de una manera de estudiar la informacin que nos proporciona la
frecuencia estadstica. Estos son los tipos de frecuencia; frecuencia absoluta, frecuencia
acumulada, frecuencia relativa y frecuencia relativa acumulada.
FRECUENCIA ABSOLUTA N
FRECUENCIA RELATIVA (F )
I
De la tabla, se puede observar que se han agregado tres columnas, estas son:
Frecuencia absoluta acumulada Ni, que permite ver los totales parciales acumulados al
final de cada fila, lo que determina las cantidades de alumnos que hay hasta ese rango.
Luego, las columnas de Frecuencia relativa f i, muestra los datos en tanto por ciento de
ocurrencia para cada rango. Y finalmente la Frecuencia relativa acumulada F i, muestra
la acumulacin en tanto por ciento de ocurrencia para cada rango.
GRFICOS DE FRECUENCIAS
Adems de las tablas mostradas, los datos pueden ser mostrados de manera grfica.
As, el siguiente grfico de torta muestra la frecuencia absoluta de la tabla 1:
Medidas Descriptivas
Medidas descriptivas
Las medidas descriptivas son valores numricos calculados a partir de la muestra y que nos
resumen la informacin contenida en ella.
MEDIDAS DESCRIPTIVAS
Medidas de posicin o tendencia
Media muestral: Si tenemos X1, X2, ... , Xn datos, se llama media muestral de los
mismos a su media aritmtica
= 7; moda = 7
Medidas de dispersin
Rango: Si Xi estn ordenados Xn - X1
Varianza: