Está en la página 1de 22

Organizacin de la Informacin

Luego de tomar la informacin necesaria en la investigacin que se sigue,


se obtiene una gran cantidad de datos que requieren ser interpretados y
sobre los cuales se busca concluir algo especfico. Para esto se debe
depurar y clasificar la informacin aplicando tcnicas adecuadas.

La organizacin y el resumen de la informacin son dos procesos distintos


que se desarrollan por separado. La organizacin hace referencia al
arreglo de los datos en un formato lgico para su interpretacin. En
cambio, el resumen implica la condensacin de varias mediciones en una forma
compacta, ya sea grfica o numricamente. De ah que se tome primero la forma de
organizar la informacin tomada en una investigacin estadstica.
La informacin estadstica puede organizarse de diversas maneras: ordenando el
conjunto de datos como una combinacin ordenada o en un arreglo denominado
tallo y hojas, otro de los mtodos usados es el uso de tablas y ms especficamente
la tabla de frecuencias.

PROCESO DE ORGANIZACIN DE LA INFORMACIN

Para el caso de la o r g a n i z a c i n d e l a i n f o r m a c i n r e c o l e c t a d a ,
s e e s t a b l e c e u n m t o d o denominado distribucin de frecuencias.
La distribucin de frecuencias es un mtodo para organizar y resumir datos.

Bajo este mtodo, los datos que componen una serie se


c l a s i f i c a n y s e ordenan, indicndose el nmero de veces que se repite el valor.

Captulo 3:
Estadstica. Organizacin de la informacin
ORGANIZACIN DE LA INFORMACIN
15 Por qu hay que ORGANIZAR la Informacin?
Porque la cantidad de informacin que muchas veces se tiene, por las
diferentes mediciones que se hacen en un proceso, es demasiado grande y
nuestra mente no logra resumirlos en forma tal que le trasmitan un
conocimiento exacto de ese proceso. Una persona puede pasar, horas y
horas, leyendo y releyendo la informacin bruta sin que pueda llegar a
conocer las caractersticas fundamentales del proceso en estudio. Si los
datos se ORGANIZAN, se hace fcil conocer el comportamiento de un
proceso.
16 Cmo se organiza la informacin?
Hay tres maneras de ORGANIZAR la informacin:
TABULACIN: presentar los datos del proceso en una tabla o cuadro.
GRAFICACIN: presentar grficos de los datos que han sido tabulados.
PARMETROS: utilizar unos pocos datos representativos del proceso.
17 Cules son los GRFICOS ESTADSTICOS ms utilizados?
Los grficos son utilizados en Estadstica porque un grfico dice ms que mil
palabras. Mediante un grfico se puede observar visualmente el
comportamiento de un proceso.
Los grficos ms utilizados en Estadstica son: 1) HISTOGRAMA, 2)
POLGONO DE FRECUENCIAS, 3) OJIVA.
En los Apndices se explica la Tabulacin de Datos (Tablas de Frecuencia) y
la Graficacin (Histograma, Polgono de Frecuencia y Ojiva).

Datosagrupadosynoagrupados
Datos Agrupados

Los datos agrupados son como lo indica su nombre, una cantidad dada de
datos que puede clasificarse, ya sea por sus cualidades cualitativas o
cuantitativas, y por tal agruparse para su anlisis.

Estos datos por lo general son aconsejable agruparles cuando su


poblacin cuenta con alrededor de 20 o ms elementos que comparten
una caracterstica y caben dentro de una categorizacin (repeticiones de
un valor), pues permite un mejor manejo y anlisis ms profundo de los
mismos. Porque al emplear este mtodo podemos manejarlos por clases
(una clase es una categora en la que se agrupan los datos).

Por lo cual pueden organizarse o clasificarse de dos formas: datos


agrupados en frecuencia o en intervalos.

Los datos agrupados en frecuencia son los que se distribuyen u organizan


en una tabla de frecuencia (La frecuencia es igual al nmero de veces en
que se repite cada valor en una serie de datos.), as, Por medio de ella, es
fcil identificar la cantidad de respuestas repetidas.

Los datos agrupados por intervalos son los que se organizan dentro de un
rango y se delimita su amplitud por lmites establecidos. As, por medio de
esta, es fcil identificar la cantidad de elementos en un determinado
rango de valores.

Concluyendo con la distincin de puntos significativos de este tema.


1.- su fin es resumir la informacin mediante el uso de de tablas que
organizan sus elementos y agrupan sus valores para ser presentados
numrica o grficamente. Esto implica: ordenar, clasificar y expresar los
en una tabla de frecuencias o intervalos.
2.- Se agrupa a los datos, si se cuenta con 20 o ms elementos. Aunque
contemos con ms de 20 elementos, debe de verificarse que los datos n
sean significativos, esto es: que la informacin sea repetitiva, tambin
debemos de verificar que los datos puedan clasificarse. Y que dicha
clasificacin tiene coherencia y lgica (de acuerdo a lo que se nos est
pidiendo).
Ejemplos:
Se busca determinar el nmero de nios en cada uno de los grados
escolares de una primaria, (del 1 al 6 grado), por lo que se recolectan los
datos y se organizan y agrupan en una tabla de frecuencias.

Edad..........Frecuencia
1..................2
2..................4
3..................7
4..................4
5..................2
6..................1
Total............20
Agrupacin en intervalos, por ejemplo, de 2 aos para este caso.
Edad..........Frecuencia
1-2...............6
3-4...............11
5-6...............3
Total.............20

DATOS NO AGRUPADOS
Los datos no agrupados son el conjunto de datos que no se ha clasificado
y se es presentada en su forma de aparicin en una tabla de datos donde
cada valor se representa de forma individual. Por lo general este conjunto
comprende una cantidad de elementos menor a 30 (n<30) con poca o
nula repeticin.

El tratamiento de estos datos sin agrupar. El manejo de estos datos es


simple, se recolectan los datos de la poblacin de estudio y dichos datos
se distribuyen en una tabla de datos y se analizan sin necesidad de
formar clases con ellos.

Estos datos al distribuirse en tabla de frecuencia donde cada dato


mantiene su propia identidad despus que la distribucin de frecuencia se
ha elaborado.

Vas a investigar la edad a un grupo de 20 Nios en datos no agrupados


(es decir, vienen los 20 nios y as como te dan la edad as la anotas)
2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,6 (Total 20 nios)

Estos son datos no agrupados por qu no los has clasificado y contado.


1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,6 (Total 20 nios)
Los datos no agrupados tambin los puedes ordenar, por ejemplo de la
edad menor a la edad mayor, no estn contabilizados ni clasificados
solamente estn ordenados.
En una investigacin sobre el calentamiento de varios elementos lquidos
para determinar en cada uno de ellos el punto, la temperatura, en la cual
cambian de estado, los cientficos van anotando las temperaturas que van
dando efecto.
134C, 345C, 234C, 456C, 837C, 456C, 122C, 4567C, 3456C, 456C,
190C, 900C.
estas medidas pueden ser apiladas en una tabla de datos, y mantener su
independencia como valor unico y representativo

Estadstica: lmites aparentes y lmites


reales de las clases
LIMITES EN ESTADISTICA
Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre los cuales van a estar
los valores de los datos agrupados en ese intervalo de clase.

La elaboracin de una distribucin de frecuencias tiene mucho de


subjetivo, pero al mismo tiempo mucho de complejidad. Esto ltimo
por la determinacin de los lmites de las clases.
Los llamados lmites indicados (lmites aparentes, lmites
nominales, segn otros autores) y su conversin en lmites reales
(lmites exactos), es una tarea muy delicada y tediosa para el alumno
que apenas se inicia con la estadstica descriptiva.
Un poco de teora
Segn lo estudiado los lmites de las clases deben ser
mutuamente excluyente, esto es; no debe haber duda en cuanto a la
clase a que pertenece un dato determinado. Cada intervalo se llama
una clase. Por ejemplo en la distribucin de frecuencias siguiente:

2400 2599

2600 2799

20

2800 2999

33

3000 3199

25

3200 3399

11

3400 3599

La primera columna son las clases y la segunda son las


frecuencias que en este artculo no juegan ningn papel.
El lmite inferior de la primera clase es 2400 y su respectivo lmite
superior es 2599, esto son los lmites indicados. El dato 2480 tiene
que ser incluido en esta clase y en ninguna ms. Es totalmente
excluyente, solo pertenece a una y solo una clase.
La anchura de una clase se llama intervalo entre clases: es la
diferencia entre dos lmites sucesivos inferiores de clases. En este
ejemplo es 200, que resulta de efectuar la resta: 2600 2400.
La eleccin de los lmites apropiados depende en gran parte de si
los datos son continuos o discretos. Tomaremos solo el caso de las
variables continuas solamente por ser las que presentan mayor
dificultad en su confeccin.
Siguiendo con el ejemplo; se calculan los lmites exactos del
intervalo: Se extienden 0.5 unidades a cada lado de los lmites
indicados del intervalo, es decir, el lmite inferior exacto es 0.5
unidades menor que el lmite inferior aparente, y el lmite superior
exacto es 0.5 unidades mayor que el lmite superior indicado.
Quedando as:

2399.50 2599.50

2599.50 2799.50

20

2799.50 2999.50

33

2999.50 3199.50

25

3199.50 3399.50

11

3399.50 3599.50

Estos seran los lmites reales o exactos de clases del ejemplo


anterior.
La propuesta
Esta ltima parte es la que consideramos compleja e innecesaria,
debido a que es posible usar la notacin de intervalo de nmeros
reales para determinar los lmites exactos de una clase. Veamos como
sera segn el mtodo que se propone:

[2400 2600[

[2600 2800[

20

[2800 3000[

33

[3000 3200[

25

[3200 3400[

11

[3400 3600[

As el dato 2480 queda claramente definido en la primera clase, el


dato 2599.5, el 2599.9, etc., igualmente son de la primera clase. El
dato 2600 no se toma en la primera clase sino que debe contabilizarse
en la segunda clase. Y as sucesivamente. Es mucho menos
complicado este mtodo que el de sumar y restar 0.5 a ambos lados
de los lmites indicados.

Esta notacin es equivalente a la encontrada en libros de


estadstica de la siguiente manera:
De 2400 a menos de
2600

De 2600 a menos de
2800

20

De 2800 a menos de
3000

33

De 3000 a menos de
3200
De 3200 a menos de
3400
De 3400 a menos de
3600

25
11
4

Entonces por que no hacer uso de esa notacin simple y precisa


para elaborar las clases.
ANCHURA DE INTERVALO DE CLASE
Tipos de intervalos de clase Este tipo de clase es el ms utilizado en los clculos
estadsticos; cuando todas las clases son del mismo tamao, los clculos
relacionados con la distribucin de frecuencia son simplificados considerablemente.
En trminos generales, este tipo de distribucin es el que se utiliza comnmente en
casi todas las investigaciones.
Ejemplo:CLASE

Fi

57

8 10

10

11 13

15

14 16

18

17 19

11

20 22

Totales

64

Clase desigual de tamao Los intervalos de clase son desiguales no son frecuentes
en el anlisis estadstico, la utilizacin de los mismos se debe evitar; sin embargo,
en algunas
investigaciones es indispensable su utilizacin; tal es el caso de las investigaciones
que tienen como propsito particular analizar valores que varan en un amplio
recorrido de la variable. Cuando se utiliza este tipo de clase de los intervalos de
clase deberan ser incrementados de una forma ordenada, de ser posible. Este tipo
de clases se utiliza algunas veces para reportar datos relacionados con valuaciones
de activos o ingresos personales.
Ejemplo: CLASE

fi

Menos de
150,000

67

150,000
239,000

36

194,500

340,000
429,000

10

384,500

430,000
519,000

474,500

520,000
609,000

564,500

610,000
699,000

654,500

700,000
789,000

744,500

790,000 y
ms

TOTALES

135

NCRIc
La amplitud de clase, longitud o ancho de una clase Es el nmero de valores o
variables que concurren a una clase determinada. La amplitud de clase se designa
con las letras Ic. Existen diversos criterios para determinar la amplitud de clases,
ante esa diversidad de criterios, se ha considerado que lo ms importante es dar un
ancho de longitud de clase a todos los intervalos de tal manera que respondan a la
naturaleza de los datos y al objetivo que se persigue y esto se logra con la prctica.
Existe una frmula para determinar Ic y se expresa as: Ic=R/NC
Donde:
Ic = Amplitud de clase
R= Rango
NC = Nmero de clases
Con la frmula anterior se puede determinar
Ic=R/1+322.3(LOG,N)
Sturges el cual establece que:
Donde:
Ic = Amplitud de clase
R = Rango
N = Nmero total de datos
Nota: Normalmente el resultado final es un nmero fraccionario, el cual no es
adecuado para la prctica, sin embargo, se puede aplicar la tcnica de redondeo
para convertirlo en un nmero entero.
Nosotros utilizaremos el mtodo de Sturges para determinar el
Ejemplo:
Sean los siguientes datos horas extras laboradas por obreros en un mes. Calcule el
rango y el intervalo de clase.
22 39 37 28 23 39 24 38 31 35 36 28 23 27 38 40 22 23 36 27
32 33 26 60 39 33 40 27 34 22 30 31 37 33 41 39 58 59 56 41
54 56 57 58 39 40 34 45 53 52 52 28 36 37 40 26 34 25 23 32
56 33 58 40 36 25 42 33 45 55 29 52 38 28 38 38 32 42 53 58
45 43 40 28 60 41 37 42 31 45 30 28 40 37 28 44 40 39 57 60
=100 DATOS R = X
R = 60 22 + 1
R = 38+1
R = 39
Ic=R/1+322.3(LOG,N)
ic=39/1+322.3(log,100)
ic=39/1+322.3(2)
ic=39/7.644
ic=5.1020.

Por lo tanto, el ancho de la clase ser de 5. M Xm + UM Ic de una distribucin de


frecuencia de clase siempre y cuando el mismo sea aplicable. Ic, conociendo el
rango y el nmero de clases. Cuando se tenga duda en determinar la amplitud de
clase de una serie de valores, es de gran utilidad utilizar el mtodo sugerido por
Hebert, A.
Clase de igual tamao

MARCA DE CLASE
La marca de clase es el punto medio de
cada intervalo.
La marca de clase es el valor que representa a todo
el intervalo para el clculo de algunosparmetros como
la media artmtica o la desviacin tpica.
Se representa por ci o xi.

Ejemplo

xi

fi

xi
fi

xi2
fi

[10,
20)

15

15

225

[20,
30)

25

20
0

500
0

[30, 40
)

35

10

35
0

12
250

[40,
50)

45

40
5

18
225

[50,

55

44

24

60)

200

[60, 70
)

65

26
0

16
900

[70,
80)

75

15
0

11
250

42

1
82
0

88
050

Frecuencia
Estadstica
La frecuencia es la cantidad de veces que se repite un suceso en un rango de
un espacio muestral dado.

Por ejemplo, una profesora en su informe anual, sealar que para el curso de 35
alumnos, la frecuencia de notas es la siguiente.
Tabla 1: Ejemplo Frecuencia Estadstica

De la tabla 1 se observa que: 3 alumnos obtuvieron nota bajo 4.0, y el resto tienen nota
igual o superior a 4.0, resaltndose que la mayora de los escolares estn en el rango
5.0 a 5.9, y slo uno sobresaliente con la nota 7.0.

TIPOS DE FRECUENCIAS
De lo expuesto hasta ahora se ha mostrado el concepto de frecuencia, sin embargo
existen ms de una manera de estudiar la informacin que nos proporciona la
frecuencia estadstica. Estos son los tipos de frecuencia; frecuencia absoluta, frecuencia
acumulada, frecuencia relativa y frecuencia relativa acumulada.

FRECUENCIA ABSOLUTA N

Es la frecuencia ya aplicada en la primera tabla, que corresponde al nmero de veces


que se repite un dato dentro un rango dado, segn sea definido previamente. En el
caso ejemplificado, son 35 alumnos, donde cada clase o rango corresponde a una
posicin dentro de la tabla. De este modo se define los n i para i de 1 a 7.

FRECUENCIA ABSOLUTA ACUMULADA


(N )
I

Es el nmero de veces n i en la muestra de N, con un valor igual o menor al de la


variable. La ltima frecuencia absoluta acumulada deber ser igual a N.

FRECUENCIA RELATIVA (F )
I

Es el cociente entre la frecuencia absoluta y el tamao de la muestra (N), para cada


valor de i en la tabla, segn la frmula: f i = ni / N

FRECUENCIA RELATIVA ACUMULADA (F )


I

Es el cociente entre la frecuencia absoluta acumulada y el nmero total de datos, N. Es


decir, Fi = Ni / N.
Tabla 2: Ejemplo Segn Tipos de Frecuencia (muestra de N = 35 escolares)

De la tabla, se puede observar que se han agregado tres columnas, estas son:
Frecuencia absoluta acumulada Ni, que permite ver los totales parciales acumulados al
final de cada fila, lo que determina las cantidades de alumnos que hay hasta ese rango.
Luego, las columnas de Frecuencia relativa f i, muestra los datos en tanto por ciento de
ocurrencia para cada rango. Y finalmente la Frecuencia relativa acumulada F i, muestra
la acumulacin en tanto por ciento de ocurrencia para cada rango.

GRFICOS DE FRECUENCIAS
Adems de las tablas mostradas, los datos pueden ser mostrados de manera grfica.
As, el siguiente grfico de torta muestra la frecuencia absoluta de la tabla 1:

Tambin se puede mostrar la frecuencia absoluta y la frecuencia absoluta acumulada


como un grfico de lnea:

Medidas Descriptivas

Medidas descriptivas
Las medidas descriptivas son valores numricos calculados a partir de la muestra y que nos
resumen la informacin contenida en ella.

MEDIDAS DESCRIPTIVAS
Medidas de posicin o tendencia
Media muestral: Si tenemos X1, X2, ... , Xn datos, se llama media muestral de los
mismos a su media aritmtica

Moda muestral: El valor que ms se repite (puede no existir y si existe puede no


ser nica).
Mediana muestral: Ordenando los Xi, el valor que est en el medio

Ejemplo: Sean los datos 3, 5, 7, 7, 8, 9


= 39/6 = 6,5;

= 7; moda = 7

Medidas de dispersin
Rango: Si Xi estn ordenados Xn - X1
Varianza:

aunque para el clculo se suele usar otra frmula ms cmoda

Desviacin tpica o estndar:

Ojo!! no confundir con error tpico o estndar


Coeficiente de variacin:

También podría gustarte