Está en la página 1de 29

Organizacin y Presentacin de los Datos

La estadstica tienen como objetivos sintetizar, organizar, analizar y extraer la variacin ms relevante de un fenmeno en particular. De tal forma, los datos recabados deben presentarse de forma en que sean fciles de analizar visualmente y que su presentacin sea sencilla y esttica. Los mtodos para describir conjuntos de datos pueden ser tabulares o grficos.

Mtodos Tabulares

La presentacin de informacin cuantitativa o cualitativa, mediante tablas, es frecuentemente observada tanto en la literatura cientfica como en las ciencias sociales. En estas tablas se procura que sean los ms sencillas y claras.

De acuerdo a la disciplina las tablas pueden seguir diferentes formatos, por ejemplo en la literatura cientfica solo se evita el uso de lneas verticales.

Sin embargo, frecuentemente se presenta el titulo de la tabla por encima de esta y alineada a la izquierda.

Egresados por Licenciatura en la UNSIJ Licenciatura Nmero de Egresados 21 Informtica 11 Ciencias Ambientales 16 Ingeniera Forestal

Calificaciones obtenidas por alumnos de la UNSIJ (mnima 10 - Mxima 100)

16 38 75 45 67 31 92 43 91 89 19 24 54 46 92 33 16 11
Para resumir la informacin del nmero de estudiantes que obtuvieron una calificacin en particular, se hace por medio de una tabla con dos encabezados, lo cual permite mostrar la frecuencia de calificaciones por intervalo.

En este tipo de tablas la amplitud de los valores numricos de los datos est dividida en un cierto nmero de Intervalos o Clases, las cuales se utilizan para reportar el nmero de observaciones que pertenecen a cada Intervalo. El nmero de observaciones que pertenecen a una clase o intervalo se denomina frecuencia.

Con la informacin del presente ejemplo, primero hay que decidir en cuantas clases deber dividirse el intervalo y despus su amplitud. De acuerdo a la experiencia se recomienda entre 5 y 20 clases, resulta conveniente construirlas de modo que todas las clases tengan la misma anchura, la cual recibe el nombre de amplitud de Clase. En este caso optaremos por 7 clases, todas ellas con igual amplitud de clase.

Tabla de distribucin de calificaciones entre alumnos de la UNSIJ

Nota: datos obtenidos al azar

Clase 40 50 60 70 80 90 100 Alumnos

Frecuencia 8 3 1 1 1 1 3 18

Sin embargo, existen otros mtodos: primero se debe obtener el valor mnimo y el mximo. 16 53 14.3 8 123

0
0 11.3 60.4 176.9 119.8 155.6 133.6 70.8 4.9 1.6 9.4 3.4 4.5 10 108.6

10.3 2.7 0.2 1.1 1.9 32.1 25.9 154.1 158.7 171.9 99.4 34.3 0 0 5.2 98.6

19.7 29.5 62.5 142.3 202.8 169.9 157.6 8.9 16.3 58.2 145.5 149.8 71.6 72.4 9.8

1.1 3.1 0 0.4 3.3 19.7 146.6 187

216 87.1 1.7 4.1 35.1 124.3 0.4 12.3 22.8 89.7 243.7 134.6 114.3 3.8 57.3

257
163.2 93 8.9 9.7 6.1 3.6

Nmero de decimales y cifras, Sokal y Rohlf (1995) proponen que debe existir entre 30 a 300 unidades entre el valor mnimo y mximo. Cuando se encuentra por encima de este valor debe reducirse el nmero de cifras, cuando se encuentra por debajo se debe incrementar las cifras. Por ejemplo: Si se consideran unidades (5-10) Mnimo 5 Mximo 10 Diferencia 5 Pero si se considera decimales (5.0-10.0) Mnimo 50 Mximo 100 Diferencia 50, por lo que se debe considerar como significativo el uso de decimales

Regresando a los datos de precipitacin mensual en el Estado de Mxico Por ejemplo: Si se consideran unidades (0-257) Mnimo 0 Mximo 257 Diferencia 257 Por lo que se deben considerar desde el cero hasta centenas

Sturges, que establece que el nmero de clases es K = 1 + log2 n = 1 +


3.322 log n, la cual subestima el nmero de intervalos.

Velleman (1976), K = , recomendada cuando 2 n es pequeo (n < 50) Dixon y Kronmal (1965), K = 10 log n, para n grande (n > 50). Garca-Cue el al. proponen que para cualquier tamao de muestra n Sturges = 1 + 3.322 log n = 1 + 3.322 log 82 = 7.35 = 7 Garca-Cue el al = 82 = 9.05 = 9

Para obtener los intervalo por clase, tomando el mtodo de Sturges, tenemos:

257 0 c= = 36.7 37 7
MXIMO MNIMO 0 37 37 74 74 111 111 148 148 185 185 222 222 259

Comnmente se elige al punto central de cada intervalo y se le denomina Centro de clase (mi) o punto medio de la clase (mi ), el cual se obtiene dividiendo entre dos la suma de los lmites de clase.

maxi mini 37 0 mi = = 18.5 2 2


MXIMO 0 37 74 111 148 185 222 MNIMO 37 74 111 148 185 222 259 Centro Clase 18.5 55.5 92.5 129.5 166.5 203.5 240.5

El siguiente paso para construir la Tabla de Frecuencias es contar el nmero de observaciones que pertenecen a cada clase. Este nmero es llamado Frecuencia Absoluta de clase (fi).

MXIMO 0 37 74 111 148 185 222

MNIMO 37 74 111 148 185 222 259

Centro Clase 18.5 55.5 92.5 129.5 166.5 203.5 240.5

fi IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII III IIIII I IIIII IIII IIIII IIII III II

FRECUENCIA 45 8 6 9 9 3 2

Tambin resulta conveniente calcular las frecuencias relativas de clase (fRi); que indican la proporcin del total de observaciones perteneciente a cada clase. Para obtenerlas, se divide la frecuencia absoluta de la clase entre el total de observaciones (Total de frecuencias absolutas).

fi 49 fRi = = = 0.55 n 82
MXIMO 0 37 74 111 148 185 222 MNIMO 37 74 111 148 185 222 259 Total Centro Clase 18.5 55.5 92.5 129.5 166.5 203.5 240.5 fi IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII III IIIII I IIIII IIII IIIII IIII III II 82 fi 45 8 6 9 9 3 2 fRi 0.55 0.10 0.07 0.11 0.11 0.04 0.02 1.00

A la tabla de frecuencias es conveniente aadirle informacin sobre el nmero de datos cuyo valor numrico es menor o igual que el lmite superior de cada clase; este nmero recibe el nombre de frecuencia acumulada (FAi). y se obtiene al sumar las frecuencias absolutas de las clases precedentes. De la misma manera se calcula la frecuencia relativa acumulada (FRA), al adicionar las frecuencias relativas de las clases anteriores.

MXIMO MNIMO 0 37 74 111 148 185 222 37 74 111 148 185 222 259 Total

Centro Clase 18.5 55.5 92.5 129.5 166.5 203.5 240.5

fi IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII III IIIII I IIIII IIII IIIII IIII III II 82

fi 45 8 6 9 9 3 2

fiA 45.00 53.00 59.00 68.00 77.00 80.00 82.00

fRi 0.55 0.10 0.07 0.11 0.11 0.04 0.02 1.00

fRA 0.55 0.65 0.72 0.83 0.94 0.98 1.00 1.00

Mtodos Grficos

Un inconveniente de presentar los datos en la forma tablas de distribucin de frecuencias es que la informacin contenida no es aparentemente evidente a menos que sea estudiada con detalle. La forma ms eficiente de simplificar la interpretacin de la informacin y evidenciar los patrones y tendencias es transformndola a presentaciones visuales. En esta sesin se presentaran los mtodos grficos ms frecuentes.

Grficas de Puntos o Lneas


Las grficas de puntos permiten presentar datos de forma rpida de la forma en como estn distribuidos los datos. Esta consiste en una lnea marcada con divisiones de la escala en el cual la variable es medida. Cada punto representa una observacin, si el valor se repite, el punto es colocado encima del ltimo que fue graficado.

Grficas de Barras
Describir informacin por medio de grfica de barras es particularmente til cuando se utilizan variables categricas que son obtenidas en una escala nominal. Una grfica de barras usa lneas (i.e. barras) que representan categoras discretas de datos, en donde la longitud de la lnea es proporcional a la frecuencia dentro de esa categora

Suponga que en un bosque coloca 31 nidos artificiales, 15 son ocupados por gorriones, 10 por azulejos, 4 por carpinteros y 2 por cuervos. La tabla tendr que ser construida de la siguiente manera, junto con la grfica

ave gorrin azulejo carpintero cuervo n

f 15 10 4 2 31

16 14 12 10 8 6 4 2 0 gorrin azulejo carpintero cuervo

Nmero de observaciones (f)

Histograma
Los histogramas son grficas de barras en donde el rea cada bloque es proporcional a la frecuencia. El rea de un bloque es obtenido multiplicando el ancho del bloque (intervalo de clase) por la altura (frecuencia)
50 45 40 35 30 25 20 15 10 5 0 18.5 55.5 92.5

Frecuencia

Ancho clase: Frecuencia: rea:

18.5 45 (18.5*45) = 842.5

129.5

166.5

203.5

240.5

Centro Clase

Polgono de Frecuencia y Curva de Frecuencia


Si el punto medio del tope de cada bloque del histograma es unido por una lnea, un polgono de frecuencia es construido

Cuando el nmero de observaciones de una variable continua es grande y las unidades de incremento entre bloques es pequea, las lneas entre bloques tiende a ser suavizada, formando una curva continua, llamada curva de frecuencia.

Grfica Dispersin
Cuando pares de observaciones de dos variables son obtenidas de la misma muestra (es decir, los datos son bivariados), una grfica de dispersin es utilizada para desplegar los datos.

Grfica Circular
Las grficas son utilizadas frecuentemente para desplegar datos en porcentajes o proporciones. Si se considera que el total de datos es el 100% a cada categora le corresponde una fraccin o rebanada de pastel.

También podría gustarte