Está en la página 1de 18

Estadsticas descriptivas: organizacin y presentacin de los datos.

Anlisis exploratorio de los datos. A partir de este captulo abordaremos la manera de agrupar los datos, mediante, las distribuciones de frecuencias, y de presentar los mismos organizadamente utilizando cuadros y grficos estadsticos. Estudio descriptivo de una coleccin de datos Una vez obtenida la informacin correspondiente o fenmeno objeto de investigacin, esta se nos presenta bajo la forma de una coleccin de datos individuales y viene a construir la materia prima del investigador.

Un estudio descriptivo de una coleccin de datos contempla los siguientes aspectos: 1) Ordenacin y clasificacin de los datos originales 2) Presentacin de los datos agrupados en cuadros estadsticos y grficos.

3) Calculo de medidas descriptivas numricas que nos indiquen al centro o la localizacin de los datos, el grado de variabilidad o dispersin de los mismos y la forma en que se distribuyen.
4) El anlisis propiamente de los datos, conjugando los resultados obtenidos en 1, 2 y 3. Esto nos permite determinar si existe alguna tendencia o patrn en los datos, la forma en que se distribuyen, los valores mximos y mnimos, el grado de variabilidad o dispersin de los datos con respecto a un valor central, la presencia de datos considerados atpicos en relacin al resto de los datos.

Organizacin de los datos


Vamos a considerar por separados los casos de datos cualitativos y datos cuantitativos. Organizacin de datos cualitativos. En este caso la agrupacin de los datos es muy sencilla y se hace de acuerdo a las modalidades que presente la variable en estudio. Mediante un conteo se determina el numero de datos (tambin llamado frecuencia) correspondiente a las diferentes categoras de la variable. Este procedimiento es vlido para cualquier cantidad de datos.

Ejemplo En estudio sobre las personas que ejercen cargos directivos en la UPB, se realizaron 32 entrevistas y en relacin al sexo se obtuvo la siguiente informacin: F, F, M, M, F, M, F, F, M, F, M, M, M, M, F, F, M, F, F, F, M, F, F, M, M, F, F, F, F, F, M, M. Agrupando los datos de acuerdo a las categoras masculinas y femeninas, se obtiene el siguiente cuadro:

clasificacin del personal

directivo de acuerdo al sexo


sexo masculino femenino total personas 14 18 32

Cuando el inters es agrupar los datos de acuerdo a dos caractersticas simultneamente, por ejemplo clasificar a las personas de acuerdo al sexo y a la profesin, entonces se elaboran los denominados cuadros de doble entrada, tambin conocidos como tablas de contingencia.

Tabla de contingencia
Estas tablas se obtienen ubicando a cada individuo en alguna de las celdas, de acuerdo a las modalidades que presente en las dos caractersticas consideradas. Esta clase de tabla permite analizar cada caracterstica por separado, observando los totales de los mrgenes, y en forma conjunta, mediante las cifras que estn en las celdas.

tabla de doble entrada caracterstica B b1 a1 a2 ar totales b2 ... bk totales

Ejemplo
Agrupar los siguientes datos correspondientes al sexo y la profesin de los 32 directivos UPB.
sexo F F M M F M F F profesin economista medico socilogo economista ingeniero estadstico ingeniero estadstico sexo M F F F M F F M profesin economista ingeniero abogado economista estadstico gegrafo socilogo abogado sexo M F M M M M F F profesin abogado medico abogado ingeniero ingeniero gegrafo abogado socilogo sexo M F F F F F M M profesin economista ingeniero socilogo ingeniero abogado abogado gegrafo estadstico

Organizacin de datos cuantitativos.

Para organizar datos de tipo cuantitativo, discreto o continuo, se utiliza un procedimiento similar, pero ms laborioso, al utilizado con los datos cualitativos.

Ejemplo
Vamos a utilizar el nivel de hemoglobina (gramos por 100 mililitros) de un grupo de 40 pacientes de un hospital, la cual se presenta en el siguiente cuadro. Vamos agrupar los siguientes datos.
12 16,2 14,6 14 14,6 14,8 15,3 15,4 13,2 14,4 13,7 11,6 15,7 14,8 15 13,8 15,2 17,3 17 14,8 16 16,2 18 16,3 14,7 15 16,2 16 13,6 15,3 14 14,8 15 16,9 15,4 17,2 16 15 16,2 16,8

Distribucin de frecuencia
Elementos de una distribucin de frecuencia. 1) Intervalos de clase o clases, que consisten en intervalos de valores ordenados en forma ascendente y que cubren todos los datos disponibles. 2) Limites de clase: son los extremos de la clase o intervalo. El extremo inferior o valor menor del intervalo se denomina LMITE INFERIOR DE LA CLASE y el extremo superior se denomina LMITE SUPERIOR. Se denotan por LIi y LSi, para clase i-esima. Podemos tener intervalos abiertos cuando no se tiene lmite inferior, superior o ambos. 3) Amplitud de clase: se obtiene haciendo la diferencia entre el lmite superior y el lmite inferior de la clase. Se denotan por ci, donde el subndice i representa la clase considerada. A las clases abiertas no se les puede determinar su longitud. Adems siempre se trata de construir clases con la misma longitud. 4) Frecuencia absoluta de clase: es el nmero de observaciones contenidas o incluidas en la clase. Se denota por fi.

5) Frecuencia relativa de clase: se obtiene dividiendo la frecuencia absoluta de la clase fi entre el nmero total de observaciones n. se denota por fri

fi f ri n

Siempre se cumple que:

f
i 1

ri

La frecuencia relativa de una clase representa la proporcin de datos contenidos en esa clase.

6) Frecuencia absoluta acumulada: se obtiene sumando las frecuencias absolutas de todas las clases anteriores a ella y la frecuencia absoluta de la clase considerada. Se denota por Fi. Se tiene que
F1 f1 F2 f1 f 2 F1 f 2 F3 f1 f 2 f 3 F2 f 3

Y as sucesivamente. La frecuencia acumulada de la ltima clase de la distribucin de frecuencia coincide con el nmero total de datos n.

7) Frecuencia relativa acumulada: se obtiene dividiendo la correspondiente frecuencia acumulada Fi entre el nmero total de datos. Se denota por Fri.

Fi Fri n

8) Marca de clase: la marca de clase se define como el punto medio de esa clase, es decir, es la semisuma de los lmites inferior y superior de la clase. LI LS i mi i 2 La marca de clase se usar cuando las medidas de tendencia central.

Reglas y recomendaciones generales para construir una distribucin de frecuencias.


1) Se determina el valor mximo y mnimo de los datos y se calcula la diferencia entre estos valores, la cual se denomina rango o recorrido de la variable y se denota por R. 2) Se determina el nmero de clases y las amplitudes de clase. Y en ese sentido pueden presentarse alternativas. Para encontrar el nmero hay dos alternativas: Regla del conteo y regla de Sturges. Regla del conteo

2 n
k

Regla de Sturges.

El nmero de clases no debe ser menor de 5 ni mayor de 15. 3, Amplitud de la clase Para encontrar la amplitud de la clase

k 1 3.3 log n

R Ci k
Luego de tener el nmero de clases y la amplitud de clase, se procede a construir la distribucin de frecuencia.

También podría gustarte