Está en la página 1de 12

UNMSM – FISI –NOTAS DE CLASE: ESTADÍSTICA DESCRIPTIVA

ORGANIZACIÓN Y PRESENTACIÓN DE DATOS


ORGANIZACIÓN DE DATOS

Una vez obtenidos los datos de una encuesta, como producto de la aplicación de un
instrumento de medición, se realiza la crítica, la codificación y se almacenan en una matriz de datos,
la cual contiene todos los datos relacionados a cada una de las variables definidas en el estudio.
Los datos correspondientes a cada variable se organizan usando las diferentes técnicas
estadísticas para luego ser presentados en tablas o cuadros y también gráficamente.
Dependiendo del nivel de medición de la variable, se tendrá una presentación gráfica y
tabular diferente.

PRESENTACION DE DATOS

Hay dos formas de presentar los datos ya organizados:


i) Mediante tablas o cuadros: tablas de frecuencia, tablas de contingencia, cuadros
estadísticos.
ii) Mediante gráficos y diagramas.

Las tablas de frecuencia son el resumen del comportamiento de una sola variable.

Las tablas de contingencia muestran la relación entre dos o más variables.

Los cuadros estadísticos (o tablas estadísticas) proporcionan información para uso general.

Generalmente, los gráficos se utilizan como complemento, para ilustrar mediante figuras el
comportamiento de las variables y además facilitan la comprensión de los fenómenos estudiados.

CUADROS ESTADÍSTICOS

Están diseñados para servir como depósito de información. Proporcionan información para
uso general. Incluyen información detallada. Como ejemplo tenemos los cuadros publicados por
organismos gubernamentales.

PARTES DE UN CUADRO ESTADÍSTICO

1. Número de cuadro: permite identificar y ubicar el cuadro en el interior de un documento.


2. Título: es la descripción resumida del contenido del cuadro. Un título completo debe indicar:
QUÉ se está presentando, de DÓNDE se ha recogido la información, CÓMO están ordenados
los datos en el cuadro, CUÁNDO o a qué momento está referida la información.
3. Encabezamiento: se ubica en la parte superior del cuadro (primera fila) y contiene la
descripción de los títulos de las columnas del cuadro (descripción de las variables y
categorías).
4. Talón: se ubica en el lado izquierdo del cuadro y contiene la descripción de los títulos de las

1
Lic. Justa Caridad Huaroto Sumari
UNMSM – FISI –NOTAS DE CLASE: ESTADÍSTICA DESCRIPTIVA

filas del cuadro. Llamada columna matriz, generalmente contiene las diferentes clases de la
escala de clasificación utilizada.
5. Cuerpo: es el contenido numérico del cuadro. En él se encuentra la información numérica
que resume el comportamiento del fenómeno estudiado.
6. Notas explicativas: contiene
a) Nota de encabezamiento: se escribe debajo del título, generalmente indica las
unidades en que está expresada la variable.
b) Nota de pie o llamadas: se usa para aclarar algunos términos o siglas.
c) Fuente: es la indicación que nombra la publicación, entidad u origen de los datos.
Los totales generales se ubican en la primera fila y primera columna o última fila y última
columna

Estas mismas partes son válidas para un gráfico estadístico.

Número de tabla
EJEMPLO
Cuadro Nº 1
Población económicamente activa de 15 y más años
de la Región Loreto por nivel de educación alcanzado Titulo
según provincias. Censo de población de 1993.
(distribución porcentual)

Nivel Educativo 2/
Provincias Total Total Sin Primaria Secundaria Superior Encabezamiento
Talón
PEA Nivel
TOTAL 1/ 141750 100,0 7,5 44.1 32.4 16.0
Maynas 78890 100,0 5,2 36.0 38.1 20.7
Amazonas 22508 100,0 13,5 52.2 24.3 10.0
Cuerpo
Loreto 11038 100,0 12,5 60.5 19.7 7.3
Ramón Castilla 6564 100,0 14,0 53.8 23.5 8.7
Requena 11828 100,0 7,2 58.5 25.5 8.8
Ucayali 10922 100,0 4,4 59.7 27.1 8.8
1/ Excluye a los que no especificaron nivel de educación. Notas Explicativas
2/ Se refiere a algún grado o año de estudios
FUENTE: INEI. Censos Nacionales de 1993. Fuente

PUNTOS IMPORTANTES EN LA CONSTRUCCIÓN DE UN CUADRO O TABLA


ESTADÍSTICA

a) Antes de elaborar la tabla es importante establecer algún criterio de ordenamiento de los


datos (diseño de la tabla)
b) Ninguna casilla debe quedar en blanco. Si el dato no es aplicable o no hay información,
deberá colocarse un guión o algún otro símbolo en la casilla correspondiente.
c) Las unidades de medida de las variables deben estar claramente especificadas.
d) La tabla debe ser sencilla y explicativa. A veces es preferible usar dos o más tablas sencillas

2
Lic. Justa Caridad Huaroto Sumari
UNMSM – FISI –NOTAS DE CLASE: ESTADÍSTICA DESCRIPTIVA

en lugar de una muy complicada.


e) De preferencia se debe tratar un solo tema en la tabla. Si se expone más de una variable,
éstas deben estar relacionadas, de modo que se faciliten las comparaciones
f) Enfatizar cifras importantes. Según se desee, los totales pueden colocarse en
 La última fila y la última columna del cuerpo de la tabla
 La primera fila y la primera columna del cuerpo de la tabla.
g) Redondear en los dígitos los detalles innecesarios (ejemplo: 14.5 a 14, 14.78 a 15 ó 14.78 a
14.8, 13.5 a 14)
h) Mejorar la apariencia de la tabla (letras mayúsculas, negritas, colores, espaciar las cifras).

GRAFICOS ESTADÍSTICOS

La característica principal de un buen gráfico es que debe ser explicativo por sí mismo,
facilitando la evaluación de los datos.
El principio de construcción de los gráficos son las coordenadas rectangulares.

PARTES PRINCIPALES DE UN GRAFICO

1. Número de gráfico: es importante la asignación de un número, pues permitirá hacer


referencia a cada uno de ellos en el proceso de análisis de resultados.
2. Título: al igual que la tabla, resume la información contenida en el gráfico.
3. Cuerpo del gráfico: es la figura que resume el comportamiento del fenómeno estudiado.
4. Escalas: en ellas se precisa la correspondencia entre los elementos del gráfico y la naturaleza
de las medidas presentadas. Para gráficos que son representados en un sistema de
coordenadas, tomar en cuenta las siguientes recomendaciones:
 Seguir la regla de los ¾ o la regla de la igualdad para los ejes de la ordenada y
abscisa.
 Considerar la escala aritmética a la hora de dividir los ejes
 En los ejes debe figurar el nombre de la variable y su unidad de medida.
5. Leyenda: contiene aclaraciones con respecto al gráfico.
6. Notas explicativas: van al final del gráfico; en ellas se colocan información relativa a la
fuente, aclaraciones referidas a las cifras, a los encabezados, etc.

3
Lic. Justa Caridad Huaroto Sumari
UNMSM – FISI –NOTAS DE CLASE: ESTADÍSTICA DESCRIPTIVA

GRAFICO N°1
Numero de Grafico
Escalas Titulo

Cuerpo de
Grafico

Fuente: Tesis de produccion y Comercializacion de truchas en Puno


Yapuchura Sayco Angelica. FCM- UNMSM- 2002 Fuente

TIPOS COMUNES DE GRAFICOS

Los gráficos más comúnmente usados, dependiendo del tipo de variable y de la información que
se quiere mostrar, son:
1. Circulares o de sectores (“pie”): útiles cuando el número de categorías de la variable es
pequeño (5 ó menos). Apropiado para variables cualitativas.
2. Barras: útil cuando la variable tiene un número grande de categorías. Las barras pueden ser
verticales u horizontales. Apropiado para variables cualitativas.
3. Lineales: útil para estudiar la evolución de una variable a través del tiempo.
4. histogramas y polígonos. Apropiado para variables cuantitativas continuas.
5. Ojiva. Apropiado para variables cuantitativas continuas.
6. Diagrama de tallo y hojas. Apropiado para variables cuantitativas.
7. Gráfico de cajas. Apropiado para variables cuantitativas.
8. Gráfico de bastones. Apropiado para variables cuantitativas discretas.
9. Otros gráficos (Pareto, pictogramas, áreas, etc.)

EJEMPLOS DE GRÁFICOS:

4
Lic. Justa Caridad Huaroto Sumari
UNMSM – FISI –NOTAS DE CLASE: ESTADÍSTICA DESCRIPTIVA

HISTOGRAMA GRÁFICO DE BARRAS

GRÁFICO DE SECTORES POLÍGONO

GRÁFICO DE CAJAS GRÁFICO LINEAL

GRÁFICO DE BARRAS APILADAS

PICTOGRAMA

5
Lic. Justa Caridad Huaroto Sumari
UNMSM – FISI –NOTAS DE CLASE: ESTADÍSTICA DESCRIPTIVA

GRÁFICO DE BASTONES DIAGRAMA DE DISPERSIÓN

PRESENTACIÓN DE DATOS EN TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS

Las tablas de frecuencia son el resumen del comportamiento de una sola variable.

Con los datos ya organizados en una base de datos, construimos las tablas de frecuencia, una
para cada variable.
En una tabla de distribución de frecuencias, los datos se clasifican de acuerdo a las diferentes
categorías de la variable, si el nivel de medición es nominal u ordinal; o se agrupan en clases si el
nivel de medición es de intervalo o de razón.
Una tabla de distribución de frecuencias nos permite ver patrones de comportamiento de los
datos.

Frecuencia: Es el número de veces que se repite un dato, al medir una variable en cada una de
las unidades estadísticas involucradas en la investigación.

TABLA DE FRECUENCIAS PARA VARIABLE CATEGÓRICA O CUALITATIVA

Como producto de la observación de la variable en cada unidad estadística, se obtiene un


conjunto de respuestas o datos. A cada una de las respuestas diferentes se les llama niveles,
categorías o modalidades. Una vez identificadas, se las dispone en la primera columna de la tabla y
enseguida se procede a hacer el conteo de casos (frecuencia) que caen en cada categoría, tal como se
muestra en la tabla adjunta.

Tabla Nº 1
Variable frecuencia
cat. 1 f1
cat. 2 f2
. .
. .
. .
cat. k fk

Una tabla de distribución de frecuencias, indica la distribución de un conjunto de datos en clases o

6
Lic. Justa Caridad Huaroto Sumari
UNMSM – FISI –NOTAS DE CLASE: ESTADÍSTICA DESCRIPTIVA

categorías. Esta tabla describe la manera cómo están distribuidos los valores de una variable,
permitiendo hacer interpretaciones acerca de los datos y es un punto de partida en la búsqueda de un
modelo teórico para analizar tal distribución.

Ejemplo 1: En una empresa pública laboran 18 abogados, 32 ingenieros, 45 topógrafos, 20 obreros y


15 secretarias. La clasificación de los empleados de acuerdo a la variable ocupación aparece en el
cuadro siguiente.

Cuadro Nº 1
Ocupación Número de
Empleados
Abogados 18
Ingenieros 32
Topógrafos 45
Obreros 20
Secretarias 15
Total 130

Las frecuencias que se indican en las columnas del cuadro 1 pueden representarse gráficamente
mediante sectores circulares (figura 1) o mediante barras rectangulares (figura 2).

Figura Nº 1 Figura Nº 2
Distribución de Empleados según su Distribución de Empleados por ocupación
ocupación

Secretarias Abogados 50
40
Obreros 30
20
10
Ingenieros 0
Abogados Ingenieros Topógrafos Obreros Secretarias

Topógrafos

EJEMPLO 2: Clasificación de una muestra de postulantes del Examen de Admisión 2016-II de la UNMSM según su
género

Número de Porcentaje GÉNERO


GÉNERO postulantes
Femenino 829 52,6
Femenino
Masculino 746 47,4 47.4%

TOTAL 1575 100,0 Masculino

52.6%

7
Lic. Justa Caridad Huaroto Sumari
UNMSM – FISI –NOTAS DE CLASE: ESTADÍSTICA DESCRIPTIVA

CUADRO 2 : Clasificación de una muestra de postulantes en el examen de admisión


2016-II de la UNMSM, según el ranking de las carreras más solicitadas

Carrera Frecuencia Porcentaje


1 Administración 126 8.4%
2 Medicina Humana 114 7.6%
3 Ingeniería Industrial 104 7.0%
4 Contabilidad 81 5.4%
5 Derecho 71 4.8%
6 Ingeniería de Sistemas 70 4.7%
7 Administración de Negocios Internacionales 65 4.4%
8 Economía 63 4.2%
9 Ingeniería Civil 56 3.8%
10 Psicología 49 3.3%
11 Administración de Turismo 47 3.2%
12 Otras 692 46.4%
Total 1492 100.0

TABLA DE FRECUENCIAS PARA VARIABLE NUMÉRICA O CUANTITATIVA


En este caso, debemos distinguir dos situaciones:
La primera, si los datos son numerosos y existen pocos valores diferentes, las clases serán
precisamente cada uno de esos valores diferentes.
La segunda, si los datos son numerosos y existen muchos valores diferentes, las clases serán
intervalos de números reales.

Se acostumbra presentar a los datos de variable discreta según la primera situación y a los datos de
variable continua según la segunda situación.

Hay que precisar que esos tipos de presentaciones no son exclusivas de dichos tipos de variables.

CASO 1: VARIABLE DISCRETA

En este caso, las clases serán los valores diferentes de la variable. Para un conjunto de n
datos, donde hay k valores diferentes x1, x2, ..., xk, la presentación de los mismos es tal como se
muestra en la tabla que sigue.

Tabla Nº 3
X fi hi Fi Hi
x1 f1 h1 F1 H1
x2 f2 h2 F2 H2
.
.
.
xk fk h k Fk Hk

8
Lic. Justa Caridad Huaroto Sumari
UNMSM – FISI –NOTAS DE CLASE: ESTADÍSTICA DESCRIPTIVA

fi es la frecuencia absoluta simple.


Representa el número de veces que se repite cada dato; ∑ f i = n.

A veces, se requiere expresar las frecuencias en términos relativos o mediante un conteo acumulado.

Las frecuencias que aparecen en las columnas tercera, cuarta y quinta del cuadro son,
respectivamente, iguales a:

hi = fi/n conocida como la frecuencia relativa.


Expresa la fracción de las veces que aparece el dato i- ésimo; ∑ h i = 1.
i
Fi = f
j 1
j , es la frecuencia absoluta acumulada.

Acumula el número de veces que se presentan los datos menores o iguales al i-ésimo dato; F k = n.
i
Hi = h j 1
j , es la frecuencia relativa acumulada.

Acumula la fracción de veces que se presentan los datos menores o iguales al i-ésimo dato; H k = 1.

La representación gráfica de las frecuencias absolutas y relativas puede hacerse en un sistema


de ejes coordenados cartesianos, colocando en el eje de las abscisas los distintos valores x i de la
variable y en el eje de las ordenadas, las frecuencias. Se obtienen así gráficos llamados de bastones y
para las frecuencias absolutas acumuladas y relativas acumuladas se obtiene los gráficos de
escalera

Ejemplo:
Presentaremos en una tabla de frecuencias los datos siguientes, correspondientes al número de
hermanos, X, de 20 estudiantes.

2 1 3 3 1 4 3 2 0 2
4 4 1 2 2 3 2 2 3 2

Los datos pueden organizarse como en la siguiente tabla.

Xi fi hi Fi Hi
0 1 0.05 1 0.05
1 3 0.15 4 0.20
2 8 0.40 12 0.60
3 5 0.25 17 0.85
4 3 0.15 20 1.00
Total 20 1.00

Las frecuencias que se presentan en esta tabla se pueden representar gráficamente mediante el
gráfico de bastones y el gráfico escalonado.
(Queda como ejercicio hacer los gráficos)

9
Lic. Justa Caridad Huaroto Sumari
UNMSM – FISI –NOTAS DE CLASE: ESTADÍSTICA DESCRIPTIVA

Gráfico de bastones: Hacer el gráfico de escalera (escalonado)


NÚMERO DE HERMANOS DE UN GRUPO DE ALUMNOS

10

8
Número de Alumnos

0
0 1 2 3 4 5 6
Número de Hermanos

CASO 2: VARIABLE CONTINUA


En este tipo de variable, los datos se organizan en intervalos.

PROCEDIMIENTO:
Representemos a los datos originales (que se muestran en una columna de la base de datos) con la
notación siguiente: X1 , X2 , X3 , …..,Xn .
Al ordenarlos de manera ascendente, la notación que emplearemos es la siguiente:
X(1) , X(2) , X(3) , ….., X(n).

1) Se obtiene el rango, R, de los datos: es la diferencia entre el dato más grande y el dato más
pequeño del conjunto de n datos. Esto es, R = X(n) – X(1)

2) Se obtiene el número de clases, k. Este número depende de lo que se quiere presentar y cómo se
quiere presentar. Aunque una regla práctica indica que el número de clases debe variar entre 5 y 20,
es el investigador quien tiene la palabra final al respecto.
Sin embargo, se dan algunos criterios para determinar este número:
Si n>30, entonces k = n
Siguiendo el criterio de Sturges, el número de intervalos es igual a k = 1 + 3.32 log10 n.

3) Se determina la amplitud, c, de los intervalos. Pudiendo ser de amplitudes diferentes, para mayor
facilidad se usan de amplitudes o longitudes iguales.
c = R/k
4) Se procede a construir los intervalos; éstos pueden ser cerrados por la izquierda y abiertos por la
derecha o pueden ser cerrados en ambos límites. Los intervalos que así se forman se llaman
intervalos de clase.
La construcción de intervalos de clase semi abiertos, de amplitud constante, es como sigue:

[Linf Lsup )
I1  [X(1) X(1) + c )
I2  [X(1) + c X(1) + 2c)
I3  [X(1) + 2c X(1) + 3c)
. .
. .
. .
IK  [X(1) + (k-1)c X(n) )

10
Lic. Justa Caridad Huaroto Sumari
UNMSM – FISI –NOTAS DE CLASE: ESTADÍSTICA DESCRIPTIVA

5) Se procede a hacer el conteo, ubicando cada dato en el intervalo correspondiente y se completa el


cuadro agregando columnas según los diferentes tipos de frecuencias, como en el caso anterior.
Los datos se pueden representar como en la tabla siguiente.

Intervalos fi hi Fi Hi
I1 f1 h1 F1 H1
I2 f2 h2 F2 H2
.
.
.
Ik fk hk Fk Hk

Después de la primera columna de intervalos, se puede insertar una segunda columna donde
aparecen las marcas de clase , Xi´, que son los puntos medios de cada intervalo de clase y se les
considera como valores representativos de todos los datos que caen en cada intervalo.

EJEMPLO: CALIDAD TOTAL es una institución dedicada a otorgar certificaciones de calidad ISO
9001 a empresas de bienes y servicios. Royal S.A. está en proceso de evaluación por esta institución
y una de las tareas es medir la satisfacción del personal de la empresa mediante una prueba con
escala de 0 a 100 puntos. Los 40 trabajadores que laboran en la sede principal obtuvieron las
siguientes puntuaciones:

74 89 82 83 67 81 68 85 81 72
71 74 60 64 72 84 66 84 69 81
69 66 93 63 102 70 95 82 81 80
88 80 85 85 72 81 90 89 80 87

Siguiendo el procedimiento, agruparemos estos datos en intervalos de clase, ya que observamos


muchos valores diferentes.

PROCEDIMIENTO:
1º R = X(n) – X(1)  R = 102 - 60 = 42
2º k = 1 + 3.3 log (40) = 6.28  k=6
3º c=R/k  c = 42 / 6 = 7
4º Formación de los 6 intervalos de clase semi abiertos y conteo de los datos:

Puntajes X’i fi hi (%) Fi Hi (%)


marca de clase
60---67 63.5 5 12.5 5 12.5
67---74 70.5 9 22.5 14 35
74---81 77.5 5 12.5 19 47.5
81---88 84.5 14 35 33 82.5
88---95 91.5 5 12.5 38 95
95---102 98.5 2 5 40 100
Total n = 40 100

Cuando los datos corresponden a variables continuas, a menudo se usan curvas cuyas

11
Lic. Justa Caridad Huaroto Sumari
UNMSM – FISI –NOTAS DE CLASE: ESTADÍSTICA DESCRIPTIVA

formas se obtienen a partir de los gráficos llamados histogramas (de frecuencia absoluta o relativa).

Los histogramas se obtienen al yuxtaponer bandas rectangulares (rectángulos). Cada banda


corresponde a cada intervalo de clase Ii. La base es la amplitud del intervalo y la altura es
proporcional a la frecuencia que se desea representar.

Uniendo los puntos medios de los lados superiores de cada banda rectangular del histograma
se obtiene un polígono llamado polígono de frecuencias (ya sea de frecuencias absolutas o
relativas).

El histograma acumulado se usa para las frecuencias absolutas acumuladas o relativas


acumuladas; también se puede graficar la OJIVA.

REPRESENTACIÓN GRÁFICA:

Histogram de frecuencias absolutas simples Histogram de frecuencias relativas simples (%)


14 40
14
35

12
Porcentaje de Trabajadores
Número de Trabajadores

30
10
9
22.5
8
20
6
5 5 5
12.5 12.5 12.5

4
10
2 5
2

0 0
60 67 74 81 88 95 102 60 67 74 81 88 95 102
Puntajes Puntajes

Histogram de frecuencias relativas acumuladas (%) Histogram de frecuencias relativas acumuladas (%)
40 100
40 38 100 95

33 82.5
80
Porcentaje Acumulado

Porcentaje Acumulado

30

60

20 19 47.5

14 40 35

10
20
5 12.5

0 0
60 67 74 81 88 95 102 60 67 74 81 88 95 102
Puntajes Puntajes

12
Lic. Justa Caridad Huaroto Sumari

También podría gustarte