Está en la página 1de 12

_ Organización y presentación de datos 1

MATERIAL DE PROFUNDIZACIÓN

ORGANIZACIÓN Y PRESENTACIÓN DE
DATOS
_ Organización y presentación de datos 2

Dirección de Planificación y Desarrollo Online - INACAP Online


Universidad Tecnológica de Chile - INACAP
www.inacap.cl
Santiago de Chile

Equipo recopilador

Experto disciplinar: Sebastián Herrera de la Piedra.


Diseñador instruccional: Mauricio Méndez Saldaña
Editor de contenidos: Camila Oróstica
Diseñador gráfico: Sebastián Cifuentes Torres

Enero, 2019. Propiedad de INACAP


Versión: 1.0 (01/2019)
Palabras claves: estadística, probabilidad, muestra, frecuencias, representación gráfica.

_Material de profundización
_ Organización y presentación de datos 3

1. PRESENTACIÓN DE DATOS

En esta oportunidad abordaremos las tablas de frecuencias y los gráficos estadísticos, y comenzaremos señalando que
ambas representaciones gráficas son maneras equivalentes de presentar información, dado que las dos exponen
ordenadamente la información recogida en una muestra.

Veamos el siguiente ejemplo: tenemos al centro nuestra muestra que consta de 10 personas (6 mujeres y 4 hombres),
y a cada costado representaciones gráficas equivalentes, a la izquierda una tabla de frecuencia y a la derecha un gráfico
estadístico.

Figura 1: Representaciones gráficas equivalentes. Fuente: elaboración propia.

1.1. Datos desordenados y ordenados en tablas


Veamos ahora como una tabla de frecuencia nos permite ordenar información que se nos presenta desordenada

Si consideramos la variable “Género”, tendremos dos categorías:


H: Hombre
M: Mujer

La muestra a partir de la imagen es M H H M M H M M M H, que equivale a decir


HHHH MMMMMM

Usando una tabla podríamos ordenar la información de la siguiente manera:

_Material de profundización
_ Organización y presentación de datos 4

VARIABLE: GÉNERO FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA (PORCENTAJE)

Hombre 4 4/10= 0,4 = 40%

Mujer 6 6/10= 0,6 = 60%

n= 10
tamaño muestral

Tabla 1: Ejemplo datos ordenados y desordenados en tablas. Fuente: elaboración propia.

Como acabamos de revisar, las tablas de frecuencia exponen


la información recogida en la muestra de forma resumida sin
que se pierda nada de información.
Veamos un ejemplo más:

NÚMERO DE HIJOS
Cantidad Frecuencia Porcentaje Porcentaje válido Porcentaje acumulado
0 419 27,6 27,8 27,8
1 255 16,8 16,9 44,7
2 375 24,7 24,9 69,5
3 215 14,2 14,2 83,8
4 127 8,4 8,4 92,2
5 54 3,6 3,6 95,8
6 24 1,6 1,6 97,3
7 23 1,5 1,5 98,9
8 o más 17 1,1 1,1 100,0
Total 1509 99,5 100

Tabla 2: Ejemplo datos ordenados y desordenados en tablas. Fuente: elaboración propia.

A partir de la información presentada, ¿qué porcentaje de individuos tiene 3 hijos o menos? ¿qué porcentaje de
individuos tiene entre 4 y 6 hijos?

_Material de profundización
_ Organización y presentación de datos 5

Para responder la primera pregunta, bastaría con mirar en el cuadro el porcentaje acumulado de personas que tienen
3 hijos y señalar que el 83,8% posee 3 hijos o menos.
Para responder la segunda pregunta deberíamos sumar los porcentajes válidos de los individuos que tienen 4, 5 y 6
hijos. De esta forma sería 8,4% + 3,6% + 1,6% = 13,6%.

1.2. Distribución de frecuencias

La distribución de frecuencias es una tabla resumen de los datos originales, donde se fijan intervalos de clase. Para la
construcción de la distribución de frecuencias, se deben conocer los siguientes conceptos (Spiegel y Stephens, 2009):

NOTACIÓN DEFINICIÓN

Es el punto medio de cada intervalo (clase) y representa el valor de cada


Marca de clase Xi
intervalo.

Es la diferencia entre el límite superior e inferior del intervalo.


Amplitud A

Corresponde a la diferencia entre el mayor y el menor valor de los datos


Recorrido o rango R
en estudio.

Corresponde al número de observaciones que pertenecen al intervalo de


Frecuencia absoluta fi
clase.

Es la razón entre la frecuencia absoluta en cada intervalo y el total de la


Frecuencia relativa hi
muestra.

Frecuencia absoluta Corresponde a la suma de las frecuencias absolutas anteriores, más la


Fi
acumulada frecuencia en cuestión.

Frecuencia relativa Corresponde a la suma de las frecuencias relativas anteriores, más la


Hi
acumulada frecuencia en cuestión.

Tabla 3: Distribución de frecuencias. Fuente: elaboración propia.

Se indica por Li al límite inferior del intervalo; y por Ls al límite superior.


INTERVALO MARCA DE CLASE

8-12 10

12-16 14

Figura 2: Distribución de frecuencias. Fuente: elaboración propia.

_Material de profundización
_ Organización y presentación de datos 6

Al momento de elaborar una tabla es importante tener en cuenta los siguiente:

Definir su propósito.
Escribir un título que indique QUÉ se presenta en la tabla, CÓMO, CUÁNDO y DÓNDE.
Asignar escalas de clasificación en filas y columnas.
Las tablas, habitualmente deben ser enumeradas cuando hay más de una en el texto.

Veamos un ejemplo:

MOTIVO CONSULTA NÚMERO DE PÁGINAS

Bronquitis 29

Otitis 23

Heridas 17

Fracturas 12

Vacunas 9

Total 90

Qué Cómo Cuándo Dónde

Tabla 4: Motivo de la consulta médica, durante la primera semana de 2018 en la clínica buena salud. Fuente: elaboración propia.

1.3. Representaciones gráficas


Para hacer más clara y evidente la información que nos dan las tablas se utilizan los gráficos, existen múltiples tipos
de gráficos, los usados de manera más frecuentemente usados los siguientes: gráfico de barras, gráfico de sectores o
circular (pastel), histograma, polígono de frecuencias, la ojiva y el pictograma.

Veamos los gráficos más utilizados brevemente.

1.3.1 Gráfico circular o de torta

Se utiliza para representar la frecuencia relativa hi


Se aplica para cualquier tipo de variable, pero de preferencia se aplica a variables cualitativas.

_Material de profundización
_ Organización y presentación de datos 7

Nivel de educación de los trabajadores de una empresa


NIVEL DE EDUCACIÓN FI HI Postgrado Básico
11% 8%
Básico 16 8%
Medio
Medio 50 25%
25%
Universitario 112 56%
Universitario
Postgrado 22 11% 56%

Figura 3: Gráfico circular o de torta. Fuente: elaboración propia.

1.3.2. Histograma

Se utiliza para representar la distribución de frecuencias absolutas o relativas en una variable cuantitativa
continua.
Esta formado por rectángulos unidos a otros, cuyos vértices de la base coinciden con los limites de los
intervalos.

DURACIÓN DE UNA
FI HI FI HI
LLAMADA EN MINUTOS

6-9 4 1,00% 4 1,00%


Distribución del tiempo de las
9-12 17 4,25% 21 5,25%
llamadas al extranjero
12-15 41 10,25% 62 15,50% 120 98
84
N° de llamadas

100 76
15-18 98 24,50% 160 40,00% 80 56
60 41
18-21 84 21,00% 244 61,00% 40 17 18
20 4 5 1
21-24 76 19,00% 320 80,00% 0
6 - 9 9 - 12 12 - 15 - 18 - 21 - 24 - 27 - 30 - 33 -
24-27 56 14,00% 376 94,00% 15 18 21 24 27 30 33 36
Tiempo en minutos
27-30 18 4,50% 394 98,50%

30-33 5 1,25% 399 99,75%

33-36 1 0,25% 400 100,00%


Figura 4: Histograma. Fuente: elaboración propia.

_Material de profundización
_ Organización y presentación de datos 8

1.3.3. Polígono de frecuencias

Se utiliza para representar la distribución de frecuencias absolutas o relativas de una variable cuantitativa
continua. Es útil cuando se quiere comparar dos distribuciones en un mismo gráfico.

DURACIÓN DE UNA
LLAMADA EN FI HI FI HI
MINUTOS Distribución del tiempo de duración
de las llamadas
6-9 4 1,00% 4 1,00%
120 98
100 84

N° de llamadas
9-12 17 4,25% 21 5,25% 76
80 56
12-15 41 10,25% 62 15,50% 60 41
40 17 18
20 4 5 1
15-18 98 24,50% 160 40,00%
0
18-21 84 21,00% 244 61,00% 0 3 6 9 12 15 18 21 24 27 30 33 36 39
Tiempo en minutos
21-24 76 19,00% 320 80,00%

24-27 56 14,00% 376 94,00% Figura 5: Polígono de frecuencias. Fuente: elaboración propia.

27-30 18 4,50% 394 98,50%

30-33 5 1,25% 399 99,75%

33-36 1 0,25% 400 100,00%

1.3.4. Gráfico de barras múltiples

Si Se utiliza para representar la asociación de dos o más variables cualitativas o cuantitativas discretas.
Sirve para mostrar dos o más conjuntos de datos al mismo tiempo y así facilitar la comparación entre ellos.

ESTADO CIVIL PROFESORES ENSEÑANZA BÁSICA PROFESORES ENSEÑANZA MEDIA

Casado 24 22

Sotero 16 17

Viudo 5 8

Separado 13 15

Total 58 62
Tabla 5: Gráfico de barras múltiples. Fuente: elaboración propia.

_Material de profundización
_ Organización y presentación de datos 9

Supongamos que nos piden construir un gráfico para presentar visualmente los resultados obtenidos en la tabla previa.
Entonces deberíamos mostrar un gráfico como el siguiente:

Ciclo según estado civil de los profesores del colegio


30
25
N° de profesores

20
15
10
5
0
Casado Soltero Viudo Separado
Profesores enseñanza básica 24 16 5 13
Profesores enseñanza media 22 17 8 15
Figura 6: Gráfico de barras múltiples. Fuente: elaboración propia.

Por ejemplo, si nos solicitan 3 interpretraciones a partir del gráfico hecho, podríamos señalar lo siguiente:

El estado civil más frecuente entre los profesores del colegio es casado (46), mientras que la minoría de ellos es
viudo (13).
En la enseñanza básica y media hay más profesores solteros que separados.
Más de la mitad de los profesores son casados o solteros (79).

1.3.5. Gráfico de línea

Los gráficos de líneas se recomiendan para representar series de tiempo, donde la variable independiente
es el tiempo.
Se utiliza para comparar valores a lo largo del tiempo, indicándonos las fluctuaciones que tiene la variable.

EVOLUCIÓN DE LA MATRÍCULA POR GÉNERO DE ESTUDIANTES DEL LICEO #145 DURANTE LOS ÚLTIMOS AÑOS

Año Masculino Femenino

2005 322 319

2006 321 319

2007 321 320

2008 320 319

2009 318 321

2010 316 320


Tabla 6: Gráfico de líneas. Fuente: elaboración propia.

_Material de profundización
_ Organización y presentación de datos 10

Supongamos que nos piden construir un gráfico para presentar visualmente los resultados obtenidos en la tabla previa.
Entonces deberíamos mostrar un gráfico como el siguiente:

Matrícula anual por género


324
N° de estudiantes

322
320
318
316
314
312
2005 2006 2007 2008 2009 2010
Masculino 322 321 321 320 318 316
Femenino 319 319 320 319 321 320
Figura 7: Gráfico de línea. Fuente: elaboración propia.

Si igual que antes, nos solicitaran interpretraciones a partir del gráfico hecho, podríamos señalar lo
siguiente:

Los estudiantes varones muestran una tendencia descendente en la matrícula anual, en cambio
en las mujeres no se observa la tendencia en la matricula anual.
A partir del año 2009 y 2010 se matriculan más mujeres que varones.

1.3.6. Gráfico de dispersión

Un diagrama de dispersión es una representación gráfica de un sistema de ejes coordenados X e Y. Cada eje
representa una variable.
El conjunto de todos los puntos se denomina nube de puntos.
El propósito del diagrama de dispersión es mostrar, de manera intuitiva, si existe o no relación entre las
variables.

Altura en Peso en
centímetros kilogramos Relación altura y peso de los individuos
162 61
154 60 100
180 78 80
Peso (kg)

158 62 60
171 66 40
169 60 20
166 54 0
176 84 150 155 160 165 170 175 180 185
163 68 Altura (cm)

Figura 8: Gráfico de dispersión. Fuente: elaboración propia.

_Material de profundización
_ Organización y presentación de datos 11

En la tabla de la izquierda se observan dos variables, altura en centímetros y peso en kilogramos, de un grupo de
individuo, y a la derecha un gráfico de dispersión que muestra los datos de la tabla anterior.

1.3.7. Gráfico de tallos y hojas

Consiste en mantener la decena del dato y clasificar la unidad numérica. Las unidades, por cada decena, son
puestas en orden ascendente.

1* | 69
2* | 23677
3* | 1122235555679
4* | 2455568
5* | 178
Figura 9: Gráfico de tallos y hojas. Fuente: elaboración propia.

1.3.8. Gráfico de cajas y bigotes o box plot

Este gráfico se utiliza para graficar variables cuantitativas. Consta de dos partes: la caja, que representa los
datos entre el percentil 25 y 75, y en cuyo interior se identifica el valor de la mediana y los bigotes: el bigote
inferior indica los valores contenidos entre el valor mínimo de la serie y el percentil 25, mientras el bigote
superior representa los datos contenidos entre el percentil 75 y el valor máximo de la serie de datos.
100
80
60
40
20

X1 X2
X3 X4
X5 X6
Y

Figura 10: Gráfico de cajas y bigotes. Fuente: elaboración propia.

_Material de profundización
_ Organización y presentación de datos 12

Te invitamos a resolver el ejercicio práctico asociado a


este recurso disponible en el aula virtual.

REFERENCIAS BIBLIOGRÁFICAS

Spiegel, M. R. y Stephens, L. J. (2009). Estadística. Recuperado el 14 de octubre de 2020, de:


https://ezproxy.dnb-inacap.cl/login?url=http://search.ebscohost.com/login.aspx?
direct=true&db=cat02940a&AN=inacap.b1048632&lang=es&site=eds-live&scope=site

_Material de profundización

También podría gustarte