Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema #4
ORGANIZACIÓN, PRESENTACIÓN
DE DATOS Y DISTRIBUCIÓN DE
FRECUENCIAS
CONTENIDO:
4.1. Organización de datos recopilados.
4.2. Distribución de frecuencias
4.2.1. Elementos esenciales para la elaboración de tablas de distribución de frecuencias y
cuadros estadísticos
4.3. Distribución de frecuencias con datos no agrupados (variables cualitativas)
4.3.1. Para variables nominales
4.3.2. Para variables ordinales.
4.4. Distribución de frecuencia con datos agrupados (variables cuantitativas)
4.5. Frecuencias y distribuciones acumuladas
4.6. Representación gráfica y tabular. (Tipos de gráficos e interpretación de los datos
presentados en gráficos.
4.7. Empleo erróneo de las técnicas de representación gráfica.
4.8. Gráficos para variables de escala nominal.
4.9. Gráficos para variables de escala ordinal.
4.10. Gráficos para variables de escala por intervalos
4.10.1. Histograma de frecuencias
4.10.2. Polígono de frecuencias
4.11. Distribuciones de frecuencias acumulada y Polígonos de frecuencias acumulada – Gráfico
Ojiva
4.12. Otros tipos de Gráficos Estadísticos
4.12.1. Gráficos Circulares
4.12.2. Gráficos de Barras Verticales
4.12.3. Gráficos de Barras Horizontales.
4.12.4. Gráficos de líneas
4.12.5. Gráficos de áreas
4.12.6. Cartogramas
4.12.7. Pictogramas
4.13. Tipos de curvas de polígonos de frecuencias
2
¿Qué puede hacer el investigador social para organizar los números desordenados que recoge
de sus entrevistados? ¿Cómo se las arregla para transformar esta masa de datos en un
resumen fácil de entender que pueda utilizar para probar su hipótesis inicial? Se debe realizar la
tabulación.
La organización de datos estadísticos consiste en trabajar con los datos recolectados para
convertirlos en conocimiento útil.
La presentación de datos estadísticos constituye en sus diferentes modalidades uno de los
aspectos de más uso en la estadística en educación. Entonces, la organización de datos es una
estructura física – lógica que permite realizar operaciones computacionales (editar, guardar,
actualizar, etc.) sobre un contenido de información.
El registro de estos datos se simplifica por medio de señales elementales como una X y los
totales se muestran al pie de las columnas como se puede apreciar en el siguiente “cuadro de
concentración de datos” de un grupo de personas estudiantes elegidas para un estudio de
investigación sobre estudiantes provenientes del Municipio de Poroma que estudian en la
USFX.
3
Cuadro No. 1
Cuadro de concentración de datos
Sexo Carrera que cursa Situación laboral
Cuestionario Edad
Hombre Mujer Econo. Sociol. Comun. Admi. SI trabaja NO trabaja
1 X 18 X X
2 X 23 X X
3 X 19 X X
4 X 19 X X
5 X 18 X X
6 X 17 X X
7 X 20 X X
8 X 18 X X
9 X 21 X X
10 X 21 X X
11 X 25 X X
12 X 17 X X
13 X 20 X X
14 X 24 X X
15 X 21 X X
16 X 22 X X
17 X 18 X X
18 X 18 X X
19 X 20 X X
20 X 17 X X
Total 12 8 3 5 6 6 4 16
Las distribuciones de frecuencias son tablas en que se dispone las categorías o modalidades
de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor,
proporciones, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la
obtención de la información que contienen los datos.
Las tablas de distribución de frecuencias pueden ser de dos tipos:
- para datos no agrupados
- para datos agrupados
4.2.1. Elementos esenciales para la elaboración de tablas de distribución de
frecuencias y cuadros estadísticos
La construcción de cuadros estadísticos de trabajo o de cuadros de referencia requiere
prácticamente de los mismos elementos en su elaboración, ya que ambos presentan las
mismas características estructurales, por lo que los elementos que a continuación se describen
deberán ser utilizados en la conformación de éstos indistintamente.
1. Número del cuadro. Es el primer elemento de todo cuadro estadístico. Tiene como
objeto permitir una fácil y rápida referencia al mismo.
3. Columnas. Son las subdivisiones verticales de las casillas. Se incluyen tantas columnas
como sean necesarias. Por ejemplo, al clasificar la variable género en un cuadro
estadístico, se tendría una columna para hombres y otra para mujeres.
4. Renglones o filas. Son las divisiones horizontales que corresponden a cada criterio en
que es clasificada una variable.
5
5. Líneas de cabecera. Son las líneas que se trazan para dividir las casillas de cabecera
de los renglones.
6. Cuerpo del cuadro. Está formado por todos los datos sin considerar la cabeza del
cuadro y los renglones de totales.
8. Notas al pie del cuadro. Se usan para calificar o explicar un elemento particular en el
cuadro que presente una característica distinta de clasificación, o también se usa para
incorporar aclaraciones sobre la información del cuadro.
Número de estudiantes
Sexo
(Frecuencia)
Varones 12
Mujeres 8
Total 20
Una rápida mirada a la distribución de frecuencia, en dicha Tabla, revela claramente que del
Municipio de Poroma, son más hombres que mujeres que vienen a estudiar a la USFX.
6
ACTIVIDAD DE APRENDIZAJE Nº 1
Elaborar una tabla de distribución de frecuencias
para cada una de las variables: Edad, Carrera que
cursa y situación laboral, con los datos del Cuadro
de concentración de datos de la página anterior.
Tabla No. 2
Estudiantes de la USFX provenientes del Municipio de Poroma, según carrera que cursa
Número de estudiantes
Carrera que cursa
(Frecuencia)
Economía 3
Sociología 5
Comunicación 6
Administración 6
Total 20
Tabla No. 3
Estudiantes de la USFX provenientes del Municipio de Poroma, según situación laboral
Número de estudiantes
Situación laboral
(Frecuencia)
Si trabaja 4
No trabaja 16
Total 20
Hasta aquí hemos visto ejemplos para realizar la distribución de frecuencias de forma manual
porque los datos de encuesta presentados en el cuadro No. 1 son reducidos y resulta sencillo
realizar la tabulación manual.
Sin embargo, cuando se trata de encuestas con muchas variables y que ha sido aplicada a una
cantidad grande de personas, resulta más sencillo realizar la tabulación y la distribución de
frecuencias utilizando una herramienta informática sencilla, en este caso veremos el Excel.
ACTIVIDAD DE APRENDIZAJE Nº 2
Para realizar la Distribución de frecuencias con
datos no agrupados, utilizaremos dos funciones de
Excel para contar datos: Función “Contar si” y
Función “Ordenar y Filtrar”.
.
PRIMERA OPCIÓN:
Teniendo la tabla de frecuencias dibujada.
Paso 1: Seleccionar marcando de forma sostenida con un clic izquierdo las columnas con datos que
queremos contar:
Paso 2: Clic en “ordenar y filtrar”.
Paso 3: Clic en “Filtro”.
Paso 4: Clic en el botón que aparece en la columna de la variable que queremos contar. Marcamos o
desmarcamos lo que deseamos que se muestre y colocamos “aceptar”.
Paso 5: Para saber cuántos son, remarcamos toda la columna con clic izquierdo sostenido; y en la
parte inferior derecha nos da un número/Recuento de cuántos son. Y así sabemos cuántos hay por
cada categoría que deseamos contar.
PARA REPASAR Y REFORZAR ESTE PROCEDIMIENTO, AQUÍ HAY UN VIDEO DISPONIBLE https://youtu.be/mEexSavDSqo
SEGUNDA OPCIÓN:
Segunda Opción:
Teniendo la tabla de frecuencias dibujada.
Paso 1: Dentro de la celda de distribución de frecuencias escribir: =contar
Paso 2: Elegir con doble clic “contar si”
Paso 3: marcar con un clic sostenido izquierdo la columna entera de datos que nos interesa contar (a
eso se llama rango).
Paso 4: Luego colocamos: ; (punto y coma) y elegimos con un clic el dato que nos interesa contar, en
este caso: hacemos clic en “masculino”.
Paso 5: Congelar la fórmula colocando signo de pesos/dólar $ (presionando las teclas shift y 4) antes y
después de las letras de la fórmula).
Paso 6: Cerrar paréntesis y ENTER.
Para Sumar en Excel:
Opción 1: =suma (seleccionar el rango), cerrar paréntesis y ENTER.
Opción 2: seleccionar los datos que se quieren sumar y hacer clic en el botón “Autosuma” (que parece
una Z doblada) en la parte superior derecha.
PARA REPASAR Y REFORZAR ESTE PROCEDIMIENTO, AQUÍ HAY UN VIDEO DISPONIBLE https://youtu.be/OigwRWWqvE4
8
Cuando existen muchos datos, la dificultad de resumirlos, puede ser superada agrupando los
diversos valores en un número reducido de clases llamados intervalos de clase. Esta
situación generalmente se presenta cuando se trata de datos cuantitativos, pues los posibles
valores que puede tomar una variable son muchos y se hace necesario agruparlos. A
continuación, aprenderemos a construir este tipo de tabla.
Cada una de las clases tiene un extremo o límite superior y uno inferior; el extremo inferior es
el menor valor que puede caer en esta clase y el superior el mayor valor.
Tabla No. 4
Edad de los trabajadores de la empresa «XYZ» gestión 2020
Sin embargo, es posible dar ciertas guías generales que pueden ser de utilidad en la
determinación del número de clases. En primer lugar, el número de clases no debe ser ni
muy grande ni muy pequeño; un número pequeño de clases puede ocultar la naturaleza
general de los datos y uno muy grande puede ser demasiado detallado como para relevar
alguna información útil. Como regla general, se recomienda que el número de clases esté
entre 5 y 12.
La llamada regla de Sturges puede dar una aproximación razonable para el número de
clases, siendo esta:
9
K = 1 + 3.322 Log N
Una vez determinado el número de clases, debe decidirse la amplitud de estas. Tomando la
misma amplitud para todas las clases, este valor queda dado por: A = amplitud.
A = dato mayor – dato menor
K
Una vez obtenida la amplitud de las clases se procede a calcular los intervalos y a realizar el
conteo de valores para determinar la frecuencia de cada uno.
Ejemplo:
27 23 22 38 43 24 35 26 28 20 18
25 23 22 63 31 30 41 45 29 43 27
29 28 27 25 29 28 24 37 28 18 29
26 33 25 27 25 34 32 36 22 33 32
21 23 24 18 48 23 18 38 26 23 21
Solución:
Paso 1: Ordenar los datos
Para una mayor facilidad se recomienda ordenar los datos de menor a mayor.
18 21 23 24 25 27 28 29 32 36 43
18 21 23 24 25 27 28 29 33 37 43
18 22 23 24 26 27 28 30 33 38 45
18 22 23 25 26 27 29 31 34 38 48
20 22 23 25 26 28 29 32 35 41 58
Los intervalos son una medida estadística dentro de la cual se agrupa una cantidad exacta de
datos. Es el número de filas/casillas que va a tener la tabla.
K = 1 + 3.322* Log(55)
K = 6.781
De acuerdo a la regla de Sturges, deberíamos tener 6 ó 7 intervalo de clases. Para efectos
de cálculos el valor de K se aproxima el entero más próximo. K = 7
A = 40 = 5.7 A=6
7
En este caso es necesario redondear pues la amplitud debe aproximarse al entero más
cercano.
Una vez determinado el número de clases y la amplitud, debe elegirse el extremo inferior de la
primera clase. Dado que aquí el valor mínimo es 18, el extremo inferior puede ser 18 o menos;
por consiguiente, tomaremos como criterio usar el número 18.
Paso 7: Identificar el límite superior y el límite inferior de la segunda clase (segunda fila)
Establecido el extremo inferior, se sumará la amplitud a éste para obtener el valor del límite
superior en cada una de las clases.
Para obtener el límite inferior de la segunda clase, se le suma 1 al límite superior de la primera
clase. Se tiene que tomar en cuenta que en la última clase esté contenido el dato mayor.
Una vez construidos los diversos intervalos de clase, se cuenta el número de elementos que
cae en cada uno, obteniéndose así las respectivas frecuencias.
11
Tabla Nro. 5
Edad de los estudiantes provenientes del Municipio de Poroma
Intervalo de clase f
18 - 24 18
25 - 31 21
32 - 38 10
39 - 45 4
46 - 52 1
53 - 59 1
Total 55
Para repasar este procedimiento con otros ejemplos de forma manual, haga clic en los
siguientes links y encontrarán un video tutorial en cada uno para recordar y reforzar lo
aprendido en la clase:
ACTIVIDAD DE APRENDIZAJE Nº 3
En el siguiente link encontrarán un video sobre este
procedimiento: https://youtu.be/YIAWyP5rsSw
Paso 5: Desplazar la fórmula hacia abajo presionando con clic izquierdo en la parte inferior
derecha de la celda, justo cuando aparezca una cruz negrita.
Frecuencia Relativa (fr).- Indica la proporción con que se repite un valor. Es el cociente entre
la frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas es
siempre 1. Se calcula así:
𝒇
𝒇𝒓 =
𝒏
14
f% = fr *100
Frecuencia absoluta Acumulada (fa).- Indica el número de valores que son menores o iguales
que el valor dado. Es la suma de la primera frecuencia absoluta con la segunda, este valor con
la tercera, y así sucesivamente.
Frecuencia Relativa Acumulada Porcentual (fra%).- Indica el número de valores que son
menores o iguales que el valor dado. Se obtiene multiplicando la frecuencia relativa acumulada
por 100. Se calcula así:
Tabla 6
Distribución de frecuencia agrupada de calificaciones
de exámenes finales para 71 estudiantes
Nº de
Frecuencia Frecuencia
Calificaciones estudiantes Frecuencia
relativa absoluta
(Intervalo de Frecuencia relativa
porcentual acumulada
clase) Absoluta
(f) fr fr% fa
50 – 54 4 0,06 6 4
55 – 59 5 0,07 7 9
60 – 64 5 0,07 7 14
65 – 69 12 0,17 17 26
70 – 74 17 0,24 24 43
75 – 79 12 0,17 17 55
80 – 84 7 0,10 10 62
85 – 89 4 0,06 6 66
90 – 94 2 0,03 3 68
95 – 99 3 0,04 4 71
71 1 100
15
ACTIVIDAD DE APRENDIZAJE Nº 4
1. Se realiza una encuesta a un conjunto de 16
familias sobre el número de hijos. Los resultados
en el orden obtenido son:
x1= 2, x2= 1, x3= 3, x4= 3 , x5= 1 ,x6= 1 , x7= 3, x8= 0 ,
x9= 2 , x10= 1 , x11= 2 , x12= 3 , x13= 4 , x14= 1 , x15= 1,
x16= 2.
.
a. De acuerdo a estos datos cuántas filas debería tener esta tabla.
b. Construya una tabla de distribución de frecuencias absolutas para esos datos.
a. Construir la columna de distribución de frecuencias relativas.
b. Construir la columna de distribución de frecuencias relativa porcentual.
c. Construir la columna de distribución de frecuencias absolutas acumuladas.
Para contestar estas preguntas, primero se deberá:
- Identificar el número de observaciones diferentes, en otras palabras, qué valores diferentes
toma la variable Nº de hijos (¿Cuántos valores hay?)
- Contar para cada valor diferente de la variable Nº de hijos, cuantas veces se repite ese
valor, en otras palabras, calcular la frecuencia.
- Construir las tablas de frecuencias.
Solución:
Tabla N° 7
Distribución de frecuencias sobre número de hijos de 16 familias
Para repasar y reforzar lo aprendido hacer clic en los siguientes enlaces, donde encontrarán
videos tutoriales para este aspecto del contenido.
- Ejemplo de Frecuencia Acumulada: https://youtu.be/X1uqaHX6BKI
- Ejemplo de Tabla de Frecuencias: https://youtu.be/xq6tBKbg3HQ
- Ejemplo de Tabla de Frecuencias: https://youtu.be/SBI6GlAwL60
- Ejemplo de Tabla de Frecuencias agrupada en intérvalos: https://youtu.be/CuKr7GzohbI
16
ACTIVIDAD DE APRENDIZAJE Nº 5
Un sociólogo visita 25 comunidades campesinas en el Municipio
de San Lucas y en cada una anotó el número de familias que
están interesadas en participar del Proyecto de lavanderías
familiares, de lo cual resultaron los datos siguientes:
15, 25, 20, 15 ,18, 16, 17, 18, 20, 18, 18, 18, 19, 16, 17, 19, 16,
17, 17, 17, 19, 18, 19, 18, 15..
Solución:
Tabla N° 8
Distribución de frecuencias del número de familias interesadas en
participar en el Proyecto de lavanderías familiares
Las diferencias pueden exagerarse aún más utilizando el artificio que Darrell Hulf e Irving Geis
llaman diagrama Gee Whiz. Este consiste en eliminar la frecuencia cero en el eje vertical y
empezar con una frecuencia superior a cero.
18
Los gráficos 2 y 3 tomados del libro How to Lie with Statistics ilustra muy claramente la forma en
que éstos pueden emplearse con un propósito engañoso.
Gráfico Nº 2
Tabla Nº 9
Millones
1937 de $us
JUN. 19,5
JUL. 19,45
AGO. 19,35
SEP. 19,55
OCT. 19,2
NOV. 19,55
DIC. 20,3
Gráfico Nº 3
1. No se presupone ningún orden adjudicable a las variables de escala nominal. Así las
diversas categorías pueden quedar representadas a lo largo del eje de las abscisas en
cualquier orden que se elija. Los autores prefieren ordenar las categorías
alfabéticamente, para ser consecuentes con su deseo de eliminar cualquier posibilidad
de que tendencias personales intervengan en la decisión.
2. Las barras deben ir separadas y no en contacto, para evitar cualquier implicación de
continuidad entre las categorías.
4.9. Gráficos para variables de escala ordinal.
En las variables de escala ordinal, las categorías en el eje de las abscisas deben ser
colocadas respetando su orden de ocurrencia natural. En el gráfico 6, se ilustra el uso del
diagrama de barras en el caso de una variable de escala ordinal.
Frecuencias, f
35
60-69 21 30
25
70-79 43 20
15
80-89 32 10
5
0
90-99 9 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99
Total 120 Intervalo de clases,
rendimientos
Gráfico Nº 7: Histograma de frecuencias
de los rendimientos de 120 estudiantes
Entonces, se la obtiene sumando el límite inferior con el superior de cada clase y dividiéndolo
entre dos, como se muestra a continuación:
Rendimientos N° de estudiantes
Intervalos de clases f Marca de clase f%
50 - 59 15 54.5 12
60 – 69 21 64.5 17
70 - 79 43 74.5 36
80 - 89 32 84.5 27
90 - 99 9 94.5 8
100
45
40 40
Frecuencias, f
35
30 30
25 20
20
15 10
10
5 0
0 0 54,5 64,5 74,5 84,5 94,5 104,5
50 - 59 60 - 69 70 - 79 80 - 89 90 - 99
Marca de clase, rendimientos
Intervalo de clases,
rendimientos
Gráfico Nº 10
23
La suma de las frecuencias relativas de todas las clases, da como resultado 100. En el
siguiente gráfico se muestra la distribución de frecuencias relativas del ejemplo anterior.
40
35
30
fr %
25
20
15
10
5
0
0 54,5 64,5 74,5 84,5 94,5 104,5
Marca de clase
Gráfico Nº 11
Polígono de frecuencias relativas porcentuales de los rendimientos de 120 estudiantes
Aquí, agregamos una especificación a la columna de intervalo de clase: las Fronteras de clase;
que son los límites exactos o puntos específicos de la escala, que sirven para "separar
24
las clases”. Se pueden determinar identificando los puntos que están en la mitad entre los
límites superior e inferior de las clases adyacentes.
de 120 estudiantes.
En ese sentido, como se puede observar en el gráfico, la ojiva es un gráfico que se construye
para una frecuencia acumulada o una frecuencia acumulada relativa.
La ojiva es un polígono abierto en el extremo superior, que se obtiene al unir por segmentos de
recta, los puntos; situados a una altura igual a la frecuencia acumulada o la frecuencia
acumulada relativa de cada clase (eje Y) con los límites reales superiores de éstas (eje X). Para
llevar a cabo su construcción se requiere crear un primer intervalo ficticio (o falso) con
frecuencia acumulada cero. Este gráfico nos permite analizar cuántas observaciones están por
debajo de un determinado valor.
Existen varios tipos de gráficos que pueden utilizarse para la representación de los datos que
se organizan en una distribución de frecuencias, entre los más usuales están los gráficos
circulares (torta, quesitos), barras, etc.
Gráfico Nº 14 Actitudes hacia la guerra Gráfico Nº 15
Educación Sexual
No resp. Si
21% recibieron
50%
No
recibieron
29%
26
Al utilizar los procesadores que nos brinda el Microsoft Office de Windows, ya sea M. Excel,
Word, Power Point encontraremos varias opciones de Gráficos circulares, de los cuales
podemos elegir el que más convenga.
4.12.2. Gráficos de Barras Verticales
Representan valores usando trazos verticales, aislados o no uso de otros, según la variable a
graficar sea discreta o continua. Pueden usarse para representar una seria y dos o más series
(también llamado de Barras Comparativas) puesto que se usan para comparar dos o más
variables.
4.12.3. Gráficos de Barras Horizontales.
Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se
utilizan cuando los textos correspondientes a categoría son muy extensos.
Se pueden diseñar para una serie o para dos o más series. También llamada de Barras
comparativas ya que se usan para comparar dos o más variables.
Cuando lo que se busaca es resaltar la representación de los porcentajes de los datos que
componen un total, los Gráficos de Barras Verticales u Horizontales, también pueden ser
diseñados en Barras Proporcionales.
Gráfico Nº 17 Gráfico Nº 18
Gráfico Nº 19
4.12.6. Cartogramas
Gráfico Nº 20
28
4.12.7. Pictogramas
Los Pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en
una determinada escala para expresar la unidad de medida de los datos. Generalmente este
dibujo debe cortarse para representar los datos.
Gráfico Nº 21
Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes
escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen
un pictograma.
4.13. Tipos de curvas de polígonos de frecuencias
Una curva de frecuencias, es un polígono suavizado y se grafica igual como se hace para el
polígono de frecuencias.
Las curvas de frecuencia presentan determinadas formas con características que les distinguen
como se indica en la figura siguiente.
Las curvas de frecuencia simétricas o bien formadas se caracterizan por el hecho de que
las observaciones que equidistan del máximo central tienen la misma frecuencia. Un
ejemplo importante es la curva normal.
En las curvas de frecuencias moderadamente asimétricas o sesgadas la cola de la curva
a un lado máximo central es mayor que al otro lado. Si la cola mayor se presenta a la
derecha de la curva se dice que esta está sesgada la derecha o que tiene sesgo
positivo, mientras que si ocurre lo contrario se dice que la curva está sesgada a la
izquierda o que tiene un sesgo negativo.
En las curvas en forma de J o de J invertida, el máximo se presenta en un extremo.
Las curvas de frecuencias en forma de U tienen el máximo en ambos extremos.
Una curva de frecuencia bimodal tiene dos máximos.
Una curva de frecuencias multimodal tiene más de dos máximos.
29
Bimodal Multimodal