Está en la página 1de 29

1

Tema #4
ORGANIZACIÓN, PRESENTACIÓN
DE DATOS Y DISTRIBUCIÓN DE
FRECUENCIAS

CONTENIDO:
4.1. Organización de datos recopilados.
4.2. Distribución de frecuencias
4.2.1. Elementos esenciales para la elaboración de tablas de distribución de frecuencias y
cuadros estadísticos
4.3. Distribución de frecuencias con datos no agrupados (variables cualitativas)
4.3.1. Para variables nominales
4.3.2. Para variables ordinales.
4.4. Distribución de frecuencia con datos agrupados (variables cuantitativas)
4.5. Frecuencias y distribuciones acumuladas
4.6. Representación gráfica y tabular. (Tipos de gráficos e interpretación de los datos
presentados en gráficos.
4.7. Empleo erróneo de las técnicas de representación gráfica.
4.8. Gráficos para variables de escala nominal.
4.9. Gráficos para variables de escala ordinal.
4.10. Gráficos para variables de escala por intervalos
4.10.1. Histograma de frecuencias
4.10.2. Polígono de frecuencias
4.11. Distribuciones de frecuencias acumulada y Polígonos de frecuencias acumulada – Gráfico
Ojiva
4.12. Otros tipos de Gráficos Estadísticos
4.12.1. Gráficos Circulares
4.12.2. Gráficos de Barras Verticales
4.12.3. Gráficos de Barras Horizontales.
4.12.4. Gráficos de líneas
4.12.5. Gráficos de áreas
4.12.6. Cartogramas
4.12.7. Pictogramas
4.13. Tipos de curvas de polígonos de frecuencias
2

4.1. Organización de datos recopilados.

¿Qué puede hacer el investigador social para organizar los números desordenados que recoge
de sus entrevistados? ¿Cómo se las arregla para transformar esta masa de datos en un
resumen fácil de entender que pueda utilizar para probar su hipótesis inicial? Se debe realizar la
tabulación.
La organización de datos estadísticos consiste en trabajar con los datos recolectados para
convertirlos en conocimiento útil.
La presentación de datos estadísticos constituye en sus diferentes modalidades uno de los
aspectos de más uso en la estadística en educación. Entonces, la organización de datos es una
estructura física – lógica que permite realizar operaciones computacionales (editar, guardar,
actualizar, etc.) sobre un contenido de información.

Tabulación manual. Consiste en hacer el recuento de datos mediante el uso exclusivo de


papel y lápiz. Puede efectuarse mediante el traslado de los datos a hojas o cuadros de
concentración que permiten tener a la vista los datos que se encuentran dispersos en los
cuestionarios o tarjetas del investigador; con ellas es más simple realizar su conteo.

El registro de estos datos se simplifica por medio de señales elementales como una X y los
totales se muestran al pie de las columnas como se puede apreciar en el siguiente “cuadro de
concentración de datos” de un grupo de personas estudiantes elegidas para un estudio de
investigación sobre estudiantes provenientes del Municipio de Poroma que estudian en la
USFX.
3

Cuadro No. 1
Cuadro de concentración de datos
Sexo Carrera que cursa Situación laboral
Cuestionario Edad
Hombre Mujer Econo. Sociol. Comun. Admi. SI trabaja NO trabaja
1 X 18 X X
2 X 23 X X
3 X 19 X X
4 X 19 X X
5 X 18 X X
6 X 17 X X
7 X 20 X X
8 X 18 X X
9 X 21 X X
10 X 21 X X
11 X 25 X X
12 X 17 X X
13 X 20 X X
14 X 24 X X
15 X 21 X X
16 X 22 X X
17 X 18 X X
18 X 18 X X
19 X 20 X X
20 X 17 X X
Total 12 8 3 5 6 6 4 16

La tabulación manual es recomendable cuando el número de cuestionarios o datos


recolectados no es muy grande y las categorías o clases especificadas sean poco numerosas.
En estas condiciones, la tabulación manual suele ser más ventajosa que la tabulación de
procesamiento electrónico.

Tabulación electrónica de datos. Es recomendado en aquellas investigaciones que requieren


de operaciones a gran escala, que son complicadas y con alto grado de repetición. Este
sistema es preferido al manual por la gran velocidad y eficiencia con la que la computadora
procesa los datos; sin embargo, a pesar de estas ventajas, se requiere de una cantidad
relativamente grande de trabajo preliminar en la elaboración del programa de computadora, así
como en la captura de los datos para su proceso.
4

En la actualidad, el investigador cuenta con una gran variedad de programas de computadora


(paquetes) que le permiten procesar los datos eficientemente, entre algunos de ellos se tiene el
SPSS (Statistical Package for Social Science).

El resultado del proceso de tabulación o condensación de datos se presenta en lo que en


estadística se llaman cuadros estadísticos o tablas de distribución de frecuencias, que
estudiaremos a continuación.

4.2. Distribución de frecuencias

Las distribuciones de frecuencias son tablas en que se dispone las categorías o modalidades
de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor,
proporciones, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la
obtención de la información que contienen los datos.
Las tablas de distribución de frecuencias pueden ser de dos tipos:
- para datos no agrupados
- para datos agrupados
4.2.1. Elementos esenciales para la elaboración de tablas de distribución de
frecuencias y cuadros estadísticos
La construcción de cuadros estadísticos de trabajo o de cuadros de referencia requiere
prácticamente de los mismos elementos en su elaboración, ya que ambos presentan las
mismas características estructurales, por lo que los elementos que a continuación se describen
deberán ser utilizados en la conformación de éstos indistintamente.

1. Número del cuadro. Es el primer elemento de todo cuadro estadístico. Tiene como
objeto permitir una fácil y rápida referencia al mismo.

2. Título. Es el segundo elemento del cuadro estadístico. En él se deberá indicar el


contenido del cuadro, su circunscripción espacial, el periodo o espacio temporal y las
unidades en las que están expresados los datos.

3. Columnas. Son las subdivisiones verticales de las casillas. Se incluyen tantas columnas
como sean necesarias. Por ejemplo, al clasificar la variable género en un cuadro
estadístico, se tendría una columna para hombres y otra para mujeres.

4. Renglones o filas. Son las divisiones horizontales que corresponden a cada criterio en
que es clasificada una variable.
5

5. Líneas de cabecera. Son las líneas que se trazan para dividir las casillas de cabecera
de los renglones.

6. Cuerpo del cuadro. Está formado por todos los datos sin considerar la cabeza del
cuadro y los renglones de totales.

7. Renglón de totales. Es un elemento opcional en los cuadros estadísticos. Se agrega el


renglón de totales sólo en aquellos cuadros donde es posible sumar el contenido de las
columnas. Esta característica del cuadro también es válida para las filas, es decir, es
posible tener columna de totales.

8. Notas al pie del cuadro. Se usan para calificar o explicar un elemento particular en el
cuadro que presente una característica distinta de clasificación, o también se usa para
incorporar aclaraciones sobre la información del cuadro.

9. Fuente. Tiene por objeto indicar el origen de los datos.

4.3. Distribución de frecuencias con datos no agrupados (variables cualitativas)


4.3.1. Para variables nominales
La siguiente tabla de frecuencias resume los datos obtenidos para la variable sexo del
Cuadro de concentración de datos, presentado en la página anterior.
Tabla No. 1
Estudiantes de la USFX provenientes del Municipio de Poroma, según sexo.

Número de estudiantes
Sexo
(Frecuencia)
Varones 12
Mujeres 8
Total 20

La distribución de frecuencia consiste de dos columnas. Así, en la Tabla Nro. 1, la columna de


la izquierda indica qué variable está siendo presentada (sexo del estudiante) y contiene las
categorías de análisis (masculino y femenino). La columna de la derecha que se refiere a
Frecuencia (f) indica el número de casos u observaciones en cada categoría (12 y 8
respectivamente), así como el número total de observaciones, que en este caso es 20.

Una rápida mirada a la distribución de frecuencia, en dicha Tabla, revela claramente que del
Municipio de Poroma, son más hombres que mujeres que vienen a estudiar a la USFX.
6

ACTIVIDAD DE APRENDIZAJE Nº 1
Elaborar una tabla de distribución de frecuencias
para cada una de las variables: Edad, Carrera que
cursa y situación laboral, con los datos del Cuadro
de concentración de datos de la página anterior.

Tabla No. 2
Estudiantes de la USFX provenientes del Municipio de Poroma, según carrera que cursa

Número de estudiantes
Carrera que cursa
(Frecuencia)
Economía 3
Sociología 5
Comunicación 6
Administración 6
Total 20

Tabla No. 3
Estudiantes de la USFX provenientes del Municipio de Poroma, según situación laboral

Número de estudiantes
Situación laboral
(Frecuencia)
Si trabaja 4
No trabaja 16
Total 20

4.3.2. Para variables ordinales.


También podemos construir tablas de distribución de frecuencias para datos de variables
ordinales. En este caso, tendremos cuidado de colocar el listado de las categorías de análisis,
respetando el orden asignado.
Tabla No. 4
Nivel de preocupación ante emergencia Sanitaria por Covid19
Nivel de preocupación f Nivel de preocupación f
Preocupado 5 Muy preocupado 8
Muy Preocupado 8 Preocupado 5
Poco preocupado 2 Indiferente 3
Indiferente 3 Poco Preocupado 2
Nada preocupado 2 Nada Preocupado 2
Total Total 20
Incorrecta Correcta
7

Hasta aquí hemos visto ejemplos para realizar la distribución de frecuencias de forma manual
porque los datos de encuesta presentados en el cuadro No. 1 son reducidos y resulta sencillo
realizar la tabulación manual.
Sin embargo, cuando se trata de encuestas con muchas variables y que ha sido aplicada a una
cantidad grande de personas, resulta más sencillo realizar la tabulación y la distribución de
frecuencias utilizando una herramienta informática sencilla, en este caso veremos el Excel.

ACTIVIDAD DE APRENDIZAJE Nº 2
Para realizar la Distribución de frecuencias con
datos no agrupados, utilizaremos dos funciones de
Excel para contar datos: Función “Contar si” y
Función “Ordenar y Filtrar”.
.
PRIMERA OPCIÓN:
Teniendo la tabla de frecuencias dibujada.
Paso 1: Seleccionar marcando de forma sostenida con un clic izquierdo las columnas con datos que
queremos contar:
Paso 2: Clic en “ordenar y filtrar”.
Paso 3: Clic en “Filtro”.
Paso 4: Clic en el botón que aparece en la columna de la variable que queremos contar. Marcamos o
desmarcamos lo que deseamos que se muestre y colocamos “aceptar”.
Paso 5: Para saber cuántos son, remarcamos toda la columna con clic izquierdo sostenido; y en la
parte inferior derecha nos da un número/Recuento de cuántos son. Y así sabemos cuántos hay por
cada categoría que deseamos contar.
PARA REPASAR Y REFORZAR ESTE PROCEDIMIENTO, AQUÍ HAY UN VIDEO DISPONIBLE https://youtu.be/mEexSavDSqo

SEGUNDA OPCIÓN:
Segunda Opción:
Teniendo la tabla de frecuencias dibujada.
Paso 1: Dentro de la celda de distribución de frecuencias escribir: =contar
Paso 2: Elegir con doble clic “contar si”
Paso 3: marcar con un clic sostenido izquierdo la columna entera de datos que nos interesa contar (a
eso se llama rango).
Paso 4: Luego colocamos: ; (punto y coma) y elegimos con un clic el dato que nos interesa contar, en
este caso: hacemos clic en “masculino”.
Paso 5: Congelar la fórmula colocando signo de pesos/dólar $ (presionando las teclas shift y 4) antes y
después de las letras de la fórmula).
Paso 6: Cerrar paréntesis y ENTER.
Para Sumar en Excel:
Opción 1: =suma (seleccionar el rango), cerrar paréntesis y ENTER.
Opción 2: seleccionar los datos que se quieren sumar y hacer clic en el botón “Autosuma” (que parece
una Z doblada) en la parte superior derecha.
PARA REPASAR Y REFORZAR ESTE PROCEDIMIENTO, AQUÍ HAY UN VIDEO DISPONIBLE https://youtu.be/OigwRWWqvE4
8

4.4. Distribución de frecuencia con datos agrupados (variables cuantitativas)

Cuando existen muchos datos, la dificultad de resumirlos, puede ser superada agrupando los
diversos valores en un número reducido de clases llamados intervalos de clase. Esta
situación generalmente se presenta cuando se trata de datos cuantitativos, pues los posibles
valores que puede tomar una variable son muchos y se hace necesario agruparlos. A
continuación, aprenderemos a construir este tipo de tabla.

Cada una de las clases tiene un extremo o límite superior y uno inferior; el extremo inferior es
el menor valor que puede caer en esta clase y el superior el mayor valor.

Tabla No. 4
Edad de los trabajadores de la empresa «XYZ» gestión 2020

Intervalo de clase Frecuencia


18 - 23 15
24 - 29 22
30 - 35 8
36 - 41 5
42 - 47 3
48 - 53 1
54 - 59 1
55

4.4.1. Construcción de una distribución de frecuencias para datos cuantitativos


Al construir una distribución de frecuencias para datos cuantitativos es necesario
primeramente decidir cuál va a ser el número de clases. En general, este número depende
fundamentalmente de la naturaleza de los datos a resumir y del objetivo que se persiga con
ese resumen.

Sin embargo, es posible dar ciertas guías generales que pueden ser de utilidad en la
determinación del número de clases. En primer lugar, el número de clases no debe ser ni
muy grande ni muy pequeño; un número pequeño de clases puede ocultar la naturaleza
general de los datos y uno muy grande puede ser demasiado detallado como para relevar
alguna información útil. Como regla general, se recomienda que el número de clases esté
entre 5 y 12.

La llamada regla de Sturges puede dar una aproximación razonable para el número de
clases, siendo esta:
9

K = 1 + 3.322 Log N

Donde K, es el número de intervalos de clase.

Una vez determinado el número de clases, debe decidirse la amplitud de estas. Tomando la
misma amplitud para todas las clases, este valor queda dado por: A = amplitud.
A = dato mayor – dato menor
K
Una vez obtenida la amplitud de las clases se procede a calcular los intervalos y a realizar el
conteo de valores para determinar la frecuencia de cada uno.

Ejemplo:

Las edades de los 55 estudiantes del primer curso de la Carrera de


Sociología, fueron obtenidas a través de una encuesta. Construir una
distribución de frecuencias para las edades de los 55 estudiantes A
continuación se presentan estos datos.

27 23 22 38 43 24 35 26 28 20 18
25 23 22 63 31 30 41 45 29 43 27
29 28 27 25 29 28 24 37 28 18 29
26 33 25 27 25 34 32 36 22 33 32
21 23 24 18 48 23 18 38 26 23 21

Solución:
Paso 1: Ordenar los datos

Para una mayor facilidad se recomienda ordenar los datos de menor a mayor.

18 21 23 24 25 27 28 29 32 36 43
18 21 23 24 25 27 28 29 33 37 43
18 22 23 24 26 27 28 30 33 38 45
18 22 23 25 26 27 29 31 34 38 48
20 22 23 25 26 28 29 32 35 41 58

Paso 2: Identificar el Valor Máximo y el Valor Mínimo.


Valor Máximo= 18
Valor Mínimo= 58
10

Paso 3: Obtener el Rango (R)


Es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos de una muestra
R= Valor máximo –valor mínimo
58 – 18= 40 R=40

Paso 4: Calcular el número de intervalos

Los intervalos son una medida estadística dentro de la cual se agrupa una cantidad exacta de
datos. Es el número de filas/casillas que va a tener la tabla.

K = 1 + 3.322* Log(55)
K = 6.781
De acuerdo a la regla de Sturges, deberíamos tener 6 ó 7 intervalo de clases. Para efectos
de cálculos el valor de K se aproxima el entero más próximo. K = 7

Paso 5: Calcular la amplitud.

Para esto dividimos el rango entre el número de intervalos.

A = 40 = 5.7 A=6
7
En este caso es necesario redondear pues la amplitud debe aproximarse al entero más
cercano.

Paso 6: Identificar el límite inferior

Una vez determinado el número de clases y la amplitud, debe elegirse el extremo inferior de la
primera clase. Dado que aquí el valor mínimo es 18, el extremo inferior puede ser 18 o menos;
por consiguiente, tomaremos como criterio usar el número 18.

Paso 7: Identificar el límite superior y el límite inferior de la segunda clase (segunda fila)

Establecido el extremo inferior, se sumará la amplitud a éste para obtener el valor del límite
superior en cada una de las clases.

Para obtener el límite inferior de la segunda clase, se le suma 1 al límite superior de la primera
clase. Se tiene que tomar en cuenta que en la última clase esté contenido el dato mayor.

Paso 8: Realizar la Distribución de Frecuencias

Una vez construidos los diversos intervalos de clase, se cuenta el número de elementos que
cae en cada uno, obteniéndose así las respectivas frecuencias.
11

Tabla Nro. 5
Edad de los estudiantes provenientes del Municipio de Poroma
Intervalo de clase f
18 - 24 18
25 - 31 21
32 - 38 10
39 - 45 4
46 - 52 1
53 - 59 1
Total 55

Para repasar este procedimiento con otros ejemplos de forma manual, haga clic en los
siguientes links y encontrarán un video tutorial en cada uno para recordar y reforzar lo
aprendido en la clase:

- Tabla de Frecuencia simple: Ejemplo: https://youtu.be/cyXenZEbGz4

- Tabla de frecuencias agrupada en intervalos https://youtu.be/CuKr7GzohbI

ACTIVIDAD DE APRENDIZAJE Nº 3
En el siguiente link encontrarán un video sobre este
procedimiento: https://youtu.be/YIAWyP5rsSw

Para realizar este procedimiento utilizando el Excel, se


siguen los siguientes pasos:

1. Identificar el número de datos; para ello:


Paso 1: escribir =contar
Paso 2: elegir contar con doble clic
Paso 3: seleccionar la columna de datos y cerrar paréntesis
Paso 4: ENTER
2. Identificar el Valor Máximo = Xmax
Paso 1: escribir =max
Paso 2: seleccionar con doble clic MAX
Paso 3: seleccionar toda la columna de datos y cerrar paréntesis
Paso 4: ENTER
3. Identificar el Valor Mínimo = Xmin
12

Paso 1: escribir =min


Paso 2: seleccionar con doble clic MIN
Paso 3: seleccionar toda la columna de datos y cerrar paréntesis
Paso 4: ENTER
4. Hallar el Rango (R) haciendo una resta
R= Valor máximo – Valor mínimo
5. Hallar el número de intervalos (k)
Paso 1: escribir en la celda =1+3,322log
Paso 2: seleccionar LOG10
Paso 3: seleccionar el número de datos con un clic
Paso 4: cerrar paréntesis
Paso 5: ENTER
Paso 6: Redondear al entero más próximo si es necesario.
6. Hallar la Amplitud haciendo una división
A= Rango/número de intervalos
Para comenzar a llenar los datos en la tabla de distribución de frecuencia se debe identificar los
límites:
7. Identificar el Límite Inferior de la primera clase
Para ello hacer clic en la celda donde se anotó el valor mínimo.
8. Identificar el Límite Superior
Paso 1: al límite inferior le sumamos la amplitud. Para ello realizamos una operación de suma.
Paso 2: Congelar la amplitud usando el símbolo de pesos/dólar.
Paso 3: ENTER
Paso 4: Desplazar la fórmula hacia abajo presionando con clic izquierdo en la parte inferior
derecha de la celda, justo cuando aparezca una cruz negrita.
Y así ya se tiene el límite superior para todas las celdas del intervalo de clases.
9. Identificar el Límite Inferior de la segunda clase
Paso 1: Colocar el signo = en la celda.
Paso 2: Marcar el límite superior de la primera clase con un clic.
Paso 3: Sumar una unidad (+1)
Paso 4: ENTER
13

Paso 5: Desplazar la fórmula hacia abajo presionando con clic izquierdo en la parte inferior
derecha de la celda, justo cuando aparezca una cruz negrita.

10. Realizar la Distribución de Frecuencias


Para ello se utilizará la función FRECUENCIA de Excel.
Paso 1: Escribir =frecuencia.
Paso 2: Con doble clic seleccionar FRENCUENCIA.
Paso 3: Seleccionar todos los datos de la columna.
Paso 4: Colocar punto y coma ;
Paso 5: Seleccionar las celdas de límites superiores.
Paso 6: Cerrar paréntesis.
Paso 7: ENTER
Nota.- En este caso, la fórmula no se puede desplazar hacia abajo, para obtener las demás
frecuencias, porque no funciona. Entonces se aplica el siguiente procedimiento para obtener todas
las frecuencias absolutas del resto de clases o intervalos. Para ello se debe tener en cuenta que, ésta
fórmula arroja como resultado una matriz (base) que ayudará a obtener las demás frecuencias.
Paso 1: Seleccionar toda la columna de frecuencias absolutas.
Paso 2: Presionar la Tecla F2 (Está en la primera fila de la parte superior del teclado).
Paso 3: Presionar 3 teclas juntas: CONTROL, SHIFT Y ENTER.

4.5. Frecuencias y distribuciones acumuladas


A veces, es deseable presentar frecuencias de una manera acumulada, especialmente cuando
buscamos localizar la posición de un caso en relación con la actuación total de un grupo. A
continuación, presentamos los tipos de frecuencias:
Frecuencia Absoluta (f).- Es el número de veces que se repite el valor de cada variable. La
suma de frecuencias absolutas es siempre al total de datos observados.

Frecuencia Relativa (fr).- Indica la proporción con que se repite un valor. Es el cociente entre
la frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas es
siempre 1. Se calcula así:

𝒇
𝒇𝒓 =
𝒏
14

Frecuencia Porcentual (f%).- Llamada también frecuencia relativa porcentual. Se obtiene


multiplicando la frecuencia relativa por 100. La suma de las frecuencias porcentuales es
siempre 100%. Se calcula así:

f% = fr *100

Frecuencia absoluta Acumulada (fa).- Indica el número de valores que son menores o iguales
que el valor dado. Es la suma de la primera frecuencia absoluta con la segunda, este valor con
la tercera, y así sucesivamente.

Frecuencia Relativa Acumulada (fra).- Es la suma de la frecuencia relativa primera con la


segunda, este valor con la tercera, y así sucesivamente.

Frecuencia Relativa Acumulada Porcentual (fra%).- Indica el número de valores que son
menores o iguales que el valor dado. Se obtiene multiplicando la frecuencia relativa acumulada
por 100. Se calcula así:

fra% = fra *100

Tabla 6
Distribución de frecuencia agrupada de calificaciones
de exámenes finales para 71 estudiantes

Nº de
Frecuencia Frecuencia
Calificaciones estudiantes Frecuencia
relativa absoluta
(Intervalo de Frecuencia relativa
porcentual acumulada
clase) Absoluta
(f) fr fr% fa
50 – 54 4 0,06 6 4
55 – 59 5 0,07 7 9
60 – 64 5 0,07 7 14
65 – 69 12 0,17 17 26
70 – 74 17 0,24 24 43
75 – 79 12 0,17 17 55
80 – 84 7 0,10 10 62
85 – 89 4 0,06 6 66
90 – 94 2 0,03 3 68
95 – 99 3 0,04 4 71
71 1 100
15

ACTIVIDAD DE APRENDIZAJE Nº 4
1. Se realiza una encuesta a un conjunto de 16
familias sobre el número de hijos. Los resultados
en el orden obtenido son:
x1= 2, x2= 1, x3= 3, x4= 3 , x5= 1 ,x6= 1 , x7= 3, x8= 0 ,
x9= 2 , x10= 1 , x11= 2 , x12= 3 , x13= 4 , x14= 1 , x15= 1,
x16= 2.

.
a. De acuerdo a estos datos cuántas filas debería tener esta tabla.
b. Construya una tabla de distribución de frecuencias absolutas para esos datos.
a. Construir la columna de distribución de frecuencias relativas.
b. Construir la columna de distribución de frecuencias relativa porcentual.
c. Construir la columna de distribución de frecuencias absolutas acumuladas.
Para contestar estas preguntas, primero se deberá:
- Identificar el número de observaciones diferentes, en otras palabras, qué valores diferentes
toma la variable Nº de hijos (¿Cuántos valores hay?)
- Contar para cada valor diferente de la variable Nº de hijos, cuantas veces se repite ese
valor, en otras palabras, calcular la frecuencia.
- Construir las tablas de frecuencias.
Solución:
Tabla N° 7
Distribución de frecuencias sobre número de hijos de 16 familias

Número de Frecuencia Frecuencia Frecuencia relativa Frecuencia


Hijos Absoluta Relativa porcentual Absoluta
f fr f% Acumulada
fa
0 hijos (No tiene) 1 0,06 6 1
1 hijo 6 0,38 38 7
2 hijos 4 0,25 25 11
3 hijos 4 0,25 25 15
4 hijos 1 0,06 6 16
TOTAL 16 1 100

Para repasar y reforzar lo aprendido hacer clic en los siguientes enlaces, donde encontrarán
videos tutoriales para este aspecto del contenido.
- Ejemplo de Frecuencia Acumulada: https://youtu.be/X1uqaHX6BKI
- Ejemplo de Tabla de Frecuencias: https://youtu.be/xq6tBKbg3HQ
- Ejemplo de Tabla de Frecuencias: https://youtu.be/SBI6GlAwL60
- Ejemplo de Tabla de Frecuencias agrupada en intérvalos: https://youtu.be/CuKr7GzohbI
16

ACTIVIDAD DE APRENDIZAJE Nº 5
Un sociólogo visita 25 comunidades campesinas en el Municipio
de San Lucas y en cada una anotó el número de familias que
están interesadas en participar del Proyecto de lavanderías
familiares, de lo cual resultaron los datos siguientes:
15, 25, 20, 15 ,18, 16, 17, 18, 20, 18, 18, 18, 19, 16, 17, 19, 16,
17, 17, 17, 19, 18, 19, 18, 15..

a. De acuerdo a estos datos cuántas filas debería tener esta tabla.


b. Construya una tabla de distribución de frecuencias absolutas para esos datos.
c. Construir una tabla de distribución de frecuencias relativas.
d. Construir una tabla de distribución de frecuencias relativa porcentual.
e. Construir una tabla de distribución de frecuencias absolutas acumuladas.

Solución:
Tabla N° 8
Distribución de frecuencias del número de familias interesadas en
participar en el Proyecto de lavanderías familiares

Número de Frecuencia Frecuencia Relativa Frecuencia relativa Frecuencia


familias Absoluta fr porcentual Absoluta
f f% Acumulada
fa
15 familias 3 0,12 12 3
16 familias 3 0,12 12 6
17 familias 5 0,2 20 11
18 familias 7 0,28 28 18
19 familias 4 0,16 16 22
20 familias 2 0,08 8 24
25 familias 1 0,04 4 25
TOTAL 25 1 100

Analice sobre los datos obtenidos:


a. ¿Cuántas comunidades tienen más de 20 familias interesadas?
b. ¿Cuántas comunidades tiene de 18 o menos familias interesadas?
c. ¿Qué proporción de comunidades tienen 18 familias interesadas?
d. ¿Qué porcentaje de comunidades tienen 19 familias interesadas?
17

4.6. Representación gráfica y tabular. (Tipos de Gráficos e Interpretación de los datos


presentados en gráficos)
Generalmente el trabajo apenas estará iniciado cuando se haya obtenido la distribución de
frecuencias. El paso siguiente es el de presentar los datos mediante un dibujo, de tal modo que,
el lector pueda percibir fácilmente las características esenciales de una distribución de
frecuencias y comparar una distribución con otra, si lo desea. Estos dibujos, llamados gráficas
no deben ser considerados como sustitutivos del tratamiento estadístico de los datos, sino más
bien como ayudas visuales para pensar en los problemas estadísticos y para discutirlos.
4.7. Empleo erróneo de las técnicas de representación gráfica.
Como se sabe, las gráficas han sido empleadas algunas veces en los negocios comerciales
para tratar de confundir al lector. Por ejemplo, si se manipulan intencionadamente los ejes de
una gráfica, el vertical (de las ordenadas o eje Y) y el horizontal (de las abscisas o eje X) es
posible dar la impresión que se desee. La siguiente figura ilustra esta aplicación tendenciosa
de las técnicas de representación gráfica. En ella se muestran dos diagramas de barras
(basados en los mismos datos) en los cuales se alargaron las ordenadas y las abscisas,
respectivamente, para causar dos impresiones distintas.
Se notará que la gráfica (a) tiende a exagerar la diferencia entre las frecuencias de las tres
clases, mientras que la (b) tiende a reducirla al mínimo.

(Gráfico 1a) (Gráfico 1b)


Gráficos 1ª y 1b: Diagrama de barras que representan los mismos datos, pero producen impresiones diferentes por la variación
de las longitudes relativas de la ordenada y de la abscisa.

Las diferencias pueden exagerarse aún más utilizando el artificio que Darrell Hulf e Irving Geis
llaman diagrama Gee Whiz. Este consiste en eliminar la frecuencia cero en el eje vertical y
empezar con una frecuencia superior a cero.
18

Los gráficos 2 y 3 tomados del libro How to Lie with Statistics ilustra muy claramente la forma en
que éstos pueden emplearse con un propósito engañoso.
Gráfico Nº 2

Tabla Nº 9

Millones
1937 de $us
JUN. 19,5
JUL. 19,45
AGO. 19,35
SEP. 19,55
OCT. 19,2
NOV. 19,55
DIC. 20,3
Gráfico Nº 3

Es evidente que el uso de estos artificios es totalmente opuesto al propósito de un estadístico,


que es el de presentar los datos con una claridad tal que las interpretaciones equívocas sean
mínimas. Para evitar estos se recomienda lo siguiente.
a. Considerar en el eje y la frecuencia cero.
b. La altura de la gráfica debe ser entre 0.70 y 0.80 de su longitud.
19

4.8. Gráficos para variables de escala nominal.

El diagrama de barras, ilustrado en las figuras 2 y 3, es un recurso gráfico empleado para


representar los datos correspondientes a una escala nominal y ordinal. Para cada categoría se
traza una barra vertical, y la altura de la barra representa el número de miembros de esa clase.
Si fijamos arbitrariamente la anchura de cada barra como una unidad, puede darse área a cada
barra para representar la frecuencia de cada categoría. Así, el área total de todas las barras es
igual a N.

Gráfico Nº 4 Número de estudiantes inscritos en cursos de economía y que están siguiendo


otros estudios académicos (datos hipotéticos).

Gráfico Nº 5. Número de estudiantes asistentes a las manifestaciones


de izquierda y derecha, por sexo.
20

En la preparación de distribuciones de frecuencias de variables de escala nominal, se deberán


tener en cuenta dos cosas:

1. No se presupone ningún orden adjudicable a las variables de escala nominal. Así las
diversas categorías pueden quedar representadas a lo largo del eje de las abscisas en
cualquier orden que se elija. Los autores prefieren ordenar las categorías
alfabéticamente, para ser consecuentes con su deseo de eliminar cualquier posibilidad
de que tendencias personales intervengan en la decisión.
2. Las barras deben ir separadas y no en contacto, para evitar cualquier implicación de
continuidad entre las categorías.
4.9. Gráficos para variables de escala ordinal.
En las variables de escala ordinal, las categorías en el eje de las abscisas deben ser
colocadas respetando su orden de ocurrencia natural. En el gráfico 6, se ilustra el uso del
diagrama de barras en el caso de una variable de escala ordinal.

Gráfico Nº 6. Número de estudiantes asistentes a las manifestaciones


de izquierda y derecha, por sexo.

4.10. Gráficos para variables de escala por intervalos


4.10.1. Histograma de frecuencias
Consiste en un conjunto de rectángulos que consta de: bases en el eje X horizontal centros en
las marcas de clase y longitudes iguales a los tamaños de los intervalos de clase y áreas
proporcionales a las frecuencias de clase. Si los intervalos de clases tienen todas las mismas
anchuras, las alturas de los rectángulos son proporcionales a las frecuencias de clase. En caso
contrario, deben ajustarse a las alturas.

Por ejemplo, en base a la siguiente distribución de frecuencias se puede representar el


histograma que se muestra en el gráfico 7.
21

TABLA: Distribución de frecuencia de los rendimientos de 120 estudiantes de la Escuela de


Gastronomía Chuquisaca
Tabla Nº 10
Clases, N° de estudiantes Histograma de frecuencias
Rendimientos Frec.Abs.(f),
50
50-59 15 45
40

Frecuencias, f
35
60-69 21 30
25
70-79 43 20
15
80-89 32 10
5
0
90-99 9 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99
Total 120 Intervalo de clases,
rendimientos
Gráfico Nº 7: Histograma de frecuencias
de los rendimientos de 120 estudiantes

Como se puede observar, el histograma muestra la variable aleatoria o fenómeno de interés a


lo largo del eje horizontal; el eje vertical representa el número, proporción o porcentaje de
observaciones por intervalo de clase, dependiendo si el histograma particular, es un histograma
de frecuencia absoluta, un histograma de frecuencia relativa o histograma de porcentaje.

4.10.2. Polígono de frecuencias


Es un gráfico de trazos resultante de la unión de los puntos producto de la intersección de la
frecuencia de clase con relación a la marca de clase, en el sistema de coordenadas
rectangulares. Es decir, el Polígono de frecuencia es el nombre que recibe una clase de
gráfico que se crea a partir de un histograma de frecuencia. Estos histogramas emplean
columnas verticales para reflejar frecuencias, en cambio el polígono de frecuencia es
realizado uniendo los puntos de mayor altura de estas columnas.
Entonces, aquí se incorpora una nueva columna a la Tabla de Distribución de Frecuencias; esta
columna se llama “marca de clase”.
La marca de clase es el punto medio del intervalo de clase y se obtiene promediando los límites
inferior y superior de clase.

Marca de clase = (Lím. Inf. Clase + Lím. Sup. Clase)/2

Del ejemplo de la distribución de frecuencias, la marca de intervalo 70 – 79 es (70 + 79)/2 =


74.5
22

Entonces, se la obtiene sumando el límite inferior con el superior de cada clase y dividiéndolo
entre dos, como se muestra a continuación:

Tabla Nº 11 Rendimientos de 120 estudiantes

Rendimientos N° de estudiantes
Intervalos de clases f Marca de clase f%
50 - 59 15 54.5 12
60 – 69 21 64.5 17
70 - 79 43 74.5 36
80 - 89 32 84.5 27
90 - 99 9 94.5 8
100

Gráfico Nº 8: Histograma de frecuencias de Gráfico Nº 9: Polígono de frecuencias


los rendimientos de 120 estudiantes de los rendimientos de 120 estudiantes
Histograma de frecuencias Polígono de frecuencias
50 50
N° de estudiantes, f

45
40 40
Frecuencias, f

35
30 30
25 20
20
15 10
10
5 0
0 0 54,5 64,5 74,5 84,5 94,5 104,5
50 - 59 60 - 69 70 - 79 80 - 89 90 - 99
Marca de clase, rendimientos
Intervalo de clases,
rendimientos

Gráfico Nº 10
23

Polígono de frecuencia relativa Porcentual

La frecuencia relativa porcentual de una clase es su frecuencia absoluta dividida por la


frecuencia total de todas las clases y se expresa generalmente como porcentaje.

fr % = (frecuencia absoluta/frecuencia total)*100

Por ejemplo la frecuencia relativa de la clase 70 – 79 de la tabla es (43/120)*100 = 36 %.

La suma de las frecuencias relativas de todas las clases, da como resultado 100. En el
siguiente gráfico se muestra la distribución de frecuencias relativas del ejemplo anterior.

La representación gráfica de la distribución de frecuencias relativas porcentuales en un eje de


coordenadas rectangulares nos dará un polígono de frecuencias relativas porcentuales, el cual
se muestra en el gráfico Nº 11.

Polígono de frecuencias relativas


porcentuales

40
35
30
fr %

25
20
15
10
5
0
0 54,5 64,5 74,5 84,5 94,5 104,5

Marca de clase

Gráfico Nº 11
Polígono de frecuencias relativas porcentuales de los rendimientos de 120 estudiantes

4.11. Distribuciones de frecuencias acumulada y Polígonos de frecuencias acumulada –


Gráfico Ojiva
La frecuencia total de todos los valores menores que la frontera de clase superior de un
intervalo de clase dado se llama frecuencia acumulada hasta ese intervalo de clase inclusive.

Aquí, agregamos una especificación a la columna de intervalo de clase: las Fronteras de clase;
que son los límites exactos o puntos específicos de la escala, que sirven para "separar
24

las clases”. Se pueden determinar identificando los puntos que están en la mitad entre los
límites superior e inferior de las clases adyacentes.

En el ejemplo de la tabla anterior de rendimientos, si se dan calificaciones con precisión de 1


punto, el intervalo de clase 70 – 79 incluye teóricamente todas las medidas desde 69,5 y 79,5
se llaman fronteras de clase o verdaderos límites de clase, el menor (69,5) es la frontera de
clase inferior y el mayor (79,5) la frontera de clase superior.

Por ejemplo, la frecuencia acumulada hasta el intervalo de clase 70 – 79 de la tabla, es


15+21+43 = 79; los que significa que 79 estudiantes tienen rendimientos por debajo de 79.5.
Una tabla que presente tales frecuencias acumuladas se llama una distribución de frecuencias
acumuladas, la cual se muestra para esta tabla de rendimientos, sería:

Tabla Nº 12 Frecuencias y marca de clase de 120 estudiantes


Rendimientos N° de estudiantes
Intervalos de clases f Marca de clase f%
50 - 59 15 54.5 12
60 – 69 21 64.5 17
70 - 79 43 74.5 36
80 - 89 32 84.5 27
90 - 99 9 94.5 8
Totales 120 100

Tabla Nº 13 Distribuciones de frecuencia acumulada de los


rendimientos de 120 estudiantes.
Rendimientos N° de estudiantes
Front. Superior de clase Frecuencia acumulada
59.5 15
69.5 36
79.5 79
89.5 111
99.5 120

La representación gráfica de las distribuciones de frecuencias acumulada en un eje de


coordenadas rectangulares nos dará el polígono de frecuencia acumulada u ojiva, el cual se
muestra en el gráfico Nº 12.
25

Gráfico Nº 12: Polígono de frecuencias acumuladas u ojiva de los rendimientos

de 120 estudiantes.

En ese sentido, como se puede observar en el gráfico, la ojiva es un gráfico que se construye
para una frecuencia acumulada o una frecuencia acumulada relativa.
La ojiva es un polígono abierto en el extremo superior, que se obtiene al unir por segmentos de
recta, los puntos; situados a una altura igual a la frecuencia acumulada o la frecuencia
acumulada relativa de cada clase (eje Y) con los límites reales superiores de éstas (eje X). Para
llevar a cabo su construcción se requiere crear un primer intervalo ficticio (o falso) con
frecuencia acumulada cero. Este gráfico nos permite analizar cuántas observaciones están por
debajo de un determinado valor.

4.12. Otros tipos de Gráficos Estadísticos


4.12.1. Gráficos Circulares

Existen varios tipos de gráficos que pueden utilizarse para la representación de los datos que
se organizan en una distribución de frecuencias, entre los más usuales están los gráficos
circulares (torta, quesitos), barras, etc.
Gráfico Nº 14 Actitudes hacia la guerra Gráfico Nº 15

Educación Sexual
No resp. Si
21% recibieron
50%

No
recibieron
29%
26

Al utilizar los procesadores que nos brinda el Microsoft Office de Windows, ya sea M. Excel,
Word, Power Point encontraremos varias opciones de Gráficos circulares, de los cuales
podemos elegir el que más convenga.
4.12.2. Gráficos de Barras Verticales
Representan valores usando trazos verticales, aislados o no uso de otros, según la variable a
graficar sea discreta o continua. Pueden usarse para representar una seria y dos o más series
(también llamado de Barras Comparativas) puesto que se usan para comparar dos o más
variables.
4.12.3. Gráficos de Barras Horizontales.
Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se
utilizan cuando los textos correspondientes a categoría son muy extensos.
Se pueden diseñar para una serie o para dos o más series. También llamada de Barras
comparativas ya que se usan para comparar dos o más variables.
Cuando lo que se busaca es resaltar la representación de los porcentajes de los datos que
componen un total, los Gráficos de Barras Verticales u Horizontales, también pueden ser
diseñados en Barras Proporcionales.

Gráfico 16 Opinión de 122 jóvenes sobre la educación sexual.

4.12.4. Gráficos de líneas


Los Gráficos de líneas representan los valores de los datos en dos ejes cartesianos
ortogonales entre sí. Pueden utilizarse para más de una serie de datos. Se utilizan para
representar valores con grandes incrementos entre sí.
27

Gráfico Nº 17 Gráfico Nº 18

4.12.5. Gráficos de áreas

En los Gráficos de Áreas se busca mostrar


la tendencia de la información generalmente
en un período de tiempo. Pueden utilizarse
para representar una o más series y en
dos dimensiones o en tres dimensiones.

Gráfico Nº 19

4.12.6. Cartogramas

Los Cartogramas se utilizan para mostrar


datos sobre una base geográfica. La
densidad de datos se puede marcar por
círculos, sombreado, rayado o color.

Gráfico Nº 20
28

4.12.7. Pictogramas
Los Pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en
una determinada escala para expresar la unidad de medida de los datos. Generalmente este
dibujo debe cortarse para representar los datos.

Gráfico Nº 21

Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes
escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen
un pictograma.
4.13. Tipos de curvas de polígonos de frecuencias
Una curva de frecuencias, es un polígono suavizado y se grafica igual como se hace para el
polígono de frecuencias.
Las curvas de frecuencia presentan determinadas formas con características que les distinguen
como se indica en la figura siguiente.
 Las curvas de frecuencia simétricas o bien formadas se caracterizan por el hecho de que
las observaciones que equidistan del máximo central tienen la misma frecuencia. Un
ejemplo importante es la curva normal.
 En las curvas de frecuencias moderadamente asimétricas o sesgadas la cola de la curva
a un lado máximo central es mayor que al otro lado. Si la cola mayor se presenta a la
derecha de la curva se dice que esta está sesgada la derecha o que tiene sesgo
positivo, mientras que si ocurre lo contrario se dice que la curva está sesgada a la
izquierda o que tiene un sesgo negativo.
 En las curvas en forma de J o de J invertida, el máximo se presenta en un extremo.
 Las curvas de frecuencias en forma de U tienen el máximo en ambos extremos.
 Una curva de frecuencia bimodal tiene dos máximos.
 Una curva de frecuencias multimodal tiene más de dos máximos.
29

Simétrica Asimétrica a la derecha Asimétrica a la izquierda


(Sin sesgo) (Sesgo positivo) (Sesgo negativo)

En forma de J En forma de J inversa En forma de U

Bimodal Multimodal

También podría gustarte