Está en la página 1de 21

Módulo III

Organización y Representación de los Datos

La recopilación de datos asociada a la realización de un estudio suele representar la obtención de


un conjunto más o menos numeroso de datos, ahora bien, la interpretación de los mismos a simple
vista suele resultar poco inteligible (o confusa) en la mayoría de los casos. La estadística
descriptiva nos ofrece herramientas para organizar y resumir los datos que hayamos recogido, de
modo que pueda ser extraída e interpretada la información contenida en los mismos que sea de
nuestro interés.

¿Cómo se pueden presentar los datos recopilados en una investigación para facilitar su lectura,
comprensión, análisis e interpretación?
Se pueden presentar organizados para facilitar su lectura e interpretación a través de cuadros o
tablas, y representarlos a través de una variedad de diagramas o gráficas estadísticas, llamadas
figuras. Los Datos y las Variables que originan, deben su organización y presentación
primeramente a un proceso de conteo, para luego ser presentados en gráficos y/o diagramas de
diversa índole, como los gráficos de barras y los diagramas de sectores. Los datos son clasificados
en base a las características cualitativas (propiedades o atributos) o en categorías numéricas o
cuantitativas.

Generalmente, tanto para la redacción de un artículo científico como para una comunicación, ya
sea oral o en cartel, se hace necesario organizar los datos de manera que se hagan patentes al
lector o al auditorio, de modo que su presentación específica e individualizada, permita la
percepción de los resultados y de su interrelación de una manera simple y clara.

Para la presentación de datos podemos utilizar tablas y/o cuadros, gráficos y/o diagramas (figuras).

El uso de uno u otro vendrá determinado por el tipo de comunicado (artículo de revista o
comunicación a congresos). Pero todos ellos, deben seguir unas reglas para su elaboración.

Ejemplos de estos Diseños o Presentaciones:

La tabla es una red de columnas y filas que en su mayoría se compone de datos


numéricos
Un cuadro es una red de columnas y filas que funciona a manera de tabla de doble
entrada, con texto en la mayoría de sus celdas.

Gráfico o Figura
Diferencias entre cuadro, tabla y gráfico

Expresión de relaciones numéricas, sobre las cuales hay referencias o


Cuadro explicaciones en el texto; los datos deben disponerse de manera que
puedan leerse verticalmente
Expresiones numéricas, sobre las cuales no hay referencias o
Tabla explicaciones en el texto, ejemplo tabla de logaritmos, tabla química,
Figura Expresión de imágenes, fotografías, mapas, diagramas gráficos y
estadísticos.

¿Qué son las Normas APA? (American Psychological Association)


Las Normas APA son el estilo de organización y presentación de información más usado en el área
de las ciencias sociales. Estas se encuentran publicadas bajo un Manual que permite tener al
alcance las formas en que se debe presentar un artículo científico. Aquí podrás encontrar los
aspectos más relevantes de la sexta edición del Manual de las Normas APA, como referencias,
citas, elaboración y presentación de tablas y figuras, encabezados y seriación, entre otros. En lugar
de gráficos y/o diagramas, habla de figuras. Las normas de la American Psychological
Association son hoy en día uno de los estándares más reconocidos para la transmisión del
conocimiento científico y académico. Desde el año 1929, cuando sale a luz el primer esbozo de las
normas, hasta el presente, APA se ha convertido en un extenso manual para la divulgación del
trabajo científico en todas las áreas del conocimiento. Asimismo, el Manual APA 2017 es visto
como una autoridad en cuanto a normas de creación, presentación, formato, citación y referencias
de trabajos se refiere. La última edición corresponde a su sexta versión, la cual podemos esperar
que sea definitiva, pues no está entre los planes de la asociación sacar una nueva edición.

TABLAS Y FIGURAS
Para la creación de tablas y figuras es posible usar los formatos disponibles de los programas
electrónicos. No hay una prescripción determinante sobre el modelo que debería utilizarse. Las
Normas APA indican que las tablas y figuras deben enumerarse con números arábigos, en el
orden como se van mencionando en el texto (Tabla 1, Figura 1). Esto debe aparecer acompañado
de un título claro y preciso como encabezado de cada tabla y figura.
No está permitido el uso de sufijación como 1a, 2a. APA recomienda un formato estándar de tabla
donde no se utilizan líneas para las filas, ni celda, solo para las columnas.

Tanto las tablas como las figuras se les colocan una nota si deben explicar datos o abreviaturas. Si
el material es tomado de una fuente protegida, en la nota se debe dar crédito al autor original y al
dueño de los derechos de reproducción. Además, es necesario contar con autorización por escrito
del titular de los derechos para poder reproducir el material.

Gráficos, diagramas o figuras.


Figura es todo aquel material de ilustración que incluye gráficas, diagramas, fotografías; o sea,
todo aquello que precisa un trabajo diferente a la mera composición tipográfica. Son elementos de
la obra en los que predomina la imagen sobre el texto. Se usan para apoyar y complementar lo
dicho en el texto. Debe evitarse que las figuras repitan lo que se dice en los párrafos anteriores,
posteriores y viceversa.

Podemos decir que la figura es la imagen de las ideas. Si una tabla se concibe para realzar
interrelaciones entre los datos, las figuras encuentran su motivo en la mera exposición de un hecho
físico (fotografía) o en la voluntad de mostrar patrones o tendencias de una variable o de varias a la
vez.

Un gráfico no es más que una representación de un cuadro o tabla en forma de diagrama y, por
tanto, se trata de otra forma de presentar la misma información. Su utilidad se manifiesta en dos
momentos del proceso de análisis:

- Permite reconocer a golpe de vista la existencia de relación entre las variables representadas, así
como determinar algunos rasgos clave de la misma, de forma que las conclusiones obtenidas
pueden ser utilizadas para formular modelos explicativos.

- También puede ayudar a comparar los resultados ofrecidos por los modelos con los hechos,
mediante la representación gráfica de ambos.

REVISTA e- CIENCIAS DE LA INFORMACIÓN


Según Gómez (2008), la presentación de la información estadística es importante por dos razones:
primero, es más fácil y productivo presentar los datos recolectados de una forma organizada y
eficiente; y segundo, responde a la necesidad de poner esta información al alcance de otras
personas. No obstante, como lo dice este autor, no es un proceso fácil, ya que tiene el
inconveniente fundamental de que no se pueden dar reglas fijas y exactas; en ella interviene
mucho el juicio de la persona que maneja la información. Sin embargo, deben cumplirse ciertos
requisitos básicos que pueden usarse como guía a la hora de presentar la información (Gómez,
2008, p. 186).

Por ello, la Revista e - Ciencias de la Información solicita a aquellos interesados en postular un


artículo seguir los siguientes lineamientos básicos en la presentación de tablas, cuadros y figuras:

• Toda tabla, cuadro y figura se debe enumerar con números arábigos (no se utiliza la enumeración
de tablas con decimales o letras, p. ej., Tabla 1.1 o Figura 1b) y esta enumeración debe ponerse en
negrita.

• El número de la figura, tabla o cuadro va en negrita y, un renglón a bajo, se coloca el título (no se
coloca puntos al final de ambos).
• No se debe utilizar abreviaturas en el título de la tabla, cuadro o figura, aunque sí es posible usar
siglas y acrónimos.

• Se debe incluir una nota debajo de la figura indicando la fuente de la siguiente forma: “Fuente:
Apellido, Año, Número de página.”

• Los títulos, las notas y la fuente deben estar centrados con base en el ancho de la tabla, cuadro o
figura.

• Se solicita que la información que se presenta en las tablas, cuadros o figuras sea concisa, lógica
y fácil de entender para el lector.

1. TABLAS
Las tablas muestran toda aquella información textual o listada que no presenta datos numéricos
procesados. Dentro del texto se realiza una mención de la tabla según su numeración y no con “la
tabla que se muestra arriba” o “la tabla de la página 12”, ya que la posición de esta no se determina
hasta tener la versión diagramada del título (APA, 2010). La presentación general de tablas se
realiza con una o varias columnas dependiendo de la cantidad de características del objeto que se
presenta en la tabla. En el caso de las nominaciones del objeto y sus características, se indica
cada uno en la primera fila de la tabla y se señala en negrita. Al final, se debe situar la fuente de la
tabla. En la presentación de la tabla, se deben colocar todos los bordes, y la nominación de los
títulos va en negrita.

Tabla 1
Título

Nombre del Objeto Características del Objeto

Fuente: Apellido, Año, p. X

Ejemplo:

Tabla 1
Número de grupos muestreados, por nivel y curso,
Escuela de Ciencias de la Comunicación
Colectiva, octubre del 2009
NIVEL CURSO GRUPO

Primer Comunicación y Nuevas Tecnologías II 4


Segundo Seminario I 3
Periodismo Informativo 1
Tercer Seminario II 3
Taller de Creatividad 1
Cuarto Taller de Realización de Radio y TV II 1
Producción de TV Publicitaria II 1
Géneros Periodísticos Especiales 1
Taller de Relaciones Públicas 1

Fuente: Elaboración propia con base en datos de la Escuela de Ciencias de la


Comunicación Colectiva, 200, p. 2

2. CUADROS
Según el Instituto Nacional de Estadística y Censo [INEC] (de la Contraloría General de la
República de Panamá) un cuadro estadístico es el arreglo ordenado de los datos procesados para
facilitar la lectura e interpretación de los mismos. Su buena presentación transmite calidad de los
procedimientos previos y aclara el significado del material. Una presentación pobre, no sólo
perjudica la calidad de la información, que tiende a destruir el efecto del trabajo realizado (2010, p.
1).
De esta forma, los autores señalan que es necesario colocarse en la posición del usuario a la hora
de realizar el cuadro, de manera tal que quede comprensible. Los elementos básicos de todo
cuadro, según Gómez (2008), son:
• Título
• Encabezados
• Columna matriz
• Cuerpo o contenido
También se puede incluir notas preliminares, notas al pie del cuadro y fuente. En cuanto al título
del cuadro, se recomiendan los siguientes lineamientos (INEC, 2010):
- Tomar en cuenta que el título es un referente que presenta parámetros para la búsqueda de
información.
- El punto se utiliza entre la referencia de tiempo y la referencia geográfica.
- El guion se utiliza solo para indicar periodos de tiempo consecutivos.
- Cualquier aclaración del título se debe indicar en el pie del cuadro.
- Se debe indicar el qué, el dónde, el cuándo y la clasificación (es decir, las clasificaciones
principales utilizadas para organizar la información), de forma tal que el título responda a estas
preguntas indicando qué son los datos, dónde, cuándo y cómo se recogieron, y bajo qué criterios
se clasifican en el cuadro (Gómez, 2008).

Otras generalidades que se deben tomar en cuenta son:


- Debe estar alineado en el centro.
- Cuando las cifras llevan decimales, todas deben tener la misma cantidad de decimales.
- Los títulos, las notas y la fuente deben estar centrados con base en el ancho del cuadro.
- La indicación de “Cuadro 1” (y las demás numeraciones) deben ponerse en negrita. El título va sin
negrita. Sobre los valores numéricos que se presentarán en el cuadro, estos deben tener el mismo
número de decimales en todo el cuadro, así como en todo el texto. Se debe evitar a toda costa
dejar celdas vacías en el cuadro o incluir símbolos ambiguos. Si fuera el caso de que no se pudo
obtener el dato, deje la celda en blanco e inserte un guion, así como una nota al final del cuadro
justificando el caso (Gómez, 2008).

En la presentación del cuadro, los bordes se colocan solamente entre las variables y los totales. No
se colocan bordes a la izquierda ni a la derecha. Igualmente, las variables y los totales van
en negrita.
A continuación, se indica la presentación del cuadro con base en lo sugerido por Gómez (2008, p.
189):
1) Sección y Número del Cuadro: No es más que el número, código o elemento que ubica el
cuadro en la publicación.

2) Título: Descripción que precede al cuadro, debe ser redactado en forma breve y se recomienda
utilizar la forma de pirámide invertida. Debe responder a las interrogantes: Qué, Dónde, Cómo y
Cuándo.

¿Qué?: Se refiere al hecho observado.

¿Dónde?: Se refiere al lugar que corresponde la información.

¿Cómo?: Se refiere al orden en que se presenta la información la cual debe comenzar por el
encabezamiento identificado por la preposición “por” y debe seguir con la información de la
columna matriz identificada con la preposición “según”.

¿Cuándo?: Se refiere al tiempo en que se cubre la información.

3) Encabezamiento: Recibe este nombre la serie de casillas situadas en la parte superior del
cuadro y en la cual se indican una o varias clasificaciones de los datos.

4) Columna matriz: Colocada en el lado izquierdo es de hecho la primera columna del cuadro. En
ella se indican tanto las características principales como las dependientes.
5) Cuerpo del Cuadro: Es el conjunto de columnas y líneas que contiene el cuadro en orden vertical
y horizontal, en él la se colocan los datos sobre el hecho observado y las cifras deben ser
alineadas a la derecha, unidades debajo de unidades, decenas debajo de decenas, etc. Los totales
se colocan en la parte superior, horizontalmente y a la izquierda.

6) Columnas: Están localizadas en el cuerpo del cuadro y nunca deben aparecer en blanco.

7) Nota: Está destinada a ofrecer conceptos o definiciones que aclaren el contenido de los cuadros
o a indicar la metodología utilizada en la investigación.

8) Llamada: Información de carácter específico que se aplica a determinada parte del cuadro. Se
indica en el cuadro con el símbolo ( ), Cuando va al lado de un número se identifica con una letra y
debe ir antes de ésta. Si va al lado de una palabra se pone en número y al final de la misma.

9) Fuente de Información: Indica la publicación o entidad responsable de la información.

¿Señale cuáles son los Errores en el Cuadro anterior?

Qué: POBLACIÓN DE ESTUDIANTES UNIVERSITARIOS


Dónde: EN PANAMÁ
Cómo: POR SEXO, SEGÚN LUGAR DE PROCEDENCIA
Cuándo: Año 1998.
Ejemplos:
3. FIGURAS

Se le llama figura a todo gráfico, fotografía, mapa, dibujo, esquema, ilustración o cualquier
elemento que no sea una tabla o un cuadro estadístico. Para utilizar figuras que son de otra autoría
debe presentarse el debido permiso de utilización del titular de los derechos intelectuales y se debe
dar el crédito al autor original y al titular de los derechos en la fuente de la figura (APA, 2010). En el
caso de las imágenes, mapas y fotografías, estos deben tener una resolución de 300 DPI y estar
en formato jpg, png o tiff.
Es importante que la figure:
Sea homogénea y nítida
- Tenga un tipo de letra simple y legible
- Tenga los elementos debidamente señalados o explicados. (APA, 2010).

Específicamente en los casos de los gráficos, Gómez (2008) indica que se debe tener en
consideración
lo siguiente:
- Los ejes deben estar debidamente rotulados y claros.
- Debe evitarse la presentación de gráficos que exageren o atenúen las tendencias que presentan
los datos, ya que esto se puede prestar a que los lectores lleguen a conclusiones erróneas.
- Debe estar proporcionalmente construido, es decir, ni muy ancho ni muy alto.
- No se debe incluir series de datos, ya que esto puede más bien confundir al lector.
- Debe ser sencillo y fácil de interpretar adaptándolo adecuadamente al tipo de información que
presenta.
A continuación, se indican el tipo de gráfico recomendado según el tipo de información que se
desea presentar (los gráficos más básicos, con base en Gómez, 2008):

Gráficos de Barras → Series cualitativas y geográficas


En el caso de las barras horizontales, se utilizan en aquella información cualitativa o geográfica, y
las verticales se utilizan para información cronológica o cuantitativa discreta. Además, se debe
dejar un espacio proporcionado entre cada barra y deben acomodarse de mayor a menor.

Gráficos Circulares → Información porcentual


También se puede utilizar el gráfico de barras simples o de barra de 100%, sin embargo, este
último y el gráfico circular son los más recomendados para la presentación de información
porcentual. En estos dos tipos de gráficos se deben organizar las categorías de mayor a menor,
donde en el caso del gráfico circular, la categoría más grande se coloca en el punto más alto del
círculo, y se continúa con las
Subsecuentes siguiendo el sentido de las manecillas de un reloj.

Gráficos lineales → Series de tiempo


Se utilizan cuando se presentan dos escalas donde se considera importante que el lector
tome en cuenta estas dos escalas o dimensiones simultáneamente.

Pictograma → Información variada


Se utiliza para indicar información variada o general con base en figuras o dibujos que llamen la
atención. Estas figuras o dibujos deben ser proporcionados entre sí ante la información que
representa y no se usan escalas, sino más bien símbolos que poseen un valor específico
(representan la frecuencia). Se debe escoger la figura que mejor represente la naturaleza de la
información y es recomendable que esté posicionada horizontalmente.

Mapas estadísticos → Información estadística presentada sobre una base


geográfica
Para este tipo de gráfico se recomienda mostrar la información de la manera más clara y sencilla.
Finalmente, se les indica a los autores que todas las tablas, los cuadros y las figuras deben
incluirse en un apartado al final del documento y se debe hacer la referencia a ellos dentro del
texto.

Figura 1: Población de Estudiantes Universitarios en Panamá, según lugar de procedencia, año


1998.
A. Datos Cuantitativos

Distribución de Frecuencia y su importancia en el Análisis Estadístico


Si los resultados de la investigación son eminentemente numéricos, sean valores discretos o
continuos, deberá proporcionárseles un tratamiento especial de organización conocido como
distribución de frecuencias.

Concepto de frecuencia
Una manera útil de organizar y presentar los datos es dividirlos en categorías similares o clases y
luego contar el número de datos u observaciones que caen o que pertenecen a cada una, lo que se
conoce como frecuencia.
Una distribución de frecuencias es una tabla de resumen en la que los datos se agrupan o arreglan
en clases o categorías similares, establecidas de modo conveniente, ordenadas en forma
numérica.

Cuando se dispone de un gran número de datos, es útil el distribuirlos en clases o categorías y


determinar el número de individuos pertenecientes a cada clase, que es conocida como frecuencia
de clase.
Los datos ordenados y resumidos en esta forma se suelen llamar datos agrupados. Estos se
ordenan a través de los intervalos de clases que a su vez se encuentran restringidos por los límites
de clases.

Los intervalos de clases son cada uno de los límites establecidos para la agrupación de los datos;
mientras que los límites de clases son los extremos o fronteras que componen el intervalo de clase.
Generalmente se toma a el menor de los datos como el límite inferior de la clase más baja (primera
clase), y al mayor de los datos como el límite superior de la clase más alta (última clase).

La construcción de una distribución de frecuencias depende de los datos con que se dispone, pero
en general esta es sencilla.

Agrupamiento de Valores
El agrupamiento de valores a través de una distribución de frecuencias puede darse de dos formas
o a través de dos tipos de agrupamientos o tablas.

-. Distribución de Frecuencias por Puntos


Si la amplitud de la variación de los datos es pequeña, se puede elaborar una distribución de
frecuencias por puntos o puntual, en donde se representan los datos en forma que se dispongan
los valores por orden de magnitud. En este caso, las variaciones o diferencias entre las mediciones
sucesivas resultan ser infinitesimales o muy pequeñas (son infinitamente pequeñas)

Ejemplo #1: Un inspector quiere estimar el peso promedio de llenado para cajas de cereal
empacadas en una fábrica. El cereal está en paquetes que contienen 12 cajas cada uno. El
inspector selecciona aleatoriamente 5 paquetes y mide el peso de llenado de cada caja en los
paquetes muestreados, con los resultados en onzas, que se muestran en el cuadro siguiente.

PAQUETE ONZAS DE LLENADO

1 16.1 15.9 16.1 16.2 15.9 15.8 16.1 16.2 16.0 15.9 15.8 16.0

2 15.9 16.2 15.8 16.0 16.3 16.1 15.8 15.9 16.0 16.1 16.1 15.9

3 16.2 16.0 15.7 16.3 15.8 16.0 15.9 16.0 16.1 16.0 15.9 16.1

4 15.9 16.1 16.2 16.1 16.1 15.9 15.9 16.1 15.9 15.9 16.0 16.0

5 16.0 15.8 16.3 15.7 16.1 15.8 16.0 16.1 15.8 16.0 16.1 15.9

Elabore una distribución de frecuencias apropiada. Analice e interprete los datos.

Ordenando los datos de menor a mayor obtenemos el siguiente cuadro:


VALOR CONTEO DE FRECUENCIA FRECUENCIA
PUNTUAL DATOS ABSOLUTA (fi) RELATIVA (fr)

15.7 II 2 0.33

15.8 IIIIIII 7 0.117

15.9 IIIIIIIIIIIIII 14 0.233

16.0 IIIIIIIIIIIII 13 0.217

16.1 IIIIIIIIIIIIIII 15 0.250

16.2 IIIII 5 0.083

16.3 IIII 4 0.067

TOTALES 60 1.000

-. Distribución de Frecuencias por Intervalos


Si al colectar los datos, la amplitud de la variación de estos es significativamente grande, entonces
se procede a agruparlos en intervalos de clase con la finalidad de buscarles significado. Este tipo
de arreglo debe proveer la información sobre la concentración de los valores, así como sobre
aquella parte sobre el eje sobre la cual se distribuyen los mismos.
Cabe señalar que tanto el diagrama de frecuencias por puntos, como el diagrama de frecuencias
por intervalos se pueden aplicar a las variables aleatorias discretas o continuas.

Importancia de la Definición y Establecimiento de los Intervalos de Clase


Este es un proceso de gran importancia, ya que afecta directamente la utilidad de la distribución de
frecuencias, pues si elegimos mal los intervalos, estaremos confundiendo la naturaleza de la
configuración de la distribución, por lo que arribaríamos a conclusiones erróneas o incorrectas.

Para algunos autores, la adecuada elección de los intervalos de clase debe observar los siguientes
principios:

a. El número de clases o de intervalos ha de ser tal que quede de manifiesto la naturaleza de la


distribución. Si el número de clases es muy grande, los intervalos de clases serán muy pequeños y
no aparecerá la verdadera configuración de la distribución, ya que estaríamos excluyendo
información; por otro lado, si se tienen demasiadas clases pueden aparecer clases vacías, y la
distribución perdería su significado. En el caso contrario, si el número de clases es muy pequeño
los intervalos serán muy amplios, por lo tanto, quedarían números relativamente considerables de
partidas concentradas en unas cuantas clases con intervalos más estrechos. En este caso, si las
clases son pocas, podríamos estar encubriendo características importantes de los datos, debido al
agrupamiento.

b. Los intervalos de clases tienen que ser de igual amplitud (ancho o longitud), para obtener así
una configuración uniforme de la distribución de frecuencias, y poder realizar así comparaciones
entre clases, o realizar comparaciones uniformes de las frecuencias de clase.

c. Los intervalos se escogen de tal manera que el punto medio (marca de clase) coincida con
valores reales observados. Debe evitarse que las observaciones coincidan con los límites de los
intervalos de clases, a fin de evitar ambigüedades y garantizar así que cada observación quede
dentro de un intervalo.
Según lo anterior, se requiere primero del establecimiento de los límites nominales de clase, y
luego calcular los límites reales a través de ciertas fórmulas matemáticas, y mediante algunos
razonamientos no muy claros.

Estas expresiones son dos:

Límite Real Inferior de Clase =

(Límite Nominal Inferior de la Clase + Límite Nominal Superior de la Clase anterior) / 2

Límite Real Superior de Clase =

(Límite Nominal Superior de la Clase + Límite Nominal Inferior de la Clase siguiente) / 2

Adicionalmente, habría que restar 1 del cálculo del límite inferior de la segunda clase y 2 unidades
de límite superior de esa misma clase. Esta diferencia debe aumentarse en una unidad para las
clases subsiguientes; esto es, se debe restar dos unidades del limite inferior de la tercera clase y 3
unidades del superior; 3 unidades del límite inferior de la cuarta clase y 4 unidades del superior de
esa misma clase; 4 unidades del límite inferior de la quinta clase y 5 unidades del superior, y así
sucesivamente.

Obviamente este procedimiento, que aparece no muy claro en algunos libros de Estadística, resulta
algo complicado y confuso. Más simple y sencillo resulta restar y sumar 0.5 a los límites inferiores y
superiores, nominales, cuando se nos presentan intervalos de clases representados por números
enteros. Cuando el intervalo está representado por números enteros con parte decimal, entonces
restamos y sumamos 0.05 de los límites inferiores y superiores, respectivamente.

Ejemplo #2:

Un examen de estadística de una hora produjo los siguientes resultados o puntuaciones:

38 72 82 87 91
50 73 82 88 93
62 78 83 88 93 *Estos datos ya han sido ordenados en forma ascendente
63 78 83 91 95 por lo que representan una serie estadística.
68 80 84 91 96
69 81 84 91 97

Determinación del Rango General de la Distribución:


Es la diferencia entre el valor mayor y el menor existente entre los datos.
Esto es: Rango (R) = Xmayor – Xmenor = 97 – 38 = 59

Establecer el No. de Clases en que se agruparán los datos:


Esto se logra dividiendo el rango en intervalos con un tamaño apropiado. Existen varios modelos
matemáticos para ayudar a determinar el No. de intervalos de clases (o el No. de clases); sin
embargo, una guía práctica empírica que sugiere el matemático estadounidense Herbert Sturges
es:

K = 1 + 3.3 log (n)


Donde:
N = # de datos de la muestra o tamaño muestral
K = # de intervalos de clases o clases o categorías
Log = logaritmo de base 10
Según los datos tenemos que:

K = 1 + 3.3 log (30) = 5.8745 ͠X͜͠ 6 clases aproximadamente.

Esta es una guía práctica, su variación dependerá del valor del límite inferior de la primera clase
que se asigne, asignación que es arbitraria. Este valor debe ser tal que incluya al menor de los
datos.

Otra forma, para n ≤ 50 0bservaciones: K = √ n= √ 30 = 5.477 = 5.5 ͠X͜͠ 6 clases.

Para n ˃ 50 0bservaciones: K = 10 log(n) Según Dixon y Kronmel

3
Para muestras con 200 ó más observaciones K = √ n
En este sentido, tenemos que:
L.I.C. = Límite Inferior de Clase

L.S.C. = Límite Superior de Clase

Criterios de Selección de Datos:


Se establecen para evitar ambigüedades o conflictos y permiten generar los límites reales de
clases de una manera sencilla y sin complicaciones. Su fijación permite utilizar observaciones
reales o valores observados y/o la coincidencia de los datos con los límites.
Criterio No. 1: L.I.C. ≤ Xi < L.S.C.

Criterio No. 2: L.I.C. < Xi ≤ L.S.C.


Utilizando el Criterio No. 1, podemos utilizar el valor del menor de los datos o la calificación más
baja, el cual quedaría automáticamente incluido.

El Criterio No. 2 generalmente se utiliza cuando se desconocen los valores de las observaciones,
partiendo entonces de una tabla de distribución de frecuencias que puede estar incompleta;
también, cuando se dan indicios en el enunciado que den cabida a la utilización de este criterio.

Longitud o Ancho de Intervalo:


Finalmente, el tamaño de los intervalos o su longitud será dado por la relación:

Ancho de Clase o Longitud o Amplitud de Intervalo = Ai = R / K = 59 / 6 = 9.83 ͠X͜͠ 10 puntos

Conforme a todo lo anterior, la tabla de distribución de frecuencias para el ejemplo en


consideración es como sigue:

Criterio de Selección de Datos: L.I.C. ≤ Xi < L.S.C.

CLASES INTERVALOS M.C. fi CONTEO fr Fi Fr


1 38 – 48 43 1 I 1/30 1 1/30
2 48 – 58 53 1 I 1/30 2 2/30
3 58 – 68 63 2 II 2/30 4 4/30
4 68 – 78 73 4 IIII 4/30 8 8/30
5 78 – 88 83 11 IIIIIIIIIII 11/30 19 19/30
6 88 -- 98 93 11 IIIIIIIIIII 11/30 30 30/30=1.00
SUMAS 30 30/30=100

M.C. = Marca de Clase, representa el punto medio del intervalo

fi = frecuencia absoluta, la cual denota con qué frecuencia se toma cada valor de la variable “Xi”.

fr = frecuencia relativa, la proporción de veces que se toma un valor de la variable, y resulta de


dividir cada valor de fi entre el total de observaciones.

Matemáticamente se expresa de la siguiente forma: fr = fi/n

Fi = frecuencia acumulada, que resulta de sumar sucesivamente los valores de la columna de fi.

Fr = frecuencia relativa, que resulta de sumar sucesivamente los valores de la columna de fr, o de
dividir cada valor de la columna de Fi entre el total de observaciones de la muestra (n).

Preguntas para desarrollar y responder por el estudiante:

- ¿Cuántas distribuciones de datos están representadas en la tabla de distribución de


frecuencias anterior?
- ¿Cuántas distribuciones de frecuencias están representadas en dicha tabla?
- ¿Qué evidencia la columna de Conteo?

B. Datos Cualitativos

Para datos cualitativos o categóricos, la construcción de una tabla de frecuencias requiere del
conteo del número de elementos o individuos que caen dentro de cierta clase, o que tienen
determinada característica, propiedad o atributo.
La tabla se construye de la siguiente forma: a.- en la 1ª columna se registran las cualidades o
características; b.- en la 2ª columna se anotan las frecuencias (fi), y c.- en la 3ª columna se anotan
las frecuencias relativas (fr). En este tipo de tabla no se dan intervalos de clases, porque carecen
de sentido o significado.

Ejemplo # 3: Una encuesta colocada a los estudiantes graduandos de un instituto con la finalidad
de conocer el tipo de ocupación al cual aspiran éstos. Los resultados se listan a continuación:

Clase Ocupacional Número Porcentaje

Biólogo 5 0.05
Banquero 8 0.08
Empresario 22 0.22
Químico 7 0.07
Médico 10 0.10
Corredor de Seguros 6 0.06
Periodista 9 0.09
Abogado 14 0.14
Profesor 9 0.09
Ingeniero 5 0.05
Otros 5 0.05

Total 100 1.00

En la categoría “otros” se registran las observaciones que de una forma u otra logran hacer
significativa dicha clasificación.

Ejemplo # 2: El nivel de instrucción de la población de 7 años y más edad, en la república de


Panamá, según el último Censo de población, se da a continuación:

Nivel de Instrucción Porcentaje

Ningún Grado 12.5


Algún Grado de Primaria 54.3
Algún Grado de Secundaria 27.3
Algún Año Universitario 5.9

Total 100.0

C. Presentación Grafica de los Datos Agrupados en Tablas de Frecuencias


Las distribuciones de frecuencias se pueden presentar en gráficos tales como: histogramas de
frecuencias, polígonos de frecuencias y otras formas.
Histograma de Frecuencias
También llamado diagrama de columnas o de barras. Se construye como sigue: los intervalos de
clase se marcan a lo largo del eje horizontal (eje X) y luego para cada intervalo se construye una
barra o rectángulo cuya altura sea igual a la frecuencia o a la frecuencia relativa de la clase.
La característica más significativa del histograma de frecuencias de la muestra es que proporciona
información sobre el histograma de frecuencias de la población (el cual describe la población), por
tal razón es de esperarse que estos dos histogramas (esto es un supuesto) son similares y este
grado de similitud aumenta a medida que se añaden más datos a la muestra.

Polígono de Frecuencias
Se construye situando sobre el punto medio de la clase, un punto a la altura de la frecuencia o de
la frecuencia relativa de esa clase, uniendo o conectando luego los puntos así determinados.

Ojiva de Frecuencias o Polígono de Frecuencias Acumuladas


Es un gráfico asociado a la distribución de frecuencias, que muestra las frecuencias acumuladas
menores que cualquier límite real superior de clase trazado. Se construye colocando en un eje
cartesiano, anotando en el eje vertical las frecuencias acumuladas o acumuladas relativas, y, en el
eje horizontal se colocan los límites de los intervalos. Se inicia colocando un punto, sobre el eje “X”,
sobre el Límite Inferior de la 1ª clase, para indicar que no existe información u observación igual o
por debajo de ese valor; seguidamente, se anota un punto sobre el Límite Superior de la clase
siguiente, a la altura de la frecuencia acumulada de dicha clase (frecuencia absoluta de la clase +
la frecuencia absoluta anterior). Se continúa así, hasta colocar un punto sobre el Límite Superior de
la clase más alta o de la última clase. Luego, se unen los puntos por líneas de trazos rectos.

Gráfico de Sectores
Generalmente, se utilizan para la descripción de variables categóricas, aunque en algunas
ocasiones se pueden utilizar para variables de escala. Consideran una figura geométrica (tipo
circular, pie o pastel), en la que la distribución de frecuencias se reparte dentro de la figura, en
donde cada porción dentro de la figura representa la información porcentual del total de datos; por
eso, la distribución de frecuencias debe ser transformada a una de frecuencias relativas.

Ejemplo #4:
En una investigación social acerca del estado civil de las personas, se obtuvieron los siguientes
resultados:

Estado Civil Proporción (%)


Solteros o sin compromisos 10
Sin pareja (viudos, separados o divorciados) 30
Casados 60
Total 100

Construya un gráfico o diagrama de sectores, para las tres categorías de datos. Analice e
interprete los resultados.

Solución:

Paso #1: Determinar la distribución de frecuencias relativas

Paso #2: Determinar los ángulos que representan las porciones dentro de la figura para cada clase
o categoría.

Esto es: Solteros---------- 0.10 X 360 = 36º


Sin pareja-------- 0.30 X 360 = 108º
Casados---------- 0.60 X 360 = 216º
Estadi Civil de un grupo de Personas

10%

Solteros o sin compromisos


Sin pareja (viudos, separados o
divorciados)
Casados
30%
60%

También podría gustarte