Está en la página 1de 12

UNMSM

I.ORGANZACIÓN Y PRESENTACIÓN DE DATOS


TABLAS Y GRÁFICOS UNIVARIANTES

1. Organización y presentación de datos: Tablas y Gráficos Univariantes.


1.1. Datos categóricos: Definición de frecuencias. Construcción de Tablas de frecuencias.
Gráficos de frecuencias: barras simples, circular y pictogramas.
1.2 Datos cuantitativos discretos: Construcción de Tablas de frecuencias. Gráficos de
frecuencias simples y acumuladas.
1.3 Datos cuantitativos continuos: Construcción de Tablas de frecuencias empleando intervalos
de clases. Gráficos de frecuencias simples: Histograma y Polígono de Frecuencias. Gráficos de
frecuencias acumuladas: La Ojiva.
I.ORGANZACIÓN Y
ASIGNATURA:
FUNDAMENTOS DE

PRESENTACIÓN DE DATOS ESTADÍSTICA

Universidad Nacional
TABLAS Y GRÁFICOS UNIVARIANTES
Mayor de San Marcos
I. INTRODUCCIÓN

las investigaciones tienen por objeto explorar la naturaleza o


UNMSM
comportamiento de las variables medidas de una población o
muestra bajo estudio, y analizar su intensidad o variabilidad.
Recopilar y procesar datos se ha convertido en una necesidad Facultad: Ciencias
imperiosa en la actualidad. Conocerlos e interpretarlos permite al
Biológicas
investigador descubrir, prevenir, informar o predecir el
comportamiento de diferentes sucesos o fenómenos propios de la
naturaleza, del entorno social o incluso del pensamiento. Escuela: Genética y
Una vez recolectado los datos adecuadamente se presentan
mediante tablas de frecuencias o gráficos, dando como resultado Biotecnología
información estadística, que permitirá conocer el comportamiento
de la variable bajo estudio.
Profesores:

Leamos el siguiente resumen1 Teoría: Mg. Violeta


“El análisis de los polimorfismos genéticos permite identificar genes que
confieren susceptibilidad a presentar enfermedades. En este trabajo se Nolberto Sifuentes y Mg.
presenta la nomenclatura utilizada en la bibliografía de epidemiología
genética y una estrategia básica de análisis estadístico de estudios Fernando Camones
epidemiológicos que incorporan estos marcadores. En primer lugar, se
Gonzales
presenta el análisis descriptivo de un único polimorfismo y la
evaluación del equilibrio Hardy-Weinberg. A continuación se presentan
los métodos para evaluar la asociación con la enfermedad. Para ello se
emplean modelos de regresión logística y se estudian los posibles
SESIÓN 2 y 3:
modelos de herencia. Por último, se presentan métodos para el análisis 1. Organización y presentación
simultáneo de múltiples polimorfismos: estimación de las frecuencias de de datos: Tablas y Gráficos
Univariantes.
haplotipos y análisis de asociación con la enfermedad”. 1.1. Datos categóricos: Definición
de frecuencias. Construcción de
1 Tablas de frecuencias. Gráficos de
INIESTA, Raquel; GUINO, Elisabet y MORENO, Víctor. Análisis estadístico de polimorfismos genéticos en frecuencias: barras simples,
estudios epidemiológicos. Gac Sanit [online]. 2005, vol.19, n.4 [citado 2016-03-23], pp. 333-341 . Disponible en: circular y pictogramas.
1.2 Datos cuantitativos
<http://scielo.isciii.es/scielo .php?script=sci_arttext&pid=S0213-91112005000400011&lng=es&nrm=iso>.ISSN 0213-
discretos: Construcción de Tablas
9111 de frecuencias. Gráficos de
frecuencias simples y acumuladas.
1.3 Datos cuantitativos
continuos: Construcción de
Tablas de frecuencias empleando
intervalos de clases. Gráficos de
frecuencias simples: Histograma y
Polígono de Frecuencias. Gráficos
de frecuencias acumuladas: La
Ojiva.
Figura 1. Base de datos en Excel

II. ORGANIZAR LOS DATOS

Anotaremos los conceptos básicos para poder construir una tabla de frecuencias:

1. TABLA DE FRECUENCIAS: Una tabla de frecuencias es un conjunto ordenado de los


posibles valores (medición estadística) que toma una variable. El número de posibles
valores lo representamos mediante k (llamadas clases).

2. FRECUENCIA: Es el número de veces que se repite en una población o muestra, cada


una de las categorías o niveles de una variable categórica, o los valores posibles de una
variable cuantitativa.
3. FRECUENCIA ABSOLUTA: Es la frecuencia en números absolutos. La suma de las
frecuencias absolutas es igual al total de unidades bajo estudio.
4. FRECUENCIA RELATIVA: Es igual al cociente entre la frecuencia absoluta de un
valor o categoría por la frecuencia total de la variable correspondiente. El total de las
frecuencias relativas de una distribución es igual a uno. Se acostumbrar multiplicar por
100 a la frecuencia relativa (frecuencia porcentual)

III. TABLAS Y GRÁFICOS DE FRECUENCIAS

Las partes principales son:


1. Número de orden: Se emplea para facilitar la referencia a la tabla en el texto. Debe
asignársele un número consecutivo a cada tabla siguiendo el orden en que se citan por
primera vez en el texto.
2. Título: Debe ser completo, claro y conciso, debe reflejar claramente en qué consiste el
contenido y con qué criterios se clasificaron los elementos a que se hace referencia,
ubicándolo además en tiempo y lugar. (¿Dónde?, ¿Qué?, ¿Cómo? y ¿Cuándo?)
3. Cuadro o cuerpo de la tabla: Constituido por un grupo de casillas o celdas formadas por
el entrecruzamiento de filas y columnas. La primera fila se reserva para indicar a qué se
refieren los datos subyacentes y que unidad de medida se utilizó. En la primera columna
se reflejan las diferentes clases según el tipo de variable (categorías, niveles o valores
de una variable), en el resto de columnas se consideran las diferentes frecuencias.
4. Notas explicativas o píe: Sirven para indicar la fuente de donde se obtuvieron los datos
y, de ser pertinente, la significación estadística o alguna breve nota aclaratoria del
contenido, que puede indicarse por llamadas mediante símbolos colocados como
exponentes.

Un gráfico estadístico tiene las mismas partes, salvo que en lugar de cuadro o cuerpo, es una
figura geométrica plana o espacial.

3.1 CONCEPTOS BÁSICOS

Anotaremos los conceptos básicos para poder construir una tabla de frecuencias:

1. TABLA DE FRECUENCIAS: Una tabla de frecuencias es un conjunto ordenado de los posibles


valores (medición estadística) que toma una variable. El número de posibles valores lo
representamos mediante k (llamadas clases).
2. FRECUENCIA: Es el número de veces que se repite en una población o muestra, cada una de
las categorías o niveles de una variable categórica, o los valores posibles de una variable
cuantitativa.
3. FRECUENCIA ABSOLUTA: Es la frecuencia en números absolutos. La suma de las frecuencias
absolutas es igual al total de unidades bajo estudio.
4. FRECUENCIA RELATIVA: Es igual al cociente entre la frecuencia absoluta de un valor o
categoría por la frecuencia total de la variable correspondiente. El total de las frecuencias
relativas de una distribución es igual a uno. Se acostumbrar multiplicar por 100 a la frecuencia
relativa (frecuencia porcentual)

3.2 PARTES DE UNA TABLA DE FRECUENCIAS

Las partes principales son:

1. Número de orden: Se emplea para facilitar la referencia a la tabla en el texto. Debe asignársele
un número consecutivo a cada tabla siguiendo el orden en que se citan por primera vez en el
texto.
2. Título: Debe ser completo, claro y conciso, debe reflejar claramente en qué consiste el
contenido y con qué criterios se clasificaron los elementos a que se hace referencia, ubicándolo
además en tiempo y lugar. (¿Dónde?, ¿Qué?, ¿Cómo? y ¿Cuándo? )
3. Cuadro o cuerpo de la tabla: Constituido por un grupo de casillas o celdas
formadas por el entrecruzamiento de filas y columnas. La primera fila se reserva
para indicar a qué se refieren los datos subyacentes y que unidad de medida se
utilizó. En la primera columna se reflejan las diferentes clases según el tipo de
variable (categorías, niveles o valores de una variable), en el resto de columnas
se consideran las diferentes frecuencias.
4. Notas explicativas o píe: Sirven para indicar la fuente de donde se obtuvieron
los datos y, de ser pertinente, la significación estadística o alguna breve nota
aclaratoria del contenido, que puede indicarse por llamadas mediante símbolos
colocados como exponentes.

Un gráfico estadístico tiene las mismas partes, salvo que en lugar de cuadro o cuerpo, es
una figura geométrica plana o espacial.

3.3 TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS DE VARIABLES CATEGÓRICAS

La tabla de frecuencias tiene k categorías o niveles, según sea la escala de medición


empleada y se indica el número de veces que se repite cada posible valor (categorías o
niveles), llamado frecuencia o frecuencia absoluta ( f i ).

A partir de la frecuencia absoluta se calcula la frecuencia relativa hi  o porcentual hi x100,
obtenida

como:

Para facilitar la interpretación, cada tabla se debe acompañar con un GRÁFICO adecuado,
que puede ser:

1. Gráfico circular: Útil para representar el tamaño relativo (%) de cada categoría o
nivel de una variable categórica y que es proporcional a cada sector del círculo.
2. Gráfico de barras simples: Tiene la misma función que el gráfico anterior, pero se
suele usar para representar el tamaño absoluto (también puede ser porcentual)
de cada categoría o nivel de una variable categórica y es proporcional a la longitud
de la barra. Se pueden emplear barras horizontales o verticales. El gráfico se
construye a partir de los ejes cartesianos.
Cada sector o barra debe ser coloreada o sombreada de diferente forma o color
(contrastantes).
Ejemplo 1: Se han analizado datos de 90 pacientes que fueron diagnosticadas de carcinoma
mamario en el año pasado, en cierto hospital y se clasificaron en los siguientes subgrupos:

1: carcinoma mamario in situ, 2: enfermedad locorregional


3: Enfermedad metastásica en el momento del diagnóstico

1 3 3 2 3 3 3 2 3 3 3 3 3 1 3 3 3 2

3 3 3 3 3 3 3 3 1 3 3 2 3 3 2 3 3 2

2 3 3 3 1 3 3 3 3 2 3 3 3 1 2 3 3 3

3 1 3 2 3 3 2 3 2 3 3 3 2 3 3 2 3 1

3 3 3 1 3 3 3 1 3 3 1 3 3 3 3 3 3 3
1
a) Construya la tabla de frecuencias respectiva, e b) Presentar mediante gráficos pertinentes los datos
interprete. recolectados.

3.4 TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS DE VARIABLES CUANTITATIVAS


DISCRETAS

Para elaborar la tabla de frecuencias se sigue los siguientes pasos:

1. Se calcula el rango Rde los datos de la variable cuantitativa discreta y está dado por:
R  Máx(X )  Min(X ) , si es corto o pequeño, continuar.

2. Presentan los posibles valores de la variable cuantitativa discreta ordenadamente


(ascendente o descendente). El número posibles valores lo representamos
mediante k (clases),
3. Para cada valor posible se indica el número de veces que se repite cada uno
de ellos, llamado frecuencia o frecuencia absoluta  f i  y se puede calcular las
siguientes frecuencias:

3.1 Frecuencia relativa hi  o porcentual hi x100 , obtenida como para tablas de
datos categóricos.

3.2 Frecuencia Absoluta acumulada, para la j-ésima clase : Fj  f i ,


i1

j  1,2..., k que viene a ser la suma de frecuencias absolutas de un valor de la variable con
todas las anteriores.
2
Ejemplo 2: El número de hijos por hogar que declaran en una encuesta de
salud pública realizado en el distrito de Pueblo Libre (junio 2017) es.

2 1 0 3 4 2 2 3 2 3 1 0 1 1 3 4
3 4 2 4 0 3 0 2 3 0 3 4 4 2 4 1
1 2 4 1 1 0 2 2 0 3 4 0 1 4 0 2
4 3 2 3 2 1 0 0 2 4 0 4 1 0 2 2
2 1 1 2 3 3 2 1 3 1 3 1 4 0 1 2

a) Construya la tabla de frecuencias respectiva, e b) Presentar mediante un gráfico los datos


interprete. recolectados.

3.5 TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS DE VARIABLES CUANTITATIVAS


CONTINUAS

El proceso de construcción de una distribución de frecuencias para una variable cuantitativa


discreta con muchos valores es similar al de una variable cuantitativa continua, para su
organización y posterior análisis, es necesario agruparlos en clases o intervalos. Esta forma
de organización se conoce con el nombre de DISTRIBUCION DE FRECUENCIAS. En este
proceso se produce una pérdida de información producto de la condensación de los datos,
para minimizar está perdida de información se realiza la siguiente metodología, los pasos
de la metodología que vamos a realizar son los siguientes:

1. Calcular el Rango o Recorrido (R)


R=Dato Mayor (Xmáx)-Dato menor (Xmín)
2. Determinar el número de clases o grupos (K). El número de clases, es el
número de categorías o intervalos en el que se va dividir los datos y se puede
determinar por:
La ley de Sturges: K=1+3.3*log(n o N)
3

3. Determinación de la amplitud del intervalo (A). Llamado también ancho de


clase, la amplitud es la cantidad de datos que están comprendidos en un
intervalo de clase

 Ai es entero.
4. Calculo del Rango Final (R’)
R’=Ai*K,
Donde: Ai y K pueden haber sufrido alguna variación a través del redondeo no
convencional.

5. Calculo del Exceso (E). E= R’-R


6. Determinar los extremos de los intervalos de clase más conocidos como
límite inferior y límite superior de cada intervalo de clase (L i, Ls)

7. Determinar los intervalos (Ii y Is)


4
En cuanto a los gráficos, para representar datos de variable cuantitativa continua puede
emplearse:

1. El histograma que representan a los intervalos de clase


conjuntamente con sus frecuencias absolutas o relativas, simples.
2. El polígono de frecuencias, emplea los intervalos de clases y sus respectivas
frecuencias (absolutas o relativas), si emplea las frecuencias relativas
acumuladas, el grafico recibe el nombre de ojiva.

Para ambos gráficos se emplea el plano cartesiano, tal que el eje horizontal, está
reservado para representar a los datos de la variable (intervalos de clase o marcas
de clase) y el eje vertical representar a las frecuencias.

Ejemplo 3.

Supongamos que hemos recogido información sobre consumos de proteínas (medido en


gramos) en una muestra de 20 niños entre 1 y 6 años de edad, y que corresponden al
estudio de los niños desnutridos de la comunidad de Pomallucay de la provincia de San
Marcos-Ancash. Los datos son los siguientes:

16 19 21 23 26
17 20 22 23 27
18 20 22 24 29
19 21 23 25 35
5
Se solicita:
a) Construir la tabla de frecuencias para la variable de interés.
b) Interprete algunos valores de las frecuencias
Solución:
1. Calcular el Rango o Recorrido (R)
R=Dato Mayor (Xmáx)-Dato menor (Xmín)

2. Determinar el número de clases (K=1+3.3*log(n)

3. Determinación de la amplitud del intervalo (A).

4. Calculo del Rango Final (R’)


R’=Ai*K,

5. Calculo del Exceso (E). E= R’-R


6
6. Determinación de los intervalos (Ii y Is)

Ejemplo 4:

Considerando la misma población del ejemplo 1, se ha medido el tamaño del carcinoma (cm),
los datos son:

2 1.9 2.4 1.8 2 1.6 2.8 5.6 1.9 3.1 3 1.9 2.7 1.8 3 2.6 2.2 2.1

2.1 2.4 3 3.2 3.8 4 1.6 1.9 1.9 2.3 3.2 1.7 3.1 2.7 2.6 2.4 3.8 6

3.4 3.1 2.2 3.7 1.5 2.8 2.1 3.3 4.3 5 3.3 4.3 2.8 2 5.9 2.1 4 3.5

2 1.2 3.3 5.6 4.5 4 1.6 2.9 5.3 1.4 4.7 3.6 1.7 3.1 2.7 2.3 3.2 1.5

2 1.4 3 2 3.1 4.2 3 1.3 1.8 2 1.8 2.1 2.7 3 3.2 3.8 4 3.9

a) Con la guía de su profesor, construya la tabla de frecuencias para estos datos.


b) Elaborar e interpretar el histograma.
c) Elaborar e interpretar el polígono de frecuencias sin acumular y acumuladas (ojiva).

Mg. Violeta Nolberto Sifuentes

Mg. Fernando Camones Gonzales

01/04/2019 Y 08/04/2019
7

También podría gustarte