Está en la página 1de 19

BIOESTADISTICA

JENNIE MILDRED PEREZ HERNANDEZ


UNIDAD 2
DATOS AGRUPADOS
Tabla de Frecuencia

Si se tiene una serie de datos, primero hay que


organizarlos en forma ordenada y en subconjuntos
que presenten caractersticas similares. (Misma
escuela, mismo sexo, misma finalidad, misma
estatura, etc.).

Los DATOS AGRUPADOS se pueden resumir


grficamente o en tablas y mediante medidas
numricas que obtendremos posteriormente como
la media, la mediana, la desviacin estndar, etc.
Los datos ordenados en grupos o categoras reciben
el nombre de DISTRIBUCION DE FRECUENCIAS.
Para obtener el RANGO de una distribucin de frecuencias, se realiza la diferencia entre el mayor y el menor de los

datos.

Cuando se tiene un gran nmero de datos, abra que distribuirlos en CLASES, CATEGORIAS o INTERVALOS y

determinar con exactitud el nmero de elementos pertenecientes a cada clase, esto ltimo se conoce como

FRECUENCIA DE CLASE.

La utilidad de lo anterior es que se puede analizar con mayor facilidad un conjunto de nmeros sin que se tenga que

considerar cada nmero.

Para obtener una DISTRIBUCIN DE FRECUENCIAS o TABLA DE FRECUENCIAS basta colocar en una tabla las

clases existentes con sus frecuencias correspondientes y siempre en forma ordenada.

Diremos que los DATOS AGRUPADOS son ahora datos ordenados y resumidos en una distribucin de frecuencias.

Una categora o una clase recibe el nombre de INTERVALO DE CLASE y los nmeros en sus extremos reciben el

nombre de LIMITES DE CLASE (El menor lmite inferior de la clase y el mayor lmite superior de la clase). Hay

intervalos de clase que no poseen lmite superior ni inferior. Estos reciben el nombre de INTERVALO DE CLASE

ABIERTO.
Existen otros lmites de gran importancia llamados LIMITES REALES DE CLASES. Se determinan sumando el
lmite inferior mas es nmero anterior y esto dividido entre dos. As obtenemos el lmite real inferior. Para hallar el
lmite real superior se suma el lmite superior ms el nmero que le sigue y el resultado dividido entre dos.

A partir de los lmites reales de clase podemos calcular el TAMAO O ANCHURA de un intervalo de clase. Basta
con realizar la diferencia entre los lmites reales de clase considerando primero el superior.

La MARCA DE CLASE se obtiene sumando los lmites superior e inferior y dividiendo entre dos. Es fcil observar
que esto es el punto medio del intervalo de clase y por ello tambin la marca de clase se le conoce como punto
medio de clase.

Con la informacin anterior podemos formar las distribuciones de frecuencia con mayor facilidad si consideramos
primero el Rango. Despus de calcularlo, lo dividimos en un nmero conveniente de intervalos de clase del mismo
tamao y considerando al mismo tiempo que las marcas de clase coincidan con datos que fueron observados. Por
ltimo indicamos las frecuencias de clase.

Al construir una distribucin de frecuencias podemos representarla grficamente, ya sea por medio de un
HISTOGRAMA (rectngulo sobre el eje x) o por un POLIGONO DE FRECUENCIAS (grfico de lnea trazado sobre las
marcas de clase).
Distribucin de Frecuencia Relativa
La frecuencia relativa de una clase es la frecuencia de las
clases. El resultado se expresa generalmente como
porcentaje. La suma de las frecuencias relativas de todas las
clases es 1 o 100 %. Una tabla de DISTRIBUCION DE
FRECUENCIAS RELATIVAS o DISTRIBUCION
PORCENTUAL se obtiene al sustituir las frecuencias
relativas por las frecuencias de las clases. Las grficas no
cambian. En la parte vertical de los ejes de coordenadas
nicamente pondramos las frecuencias relativas. Los
grficos que resultan se llaman HISTOGRAMAS DE
FRECUENCIAS RELATIVAS o HISTOGRAMAS
PORCENTUALES y POLIGONOS DE FRECUENCIAS
RELATIVAS o POLIGONOS PORCENTUALES.
Distribucin de Frecuencia Acumulada
Una distribucin de frecuencias acumulada
est diseada para mostrar el nmero o
porcentaje de elementos que son menores
que cierto valor especfico o iguales a ste.
Las distribuciones se pueden convertir
fcilmente a distribuciones acumuladas
mediante sumas sucesivas de frecuencias de
clase, es decir la frecuencia total de todos los
valores menores que el lmite real superior de
clase de un intervalo de clase dado se conoce
como FRECUENCIA ACUMULADA hasta ese
intervalo de clase inclusive.
Ejemplo:
Consideremos la edad de 100 ancianos que varan entre 60 y 74
aos.
Demostracin.
Rango = Valor mayor Valor menor
62 72 72 69 69 69 61 68 71 71
= 74-60 = 14 aos
64 67 64 67 60 64 67 62 64 67
65 64 74 64 73 65 63 74 64 63 Una forma de obtener el Nmero
de Intervalos es obteniendo la
73 64 67 73 71 71 67 65 67 67 raz cuadrada al numero total de
datos observados y se redondea al
67 63 63 63 64 71 64 74 71 71
numero inmediato.
70 67 70 66 70 67 70 66 70 66 Nmero Intervalo N

66 68 66 66 69 67 67 68 68 68
La Amplitud del Intervalo es la
68 66 68 70 70 66 67 66 66 70 divisin del Rango sobre los nmeros
68 68 68 70 67 67 68 68 67 69 de intervalos.
Rango
67 67 67 70 70 70 70 61 70 70 Amplitud Intervalo
N .I
Aunque para este problema dividiremos todo en seis intervalos de clase. La distribucin de
frecuencias ser por consiguiente.

Aos Nmero de
Frecuencia
Ancianos Frecuencia Re lativa 100%
Intervalos Frecuencia Frecuencia Frecuencia TotalN
Relativa Acumulada Frecuencia Acumulada suma frecuencia relativa
60-62 5 5% 5%
Primer intervalo de clase 60-62
63-65 18 18% 23%
Segundo intervalo de clase 63-65,,etc
66-68 42 42% 65%
Primera frecuencia de clase 5
69-71 27 27% 92% Segunda frecuencia de clase 18,, etc
72-74 8 8% 100%
60 Lmite inferior del primer intervalo de clase
Total 100 62 Lmite superior del primer intervalo de clase

Tamao C=62.5-59.5=3 59 60 119


Lmite Re al Inferior 59.5
Tamao C=65.5-62.5=3,, etc 2 2

60 62 62 63 125
Marca de Clase 61 Lmite Re al Superior 62.5
2 2
2
63 65
Marca de Clase 64,..., etc
2
AOS ANCIANOS

Menor que 59.5 0

Menor que 62.5 5

Menor que 65.5 23

Menor que 68.5 65

Menor que 71.5 92

Menor que 74.5 100


Medidas de Tendencia Central y de Posicin

A menudo es necesario representar un conjunto de datos en trminos de un solo nmero el cual, en


su forma, es descriptivo de todo el conjunto. La eleccin definitiva del nmero depende de la
caracterstica determinada que queremos describir. En un estudio, por ejemplo podramos estar
interesados en los valores extremos (menor y mayor) de los datos; en otro, en el valor que slo es
superado por el 10% de los valores; y en otro ms, en el total de los valores.

Ests medidas se emplean para indicar un valor que tiende a ser el ms representativo de un
conjunto de nmeros. Las tres medidas de mayor importancia son: MEDIA, MEDIANA y MODA.

Otra palabra que se emplea en lugar de medidas de tendencia central es la de PROMEDIOS, es


decir, son valores que tienden a situarse en el centro de un conjunto.
Media
Esta medida de tendencia central posee varias propiedades:

La medida siempre se puede calcular para un conjunto de nmeros.

La medida es nica, es decir, existe una y slo una medida para un conjunto dado de nmeros.

Si sumamos una constante a cada valor del conjunto, la medida aumentar por la misma cantidad. Si en lugar de sumar, se multiplica o
divide sucede lo mismo, es decir, la medida resultara multiplicada o dividida por dicha constante.

Si cambia algn valor del conjunto de nmeros, entonces tambin la medida cambia.
N

La suma de desviaciones de los nmeros de un conjunto a partir de la medida cero, esto xi x 0


es:
i 1

Para una distribucin de frecuencias, la frmula correspondiente de la medida se determina de la siguiente forma.
x , x 2 ,..., x n f , f ,..., f n
Si los nmeros1 se presentan con frecuencias
1 2 veces, respectivamente, la media es:
n n

f x f 2 x 2 ... f n x n f i xi f i xi
x 1 1 i 1
i 1

f 1 f 2 ... f n n
N
fi 1
i

Donde N f es la frecuencia total, es decir el nmero total de casos.

Cuando se tiene una tabla de una distribucin de frecuencias en donde hemos clasificado nuestros datos y deseamos calcular la medida
tenemos que considerar nicamente las marcas de clase de cada intervalo. Estas marcas de clase multiplicadas por las frecuencias y
divididas entre la frecuencia total, nos da como resultado la media.
Mediana
La caracterstica de mayor importancia es que divide un conjunto ordenado en dos grupos
iguales, es decir, la mediana de un conjunto de datos ordenados en orden de magnitud, es
el valor medio o la media de los valores medios. Considerando una distribucin de
frecuencias para datos agrupados, la mediana se obtiene mediante.

N
fai 1
Md Lwi 2 w
fi


i especifica la posicion de la mediana de clase
Lw Limite inf erior del int ervalo de la frecuencia de la mediana de clase
fa frecuencia acumulada de la Mediana de clase
f i frecuencia de la Mediana de clase
w amplitud o longitud del int ervalo

Se determina la mediana de clases cuando la frecuencia acumulada es mayor a N/2


Moda
Para una distribucin de frecuencias, la moda es el valor o los valores mximos de la
curva y se puede calcular por medio de:

d1
Mo Lmo *w
d1 d 2

Lmo Limite inf erior del int ervalo de la clase mod al


d1 frecuencia de la clase mod al menos la frecuencia anterior
d 2 frecuencia de la clase mod al menos la frecuencia posterior
w amplitud o longitud del int ervalo
Medidas de Dispersin
Este tipo de medidas tambin reciben el nombre de MEDIDAS
DE VARIACIN. Las medias de dispersin o variacin se
emplean para saber si los valores estn relativamente cercanos
uno del otro o si se encuentran dispersos. En otras palabras, se
quiere determinar una cantidad que describa la medida en la
cual un conjunto de datos se aleja de su media.

Todas las medidas de variacin, exceptuando la de Amplitud o


Rango de variacin, toman a la media como punto de
referencia.
Desviacin media o Promedio de desviacin
Se emplea para medir el promedio de los alejamientos de los datos observados en la muestra
respecto a la media de estos datos.

Si se desea comprobar el resultado, la suma de las desviaciones alrededor de la media debe ser
cero. Para una distribucin de frecuencias, la desviacin media se determina por:

f i xi x
MD i 1

N numero total de datos


x marcas de clase
x media
f frecuencia de clase

El valor absoluto significa que se deben considerar los alejamientos de los datos, tanto a la izquierda
como a la derecha de la media para incrementar la desviacin promedio.
Varianza
La variancia de una muestra se determina en forma similar que la desviacin media pero con las
siguientes dos diferencias.

1. Las desviaciones se elevan al cuadrado antes de ser sumadas.

2. Se obtiene el promedio, utilizando N-1 en lugar de N. Esto nos permite obtener un resultado mejor
de la variancia.

La variancia para una distribucin de frecuencias se determina por medio de la siguiente formula:

f x x
2
i i
S
2 i 1

N 1
Desviacin Estndar
La desviacin estndar es la raz cuadrada positiva de la varianza. Para obtener la desviacin
estndar se debe calcular la varianza y hallar su raz cuadrada positiva. Entonces la desviacin
estndar queda representada por la letra mayscula S. La desviacin estndar es una de las
medidas ms importantes dentro de la estadstica. Las unidades de esta medida son las mismas que
las de la media.

f x x
2
i i
S i 1

N 1
Coeficiente de Variacin

El coeficiente de variacin es la divisin de la desviacin estndar entre la media, multiplicada por


100

S
C.V * 100
x

También podría gustarte