Está en la página 1de 46

BIOESTADISTICA I

CURSO 2014
Estadstica Descriptiva
Medidas de Resumen I
Raquel Correa Luna





Conocer y calcular las diferentes medidas de
localizacin (tendencia central y posicin)

Conocer y calcular las diferentes medidas de dispersin

Conocer y calcular medidas de asimetra

Identificar y comparar mtodos numricos para resumir
datos

Saber seleccionar las medidas de resumen ms
adecuadas a diferentes tipos de datos

OBJETIVOS DE LA CLASE
Clases f F fr Fr
330-345 3 3 0,09 0,09
345-360 3 6 0,09 0,17
360-375 4 10 0,11 0,29
375-390 12 22 0,34 0,63
390-405 7 29 0,20 0,83
405-420 4 33 0,11 0,94
420-435 2 35 0,06 1,00
TOTAL 35 1,00
n f =

frecuencia
ABSOLUTA
ACUMULADA
frecuencia
RELATIVA
ACUMULADA
n
F
Fr =
MARCA DE CLASE (O PUNTO MEDIO)
5 337
2
345 330
2
.
Ls Li
=
+
=
+
337.5
352.5
367.5
382.5
397.5
412.5
427.5
MEDIDAS DE RESUMEN DE DATOS NUMERICOS
Se podra condensar la informacin contenida en los
datos con algunos pocos valores que la expresen de forma
clara y concisa ?
PARMETROS
Caractersticas medibles de una
poblacin.
Representadas por letras griegas.
Valor fijo para una poblacin dada.
ESTADSTICOS
Caractersticas medibles de una
muestra, usadas para estimar
parmetros poblacionales.
Representadas por letras latinas.
Variable para la poblacin de muestras
(cambia de muestra en muestra).
poblacin
muestras

RESUMEN NUMERICO DE DATOS
Medidas de Localizacin (posicin)
.





Medidas Dispersin




Medidas de Asimetra
Coeficiente de Asimetra

Valores que tienden
a representar mejor
al conjunto de datos
Medidas de Tendencia Central
Media Aritmtica
Mediana
Moda
Cuantiles (separatrices)
Cuartiles, Quintiles, Deciles,
Percentiles
Medida de informacin
respecto a la cantidad
de variabilidad
presente en un conjunto
de datos.
Amplitud Total
Semirecorrido Intercuartlico
Varianza
Desviacin Tpica
Medida de la forma de la
distribucin
Medidas de Posicin o Localizacin
De tendencia central : MODA, MEDIANA , MEDIA aritmtica
Cuantiles o Separatrices: CUARTILES, DECILES, PERCENTILES

Identifican una la posicin en una distribucin, se utilizan para
describir o representar lo mejor posible una distribucin de
frecuencias, pero tambin son valores de referencia para una
comparacin con otras distribuciones de frecuencia. Adems,
para un valor de una caracterstica de una observacin
individual, se puede determinar la posicin relativa de esa
unidad con respecto a las otras unidades estudiadas.
Media Aritmtica

1
N
i
i
x
N

=
=

n
i
i
x
x
n
=

1
k
i
i
i
x f
N

-
=
=

1 1
1
k k
i i
i i
i i
k
i
i
x f x f
x
n
f
- -
= =
=
= =

poblacin muestra
agrupar
datos sin
datos
agrupados
EJEMPLO
(4.37+4.87+4.35+3.92+4.68+4.54+5.24+4.57+4.59+4.66+4.40+4.73+4.83+4.21) 14
63.96
4.57 /
14
x
x mmol l
=
= =
Se toma una muestra de 14 perros y se determina su
valor K en plasma (mmol/l):
4.37, 4.87, 4.35, 3.92, 4.68, 4.54, 5.24, 4.57, 4.59, 4.66, 4.40, 4.73, 4.83, 4.21
Calcular la media aritmtica para los datos sin agrupar
Clases X
i
f X
i
(f
i
) X
i
(f
i
) X
i
(f
r
)
330-344 337 3 337(3) 1011 28,89
345-359 352 3 352(3) 1056 30,17
360-374 367 4 367(4) 1468 41,94
375-389 382 12 382(12) 4584 130,97
390-404 397 7 397(7) 2779 79,40
405-419 412 4 412(4) 1648 47,09
420-434 427 2 427(2) 854 24,40
TOTAL 35 13400 382,86
EJEMPLO para datos agrupados
Marca de
clase

= x fr

.
CARACTERSTICAS DE LA MEDIA ARITMTICA
til para comparar poblaciones
No se puede calcular con clases extremas abiertas
ej: 1,2, 3 , 4, 4,6 media= 20/6 = 3,33
1, 2, 3, 4, 4, 16 media= 30/6 =5
ej.: (1- 5)+(2-5)+(3-5)+(4-5)+(4-5) +( 16- 5) = 0

Calculada para datos en escala de Intervalo y Proporcin (Razn)
Centro de gravedad de la distribucin
nica para un conjunto dado de datos
Sensible a todos los valores del conjunto de datos, sobre todo extremos

La suma de desvos de los datos con respecto a la media es 0

MEDIANA
Definicin
Valor de los datos ordenados, que deja por debajo de s, el
50% de las observaciones

Caractersticas
Calculada para datos en escala Ordinal, Intervalo y Proporcin (razn)
nica para un conjunto dado de datos
Fcil de determinar en datos no agrupados

No es influenciada por valores extremos
Se puede calcular con clases con extremos abiertos

Mediana o Percentil 50
MEDIANA
2) Aplicar la frmula de clculo

i
Mn x =
1
2
n
i
+
=
i
2
a
n
F
Mn L h
f

= +
Sin Agrupar:
1) Ordenar
2) Determinar el n de posicin i


3) Hallar el valor de x en la posicin i
Datos Agrupados
1) Determinar la clase que contiene la Mn buscando la primera clase con Fr>0,50
O bien : Buscar la clase que contiene la Mn por el n de posicin i, buscando la
primera clase con F > i
Es el valor de la variable que divide a las observaciones en dos
grupos con el mismo nmero de individuos (percentil 50).
Si el nmero de datos es par, se elige la media de los dos datos
centrales
MEDIANA ( P50, Q2)
Mn es 5
Si el nmero de observaciones es IMPAR 1, 2, 4, 5, 6, 6, 8
Si el nmero de observaciones es PAR 1, 2, 4, 4, 5, 6, 6, 8
Mn es (4+5)/2 = 4,5
314 991 789 556 412 499 350 863 455 297
598 510 388 642 474 333 421 685 536
297 314 333 350 388 412 421 455 474 499
510 536 556 598 642 685 789 863 991
Datos
No Ordenados
Datos Ordenados
Pesos en gr de 19 cobayos:
Mediana .- ejemplo datos sin agrupar
2) Determinar el n de posicin
1
2
n
i
+
=
10
2
1 19
=
+
3) Hallar el valor de x en la posicin i =10
Mn =499
Clases Xi f F fr Fr
330-345 337 3 3 0,09 0,09
345-360 352 3 6 0,09 0,18
360-375 367 4 10 0,11 0,29
375-390 382 12 22 0,34 0,63
390-405 397 7 29 0,20 0,83
405-420 412 4 33 0,11 0,94
420-435 427 2 35 0,06 1,00
TOTAL 35 1,00
Clases Xi f F fr Fr
330-345 337 3 3 0,09 0,09
345-360 352 3 6 0,09 0,18
360-375 367 4 10 0,11 0,29
375-390 382 12 22 0,34 0,63
390-405 397 7 29 0,20 0,83
405-420 412 4 33 0,11 0,94
420-435 427 2 35 0,06 1,00
TOTAL 35 1,00
CALCULO de la MEDIANA para datos agrupados
1) Determinar la posicin
18 5 . 0 ) 1 35 ( = +
2) clase que contiene la Mediana
375 = Li
3) Realizar la interpolacin para hallar el valor de la Mn
i
2
a
n
F
Mn L h
f

= +
5 . 382 5 . 7 375 15
12
10
2
35
375 = + =

+ = Mn
Extensin del intervalo h = 390-375
Clases Xi f F fr Fr
330-344 337 3 3 0,09 0,09
345-359 352 3 6 0,09 0,17
360-374 367 4 10 0,11 0,29
375-389 382 12 22 0,34 0,63
390-404 397 7 29 0,20 0,83
405-419 412 4 33 0,11 0,94
420-434 427 2 35 0,06 1,00
TOTAL 35 1,00
EJEMPLO datos agrupados: el resultado
es diferente para diferentes agrupamientos
383,9 Kg
Clase que contiene
la mediana
EJEMPLO
Distribucin de frecuencias relativas acumuladas
de los pesos de novillos. FV. 2002
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
330 345 360 375 390 405 420 435
Marcas de Clase Kg
F
r

Se puede calcular con clases con extremos abiertos

Caractersticas de la Mediana
Calculada para datos en escala Ordinal, Intervalo y Proporcin (razn)
nica para un conjunto dado de datos
Fcil de determinar en datos no agrupados
No es influenciada por valores extremos
1, 2, 4, 5, 6, 6, 800.
La media es 117,7
La mediana es 5
Caractersticas
til para medidas nominales y ordinales
No se afecta por valores extremos
Se puede utilizar con clases abiertas
Puede no existir o no ser nica
MODA
Definicin : Valor de la variable con mayor frecuencia
datos sin agrupar
297 314 333 350 388 412 421 455 455 455
466 466 502 502 542 587 601 621 629
Mo = 455
Poblacin o Muestra
Moda
MODA datos agrupados
h Li Mo .
2
1
1
A +
A
A
+ =
1) Determinar la clase que contiene la Moda
2) Aplicar la frmula:
A
1
Diferencia entre la
frecuencia de la clase modal y
la clase anterior
A
2
Diferencia entre la
frecuencia de la clase modal y
la clase siguiente
Extensin del intervalo h = 390-375
23 . 384 23 . 9 375 15
5 8
8
375 = + =
+
+ = Mo
Clases Xi f F fr Fr
330-345 337 3 3 0,09 0,09
345-360 352 3 6 0,09 0,18
360-375 367 4 10 0,11 0,29
375-390 382 12 22 0,34 0,63
390-405 397 7 29 0,20 0,83
405-420 412 4 33 0,11 0,94
420-435 427 2 35 0,06 1,00
TOTAL 35 1,00
Clases Xi f F fr Fr
330-345 337 3 3 0,09 0,09
345-360 352 3 6 0,09 0,18
360-375 367 4 10 0,11 0,29
375-390 382 12 22 0,34 0,63
390-405 397 7 29 0,20 0,83
405-420 412 4 33 0,11 0,94
420-435 427 2 35 0,06 1,00
TOTAL 35 1,00
CALCULO de la MODA para datos agrupados
1) Determinar la clase que contiene la Moda
2) Realizar la interpolacin para hallar el valor de la Mo
375 = Li
h Li Mo
2 1
1
A + A
A
+ =
A
1
= 12 4 = 8 A
2
= 12 7 = 5
A
1

A
2


A1
A2
x
Li
Limite inferior de la clase modal
Mo
forma grafica de determinar la moda
CUAL MEDIDA DE TENDENCIA CENTRAL USAR?
Se debe considerar:
Escala de Medicin
Forma de la Distribucin

MEDIA
Datos Numricos y distribuciones Simtricas

MEDIANA
Datos Ordinales o Numricos con distribuciones
Sesgadas

MODA
Datos Nominales y distribuciones bimodales
Histograma
0
2
4
6
8
10
12
14
16
100 110 120 130 140 150 160 170 180
Hb
f
media ( ) x
mediana ( Mn )
moda ( Mo )
Relacin entre las medidas de tendencia central
1/3
2/3
en las distribuciones simtricas
coinciden las 3 medidas
26
0.20
0.80
0.40
P20 P40 P80
Cuantiles o Separatrices
Valor de la variable que deja por debajo un porcentaje
determinado de las observaciones. PERCENTILES

P20 (Percentil20 ) valor de x que deja por debajo el 20% de las observaciones
P40 (Percentil40 ) valor de x que deja por debajo el 40% de las observaciones
x
Percentiles
Cuartiles
Deciles
1) Ordenar
2) Determinar el n de posicin i







posicin del percentil :
i = ( n +1) r /100
i = ( n +1) p
Si i no es entero tomar el punto medio entre los valores x
int(i)
x
int(i+1)
h
f
Fa
100
n.r
Li Pr

+ =
posicin del percentil :
i = 1 + ( n-1) r/100
Para interpolar considerando la fraccin obtenida
Cuantiles o Separatrices
P = x
i
Sin Agrupar:
Datos Agrupados
1) Determinar la clase que contiene el percentil
2) Aplicar la frmula de clculo
posicin
(mol/l)
Cuantiles
(mol/l)
(mol/l)
suma
posicin Xi
1 2,5 -2,06 4,2354 6,3
2 2,9 -1,66 2,7490 8,4
3 3,3 -1,26 1,5826 10,9
4 3,4 -1,16 1,3410 11,6
5 3,5 -1,06 1,1194 12,3
6 4,2 -0,36 0,1282 17,6
7 4,9 0,34 0,1170 24,0
8 5,1 0,54 0,2938 26,0
9 5,4 0,84 0,7090 29,2
10 5,6 1,04 1,0858 31,4
11 6,9 2,34 5,4850 47,6
12 7,0 2,44 5,9634 49,0
13 54,7 0,00 24,8092 274,2
i
x x
2
( )
i
x x
2
i
x
Ejemplo: concentracin de vit. E (mol/l)en vaquillonas
con signos clnicos de carencia
Quartiles datos sin agrupar
P50= Q2 = Mn= 4.55
P25
P75
Clases Xi f F fr Fr
330-344 337 3 3 0,09 0,09
345-359 352 3 6 0,09 0,17
360-374 367 4 10 0,11 0,29
375-389 382 12 22 0,34 0,63
390-404 397 7 29 0,20 0,83
405-419 412 4 33 0,11 0,94
420-434 427 2 35 0,06 1,00
TOTAL 35 1,00
EJEMPLO datos agrupados P
90
413,9 Kg
Clase que contiene el El
P
90

EJEMPLO P
90
Distribucin de frecuencias relativas acumuladas
de los pesos de novillos. FV. 2002
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
330 345 360 375 390 405 420 435
Marcas de Clase Kg
F
r
MEDIDAS DE DISPERSION
Proporciona informacin acerca de la variabilidad
presente en un conjunto de datos

Amplitud Total ( A )
Desviacin Media Absoluta
Varianza (poblacin:
2
muestra s
2
)
Desviacin Estndar (Tpica) (poblacin:

muestra s

)
Coeficiente de Variacin ( CV )
Semirecorrido Intercuartlico (Desviacin Cuartlica) Q

dispersin
Ejemplo: concentracin de vit. E (mol/l)en
vaquillonas con signos clnicos de carencia
Xi
2,5 -2,06 4,2354 6,3
2,9 -1,66 2,7490 8,4
3,3 -1,26 1,5826 10,9
3,4 -1,16 1,3410 11,6
3,5 -1,06 1,1194 12,3
4,2 -0,36 0,1282 17,6
4,9 0,34 0,1170 24,0
5,1 0,54 0,2938 26,0
5,4 0,84 0,7090 29,2
5,6 1,04 1,0858 31,4
6,9 2,34 5,4850 47,6
7,0 2,44 5,9634 49,0
54,7 0,00 24,8092 274,2
i
x x
2
( )
i
x x
2
i
x
7.0 2.5 4.5
S I
A L L = = =
Amplitud
mol/l
Amplitud
suma
Ej.: Amplitud con Datos Agrupados
Clases Xi f
330-344 337 3 1011 6309,4 340707
345-359 352 3 1056 2857,0 371712
360-374 367 4 1468 1006,2 538756
375-389 382 12 4584 8,9 1751088
390-404 397 7 2779 1399,6 1103263
405-419 412 4 1648 3396,6 678976
420-434 427 2 854 3896,7 364658
TOTAL 35 13400 18874,3 5149160
2
( )
i i
x x f
i i
x f
2
i i
x f
434.5 329.5 105 A= =
Varianza

poblacin
muestra
agrupar
datos sin
datos
agrupados
( )
1
2
2

=

n
x x f
s

( )
1
2
2

=

n
x x f
s

1
k
i
i
i
x f
N

-
=
=

o
2
=
( )
1
2
2

=

n
x x f
s

1
k
i
i
i
x f
N

-
=
=

o
2
=
( )
1
2
2

=

n
x x f
s

( )
1 - n
x x
2


=
2

s
la varianza es el promedio de los cuadrados de los desvos
con respecto a la media (MC)
suma de cuadrados de
los desvos (SC)
grados de libertad (gl)
La divisin por n-1 asegura que la varianza muestral sea una estimacin centrada de la
varianza poblacional
Es sensible a valores extremos (alejados de la media).
Sus unidades son el cuadrado de las unidades de la variable
DESVIACIN TPICA
Es la raz cuadrada de la varianza

2

S S =
Tiene las mismas unidades que la variable.
Ejemplo: concentracin de vit. E (mol/l)en vaquillonas
con signos clnicos de carencia
X
2.5 -2.06 4.2354 6.3
2.9 -1.66 2.7490 8.4
3.3 -1.26 1.5826 10.9
3.4 -1.16 1.3410 11.6
3.5 -1.06 1.1194 12.3
4.2 -0.36 0.1282 17.6
4.9 0.34 0.1170 24.0
5.1 0.54 0.2938 26.0
5.4 0.84 0.7090 29.2
5.6 1.04 1.0858 31.4
6.9 2.34 5.4850 47.6
7.0 2.44 5.9634 49.0
54.7 0.00 24.8092 274.2
i
x x
2
( )
i
x x
2
i
x
54.7
4.56
12
x = =
2
2
24.8092
2.26
11
2.26 1.5
S
S S
= =
= = =
2
2
2 1
2
2
( )
1
54.7
274.2
12
2.26
12 1
n
i
i
i
x
x
n
S
n
S
=

=

= =

Varianza y Desviacin Estndar


muestrales (datos sin agrupar)
1.5
100 100 32.9%
4.56
S
CV
x
= = =
Coeficiente de Variacin
E


Es el cociente entre la desviacin tpica y la media.
Expresa la desviacin tpica en forma relativa a la media

Es frecuente indicarla en porcentajes
Si la media es 80 y la desviacin tpica 20 entonces
CV =20/80 = 0,25 = 25% (variabilidad relativa)

Es adimensional. Puede usarse para comparar la variabilidad de diferentes
variables.
Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan
ms dispersin en peso que en altura.

No debe usarse cuando la variable presenta valores negativos o donde el valor 0
sea una cantidad fijada arbitrariamente
Por ejemplo 0C 0F


x
s
CV

=
Coeficiente de variacin
Ej.: Varianza, Desviacin y CV con Datos Agrupados
Clases Xi f
330-344 337 3 6309.4 1011 340707
345-359 352 3 2857.0 1056 371712
360-374 367 4 1006.2 1468 538756
375-389 382 12 8.9 4584 1751088
390-404 397 7 1399.6 2779 1103263
405-419 412 4 3396.6 1648 678976
420-434 427 2 3896.7 854 364658
TOTAL 35 18874.3 13400 5149160
2
( )
i i
x x f
i i
x f
2
i i
x f
2
2 1
( )
18874.3
555.13
( ) 1 34
k
i i
i
i
X X f
s
f
=

= = =

2
2
1
2
1
( )
1
n
n
i i
i
i i
i
f X
f X
n
S
n
=
=

=

2
2
13400
5149160
35
555.13
34
S

= =
23.6
6.2%
382.86
CV = =
2
555.13 23.6 S S = = =
Clases Xi f F fr Fr
330-345 337 3 3 0.09 0.09
345-360 352 3 6 0.09 0.17
360-375 367 4 10 0.11 0.29
375-390 382 12 22 0.34 0.63
390-405 397 7 29 0.20 0.83
405-420 412 4 33 0.11 0.94
420-435 427 2 35 0.06 1.00
TOTAL 35 1.00
Ej.: Semirrecorido Intercuartilico con Datos
Agrupados
P
25

P
75

Ej.: Semirrecorido Intercuartilico con Datos Agrupados
1
1
1
4
8.75 6
360 15 370.31
4
a
i
n F
Q L h
f
Q

= +

= + =
3
3
3
4
26.25 22
390 15 399.11
7
a
i
n F
Q L h
f
Q

= +

= + =
Clases Xi f F fr Fr
330-345 337 3 3 0.09 0.09
345-360 352 3 6 0.09 0.17
360-375 367 4 10 0.11 0.29
375-390 382 12 22 0.34 0.63
390-405 397 7 29 0.20 0.83
405-420 412 4 33 0.11 0.94
420-435 427 2 35 0.06 1.00
TOTAL 35 1.00
Cual medida de dispersin utilizar?
DESVIACIN TPICA
Se emplea cuando tambin es apropiado utilizar la media
(simetra, datos numricos)
SEMIRECORRIDO INTERCUARTILICO
Cuando se usa la mediana (datos ordinales o numricos
sesgados, intervalos abiertos)
AMPLITUD
Cuando se quiere poner el nfasis en datos numricos extremos
COEFICIENTE DE VARIACION
Cuando se quiere comparar distribuciones numricas medidas en
escalas o unidades diferentes
42
medidas de tendencia central y dispersin
forman DUOS
Media -
Varianza y
desviacin tpica
Mediana -
Semirrecorrido
intercuartlico
Moda -
Amplitud total
Segn teora de momentos
Segn el mtodo de las separatrices
Segn el mtodo de los extremos
Datos numricos
distribuciones simtricas o asimtricas
con muchas observaciones
Datos ordinales o numricos
distribucin asimtrica y con pocas
observaciones-
Datos nominales
Distribuciones bimodales
medidas de asimetra (sesgo)
asimetra positiva

asimetra negativa
distribucin simtrica
FORMA DE LADISTRIBUCION
Es nulo cuando la distribucin
es simtrica
Coeficiente de asimetra


s
Mn x
as

3

=
as = +
as = -
MEDIDAS DE ASIMETRA o SESGO
382.9 384.4
3 3 0.19
23.6
x Mn
CA
S

= = =
TIPOS DE CURVAS
SIMTRICA
las observaciones equidistan del mximo central con
la misma frecuencia. Coinciden Media, Moda y
Mediana
ASIMTRICA
la cola ms larga determina la direccin del sesgo. Se
separan la Media, Mediana y Moda
BIMODAL
MULTIMODAL
Prximo terico:

Representacin Grfica
MUCHAS GRACIAS

También podría gustarte