Está en la página 1de 10

BIOESTADSTICA MAGSTER EN SALUD PBLICA

LECTURA
MEDIDAS DE RESUMEN
Preparado por: Domingo Lancellotti
Objetivos:
1. Conocer las Medidas de Tendencia Central ms utilizadas en el mbito de la Salud
2. Conocer las Medidas de Posicin
3. Conocer las Medidas de Variabilidad o Dispersin
4. Realizar los clculos adecuados para ambos tipos de Medidas

PRESENTACIN
Las Medidas de Resumen son un grupo de indicadores cuantitativos que permiten describir de manera
resumida el comportamiento de un conjunto de datos numricos.

I.

MEDIDAS DE TENDENCIA CENTRAL

Son aquellas Medidas de Resumen que nos indican el comportamiento de los datos en relacin al centro de
la distribucin.
a) Media:
La Media de una variable X cualquiera corresponde al centro de gravedad de la distribucin de los datos (es
el promedio de los datos). Si hacemos referencia a la Media de una poblacin, sta se denota como (m o
mi) y su frmula es:
N

xi

i 1

(1)

El smbolo hace referencia a una sumatoria, mientras que xi corresponde a cada uno de los N datos (N =
total de datos de la poblacin) por lo que la frmula debe ser leda como la suma de los valores de todos los
datos dividido por la cantidad total de datos de la poblacin.
Si hacemos referencia a una porcin de datos representativos de la poblacin una muestra de datos , la
Media se denota como x:
n

xi

i 1
x
n

(2)

Entonces, n corresponde al total de datos de una muestra y la frmula se lee como la suma de los valores de
todos los datos dividido por la cantidad total de datos de la muestra.
Para datos agrupados en una Tabla de Distribucin de Frecuencia, pero NO en intervalos, se recomienda
utilizar la siguiente frmula:
k

xi ni

i 1
x
n

(3)

FACULTAD DE MEDICINA DEPARTAMENTO DE SALUD PBLICA

BIOESTADSTICA MAGSTER EN SALUD PBLICA

Aqu, cada valor xi se multiplica por el nmero de veces que se encuentra en la muestra (o sea, por la
respectiva Frecuencia Absoluta ni ), luego se suman esas k multiplicaciones y, finalmente, se divide por n
(lo que tambin es vlido para N).
Ejercicio 1: Obtener la Media de la variable Edad Gestacional (en semanas) de los recin nacidos de sexo
masculino en la Comuna de Monte Patria, ao 2007 (Base de Datos del Anexo). Aplicando la frmula (1), la
Media es igual a (31 + 30 + 28 + + 40) / 214 = 38,64 semanas.
En la Tabla A1 del Anexo se presenta la Distribucin de Frecuencias de la Edad Gestacional de recin
nacidos de sexo masculino en la Comuna de Monte Patria, ao 2007. Aplicando la frmula (3) la Media es
igual a [(28 x 1) + (29 x 0) + (30 x 1) + + (41 x 18)] / 214 = 38,64 semanas, resultado idntico al obtenido con
la frmula (1).
b) Mediana:
La Mediana de una variable X cualquiera est definida como la medida central del conjunto de datos xi,
ordenados de menor a mayor. Si n es un nmero impar, la Mediana se obtiene como:

Med x(n1)/2

(4)

Si n es un nmero par, la Mediana corresponder a:


.

Med xn/2 x(n/2)1 2

(5)

Aqu, n es el total de datos (lo que tambin es vlido para N) y los subndices nos indican el lugar respectivo
del xi cuyo valor ser considerado en el clculo de la Mediana; por ejemplo, si n = 11, el subndice (n+1)/2
corresponde a (11+1)/2 = 6, lo que quiere decir que en este conjunto de n = 11 datos ordenados de menor a
mayor, el valor del dato que est en el lugar x6 ser la Mediana. Para un n = 12, el subndice (n/2)+1
corresponder a (12/2)+1 = 7, o sea, hay que considerar el valor del x7 del conjunto de n = 12 datos
ordenados de menor a mayor como parte del clculo de la Mediana.
Ejercicio 2: Obtener la Mediana de la variable Edad Gestacional (en semanas) de los recin nacidos de
sexo masculino en la Comuna de Monte Patria, ao 2007 (Base de Datos del Anexo). Como n = 214 (nmero
par) utilizamos la frmula (5), entonces, n/2 corresponde a 214/2 = 107 y (n/2)+1 corresponde a (214/2)+1 =
108; as, una vez ordenados de menor a mayor los n = 214 datos, los valores de los datos x107 y x108 se
suman y, luego, se dividen por 2.
Si bien la Base de Datos referida no est ordenada para esta variable (habra que ordenarla), la Tabla A1 del
Anexo s presenta estos datos ordenados. Por ejemplo, en esta tabla N11 nos dice que 76 datos son iguales
o menores que 38 y N12 nos dice que 138 datos son iguales o menores que 39, o sea, los datos que estn
desde la ubicacin x77 a la ubicacin x138 son todos de valor 39. Por lo tanto, la Mediana de la variable Edad
Gestacional es igual a (x107+x108)/2 que es igual a (39+39)/2 = 39 semanas.
c) Moda:
La Moda de una variable se define como cualquier mximo relativo en la Distribucin de Frecuencias.
Corresponde a cualquier valor de la variable que posee una frecuencia mayor que el valor anterior y que el
posterior, esto es, el valor que poseen la mayor cantidad de datos:
.

Moda max xi

(6)

Ejercicio 3: Obtenga la Moda de la variable Edad Gestacional (en semanas) de los recin nacidos de sexo
masculino en la Comuna de Monte Patria, ao 2007 (Base de Datos del Anexo). En la Distribucin de
Frecuencia realizada con esta variable (Tabla A1) se observa que la mayor cantidad de dados (el valor que
FACULTAD DE MEDICINA DEPARTAMENTO DE SALUD PBLICA

BIOESTADSTICA MAGSTER EN SALUD PBLICA

ms se repite) es el valor 39, se repite 62 veces dentro del conjunto de n = 214 datos. As, la Moda para la
variable Edad Gestacional corresponde a 39 semanas.
RELACIN ENTRE LA MEDIA, MEDIANA Y MODA
En una distribucin Normal (campana de Gauss), la Media, la Mediana y la Moda son iguales:

Media

Moda

Mediana

En una distribucin uniforme, la Media y la Mediana son iguales. Por definicin, no existe la Moda:

Media

Mediana

En una distribucin asimtrica, el orden segn magnitud de las Medidas de Resumen est dado por el sesgo
de la distribucin:
Sesgo Negativo

Media

Mediana

Sesgo Positivo

Moda
Moda

Media

Mediana

En distribuciones con Sesgo Negativo, el orden corresponde a Media < Mediana < Moda, mientras que en
distribuciones con Sesgo Positivo la Moda < Mediana < Media. En esto se evidencia que la Media es la
Medida de Resumen que ms se ve afectada por la presencia de valores extremos.
FACULTAD DE MEDICINA DEPARTAMENTO DE SALUD PBLICA

BIOESTADSTICA MAGSTER EN SALUD PBLICA

II. MEDIDAS DE POSICIN


Son aquellas Medidas de Resumen que nos permiten conocer otros puntos de inters dentro del conjunto de
datos, aparte de los puntos centrales. stas dividen el conjunto de datos en subconjuntos de igual nmero de
observaciones y requieren que los datos estn ordenados de menor a mayor.
a) Percentiles
Se define el Percentil de orden k%, como el valor, Pk, que deja por debajo de si el k% de los datos. Divide al
conjunto de datos en 100 partes iguales:

P1

P50

P99

Para valores individuales, los percentiles se obtienen como:

Pk x [n1] k%

100

(7)

Observe que esta frmula es una generalizacin de la frmula (4), utilizada para el clculo de la Mediana.
Entonces, como la Mediana divide al conjunto de datos en 2 partes iguales, esa Medida de Tendencia
Central corresponde al Percentil del 50% (P50).
Ejercicio 4: Obtener el P18 de la variable Edad Gestacional (en semanas) de los recin nacidos de sexo
masculino en la Comuna de Monte Patria, ao 2007 (Base de Datos del Anexo). Reemplazando en (7)
tenemos:
18
P18 x [ 214 1] 100

El P18 = x38,7 = x39. De la Tabla A1 obtenemos que el valor del Percentil del 18% es de 38 semanas.
b) Cuartiles
Los Cuartiles (Q) dividen al conjunto de datos en 4 partes iguales:

Q1

Q2

Q3

FACULTAD DE MEDICINA DEPARTAMENTO DE SALUD PBLICA

BIOESTADSTICA MAGSTER EN SALUD PBLICA

Los Cuartiles dejan tras de s al 25%, 50% y 75% de los datos, por lo que se pueden obtener directamente
de los Percentiles P25, P50 y P75, respectivamente.
c) Quintiles
Los Quintiles (K) dividen al conjunto de datos en 5 partes iguales:

K1

K2

K3

K4

Los Quintiles dejan tras de s al 20%, 40%, 60% y 80% de los datos, por lo que se pueden obtener
directamente de los Percentiles P20, P40, P60 y P80, respectivamente.
d) Deciles
Los Deciles (D) dividen al conjunto de datos en 10 partes iguales:

D1 D2 D3 D4 D5 D6 D7 D8 D9
Los Deciles dejan tras de s al 10%, 20%, 30% y 90% de los datos, por lo que se pueden obtener
directamente de los Percentiles P10, P20, P30 y P90, respectivamente.

FACULTAD DE MEDICINA DEPARTAMENTO DE SALUD PBLICA

BIOESTADSTICA MAGSTER EN SALUD PBLICA

III.
MEDIDAS DE VARIABILIDAD O DISPERSIN
Las Medidas de Variabilidad o Dispersin son aquellas Medidas de Resumen que nos indican cun
prximas o cun dispersas estn entre s las medidas en torno a un valor central.
a) Amplitud o Rango:
Para una variable cuantitativa, la diferencia entre los valores del xi menor y del xi mayor definen la Amplitud
o Rango mximo de dispersin de los datos:

Rango max x1, x2

(8)

Esta Medida de Resumen es fcil de calcular y su unidad es la misma en que ha sido cuantificada la
variable. Sin embargo, no utiliza todas las observaciones (slo dos de ellas) y se ve muy afectada por la
presencia de observaciones extremas. El Rango puede aumentar o mantenerse a medida que aumenta el
nmero de observaciones, sin embargo, nunca disminuir.
Ejercicio 1: Obtener el Rango de la variable Edad Gestacional (en semanas) de los recin nacidos de sexo
masculino en la Comuna de Monte Patria, ao 2007 (Base de Datos del Anexo y resumida en la Tabla A1 del
mismo Anexo). Aplicando la frmula (8), la mxima diferencia a detectar dentro de un conjunto de
observaciones es, precisamente, la diferencia observada entre el valor menor y el valor mayor, o sea, el
Rango corresponde a 28 41 semanas.
b) Varianza:
Se define a la Varianza de una poblacin, 2, como el promedio de las diferencias cuadrticas entre cada
uno de los datos xi y la Media (si no se elevan al cuadrado el promedio de estas diferencias sera = 0).
Sean los xi cada uno de los valores que toma una variable en una poblacin. Si N es el nmero de
observaciones, entonces, la Varianza Poblacional corresponde a:

xi

i 1
N

(9)

Note que la estructura de la frmula de la Varianza es igual a la Media y por lo tanto es un promedio, en
donde los xi son reemplazados por (xi )2. Dada esta diferencia al cuadrado, la unidad de la Varianza es
cuadrtica, o sea, si las medidas son en cm, la Varianza se expresar en cm2, si es en gr la Varianza se
expresar en gr2, etc. Por ltimo, a diferencia de la Amplitud o Rango, la Varianza disminuye a medida que
aumenta el nmero de observaciones.
Para datos agrupados, pero no en intervalos, la Varianza puede ser obtenida como:

xi ni

i 1
N

(10)

Ejercicio 2: Obtener la Varianza de la variable Edad Gestacional (en semanas) de los recin nacidos de
sexo masculino en la Comuna de Monte Patria, ao 2007 (Base de Datos del Anexo). La frmula (9) en
primer lugar requiere obtener la Media Poblacional de los N = 214 observaciones. Si sumamos los N = 214
valores y esa sumatoria la dividimos por 214 obtenemos una = 38,64 semanas. Luego, a cada uno de los
N = 214 xi se le resta 38,64 y cada una de esas diferencias se elevan al cuadrado. Finalmente, se suman las
214 diferencias cuadrticas y se divide por 214. Para la Edad Gestacional la Varianza corresponde a 3,76
semanas2.
FACULTAD DE MEDICINA DEPARTAMENTO DE SALUD PBLICA

BIOESTADSTICA MAGSTER EN SALUD PBLICA

En la Tabla A1 se encuentra la Distribucin de Frecuencias para la variable Edad Gestacional (en


semanas). Esta variable est agrupada en los i = 14 valores distintos que toma la variable, acompaada por
las veces en que cada uno de estos valores se repite, o sea, el respectivo ni (Frecuencia Absoluta). Si
utilizamos la frmula (10) la obtencin de la Varianza es como sigue:
xi
_____
28
29
30
31
32
33
34
35
36
37
38
39
40
41
_____

(xi )2
___________________________________
(28 - 38,64)2
(29 - 38,64)2
(30 - 38,64)2
(31 - 38,64)2
(32 - 38,64)2
(33 - 38,64)2
(34 - 38,64)2
(35 - 38,64)2
(36 - 38,64)2
(37 - 38,64)2
(38 - 38,64)2
(39 - 38,64)2
(40 - 38,64)2
(41 - 38,64)2

(xi )2 x ni
______________

ni
______

= 113,21
= 92,93
= 74,65
= 58,37
= 44,09
= 31,81
= 21,53
= 13,25
=
6,97
=
2,69
=
0,41
=
0,13
=
1,85
=
5,57

___________________________________

1
0
1
1
2
2
2
3
6
19
39
62
58
18

113,21
0
74,65
58,37
88,18
63,62
43,06
39,75
41,82
51,10
15,97
8,04
107,28
100,25

______

______________

= 805,30
La sumatoria de las multiplicaciones de cada diferencia cuadrtica por su respectiva Frecuencia Absoluta,
esto es, (xi..)2.x.ni.=.805,30, es idntica a la sumatoria de las diferencias cuadrticas de las N = 214
observaciones, sumatoria que al dividirla por N = 214 entrega una 2 = 3,76 semanas2.
Existe una frmula de la Varianza equivalente conocida como frmula de clculo rpido, que se basa en
sumatorias y entrega idntico resultado. Deben poner atencin en la estructura de la frmula, dado que
muchos de los anlisis estadsticos que vern en el futuro siguen esta configuracin, lo que muestra la
importancia del concepto de Varianza dentro de la estadstica. La frmula es:

x 2

xi N
i 1
2

(11)

c) Desviacin Estndar:
La Desviacin Estndar, , es la raz cuadrada de la Varianza por lo que expresa los resultados en la
misma unidad que lo hace la variable en cuestin.

xi

i 1
N

(12)

Ejercicio 3: Obtener la Desviacin Estndar de la variable Edad Gestacional (en semanas) de los recin
nacidos de sexo masculino en la Comuna de Monte Patria, ao 2007 (Base de Datos del Anexo). La frmula
(12) muestra que el interior de la raz cuadrada es el clculo de la Varianza y puede ser obtenida con
cualquiera de sus frmulas [(9), (10) y (11)]. La Varianza para la variable Edad Gestacional ya fue obtenida,
FACULTAD DE MEDICINA DEPARTAMENTO DE SALUD PBLICA

BIOESTADSTICA MAGSTER EN SALUD PBLICA

entonces, la Desviacin Estndar corresponde a la raz cuadrada de 3,76, esto es, = 1,94 semanas.
La Desviacin Estndar, por lo tanto, corresponde al promedio de las diferencias de los datos respecto al
valor central (a la Media) y, por lo general, se utiliza acompaada de la Media. Por ejemplo, nos podemos
referir a la Edad Gestacional de los recin nacidos de sexo masculino en la Comuna de Monte Patria, ao
2007 como: 38,64 1,94 semanas de gestacin.
La magnitud de la Desviacin Estndar se utiliza como Medida de Posicin, magnitud que se conoce con
el nombre de Z. Un Z corresponde a la magnitud de 1 Desviacin Estndar por sobre la Media (esto es, la
Media ms 1 Desviacin Estndar). Dos Z corresponde a 2 Desviaciones Estndar por sobre la Media (la
Media ms 2 Desviaciones Estndar), y as sucesivamente. Por otro lado, Z (1 Z negativo) es 1
Desviacin Estndar bajo la Media (o sea, la Media memos 1 Desviacin Estndar). 2 Z corresponde a 2
Desviaciones Estndar bajo la Media (la Media menos 2 Desviaciones Estndar) y, as sucesivamente.
Parmetros y Estadgrafos:
Cuando hacemos referencia a Medidas de Resumen para una Poblacin nos referimos a los Parmetros
(por ejemplo, , 2 y ) y cuando hacemos referencia a las Medidas de Resumen para una Muestra nos
referimos a los Estadgrafos (por ejemplo, x ). Entonces, si la Varianza hace referencia a una porcin de
datos representativos de la Poblacin, sta se denotar con el smbolo S 2 y su frmula es:

xi x

i 1
n

(13)

n 1

A diferencia de la Media, en la Varianza adems de la nomenclatura cambia tambin su frmula, estando


ahora la sumatoria dividida por n 1. El numerador es conocido como SS, del ingls suma de los cuadrados,
y el denominador como , llamado grados de libertad. Esta nomenclatura ser tambin utilizada en los
futuros anlisis estadsticos.
Finalmente, la Desviacin Estndar muestral corresponde a:

xi x

i 1
n

n 1

(14)

Aqu, siguen siendo vlidos los nombres a los componentes de la frmula (SS y ).
Ejercicio 4: Obtener la Varianza y la Desviacin Estndar muestrales de la variable Edad Gestacional (en
semanas) de los recin nacidos de sexo masculino en la Comuna de Monte Patria, ao 2007 (Base de Datos
del ANexo. En las frmulas (13) y (14) la obtencin de la SS (el numerador) es idntica a como se obtiene en
(9) y en (12) [y en particular con la frmula (10) ya que se trata del mismo ejemplo]. El SS = 805,30 es
dividido por 213 (el n 1) resultando una S 2 = 3,78 semanas2. La raz cuadrada de este valor nos entrega una
S = 1,94 semanas. Los valores de S2 y S fueron muy similares a los de 2 y , respectivamente,
especialmente en la Desviacin Estndar la que, no obstante, si hubiese sido expresada con una mayor
cantidad de decimales habra evidenciado la diferencia. Note que el sustraer el valor 1 al total de datos tiene
un efecto importante en el Estadgrafo slo cuando el n es pequeo, siendo este efecto cada vez menor
mientras ms grande sea el n. Por ejemplo, restar 1 a un n = 5, disminuye el denominador de la frmula en
un 20%; si restamos 1 a n = 50, el denominador disminuir en un 2%; si el n = 500, la disminucin ser en
0,2%, etc. De este modo, mientras mayor sea el n, el Estadgrafo se aproximar cada vez ms al valor del
Parmetro, situacin de gran relevancia en la Estadstica Inferencial (a tratar ms adelante).

FACULTAD DE MEDICINA DEPARTAMENTO DE SALUD PBLICA

BIOESTADSTICA MAGSTER EN SALUD PBLICA

ANEXO

Tabla A1.
Distribucin de Frecuencias de la Edad Gestacional de recin nacidos de sexo masculino
en la Comuna de Monte Patria, ao 2007.

Semanas

ni

pi

Ni

Pi

28
29
30
31
32
33
34
35
36
37
38
39
40
41

1
0
1
1
2
2
2
3
6
19
39
62
58
18

0,0047
0,0000
0,0047
0,0047
0,0093
0,0093
0,0093
0,0140
0,0280
0,0888
0,1822
0,2897
0,2710
0,0841

1
1
2
3
5
7
9
12
18
37
76
138
196
214

0,0047
0,0047
0,0093
0,0140
0,0234
0,0327
0,0421
0,0561
0,0841
0,1729
0,3551
0,6449
0,9159
1,0000

FACULTAD DE MEDICINA DEPARTAMENTO DE SALUD PBLICA

BIOESTADSTICA MAGSTER EN SALUD PBLICA

Base de Datos recin nacidos de sexo Masculino, comuna de Monte Patria, ao 2007
xi SEMANAS PESO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58

31
30
28
34
33
32
37
32
33
40
38
38
37
38
37
35
37
38
38
39
40
36
36
35
36
37
37
36
36
40
40
39
38
38
37
38
38
38
39
37
37
40
38
40
38
34
39
41
39
38
40
39
36
38
39
39
37
37

1320
1320
1380
1790
1950
1960
1960
2020
2270
2450
2530
2530
2570
2580
2580
2600
2610
2650
2680
2700
2750
2760
2780
2782
2800
2800
2800
2800
2820
2870
2900
2900
2900
2920
2920
2930
2950
2950
2990
3000
3000
3010
3010
3020
3030
3040
3050
3050
3050
3060
3060
3060
3070
3100
3100
3110
3120
3120

xi
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116

SEMANAS PESO
38
3130
40
3140
40
3150
39
3150
37
3160
37
3170
38
3170
41
3180
39
3180
39
3200
39
3215
38
3220
39
3220
40
3220
40
3240
37
3250
39
3250
39
3250
39
3250
39
3250
39
3250
38
3250
35
3250
38
3260
37
3270
39
3290
39
3300
39
3300
41
3300
38
3300
38
3300
40
3300
39
3300
40
3300
40
3300
39
3310
39
3310
38
3310
39
3320
38
3320
40
3350
39
3350
39
3360
41
3360
41
3370
40
3380
40
3380
40
3380
40
3380
38
3390
39
3390
38
3400
39
3400
39
3400
38
3400
39
3400
39
3400
40
3420

xi SEMANAS PESO
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174

37
38
38
40
39
39
38
39
40
39
39
39
38
37
40
40
40
40
38
39
39
39
40
39
39
38
38
40
38
39
37
40
39
40
39
38
40
40
40
39
40
41
40
40
40
39
39
40
39
39
39
38
40
41
40
41
39
40

3420
3420
3430
3430
3430
3440
3460
3470
3470
3480
3480
3480
3500
3500
3500
3500
3510
3520
3520
3520
3530
3530
3550
3570
3570
3580
3600
3600
3600
3610
3620
3620
3620
3650
3650
3680
3700
3700
3700
3700
3710
3720
3720
3730
3750
3750
3760
3760
3770
3790
3800
3800
3820
3820
3850
3860
3870
3870

FACULTAD DE MEDICINA DEPARTAMENTO DE SALUD PBLICA

xi
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214

SEMANAS
39
39
41
39
41
41
41
40
39
40
40
40
41
39
40
41
37
41
41
41
40
39
40
40
40
40
40
38
38
39
40
39
40
40
40
38
41
39
40
40

PESO
3900
3900
3900
3900
3920
3920
3920
3930
3930
3930
3950
3950
3950
3970
3980
3980
3980
4000
4000
4000
4000
4000
4000
4020
4030
4030
4070
4080
4080
4090
4100
4100
4200
4200
4200
4250
4280
4360
4400
4400

También podría gustarte