Está en la página 1de 10

Universidad De Carabobo

Facultad De Ciencias De La Salud

Sede Aragua

Escuela De Medicina “Dr. Witremundo Torrealba”

Departamento De Salud Pública

Medidas
De
Dispersión

Bachilleres:

Abril 2017
Medidas de Dispersión

Las medidas de dispersión muestran la variabilidad de una distribución,


indicando por medio de un número, si las diferentes puntuaciones de una variable
están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la
variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si
todos los casos son parecidos o varían mucho entre ellos.

Desviación Estándar

Es la medida de variación frecuentemente utilizada para mostrar la


dispersión de los valores individuales alrededor de la media en una distribución. La
desviación estándar es el promedio de desviaciones de las puntuaciones con
respeto a la media. Cuanto mayor sea la dispersión de los datos, mayor es la
desviación estándar. Se simboliza como “s” (en minúscula), o la letra griega
(σ).Para su cálculo se utilizan las siguientes formulas:

A. Para Datos No Agrupados:

(X− ) (X− )
s = √∑ o s = √∑
n n

Ejemplo:

Peso de los niños del grupo A: 6 – 6 – 7 – 8 – 9 – 10 - 10 kg

1. Se calcula la media aritmética de la serie:

6 + 6 + 7 + 8 + 9 + 10 + 10 56
= = = 8kg
7 7

2. Calculo de las desviaciones medias:

Xi Xi - (Xi - )2
6 6–8=-2 4
6 6–8=-2 4
7 7–8=-1 1
8 8-8=0 0
9 9–8=1 1
10 10 – 8 = 2 4
10 10 – 8 = 2 4
N=7 ∑ =18

18 18
3. Aplicando la fórmula: s = √ = √ = √3
7−1 6
B. Para Datos Agrupados:

𝑓𝑖 ∙ (𝑋𝑚− )2
s=√
𝑛
Dónde:

s = Desviación estándar

fi = Frecuencia absoluta de cada claee

Xm = Centro de cada clase

= Media aritmética

n = Total de cosas

Ejemplo:

Distribución de 248 pacientes atendidos por intoxicación alimentaria. HUAL 1997.

Edad en años Fi Xm fi . Xm
10 -11 36 11 369
12 – 13 56 13 728
14 – 17 80 16 1280
18 – 19 46 19 874
20 – 25 30 23 690
Total 248 ∑ = 3.968

Para calcular la desviación estándar (s):

∑ Xm ∙fi 3.968
A. Se calcula la media aritmética: = = = 16 años
n 248
B. Se obtienen los desvíos medios, restando la media a cada centro de clase
[𝐷𝑚 = (𝑋𝑚 − )].
C. Cada desvío medio se eleva al cuadrado.
D. Cada desvío medio al cuadrado de multiplica por la frecuencia absoluta de
cada clase.
2
E. Se suman los productos de estas multiplicaciones [𝑓𝑖. (𝑋𝑚 ∙ )].
F. Se divide el total de la sumatoria entre el total de la frecuencia. Este
resultado se denomina varianza.
G. Se extrae la raíz cuadrada de la varianza.

(B) (C) (D)


Edad en años fi Xm (Xm - ) (Xm - )2 fi.(Xm - )2
10 - 11 36 11 11 – 16 = -5 25 900
12 – 13 56 13 13 – 16 = -3 9 504
14 – 17 80 16 16 – 16 = 0 0 0
18 – 19 46 19 19 – 16 = 3 9 414
20 - 25 30 23 23 – 16 = 7 46 1.470
Total 248 3.968 (E) 3.288

3.288
(F) √ = √13.2580 (Varianza)
248

(G) s = 3, 64 años

3, 64 años, valor que indica la forma como se dispersan las observaciones


alrededor de la media.

Varianza (σ2)

Es la desviación estándar elevada al cuadrado, y se simboliza con la letra


“S2”. Es un concepto estadístico muy importante, especialmente en pruebas
cuantitativas, sin embargo, para fines descriptivos se utiliza preferiblemente la
desviación estándar.

Coeficiente de Variación

En oportunidades es necesario comparar la variabilidad de diversas series


estadísticas, expresados en diferentes unidades de medida (kg, mts, cms, años,
entre otros). En tal caso, no es posible utilizar directamente la desviación estándar
para determinar en cuál de ellas existe menos o mayor variación. En su lugar, se
utiliza el coeficiente de variación, el cual mide la variación porcentual de los
valores en la distribución. Es una medida de variación relativa, se expresa en
porcentaje y se define como el coeficiente entre la desviación estándar y la media,
multiplicado por 100.
𝑠
Cv = x 100
A mayor coeficiente de variación, más heterogéneo es el grupo, hay mayor
dispersión, el grupo esta menos concentrado, a menor coeficiente hay más
homogeneidad en la serie mayor concentración de los valores y la media es más
representativa de los valores que conforman la serie.

Ejemplo: ¿Cuál de estas dos series es más heterogénea?

S
Talla 1,75 mts 0,08 mts
Peso 60 kg 1,5 kg

0,08
Cv (Talla) = x 100 = 4,57%
1.75
1,5
Cv (Peso) = x 100 = 2,5%
60
El mayor coeficiente de variación es el de la variable talla (4.6%). Por lo
tanto este grupo de valores es más heterogéneo; su medida es la menos
representativa de la serie. En la talla se aprecia mayor variación entre sus datos.

Medidas De Posición

Las medidas de posición se refieren a los lugares donde se ubican


determinados valores de la distribución. Y estas son:

1. Cuartiles (Q): Son aquellas medidas que dividen la serie en cuatro porciones
iguales, en términos de proporción de observaciones de cada uno de ellas.

Q1= Valor por debajo del cual está el 25% de las observaciones.

(𝑛+1)
Para calcular el lugar: Lugar =
4
Q2= Valor por el cual está el 50% de las observaciones.

2(𝑛+1)
Para calcular el lugar: Lugar =
4
Q3= Valor por debajo del cual está el 75% de las observaciones.
3(𝑛+1)
Para calcular el lugar: Lugar =
4
Ejemplo: Calcular el Q3:

Edad (Xi) Fi F.A


20 años 2 2
21años 1 3
22años 3 6
23años 16 22
24años 12 34
25años 5 39
26años 9 48
27años 8 56
28años 13 69
29años 11 80
Total 80

Procedimiento:

3(𝑛+1) 3 𝑥81 243


Posición del Q3 = = = = 60,75 (es el lugar)
4 4 4
Al observar la columna de frecuencias acumuladas, se nota que el lugar de
60,75 esta incluido en la clase #9; por lo tanto, el Q3 tiene un valor de 28 años,
dado que el intervalo de la distribución es igual a 1, es decir el 75% de los sujetos
de la distribución son menores de 28 años.

Si Los datos están agrupados en clases con intervalos de dos o más, una
vez ubicada la clase donde se encuentra el cuartil buscado, se siguen los mismos
pasos utilizados anteriormente para calcular la mediana, según la fórmula:

Q (buscado) = Li + {[(𝐿𝑢𝑔𝑎𝑟 𝑑𝑒𝑙 𝑄 𝑏𝑢𝑠𝑐𝑎𝑑𝑜) − 𝐹. 𝐴] 𝐼𝑐 ⁄𝑓𝑖 }

Dónde:

Q (Buscado) = Cuartil buscado, puede ser 1; 2; 3.

Li = Límite inferior de la clase donde está el Q buscado.


F.A = Frecuencia acumulada hasta la clase anterior a aquella donde está el Q
buscado
fi = Frecuencia absoluta de la clase en donde está el Q buscado.
Ic = Intervalo de clase donde está el cuartil buscado.
n = Frecuencia total, o total de datos.

2. Deciles (D): Son los valores o puntos de la serie que la dividen el 10 partes
iguales. El primer decil o D1, es el valor por debajo del cual está el 10% de los
casos de distribución. Para calcular, por ejemplo el D4 en la serie anterior, se
procede d la siguiente manera:

4(𝑛+1) 4 𝑥81 324


Lugar = = = = 32,4
10 10 10
El decil 4 está en el lugar 32,4. Este lugar corresponde a la clase #5 donde
se encuentran los sujetos de 24 años, por lo cual el decil 4 corresponde a un valor
de 24 años, el 40% de los sujetos tienen una edad igual o menor de 24 años.

Si los datos están agrupados en clases con intervalos de 2 o más, una vez
ubicados la clase donde se encuentra el decil buscado, se siguen los mismos
pasos utilizados anteriormente para calcular la mediana, según la fórmula:

D buscado = Li + {[(𝐿𝑢𝑔𝑎𝑟 𝑑𝑒 𝐷 𝑏𝑢𝑠𝑐𝑎𝑑𝑜) − 𝐹. 𝐴] 𝐼𝑐 ⁄𝑓𝑖 }

3. Percentiles (P): Son puntos o valores que dividen la serie en 100 partes
iguales, es decir; por debajo de un determinado percentil se encuentra un cierto
porcentaje de los casos, por ejemplo el percentil 60; es el punto por debajo del
cual se encuentra el 60% de los sujetos.

Ejemplo:

Calcular el percentil 25 (P25), en la serie anterior.

25 𝑋 81 2025
Lugar de P25 = = = 20,25
100 100
En esta distribución, la posición 20,25 está ubicada en la cuarta clase,
donde están las personas de 23 años, lo cual indica que el 25% de los sujetos
tienen edades iguales o menores de 23 años.

Si los datos están agrupados en clases con intervalos de 2 o más, una vez
ubicada la clase donde se encuentra el percentil buscado, se siguen los mismos
pasos utilizados anteriormente para buscar la mediana, según la fórmula:
P (buscado) = Li + {[(𝐿𝑢𝑔𝑎𝑟 𝑑𝑒 𝑃 𝑏𝑢𝑠𝑐𝑎𝑑𝑜) − 𝐹. 𝐴] 𝐼𝑐 ⁄𝑓𝑖 }

Ejemplo:

Edad de 104 pacientes hipertensos.


Consulta de medicina interna CHET. Valencia. 1997

Edad fi F.A
43 - 47 7 7
48 – 52 18 25
53 – 57 24 49
58 – 62 36 85
63 - 67 13 98
68 – 72 4 102
73 - 77 2 104
Total 104

Calcular el Percentil 75

75(𝑛+1) 75(104+1) 75 𝑋 105 7.875


a. Lugar de P75 = = = = = 78,75.
100 100 100 100

b. Según la columna de frecuencias acumuladas, el percentil 75 está contenido


en la cuarta clase, correspondientes a las edades 58 – 62 años.

c. P75 = Li + {[(Lugar de P buscado)-F.A] Ic⁄fi}

Límite inferior de la 4ta clase = 58 años


Lugar de P75 en la serie = 78,75
Intervalo de la cuarta clase = 5 años
Frecuencia Absoluta de la4ta clase = 36 pacientes
Frecuencia acumulada hasta la 3era clase = 49

P75 = 58+ {[(78,75)-49] 5⁄36}

P75 = 58+ {29,75 x 0,14} = 58 + 4,13

P75 = 62,13 años

Lo cual significa que el 75% de estos pacientes tienen una edad igual o
inferior a 62, 13 años.
Intervalo Intercuartil

Se emplea con el fin de superar la limitación del rango como medida de


dispersión, su mayor utilidad radica que entre sus límites se encuentra el 50 % de
las observaciones centrales de la distribución, que no son afectadas por los
valores extremos de la serie.

El intervalo cuartil, mide la dispersiones de los valores de la serie, pues


mientras más próximos sus límites, existe mayor concentración de las
observaciones alrededor de la mediana. Es igual a la mitad de la distancia que el
Primerio y el Tercer cuartil.

𝑄3 −𝑄1 𝑃75 − 𝑃25


Q= =
2 2
Procedimiento:

a) El rango intercuartil se define como la diferencia entre el cuartil superior (el 25


% más alto) y el cuartil inferior (el 25 % más bajo) de un conjunto de datos. El
cuartil inferior, generalmente, se escribe como Q1 y el cuartil superior es Q3, lo
que técnicamente marca el punto intermedio entre el conjunto de datos Q2 y el
punto más alto Q4.

b) Para visualizar un cuartil, divide una lista de números en cuatro partes iguales.
Cada una de esas partes es un "cuartil".

c) Si tu conjunto de datos es: 1, 2, 3, 4, 5, 6, 7, 8,9 ,10, 11, 12

1,2, 3 están en el primer cuartil, o Q1

4, 5, 6 están en el segundo cuartil, o Q2

7, 8, 9 están en el tercer cuartil, o Q3

10, 11, 12 están en el cuarto cuartil, o Q4

d) Sacas la media de cada cuartil,

e) Para poder hallar la diferencia entre los cuartiles superior e inferior, deberás
restarle el percentil 25º al percentil 75º. La fórmula se escribe de la siguiente
forma: Q3 – Q1 = RIQ.

𝑄3 −𝑄1 8−2 6
f) Q= = = =3
2 2 2

También podría gustarte