Está en la página 1de 13

Curso de Estadística Básica

UNIDAD NO. 3: MEDIDAS DE DISPERSIÓN

Son medidas que se emplean para determinar el grado de variabilidad o de dispersión de los datos con respecto a un
promedio. Si los valores están muy cerca al promedio, se dice que el promedio es representativo de esa información; si
los valores se encuentran dispersos se dice que el promedio no representa con claridad la información.

RANGO O RECORRIDO U OBSILACION

Es la medida de dispersión más fácil de calcular ya que únicamente se toman los valores extremos de la variable y se
establece su diferencia.

Es el espacio donde están distribuidos todos los valores de la variable; es el campo de variabilidad.

a) Para la variable aleatoria discreta: R = Xmáx. – Xmín.


Xmáx. : V. a. Máxima
Xmín: V. a. Mínima

b) Para la V. a. continua: R = Zm - Z
Zm: Límite superior del último intervalo
Z : Límite inferior del primer intervalo

Esta medida de variación da una idea cruda de la dispersión de los datos. Su uso es bastante limitado y tan solo se usa
en aquellas ocasiones donde deseamos obtener una idea rápida de la variación del grupo de datos.

EJEMPLO: Como solamente, se usan dos valores el mayor y el menor puede dar una interpretación equivocada de la
dispersión.

Sean las V. a. 4, 5, 5, 6, 7, 7, 20
R = Xmáx. - Xmín.
R = 20 - 4 = 16

Y sean los V. a. 2, 4, 6, 7, 9, 12, 14, 15


R = Xmáx. - Xmín.
R = 15 - 2 = 13

Si se observan los valores se ve que hay mayor variabilidad en el segundo grupo de variables; sin embargo, el rango en
el primer grupo es mayor que en el segundo, pero esto es así por que en el primer grupo hay un número extremo que es
el 20, si se omite quedaría el rango en el primer grupo. R: 7 – 4 = 3 que es el valor que representa con mayor fidelidad
la dispersión o variabilidad en el primer grupo.

- El rango es una medida de variación inestable ya que es sensible a las dos observaciones extremos
- Es una distribución asimétrica, un valor aproximado de la media aritmética es Zi + Zm = X
- El rango es de mucha aplicación en control de cavidad, ya que se emplea un mismo método para obtener varias
muestras de igual tamaño.

LA VARIANZA

De todas las medidas es la más importante, más conocida y más usada.

Se define como la media aritmética de los cuadrados de las observaciones respecto a su media (o la media aritmética de
las observaciones cuadráticas con respecto a la media aritmética.

a) DATOS AGRUPADOS

Esp: Alexander Castilla 1


Curso de Estadística Básica

: Varianza de la población o poblacional

Donde Xi = Variable Aleatoria


ni = Frecuencia Absoluta
n = Tamaño de la población

: Media Poblacional

: Varianza muestral o de la muestra

Con Xi = V. a.

ni = Frecuencia Absoluta
n = Tamaño de la muestra

Para facilitar los cálculos, la varianza se puede presentar así:

Xi ni Xi ni (Xi – X)2 (Xi – X )2 ni Xi2 ni


0 1 0 2,56 2,56 0
1 4 4 0,36 1,44 4
2 3 6 0,16 0,48 12
3 2 6 1,96 3,92 18
_
 n=10 16 --------- (Xi-X)2ni = 8,40 Xi2ni = 34

Calcular la Varianza.
Aplicar la fórmula:

n
Para este cálculo: X =  Xi ni = 16 = 1,6
i=1 n

Haciendo las observaciones cuadráticas en la tabla se tiene que: S2x = 8,40 = 0,84
10
Ahora aplicando la fórmula: S2x =  Xi2 ni - X2
n

X2 = 1.6 = 256 y hago la columna Xi2 ni en la tabla, de donde:

S2x = 34 - 2,56 = 0,84


10

Esp: Alexander Castilla 2


Curso de Estadística Básica

Cuando se trabaja con datos continuos (intervalos de clase), las marcas de clase representan las variables aleatorias y se
procede de igual forma como se hizo anteriormente para calcular la varianza.

b) PARA DATOS NO AGRUPADOS

EJEMPLO: Sean las variables aleatorias 5, 3, 1, 6, y 10. Calcular la varianza:

Aplicando la fórmula:

Para esto necesito la X:

X =  Xi = 5 + 3 + 1+ 6 + 10 = 5 Xi ni Xi2
n 5
5 1 25
 S2x = (5 – 5)2 + ( 3 – 5 )2 + ( 1 – 5 )2 + ( 6 – 5 )2 + ( 10 – 5 )2 3 1 9
5 1 1 1
6 1 36
S2 x = 0 + 4 + 16 + 1 + 25 = 46 = 9,2 10 1 100
5 5
 n=5  Xi2 = 171
Aplicando la fórmula:

DESVIACION TIPICA O ESTANDAR

La desviación típica es la raíz cuadrada de la varianza, considerada siempre con signo positivo. Esta medida
siempre está expresada en las mismas unidades de la variable y se interpreta como el margen de eeror que
tiene la característica con respecto a la media.

Para datos agrupados:

Para datos no Agrupados:

Esp: Alexander Castilla 3


Curso de Estadística Básica

EJEMPLO: Para el caso anterior en que la varianza era igual a 0,84 suponga que las variables son edades en años
cumplidos de niños
S2x = 0,84, entonces Sx =  S2x =  0,84 = 0,9165

Interpretación: La variabilidad en la edad de los niños con relación a la edad promedio de 1.6 años es de 0,91 de años o
sea que las edades de los niños tienen una variación entre una y otra de aproximadamente un año.

Para el caso en que la varianza es igual a 9,2 (S2x = 9,2) la desviación estándar es:

Sx =  S2x =  9,2 = 3,03

Interpretación: La variación con respecto al promedio de las observaciones es de 3,03 o sea que los datos tienen una
variabilidad de 3,03 con respecto a su media aritmética.

PROPIEDADES DE LA DESVIACIÓN TIPICA

a) Está expresada en las mismas unidades de la variable lo cual permite comparar la desviación estándar con los valores
de la variable, o sea, se puede interpretar.

Permite hacer comparaciones con dos o más distribuciones cuando están expresadas en las mismas unidades de medida
para ver cual presenta mayor menor grado de variabilidad absoluta.

b) Es la medida de variación más confiable ya que se calcula con todos los valores de la V.a. y todas las frecuencias.
c) El valor de la desviación estándar aumenta a medida que crece la variabilidad.
d) Sirve para medir la representatividad de la medida aritmética.

PROPIEDADES DE LA VARIANZA

a) La varianza depende de todos los valores de la variable aleatoria y todas las frecuencias.
b) La varianza se presta para tratamiento algebraico.
c) La varianza se puede calcular en cualquier distribución.
d) La varianza siempre es mayor o igual a cero. S2x = 0.

e) La varianza de una constante es cero: Var (K) = 0, veamos un ejemplo de por qué esto: Si todos los estudiantes de
este concurso obtienen la misma calificación, se encuentra que no existe ninguna diferencia entre las notas de cada
estudiante y el promedio del curso, de ahí que la varianza sea igual a cero.
b) La varianza de la suma ( o resta) de una constante por una variable es igual a la
Varianza de la variable:
Var (X + K) = Var (X) + Var (K)
Var (X + K) = Var (X) + 0
Var (X + K) = Var (X)
ó
Var (X – K) = Var (X) - Var (K)
Var (X – K) = Var (X) - 0
Var (X – K) = Var (X)

g) La varianza de una constante por una variable, es igual al producto de la constante al cuadrado por la varianza de la
variable: Var (KX) = K2 Var (X).

Esp: Alexander Castilla 4


Curso de Estadística Básica

h) Cuando se conocen las medias y varianzas de las submuestras en que se divide la muestra, con sus respectivos
tamaños, se puede obtener la media y la varianza de dicha muestra así:

X = X1 ni + X2n2 , n = n1 + n2
n

Sx = S21n1 + S22 n2 + (X1 - X )2 n1 + (X2 - X )2 n2


n n

Si Sx es pequeña: Es representativa de la media aritmética de la cual se obtuvo y hay uniformidad en los valores
de las variables aleatorias.
Si Sx es grande: Hay mucha dispersión en la distribución o sea que las V. a. están muy dispersas.

e) En una distribución simétrica se tendrá:

 Entre la media y una vez la desviación estándar por encima y por debajo se tendrá el 68,3% de las
observaciones.
 Entre la media y dos veces la desviación típica por encima y por debajo se tendrá que el 95,5% de las
observaciones.
 Entre la media y tres veces la desviación típica por encima y por debajo se tendrá el 99,7% de las
observaciones. A partir de tres por mucho que se aumente no se tendrá el 100% de las observaciones ya que la
curva se aproxima al eje horizontal pero no la toca ya que es sintéticamente normal.

34,15% 34,15%

X – 3Sx X – 2Sx X-Sx X + Sx X + 2Sx X +3Sx

68,3%

95,5%
99,7%

EJEMPLO: Suponga una distribución simétrica con media 6 y desviación típica 1,73, obtenemos los límites de
confianza con 1, 2 y 3 veces la desviación típica.

X  1 Sx: X + Sx = 6 + 1.73 = 7.73: Ls


68, 3%
X - Sx: X + Sx = 6 – 1.73 = 4.27: Li

Esp: Alexander Castilla 5


Curso de Estadística Básica

Aplicación en Winstats

Entre al programa de Winstats, clic en la opción Window, en el menú que se despliega haga clic en
probability Normal, en la ventana emergente Gauss. En la barra de menú clic en Cal, en la ventana
de menú clic en Probabilities. En la venta normal calculations digite el valor corto (low x ) (- 1), y
el valor Largo ( high x) (1). Clic en probability.

Si N = 4096  aproximadamente 2798 observaciones estaban incluidas en dicho intervalo.

X  2 Sx: 6 + 2 (1.73) = 9.46 : Ls


95.5%
X - 2 Sx : 6 – 2 (1.73) = 2.54 : Li

X  3 Sx : 6 + 3 (1.73) = 11.19 : Ls
99.7%
X  3 Sx : 6 – 3 (1.73) = 0.81 : Li

Ejercicio: Utilizando el programa de Winstats realiza las gráficas de la desigualdad de Tchebycheff, para dos
y tres desviaciones estándar.

COEFICIENTE DE VARIACION

Se emplea cuando se quiere comparar dos o más distribuciones con el fin de determinar cuál
de ellas tienen menor o mayor variabilidad relativa. Se usa también cuando dichas

Esp: Alexander Castilla 6


Curso de Estadística Básica

distribuciones están dadas en medidas de unidades diferentes y por tanto no se pueden comparar las
varianzas o las desviaciones estándar. Se usa para comparar también las distribuciones que tienen igual
varianza, ya que a simple vista parece que tienen igual variabilidad.

EJEMPLO: Suponga que dos muestras de sexo masculino proporcionan los siguientes resultados:

MUESTRA 1 MUESTRA 2

EDAD 25 Años 11 Años


PESO MEDIO 72,5 Kg. 40 Kg.
DESVIACIÓN TIPICA 5 Kg. 5 Kg.

C V1 = 5 (100) = 6,89% :% de variación de la 1º muestra.


72,5

C V2 = 5 (100) = 12,5% : % de variación de la 2º muestra.


40

Los pesos de las personas de la segunda muestra (11) años presentan mayor variabilidad que los pesos de la 1ª muestra
(25 años).

Nota: Si el % de variación es muy alto, la media aritmética no es la suficientemente representativa de la distribución, P


e 109,78% = C.V.

Aplicación en Microsoft Excel

1.- Digita la información que te aparece en la siguiente tabla en la hoja 1 del programa de Excel:

Esp: Alexander Castilla 7


Curso de Estadística Básica

2.- Para calcular la marca de clase proceda de la siguiente manera; =(A3+B3)/2. Luego debe arrastrar la formula hasta
la celda E9.
3.- La media , se calcula primero multiplicando la frecuencia absoluta por la marca de clase en la celda
F3, así; =C3*E3. Luego debe arrastrar la formula hasta la celda F9, y hallar la sumatoria de la columna F en la celda
F10. El segundo paso es en la celda B13 divide la suma que obtuvo en F10 entre el total que está en la celda C10.
Así: =F10/C10
4.- Para calcular la varianza utilice la siguiente formula: , primero multiplicamos en la columna G3
con la formula =(E3-$B$13)^2*C3. Luego debe arrastrar la formula hasta la celda G10. El segundo paso es en la celda
B18 divide la suma que obtuvo en G10 entre el total que está en la celda C10. Así: =G10/C10

5.- Para calcula la desviación típica utilizaremos la siguiente formula: Calculemos la raíz

cuadrada de la varianza as; =RAIZ(B18), en la celda C19.


6.- Para determinar el coeficiente de variación utilizamos la siguiente formula: En la celda C20
utilizamos la siguiente formula: =C19/B13, y la expresamos en formato moneda.

DESVIACIÓN MEDIA CON RESPECTO A LA MEDIA ARITMÉTICA

DESVIACIÓN MEDIA: Es la media aritmética de las observaciones respecto a la media aritmética en 11. Su resultado
se considera como una aproximación en la cuantificación de la dispersión es fácil de calcular.
Siempre DMX < Sx

DMX =  / Xi - X / : Para Datos No Agrupados

n
n
DMX =  / Xi - X / ni :
i=1 : Para Datos Agrupados
n

Ejemplo: Sean Xi = 42, 68, 69, 72, 73, 74, 76

Xi / Xi - X /
42 25.7
68 0.3
69 1.3
72 4.3
73 5.3
74 6.3
76 8.3

X =  Xi = 474 = 67,70
n 7

n
 / Xi - X /
DMX i=1 = 51.5 = 7.35: Datos No Agrupados

Esp: Alexander Castilla 8


Curso de Estadística Básica

n
EJEMPLO:
INTERVALOS Xi ni Xini /Xi – X/ /Xi – Xi/ni
46 – 54 50 3 150 17,6 52,8
54 – 62 58 6 348 9,6 57,6
62 – 70 66 10 660 1,6 16,0
70 – 78 74 6 444 6,4 38,4
78 – 86 82 3 246 14,4 43,2
86 – 94 90 2 180 22,4 44,8
 ____ _______
30 2028 252,8

X =  Xini =
n

X= 2028 = 67,6
30

n
 / Xi - X /ni
DMX i=1 = 8.426: Datos Agrupados
n

DESVIACIÓN MEDIANA
(DESVIACIÓN MEDIA RESPECTO A LA MEDIANA)

Se define como la media aritmética de las diferencias (desviaciones) en valor absoluto entre los valores que toma la
variable y la mediana.

DMMe = /Xi – Me/ : (Datos No Agrupados)


N

DMMe = /Xi – Me/ni : (Datos Agrupados)


n

Se usa cuando los valores extremos de la distribución no están definidos o cuando el promedio está afectado por valores
grandes de la variable que obligan a calcular la mediana.

DMMe < DMX < Sx

EJEMPLO: Sean las observaciones 1, 2, 6, 20, 25, 30, 31 cuando n = 7 (impar): La mediana es el valor medio o central
en los datos organizados.

Entonces: Me = 20.

Seguidamente calculo las desviaciones:

Esp: Alexander Castilla 9


Curso de Estadística Básica

DMMe =  /Xi – Me/ = 77 = 11 Xi / Xi – Me /


n 7 1 19
2 18
6 14
20 0
25 5
30 10
3 11
 77

Aplicación en Microsoft Excel

Para hacer el estudio del cálculo de la desviación media y media en datos agrupados utilizaremos el
programa de Microsoft Excel.

1.- Digita la información que te aparece en la siguiente tabla en la hoja 1 del programa de Excel:

2.- Para calcular la marca de clase que es el punto medio del intervalo: aplique la siguiente formula =
(B6+C6)/2 en la celda E6.

3.-La media, se calcula primero multiplicando la frecuencia absoluta por la marca


de clase en la celda F6, así; =D6*E6. Luego debe arrastrar la formula hasta la celda F16, y hallar la sumatoria
de la columna F en la celda F18. El segundo paso es en la celda E20 divide la suma que obtuvo en F18 entre
el total que está en la celda D18. Así: =F18/D18

4.- Para calcular la frecuencia acumulada sume la frecuencia absoluta en forma acumulada, así; en la celda
G6 escribe =D6, en la celda G7 escriba =G6+D7. Luego arrastre hasta la columna G17.

Esp: Alexander Castilla 10


Curso de Estadística Básica

5.- Para calcular la desviación media se utiliza la siguiente fórmula: En Excel primero
calculamos en la celda H6, la expresión del numerador con la siguiente formula =ABS(E6-$D$20)*D6,
luego arrastramos la formula hasta la columna H17 y calculamos la sumatoria en la celda H18. Como
segundo calculamos en la celda H21, dividimos el valor que nos dio la sumatoria de la celda H18 entre el
total que está en la celda D18. Así: =H18/D18

6.- Para calcular la amplitud en la celda D22, restamos el límite superior del primer intervalo menos el límite
inferior del primer intervalo. Así: =C6-B6.

7.- Para hallar la mitad de datos en la celda D23, dividimos el valor total de la frecuencia entre dos. Así:
=D18/2
8.- La mediana se calcula con la siguiente fórmula:

Primero se busca la frecuencia absoluta acumulada que iguala o excede la mitad de dados, luego se establece
el intervalo que contiene la mediana y se aplica la formula así: =B11-D22*(D23-G10)/D11

9.- Para calcular la desviación media se utiliza la siguiente fórmula: Utilice el mismo
procedimiento que uso para calcular la desviación media pero con la diferencia en vez de utilizar media
ahora utilizara mediana.

TALLER DE MEDIDAS DE POSICION Y VARIABILIDAD

1.- Construcción de una distribución de frecuencia con intervalos para característica aleatoria cuantitativa continúa.
A continuación, se presentan los datos correspondientes a la
16 27 18 21 20 50 40 22 38 25
edad en años de los estudiantes de una sección de Estadística.
Escriba en el programa de Excel los siguientes daos 32 17 30 24 19 22 17 32 26 22
correspondientes a las edades en años. 35 19 28 23 21 26 18 25 20 19
Diseñe los cuadros como se muestran a continuación: 20 52 21 16 31 18 24 55 30 27

Esp: Alexander Castilla 11


Curso de Estadística Básica

2.- Construya la distribución con intervalos utilizando todas las fórmulas que vimos es la guía anterior
3.- Calcula La media, mediana y moda con los datos de la distribución. Además, calcula el 60%, 75% de los valores de
la variable edad en años de los estudiantes de la sección de estadística.

4.- Determina atreves de funciones la varianza, la desviación típica o estándar y el coeficiente de variación.

5.- Con los datos presentados construye la distribución de intervalos:

6.- Determina las medidas de posición y variabilidad realizando su cálculo con las formulas respectivas y su
interpretación.

COEFICIENTE DE DESVIACIÓN MEDIA

Esta medida de dispersión también se expresa en forma porcentual y es muy parecida al coeficiente de variación con la
diferencia de considerar que la desviación media en vez de la desviación típica.

Cdx = DMx x 100


X

EJEMPLO: Considerando el ejemplo anterior de la desviación media; en que la DMX=8,426 y la X = 67,6.

 Cdx = DMX x 100 = 8,426 x 100 = 12,61%


X 67,6

Esp: Alexander Castilla 12


Curso de Estadística Básica

COEFICIENTE DE DESVIACIÓN MEDIANA

CdMe = DMme x 100


Me

EJEMPLO: Considerando los datos de la desviación mediana anterior en que: Me=20 y Dmme = 11.

CdMe = DMme x 100 = 11 x 100 = 55%


Me 20

RECORRIDO INTERCUARTILICO, DESVIACION CUARTIL Y RECORRIDO INTERDECIL

Estas Medidas de dispersión se utilizan cuando la distribución se divide en partes iguales para su estudio.

RECORRIDO INTERCUARTILICO: Consiste en hallar la variación del 50% de la información que se encuentra en la
mitad de la distribución.

QD = Q3 - Q1 : Es la diferencia entre el 3º y 1º cuartil.

DESVIACIÓN CUARTIL O SEMIRECORRIDO INTERCUARTILICO

QD = Q3 - Q1 : En la distribución normal Q = 06745 Sx.


2

COEFICIENTE DE DESVIACIÓN CUARTIL: Se aplica especialmente en aquellas distribuciones cuyos valores


extremos no están definidos (abiertos) o cuando se desea hacer una estimación rápida de la dispersión no necesaria para
posteriores cálculos.

RECORRIDO INTERDECIL: Corresponde a la diferenciación entre el 9º y 1º decil.

Consiste en hallar la variación del 80% de la información que se encuentra entre esos dos deciles.

D R = D9 - D1

Esp: Alexander Castilla 13

También podría gustarte