Está en la página 1de 16

TEMA 4

MEDIDAS DE DISPERSIÓN

4.1 CONCEPTO.
4.2 RANGO O RECORRIDO. (R)
4.3 DESVIACIÓN MEDIA O PROMEDIO.
4.4 VARIANZA Y DESVIACION ESTANDAR O TIPICA
4.1 CONCEPTO.
Llamados también estadígrafos de dispersión, determinan como se agrupan o dispersan
los datos alrededor de un promedio escriben el grado de dispersión de los datos, es decir,
cuán separados se encuentran, como opuesto a datos que están muy concentrados o
cercanos entre sí.
Iindican lo representativa que es la medida de posición a mayor dispersión menor
representatividad de la medida de posición y viceversa.
Podemos preguntarnos ¿Por qué estudiar la dispersión? - Un promedio como la media o la
mediana solamente localiza el centro de los datos y esto es importante desde ese punto de
vista, pero un promedio no dice nada acerca de la diseminación de los datos.
Por ejemplo, usted es el Administrador o Contador de un gran comercio y una sucursal.
Le solicitan analizar las ventas del último año. Saca una muestra de datos en ambos, la
describe y determina que el monto de venta promedio en ambos comercio es el mismo.
¿Usted se conformaría solo con ese dato? y le diría al Gerente que ambos comercio andan
bien.- Seguramente no, trataría además de buscar alguna medida que le pueda indicar que
paso con todas las ventas respecto a su promedio.-

Por Ejemplo. - Peso promedio del varon en Sucre 70 kg, estatura promedio 1,56

POSICION LOCAL Imaginario social 45 kg 1,60 Ideal


DISPERCION que tan lejos estamos de la idea social
PROMEDIO la idea de la sociedad
Las medidas que le indicarían esto, son las llamadas Medidas de Variabilidad o de
Dispersión. -
Un valor pequeño para una medida de dispersión indica que los datos se encuentran
acumulados cercanamente, por ejemplo, alrededor de la media. Por lo tanto, la media se
considera bastante representativa de los datos
Por lo contrario, una medida de dispersión grande indica que la media no es confiable, es
decir, que no es representativa de los datos
Una segunda razón para estudiar la dispersión en un conjunto de datos es poder comparar

Lic. Jose Gualberto Villarroel Arias Página 1


cuán dispersa están dos o más distribuciones dos distribuciones pueden tener iguales
medidas de tendencia central y sin embargo mostrar grados de dispersión diferentes.

Ejemplo 1 EMPRESA DE COSMETICOS AGENCIA A AGENCIA B AGENCIA C


A B C
15 13 1
15 20 1
15 12 43
45 45 45
X1 = 15 X2 = 15 X3 = 15

X1 = No Hay dispersión. Representa mejor la X


X2 = Hay dispersión
X3 = Hay dispersión. Tiene mayor dispersión
“A MAYOR DISPERSIÓN MENOR CONFIABILIDAD DE LA MEDIDA DE TENDENCIA
CENTRAL".

Tipos de Medidas de Dispersión:


ABSOLUTAS:
Son las que están expresadas en la misma unidad de medida de la variable. Se
estudiarán:
1.) Rango o Recorrido
2.) Desviación Media o Promedio
3.) Varianza y Desviación Estándar

RELATIVAS:
Son las que están expresadas en porcentajes. Se estudiará únicamente:
El Coeficiente de Variación.

4.2 RANGO O RECORRIDO. ( R )


Se denomina Rango o Recorrido a la diferencia entre el máximo valor de la variable
y el mínimo que toma como medida de dispersión se la toma poco en cuenta ya que
nada me dice de los valores intermedios de la variable
Un uso importante del Rango lo encontramos cuando vemos la Estadística
Descriptiva en el Control de Calidad de Proceso solamente tiene en cuenta los valores
extremos de los datos.

Lic. Jose Gualberto Villarroel Arias Página 2


Ejemplo 2

Para diversas formas de presentación de datos se calcula el rango:

a) Sean las observaciones: 28, 38, 70, 96,48

R = Xi máximo – Xi mínimo.

R = 96 – 28 = 68
R = 68

b) Para el caso de una tabulación discreta

X f
Rango R = Xi máx – Xi mín
3 12
R= 6-3 = 3
4 15
Para el Rango no interesa la reiteración de algún dato
5 13
6 10
50

c) Para una clasificación de datos

Xj f
Peso Kg [Linf, Rango R = Xi máx – Xi mín
Marca Frecuencia
Lsup [ R= 70-40 = 30
de clase de Clase
Para el Rango no interesa la reiteración de algún dato
[40, 46[ 43 4
[46 , 52[ 49 5 Ocasionalmente se toma como rango a la diferencia de la
[52 , 58[ 55 7 marca de clase R= 67-43 = 24
[58, 64[ 61 6
[64 , 70[ 67 3
25

Según se aprecia que el rango es fácil de calcular, sin embargo su calidad de


información es baja, de modo que para un análisis mas completo es preferible el uso de
otras medidas de dispersión.

Ejemplo 3
En la ciudad de Sucre durante el verano 7 vendedores de una empresa de equipos de
calefacción y aire acondicionado vendieron las siguientes cantidades de unidades de aire
acondicionado 7 10 2 15 6 8 y 5 ¿Cuál es el recorrido de esta variable, unidades de aire
acondicionado ?

Lic. Jose Gualberto Villarroel Arias Página 3


R = Xi máx – Xi mín
R= 15 – 2 = 13
Respuesta.- El recorrido o rango es 13 y significa que comparando las ventas de los 7
vendedores existe una variación de 13 unidades de aire acondicionado entre el que vendió
más y el que vendió menos.

4.3 DESVIACIÓN MEDIA O PROMEDIO.


Es la media aritmética de las diferencias tomadas en su valor absoluto de cada uno de los
valores con respecto a su media aritmética, Sirve para medir la distancia absoluta
promedio entre cada uno de los datos (observaciones) y el parámetro característico de la
información; que generalmente es la media aritmética.
Fórmulas:
a) Datos sin agrupar ordenación de n datos:
DM =  / x - X /
n
b) Datos Agrupados, tabulación o clasificación de datos:
DM= ƒ / x - X /
ƒj

Donde: / / = Valor absoluto de las desviaciones de la variable con respecto a la media


o bien no tomar en cuenta el signo.

Ejemplo 4
La desviación media de los números 12,14,17,18,19 es:

Primero se calcula la media aritmética del conjunto de datos


∑𝑛𝑗=1 𝑋𝑗 ∑5𝑗=1 𝑋𝑗 12 + 14 + 17 + 18 + 19 80
𝑋= = 𝑋= = = = 16 𝑀𝑒𝑑𝑖𝑎
𝑛 5 5 5
Segundo se saca la desviación media o promedio

∑ 𝗅X − X𝗅 𝗅12 − 16𝗅 + 𝗅14 − 16𝗅 + 𝗅17 − 16𝗅 + 𝗅18 − 16𝗅 + 𝗅19 − 16𝗅
DM = =
n 5

Reemplazando datos, el valor absoluto de un positivo o negativo es positivo

𝗅 − 4𝗅 + 𝗅 − 2𝗅 + 𝗅1𝗅 + 𝗅2𝗅 + 𝗅3𝗅 4 + 2 + 1 + 2 + 3 12


𝐷𝑀 = = = = 2.4
5 5 5

Lic. Jose Gualberto Villarroel Arias Página 4


Ejemplo 5
a) La desviación media de datos agrupados

X F Los datos están agrupados como una tabulación discreta calculando


2 10 previamente la media aritmética
3 16
4 13 ∑ 𝑓𝑥𝑗 − 10 ∗ 2 + 16 ∗ 3 + 13 ∗ 4 + 11 ∗ 5
5 11 𝑋= = = 3.5
∑ 𝑓𝑗 10 + 16 + 13 + 11
50

∑ 𝑓𝑗𝘭𝑋𝑗 − 𝑋𝘭 10𝗅2 − 3.5𝗅 + 16𝗅3 − 3.5𝗅 + 13𝗅4 − 3.5𝗅 + 11𝗅5 − 3.5𝗅 46


𝐷𝑀 = = = = 0,92
∑ 𝑓𝑗 10 + 16 + 13 + 11 50

a) Los datos están agrupados como una clasificación de datos

Xj f
Peso Kg [Linf,
Marca Frecuencia
Lsup [ Calculando previamente la media aritmética X Luego
de clase de Clase
[55, 59[ 57 3 aplicando la definición de desviación media de datos
[59, 63[ 61 7 clasificados Note que los cálculos se hacen con las marcas
[63, 67[ 65 8 de clase
[67, 71[ 69 5
[71, 75[ 73 1
24

∑ 𝑓𝑥𝑗 − 3 ∗ 57 + 7 ∗ 61 + 8 ∗ 65 + 5 ∗ 69 + 1 ∗ 73 1.536
𝑋= = = = 𝟔𝟒
∑ 𝑓𝑗 3+7+8+5+1 24

∑ 𝑓𝑗𝘭𝑋𝑗 − 𝑋𝘭 𝟑𝗹𝟓𝟕 − 𝟔𝟒𝗹 + 7𝗅61 − 64𝗅 + 𝟖𝗹𝟔𝟓 − 𝟔𝟒𝗹 + 5𝗅69 − 64𝗅 + 𝟏𝗹𝟕𝟑 − 𝟔𝟒𝗹 84
𝐷𝑀 = = = = 𝟑, 𝟓
∑ 𝑓𝑗 3+7+8+5+1 24

Lic. Jose Gualberto Villarroel Arias Página 5


Ejemplo 6 (Serie Simple)
Calcular la Desviación Media de la Agencia de computadoras A Y B

Agencia A 13 20 12
Agencia B 1 1 43

A x-X aux
13 2 ( 13 - 15) =2
20 5 ( 20 - 15) =5
12 3 ( 12 - 15) =3
 45  10 10
X = 45 = 15 DE AHÍ SALE
3
DM = / x - X / = 10 = 3.33
N 3
B x-X aux.
1 14 (1 - 15) = 14
1 14 (1 - 15) = 14
43 28 (43 - 15) = 28
45 56 56
DM = 56 = 18.67 Tiene Mayor Dispersión
3
EJEMPLO 7
Hallar la desviación media de: 4,6,12,16,22.

Solución:
__
x = 4 + 6+12+16+22 = 12
5
4 - 12 8
6 - 12 6
𝟐𝟖
𝑫𝑴 = 12- 12 0 = 𝟓, 𝟔
𝟓
16- 12 4
22- 12 10
∑ 28

Lic. Jose Gualberto Villarroel Arias Página 6


4. 4 VARIANZA Y DESVIACION ESTANDAR O TIPICA

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de


una distribución estadística. Se denomina varianza de una variable estadística, y se denota
por s² al promedio del cuadro de las distancias entre cada observación y la media:

La desviación estándar (σ sigma ) mide cuánto se separan los datos.

Varianza
la varianza (que es el cuadrado de la desviación estándar: sigma σ2) se define así:
Es la media de las diferencias con la media elevadas al cuadrado.
En otras palabras, sigue estos pasos:

1. Calcula la media (el promedio de los números)


2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia
elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado

¿Por qué al cuadrado?

Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar
que los números negativos reduzcan la varianza)

Y también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es
mucho más grande que 502=2,500.

Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo deshacemos
(con la raíz cuadrada) y así la desviación estándar es mucho más útil.

Qué significa la desviación estándar respecto a los riesgos de inversión?


Las inversiones en mercados financieros pueden ser en forma de acciones, bonos y divisas.
El único propósito de una inversión es obtener un retorno positivo, pero cada inversión tiene
riesgos inherentes de generar pérdidas. En finanzas cuantitativas, se utilizan herramientas
estadísticas como la media, desviación, estándar y coeficiente de varianza para determinar
el desempeño de acciones y también para tomar decisiones de inversión
Que es desviación estándar?
Justamente la desviación Estándar, en un conjunto de datos (precios en el caso del mercado
de valores) es una medida de dispersión, que nos indica cuánto pueden alejarse los valores
respecto al promedio (media), por lo tanto es útil para buscar probabilidades de que un
evento ocurra, o en el caso del mercado bursátil, determinar entre que rango de precios
puede moverse un determinado activo, y determinar que tipo de activos pueden ser mas
volátiles que otros.
En finanzas, la desviación estándar es una medida de riesgo ya que entre mayor dispersión
o variabilidad de los rendimientos de un activo, más grande la posibilidad de que el

Lic. Jose Gualberto Villarroel Arias Página 7


rendimiento esperado y el realizado sean distintos entre sí.
La Varianza
8 Cms

Aquí tenemos 6 rectángulos cuya altura es de 8 centímetros (todos tienen la misma base)
¿Existe alguna variación respecto de su altura entre estos rectángulos?
¿Cuál es el promedio de la altura de estos rectángulos?

8 + 8 + 8 + 8 + 8 + 8 48
= =8
6 6
La Varianza
1
8 8 0 8 8
6
8 Cms

El tercer rectángulo y el quinto en un acto de rebeldía cambiaron su altura El tercer


rectángulo, ahora mide 10 cmt y el quinto mide 6 cmts
¿Cuál es el promedio de estos 6 rectángulos?

8 + 8 + 10 + 8 + 6 + 8 48
= =8
6 6
¡El mismo promedio! Pero….. ¿Ha habido variación?

El tercer rectángulo tiene + dos cmts sobre el promedio y el 5to rectángulo tiene – 2 cms
bajo el promedio. Los otros rectángulos tienen cero diferencias respecto al promedio
Si sumamos estas diferencias de la altura respecto del promedio, tenemos
0+0+2+0-2+0+0 = 0
Este valor nos parece indicar que no habido Variabilidad y sin embargo, ante nuestros ojos
sabemos que existe variación
8
02 + 02 +22 + 02 (−2)2 + 22 = = 1.3333
6
La varianza fue 1.33333

Observemos que las unidades involucradas en el cálculo de la varianza están al cuadrado.


En rigor la varianza es de 1.33333 centímetros cuadrados de manera que se define

√1.333 = 1.15 La raíz cuadrada de la varianza se llama DEVIACION ESTANDAR O

Lic. Jose Gualberto Villarroel Arias Página 8


TIPICA
Que La desviación estándar haya sido de 1.15 significa que en un promedio la altura de los
rectángulos variaron ( ya sea aumentando ya sea disminuyendo ) en 1.15 cms
Es claro que esta situación es “en promedio”, puesto que sabemos que los causantes de
la variación fueron los rectángulos tercero y quinto . Esta variación hace repartir la “culpa”
a todos los demás rectángulos que se “portaron bien”.
La desviación estándar mide la dispersión de los datos respecto del promedio

Varianza
Para UNA ORDENACIÓN DE DATOS X1,X2,X3, ………..Xn la varianza se calcula como

VARIANZA POBLACIONAL

(1) ∑𝑁
𝐽=1(𝑋𝑗 − 𝑢)
2 ∑ (𝑥 − 𝑢)2
б2 = = = (𝑥 − 𝑢)2
𝑁 𝑁
VARIANZA MUESTRAL

(2) ∑𝑁
𝐽=1(𝑋𝑗 − 𝑥)
2 ∑ (𝑥 − 𝑥)2 𝑛 ∑ 𝑥 2 − (∑ 𝑥)2
𝑠2 = = =
𝑛−1 𝑛−1 𝑛(𝑛 − 1)

Donde la media aritmética de una población y de una muestra respectivamente son u X


(su modo de calculo es el mismo) se toma en cuenta que el total de datos se representa
por N n para una población o muestra respectivamente

Para DATOS AGRUPADOS y sea como TABULACIÓN DISCRETA O CLASIFICACIÓN


DE DATOS la varianza se calculo por:

VARIANZA POBLACIONAL

(3) ∑𝑘𝐽=1(𝑋𝑗 − 𝑢)2 ∑ 𝑓 (𝑥 − 𝑢)2


б2 = = = (𝑥 − 𝑢)2
∑𝑘𝑗=1 𝑓 − 1 𝑁

VARIANZA MUESTRAL

∑𝑘𝐽=1(𝑋𝑗 − 𝑥)2 ∑ (𝑥 − 𝑥)2 𝑛 ∑ 𝑓𝑥 2 − (∑ 𝑓𝑥)2


(4) 𝑠2 = = =
∑𝑘𝑗=1 𝑓 − 1 𝑛−1 𝑛−1

Lic. Jose Gualberto Villarroel Arias Página 9


Donde los f son las frecuencias para una tabulación discreta los x son los datos diferentes
entre si Para una clasificación los x son las marcas de clase
Cuando no esta especificado si se busca una varianza poblacional o maestral se asume
que es muestral

Ejemplo 8

Se calcula la varianza poblacional y muestral de los siguientes conjuntos de datos


a) De los números 12,14,17,18,19

∑𝑁
𝐽=1 𝑋𝑗 ∑𝑁
𝐽=1 𝑋𝑗 12 + 14 + 17 + 18 + 19 80
𝑢2 = = = = = 16
𝑁 5 5 5

∑𝑁
𝐽=1(𝑋𝑗 − 𝑢)
2 ∑5𝐽=1(𝑋𝑗 − 16)2
б2 = =
𝑁 5

(12 − 16)2 + (14 − 16)2 + (17 − 16)2 +(18 − 16)2 + (19 − 16)2 34
𝑢2 = = = 6,8
5 5

A su vez asumiendo que los datos representan a una muestra se calcula su varianza

∑𝑁
𝐽=1 𝑋𝑗 ∑5𝐽=1 𝑋𝑗 12 + 14 + 17 + 18 + 19 80
𝑥 = = = = = 16
𝑁 5 5 5

∑𝑁𝐽=1(𝑋𝑗 − 𝑥)
2 ∑5𝐽=1(𝑋𝑗 − 16)2
𝑠2 = = =
𝑛−1 5−1
(12 − 16)2 + (14 − 16)2 + (17 − 16)2 +(18 − 16)2 + (19 − 16)2 34
𝑠2 = = = 8,5
4 4

Muchas de las operaciones se reiteran en ambos cálculos ya que la diferencia básica entre
la varianza poblacional y muestral radica en que un caso se divide entre el total (n) y en el
otro caso entre eses total menos uno (n-1)

b) Se calcula inicialmente la varianza poblacional de datos agrupados como tabulación


discreta
X f
2 10
3 16

Lic. Jose Gualberto Villarroel Arias Página 10


4 13 Calculando antes de la media
5 11 ∑ 𝑓𝑗 𝑋𝑗 10.2 + 16.3 + 13.4 + 11.5
𝑢 = = = 3.5
∑ 𝑓𝑗 10 + 16 + 13 + 11
50
por la diferencia de varianza poblacional
∑𝑘
𝐽=1 𝑓𝑗(𝑋𝑗−𝑢)
2 ∑4𝐽=1 𝑓𝑗(𝑋𝑗−3.5)2
б2 = 𝑘
∑𝑗=1 𝑓
= ∑4𝑗=1 𝑓𝑗

10(2 − 3.5)2 + 16(3 − 3.5)2 + 13(4 − 3.5)2 +11(5 − 3.5)2 54.4


= = = 1.09
50 50

La media de población o muestra es la misma u = x = 3.5

Calculando luego la varianza muestral

∑𝑘
𝐽=1 𝑓𝑗 (𝑋𝑗−𝑥)
2 ∑5𝐽=1 𝑓𝑗 (𝑋𝑗−3.5)2
𝑠2 = ∑𝑘
= ∑𝑘
Por definición de varianza muestral
𝑗=1 𝑓−1 𝑗=1 𝑓−1

10(2 − 3.5)2 + 16(3 − 3.5)2 + 13(4 − 3.5)2 +11(5 − 3.5)2 54.4


= = = 1.11
(10 + 16 + 13 + 11) − 1 49

c) Se calcula la varianza de datos agrupados como clasificación de datos previamente


se calcula la varianza poblacional

Xj f Clasificación en 5 clases (k=5) se indica la marca y


Peso Kg [Linf,
Marca Frecuencia frecuencia de clase
Lsup [
de clase de Clase
La frecuencia total es N= ∑ j = 24
[55, 59[ 57 3 Previamente calculando la Media
[59, 63[ 61 7 ∑ 𝑓𝑗 𝑋𝑗 1536
[63, 67[ 65 8 𝑢= ∑ 𝑓𝑗
= = 64
24
[67, 71[ 69 5
[71, 75[ 73 1 Por la definición de la varianza poblacional
24
∑𝑘
𝐽=1(𝑋𝑗−𝑢)
2 ∑5𝐽=1(𝑋𝑗−64)2
б2 = ∑𝑘
= ∑5𝑗=1 𝑓
𝑗=1 𝑓

3(57−64)2 +7(61−64)2 +…………1(73−64)2 424


= = = 17.67POBLACIONAL
3+7+8+5+1 24

Se calcula luego la varianza muestral la, la media de la población es igual a la muestra:


u= x = 64
Lic. Jose Gualberto Villarroel Arias Página 11
2 ∑𝑘
𝐽=1(𝑋𝑗−𝑥)
2 ∑5𝐽=1(𝑋𝑗−64)2
𝑠 = = ∑5𝑗=1 𝑓−1
∑𝑘
𝑗=1 𝑓−1

3(57 − 64)2 + 7(61 − 64)2 + … … … … 1(73 − 64)2 424


= = = 18.43 𝑀
(3 + 7 + 8 + 5 + 1) − 1 23

La tabla representa la longitud de cintura (en cm) de un conjunto de 24 damas el resultado


obtenido se interpreta como una mediada de cuan diversas son tales medidas

Método abreviado
El calculo de un modo mas rápido de la varianza poblacional requiere de las expresiones

2
∑𝑁
𝐽=1(𝑋𝑗−𝑥)
2 ∑𝑘
𝐽=1 𝑓𝑗(𝑋𝑗−𝑋)
б2 = = 𝑋2 − 𝑋2 ; б2 = ∑𝑘
= 𝑋2 − 𝑋2
𝑗=1 𝑓
𝑁

Por tanto la diferencia entre la media de los cuadrados x2 y el cuadrado de la media x2


determinan la varianza poblacional

Ejemplo 9
La varianza poblacional de los números 12,14,17,18,19 por la expresión abreviada es:

Calculando la media de los cuadrados

∑𝑁
𝐽=1 𝑋𝑗
2 ∑5𝐽=1 𝑋𝑗 2 122 + 142 + 172 + 182 + 192 1314
𝑋2 = = = = = 262.8
𝑁 5 5 5
Luego la media aritmética de los datos que se elevara al cuadrado
Reemplazando en la expresión abreviada de б2 sigma se verifica el mismo resultado del
ejemplo …….

∑𝑁
𝐽=1 𝑋𝑗
2 ∑5𝐽=1 𝑋𝑗 2 12 + 14 + 17 + 18 + 19 80
𝑋 = = = = = 16 ↦ 162 = 256
𝑁 5 5 5

2 2
б2 = 𝑋 − 𝑋 = 262.8 − 256 = 6.8

Desviación estándar o típica

La desviación estándar de una población se designa por б o sigma. La desviación estándar


de una muestra se designa por s. Son las raíces cuadradas de las varianzas de una
población o muestra respectivamente; por tanto

Lic. Jose Gualberto Villarroel Arias Página 12


Para una ORDENACION DE DATOS x1,x2,x3…..xn la desviación estándar se calcula por:

DESVIACION ESTANDAR POBLACIONAL

∑𝑵
𝑱=𝟏(𝑿𝒋 − 𝒖)
𝟐 𝑲
(1) б=√ = √(𝑿 − 𝒖)𝟐 ; 𝑵 = ∑ 𝒇𝒋
𝑵 𝒋=𝟏

DESVIACION ESTANDAR MUESTRAL

∑𝑵
𝑱=𝟏(𝑿𝒋 − 𝑿)
𝟐 𝑲
(2) 𝒔 =√ = √(𝑿 − 𝑿)𝟐 ; 𝑵 = ∑ 𝒇𝒋
𝒏−𝟏 𝒋=𝟏

Donde u son la media aritmética de una población o una muestra (poseen el mismo valor)

Para DATOS AGRUPADOS la desviación estándar se calcula como:

DESVIACION ESTANDAR POBLACIONAL

∑𝒌𝑱=𝟏 𝒇𝒋 (𝑿𝒋 − 𝒖)𝟐 𝑲


б=√ = √(𝑿 − 𝒖)𝟐 ; 𝑵 = ∑ 𝒇𝒋
(3) 𝑵 𝒋=𝟏

DESVIACION ESTANDAR MUESTRAL

∑𝒌𝑱=𝟏 𝒇𝒋 (𝑿𝒋 − 𝑿)𝟐 𝒏 ∑ 𝒇 𝑿𝟐 − (∑ 𝒇 𝑿)𝟐


(4) 𝑺=√ = √
𝒏−𝟏 𝒏−𝟏

Donde los f son las frecuencias .Para una tabulación discreta los Xj son los datos
deferentes entre si Para una clasificación los Xj son las marcas de clase
Cuando no se especifica si se trata de población o muestra, se asume que es muestra (
Cuando se calcula la desviación estándar en una calculadora o en una pc se obtiene la
desviación estándar muestral )

Ejemplo 10
a) De los números 12,14,17,18,19 ; La desviación estándar poblacional es:

Calculando la media aritmética .Luego por la definición de la Desviación estándar, para N


Lic. Jose Gualberto Villarroel Arias Página 13
=5

∑ 𝑋𝑗 ∑ 𝑋𝑗 12 + 14 + 17 + 18 + 19 80
𝑢= = = = = 16
𝑁 5 5 5

∑(𝑿𝒋−)𝟐 ∑(𝑿𝒋−𝟏𝟔)𝟐 (𝟏𝟐−𝟏𝟔) 𝟐 +(𝟏𝟒−𝟏𝟔)𝟐 +(𝟏𝟕−𝟏𝟔)𝟐 +(𝟏𝟖−𝟏𝟔)𝟐 +(𝟏𝟗−𝟏𝟔)𝟐


б=√ = √ = √
𝑵 𝟓 𝟓

𝟏𝟔 + 𝟒 + 𝟏 + 𝟒 𝟗 𝟑𝟒
б= √ = √ = 𝟐. 𝟔𝟏
𝟓 𝟓

Para la desviación estándar muestral se considera que los datos representan a una
muestra, La media de una población o de una muestra es la misma: u X = 6

∑(𝑿𝒋 −)𝟐 (𝟏𝟐 − 𝟏𝟔)𝟐 + (𝟏𝟒 − 𝟏𝟔)𝟐 + (𝟏𝟕 − 𝟏𝟔)𝟐 + (𝟏𝟖 − 𝟏𝟔)𝟐 + (𝟏𝟗 − 𝟏𝟔)𝟐
𝒔=√ = √
𝒏−𝟏 𝟓−𝟏

𝟑𝟒
𝒔= √ = 𝟐. 𝟗𝟐
𝟒

b) Los datos están agrupados como una tabulación discreta

Calculando previamente la media de los datos


X F
5 11
6 13
7 16 Esta media es válida tanto para Población o como para muestra
8 10 ∑ 𝑓𝑗 𝑋𝑗 325
𝑢= = = 6.5
50 ∑ 𝑓𝑗 50

Por definición de la desviación estándar

Por la definición de desviación estándar poblacional

∑𝒌𝑱=𝟏 𝒇𝒋 (𝑿𝒋 − 𝑿)𝟐 ∑𝟓𝑱=𝟏 𝒇𝒋 (𝑿𝒋 − 𝟔. 𝟓)𝟐


б=√ = √
∑𝒌𝑱=𝟏 𝒇𝒋 ∑𝟓𝑱=𝟏 𝒇𝒋

𝟏𝟏(𝟓 − 𝟔. 𝟓)𝟐 + 𝟏𝟑(𝟔 − 𝟔. 𝟓)𝟐 + 𝟏𝟔(𝟖 − 𝟔. 𝟓)𝟐 + 𝟏𝟎(𝟖 − 𝟔. 𝟓)𝟐 𝟓𝟒. 𝟓


=√ = √ = 𝟏. 𝟎𝟒𝟒𝟎
𝟏𝟏 + 𝟏𝟑 + 𝟏𝟔 + 𝟏𝟎 𝟓𝟎

Lic. Jose Gualberto Villarroel Arias Página 14


Por la definición de desviación estándar muestral

∑𝒌𝑱=𝟏 𝒇𝒋 (𝑿𝒋 − 𝑿)𝟐 ∑𝟓𝑱=𝟏 𝒇𝒋 (𝑿𝒋 − 𝟔. 𝟓)𝟐


𝒔 =√ = √
∑𝒌𝑱=𝟏 𝒇𝒋 − 𝟏 ∑𝟓𝑱=𝟏 𝒇𝒋 − 𝟏

𝟏𝟏(𝟓 − 𝟔. 𝟓)𝟐 + 𝟏𝟑(𝟔 − 𝟔. 𝟓)𝟐 + 𝟏𝟔(𝟖 − 𝟔. 𝟓)𝟐 + 𝟏𝟎(𝟖 − 𝟔. 𝟓)𝟐 𝟓𝟒. 𝟓


=√ = √ = 𝟏. 𝟎𝟓𝟒𝟔𝟔
(𝟏𝟏 + 𝟏𝟑 + 𝟏𝟔 + 𝟏𝟎) − 𝟏 𝟒𝟗

c) Se calcula la desviación estándar poblacional de datos clasificados que


representan el peso en kg de un grupo de 20 individuos

Los datos están clasificados en 5 clases (k=5) se indica la marca y frecuencia de clase

La frecuencia total es N = ∑ f = 24

Previamente calculando la media (44*2= 88…. .76*4 = 1448) Peso Kg [Linf,


Xj f
Marca Frecuencia
∑ 𝑓𝑗 𝑋𝑗 1488
Lsup [
𝑢= = = 62 de clase de Clase
∑ 𝑓𝑗 24
[40, 48[ 44 2
[48 , 56[ 52 4
[56 , 64[ 60 8
∑𝒌𝑱=𝟏 𝒇𝒋 (𝑿𝒋 − 𝑿)𝟐 ∑𝟓𝑱=𝟏 𝒇𝒋 (𝑿𝒋 − 𝟔𝟐)𝟐 [64, 72[ 68 6
б=√ = √ [72 , 80[ 76 4
∑𝒌𝑱=𝟏 𝒇𝒋 ∑𝟓𝑱=𝟏 𝒇𝒋
24

𝟐(𝟒𝟒 − 𝟔𝟐)𝟐 + 𝟒(𝟓𝟐 − 𝟔𝟐)𝟐 + 𝟖(𝟔𝟎 − 𝟔𝟐)𝟐 + 𝟔(𝟔𝟖 − 𝟔𝟐)𝟐 + 𝟒(𝟕𝟔 − 𝟔𝟐)𝟐 𝟐𝟎𝟖𝟎
=√ = √ = 𝟗. 𝟑𝟏
𝟐+𝟒+𝟖+𝟔+𝟒 𝟐𝟒

∑𝒌𝑱=𝟏 𝒇𝒋 (𝑿𝒋 − 𝑿)𝟐 ∑𝟓𝑱=𝟏 𝒇𝒋 (𝑿𝒋 − 𝟔𝟐)𝟐


𝒔 =√ = √
∑𝒌𝑱=𝟏 𝒇𝒋 − 𝟏 ∑𝟓𝑱=𝟏 𝒇𝒋 − 𝟏

𝟐(𝟒𝟒 − 𝟔𝟐)𝟐 + 𝟒(𝟓𝟐 − 𝟔𝟐)𝟐 + 𝟖(𝟔𝟎 − 𝟔𝟐)𝟐 + 𝟔(𝟔𝟖 − 𝟔𝟐)𝟐 + 𝟒(𝟕𝟔 − 𝟔𝟐)𝟐 𝟐𝟎𝟖𝟎
=√ = √ = 𝟗. 𝟓𝟏
( 𝟐 + 𝟒 + 𝟖 + 𝟔 + 𝟒) − 𝟏 𝟐𝟑

Lic. Jose Gualberto Villarroel Arias Página 15


Existe semejanza de los cálculos las desviaciones estándar poblacional y muéstrales

Las medidas de dispersión desviación estándar y varianza usan los mismos procedimientos
de calculo ya que la segunda es al cuadrado de la primera el porque de que se emplean
ambas se debe a que frecuentemente se precisa de homogeneidad en las dimensiones

Por ejemplo si los datos son las estaturas en cm la desviación estándar estará en cm la
varianza estará en cm2 Por tanto para fines de comparación será adecuada la desviación
estándar, sin embargo para otros análisis matemáticos se precisa de la varianza.

Para una gran cantidad de datos (n grande) la desviación muestral y desviación muestral
sesgada son prácticamente idénticos

Lic. Jose Gualberto Villarroel Arias Página 16

También podría gustarte