Está en la página 1de 8

CARRERA: DESARROLLADOR DE SOFTWARE

ESTADISTICA - AÑO 2022

Parámetros o medidas de Dispersión


De manera intuitiva podemos darnos cuenta de que una medida de posición es más representativa
del total de observaciones si la variabilidad del conjunto es pequeña.
Si las estaturas correspondientes a tres personas son 1,71, 1,72 y 1,73m; su media es 1,72. Pero
si las alturas de las tres personas hubiesen sido 1,66, 1,72, 1,78m, la altura media también hubiera
sido 1,72m.
Se puede observar que la altura media describe mejor al primer grupo de datos ya que en este
grupo las medidas son más parecidas entre sí y más parecidas al promedio que cuando se observa
el segundo conjunto de datos.
Para determinar si los datos del primer grupo son más parecidos entre sí que los del segundo,
debemos tomar un punto de referencia y medir esas diferencias entre cada valor observado y el
punto de referencia establecido.
En general, el punto de referencia elegido corresponde a una medida de posición adecuada. Para
el ejemplo consideramos la media aritmética como medida adecuada.
Media = 1,72m
Calculamos el desvio para cada valor de la variable observada en la primera muestra.
𝐷1 = 1,71 − 1,72 = −0.01
𝐷2 = 1,72 − 1,72 = 0.00
𝐷3 = 1,73 − 1,72 = 0,01
Calculamos el desvío para cada valor de la variable observada en la segunda muestra.
𝐷1 = 1,66 − 1,72 = −0.06
𝐷2 = 1,72 − 1,72 = 0.00
𝐷3 = 1,78 − 1,72 = 0,06
Para comparar las dispersiones de ambas muestras debemos establecer una medida que las
resuma y esa medida podría ser el promedio de las diferencias de cada grupo.
Para el primer grupo ese promedio de los desvíos será igual a:
−0.01 + 0,00 + 0,01
𝐷= =0
3
Para la segunda muestra se tiene:
−0.06 + 0,00 + 0,06
𝐷= =0
3
Como puede observarse las diferencias negativas se compensan con las positivas, luego este
promedio es siempre cero. Se expresa como una propiedad de la media aritmética que expresa lo
siguiente:
La suma de los desvíos de cada valor de la variable con respecto a la media aritmética es
cero.
Debido a la propiedad de la media aritmética podemos observar que el promedio de las
desviaciones no nos sirve para determinar la variabilidad de un conjunto de datos por ello se recurre
a otros indicadores que actúan como medida resúmen.
Rango
Se denomina rango de un conjunto de observaciones a la diferencia entre el mayor y menor valor
de la variable.

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

La utilización del rango como medida de dispersión presenta el problema que se incrementa con la
cantidad de observaciones, ya que existe mayor probabilidad de que los datos se encuentren más
dispersos.
El rango es una medida de dispersión satisfactoria cuando la muestra es pequeña en general
cuando es menor o igual a 10 observaciones.
Se utiliza con mayor frecuencia en los estudios de control de procesos productivos para la
confección de gráficos de control, en general cada proceso es evaluado por muestras frecuentes y
de tamaño reducido.
Desvío Medio
La desviación media mide el promedio de las diferencias entre los valores observados respecto a
la media del grupo, sin tener en cuenta el signo de la desviación.

Pesos Desviación Desviación absoluta


2.800 -0.500 0.500
3.600 0.300 0.300
3.700 0.400 0.400
2.500 -0.800 0.800
3.900 0.600 0.600
16.500 0.000

La media aritmética es 3.300Kg


Por la propiedad enunciada se puede observar que en la columna numero dos la suma da 0:
Si hallamos el promedio de estos números tenemos una medida de variabilidad de la muestra
llamado desviación media.
0.5+0.3+0.4+0.8+0.6
𝐷𝑀 = = 0.52𝐾𝑔 =
5
A diferencia del rango la desviación media considera todas las observaciones de la muestra.
𝑛
̅ ∑𝑖=1 𝑋𝑖 ;
Simbolicamente se tiene = 𝑋 el desvio medio será:
𝑛
∑𝑛𝑖=1|𝑥𝑖−𝑋̅ |
𝐷𝑀 =
𝑛
Desviación Mediana

∑𝑛𝑖=1|𝑥𝑖−𝑀𝑒 |
𝐷𝑀𝑒 =
𝑛
Las desviaciones son definidas, ahora como diferencias entre las observaciones y la mediana.
Propiedad Relativa a la Mediana
La suma de los valores absolutos de las desviaciones es mínima cuando las mismas se calculan
tomando como punto de referencia la mediana.
Para corroborar esta propiedad, calculamos la desviación mediana en el ejemplo de los pesos de
los niños al nacer.
Me = 3.600

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

Pesos Desviación Desviación


absoluta
2.800 -0.800 0.800
3.600 0.000 0.000
3.700 0.100 0.100
2.500 -1.100 1.100
3.900 0.300 0.300
-1500 2.300

2300
𝐷𝑀𝑒 = = 0.460
5
Varianza
Vimos que el modo más adecuado de estudiar la mayor o menor dispersión de los datos alrededor
de un cierto valor de referencia es utilizar la desviación de cada uno de los valores individuales con
respecto al valor de referencia establecido.
Volvemos a considerar las desviaciones con respecto a la media aritmética de un conjunto de datos.
En primer lugar, consideramos el valor absoluto de las desviaciones para evitar que su suma sea
cero. Luego elevamos cada desvío al cuadrado. Entonces la fórmula para obtener la varianza es la
siguiente. Simbólicamente tenemos:

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑉(𝑥 ) =
𝑛
Considerando el peso de los bebes al nacer consideramos el calculo de los desvíos.
Pesos Desviación Cuadrado del
desvío
2.800 -0.500 0.250
3.600 0.300 0.090
3.700 0.400 0.160
2.500 -0.800 0.640
3.900 0.600 0.360
16.500 0.000 1.500

1.500
𝑣(𝑥 ) = = 0.30𝑘𝑔
5
Al utilizar el recurso de elevar al cuadrado los desvíos, nos ha quedado alterada la unidad de
medida, para evitar este inconveniente se utiliza como medida de dispersión la raíz cuadrada de la
varianza, lo que se conoce como desviación estándar, simbólicamente se tiene:

𝐷(𝑥 ) = √𝑉(𝑥)
Para el ejemplo se 𝐷(𝑥) = √0.30= 0.55Kg

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

CONCLUSION: El peso promedio de niños al nacer, de acuerdo a la muestra considerada, es de


3.300kg con una variabilidad de aproximadamente medio kilogramo o de 550gramos.
Coeficiente de Variación
El coeficiente de variación expresa la desviación estándar como porcentaje de la media
𝐷(𝑥)
𝐶𝑉 = ∗ 100
𝑥̅
Es una medida de dispersión relativa, dado que surge como el cociente entre dos cantidades
expresadas en la misma unidad de medida, es independiente de ella.
Se utiliza para comparar la homogeneidad de dos series de datos, aun cuando están expresadas
en distintas unidades de medida.
A medida que el coeficiente de variación disminuye, se observa mayor homogeneidad de los datos
o, lo que es lo mismo, los datos están más concentrados alrededor del promedio.
0.55𝑘𝑔
Considerando el ejemplo de los bebes al nacer se tiene: 𝐶𝑉 = ∗ 100 =
3.300𝑘𝑔
16.67%.Si
Medidas de Forma
Índices de forma: El principal objetivo perseguido en la utilización de éstos índices consiste en
estudiar la forma de la distribución en cuanto a su simetría (desplazamiento horizontal) como su
puntiagudez (desplazamiento vertical).
Los índices de forma que veremos a continuación son todos considerados robustos.
Índice de Simetría
Una distribución perfectamente simétrica adopta la siguiente forma:
Presenta un solo valor modal y luego decae en ambos lados de dicho valor mostrando igual
frecuencia para valores equidistantes.

Un conjunto de observaciones que no está simétricamente distribuido se dice que es sesgado.


El sesgo es positivo si la mayor proporción de las observaciones son menores o iguales que la
media, esto indica que la media es mayor que la mediana. El histograma de una distribución
positivamente sesgada generalmente tendrá una cola más larga a derecha de la distribución, por
ello esta distribución se conoce como sesgada a la derecha.

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

Por otro lado, una distribución negativamente sesgada tiene más observaciones mayores o iguales
a la media. Tal distribución tiene una media menor que la mediana. El histograma de una
distribución negativamente sesgada tiene una cola más larga a izquierda de la distribución por eso
se conoce como distribución sesgada a izquierda.

Índice de Simetría de Pearson


El coeficiente más simple para probar el sesgo de una distribución es el de Pearson que se calcula
de la siguiente manera:
(𝑀𝑒𝑑𝑖𝑎 − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎)
𝑆𝑃 = 3 ∗
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑆𝑡á𝑛𝑑𝑎𝑟𝑑
Si la distribución es perfectamente insesgada, la media y la mediana coinciden y el valor de 𝑆𝑃 = 0.
Una distribución que es sesgada a la izquierda tendrá la media mayor a la mediana y luego 𝑆𝑃 =
𝑡𝑒𝑛𝑑𝑟𝑎 𝑢𝑛 𝑣𝑎𝑙𝑜𝑟 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜. En cambio, si la media es menor a la mediana, 𝑆𝑃 𝑠𝑒𝑟𝑎 𝑚𝑒𝑛𝑜𝑟 𝑞𝑢𝑒 𝑐𝑒𝑟𝑜 y
la distribución será sesgada a izquierda.
Índice de Simetría de Yule
Su fórmula de calculo es la siguiente
𝐶25 + 𝐶75 − 〈2𝑀𝑒〉
𝐻1 =
2𝑀𝑒
Como también está definido entre el primer y tercer cuartil, hace referencia al 50% de la distribución.
La interpretación de éste índice es el siguiente:
Si 𝐻1 = 0 𝑙a distribución es simétrica

Si 𝐻1 > 0 La distribución es asimétrica positiva ( existe un sesgo o una carencia de datos en la mitad
superior de la distribución.

Si 𝐻1 < 0 la distribución es asimétrica negativa( existe un sesgo o una carencia de datos en la mitad
inferior de la distribución.

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

Coeficiente de Curtosis o Puntiagudez


Este coeficiente compara la distribución de frecuencia de una variable con una distribución teórica
perfectamente simétrica, la distribución normal.
La distribución normal adopta la forma de una campana.
El coeficiente de Curtosis compara distribuciones empíricas en cuanto a si son más puntiagudas o
no con respecto a la distribución normal.
Si la distribución empírica es mas puntiaguda que la normal tendremos el siguiente gráfico.

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

En éste caso se dice que la distribución es leptocúrtica.


En cambio, si la distribución es más achatada que la normal adoptando la siguiente forma decimos
que la distribución es platicurtica..

Si la distribución es bastante parecida a la distribución normal diremos que es mesocurtica.

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

Coeficiente de Curtosis Robusta


𝐶90 − 𝐶10
𝐾1
1.9〈𝐶75 − 𝐶25 〉
Su interpretación es la siguiente:
𝑆𝑖 𝐾1 = 1 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑠 𝑚𝑒𝑠𝑜𝑐ú𝑟𝑡𝑖𝑐𝑎 ( 𝑠𝑒𝑚𝑒𝑗𝑎𝑛𝑡𝑒 𝑎 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙)
𝑆𝑖 𝐾1 > 1 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑠 𝑙𝑒𝑝𝑡𝑜𝑐ú𝑟𝑡𝑖𝑐𝑎 ( 𝑚á𝑠 𝑝𝑢𝑛𝑡𝑖𝑎𝑔𝑢𝑑𝑎 𝑞𝑢𝑒 𝑙𝑎 𝑛𝑜𝑟𝑚𝑎𝑙).
𝑆𝑖 𝐾1 < 1 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑠 𝑝𝑙𝑎𝑡𝑖𝑐ú𝑟𝑡𝑖𝑐𝑎 ( 𝑚𝑎𝑠 𝑎𝑐ℎ𝑎𝑡𝑎𝑑𝑎 𝑞𝑢𝑒 𝑙𝑎 𝑛𝑜𝑟𝑚𝑎𝑙).

Profesora: Lisa Graciela SALINAS

También podría gustarte