Medidas de Dispersión

MEDIDAS DE DISPERSIÓN INTRODUCCION: El conocimiento de la forma de la distribución y del respectivo promedio de una colección de valores de una variable, puede servir para tener una idea bastante clara de la conformación, pero no de de la homogeneidad de cada una de los valores con respecto a la medida de tendencia central aplicada. En el caso de las variables con valores que pueden definirse en términos de alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersión o variabilidad existente en el grupo de variantes en estudio. A estos indicadores les llamamos medidas de dispersión, por cuanto que están referidos a la variabilidad que exhiben los valores de las observaciones, ya que si no hubiere variabilidad o dispersión en los datos interés, entonces no habría necesidad de la gran mayoría de las medidas de la estadística descriptiva. Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras. LA DISPERSIÓN Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad. La dispersión es importante porque: Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.   Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas. Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.

DESVIACIÓN ESTÁNDAR: ( DE. la varianza. por ultimo se extrae la raíz cuadrada para volver a la unidad de origen. se eleva cada desviación al cuadrado para hacer desaparecer el signo. 27. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de los límites de clases. Ya que la dispersión ocurre frecuentemente y su grado de variabilidad es importante. Vamos a considerar sólo algunas medidas de dispersión absolutas: el rango. el rango se define como la diferencia entre el valor más alto (Xn ó Xmax..Pero si hay dispersión en la mayoría de los datos. Como esta suma siempre es 0 ( cero). Se aproxima el rango tomando el limite superior de la última clase menos el limite inferior de la primera clase. R = Xmáx. para calcular la media aritmética (promedio de las edades. la suma de estos cuadrados se divide entre el numero de observaciones menos uno ( n-1). ¿cómo medimos la variabilidad de una distribución empírica?. y debemos estar en capacidad de describirla. Rango para datos no agrupados.) y el mas bajo (X1 ó Xmin) en un conjunto de datos.23. EL RANGO O AMPLITUD (R): Es la medida de variabilidad más fácil de calcular.-Xmín = Xn-X1 Ejemplo: Se tienen las edades de cinco estudiantes universitarios de Ier año. Para datos finitos o sin agrupar. Ejemplo: Días de hospitalizacion en 7 pacientes con bronquitis ( calculo de la desviación estándar) Número del Días de Valores xi . S) en series no agrupadas: La desviación Estándar consiste en averiguar en cuanto difiere cada observación ( xi) del promedio general del grupo. se tiene que: R = (Xn-X1) = 34-18 = 16 años Con datos agrupados no se saben los valores máximos y mínimos.34 y 25. a saber: 18. MEDIDAS DE VARIABILIDAD MÁS USADAS        RANGO DESVIACION ESTANDAR VARIANZA COEFICIENTE DE VARIACION DECILES CUARTILES PERCENTILES. la desviación estándar y el coeficiente de variación.

medio de la clase 2 x 3 Prs 2 x3 20-24 25-29 30-34 35-39 40-44 45-49 50-54 Total 4 8 9 10 7 6 6 22 27 32 37 42 47 52 88 216 288 370 294 282 312 484 729 1024 1369 1764 2209 2704 1936 5832 9216 13690 12348 13254 16224 Peso en kilos Nº de Personas fi x2 Producto de la columnas 3x4 50 1850 72500 . S= 5. Sumar la observaciones = 49 2. Dividir por el numero de observaciones menos 1. Producto de la columnas Pto. restar este ultimo valor a la suma de cuadrados obtenida en el paso 2 ( 497- 343) = 154 5. Elevar al cuadrado cada observación y sumar esta columna =497 3. Desviación estándar en series agrupadas Los diferentes pasos que deben seguirse para el calculo de la Desviación Estándar aparecen resumidos en el siguiente cuadro.paciente Primero Segundo Tercero Cuarto Quinto Sexto Séptimo Total hospitalización al cuadrado 1 2 3 7 11 12 13 49 1 4 9 49 121 144 169 497 Los pasos a seguir son los siguientes: 1. cuyas primeras cuatro columnas se utilizan para calcular el promedio conforme ya se estudio previamente. Elevar al cuadrado las suma de las observaciones obtenidas en el primer paso y dividir por el numero de observaciones= ( 49)2 /7 = 343 4.07 ( este valor es la desviación Estándar) cuadrada. ( n-1) y extraer la raíz 6.

16 (27 – 25. Ese punto de referencia es la media aritmética de la distribución. 27.6 ( 8.5)=-7.20 2 2 S2= 137.4 años La varianza para datos agrupados . mayor es la varianza. Dado un conjunto de observaciones.Pasos: 1. se define como: el cuadrado medio de las desviaciones con respecto a su media aritmética" Matemáticamente.Elevar al cuadrado la suma fi Xi obtenida en el primer paso y dividir por el número de observaciones ( 1.4) =54.050). Xn.500.4) = 5.4 años Respuesta: la varianza de las edades es de 27.850 al cuadrado sobre 50= 68.96 xxxx 137.450= 4. se obtuvo 25. 5.1 Kg LA VARIANZA (S2 ó δ2 ): La varianza es una medida de dispersión relativa a algún punto de referencia. … . la varianza es una medida de que tan cerca. Al calcular la media aritmética (promedio de las edades. Cuando más lejos están las Xi de su propia media aritmética.20/5 = 27. 25. Más específicamente. encontrar la varianza de las edades de estos estudiantes: Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera: Xi 18 23 25 27 34 Total ( Xi ( Xi 2 2 2 2 (18 – 25.68.850) 2.4 (-7. a saber: 18.050/50 = 9.Restar este ultimo valor a la suma de cuadrados.4 (-2. tales como X1.4 (-0.Obtener los valores fi X2i multiplicando las cifras de las columnas 3 y 4 y sumar dichos valores ( =72. X2. o sea ( 72.4 años. y 34.76 (25 – 25.450) 4. cuando más cerca estén las Xi a su media menos es la varianza.5)=-2. se expresa como: Ejemplo: Se tienen las edades de cinco estudiantes universitarios de Ier año.64) = 2.Dividir el resultado de esta resta entre ( n-1) y extrae la raíz cuadrada 4.16 (34 – 25.76 (23 – 25.500) 3.5)= 8.Obtener los valores fi Xi multiplicando las cifras de la columna 2 por la columna 3 y sumar estos valores (=1.23.5)= 1.4) = 0.5)=-0.6) =73. la varianza denotada usualmente por la letra minúscula griega δ (sigma) elevada al cuadrado (δ2)y en otros casos S2 según otros analistas. o que tan lejos están los diferentes valores de su propia media aritmética.6 ( 1.

fn. . las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. que puede ser igual o distinta de 0. … . la dispersión. Será 0 solamente cuando Xi La varianza es la medida de dispersión cuadrática optima por ser la menor de todas.Si en una tabla de distribución de frecuencias. la varianza se calcula así: Σ(Xi. la variabilidad de los valores de la distribución respecto al valor central. Los puntos medios de las clases son X 1. de ahí que en ocasiones se recurra a medidas de dispersión relativas. Las medidas de dispersión cuantifican la separación.[(ΣXifi)2/N] δ2 = ---------------------------N donde N=Σfi Ejemplo: Se tienen los datos de una muestra de 30 cuentas por cobrar de la tienda Cabrera’s y Asociados dispuestos en una tabla de distribución de frecuencias. Comparar muestras de variables que entre sí no tienen cantidades en las mismas unidades. a partir de los cuales se deberá calcular la varianza. sobre todo cuando se trabaja con números decimales o cuando la media aritmética es un número entero. Xn.645 Propiedades de la varianza :    s siempre un valor no negativo. La tarea de computar la varianza se simplifica utilizando la formula de computación que se da a continuación: 2 ΣXi2fi . Asimismo cuando se trabaja con máquinas calculadoras. X2.) Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo.344 / 30 = 721. … . que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras. El Coeficiente de Variación de Pearson (C.645 Respuesta: la varianza de las cuentas por cobrar es igual B/. si se calculó anteriormente la media aritmética y se fijó en 43.649.2f1 δ = ---------------Σfi Sin embargo la formula anterior tiene algún inconveniente para su uso en la practica.721.V. f2. Si a todos los valores de la variable se le suma una constante la varianza no se modifica.458 (ver ejemplo del calculo en "media aritmética para datos agrupados) de la siguiente manera = 21. para lo cual se construye la siguiente tabla estadística de trabajo. El problema de las medidas de dispersión absolutas es que normalmente son un indicador que nos da problemas a la hora de comparar. y las frecuencias de las clases f1. Distinguimos entre medidas de dispersión absolutas.

especialmente a efectos de comparaciones entre distribuciones. Explique. Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el llamado "Coeficiente de Variación de Pearson". y que se define como la relación por cociente entre la desviación estándar y la media aritmética. tanto la varianza como la desviación estándar.Si a todos los valores de la variable se le suma una misma constante el coeficiente de variación queda alterado .).Un problema que se plantea.. Sólo le puede dar el premio de incentivo a uno de ellos. expresados en porcentajes de cumplimiento de las metas fijadas mensualmente: Vendedor A 95 105 100 Vendedor B 100 90 110 El promedio trimestral de cumplimiento de las metas de ventas de ambos vendedores es igual y equivale al 100%. por lo que entre dos distribuciones dadas diremos que posee menor dispersión aquella cuyo coeficiente de variación sea menor. Este problema se resuelve utilizando el coeficiente de variación.A.U. del que se demuestra que nos da un número independiente de las unidades de medidas empleadas. ¿Cuál usted escogería?. Ejemplo: Suponga que Usted trabaja en una compañía de ventas. ¿En base a que criterio’. representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media. o en otras palabras es la desviación estándar expresada como porcentaje de la media aritmética.V. que ofrece como premio de incentivo al mejor vendedor del trimestre anterior las entradas al palco empresarial en la serie final de béisbol de las grandes ligas en los Estados Unidos (E. para estos efectos es necesario encontrar la desviación estándar trimestral de las ventas de cada uno de la siguiente manera: Vendedor A Xi 95 105 ( Xi ( Xi 2 95 – 100 = -5 (-5)2 = 25 105 – 100 = 5 ( 5)2 = 25 . De los registros de ventas se tienen los siguientes datos de ventas.  Propiedades del Coeficiente de Variación : . Definición del Coeficiente de Variación CV= s/x2 Donde: C.E. es el de la dependencia respecto a las unidades de medida de la variable. pero Ud.

= 0.0816 Respuesta: Dado que el vendedor A tiene menor coeficiente de variación.= ----------.16.16 C.100 100 – 100 = 0 ( 0)2 = 0 50 Total XXX La desviación estándar es δ=√(50/3) = √16.667 = 8. luego entonces el coeficiente de variación es igual a: δ 8. .= ----------.VA= --------. luego entonces el coeficiente de variación es igual a: δ 4.667 = 4. A él le corresponde recibir el premio de incentivo.= 0.08.0408 Vendedor B Xi 100 90 110 ( Xi 100 – 100 = 0 ( Xi ( 0 )2 = 0 2 90 – 100 = -10 (-10)2 = 100 110 – 100 = 10 ( 10)2 = 100 200 Total XXX La desviación estándar es δ=√(200/3) = √66.08 C.VB= --------.

Sign up to vote on this title
UsefulNot useful