P. 1
Medidas de Dispersión

Medidas de Dispersión

|Views: 44|Likes:

More info:

Published by: Ivan HalluciNationcore on Mar 27, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

11/13/2012

pdf

text

original

Medidas de Dispersión

MEDIDAS DE DISPERSIÓN INTRODUCCION: El conocimiento de la forma de la distribución y del respectivo promedio de una colección de valores de una variable, puede servir para tener una idea bastante clara de la conformación, pero no de de la homogeneidad de cada una de los valores con respecto a la medida de tendencia central aplicada. En el caso de las variables con valores que pueden definirse en términos de alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersión o variabilidad existente en el grupo de variantes en estudio. A estos indicadores les llamamos medidas de dispersión, por cuanto que están referidos a la variabilidad que exhiben los valores de las observaciones, ya que si no hubiere variabilidad o dispersión en los datos interés, entonces no habría necesidad de la gran mayoría de las medidas de la estadística descriptiva. Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras. LA DISPERSIÓN Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad. La dispersión es importante porque: Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.   Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas. Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.

el rango se define como la diferencia entre el valor más alto (Xn ó Xmax. R = Xmáx. a saber: 18.. Rango para datos no agrupados. se eleva cada desviación al cuadrado para hacer desaparecer el signo. ¿cómo medimos la variabilidad de una distribución empírica?. DESVIACIÓN ESTÁNDAR: ( DE. Como esta suma siempre es 0 ( cero). la suma de estos cuadrados se divide entre el numero de observaciones menos uno ( n-1). S) en series no agrupadas: La desviación Estándar consiste en averiguar en cuanto difiere cada observación ( xi) del promedio general del grupo. Se aproxima el rango tomando el limite superior de la última clase menos el limite inferior de la primera clase. para calcular la media aritmética (promedio de las edades.-Xmín = Xn-X1 Ejemplo: Se tienen las edades de cinco estudiantes universitarios de Ier año. la desviación estándar y el coeficiente de variación. y debemos estar en capacidad de describirla. Ya que la dispersión ocurre frecuentemente y su grado de variabilidad es importante. Vamos a considerar sólo algunas medidas de dispersión absolutas: el rango. se tiene que: R = (Xn-X1) = 34-18 = 16 años Con datos agrupados no se saben los valores máximos y mínimos.34 y 25. MEDIDAS DE VARIABILIDAD MÁS USADAS        RANGO DESVIACION ESTANDAR VARIANZA COEFICIENTE DE VARIACION DECILES CUARTILES PERCENTILES. 27.23. Para datos finitos o sin agrupar. por ultimo se extrae la raíz cuadrada para volver a la unidad de origen. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de los límites de clases.) y el mas bajo (X1 ó Xmin) en un conjunto de datos. Ejemplo: Días de hospitalizacion en 7 pacientes con bronquitis ( calculo de la desviación estándar) Número del Días de Valores xi . la varianza. EL RANGO O AMPLITUD (R): Es la medida de variabilidad más fácil de calcular.Pero si hay dispersión en la mayoría de los datos.

Elevar al cuadrado las suma de las observaciones obtenidas en el primer paso y dividir por el numero de observaciones= ( 49)2 /7 = 343 4. Desviación estándar en series agrupadas Los diferentes pasos que deben seguirse para el calculo de la Desviación Estándar aparecen resumidos en el siguiente cuadro. cuyas primeras cuatro columnas se utilizan para calcular el promedio conforme ya se estudio previamente. Elevar al cuadrado cada observación y sumar esta columna =497 3. ( n-1) y extraer la raíz 6. restar este ultimo valor a la suma de cuadrados obtenida en el paso 2 ( 497- 343) = 154 5. Dividir por el numero de observaciones menos 1.paciente Primero Segundo Tercero Cuarto Quinto Sexto Séptimo Total hospitalización al cuadrado 1 2 3 7 11 12 13 49 1 4 9 49 121 144 169 497 Los pasos a seguir son los siguientes: 1.07 ( este valor es la desviación Estándar) cuadrada. Producto de la columnas Pto. Sumar la observaciones = 49 2. S= 5. medio de la clase 2 x 3 Prs 2 x3 20-24 25-29 30-34 35-39 40-44 45-49 50-54 Total 4 8 9 10 7 6 6 22 27 32 37 42 47 52 88 216 288 370 294 282 312 484 729 1024 1369 1764 2209 2704 1936 5832 9216 13690 12348 13254 16224 Peso en kilos Nº de Personas fi x2 Producto de la columnas 3x4 50 1850 72500 .

X2.450= 4.5)=-2.64) = 2.96 xxxx 137.Obtener los valores fi Xi multiplicando las cifras de la columna 2 por la columna 3 y sumar estos valores (=1.76 (25 – 25.5)= 1.Obtener los valores fi X2i multiplicando las cifras de las columnas 3 y 4 y sumar dichos valores ( =72. Al calcular la media aritmética (promedio de las edades. se define como: el cuadrado medio de las desviaciones con respecto a su media aritmética" Matemáticamente.Restar este ultimo valor a la suma de cuadrados.6 ( 1. se expresa como: Ejemplo: Se tienen las edades de cinco estudiantes universitarios de Ier año.500) 3.4 (-2. Xn.850 al cuadrado sobre 50= 68. … .68. tales como X1.450) 4.20/5 = 27.4 años Respuesta: la varianza de las edades es de 27.4 años La varianza para datos agrupados . o que tan lejos están los diferentes valores de su propia media aritmética.76 (23 – 25.Dividir el resultado de esta resta entre ( n-1) y extrae la raíz cuadrada 4. la varianza denotada usualmente por la letra minúscula griega δ (sigma) elevada al cuadrado (δ2)y en otros casos S2 según otros analistas. y 34. 5.6) =73.20 2 2 S2= 137. a saber: 18.850) 2. Ese punto de referencia es la media aritmética de la distribución.16 (27 – 25. 25.6 ( 8. o sea ( 72.050/50 = 9. cuando más cerca estén las Xi a su media menos es la varianza. Cuando más lejos están las Xi de su propia media aritmética.Pasos: 1. Más específicamente.5)=-0.050).4 (-7.4) = 5.4) =54.16 (34 – 25.5)= 8. la varianza es una medida de que tan cerca. se obtuvo 25. encontrar la varianza de las edades de estos estudiantes: Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera: Xi 18 23 25 27 34 Total ( Xi ( Xi 2 2 2 2 (18 – 25.4 años.Elevar al cuadrado la suma fi Xi obtenida en el primer paso y dividir por el número de observaciones ( 1.500.4 (-0. Dado un conjunto de observaciones.1 Kg LA VARIANZA (S2 ó δ2 ): La varianza es una medida de dispersión relativa a algún punto de referencia. mayor es la varianza.5)=-7. 27.4) = 0.23.

… . Comparar muestras de variables que entre sí no tienen cantidades en las mismas unidades.[(ΣXifi)2/N] δ2 = ---------------------------N donde N=Σfi Ejemplo: Se tienen los datos de una muestra de 30 cuentas por cobrar de la tienda Cabrera’s y Asociados dispuestos en una tabla de distribución de frecuencias.2f1 δ = ---------------Σfi Sin embargo la formula anterior tiene algún inconveniente para su uso en la practica. para lo cual se construye la siguiente tabla estadística de trabajo. La tarea de computar la varianza se simplifica utilizando la formula de computación que se da a continuación: 2 ΣXi2fi . fn. a partir de los cuales se deberá calcular la varianza.Si en una tabla de distribución de frecuencias. de ahí que en ocasiones se recurra a medidas de dispersión relativas.) Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo.649. que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras. Las medidas de dispersión cuantifican la separación. Los puntos medios de las clases son X 1. X2.458 (ver ejemplo del calculo en "media aritmética para datos agrupados) de la siguiente manera = 21. si se calculó anteriormente la media aritmética y se fijó en 43. la variabilidad de los valores de la distribución respecto al valor central. Si a todos los valores de la variable se le suma una constante la varianza no se modifica. … . f2. Será 0 solamente cuando Xi La varianza es la medida de dispersión cuadrática optima por ser la menor de todas.V. las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Asimismo cuando se trabaja con máquinas calculadoras. la varianza se calcula así: Σ(Xi. . El Coeficiente de Variación de Pearson (C. y las frecuencias de las clases f1.645 Respuesta: la varianza de las cuentas por cobrar es igual B/.645 Propiedades de la varianza :    s siempre un valor no negativo. que puede ser igual o distinta de 0. la dispersión. sobre todo cuando se trabaja con números decimales o cuando la media aritmética es un número entero.344 / 30 = 721. Distinguimos entre medidas de dispersión absolutas. Xn. El problema de las medidas de dispersión absolutas es que normalmente son un indicador que nos da problemas a la hora de comparar.721.

Si a todos los valores de la variable se le suma una misma constante el coeficiente de variación queda alterado . del que se demuestra que nos da un número independiente de las unidades de medidas empleadas. Explique. para estos efectos es necesario encontrar la desviación estándar trimestral de las ventas de cada uno de la siguiente manera: Vendedor A Xi 95 105 ( Xi ( Xi 2 95 – 100 = -5 (-5)2 = 25 105 – 100 = 5 ( 5)2 = 25 . tanto la varianza como la desviación estándar. Sólo le puede dar el premio de incentivo a uno de ellos. Definición del Coeficiente de Variación CV= s/x2 Donde: C. expresados en porcentajes de cumplimiento de las metas fijadas mensualmente: Vendedor A 95 105 100 Vendedor B 100 90 110 El promedio trimestral de cumplimiento de las metas de ventas de ambos vendedores es igual y equivale al 100%.  Propiedades del Coeficiente de Variación : . pero Ud.A. representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.. Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el llamado "Coeficiente de Variación de Pearson". ¿En base a que criterio’. ¿Cuál usted escogería?. que ofrece como premio de incentivo al mejor vendedor del trimestre anterior las entradas al palco empresarial en la serie final de béisbol de las grandes ligas en los Estados Unidos (E. es el de la dependencia respecto a las unidades de medida de la variable. Este problema se resuelve utilizando el coeficiente de variación. especialmente a efectos de comparaciones entre distribuciones.U.V. Ejemplo: Suponga que Usted trabaja en una compañía de ventas. o en otras palabras es la desviación estándar expresada como porcentaje de la media aritmética.).E. De los registros de ventas se tienen los siguientes datos de ventas.Un problema que se plantea. y que se define como la relación por cociente entre la desviación estándar y la media aritmética. por lo que entre dos distribuciones dadas diremos que posee menor dispersión aquella cuyo coeficiente de variación sea menor.

100 100 – 100 = 0 ( 0)2 = 0 50 Total XXX La desviación estándar es δ=√(50/3) = √16.= 0.16 C.667 = 4.16. A él le corresponde recibir el premio de incentivo.08 C.VA= --------.667 = 8.08. luego entonces el coeficiente de variación es igual a: δ 8.0816 Respuesta: Dado que el vendedor A tiene menor coeficiente de variación.= ----------.0408 Vendedor B Xi 100 90 110 ( Xi 100 – 100 = 0 ( Xi ( 0 )2 = 0 2 90 – 100 = -10 (-10)2 = 100 110 – 100 = 10 ( 10)2 = 100 200 Total XXX La desviación estándar es δ=√(200/3) = √66. .= 0.= ----------. luego entonces el coeficiente de variación es igual a: δ 4.VB= --------.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->