Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCION
Antes de estudiar las medidas de dispersion, recordemos cuales son los diferentes tipos de
medida o parámetros que existen en estadística.
Las medidas que existen en estadística las podemos resumir en el siguiente mapa
conceptual
MEDIDAS ESTADISTICAS
SE CLASIFICAN
EN
Supongamos que dos alumnos han realizado cinco exámenes cada uno. Para evaluarlos
elegimos hacer la media o promedio de las cinco notas que han obtenido.
Si vemos los dos tendrían la misma nota, lo que nos haría pensar que el rendimiento de los dos
alumnos son similares, pero si observamos sus notas hay una gran diferencia entre ambos.
El alumno A tiene unas notas muy homogéneas, muy próximas a la media mientras que el
alumno B tiene unos resultados muy dispares."
Para poder analizar bien sus resultados necesitaríamos otro parámetro que nos mida esa
variabilidad. Estamos hablando de las medidas de dispersión.
Como ya sabemos, las medidas de dispersion son parámetros que proporciona información
sobre la variabilidad de un conjunto de datos; es decir, si la distribución de los datos es más o
menos homogénea.
Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser
capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.
Para comparar dos o más conjuntos referentes a un mismo fenómeno. Si por ejemplo,
tanto el ingreso promedio mensual de un barrio A como el de un barrio B de una cierta
ciudad es $370.000, pero se sabe además que existe más variabilidad de los ingresos en el
barrio A que en el barrio B, entonces podemos afirmar que el promedio de los ingresos en
el barrio A es menos representativo que en el barrio B, es decir que existe peor distribución
del ingreso en el barrio A que en el B.
Del mapa conceptual sabemos que las medidas de dispersion son: Rango, Desviación Media,
Varianza, Desviación Estándar, Coeficiente de Variación
RANGO O RECORRIDO ( R )
Si los datos están agrupados en una tabla de frecuencias, el rango es la diferencia entre el límite
real superior del último intervalo y el límite real inferior del primer intervalo.
R = Lmax – Lmin
A pesar de que el rango o recorrido es fácil de calcular, puede ser una deficiente estimación de
la dispersión, puesto que sólo tiene en cuenta para su cálculo el mayor y el menor valor del
conjunto, haciendo caso omiso del comportamiento de valores intermedios.
OBSERVACIONES:
Se puede decir que el rango mide la dispersion total del conjunto de datos
Cuanto menor es el rango mayor es el grado de representatividad de los valores
centrales.
Cuanto mayor es, la distribución está menos concentrada o más dispersa.
Tiene gran aplicación en procesos de control de calidad,
Tiene el inconveniente de que sólo depende de los valores extremos. De esta forma basta
que uno de ellos se separe mucho para que el recorrido se vea sensiblemente afectado
Ejemplo1:
Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus valores se
encuentran en un rango de:
R=9–4=5
Ejemplo 2:
Si el rango del peso de un conjunto de 50 estudiantes de una universidad es 3 kilos, se sabe que
3 kilos es una diferencia muy pequeña tratándose del peso de estudiantes de una universidad; lo
cual quiere decir que los pesos de los estudiantes son muy uniformes y así el rango nos da una
buena nos da una buena idea de la dispersión de los datos.
Acabamos de ver que el rango o recorrido solo tienen en cuenta para su cálculo dos valores del
conjunto. La desviación media (Dm) suple la deficiencia de la medida anterior, pues su cálculo
tiene en cuenta todos los valores del conjunto.
Como su nombre lo indica, la desviación respecto a la media da información de lo alejado o
cerca que está un dato de los demás datos del conjunto. Intuitivamente, ya se ve que se puede
calcular como la diferencia entre un dato y la media de los datos.
La desviación media se define como el cociente de la sumatoria del valor absoluto de las
distancias existentes entre cada dato y su media aritmética y el número total de datos.
Si los datos vienen agrupados en una tabla de frecuencias, la fórmula de la desviación media es:
OBSERVACIONES:
Calcular la desviación media de la siguiente distribución, la cual muestra los resultados sobre el
número de preguntas buenas en un examen de estadística de veinte preguntas.
9, 3, 8, 8, 9, 8, 9, 18
Ejemplo 2:
PESO (gr) xi fi x i • fi ̅|
|x - 𝒙 ̅| • fi
|x -𝒙
LA VARIANZA ( 𝑺𝟐 )
Ya sabemos que el problema de los signos en la desviación media, es eludido tomando los
valores absolutos de las diferencias de los datos con respecto a la media aritmética. Ahora bien,
la varianza obvia los signos elevando las diferencias al cuadrado, lo cual resulta ser más
conveniente, aparte de que es supremamente útil en el ajuste de modelos estadísticos que
generalmente conllevan formas cuadráticas.
Ejemplo 1:
Calcular la varianza de la siguiente distribución, la cual muestra los resultados sobre el número
de preguntas buenas en un examen de estadística de veinte preguntas.
9, 3, 8, 8, 9, 8, 9, 18
Ejemplo 2:
Propiedades de la varianza
1) La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean
iguales.
2) La varianza de una constante es igual a cero (ejemplo: si todos los estudiantes de este curso
obtienen la misma nota).
3) Si a todos los valores de la variable se les suma (o resta) un número la varianza no varía.
4) Si todos los valores de la variable se multiplican por un número la varianza queda
multiplicada por el cuadrado de dicho número.
Ejemplo: De un grupo de contribuyentes se determinó que el promedio de impuestos es de
$42.200, con una varianza de $8.600.
SOLUCION
2
a) 𝑠𝑥 = 8600 • (1,02) = 8947, La nueva varianza es $8947 → Propiedad 4
2
Según la fórmula de la desviación media, las desviaciones de los valores del conjunto respecto
a la media aritmética, se tomaron en su valor absoluto con el fin de evitar las compensaciones
entre desviaciones positivas y negativas, que nos llevaría a formarnos una falsa idea de la
variabilidad de los datos.
Si observamos la fórmula para la varianza, con el fin de evitar las referidas compensaciones, se
elevaron al cuadrado dichas desviaciones volviéndolas positivas.
Tomar los cuadrados de las desviaciones para el cálculo de la varianza, puede carecer de
sentido y además las diferencias entre los valores reales y la media se vuelven muy grandes.
Este hecho, condujo a que se le hiciera una modificación a la fórmula de la varianza, sacándole
la raíz cuadrada a la misma y obteniendo así la fórmula para la desviación típica o estándar.
Esta medida nos permite determinar el promedio aritmético de variación de los datos respecto a
su punto central o media. La desviación estándar nos da como resultado un valor numérico que
representa el promedio de diferencia que hay entre los datos y la media.
Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo
tanto sus fórmulas son:
Ejemplo1:
Para el conjunto de datos: 25, 12, 23, 28, 17, 15 donde se obtuvo que su varianza era
𝒔𝟐 = 39,2; tendremos entonces que su desviación estándar es S = √39,2 = 6,26 (unidades)
Ejemplo 2:
Para el ejemplo de los datos tabulados sobre las edades de 26 personas se obtuvo como
varianza 𝒔𝟐 = 51,618; luego su desviación estándar será S = √51,618 = 6,18 (años)
OBSERVACIONES:
La desviación estándar, al igual que la media y la varianza, es un índice muy sensible a las
puntuaciones extremas.
En los casos que no se pueda hallar la media tampoco será posible hallar la desviación estándar.
Cuanta más pequeña sea la desviación estándar mayor será la concentración de datos alrededor
de la media.
Por ejemplo, la distribución azul en la parte de abajo tiene una desviación estándar mayor que
la distribución verde de arriba:
1) La desviación típica será siempre un valor positivo o cero, en el caso de que las
puntuaciones sean iguales.
2) Si a todos los valores de la variable se les suma un número la desviación típica no varía.
3) Si todos los valores de la variable se multiplican por un número la desviación típica queda
multiplicada por dicho número.
Criterio de Homogeneidad
COEFICIENTE DE VARIACION ( 𝑪𝒗 )
Las medidas de dispersión que hemos visto hasta ahora, son “absolutas” y son útiles para
describir la dispersión de un solo conjunto de datos. Si dos conjuntos van a ser comparados, los
valores absolutos son convenientes para éste fin, únicamente si los promedios de dichos
conjuntos son más o menos iguales y si por otra parte se refieren a un mismo fenómeno. Por
ejemplo, no tiene sentido comparar cual entre dos compañías A y B presenta mayor dispersión
en los salarios, si la primera paga en dólares y la segunda paga en pesos colombianos. Tampoco
tiene sentido comparar por ejemplo, cual de dos productos de la competencia presenta mayor
dispersión en su contenido, si uno de ellos tiene una presentación en onzas, mientras que el otro
tiene una presentación en gramos.
Es necesario por lo tanto, disponer de una medida que nos permita comparar qué tan pequeña o
qué tan grande es una medida de dispersión absoluta como la desviación estándar. El
coeficiente de variación (también llamado coeficiente de variación de Pearson), que
simbolizamos por 𝑪𝒗 , es una medida de dispersión relativa que resulta de comparar la S con la
̅ del conjunto, así:
𝒙 𝒔
𝑪𝒗 = • 100
̅
𝒙
Su fórmula expresa la Desviación Estándar como porcentaje de la Media, mostrando una mejor
interpretación porcentual del grado de variabilidad de la desviación estándar.
A mayor valor del 𝑪𝒗 mayor heterogeneidad del conjunto de datos y a menor 𝑪𝒗 , mayor
homogeneidad en el conjunto de datos.
Ejemplo 1:
12 12
𝑪𝒗𝑨 = • 100 = 16,67% 𝑪𝒗𝑩 = • 100 = 19,67%
72 61
Ejemplo 2.
Solución.
Debido a que tenemos estadísticos muestrales, los dos coeficientes de variación se obtienen de
la siguiente manera:
3.02 pul 26.33libras
Estatura CV (100%) 4.42% Pesos CV (100%) 15.26%
68.34 pul 172.55libras
Por ejemplo, es muy raro encontrar un adulto que mida el doble que otro, pero es mucho más
común ver a uno que pese el doble que otro.
OBSERVACIONES:
Puesto que tanto la desviación estándar como la media se miden en las unidades
originales, el 𝑪𝒗 es una medida independiente de las unidades de medición.
Debido a la propiedad anterior el 𝑪𝒗 es la cantidad más adecuada para comparar la
variabilidad de dos conjuntos de datos.
En áreas de investigación donde se tienen datos de experimentos previos, el 𝑪𝒗 es muy
usado para evaluar la precisión de un experimento, comparando en 𝑪𝒗 del experimento
en cuestión con los valores del mismo en experiencias anteriores.
El 𝑪𝒗 no se altera cuando los datos son multiplicados por una constante, pues en virtud
de las propiedades de 𝒙̅ y S ambos quedan multiplicados por esa constante, sin alterar el
cociente.
INSTITUCIÓN EDUCATIVA LICEO PANAMERICANO CAMPESTRE
SINCELEJO − SUCRE – 2019
ACTIVIDAD EVALUATIVA Y DE AFIANZAMIENTO DEL PRIMER PERIODO
ASIGNATURA: ESTADÍSTICA DOCENTE: ARTURO RAFAEL RICARDO ORTEGA
GRADO: ONCE GRUPOS: 1, 2, 3 Y 4
1) Para cada uno de los siguientes conjuntos de datos; calcula: el Rango, la Desviación Media,
La Varianza, la Desviación estándar y el Coeficiente de Variación
a)
b)
Peso Numero de recién
b) ( Kg ) nacidos (fi)
b)
2,0 – 2,5 15
2,5 – 3,0 22
3,0 – 3,5 30
3,5 – 4,0 15
4,0 – 4,5 10
2) Tenemos una variable x de la que sabemos que: 𝑪𝒗 = 0,5% y que Sx = 3. ¿Cuál es el valor
de la media de x ?
4) La distribución de edades del Censo Electoral de Residentes a 1 de enero de 1.999 para las
comunidades autónomas de Aragón y Canarias, en tantos por ciento es la siguiente:
autónomas de Aragón y Canarias, en tantos por ciento es la siguiente:
Edades Aragón Canarias
16 – 20 3.54 4.35
20 – 24 21.56 29.99
24 – 28 31.63 35.21
38 – 48 28.14 21.97
48 – 58 15.12 8.48
7) Se toman las medidas de 80 personas las que tienen estatura media de 1.70 m y desviación
estándar de 3.4 cm. Posteriormente se verificó que la media usada tenía 4 cm de menos.
Rectifique los estadígrafos mencionados.
8) El salario promedio en una ciudad es de 11000€ con una variancia de 2000€ ¿Cuáles serán
la nueva media y la nueva variancia si se efectúan los siguientes cambios:
a) Se aumenta 810€ a todos
b) Se aumenta el 15 % de su salario a cada trabajador
c) Si se duplican los sueldos
Si ya sabes lo que tienes que hacer y no lo haces, estas peor que antes