Está en la página 1de 29

Unidad III: Medidas de Variabilidad

¿Que son las medidas de dispersión o variabilidad?


Son intervalos que indican la dispersión de los datos en la escala de medición. Una
medida de dispersión o variabilidad nos determina el grado de acercamiento o
distanciamiento de los valores de una distribución frente a su promedio de
localización, indicando por medio de un número si las diferentes puntuaciones de
una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor
será la variabilidad, y cuanto menor sea, más homogénea será a la media. Cuando
es cero quiere decir que todos los datos son iguales.

Medidas absolutas: se caracterizan por ser números concretos, es decir, valores


expresados en las mismas unidades de la variable en estudio y que por lo tanto no
permiten comparaciones o análisis respecto a la mayor o menor dispersión de
series expresadas en diferentes unidades. Estas medidas son: la varianza, la
desviación estándar y el rango intercuartílico.
Medidas de variabilidad absolutas:
 Rango intercuartílico. ver mas
 Desviación estándar.
 varianza.
Medidas relativas: son valores abstractos y por lo tanto no expresadas en ninguna unidad esp
inconveniente señalado para las medidas absolutas. La principal medida es el coeficiente de v

Medidas de variabilidad absolutas

Rango intercualitíco:
El rango intercuartílico IQR (o rango intercuartil) es una estimación estadística de
la dispersión de una distribución de datos. Consiste en la diferencia entre el tercer
y el primer cuartil. Mediante esta medida se eliminan los valores
extremadamente alejados. El rango intercuartílico es altamente recomendable
cuando la medida de tendencia central utilizada es la mediana (ya que este
estadístico es insensible a posibles irregularidades en los extremos).
Desviación estándar:
 Es el promedio de desviación de las puntuaciones con respecto a la media.
 Esta medida se expresa en las unidades originales de medición de la
distribución.
 Cuanto mayor sea la dispersión de los datos alrededor de la media, mayor
será la desviación estándar.
 Se simboliza con s o mediante la abreviatura DE.
Varianza:
 Está relacionada con el tamaño de la diferencia entre cada puntuación y la
media aritmética de la distribución a que pertenece.
 Es la desviación estándar elevada al cuadrado y se simboliza s y un 2 como
potencia.
 Es un concepto estadístico muy importante, ya que muchas de las pruebas
cuantitativas se fundamentan en él.

Medidas de variabilidad relativas

Coeficiente de variación:
El coeficiente de variación se suele utilizar con variables que toman valores
positivos y cuya media no está próxima al 0, ya que en caso contrario al dividir por
un valor muy cercano a 0, el resultado puede desvirtuarse. Se calcula para cada
una de las distribuciones y los valores que se obtienen se comparan entre sí.

La mayor dispersión corresponderá al valor del coeficiente de variación mayo

3.1. Medidas de variabilidad

 Técnicas y Procesos

La variabilidad o dispersión hace referencia al grado de variación que hay en un


conjunto de puntuaciones. Por ejemplo: “entre dos distribuciones que presentan
la misma media aritmética, difieren en la variabilidad de sus puntuaciones”. Así,
cuanto menor es la variabilidad, más homogénea es la muestra de sujetos en la
variable. En el caso de máxima homogeneidad, todos los valores de la variable
serán iguales. De otro modo, cuanto más o menos dispersión en los datos, la
muestra es más o menos heterogénea y las puntuaciones difieren entre sí.

Para cuantificar la dispersión de los datos, se pueden distinguir dos tipos de


índices: los que miden el grado de semejanza y diferencia de las puntuaciones
entre sí (amplitud total o rango y la amplitud semi-intercuartil), y los que la
dispersión se mide a alguna medida de tendencia central como la media
aritmética (varianza y la desviación típica).

Amplitud total o rango


La amplitud total o rango (AT), de un conjunto de puntuaciones es la distancia que
hay en la escala numérica entre los valores que representan la puntuación
máxima y la puntuación mínima.

AT = Xmáx - Xmín

Uno de los inconvenientes de la amplitud total es su limitación al utilizar


únicamente los valores extremos de la distribución; de esta forma, no recoge la
poca o mucha dispersión que pueda existir entre los restantes valores, que son la
mayoría de las puntuaciones. Aún así se recomienda incluir éste valor como
complementario de otras medidas de dispersión.

Varianza y desviación típica


La variabilidad se puede basar en la distancia observada entre las puntuaciones y
un valor central de la distribución como la media aritmética. De modo que, una
distribución con poca variabilidad es en la que la mayoría de las puntuaciones
están próximas a la media, mientras que con mucha variabilidad, las puntuaciones
se alejan del valor medio de la variable.

Un primer índice podría ser el promedio de las desviaciones o diferencias de cada


puntuación con su media.

X¯d = ∑(Xi - X¯) / n

El problema de este índice es que el sumatorio del numerador ∑(X i - X¯), siempre
es igual a cero; para ello se han propuesto dos soluciones. La primera consiste en
calcular el valor absoluto de cada desviación antes de realizar la suma “desviación
suma”:
DM = ∑|Xi - X¯| / n

Una segunda alternativa consiste en basarnos en el cuadrado de las diferencias y


así obtenemos la varianza que se define de la siguiente manera:

La varianza de un conjunto de n puntuaciones en una variable X, denotada


por Sx2 se define como el promedio de los cuadrados de las desviaciones de las
puntuaciones con respecto a la media:

Sx2 = ∑(Xi - X¯)2 / n

Varianza a partir de una distribución de frecuencias absolutas:

Sx2 = ∑ni(Xi - X¯)2 / n

Varianza a partir de una distribución de frecuencias relativas:

Sx2 = ∑pi Xi2 - X¯2 / n

La desviación típica de un conjunto de n puntuaciones, que se representa por S x es


la raíz cuadrada de la varianza.

Tanto la varianza como la desviación típica son índices de dispersión muy útiles en
el desarrollo posterior de la estadística inferencial estando en la base de
numerosas técnicas estadísticas. Ambos índices presentan las siguientes
propiedades:

1. El cálculo de la varianza y la desviación típica, a diferencia de otros


índices de dispersión, requieren el uso de todas las puntuaciones
observadas en la distribución.

2. La varianza y la desviación típica miden la variabilidad de los datos con


respecto a la media aritmética, por lo que únicamente deben aplicarse si
estamos utilizando la media como medida de tendencia central.

3. La varianza y la desviación típica siempre son no negativas, es decir,


pueden ser iguales o mayores que cero. Son iguales a cero únicamente si
todas las puntuaciones son iguales entre sí. En este caso, no habría
variabilidad o dispersión en los datos. En el resto de los casos la varianza
y la desviación típica son positivas, siendo sus valores mayores a medida
que aumenta la variabilidad de las puntuaciones.

Otro índice de variabilidad relacionado con la varianza es la cuasi varianza:

Sn-12 = ∑(Xi - X¯)2 / n-1

Coeficiente de variación
Es frecuente que uno de los objetivos del análisis descriptivo de los datos sea la
comparación del grado de variabilidad o dispersión entre dos conjuntos de
puntuaciones en una misma o distintas variables. Debido a que, por lo general, las
variables objeto de estudio se miden en unidades distintas no tiene sentido
compararlas en base a los valores de sus varianzas o desviaciones típicas. Para
paliar este inconveniente es necesario definir un índice de variabilidad relativa
que no dependa de las unidades de medida. Un coeficiente que cumple con estos
requisitos es el coeficiente de variación, que se expresa en porcentajes:

CV = (Sx / X) × 100

El coeficiente de variación está definido para variables con X > 0 y es


recomendable que su resultado se acompañe de la media y desviación típica de la
distribución a partir de las cuales ha sido calculado.

Cuando comparamos dos conjuntos de puntuaciones obtenidas de la misma


variable, también es necesario el coeficiente de variación para comparar la
dispersión de ambas distribuciones. Únicamente es posible utilizar la desviación
típica cuando la media de ambos grupos es la misma, y entonces, llegaríamos a las
mismas conclusiones con ambos índices.

Amplitud semi-intercuartil
La varianza y la desviación típica, junto con la media aritmética, son los
estadísticos recomendados para estudiar la variabilidad y la tendencia central de
una distribución de frecuencias.

Sin embargo, en ocasiones, y debido a la asimetría de la distribución, no es


aconsejable el uso de estos índices y debemos buscar una alternativa. En estos
casos, un índice resistente de dispersión adecuado, que se utilizaría junto con la
mediana como medida de tendencia central, sería la amplitud semi-intercuartil
que es la distancia media entre el tercer y el primer cuartil:

Q = (P75 - P25) / 2

Este índice informa del 50% de las puntuaciones comprendidas entre el percentil
25 y el 75 de la distribución.

Coeficiente de asimetría
b) Asimetría

Hemos comentado que el concepto de asimetría se refiere a si la curva que


forman los valores de la serie presenta la misma forma a izquierda y derecha de
un valor central (media aritemética)

Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de


Fisher, que viene definido:
Los resultados pueden ser los siguientes:

g1 = 0 (distribución simétrica; existe la misma concentración de valores a la


derecha y a la izquierda de la media)

g1 > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la


derecha de la media que a su izquierda)

g1 < 0 (distribución asimétrica negativa; existe mayor concentración de valores a


la izquierda de la media que a su derecha)

Ejemplo: Vamos a calcular el Coeficiente de Asimetría de Fisher de la serie de


datos referidos a la estatura de un grupo de alumnos (lección 2ª):

Variable Frecuencias absolutas Frecuencias relativas


(Valor) Simple Acumulada Simple Acumulada
x x x x x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

Recordemos que la media de esta muestra es 1,253

S((xi - x)^3)*ni S((xi - x)^2)*ni


x x
0,000110 0,030467
Luego:

(1/30) * 0,000110
g1 = ------------------------------------------------- = -0,1586
(1/30) * (0,030467)^(3/2)

Por lo tanto el Coeficiente de Fisher de Simetría de esta muestra es -0,1586, lo


que quiere decir que presenta una distribución asimétrica negativa (se
concentran más valores a la izquierda de la media que a su derecha).
Coeficiente de curtosis
c) Curtosis

El Coeficiente de Curtosis analiza el grado de concentración que presentan los


valores alrededor de la zona central de la distribución.

Se definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración medio alrededor


de los valores centrales de la variable (el mismo que presenta una distribución
normal).

Distribución leptocúrtica: presenta un elevado grado de concentración alrededor


de los valores centrales de la variable.

Distribución platicúrtica: presenta un reducido grado de concentración alrededor


de los valores centrales de la variable.

El Coeficiente de Curtosis viene definido por la siguiente fórmula:


Los resultados pueden ser los siguientes:

g2 = 0 (distribución mesocúrtica).
g2 > 0 (distribución leptocúrtica).

g2 < 0 (distribución platicúrtica).

Ejemplo: Vamos a calcular el Coeficiente de Curtosis de la serie de datos referidos


a la estatura de un grupo de alumnos (lección 2ª):

Variable Frecuencias absolutas Frecuencias relativas


(Valor) Simple Acumulada Simple Acumulada
x x x x x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
Recordemos que la media de esta muestra es 1,253

S((xi - xm)^4)*ni S((xi - xm)^2)*ni


x x
0,00004967 0,03046667

Luego:

(1/30) * 0,00004967
g2 = ------------------------------------------------- - 3 = -1,39
((1/30) * (0,03046667))^2

Por lo tanto, el Coeficiente de Curtosis de esta muestra es -1,39, lo que quiere


decir que se trata de una distribución platicúrtica, es decir, con una reducida
concentración alrededor de los valores centrales de la distribución.-
La asimetría y curtosis informan sobre la forma de la distribución de
una variable. Estas medidas permiten saber las características de su asimetría y
homgeneidad sin necesidad de representarlos gráficamente.

Asimetría

La asimetría es la medida que indica la simetría de la distribución de


una variable respecto a la media aritmética, sin necesidad de hacer la
representación gráfica. Los coeficientes de asimetría indican si hay el mismo
número de elementos a izquierda y derecha de la media.

Existen tres tipos de curva de distribución según su asimetría:

 Asimetría negativa: la cola de la distribución se alarga para valores


inferiores a la media.
 Simétrica: hay el mismo número de elementos a izquierda y derecha de
la media. En este caso, coinciden la media, la mediana y la moda. La
distribución se adapta a la forma de la campana de Gauss, o distribución
normal.
 Asimetría positiva: la cola de la distribución se alarga (a la derecha) para
valores superiores a la media.

Existen tres coeficientes de asimetría:

Coeficiente de asimetría de Fisher

El coeficiente de asimetría de Fisher CAF evalúa la proximidad de los datos a


su media x. Cuanto mayor sea la suma ∑(xi–x)3, mayor será la asimetría. Sea el
conjunto X=(x1, x2,…, xN), entonces la fórmula de la asimetría de Fisher es:
Cuando los datos están agrupados o agrupados en intervalos, la fórmula
del coeficiente de asimetría de Fisher se convierte en:

 Si CAF<0: la distribución tiene una asimetría negativa y se alarga a valores


menores que la media.
 Si CAF=0: la distribución es simétrica.
 Si CAF>0: la distribución tiene una asimetría positiva y se alarga a valores
mayores que la media.
Coeficiente de asimetría de Pearson

El coeficiente de asimetría de Pearson CAP mide la diferencia entre la media y


la moda respecto a la dispersión del conjunto X=(x1, x2,…, xN).

Este procedimiento, menos usado, lo emplearemos solamente en


distribuciones unimodales y poco asimétricas.

 Si CAP<0: la distribución tiene una asimetría negativa, puesto que


la media es menor que la moda.
 Si CAP=0: la distribución es simétrica.
 Si CAP>0: la distribución tiene una asimetría positiva, ya que la media es
mayor que la moda.

Coeficiente de asimetría de Bowley

El coeficiente de asimetría de Bowley CAB toma como referencia


los cuartiles para determinar si la distribución es simétrica o no. Para aplicar este
coeficiente, se supone que el comportamiento de la distribución en los extremos
es similar. Sea el conjunto X=(x1, x2,…, xN), la asimetría de Bowley es:

Esta fórmula viene de:

Recordemos que la mediana (Me) es lo mismo que el segundo cuartil (Q2).

Por lo que la fórmula del coeficiente de asimetría de Bowley también se


puede escribir así:

 Si CAB<0: la distribución tiene una asimetría negativa, puesto que la


distancia de la mediana al primer cuartil es mayor que al tercero.
 Si CAB=0: la distribución es simétrica, ya que el primer y
tercer cuartil están a la misma distancia de la mediana.
 Si CAB>0: la distribución tiene una asimetría positiva, ya que la distancia
de la mediana al tercer cuartil es mayor que al primero.
Curtosis

La curtosis (o apuntamiento) es una medida de forma que mide cuán


escarpada o achatada está una curva o distribución.

Este coeficiente indica la cantidad de datos que hay cercanos a la media, de


manera que a mayor grado de curtosis, más escarpada (o apuntada) será la
forma de la curva.

La curtosis se mide promediando la cuarta potencia de la diferencia entre


cada elemento del conjunto y la media, dividido entre la desviación típica elevado
también a la cuarta potencia. Sea el conjunto X=(x1, x2,…, xN), entonces el
coeficiente de curtosis será:
En la fórmula se resta 3 porque es la curtosis de una distribución Normal.
Entonces la curtosis valdrá 0 para la Normal, tomándose a ésta como referencia.

Cuando los datos están agrupados o agrupados en intervalos, la fórmula


del coeficiente de curtosis se convierte en:

Desviación media: Qué es, fórmula y cómo calcularla

En estadística, la desviación media es una medida importante de dispersión que


nos permite entender cuánto varían los datos de un conjunto promedio.

La desviación es una herramienta fundamental para analizar y comprender


conjuntos de datos en diversas disciplinas, como la economía, la psicología, la
medicina y muchas otras.

Comprender cómo calcular y utilizarla es crucial para poder hacer afirmaciones


precisas y tomar decisiones basadas en datos. En este artículo, explicaremos qué
es, cómo se calcula y por qué es importante en el análisis de datos.

¿Qué es la desviación media?

La desviación media es una medida que se utiliza para entender qué tanto se
alejan los datos de un conjunto promedio.
Es una medida que nos ayuda a entender cuánto varían los datos de un conjunto
promedio. Si la desviación es grande, significa que los datos están muy dispersos
o variados, mientras que si es pequeña, significa que los datos están muy
cercanos entre sí.

Quizá te interese conocer qué es un análisis estadístico.

Usos de la desviación media

A continuación, te muestro algunos casos en los que esta desviación puede ser de
gran utilidad:

1. Comparación de datos: Si tienes dos conjuntos de datos con diferentes


promedios, la desviación puede ayudarte a determinar cuál de los dos
conjuntos tiene datos más dispersos o variables.
2. Evaluación de resultados: Si estás realizando un experimento o una
prueba y tienes un conjunto de resultados, la desviación puede ayudarte
a determinar la precisión de tus resultados. Una desviación alta indica
que los resultados pueden ser menos precisos.
3. Control de calidad: En el control de calidad de los productos, la
desviación media se utiliza a menudo para evaluar la variabilidad de los
productos. Una desviación alta puede indicar que hay problemas en la
producción o en la calidad del producto.
4. Análisis de riesgo: En el análisis de riesgo financiero, la desviación media
se utiliza a menudo para evaluar la volatilidad de un activo financiero.
Cuanto mayor sea la desviación, mayor será el riesgo asociado con el
activo financiero.

En general, la desviación media es una medida útil para entender la variabilidad


de los datos en un conjunto, y se puede utilizar en muchas situaciones diferentes.

Fórmula para calcular la desviación media

La fórmula sencilla para calcularla es la siguiente:

Desviación media = Σ | Xi – X | / N
Donde:

Σ = Suma de los términos

| Xi – X | = Valor absoluto de la diferencia entre cada dato y la media

X = Media del conjunto de datos

N = Número de datos en el conjunto

En palabras sencillas, para calcular la desviación, se suman las diferencias


absolutas entre cada valor del conjunto de datos y su media, y se divide el
resultado entre el número total de datos. Esta fórmula nos da una medida de
dispersión promedio de los datos del conjunto en relación a su media.

Ejemplo de desviación media

Aquí te dejo un ejemplo sencillo de cómo calcular la desviación media:

Supongamos que tenemos el siguiente conjunto de datos: 2, 4, 6, 8, 10.

Para calcularla, primero necesitamos calcular la media de los datos:

X = (2 + 4 + 6 + 8 + 10) / 5 = 6

Ahora, podemos calcular la desviación utilizando la fórmula:

Desviación media = Σ | Xi – X | / N

DM = (|2 – 6| + |4 – 6| + |6 – 6| + |8 – 6| + |10 – 6|) / 5

DM = (4 + 2 + 0 + 2 + 4) / 5

DM = 2.4
Por lo tanto, la desviación de este conjunto de datos es de 2.4. Esto significa que,
en promedio, los valores del conjunto difieren en 2.4 unidades de su media

Diferencia entre desviación media y desviación estándar

Tanto la desviación media como la desviación estándar son medidas de dispersión


que se utilizan para evaluar la variabilidad de los datos de un conjunto. Sin
embargo, existen algunas diferencias clave entre ellas:

1. Fórmula de cálculo: La media se calcula tomando la media aritmética de


las diferencias absolutas entre cada valor y la media del conjunto. Por
otro lado, la desviación estándar se calcula tomando la raíz cuadrada de
la varianza.
2. Sensibilidad a los valores extremos: La media es más sensible a los
valores extremos o atípicos en el conjunto de datos, ya que se calcula
utilizando las diferencias absolutas entre cada valor y la media. Por otro
lado, la desviación estándar es menos sensible a los valores extremos, ya
que se basa en la media de los cuadrados de las diferencias, lo que
disminuye el efecto de los valores extremos.
3. Interpretación: La media se interpreta como la medida promedio de la
distancia de los valores del conjunto de datos respecto a la media. Por
otro lado, la desviación estándar se interpreta como la medida promedio
de la distancia que los valores del conjunto de datos tienen respecto a la
media, en términos de su desviación estándar.

En resumen, ambas son medidas de dispersión que se utilizan para evaluar la


variabilidad de los datos de un conjunto. La desviación media es más sensible a
los valores extremos, mientras que la desviación estándar es menos sensible y
proporciona una interpretación más clara en términos de su desviación estándar.

Conclusión

En conclusión, la desviación media es una medida de dispersión crucial en


el análisis de datos que nos permite entender cuánto varían los datos de un
conjunto promedio.

A través de su cálculo y análisis, podemos obtener una comprensión más


profunda de los datos y tomar decisiones basadas en hechos con mayor precisión.
Con la herramienta de encuestas y análisis de datos de QuestionPro, puedes
recolectar y analizar los datos de tu investigación. Además, su amplia gama de
herramientas te permite profundizar aún más en tus datos y obtener insights
valiosos.

Medidas de dispersión.

Si C es una medida de posición central y xi un valor posible. Las cantidades:

xi – C y |xi – C|

se llaman, respectivamente, la desviación a la tendencia central y la desviación


absoluta a la tendencia central.

Según se consideren las desviaciones o las desviaciones absolutas con respecto a


la media o a la mediana y según que se considere la mediana o la media de la
serie de desviaciones, se obtendrán varios índices de dispersión:

La desviación mediana o también desviación probable es la mediana de las


desviaciones a la mediana.

Desviación absoluta media respecto a la mediana, es la media de las


desviaciones a la mediana. Es, según se puede demostrar, la menor desviación
absoluta media.

Desviación absoluta media respecto a la media es la media de las desviaciones


absolutas a la media.

Estos índices de dispersión son a causa de sus complicaciones algebraicas, menos


utilizados que la desviación típica. La desviación típica se define como la raíz
cuadrada de las medias de las desviaciones cuadráticas a la media. Es decir:

Entre estas tres últimas se puede demostrar que verifican la siguiente


desigualdad:
Cuando la variable estadística es discreta el calculo de la desviación típica no
ofrece dificultad alguna. Cuando la variable es continua, no se puede trabajar
directamente, indirectamente se puede trabajar haciendo la variable discreta y
asignando todos los efectivos a la marca de clase. Por lo general, el error cometido
será tanto menor cuanto más pequeños sean los intervalos. El resultado de esta
“discretización” tiene como efecto aumentar la desviación típica. También se
utiliza en los cálculos la varianza s2 que se define como el cuadrado de la
desviación típica.

Coeficiente de variación se define como la razón de la desviación típica a la


media.

[Volver al principio]

Características de forma.

Coeficiente de asimetría. Si una distribución es simétrica sus diversos momentos


centrales de orden impar son nulos. Fisher ha propuesto el siguiente coeficiente
de asimetría:

Es invariante por cambio de origen y de escala y no tiene dimensiones.

Cuando >0 el apuntamiento de la distribución está más acentuado hacia la


derecha, si <0, lo está hacia la izquierda y cuando vale 0, la curva es simétrica.

Coeficiente de aplastamiento. Fisher ha propuesto el coeficiente:


que utiliza como prototipo para comparar la distribución normal, que tiene de
coeficiente de aplastamiento 3. Si >0 la distribución está menos aplastada que
la normal ( de la misma media y desviación típica), en caso de que esté mas
aplastada el coeficiente será negativo.

Puesto que el coeficiente de aplastamiento siempre es mayor o igual que –


2.

[Volver al principio]

Características de concentración.

Para variables estadísticas continuas cuyos valores son siempre positivos, como
por ejemplo la distribución de salarios y de rentas, es posible definir una curva
que representa la proporción de individuos pi en % cuyo valor de la variable
estadística (el sueldo) es inferior o igual a xi (frecuencia absoluta acumulada en %),
en función de qi que representa, también en %, la proporción de los salarios
ganados por el conjunto de los individuos cuyo sueldo es inferior o igual a x i, con
relación al total de los salarios (acumulada). La curva de p en función de q, se
llama curva de concentración y está inscrita en un cuadrado de lado unidad,
puesto que p y q son porcentajes y varían entre 0 y 1.

Se define el índice de concentración o de Gini, como el doble del área


comprendida entre la curva de concentración y la primera bisectriz. Este índice no
depende de un cambio de escala aunque sí está influenciado por un cambio de
origen.

Se define la mediala como el valor de la variable estadística (sueldos) tal que los
obreros que individualmente ganan menos que la mediala ganan globalmente
tanto como los obreros cuyo salario sobrepasa al salario medial. Es decir el valor
de x tal que: q(x)=1/2.

[Volver al principio]

EJERCICIOS.
1. Se ha revisado un lote de 1.060 piezas esmaltadas, obteniéndose el nú-
mero de defectos que se indica en la siguiente tabla:

Número Frecuencia
de
defectos
0 600
1 310
2 75
3 13
4 2

Determinar la media y la desviación típica de la distribución.

2. Las sumas de calificaciones de matemáticas de 11 alumnos han sido:

21, 36, 19, 23, 32, 25, 28, 20, 34, 33, 31.

Se pide:

a) determinar la mediana;

b) ¿qué porcentaje de alumnos tiene nota inferior a 32?

3. Si usted conduce un coche una distancia de 10 km a la


velocidad de 60 km/h, y después otros 10 a 80 km/h, ¿cuál es la velocidad
media?

4. Si usted conduce su coche 10 minutos a 60 km/h y otros 10 minutos a 80


km/h, ¿cuál es la velocidad media?

5. Comentar el siguiente párrafo traducido libremente de una obra de la


literatura inglesa Afortunadamente para todos y gracias a los estadísticos,
hay personas cuya inteligencia es superior al promedio como inferior. Es,
pues, falso afirmar, como algún pesimista, que más del 80 % de los individuos
tienen inteligencia inferior al promedio.
¿A qué promedio se refiere para que sea correcto?

6. Comentar la conocida anécdota según la cual la Estadística enseña que si


Pedro se come un pollo y Juan no come nada, esto equivale a que ambos
coman medio pollo’, ¿Cuál es la desviación típica en cada caso?

7. Un fabricante de neumáticos comprueba para 28 cubiertas el número de


kilómetros recorridos antes de estar gastadas y encuentra la siguiente
distribución

Núm.
de cubiertas
Kms.
70.000 1
60.000 1
50.000 7
40.000 9
30.000 10

¿Qué promedio debe utilizar para describir la duración de tales cubiertas?

8. Si nos dicen que Pedro ocupa el lugar 7 en su clase no sabemos mucho su


posición relativa en la clase ya que ésta dependerá del número de alumnos. Si
son 350, ¿cuál es su percentil?

9. Un viajante ha hecho 7 viajes en el mes pasado y los gastos se indican a


continuación:

Duración Gasto
Viaje Gasto
en días por día
1 0,5 625 350
2 2,0 600 300
3 3,5 875 250
4 1.0 450 450
5 9,0 1350 150
6 0,5 450 900
7 8,5 850 100
Total 25,0 5250 3500

El Jefe del viajante dice que los gastos del viajante han sido excesivos porque el
gasto medio por día ha sido 3.500/7 =500 ptas. y el viajante dice que el gasto
medio ha sido 5.250/25= 210 ptas. ¿Quién tiene razón? ¿Qué ocurre si utilizan las
medianas?

10. Supongamos que la talla media de una muestra de 300 hombre es 1,70 con
desviación típica 0,8 y que otra muestra de 300 mujeres da como media 1,68
y desviación típica 0,07. Calcular la media y desviación típica de la muestra
formada por el conjunto de las dos.

11. Cinco lotes de 2.000 piezas de determinada lámpara fabricada por tina
empresa eléctrica contienen el siguiente número de piezas defectuosas 4, 9, 3, 2,
1. Hallar la media, varianza y desviación típica.

12. El número de accidentes de aviación en 1960 fue superior al de 1950.


¿Basta esto para afirmar que era más peligroso Volar en 1960 que en 1950?

13. Tomando una catapirina se cura un catarro en 5 días. ¿ Basta esto para
afirmar que dicha medicina cura el catarro?

14. Se da la tabla de una muestra de viviendas según la duración de las obras de


la construcción.

Número
Duración (En
correspondiente
trimestres)
de viviendas
Menos de 2 5
De 2 a menos de 3 75
De 3 a menos de 4 620
De 4 a menos de 5 735
De 5 a menos de 6 1305
De 6 a menos de 7 1025
De 7a menos de 8 1625
De 8 a menos de 9 1430
De 9ª menos de 10 1140
De 10 a menos de 335
11
De 11 a menos de 120
12
De 12 a menos de 665
13
l3 y más 90
Total 9170

Calcular la media, mediana, desviación típica y los cuartiles de esta distribución.


Construir histograma y la curva de distribución.

15. La tabla siguiente da la repartición de autocares de una compañía según el


número de kilómetros recorridos entre dos revisiones consecutivas.

Número de kilómetros Número de vehículos según la distancia


recorrida
recorrido. Antes Entre la Entre la Entre la Entre la
de la 1ª 1ª y la 2ª y la 3ª y la 4ª y la
(en millares) Revisión 2ª 3ª 4ª 5ª
revisió revisión revisió revisión
n n
0 a menos 10 3 8 12 15 19
de
10 a menos 20 3 11 15 9 10
de
20 a menos 30 6 9 13 9 12
de
30 a menos 40 5 4 3 11 15
de
40 a menos 50 7 6 9 2 8
de
50 a menos 60 9 7 9 13 6
de
60 a menos 70 9 6 6 12 4
de
70 a menos 80 16 9 7 3 4
de
80 a menos 90 14 7 5 3 2
de
90 a menos 100 20 8 6 5 2
de
100 a menos 110 25 12 9 1 1
de
110 a menos 120 21 6 2 2 1
de
120 a menos 130 23 1 1 1 —
de
130 a menos 140 10 4 3 — 1
de
140 a menos 150 11 2 — — ——
de
150 a menos 160 — 1 — — ——
de
160 a menos 170 2 — — — —-
de
170 a menos 180 1 1 1 — ——
de
180 a menos 190 - 1 — — -
de
190 a menos 200 — 1 — — —
de
200 a menos 210 1 — — —. -
de
Total 191 104 101 96 85
a) Representar gráficamente estas distribuciones para compararlas cómodamente.

b) Calcular y comparar la mediana, los cuartiles, la media y la desviación típica.

También podría gustarte