Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística descriptiva. Jóse Maria Montero Lorenzo. Madrid: Paraninfo, 2007. p17-61.
Copyright: COPYRIGHT 2007 Cengage Learning Paraninfo, S.A.
Escuchar
Página 17
2.1. Introducción
Como ya se comentó en el Capítulo 1, la información que suministra una
tabla de frecuencias acerca de un carácter estadístico puede ser
representada en un gráfico, o sintetizada en unas medidas numéricas que
describan de manera más precisa el comportamiento del carácter analizado.
En este capítulo se van a estudiar las denominadas medidas de posición,
medidas de dispersión y medidas de forma. Para ello, se hará referencia a
los caracteres cuantitativos, es decir, se utilizarán los
términos variable y valor, aunque algunas de estas medidas (posición)
también son de aplicación para el caso de los caracteres cualitativos o
atributos.
Las medidas de posición permiten situar la distribución, es decir, fijan el
comportamiento global de una variable a partir de los valores individuales
recogidos en la tabla. Las primeras medidas de interés son las medidas de
posición o tendencia central de la distribución que, en cierta manera,
reflejan el centro o punto sobre el que gravita el conjunto de valores de la
distribución. Otras medidas de posición más generales son las no centrales.
Las medidas de dispersión determinan la variabilidad existente en los
valores de la variable. Las medidas de forma informan, sin necesidad de
representar gráficamente la distribución, sobre la deformación horizontal
(medidas de asimetría) y vertical (medidas de curtosis o apuntamiento) de la
misma.
Recuadro: Ocultar
EJEMPLO 2.1
Recuadro: Ocultar
EJEMPLO 2.2
4. Si a todos los valores xi de una distribución (xi; ni) se les suma (resta) una
constante b, la media aritmética de la nueva distribución (yi; ni) queda
aumentada (disminuida) en esa constante. En otros términos, a la media
aritmética le afectan los cambios de origen.
5. Si a todos los valores xi, de una distribución (xi; ni) se les multiplica
(divide) por una constante a, distinta de cero, la media aritmética de la
nueva distribución (yi; ni) queda multiplicada (dividida) por esa constante. Es
decir, a la media aritmética le afectan los cambios de escala.
Recuadro: Ocultar
EJEMPLO 2.3
Nótese que
Por tanto:
Recuadro: Ocultar
EJEMPLO 2.4
o bien
Por tanto,
expresión que involucra la media geométrica de (1 + ri), siendo G = 1 + r.
Igual que las dos medias anteriores, la media armónica tiene la ventaja de
que en su cálculo intervienen todos los valores de la variable; sin embargo,
no tiene sentido su utilización cuando algún valor de la distribución sea nulo.
Recuadro: Ocultar
EJEMPLO 2.5
Una empresa de equipos electrónicos tiene tres talleres de montaje con las
siguientes cifras mensuales:
2.2.1.5. Mediana
Siguiendo este mismo criterio, el intervalo mediano será aquel que contenga
con lo que
En este caso se dispone de dos valores medianos, que son los que ocupan
las posiciones
Recuadro: Ocultar
EJEMPLO 2.6
Recuadro: Ocultar
EJEMPLO 2.7
Recuadro: Ocultar
EJEMPLO 2.8
2.2.1.6. Moda
A.2. Si se considera que todos los valores del intervalo están distribuidos de
manera uniforme dentro de él y el intervalo modal es Li–1 – Li, la moda
estará más cerca (lejos) del intervalo de la derecha cuanto mayor (menor)
frecuencia tenga este intervalo y menor (mayor) tenga el izquierdo (Grífico
2.2).
siendo
Por tanto,
B. La amplitud de los intervalos es distinta
con
Recuadro: Ocultar
EJEMPLO 2.9
Recuadro: Ocultar
EJEMPLO 2.10
El primer y segundo valor del segundo cuartil o mediana ocupan los lugares
En primer lugar, hay que establecer el intervalo que contiene a cada uno de
ellos y, posteriormente, asignar un valor de dicho intervalo al cuartil
correspondiente. De manera análoga a como se procedía en la
determinación de la mediana, se puede tomar como cuartil cualquier valor
del intervalo excepto el correspondiente al extremo inferior, por considerarse
los intervalos abiertos por la izquierda, o bien aplicar la siguiente expresión:
Recuadro: Ocultar
EJEMPLO 2.11
y, para el segundo:
es decir, 12 y 13, respectivamente. Por tanto, el primer y segundo valor del
primer cuartil son
Esto indica que, para caracterizar una distribución, además de calcular las
medidas de posición, también resulta necesario analizar su variabilidad.
Dicha variabilidad, habitualmente, se mide respecto a una medida de
posición central, pretendiendo, de esta manera, conocer la representatividad
de los valores centrales de la distribución, es decir, si estos valores
sintetizan de forma satisfactoria o no toda la información de la distribución.
Recorrido o rango
Esta medida tiene la ventaja de ser muy sencilla de calcular. Sin embargo,
el inconveniente que presenta es que sólo depende de los valores
extremos, por lo que si éstos se encuentran alejados del resto de los valores
de la distribución (es decir, son valores anómalos) puede dar lugar a
conclusiones erróneas.
Se define como
esto es, el promedio de las diferencias (en valor absoluto) entre cada par de
valores de la distribución. Su principal incoveniente radica en la tediosidad
de su cálculo.
Varianza
Por tanto,
4. Si a todos los valores (xi) de una distribución (xi; ni) se les suma (resta)
una constante b, la varianza de la nueva distribución (yi; ni) no varía, es
decir, a la varianza no le afectan los cambios de origen (si por ejemplo a
todos los trabajadores de una empresa les suben el sueldo mensual 100
euros, la variabilidad de los salarios sigue siendo la misma).
5. Si a todos los valores xi de una distribución (xi; ni) se les multiplica (divide)
por una constante a, distinta de cero, la varianza de la nueva distribución (yi;
ni) queda multiplicada (dividida) por esa constante al cuadrado; es decir, a la
varianza le afectan los cambios de escala.
Cuanto mayor sea la desviación típica, mayor dispersión existirá entre los
valores de la distribución y la media aritmética y, por tanto, la media
aritmética será menos representativa.
Recuadro: Ocultar
EJEMPLO 2.12
Recuadro: Ocultar
EJEMPLO 2.13
Recuadro: Ocultar
EJEMPLO 2.14
Un individuo tiene que elegir entre dos ofertas de trabajo: una propuesta por
una empresa española y la otra por una americana. La empresa española le
ofrece un sueldo anual bruto de 53.000 euros, mientras que la oferta de la
americana es de 50.000 $. Por otro lado, esta persona tiene información
sobre el sueldo medio y la desviación típica salarial de las distribuciones de
ambas empresas:
¿En cuál de las dos empresas la posición relativa de este individuo es mejor
respecto a los demás trabajadores?
Como las distribuciones de los salarios tipificados tienen media igual a cero
y desviación típica igual a 1, se observa que en ambas empresas la
remuneración de ese individuo está por encima de la media. Sin embargo,
en la empresa española estaría 3,71 desviaciones típicas por encima de la
media, mientras que en la americana su salario sería 7,82 desviaciones
típicas superior al salario medio, lo que refleja que su posición relativa frente
a los demás trabajadores es mejor en la empresa americana.
Página 51 | Inicio del artículo
En consecuencia:
Gráfico 2.3
Página 54 | Inicio del artículo
Si la distribución es simétrica: g1 = 0.
Si la distribución es asimétrica positiva o a la derecha: g1 > 0.
Si la distribución es asimétrica negativa o a la izquierda: g1 < 0.
Si la distribución es simétrica: .
Si la distribución es asimétrica positiva o a la derecha: .
Si la distribución es asimétrica negativa o a la
izquierda: .
Hágase
Entonces, se tiene que
Es decir,
y, por consiguiente,
Recuadro: Ocultar
EJEMPLO 2.15
En una empresa con 150 empleados, el número de horas
extraordinarias/año de los mismos sigue la distribución expuesta en las dos
primeras columnas de la tabla:
Los extremos de los whiskers representan los valores más grandes y más
pequeños de la distribución que no son considerados anómalos. Los valores
sospechosos de ser anómalos deberán ser considerados con prudencia y
los anómalos pueden no considerarse como pertenecientes a la distribución
en cuestión.
Recuadro: Ocultar
EJEMPLO 2.16
Casos particulares
1 La representación gráfica de la distribución normal es una campana
(campana de Gauss) que se caracteriza por ser simétrica respecto al eje de
abscisas. El coeficiente de apuntamiento de este tipo de distribuciones, tal y
como se ha definido, es nulo.
3 .