Está en la página 1de 14

En estad�stica, un par�metro es un n�mero que resume la gran cantidad de datos que

pueden derivarse del estudio de una variable estad�stica.1? El c�lculo de este


n�mero est� bien definido, usualmente mediante una f�rmula aritm�tica obtenida a
partir de datos de la poblaci�n.2?3?

Los par�metros estad�sticos son una consecuencia inevitable del prop�sito esencial
de la estad�stica: crear un modelo de la realidad.4?

El estudio de una gran cantidad de datos individuales de una poblaci�n puede ser
farragoso e inoperativo, por lo que se hace necesario realizar un resumen que
permita tener una idea global de la poblaci�n, compararla con otras, comprobar su
ajuste a un modelo ideal, realizar estimaciones sobre datos desconocidos de la
misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo
esencial los par�metros estad�sticos.

Por ejemplo, suele ofrecerse como resumen de la juventud de una poblaci�n la media
aritm�tica de las edades de sus miembros, esto es, la suma de todas ellas, dividida
por el total de individuos que componen tal poblaci�n.

�ndice
1 Enfoque descriptivo
2 Propiedades deseables en un par�metro
3 Principales par�metros
3.1 Medidas de tendencia central o centralizaci�n
3.1.1 Media aritm�tica o promedio
3.1.2 Moda
3.1.3 Mediana
3.2 Medidas de posici�n no central
3.3 Comentarios sobre las medidas de posici�n
3.4 Medidas de dispersi�n
3.4.1 Medidas de dispersi�n absolutas
3.4.1.1 Recorridos
3.4.1.2 Desviaciones medias
3.4.1.3 Varianza y desviaci�n t�pica
3.4.2 Medidas de dispersi�n relativa
3.4.2.1 Coeficiente de variaci�n de Pearson
3.4.2.2 Coeficiente de apertura
3.4.2.3 Recorridos relativos
3.4.2.4 �ndice de desviaci�n respecto a la mediana
3.5 Medidas de forma
3.5.1 Medidas de asimetr�a
3.5.2 Medidas de apuntamiento o curtosis
3.6 Otros par�metros
3.6.1 Proporci�n
3.6.2 N�mero �ndice
3.6.3 Tasa
3.6.4 Coeficiente de Gini
4 Momentos
5 Par�metros bidimensionales
5.1 Centro de gravedad
5.2 Covarianza
5.3 Coeficiente de correlaci�n lineal
6 Los par�metros en la inferencia estad�stica
7 Controversias y malas interpretaciones
8 V�ase tambi�n
9 Referencias
9.1 Bibliograf�a
9.2 Enlaces externos
Enfoque descriptivo

Gr�ficas de distribuciones normales para distintos valores de sus dos par�metros.


Un par�metro estad�stico es una medida poblacional. Este enfoque es el tradicional
de la estad�stica descriptiva.5?6?7? En este sentido, su acepci�n se acerca a la de
medida o valor que se compara con otros, tomando una unidad de una determinada
magnitud como referencia.

Por su parte, la facci�n m�s formal de la estad�stica, la estad�stica matem�tica y


tambi�n la inferencia estad�stica utilizan el concepto de par�metro en su acepci�n
matem�tica m�s pura, esto es, como variable que define una familia de objetos
matem�ticos en determinados modelos. As� se habla, por ejemplo, de una distribuci�n
normal de par�metros � y s como de una determinada familia de distribuciones con
una distribuci�n de probabilidad de expresi�n conocida, en la que tales par�metros
definen aspectos concretos como la esperanza, la varianza, la curtosis, etc. Otro
ejemplo com�n en este sentido es el de la distribuci�n de Poisson, determinada por
un par�metro, ?; o la distribuci�n binomial, determinada por dos par�metros, n y p.
Desde el punto de vista de la estad�stica matem�tica, el hecho de que estas
distribuciones describan situaciones reales y los citados par�metros signifiquen un
resumen de determinado conjunto de datos es indiferente.

Propiedades deseables en un par�metro


Seg�n Yule8? un par�metro estad�stico es deseable que tenga las siguientes
propiedades:

Se define de manera objetiva, es decir, es posible calcularlo sin ambig�edades,


generalmente mediante una f�rmula matem�tica. Por ejemplo, la media aritm�tica se
define como la suma de todos los datos, dividida por el n�mero de datos. No hay
ambig�edad: si se realiza ese c�lculo, se obtiene la media; si se realiza otro
c�lculo, se obtiene otra cosa. Sin embargo, la definici�n de moda como el "valor
m�s frecuente", puede dar lugar a confusi�n cuando la mayor frecuencia la presentan
varios valores distintos.
No desperdicia, a priori, ninguna de las observaciones. Con car�cter general, un
par�metro ser� m�s representativo de una determinada poblaci�n, cu�ntos m�s valores
de la variable est�n implicados en su c�lculo. Por ejemplo, para medir la
dispersi�n puede calcularse el recorrido, que s�lo usa dos valores de la variable
objeto de estudio, los extremos; o la desviaci�n t�pica, en cuyo c�lculo
intervienen todos los datos del eventual estudio.
Es interpretable, significa algo. La mediana, por ejemplo, deja por debajo de su
valor a la mitad de los datos, est� justo en medio de todos ellos cuando est�n
ordenados. Esta es una interpretaci�n clara de su significado.
Es sencillo de calcular y se presta con facilidad a manipulaciones algebraicas. Se
ver� m�s abajo que una medida de la dispersi�n es la desviaci�n media. Sin embargo,
al estar definida mediante un valor absoluto, funci�n definida a trozos y no
derivable, no es �til para gran parte de los c�lculos en los que estuviera
implicada, aunque su interpretaci�n sea muy clara.
Es poco sensible a las fluctuaciones muestrales. Si peque�as variaciones en una
muestra de datos estad�sticos influyen en gran medida en un determinado par�metro,
es porque tal par�metro no representa con fiabilidad a la poblaci�n. As� pues es
deseable que el valor de un par�metro con esta propiedad se mantenga estable ante
las peque�as oscilaciones que con frecuencia pueden presentar las distintas
muestras estad�sticas. Esta propiedad es m�s interesante en el caso de la
estimaci�n de par�metros. Por otra parte, los par�metros que no var�an con los
cambios de origen y escala o cuya variaci�n est� controlada algebraicamente, son
apropiados en determinadas circunstancias como la tipificaci�n.
Principales par�metros
Art�culo principal: Estad�stico muestral
Habitualmente se agrupan los par�metros en las siguientes categor�as:
Medidas de posici�n.9?
Se trata de valores de la variable estad�stica que se caracterizan por la posici�n
que ocupan dentro del rango de valores posibles de esta. Entre ellos se distinguen:

Las medidas de tendencia central: medias, moda y mediana.


Las medidas de posici�n no central: cuantiles (cuartiles, deciles y percentiles).
Medidas de dispersi�n.10?
Resumen la heterogeneidad de los datos, lo separados que estos est�n entre s�. Hay
dos tipos, b�sicamente:

Medidas de dispersi�n absolutas, que vienen dadas en las mismas unidades en las que
se mide la variable: recorridos, desviaciones medias, varianza, y desviaci�n
t�pica.
Medidas de dispersi�n relativa, que informan de la dispersi�n en t�rminos
relativos, como un porcentaje. Se incluyen entre estas el coeficiente de variaci�n,
el coeficiente de apertura, los recorridos relativos y el �ndice de desviaci�n
respecto de la mediana.
Medidas de forma.11?
Su valor informa sobre el aspecto que tiene la gr�fica de la distribuci�n. Entre
ellas est�n los coeficientes de asimetr�a y los de curtosis.

Otros par�metros.
Adem�s, y con prop�sitos m�s espec�ficos, existen otros par�metros de uso en
situaciones muy concretas, como son las proporciones, los n�meros �ndice, las tasas
y el coeficiente de Gini.

Medidas de tendencia central o centralizaci�n


Art�culo principal: Medidas de tendencia central
Son valores que suelen situarse cerca del centro de la distribuci�n de datos. Los
m�s destacados son las medias o promedios (incluyendo la media aritm�tica, la media
geom�trica y la media arm�nica), la mediana y la moda.

Media aritm�tica o promedio

La estatura media como resumen de una poblaci�n homog�nea (abajo) o heterog�nea


(arriba).
Art�culo principal: Media aritm�tica
La media muestral o media aritm�tica es, probablemente, uno de los par�metros
estad�sticos m�s extendidos.12? Sus propiedades son:13?

Su c�lculo es muy sencillo y en �l intervienen todos los datos.


Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos,
ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de
su propio valor:
{\displaystyle {\frac {\sum _{i=1}^{n}(x_{i}-{\overline {x}})}{n}}={\frac {\sum
_{i=1}^{n}x_{i}}{n}}-{\frac {\sum _{i=1}^{n}{\overline {x}}}{n}}={\overline {x}}-
{\overline {x}}=0} \frac{\sum_{i=1}^n (x_i-\overline{x})}{n} = \frac{\sum_{i=1}^n
x_i}{n} - \frac{\sum_{i=1}^n \overline{x}}{n} = \overline{x} - \overline{x} = 0

Minimiza las desviaciones cuadr�ticas de los datos respecto de cualquier valor


prefijado, esto es, el valor de {\displaystyle {\frac {\sum _{i=1}^{n}(x_{i}-
k)^{2}}{n}}} \frac{\sum_{i=1}^n (x_i-k)^2}{n} es m�nimo cuando {\displaystyle
k={\overline {x}}} k = \overline{x}. Este resultado se conoce como Teorema de
K�nig. Esta propiedad permite interpretar uno de los par�metros de dispersi�n m�s
importantes: la varianza.
Se ve afectada por transformaciones afines (cambios de origen y escala), esto es,
si
{\displaystyle x_{i}'=ax_{i}+b} x_i' = ax_i+b entonces {\displaystyle {\overline
{x'}}=a{\overline {x}}+b} \overline{x'} = a \overline{x} + b, donde {\displaystyle
{\overline {x'}}} \overline{x'} es la media aritm�tica de los {\displaystyle
x_{i}'} x_i', para i = 1, ..., n y a y b n�meros reales.
Este par�metro, aun teniendo m�ltiples propiedades que aconsejan su uso en
situaciones muy diversas, tiene tambi�n algunos inconvenientes, como son:

Para datos agrupados en intervalos (variables continuas), su valor oscila en


funci�n de la cantidad y amplitud de los intervalos que se consideren.
Es una medida a cuyo significado afecta sobremanera la dispersi�n, de modo que
cuanto menos homog�neos son los datos, menos informaci�n proporciona. Dicho de otro
modo, poblaciones muy distintas en su composici�n pueden tener la misma media.14?
Por ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95,
pongamos por caso, tendr�a una estatura media de 1,95, evidentemente, valor que
representa fielmente a esta homog�nea poblaci�n. Sin embargo, un equipo de
estaturas m�s heterog�neas, 2,20, 2,15, 1,95, 1,75 y 1,70, por ejemplo, tendr�a
tambi�n, como puede comprobarse, una estatura media de 1,95, valor que no
representa a casi ninguno de sus componentes.
Es muy sensible a los valores extremos de la variable. Por ejemplo, en el c�lculo
del salario medio de una empresa, el salario de un alto directivo que gane
1.000.000 de � tiene tanto peso como el de mil empleados "normales" que ganen 1.000
�, siendo la media de aproximadamente 2.000 �.
Moda
Art�culo principal: Moda (estad�stica)
La moda es el dato m�s repetido, el valor de la variable con mayor frecuencia
absoluta.15? En cierto sentido se corresponde su definici�n matem�tica con la
locuci�n "estar de moda", esto es, ser lo que m�s se lleva.

Su c�lculo es extremadamente sencillo, pues s�lo necesita de un recuento. En


variables continuas, expresadas en intervalos, existe el denominado intervalo modal
o, en su defecto, si es necesario obtener un valor concreto de la variable, se
recurre a la interpolaci�n.

Sus principales propiedades son:

C�lculo sencillo.
Interpretaci�n muy clara.
Al depender s�lo de las frecuencias, puede calcularse para variables cualitativas.
Es por ello el par�metro m�s utilizado cuando al resumir una poblaci�n no es
posible realizar otros c�lculos, por ejemplo, cuando se enumeran en medios
period�sticos las caracter�sticas m�s frecuentes de determinado sector social. Esto
se conoce informalmente como "retrato robot".16?
Inconvenientes:

Su valor es independiente de la mayor parte de los datos, lo que la hace muy


sensible a variaciones muestrales. Por otra parte, en variables agrupadas en
intervalos, su valor depende excesivamente del n�mero de intervalos y de su
amplitud.
Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera
de la moda, no afectan en modo alguno a su valor.
No siempre se sit�a hacia el centro de la distribuci�n.
Puede haber m�s de una moda en el caso en que dos o m�s valores de la variable
presenten la misma frecuencia (distribuciones bimodales o multimodales).
Mediana
Art�culo principal: Mediana (estad�stica)
La mediana es un valor de la variable que deja por debajo de s� a la mitad de los
datos, una vez que estos est�n ordenados de menor a mayor.17? Por ejemplo, la
mediana del n�mero de hijos de un conjunto de trece familias, cuyos respectivos
hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez
ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la
posici�n central es 2:
{\displaystyle \underbrace {1,\ 1,\ 1,\ 1,\ 1,\ 1,} _{Mitad\;inferior}\;\underbrace
{\color {Red}2,} _{Mediana\;}\;\underbrace {2,\ 2,\ 2,\ 3,\ 3,\ 4}
_{Mitad\;superior}}
\underbrace{1,\ 1,\ 1,\ 1,\ 1,\ 1, }_{Mitad \; inferior} \;
\underbrace{\color{Red} 2, }_{Mediana \;} \;
\underbrace{2,\ 2,\ 2,\ 3,\ 3,\ 4}_{Mitad \; superior}
En caso de un n�mero par de datos, la mediana no corresponder�a a ning�n valor de
la variable, por lo que se conviene en tomar como mediana el valor intermedio entre
los dos valores centrales. Por ejemplo, en el caso de doce datos como los
anteriores:

{\displaystyle \underbrace {1,\ 1,\ 1,\ 1,\ 1,} _{Valores\;inferiores}\;\underbrace


{\color {Red}1,\ 2,} _{Valores\;intermedios}\;\underbrace {2,\ 2,\ 3,\ 3,\ 4}
_{Valores\;superiores}}
\underbrace{1,\ 1,\ 1,\ 1,\ 1, }_{Valores \; inferiores} \;
\underbrace{\color{Red} 1,\ 2, }_{Valores \; intermedios} \;
\underbrace{2,\ 2,\ 3,\ 3,\ 4}_{Valores \; superiores}
Se toma como mediana {\displaystyle 1,5={\frac {{\color {Red}1}+{\color {Red}2}}
{2}}} 1,5 = \frac{{\color{Red}1}+{\color{Red}2}}{2}

En este ejemplo basado en una tabla real de percentiles usada en pediatr�a, puede
comprobarse que una ni�a de 24 meses con un peso de 13 kg estar�a en el percentil
75�, esto es, su peso es superior al 75% de las ni�as de su edad. La mediana
corresponder�a, aproximadamente, a 12 kg (intersecci�n de la l�nea curva m�s oscura
con la l�nea horizontal correspondiente al valor 12 en el eje vertical, para esa
misma edad).
Existen m�todos de c�lculo m�s r�pidos para datos m�s numerosos (v�ase el art�culo
principal dedicado a este par�metro). Del mismo modo, para valores agrupados en
intervalos, se halla el "intervalo mediano" y, dentro de este, se obtiene un valor
concreto por interpolaci�n.

Propiedades de la mediana como par�metro estad�stico:18?

Es menos sensible que la media a oscilaciones de los valores de la variable. Un


error de transcripci�n en la serie del ejemplo anterior en, pongamos por caso, el
�ltimo n�mero, deja a la mediana inalterada.
Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso
cuando alguno de ellos no est� acotado.
No se ve afectada por la dispersi�n. De hecho, es m�s representativa que la media
aritm�tica cuando la poblaci�n es bastante heterog�nea. Suele darse esta
circunstancia cuando se resume la informaci�n sobre los salarios de un pa�s o una
empresa. Hay unos pocos salarios muy altos que elevan la media aritm�tica haciendo
que pierda representatividad respecto al grueso de la poblaci�n. Sin embargo,
alguien con el salario "mediano" sabr�a que hay tanta gente que gana m�s dinero que
�l, como que gana menos.
Sus principales inconvenientes son que en el caso de datos agrupados en intervalos,
su valor var�a en funci�n de la amplitud de estos. Por otra parte, no se presta a
c�lculos algebraicos tan bien como la media aritm�tica.

Medidas de posici�n no central


Art�culo principal: Medidas de posici�n no central
Directamente relacionados con la anterior, se encuentran las medidas de posici�n no
central, tambi�n conocidas como cuantiles. Se trata de valores de la variable
estad�stica que dejan por debajo de s� determinada cantidad de los datos. Son, en
definitiva, una generalizaci�n del concepto de la mediana. Mientras que �sta deja
por debajo de s� al 50% de la distribuci�n, los cuantiles pueden hacerlo con
cualquier otro porcentaje.19? Se denominan medidas de posici�n porque informan,
precisamente, de la posici�n que ocupa un valor dentro de la distribuci�n de datos.

Tradicionalmente se distingue entre cuartiles, si se divide la cantidad de datos en


cuatro partes antes de proceder al c�lculo de los valores que ocupan cada posici�n;
deciles, si se divide los datos en diez partes; o percentiles, que dividen la
poblaci�n en cien partes.

Ejemplos: si se dice que una persona, tras un test de inteligencia, ocupa el


percentil 75, ello supone que el 75% de la poblaci�n tiene un cociente intelectual
con un valor inferior al de esa persona. Este criterio se usa por las asociaciones
de superdotados, que limitan su conjunto de miembros a aquellas que alcanzan
determinado percentil (igual o superior a 98 en la mayor�a de los casos).

El ejemplo que se muestra en la imagen de la derecha es el correspondiente al


c�lculo inverso, esto es, cuando se desea conocer el percentil correspondiente a un
valor de la variable, en lugar del valor que corresponde a un determinado
percentil.

Otras medidas de posici�n central son la media geom�trica y la media arm�nica que,
aunque tienen determinadas propiedades algebraicas que podr�an hacerlas �tiles en
determinadas circunstancias, su interpretaci�n no es tan intuitiva como la de los
par�metros anteriores.20?

Comentarios sobre las medidas de posici�n


Este tipo de par�metros no tienen por qu� coincidir con un valor exacto de la
variable y, por tanto, tampoco pueden usarse con car�cter general para hacer
pron�sticos. Por ejemplo, si se dice que la media aritm�tica de los hijos de las
familias de un pa�s es de 1,2, no es posible encontrar familias con ese valor en
concreto. Un segundo ejemplo: a ninguna f�brica de zapatos se le ocurrir�a fabricar
los suyos con tallas �nicamente correspondientes al valor promedio, ni siquiera
tienen por qu� ser estas tallas las m�s fabricadas, pues en tal caso ser�a m�s
apropiado atender a la moda de la distribuci�n de tallas de los eventuales
clientes.

La elecci�n de uno u otro par�metro depender� de cada caso particular, de los


valores de la variable y de los prop�sitos del estudio. Su uso indiscriminado puede
ser deliberadamente tendencioso o involuntariamente sesgado, convirti�ndose, de
hecho, en un abuso.21? Puede pensarse, por ejemplo, en la siguiente situaci�n: un
empresario publica que el salario medio en su empresa es de 1.600 �. A este dato,
que en determinadas circunstancias podr�a considerarse muy bueno, podr�a llegarse
si la empresa tuviese cuatro empleados con salarios de 1.000 � mensuales y el
salario del jefe, incluido en la media, fuese de 4.000 � al mes:22?

{\displaystyle {\bar {x}}={\frac {1000+1000+1000+1000+4000}{5}}=1600} \bar{x} =


\frac{1000+1000+1000+1000+4000}{5} = 1600

Con car�cter general y a modo de resumen podr�a decirse que la media aritm�tica es
un par�metro representativo cuando la poblaci�n sigue una distribuci�n normal o es
bastante homog�nea; en otras situaciones de fuerte dispersi�n, habr�a que
decantarse por la mediana. La moda es el �ltimo recurso (y el �nico) cuando de
describir variables cualitativas se trata.

Medidas de dispersi�n
Art�culo principal: Dispersi�n (matem�tica)

Diagrama de caja que muestra la dispersi�n gr�ficamente, usando los cuartiles como
referencia. Entre Q1 y Q3 (rango intercuart�lico) se encuentran el 50% de las
observaciones.
Las medidas de posici�n resumen la distribuci�n de datos, pero resultan
insuficientes y simplifican excesivamente la informaci�n. Estas medidas adquieren
verdadero significado cuando van acompa�adas de otras que informen sobre la
heterogeneidad de los datos. Los par�metros de dispersi�n miden eso precisamente,
generalmente, calculando en qu� medida los datos se agrupan en torno a un valor
central. Indican, de un modo bien definido, lo homog�neos que estos datos son. Hay
medidas de dispersi�n absolutas, entre las cuales se encuentran la varianza, la
desviaci�n t�pica o la desviaci�n media, aunque tambi�n existen otras menos
utilizadas como los recorridos o la meda; y medidas de dispersi�n relativas, como
el coeficiente de variaci�n, el coeficiente de apertura o los recorridos relativos.
En muchas ocasiones las medidas de dispersi�n se ofrecen acompa�ando a un par�metro
de posici�n central para indicar en qu� medida los datos se agrupan en torno de
�l.23?

Medidas de dispersi�n absolutas


Recorridos
El recorrido o rango de una variable estad�stica es la diferencia entre el mayor y
el menor valor que toma la misma. Es la medida de dispersi�n m�s sencilla de
calcular, aunque es algo burda porque s�lo toma en consideraci�n un par de
observaciones. Basta con que uno de estos dos datos var�e para que el par�metro
tambi�n lo haga, aunque el resto de la distribuci�n siga siendo, esencialmente, la
misma.

Existen otros par�metros dentro de esta categor�a, como los recorridos o rangos
intercuant�licos, que tienen en cuenta m�s datos y, por tanto, permiten afinar en
la dispersi�n. Entre los m�s usados est� el rango intercuart�lico, que se define
como la diferencia entre el cuartil tercero y el cuartil primero. En ese rango
est�n, por la propia definici�n de los cuartiles, el 50% de las observaciones. Este
tipo de medidas tambi�n se usa para determinar valores at�picos. En el diagrama de
caja que aparece a la derecha se marcan como valores at�picos todos aquellos que
caen fuera del intervalo [Li, Ls] = [Q1 - 1,5�Rs, Q3 + 1,5�Rs], donde Q1 y Q3 son
los cuartiles 1� y 3�, respectivamente, y Rs representa la mitad del recorrido o
rango intercuart�lico, tambi�n conocido como recorrido semiintercuart�lico.24?

Desviaciones medias
Art�culo principal: Desviaci�n media
Dada una variable estad�stica X y un par�metro de tendencia central, c, se llama
desviaci�n de un valor de la variable, xi, respecto de c, al n�mero |xi - c|. Este
n�mero mide lo lejos que est� cada dato del valor central c, por lo que una media
de esas medidas podr�a resumir el conjunto de desviaciones de todos los datos.

As� pues, se denomina desviaci�n media de la variable X respecto de c a la media


aritm�tica de las desviaciones de los valores de la variable respecto de c, esto
es, si

{\displaystyle X={x_{1},\,x_{2},\,...,\,x_{n}},} X = {x_1, \, x_2, \, ...,\, x_n},


entonces {\displaystyle DM_{c}={\frac {\sum _{i=1}^{n}\left|x_{i}-c\right|}{n}}}
DM_c = \frac{\sum_{i=1}^n \left| x_i - c \right|}{n}

De este modo se definen la desviaci�n media respecto de la media (c =


{\displaystyle {\overline {x}}} \overline{x}) o la desviaci�n media respecto de la
mediana (c = {\displaystyle {\overline {Me}}} \overline{Me}), cuya interpretaci�n
es sencilla en virtud del significado de la media aritm�tica.23?

Sin embargo, el uso de valores absolutos impide determinados c�lculos algebraicos


que obligan a desechar estos par�metros, a pesar de su clara interpretaci�n, en
favor de los siguientes.

Varianza y desviaci�n t�pica


Art�culo principal: Varianza
Conjunto de datos estad�sticos de media aritm�tica 50 (l�nea azul) y desviaci�n
t�pica 20 (l�neas rojas).
Como se vio m�s arriba, la suma de todas las desviaciones respecto al par�metro m�s
utilizado, la media aritm�tica, es cero. Por tanto si se desea una medida de la
dispersi�n sin los inconvenientes para el c�lculo que tienen las desviaciones
medias, una soluci�n es elevar al cuadrado tales desviaciones antes de calcular el
promedio. As�, se define la varianza como:25?

{\displaystyle {\sigma ^{2}}={\frac {\sum \limits _{i=1}^{n}\left(x_{i}-{\overline


{x}}\right)^{2}}{n}}} {\sigma^2} = \frac{ \sum\limits_{i=1}^n \left( x_i -
\overline{x} \right) ^ 2 }{n},
o sea, la media de los cuadrados de las desviaciones respecto de la media.

La desviaci�n t�pica, s, se define como la ra�z cuadrada de la varianza, esto es,

{\displaystyle {\sigma }={\sqrt {\sigma ^{2}}}} {\sigma} = \sqrt{\sigma ^2}


Para variables agrupadas en intervalos, se usan las marcas de clase (un valor
apropiado del interior de cada intervalo) en estos c�lculos.

Propiedades:25?

Ambos par�metros no se alteran con los cambios de origen.


Si todos los valores de la variable se multiplican por una constante, b, la
varianza queda multiplicada por b2.
En el intervalo {\displaystyle ({\overline {x}}-k\sigma ,\,{\overline {x}}
+k\sigma )} (\overline{x} - k\sigma, \, \overline{x} + k\sigma) se encuentran, al
menos, el {\displaystyle 100(1-{\frac {1}{k^{2}}})\%} {\displaystyle 100(1-{\frac
{1}{k^{2}}})\%} de las observaciones (v�ase Desigualdad de Tchebyschev).26?
Esta �ltima propiedad muestra la potencia del uso conjunto de la media y la
desviaci�n t�pica como par�metros estad�sticos, ya que para valores de k iguales a
2 y 3, respectivamente, se obtiene que:

En el intervalo {\displaystyle ({\overline {x}}-2\sigma ,\,{\overline {x}}


+2\sigma )} (\overline{x} - 2\sigma, \, \overline{x} + 2\sigma) est�n, al menos, el
75% de los datos.
En el intervalo {\displaystyle ({\overline {x}}-3\sigma ,\,{\overline {x}}
+3\sigma )} (\overline{x} - 3\sigma, \, \overline{x} + 3\sigma) est�n, al menos, el
89% de los datos.
Se cumple la siguiente relaci�n entre los par�metros de dispersi�n:

{\displaystyle D_{Me}\leq D_{\overline {x}}\leq \sigma } D_{Me} \leq


D_{\overline{x}} \leq \sigma
donde {\displaystyle D_{Me},\,D_{\overline {x}}} D_{Me}, \, D_{\overline{x}}, y
{\displaystyle \sigma } \sigma son, respectivamente, la desviaci�n media respecto
de la mediana, la desviaci�n media respecto de la media y la desviaci�n t�pica
(v�ase Desviaci�n media).

La media. Es una medida de dispersi�n que tiene, por su propia definici�n, las
mismas propiedades que la mediana. Por ejemplo, no se ve afectada por valores
extremos o at�picos.27?

Medidas de dispersi�n relativa


Son par�metros que miden la dispersi�n en t�rminos relativos, un porcentaje o una
proporci�n, por ejemplo, de modo que permiten una sencilla comparaci�n entre la
dispersi�n de distintas distribuciones.28?

Coeficiente de variaci�n de Pearson


Art�culo principal: Coeficiente de variaci�n
Se define como {\displaystyle C_{V}={\frac {\sigma }{\bar {x}}}} C_V =
\frac{\sigma}{\bar{x}} , donde s es la desviaci�n t�pica y {\displaystyle {\bar
{x}}} \bar{x} es la media aritm�tica.

Se interpreta como el n�mero de veces que la media est� contenida en la desviaci�n


t�pica. Suele darse su valor en tanto por ciento, multiplicando el resultado
anterior por 100. De este modo se obtiene un porcentaje de la variabilidad.

Su principal inconveniente es que en el caso de distribuciones cuya media se acerca


a cero, su valor tiende a infinito e incluso resulta imposible de calcular cuando
la media es cero. Por ello no puede usarse para variables tipificadas.

Coeficiente de apertura
Se define como el cociente entre los valores extremos de la distribuci�n de datos,
esto es, dada una distribuci�n de datos estad�sticos x1, x2, ..., xn, su
coeficiente de apertura, CA es {\displaystyle C_{A}={\frac {m{\acute {a}}x(x_{i})}
{m{\acute {\imath }}n(x_{i})}},\;i=1,...,n} C_A = \frac{m\acute{a}x(x_i)}
{m\acute{\imath}n(x_i)}, \; i = 1, ..., n

Se usa para comparar salarios de empresas.

Recorridos relativos
Dado Re, el recorrido de una distribuci�n de datos estad�sticos, el recorrido
relativo, RR es {\displaystyle R_{R}={\frac {R_{e}}{\bar {x}}}} R_R = \frac{R_e}
{\bar{x}}, donde {\displaystyle {\bar {x}}} {\bar{x}} es la media aritm�tica de la
distribuci�n.

Dada una distribuci�n de datos estad�sticos con cuartiles Q1, Q2 y Q3, el recorrido
intercuart�lico relativo, RIQR se define como29? {\displaystyle R_{IQR}={\frac
{Q_{3}-Q_{1}}{Q_{2}}}} R_{IQR} = \frac{Q_3 - Q_1}{Q_2}

Por otra parte, se define el recorrido semiintercuart�lico relativo, RSIR, como


{\displaystyle R_{SIR}={\frac {Q_{3}-Q_{1}}{Q_{3}+Q_{1}}}} R_{SIR} = \frac{Q_3 -
Q_1}{Q_3 + Q_1}

�ndice de desviaci�n respecto a la mediana


Se define como {\displaystyle V_{Me}={\frac {D_{Me}}{Me}}} V_{Me} = \frac{D_{Me}}
{Me}, donde DMe es la desviaci�n media respecto de la mediana y Me es la mediana de
una distribuci�n de datos estad�sticos dada.

Medidas de forma

La campana de Gauss, curva que sirve de modelo para el estudio de la forma de una
distribuci�n.
Las medidas de forma caracterizan la forma de la gr�fica de una distribuci�n de
datos estad�sticos. La mayor�a de estos par�metros tiene un valor que suele
compararse con la campana de Gauss, esto es, la gr�fica de la distribuci�n normal,
una de las que con m�s frecuencia se ajusta a fen�menos reales.

Medidas de asimetr�a
Art�culo principal: Asimetr�a estad�stica
Se dice que una distribuci�n de datos estad�sticos es sim�trica cuando la l�nea
vertical que pasa por su media, divide a su representaci�n gr�fica en dos partes
sim�tricas. Ello equivale a decir que los valores equidistantes de la media, a uno
u otro lado, presentan la misma frecuencia.

En las distribuciones sim�tricas los par�metros media, mediana y moda coinciden,


mientras que si una distribuci�n presenta cierta asimetr�a, de un tipo o de otro,
los par�metros se sit�an como muestra el siguiente gr�fico:
Posiciones relativas de par�metros centrales.svg

Ello puede demostrarse f�cilmente si se tiene en cuenta la atracci�n que la media


aritm�tica siente por los valores extremos, que ya se ha comentado m�s arriba y las
definiciones de mediana (justo en el centro de la distribuci�n, tomando el eje de
abscisas como referencia) y moda (valor que presenta una ordenada m�s alta).

Por consiguiente, la posici�n relativa de los par�metros de centralizaci�n pueden


servir como una primera medida de la simetr�a de una distribuci�n.

Otras medidas m�s precisas son el coeficiente de asimetr�a de Fisher, el


coeficiente de asimetr�a de Bowley y el coeficiente de asimetr�a de Pearson.

Medidas de apuntamiento o curtosis

Tres distribuciones con distintos grados de apuntamiento.


Art�culo principal: Curtosis
Con estos par�metros se pretende medir c�mo se reparten las frecuencias relativas
de los datos entre el centro y los extremos, tomando como comparaci�n la campana de
Gauss.

El par�metro usado con m�s frecuencia para esta medida es el coeficiente de


curtosis de Fisher, definido como:

{\displaystyle \gamma _{2}={\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{4}}{n\sigma


^{4}}}-3} \gamma_2 = \frac{\sum_{i=1}^n (x_i-\bar{x})^4}{n\sigma^4}-3,
aunque hay otros como el coeficiente de curtosis de Kelley o el coeficiente de
curtosis percent�lico.

La comparaci�n con la distribuci�n normal permite hablar de distribuciones


platic�rticas o m�s aplastadas que la normal; distribuciones mesoc�rticas, con
igual apuntamiento que la normal; y distribuciones leptoc�rticas, esto es, m�s
apuntadas que la normal.30?

Por �ltimo, existen otras medidas para decidir sobre la forma de una distribuci�n
con ajuste a modelos menos usuales como los que se muestran en las siguientes
gr�ficas:

Forma distribucion.svg

Otros par�metros
Se presentan en este apartado otros par�metros que tienen aplicaci�n en situaciones
muy concretas, por lo que no se incluyen entre los grupos anteriores, aunque tienen
cabida en este art�culo por su frecuente uso en medios de comunicaci�n y su
facultad de resumir grandes cantidades de datos, como ocurre con las medidas
tratadas hasta ahora.

Proporci�n
Art�culo principal: Proporci�n
La proporci�n de un dato estad�stico es el n�mero de veces que se presenta ese dato
respecto al total de datos. Se conoce tambi�n como frecuencia relativa y es uno de
los par�metros de c�lculo m�s sencillo. Tiene la ventaja de que puede calcularse
para variables cualitativas.

Por ejemplo, si se estudia el color de ojos de un grupo de 20 personas, donde 7 de


ellas los tienen azules, la proporci�n de individuos con ojos azules es del 35% (=
7/20).
El dato con mayor proporci�n se conoce como moda (v�ase, m�s arriba).

En inferencia estad�stica existen intervalos de confianza para la estimaci�n de


este par�metro.

N�mero �ndice
Art�culo principal: N�mero �ndice
Un n�mero �ndice es una medida estad�stica que permite estudiar las fluctuaciones o
variaciones de una magnitud o de m�s de una en relaci�n al tiempo o al espacio. Los
�ndices m�s habituales son los que realizan las comparaciones en el tiempo. Algunos
ejemplos de uso cotidiano de este par�metro son el �ndice de precios o el IPC31?

Tasa
Art�culo principal: Tasa (�ndice)

Coeficiente de Gini en el mundo (2007-2008)


La tasa es un coeficiente que expresa la relaci�n entre la cantidad y la frecuencia
de un fen�meno o un grupo de fen�menos. Se utiliza para indicar la presencia de una
situaci�n que no puede ser medida en forma directa.31? Esta raz�n se utiliza en
�mbitos variados, como la demograf�a o la econom�a, donde se hace referencia a la
tasa de inter�s.

Algunos de los m�s usados son: tasa de natalidad, tasa de mortalidad, tasa de
crecimiento demogr�fico, tasa de fertilidad o tasa de desempleo.

Coeficiente de Gini
Art�culo principal: Coeficiente de Gini
El �ndice de Gini o coeficiente de Gini es un par�metro de dispersi�n usado para
medir desigualdades entre los datos de una variable o la mayor o menor
concentraci�n de los mismos.

Este coeficiente mide de qu� forma est� distribuida la suma total de los valores de
la variable. Se suele usar para describir salarios. Los casos extremos de
concentraci�n ser�an aquel en los que una sola persona acapara el total del dinero
disponible para salarios y aquel en el que este total est� igualmente repartido
entre todos los asalariados.32?

Momentos
Art�culos principales: Momento est�ndar y Momento centrado.
Los momentos son una forma de generalizar toda la teor�a relativa a los par�metros
estad�sticos y guardan relaci�n con una buena parte de ellos. Dada una distribuci�n
de datos estad�sticos x1, x2, ..., xn, se define el momento central o momento
centrado de orden k como

{\displaystyle \mu _{k}={\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{k}}{n}}} \mu_k =


\frac{\sum_{i=1}^n (x_i - \bar{x})^k}{n}

Para variables continuas la definici�n cambia sumas discretas por integrales (suma
continua), aunque la definici�n es, esencialmente, la misma.33? De esta definici�n
y las propiedades de los par�metros implicados que se han visto m�s arriba, se
deduce inmediatamente que:

{\displaystyle \mu _{0}=1;\;\mu _{1}=0;\;\mu _{2}=\sigma ^{2};\;} \mu_0 = 1; \;


\mu_1 = 0; \; \mu_2 = \sigma^2; \;

y que

{\displaystyle \gamma _{1}={\frac {\mu _{3}}{\mu _{2}^{3/2}}};\;\;\gamma


_{2}={\frac {\mu _{4}}{\mu _{2}^{2}}}} \gamma_1 = \frac{\mu_3}{\mu_2^{3/2}}; \; \;
\gamma_2 = \frac{\mu_4}{\mu_2^2}34?

Se llama momento no centrado de orden k a la siguiente expresi�n:

{\displaystyle m_{k}={\frac {\sum _{i=1}^{n}(x_{i})^{k}}{n}}} m_k =


\frac{\sum_{i=1}^n (x_i)^k}{n}

De la definici�n se deduce que:

{\displaystyle m_{0}=1;\;m_{1}={\bar {x}};\;m_{2}-m_{1}^{2}=\sigma ^{2};} m_0 =


1; \; m_1 = \bar{x}; \; m_2 - m_1^2 = \sigma^2;
Usando el binomio de Newton, puede obtenerse la siguiente relaci�n entre los
momentos centrados y no centrados:

{\displaystyle \mu _{k}=\sum _{i=1}^{n}(-1)^{k}{k \choose i}m_{k-i}m_{1}^{i}} \mu_k


= \sum_{i=1}^n (-1)^k {k\choose i} m_{k-i} m_1 ^i
Los momentos de una distribuci�n estad�stica la caracterizan un�vocamente.35?

Par�metros bidimensionales
Art�culo principal: Estad�stica bidimensional
En estad�stica se estudian en ocasiones varias caracter�sticas de una poblaci�n
para compararlas, estudiar su dependencia o correlaci�n o realizar cualquier otro
estudio conjunto. El caso m�s com�n de dos variables se conoce como estad�stica
bidimensional.36?

Un ejemplo t�pico es el de un estudio que recoja la estatura (denot�mosla por X) y


el peso (sea Y) de los n individuos de una determinada poblaci�n. En tal caso,
fruto de la recogida de datos, se obtendr�a una serie de parejas de datos (xi, yi),
con i = 1, ..., n, cada una de las cuales estar�a compuesta por la estatura y el
peso del individuo i, respectivamente.

En los estudios bidimensionales, cada una de las dos variables que entran en juego,
estudiadas individualmente, pueden resumirse mediante los par�metros que se han
visto hasta ahora. As�, tendr�a sentido hablar de la media de las estaturas
( {\displaystyle {\bar {X}}} \bar{X}) o la desviaci�n t�pica de los pesos (sY).
Incluso para un determinado valor de la primera variable, xk, cabe hacer estudios
condicionados. Por ejemplo, la mediana condicionada a la estatura xk ser�a la
mediana de los pesos de todos los individuos que tienen esa estatura. Se denota
Me/x=xk.

Sin embargo existen otros par�metros que resumen caracter�sticas de ambas


distribuciones en su conjunto. Los m�s destacados son el centro de gravedad, la
covarianza y el coeficiente de correlaci�n lineal.

Centro de gravedad
Dadas dos variables estad�sticas X e Y, se define el centro de gravedad como la
pareja ( {\displaystyle {\bar {X}}} \bar{X}, {\displaystyle {\bar {Y}}} \bar{Y}),
donde {\displaystyle {\bar {X}}} \bar{X} y {\displaystyle {\bar {Y}}} \bar{Y} son,
respectivamente, las medias aritm�ticas de las variables X e Y.

El nombre de este par�metro proviene de que en una representaci�n de las parejas


del estudio en una nube de puntos, en la que cada punto tuviese un peso
proporcional a su frecuencia absoluta, las coordenadas ( {\displaystyle {\bar {X}}}
\bar{X}, {\displaystyle {\bar {Y}}} \bar{Y}) corresponder�an, precisamente, al
centro de gravedad como concepto f�sico.37?

Covarianza
Art�culo principal: Covarianza
La covarianza o varianza conjunta de una distribuci�n bidimensional se define como:
{\displaystyle \sigma _{xy}={\frac {1}{n}}\sum _{i=1}^{n}{(x_{i}-{\overline {x}})
(y_{i}-{\overline {y}})}} \sigma_{xy} = \frac 1n \sum_{i=1}^n { (x_i -
\overline{x})(y_i - \overline{y})}
La interpretaci�n de este par�metro tiene que ver con la eventual correlaci�n
lineal de las dos variables. Una covarianza positiva implica una correlaci�n
directa y una negativa, una correlaci�n inversa.38? Por otra parte, es un par�metro
imprescindible para el c�lculo del coeficiente de correlaci�n lineal o los
coeficientes de regresi�n, como se ver� m�s abajo.

En su contra tiene que se ve excesivamente influenciada, al igual que ocurr�a con


la media aritm�tica, por los valores extremos de las distribuciones y los cambios
de escala.

Coeficiente de correlaci�n lineal


Art�culo principal: Coeficiente de correlaci�n

Variaci�n del coeficiente de correlaci�n lineal en funci�n de la nube de puntos


asociada.
Se trata de un coeficiente que permite determinar la bondad del ajuste de la nube
de puntos por una recta.

Se define como: {\displaystyle r={\frac {\sigma _{xy}}{\sigma _{x}\sigma _{y}}}} r


= \frac{\sigma_{xy}}{\sigma_x \sigma_y}, donde sxy es la covarianza y sx y sy, las
desviaciones t�picas respectivas de las distribuciones implicadas.

El coeficiente de correlaci�n lineal toma valores entre -1 y 1. En esa escala, mide


la correlaci�n del siguiente modo:

La correlaci�n lineal es m�s fuerte cuanto m�s cerca est� de -1 o 1.


La correlaci�n lineal es m�s d�bil cuanto m�s pr�ximo a cero sea r.39?
El diagrama de la derecha ilustra c�mo puede variar r en funci�n de la nube de
puntos asociada:

Otros par�metros bidimensionales son, el coeficiente de correlaci�n de Spearman,


los coeficientes de correlaci�n no param�tricos, el coeficiente de determinaci�n o
los coeficientes de regresi�n lineal.

Al igual que con distribuciones unidimensionales, existe una forma equivalente de


desarrollar la teor�a relativa a los par�metros estad�sticos bidimensionales usando
los momentos.

Los par�metros en la inferencia estad�stica


Art�culos principales: Estimaci�n estad�stica y Estad�stico muestral.
En ocasiones los par�metros de una determinada poblaci�n no pueden conocerse con
certeza. Generalmente esto ocurre porque es imposible el estudio de la poblaci�n
completa por cuestiones como que el proceso sea destructivo (p. e., vida media de
una bombilla) o muy caro (p.e., audiencias de televisi�n). En tales situaciones se
recurre a las t�cnicas de la inferencia estad�stica para realizar estimaciones de
tales par�metros a partir de los valores obtenidos de una muestra de la
poblaci�n.40?

Se distingue entonces entre par�metros y estad�sticos. Mientras que un par�metro es


una funci�n de los datos de la poblaci�n, el estad�stico lo es de los datos de una
muestra. De este modo pueden definirse la media muestral, la varianza muestral o
cualquier otro p�rametro de los vistos m�s arriba.

Por ejemplo, dada una muestra estad�stica de tama�o n, {\displaystyle (x_{1},\


x_{2},\ ...,\ x_{n})} (x_1,\ x_2,\ ...,\ x_n), de una variable aleatoria X con
distribuci�n de probabilidad F(x,?), donde ? es un conjunto de par�metros de la
distribuci�n, se definir�a la media muestral n-�sima como:

{\displaystyle {\bar {X}}_{n}=T(x_{1},x_{2},...,x_{n})={\frac {1}{n}}\sum


_{i=1}^{n}x_{i}={\frac {x_{1}+x_{2}+...+x_{n}}{n}}} \bar{X}_n = T(x_1,x_2,...,x_n)
= \frac{1}{n} \sum_{i=1}^n x_i = \frac{x_1+x_2+...+x_n}{n}

En el caso concreto de la varianza muestral, suele tomarse, por sus mejores


propiedades como estimador, la siguiente:

{\displaystyle S_{n}^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}(X_{i}-{\bar {X_{n}}})^{2}}


S_n^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i-\bar{X_n})^2

donde se ha tomado como denominador n-1, en lugar de n. A este par�metro tambi�n se


le llama cuasivarianza.41?

También podría gustarte