Está en la página 1de 19

Un valor estadstico es cada uno de los distintos resultados que se pueden obtener en un

estudio estadstico.
Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.

Parmetro estadstico
En estadstica, un parmetro es un nmero que resume la gran cantidad de datos que
pueden derivarse del estudio de una variable estadstica.1 El clculo de este nmero
est bien definido, usualmente mediante una frmula aritmticaobtenida a partir de datos de
la poblacin.2 3
Los parmetros estadsticos son una consecuencia inevitable del propsito esencial de la
estadstica: crear un modelo de la realidad.4
El estudio de una gran cantidad de datos individuales de una poblacin puede ser farragoso
e inoperativo, por lo que se hace necesario realizar un resumen que permita tener una idea
global de la poblacin, compararla con otras, comprobar su ajuste a un modelo ideal,
realizar estimaciones sobre datos desconocidos de la misma y, en definitiva, tomar
decisiones. A estas tareas contribuyen de modo esencial los parmetros estadsticos.
Por ejemplo, suele ofrecerse como resumen de la juventud de una poblacin la media
aritmtica de las edades de sus miembros, esto es, la suma de todas ellas, dividida por el
total de individuos que componen tal poblacin.
Enfoque descriptivo

Grficas de distribuciones normales para distintos valores de sus dos parmetros.


Un parmetro estadstico es una medida poblacional. Este enfoque es el tradicional de
la estadstica descriptiva.5 6 7 En este sentido, su acepcin se acerca a la de medida o valor
que se compara con otros, tomando una unidad de una determinada magnitud como
referencia.

Por su parte, la faccin ms formal de la estadstica, la estadstica matemtica y tambin


la inferencia estadstica utilizan el concepto de parmetro en su acepcin matemtica ms
pura, esto es, como variable que define una familia de objetos matemticos en
determinados modelos. As se habla, por ejemplo, de una distribucin normal de
parmetros y como de una determinada familia de distribuciones con una distribucin
de probabilidad de expresin conocida, en la que tales parmetros definen aspectos
concretos como la esperanza, la varianza, la curtosis, etc. Otro ejemplo comn en este
sentido es el de la distribucin de Poisson, determinada por un parmetro, ; o
la distribucin binomial, determinada por dos parmetros, n y p. Desde el punto de vista de
la estadstica matemtica, el hecho de que estas distribuciones describan situaciones reales
y los citados parmetros signifiquen un resumen de determinado conjunto de datos es
indiferente.
Propiedades deseables en un parmetro
Segn Yule8 un parmetro estadstico es deseable que tenga las siguientes propiedades:

Se define de manera objetiva, es decir, es posible calcularlo sin ambigedades,


generalmente mediante una frmula matemtica. Por ejemplo, la media aritmtica se define
como la suma de todos los datos, dividida por el nmero de datos. No hay ambigedad: si
se realiza ese clculo, se obtiene la media; si se realiza otro clculo, se obtiene otra cosa.
Sin embargo, la definicin de moda como el "valor ms frecuente", puede dar lugar a
confusin cuando la mayor frecuencia la presentan varios valores distintos.

No desperdicia, a priori, ninguna de las observaciones. Con carcter general, un


parmetro ser ms representativo de una determinada poblacin, cuntos ms valores de la
variable estn implicados en su clculo. Por ejemplo, para medir la dispersin puede
calcularse el recorrido, que slo usa dos valores de la variable objeto de estudio, los
extremos; o la desviacin tpica, en cuyo clculo intervienen todos los datos del eventual
estudio.

Es interpretable, significa algo. La mediana, por ejemplo, deja por debajo de su


valor a la mitad de los datos, est justo en medio de todos ellos cuando estn ordenados.
Esta es una interpretacin clara de su significado.

Es sencillo de calcular y se presta con facilidad a manipulaciones algebraicas. Se


ver ms abajo que una medida de la dispersin es la desviacin media. Sin embargo, al
estar definida mediante un valor absoluto, funcin definida a trozos y no derivable, no es
til para gran parte de los clculos en los que estuviera implicada, aunque su interpretacin
sea muy clara.

Es poco sensible a las fluctuaciones muestrales. Si pequeas variaciones en una


muestra de datos estadsticos influyen en gran medida en un determinado parmetro, es
porque tal parmetro no representa con fiabilidad a la poblacin. As pues es deseable que
el valor de un parmetro con esta propiedad se mantenga estable ante las pequeas

oscilaciones que con frecuencia pueden presentar las distintas muestras estadsticas. Esta
propiedad es ms interesante en el caso de la estimacin de parmetros. Por otra parte, los
parmetros que no varan con los cambios de origen y escala o cuya variacin est
controlada algebraicamente, son apropiados en determinadas circunstancias como
la tipificacin.
Principales parmetros
Habitualmente se agrupan los parmetros en las siguientes categoras:
Medidas de posicin.9
Se trata de valores de la variable estadstica que se caracterizan por la posicin que ocupan
dentro del rango de valores posibles de esta. Entre ellos se distinguen:

Las medidas de tendencia central: medias, moda y mediana.


Las medidas de posicin no central: cuantiles (cuartiles, deciles y percentiles).
Medidas de dispersin.
Resumen la heterogeneidad de los datos, lo separados que estos estn entre s. Hay dos
tipos, bsicamente:

Medidas de dispersin absolutas, que vienen dadas en las mismas unidades en las
que se mide la variable: recorridos, desviaciones medias, varianza, ydesviacin tpica.

Medidas de dispersin relativa, que informan de la dispersin en trminos relativos,


como un porcentaje. Se incluyen entre estas el coeficiente de variacin, el coeficiente de
apertura, los recorridos relativos y el ndice de desviacin respecto de la mediana.
Medidas de forma.11
Su valor informa sobre el aspecto que tiene la grfica de la distribucin. Entre ellas estn
los coeficientes de asimetra y los de curtosis.
Otros parmetros.
Adems, y con propsitos ms especficos, existen otros parmetros de uso en situaciones
muy concretas, como son las proporciones, los nmeros ndice, las tasas y el coeficiente de
Gini.

Medidas de tendencia central o centralizacin


Son valores que suelen situarse hacia el centro de la distribucin de datos. Los ms
destacados son las medias o promedios (incluyendo la media aritmtica, lamedia
geomtrica y la media armnica), la mediana y la moda.
Media aritmtica o promedio

La estatura media como resumen de una poblacin homognea (abajo) o heterognea


(arriba).
La media muestral o media aritmtica es, probablemente, uno de los parmetros
estadsticos ms extendidos.12 Sus propiedades son:13

Su clculo es muy sencillo y en l intervienen todos los datos.


Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos,
ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio
valor:

Minimiza las desviaciones cuadrticas de los datos respecto de cualquier valor prefijado,
esto es, el valor de es mnimo cuando . Este resultado se conoce como Teorema de Knig.
Esta propiedad permite interpretar uno de los parmetros de dispersin ms importantes:
la varianza.

Se ve afectada por transformaciones afines (cambios de origen y escala), esto es, si


entonces , donde es la media aritmtica de los , para i = 1, ..., n y a y bnmeros reales.

Este parmetro, aun teniendo mltiples propiedades que aconsejan su uso en situaciones
muy diversas, tiene tambin algunos inconvenientes, como son:

Para datos agrupados en intervalos (variables continuas), su valor oscila en funcin


de la cantidad y amplitud de los intervalos que se consideren.

Es una medida a cuyo significado afecta sobremanera la dispersin, de modo que


cuanto menos homogneos son los datos, menos informacin proporciona. Dicho de otro
modo, poblaciones muy distintas en su composicin pueden tener la misma media. 14 Por
ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95, pongamos
por caso, tendra una estatura media de 1,95, evidentemente, valor que representa fielmente
a esta homognea poblacin. Sin embargo, un equipo de estaturas ms heterogneas, 2,20,
2,15, 1,95, 1,75 y 1,70, por ejemplo, tendra tambin, como puede comprobarse, una
estatura media de 1,95, valor que no representa a casi ninguno de sus componentes.

Es muy sensible a los valores extremos de la variable. Por ejemplo, en el clculo del
salario medio de una empresa, el salario de un alto directivo que gane 1.000.000 de tiene
tanto peso como el de mil empleados "normales" que ganen 1.000 , siendo la media de
aproximadamente 2.000 .
Moda[editar]
La moda es el dato ms repetido, el valor de la variable con mayor frecuencia absoluta.15 En
cierto sentido se corresponde su definicin matemtica con la locucin "estar de moda",
esto es, ser lo que ms se lleva.
Su clculo es extremadamente sencillo, pues slo necesita de un recuento. En variables
continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto,
si es necesario obtener un valor concreto de la variable, se recurre a la interpolacin.
Sus principales propiedades son:

Clculo sencillo.

Interpretacin muy clara.

Al depender slo de las frecuencias, puede calcularse para variables cualitativas. Es


por ello el parmetro ms utilizado cuando al resumir una poblacin no es posible realizar
otros clculos, por ejemplo, cuando se enumeran en medios periodsticos las caractersticas
ms frecuentes de determinado sector social. Esto se conoce informalmente como "retrato
robot".16
Inconvenientes:

Su valor es independiente de la mayor parte de los datos, lo que la hace muy


sensible a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su
valor depende excesivamente del nmero de intervalos y de su amplitud.

Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos
fuera de la moda, no afectan en modo alguno a su valor.

No siempre se sita hacia el centro de la distribucin.


Puede haber ms de una moda en el caso en que dos o ms valores de la variable
presenten la misma frecuencia (distribuciones bimodales o multimodales).
Mediana[editar]
Artculo principal: Mediana (estadstica)
La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos, una
vez que estos estn ordenados de menor a mayor.17 Por ejemplo, la mediana del nmero de
hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1,
2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el
que ocupa la posicin central es 2:
En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la
variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos
valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:
Se toma como mediana

En este ejemplo basado en una tabla real de percentiles usada enpediatra, puede
comprobarse que una nia de 24 meses con un peso de 13 kg estara en el percentil 75, esto
es, su peso es superior al 75% de las nias de su edad. La mediana correspondera,
aproximadamente, a 12 kg (interseccin de la lnea curva ms oscura con la lnea horizontal
correspondiente al valor 12 en el eje vertical, para esa misma edad).
Existen mtodos de clculo ms rpidos para datos ms numerosos (vase el artculo
principaldedicado a este parmetro). Del mismo modo, para valores agrupados en
intervalos, se halla el "intervalo mediano" y, dentro de este, se obtiene un valor concreto
por interpolacin.
Propiedades de la mediana como parmetro estadstico:18

Es menos sensible que la media a oscilaciones de los valores de la variable. Un error


de transcripcin en la serie del ejemplo anterior en, pongamos por caso, el ltimo nmero,
deja a la mediana inalterada.

Como se ha comentado, puede calcularse para datos agrupados en intervalos,


incluso cuando alguno de ellos no est acotado.

No se ve afectada por la dispersin. De hecho, es ms representativa que la media


aritmtica cuando la poblacin es bastante heterognea. Suele darse esta circunstancia
cuando se resume la informacin sobre los salarios de un pas o una empresa. Hay unos
pocos salarios muy altos que elevan la media aritmtica haciendo que pierda
representatividad respecto al grueso de la poblacin. Sin embargo, alguien con el salario
"mediano" sabra que hay tanta gente que gana ms dinero que l, como que gana menos.
Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su
valor vara en funcin de la amplitud de estos. Por otra parte, no se presta a clculos
algebraicos tan bien como la media aritmtica.
Medidas de posicin no central[editar]
Directamente relacionados con la anterior, se encuentran las medidas de posicin no
central, tambin conocidas como cuantiles. Se trata de valores de la variable estadstica
que dejan por debajo de s determinada cantidad de los datos. Son, en definitiva, una
generalizacin del concepto de la mediana. Mientras que sta deja por debajo de s al 50%
de la distribucin, los cuantiles pueden hacerlo con cualquier otro porcentaje. 19 Se
denominan medidas de posicin porque informan, precisamente, de la posicin que ocupa
un valor dentro de la distribucin de datos.
Tradicionalmente se distingue entre cuartiles, si se divide la cantidad de datos en cuatro
partes antes de proceder al clculo de los valores que ocupan cada posicin; deciles, si se
divide los datos en diez partes; o percentiles, que dividen la poblacin en cien partes.

Ejemplos: si se dice que una persona, tras un test de inteligencia, ocupa el percentil 75, ello
supone que el 75% de la poblacin tiene un cociente intelectual con un valor inferior al de
esa persona. Este criterio se usa por las asociaciones de superdotados, que limitan su
conjunto de miembros a aquellas que alcanzan determinado percentil (igual o superior a 98
en la mayora de los casos).
El ejemplo que se muestra en la imagen de la derecha es el correspondiente al clculo
inverso, esto es, cuando se desea conocer el percentil correspondiente a un valor de la
variable, en lugar del valor que corresponde a un determinado percentil.
Otras medidas de posicin central son la media geomtrica y la media armnica que,
aunque tienen determinadas propiedades algebraicas que podran hacerlas tiles en
determinadas circunstancias, su interpretacin no es tan intuitiva como la de los parmetros
anteriores.20
Comentarios sobre las medidas de posicin[editar]
Este tipo de parmetros no tienen por qu coincidir con un valor exacto de la variable y, por
tanto, tampoco pueden usarse con carcter general para hacer pronsticos. Por ejemplo, si
se dice que la media aritmtica de los hijos de las familias de un pas es de 1,2, no es
posible encontrar familias con ese valor en concreto. Un segundo ejemplo: a ninguna
fbrica de zapatos se le ocurrira fabricar los suyos con tallas nicamente correspondientes
al valor promedio, ni siquiera tienen por qu ser estas tallas las ms fabricadas, pues en tal
caso sera ms apropiado atender a la moda de la distribucin de tallas de los eventuales
clientes.
La eleccin de uno u otro parmetro depender de cada caso particular, de los valores de la
variable y de los propsitos del estudio. Su uso indiscriminado puede ser deliberadamente
tendencioso o involuntariamente sesgado, convirtindose, de hecho, en un abuso.21 Puede
pensarse, por ejemplo, en la siguiente situacin: un empresario publica que el salario medio
en su empresa es de 1.600 . A este dato, que en determinadas circunstancias podra
considerarse muy bueno, podra llegarse si la empresa tuviese cuatro empleados con
salarios de 1.000 mensuales y el salario del jefe, incluido en la media, fuese de 4.000 al
mes:22
Con carcter general y a modo de resumen podra decirse que la media aritmtica es un
parmetro representativo cuando la poblacin sigue una distribucin normal o es bastante
homognea; en otras situaciones de fuerte dispersin, habra que decantarse por la mediana.
La moda es el ltimo recurso (y el nico) cuando de describir variables cualitativas se trata.

Medidas de dispersin[editar]

Diagrama de caja que muestra la dispersin grficamente, usando los cuartiles como
referencia. Entre Q1 y Q3 (rango intercuartlico) se encuentran el 50% de las observaciones.
Las medidas de posicin resumen la distribucin de datos, pero resultan insuficientes y
simplifican excesivamente la informacin. Estas medidas adquieren verdadero significado
cuando van acompaadas de otras que informen sobre la heterogeneidad de los datos.
Los parmetros de dispersin miden eso precisamente, generalmente, calculando en qu
medida los datos se agrupan en torno a un valor central. Indican, de un modo bien definido,
lo homogneos que estos datos son. Hay medidas de dispersin absolutas, entre las cuales
se encuentran la varianza, la desviacin tpica o la desviacin media, aunque tambin
existen otras menos utilizadas como los recorridos o la meda; y medidas de dispersin
relativas, como el coeficiente de variacin, el coeficiente de apertura o los recorridos
relativos. En muchas ocasiones las medidas de dispersin se ofrecen acompaando a un
parmetro de posicin central para indicar en qu medida los datos se agrupan en torno de
l.23
Medidas de dispersin absolutas[editar]
Recorridos[editar]
El recorrido o rango de una variable estadstica es la diferencia entre el mayor y el menor
valor que toma la misma. Es la medida de dispersin ms sencilla de calcular, aunque es
algo burda porque slo toma en consideracin un par de observaciones. Basta con que uno
de estos dos datos vare para que el parmetro tambin lo haga, aunque el resto de la
distribucin siga siendo, esencialmente, la misma.
Existen otros parmetros dentro de esta categora, como los recorridos o rangos
intercuantlicos, que tienen en cuenta ms datos y, por tanto, permiten afinar en la
dispersin. Entre los ms usados est el rango intercuartlico, que se define como la
diferencia entre el cuartil tercero y el cuartil primero. En ese rango estn, por la propia
definicin de los cuartiles, el 50% de las observaciones. Este tipo de medidas tambin se
usa para determinar valores atpicos. En el diagrama de cajaque aparece a la derecha se
marcan como valores atpicos todos aquellos que caen fuera del intervalo [Li, Ls] = [Q1 -

1,5Rs, Q3 + 1,5Rs], donde Q1 y Q3 son los cuartiles 1 y 3, respectivamente, y Rs representa


la mitad del recorrido o rango intercuartlico, tambin conocido como recorrido
semiintercuartlico.24
Desviaciones medias[editar]
Dada una variable estadstica X y un parmetro de tendencia central, c, se llama desviacin
de un valor de la variable, xi, respecto de c, al nmero |xi - c|. Este nmero mide lo lejos que
est cada dato del valor central c, por lo que una media de esas medidas podra resumir el
conjunto de desviaciones de todos los datos.
As pues, se denomina desviacin media de la variable X respecto de c a la media
aritmtica de las desviaciones de los valores de la variable respecto de c, esto es, si
entonces
De este modo se definen la desviacin media respecto de la media (c = ) o la desviacin
media respecto de la mediana (c = ), cuya interpretacin es sencilla en virtud del
significado de la media aritmtica.23
Sin embargo, el uso de valores absolutos impide determinados clculos algebraicos que
obligan a desechar estos parmetros, a pesar de su clara interpretacin, en favor de los
siguientes.
Varianza y desviacin tpica[editar]
Artculo principal: Varianza

Conjunto de datos estadsticos demedia aritmtica 50 (lnea azul) ydesviacin tpica 20


(lneas rojas).
Como se vio ms arriba, la suma de todas las desviaciones respecto al parmetro ms
utilizado, la media aritmtica, es cero. Por tanto si se desea una medida de la dispersin sin
los inconvenientes para el clculo que tienen las desviaciones medias, una solucin es

elevar al cuadrado tales desviaciones antes de calcular el promedio. As, se define


la varianzacomo:25
o sea, la media de los cuadrados de las desviaciones respecto de la media.
La desviacin tpica, , se define como la raz cuadrada de la varianza, esto es,
Para variables agrupadas en intervalos, se usan las marcas de clase (un valor apropiado del
interior de cada intervalo) en estos clculos.
Propiedades:25

Ambos parmetros no se alteran con los cambios de origen.

Si todos los valores de la variable se multiplican por una constante, b, la varianza


queda multiplicada por b2.

En el intervalo se encuentran,
(vase Desigualdad de Tchebyschev).26

al

menos,

el de

las

observaciones

Esta ltima propiedad muestra la potencia del uso conjunto de la media y la desviacin
tpica como parmetros estadsticos, ya que para valores de k iguales a 2 y 3,
respectivamente, se obtiene que:

En el intervalo estn, al menos, el 75% de los datos.

En el intervalo estn, al menos, el 89% de los datos.


Se cumple la siguiente relacin entre los parmetros de dispersin:
donde , y son, respectivamente, la desviacin media respecto de la mediana, la desviacin
media respecto de la media y la desviacin tpica (vaseDesviacin media).
La media. Es una medida de dispersin que tiene, por su propia definicin, las mismas
propiedades que la mediana. Por ejemplo, no se ve afectada por valores extremos o
atpicos.27
Medidas de dispersin relativa[editar]
Son parmetros que miden la dispersin en trminos relativos, un porcentaje o
una proporcin, por ejemplo, de modo que permiten una sencilla comparacin entre la
dispersin de distintas distribuciones.28

Coeficiente de variacin de Pearson[editar]


Se define como , donde es la desviacin tpica y es la media aritmtica.
Se interpreta como el nmero de veces que la media est contenida en la desviacin tpica.
Suele darse su valor en tanto por ciento, multiplicando el resultado anterior por 100. De
este modo se obtiene un porcentaje de la variabilidad.
Su principal inconveniente es que en el caso de distribuciones cuya media se acerca a cero,
su valor tiende a infinito e incluso resulta imposible de calcular cuando la media es cero.
Por ello no puede usarse para variables tipificadas.
Coeficiente de apertura[editar]
Se define como el cociente entre los valores extremos de la distribucin de datos, esto es,
dada una distribucin de datos estadsticos x1, x2, ..., xn, su coeficiente de apertura, CA es
Se usa para comparar salarios de empresas.
Recorridos relativos[editar]
Dado Re, el recorrido de una distribucin de datos estadsticos, el recorrido relativo, RR es ,
donde es la media aritmtica de la distribucin.
Dada una distribucin de datos estadsticos con cuartiles Q1, Q2 y Q3, el recorrido
intercuartlico relativo, RIQR se define como29
Por otra parte, se define el recorrido semiintercuartlico relativo, RSIR, como
ndice de desviacin respecto a la mediana[editar]
Se define como , donde DMe es la desviacin media respecto de la mediana y Me es la
mediana de una distribucin de datos estadsticos dada.

Medidas de forma[editar]

La campana de Gauss, curva que sirve de modelo para el estudio de la forma de una
distribucin.
Las medidas de forma caracterizan la forma de la grfica de una distribucin de datos
estadsticos. La mayora de estos parmetros tiene un valor que suele compararse con
la campana de Gauss, esto es, la grfica de ladistribucin normal, una de las que con ms
frecuencia se ajusta a fenmenos reales.
Medidas de asimetra[editar]
Se dice que una distribucin de datos estadsticos es simtrica cuando la lnea vertical que
pasa por su media, divide a su representacin grfica en dos partes simtricas. Ello equivale
a decir que los valores equidistantes de la media, a uno u otro lado, presentan la misma
frecuencia.
En las distribuciones simtricas los parmetros media, mediana y moda coinciden, mientras
que si una distribucin presenta cierta asimetra, de un tipo o de otro, los parmetros se
sitan como muestra el siguiente grfico:

Ello puede demostrarse fcilmente si se tiene en cuenta la atraccin que la media aritmtica
siente por los valores extremos, que ya se ha comentado ms arriba y las definiciones de
mediana (justo en el centro de la distribucin, tomando el eje de abscisas como referencia)
y moda (valor que presenta una ordenada ms alta).
Por consiguiente, la posicin relativa de los parmetros de centralizacin pueden servir
como una primera medida de la simetra de una distribucin.
Otras medidas ms precisas son el coeficiente de asimetra de Fisher, el coeficiente de
asimetra de Bowley y el coeficiente de asimetra de Pearson.
Medidas de apuntamiento o curtosis[editar]

Tres distribuciones con distintos grados de apuntamiento.


Con estos parmetros se pretende medir cmo se reparten las frecuencias relativas de los
datos entre el centro y los extremos, tomando como comparacin la campana de Gauss.
El parmetro usado con ms frecuencia para esta medida es el coeficiente de curtosis de
Fisher, definido como:
,
aunque hay otros como el coeficiente de curtosis de Kelley o el coeficiente de curtosis
percentlico.
La comparacin con la distribucin normal permite hablar de distribuciones platicrticas o
ms aplastadas que la normal; distribuciones mesocrticas, con igual apuntamiento que la
normal; y distribuciones leptocrticas, esto es, ms apuntadas que la normal.30
Por ltimo, existen otras medidas para decidir sobre la forma de una distribucin con ajuste
a modelos menos usuales como los que se muestran en las siguientes grficas:

Otros parmetros[editar]
Se presentan en este apartado otros parmetros que tienen aplicacin en situaciones muy
concretas, por lo que no se incluyen entre los grupos anteriores, aunque tienen cabida en
este artculo por su frecuente uso en medios de comunicacin y su facultad de resumir
grandes cantidades de datos, como ocurre con las medidas tratadas hasta ahora.
Proporcin[editar]
La proporcin de un dato estadstico es el nmero de veces que se presenta ese dato
respecto al total de datos. Se conoce tambin como frecuencia relativa y es uno de los
parmetros de clculo ms sencillo. Tiene la ventaja de que puede calcularse para variables
cualitativas.
Por ejemplo, si se estudia el color de ojos de un grupo de 20 personas, donde 7 de ellas los
tienen azules, la proporcin de individuos con ojos azules es del 35% (= 7/20).
El dato con mayor proporcin se conoce como moda (vase, ms arriba).
En inferencia estadstica existen intervalos de confianza para la estimacin de este
parmetro.
Nmero ndice[editar]
Un nmero ndice es una medida estadstica que permite estudiar las fluctuaciones o
variaciones de una magnitud o de ms de una en relacin al tiempo o al espacio. Los
ndices ms habituales son los que realizan las comparaciones en el tiempo. Algunos
ejemplos de uso cotidiano de este parmetro son el ndice de precios o el IPC31
Tasa[editar]
Artculo principal: Tasa (ndice)

Coeficiente de Gini en el mundo (2007-2008)


La tasa es un coeficiente que expresa la relacin entre la cantidad y la frecuencia de un
fenmeno o un grupo de fenmenos. Se utiliza para indicar la presencia de una situacin
que no puede ser medida en forma directa.31 Esta razn se utiliza en mbitos variados, como
la demografa o la economa, donde se hace referencia a la tasa de inters.
Algunos de los ms usados son: tasa de natalidad, tasa de mortalidad, tasa de crecimiento
demogrfico, tasa de fertilidad o tasa de desempleo.
Coeficiente de Gini[editar]
El ndice de Gini o coeficiente de Gini es un parmetro de dispersin usado para medir
desigualdades entre los datos de una variable o la mayor o menor concentracin de los
mismos.
Este coeficiente mide de qu forma est distribuida la suma total de los valores de la
variable. Se suele usar para describir salarios. Los casos extremos deconcentracin seran
aquel en los que una sola persona acapara el total del dinero disponible para salarios y aquel
en el que este total est igualmente repartido entre todos los asalariados.32
Momentos[editar]
Artculos principales: Momento estndar y Momento centrado.
Los momentos son una forma de generalizar toda la teora relativa a los parmetros
estadsticos y guardan relacin con una buena parte de ellos. Dada una distribucin de datos
estadsticos x1, x2, ..., xn, se define el momento central o momento centrado de
orden k como
Para variables continuas la definicin cambia sumas discretas por integrales (suma
continua), aunque la definicin es, esencialmente, la misma. 33 De esta definicin y las
propiedades de los parmetros implicados que se han visto ms arriba, se deduce
inmediatamente que:

y que
34

Se llama momento no centrado de orden k a la siguiente expresin:


De la definicin se deduce que:
Usando el binomio de Newton, puede obtenerse la siguiente relacin entre los momentos
centrados y no centrados:
Los momentos de una distribucin estadstica la caracterizan unvocamente.35
Parmetros bidimensionales[editar]
En estadstica se estudian en ocasiones varias caractersticas de una poblacin para
compararlas, estudiar su dependencia o correlacin o realizar cualquier otro estudio
conjunto. El caso ms comn de dos variables se conoce como estadstica bidimensional.36
Un ejemplo tpico es el de un estudio que recoja la estatura (denotmosla por X) y el peso
(sea Y) de los n individuos de una determinada poblacin. En tal caso, fruto de la recogida
de datos, se obtendra una serie de parejas de datos (xi, yi), con i = 1, ..., n, cada una de las
cuales estara compuesta por la estatura y el peso del individuo i, respectivamente.
En los estudios bidimensionales, cada una de las dos variables que entran en juego,
estudiadas individualmente, pueden resumirse mediante los parmetros que se han visto
hasta ahora. As, tendra sentido hablar de la media de las estaturas () o la desviacin tpica
de los pesos (Y). Incluso para un determinado valor de la primera variable, xk, cabe hacer
estudios condicionados. Por ejemplo, la mediana condicionada a la estatura xk sera la
mediana de los pesos de todos los individuos que tienen esa estatura. Se denota Me/x=xk.
Sin embargo existen otros parmetros que resumen caractersticas de ambas distribuciones
en su conjunto. Los ms destacados son el centro de gravedad, lacovarianza y el coeficiente
de correlacin lineal.
Centro de gravedad[editar]
Dadas dos variables estadsticas X e Y, se define el centro de gravedad como la pareja (, ),
donde y son, respectivamente, las medias aritmticas de las variables X e Y.
El nombre de este parmetro proviene de que en una representacin de las parejas del
estudio en una nube de puntos, en la que cada punto tuviese un peso proporcional a su
frecuencia absoluta, las coordenadas (, ) corresponderan, precisamente, al centro de
gravedad como concepto fsico.37

Covarianza[editar]
Artculo principal: Covarianza
La covarianza o varianza conjunta de una distribucin bidimensional se define como:
La interpretacin de este parmetro tiene que ver con la eventual correlacin lineal de las
dos variables. Una covarianza positiva implica una correlacin directa y una negativa, una
correlacin inversa.38 Por otra parte, es un parmetro imprescindible para el clculo del
coeficiente de correlacin lineal o los coeficientes de regresin, como se ver ms abajo.
En su contra tiene que se ve excesivamente influenciada, al igual que ocurra con la media
aritmtica, por los valores extremos de las distribuciones y los cambios de escala.
Coeficiente de correlacin lineal[editar]
Artculo principal: Coeficiente de correlacin

Variacin del coeficiente de correlacin lineal en funcin de la nube de puntos asociada.


Se trata de un coeficiente que permite determinar la bondad del ajuste de la nube de puntos
por una recta.
Se define como: , donde xy es la covarianza y x y y, las desviaciones tpicas respectivas
de las distribuciones implicadas.
El coeficiente de correlacin lineal toma valores entre -1 y 1. En esa escala, mide la
correlacin del siguiente modo:

La correlacin lineal es ms fuerte cuanto ms cerca est de -1 o 1.

La correlacin lineal es ms dbil cuanto ms prximo a cero sea r.39


El diagrama de la derecha ilustra cmo puede variar r en funcin de la nube de puntos
asociada:

Otros parmetros bidimensionales son, el coeficiente de correlacin de Spearman,


los coeficientes de correlacin no paramtricos, el coeficiente de determinacin o
los coeficientes de regresin lineal.
Al igual que con distribuciones unidimensionales, existe una forma equivalente de
desarrollar la teora relativa a los parmetros estadsticos bidimensionales usando
los momentos.
Los parmetros en la inferencia estadstica[editar]
En ocasiones los parmetros de una determinada poblacin no pueden conocerse con
certeza. Generalmente esto ocurre porque es imposible el estudio de la poblacin completa
por cuestiones como que el proceso sea destructivo (p. e., vida media de una bombilla) o
muy caro (p.e., audiencias de televisin). En tales situaciones se recurre a las tcnicas de
la inferencia estadstica para realizar estimaciones de tales parmetros a partir de los
valores obtenidos de una muestra de la poblacin.40
Se distingue entonces entre parmetros y estadsticos. Mientras que un parmetro es una
funcin de los datos de la poblacin, el estadstico lo es de los datos de una muestra. De
este modo pueden definirse la media muestral, la varianza muestral o cualquier otro
prametro de los vistos ms arriba.
Por ejemplo, dada una muestra estadstica de tamao n, , de una variable aleatoria X con
distribucin de probabilidad F(x,), donde es un conjunto de parmetros de la
distribucin, se definira la media muestral n-sima como:
En el caso concreto de la varianza muestral, suele tomarse, por sus mejores propiedades
como estimador, la siguiente:
donde se ha tomado como denominador n-1, en lugar de n. A este parmetro tambin se le
llama cuasivarianza.41

También podría gustarte