Está en la página 1de 11

Medidas de centralizacin:

Media aritmtica
Es un conjunto finito de nmeros es el valor caracterstico de una serie de datos
cuantitativos objeto de estudio que parte del principio de la esperanza matemtica o valor
esperado, se obtiene a partir de la suma de todos sus valores dividida entre el nmero de
sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media
muestral siendo uno de los principales estadsticos muestrales.
Expresada de forma ms intuitiva, podemos decir que la media (aritmtica es la
cantidad total de la variable distribuida a partes i!uales entre cada observaci"n.
#or ejemplo, si en una $abitaci"n $a% tres personas, la media de dinero que tienen en sus
bolsillos sera el resultado de tomar todo el dinero de los tres % dividirlo a partes i!uales
entre cada uno de ellos. Es decir, la media es una forma de resumir la informaci"n de una
distribuci"n (dinero en el bolsillo suponiendo que cada observaci"n (persona tuviera la
misma cantidad de la variable.
&ambin la media aritmtica puede ser denominada como centro de !ravedad de
una distribuci"n, el cual no est necesariamente en la mitad.
'ados los n nmeros la media aritmtica se define simplemente
como(
#or ejemplo, la media aritmtica de ), * % +, es i!ual a(
-e utiliza la letra X con una barra $orizontal sobre el smbolo para representar la media de
una muestra ( , mientras que la letra . (mu se usa para la media aritmtica de una
poblaci"n, es decir, el valor esperado de una variable.
En otras palabras, es la suma de n valores de la variable % lue!o dividido por n(
donde n es el nmero de sumandos, o en el caso de estadstica el nmero de datos.
#ropiedades(
-i multiplicamos o dividimos todas las observaciones por un mismo nmero, la
media queda multiplicada o dividida por dic$o numero.
-i le sumamos a todas las observaciones un mismo nmero, la media aumentar
en dic$a cantidad.
/dems de la media aritmtica existen otros conceptos de media, como son la
media !eomtrica % la media arm"nica.
Mediana:
0epresenta el valor de la variable de posici"n central en un conjunto de datos
ordenados. 'e acuerdo con esta definici"n el conjunto de datos menores o i!uales que la
mediana representarn el *12 de los datos, % los que sean ma%ores que la mediana
representarn el otro *12 del total de datos de la muestra. 3a mediana coincide con
el percentil *1, con el se!undo cuartil % con el quinto decil. -u clculo no se ve afectado
por valores extremos.
#ara calcular la mediana debemos tener en cuenta si la variable es discreta o continua.
Es el valor medio en un conjunto de valores ordenados. Corresponde al percentil *1 o
se!undo cuartil (#*1 o 45. 3os pasos son(
, /rre!la los valores en orden del menor al ma%or
5 Cuenta de derec$a a izquierda o al revs $asta encontrar el valor o valores
medios.
Ejemplo( tenemos el si!uiente conjunto de nmeros ),6,7,8,,,,5,9,8,,1,,,,8 ordenamos(
5,6,8,8,8,7,),9,,1,,,,,, En esta secuencia la mediana es 7, que es el nmero central. : si
tuvisemos( ),6,7,8,,,,9,8,,1,,,,8, entonces ordenamos( 6,8,8,8,7,),9,,1,,,,,, % la
mediana (;d est en( los nmeros centrales son 7 % ), lo que $aces es sumar 7 < ) %
divides entre 5 % ;d= 7.*.
Existen dos mtodos para el clculo de la mediana(
Considerando los datos en forma individual, sin a!ruparlos.
>tilizando los datos a!rupados en intervalos de clase, a continuaci"n veamos cada una
de ellas.
Datos sin agrupar
-ean los datos de una muestra ordenada en orden creciente %
desi!nando la mediana como , distin!uimos dos casos(
a -i n es impar, la mediana es el valor que ocupa la posici"n una vez que
los datos $an sido ordenados (en orden creciente o decreciente, porque ste es el valor
central. Es decir(
#or ejemplo, si tenemos * datos, que ordenados son( , ,
, , =? El valor central es el tercero( . Este valor, que
es la mediana de ese conjunto de datos, deja dos datos por debajo ( , % otros dos
por encima de l ( ,
b -i n es par, la mediana es la media aritmtica de los dos valores centrales. Cuando
es par, los dos datos que estn en el centro de la muestra ocupan las posiciones
% . Es decir(
#or ejemplo, si tenemos @ datos, que ordenados son( , ,
, , , =? Aa% dos valores que estn por debajo
del % otros dos que quedan por encima del si!uiente
dato . #or tanto, la mediana de este !rupo de datos es la media
aritmtica de estos dos datos(
Datos agrupados
/l tratar con datos a!rupados, si coincide con el valor de una frecuencia acumulada, el
valor de la mediana coincidir con la abscisa correspondiente. -i no coincide con el valor
de nin!una abcisa, se calcula a travs de semejanza de trin!ulos en el $isto!rama o
pol!ono de frecuencias acumuladas, utilizando la si!uiente equivalencia(
'onde % son las frecuencias absolutas acumuladas tales
que , % son los extremos, interior % exterior, del intervalo
donde se alcanza la mediana % es la abscisa a calcular, la moda. -e
observa que es la amplitud de los intervalos seleccionados para el dia!rama.
Moda:
3a moda es el valor de la variable que ten!a ma%or frecuencia absoluta, la que ms se
repite, es la nica medida de centralizaci"n que tiene sentido estudiar en una variable
cualitativa, pues no precisa la realizaci"n de nin!n clculo.
#or su propia definici"n, la moda no es nica, pues puede $aber dos o ms valores de la
variable que ten!an la misma frecuencia siendo esta mxima. En cu%o caso tendremos
una distribuci"n bimodal o polimodal se!n el caso.
#or lo tanto el clculo de la moda en distribuciones discretas o cualitativas no precisa de
una explicaci"n ma%orB sin embar!o, debemos detenernos un poco en el clculo de la
moda para distribuciones cuantitativas continuas.
Cnconvenientes de su uso
Este parmetro, aun teniendo mltiples propiedades que aconsejan su uso en situaciones
mu% diversas, tiene tambin al!unos inconvenientes, como son(
#ara datos a!rupados en intervalos (variables continuas su valor oscila en funci"n de la
cantidad % amplitud de los intervalos que se consideren.
3a estatura media como resumen de una poblaci"n $omo!nea (abajo o $etero!nea
(arriba.
Es una medida a cu%o si!nificado afecta sobremanera la dispersi"n, de modo que cuanto
menos $omo!neos sean los datos, menos informaci"n proporciona. 'ic$o de otro modo,
poblaciones mu% distintas en su composici"n pueden tener la misma media.8 #or
ejemplo, un equipo de baloncesto con cinco ju!adores de i!ual estatura, ,,9* m,
evidentemente, tendra una estatura media de ,,9* m, valor que representa fielmente a
esta poblaci"n $omo!nea. -in embar!o, un equipo de ju!adores de estaturas ms
$etero!neas, 5,51 m, 5,,* m, ,,9* m, ,,7* m % ,,71 m, por ejemplo, tendra tambin,
como puede comprobarse, una estatura media de ,,9* m, valor que no representa a casi
nin!uno de sus componentes.
En el clculo de la media no todos los valores contribu%en de la misma manera. 3os
valores altos tienen ms peso que los valores cercanos a cero. #or ejemplo, en el clculo
del salario medio de un empresa, el salario de un alto directivo que !ane ,.111.111 de D
tiene tanto peso como el de diez empleados EnormalesE que !anen ,.111 D. En otras
palabras, se ve mu% afectada por valores extremos. Fo se puede determinar si en una
distribuci"n de frecuencias $a% intervalos de clase abiertos.
Medidas de Posicin
-on indicadores usados para seGalar que porcentaje de datos dentro de una
distribuci"n de frecuencias superan estas expresiones, cu%o valor representa el valor del
dato que se encuentra en el centro de la distribuci"n de frecuencia, por lo que tambin se
les llama E ;edidas de &endencia CentralE.
#ero estas medidas de posici"n de una distribuci"n de frecuencias $an de cumplir
determinadas condiciones para que lean verdaderamente representativas de la variable a
la que resumen. &oda sntesis de una distribuci"n se considerara como operativa si
intervienen en su determinaci"n todos % cada uno de los valores de la distribuci"n, siendo
nica para cada distribuci"n de frecuencias % siendo siempre calculable % de fcil
obtenci"n. / continuaci"n se describen las medidas de posici"n ms comunes utilizadas
en estadstica, como lo son(
Cuartiles( Aa% 6 cuartiles que dividen a una distribuci"n en 8 partes i!uales( primero,
se!undo % tecer cuartil.
'eciles( Aa% 9 deciles que la dividen en ,1 partes i!uales( (primero al noveno decil.
#ercentiles( Aa% 99 percentiles que dividen a una serie en ,11 partes i!uales( (primero al
noventa % nueve percentil.
Cuartiles (4,, 45, 46
/quel valor de una serie que supera al 5*2 de los datos % es superado por el 7*2
restante.
Hormula de 4, para series de 'atos /!rupados en Clase.
'onde(
( #osici"n de 4,, la cual se localiza en la primera frecuencia acumulada que la
conten!a, siendo la clase de 4,, la correspondiente a tal frecuencia acumulada.
3i, faa, fi, Cc( idntico a los conceptos vistos para ;ediana pero referidos a la medida de la
posici"n correspondiente.
#rimer cuartil (4,(
-e!undo cuartil (45(
Coincide, es idntico o similar al valor de la ;ediana (45 = ;d. Es decir, supera % es
superado por el *12 de los valores de una -erie.
c &ercer cuartil (46(
/quel valor, termino o dato que supera al 7*2 % es superado por el 5*2 de los datos
restantes de la -erie
Hormula de 46 para series de 'atos /!rupados en Clase.
'onde(
( posici"n de 46, todo idntico al calculo de la ;ediana.
'eciles (',, '5, I '9
#rimer 'ecil (',, 4uinto 'ecil ('* % Foveno 'ecil ('9.
El primer decil es aquel valor de una serie que supera a ,J,1 parte de los datos % es
superado por las 9J,1 partes restantes (respectivamente, $ablando en porcentajes,
supera al ,12 % es superado por el 912 restante,
El '9 (noveno decil supera al 912 % es superado por el ,12 restante.
Como se observa, son formulas parecidas a la del calculo de la ;ediana, cambiando
solamente la respectivas posiciones de las medidas.
#ercentiles (#,, #5, I #99
#rimer #ercentil (#,, #ercentil *1 (#*1 % #ercentil 99 (#99.
El primer percentil supera al uno por ciento de los valores % es superado por el noventa %
nueve por ciento restante.
Hormulas de #,, #*1, #99 para series de 'atos /!rupados en Clase.
El #99 (noventa % nueve percentil supera al 992 de los datos % es superado a su vez por
el ,2 restante.
Cdnticas formulas al calculo de la ;ediana, cambiando obviamente las correspondientes
posiciones de cada medida.
#ara determinar estas medidas se aplicara el principio de la medianaB as, el primer cuartil
cereal valor por debajo del cual se encuentra el 5* por ciento de los datosB bajo el tecer
cuartil se encuentra el 7* por cientoB el )1 decil ser el valor por encima del cual estar el
51 por ciento de los datos, etc.
Como se observa, todas estas medidas no son sino casos particulares del percentil %a
que el primer cuartil no es sino el 5*K percentil, el tercer cuartil el 7*K percentil, el cuarto
decil el 81K percentil, etc.
'atos no a!rupados(
-e $ace difcil calcular estas medidas, sin embar!o, si!uiendo los
mismos principios mencionados para la ;ediana, se pueden localizar en la forma
si!uiente(
-i tenemos una serie de valores L,, L5, L6 I Ln, se localiza el primer cuartil como el
valor cuando n es par, % cuando n es impar. #ara el tercer cuartil ser (n
parB (n impar.
En caso de los textiles ser o donde / representa el nmero del textil.
#ara los deciles ser o siendo / el nmero del decilB % para los
percentiles o .
Medidas de dispersin

&ambin llamadas medidas de variabilidad, muestran la variabilidad de una
distribuci"n, indicando por medio de un nmero, si las diferentes puntuaciones de una
variable estn mu% alejadas de la mediana media. Cuanto ma%or sea ese valor, ma%or
ser la variabilidad, cuanto menor sea, ms $omo!nea ser a la mediana media. /s se
sabe si todos los casos son parecidos o varan muc$o entre ellos.
#ara calcular la variabilidad que una distribuci"n tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica.
#ero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de
estrate!ias para salvar este problema. >na es tomando las desviaciones en valor absoluto
('esviaci"n media % otra es tomando las desviaciones al cuadrado (Marianza.
Rango estadstico
El ran!o o recorrido estadstico es la diferencia entre el valor mximo % el valor mnimo en
un !rupo de nmeros aleatorios. -e le suele simbolizar con 0.
0equisitos del ran!o
Nrdenamos los nmeros se!n su tamaGo.
0estamos el valor mnimo del valor mximo
;edio ran!o
El medio ran!o de un conjunto de valores numricos es la media del menor % ma%or valor, o la
mitad del camino entre el dato de menor valor % el dato de ma%or valor. En consecuencia, el medio
rango es(
0epresentaci"n del medio ran!o(
3a varianza es una medida estadstica que mide la dispersi"n de los valores respecto a un valor
central (media, es decir, es el cuadrado de las desviaciones(
Propiedades
3a varianza es siempre positiva o 1(
-i a los datos de la distribuci"n les sumamos una cantidad constante la varianza no se modifica.
c
-i a los dato de la distribuci"n les multiplicamos una constante, la varianza queda multiplicada por
el cuadrado de esa constante.
#ropiedad distributiva( cov
Desviacin tpica
3a varianza a veces no se interpreta claramente, %a que se mide en unidades cuadrticas.
#ara evitar ese problema se define otra medida de dispersi"n, que es la desviaci"n tpica,
o desviaci"n estndar, que se $alla como la raz cuadrada positiva de la varianza. 3a
desviaci"n tpica informa sobre la dispersi"n de los datos respecto al valor de la mediaB
cuanto ma%or sea su valor, ms dispersos estarn los datos. Esta medida viene
representada en la ma%ora de los casos por -, dado que es su inicial de su nominaci"n
en in!ls.
'esviaci"n tpica muestral
'esviaci"n tpica poblacional
-->x= [17 14 2 5 8 7 6 8 5 4 3 15 9]
x =
17. 14. 2. 5. 8. 7. 6. 8. 5. 4. 3. 15.
9.
-->stdev(x)
ans =
4.716311
-->
#rimero $emos declarado un vector con nombre L, donde introduzco los nmeros de la
serie. 3ue!o con el comando stdev se $allar la desviaci"n tpica.
== Covarianza == 3a covarianza entre dos variables es un estadstico resumen indicador
de si las puntuaciones estn relacionadas entre s. 3a formulaci"n clsica, se simboliza
por la letra !rie!a si!ma (O cuando $a sido calculada en la poblaci"n. -i se obtiene sobre
una muestra, se desi!na por la letra E E.
3a formula suele aparecer expresada como(
Este tipo de estadstico puede utilizarse para medir el !rado de relaci"n de dos variables
si ambas utilizan una escala de medida a nivel de intervaloJraz"n (variables cuantitativas.
3a expresi"n se resuelve promediando el producto de las puntuaciones diferenciales por
su tamaGo muestral (n pares de puntuaciones, n+, en su forma inses!ada. Este
estadstico, refleja la relaci"n lineal que existe entre dos variables. El resultado numrico
fluctua entre los ran!os de <infinito a +infinito.
/l no tener unos lmites establecidos no puede determinarse el !rado de relaci"n lineal
que existe entre las dos variables, solo es posible ver la tendencia.
Resumen
El objetivo principal de las medidas de tendencia central es poder representar por
medio de un solo nmero al conjunto de datos, es decir, dan valores representativos de la
distribuci"n de frecuencias, situados en al!n lu!ar intermedio, alrededor del cual, se
encuentran los otros valores. Fos indican d"nde tienden a concentrarse los valores.
Existen tres medidas de tendencia central !enerales, que son, la ;edia aritmtica, la
;ediana % la ;odaB as como otras que se utilizan en casos particulares como la ;edia
ponderada, la ;edia /rm"nica, la ;edia Peomtrica, la ;edia Cuadrtica.
3as medidas de posici"n nos facilitan informaci"n sobre la serie de datos que
estamos analizando. 3a descripci"n de un conjunto de datos, inclu%e como un elemento
de importancia la ubicaci"n de stos dentro de un contexto de valores posible. >na vez
definidos los conceptos bsicos en el estudio de una distribuci"n de frecuencias de una
variable, estudiaremos las distintas formas de resumir dic$as distribuciones mediante
medidas de posici"n (o de centralizaci"n, teniendo presente el error cometido en el
resumen mediante las correspondientes medidas de dispersi"n.
-e trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En
vez de manejar todos los datos sobre las variables, tarea que puede ser pesada,
podemos caracterizar su distribuci"n de frecuencias mediante al!unos valores numricos,
eli!iendo como resumen de los datos un El objetivo principal de las medidas de tendencia
central es poder representar por medio de un solo nmero al conjunto de datos, es decir,
dan valores representativos de la distribuci"n de frecuencias, situados en al!n lu!ar
intermedio, alrededor del cual, se encuentran los otros valores. Fos indican d"nde tienden
a concentrarse los valores. Existen tres medidas de tendencia central !enerales, que son,
la ;edia aritmtica, la ;ediana % la ;odaB as como otras que se utilizan en casos
particulares como la ;edia ponderada, la ;edia /rm"nica, la ;edia Peomtrica, la ;edia
Cuadrtica.
Como tambin tenemos el conocimiento de la forma de la distribuci"n % del
respectivo promedio de una colecci"n de valores de una variable, puede servir para tener
una idea bastante clara de la conformaci"n, pero no de la $omo!eneidad de cada una
de los valores con respecto a la medida de tendencia central aplicada. En el caso de
las variables con valores que pueden definirse en trminos de al!una escala de medida
de i!ual intervalo, puede usarse un tipo de indicador que permite apreciar el !rado de
dispersi"n o variabilidad existente en el !rupo de variantes en estudio.
/ estos indicadores les llamamos medidas de dispersi"n, por cuanto que estn referidos a
la variabilidad que ex$iben los valores de las observaciones, %a que si no $ubiere
variabilidad o dispersi"n en los datos inters, entonces no $abra necesidad de la !ran
ma%ora de las medidas de la estadstica descriptiva.
3as medidas de tendencia central tienen como objetivo el sintetizar los datos en
un valor representativo, las medidas de dispersi"n nos dicen $asta que punto estas
medidas de tendencia central son representativas como sntesis de la informaci"n. 3as
medidas de dispersi"n cuantifican la separaci"n, la dispersi"n, la variabilidad de los
valores de la distribuci"n respecto al valor central. 'istin!uimos entre medidas de
dispersi"n absolutas, que no son comparables entre diferentes muestras % las relativas
que nos permitirn comparar varias muestras.
Introduccin
El estudio de una variable estadstica comienza con la obtenci"n de datos, bien
sondeando la poblaci"n o tomando una muestra. El si!uiente paso en el proceso es la
ordenaci"n de datos elaborando la tabla correspondiente. &rabajar con una tabla es
complejo % tedioso por lo que es ms conveniente la introducci"n de nuevos parmetros
que nos permitan resumir la informaci"n que contienen esas tablas.
El objetivo que se persi!ue es el resumen de la informaci"n que nos aportan los
datos con la menor prdida posible. Mamos a a!rupar los parmetros en tres !rupos
dependiendo de su funci"n. #rimero evaluaremos las medidas de centralizaci"n, quienes
con ellas pretendemos condensar los distintos valores de la variable en uno s"lo que los
resuma. -e!uido de las medidas de posici"n lue!o de que una vez ordenados los datos
de menor a ma%or ser necesario identificar la posici"n de los valores. : finalmente las
medidas de dispersi"n, donde se condensan los datos en uno s"lo pero no nos aportan
informaci"n nin!una sobre la concentraci"n o dispersi"n de los datos, $abr pues que
introducir medidas que palien esta carencia.

También podría gustarte