Está en la página 1de 13

MEDIDAS DE CENTRALIZACION

Comnmente se trata de resumir la informacin de un conjunto de observaciones en un solo valor, as se habla de la altura promedio del hombre peruano, de los ingresos promedios mensuales, del promedio de notas, edad promedio de los estudiantes, etc. Al condensar toda la informacin en un solo valor podemos pensar que todas las observaciones poseen ese valor. Medidas de centralizacin: Definicin:Una medida de centralidad es un valor (o categora) que, calculado a partir de una serie de datos (muestrales o poblacionales) o de una distribucin de frecuencias, se caracteriza por representar el valor (o categora) alrededor del cual se agrupan las observaciones. Intuitivamente se la puede considerar como el centro de la distribucin de los datos. Las medidas de centralidad ms frecuentes son: la media, la mediana, y la moda. Estudiaremos primero la media: a) La media ( ) Para Datos no clasificados o no agrupados. Se define como la media aritmtica de una muestra de datos: x1, x2, , xn ; esto es: (x1 + x2 + + xn ) / n =

Si hubieran en la muestra k valores diferentes, que los denotsemos por xi, tendramos: X1 X2 X3 Xk con fk fi 4 6 4 5 2 0 3 4 3 1 0 1 2 . Por Ejemplo: xi . fi 604 frecuencia f1 f2 f3

Entonces la media muestral estara dada por:

I xi 1 151 2 152 3 153 4 154 5 155 6 156 7 157 8 158 9 159 10 160 11 161 12 162 13 163 De donde obtenemos el valor de la media muestral:

Para datos clasificados o agrupados: En el caso de tener los datos agrupados en una tabla de distribucin de frecuencias, calcularemos el valor para la media de datos agrupados de manera aproximada: En el , donde k = nmeros de intervalos de clase. caso del Ejemplo = 156,0142857 1 realizado antes, tendremos:

Media aritmtica ponderada: Algunas veces se asocia a los nmeros x1, x2, , xk ciertos factores o pesos w1,w2, wk que dependen de la importancia de cada uno de los nmeros. Obtenindose, de esta manera ,

que recibe el nombre de media ponderada. Ejemplo: Si Mara en su curso de matemticas ha obtenido en su primer examen 14, en el examen final 12, y su promedio de prcticas es 16, y se sabe adems que el examen final se valora como cuatro veces el promedio de las practicas, entonces su promedio final en el curso ser: ( ) ( ) Ventajas y desventajas: Ventajas Fcil de calcular e interpretar. Es equitativa porque usa todos los datos. Si existe simetra en los datos es la mas recomendable. Es estable al muestreo. Desventajas Si existen valores extremos se desplaza en la direccin del valor extremo y no representa apropiadamente a la muestra.

i. ii.

b) La mediana (Me) Es el valor central de las observaciones cuando stas se ordenan de menor a mayor. Divide a la serie en dos grupos de igual nmero de elementos. Ordenados los datos en forma creciente: i. ii. Si el nmero de datos es par, se acostumbra tomar como la mediana al promedio de los datos centrales. Si el nmero de datos es impar, la mediana es valor central.

Ejemplo: 1. Para los datos del Ejemplo 1, se tiene: Como n = 35 es impar, se calcula la mediana como aquel valor que se ubica en el centro de la serie de los datos ordenados de menor a mayor; en este caso sera el que ocupa la decimoctava posicin, entonces: Me = x18 = 154 2. Dada una muestra de tamao n = 6: -2, 0, 3, 7, 11, 15 en este caso en que n es un numero par, se calcula el valor de la mediana como el promedio los dos datos centrales, esto es: Me = ( x3 + x4 ) /2 = 10 /2 = 5 En el caso de tener los datos agrupados, se calcula el valor de la mediana de manera aproximada, a travs de la siguiente frmula: ( En donde:
n = nmero de datos i = el menor intervalo i, tal que se cumple: Fi > n/2 Fi-1= Frecuencia acumulada del intervalo (i 1) fi = frecuencia absoluta del intervalo i Ai = Amplitud del intervalo i li =lmite inferior del i-simo intervalo de clase que contiene a la mediana.

Para el Ejemplo 1: La mediana: en el caso de estar los datos agrupados, por medio de la tabla de distribucin de frecuencias, tendremos: El intervalo i de la clase de la mediana ser el segundo intervalo ( i = 2), ya que F2 > 17,5 por lo que: l2 = 154, f2 = 7 Entonces, haciendo uso de la frmula

Para el ejemplo 2: El intervalo para la mediana es el cuarto intervalo (i = 4), por lo tanto: l4 = 143,6, F3=15, y f4 = 12 Entonces, haciendo uso de la frmula para la mediana, tenemos:

( Ventajas y desventajas
i.

Ventajas No es afectada por valores extremos y se puede usar cuando hay asimetra. No vara con el cambio de amplitudes.

ii.

Desventajas: No tiene definicin algebraica Es inestable al muestreo Su interpretacin no es fcil.

c) Moda (Mo). Se define como la observacin que se presenta con ms frecuencia dentro del conjunto de datos. Ejemplos: 1. Considera la siguiente muestra de datos simples: 1, 1, 2, 3, 4, 5, 5, 7, 1, 5, 7, 1. Advierte que la observacin que se presenta con mayor frecuencia es el dato: x1=1, ya que se presenta cuatro veces dentro del conjunto; por lo tanto, la moda de la muestra es: Mo = 1 2. Sea la siguiente muestra de datos simples: 1, 2, 4, 0, 6, 7. En este caso, se puede apreciar que todos los datos se presentan con la misma frecuencia, por lo tanto, no existe la moda de la muestra. 3. Sea la muestra de datos simples: 1, 1, 3, 5, 7, 3, 1, 6, 3. En este conjunto de datos se observa que hay dos datos: x1 = 1, y x3 = 3, que se presentan con la misma frecuencia: por lo tanto, concluimos que la muestra posee dos modas: Mo1 =1 Mo2=3 Tenemos asi una muestra bimodal. La moda para datos agrupados se obtiene por medio de la formula:

( En donde:

i. ii.

i = es la clase modal (la que tiene mayor frecuencia absoluta). d1 = fi fi-1 , d2 = fi fi-1 fi = frecuencia modal fi-1 = frecuencia de la clase inmediatamente anterior a la clase modal fi+1 = frecuencia de la clase inmediatamente posterior a la clase modal A1 = amplitud del intervalo de la clase modal li = lmite inferior de la clase modal Para el Ejemplo 1: La moda para los datos simples es aquella observacin que tiene mayor frecuencia, en este caso el dato 152 muestra la mayor frecuencia (6 veces), luego Mo=152 La moda para datos agrupados: El intervalo de la clase modal es el primer intervalo, ya que es el que tiene la mayor frecuencia, por lo tanto: l1 = 151 d1 = 14 0 = 14 d2 = 14 7 = 7 A1 = 3 Entonces ( )

Para el Ejemplo 2: La moda para datos agrupados: El intervalo modal es el cuarto intervalo, por lo tanto: i=4 l4 = 143,6 d1 = 12 7 = 5 d2 = 12 6 = 6 A4 = 8,2 Entonces:

Ventajas y desventajas 1. Ventajas Se utiliza para variables cualitativas o cuantitativas, pero especialmente para las primeras. 2. Desventajas No es equitativa No tiene definicin algebraica Es inestable al cambio de amplitudes y al muestreo Puede existir ms de una o no existir.

Ejercicios
1. Analiza la verdad o falsedad de las siguientes afirmaciones: a) El valor que ms se repite en un conjunto de datos recibe el nombre de media aritmtica. b) Despus de agrupar un conjunto de datos en varias clases, podemos identificar la mediana de clase como aquella que posee el mayor nmero de observaciones. c) Los valores extremos en un conjunto de datos influyen profundamente en la mediana 2. La siguiente tabla muestra la distribucin de la carga mxima en toneladas que soportan ciertos cables producidos por una compaa. Mximo de carga Nmero de cables [9,3 , 9,8[ 2 [9,8 , 10,3[ 5 [10,3 , 10,8[ 12 [10,8 , 11,3[ 17 [11,3 , 11,8[ 14 [11,8 , 12,3[ 6 [12,3 , 12,8[ 3 [12,8 , 13,3[ 1 Determinar a) La media de la carga mxima. b) La mediana c) La moda d) Cul elegira? 3. Halle la media, la mediana y la moda de los ejercicios realizados en clase.

MEDIDAS DE LOCALIZACIN CUANTILES Son medidas descriptivas que pueden dividir al total de datos en cierto nmero de partes igualmente numerosos y nace como consecuencia del estudio de la mediana; las principales son: a) Cuartiles ( Qi) Son aquellos valores que dividen al total de datos ordenados de menor a mayor en 4 partes igualmente numerosas. 1. PARA DATOS NO TABULADOS Ejemplo: a) Cuando da entero el punto de Posicin. Se tiene los pesos de 11 nios expresados en kg 3 ; 6 ; 8 ; 8 ; 10 ; 11 ; 12 ; 13 ; 19 ; 22 ; 36 Se pide determinar: Q1 ; Q2 ; Q3 Resolucin: 1 Numerar los datos ordenadas 3 ; 6 ; 8 ; 8 ; 10 ; 11 ; 12 ; 13 ; 19 ; 22 ; 36 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 Punto de posicin correspondiente:
Para i = 2 : Reemplazando:
( ) ( )

; Q2 = 11

Posicin x9 b) Cuando no da entero el punto de posicin. Sean los sueltos diarios de 12 trabajadores 9 ; 11 ; 13 ; 15 ; 15 ; 16 ; 16 ; 17 ;17 ;18 ;19 ; 20 Se pide determinar: Q1 ; Q2 y Q3 Resolucin 9 ; 11 ; 13 ; 15 ; 15 ; 16 ; 16 ; 17 ;17 ;18 ;19 ; 20

x1 x2 x3 x4 x5 x6

x7 x8 x9 x10 x11 x12


( )

Punto de posicin correspondiente:


Para i = 1 : Reemplazando: Para i = 2 : Reemplazando:
( )

; ;

Q2 = 13 +
x3 x6

( (

) )

Tomamos la parte entera; Posicin x3


( )

Diferencia entre x3 y x4

Q2 = 16 +

Tomamos la parte entera; Posicin x6

Diferencia entre x6 y x7

Observacin Cuando el punto de posicin no arroja valores enteros para el caso de Q1 tomamos la posicin de la parte entera mas el 25 % de la diferencia entre esta y la siguiente; algo parecido sucede con Q2 slo que se tomar el 50% y para Q3 el 75%.

2. PARA DATOS TABULADOS [ ]

: Lmite inferior de la clase donde se encuentra el cuartil. : Amplitud de la clase donde se encuentra el cuartil. : Nmero que indica el cuartil deseado. : Nmero total de datos : Frecuencia absoluta acumulada anterior a la clase donde se encuentra el cuartil. : Frecuencia absoluta de la clase donde se encuentra el cuartil. Ejemplo: En el siguiente cuadro estadstico: Ii [10 20 > [20 30 > [30 40 > [40 50 > Se pide determinar: Q1 y Q2 Resolucin: Ii [10 20 > [20 30 > [30 40 > [40 50 > Calculando Q1: Punto de posicin correspondiente: Para i = 1 ; Q1 = 20 + 10 * Calculando Q2: Punto de posicin correspondiente: Para i = 2 ; Q2 = 30 + 10 * + ; Como F3 > 25 Clase: [30 40 > + se ubica el cuartil donde Fi > Clase: [20 30 > fi 3 17 8 22 Fi 3 20 28 50 fi 3 17 8 22

; Como F2 > 12,5

b) Deciles ( Di) Son aquellos valores que dividen al total de datos ordenados de menor a mayor en 10 partes igualmente numerosas. 1. PARA DATOS NO TABULADOS Se calcula en forma similar a los cuartiles ordenando los datos de menor a mayor y hallando el punto de posicin correspondiente:

Punto de posicin: 2. PARA DATOS TABULADOS [

: Lmite inferior de la clase donde se encuentra el decil. : Ancho o amplitud de la clase donde se encuentra el decil. : Nmero que indica el decil deseado. : Nmero total de datos : Frecuencia absoluta acumulada anterior a la clase donde se encuentra el decil. : Frecuencia absoluta de la clase donde se encuentra el decil. Ejemplo: En el siguiente cuadro estadstico: Ii [10 20 > [20 30 > [30 40 > [40 50 > [50 60 > Se pide determinar: D3 Resolucin: Ii [10 20 > [20 30 > [30 40 > [40 50 > [50 60 > Calculando D1: Punto de posicin correspondiente: Para i = 3 ; D3 = 20 + 10 * + ; Como F2 > 15 se ubica el decil donde Fi > Clase: [20 30 > fi 8 16 10 4 12 Fi 8 24 34 38 50 fi 8 16 10 4 12

c) Percentiles ( Pi) Son aquellos valores que dividen al total de datos ordenados de menor a mayor en 100 partes igualmente numerosas. 1. PARA DATOS NO TABULADOS Se calcula en forma similar que los cuartiles y deciles ordenando los datos de menor a mayor y hallando el punto de posicin correspondiente: Punto de posicin:
( )

2. PARA DATOS TABULADOS [ ]

: Lmite inferior de la clase donde se encuentra el percentil. : Ancho o amplitud de la clase donde se encuentra el percentil. : Nmero que indica el percentil deseado. : Nmero total de datos :Frecuencia absoluta acumulada anterior a la clase donde se encuentra el percentil. : Frecuencia absoluta de la clase donde se encuentra el percentil. Ejemplo: En el siguiente cuadro estadstico: Ii [5 10 > [10 15> [15 20 > [20 25 > [25 30 > Se pide determinar: P40 Resolucin: Ii [5 10 > [10 15> [15 20 > [20 25 > [25 30 > Calculando P40: Punto de posicin correspondiente: Para i = 40 ; P40 = 10 + 5 * + ; Como F2 > 20 se ubica el percentil donde Fi > Clase: [10 15 > fi 16 7 3 14 10 Fi 16 23 26 40 50 fi 16 7 3 14 10

MEDIDAS DE DISPERSIN Son aquellos que miden la dispersin que existe entre los datos de una muestra. La descripcin ms clara de la dispersin son aquellos que tienen que ver con la desviacin promedio a partir de alguna medida de tendencia central las ms importantes son: I. DESVIACIN MEDIA ABSOLUTA (DM) Es el promedio aritmtico que existe entre los valores absolutos de las desviaciones de los datos observados respecto a la media aritmtica. 1. PARA DATOS NO TABULADOS | | xi : Son los respectivos datos. : Media o promedio n = Nmero total de datos. Ejemplos: Sean las longitudes de 6 huesos expresado en centmetros. 12 ; 24 ; 6 ; 18 ; 60 ; 36 Se pide determinar la desviacin media Resolucin xi 6 12 18 24 36 60 xi - -20 -14 -8 -2 10 34 | | | 20 14 8 2 10 34 88 |

2. PARA DATOS TABULADOS | |

: Nmero de intervalos. : Son las respectivas marcas de clase. : Nmero total de datos : Son las respectivas frecuencias : Media o promedio.

Ejemplo: En el siguiente cuadro estadstico: Ii [2 4 > [4 6 > [6 8 > [8 10 > [10 12 > [12 14 > [14 16 > [16 18 > Se pide determinar la desviacin media: Ii fi yi yi fi [2 4 > 2 3 6 [4 6 > 4 5 20 [6 8 > 10 7 70 [8 10 > 1 9 9 [10 12 > 12 11 132 [12 14 > 11 13 143 [14 16 > 3 15 45 [16 18 > 7 17 119 544

fi 2 4 10 1 12 11 3 7

yi - -7,8 -5,8 -3,8 -1,8 0,2 2,2 4,2 6,2

| 7,8 5,8 3,8 1,8 0,2 2,2 4,2 6,2


|

| 15,6 23,2 38 1,8 2,4 24,2 12,6 43,4 161,2


|

II.

LA VARIANZA (V(x) ; S2 )

Es la media de los cuadrados de las desviaciones, y la denotaremos por por .

o tambin

Aunque tambin es posible calcularlo como:

Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendr en cm2.

III.

DESVIACIN ESTNDAR (S) Es la raz cuadrada de la varianza, se denota por Sx o s x.

Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica, que como veremos cuando estudiemos el tema de estimacin estadstica, son los estimadores de la varianza y desviacin tpica poblacionales respectivamente.

IV.

COEFICIENTE DE VARIACIN (C.V) Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitir decir entre dos muestras, cual es la que presenta mayor dispersin. La denotaremos por C.V.

Ejemplo Veamos por ltimo un ejemplo de cmo se calculan todas estas medidas.

45 55 65 75 85

55

6 16 35 46 50

50 60 70 80 90

300

19,4

116,4 94 11,4 116,6 82,4 420,8

2258,16 883,6 6,84 1235,96 1697,44 6082

15000 36000 93100 70400 32400 246900

65 10 75 19 85 11 95 4 N= 50

600 -9,4 1330 0,6 880 10,6 360 20,6 3470

Dm=

c.v. =

También podría gustarte