Está en la página 1de 10

1.

MEDIA Es la medida de posicin central ms utilizada, la ms conocida y la ms sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeos. La media se define como la suma de todos los valores observados, dividido por el nmero total de observaciones.

Ecuacin 5-1 Cuando los valores representan una poblacin la ecuacin se define como:

Ecuacin 5- 2 Donde (m) representa la media, (N) representa el tamao de la poblacin y (Xi) representa cada uno de los valores de la poblacin. Ya que en la mayora de los casos se trabajan con muestras de la poblacin todas las ecuaciones que se presenten a continuacin sern representativas para las muestras. La media aritmtica para una muestra esta determinada como

Ecuacin 5-3 Donde (X) representa la Media para la muestra, (n) el tamao de la muestra y (Xi) representa cada uno de los valores observados. Esta frmula nicamente es aplicable si los datos se encuentran desagrupados; en caso contrario debemos calcular la media mediante la multiplicacin de los diferentes valores por la frecuencia con que se encuentren dentro de la informacin; es decir,

Ecuacin 5-4 Donde (Yi) representa el punto medio de cada observacin, (ni) es la frecuencia o nmero de observaciones en cada clase y (n) es el tamao de la muestra siendo igual a la suma de las frecuencias de cada clase. Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5 personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su interpretacin se han generado tres rangos de edad los cuales se han establecido de 21 a 30 aos, de 31 a 40 aos y de 41 a 50 aos. Si nos fijamos en estos rangos notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organizacin de estos datos se representan en la tabla [5-1].

Figura 5-1 Si aplicamos la frmula para valores agrupados obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad de los encuestados es de 35 aos. Si ha estos mismos resultados le aplicamos la ecuacin para datos desagrupados (Ecuacin 5-3), tomando como referencia cada uno de los valores individuales, obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad para los datos desagrupados es de 34 aos aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la exactitud de los clculos, principalmente al aumentar el nmero de datos. Para evitar estos inconvenientes, SPSS nos permite calcular las Medias, como si se trataran de valores desagrupados, aunque tiene algunos procedimientos para valores agrupados. Es importante resaltar que existe una gran variedad de medias como la Media geomtrica, la Media ponderada, la Media cuadrtica, etc. Por el momento slo hacemos nfasis en la media aritmtica ya que es la ms utilizada, aunque se recomienda a los lectores profundizar en estos temas. 2. MEDIANA Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos despus que las observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posicin de la mediana se utiliza la frmula

Ecuacin 5-5 Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2, 5, 8, 10 y 13), la posicin de la mediana sera:

Lo que nos indica que el valor de la mediana corresponde a la tercera posicin de la serie, que equivale al nmero (8). Si por el contrario contamos con un conjunto de datos que contiene un

nmero par de observaciones, es necesario promediar los dos valores medios de la serie. Si en el ejemplo anterior le anexamos el valor 15, tendramos la serie ordenada (2, 5, 8, 10, 13 y 15) y la posicin de la mediana sera,

Es decir, la posicin tres y medio. Dado que es imposible destacar la posicin tres y medio, es necesario promediar los dos valores de la posiciones tercera y cuarta para producir una mediana equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo que nos indicara que la mitad de los valores se encuentra por debajo del valor 9 y la otra mitad se encuentra por encima de este valor. En conclusin la mediana nos indica el valor que separa los datos en dos fracciones iguales con el cincuenta porciento de los datos cada una. Para las muestras que cuentan con un nmero impar de observaciones o datos, la mediana dar como resultado una de las posiciones de la serie ordenada; mientras que para las muestras con un nmero par de observaciones se debe promediar los valores de las dos posiciones centrales. 3. MODA La medida modal nos indica el valor que ms veces se repite dentro de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que ms veces se repite es el nmero 2 quien seria la moda de los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos ms de dos valores, lo que se conoce como multimodal. En conclusin las Medidas de tendencia central, nos permiten identificar los valores ms representativos de los datos, de acuerdo a la manera como se tienden a concentrar. La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendra

cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por ltimo la Moda nos indica el valor que ms se repite dentro de los datos.

1. Grfico de Barras Este tipo de grfico nos permite identificar y comparar de forma visual el comportamiento de las categoras de una variable. Por medio de las barras podemos conocer aspectos de forma sencilla de una o varias variables, como lo pueden ser sus categoras, las frecuencias y las diferencias entre ellas. La estructura bsica de un grfico de barras [Fig.5-9], esta basado en un eje de categoras generalmente el eje horizontal y un eje de frecuencias que en algunos casos puede ser remplazado por el porcentaje. Adems se suelen utilizar diferentes colores para cada una de las categoras facilitando el reconocimiento por parte del usuario.

Figura 5-9 Los grficos de barras tambin son tiles para comparar varias variables a la vez [Fig.5-10]. Este tipo de opciones implica una serie de tcnicas como la anidacin y la agrupacin las cuales sern expuestas en el captulo siete.

Figura 5-10 2. Grfico de Sectores Los grficos de sectores o de torta nos permiten observar la variable de forma global haciendo una comparacin inmediata del porcentaje o la frecuencia del total de las categoras de una variable. Su utilidad radica en la facilidad para interpretar la informacin contenida en una variable mediante la representacin grafica de los resmenes (Porcentajes o Frecuencias).

Figura 5-11 La estructura bsica de los grficos de sectores [Fig.5-11], esta definida por un crculo en el cual se representan cada una de las categoras por la porcin o fraccin correspondiente al porcentaje o la frecuencia. En algunas ocasiones suelen separarse las fracciones, con el fin de hacer ms clara la informacin. 3. Histograma Los histogramas nos permiten identificar diversos parmetros como la dispersin, la distribucin y la concentracin de los datos en una variable de Escala. Este tipo de grficos generan una representacin visual del comportamiento de los datos, permitiendo observar rasgos caractersticos como la zona o rango de mayor concentracin, la amplitud, los valores extremos, etc. La estructura bsica de un histograma [Fig.5-12], esta basada en rangos, los cuales suelen ser representados por barras cuya altura es determinada por la cantidad de valores que se encuentren dentro de los lmites de cada rango (Frecuencia). Generalmente se utiliza el Eje vertical para representar las frecuencias y el Eje horizontal para los rangos; adicionalmente se puede sobreponer una Curva Normal con el fin de comparar si los datos tienden a distribuirse de forma uniforme.

Figura 5-12 En resumen cuando se trabaja con variables categricas (Nominal u Ordinal), los grficos ms indicados y representativos en su anlisis descriptivo corresponden a los grficos de Barras y los de Sectores; por el contrario si se trata de una variable de Escala el grfico ms apropiado es el Histograma. Dado que por el momento slo estamos haciendo un recorrido por las opciones del procedimiento Frecuencias, no seleccionaremos ninguno de los grficos y en cambio hacemos clic en el botn Cancelar, con lo cual volvemos al cuadro de dilogo principal del procedimiento. En la siguiente leccion conoceremos la ultima opcion del procedimiento Frecuencias denominada Formato

Medidas de Dispersin - Varianza y Desviacin As como las medidas de tendencia central nos permiten identificar el punto central de los datos, las Medidas de dispersin nos permiten reconocer que tanto se dispersan los datos alrededor del punto central; es decir, nos indican cuanto se desvan las observaciones alrededor de su promedio aritmtico (Media). Este tipo de medidas son parmetros informativos que nos permiten conocer como los valores de los datos se reparten a travs de eje X, mediante un valor numrico que representa el promedio de

dispersin de los datos. Las medidas de dispersin ms importantes y las ms utilizadas son la Varianza y la Desviacin estndar (o Tpica).

1. VARIANZA Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el nmero de observaciones que se tengan. Si la varianza es calculada a una poblacin (Total de componentes de un conjunto), la ecuacin sera:

Ecuacin 5-6 Donde ( ) representa la varianza, (Xi) representa cada uno de los valores, ( ) representa la media poblacional y (N) es el nmero de observaciones tamao de la poblacin. En el caso que estemos trabajando con una muestra la ecuacin que se debe emplear es:

Ecuacin 5-7 Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, ( ) representa la media de la muestra y (n) es el nmero de observaciones tamao de la muestra. Si nos fijamos en la ecuacin, notaremos que se le resta uno al tamao de la muestra; esto se hace con el objetivo de aplicar una pequea medida de correccin a la varianza, intentando hacerla ms representativa para la poblacin. Es necesario resaltar que la varianza nos da como resultado el promedio de la desviacin, pero este valor se encuentra elevado al cuadrado. 2. Desviacin estndar o Tpica Esta medida nos permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto central o media. La desviacin estndar nos da como resultado un valor numrico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviacin estndar basta con hallar la raz cuadrada de la varianza, por lo tanto su ecuacin sera:

Ecuacin 5-8 Para comprender el concepto de las medidas de distribucin vamos a suponer que el gerente de una empresa de alimentos desea saber que tanto varan los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente. Por lo que su media es:

La varianza sera:

Por lo tanto la desviacin estndar sera:

Con lo que concluiramos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta informacin le permite al gerente determinar cuanto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los correctivos necesarios en el proceso de empacado.

DESCRIPCON DE LOS DATOS (Captulo 3) Medida de Tendencia Central: Un nico valor que resume un conjunto de datos. Seala el centro de valores. No hay una sola medida de tendencia central, se consideran 5: la media aritmtica, media ponderada, la mediana, la moda y la media geomtrica. Media de la poblacin: A partir de datos en vivo, los que no han sido agrupados en una distribucin de frecuencias o en una representacin de tallo y hoja, la media de una poblacin es: Suma de todos los valores de la poblacin Media de una poblacin = Nmero de valores en la poblacin N Donde: = X

representa la media de poblacin

N n total de elementos en la poblacin X cualquier valor en particular

sumatoria

La media de una poblacin es un parmetro (una caracterstica medible de una poblacin) , as como la amplitud de variacin (la diferencia entre el valor ms grande y el ms pequeo en un conjunto de datos). Media de una muestra: Para datos en vivo, no agrupados la media es: Suma de todos los valores de una muestra Media de una muestra = X = Nmero de valores en la muestra n Donde: n nmero total de valores de la muestra X

La media de una muestra, o cualquier otra medida basada en datos muestrales, se denomina dato estadstico (una caracterstica de una muestra).

Propiedades de media aritmtica:

La tasa de inters de la media aritmtica es una medida de tendencia central ampliamente utilizada. Propiedades:

los valores.

specto a la media, siempre ser cero. LAS DESVIACIONES RESPECTO DE LA MEDIA SUMAN CERO ( X - X ) = 0 La media podra no ser un promedio adecuado para representar datos. La media se ve afectada de modo notable por valores extraordinariamente grandes o pequeos. No se puede determinar la media de datos de extremo abierto (Ej: U$S 100.000 y mayor). Media ponderada: Es un caso especial de la media aritmtica. Se presenta cuando hay varias observaciones del mismo valor que pueden ocurrir si los datos se han agrupado en una distribucin de frecuencias. Para determinar la media ponderada multiplicamos cada observacin por el nmero de veces que aparece. w1X1 + w2X2 + w3X3 +...+ wnXn Media ponderada = Xw = w1 + w2 + w3 +...+ wn Mediana: Para datos que contienen 1 o 2 valores sumamente grandes o muy pequeos, la media aritmtica puede no ser representativa. El punto central puede describirse mejor utilizando una medida de tendencia central denominada mediana. w (wX)

o o o o o

Mediana: Punto medio de los valores despus de ordenarlos de menor a mayor, o de mayor a menor. Se tiene que 50% de las observaciones se encuentran por arriba de la mediana y 50% por debajo de ella. Las propiedades de la mediana son: Es nica, slo existe una mediana para un conjunto de datos. No se ve afectada por valores muy grandes o muy pequeos. Puede calcularse para una distribucin de frecuencias con una clase de extremo abierto, si la medina no se encuentra en una clase de tal extremo.

Puede obtenerse para datos de nivel de razn, de intervalo y ordinal(excepto para el nominal). 5. Moda: El valor de la observacin que aparece con ms frecuencia. Puede determinarse para todos los niveles de datos: nominal, ordinal, de intervalo y de razn. No se ve afectada por valores muy altos o muy bajos. Al igual que la mediana, puede utilizarse como medida de tendencia central para distribuciones con clases de extremo abierto.

o o

Desventajas de la moda:

Para muchos conjuntos de datos no hay valor modal porque ningn valor aparece ms de una vez. Para algunos conjuntos de datos hay ms de una moda (bimodal = que tiene dos modas). 6. Media geomtrica: til para encontrar el promedio de porcentajes, razones, ndices o tasas de crecimiento. Se utiliza ampliamente en los negocios y la economa porque frecuentemente interesa encontrar el cambio porcentual en ventas, sueldos o cifras econmicas, como el Producto Nacional Bruto. MEDIDA GEOMTRICA MG = n (x1) (x2)...(xn) Siempre ser menor o igual a (nunca mayor que) la media aritmtica. Todos los valores de datos deben ser positivos. Una segunda aplicacin de la media geomtrica es encontrar un aumento porcentual promedio en un intervalo de tiempo: AUMENTO PORCENTUAL valor al final del periodo PROMEDIO EN UN MG = n - 1 PERIODO DADO valor al principio del periodo 7. Media, mediana y moda de datos agrupados: Con frecuencia los datos sobre ingresos, edades; etc, se agrupan y presentan en forma de una distribucin de frecuencias. Resulta imposible obtener los datos originales. Para obtener un valor representativo para los datos, es necesario estimarlo con base en una distribucin de frecuencias.

Media: las observaciones en cada clase son representadas por el punto medio de sta. Se calcula con: fX

MEDIA ARITMTICA DE DATOS AGRUPADOS X = n Donde: X designa la media aritmtica. X es el valor central, o punto medio, de cada clase.

f frecuencia de cada clase. fX frecuencia en cada clase multiplicada por el punto medio de sta. n nmero total de frecuencias. Para encontrar el punto medio de una clase especfica, se suman los lmites superior e inferior de la clase y el resultado lo dividimos entre dos. Continuamos con el proceso de multiplicar el punto medio de la clase por la frecuencia para cada clase y despus se suman estos productos. La media de datos agrupados en una distribucin de frecuencias puede ser diferente de la de datos reales. La agrupacin resulta en alguna prdida de informacin.

o o

Mediana: una vez que los datos originales se han organizado en una distribucin de frecuencias, parte de la informacin nos es identificable. No es posible determinar la mediana exacta, puede estimarse:

Localizando la clase en la que se encuentra la mediana, y despus, interpolando dentro de esa clase para obtener tal valor. Los elementos de la clase en que se encuentra la mediana estn espaciados de manera uniforme por toda la clase. Su frmula es: n _ FA 2 Mediana = L + (i) f Donde: L lmite inferior de la clase que contiene a la mediana n n total de frecuencias f frecuencia de la clase antes mencionada FA n acumulativo de frecuencias en todas las clases que preceden inmediatamente a la clase en cuestin (con la mediana) i es el ancho de la clase en que se encuentra la mediana La mediana se basa slo en las frecuencias y los lmites de la clase que contiene la mediana, es posible determinarla si se dan frecuencias porcentuales en vez de las frecuencias absolutas. Puede determinarse para distribuciones con extremos abiertos.

Moda: el punto promedio de la clase modal es la moda estimada. Es el valor que ocurre con ms frecuencia. Si el conjunto de datos tiene mas de dos modas, se llama distribucin multimodal.

8. Seleccin de un promedio para datos de una distribucin de frecuencias: Distribucin simtrica

(sesgo cero) Frecuencias 20 Aos Moda = Media = Mediana Distribucin con asimetra positiva Frecuencia Sesgo hacia la derecha (simetra positiva) Moda Mediana Media $300 a $500 $600 Distribucin negativamente asimtrica Frecuencias Sesgo hacia la izquierda (asimetra negativa) Media Moda Mediana 1200 1800 3000 4

También podría gustarte