Está en la página 1de 8

Medidas de tendencia central.

Una propiedad de una distribucin de puntajes es que tiene un promedio, es decir, un valor individual que es ms representativo de esa distribucin o conjunto de puntajes. Hay tres tipos de promedios o medidas de tendencia central: la media, la moda y la mediana La media. Es la sumatoria de un conjunto de puntajes dividida entre el nmero de puntajes. En repetidas ocasiones hemos calculado muchas medianas a lo largo de los aos pero se han llamado promedios, como la cantidad promedio de dinero que necesitamos para cubir nuestros gastos o llenar un tanque de gasolina de el automvil, o el promedio decimal de las calificaciones durante los ltimos tres semestres. La formula de la media es: = x/n Donde: = la media = Signo de sumatoria X= puntajes individuales n= tamao de la muestra

Para calcular la media, se siguen los siguientes pasos. Se suman todos los puntajes del grupo para obtener un total. Dividir el total de todos los puntajes entre el nmero de observaciones. Por ejemplo, el puntaje medio en la prueba de lectura para los primeros 10 estudiantes es 47.3. Los primeros 10 puntajes son 55, 41, 46, 58, 41,50 y 35. Su total es 473, y si lo dividimos entre 10 (el numero de observaciones), el resultado es 47. 3. En este ejemplo 47. 3 es el valor que mejor representa la posicin mas central del conjunto de 10 puntajes. Para los 200 puntajes del apndice B, la medida es de 48.6 en la prueba de lectura y de 47.4 en la de matemticas. Estos valores se calcularon del mismo modo, sumando los 200 puntajes y dividiendo el total entre el numero de puntajes del conjunto, 200. La media de cualquier variable se puede calcular empleando el mismo mtodo. La mediana. La mediana es el puntaje de una distribucin por arriba del cual se encuentra la mitad de los puntajes. Por ejemplo, es un conjunto de puntajes sencillos como 1, 3 y 5, la mediana es 3. Si se aadiera otro puntaje, digamos 7, la mediana seria el valor que est entre 3 y 5, o sea ,4. Aqu, 50 % de los puntajes queda arriba del 4 ( y, desde luego, 50% queda abajo). Para calcular cuando el numero de puntajes es impar, debemos de seguir estos pasos. Se ordenan los puntajes del ms bajo al ms alto.

Contar el nmero de puntajes. Escoja el puntaje que esta en medio como la mediana. Por ejemplo, aqu se ordenan los puntajes en 15 alumnos de segundo ao del valor ms bajo al ms alto. El octavo puntaje (el puntaje que ocupa la octava posicin en el grupo) es la mediana. En este caso, ese valor es 43. 31, 33, 35, 38, 40, 41,42, 43, 44, 46, 47, 48, 49, 50, 51 Para calcular la mediana si el numero (no la sumatoria) de puntajes del conjunto es par, debemos seguir estos pasos. Ordenar los puntajes del ms bajo al ms alto. Contar el nmero de puntajes. Calcular la media de los dos puntajes que estn en medio; esa es la mediana. Por ejemplo, los 14 puntajes siguientes se ordenaron del ms bajo al ms alto. La mediana se calcul sumndolos puntajes sptimo y octavo (los puntajes que ocupan las posiciones sptima y octava del grupo, 42 y 43) y dividiendo entre dos. El resultado es de 42.5. 31, 33, 35, 38, 40, 41,42, 43, 44, 46, 47, 48, 49, 50. La moda. La moda es el puntaje que ocurre con mayor frecuencia. No es el nmero de veces que ocurre el puntaje, si no el puntaje mismo. Si tenemos los nmeros siguientes. 58,27,24, 41, 27, 26, 41, 53,, 14, 29, 41, 53, 47, 28, 56. La moda es 41, numero 3 ( las veces que ocurre el numero 41). La moda es til principalmente en el caso de datos nominales como el sexo. Es el conjunto de datos de competencia, la moda para el sexo es femenino, ya que hay 105 mujeres y 96 hombres. La moda es una opcin excelente si se desea un panorama general de cual clase o categora ocurre con mayor frecuencia. Calculo de la media a partir de datos no agrupados. Una distribucin de frecuencias consta de datos agrupados en clases. Cada valor de una observacin cae dentro de algunas de las clases. Supongamos que tenemos una distribucin de frecuencias del saldo promedio mensual de la cuenta de cheques de 600 clientes de una sucursal bancaria. Apartir de la informacin de la tabla, podemos calcular fcilmente una estimacin del valor de la media de estos datos agrupados. Es una estimacin por que utlizamos los 600 datos puntuales de la muestra. De haber usado los datos originales sin agrupar, podramos haber

cualculado el valor real de la media, pero solo despus de obtener el promedio de los 600 valores individuales. Para encontrar la media aritmtica de datos agrupados, primero calculamos el punto medio de cada clase. Para lograr que los puntos medios queden en cifras cerradas redondeamos las cantidades. A si, por ejemplo el punto medio de la primera clase, 24.995, se convierte en 25.00. despus multiplicamos cada punto medio por la frecuencia de las observaciones de dicha clase, sumamos todos los resultados y dividimos esta suma entre el numero total de observaciones de la muestra. La formula es la siguiente.

Donde:

= media de la muestra. = smbolo que significa suma de. F=frecuencia (numero de observaciones) de cada clase. X= punto medio de cada clase de muestra. n= numero de observaciones en la muestra.

Deciles, cuartiles y percentiles. Cuartiles. Para calcular los cuartiles se divide la distribucin en cuatro partes, de tal manera que cada una contenga igual numero de observaciones, es decir el 25% de las observaciones. Se denominan cuartiles a los tres valores que separan a la frecuencia total de la distribucin dividida en cuatro partes iguales. El valor central es igual a la mediana y corresponde al segundo cuartil. El cuartil inferior (Q) es aquel valor de la variable que supera al 25% de las observaciones y a la vez, es superado por el restante 75%. El segundo cuartil (Q) es aquel valor de la variable que supera al 50 % y a la vez es superado por el otro 50% de las observaciones. ( mediana) El tercer cuartil (Q) es aquel valor de la variable que supera al 75 % y es superado por el 25% de las observaciones. Deciles Si en vez de dividir la distribucin en cuatro partes iguales, la dividimos en 10 partes, se tendrn nueve valores que dividen la frecuencia total en diez partes iguales.

Percentil. Si deseamos dividir la dsitribucion en cien partes con igual numero de observaciones, se tendrn 99 valores de la variable que separan a la frecuencia total de la distribucin divididas en 100 partes iguales.

Medidas de dispersin Las medidas de dispersin permiten calcular la representatividad de un promedio (media o mediana) para lo cual ser preciso cuantificar la distancia de los diferentes valores de la distribucin respecto a dicho promedio. Las medidas de dispersin mas conocidas son: Varianza (s) se define como:

Donde x son los valores de la variable X, de las n respectivas frecuencias absolutas, aritmtica y N el numero total de elementos ,

la media

La varianza indica as la mayor o menor dispersin de los valores de la variable respecto a la media aritmtica; es decir, mostrar el grado de representatividad de dicho promedio. Desviacin estndar: Un inconveniente de la varianza radica en que sus unidades se corresponden, no con la de la variable, si no con las de las variables elevadas al cuadrado, lo cual puede dificultar considerablemente su interpretacin. Por ello se utiliza la desviacin tpica. La desviacin tpica es la raz cuadrada con signo positivo de la varianza; es decir,

Al ser la desviacin tpica la raz cuadrada de varianza su dimensin coincide con al de la variable, por lo cual resulta mas apta como medida de la dispersin de una distribucin.

Cuando para una distribucin de frecuencias, se conoce como media aritmtica y la desviacin tpica, es posible, mediante una sencilla trasformacin, conseguir una nueva distribucin en la que la variable es Z (trasformada), denominada tipificada, se obtendran como:

Parmetros de dispersin. Informan de las desviaciones que sufren los datos al respecto de los valores centrales en especial con relacin a la media aritmtica. Los parmetros de dispersin ms usuales se describen a continuacin. Rrecorrido. Recorrido o rango de una variable estadstica es la diferencia entre el mayor y menor valor de los datos observados. Se representa con R. Asi se tiene: R= X ms - X mn.

En la misma lnea y en casos particulares suele utilizar el recorrido intercuartlico. Dicho recorrido es la diferencia entre los cuartiles tercero y primero representados por: R= Q - Q. Desviacin media: Se denomina desviacin media de una variable estadstica a la media de los valores absolutos de las desviaciones de los datos o marcas de clase respecto a la media aritmtica. Se representa por DM. La expresin qu permite calcular la desviacin media es la siguiente:

Cuartiles. Para calcular los cuartiles se divide la distribucin en cuatro partes, de tal manera que cada una contenga igual numero de observaciones, es decir el 25% de las observaciones. Se denominan cuartiles a los tres valores que separan a la frecuencia total de la distribucin dividida en cuatro partes iguales. El valor central es igual a la mediana y corresponde al segundo cuartil.

El cuartil inferior (Q) es aquel valor de la variable que supera al 25% de las observaciones y a la vez, es superado por el restante 75%. El segundo cuartil (Q) es aquel valor de la variable que supera al 50 % y a la vez es superado por el otro 50% de las observaciones. ( mediana) El tercer cuartil (Q) es aquel valor de la variable que supera al 75 % y es superado por el 25% de las observaciones. Para calcular los cuartiles, se utlizan las siguientes reglas: Regla 1. Si el resultado es un nmero entero, entonces el cuartil es igual al valor clasificado. Por ejemplo, si el tamao de la muestra es n=7, el primer cuartil Q es igual a (7+1)/4 = al segundo valor clasificado. Regla 2. Si el resultado es una fraccin de mitad (2.5, 4.5 etc), entonces el caurtil es igual al promedio de los valores clasificados correspondientes. Por ejemplo, si el tamao de la muestra es n=9, el primer cuartil Q es igual al valor clasificado como (9 +1)/4=2.5, la mitad entre los valores clasificados como segundo y tercero. Regla 3. Si el resultado no es un numero entero ni una fraccin de mitad, se redondea el entero ms cercano y se selecciona ese valor clasificado. Por ejemplo, si el tamao de la muestra es n=10, el primer cuartil Q es igual a ( 10+1)/4= al valor clasificado como 2.75. Se redondea el 2.75 a 3 y se utiliza el valor clasificado como el tercero. La media. Es la sumatoria de un conjunto de puntajes dividida entre el nmero de puntajes. En repetidas ocasiones hemos calculado muchas medianas a lo largo de los aos pero se han llamado promedios, como la cantidad promedio de dinero que necesitamos para cubir nuestros gastos o llenar un tanque de gasolina de el automvil, o el promedio decimal de las calificaciones durante los ltimos tres semestres. La formula de la media es: = x/n Donde: = la media = Signo de sumatoria X= puntajes individuales n= tamao de la muestra

Para calcular la media, se siguen los siguientes pasos. Se suman todos los puntajes del grupo para obtener un total. Dividir el total de todos los puntajes entre el nmero de observaciones.

Por ejemplo, el puntaje medio en la prueba de lectura para los primeros 10 estudiantes es 47.3. Los primeros 10 puntajes son 55, 41, 46, 58, 41,50 y 35. Su total es 473, y si lo dividimos entre 10 (el numero de observaciones), el resultado es 47. 3. En este ejemplo 47. 3 es el valor que mejor representa la posicin mas central del conjunto de 10 puntajes. Para los 200 puntajes del apndice B, la medida es de 48.6 en la prueba de lectura y de 47.4 en la de matemticas. Estos valores se calcularon del mismo modo, sumando los 200 puntajes y dividiendo el total entre el numero de puntajes del conjunto, 200. La media de cualquier variable se puede calcular empleando el mismo mtodo. La distribucin normal. La distribucin normal fue reconocida por primera vez por el francs Abraham de Moivre (16671754). Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y formul la ecuacin de la curva; de ah que tambin se la conozca, ms comnmente, como la "campana de Gauss". La distribucin de una variable normal est completamente determinada por dos parmetros, su media y su desviacin estndar, denotadas generalmente por esta notacin, la densidad de la normal viene dada por la ecuacin: y . Con

Ecuacin 1: Que determina la curva en forma de campana que tan bien conocemos. As, se dice que una caracterstica sigue una distribucin normal de media y varianza , y se denota

como , si su funcin de densidad viene dada por la Ecuacin 1. Al igual que ocurra con un histograma, en el que el rea de cada rectngulo es proporcional al nmero de datos en el rango de valores correspondiente si, tal , en el eje horizontal se levantan perpendiculares en dos puntos a y b, el rea bajo la curva delimitada por esas lneas indica la probabilidad de que la variable de inters, X, tome un valor cualquiera en ese intervalo. Puesto que la curva alcanza su mayor altura en torno a la media, mientras que sus "ramas" se extienden asintticamente hacia los ejes, cuando una variable siga una distribucin normal, ser mucho ms probable observar un dato cercano al valor medio que uno que se encuentre muy alejado de ste. Propiedades de la distribucin normal: La distribucin normal posee ciertas propiedades importantes que conviene destacar: 1. Tiene una nica moda, que coincide con su media y su mediana. 2. La curva normal es asinttica al eje de abscisas. Por ello, cualquier valor entre y es tericamente posible. El rea total bajo la curva es, por tanto, igual a 1. 3. Es simtrica con respecto a su media . Segn esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor.

4. La distancia entre la lnea trazada en la media y el punto de inflexin de la curva es igual a una desviacin tpica ( ). Cuanto mayor sea , ms aplanada ser la curva de la densidad. 5. El rea bajo la curva comprendido entre los valores situados aproximadamente a dos desviaciones estndar de la media es igual a 0.95. En concreto, existe un 95% de posibilidades de observar un valor comprendido en el intervalo . 6. La forma de la campana de Gauss depende de los parmetros y (Figura 3). La media indica la posicin de la campana, de modo que para diferentes valores de la grfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviacin estndar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en torno a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribucin. Como se deduce de este ltimo apartado, no existe una nica distribucin normal, sino una familia de distribuciones con una forma comn, diferenciadas por los valores de su media y su varianza. De entre todas ellas, la ms utilizada es la distribucin normal estndar, que corresponde a una distribucin de media 0 y varianza 1. As, la expresin que define su densidad se puede obtener de la Ecuacin 1, resultando:

Es importante conocer que, a partir de cualquier variable X que siga una distribucin , se puede obtener otra caracterstica Z con una distribucin normal estndar, sin ms que efectuar la transformacin:

Ecuacin 2: Esta propiedad resulta especialmente interesante en la prctica, ya que para una distribucin existen tablas publicadas a partir de las que se puede obtener de modo sencillo la probabilidad de observar un dato menor o igual a un cierto valor z, y que permitirn resolver preguntas de probabilidad acerca del comportamiento de variables de las que se sabe o se asume que siguen una distribucin aproximadamente normal.

También podría gustarte