Está en la página 1de 32

Medidas de la tendencia central y de la dispersin

Tendencia central Datos no agrupados Media aritmtica Mediana

Dispersin Datos no agrupados Recorrido Desviacin media absoluta Varianza y desviacin tpica Percentiles Datos agrupados Percentiles Varianza y desviacin tpica

Moda
Media aritmtica ponderada Media geomtrica Datos agrupados

Media aritmtica
Mediana Moda Conceptos relacionados

Teorema Chebyshev

de

Regla emprica

Sesgo

Coeficiente variacin

de

Medidas de la tendencia central y de la dispersin

Las medidas de tendencia central ttienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias muestras.

Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se denomina medida o parmetro de tendencia central o de centralizacin.

MEDIA ARITMETICA

Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el nmero total de datos. Solo es aplicable para el tratamiento de datos cuantitativos.

Ejemplo Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

MEDIANA

Mediana (Me): Valor que divide una serie de datos en dos partes iguales. La cantidad de datos que queda por debajo y por arriba de la mediana son iguales.

Ejemplo:
Encontrar la mediana para los siguientes datos: 41234221553 SOLUCIN 1: Ordenar los datos. 11222334455 2: Localizar el valor que divide en dos parte iguales el nmero de datos. 11222334455 La mediana es 3, dejando 5 datos a cada lado.

MODA

La moda es el valor que se presenta con mayor frecuencia en un conjunto de datos. a una distribucion que tiene una sola moda se le denomina unimodal, si tiene dos datos que se repiten igualmente, se le conoce como bimodal, y si tiene tres o mas modas se le conoce como multimodal. si ningun dato se repite, entonces no tiene moda.

ejemplo: hallar la moda del siguiente conjunto de datos. 14,15,16,18,5,7,5,9,15,5. se ordenan: 5,5,5,7,9,14,15,15,16,18. la moda es igual a 5..

MEDIA ARITMETICA PONDERADA

Tiene en cuenta la importancia relativa de las observaciones, es superior a la media aritmtica simple

MEDIA GOMETRICA

En matemticas y estadstica, la media geomtrica de una cantidad arbitraria de nmeros (digamos n nmeros) es la raz nsima del producto de todos los nmeros.

Por ejemplo, la media geomtrica de 2 y 18 es

DATOS AGRUPADOS

En la mayor parte de casos tenemos un nmero grande de datos y tomamos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La frmula para el clculo cuando se trata de datos agrupados es diferente a la de los no agrupados.

MEDIA ARITMETICA

La media aritmtica es igual a la divisin de la sumatoria del producto de las clases por la frecuencia sobre el nmero de datos.

Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la media es:

MEDIANA

En el mbito de la estadstica, una mediana es el valor de la variable que deja el mismo nmero de datos antes y despus que l, una vez ordenados estos.

EJEMPLO Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase viene dada por la siguiente tabla: Calificaciones 1 2 3 4 5 6 7 8 9 Nmero de alumnos 2 2 4 5 8 9 3 4 2 Se halla las frecuencias absolutas acumuladas .Asociada a la mediana para n impar, se obtiene . Ni-1< n/2 < Ni = N19 < 19.5 < N20 Me = 5 puntos, la mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms.

MEDIDAS DE DISPERSIN

Se llaman medidas de dispersin aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentraci n de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas.

La dispersin es importante porque:

Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin central es menos representativa de los datos.

Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersin antes de abordar esos problemas.

Datos no agrupados

Datos no agrupados es el conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados, para obtener informacin directamente de ellos.

Ejemplo: 5,7,2,15,2,6,12,5,5,20,10. numero de personas que ayudaron a una causa.

EL RANGO O RECORRIDO ( R ):

Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el rango se define como la diferencia entre el valor ms alto (Xn Xmax.) y el mas bajo (X1 Xmin) en un conjunto de datos.

Rango para datos no agrupados; R = Xmx.-Xmn = XnX1

Ejemplo: Se tienen las edades de cinco estudiantes universitarios de 1er ao, a saber: 18,23, 27,34 y 25., para calcular la media aritmtica (promedio de las edades, se tiene que: R = Xn-X1 ) = 34-18 = 16 aos

Desviacin media absoluta

La desviacin media es la media de las diferencias en valor absoluto de los valores a la media.

Este valor estadstico no es de mucha utilidad en estadstica debido a que no es fcil manipular dicha funcin al no ser derivable. Siendo ms formales, la desviacin media debera llamarse desviacin absoluta respecto a la media, para evitar confusiones con otra medida de dispersin, la desviacin absoluta respecto a la mediana, DM, cuya frmula es la misma, sustituyendo la media aritmtica por la mediana M. Pero tal precisin no es relevante, porque la desviacin absoluta respecto a la mediana es de uso todava menos frecuente.

Ejemplo: Desviacin media para datos no agrupados Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al alumno ms idneo para representar al colegio en un torneo a nivel nacional. El nmero de preguntas buenas por materia se muestra a continuacin:
Materia 1 Carlos 2 Pedro 7 Juan 5

2
3 4 5 6 7 8 9 10

9
10 2 3 1 9 9 1 4

2
2 6 6 3 6 7 6 5

6
5 5 5 5 4 5 6 4

SOLUCIN Lo primero que analizaremos es la media de los puntajes para cada uno de los alumnos, con el fin de determinar el alumno con mayor promedio de preguntas buenas. Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5 preguntas correctas por prueba. Cul sera entonces el indicador diferenciador entre los alumnos?. Complementemos el anlisis anterior calculando la desviacin media: Carlos muestra una desviacin media de 3,9 indicando que los datos se alejan en promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variacin (2,9), siendo Juan el que menos variacin presenta con 0,9 preguntas tanto por arriba como por debajo de la media aritmtica. Se recomienda al colegio elegir como ganador en este caso a Juan, presenta resultados ms constantes que los otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una variacin muy baja (rondando entre 4 y 6).

CENTILES O PERCENTILES

Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o clasificacin de las personas cuando atienden caractersticas tales como peso, estatura, etc. Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,..., percentil 99.

DATOS AGRUPADOS

En la mayor parte de casos tenemos un nmero grande de datos y tomamos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La frmula para el clculo cuando se trata de datos agrupados es diferente a la de los no agrupados.

PERCENTILES:

Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados.

Para datos agrupados los deciles se calculan mediante la frmula.

k= 1,2,3,... 9 Donde: Lk = Lmite real inferior de la clase del decil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k

c = Longitud del intervalo de la clase del decil k

EJEMPLO.- Determinacin del primer cuartil, el sptimo decil y el 30 percentil, de la siguiente tabla: Como son datos agrupados, se utiliza la frmula
Salarios (I. De Clases) 200-299 300-299 400-499 500-599 600-699 700-800 No. De Empleados (f1) 85 90 120 70 62 36 85 175 295 365 427 463 fa

Como son datos agrupados, se utiliza la frmula

Siendo

Varianza

El cuadrado de la desviacin estndar recibe el nombre de varianza y se representa por . La suma de los cuadrados de los desvos de la totalidad de las observaciones, respecto de la media aritmtica de la distribucin, es menor que la suma de los cuadrados de los desvos respecto de cualquier otro valor que no sea la media aritmtica.

El coeficiente variacin:

de

Para comparar la dispersin de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamao de los datos. Este coeficiente nicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razn.

Para comparar la dispersin de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamao de los datos. Este coeficiente nicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razn.

Teorema de Chebyshev: Para un conjunto cualquiera de observaciones (muestra o poblacin), la proporcin mnima de los valores que se encuentran dentro de k desviaciones estndares desde la media es al menos 1 - 1/k2, donde k es una constante mayor que 1.

Regla emprica: Para una distribucin de frecuencias simtrica de campana, aproximadamente 68% de las observaciones estar a ms y menos una desviacin estndar desde la media, aproximadamente 95% de tales observaciones se encontrar a ms y menos dos desviaciones estndares de la misma; y prcticamente todas las observaciones (99,7%) se hallarn a ms y menos tres desviaciones con respecto a la media.

SESGO
No todas las distribuciones son normales, algunas estn sesgadas a la izquierda o a la derecha, en ambos casos la moda es, por definicin aquella observacin que ocurre con ms frecuencia .por consiguiente esta en el pico de la distribucin ,por su propia naturaleza la media aritmtica resulta afectada, sobre todo, por observaciones extremas, as pues, est desviada a la direccin del sesgo ms que la mediana, que queda situada en algn punto entre la media aritmtica y moda.

El coeficiente de variacin

Para comparar la dispersin de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamao de los datos. Este coeficiente nicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razn.
Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado coeficiente de variacin (las barras del denominador representan el valor absoluto, es decir, indican que debe prescindirse de la unidad de medida de la media). A menor coeficiente de variacin consideraremos que la distribucin de la variable medida es ms homognea.

Ejemplo: Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 25. Cul de las dos presenta mayor dispersin?