Está en la página 1de 11

TEMA 3: LAS MEDIDAS DE POSICIN E DISTRIBUCIONES UNIDIMENSIONALES 3.1.

INTRODUCCIN Las distribuciones de frecuencias de una variable estadstica pueden estudiarse a travs de unas medidas, que se conocen con el nombre genrico de estadsticos y que, analizadas conjuntamente, nos dan un panorama sobre las caractersticas de la distribucin. Los ms habituales son:

3.2. LA MEDIA ARITMTICA 3.2.1. La media aritmtica simple Suele denotarse por Se lee como el sumatorio de todos los valores de x desde el primero (i = 1) hasta el ltimo (i = n)

3.2.2. La media aritmtica ponderada por las frecuencias En las distribuciones de tipo II o de tipo III es necesario utilizar las frecuencias para obtener la media aritmtica.

En el caso de que los datos estn agrupados en clases, es decir, en las distribuciones de tipo III, se opera igual, tomando la marca de clase mi como xi. (Ver ejemplo 3.3)

3.2.3. La media aritmtica ponderada por coeficientes En ocasiones resulta conveniente introducir un coeficiente de ponderacin que de mayor peso a algunos valores de la variable. Estos coeficientes o pesos suelen denominarse wi

Para las distribuciones de tipo II y III sera:

Ver ejemplos 3.5 y 3.6. 3.2.4. Propiedades de la media aritmtica 1. La suma de las desviaciones de todos los valores respecto a su media aritmtica es cero

2. Si multiplicamos o dividimos todas las observaciones por un mismo nmero, lo que se conoce como cambio de escala, la media queda multiplicada o dividida por dicho nmero. 3. Si le sumamos a todas las observaciones un mismo nmero, lo que se conoce como cambio de origen, la media aumentar en dicha cantidad. Como consecuencia de estas dos ltimas propiedades, s a la variable estadstica xi la sometemos al mismo tiempo a un cambio de origen Ot y a un cambio de escala C mediante la transformacin
, (siendo

Ot y C constantes), resulta que:

Esta propiedad es bastante utilizada para la simplificacin de los clculos cuando los valores observados son muy elevados y tienen un mximo comn divisor. (Ver ejemplo 3.8) 3.2.5. Ventajas e inconvenientes de la media aritmtica Ventajas: Se trata de un concepto familiar para la mayora de las personas y es intuitivamente claro. Es calculable en todas las variables, es decir siempre que nuestras observaciones sean cuantitativas. Para su clculo se utilizan todos los valores de la distribucin. Es nica para cada distribucin de frecuencias. Tiene un claro significado, ya que al ser el centro de gravedad de la distribucin representa todos los valores observados. Es til para llevar a cabo procedimientos estadsticos como la comparacin de medias de varios conjuntos de datos.

Inconvenientes: Que es un valor muy sensible a los valores extremos, con lo que n las distribuciones con gran dispersin de datos puede llegar a perder totalmente su significado. Que no es calculable cuando los parmetros son cualitativos. Podemos tener dificultades para su clculo en distribuciones de tipo III con intervalos abiertos; en estos casos es necesario estimar una marca de clase para poder calcular la media y sta nos vara s cambiamos la marca de clase.

3.3. MEDIA GEOMTRICA Es la raz de ndice N del producto de las observaciones elevado a sus respectivas frecuencias. Para distribuciones unitarias o distribuciones de tipo I:

En distribuciones no unitarias:

Slo se puede calcular si no hay observaciones nulas, tambin puede no tener sentido su clculo cuando algn valor es negativo, ya que podemos obtener nmeros irracionales. Debe emplearse cuando los valores e la variable no son de naturaleza aditiva (tasas, tipos de inters, porcentajes, nmeros ndices, etc.) Ventajas:

En su determinacin intervienen todos los valores de la distribucin. Es menos sensible que la media aritmtica cuando la distribucin tiene valores extremos. Es ms representativa que la media aritmtica cuando la distribucin evoluciona de forma acumulativa o con efectos multiplicativos. Cuando la distribucin no tiene valores nulos, su valor est definido de forma objetiva y es nico.

Inconvenientes: Su significado es menos intuitivo que la media aritmtica. La mayor complicacin de los clculos. Su indefinicin (da nmeros con naturaleza imaginaria) cuando tiene valores negativos y su valor nulo cuando una observacin toma este valor.

Exigir normalmente la utilizacin de logaritmos o de programas informticos.

Y en neperianos:

3.4. MEDIA ARMNICA La media armnica de N observaciones es la inversa de la media de las inversas de las observaciones; suele denotarse con la letra H. Para distribuciones unitarias o de tipo I:

Para distribuciones de tipo II:

Su utilizacin es bastante poco frecuente y slo debe emplearse cuando la variable est medida en unidades relativas, por ejemplo, KM./h., es decir, para promediar velocidades, tiempos, rendimientos, etc. Ventajas: Est definida de forma objetiva y es nica. Para su clculo tiene en cuenta todos los valores de la distribucin.

Es ms representativa que otras medidas en los casos de obtener promedios de velocidades, rendimientos, productividades, etc. Los valores extremos tienen una menor influencia que en la media aritmtica.

Inconvenientes: Slo se puede calcular si no hay observaciones iguales a cero. Cuando la variable toma algunos valores muy pequeos puede carecer de significado.

3.5. RELACION ENTRE LAS MEDIAS ARMNICA, GEOMTRICA Y ARITMTICA

3.6. LA MEDIANA Las medias estudiadas hasta ahora son medidas que tratan de equilibrar los valores de una distribucin compensando los ms grandes con los ms pequeos para buscar su centro de gravedad o posicionamiento central; estos estadsticos tienen 2 problemas: Son muy sensibles a los valores extremos de las distribuciones de forma que cuando existe mucha dispersin los hacen poco representativos. Clculo de la mediana. No es posible calcularlos en las distribuciones cualitativas, para solucionarlo se calcula la moda.

La mediana de una distribucin de frecuencias, previamente ordenada en orden creciente o decreciente, se define como el valor central de la variable que divide la distribucin en dos partes iguales, es decir, es el valor que deja el mismo nmero de observaciones o de frecuencias a su izquierda que a su derecha. A. Clculo de la mediana en el caso de distribuciones de tipo I 1. Que el nmero de observaciones, N, sea impar:

2. Que el nmero de observaciones, N, sea par: En este caso hay 2 trminos centrales, y; la mediana ser la media aritmtica de esos 2 valores. (Ver ej:3.13)

B. Clculo de la mediana en las distribuciones de tipo II Es preciso ordenar los valores y trabajar con la frecuencia absoluta acumulada Ni, obteniendo en concreto el valor N/2. Se distinguen 2 casos: 1. Que exista un Ni iguala N/2: En este caso la mediana es la media aritmtica de Xi y del siguiente Xi+1, si la variable no admite decimales, la mediana seran los 2 valores, conjuntamente. 2. Cuando no existe un Ni que iguale a N/2, la mediana corresponde al primer Xi cuyo valor supere al de N/2.

C. Clculo de la mediana en las distribuciones de tipo III o agrupadas por intervalos. 1. Si existe Ni que es igual a N/2, la mediana por convenio, es el lmite superior del intervalo mediano o intervalo en el que Ni = N/2

2. Si no existe un Ni = N/2, la mediana est en el siguiente intervalo, es decir en el primer intervalo cuya Ni supero a N/2; diremos que dicho intervalo es el intervalo mediano. (Ver ej: 3.16)

Ventajas: Es la medida ms representativa en el caso de las variables cualitativas o atributos. Su clculo es sencillo. Tiene una fcil interpretacin No es sensible a los valores extremos de la distribucin.

Inconvenientes: En su determinacin no se tienen en cuenta todos los valores de la variable; puede constituir una ventaja, ya que es posible su clculo cuando no se conocen los valores extremos pero s su frecuencia.

3.7. LA MODA La moda es el valor de la variable que se repite ms veces; suele designarse por M o y se define como el valor de la variable que presenta mayor frecuencia absoluta. Cuando existan varios valores en esta situacin se dice que la distribucin es bimodal, trimodal o multimodal. Se diferencian entre moda o modas absolutas y moda o modas relativas Un valor de una variable constituye una moda relativa cuando su frecuencia absoluta no es superada por la de sus valores contiguos.

Obtencin de la moda en los 3 tipos de distribuciones: A. En las distribuciones de frecuencias de tipo I no tiene sentido hablar de moda, ya que las frecuencias absolutas son todas unitarias. B. Para obtener la moda de las distribuciones de tipo II basta con observar la columna de las ni. C. En las distribuciones de tipo II, es decir, cuando los datos estn agrupados en clases o intervalos pueden darse 2 supuestos: a) Que los intervalos sean de igual amplitud, en este caso la moda absoluta se situar en el intervalo que presente mayor frecuencia absoluta y las modas relativas en el intervalo o intervalos que superen la frecuencia absoluta de los intervalos contiguos. Para determinar el valor exacto de la moda podramos optar por considerar la marca de clase del intervalo o proceder a prorratear un valor dentro del intervalo.

b) Que los intervalos tengan distinta amplitud: Para este caso es necesario obtener un ratio de densidad de frecuencia (frecuencia absoluta dividida por amplitud del intervalo); el intervalo con mayor valor en este ratio constituir el intervalo modal. Es imprescindible para evitar situaciones de desequilibrio que pudieran desvirtuar el propio concepto, inters e interpretacin de la moda. Para hallar el punto modal exacto lo ms habitual es operar con la siguiente expresin:

Ventajas: Puede obtenerse en todas las distribuciones (cuantitativas como cualitativas), ya que siempre es posible determinar el valor, la categora o la modalidad que ms se repite. Su clculo es sencillo. Fcil interpretacin estadstica, a que nos da el valor o modalidad que ms se repite.

Inconveniente: En su determinacin no intervienen todos los valores de la distribucin, centrndonos slo en la mayor frecuencia absoluta de un determinado valor de la variable o de la modalidad de los atributos.

3.8. MEDIDAS DE POSICION NO CENTRALES: LOS CUANTILES Los cuantiles son los valores de la variable que dividen una distribucin de frecuencias en partes iguales. Los ms habituales son: Cuartiles, son 3 valores que dividen la serie de datos en cuatro partes iguales. La mediana coincide con el segundo cuartil divide la distribucin en dos partes iguales. Quintiles, son 4 valores que dividen la distribucin en 5 partes iguales. Deciles, son nueve valores que dividen la distribucin en 10 partes iguales. Percentiles, que son 99 valores que dividen la distribucin en cien partes iguales.

Considerando N el nmero de datos de la distribucin, o frecuencia absoluta acumulada, con carcter general los cuantiles se obtienen con la expresin , en la que r indica el cuantil correspondiente (r = 1, primer cuantil, r = 2, segundo cuantil, etc.) y q el nmero de intervalos con iguales frecuencias en los que se pretende dividir la distribucin (si q = 4 hablamos de cuartiles, si q = 10 de percentiles, etc.). Para distribuciones agrupadas en intervalos utilizamos la siguiente expresin:

Algunos programas informticos no utilizan los mismos criterios o algoritmos indicados con anterioridad; en concreto, la Excel considera a todas las distribuciones como si fueran continuas

y sita los cuartiles no el valor de la variable cuya frecuencia absoluta acumulada supera al establecido por el cuartil, sino en un punto intermedio que obtiene mediante un algoritmo particular. (Ver ejemplo 3.24).

3.9. MEDIDAS DE POSICION ROBUSTAS Tratan de paliar los problemas de estimacin asociados a distribuciones anmalas, siendo estadsticos que funcionan bien para varios tipos distintos de distribuciones tericas, aunque pueden no ser el mejor estimador para ningn tipo concreto de distribucin siendo, por tanto, el mejor compromiso. 3.9.1. La media k-recortada Es la media de los datos que quedan despus de eliminar el k por ciento de los datos ms grandes y k por ciento de los datos ms pequeos. A la media recortada al 25% se le denomina centrimedia. La media recortada al 0% es igual a la media aritmtica.

3.9.2. La media k-winsorizada En lugar de prescindir de los k por ciento datos ms grandes y ms pequeos, se sustituyen por el valor mayor y menor de los datos restantes. 3.9.3. La trimedia Es un ndice de tendencia central que consiste en calcular una media aritmtica ponderada de tres medidas, la Mediana (con peso doble) (Ver ejemplo 3.25)

3.10 MOMENTOS DE UNA DISTRIBUCIN UNIDIMENSIONAL DE FRECUENCIAS Los momentos son medidas que caracterizan a una distribucin de frecuencias y que tienen como principal utilidad su condicin de operadores para el clculo simplificado de las medidas de posicin, dispersin o forma de una distribucin; tambin tienen una importante utilidad para efectuar las regresiones estadsticas. Existen dos clases: Respecto al origen, que se representan con ah

Los momentos centrales o respecto a la media, se representan con mh

Al momento de orden 2 respecto a la media m2, se le denomina varianza, constituye la medida de dispersin ms utilizada. Puede demostrarse, utilizando el desarrollo del Binomio de Newton, que los momentos respecto a la media estn relacionados con los momentos respectos al origen

3.11. LAS FUNCIONES ESTADSTICAS EN HOJA DE CLCULO EXCEL Y EN SPSS 3.11.1 Las funciones estadsticas en Excel Las funciones que incorpora la hoja de clculo son herramientas especiales que realizan clculos complejos, lo que nos permite llevar a cabo acciones y ejecutar operaciones que nos devuelven valores de forma automtica. Los grupos de funciones son los siguientes: Financieras, ejecutan funciones sobre valores. Desarrollan clculos sobre amortizaciones, prstamos, intereses, etc. Fecha y hora. Devuelven informacin cronolgica. Matemticas y trigonomtricas: Es una lista de funciones de clculo numrico, operaciones con matrices, trigonometra, etc. Estadsticas: Funciones de clculo probabilstico, tendencias, desviaciones, distribuciones, estimaciones, etc. Bsqueda y referencia. Devuelven informacin sobre celdas, rangos de celdas y posiciones y trabajan con stas. Base de Datos. Extraen informacin, manipulan y operan sobre listas. Texto. Convierten a datos tipo texto cualquier tipo de datos y operan con los caracteres de las cadenas de texto. Lgicas. Devuelven valores lgicos. Informacin. Ofrecen informacin de Microsoft Excel.

Funciones estadsticas ms empleadas en Excel ESTADISTICA Media Media geomtrica Media armnica Mediana Moda Suma Cuenta K-simo mayor K-simo menor FORMULACIN =PROMEDIO(rango) =MEDIA.GEOM(rango) =MEDIA.ARMO(rango) =MEDIANA(rango) =MODA(rango) =SUMA(rango) =CONTAR(rango) =K.ESIMO.MAYOR(rango;k) =K.ESIMO.MENOR(rango;k) =SI(prueba_lgica;valor_si_verdadero;valor_si_falso) =FRECUENCIA(matriz_datos;matriz_clases) =CONTAR.SI(rango;criterio) =SUMAR.SI(rango;criterio;rango_suma)

LA MACRO HERRAMIENTAS DE EXCEL PARA ANLISIS ESTADSTICO La hoja de clculo Excel dispone tambin de una opcin MACRO que facilita la rpida obtencin de mltiples estadsticos descriptivos. La forma de ver si la opcin est activada es mirar en el men Herramientas y comprobar que se encuentra el texto Anlisis de datos. En

caso de no encontrar esta opcin activada tendremos que cargar la macro Herramientas para anlisis, dentro del apartado Macros automticas. Las posibilidades de esta macro son muy amplias, en este apartado nos quedaremos con la opcin de Estadstica Descriptiva. Dicha opcin Genera un informe de estadsticas de una sola variable para datos del rango de entrada, y proporciona informacin acerca de la tendencia central y dispersin de los datos. En concreto, genera informacin tanto sobre la Media, la Mediana y la Moda, como sobre los estadsticos de dispersin, concentracin y forma (error tpico, la desviacin estndar, la varianza de la muestra, el coeficiente de Curtosis, el coeficiente de asimetra, el rango, el valor mnimo, el valor mximo, etc.) (Ver ejemplo pg. 153). EL MEN DATOS Ordenar datos Los datos en una lista estn organizados de tal manera que las filas definen registros y las columnas los campos que constituyen la informacin de los registros. Se pueden seleccionar hasta 3 criterios para ordenar la base de datos y dentro de cada uno de ellos por orden de presentacin (ascendente o descendente). Hay que tener presente: En las operaciones de ordenacin se ha de tener cuidado con las celdas que contienen frmulas. Si se ordena por filas, despus de la ordenacin, las referencias a celda de la misma fila sern correctas pero no lo sern las referencias a otras filas. Si es por columnas, las referencias a celdas de la misma columna sern correctas despus de ordenar, pero sern incorrectas las frmulas que hacen referencia a otras columnas. Una forma de evitar este problema es incluir en las frmulas que se encuentran fuera de lista, slo referencias absolutas. Si ordenamos por filas (columnas) debemos evitar las frmulas que hagan referencia a otras filas (columnas).

3.11.2 Las funciones estadsticas en SPSS Analizaremos 3 funciones de inters: la transformacin de datos, la gestin y transformacin de ficheros de datos y la generacin de estadsticos descriptivos. La transformacin de datos El anlisis preliminar de la informacin a estudiar puede revelar esquemas de codificacin poco prcticos o errores de codificacin, o bien pueden requerirse transformaciones de los datos para trabajar posteriormente una mejor relacin entre las variables. SPPS puede realizar transformaciones de los datos de todo tipo, desde tareas sencillas, como la agrupacin de categoras para su anlisis posterior, hasta otras ms avanzadas, como la creacin de nuevas variables basadas en ecuaciones complejas e instrucciones condicionales. Para realizar el clculo de nuevas variables, utilice el cuadro de dilogos Calcular para calcular los valores de una variable basndose en transformaciones numricas de otras variables; con el mismo: Puede calcular valores para las variables numricas o de cadena (alfanumricas).

Puede crear nuevas variables o bien reemplazar los valores de las variables existentes. Para las nuevas variables, tambin se puede especificar el tipo y la etiqueta de variables. Puede calcular valores de forma selectiva para subconjuntos e datos basndose en condiciones lgicas. Puede utilizar ms de 70 funciones preincorporadas, incluyendo funciones aritmticas, funciones estadsticas, funciones de distribucin y funciones de cadena.

Calcular variable: Si los casos, permite aplicar transformaciones de los datos para subconjuntos de casos seleccionados utilizando expresiones condicionales. Una expresin condicional devuelve el valor verdadero, falso o perdido.

La gestin y transformacin de ficheros Ordenar datos Transponer casos y variables Fundir archivos Seleccionar subconjuntos de casos. Agregar datos. Ponderar datos Reestructurar datos.

La generacin de estadsticos descriptivos SUM (A) : Halla la suma de las observaciones de la variable A SUM (A, B, C,) : Halla el vector de las sumas de las observaciones de las variables A, B, C MEAN (A) : Halla la media de la variable A MEAN (A, B, C, ) : Halla el vector de las medias de las variables A, B, C, LAG(numvar;n): Desplaza el comienzo de la variable numrica numvar n posiciones hacia delante y sustituye las n primeras posiciones por valores desaparecidos. Se trata de la tpica variable retardo de orden n.