Está en la página 1de 30

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓNMEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN Estadística sumaria.

Podemos usar una serie de números conocidos comoestadística sumariapara describir lascaracterísticas del conjunto de datos. Dos de estas características son de particular importanciapara los responsables de tomar decisiones: la de tendencia central y la de dispersión. Tendencia central:la tendencia central se refiere al punto medio de una distribución. Lasmedidas de tendencia central se conocen como medidas de posición. Dispersión:se refiere a la extensión de los datos en una distribución, es decir, al grado en quelas observaciones se distribuyen. Sesgo:las curvas que representan los puntos de datos de un conjunto de datos pueden ser simétricas o sesgadas. Las curvas simétricas, tienen una forma tal que una línea vertical quepase por el punto más alto de la curva dividirá el área de ésta en dos partes iguales. Cadaparte es una imagen espejo de la otra. En las curvas sesgadas, los valores de su distribuciónde frecuencias están concentrados en el extremo inferior o en el superior de la escala demedición del eje horizontal. Los valores no están igualmente distribuidos. Las curvas puedenestar sesgadas hacia la derecha (positivamente sesgadas) o sesgadas hacia la izquierda(negativamente sesgadas). Curtosis:cuando medimos la curtosis de una distribución, estamos midiendo su grado deagudeza. La media aritmética. Cuando nos referimos al "promedio" de algo, estamos hablando de la media aritmética. Para encontrar la media aritmética, sumamos los valores y el resultado lo dividimos entre elnúmero de observaciones. Símbolos convencionales. Una muestra de una población consiste ennobservaciones, con una media de x (léase equistestada). Las medidas que calculamos para una muestra se conocen comoestadística. La notación es diferente cuando calculamos medidas para la población entera, es decir, para elgrupo que contiene a todos los elementos que estamos describiendo. La media de unapoblación se simboliza con (letra griega mi). El número de elementos de una población sedenota con la letra mayúscula cursiva N. Por lo general, en estadística utilizamos letras delalfabeto latino para simbolizar la información sobre las muestras y letras del griego parareferirnos a la información sobre poblaciones. Cálculo de la media a partir de datos no agrupados. Media de la población: = x / N x = x / n Para calcular esta media, sumamos todas las observaciones. Los estadísticos se refieren aeste tipo de datos como datos no agrupados. Cálculo de la media de datos agrupados: Una distribución de frecuencias consta de datos agrupados en clases. Cada valor de unaobservación cae dentro de alguna de las clases. No sabemos el valor individual de cadaobservación. A partir de la información de la tabla, podemos calcular fácilmente una estimacióndel valor de la media de estos datos agrupados. De haber usado los datos originales sin agrupar, podríamos haber calculado el valor real de lamedia. Para encontrar la media aritmética de datos agrupados, primero calculamos el punto medio decada clase. Para lograr que los puntos medios queden en cifras cerradas, redondeamos lascantidades. Después, multiplicamos cada punto medio por la frecuencia de las observacionesde dicha clase, sumamos todos los resultados y dividimos esta suma entre el número total deobservaciones de la muestra. x = (f x) / n f = frecuencia de observaciones de cada clase x= punto medio de cada clase de la muestra n = número de observaciones de la muestra Codificación: Mediante esta técnica, podemos eliminar el problema de tener puntos medios muy grandes

oinconvenientes. En lugar de utilizar los puntos medios reales para llevar a efecto nuestroscálculos, podemos asignar enteros consecutivos de valor pequeño, conocidos como códigos, acada uno de los puntos medios. El entero cero puede ser asignado a cualquier punto medio,pero para que nuestros enteros sean pequeños, asignaremos cero al punto medio de la partemedia de la distribución (o la parte más cercana a ésta). Podemos asignar enteros negativos alos valores menores a dicho punto medio y enteros positivos a los valores más grandes. Los estadísticos usan xopara representar el punto medio al que se le ha asignado el código 0 yu para el punto medio codificado: x = xo+ w [(u f)] / n w = ancho numérico del intervalo de clase u = código asignado a cada punto medio de clase Ventajas y desventajas de la media aritmética. La media aritmética, en su carácter de un solo número que representa a un conjunto de datoscompleto, tiene importantes ventajas: 1.Se trata de un concepto familiar para la mayoría de las personas y es intuitivamenteclaro.2.Cada conjunto de datos tiene una media, es una medida que puede calcularse y esúnica debido a que cada conjunto de datos posee una y sólo una media.3.Es útil para llevar a cabo procedimientos estadísticos como la comparación de mediasde varios conjuntos de datos.Desventajas: 1.Puede verse afectada por valores extremos que no son representativos del resto de losdatos.2.Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos dedato de nuestro cálculo.3.Somos incapaces de calcular la media para un conjunto de datos que tiene clases deextremo abierto, ya sea en el inferior o en el superior de la escala.SUGERENCIA: La media aritmética, a menudo, puede mal interpretarse si los datos no entran en un grupohomogéneo. La mediana. La mediana es un solo valor calculado a partir del conjunto de datos que mide la observacióncentral de éstos. Esta sola observación esla más central o la que está más en medio en elconjunto de números. La mitad de los elementos están por encima de este punto y la otra mitadestá por debajo. Cálculo de la mediana a partir de datos no agrupados: Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en ordendescendente o ascendente. Si el conjunto de datos contiene un número impar de elementos, el de en medio en el arreglo es la mediana. Si hay un número par de observaciones, la medianaes el promedio de los dos elementos de en medio. Mediana = (n + 1) / 2 Cálculo de la mediana a partir de datos agrupados: 1.Encontrar qué observación de la distribución está más al centro (Mediana = (n + 1) / 2).2.Sumar las frecuencias de cada clase para encontrar la clase que contiene a eseelemento más central.3.Determinar el número de elementos de la clase y la localización de la clase quecontiene al elemento mediano.4.Determinar el ancho de cada paso para pasar de una observación a otra en la clasemediana, dividiendo el intervalo de cada clase entre el número de elementos contenidoen la clase.5.Determinar el número de pasos que hay desde el límite inferior de la clase medianahasta el elemento correspondiente a la mediana.6.Calcular el valor estimado del elemento mediano multiplicando el número de pasos quese necesitan para llegar a la observación mediana por el ancho de cada paso. Alproducto sumarle el valor del límite inferior de la clase mediana.7.Si existe un número par de observaciones en la distribución, tomar el promedio de losvalores obtenidos para el elemento mediano calculados en el paso número 6.Un método más sencillo: m = {[(n + 1) / 2 (F + 1)] / fm} w + Lm m = mediana de la muestran = número total

de elementos de la distribuciónF = suma de todas las frecuencias de clase hasta, pero sin incluir, la clase medianafm = frecuencia de la clase medianaw = ancho de intervalo de claseLm = límite inferior del intervalo de clase mediano Ventajas y desventajas de la mediana: Los valores extremos no afectan a la mediana tan intensamente como a la media. La medianaes fácil de entender y se puede calcular a partir de cualquier tipo de datos incluso a partir dedatos agrupados con clases de extremo abierto a menos que la mediana entre en una clasede extremo abierto. Podemos encontrar la mediana incluso cuando nuestros datos son descripciones cualitativas,en lugar de números. Ciertos procedimientos estadísticos que utilizan la mediana son más complejos que aquellosque utilizan la media. Debido a que la mediana es una posición promedio, debemos ordenar losdatos antes de llevar a cabo cualquier cálculo. Esto implica consumo de tiempo para cualquier conjunto de datos que contenga un gran número de elementos. Por consiguiente, si deseamosutilizar una estadística de muestra para estimar un parámetro de población, la media es másfácil de usar que la mediana. La moda. La moda es una medida de tendencia central diferente de la media, pero un tanto parecida a lamediana, pues en realidad no se calcula mediante algún proceso aritmético ordinario. La modaes aquel valor que más se repite en el conjunto de datos. En ocasiones, el azar hace que un solo elemento no representativo se repita lo suficiente paraser el valor más frecuente del conjunto de datos. Es por esta razón que rara vez utilizamos lamoda de un conjunto de datos no agrupados como medida de tendencia central. Por esta razón, siempre que utilizamos la moda como medida de tendencia central de unconjunto de datos, debemos calcular la moda de datos agrupados (buscar la clase modal). Cálculo de la moda de datos agrupados: Cuando los datos ya se encuentran agrupados en una distribución de frecuencias, podemosponer que la moda está localizada en la clase que contiene el mayor número de elementos, esdecir, en la clase que tiene mayor frecuencia. Para determinar un solo valor para la moda apartir de esta clase modal: Mo = Lmo+ [d1/ (d1+ d2)] w Lmo= límite inferior de la clase modal.d1= frecuencia de la clase modal menos la frecuencia de la clase que se encuentrainmediatamente por debajo de ella.d2= frecuencia de la clase modal menos la frecuencia de la clase que se encuentrainmediatamente por encima de ella.w = ancho del intervalo de la clase modal. Ventajas y desventajas de la moda: La moda, al igual que la mediana, se puede utilizar como una posición central para datos tantocualitativos como cuantitativos. También, al igual que la mediana, la moda no se ve mayormente afectada por los valoresextremos. Incluso si los valores extremos son muy altos o muy bajos, nosotros escogemos elvalor más frecuente del conjunto de datos como el valor modal. Podemos utilizar la moda sinimportar qué tan grandes o qué tan pequeños sean los valores del conjunto de datos, eindependientemente de cuál sea su dispersión. La podemos utilizar aun cuando una o más clases sean de extremo abierto. Muy a menudo, no existe un valor modal debido a que el conjunto de datos no contiene valoresque se presenten más de una vez. En otras ocasiones, cada valor es la moda, pues cada unode ellos se presenta el mismo número de veces. Otra desventaja consiste en que cuando losdatos contienen dos, tres o más modas, resultan difíciles de interpretar y comparar. Comparación entre la media, la mediana y la moda. Cuando trabajamos un problema de estadística, debemos decidir si vamos a utilizar la media, lamediana o la moda como medidas de tendencia central. Las distribuciones simétricas que sólocontienen una

el 25% de los datos está en el fractil 0. debido a que siempre está entre la moda y la media.5. La dispersión es importante porque: 1. Las distribuciones de extremo abierto no tienen alcance. la mediana y la moda. Las medidas de distancia son: el alcance. con frecuencia la mediana resultaser la mejor medida de posición.Proporciona información adicional que permite juzgar la confiabilidad de la medida detendencia central. En una distribución negativamente sesgada. Los fractiles son parecidos a los porcentajes. En unadistribución cualquiera. por ejemplo. En una distribución positivamente sesgada (es decir. la mediana y la moda sólo nosrevelan una parte de la información que necesitamos acerca de las características de los datos. Sólo toma en cuenta los valores más alto y más bajo de una distribución y noconsidera ninguna otra observación del conjunto de datos. La mediana. la modatodavía se encuentra en el punto más alto de la distribución. . Si no se deseatener una amplia dispersión de valores con respecto al centro de distribución o estopresenta riesgos inaceptables. sesgada hacia la derecha). En una distribución de frecuencias. y se ve muy influido por los valores extremos. Entales casos.familia modal para el diseño de automóviles). debemos medir también sudispersión. el alcance interfractil y el alcanceintercuartil. Alcance.Medidas de dispersión. la mediana o la moda.2.Quizá se desee comparar las dispersiones de diferentes muestras.igualmente.Ya que existen problemas característicos para datos ampliamente dispersos. no es necesario escoger la medida de tendencia central. 25% de los datos cae en el vigésimo quinto percentil o por debajo de éste. debemosser capaces de distinguir que presentan esa dispersión antes de abordar esosproblemas. una fracción o proporción dada de los datos cae en unfractil o por debajo de éste. pero su utilidad como medida de dispersión eslimitada. en ocasiones. la moda sigue siendo el punto más alto de ladistribución. Al igual que sucede con cualquier conjunto de datos. La dispersión puede medirse en términos de la diferencia entre dos valores seleccionados delconjunto de datos. la mediana está hacia la izquierda de ella y la media se encuentra todavía más a laizquierda de la moda y la mediana.3. la posicióncentral es menos representativa de los datos. puesto que la mitad delos datos es menor o igual a este valor. extensión o variabilidad. depende de la práctica comúnde una industria en particular (salario medio de los obreros. Ignora la naturaleza de la variaciónentre todas las demás observaciones. Es la diferencia entre el más alto y el más pequeño de los valores observados.25 o por debajo de éste. pues ya está hecha laselección. ni se distorsiona con la presencia de valores extremos como la media. es el fractil 0. Lamediana no se ve altamente influida por la frecuencia de aparición de un solo valor como es elcaso de la moda. la mediana está hacia la derechade la moda y la media se encuentra todavía más a la derecha de la moda y la mediana. Alcance = valor de la observación más alta valor de la observación más pequeña El alcance es fácil de entender y de encontrar. siempre tienen el mismo valor para la media. precio mediano de una casa.moda. SUGERENCIA La selección de la media. la media. Cuando la población está sesgada negativa o positivamente. La dispersión. pues no existe un valor más alto omás bajo en la clase de extremo abierto. necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes. Si los datos se encuentran ampliamente dispersos.Para aumentar nuestro entendimiento del patrón de los datos. Alcance interfractil.

que se simboliza con 2(sigma cuadrada). La desviación estándar.Elalcance interfractil es una medida de la dispersión entre dos fractiles de una distribución defrecuencias. Alcance intercuartil. Esta medida se conoce como la desviación estándar. Desviación estándar de la población. la desviación estándar es la raíz cuadrada del promedio de lasdistancias al cuadrado que van desde las observaciones a la media. dónde estánlocalizados los valores de una distribución de frecuencias con relación a la media. está en las mismas unidades que los datosoriginales. Usos de la desviación estándar. dividimos la suma de las distancias al cuadrado entre la media ycada elemento de la población entre el número total de observaciones de dicha población. construimos una tabla utilizando todos loselementos de la población. dividimos nuestros datos en cuatro partes. Los cuartiles son. Ambas medidas nos dan una distancia promedio decualquier observación del conjunto de datos con respecto a la media de la distribución. Las descripciones más comprensivas de la dispersión son aquellas que tratan con la desviaciónpromedio con respecto a alguna medida de tendencia central. y el alcance intercuartil es ladiferencia entre los valores del primer cuartil y el tercer cuartil. La raíz cuadrada de un número positivo puede ser tanto positiva como negativa. Cuandotomamos la raíz cuadrada de la varianza para calcular la desviación estándar.Los cuartiles dividen los datos en cuatro partes iguales. entonces.N = número total de elementos de la población. Cada población tiene una varianza. Para calcular la varianza o la desviación estándar. cadauna de las cuales contiene 25% de los elementos de la distribución. Los fractiles que los dividen en 10 partes iguales se conocen como deciles. Dos de tales medidas son lavarianza y la desviación estándar. los estadísticossolamente consideran la raíz cuadrada positiva. la diferencia entre los valores de los dos fractiles.x = elemento u observación. es decir.entonces.µ= media de la población. Los percentiles dividen el conjunto dedatos en 100 partes iguales. La desviación estándar de la población. dependiendo del número de partes iguales en que sedividen los datos.Estas unidades noson intuitivamente claras o fáciles de interpretar. La desviación estándar está en las mismas unidades que las que se usaron para medir los datos. El teoremade Chebyshev dice que no importa qué forma tenga la distribución. El alcance intercuartil mide aproximadamente qué tan lejos de la mediana tenemos que ir encualquiera de las dos direcciones antes de que podamos recorrer una mitad de los valores delconjunto de datos. Para calcular la varianza de una población. Los fractiles tienen nombres especiales. que sea menosconfusa. Con más precisión: Aproximadamente 68% de los valores de la población cae dentro de + 1 . y almenos 89% de los valores caen dentro de + 3 desviaciones estándar a partir de la media. Por esta razón. Varianza de la población. Para calcular este alcance. y es la raíz cuadrada de lavarianza. tenemos que hacer un cambiosignificativo en la varianza para calcular una medida útil de la desviación. La desviación estándar nos permite determinar. al menos 75% de losvalores caen dentro de + 2 desviaciones estándar a partir de la media de la distribución. las unidades son elcuadrado de las unidades de los datos. Como la varianza es el promedio de las distancias al cuadrado que van desdelas observaciones a la media. es simplemente la raíz cuadrada de la varianzade la población. con un buen grado de precisión. los valores más alto y más bajo de estas cuatro partes. Medidas de desviación promedio. o . SUGERENCIA El punto fractil es siempre el punto en el o debajo del cual cae la proporción establecida devalores. 2= (x -µ)2/ N 2= varianza de la población. Para la varianza.

Alcance intercuartil:diferencia entre los valores del primer y tercer cuartiles. su media y cómo se compara la desviación estándar conrespecto a la media. sustituyendoµpor x y N con n 1. Aproximadamente 95% de los valores estará dentro de + 2 desviaciones estándar apartir de la media. por otro lado. podemos también usar la desviación estándar de la muestra paracalcular los resultados estándar de la muestra.N = número total de elementos de la población. La desviación estándar no puede ser la única base para la comparación de dos distribuciones.expresando la desviación estándar como porcentaje de la media. Aproximadamente 99% de los valores estará en el intervalo que va desde tresdesviaciones estándar por debajo de la media hasta tres desviaciones estándar por arriba de la media. La desviación estándar es una medida absoluta de la dispersión que expresa la variación en lasmismas unidades que los datos originales.Si tenemos una desviación estándar de 10 y una media de 5.x = punto medio de cada una de las clases.µ= media de la población. Dispersión relativa: el coeficiente de variación.f = frecuencia de cada una de las clases. utilizamos las mismasfórmulas. si encontramos lavarianza de la muestra para cada muestra y promediamos los resultados. Al igual que utilizamos la desviación estándar de la población para derivar los resultadosestándar de la misma. Estos resultados indican a cuántas desviacionesestándar se halla una observación en particular por arriba o por debajo de la media de lamuestra.Resultado estándar: La desviación estándar es también útil para describir qué tan lejos las observacionesindividuales de una distribución de frecuencias se apartan de la media de la distribución. s2= (x . Resultado estándar de la muestra = (x x) / s SUGERENCIAS Las letras griegas siempre se refieren a parámetros de la poblacióny las letras latinas serefieren aestadísticas de la muestra. a menos que tomemos n 1como denominador de los cálculos. tenemos una desviaciónestándar de 10 y una media de 5. Enconsecuencia.desviaciónestándar a partir de la media. Lo que necesitamos es una medida relativa que nos proporcione una estimación de la magnitudde la desviación con respecto a la magnitud de la media. Alcance interfractil:medida de la .x)2/ (n 1) ¿Por qué utilizamos n 1 como denominador en lugar de N? Los especialistas en estadísticapueden demostrar que si tomamos muchas muestras de una población dada. entonces estepromedio no tiende a tomar el valor de la varianza de la población. Unamedida que se conoce comoresultado estándar nos da el número de desviaciones estándar que una observación en particular ocupa por debajo o por encima de la media: Resultado estándar = (x -µ) / Cálculo de la varianza y la desviación estándar utilizando datos agrupados: 2= f(x -µ)2/ N 2= varianza de la población. etadiferencia representa el alcance de la mitad central del conjunto de datos. no podemos conocer la dispersión de un conjunto de datos hasta queconocemos su desviación estándar. Se relaciona la desviación estándar y la media. = 2 desviación estándar de una muestra: Para calcular la varianza y la desviación estándar de una muestra. pero n 1 para calcular la desviación estándar de la muestra. Elcoeficiente de variaciónes una deestas medidas relativas de dispersión. Recordar utilizar N como denominador cuando se calcula la desviación estándar de lapoblación. Coeficiente de variación = ( /µ) * 100 CONCEPTOS: Alcance:distancia entre los valores más bajo y más alto de un conjunto de datos. Si. los valores varían en unacantidad que es el doble de la media misma. la variación con respecto a la media es insignificante.000.

y al menos 89% caerá dentro de tres desviaciones estándar. la transformaciónde una observación al restarle la media y dividirla entre la desviación estándar. Cantidades numéricas que dan unaidea sobre la ubicación de la distribución de frecuencias. Asimetría en distribuciones de frecuencias no simétricas. Moda:el valor que más a menudo se repite en un conjunto de datos. Promedio de los desvíos cuadráticos con respecto a lamedia. Sesgo:grado en que una distribución de puntos está concentrada en un extremo o enel otro. Medida de distancia:medida de dispersión en términos de la diferencia entre dosvalores del conjunto de datos. Curtosis:el grado de agudeza de una distribución de puntos.dispersión entre dos fractiles de una distribución. representadas por caracteres latinos. Estadística sumaria:números solos que describen ciertas características de unconjunto de datos. Codificación:método para calcular la media de datos agrupados mediante larecodificación de los valores de los puntos medios de las clases a valores mássencillos. Cantidades que describen la variabilidad de losdatos. falta de simetría. Simétrica:característica de una distribución en la que cada mitad es la imagenespecular de la otra. esdecir. Medida de dispersión:medida que describe cómo se dispersan o distribuyen lasobservaciones de un conjunto de datos. Estárepresentado por el punto más alto de la curva de distribución de un conjunto de datos. una fracción dada de los datos. Desviación estándar:raíz cuadrada positiva de la varianza. o por encimade. Mediana:punto situado a la mitad de conjunto de datos. la diferencia entre los valores de dos fractiles. Coeficiente de variación:medida relativa de la dispersión. medida de localización quedivide al conjunto de datos en dos partes iguales. Media:medida de tendencia central que representa el promedio aritmético de unconjunto de observaciones. Dispersión:la extensión o variabilidad de un conjunto de datos. Clase mediana:clase de una distribución de frecuencias que contiene el valor mediano de un conjunto de datos. Percentiles:fractiles que dividen los datos en 100 partes iguales. comparable por medio dedistribuciones diferentes. Teorema de Chebyshev:no importa qué forma tenga la distribución. Distribución bimodal:distribución de puntos de datos en la que dos valores sepresentan con más frecuencia que los demás elementos del conjunto de datos. Fractil:en una distribución de frecuencias. que expresa la desviación estándar como porcentaje de lamedia. es la posición de un valor en. al menos 75% delos valores de la población caerán dentro de dos desviaciones estándar a partir de lamedia. representados generalmente por letras griegas. medida de dispersión conlas mismas unidades que los datos originales. Medida de tendencia central (o de posición):medida que indica el valor esperado deun punto de datos típico o situado en el medio. Proporción o porcentaje de la media que representa la desviación estándar. Estadística (o estimador):medidas numéricas que describen las características deuna muestra. Deciles:fractiles que dividen los datos en diez partes iguales.RECOMENDACIONES . Varianza:medida de la distancia cuadrada promedio entre la media y cadaobservación de la población. Cuartiles:fractiles que dividen los datos en cuatro partes iguales. Resultado estándar:expresión de una observación en términos de unidades dedesviación estándar por encima o por debajo de la media. Parámetros:valores numéricos que describen las características de una poblacióncompleta. es decir.

Diferenciar con precisión cuándo se hace referencia a un parámetro poblacional ycuándo a un estadístico muestral.. Calcular la media aritmética con los datos en bruto sin agrupar siempre que serequiera su valor exacto.PRÁCTICAS: Revisar cuidadosamente los datos antes de usarlos. Tanto la mediana como la moda son valores de la variable (no confundir con lasfrecuencias a las que están asociadas). Información y clasificación Lecturas:13. siempre que se pueda. ED. mediana y moda para determinar el sesgo dela distribución.Clasificación:Derechos de autor:Funciones no comerciales . LEVIN . Prestar atención a las ventajas y desventajas de las distintas medidas de posición ydispersión. ESTADÍSTICA PARA ADMINISTRADORES. please follow these directions to submit a copyright infringement notice. para decidir correctamente su elección. No tiene sentido calcular la moda en series de datos sin agrupar. cuando la serietiene pocos datos e incluye valores extremos. .BIBLIOGRAFÍA: RICHARD I. Elaborar histogramas o cualquier otro tipo de gráficos que permita visualizar la forma ylas características principales de la distribución de frecuencias. RUBIN.DAVID S. indique los motivos por los que está denunciando este documento Spam o correo basura Contenido para adultos con pornografía Detestable u ofensivo If you are the copyright owner of this document and want to report it. Denunciar Cancelar .Este es un documento privado. Comparar.832Subido:04/26/2010Categoría:Sin categorizar. La desviación estándar es preferible a la varianza porque se expresa en las mismasunidades de la variable. Usar en forma conjunta una media de posición y una de dispersión (como mínimo) paraanalizar el comportamiento de la variable.SEXTA ED. . El rango o alcance es una medida de dispersión poco apropiada para describir seriescon muchos datos. Dar preferencia al cálculo de la mediana como medida de posición. chequear en particular los valores extremos. media. verificar que no contenganerrores. PRENTICE HALL. 1996Medidas de Tendencia Central y Dispersión Descargar gratis este documentoImprimirMóvilColeccionesDenunciar documento¿Quiere denunciar este documento?Por favor.

10 p. 5 p.SíganosSebas_Iglo. 14 p. 14 p. 14 p. 13 p. 10 p. 10 p.. 10 p. 2 p. 12 p. 10 p. 5 p. 10 p. 12 p. 13 p. 10 p. 13 p. 10 p. . 13 p. Compartir e incluir Más material de este usuario AnteriorSiguiente 1 p. 14 p.

133 p. 15 p. 11 p.Utilice su nombre de usuario de Facebook y vea lo que sus amigos leen y comparten. Descargar e imprimir Add this document to your Collections. but others can view it public moderated: others can add to this collection.locked public . and only you will be able to view itSave collectionCancel.Add a Comment Submitshare:Characters: 400 Arantza Gutierrezleft a comment hola 06 / 16 / 2011 Reply Report .moderated privatepublic locked: only you can add to this collection.Print This DocumentAlta calidadOpen the downloaded document. so it may only be added to private collections.. Closes in seconds.. X.This is a private document.+ Create a New CollectionName:Description:Collection Type:public .Readcasters nuevos . and select print from the file menu (PDF reader required).Finished? Back to Document. Dirección de correo electrónico (obligatoria) Crear nombre de usuario (obligatorio) Contraseña (obligatoria) Enviarme el boletín informativo de Scribd y las notificaciones ocasionales relacionadas con mi cuenta .. but you approve or reject additions private: only you can add to this collection. Otras opciones de nombre de usuarioLogin with FacebookInscripciónNo tengo una cuenta de Facebook .

. Nos comprometemos a respetar su privacidad. ¿Por qué inscribirse?1. Reset Your Password«Volver a inicio de sesión Por favor. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución. en este caso se observan variables cuantitativas Entre las medidas de tendencia central tenemos: Media . Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas. Share Your Reading Interest On Scribd and social sites like Facebook and Twitter. con frecuencia es conveniente resumir la información con un solo número . se habla de estas medidas como medidas de posición. Iniciar sesión Enviar Medidas de tendencia centralDe Wikipedia. . volviendo a usted.¿Ya tiene una cuenta en Scribd? Dirección de correo electrónico o nombre de usuario Contraseña . Puede administrar estas notificaciones en la configuración de su cuenta. por lo que las medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable que se esta observando... Dirección de correo electrónico: También es necesario que proporcione un nombre de usuario para esta cuenta. la enciclopedia libre Saltar a: navegación. Inicio de sesión correctoAhora. Este número que. búsqueda Al describir grupos de observaciones. independientemente de que ésta esté más o menos centrada. Publish Your Documents Quickly and easily3.Ingresar ¿Problemas para ingresar? . ingrese su dirección de correo electrónico a continuación para restablecer la contraseña. para tal fin..[1] En este caso se incluyen también los cuantiles entre estas medidas. suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Discover and Connect With people of similar interests2.Inscríbase Política de privacidad Recibirá notificaciones por correo electrónico con respecto a la actividad de su cuenta. Le enviaremos un correo electrónico con instrucciones sobre cómo continuar.

3 Inconvenientes de su uso 1.2 Inconvenientes 3 Mediana 3.5 Media muestral 2 Moda 2. Media armónica. Mediana. .Media ponderada. Moda. Contenido [ocultar] 1 La media aritmética (o simplemente media) 1. Media geométrica.2 Propiedades e inconvenientes 4 Véase también 5 Referencias 6 Enlaces externos [editar] La media aritmética (o simplemente media)Artículo principal: Media aritmética La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el número de sumandos.1 Propiedades 2.4 Media aritmética ponderada 1.1 Cálculo de la mediana para datos agrupados 3.2 PROPIEDADES 1.1 Definición formal 1.

probablemente.0 ·Primero. x1.Por ejemplo.4 6.0 27.0+6. se define su media aritmética como Esta definición varía.1 = 27. esto es.[2] Se le llama también promedio o.0+5. [editar] Definición formalDado un conjunto numérico de datos. [editar] PROPIEDADESLas principales propiedades de la media aritmética son:[3] Su cálculo es muy sencillo y en él intervienen todos los datos.. .1 ·La media aritmética en este ejemplo es 5. las notas de 5 alumnos en una prueba: niño 1 2 3 4 5 nota 6.1 ·Luego el total se divide entre la cantidad de alumnos: 7.52 La media aritmética es.4+3. media. uno de los parámetros estadísticos más extendidos.6 3. Su valor es único para una serie de datos dada. se suman las notas: 5.52 6.1+7.. simplemente. Se usa con frecuencia para comparar poblaciones. aunque es más apropiado acompañarla de una medida de dispersión.6/5=5. cuando se trata de variables continuas. aunque no sustancialmente. también puede calcularse para variables agrupadas en intervalos. .. x2. xn.

. un equipo de baloncesto con cinco jugadores de igual estatura. tendría también. donde es la media aritmética de los xi'. evidentemente. 1.[4] Por ejemplo. en el cálculo del salario medio de un empresa. el valor de es mínimo cuando .15 m. se ve muy afectada por valores extremos. No se puede determinar si en una distribución de frecuencias hay intervalos de clase abiertos.Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos. por ejemplo.000. tiene también algunos inconvenientes. el salario de un alto directivo que gane 1. valor que no representa a casi ninguno de sus componentes. 2. Esta propiedad permite interpretar uno de los parámetros de dispersión más importantes: la varianza. un equipo de jugadores de estaturas más heterogéneas..000 de tiene tanto peso como el de diez empleados "normales" que ganen 1. En otras palabras. menos información proporciona. esto es. ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor: Minimiza las desviaciones cuadráticas de los datos respecto de cualquier valor prefijado. una estatura media de 1. [editar] Inconvenientes de su usoEste parámetro. Por ejemplo. valor que representa fielmente a esta población homogénea.95 m.70 m. . esto es. 2. .95 m.95 m. si xi' = axi + b entonces . 1. Sin embargo.75 m y 1. En el cálculo de la media no todos los valores contribuyen de la misma manera. n y a y b números reales. Este resultado se conoce como Teorema de König. Se ve afectada por transformaciones afines (cambios de origen y escala). como puede comprobarse.000 . como son: Para datos agrupados en intervalos (variables continuas) su valor oscila en función de la cantidad y amplitud de los intervalos que se consideren. 1. de modo que cuanto menos homogéneos sean los datos.Es una medida a cuyo significado afecta sobremanera la dispersión. tendría una estatura media de 1. poblaciones muy distintas en su composición pueden tener la misma media. Los valores altos tienen más peso que los valores cercanos a cero. La estatura media como resumen de una población homogénea (abajo) o heterogénea (arriba). aún teniendo múltiples propiedades que aconsejan su uso en situaciones muy diversas. Dicho de otro modo.. por lo que es un parámetro muy útil en inferencia estadística.20 m.95 m. para i = 1. Es poco sensible a fluctuaciones muestrales.

entonces la moda es 5. en su defecto. Cuando en una distribución de datos . [editar] ModaArtículo principal: Moda (estadística) La moda es el dato más repetido.xn son nuestros datos y w1. esto es. la media ponderada se define de la siguiente forma: [editar] Media muestralEsencialmente. se recurre a la interpolación. Si x1. la media muestral es el mismo parámetro que el anterior. dos datos que tengan la misma frecuencia absoluta máxima. pues sólo necesita un recuento. aunque el adjetivo "muestral" se aplica a aquellas situaciones en las que la media aritmética se calcula para un subconjunto de la población objeto de estudio. La media muestral es un parámetro de extrema importancia en la inferencia estadística. En esos casos se puede utilizar una media ponderada.w2. el valor de la variable con mayor frecuencia absoluta. si es necesario obtener un valor concreto de la variable.[editar] Media aritmética ponderadaA veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio.. El número que más se repite es 5..x2.[5] En cierto sentido la definición matemática corresponde con la locución "estar de moda". cuando encontremos dos modas. Su cálculo es extremadamente sencillo.. Hablaremos de una distribución bimodal de los datos. entre otros usos.. el número de personas en distintos vehículos en una carretera: 5-7-4-6-9-5-6-1-5-3-7. es decir. En variables continuas. ser lo que más se lleva.wn son sus "pesos" respectivos. siendo de gran utilidad para la estimación de la media poblacional... expresadas en intervalos.. Por ejemplo. existe el denominado intervalo modal o..

se encuentran tres o más modas. respectivamente. La moda. al Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la siguiente tabla (debajo): Calificaciones 1 2 3 4 5 6 7 8 9 Número de alumnos 2 2 4 5 8 9 3 4 2 [editar] PropiedadesSus principales propiedades son: Cálculo sencillo. es un punto que divide el intervalo modal en dos partes de la forma p y c-p. Al depender sólo de las frecuencias. puede calcularse para variables cualitativas. Interpretación muy clara. entonces es multimodal. cuando los datos están agrupados. Esto se conoce informalmente como "retrato robot". Por último. cuando se enumeran en medios periodísticos las características más frecuentes de determinado sector social. Cuando tratamos con datos agrupados en intervalos. siendo c la amplitud del intervalo. si todas las variables tienen la misma frecuencia diremos que no hay moda. se ha de definir el intervalo modal. por ejemplo. Es por ello el parámetro más utilizado cuando al resumir una población no es posible realizar otros cálculos. antes de calcular la moda.[6] . que verifiquen que: Siendo ni la frecuencia absoluta del intervalo modal y ni 1 y ni + 1 las frecuencias absolutas de los intervalos anterior y posterior. El intervalo modal es el de mayor frecuencia absoluta.

4. [editar] Cálculo de la mediana para datos agrupadosPrimero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho).[7] Por ejemplo. para valores agrupados en intervalos. una vez que éstos están ordenados de menor a mayor. 1. . 3. se obtiene un valor concreto por interpolación. 2. en el caso de doce datos como los anteriores: Se toma como mediana Existen métodos de cálculo más rápidos para datos más númerosos (véase el artículo principal dedicado a este parámetro). 1. una vez ordenados los datos: 1. cuyos respectivos hijos son: 3. no afectan en modo alguno a su valor. Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la misma frecuencia (distribuciones bimodales o multimodales). 3. 1. 1. [editar] MedianaArtículo principal: Mediana (estadística) La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos. 2. 2. 2. 1. 2. por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. dentro de éste. en variables agrupadas en intervalos. Por ejemplo. se halla el "intervalo mediano" y. de tal modo que grandes variaciones en los datos fuera de la moda. Del mismo modo. Usa muy pocas observaciones. lo que la hace muy sensible a variaciones muestrales. No siempre se sitúa hacia el centro de la distribución. 1. 1 y 1. el que ocupa la posición central es 2: En caso de un número par de datos. la mediana no correspondería a ningún valor de la variable. 4. puesto que. la mediana del número de hijos de un conjunto de trece familias. su valor depende excesivamente del número de intervalos y de su amplitud.[editar] InconvenientesSu valor es independiente de la mayor parte de los datos. 1. 2. 3. es 2. 1. 2. 1. Por otra parte. 2.

obtenemos X(39+1)/2 = X20 y basándonos en la fórmula que hace referencia a las frecuencias absolutas: Ni-1< n/2 < Ni = N19 < 19. Ejemplo (N par) Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase viene dada por la siguiente tabla (debajo): Calificaciones 1 2 3 4 5 6 7 8 9 Número de alumnos 2 2 4 5 6 9 4 4 2 xi fi Fi 122 224 348 4 5 13 5 6 19 = 19 6 9 28 7 4 32 8 4 36 9 2 38 . en este caso como estamos hablando de calificaciones. 21 (frecuencia absoluta acumulada para Xi = 5) > 19. serán puntos) La mitad de la clase ha obtenido un 5 o menos.5 < N20 Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar.Así. aplicando la formula asociada a la mediana para n impar.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades. y la otra mitad un 5 o más. En nuestro ejemplo.

incluso cuando alguno de ellos no está acotado. De hecho. el último número. obtenemos X(38/2) = X19 y basándonos en la fórmula que hace referencia a las frecuencias absolutas --> Ni-1< n/2 < Ni = N18 < 19 < N19 Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el decimonoveno y el vigésimo lugar. alguien con el salario "mediano" sabría que hay tanta gente que gana más dinero que él. En nuestro ejemplo. Si volvemos a utilizar la fórmula asociada a la mediana para n par.Calculemos la Mediana: Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho). Un error de transcripción en la serie del ejemplo anterior en. el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6. . No se ve afectada por la dispersión. como que gana menos. Sin embargo. es más representativa que la media aritmética cuando la población es bastante heterogénea. (desde el vigésimo hasta el vigésimo octavo) con lo que Me = (5+6)/2 = 5. Hay unos pocos salarios muy altos que elevan la media aritmética haciendo que pierda representatividad respecto al grueso de la población. puede calcularse para datos agrupados en intervalos. deja a la mediana inalterada.5 puntos. Como se ha comentado. Suele darse esta circunstancia cuando se resume la información sobre los salarios de un país o una empresa. [editar] Propiedades e inconvenientesLas principales propiedades de la mediana son:[8] Es menos sensible que la media a oscilaciones de los valores de la variable. pongamos por caso.

Sus principales inconvenientes son que en el caso de datos agrupados en intervalos. u PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. el percentil de orden 15 deja por debajo al 15% de las observaciones. no se presta a cálculos algebraicos tan bien como la media aritmética. son un caso particular de los percentiles: . Medidas descriptivas Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos resumen la información contenida en ella. y por encima queda el 85% u CUARTILES: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales. Ejemplo. los deciles y los percentiles. su valor varía en función de la amplitud de estos. que comprenden el mismo número de valores. en intervalos. Los más usados son los cuartiles.El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos .El segundo cuartil Q 2 (la mediana). Medidas de Posición: Cuantiles Los cuantiles son valores de la distribución que la dividen en partes iguales. es el menor valor que es mayor que la mitad de los datos . Por otra parte. es decir.

Primer cuartil: . xi ni Ni 0 14 14 1 10 24 2 15 39 3 26 65 4 20 85 5 15 100 n=100 Solución: 1. Ejemplo: Dada la siguiente distribución en el número de hijos (Xi) de cien familias. calcular sus cuartiles. son también un caso particular de los percentiles.El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos u DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales..

son: u MEDIA : (media aritmética o simplemente media). .2. Por orden de importancia. Segundo cuartil: 3. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. es el promedio aritmético de las observaciones. Si xi es el valor de la variable y ni su frecuencia. Tercer cuartil: Medidas de Centralización Nos dan un centro de la distribución de frecuencias. el cociente entre la suma de todos los datos y el numero de ellos. tenemos que: Si los datos están agrupados utilizamos las marcas de clase. es decir ci en vez de xi. es un valor que se puede tomar como representativo de todos los datos. es decir.

. aquella cuya frecuencia absoluta es mayor. es decir. No tiene porque ser única. u MODA (M0): es el valor de la variable que más veces se repite. Distinguimos entre medidas de dispersión absolutas. Si el número de datos es impar la mediana será el valor central. las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. la dispersión. si es par tomaremos como mediana la media aritmética de los dos valores centrales. que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras. MEDIDAS DE DISPERSIÓN ABSOLUTAS u VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observación y la media aritmética del conjunto de observaciones. Medidas de Dispersión Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo. Las medidas de dispersión cuantifican la separación. de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. la variabilidad de los valores de la distribución respecto al valor central.u MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a mayor.

Re = xmax . u DESVIACIÓN TÍPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado.xmin MEDIDAS DE DISPERSIÓN RELATIVAS u COEFICIENTE DE VARIACIÓN DE PEARSON: Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se . Es la diferencia entre el valor de las observaciones mayor y el menor. para evitar este problema podemos usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de la varianza Para estimar la desviación típica de una población a partir de los datos de una muestra se utiliza la fórmula (cuasi desviación típica): u RECORRIDO O RANGO MUESTRAL (Re).Haciendo operaciones en la fórmula anterior obtenemos otra fórmula para calcular la varianza: Si los datos están agrupados utilizamos las marcas de clase en lugar de Xi.

MEDIDA DE ASIMETRÍA Diremos que una distribución es simétrica cuando su mediana.utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética CV representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media. bien sea el histograma o el diagrama de barras de la distribución. con la distribución normal. Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la derecha que por la izquierda. Medidas de Forma Comparan la forma que tiene la representación gráfica. su moda y su media aritmética coinciden. .

MEDIDA DE APUNTAMIENTO O CURTOSIS Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Una de ellas es el Coeficiente de Asimetría de Pearson: Su valor es cero cuando la distribución es simétrica. .Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asimétrica a la izquierda. Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Existen varias medidas de la asimetría de una distribución de frecuencias. Se definen 3 tipos de distribuciones según su grado de curtosis: Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

60. moda.61. 15. y 80 días. 59. varianza y desviación típica. 60. 32. 64. 59. 71.EJEMPLO 1 El número de diás necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21. los dos valores que se encuentran en el medio son 60 y 60. 61. 80. 21. 60. 60. La moda: el valor de la variable que presenta una mayor frecuencia es 60 . Si ordenamos los datos de mayor a menor observamos la secuencia: 15. SOLUCIÓN: La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone: La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. 32. 64. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60. mediana. 71. Como quiera que en este ejemplo el número de observaciones es par (10 individuos). Calcular la media. que es el valor de la mediana.

67 El rango: diferencia entre el valor de las observaciones mayor y el menor 80 .67/52.15 = 65 días El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética CV = 20. Sx2= La desviación típica S: es la raíz cuadrada de la varianza. S = 427.La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.3 = 0.61 = 20.39 .

EJEMPLO 2 El precio de un interruptor magentotérmico en 10 comercios de electricidad de una ciudad son : 25. y 27 Euros. 28. 29. (abrir la calculadora estadística. moda. 24. bigotes el recorrido] Abrir Calculadora Estadística . 26. más abajo) diagrama de barras y el diagrama de caja. mediana. 30. 25. SOLUCIÓN: (Utilizar la calculadora de debajo) [El diagrama de cajas: caja desde Q1 a Q3 (50% de los datos). 26. Hallar la media. 25.

Ir a Calculadora Estadística Resumen de Fórmulas .