UNIVERSIDAD DE SAN CARLOS DE GUATEMALA , CENTRO UNIVERSITARIO DE OCCIDENTE MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central pueden describirse rígidamente como promedios, en e sentido de que son indicativos del centro, mitad, o lo mas común de un conjunto de datos. Al calcular valores descriptivos que resumen un conjunto de datos, la primera consideración es encontrar un valor central o representativo de los datos. LA MEDIA ARIMETICA La media aritmética o simplemente media, es una medida descriptiva que se calcula sumando los valores numéricos y dividiendo entre el número de valores. El símbolo que se usa para la media poblacional es la letra griega (mu o miu) y el símbolo para la media de la muestra es X (X barra). Con frecuencia las medidas de un conjunto de datos se representan por X1,X2,X3……XN Donde X1, es la primera medida en el conjunto de datos, X2, es la segunda medida y así sucesivamente hasta XN, la ultima N-esima medida en el conjunto de datos. Para cuatro medidas, 3,6,4, y 9, el conjunto de datos es. X1=3, X2=6, X=4, Y X4=9 En la mayoría de los estudios estadísticos, hay dos conjuntos de datos diferentes que son de interés: La población y la muestra Media poblacional=μ= (X1+X2+X3+……+XN) / N = ∑Xi/N. Donde μ=media poblacional. ∑Xi=suma de todos los valores de los datos de la población N=tamaño de la población. La letra griega ∑ es el signo de sumatoria que indica que se suman todas las observaciones de 1 a N. La Xi denota las observaciones individuales, pero en aras de simplicidad, el subíndice y superíndice se reducirán y aparecerá el signo de la sumatoria como simplemente ∑. Cualquier característica medible de una población, por ejemplo, la media de población (μ), se llama parámetro. Un parámetro de una población es cualquier característica medible de la población. CURSO ESTADISTICA MSC ING JORGE MYNOR HERNANDEZ

Página 1

Con n observaciones en el conjunto de datos de la muestra. Ej.UNIVERSIDAD DE SAN CARLOS DE GUATEMALA . Los registros de personal contienen el número de días que estuvo enfermo cada empleado el mes pasado. la media aritmética se obtiene aplicando la formula general dada. Los datos forman una distribución de frecuencias de valores agrupados en intervalos de amplitud constante o variable.Ẋ)=0. por ejemplo la media muestral (X) se llama un estadístico. Con frecuencia se usa un estadístico muestral para calcular un parámetro de una población. n=tamaño de la muestra. La media de una serie simple. Cualquier característica medible de una muestra. La atlas Welding Shop tiene 10 empleados. Características de la media aritmética Todo conjunto de datos medido en una escala de intervalos o de razón tiene una media. CURSO ESTADISTICA MSC ING JORGE MYNOR HERNANDEZ Página 2 . Los valores y cálculo de la media son. CENTRO UNIVERSITARIO DE OCCIDENTE La media de una muestra es un estadístico Ẋ(X barra). La media es sensible a valores extremos. Un estadístico muestral es cualquier característica medible de una muestra. La suma de las desviaciones de la media de los números en el conjunto de datos es cero= ∑(x. 2. la media se determina así. La suma de los cuadrados de las desviaciones de los valores de una serie respecto a la media aritmética es un mínimo. 1. Los datos forman una serie simple. Los datos forman una distribución de frecuencias de valores sin agrupar 3. o sea que no presentan frecuencias repetidas. Calculo de la media aritmética Para el cálculo de la media aritmética o media se deben considerar los siguientes casos 1. ∑Xi=suma de todos los valores de los datos de la muestra.μ)=0 y ∑(x. Media muestral= Ẋ=(X1+X2+X3+….+Xn)/n = ∑Xi/n Donde Ẋ=media muestral. Cuando los valores forman una serie simple. en relación con la suma de los cuadrados de las desviaciones de los valores respecto de otro promedio cualquiera.

590+3. La desventaja de la media es que los valores extremos la distorsionan. CENTRO UNIVERSITARIO DE OCCIDENTE μ=∑X=(3+0+5+6+1+0+11+8+0+4)/10=3.100 Burger King 5. Observe también que la suma de los cuadrados de las desviaciones de la media ∑(x.6 Este valor 127. Si se restara cualquier otro valor diferente a 3.6 es un valor mínimo porque la media poblacional es el centro matemático de la distribución de 10 valores poblaciones.. Compañía ventas ($ millones) Mc Donald’s 14.μ) ^2 es igual a 127. Observe que la suma de las desviaciones de la media ∑(x.590 Kentucky Fried Chicken 3.6.800 Pizza Hut 2.UNIVERSIDAD DE SAN CARLOS DE GUATEMALA . Usamos la media muestral.8 días de enfermedad por empleado.030+2.La media de una distribución de frecuencias de valores sin agrupar Esta media se define como el cociente de dividir la suma de los productos de los valores multiplicados por sus frecuencias.450 Ẋ= ∑Xi/n=(14.μ) es igual a 0. Ej.500+3.700 Hardee’s 3. se obtendría un número mayor que 127. se denomina media aritmética ponderada y se expresa según la formula Ẋ= (∑f Xi)/N CURSO ESTADISTICA MSC ING JORGE MYNOR HERNANDEZ Página 3 .800+2.8 El calculo revela que se tomaron un promedio de 3.030 Wendy’s 2. entre la suma de casos o frecuencias. La tabla siguiente muestra las ventas de las seis cadenas de restaurantes más grandes.450)/6=5. Esta es la razón por la cual la media no es el mejor estadístico descriptivo para resumir todos los conjuntos de datos.100+5.8 de los valores de los datos y si las desviaciones resultantes se elevaran al cuadrado y se sumaran.280 Nótese que esta media ha sido distorsionada por las ventas de Mc Donald’s. 2.

La media de una distribución de frecuencias de valores agrupados Para calcular la media aritmética de la distribución de la tabla 2. 2 f 2 1 1 3 4 4 3 2 5 5 8 4 3 4 1 50 3=1x2 f Xi 6 5 6 21 32 36 30 22 60 65 112 60 48 72 19 594 Ẋ= (∑f Xi)/N= 594/50 = 11. 1 1 Xi 3 5 6 7 8 9 10 11 12 13 14 15 16 18 19 N= Fuente. CENTRO UNIVERSITARIO DE OCCIDENTE TABLA No. …. en la que los intervalos son de amplitud constante. CURSO ESTADISTICA MSC ING JORGE MYNOR HERNANDEZ Página 4 .88=12 3. los datos y las operaciones se disponen así Columna 1 los intervalos de la distribución Columna 2 contiene las marca de clase Xi o punto medio de los intervalos Columna 3 Contiene las frecuencias absolutas o repeticiones de los valores del intervalo Columna 4 Contiene los productos de multiplicar cada marca de clase por la frecuencia respectiva La media aritmética se obtendrá dividiendo la suma de la columna 4 entre la soma de la columna 3.UNIVERSIDAD DE SAN CARLOS DE GUATEMALA ..

0 40.0 -30.0 -20.100 2 Xi 18 23 28 33 38 43 48 53 58 63 68 73 78 83 88 93 98 N= FUENTE…….0 10. N= suma de frecuencias o total de casos.0 Método Abreviado Tiene como base la propiedad de la suma algebraica de las desviaciones de los valores de cada una serie respecto de la media aritmética de las desviaciones de los valores de una serie respecto de la media aritmética es igual a cero.460 1.75 .80 .0 -35.60 .0 15.872 2.30 . por lo que el método abreviado es igual a una media supuesta o arbitraria mas una cierta corrección.0 30.743 616 465 196 19.20 . CENTRO UNIVERSITARIO DE OCCIDENTE tabla 2 1 Intervalos 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 .0 0.0 20.45 .95 .0 35..244 1.378 1.0 -25.35 .85 .0 5.701 2.40 .0 -5.0 25. CURSO ESTADISTICA MSC ING JORGE MYNOR HERNANDEZ Página 5 .65 .00 Ẋ= 58.0 -15.70 .0 -10.50 .25 . respecto de la media supuesta.092 5=2-Ẋ Xi-Ẋ -40.55 . Media=X= Xs+∑f di/N Donde Xs= media supuesta o arbitraria +∑f di= suma algebraica de los productos de las frecuencias por las desviaciones de los valores.90 .032 1.248 1. MEDIA= 3 f 1 5 4 13 20 24 39 51 41 27 33 20 16 21 7 5 2 329 4=3X2 f Xi 18 115 112 429 760 1.0 0.703 2.UNIVERSIDAD DE SAN CARLOS DE GUATEMALA .

0 -195. Xs = MEDIA= 48 Ẋ= Xs+SUMA(fd)/N= 48 + 10.UNIVERSIDAD DE SAN CARLOS DE GUATEMALA .0 735.300.03 3 f 1 5 4 13 20 24 39 51 41 27 33 20 16 21 7 5 2 329 4=3X2 di=Xi-Xs -30 -25 -20 -15 -10 -5 0 5 10 15 20 25 30 35 40 45 50 170 5=2-Ẋ f di -30.03 = 58.0 405.25 .0 660.0 500.0 410.70 .40 .75 ..0 280. Es entre los estadísticos de tendencia central.20 .95 .0 0.80 .0 -120.45 .0 -125.90 . Es imprescindible para el cálculo y compresión de otros valores representativos.0 3.0 100.0 225.0 480.00 Uso de la media aritmética Se puede resumir el uso de la media aritmética según las siguientes Ventajas Es fácil de calcular. ya que las operaciones aritméticas o algebraicas en su caso son elementales Su significado es universal.50 .35 .30 . CENTRO UNIVERSITARIO DE OCCIDENTE tabla 2 1 Intervalos 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 .100 2 Xi 18 23 28 33 38 43 48 53 58 63 68 73 78 83 88 93 98 N= FUENTE…….60 . Desventajas CURSO ESTADISTICA MSC ING JORGE MYNOR HERNANDEZ Página 6 .85 .55 .0 -80.0 -200.65 .0 255. el más fiable y representativo de los valores de la variable.

LA MEDIANA La mediana de un conjunto de datos es el elemento central en un conjunto de observaciones dispuestas en orden de magnitud. esto es su valor no depende de todos los datos sino de uno .UNIVERSIDAD DE SAN CARLOS DE GUATEMALA . o cuando las muestra es muy pequeña. la media no será representativa. pero han de estar ordenados. su calculo es imprescindible cuando no se puede utilizar la media aritmética. así la mediana seria= 56 CURSO ESTADISTICA MSC ING JORGE MYNOR HERNANDEZ Página 7 . porque queda exactamente en la mitad del conjunto de datos ordenados. 67. 52. Si la distribución es incompleta no se puede calcular la media. se usa la mediana para resumir los datos. ya que sea inferior o superior. Así la posición del valor de la media seria = (5+1)/2=3 Es decir la tercera posición. Es decir. L a media es un promedio no firme. entonces se utiliza la mediana. es decir desconocemos algún valor limite o intervalo. Suponga que los ingresos por ventas mensuales en miles de dólares para cinco meses son: 56. la posición de la media es: Posición de la mediana= (n+1)/2 Si el conjunto de datos tiene un número par de observaciones. es necesario promediar los dos valores medios. Algunas veces es llamada media posicional. 52. Características de la mediana Todo conjunto de datos a nivel ordinal. después de que se han colocado los datos en una serie ordenada. 67. La mediana para una serie simple Si el conjunto de datos tiene un número impar de observaciones. Ej. CENTRO UNIVERSITARIO DE OCCIDENTE Cuando los valores no se distribuyen homogéneamente. La mediana no es sensible a los valores extremos No tiene propiedades matemáticas valiosas para usarla en otros cálculos. no se puede calcular el promedio. 56. dos a lo sumo. 67. nivel de intervalo o nivel de razón tiene una mediana. Entonces primero ordenamos: 45. Aproximadamente la mitad de los valores de los datos en el conjunto son menores que la mediana y aproximadamente la mitad son mayores. 45 y 67. En los casos en los que se quiere un valor central normal que no sufra los efectos de distorsión por los valores extremos.

el cuartil del centro es la mediana original.000 y en la mitad de los meses los ingresos excedieron dicha suma. 52. que se usa con frecuencia en conjuntos muy grandes de datos. La mediana de una distribución de frecuencias de valores agrupados Md= Lk+( ( (n/2 . CENTRO UNIVERSITARIO DE OCCIDENTE Si agregamos un texto mes de ventas de 35. Los valores separados se llaman entonces percentiles. cada una con el mismo numero de elementos. se obtienen cuatro secciones iguales. Fk= frecuencia absoluta del intervalo donde esta la mediana I = El valor numérico de la amplitud donde esta la mediana Salario (intervalo de clase) 1 3 4 6 7 9 10 12 13 15 16 18 Numero de Empleados (frecuencias) Frecuencias Absolutas 1 1 4 5 9 14 6 20 2 22 3 25 25 CURSO ESTADISTICA MSC ING JORGE MYNOR HERNANDEZ Página 8 .5 Es decir la posición de la mediana seria la posición 3 y medio. 67 La posición de la mediana seria= (6+1)/2= 3.UNIVERSIDAD DE SAN CARLOS DE GUATEMALA . Los dos valores d e la posición tercera y cuarta se promedian para producir una mediana de: Mediana= (52+56)/2=54 Esto significa que la mita de los meses las ventas estuvieron por debajo de 54. Cada uno de estos tres valores separados se llama cuartil. es separlo en 100 secciones. la serie se convierte en un conjunto de datos de pares: 35. 56. Una extensión de esta idea. La mediana separa al arreglo de datos en dos secciones iguales.Fk-1 ) / fk) C Md= Mediana Lk= Limite real inferior del intervalo donde esta la mediana (n+1)/2= Mitad de los casos o 50 % Fk-1= Frecuencia acumulada inmediata anterior al intervalo donde esta la mediana. 45. 67. Si cada sección se subdivide con una nueva mediana.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA . El valor que ocurre con más frecuencias se conoce como moda. Características de la moda Algunos conjuntos de datos no tienen una moda Algunos conjuntos de datos tienen más de una moda. No tiene propiedades matemáticas valiosas para usarlos en otros cálculos. Ej. La intersección de las ojivas de valores ascendentes y la grafica de valores descendentes es la mediana. 52. i= amplitud del intervalo donde esta la moda. Moda para una distribución de frecuencias de valoes agrupados en intervalos de amplitud consante En este caso bastara ver cual es el intervalo que tiene mayor frecuencia y aplicar la formula Mo= L i-1 + (fi+1) / ( fi-1 + fi+1) Donde Mo= Moda Li-1= limite real inferior del intervalo donde esta la moda. fi-1=frecuencia absoluta inmedia anterior al intervalo donde esta la moda. CURSO ESTADISTICA MSC ING JORGE MYNOR HERNANDEZ Página 9 . 67 la moda es 67. Si agregamos un séptimo datos que seria 56. Si utilizamos los mismos datos anteriores 35.5+2. fi+1= frecuencia absoluta inmediata siguiente al intervalo donde esta la moda. CENTRO UNIVERSITARIO DE OCCIDENTE Md = 6.5=9.5 + (( (25/2)-5 )/9 )x3=6. 56. con modas 56 y 57. 67. el conjunto de datos seria bimodal. 45. LA MODA A veces es importante conocer cual es el valor que mas prevalece en el conjunto de datos.

30 .50 . CURSO ESTADISTICA MSC ING JORGE MYNOR HERNANDEZ Página 10 . Para este caso debemos hallar el cociente de dividir la frecuencia entre la amplitud osea f/i. 3 f 1 5 4 13 20 24 39 51 41 27 33 20 16 21 7 5 2 329 Mo= 50.65 .100 2 Xi 18 23 28 33 38 43 48 53 58 63 68 73 78 83 88 93 98 N= FUENTE…….UNIVERSIDAD DE SAN CARLOS DE GUATEMALA .95 .40 . llamando ki a ese cociente.55 .70 .80 .20 .5+201/80= 50.35 .51 = 53. CENTRO UNIVERSITARIO DE OCCIDENTE DISTRIBUCION DE PUNTUACIONES ALCANZADAS DE 329 ALUMNO DEL CURSO DE SOCIAL PRIMERO BASICO tabla 2 1 Intervalos 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 .5+2.25 .01 La moda de una distribución de frecuencias de valores agrupados en intervalos de amplitud variable.75 .45 .90 .5 + (41 / ( 39+41) ) x 5 = 50.85 . la moda estará en el intervalo que tenga mayor ki y se calcula aplicando la formula Mo= Li-1 + ( (ki+1) / (ki-1+ki+1) )x i Mo=moda Li-1 =limite real inferior del intervalo donde esta la moda ki+1=cociente f/i de la frecuencia entre la amplitud del intervalo siguiente al que contiene la moda.60 .. mas apropiadamente fi+1 / i.

8 83 37 14.6 3.8 fuente……….8 = 28. El mayor f/i es 83 Mo= 25+( 37 ) / ( 37+20. mas apropiadamente fi-1 / i i=amplitud del intervalo donde esta la moda INTERVALO 20 25 30 35 40 50 25 30 35 40 50 60 N= f 104 415 185 73 38 8 823 i 5 5 5 5 10 10 f/i 20. CENTRO UNIVERSITARIO DE OCCIDENTE ki-1=cociente f/I de la frecuencia entre la amplitud del intervalo anterior al que contiene la moda.8 0.20 La moda puede usar un histograma CURSO ESTADISTICA MSC ING JORGE MYNOR HERNANDEZ Página 11 .UNIVERSIDAD DE SAN CARLOS DE GUATEMALA .8) = 25 + 185 /57..

Sign up to vote on this title
UsefulNot useful