Está en la página 1de 8
— TEE ———————_—————— lz, Estadistica Se ha clasificado aun grupo de personas de acuerdo a su ocupacién y procedencia, La distribucién resulté la siguiente Coma Seema See “rarieliores re 16 7 Mineros 5 9 4 Técnicos B 8 2 4 Obreros 16 mn 4 Capitulo 2 2) Haga un grafico para representar la distribucién de las personas por su ocupacién. b) Hage un grafico para comparar la regién de procedencia de las personas segiin su ocupacién. Rp, Graf a) bars totals, b)baras agrupaas. 3 a * ears sr MEDIDAS DE TENDENCIA CENTRAL El volumen de exportacién de cobre, en miles de toneladas, durante el periodo 90-94 se dan en la tabla que sigue. Trazar un grafico para 2.1 Introduccién “Ano [Gran mineria | Mediana mineria_[_Pequefia mineria_| 1995, 30 ~ 30 | 30 Los datos organizados en una distribucién de frecuencias destacan sus caracteristicas ee mt specs, con wares do. lae, cee, forma. de dsrbucén (eiméticn Tl 0 a0 3 simiirica) et. Sin embargo, los indicadores que describen a fos datos en forma mis precisa, Eta 2 Aches calclerse. Estos indicadores que Teumen los datos en nimeos denorinad taf SO ® i Ieidas deseriptivas se refieen a fa centralizacioa, ala dispersion 0 variabilidad ala asimetria, a la euros, También, son metodos numéreos par describ los dt Gisdrs concidos como, medias de postin relalva que deserbn la postion Se ta observacion relative a las dems otservacones de la dstibuien, estos son los percentiles y los valores estandarizados Z. Ducten, esos son Tes 4) Mostrar la evolucién de las exportaciones. i) Ver el tipo de mineria que determina principalmente Ja tendencia de las cexportaciones. ©) Mostrar la proporcién de cada tipo de mineria respecto al total de exportaciones por hia aio Rp.) Bars pores cmon, Lis sides de tendecia ena, denominadstmbignpromedion, bia eer latos, como la media aritmética (la media geométrica, la media armér ee ee s nla media. arménica),. la Utilice un paquete de cémputo estadistico para resolver este problema 4 La moda, puede ser también interpr i GASTOS. En cada caso realice un breve comentario “Obtenga el minimo, el maximo y el sango de valores de la varia Se sugiere al usuario de este texto, uilizar una calculadora estadistica o correr paquetes Olesen mina ngs as es ayers def A EAD ene oo CEST ena socio de los evs protean de med 2800 soles. Luego el porcentaje entre 2500 y 4000 luméricos para describir datos que contiene. Roan ee eres pare orgaizar Ios datos en citibaiéa de Renusicis, Obtenge le dstibucion de Hecvencas 22 : 4). Grafique el histogram, ef potigono de frecuencias y la curva de fecuenciss La mediana 8 Tate disteuton de reccencis pra resolver el incisob. Definicién. La mediana (He) 0 valor mediano de una serie de valores observados es el ©) Apts els ens Pe gcmulfs exo os tes cuaes MIE separa la sri de dts oranda (en forma cei o detect) cdo beng a sii e Fen iguees cute a solic Gl ncso ©) EAS de gun mero de dats, La medians ee percent 0 de os dates iervados no «9 Desalle un daprome de tals y boas Aerupadosoagruputos por intervalos observados no Uamediana es a eid : la media promedio que depende del mero de orden de los datos y "os valores de estos datos, por lo tanto no le afetan los valores “aislados” prandes © Pequenios, 38___Estadistica f Medidas de la tendencia central 39 2.2.1 Célculo de la mediana Peay) a Eee i la oe se agrupan en una distribucién de frecuencias por ; vervalos, fa mediana se determina aproximadamente por interpolacion de manera que 1) Mediana de datos no agrupados la mad inferior (50%) de los datos agrupados sean menoreso ighales que la medians / Enel m la im de frecuencias por interval cuantitativa X se siguen los siguientes pasos: a a itatva Xs sig gulentes El método de céloulo de la mediana propuesto en aplicaciones de la oliva de la 1) Se ordenan Jos datos en forma ereciente seccidn 1.4.4 lo formalizamos en esta seccién. 2) Luego, se ubica el valor central Me. Primero, se ubica el intervalo que contiene a la mediana Me en la mitad inferior ‘Si mes impar, la mediana es el dato ordenado del centro, Pero sin es par, la mediana del total de las frecuencia: 0.5xn, (50% del total de las frecuencias de cualquier ti es la semisuma de los dos valores ordenados centrales. q de la siguiente manera. " ened Desde Ia mitad inferior del total de las frecuencias, 0.5xn, (en el eje d EJEMPLO 2.1 _ ] frecuencias acumuladas), se hace un trazo horizontal @ la ojiva, y a i jive se a Calcule la mediana para las siguientes series de datos. tuna vertical al eje de los intervalos, ubiedndose un intervalo que contiene @ la a) 120, 3, 14, 1, 99, 7, 30, 2,000, 16 a (by Ul. Este imervalo tiene amplitud 4, frecuencia absoluta acumulada F, y vencia abs no act =F- ‘ b) 30, 77, 3, 300, 36, 11, 10,000, 29 cuencia absoluta no acumulada J; = F~ F.4 Segundo, la mediana Me e[Z,,U,[ y esti dada por: Me=L,+a donde, ase SOLUCION cbtiene por interpolacién (Semejanzas de triingulos ABE y ACD de la figura 2.1) a) La serie ordenada de los 9 datos es j comparando intervalos con frecuencias, esto es: . 1,3, 7, 14 16, 30, 99, 120, 2,000 7 7 3 ees MM ‘La mediana es el quinto dato ordenado que separa ala serie en 2 grupos de 4 datos cada. Sy ant uno. Esto es, Me= 16. ‘ ' bb) La serie ordenada de los 8 datos es: . Luego, Mex t+ 3, 11, 29, 30, 36, 77, 300, 10,000. Donde : La mediana en este cas0, puede ser cualquier nfmerosituado entre 30 y 36, ya que éste L, ese limite inferior del intervato de la medina separa alos datos en dos grupos de 4 datos cada uno. Pero, para evitar la infnidad de Fe ee eee valores de la mediana, se eonviene elegir como mediana ia semisuma de los dos valores centrales. Estoes, Me=(30+36)/2=33. Observe, queen ambos casos, le mediana no depende de la magnitud de los datos, depende sélo del nimero de ellos. A es la amplitud del intervalo de la mediana Sin =F, es la parte (0 porcién) de frecuencia f para legar a 0.5xn desde F Frecacumuladas jive NOTA. E] lector puede verificar que la mediana de los 45 salarios quincenales del ejemplo 1.3 sin clasificarlos por intervalos, es igual a 61 délares. 2) Mediana de datos agrupados 2a) Si los valores de na varlable discreta se agrupan en una distribucién de frecuencias de la forma "dato <> frecuencia", el célculo de la mediane se hace siguiendo el método de | \ | datos no agrupados. Como los datos ya estin ordenados, sélo bastard ubicar su centro. | Lu ‘Por ejemplo, la mediana para la distribucin de frecuencias del numero de hijos por iy Me Intervalos ‘familia del ejemplo 1.2 es igual a2. Figura, 2.1 Determinacién de la mediana por inerpolacién EJEMPLO 2.2 Caleuie ta mediana de los 45 salarios quincenales del ejemplo 1.3 agrupados en 7 intervalos de amplitud iguales SOLUCION Los 45 salarios organizados en 7 intervalos del ejemplo 1.3 se repiten en el cuadro 2.1, Cuadro 2.1, Céleulo de la mediana de X=Salarios Salarios(S) | Numero de empleados | Pree. Acumuladas ci fi Fi Taam T T aaa 2 3 [42350 4 7 130,58 0 0 138,66, 16 3 [6.741 8 41 (74.82) 4 45 Total 5 La mitad inferior de los n = 45, es 0.5xn = 22.5. Esta mitad inferior esta entre las frecuencias acumuladas 17 y 33 que se corresponden con el intervalo [58, 66f, donde, se ubica la medina Me. En este intervalo, L-58, f,=16, Fy=1, 5, es la porcién de frecuencia no acumuladaf para legar a n/2 desde F-1 Mex ty ix Ans 2x82 5842.15 = 0.58 f NOTA (Céleulo de la mediana para frecuencias relativas) ‘Si en lugar de las frecuencias absolutas se utilizan Ins frecuencias relativas (0 los pporcentajes), entonces, haciendo hein, Hii=F jin, MheWfin=0.5-H).4 en ta formula de la medina, se tiene: ' xA=h+ Shdasbe) StS 60.158 M 16 2.2.2. Propiedades de la mediana 1) La mediana, s6lo depende del nimero de datos ordenados y no del valor de los datos. Por lo tanto, no es sesgada por algiin valor aislado grande 0 pequetio como se observa enel ejemplo 2.1. c mn intervalos 2) La mediana puede ser calculada para distribuciones de frecuencia con int diferente amplitud, siempre que se pueda determinar el limite inferior L, det intervalo gue contiene a la mediana, 4) La mediana puede sercalculada para variables con valores en escala ordinal 4) La suma de las diferencias (en valor absoluto) de datos con respecto a su mediana es minima, En el caso de datos sin agrupar se tiene que = minimo, si ces la mediana de los x, EJEMPLO 2.3 ‘Cinco personas que viven en lugares situados a distancias en kilémetros a lo largo de una carretera en linea recta como se indica en la figura que sigue, deben reunirse en algiin panto de la carretera, Determine el lugar de reunién de manera que el costo total del {transporte sea minimo, si el costo de cada transporte es proporcional al recorrido. anciag 20 Is 10 Lugares A Dis SOLUCION Si A es el origen, entonces, las coordenadas de A, B, C, D y E son respectivamente: %1=0, %)=20, 35=35, x, =41 y x5 =51 Sea K el punto de reunién. Dado que el costo es proporcional al recorride, podemos elegir sin pérdida de generalidad la proporcionalidad igual a 1, entonces, Este costo es minimo, si K es la mediana de los $ valores 0, 20, 35, 41, 51, esto esi K=35. Luego, deben reunirse en el lugar C, a 35 kil6metros de A. 2.3 La moda Definicién. La moda de una serie de datos es el valor Mo que se define como el dato que ocurre con mayor frecuencia En la distribucion de frecuentas por intervalos la moda se ubica en el intervalo que tiene Ja mayor frecuencia de cualquiera de los tres tipos La moda de una funcién cualquiera es el valor de la variable en el que existe un ‘méximo absoluto (0 dos 0 mas méximos relatives iguales). La moda no siempre existe y_si existe, no siempre es énica, La moda es et promedio ™enos importante debido a su ambigiedad. El empleo de la moda como medida promedio puede estar justificado cuando se ultra sefalar el valor més comin de una serie de datos o se precise répidamente de una medida promedioy no haya tiempo de calcular las otras. Por ejemplo, los comerciantes Se estoquean con productos que estén de moda. Esta es una aplicacién comin del promedio EJEMPLO 2.4 La moda. de los datos: a) 7,9, 7,8, 7,4, 7,13,7 esigual a 7. Esta serie de datos es unimodal b) 5,3,4, 5,7, 3, 5, 6,3 es igual tanto a3, como a 5. Esta serie de datos es bimodal. ©) 31,11, 12, 19 no existe, (Tambien, se dice, que cada uno de los datos es una moda), Nora. 1) La moda de Jos 45 salarios quincenales sin agrupar del ejemplo 1.3, es igual a 62 dolares (verificar!). 2) Lamoda del nimero de hijos por familia del ejemplo 1.2 es igual a2. culo de la moda de datos agrupados por intervalos Para caleular a moda de m datos organizados por intervalos se siguen los siguientes, primero se determina el intervalo que contene la moda Mo. Ese intervalo fl, Ul, denominado intervalo modal y que debe ser ef nico con Ia mayor frecuencia, tiene amplitud A, frecuencia absoluia fy sus frecuencias vecinas antes y después son fi. y fat respectivamente, Lucgo se aplica 1a formula Mo = L, + Donde, L, es él limite inferior del intervalo modal. d=fi-fia 4, =f~Sin 4 es a amplitud del intervalo modal, NOTA. La formula de la moda se aplica en distibuciones com sana sola frecuencia maxima. EJEMPLO 2.8 Calcule la moda de los 45 salarios quincensles del ejemplo 1.3 agrupados en 7 intervalos de amplitudes iguales SOLUCION Los datos organizados en 7 intervalos del ejemplo 1.3 se repiten en el cuadro 2.1. Aqui se observa que la moda Mo ¢ [58,66[. Adems, 1,=58, 4,=16-10=6, a, Luego, la moda de la distribucién es: Medidas de la tendencia central 43 NOTA: (Cileulo de la moda en distribucién de frecuencias relativas) Sien luge de Ins frecuencias absolutes se utlizan las frecuencia relativas, se tiene 4 fs +A a= 58+ 361.4 Ged, 0/453 os Mo 2.4 La media aritmética Definicién. La media aritmética, denominada simplemente media, cs el valor numérico (que se obtione dividiendo Ia suma total de los valores observadas de una variable entre el aiimero de observaciones, Para valores de una variable X observados en una muestra, la media aritméti denotada por F. tmética sera 2.4.1 Calculo de la media aritmética 1) Media aritmética de datos no agrupados La media aritmética dem valotes 25%, un en una muestra es el nimero: ‘» de la variable cuantitativa x, observados Suma total Fdedatos EJEMPLO 2.6 Caleule la media aritmética de los 45 salarios sin agrupar del ejemplo 1.3. SOLUCION {a suma total de los 45 salaries sin agrupar es $2670. Luego, “ 2 su 45°45 $59,333 2) Media aritmética de datos agrupados 2a) Media para datos agrupados de variable disereta . = 7 valores de una variable estadistica discreta X’se clasifican en k valores distintos Toe S+ con fecuencias absolute respectva fff, entoncss, la sun total de latos es igual xx fix) % fy ttm x fy y la media aritmética es el nimero: eR Medidas de ta tendenelacentral___45 44____Estadistica 2 SOLUCION Yims La distribucién de frecuencias del ejemplo 1.3 se repite en el cuadro 2.3, donde se ha = _ Suma total jncluido una columna de productos f; xm, ad Cundro 2.3. Célculo de la media aritmétiea de X=Salarios aero Salarios ¥ empleados | Productos ‘Calcule la media aritmética de Ia distribucién de frecuencias del nimero de hijos por familia del ejemplo 1.2. UCION . | SOUUGisribucién de frecuencias del ejemplo 1.2 se repite en el cuadro 2.2, donde se ha” incluido una columna de productos f, 3%) ‘Cuadro 2:2. Céleulo de la media de X=Niimero de hijas por famitia Fede hijos | #de familias [Productos % Total La media de la distribucién es: 2b) Media para datos agrupados por intervalos ‘Sin valores de una variable cuantitativa X estin organizados.en una distribucién de frecuencias de k intervalos, donde: IM, My yoy My, SOD Jas marcas de clase , ¥ ; Sisfaons Fe son las frecuencias absolutas respectivas, centonces, la sumsa total de los m datos es igual mx firm, fittm fi y la media aritmética es el mimero: eae Fede datos — aritmética de la muestra de 45 salarios quincenales del ejemplo 13 agrupados en 7 intervalos de amplitudes iguales ti fi fxm, B63 T 0 Beat 5 a fe2sot 4 1 {50.38 10 540 [58,66 16 992 Icom 8 560 {4821 4 a2 Total re 4b i Dim srs EL 3 7 = 859.867. NOTA. Observe que la media de los 45 datos sin agrupar es $59.333 (media exacta). La ‘media $59.867, obtenida por el método de distribucién de frecuencias por intervalos, es un valor aproximado del resultado obtenido con datos sin agrupar NOTA. (Media aritmétiea con frecuencias relatives). Para calcula Ia media artmeétiea de una distribucién de frecuencias relativas (0 porcentajes) tanto de variable discreta ‘amo por intervalo, sehace 4, = fiJn, 1=1,2,-.k En este caso la suma total de los 7 datos es my hy +1 Xhy +...4m, xg, el total de ‘frecuencias relativas es 1 y la media aritmética es el nimero: A Diem ‘Suma total y ‘hxm, # de datos n ‘ _ Por ejemplo ta media aritmética para la distribucién de frecnencias relativas de los 45 2 | laios es, 8 = Sh xm = 0.02213040.044x38e, 1.08978 = $59,867 it NOTA (Media aritmética de la poblacién)- La media aritmética de una poblacién se denota por p. Si la poblacién es finita de tamafio N con valores X;,2p,...y , la media titmeticaes el nimero Suma total # de datos 46___statstica Medidas de la tendeneia central___47 ee tenet core $F q-ot2SG/-D% yaque nF-0?20 2.4.2 Propiedades de la media aritmética 2 a 1) La suma total de m valores cuya media es ¥ es igual a ni. En efecto, para n datos no 9) Media global agrupads y agrupados respectivamente, se tiene: Si los valores de la variable se observaron en k grupos de tamatios respectivos Sn on y,Mpy-N_ Tesutando las medias respectivas ¥,,%,..%,, entonces, la media global o a del total de datos es igual a 2) Sia la variable X se le hace la transformacién lineal ¥ = aX +, es decir si a cada uno a os as XH tm Hy tat mp ky de los n valores x, de X es transformado en el valor: y,=at,+b de ¥, siendoa yb 4 le datos 7th ttm, constantes, entonces, la media de los » valores yj 05 (jverficar!: Por ejemplo, si en un examen de Matemética, 110 alumnos del horario Hi! obtuvieron luna media de 12.6 y 120 alumnos del horario H2 obtuvieron una media de 13.48, entonces, Ja media global o del total de alumnos es: Faakeb ‘Como casos particulares se tiene si 7 1O0KI2.6+120%13.48 _ 15 96, 110+120, constante,entonces su media es igual a esa constante, : “ns ° Media ponderada Si ¥=X-ra, entonces, F=ai+b, Esto es, sia cada dato se suma una constante la . . redia queda sumada por esa constante La media ariméties F=Y°fpxx,/)° J, os una media de los valores 3.33.04 Si Y= aX ens, Y=, Exo, stn cade to semuipiaporumacenson 8B ‘media queda multiplicada por esa constant. Speen, x XrcnXp ponderada por los pesos 3) La. suma algebraica de las desviaciones dem datos x; con respecto a su media ¥ es a pe pe ‘gual a cero, En efecto, para datos no agrupados, y agrupades, se tiene respectivamente: = i Ye, -)=0, LAKe-D=0. a m Fe Wy Wayans y es el mimero: ey LX Fp aa ty mamta ES Por ejemplo, si un alumno en el semestre anterior ha obtenido 11 en el curso A de 5 Sréditos, 13 en el curso B de 4 créditos, y 16 en el curso C de 3 eréditos, entonces, su Promedio de notas (ponderado por los erSditos) es, 4) La suma de los cuadrados de las desviaciones de n datos con respecto a su media es ‘minima, Para datos no tabulados, por ejemplo, So-0 En efecto, sis cualquier nimero real, F(a 9? = ly -F+ FoF Dy 212 -OGy -D eF—0)%. Lei = Des oF = Ya -9 +28 ts x a a a ‘nima, si M1x5413x4 +163 _ 15: was 2.92. En reatidad, toda media aritmética es ponderada. En el caso de la media de datos no ‘erepados, el peso de cada valor de la variable es igual a uno, ‘Los pesos pueden ser también nimeros relatives 0 porcentajes. So? = YG - D2 +nE-e)?, yaque DG -7) Deir xe FY me yeaue 2 q Por ejemplo, si en este mes el aumento de los alimentos fue del 5%, de vivienda el ] 10% y de eciueacién 8%6, Entonces, el aumento promedio en los tres tubros para una or Medidas de la tendencia central 48 Btadisticn persona,que_gasa el 40% de su suelo en alimentos, el 35% en vivid y et 254% en ; studios est dado por: Sen. (.05x0.440.10x0.35+0.08*0.25 = 0.075. a Pero el aumento promedio en los tres rubros para una persona que gasta S/.1,200 en ae Be cote ttl sed mismo, si Kes la media de los 5 valores: 0, 20, 35, 41, SI, esto es alimentos, §/.600 en vivienda y S/. 1,000 en estudios esté dado por: *G0, deben reunirse en un lugar a 29.4 Km. de A. . 0,05x1200-+0.10600 +0.08%1000 _ 200 EJEMPLO 2.11 Fe eo oe = 09 00714 ‘Ua conjunto de 1200+ 600 +1000 2800 gen ras ae ae valores de venta serian de $5 en el 30% de los casos enel Jos casos y 10$ en el 25% de los casos, tiene nie "de Sk, Hallar el valor de k si se tienen un costo de produccién fijo oO : quiere hacer una inversién minima y si EJEMPLO 29 F Gversin es igual a sura dels eundrados de todas as ulidadee > Ome 8 Los sueldos del mes de enero de 200 empleados de una empresa tienen una media de bee SOLUCION By Si el 60% de los empleados son hombres (el resto son mujeres) y tienen un sveldo ee ane » promedio de $250, jcuinto es el sueldo medi de las mujeres en enero? . ba iverson es: (5-1)" ene 30% dels eats + (7-B)? ene 45% de los casos + by Si para el mes de joo, se propone un aumento general que consists de wo puneno, (10 ~#)? en el 25% de los casos. Naable del 30% a cada sueldo de enero mas una bonificacién de $30, jeuénto dinero La inversién es minima, si k es la media de los datos: : ‘icional necesitard la empresa para pagar los sueldos inerementados? 7} Frecuencia 0.45 y $10 con frecuencia 0.25. Esto. arian SOLUCION k=5%03+7%045410% a) Sean X, % y Xp las medi 0.25 as total, de hombres y de mujeres respectivamente. Entonces, — eae NOTA. (Defectos de la medi i FAME pe hyn media aritmética) MASA ME 95 hy ‘tmética) 1.Lamedia ica ‘a media aritmética es la medida promedio que depende de todos los valores observados, nym s e fen consecuencia, es “afectada” o “sesgada” mos discordantes : 3 nc © “sesgada” por valores extremos di aoe aDE atipicos (0 extraiamente_ grande ei eaeaapaee n a so, gutfamente grandes © pequets en el grape). Por eemplo, le media Luego, 230 =0,6%250+0.4x%p, de donde resulta, ¥ “ a 2) 55,56, 57, 58, 59,60 es igual a ¥,=345/6=575 ”, b) 55, 56, 57, 58, 59, 100 es igual a ¥, =385/6- 64.2. y ©) 55, 56,57, 58, 59,0 esigual a ¥=285)6=47.5 Pal3¥ +30=1.3%230 +30 = 329 7} _ Como se puede observar, la media aritmética es ses x¥ =200x230= $46,000 Mca elgrupod) y Oenel grupo enc). ¢ sesgada por los valores extremos: 100 El total de dinero para pagar sueldos de enero El total de dinero para pagar sueldos de julio El dinero adicional para pagar sueldos de jul 5 © 200%329 = $65,800 La media aritmética puede ser calculada tambiéi amass RN ae te ic ens etn ot (marcas) des interno. Por emp, mos puede cla lmeia pr i le frecuencias como del cuadro 2.4, (También, no se puede calcular ia EJEMPLO 2.10 rAplicando Tos dats del ejemplo 2.3, determine el lugar de reunion de manera Got ‘mediana y Ja moda, gpor qué?) cost tual del transporte sea minimo, siel costo de cada transporte es proporcionsl ‘cundrado del recorrido. : agen intervals Frecuencias SOLUCION Tesoro igual que 20 = Seo K cl lugar de reunién ubicado en la caretera en linea recta. Dado que el coste 20.251 a ‘cuadrado del recorrido (sin pérdida de generalidad sams | 25 emis + transporte es proporcional al ‘Come constante de la proporcionalidad), el costo fora! del transporte es: 50 Estadisticas 2.8-Relacién entre media, mediana y moda L. Si la distribucién de frecuencias de los datos es simétrica, entonces, la media, Ia ‘mediana y la moda tienen el mismo valor (figura 2.2(a)). Esto es, = Me = Mo. 2. Si la distribucién es asimétrica de cola ala derecha, entonees, Ia moda es menor que a mediana y esta a su vez es menor que la media (figura 2.2(b)). Es decir, Mo < Me <3. 3, Si la dstribucién es asimétrica de cola a la izquierda, entonces, la relacion es (figura 2.2(€)): i ¥< Me < Mo. A “| sepundo ato y un ‘Me = Mo igura 22 (@) ‘Mo

También podría gustarte