Está en la página 1de 64
Derinicion - Distatsuciones € FREcuEncias i INTRODUCCION: DISTRIBUCIONES DE FRECUENCIAS NO AGRUPADAS Suponga que acaba de realizar su primer examen de estadfstica y que recibi6 una calif- cacién de 86. Es natural que esté interesado en saber lo bien que le fue con respecto a los otros estudiantes, Usted tiene muchas preguntas: {Cudntos estudiantes obtuvieron un 86? {Hubo muchas calficaciones mayores que la suya? Cudntas calificaciones fueron me- nores? Las calificaciones brutas del examen se presentan desorganizadas en la tabla 3.1 ‘Aunque aparecen todas las calificaciones, es dificil hacerse una idea de ellas, debido a la forma en que estén en la tabla, Un arreglo més eficiente, y que tiene un mayor significa- do, consistirfa en enumerar las calificaciones con su frecuencia de aparicién. Esta lista es una distribucién de frecuencias. + Una distribucién de frecuencias presenta los valores de los datos y su fre- cuencia de aparicién, Al ser presentados en una tabla, los valores de fos datos se enumeran en orden, donde por lo general el valor del dato menor aparece ena parte inferior dela tabla, (Ordenamos as calificaciones de la tabla 3.1 en una distribucin de frecuencias, la cual aparece en la tabla 3.2, Ahora los datos tienen mayor significado. En primer lugar, es facil ver que hay 2 calificaciones de 86, Adem, al sumar las frecuencias apropiadas(), podemos determinar el niimero de calificaciones mayores y menores que 86. Se puede ver que hay 15 calificaciones mayores y 53 calificaciones menores que la suya. También ¢s facil determinar el rango de las datos en una distribucin de frecuencias, Para el exa- rmen de estadistca, as calificaciones varfan de 46 a 99. Podemos ver, a partir de este ejemplo, que ef objetivo principal de una distibucin de frecuencias consist en presen- tar los datos de un modo que facilite su comprensiGn e interpretacién, 35 36 CAPITULO 3 DisTRIBUCIONES DE FRECUENCIAS Tanta 3.1 Tapua 3.2 e Calificacién del examen de estadistica (N= 70) 95 37 16 93 86 80 89 76 76 6 "a 94 96 7 65 ~p 6 56 2 82 1 67 79 1 1 52 16 68 n 88 84 70 83 93 16 82 96 87 Cc 89 7 81 87 65 7 n 56 B % 58 54 82 82 66 B % 86 81 6 46 o 99 93 82 2 15 16 90 ” 0 Calificaciones de Ia tabla 3.1 organizadas en una distribuci6n de frecuencias DATOS AGRUPADOS Cuando hay muchos datos con un rango muy amplio, como es el caso del examen de estadistica que estamos estudiando, la enumeracién de los datos individuales produce muchos valores con una frecuencia nula y una presentacién donde es dificil visualizarla forma de la distribucién y su tendencia central. En estas condiciones, los datos individua- les se agrupan por lo general en intervalos de clase y se presentan como una distribucién de frecuencias de datos agrupados. La tabla 3.3 muestra las calificaciones del examende estadistica agrupadas en dos distribuciones de frecuencia, una donde cada intervalo tient 2 unidades de ancho y la otra con intervalos de 19 unidades de ancho. ‘Al agrupar los datos, uno de los puntos mas importantes es la amplitud del intervlo; ya que al formar grupos de datos se pierde cierta informacién. Mientras més amplio se? el intervalo, se perderd més informacién. Por ejemplo, considere la distribucién que ap rece en la tabla 3.3 con intervalos de 19 unidades de ancho. Aunque este ancho de ine valo produce una presentacién suave (no existen frecuencias nulas), se ha perdido mucha informacién. Por ejemplo, ¢c6mo se distribuyen las 38 calificaciones en el itervaloe 76 a 942, estén en 94?, ;0 en,762, jo estén distribuidas de manera uniforme en tod0e BEE Ee ae = ee Tanta 3.3 Datos agrupados 37 Calificaciones de la tabla 3.1 agrupadas en intervalos de clase con diversas anchuras Intervalo de clase Intervalo de clase (anchura = 19) iG (anchura = 2) = 95-113 76-94 57-15 38-56 98-99 96-97 94-95 92-93 90-91 88-89 86-87 84-85 82-83 80-81 78-79 76-71 74-15 RB 70-71 68-69 66-67 64-65 62-63 60-61 58-59 56-57 54-55 52.53 50-51 48-49 46-47 Sucqcavanne peSE sc Pe ge F 3 10? La cuesti6n es que no sabemos c6mo estén distribuidas en el intervalo. Hemos ido al agrupamiento de los datos. Observe que mientras mayor sea el intervalo, mayor sera la ambigiiedad 5 mas pequefio sea el intervalo, se preservardn de manera interval perdido esa informacién debic Debe ser obvio que mientra: ands fiel los datos originales (el caso extremo es donde la amplitud del intervalo es de 1 tinidad, con lo que regresamos a los datos individuales). Por desgracia, cuando el interva~ mismos problemas que en el caso de los datos o es demasiado angosto, encontramos los individuales: a saber, valores con frecuencia nula y una presentaci6n poco clara de la forma de la distribuci6n y su tendencia central. La distribucién de frecuencia con interva- los de 2 unidades de ancho, que aparece en la tabla 3.3, es un ejemplo en donde los intervalos son demasiado pequefios. Podemos ver, entonces, que al agrupar los datos hay que resolver el dilema entre per- der informacién y tener una presentacién visual significativa. Para poseer lo mejor de ambos aspectos, debemos elegir un ancho de intervalo no muy amplio ni muy angosto. En la préctica, por lo general, determinamos la amplitud del intervalo dividiendo la dis- tribucién de 10 a 20 intervalos. A lo largo de los afios, se ha mostrado que este rango de intervalos funciona bien con la mayor parte de las distribuciones. Dentro de este rango, el 38 CAp{ruLo 3. DISTRIBUCIONES DE FRECUENCIAS niimero especifico de intervalos utilizados depende de la cantidad y el rango de los gy en bruto. Observe que mientras més intervalos se utilicen, mas angostos serén éstgg_ Construccién de una distribucién de frecuencias de datos agrupados Los pasos para construir una distribucién de frecuencias de datos agrupados son siguientes: Determinar el rango de los datos. Determinar la amplitud de cada intervalo de clase (i) Enumerar los limites de cada intervalo de clase, colocando el intervalo que: ne al dato minimo en la parte inferior. Cotte. 4. Contar los datos en bruto en los intervalos de clase adecuados. 5. Sumar las cuentas de cada intervalo para obtener la frecuencia del interval, Apliquemos estos pasos a los datos de la tabla 3.1 1. Determinacién del rango. IS Rango = Dato maximo menos dato minimo = 99 ~ 46 = 53, 2. Determinacién de la amplitud del intervato (i). Suponga que queremos agry los datos en 10 intervalos de clase, r Rango _ 3 (ScNimerodeinecnlordsciey SRDS > | \comamea Cuando i tiene un residuo decimal, seguiremos la regla de redondear fal mis rimero de cifras decimales que tienen los datos en bruto. Asf, ise redondea as 3. Enumeracién de los intervalos. Comenzamos con el intervalo inferior, El pr. mer paso consiste en determinar el Kite inferior de este intervalo, Existen do requisitos: a, El limite inferior de este intervalo debe ser tal que el intervalo contenga dato mfnimo. b,. Se acostumbra que el Ifmite inferior de este intervalo sea divisible de mane, exacta entre i Con estas condiciones, el limite inferior es entonces el valor del dato mining en la distribucién, si éste es divisible de manera exacta entre i. Sino lo es, ei. Ces el limite inferior es el siguiente valor minimo que sea divisible exactamene fntre i, En nuestro ejemplo, el Ifmite inferior de este intervalo comienza con 45, ya que la calificaci6n minima (46) no es divisible de manera exacta entre 5 Una vez determinado el Ifmite inferior del primer intervalo, enumeraremas o- dos los intervalos, Como cada intervalo tiene 5 unidades de ancho, einer {inferior varfa de 45 a 49. Aunque parecerfa que este intervalo tiene s6lo4 unit des de ancho, en realidad tiene 5. Si hay alguna duda, basta contar las unidades (45, 46, 47, 48, 49). Al enumerar los demés intervalos, debemos estar segursé: gue los intervalos son continuos y mutuamente excluyentes. Esto sitimo que Gecir que los intervalos deben ser tales que ningtin dato debe quedar incl manera valida en mAs de un intervalo, Con estas reglas obtenemos Tos interval {gue aparecen en la tabla 3.4, Observe que, siendo consistentes con el andlsss {os limites reales del capstulo 2, los intervalos de clase que aparecen en laine yp Datos agrupados 39 columna representan limites aparentes. Los Ifmites reales aparecen en la se- tzinda columnna. Lo usual es enumerar sé los limites aparents de cada intervalo ¥ omit os limites reales, Seguiremos esta précticaen los ejemplos subsecuentes. 4, Conteo de los datos, A continuacién, introducimos los. datos en bruto en los intervalos de clase adecuados. Este conteo es Wi procedimiento por medio del ual uno recere Ia distibucign de manera sistemstica, de modo que por cada dato en bruto se escribe una raya vertical junto al intervalo que contiene a dicho dato. ‘Ast, para 95 (la primera calificacion de la tabla 3.1) colocamos una raya en el intervalo 95-99. Seguimos este P! das las calificaciones, y de rocedimiento para to Tas aoe obtener los resultados que aparccen ed la tabla 34 5. Suma de frecuencias. Por tiltimo, las rayas verticales se convierten en frecuen- clas, al sama las primeras, de modo correspondiente, cada intervalo, Estas fre- cuencias aparecen también en Ta tabla 3.4, jones agrupadas TABLA 3.4 Construcién deuna distibucgn de recuenias para Is callie 95.99 94,5-99.5 i Sim! 90.94 89,5-94.5 DT f 6 85.89 845-895 PHI 1 80-84 795-845 nd TK 10 75:79 145-19.5 1M1 PHBE 16 70-74 69.5-74.5 ‘HU 3 65.69 64,5-69.5 THU 7 60-64 59,5-64.5 MI ts 55.59 4955-545 mL 4 50-54 495-545 1 2 45-49 44.5-49.5 1 z= -, Dados los siguientes 90 datos, construya datos agrupados, con 12 intervalos. Reaticemos un problema de préctc ‘una distribucion de frecuencias para 112. 68 55 3 nD 80 35 35 62 102 65 (104 51100 "4 45 60 58 92. 44) 122 B 65 8 49 61 65 83 16 95 55 50 82 51 138 B 83 n 89 37 6 95 109 93, 65 6 24 60, 43 130107 nD 86 n 128 90 48 2 67 16 7 86 «14 3 54 64 82 47 81 28 9. 85 32106 0a eala) 8 42 62 86 94. 1 28 9 46 53 38 58 32 68 40 CapiruLo 3 2S oe DISTRIBUCIONES DE FRECUENCIAS {inal cisieecnobonesouugiors <2 aa OLUCION La solucin aparece en la tabla 3.5. Tania 3.5 ; Peterminacién del rang, | Ranigo = dato mim — dato minimo = 138 29 Determinacién de la amplitud del intervalo (i): ae Be Rango _ 16 Numero de intervalos 2 = 9:7 — ise redondea a 10 Enumeracién de los limites para cada intervalo de clase. Como el dato n distribucién (22) no es divisible de manera exacta entre i, mfnimo en ja el limit intervalo es 20. ;Por qué 20? Porque esl siguiente valor inferior que es aan Ean xacta entre 10. Los limites de cada intervalo de clase aparecen ehumerader nat ae Come dos datas en brtoenlosintervalos de claseadeeuados. Engrg ne la siguiente tabla. Wen 5. Sesuma la cuenta para cada inter para obtener sufecuenct. Ese hinentg ae Intervalo de clase Conteo Ff __Amtervalodeclase Conteo 13 4 2 mu 3 120-129 2 mummy |S 110-119 Mi 3 mm 4S 100-109 PHI 6 Th ? 90-99 HLL 7 mn 80-89 PATH rr Mm Dsscies siguientes 130 datos, construya una distribucién datos agrupados con 15 intervalos. de frecuencias para Var) 219ib inka 1etScs3 2) B28 Beda 20 ine sh om Samine 1B 3,527 29 at 3d ee to eens 7 2a Te 2.59 1315 5°) T18B 9" 2714.25 mp 14 seed Oem a mo 2.5 | Sey? “©3:1BN7.6 (hp tal ih gra‘on sl agalael ity Maio nt 19 06 Te ©55.0 cep 4101600 Sigg SPDs Me aha AEN See ey AGS A AG aa 38 92.9. 0 34 seul09)pea018) ba ll8 maps onan acm ea ond Cem yA cio e t) 1 OG ” th 37. | 35 yteen 4 0p gon LS emia aan mA Ce nS aol 17) 9 46. B.S) 211e 42) eee Od ye 16, 28 288 2.RRY 315) a7 ies See OMe 30 3a 278) 2208 73:1 es 14 meas aa olen) Sige Uma) Wim EPO APO. 6 PA akon Gh 23 ee Ra ae ee Deriniciones Datos agrupados 41 SoLucION La solucién aparece en la tabla 3.6. Tapia 3.6 1. Determinacién del rango. Rango = dato méximo ~ dato minimo = 5.0~ 0,6 = 44 2 Determinacién del ancho del intervalo (i): Rango = 442029 ise redondeaa03 Nimero deintervalos 15 3. Enumeracién de los limites de cada intervalo de clase. Com el dato minimo en la distribucién (0,6) se puede dividir de manera exacta entre i ésta se convierte en el limite inferior del primer intervalo, Los limites de cada intervalo aparceen en la tabla anexa 4. Conteo de los datos en bruto en los intervalos de clase adecuados. Esto se ha hecho en la tabla, Suma de las cuentas de cada intervalo para obtener sus frecuencias, Esto e hizo dela siguiente manera, Observe que la unidad de medida minima en los datos en bruto cs 0.1 los Ifmites reales para cualquier dato estén a 20.05 del dato mencionado. Ast, os limites reales para el intervalo 4,8-5,0 son 4.75-5.05. Intervalo de clase _Conteo Jf Intervalode clase Conte f " 2 24.2.6 TAIL 10 TA 5 21-23 PAUL 9 PKI I) 8 18-20 PHU 9 181 6 15-17 mw 8 PAULL 1 L214 7HU/ 6 maT THT = 16 09-141 mM 4 THITHI TAIT 16 06-08 mw 3 1 = Frecuencia relativa, frecuencia acumulada y distribuciones de porcentajes acumulados A menudo se desea expresar los datos de una distribucién de frecuencias como una frecuencia relativa, una frecuencia acumulada o una distribucin de porcentajes a mulados + Una distribucién de frecuencias relativas indica la proporcién del nimero total de datos que aparecen en cada intervalo. + Una distribucién de frecuencias acumuladas indica el niimero de datos que caen por debajo del limite real superior de cada intervalo, CaPiruLo 3. DISTRIBUCIONES DE FRECUENCIAS Tawta 3.7 Derinicion * Una distribucién de porcentajes acumulados indica el porce que caen por debajo det limite real superior de cada interval maje de daigy La tabla 3.7 muestra Ia distribucién de frecueneias de las calificac f estadistica expresadas como frecuencias relativas, frecuencias acumen, Uo! Xam, cign de porcentajes acumulados. Para convertir una distribucion de fase) Y disqye distribucién de frecuencias relativas, dividimos la frecuencia de cna eM ey Me miimero total de calificaciones, Asf, oe n lo ent Frecuencia Frecuencia relativa = —Ucnela Por ejemplo, determinamos la frecuencia relativa para el intervalo 45.49, gi, frecuencia (1) entre la cantidad total de calificaciones (70), Ast, ta free, lend paraeste intervalo es '/,y= 0.01. La frecuencia relativa es iil, pues nos ine Tela’ ci6n de calificaciones contenida en el intervalo. ica a pel La frecuencia acumulada para cada intervalo se calcula sumando la fre 7 intervalo a las frecuencias de todos los intervalos de clase que estin por d acta Oy ja frecuencia acumulada para el intervalo 60- 64= 444424121], -°4Odeq El porcentaje acumulado de cada intervalo se determina convirtiendo , | acumuladas en porcentajes acumulados. La ecuacién para hacer esto es ~ Frecteng, Frecuencia acumulada —Towencia acumulada Porcentaje acumulado = “ Escalas de medici6n y sus caracteristicas Intervalo Frecuencia de clase relativa < 95-99 90-94 85-89 80-84 75-79 70-74 65-69 60-64 55-59 50-54 45-49 RSra8 9 7 4 4 2 1 3 TT PAY Mate a pa Percentiles 43, Asf, para el intervalo 60 » 64 tenemos que: 1 Frecuencia acumulad Porcentaje acumulado = —Peecucnein ecumulada UW taje acumulado: Wi % 100 = 5X 100 = 15.71% Las distribuciones de frecuencias acumuladas y de porcentajes acum para determinar percentiles y rangos percentiles, uulados son tiles @ PERCENTILES iva. Se utilizan de manera amplia en la Los percentiles son medidas de posicién relat iuo con el de un grupo de referencia, educaci6n para comparar él rendimiento de un ind rentil es el valor sobre la escala de medida, debajo Derinicion —*—-« Unpercentil 0 punto pere = dado de los datos este la distribucion del cual cae un porcentaje ‘Asf; el 600, punto percentil es el valor sobre la escala de medida, debajo del cual el 60% de los datos en la distribucién. CAlculo de los puntos percentiles Icular el 50o. punto percentil para las calificaciones eee aaa ade estadistica, Estas calficaciones aparecen en la tabla 3.8 como distribucio- sea frechencias acumuladas y de poreentajes acumuladores. Utilizaremos el simbolo Py, para representar al S00, punto percentil. Qué entendemos por el 500 pinta percentil? ‘tir dela definiién de punto percentil, Py es el valor de la escala debajo del cual cae 21 50% de las calificaciones. Como hay 70 calificaciones en la distribuci6n, Psp debe ser ‘Suponga que estamos interesados en Tanta 3.8 Cileulo de los puntos percentiles a partic dc las caificaciones de la tabla 3.1 Intervalo a % de clase f acumulada acumulado Céleulo del percentil 95-99 4 70 100 Punto percentil = X, + (/f) 90-94 6 66 94.29 (fpacumulada—f, acumulada) ieee 7 60. 85.71 80-84 10 33 15.71 75-19 16 a 61.43 Poy = 745 + (She) 35-27) 70-14 9 27 38.57 = 77.00 | 65-69 7 18 25.71 60-64 4 n 15.71 | 55.59 4 7 10.00 2 3 4.29 1 1 143 44 CarfruLo 3 Disteinuctonus pu rRUCURNCIAS el valor debajo del cual eaen 35 calificaciones (el 50% de 70 €8 35), 2 columna de las frecuencias acumuladas y movernos de abujo hhacia arriba, AU Sb, cae en el intervalo 75-79. Sin embargo, en este momento no Sabemoy 4 ‘escala debemos asignar a P.,. Lo tnico qué sabemos £5 que cae en alga, los Mites reales del intervilo 75-79, que son 74.5.9 te" Para deter’ donde esta Pro, suponemos que todas las ealificaciones esta dlistipering uniforme en todo el intervalo, dag ql yt Como 27 de las ealificaciones exen por debajo tro del intervalo hasta obtener 8 calificaciones sd existen 16 calificaciones en el intervalo y éste tiene cién del intervalo equivale a4/,, de In unidad. Para ecesitamos movernos dentro de intervalo/,,% 8 inferior de 74.5, Hegamos a Pyy. Ast, Po =74.5+2.5=77.0 Para determinar cualquier punto percentil,siga estos pasos, 1 Determinar ta frecuencia de los datos por debajo del Punto Iizaremos esta frecuencia como “‘f, acumulada™ Perceniy Sing Jn= (porcentaje de los datos por debajo del PUM pe, Mi) fo acumulada para Pry = (50%) x N= (0.50) xc ex xy 2. Determinar el limite real inferior del imtervalo que hint, Llamaremos a este Ifmite real inferior X;. Al conocer el miigys!Mo ie debajo del punto percentil, podemos localizar ¢| intervalo que n° de dag Percentil comparando f, acumulada con la frecuencia, acumulada qette ay Cada in Na, % Ficura 3-1 35 calificaciones que est 27 debajo de este valor Determinacién del valor calificaciones pag dba de cs de Pay em la escala, para a ots eee Osta calles rare {as calificaciones de! por debajo, examen de estadistica. de este Tels ty j+——-—— 5 unidades de escala 5 Fexc] jx de una unidad de escala LL i6 | [*—— 25 unidades adicionales —+| | us no =| Hs Psy = 74.5 +2.5 = 77,00 p De Statistical Reasoning in Psychology and Education, de E,W. Mit d inium. Derechos res John Wiley & Sons, Inc. Adaptado con autorizacién, Matos 65 46 a Carini uw LO 3 DISTRIBUCIONES DE FRECUENCIAS | | donde X,= Valor del Ifmite real inferior del intervalo que contiong punto percentil al Jpacumulada = Frecuencia de datos aue est8 F Fracumutada= Frecuencia de datos que est Pry del intervalo que contiene al punto f= Frecuencia del interyalo ave contic! {= Amplitud del intervalo or debajo del punto pere eect eae percentil rior pel punto percentil izar esta ecuaci6n para cateular Pso ¥ OBLENeT X, + Uf )Pp acumul 74.5 + (1635-27) Podemos utili: lada — f, acumulada) Punto percentil = Pso= = 74.5.4 2.5 = 77.00 Tratemos de resolver otro problema, Estalvez calcularemos Fao, 1 Valor debajo del cual esté el 20% de las calificaciones. a iterminos|de lal frecuceas sepase ada, Pyo es el valor por debajo del cual cach 1 calificaciones (el 20% sour ae. E tormoa ver en la tabla 2.8 (pagina 43) que Pa90st6 ene] inteny Feo eotT1 ealificaciones eaen por debajo del valor 64.5, necesitamos $ ome adisionales. Dado que en el intervalo hay 7 calificaciones y ee eee ide anchovdsbemsimoverics (xi == unidadiesienicstc imervas Io. Ast, Pay = 64.5 + 2.14 = 66.64 También podriamos haber determinado P29 en for i n ‘amos rma directs | ecuacién para el punto percentil. Asf, 2 a ao | Punto percentil = _X,, + (i/f)(fp acumulada — f, acumulada) Py = 64.5 + 6/14 - 11) | = 64.5 +2.14 = 66.64 eee PROBLEMA E PRACTICA 3.4 Resoivamos un problema més. Esta ve [es un f b z calcularemos P. ao Por debajo del cual cael 7598delas Ealifcacionts, Bate ne < u acumulada, P,, es el valor de la es 5% ins del ee 5 ja escala : ds de la ealifcartones (fp acumulada es igual al 75% de UME ao A ae tabla 3.8 (pagina 43), vemos que P,, cae en el intervalo Boren an Boa . califica. -ciones caen por debajo del limite inferior de este intervalo (79.5), necesitamos cre In escala adecuados parn $2.5 = 43 = 9.5 calificaciones adicionales. Como existen 10 calificaciones en el intervalo y éste tiene 5 unidades de ancho, necesitamos movernos en el intervalo %, % 9.5 uunidades. Asf, 15 Pry 79.5 44.75 = 84,25 EI P,, también se puede determinar en forma directa, mediante ta ecuacién para el punto percent. Asi Punto percentil = X, + (W/f)(f acumulada~f, acurnulada) Py = 19.5 + HYyN525~43) = 79.5 +415 = 84,25 © — RANGos PERCENTILES A veces queremos conocer el rango percentil de un dato crudo. Por ejemplo, como su calificacién en el examen de estadistica fue de 86, le seria itil conocer el rango percentil de este valor. DeFinicion «EL rango percentil de wn dato es el porcentaje de datos con valores menores que el de dato en cuestion. CAlculo de rangos percentiles Esta situaci6n es contraria a la anterior, donde calculdébamos un punto percentil. Ahora ; sabemos el dato y debemos calcular el porcentaje de datos que estén por debajo de él. De ' huevo, suponemos que los datos dentro de cualquier intervalo estan distribuidos de manera Luniforme, Podemos ver en la columna de intervalos de clase de la tabla 3.9 que la califi- cacién de 86 cae en el intervalo 85-89, Existen 53 calificaciones que estan por debajo de 84.5, el limite inferior de este intervalo. Como existen 7 calificaciones en el intervalo y tiene 5 unidades de amplitud, hay ’/,calificaciones por cada unidad de la escala. Entre h una calificacién de 86 y 84.5, existen ("/,)(86~ 84.5) = 2.1 calificaciones adicionales. Por lo tanto, hay un total de 53 + 2.1 = 55.1 calificaciones que estén por debajo de 86. Como la distribucién tiene 70 calificaciones, el rango percentil de 86 es (°°"/,9) X 100 = 78.71 Resumimos estas operaciones en la siguiente ecuacisn: Ec f, acumulada + (f/i)(X - X,) ‘ecuacién para calcular Basal ial epee Spee SN tun rango percentil donde ‘f, acumulada = Frecuencia de datos que estin por debajo del Ii- mite real inferior del intervalo que contiene al dato X Dato cuyo rango percentil queremos determinar Valor de escala del limite real inferior del inter- valo que contiene al dato X 48, APLry, LO3 DISTRIMUCIONES DE FRECUENCIAS i= Amplitud del intervalo = Frecuencia del intervalo que contiene al dato x = Niimero total de datos en crudo Podemos utilizar esta ecuacién para determinar el rango percentil de 86, para. f,scumulada + F/X=X) ys o9 N ' Rango petcentil = 53 + (7/5)(86 -84.5) ei | SI ey Le TO " 0 Hhagamos otro problema de prictica, Determine el rango percentil de 59, jy calificacién se encuentra en el intervalo 55-59. Existen 3 calificaciones gy estan por debajo de 54.5 Como existen 4 calificaciones dentro del intervalo, hay (/,)(59 — 54.5) = 3.6 calificaciones dentro del intervalo pero que estén por dehy, jo de 59. En total, hay 3+ 3.6 = 6.6 calificaciones por debajo de 59. Asf, el rangy percentil de 59 es (8/9) X 100 = 9.43 SOLUCION La solucién aparece en forma de ecuacién en la tabla 3.9 Tania 3.9 Célculos del rango percentil para los datos de la tabla 3,1 Intervalo f % declase _f_acumulada_acumulada Caleulo del rango percenti, 95-99 4 70 100. Rango percent: LC 90-94 6 66 94.29 Ne y 85-89 a 60 85.71 80-84 10 53 75.71 75-19 16 43 61.43 Rango percent de 86 = 2 * /N86=845) 70-74 9 27 38.57 ae 65-69 ap 18 25.71 = 78.71 60-64 4 i 15.71 ri 55-59 4 7 10.00 Rango percenil de $9 = 2* CONS =545) 50-54 2 3 4.29 . Ep eT Oa 45-49 1 1 1.43 = 9.43 Ficura 3.3 Grifica de barras: niimero de estudiantes inscritos en varias licenciaturas, en un colegio de artes y ciencias Gratieacién de las distebuclones de frecuencias $1 ida 1a escala de la parte (a). Las impresiones ‘La parte (a) dala impresi6n correcta de ite (b) distorsiona en gran medida comienzaen cero y ampl plfa en gran med tla po Is dos grfens ‘son muy distintas. ina inscripeién muy estable, mientras que 1a Pa a 40s datos; esto hace parecer como si cxistieran ‘grandes fluctuaciones en Ia inscripcién Pot to general, In thterseccidn de los dos ees se encuentra en Ferm, ambas escalas, Siestono acurre hay que indiearlo al separa el cle correspondiente cer- ia figura 3.4 separamos el eje horizontal ©4 de Ia intersecci6n, Por ejemplo, en isla indicar que una parte de Tmescall se ha dejado de lado. 5; Cade debe tener una ctigueta y el titulo de In gréfica ha de serbreve y explicito, izan cuatro tipos principales de Al graficar las distibuci mare istribuciones de frecuencias, se util 1 ardficas la gen de bare el Nstograma, cl polis aesrecuenciasYiacuriade por. Centajes acumulados. La grdfica de barras Se acostumbra grafca as dstbuciones luna gréfica de baras, Este tipo de gréfiea apa fad categoria, donde la altura de Ia barra representa bros de esa categoria, Como no existe una relacién num latos nominales, podemos organizar los diversos BrUPOS: © lok en cualquier orden, En a figura 3 -estan ordenados de izquierd con la magnitud de la frecuencia de cada categoria, Observe de Is gorfa en este tipo de grifica no se tocan entre sf. Esto enfatiza atin m: Telacién cuantitativa entre las categorfas. fos datos nominales u ordinales mediante os en Ia figura 3.3. Se traza una barra para ia frecuencia o niimero de miem- ‘entre las categorfas de los fargo del eje horizontal, aa derecha de acuerdo i barras de cada cate- 14s la carencia de una 500 300 200 Niimero de estudiantes 100 Psicologia Comunicaciones Ciencias biolégicas Inglés Quimica Filosofia Licenciaturas NCIAS 52 CapiTuLo 3. DISTRIBUCIONES DE FRECUE i ma : de frecuencias perte EI histogra as disribuciones de ectene ss Fe eegg ‘ione 5 cxnsorama ls apostle eras por datos intervalares 0 de. pes eh er mere de fase; Lon neva 5 el histograma se raza una ra porodo gue Baa ade cia sm en ae . Jocalizan sobre el €j¢ horizont rear a Ta barra © oresponds 2 cme US tervalos son continuos, barre 4 ravestea lave pee epnacies stadfstica (tabla 3.4, page ) mevalo de pease clones del exams extadatcs (iyo medio de cada interVaT u conveniencia, aque se acostumbra local 7 arecen de nuevo em 12 08 sci Las calificaciones ag™upa* Histograma; las 18, sso naa) i : 15-19 16 ve es-09 7 pn loamee ee 5559.4 2g 8 50-54 2 Z oF sf 2} neal Calificacién en el examen de estadistica El poligono de frecuencias jencias también se utiliza para representar los datos de intervalos ode El polfgono de frecuc a r ° proporciones. Eleje horizontal es idéntico al del histograma. Sin embargo, para este tipo de srafica, en vez de utilizar barras, se marca un punto en la gréfica que correspondeal punto medio de cada intervalo, a una altura correspondiente a la frecuencia del intervalo Luego se unen los puntos localizados mediante Ifneas rectas. Por ultimo, la Ifnea que une Ios puntos se extiende para cortar el eje horizontal en el punto medio de los dos inter valos de clase contiguos al primer y tiltimo intervalos que contienen a los datos. Est: manera de cerrar la figura con el eje horizontal forma un poligono, del cual recibe | nombre esta gréfica. La figura 3.5 muestra las calificaciones de la tabla 3.4 como un poligono de frecuencias. La principal diferencia entre un histograma y un poligono ée frecuencias es la siguiente: el histograma exhibe las calificaciones como si estuviesea distribuidas de manera uniforme en el intervalo, mientras que el polfgono de frecuencias piauns 35 or, ts “jones itt de Graficacién de las distibuctones de frecuencias 53 Intervalo de clase 95-99 85-89 80-84 75-79 eyek Buea, 447 5257:«62:«67:«72~=«~T”:=«*RSCBTsS9D_— 97-102 Calificacién en el examen de estadistica icaciones como si estuviesen concentradas en el punto medio del inter estigadores prefieren el uso del polfgono de frecuencias cuando estén fe dos 0 més distribuciones. Los polfgonos de frecuencias también ‘en una distribucién continua, lo que muestra las califi valo. Algunos inv‘ comparando la forma d. 2 (onan el efecto de presentar los datos como si tuvies en muchos casos ocurte en realidad. La curva de porcentaje acumulado Las distribuciones de frecuencia acumulada y de porcentaje acumulado también se pue- den presentar en forma gréfica, Sélo iustraremos Ia segunda, pues las gréficas son esen- ae ente las mismas y as distribuciones de porcentajes acumulados aparecen con mayor aancia, Usted recordaré que el porcentaje acumulado para un intervalo de clase indi- TET poreentaje de datos que estén por debajo del Ifmite real superior del intervalo. Ast, Sn ele vertical para la curva de porcentajes acumulados se utilizan unidades de porcen- tgjes acumulados. En el eje horizontal, en vez de localizar los puntos medios de cada saervalo de clase, los localizamos en el limite real superior del intervalo. La figura 3.6 investta las calificaciones de la tabla,3.7 (pagina 42) desplegadas como una curva de porcentajes acumulados. Debe ser evidente que la curva de frecuencias acumuladas ten- ta la misma forma, donde la vinica diferencia seria que esta tiltima se grafica con unida- des de frecuencias acumuladas y no de porcentajes acumulados. Los percentiles y los. rangos percentiles se pueden leer directamente a partir de la curva de porcentajes acurnu- lados, Esta curva también se llama una ojiva, lo cual implica una forma de S. Forma de las curvas de frecuencia Las distribuciones de frecuencias pueden tener formas muy diversas. Algunas de las formas que aparecen con mas frecuencia estén en la figura 3.7. Las curvas se clasifican por lo general como simétricas 0 asimétricas. 54 Capiruco 3) Dis Ficura 3.6 Curva de porcentajes acumulados calificaciones del examen de estadistica de la tabla 37 Ficura 3.7 TRIBUCIONES DE FRE s Porcentaje acumulado 5238 Formas de las curvas de frecuent cUBNCIAS sentaje val suencia Poet ime ade cure 98-99 70 joo, 90-94 66 he 85-89 60 57 80-84 53 1 75-19 43 si 70-14 21 s6 65-09 18 257 60-64 ul 187 55-59 7 00 14 Calificaci6n 43% 62 67 cia 2 Calificacién en el examen d 82 je estadistica P59 = 71:00 8792 97 «(102 Con forma de campana Rectangular 0 uniforme ‘Con forma de U 3 3 4 2 2 i 5 3 3 £ £ Calificacién Calificacién if 161 ‘ai a eeu. Con forma de J ‘Asimétrica en forma positiva ‘Asimétrica en forma negativa : 4 5 4 i i Bs z E Calificacién Calificaci6n 2 10) ) Bag ee ee Derinicion Derinicion ae Una curva es simétrica si sus dos lados coinciden al do! itad. Si liaicinibennabieereitoncey creamer bree oe Las curvas que aparecen en la figura 3.7 (a), (b) y (c) son simétricas. Las cea gsm oe ern 37) (0 son ima Las ears tiva o negativa, * Cuando una curva es asimétrica en forma positiva, la mayor parte de los datos aparecen en los valores menores del eje horizontal y la curva se redu- ce hacia el extremo superior. Cuando una curva es asimétrica en forma negativa, gran parte de los datos aparecen en los valores mayores y la curva se reduce hacia el extremo inferior del eje horizontal. La curva (e) es asimétrica en forma positiva, mientras que la (f) es asimétrica en forma negativa Las curvas de frecuencias pueden clasificarse de acuerdo con su forma. Asi, las curvas de las partes (a), (b), (c) y (d) se conocen, respectivamente, como las curvas con forma de campana, rectangular 0 uniforme, con forma de U y con forma de J. ANALISIS EXPLORATORIO DE LOS DATOS El andlisis exploratorio de los datos es un procedimiento de desarrollo reciente. Utiliza {én que son bastante titiles para resumir y describir datos diagramas de facil construcci pertenecientes a una muestra, Uno de los més populares es el diagrama de tallo y hojas. Diagramas de tallo y hojas Los diagramas de tallo y hojas fueron desarrollados por primera vez en 1977 por John ‘Tukey, al trabajar en Princeton University. Son una alternativa sencilla para el histograma describir datos cuando éstos no rebasan los cien. Sin y son mds titiles para resumir y embargo, a diferencia de lo que ocurre con un histograma, un diagrama de tallo y hojas no pierde los datos originales. La figura 3.8 muestra un diagrama de tallo y hojas para las. calificaciones del examen de estadfstica de la tabla 3.1. ‘Al construir un diagrama de tallo y hojas, cada dato se representa mediante un rallo y una hoja. El tallo se coloca a la izquierda de la linea vertical y la hoja a la derecha. Por 10 datos originales son: ejemplo, los tallos y las hojas del primer y ui tallo hoja En un diagrama de tallo y hojas, los tallos se colocan en orden vertical en la pagina y las hojas se distribuyen en orden de izquierda a derecha de la pagina. La hoja de cada dato es, por lo general, el tiltimo digito y el tallo esta formado por los digitos restantes. En ciertas ocasiones, la hoja tiene los dos tiltimos digitos, segiin ei rango de los datos Observe que en los diagramas de tallo y hojas, los valores del tallo se pueden repetir, como en la figura 3.8, donde se repiten dos veces, Esto tiene el efecto de alargar el tallo, es decir, de crear més intervalos y desplegar los datos. A continuacién mostramos wn 1Cudl es Ia verdagy AL CAMBIAR LA ESCALA CAMBIA EL CUENTO , Dados los datos, al reducir esta prop parte de la escala, se da la falsa uesta en la tari impresion de que los costos ta ee atea eee hecho, crecido “poco a poco”. Al sivo” nto ci graficar etoatn ocratas aumento muy acclgno sme. Beno To hemos hecho aquf, dde manera clara eh os nala cho aqui, la crapaneTs clara el interés Westra mas y habra propues!o grifica muestra que las tarifas eoninar Noes evidente sf, a8) 984 para ratar de P ict aumentado poco apoco, _ostel perddiee one a a problema. El tema era Sino que se han acrecentado en cualquie i6dico la consiniye, que gran medida durante los ‘dluimos) 1 dela eee § afios (incluyendo el alza Meta Baficano sean valores ! s, Alza de tarifas en Puget Power 149 ‘a apareci6 en ee eyenda bale junto con 1a event et Power han Las tarifas de Puge tatentado poro 2 poco cuTaNe se ltimos 14.aos”.

También podría gustarte