Está en la página 1de 26
Razones, proporciones, porcentajes y tasas Las razones, las proporciones, los porcentajes y las tasas son medidas estadisticas sencillas que se utilizan para describir la distribucién de las per: sonas de un colectivo, en una o mds categorfas de una variable cualitativa © nominal, Tales medidas tienen especial uso en la comparacién de resulta- dos entre esas categorias, como también en la caracterizacién global de un colectivo, RAZONES Las razones son cocientes que resultan de comparar el nimero de perso nas que quedan ubicadas en una de las eategorias de una variable cualitativa digotdmica, con el niimero de personas que queda en la otra categoria de esa variable.(Si, por ejemplo, en una encuesta se encuentra que 120 personas es tin de acuerdo con La pregunta “Lista usted de acuerdo con el divorcio?", y 80 estan en desacuerdo, Ia razdn entre esos niimeros es 120/80 Bse valor se expresa diciendo que la razdn de las personas que estsin de acuer: do con el divorcio respecto de las que estan en desacuerdo es de 120 a 80, 0, simplifiernda, de 8 a 2, Al hacer la divisién, In razén seria igual a 1.5. Si la anterior relacién se hubiese calculado en sentido inverso, se habria obtenido una razdn de: 80/120, 0 sea, de 2 a 3 (= 0.67) 155 En casos como el anterior, si la divisién de los valores diera un resulta do menor que 1, conviene multiplicar el resultado por 100 (© por 1000, sein cl mimoro de docimales obtonidos), Conforme a esta convencidn, la razén entre las personas en desacuerda y de acuerdo, en el ejemplo dado anterior: mente, seria de 80:120 = 0.6666 X 100 66.7%, Cuando se utiliza eualguior potencia de 10 en los edleulos, eonviene sefialaria de manera explicita. Como decfamos, las razones tienen especial utilizacién al comparar la variable del caso entre dos o mas grupos. Si hubiese ocurrido que la encuesta citada hubiera sido aplicada en otro lugar ¥ respecto de la pregunta sobre el divorcio hubiese dado una razén de 1.2, diriamos que aqui hay menor diferen. cia entre los que estan de acuerdo con el divorcio y los que estan cn desacuer: do, ya que en el caso anterior la razén era de 1.5. Igual comparacién podria hacerse en un mismo lugar en momentos diferentes para mostrar si ha habide un cambio en la actitud frente al divarcio (0 en cualquier otra situacidn enfa. cada por una investigacidn). Conviene hacer notar que la razén no depende del niimera absoluto de porsonas consideradas en el edleulo, Asf, si los niimeros de las respectivas en: tegorfas de la variable cualitativa (actitud frente al divoreio) hubiesen sido 12 y 8 la razin habria sido la misma: 1.5. Bsto significa que las razones son medi- das relalivas que permiten hacer comparaciones similares con otros grupos, con independencia de sus tamatios. PROPORCIONES Las proporctones, de manera similar a las razones, son medidas que sin totizan la distribucidn de las personas en Jas eategorfas que pueda tener la variable cualitativa que sc considere en el andlisis. En este caso, el edlcule se realiza entre el ntimero de unidades o personas en la categoria p y el total de Jas personas del grupo Para utilizar el ejemplo dado al presentar las razones, si las personas que estiin de acuerde con el divorcia son 120 y el total del grupo es de 200 (12¢ + 80), entonces la proporcidn de personas que tienen esa actitud, en el nivel del grupo, es de: 120/200 = 016 (0 0.60, seguin quiera presentarse el resultado) La proporcidn de Jas personas en desacuerdo es: 80/200 = 0.4 (@ 0.40) 156 Parte ¥ Andlisis descriotive En general, si pes el mimero de personas de una dc las categorias de una variahle dicotémica, y q es el mimero de Personas de la otra categoria, entonces: ptg= En el ejemplo: 0.6 + 0.4 = 1. A partir del conocimienta del valor de una razén se puede calculara pro porcidn correspondiente. Si la rarén entre quienes estiin de acuerda con el divoreio fuera de 7H (siete de acuerdo y enatro en desactierda), la proporcign respectiva serfa 7/11, o sea, 0.63, Ciando Ta variable cualitativa tiene dos eategorias, es indiferente calcular ‘una run o tna proporeitn Sin embargo, cuando esa variable tiene mas de dos categorius, es conveniente utilizar proporciones, En la tabla que sigue se mues- tran las distribueiones de la variable “tipo de educacién’, completa e incompleta, de 845 personas de las localidades de Amira y de Belicia. La comparacidn de las cifras ubsolutas correspondientes a los tipos de educacidn en ambas localidados hace difill decir cul de las dos tiene una distribueién dela eduicacién mds equi, tativa o en cual de ellas existe un mayor nivel de educacién superior, pues las localidudes difieren bastante en el tamatio de la poblacidn que se compar Proporcién de personas de 30 afios y mis en tres tipos de educacién, en las localidades de Amira y Belicia, 1995 Tipo de educacion Amira P Belicia » Buisica 480 6, 284 0.54 Media 320 bas 190, 0.36 Superior 45 005 a1 10 Total 845 1.00 1.00 El céleulo de proporciones facilita mostrar la distribucidn entre las divor- sas catugorias de una variable dentro de un mismo grupo. Por ejemplo, en el caso de la lovalidad de Amira, se puede constatar la baja proporcién de per- sons con educacién superior (0,05). Con esta cifra, la proporcidn de personas con edueacidn superior en Belicia es el doble del subgrupo correspondiente on Ja localidad de Amira (0.10), PORCENTAJES Un poreentaje es una proporcién multiplicada por 100. Los porcentajes cumplen la misma funcién comparativa que esa medida, De acuerdo con lo expresado, el cundro anterior (utilizado para el calcula de proporciones) quedaria ast Cap. 12. Ravones. proporcones, porentajes'y tasas 157 Proporcién de personas de 30 afios y mas en tres tipos de educacién, en las localidades de Amira y Belicia, 1995 Amira Belicéa Tipo de educacién (8) (9) Basica 57.0 a0 Media 38.0 36.0 Superior 50 10.0 Total 100.0 100.0 (648) (525) Enel ejemplo, los porcentajes se han derivado directamente de los corres: pandientes edleulos de las proporciones, en los cuales se hizo una aproxima. cidn de los decimales para presentarlos eon dos digitos, Si el esleulo original se hubiese hecho eon tres dfgitos, entonees la proporcidn de personas eon edu cacién basica en Amira habria sido de 0.568, y el correspordiente porcentaje, de 56.8. Las necesidades de precisién debersin considerarse en cada caso. Cuando se caleulan poreentajes, es necesario tener en cuenta la recomen- dacién que nos dice que siempre debe indlicarse la base resgecto de la cual se hizo el ciloulo (en el ejemplo, 845 y 525). TASAS La tasa es un tipo especial de razén en la cual el numerador indica el nui- mero de un cierto suceso que ocurre durante un determiaado periodo, y el denominador es el niimero de sucesos con los cuales el primero est rela- cionado, Generalmente, el cociente obtenido se multiplica por 100 0 por 1000. ‘Veamos unos ejemplos de tasas 1, Tasa de atencién en salud en el municipio A: Total de horas de atencidn en salud Total de la poblacidn del municipio Las horas de atencién en salud pueden referirse a! total mensual de horas de prestacién por el médico 0 médicos de los servicios de salud del municipio, de Tas enfermeras, de los auxiliares de salud @ de otro personal de salud, de manera separada o por eategorfa profesional 2, Tusa de participacidn en la fuerza de trabajo: 158 Parte V Analisis des riptivo Naim, de personus que trabajan 4, Poblacién total 3, Tasa de retencidn escolar, Ls lu proporcidn @ poreentaje de alumnos que terminan un cierto ciclo escolar respecto del mimero de esa coharte al iniciar el ciclo. Asi, si en 1985, 200 alumnos comengaron sus estu- dios de un cielo que termtind en 1990 con 112 alumnos, la lasa de reten- cidn es de: 112/200 = 0.36 (0 46 %) Otra razén modificada es el Tlamado porcentaje de cambio, que expre sa la magnitud del cambio de una variable entre dos periodos. Por ejemplo, si en, digamos, 1990, el nimero de alumnos matriculados en In carrera de trabajo sacial era de 1250 (f,) y en 1999 ere de 2540 (/,), el porcentaje del cambio de la matricula en’esa carrera se calcula con Ja siguiente frmula: — fy 100 I Poreentaje de cambio: Introduciendo los datos del ejemplo: Porcentaje de cambio de la matefeula en la carrera 2540 — 1250 1250 x 100 = 493 Los edleulos muestran que Ia matrfcula experiments un aumento de 3 puntos porcentuales entre 1990 y 1999, Capa 12, Razones, proporciores. porcentales y tasas 159) Distribuciones de frecuencias A diferencia de las variables cualitativas que vimos en el capitulo ante- rior, en lus cuales las umidades de un colectivo se distribuyen en dos eategorias (en el caso de variables dicotsmicas) 0 en unas pocas eategorias {como sucede on las variables politomicas), esta situacién cambia cuando se trata de deseri- bir y analizar la distribucién de easos en los multiples valores que puede to- ‘mar una variable cuantitativa que, en el caso de una variable teérica, es un mimero infinito de valores. ara los abjetivos enuneindos de describir y analizar los datos recogidos para una investigacién, se utilizan tres tipos principales de su distribucién: distribucidn de frecuencias absolutas, distribucién de porcentajes y distribu- ciones acumuladas de frecuencias o de poreentajes DISTRIBUCIONES DE FRECUENCIAS ABSOLUTAS Las distribuciones de frecuencias muestran las frecuencias con las cuales se presentan los valores de una variable, ordenadas segtin el tamafio de esos valores, Cuando la variable es discreta (es decir, cuando entre éos valores de ella no hay otro valor intermedic), no hay mayor problema en ¢! ordenamien- to de sus valores; en tal caso, lo primero es elegir un nimero de intervalos, que no deberfa ser mayor que 8, con el fin de favorecer la comparacién entre los grupos, Por ejemplo, supongarnos que tenemos las escolaridades de 150 per- sonas con los siguientes mimeros de aiios de estudio: 12,14, 11, 18,8, 799 Para hacer la distribucidn de frecuencias, procedemos a elegir un mimero de intervalos, como dijimos. Si se eligen cinco intervalos (también denomina- 160 dos intervalos de clases), dividimos la diferencia entre los valores extremos (14 — 7 = 7) entre el ntimero de intervalos eleyido (7/5 = 1.4), Como el resul tado es inferior a 1.5 (cilra que permitiria elevar ese valor a 2), bajamos al mimero 1, Entonees los intervalos son: . 7-85 9-10; 11-12; 18-14 y 15-16 A continuacidn se procede a anotar el mémero de personas incluidas en cada intervalo, segtin su nivel educativo, Para simplificar la presentacidn, sit. pongamos que sc da la siguiente distribueidn de frecuencia: Niveles de escolaridad Frecuencéas (f) TR 7 90 45 1-22 19 13-14 9 15-16 0 Total 150 Ta distribucidn muestra que el mayor mimero de personas tiene escolaridades de siete y ocho aitos, seauido por las personas que tienen nuove y 10 afios. En el grupo de mayor escolaridad silo se tienen nueve personas. (En La tabla se eoloed el intervalo 15-16 que fue definido por los cinco intervalos elegidos al comienzo. En ¢se Intervalo no se tiene ninguna persona, Cuando sucede esto, no se coloca el intervalo, pero conviene decir la razdn por la cual no figura en a tabla) Cuando la variable es continua, es decir, variable en la cual entre dos mi- moros sucesivos de ella puede darse otro valor (por ejemplo, entre 4 y 5 puede darse el valor 4.86), la claboracién de la distribueién de frecuene'as es un poco mas complicada, como veremos a continuacidn. Supongamos que se tienen los valores que se indican ensoguida, corres: pondientes a tasas de desercidn de 33 escuelas de la localidad de Salvadores 14.2, 17.5, 21.9, 26.8, 22.8, 8.7, 12.4, 19.5, 27,8, 18.8, 164, 284, 25.8, 2 Pata organizar esos datos con propdsitos de ands las operaciones siguientes: es necesario realizar 1. Seleccionar el nutmero de categorias en las etsales se distribuirdn los datos, Un mimero entre 5 y 8 recordemos, se considera habitualmente como conve. niente. Sin embargo, ese mimero dependers del inter ‘s que tenga cl investigador en mostrar con mayores © menores detalles la distribucidn de los datos, Cap. 13, Disirbuciones de frecuescias — 164 2. Determinar el tamaiio del intervalo de clase, Si bien se hax propuesto formulas sencillas para determinar ese tamatno, como lo hieimos en el ejemplo ante. rior (diferencia entre el tamaiio del dato mayor y el tamaiho del dato menor, dividi da entre el miimero de intervalos que se desca tener), en general es preferible uti- liza tamafios pequefios, pues, si es conveniente para un andlisis posterior, podemos reagrupar los intervalos en otros de mayor amplitud (por ejemplo, reagrupar los datos en intervalos de 10 puntos, en lugar de intervalos de eineo puntos). 3. Kormar los éntervatos. Si, para los datos del ejemplo, elegimos un interval de 5, l limite inferior del primer intervalo podria ser 5.0 (que es inferior al enor de los datos: 6.9), y el limite superior, 99: el segundo quedaria entre 10.0 y 149, etvétera, La tabla quedarta como sigue Distribucién de las frecuencias de las tasas de desercién de 33 escuelas de 1a localidad de Salvadores Tntervalos Frecuencias 5.0-9.9 4 10.0014.9 5 : soo.a49 2 Total 33 Como se puede ver en la tabla, los limites de los intervalos se han elesido de modo que no se confundan con los que le siguen, Sin embargo, si se considera que en el caleulo de las tasas de desercidn (0 de los datos que estamos agrapando) se ha podido proceder a redondear ls cifras dcimales, entnnces queda Ta pregunta acerca dle qué steed con tasas crue, como ejemplos, tenian Ios valores 19.95 y 19.94, a respuesta general es que, en casos como ésos, si el valor del segundo decimal es igual 0 mayor «que 5, hace subir al primer decimal al digit inmediato superior, ysiel vor es menor que 5, el primer decimal no cambia el walor. Segiin esta convencién, la tasa de 19,95 queda en el intervalo de 20,0-24.9y la tasu de 19.94 queda en ol intervalode 15.0-19.9 os valores de 19.95 y 19.94 eonstituyen los limites reales de ls intervals de clase DISTRIBUCIONES DE PORCENTAJES Las distribuciones de porcentajes estin eonstituidas por los porcentajes de las frecuencias absolutas calculadas respecto del total de ellas. En general, los porcenta- jes permiten una mejor comparacién de Ja distribucién relativa de los easos en el colectivo, En el ejemplo anterior, la distribucisin de frecuencias tomarfa esta forma: 162 Parte ¥ Anilisis script in porcentual de 33 escuelas de la Localidad de Salvadores, segiin sus tasas de desercién Frecuencias Poreentajes Tasas 6 5.0.8.9 4 WI 10.0-14.9 8 152 15,0-19.9 7 212 20.0-24.9 10 30.3 5.0-29.9 5 132 30.0-34.9 a 60 88 100.0 (33) En la tabla de una distribueidn de porcentajes no es necesario colocar las columnas de frecuencias absolutas, poro sf debe indicarse la hase de su céleu- Jo. En el cjemplo, el mimero 33, que se coloca al pie de 100%, 1a ulilidad de las distribuciones de poreentajes para comparaeiones se puode vor en la tabla que sigue, tomada de una investigacién sobre el sroceso de “eliti- racién’ de las universidades chilenas durante el periodo 1976-1981 (publicada en Guillermo Briones, "La educacidn superior en el modelo de la economia nevli- oral’, en Las transformaciones educacionales bajo el régimen militar, vol. 2, PITE, Santiago, 1984, pp. 237-354). Composicién social de los estudiantes seleccionados para ingresar a las universidades chilenas, 1976 y 1981 Nivel educativo del padre ‘19781981 1976(%) 1981.04) Sin estudios 208 139 98) 0.5) Primaria incompleta 3,058 5.186 1LG/29.7% 12.6 726.1% Primaria completa 4.387 3.296 17.0) 1.0] Ensenasva media incompleta 5.652 MBL 21.9 17 Ensefianza media completa 6446 7.276 26.0 28.7 Universitaria incompleta 151147959 58 Egresado de universidad 516 586 21] 18.1% Universitaria completa 4201-4010 12.4f14.5% 15,8) 18-1% Estudios militares 739881 29, 35 Total 25.751 25.837 100.0 100.0 Nota neste yen fos euros que sguen no eeteran os alm aernados pa las eres ques india ‘senntmicn, por caecer de inforaacincoparahle en abuso por tee iol rnin de pee sao ‘merase Universidad Catia se Valparaiso PS, Plaga c.Artes Ptcas, Misn, Miomas, eatin Difeenda,Ingenena da Universidad Tien Pei Santa May Biogatiau a Universalis, Foreere: Comiskin Coorinadora del Pronesn de Admin de Alamuios « las Universidades Chilenas 163 DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS En algunos casos, los datos de una investigacidn se presentan de manera tal que se pueda mostrar el nimero de casos que son mayores 0 nenores que un cierto valor. La presentacidn se puede hacer a partir de distribuciones de frecuencias absolutas 0 de frecuencias porcentuales. como se ve ent la tabla siguiente: Distribuciones de frecuencias acumuladas de consultas mensuales de salud, de una muestra de 138 personas Niimero de Frecuencias Freeencias Poreentaje consultas (%) acumuladas acumulads: a @ @) @ @ ® @ 5 109 15138108 100.0 22 15.9 37 123 89.1 36 26.1 ms 101 Th 4 390018 471 1 109 Be 18.1 10 12 138 10 12 La columna 6 de la tabla presenta los porcentajes acumulados hacia abajo, y cada cifra indica el porcentaje de casos que queda dentro y por encima del intervalo de clase que le corresponde, Asi, la cilra 52.9 signilica que ese por: centaje de personas han golieitado atencién de salud entre wna y seis veces. En la columna 7, los poreentajes se han acumulado hacia arriba, v cada cifra indica el porcentaje de casos que quedan dentro y por dehajo del intervalo de clase correspondiente, Asi, la cifra 18.1 indica que ese poreentaje de personas han hecho entre mieve y 12 consultas CRUCE DE VARIABLES. REGLA DE ZEISEL En los ejemplos dados de distribuciones de frecuencias vimus edmo las personas se distribufan en las categorfas o intervalos de una so.a variable, ‘Una forma distinta de distribucién se da cuando se utilizan dos o tres varia. bles con dos o mas categorfas, cada una de ellas para comparar, precisamente, cémo se distribuyen en las subeategorfas que resultan por el eruce de ellas, Un evadro en el cual las dos variables ticnen el mismo nvimero de cetegorias se denomina cuadro de n % n (por ejemplo, de 3 X 3). Un cuadro en el cual se han eruzado dos variables con distinto ntimero de categorias se denomina de m Xn, La multiplicacidn da ol nuimoro de celdas del euadra. 164 pai eM Andlisis descriptive Lo que queremos decir hasta aguf se podrd apreciar divectamente en el siguiente ejemplo, Supongamos que hemos aplicado wna prueba de autoestima a una muestra de personas que Lienen distintos niveles de escolaridad, Su- pongamos, ademas, que cada una de esas variables ha sido eategorizada en tree niveles. Al cruzarlas y calcular los respectivos porcentajes, obtendyiamos un cuadyo de doble enteacla, como el siguiente: Escolaridad Ausoestima Alia Media Baja: (8) oo) (ay Alta 613 512 26.8 Media 27.2 29.3, 52.6 Baja M4 195 a4 Total 100.0 100.0 100.0 (44) en) (ay Las cifras del cuadro muestran que una mayor proporcidn de personas eon alta escolaridad tione mayores niveles de auitoestima (61.3%); siguen las per- sonas con escolaridad media (51.2 %), ¥ luego, las personas eon baja escolar dad (21.1%), Los cuadras de doble entrada tienen dos tipos de marginales o de totales: los que eorresponden a las filas ¥ los que eoxresponden a las colunnas. Por la mismo, en algunas ocasiones se produce una cierta confusién para determinar en qué sentido deben calculurse los porcentajes que se van a comparar. Las rospuestas a esta duda estdn dadas por la Hamada rela de Zeisel, que dice: Jos porcentajes deben ealcularse en la direceisn de la variable independiente, Bs decir, las bases de los porcentajes son los ntimeros correspondientes a cada una de Jas categorfas de esa variable, En el ejemplo dado, la variable indepen: diente es la escolaridad, ya que esta caractoristica podria producir vaviaciones en la autoestima. Las bases de eleulo son, por eonsecueneia, los mimeros 44, 81 y 114. (Bn el ejemplo no dimos las frecuencias absolutas correspondientes a cada una de las celdas del cuadro de poreentajes.) REPRESENTACIONES GRAFICAS las diversas téenicas que se utilizan en la presentacidn de datos permiten a muchas personas captar mejor los datos numéricos abtenidos en una investi- gacién, De esas téenicas, que toman numerosas formas, vamos a presentar silo las que expresan, por medio de gréficos, distribuciones de frecuencias y que seygin el caso, recihen los nombres de histograma, poligono le frecuencia ¥ ofv Cap 13, Distnbuciones de frecuencas — 165 HIsTOGRAMA EL histograma es la representacisn grifica de una distribucidn de frecuen- cias absolutas 0 de porcentajes, en la cul las freeuencias 0 los porcentajes correspondientes a cada categoria o intervalo de clase se representan mediante una barra o reetngulo, euya altura es proporcional al niimeru de casos (se indi- ca en el oje de las y) y su base tiene una longitud arbitraria (que se marea en el eje de las x) que es igual para todcs los intervalos si éstos tienen igual tama, Debe tenerse en cuenta que el eje de las y siempre comienza en el origen 0 en el punto cero, pero el eje de las x comienza, convencionalments, con el intervalo que tiene la menor frecuencia. En el caso de variables nominales, las barras que representan proporcionalmente las frecuencias suelen presentarse separadas para indicar que corresponden a eategorias diferentes (por ejemplo, si las freeuenciss del caso correspondieran a un cierto mimero de personas que respondieran “Si” y “No’ a una pregunta de un cuestionario), La represen- tacidn grafic se cmoce eomiinmente eon el nombre de diagrama de barras (véase fig. 13.1). Bn el caso de variables ordinales, cl procedimiento de repre- sontaciones es similar al que se realiza con una variable continua, Frecuencias absolutas Frecuendisiporneniimies 40 70 60 20 - 50 i 40 20 30 20 10 10 2 S45 6 F 8 F ? ¥ nudes Je POLIGONOS DE FRECUENCIAS Son figuras que resultan de unir los puntos medios de las bases superio- res de las barras o rectangulos del respectivo histograma, Los recténgulos no aparecen en el gréfico final Al unir Jos puntos mencionaidos, es necesario que el poligono inicie en el punto medio del primer rectsngulo y Hegne hasta cl punto medio del vtimo reetdngulo del histograma, La prolongacién errada hasta el punto cero de los 166 Parte v. Analisis cescripuve intervales del histograma implica una falsa representacidn de los datos que sirven de base a la representacién grafic. Cuando se comparan poligonos de dos 0 més grupos, es necesario conver- tir las frecuencins absolutas: de las correspondientes distribuciones en fre- cuencias relativas o porcentuales (véase fig. 15.2). Polgono de —=—~Porcentaje__—_—Poligono de F frecuendias absolutas “oe frecuencias porcentuales 70 60 30 50 o| 20 30 20 lo 10 ° ptt ol 745 8 7 BS 14 fe 7 © Edad Edad Fig. 13.2 Oya La ojita es la representacién grafic de las frecuencia absolutas acumu- adas ¢ de los respectivos porcentajes ucumulados. Fl procedimiento de cons truceidn es, en ambos casos, similar al que se utiliza en el histograma. Cualquiera de las dos ojvas permite apreciar en forma gréfica el nsimero de casos 0 de porsentajes que quedan por encima o por debajo de wn determi- nado valor de la variable (véase fig. 13.8). facumulada —Ojiva de (6) Acumulads potigono de frecuenciasabiolutas——yp_frecuenclas porcentuales 70) © 20} 50 40 20} 30 20) OTRAS FORMAS DE REPRESENTACION GRAFICA Existen, asimismo, muchas otras maneras de representar visualmente las fre. éeuencias que tienen los valores de las variables que in Evolucién del gasto socal y del stock de deuda como sorcentaje | del PB, 1990-2001 estigamos (véase fig. 18.4), Deuda pilblica (% del PIB) 990 1991 1992 £993 1994 1995 1996 1987 1998 1999 2300" 2001 * 7000) sox é z 2009) 2009 ‘coo (Gasta social (mil 0 Stock de cous pica eye Mt ee ee ee rogiara de Preverion Rebbacion “Drops y Convo de Nuciice Descends Ine Pic 19342001 "tres de 200) ca 8 2% 200 2x0 ‘eee te how ls 1984 1S m6 1997 1998 199 OD 2001 Fig. 13.4. Otros formas de repiesentocién otclico de Frecuencios, 168 SERIES DE TIEMPO ‘Una serie de tiempo es un conjunto de datos numéricos que se recoleetan en intervalus sucesivos de tiempo, Ein el anglisis de una serie de tiempo se con- sideran los siguientes cuatro componentes: * La tendencia (7), @ La fluctuacién efclica (C). @ La variacién estacional (E). ‘¢ Un movimiento irregular (1), De acuerdo con esta distincidn, se acepta que el valor de una serie tem- poral puede expresarse en funeisn de la tendencia que se dé en ella, de su flue tuacién ciclica, de su variacién estacional o de un movimiento irregular a tendencia se define como aquella parte de la serie de tiempo que mues- tra un movimiento suave 0 regular cn un periodo largo. La variacién esta- ional es la componente que muestra una forma o patzén regular de compor tamiento durante ciertos subperiodos del periodo total considerado, La tariacién ciclioa se muestra en los datos como movimientos alrededor de Ta tendencia y, finalmente, la componente irregular es la parte de Ta serie que se expliea por fendmenos poco frecuentes que la afectar, como podria ser una catdstrofe natural (terremoto, huelga, ete.) o también podria peesentarse por baja calidad de los datos. A continuacién veremos dos métodos qui de la tendencia y de una serie de tiempo. utilizan en la determinacion CALGULO DE LA TENDENCIA Los métodos més utilizados son: el método de los semipromedios y el mé- todo de los promedios moviles. Método de los setnipromedios Consiste en dividir la sorie temporal en dos partes, caleular Tuego la media aritmetica de cada parte, ubicar esos dos valores en la serie original y, final- mente, unir esos dos puntos mediante una recta. ‘Tal recta es la expresién gra- fica de la tendencia buscada, Veamos estos calculos con un ejemplo. Supon- gamos que tenemos la serie siguiente, que muestra las variaciones de In poblacidn en edad escolar que termina cliiltimo aio de la ensefianza bisica en cada uno de Jos afios que se indica. Cap. 13 Distribuciones de frecuencias 169 Poblacién de escolares que termina Ato x la educacién bésica (en mites): y 0 50.4 1 55.2 2 624 3 684 4 : a 92 x= 740 1998 Gemo dimes, en primer gar se calcula el promedio de los alumnos ogre. furdos en los aitos 1993, 1994 y 1995, correspondientec s primera mitad de Ia serie, quo es igual a 56.0; lego se procele con un etter similar en Ja seaunda mitad, eomrespondiente a los ais 1996, 1997 y 1998, Io que da una media avitmetica de 74.0, Enseguida so realiza “sno to he hecho antes— la poste auiciin gréfiea de la seria original, y on tal tepresenteetinen hace Pasar una linea entre log Puntos 56.0 y 74.0, ubicados en e] centro de los semi- pmvalos de tiempo (1984 y 1997) Tal linea se denomina Inne a los semi Premedios; su prolongacién hasta cortar el ef de los mimerns de egresados indice la tendencia de la serie, Esa tendencia muestra guy por ejemplo, en ol afo 2000, el numero de egresidos sora de unos 108 000 (ecb 133), 1993 1994 1995 1996 1997 1998 1999 2000 ne Cuando la serie temporal se compone de un nimero impar de periodos, se buede eliminar uno de ellos para obtener un ntimon par de valores, 170 Parte V. Analisis descriptive Método de los promedios méviles ste método permite eliminar en mayor magnitud las variaciones de una serie, debidus a componentes distintos de la tendencia, Por eso se le utiliza, en general, para suavizar los datos de una serie temporal, Comprende las si- guientes etafas 1. Se determinan en la série periodos de tres o cinco aii ya mejor a los datos de la serie total, 2, Se calculan los totales de la serie formada por los datos del primer periodo elegido (vamos a suponer periodas de tres ais). 3, El segundo periodo elegido comienza en el segundo dato del primer periodo. El tercero y siguientes se caleulan de la misma manera (esto fs, tomando siempre el segundo dato de la serie anterior como origen de la serie siguiente), 4, En cada uno de los periodos calculados segtin el procedimiento sefala- do anteriormente, se calculan los promedios dividiendo el total entre el nuimero de afios del periodo (en el ejemplo, 8). , segiin conven Veamos un ejemplo parcial de este procedimiento. Supongamos que tene- ‘mos la serie de la poblacidn femenina matriculada en la educacidn basica de una cierta regién. Allo Poblacidin femenina Serie 1998 13580 13580 + 14480 ~ 18260 = 47270 1994 15430 47270:8 = 15757 1895 18260 18260 + 21530 = 55220 1996 21580 1997 25720 etcétera 1998 29800 Como en el cago anterior, a unién de los puntos dados por los promedtios méviles da la recta que, al cortar el eje de la variable de la serie, indica su ten dencia, Sin embargo, este procedimiento tiene dos inconvenientes principales: 1. se pierden los arios del extremo inferior y del extremo superior de la serie y 2. no se puede caleular la forma matematica de la linea recta. Cap, 13. Distrisuciones de frecuencas, 171 Leon Medidas de tendencia™ *<. central, de dispersion y de concentracién = Las medidas de tendencia central son mimeros calculados con férmulas especiales que representan, en forma sumaria, ma serie de valores de una variable cuantitativa. Por su lado, las medidas de desviacidn expresan la he- terogeneidad u homogeneidad de esas valores, En esos casos, ambas medidas, como variables colectivas que son, caracterizan al coleetivo en el cual se dan Jos eorrespondientes valores individuales. Asf, por ejemplo, si ur. grupo tiene un promedio de edad de 15.5 aos y otro tiene un promadio de 18.6, el primero se caracteriza por su “menor” edad respecto del segundo, MODA La moda es cl valor de wna serie que se da con mayor frecuencia entre Tos miembros de un colectiva, Puede ser utilizado con variables nominales, ya que basta contar los ntimeros de sujetos que hay en cada cateyorfa de ma variable de este tipo (por ejemplo, el ntimero de hombres y el mimero de mujeres). Obviamente, es muy facil de determinar y por ello se le emplea como una pri- mera medida de tendencia central, En la serie siguiente se ve sin problemas que la moda es el nimero 20: 8,7, 6, 10, 15, 16, 20, 20, 20, 21, 23 Algunas weees hay mas de una moda: 6, 7, 8 9,9, 9, 10, 11, 12, 12, 12 En las cifras anteriores hay dos modas: los nvitneros 9 y 12. A una dis- tribucién como ésa se le denomina bimodal. 172 La facilidad de ealeulo de la moda se paga con algunas debilidades: a) La medida varia considerablemente de una muestra a otra tomada del mismo universo. 8) Puede no dg una buena representacién del coleetivo del cual pro- viene. Por ejemplo, las dos distribuciones siguientes, muy distintas entre si por sus valores componentes, tienen la misma moda (el iimero 5), con Io cual podria ereerse que las dos series de valores son semejantes, cuando, en realidad, hay bastantes diferencias entre ellas MEDIANA ‘La mediana (md) es el valor que ocupa cl lugar central de una distribu- idn ordonada de valores, habitualmente en orden ascendente. Si el ntémero de valores es impar, la medianu es cl valor central, Si ese ntimero es par, Ia mediana es la semisuma de los dos valores centrales, Rjemplos: © Niimero impar de valores, ya ordenados: 10, 12, 14, 16, 19; la mediana es 14. ¢ Niimero par de valores, ya ordenados: 12, 14, 15, 16, 18, 20, La mediana es la semisuma de los valores centrales, 15 y 16; es decir, 16. Cuando se agrupan los datos en intervalos de clase, se utiliza Ia formula correspondiente que aparece en cualquier texto de estadistica, Ta mediana es una medida de tendencia central que esta especialmente indicada para datos ordinales, como puntajes obtenidos en la medicién de acti tudes, ealificaciones, etc, A diferencia de la media aritmetica, que presentamos 4 continuacidn, no esta influida por valores extremos ~muy alios o muy bajos- que se pueden dar en una serie de valores, MEDIA ARITMETICA La media aritmética eg una de las medidas de tendencia central mis uti lizada para caracterizar a wn colectivo mediante un solo valor, Ese valor es la suma de los valores de na variable cuantitativa continua, de cardcter inte val o proporcional, dividida entre el mimero de valores sumados, Su férmula para datos no agrupados es la siguiente: Cap. 14, Mecidas de tendencia central 173 Por ejemplo, si las cifras siguientes indican el miimero de horas de cada uno de seis nitios que ven televisidn al dia -2.5, 3, 3, 35, 2, 1-, cl metodo arit mético de esa actividad es la suma de las horas dividida entre 6: ES+S+RS+I+1 : 6 En algunas oportunidades, de manera incorrecta, se utiliza la media arit. mética con datos ordinales (por ejemplo, con calificaciones dadas a los alumnos por el profesor). En tales casos, debe tenerse en cuenta que el valor obtenido es solo aproximado, por cuanto esos puntajes indican jerarquia entre ellos, y por tanto, los intervalos entre cualquier par de mimeros pueden ser desigual observacidn tiene especial importancia cuando se hacen comparaciones entre medias aritméticas, repetimos, de nivel ordinal, respecto de las cuales el investigador que analiza los datos debe tomar las precauciones del caso. Como dijimos antes, cuando en una serie de datos hay valores extremos que pueden distorsionar la representatividad de ella (como serfa el caso en la serie 3, 6, 8, 21), conviene utilizar la mediana, VARIANZA Y DESVIACION ESTANDAR Son mediclas de dispersisn 0 de variabilidad de los datos de una serie de valores. Indican, como se dijo en la introduccién de esta parte, la homogenei- dad o heterogencidad de cllos y, por tanto, la semejanza o diferencia que existe entre los individuos de un colectivo en relacién con una cierta variable cuan- titativa (la edad, los ingresos, etc.), Las principales de esas medidas son la va- rianza, la desviacién estdndar y el indice de dispersién. Las dos primeras deben utilizarse con variables intervales o proporeionales; el indice de disper- sidn se aplica variables ordinales y nominales. La varianza es el promedio de las desviaciones elevadas al cuadrado, de cada uno de los valores de una serie respecto de la media aritmtiea de ella, La desviacidn estdindar, a su ver, es la rairz cuadrada de la varianza, Las formulas de estas medidas son: © Varianza 174 © Desviacidn estindar: Analicemos uh ejemplo de caleulo, Se ha preguntado a scis niftos el nit mero de horas que dedican al estudio fuera de la escuela, Las respuestas son Jas que se indican a continuacidn, Calcular la varianza y la desviacidn estén. dar de esas horas. Nifio Horas de estuelio: x @- x 1 2 2 —0.75 0.56 2 3 3 0.25 0.06 3 25 25 - 2.75 = —0,26 0.06 4 a 3 0.25 0.06 5 2 2 -275=-0.75 0.56 6 4 4 27 1.25 1.56, 2.86 Para caleular la varianza y derivar de ella la desviacicn estandar, la primera tarca consiste en calcular la media aritmetica de los valores de las horas: 2484 B+B+2+4 6 2.75 Luogo se hacen las otras operaciones Varianza = 2.86: 6 = 0.48 Des. es! 0.48 = 0.69 Las desviaciones estdndar de dos distribuciones de frecuencie no se pues den comparar directamente, pues dependen del tamaio de la media aritméti- ca respectiva. Para hacerlo, hay que expresarlas come porcentajes ‘le esas me-| dias, las cuales reciben el nombre de eneficienées de variacién, Su férmula de | celeulo es la siguiente: v= x 100 z 175

También podría gustarte