Está en la página 1de 15
ariratoV Descripcion estadistica univariada Foie Very, Roberto Caceres En el capitulo anterior se analizaron conceptos bisicos, necesari mejor comprension is direntes herramientsextadietias que desartolarmos slo lag de ee ibes Enos ps lo analizaremos los mé:odos estadisticos que permiten realizar uri descripeién univariada de los datos manciados. Pata esto, en primera instancia veremos los diferentes grificos que permiten expresar la informacién en forma prictica y resumida, Posteriormente, y como un elemento com- plementario a los graficos, analizaremos las lamadas medidas descriptivas, las cuales permiten a través de nimeros, describit y resumir aun mis los datos estudiados, 5.1. REPRESENTACION GRAFICA DE DISTRIBUCIONES UNIVARIADAS Conjuntamente con las tablas, los grificos son un elemento fundamental en la presentacién de la informacién estadistica, lo que explica su uso ampliamente difundido. Debemos destacar que los {grificos no suplen a las tablas, sino que, por el contratio, ambos son elementos complementarios Jporlo tanto, todo grifico debe ir acompafiado de su correspondiente tabla de datos. Al igual que lo dicho para estas tltimas, los grificos deben set sencillos, ficilmente interpretables y deberin presentar claramente su titulo y leyendas, que en este caso se colocarin al pie del grifico. Un segundo objetivo de los grificos, ademis de la descripcidn y transmisién de la informacién, es l de darnos una idea de la estructura de los datos estudiados, es decir, de la distribucién de la variable. No todos los grificos se utilizan para las mismas variables, porlo que desctibiremos a cid uno de éstos de acuerdo al tipo de variable al cual se aplican. Graficos para variables cualitativas Pata tepresentar grificamente a este tipo de variable utlizaremos * Diagrama de barras. * Superficies representativas: grificos sectoriales y pictogramas Diagrama de barras de cjes de coordenadas: el ee jajes dome s Se ps my asia Pe ce A a ane abscisas corresponde a las serin absolutas 0 relatives. Indepen- frecnenit 06 hn eircom el cede as Jos siguientes griticos E>E-”_=~—_# a aa | estaciica machen LS ade ora, siendo la magnitd de g estar separada 00 se Cada unalie exnt bart OP isa cine dente, Ca reel ge coro stance de cat ras indiferent, sible? P ia este separacion sobre racin una de otTa -qanto 1 de sept debe tener el munmo anét 7 ia missna sepa aaah a ee aces forma wi estudio de pacientes Con Anemi ane ejemplos enact oo OE oir. 2, eespeetivamente. En a prime — conn even bs duce tePOPAdSN I st, anentens ue en 8 sexunds Figur, ee fepresentan Tos de la able 484 seen anteir). una gafice ttilizan frecuencias absolarg, Sere gece ic on o¢ wel RIES” oP Fas para ejerpiifias ambas formas de co Graficos | trucein Ee sis. sépida qo ies con anemia del ejemplo 4.8.1 ees la frecuer de fnguk como 10 ——— ees para z 2 30 indivi ant pape aren open incxconoree ols pases Sl PPTE 4.8.1 Tra v= 36 ® 2 if 30 indi “ i ® 0 a 6 ‘ 2 f bt sh i fererivo ‘Se0 Figura 5.1.2. Diegrama de! poco Sl ras en frecuencia relativa anemia ens ol emplo 4.8.1 ee eee re esas 0,10 0.00 qanto la descripcién realizada como las pric Brificas p diagsamas de bacras vesticales, sabien ee gue expresan la misma informac ndo que tambiéa exsepdiogrnas de bene herr re forma ls categories de la vataticne ages stplemente praada cl putes Wh de Jp hacen en el eje horizontal sican ea el eje vertical en Teele que las frecuencias Graficos sectoriales sed eluate de dco eer ropes de ings de sector le pertenece a cada catego apeando nas edo ce ee a spe, or toe como 100% los 360° de tin circulo. A mode de ¢jemplo podemos ues para i variable sexo de nuestro primer ejemplo en ee 50 individ W0S oe nnnnn 360" 17 mujeres. oem 360.x 17 = 204° 30 30 individuos.. 13hombres.... = 36x13 = 156° 30 De esta forma debemos asignar 204° de nuestro circulo al sector que representara a las imijeres y 156° al sector que lo hari para los hombres Si bien la construccién manual puede tesultar engorrosa, este tipo de grifico es de muy ficil construccibn pot medio de un programs informético, que ademis realiza por nosotros los cileulos recién planteados y nos devuelve uo grifco como cl que se observa en las figuras 5.1.3 y 5.1.4, donde se representa la mame infos Peden eT eee Figura 6.1.3, Graco secoil de la dstrbucin pot saxo d le pace con aneri BD Mescutno Bh Femenino 43% sT% SS jos cuantitativos = q ralatca médica | Linea de metas ai t 86 | Es n anemia segan clasificacion dexrbucin de ls pacientes cn a Figura 6.14, Grifca social para Ie aa perfotsgics een ain OO Microctica BD Normocitica I Macrociica 50% Ptogrames 2 Los pictogramas expresan la distribucin de la variable a través de dibujos. Existen dos modalids des de estos grificos: en la primera se realiza un solo dibujo por cada categoria de la variable siendo el drea de este dibujo la que representa la frecuencia para esta categoria. La desveatsja es que no siempre el area es exactamente proporcional a la frecuencia por la dificultad de calcul en forma precisa dicha area, pudiendo generar una imagen falsa de la informacién. Una form de contrarrestar esto es sefialar en cada dibujo los valores de frecuencia de la categoria graficaéa % Ta ath ali ese cad 9 ial eit Yo, doo cx conte ‘mismos y no su rea lo que representa al valor de la variable. ‘Sea cual fuere la modalidad utilizada los pictogramas son grificos de muy fécil 6 ae se quiere transmitic informacién estadictica a un pablico no eepeci Beso 4 mee oe ‘Gcantltathvas diseretas eslis cs chs Gao kc pak ° Dis f siguientes grifi * Grifico escalera, Diagrama de barras Lene elt Bagge “Acitca médica | Linen de métodos cuantitativo | 87 Grifico en escalera Hasta ahora hablamos del manejo de disti Maa ens penne Cas wap su din oe as oe fomo continuas, debemos considerar también las distribuciones de frecuencias acumuladas. Al ‘gu que para las disteibuciones de frecuencias simples, las acumuladas podtin ser distribuciones ahsolotas, relativas o rela:ivas porcentuales. Para una variable discreta la frecuencia absoluta acumulada hasta un determinado valor de la vatiable se define como ¢l niimero de observaciones que estan inciuidas en o por debajo de dicho valor, mientras que la frecuencia relativa acumulada corresponde a la fraccién de las observaciones {eae encuentran, includas o estin por debajo de este valor. Si maltiplicamos por 100 a exas Kis obtenemos la frecuencia relativa acumulada porcentual, En la tabla 5.12 se observa la forma de ealcular las frecuencias acurmuladas para la variable mimero de consultas previas en pacientes con anemi. sel ejemplo 4.8.1. iraodeFroampga Faomres Frecuencia absokia _—_‘Freovencarelava ® 8 oz 3 305027 q 10 038 B10 18 140=0.80 : 6 rr) 180624 2400=0380 a a a8 2a =2B 2480 =089 ‘ ~ a= er) 3080-100 Totales 90 100 fas acurnuladas para variables dscretas es €lpriico en escalera, Su construcei6n se saliza a part ee onal ‘ual representan, Al Gnalizar se obten- oe a acoso baa veer STORIE r oS ae eer gd acaba ene peticn Vee FEDS ‘Nomero de consutas Grificos para variables cuantitativas continuas Pars ene tipo de varables se presentan los siguientes priicos + Talley hojas +, Dispensograme. + Histograma, + Poligono de densitad. Of Grifico de tallo y hojas ‘Al enfrentarse a un conjunto de datos obtenidos en un proceso de medicién surge la necesidad, a primer instancia, de tenes una idea de la distibucién de la variable aleatonia, esto es, sabe qudles son los valores centrales, cuiles son los més extremos, cuales se repiten mas, etcétera. Para tote fin y cuando se maneja un nimero reducido de observaciones, resulta Gil el grifico de ule 1 hojs isetado por John W. Tuckey en 1977, Este grifico se construye » partir de datos orgs des, sin una agrupacién previa, por ejemplo, observando una base de datos. Este grifico consta de una columna que da origen a diferentes filas; columna y filas se ¢o- cuentan sepanidas por medio de una lines vertical. En la eolumna se disponen en forma verti yy la izquierda de la linea de separacién los niimeros que seran cada tallo de la grifica, mientras ee ee it i Semmens jirin las hojas. A modo de jemplo se realizaré el siguiente grifico de tallo y hoja para las edades i ea ine oa ee * de los pacientes con anemia aes roe peso dtc go times 10 vtlsain como ello cxos som, ea geen} maccesee ene ee OF hokey breteetepal ep ae allo seri el primer digito de éstas, por lo tanto los "ta. wnd Ty primer paso se observa en la figura 5.1.7a. Hecho esto ¢ a repcoducir log datos en el grifico de la siguiente ‘ ‘ad ‘egistro corresponde a 62 aiios, por lo nto en la fila ate manera: el primer dato 6 anotaremos una hoja que ae correspondiente al tallo determinado pot ¢! tallo 7 anotaremos una hoja con el eR eA A eo sete 0 5 nich 222 los 30 pacientes. Generalmente y en forma postetiot =i 9 5 delay WHEL peerect et | epee o gress ane Sonu oe8 Primer nto de cada ta 8 ; | ales 5 | e4902 $). x{s © | 25409163505 ’ * 7 | 9720418442 seek 8 | 4724 ee) © Cuando se maneja un nimero mayor de datos o n ue — en a ss coment euaniony a a entae Gemplo anterior, los tallos agrupan los datos por cada 10 aos en ls ne 8 s. En el Srpico de tallo y boja pars el mismo eho we mace en ene 'ro agrupados en tallos de a 5 afios seat nes inp deine cme keds roo got ns peue ma onanawe entib ins oon Somes canta tera cae Bio Temas ee dpoesia ie seamen erga, {ge hacen con 5,6,7,8 y 9: (8) registro del conjunto total de datos, (b). as sales s | 24 + | see re hago | 2419 ewlia gee sosaces + | ssseeso 7 | 24s442 7 | 122444 5798 # 5789 6 | 424 a | 244 bi Fi 7 Ld ) Cons poode opin; te gris: de to x hoje son de fel consists, Se Se produce todo el conjunto de datos obset lo ‘mantiene la individualidad de las observaciones, © oe ae are eS la determinacién de algunas medidas de resumen cuartiles (véase la siguiente seccion). Dispersograma et tn pi compan ns A ee ce et - ena: oa. cooper var representa grafic amen datos sn un procesamiento complejo Previo ¥ PEASE ee enccite: de las abscioas los Pasa coloca en el eje de las : nomen pcando us UR AeHHE? 4D naa wa construccion del graf dcterminade valor dentro del conjunto de 48109 M9 a. y cuintas crac pune bern qué valores roma ASH Oy 40 sipidamente la frecuencia absolut PAP acistica médica | tinea de metodos 90 | Est _— eS : 1.9. Dit rcaeraparn edad de paceios con ane del ero oo = SE CIC ane 1 de este grifico podemos observar répidamente lay f sefialar que la edad que se repite jente de mayor edad tiene 87 aos, Gomno se indicé antesiormente, @ parti Festa del comportamiento de la variable, snds 68 aos y 74 afias, con tres pacientes cada una, si como que el de menor edad tiene 52 afios, etcetera. ‘A modo de resumen podemos decie tanto pars el dispers0@! schojas que i bien ambos gréficos permiten presentar la inforny Jie waded para realizar un manejo preliminat de los datos originales, ‘eeabucion de la variable ysirviendo como paso previo a la conseruccion ‘para variables cuantitavas contimas, caractet por ejemplo, que el pack rama como para el grafico de tallo facién recabada, resultan también aportando una idea de la de intervalos y tabulacién Histograma Como ya se planted anteriormente es importante conocer Ja distribucién de nuestros datos, e+ een estas ena qu se comport a variable aleatoria extudinds, Si bien el depersograms ye irifico de tallo y hoja cumplen con esta funcién, lo hacen con a salvedad de ser titiles cuando se maneja un mimero reducido de ‘observaciones. Por lo tanto, al trabajar con un mimero elevado de Gstas 0 abarcando las mismas un amplio rango de valores, es necesario aplicar otras técnicas que permitan trabajar con mayor practicidad. Una de estas técnicas es el histograma, El histograma es un diagrama de barras vertical donde el érea de cada barra es proporcional a ta cantidad de observaciones (frecuencia), a diferencia de los diagramas cle barras vistas pars as ‘variables eualitatvas y las cunntitativas discretas en donde es simplemente la altura de la barra lo Gur representa la frecuencia de las observaciones. Otra diferencia a destacar es que las bartas en cre cano estin juntas y'no separadas, precisamente por tratarse de un geifico para variables que toman valores continuos. En este grifico los valores: de la variable se disponen en el eje de las abscisas mientras que lee ‘de hx ordenadas coreesponde a la frecuencia absoluta, relativa 0 a la densidad de frecuencias (véase ins adelante). Para poder realizar este grifico es necesario agrupar a los datos en intervalos de ¢! doble de tamatio en comparacién con la del iltimo intervalo (12.0 < x < 13.0), cuando ef realidad ambos contienen la misma cantidad de observaciones, por lo el hit cil nla por lo tanto el histograma truido de esta forma esti brindando una imagen de la informacién que no es la correcta. Esto sucede por el hecho de que no todos los intervalos tienen la misma longitud; en este caso Primer imervalo tiene una amplitud que es el doble a las demés, por lo tanto la base de la bart que lo representa también es del doble de tamaio (2.0 gr/dl}, al levantar esta barra hasta ls frecuencia relativa correspondiente se obtiene como resultado final una barra del doble de ite ‘en comparacion con otra que tiene la misma frecuencia pero la mitad de longitud de intervalo (1.0 g/d), que es, en definitive lo que sucede en este ejemplo ms Podemos entender de esta forma por qué se deben realizar los histogramas utilizando la Y, * ‘gp¢ en casos como el anterior, en donde los interyalos son de diferente tamaiio, l grifico realizado Weodos cusntativos | 93 ias no describitia correctamen ee para cada intervalo, En re aii D de los d td rool .12 seven en ttle 3 nb : amie, 7 20 0.10/20" 0.05 7 . 0.23.08 0.25 = 10 ean onaz7 ac ain Obsérvese como la Y del primer intervalo es la mitad de la del lkimo, y, por lo tanto, a alsa el bistograma en Y las areas de estos dos inte t tvalos resultan iguales, representando que ste itermaloe continen 1c misma cantidad de observaciones, hecho que traduce la realidad de los datos manejados. Figura1.12.Histograma en densidad de frecuencias 0,35 0,30 2 R ° 3 Densidad de frecuencias (Y) 8 0,05. 0,00 40.0 11.0 12.0 13.0 70 ad Hemaglobinemia en o/c i | estate mecten y ore en a Poligono de densidad stograma de densidad, al igual que it de un his Fs un gréfico de lineas que se construye & parts permite representa gréficamente la distibucion de frecuencias de la variable estudiada, Ti, emo ventaja con respecto al histograms, ser und ‘eficaz hertamienta para comparar dos o r, e rr aismo par de es se puede graficar més de un poligg _ distribuciones de frecuencias ya que eo ala vez ‘Su construccién se realiza sobre un histograma de densidad de la siguiente manera: dr bn A Ripa mado te cod iervslo' de cape sobre Is bets SOpeSoT de la batra que representa. 2. ‘Se unen entre si estos puntos por inter 3, Por timo se debe cerrar el poligono. Para es contiguos al primero yal imo intervalo del histograma. Estos intervalos te6ricos tendrin, densidad de frecuencia igual a 0 yuna longitud de intervalo igual al intervalo contiguo (€s de Glintervalo contiguo al primero tendi una longitud igual a éste, mientras que el intervalo om co contiguo al imo tendré una longitud igual a este timo). Hecho esto se marca sobre op de ls abscisas los puntos medios de estos intervalos y se cierra el poligono. - En la figura 5.1.13 se construyé un histograma de densidad a partir de los datos de I Baa heen es igual a la frecuencia relativa por el hecho de que la seater intervalos es igual a 1.0. Sobre este histograms se ha teazad : om igus sb histog: hi jo el poligono de densidad correspon. _ tease dl = de que el érea contenida debajo del poligono es idéntica al area total de : ee s woe ete quedan por fuera de la linea poligonal son -ompent otros igual tamafio que quedan por debajo cle la misma y que orig medio de lineas rectas. <0 se tienen en cuenta dos intervalos tes eco Figura 6.1.13, Poligono de densidad df 035 79 80 90 109 110 120 130 Hemoglobinemia en grs/dl 0 & @ a Ww seone v0 foxtabat paste dl his Le nes on vue para las variables dis 1 que P* iscretas, tami Ag a informacion de acuerdo a lade Mencas acumuladas s© definen como el nimsero ac eeu wbsolutas © relatvas acumuladas, Breaminado intervalo de la variable. Conce ide longitud crecientes, es decie, en fuego la frecuencia de observacio an en © por debajo iderar la frecuencia para siderar la frecuencia del pamer prualmente, Primera instancia co ae iptervalos ’ nes para el ‘mente para el primero, segundo y tere pesnere Y ¢l segundc 2 ac pan Y creer ya nt 9 segundo iataosjntos, ; ogre : eeu neal gan cuesaente hast conde todos os ‘Dado que los intervalos de clase tienen com d Set ca Ser eed Jopentes, las frecwencias acumladas para cada uno ce swumac las diferentes pecuentias se Ser ‘uno i a ro la fecoencia absolutaacumulada para el intervalo i. ie Moe pment 00s, 8 decir, el que resulta de la unién de todos los fees oa re ‘ Sones wreraciones, 0 seri 1 0 100% si cl anilisis fue realindo See aan. ee demand, sempectivuncrd Bar sth SUE w chicas cence oasoioeen tenable hemoglobinemia dl ejemplo 48.1 oe a Propicdades ser maramente ‘foie: Distrbucion de frecuencias acumuladas por hemegibinemia eng Garabededese Frecvenda __Frecuenca__Frecoenca a (ooo cade 105x680 1 oe ios00 2 ae iasre100 7 a iasre110 8 om 10sxe 12.0 8 = 120 ses 13.0 3 = Totales 30 ables con- - rc a acumuladas de varia ‘tous se utiliza un grifico lineal donde gat on ne ‘u construccién se utiliza un par de eje sone ‘ema ca Ponde s los intervalos de la variable y el eje de las gece como sua 44. Ea ellimte superior de cada intervalo ae grates 9 POND ST ane at po i teva acurnulada hasta ese intervalo. Postesiormesss 7 ene ‘dio de lineas rectas, Para termioar el grifico se UAT A eon ‘ite superior del primer intervaio con 8 PEE oi a lo sobre el je de las abecsas. En Bsn 5 es ios propésito® tipo de grificos resulta stil part “ANE Te ae densidad, se is pa al en Prede es diferencia para coniunte de dato Fenn tri mis de una ov, Jocalizacion de 18 ee ‘eves Ora Finalidad es lade permit 2197 wiable homogiobinemia 109 5 19 29 28 a0 Hamegiemia on ptt 52. DESCRIPCION NUMERICA nba secciones previas se mostx6 cémo mediante métodos grificos se puede representa Ia infos- ve cia contenida en los datos en una forma visualmente mis accesible, que permite la exploracion “tiativa de los patrones dela distribucin de frecuencias de una variable aleatora Sin embargo, rresones tales métodos dan una representacion casi tan compleja como los datos originales 2 tebe dep dc todas las obsérvaciones: as medidas qu nen ents propiedad as 9% ‘inamos medidas suficien er, $i una medida numérica 00 se basa en tas as obserwacionst igpor parte de la informacién contenida en los datos. » ie eran igiendo oer ere ‘una medida debe ser simple ¢ inme- : uit desnitig de etc «arene oneal alt gore wea ncn 7 (Die sensibles a-valores extremos: medida descrptva no se debe afectas por} eae : "muy pequetos obtenidos, Berita Lawyer or OTE, nf ce Pi mplo eon eid de igen ese en de mito cna 96 | esenancaradic | unen 8° TES — te 10 0 90 100 10 120 130 3 Hemogiobinemia en grsic también hallar medidas de posicién de la distsibuciSn, como los percentiles, deciles y cuartes (véase la siguiente seccién). : “Ademis es posible, a partic de la ofa, obtener valiosa informacién de los datos analizaéo: Simplemente con visualizar con atencién el grifico de la figura 5.1.14 se puede determina, po «ejemplo, que la proporcién de individuos que tienen un valor de hemoglobinemia x<10,0 gr/dles de 0.33 0 lo que es igual 2 33%, y, por lo tanto, afirmar que la proporcién de individuos que tienen ua valor de hemoglobinemia x 2 10,0 gr/dl es de 0.67 0 67%. De igual forma, lx ién de individuos que tienen un valor de hemoglobinemia comprendido entre 9.0 $< 11,0 gx/al es 0.53 (resultado de restarle ala frecuencia acumulada hasta 11.0 gr/dl la acumulads ‘hasta 9.0 gr/dl, es decir 0.63 - 0.10 = 0.53). Los ejemplos anteriores involucraron valores de ‘variable que son exactamente limites de intervalos y si bien las proporciones fueron obteniés! sonizaado le opr, también hubeet sido posible Ueyar a los mismos resultados directament + partir de la table 5.1.6. El gran mérito de la ojiva es poder contestar este tipo de interrogante’ aes cualier voc de a vatableincuio ene gufico y no solamente pura squcllos vate cao limites de intervalos, Por ejemplo, si se desea saber qué proporcién de individuos tiene ust ‘hemoglobinemia tal que X< 10,5 gr/dl, la ojiva brinds répidamente la respuesta. Para esto valor de frecuencia relativa acumulada individuos que cumple con la resultante de la mente 0.48 (véate Biguen 5.1.15), plicando el mismo procedimiento A eb hemoglobin /Péto en sentido inver: r eran on respecto al cual el 95% de los i se puede determinar, por cjempl® i , ¢s decir, el valor de 8 individuos tiene una hemoglobines se ‘ = individuos, en nuestro ejemplo este valor conresponde vats 95% de \a\ ee nn

También podría gustarte