Está en la página 1de 8
Pee a pices es representar gréficamente los preety reese paren ey Ceres. eer hacer tales pee ocaes por Albert Einsteia y cexperimento Aqui fo wiizames Mirando los datos Un primer vistazo a los graficos de datos 2POR QUE RESULTA MOLESTO MIRAR Los DATOS? ‘Ahora que has soportado todas estas péginas de jerga ‘vamnos a hacer algo realmente iti aprender a mirat los datos, Con los ordenadores a punto sobre la mess, la tentacién de ponents a teclear y comenzar a analizar 1 barullo que supone cualquier conjunto de datos es realmente grande. Finalmente, bicimos el estudio; en primer lugar, para obtenee algunos resultados que po: ‘driamos publica y, ademas, demostrar al decano que no estamos perdiendo el tiempo. Sin embargo, como en la mayoria de los dmbitos en los que nos movernos (especialmente, los que nos resultan mas agradables), debemos aprender a controlar nuestros impulsos para egar a ser unas personas como es dcbido, Resulta dificil poner todo el énfasis que merece en. lo importante y dil que es Megara conseguie un «amor {los datos» antes de comenzar a jugar con ellos. Sino texiste tna ley de Muephy que diga: #Seguro que hay etrores en tus datoss, deberiainventarse. No debes mi- rar los datos exclusivamente por si hay errores; est ahi, y tu trabajo consiste en encontrar todos los que Duedas. A veees, el problema no es un error propia: mente dicho; muy a menudo, un investigadar puede ‘usar tn eéligo numérico tal como 99 0 999 para ind car un valor inexistente de alguna variable y olvidarse de dar este pequetio detalle al pedirte que analices sus datos. El resultado es que puedes encontrarte con que algunos individuos del estudio en cuesti6n pueden te her algunos afios mis que el propio Matusalén. Repre septar los datos antes de manipularlos te puede abo: rar muchas siuaclones embarazosas. Una segunda cuesti6m a tener en cuenta al mirar los datos es ver si se pueden analizar mediante los tests estadisticos que habia planeado aplicar. Por ejemplo, algunos tests requieren que los datos deben configurar tuna forma determinada, o que una figura de dos varia Des siga una linea recta. Aunque haya tests especiicos para estas hiptesis, no debe desdeibarse el atest del ojo clinica». En muchos casos, uta mirada tépica nos oftece 6 uuna mejor visiém de los datos que cualquier amasijo de HISTOGRAMAS, DIAGRAMAS DE BARRAS. Y VARIACIONES SOBRE EL MISMO TEMA El tema principal: el diagrama de barras, Seguramente, el tipo de grficos mas familiares son los diagramas de barras y los histogramas (ya te exp ‘aremos que la diferencia entre ellos es minima). En ‘seca, consisten en una barra cuya longitud es pro porcional al miimero de casos. Para lustrar esto, vea jgedanken experiment». Imaginemos que hacemos un estudio en e que encuestamos a 100 est iantes y les preguntamas cudl es la asignatura que ‘menos les gusta. Podetnos tabular los datos tal como se nuestra et la tabla 2-1 I primer paso es clegir una longltud adecuada para lee ¥, en el que sefialaremos, al menos de momento, fel mimero de individuos que eligen cada alternativa. EI ‘mayor de ellos es 42, por lo que elegiremos un ntimero algo mayor que éste para sitarlo en la parte més alta de! ee, Gomo vamos a tomar intervals de 10 unidades, 50 podria ser una bucna cleccién. $i hubiéramos usado el ndimeto 42, hubiéramos tenido que tomar divisiones correspondientes a 7 unidades (que dan lugar a nme ‘Nimerode as Curso estudiantes Respuesta de - roo estedianies Scientia s als preguma noma Historia = ocCustes clearso Pricologa B Imroductoro Célewlo 2 que has encontrado ms aburrido? - FURA2-1 oe Diagrama de barras ° de los cinco cursos 8 40}- menos populares 3 00+ 3 2 20 é 2 ol Sociolonla Economia Historia Priclogla Caleue Curso | TT TT 1 Kise oft -oped oo mataoleet a Numero de estudiantes 19s algo més 1ar0s},* 0 todos los nfimeros pares, lo que daria al ee una apariencia de estar demasiado atestado. Asi nuestro grafico seria como el de la figura 2-1 ‘A primera vista, sho queda mall No obstante, lo po: demos mejorar. Es evidente que los datos son nomina les; el orden es arbitrario, por lo que podemos cambiar <1 onden dels stints categorias sin que se pietda nada, De hecho, ganamos algo si colocamos las asignaturas cde manera que la que ha sido clegida un mayor mime rode cees est en primer lugar, inientras que la mas baja aparece en sivima posicién. Ahora, la posicién te lativa de las asignaturas hace que veamos las cosas con Inds faclidad, (Aunque sea una cuestién menor, esul- ta mis eficaz colocar los puntos de separacién de uni dades det eje hacia la parte exterior que hacia dentro. Silos datos estén cerca del eje ¥, sina marca hacia den: two puede oscurecer el grélico © viceversa.) Estos dos cambios dan lugar a la figura 2-2, ffsta es la manera en que se representaban, general- ‘mente, los datos nominales mediante diagramas de ba sorisogia fee 50 & 8 20- Numero de estudiantes 3S li. Eeonemia Scoalogie Pecoigia Calewo Curso Historia cacuo [s+ + +@ Heora |e @ oe 0 10 2 30 40 50 Numero de estudiantes ‘ras hasta fecha reciente. En Jos iltimos afios, sin em- bargo, las cosas fan cambiada sensiblemente. SI los nombres de las categorias son largos, pueden quedar uunos encima de otros en la parte inferior del grifico. Asimismo, alguna investigacién (Cleveland, 1984) hha demostrado que la gente alcanza un grado de com prensién mayor de los tamatios relativos de las barras si éstas se colocan en posicién horizontal. Si ailamos, los ejes (juego de palabras buscado), legamos a laf ura 2-3, Variacién 1: diagrama de puntos Ora variance del diagrama de barras, particularmente ‘itil cuando hay un gran nvimero de categorias, es el dlagrama de puntos, como podemos ver en la figura 2 4, Bn gar dena barra se coloca un punto grueso exae lamente en el lugar en que terminaria aguélla. Cuando, hay muichos niveles, una linea de pequeios puntos des de el eje hasta el punto Final hacen que el diagrama se pueda interpretar con mayor facilidad. FIGURA 2-2 Ta figura 2-1 representada de rnuevo de modo que las categorias estén. s por orden. erendia, y ls divisiones del eje vertical estén en la parte exterior. FIGURA2-4 La figura 2-3 dibujada de nuevo como diagrama de puntos Rapido! Cuenta ‘de 7 om 7, comerrzarde por 1 y terminande on 64. Ves lo que ‘ueremes deci? 8 Observa que esta caftemacin etd basada cen fa ested, noo la estadisica a LANATURALEZA DE LOS DATOS YLA ESTADISTICA, Representacién grafica de datos ordinales Bl uso de los histogramas no estérestringldo de manera exclusiva a datos nominales: se pueden utilizar para ‘cualquiera de los cuatro tipos existentes. Sin embargo, hay que tener en cuenta algunas consideraciones si se tusan para datos ordinales, imtervilicos proporciona les, La primera, que parece obvia, es que, como los va~ lores estén orenados, no pademos intercambiar ale- ‘aremente las posiciones relativas de las diferentes calegorias con el fin de hacer el grlico mas agradable. Si representaras grifleamente el miimero de estudian- tes que han obtenide la calificacién de: Sobresaliente! Notable! Aprobado/ Suspenso, confundira més que otra ‘asa colocar estos valores en el oxden: Aprobado! Sus ‘penso/ Sobresaliente/ Notable, simplemente porque la primera clase es la que tiene un mayor ntimero de es- tudiantes. Representacién grifica de datos intervélicos y proporcionales En la representacisn gréfica de variables intervlicas y proporcionales hay que tener en cuenta algunos facto- res mis, Supongamos que tenemos algunos datos del rimero de paiiuelos dispensados todos os dias por un igrupo de 75 asistentes sociales: miramos nuestros datos yy observamos que el nfimero menor es 10, yel mayor, 117: la diferencia entre ellos es 107, (Bsta diferencia re ibe el noibre de recorride 0 rango. Lo definiremos de una manera algo més formal en el capitulo siguien- te). Si tenemos una barra para cada valor nos vamos a ‘encontrar con algunos problemas. En primer lugar, te= rnemios mas valores posibles que datos, por lo que algu> nas borras tendrn waltura» cero y muchas otras ten ddrin solamente una altura de una 0 dos unidades. Esto leva al segundo problema, por lo que sexs lfc en- contrar algiin disefio que permita visualizar los datos, Estudiante Namero de ‘cuss vaciadas por 100 estudiantes Gel ditimo curso de entermeria surame et slimo mes me oe o10 at o28 LT eis ia 20 9 to 1620 3124286 2125353818 2-306 27 4 32 42 46k s7 16 OD 32306 2S sie oce Oma 7a 3217 E226 fae 2s 06 T 5228 1S 3849 Pie ee Goat 7iee 35 B70 aka ee moe sais) ee ee 2 24 33833 3412525 26 17 7 58 En tercer lugar, el eje quedara terniblemente contuso, Por estas azones, vamos a intentar resolver la cuestion, con una cantidad de entee 10 y 20 barras en el eje.? Para ello, hacemos que cada barra represente cierto intervalo entre mtimeros, al que llamaremos amplitud del intervalo. sies posible, usaremos wna amplitud tal {que la mayoria de los intervalos abarquen wna cantidad ‘adecuada de individuos: 2, 5, 10-0 20, Incluso, si uma amplitud de 6 07 pudiera dar un grafico de una esttiea agradable, estos nimeros no dan lugar a miitiplos 16 tdlmente comprensibles. Veamos un ejemplo. Si tomomos 100 estudiantes de enfermeria del it mo curso y les preguntamos cuintos orinales de culta hhan vaciado durante el ihimo mes, obtendriamos 100 resputstas, como en la tabla 2-2. Lo msimportante que nos dice una tabla como esta es gue es imposible darle sentido alguna, Estamos desbordados por la ingente masa de nimeros y no hay manera de que surjaalgiin dliseno adecuado a ellos. De hecho, ni siquiera es fécil saber eudles son Ios niimeros mayor y menor que apa- recen, quién ha estado trabajando como wn troyano y uién ha estado haeiéndose el tonto. Para hacer nues- tra vida (y todo lo que sigue) mas agradable, Io primero ‘que deberfamos hacer es colocar los datos en orden de ‘menor a mayor. Dos cuestiones a tener en cuenta: pr mero, puedes ordenar los datos de mayor a menor silo deseas, pues no representa ningiin inconveniente, ¥ segundo, la mayoria de los ordenadores tienen una sencilla rutina, habitualmente llamada SORT, para ha= cer el trabajo por ti, Una vez hecho esto, tendremos la tabla 2-3, Con esta tabla poxlemos ver inmediatamente tos va~ lores exiremos y tener al menos una ligera idea de como estan distribuidas los niimeros; no hay demasiados en- tte Ly 10 0 entre 60 y 70, y muchos en las decenas de Jos 20 y los 30. Vemnos también que el rango es (66-1) 665, excesivo para asignar una barra a cada niimero. Una amplitud de 2 daria lugar a 33 divisiones (que siguen siendo demasiadas). Una amplitud de intervalo de 5 pro- duce 14 divisiones (que es lo correcto). Para ayudarnos 2 dibuijar ef grafico deberiamos hacer un euadro resu- ‘men, com el de la tabla 2-4, que da los intervalos y el ‘nimero de individuas de cada uno de ellos. ‘Observemos dicha tabla. En primer lugar, hay dos columnas adicionales, una con la denominacién punto ‘medio y la otra, que Tamamos frecuencia acuutada 0 to- tal acumulado. La primera, como su mismo nombre in- dlica, el punto medio del intervalo. Como el primero de ellos esta formada por los niimeros 0,1,2,3 y 4, et punto medio es 2. Si hubiera un ntimero par de nme. ros, come por ejemplo, 0,1,2 y3, el punto medio estaria ‘de nuevo en el contro, En este cas0, no obsiante, que- daria a mitad de camino entre el I y el 2, y seria por tanto 1,5, La otra colummna adicional, la frecuencia acu ‘mulada, es simplemente una suma sucesiva del nsimero {de casos: el primer intervala tiene 1 caso, yel segundo, 4, por lo que la frecuencia acumulada en el segundo intervalo ex (144)=5. Los 9 easos del tercer intervalo producen un total acumulado de (5+9}=14, Esto es muy Drictco, porque sino terminamos en 100 sabremos qu nos hemos equivacado en alga lugar de la column. {Laura cuestion es que hay que observar los intervalos.

También podría gustarte