Está en la página 1de 18
rganizacion y representaci6n 2 de datos 2.1. Introduccion. 2.2. Distribucién de frecuencias. 2.2.1. Supuestos de distribuci6n in- traintervalo, 2.3. Representaciones gréficas. 2.3.1. Representaciones gréficas de so frecuente. 2.3.2. Convenciones sobre las repre- sentaciones graficas. 2.3.3. Tendenciosidad en las repre- sentaciones graficas. 2.3.4, Propiedades de las distribu- ciones de frecuencias. 2.4. Diagrama de tallo y hojas. 2.5. Problemas y ejercicios. 2.5.1. Soluciones. Apéndice informético. 2.4. Introdueci6n En el capitulo anterior hemos descrito cuatro ejemplos en los que legabamos a ‘un punto donde nos encontribamos con un conjunto de valores tomados en una 0 ‘varias variables. A partir de ellos nos disponiamos a extraer conclusiones relaciona- das con los objetivos planteados al comicnzo de la investigacién. Para ello es ‘conveniente empezar por inspeccionar cuidadosamente los datos. A veces esta pri- ‘mera inspecci6n, previa a la realizacién de complejos célculos posteriores, nos porta ya alguna informacién sobre circunstancias lamativas interesantes, Si se han observado pocos valores, porque la muestra es poco numerosa, a simple inspeccién visual de los mismos puede darnos una idea cabal de fo que los nimeros significan. Sin embargo, cuando la cantidad de niimeros recolectados es demasiado grande, y ees el caso més frecuente, se hace difleil hacer una inspeccién directa que sea realmente comprensiva. Por eso el primer paso suele consistir en reorganizar los datos utilizando un formato més intcigible que la simple yuxtaposicién de nimeros. Un instrumento para conseguir esa ordenacién es la denominada distribucién de Srecuencias, y a partir de ella es frecuente también construir representaciones grafi- as. En este capitulo vamos a describir estos dos instrumentos, asi como una alternativa recientemente propuesta para las distribuciones de frecuencias, denomi- nada diagrama de tallo y hojas. Terminaremos el capitulo comentando en el apéndi- 6 la presencia de estos instrumentos en el SPSS/PC +. 2.2. Distribucién de frecuencias La distribucién de frecuencias es un instrumento disefiado para cumplir tres iciones: a) proporcionar una reorganizacién y ordenacién racional de los datos ecogidos;b) ofrecer la informacién necesaria para hacer representaciones grificas, ¥ © facilitar 10s edculos necesarios para obtener los estadisticos muestrales. Vamos a fnir algunos elementos que aparecen en una distribucién de frecuencias, utiliza © la simbologia siguiente: representaremos por X a la variable con la que trabaja- Mos, y que puede adoptar distintos valores, X;, Xp, X;, «5 pero cada uno de esos Tlores puede aparecerrepetido mis de una vez en los elementos que componen la Westra; asi, en el ejemplo sobre la inoculacion de estrés habia varios sujetos que 50 J Aniisis de datos en psicologie 1 ‘compartian el valor 106 en inteligencia, o el valor 5 en estrés. Con estos simbolos podemos dar las siguientes definiciones: Se llama frecuencia absoluta de un valor X, y se simboliza por n, al nimero de veces que se repite el valor X, en la muestra Se llama frecuencia relativa de un valor X, y se simboliza por p, al cociente entre la frecuencia absoluta de ese valor y'el tamafio de la muestra, Es decir, 2. = njr Sc llama frecuencia absoluta acumulada de un valor X, y se simboliza por ny al ndmero de veces que se repiteen la muestra ese valor 0 cualquier otro valor inferior. Se llama frecuencia relatioa acumulada de wn valor X, y se simboliza por p, al cociente entre su frecuencia absoluta acumulada y el tamatio de la muestra. Es decir, p, = mal A veces las frecuencias relativas, ya sean simples o acumuladas, se expresan en. términos poreentuales. En esos casos suclen representarse con mayiisculas; para obtenerlas basta con multiplicar por 100 las frecuencias elativas. Asi, para cualquier valor de la variable, X, tenemos que Fr = py 100 y B=p,-10 Una distribucién de frecueneis se organiza en forma de taba, en cuya cabecsra pueden aparecer todos 0 algunos de los elementos que acabamos de definir, aunque hay uno, las frecuencas absolutas, que sueleapareoer casi siempre. En una distribucion de frecuencias completa aparece, en primer lugar, una columna con los valores que adoota Ja variable, creciendo de abajo hacia arriba; podrian ponerse en el orden invers0, pero para uniformar su uso y aplicar automaticamente los protedimientos que veremos ‘is adelante, en este libro adoptaremos siempre esa ordenacin. A continuacion de Jos valores de la variable aparecen los cuatro clementos que hemos definido. Veimas- Jo con un ejemplo (tabla 2.1): supongamos que a partir de una determinada poblacién un investigador selecciona una muestra de veinte familias, cuenta el nimero de hijos (X) y encuentra los siguientes valores: 2, 1, 0, 3, 2, 2, 3, 1, 1,0, 1, 2,1, 2,0,2,4,2,3y 1. Construimos la distrbucin de frecuencias siguiendo los pasos descritos 4) La variable es cuantitativa discreta y toma valores entre 0 y 4 en esta ‘muestra; por tanto ponemos en la primera columna esos valores, creciendo de abajo hacia arriba Para la columna de frecuencias absolutas contamos el nlimero de veces cue se repite cada valor, si el mimero de valores es muy grande conviene i haciendo marcas por cada valor, para contarlas al final. Una forma de comprobar que no hemos cometide ciertos tipos de errores es asegurarnos de que la suma de las n, es igual an. » Organizacién y reprasentacién de dotor | 51 Para la columna de frecuencias relativas dividimos cada frecuencia absoluta por n. Para detectar errores también aqui podemos hacer la comprobacién de que la suma de las p, es igual a 1 (a veces esta columna no suma aritméticamente 1, debido a que Ia necesidad de redondear las p, distorsiona los valores verdaderos; no es raro encontrar que la suma de esta columna da valores iguales a 0,98 6 0,95), Para obtener las frecuencias absolutas acumuladas sumamos para cada valor su frecuencia absoluta mas la absoluta acumulada del valor anterior. De nuevo comprobamos que la frecuencia absoluta acumulada del valor mayor es igual an. Para las frecuencias relativas acumuladas dividimos cada frecuencia absolu- ta acumulada por n. La frecuencia relativa acumulada del valor mayor debe ser igual a1. 4 4) 4 TABLA 21 Distribucién de frecuencias construida sobre el ejemplo del nitmero de hijos (véaxe texto) x m a ne 4 1 ‘O05 1,00 3 3 415 o9s 2 7 935 080 1 6 030 04s 0 4 415 01s 2 1,00 De Ia inspeceién de la distribucién confeccionada en la tabla 2.1 podemos fatraer de forma inmediata algunas informaciones. Por ejemplo, en las frecuencias absolutas comprobamos que el tamafio de familia més frecuente en la muestra es el dos hijos, eguido de cerea por el de un solo hijo. Las familia sin hijos no son muy frecuentes, De la columna de frecuencias relativas acumuladas deducimos que {i wa proporcion de 0,20 de las familias (una de cada cinco) supera la barrera de & tutorreproduecién, es decir, tiene mis de los dos hijos que signficarian que por ada pareja de adultos naciera una pareja de hijos Aunque del ejemplo anterior pudiera deducirse lo contrario, no en todos los Gir08 las distribuciones de frecuencias se confeccionan de una forma tan sencilla y "a. A veces surgen ciertas complicaciones, que ilustraremos en el siguiente {mPlo. Supongamos que recogemos las puntuaciones obtenidas por 100 sujetos en comaials € de conservadurismo de Wilson y Paterson (1970), y nos disponemos a amet con ellas una distribucion de frecuencias siguiendo los pasos deseritos iormente, Para poner en la primera columna los valores que adopta la variable 82 / Anilisis de datos on psicologia | Organizacién y representacién de datos | 53 debemos primero encontrar los valores maximo y minimo en esta muestra [véase_ CUADRO 21 cuadro 21, apartado a]. Comprobamos que el valor mayor es 69 y cl menor es 16; calculamos el nimero de filas que tendria nuestra distribucion, que serian 54 en Tugar de las cinco del ejemplo del mtimero de hijos. Es facil comprender que uns primera dificultad en la construccién de esta distribucién de frecuencias es el excesi- {yo niimero de valores distintos, que darian lugar a una tabla demasiado larga. Si _Ejemplo de distribucion de frecuencias con datos agrupados en intervalos, optenidos a partir de la escala de conservadurismo de Wilson y Patterson (1970) @ Datos directos obtenidos en una muestra de 100 sujetos: len lector todavia no le parece excesivo este nimero de valores, imagine lo que 513s 6 41 ST BB pasaria sila variable fuese, por ejemplo, «ingresos mensuales»; probablemente ¢n 3 3 36 ” Fina muestra al azar de 1.000 espafioles encontrariamos centenares de valores distin= 19 47 a 54 a tos, Una segunda dificullad que surge en nuestro cjemplo es que hay valores M36 M4 4S 30 9 i intermedios que no aparecen, como el 67 6 cl 68. El resultado seria, por tanto, una 0 a 3 B } tabla excesivamente grande ¢ inmancjable que dificilmente ayudaria a los objetivos 2 37 a 7 } wae es qu ha sdo dneBade, que exponiamos al comienzo de exta seein [véase “may 8 % cuadro 21, apartado by} Ba ee ee Para mejorar la consocuci6n de esos objetivos, en los casos en los que se dan. Bester A circunstancias como éstas suele aplicarse lo que se denomina una agrupacién em Sconsjon'y que consiste en formar grupos de valores consecutivos,lamados inter 1) Distribucion de frecvencias sin agrupar en intervalos (sé los valores y Tas fre= valos, y poner uno de estos grupos en cada fila, en lugar de poner cada valor cuencias absolute individual por separado. Siguiendo con nuestro ejemplo, y dado que desde el menor al mayor hay 54 valores diferentes, podriamos, por ejemplo, hacer nueve grupos de sacs cada uno, comensando por el grup 117,16 1, 2021,» trmipanda @ wee op ot 65. 6667 by 68 Cada uno de cts Bosse indice ena $ distribucién de frecuencias poniendo los valores mayor y menor incluidos en 4. Asi, 8 los dos intervalos que acabamos de poner como ejemplo serian el 16-21 y el 64-69. A z teu sc eseuon nsec abla ona de fos vale incuidoe “ 27am hacend lo mismo Gesputs con as ecuenca relatvas, ls abl a tis acumulade srt scumladas(evadro 2, apa 6 i Fn las distribuciones de frecuencias con valores agrupados en intervalos apare~ 2 cen algunos elementos nuevos a los que vamos a poner nombre: Se llama intervalo a cada uno de los grupos de valores que ocupan una fila en tuna distribucién de frecuencias. En algunos textos se llaman clases. % ‘Se llaman limites aparentes 0 informados de un intervalo a los valores mayor ¥ os menor que puede adoptar la variable dentro de ese intervalo, segiin el instru- mento de medida utilizado, Se laman limites exactos de un intervalo a los valores méximo y minimo jncluidos en el intervalo y que podrian medirse si se contara con un instru- mento de precision perfecta. ‘Se llama punto medio de un intervalo a la suma de sus limites exactos partido por dos. En algunos libros se lama marca de clase. Se llama amplitud de un intervalo a la diferencia entre su limite exacto superior y su limite exacto inferior. Suele representarse por Ia letra I 84 / Andivie de dotos en psicologie | ara algunos autores no tiene sentido aplicar algunos de estos términos a todo tipo de variables. Por ejemplo, los limites exactos de los intervalos no serian distin- 10s de los aparentes o informados en variables discretas. La razén es que en esos casos los valores medidos no son redondcos debidos a la imprecision de los instru- mentos de medida (véase el capitulo anterior). No obstante, nosotros no haremos distincion a estos efectos entre variables discretas y continuas. ‘Una cuestion que algunos lectores se estardn preguntando en este punto es la zazon por la que hemos decidido hacer nueve intervalos de seis valores, en lugar de ‘otras posibles combinaciones, como por ejemplo seis intervalos de nueve valores 0 tres intervalos de dieciocho valores cada uno. Para hacer una distribucién de frecuencias no hay unas normas muy rigurosas. Nosotros vamos a plantear tres reglas y algunas directrices. Las tres normas son las siguientes: 4) El intervalo superior debe incluir al mayor valor observado. 6) El intervalo inferior debe incluir al menor valor observado. ‘) Cada intervalo debe incluir el mismo nimero de valores. Pero son muchas las agrupaciones diferentes de los datos de nuestro ejemplo que cumplen con estas reglas. Para decidir entre ellas hay que tener presentes algunas directrices, basadas en dos guias principales: a) dado que el objetivo de tuna distribueion de frecuencias es conseguir una ordenacién manejable que ayude ‘a comprender el significado de los datos, no es conveniente que el nimero de intervalos sea demasiado grande, y b) como consecuencia de lo anterior, podemos: sentirnos inclinados a reducir al maximo el nlimero de intervalos, pero lo cierto es ‘que esto traeria consigo una consecuencia negativa. En concreto, los intervalos tondrian una excesiva amplitud, y acabariamos teniendo a sujetos con punt: nes muy distintas en el mismo intervalo. Mas adelante, a a hora de hacer represen- taciones graficas y calculos de estadisticos, nos veremos obligados a tratar los valores de formas distorsionantes, cayendo en lo que se suele denominar error de agrupamiento (véase més adelante el apartado sobre los supuestos de distribucion intraintervalo). Dado que estas dos guias nos orientan en sentidos contrarios, parece razonable adoptar soluciones de compromiso entre ellas. A pesar de lo ambiguo de esta afirmacién, lo que podemos decir es que el nimero apropiado de intervalos debe ser tal que, simulténeamente, con ella se consiga una agrupacion ‘operativa y que cumpla los objetivos para los que ha sido disefiada la distribucibn, de frecuencias, pero sin distorsionar excesivamente los valores con el error de ‘agrupamiento. ‘Terminaremos Jo referente a la construcci6n de intervalos comentando dos lltimas cuestiones. En primer lugar, a veces hay casos en los que hacer un nmero de intervalos siguiendo las directrices que acabamos de plantear distorsionarian demasiado los datos. Por ejemplo, si se trata de la variable «ingresos mensuales», tendremos una mayoria de valores concentrados en torno a los valores centrals, y ‘unos pocos que se desvian de éstos mucho por arriba. Sien un caso asi se hiciera un nimero de intervalos en torno a diez, y de amplitud constante, la inmensa mayoria Orgonizeciin y opresentacién de dotos | 85 de los datos estarian concentrados en uno 0 dos intervalos. Para evitar eso se ‘tilizan lo que se denomina intervalas abiertos, en los cuales no se pone el limite jnferior del intervalo que incluye los valores menores, el limite superior del intervalo {que ineluye los valores mayores, 0 no se pone ninguno de estos dos. En la tabla 22 parece un ejemplo de distribucion de este tipo. TABLA 22 Distribucion de frecuencia, con los datos agrupados en intervalos, en la que aparece un intercalo abierto. La variable es aingresos mensuales» ™ “+ de 500.000 15 450.000-00.000 10 400,000-450.000 2» 350,001-400,000 30 300.001-350.000 40 2250.001-300.000 50 200.001-250.000 100 150.001-200.000 200 100,001-150.000 200 '0,000-100.000 50 75 Le otra cuestion se refiere a lo que a veces se denomina problema de los bordes. Supongamos que vamos a construir una agrupacién en intervalos, siendo los valores ‘mayor y menor observados iguales a 79 y 43, respectivamente. Como el niimero de Valores distintos seria igual a 37, que es un nimero primo, no pueden hacerse Intervalos de amplitud constante tales que el mayor tenga al 79 como limite aparen- {e superior y al 43 como limite aparente inferior. En estos casos suele afiadirse al listado de valores distintos observados algunos otros valores no observados en la Muestra. Estos valores, por supuesto, tendrém frecuencias absolutas iguales a cero, Pero nos permitirén conseguir un nimero de valores distintos que sea miiltiplo del Ziero de intervalos que queremos hacer. Por ejemplo, en este caso podriamos Static tres valores y hacer ocho intervals de amplitud igusl a cinco. Estos tres es podrian aftadirse por abajo (40, 41 y 42) 0 por arriba (80, 81 y 82), aunque Para no distorsionar demasiado ninguno de los intervalos extremos es preferible [tPartirlos lo més homogéneamente posible entre los dos. En este caso podrian wcerse los intervalos de forma que el inferior fuese el 41-45 y el iltimo el 76-80, © 86 / Andisie de datos en psicologie 1 también podrian hacerse de forma que el inferior fuese 42-46 y el iltimo el 77-81. Se trata de algo asi como de crear, o incluir en la distribucién de frecuencias, el hueco 0 lugar donde anotariamos ciertos valores en caso de que se hubiesen dado, a pesar de que de hecho no se han observado. 2.2.1. Supuestos de distribucién traintervalo Una ver confeccionada una distribucién de frecuencias con datos agrupados en intervalos, ésta se puede utilizar para hacer representaciones grificas y para faciitar 19s calculos de estadisticos que iremos explicando en capitulos posteriores, Si quere- ‘mos utilizar la distribucion de frecuencias para ello, sin tener que recurrir a los datos directos, hay que asumir ciertas interpretaciones de las distribuciones que suponen un margen de error, pero que son imprescindibles. La situacién seria una en la que cn lugar de contar con los datos directos, y de construir la distribucion de frecuen- cias, ésta se nos da hecha. Para ilustrarlo supongamos que lo tinico que se nos roporciona del ejemplo descrito en fa tabla 2.1 es la distribucién que aparece en el apartado ¢), ya confeccionada. Si queremos hallar la suma de las puntuaciones ‘obtenidas, no podriamos hacerlo con precisién. No sabemos cuiles eran las dos ‘observaciones del intervalo superior, slo sabemos que eran valores entre 64 y 69. Dado que de cada puntuacién sélo sabemos el intervalo al que pertenece, un procedimiento que a veces resultard itil consiste en asumir el supuesto de concentra cidn en el punto medio. Segiin este supuesto, tratatiamos a es0s dos datos como si fueran dos valores iguales a 66,5, que es el punto medio de su intervalo. Esta forma de actuar supone una cierta cantidad de error, pues en realidad los valores originales «eran 65 y 69. Sin embargo, a medida que los intervalos tienen frecuencias mayores, estos errores se van reduciendo, dado que mientras que la sustitucion de algunos de ellos por el punto medio supone un incremento artificial, en otros lo que se produce es una reduccién artificial y, en general, tenderén a compensarse los dos tipos de error. ‘También veremos més adelante algunos casos en los que el supuesto de con- centracién en el punto medio no resulta apropiado, porque interesa la adopcién de un criterio que asigne valores distintos a los elementos de un mismo intervalo. Un criterio de este tipo se sigue cuando se asume el supuesto de distribucién ‘homogénea, segin el cual los valores incluidos en un intervalo se reparten con absoluta uniformidad en su interior. Es decir, que si en un intervalo hay cinco observaciones, aceptaremos que sus valores son los que tendriamos si partiéramos al intervalo en cinco subintervalos de igual amplitud y asigndramos a cad: duo el punto medio de un subintervalo. Por ejemplo, supongamos que en la dis- tribucién de la variable conservadurismo apliciramos este supuesto. En ese caso, cl intervalo 58-63 quedaria partido en ocho subintervalos de igual amplitud, tal y como se detalla en el cuadro 2.2. En los capitulos siguientes iremos indicando en ‘qué casos asumiremos el supuesto de concentracién en el punto medio y en qué casos el de distribucién homogénea. Orgonizecién y epresentacién de detos | 57 CUADRO 2.2 Ejemplo numérico de los supuestos de distribucién intraintervalo Se trata de un hipotético intervalo 58-63, que tiene frecuencia absoluta igual a ocho. (Una representacién ampliada del intervalo, asi como de su particion en subintervalos ‘gual, seria la siguiente: 315 585 95 605 15 os 6s ee eS $8 9 0 6 a 6 575 $825 590 59,75 OS 1S OSS 5787S $8625 59,375 60.125 60875 61,625 6237563125 El intervalo original tiene una amplitud original de seis unidades, y sus limites exactos son 57,5 y 635, pero al adoptar el supuesto de distribuciin homogénea se subdivide en ‘cho subintervalos iguales, tal y como aparece en la grafic. Se asignaria el punto medio de cada uno de estos subintervalos una de las observaciones incluidas en ef interval. Por tanto los ocho valores en los dos supuestos de distribucién intrainterva- To setian Ios siguientes: Supuesto de concentracién en el punto medio: os 6s 5 OS 60S 6S 60s OS Supuesto de distribucion homogénea: S78TS $8628 5937S 60125 6087S 61,625 62,375 63,125 Representaciones grat as AA partir de las distribuciones de frecuencias se pueden construir representacio- Nes grificas. La funcién de éstas es dar informaciones globales mediante un solo golpe Ge vista. Las hay de muy diversos tipos, aunque nosotros vamos a centrarnos en ‘quellas que mas frecuentemente nos encontramos en el Ambito de la psicologia. Tras ibit sus caracteristicas pasaremos a establecer algunas convenciones acerca de su nfecci6n y, por timo, trataremos el tema de la honestidad en las erdficas estadisticas, 2.3.1, Representaciones graficas de uso frecuente enc), Piagrama de rectingulos, Para hacer un diagrama de rectingulos se colocan lcje de abscisas las modalidades (0 los mimeros que las representan), y en el eje 5B / Anilisis de detos en psicologie 1 Orgenizecién y representacién de datos | 59 de ordenadas las frecuencias (pueden ser absolutas o elativas, simples o acumula- das), Sobre cada modalidad se levanta un rectingulo cuya altura es la frecuencia correspondiente. La base de los rectingulos sera arbitraria, pero igual para todos, En la figura 2.1 aparece un diagrama de rectingulos de la variable estado civil en un ejemplo hipotético. Este tipo de representaciones se suele utilizar para variables ‘nominales, pero también se utiliza para variables ordinales, como el nivel cultural de nuestro ejemplo, que aparece en la figura 2.2. 1 fs ae Figura 2.3.—Perfil ortogonal construido sobre unas supuestas puntuaciones de un ‘estudiante en cuatro: Ed ® 7 «) Pictograma. Son representaciones en forma de circulos en las que éstos son siicae dividdos en secciones cuya superficie es proporcional a la frecuencia de Ia modal ddad correspondiente. A veces, cuando el interés del trabajo lo aconseja, se separa tuna de las secciones del pictograma, con objeto de captar la atencién del lector. Eu Ja figura 24 aparece un pictograma de la variable «nivel cultural Figura 21. Diagrams de rctinguloe conetruido eobre la variable sestada cli i 3 secandarios iH igura 24,—Pictograma construe sobre los dato de Ia variable rive cultura ie ea eg a, Figura 244—Pictogs ido sobre los datos dela Figura 22—Diagrama de rectingulos construido sobre Ia. variable enivel cultural _.) Diagrama de barras. Se utiliza para variables cuantitativas diseretas. En el je de abscisas se colocan los distintos valores de la variable y en el eje de ordenadas las frecuencias. Sobre cada valor de la variable se traza una linea o barra perpendi- b) Perfil ortogonal. Se utiliza mucho en informes psicopedagogicos o de rendi- alae cuya altura debe ser igual ala frecuencia. En la figura 2.5 aparece un diagrama tiento, En la figura 23 aparece un perfil hecho sobre las ealificaciones obtenidas barras correspondiente al ejemplo de Ia variable «nimero de hijos» que utiliza- por un alumno a lo largo de cuatro examenes. ‘™Os anteriormente. 60 / Ansisi de datos en psicologta | Organicacién y representacién de detos | 61 PN ge ee . voligono de frecuencias. Para variables discretas, aoa seit de unr ou extemes spore les qe bran ae ‘hhubiera hecho una grafica como la descrita en el apartado d), Si se trata re eee acetal ie lo elope ons nh on aad ruido con esos mismos datos. En las figuras 2.7 y 2.8 presentamos ejemplos eas dene datos iMilizados para el histograma de la figura 2.6. » 4 of a Figura 25-—Diagrama de barra consruido sobre la variable xnimeto de hijom. ©) Histograma. Se utiliza para variables cuantitativas continuas con datos agrus pados en intervalos. En el eje de abscisas se colocan los limites exactos del intervalos, y en el eje de ordenadas las frecuencias. Sobre cada intervalo se lev: tun rectdngulo cuya altura sea igual a la frecuencia correspondiente. En la figura 2. aparece un histograma construido sobre los datos del ejemplo utilizado on cuadro 21. au Me eg claticc asec rigura 27-—Poligono oe Mecuencas consruide sobre I vatabte saeco de hijosr baa] 158 215 275 33S 39S 455 515 515 65 695 95 155 2S 275 HBS IS 455 51S 575 5 05 155 Figura 2.6.—Histograma construido sobre Ia variable aconservadursmo», Figura 28.—Poligono de frecuencas construdo sobre la variable aconservadurismo™, 62 / Anbisis de dotos en pseologta 1 2) Diagrama de barras acumulativo, Se utiliza en variables discretas. En el eje abscisas se colocan los valores de la variable, y en el de ordenadas las frecuencit acumuladas, ya sean absolutas o relativas. Sobre cada valor se traza una perpendi cular cuya longitud sea igual a la frecuencia acumulada. Desde el extremo super de cada una de estas barras se traza una linea horizontal que se une con la bat situada a su derecha. En la figura 29 presentamos un ejemplo sobre la variabl ‘«ntimero de hijos». * i @ a 4 Figura 29—Diagrama de barras acumulatvo construido sobre la variable enimero de hijs» 1h) Poligono de frecuencias acumuladas. Se utiliza en variables continuas. El ¢je de abscisas se construye igual que en los histogramas, pero en el de ordenadas incluyen las frecuencias acumuladas, ya sean absolutas 0 relativas, Sobre cada limite se levanta una perpendicular cuya longitud sea idéntica a la frecuencia acumulada y se unen los extremos superiores de dichas perpendiculares. Con frecuencia en este tipo de grificos se utilizan para el eje de ordenadas los porcentajes. En la figura 2.10 ‘aparece un ejemplo sobre la variable de la figura 26, 4) Otros dibyjos. Muchas veces se utilizan otras representaciones figurativas, en las que se incluyen los objetos de los que se estin haciendo recuentos de frecuencias, © algiin simbolo que los identfique de forma muy expresiva. Asi, para expresar la capacidad de un ejército, el tamafio del parque automovilistico de un pais, 0 su produccién vitivinicola, pueden utilizarse siluetas de carros de combate, perfiles de coches, 0 dibujos de botellas de vino. No obstante, en estos casos hay que tenet presentes as indicaciones que hacemos en el apartado 2.3.3 sobre los tamaiios de las figuras, Crgenlzacion y epresentacisn de detos | 63 95 155 US ITS 335 385 455 51S 57S OBS OS TSS Figura 210.—Poigono de fecuencias acumuladasconstrido sobre Ia variable «conservadurismo», 2.3.2. Convenciones sobre las representaciones graficas ‘Aunque las representaciones grificas de los datos incluidos en una distribucién de frecuencias pueden realizarse de muy distintas formas, vamos a establecer algunas convenciones para unificar criterios, asi como a sugerir algunas directrices que ‘nosotros mismos seguiremos en el resto de este libro: 4) En el eje de abscisas colocamos los valores de la variable, y en el de ordenadas las frecuencias (absolutas o relativas, simples o acumuladas), }) La interseccion de los dos ejes es el origen, de modo que en el eje de abseisas las puntuaciones mas bajas estardn a la izquierda, y las més altas ala derecha; en el de ordenadas los valores pequetios estariin abajo y los altos arriba, Si el valor minimo del eje de abscisas fucra excesivamente grande, se debe cortar la linea, como en el ejemplo de la figura 2.6 (hay que tener presentes, rno obstante, las precauciones que se detallan en el préximo apartado), Conviene incluir en cada grifico toda la informacién posible para evitar ambigiedades y facilitar su interpretacion pot otras personas o por nosotros mmismos al cabo del tiempo (nombre de la variable junto al eje de abscisas, tipo de frecuencia junto al eje de ordenadas, grupo al que corresponde cada srifica cuando se han representado dos o més grupos conjuntamente, tc) ‘Cuando en un mismo grafico se representan dos 0 mas grupos simultinea~ mente, y éstos son de tamafios considerablemente distintos, se deben utilizar frecuencias relativas. 10 queremos concluir este apartado sin idad y el sentido comin aplicados a la Tepresentacién grifica. En este aspecto de la estadistica se ha observado como en 64 / Ansivie de dotos en psicologle | ppocos la aparicién de ideas creativas e innovadoras. En realidad, cualquier represe tacion grafica es bienvenida siempre y cuando sirva a los objetivos planteados y haga honestamente (véase el apartado siguiente). En este sentido, debemos presentes los hallazgos de la psicologia cognitiva sobre las limitaciones de la ment ‘humana en cuanto al nimero de clementos distintos que podemos manejar simul neamente a la hora de hacernos una idea global de un problema. Los estud indican que este limite suele estar en torno a7 + 2, y por tanto un buen consej seria no utilizar, siempre que ello no fuerce demasiado los datos, un nimero intervalos, columnas, barras, grupos, secciones, etc,, mayor de 9. Por otra parte, ha ue tener siempre presente que las representaciones sirven para comunicar info ién de un solo golpe de vista, y por ello en su construccién debe tenerse en cue el piblico al que va dirigida, sus necesidades de informaciones més bien globales generales 0 especifcas y precisas, y cualquier otra consideracién que pueda mejo la transmisién de informacién ail y precisa 2.3.3. Tendenciosidad en las representaciones gréficas Las representaciones grificas pueden utilizarse de manera tendenciosa ps inducir impresiones engatiosas e interesadas. Los métodos més frecuentemente util zados para ello fueron recogidos y expuestos en un pequeiio y divertido libro Darrel Huff (1954), Aunque ecte libro podria considcrarse una estupeudla introd ci6n a los métodos de engatio para desaprensivos y desahogados, el autor justifica ublicacién de la siguiente manera: «Quizé podria justificarla de la misma form ue lo haria el ladrén retirado cuyas memorias publicadas equivalian a un cut superior de como manipular cerraduras y andar sin ser oido. Los delincuentes y ‘conocen esos trucos; la gente honrada debe conocerlos para su autodefensa» (ap. cit, pig. 9). Con esa misma filosofia hemos recogido aqui dos de los procedimientos mas utilizados. Un primer método consiste en recortar el eje de ordenadas (y por tanto las barras, los histogramas o la figura que se haya utilizado), eliminando los menores. valores de frecuencias con la excusa de que no hay ninguna observacién que las adopte. Esto tiene como consecuencia que pequefias diferencias parezcan mayores, Un segundo tipo de distorsién se produce cuando se utilizan figuras representativas. de aquello que se esté midiendo. Estas figuras suelen haccrse proporcionando sus alturas a las frecuencias correspondientes. Sin embargo, el incremento en la altura. conlleva también un incremento en la anchura. Como consecuencia de ello, la superficie dc las figuras no guarda relacién con las frecuencias observadas, dando la impresin de que la diferencia es mayor que la realmente registrada. Una alternativa no tendenciosa son los diagrama de barras, en los que no se produce esta distorsion, porque la anchura de las barras es constante. En el cuadro 2.3 presentamos ejemplos de graficas hechas con estos procedimientos, y junto a ellas las alternativas correcta: mente confeccionadas, Onganizacién y representacin de dates | 65 CUADRO 23 _pemplos de gréficas tendenciasas, cada una acompanada de su alternativa correcta Al hacer un diagrama de barras de la variable «diagnéstico psiquiétrico» de la {zquierda, parece que hay muchos més neurSticos que psicdticos. Esta impresion se Gebe a que el eje de ordenadas ha sido recortado, puesto que en realidad hay 180 psicdticos y 200 neurotcos. Al rehacer el diagrama con el eje completo, se aprecia {que la diferencia real entre ambos tipos es muy pequeiia. Ey 2» 0 0 1 Es v0 » P N e Pp N ° a repreentar las frcnenias dels interlones de volo regitrada en una Comat umos juin Ges nanan, Aung dor ere an ade Ge vlan yun co ha indeado que votard no Goble nimero dees que de foes y de ac ns ra east exptan eas poporins el hecho de fed smd hs igus we mtn propionic eo stra hace gue iSsoprteoncueida en in pier figue en menor que ln tad de ins pore senda cn la ogee La tyres val te que la denn Sas fmucho mayor Esto no ocre en la rpresentacion en forma de diagrama de tes 067 0667 ass 0333 o ° NO st NO sf 2.3.4. Propiedades de las distribuciones de frecuens Los conjuntos de datos de variables cuantitativas obtenidos en muestras, y que hemos organizado mediante distribuciones de frecuencias, tienen algunas caracteris- ‘que iremos exponiendo detalladamente a lo largo de los préximos capitulos. 86 / Ansisis de datos en psicologia 1 Ovgenizecion y representacién de datos | 67 Sin embargo, vamos a describir sucintamente en este punto cusles son esas cars Fisticas 0 propiedades. Para ilustrarlas utlizaremos curvas suavizadas, que no a mis que poligonos de frecuencias sin Angulos, es decir, dibujadas limando esquinas y suavizando su trazado. Hay que tener en cuenta que los poligonos frecuencias dependen demasiado de la unidad de medida utilizada, de la agruy fen intervalos hecha (en caso de haber recurrido a cllo) y de las fluctua Particulares esperables en una muestra conereta. Por ello, las curvas suavi suelen ser representaciones mas apropiadas que los poligonos de frecuencias sim j Son cuatro las propiedades con las que describiremos las distribuciones de frecuenc a) | Tendencia central. Una primera propiedad es la que se refiere a la magnit general de las observaciones hechas. Esta magnitud general puede cuantifi ‘mediante unos indices conocidos como indices de tendencia central 0 promedios, ue reciben ese nombre porque pretenden ser sintesis de los valores de la varia Asi en la figura 2.11 puede observarse que los valores del grupo A tienen tendencia central en torno al valor 90, mientras que la tendencia central de los grupo B esta en torno al valor 100. las que A y B tienen tendenciascentales similares, y 1 212-—Bjemplo de tes distribuciones a xa si menores que a de C, mlentrat que la variabhdad de B es mayor que Avnet o seg. Ea a gua 213 aparezen as res de los grupos A By C. La dt propo A india queen genera la mayor de os sos han obo punta ciones central, en tomo ia media, mientras que unos pocos han obte puntuaciones relativamente alts y otros poos han obtnido puntuaciones relative: nent aja: se dice quel dstibucin Aes smtrc. Esto no ocurte en los grupos By C. En el primero de ellos hay muchas observaciones con puntuaciones bajas Bos con puntuaciones ata, mientrus yu en el sgudo ovurr lo contearic: dice que las dstribuciones B y Csufen de asmetra positive y negutiv, respective mente. Fsta propiedad se refer, por tanto, al grado en que Tos datos tienden concenrase en los valores centres, en os valores inlerioes al promedio, 0 els Yalores superiors a ése, rise simetra perfect cuando en caso, de doblar la representacion gréfica por una vertical trazada sobre la media, las dos mitades se % 100 10 b) Variabilidad. Esta propiedad se reficre al grado de concentracién de las observaciones en torno al promedio. Una distribucién de frecuencias seri homogé- ‘nea 0 poco variable si los datos difieren poco entre si y, por tanto, se agolpan en {orno a su promedio. Seri heterogénea 0 muy variable si los datos se dispersan mucho con respecto al promedio. Esta propiedad es independiente de la anterior, es, decir, dos grupos que tengan distinta variabilidad pueden tener tendencias centrales, muy distintas o similares. Asi, en la figura 2.12 aparecen las representaciones de las distribuciones de frecuencias de tres grupos, A, B y C. Los grupos Ay B tienen la ‘misma tendencia central, pero el B es més variable que el A, mientras que el grupo C ¢s igual de variable que el A pero tiene un mayor promedio. oo sme B Pi 213— sibacions com into tps de go La daibucén A Be DO Bienen pntva ya C ems neat 68 / Anéisis de datos en psiclogta | superponen perfectamente. Las distribuciones con asimetria negativa son propi de las pruebas, tareas o tests faciles, en las que la mayoria de los sujetos punt alto. Las distribuciones asimétricas positivas son tipicas de pruebas, tareas tests dificiles, en las que la mayoria de los sujetos puntian bajo. Las pruebs tareas o tests de dificultad media suelen producir distribuciones més 0 ment simétricas, 4) Curtasis. Se refiere al grado de apuntamiento de la distribucién de frec cias. Si es muy apuntada, se llama leptociirtica, y si es muy aplastada, se Il Platicitica. Generalmente el grado de curtosis de una distribuciOn se compara Onganizacién y representacién de dates | 69 CUADRO 24 Ejemplos numéricos de distribuciones con distintas propiedades En el ejemplo, junto a los intervalos confecionados con los valores de la variable, hemos dspuesio en diferentes columnas las frecuencia absolut obtenidas en cuatro frupos de 100 suetos cada uno, que representaremos por as letras A, B, Cy D. Estas fistibuciones de frecuencias pueden compararse, de forma simplemente visual, en las propiedades que hemos descrto en el texto. As, las distribuciones A y B tienen {endencias centrale parecidas, peo la distibusion A es mis homogénea que la B; sin tenibargo, ambas dstribuciones son siméticas. Por el conravo, las distrbuciones C y Dienen el mismo grado de variablidad, aunque la primera tine asimetianegativa ¥ uun modelo de distribucién llamado «distribucién normal», del que hablaremos la segunda asimetria postiva, capitulos posteriores, y que respecto a la curtosis se lama distribucién mesocirt ues esti entre los otros dos tipos de curtosis. En la figura 2.14 aparecen representaciones de tres grupos A, B y C; la del grupo A es leptociirtica, Ia del a mesocirtica y la del C platicirtica, Grupo Seas ees 8] of BSs0ure s 2.4. Diagrama de tallo y hojas Figura 214—Rjemplo de dstrtbuciones con distinostipos de curtosis La dstribucion Aes leptocis Ta B mesoirica y l'© platcirtca, Las distribuciones de frecuencias no son el iinico medio para resumir y exponer Conjuntos de datos; una alternativa a ellas son los llamados diagramas de rallo y hojas, que fueron ideados por Tukey (1977) en el contexto del enfoque denominado ‘milisis exploratorio de datos. Su obtencién requiere separar cada puntuacién en dos partes: cl primer o Drimeros digitos, que reciben el nombre de rallo,y el digito o digitos restantes, que Teciben el nombre de hojas, por ejemplo, X = 56 se puede separar en 5 (tallo) y 6 a). Sin embargo, como veremos mas adelante, estos diagramas tienen la suficien- {: flexibilidad como para admitir otras posibilidades. Los pasos que hay que seguir Para construir un diagrama de tallo y hojas son los siguientes: En este apartado hemos pretendido s6lo indicar, de una forma muy intuitiva, las propiedades mas importantes de las distribuciones de frecuencias. Sin embargo, ‘no nos vamos a contentar con hacer las comparaciones visuales que, grosso modd hemos hecho en los ejemplos anteriores (véase también los ejemplos numéricos del ‘cuadro 24), sino que en los temas siguientes vamos a exponer procedimientos para. cuantificar esas propiedades, con lo que podremos comparar unos conjuntos de_ valores con otros con total precisiOn. Podremos asi hacer afirmaciones del tipo «el ‘grupo A tiene un mayor promedio que el B», «el grupo C es menos homogéneo que €l D> 0 «el grupo E es mis simétrico que el Fo. 4) Se identifican tos valores méximo y minimo observados, >) Se toma una decision acerca del niimero mas apropiado de tallos distintos. 70 | Anéisis de datos en psicologle | 6) Se listan todos 10s tallos distintos en una columna, ordenados de fo ereciente de arriba hacia abajo. 4) Se escribe cada hoja junto al tallo que le corresponda, preferiblemen ordenados segin su valor. En el cuadro 2.5 presentamos un ejemplo numérico sobre 30 observaciones. ‘gual que al tratar la agrupacion en intervalos nos planteébamos la cuestién de cu cs el nimero mis apropiado de intervalos, ahora podemos plantearnos con ql criterio decidimos el nimero de tallos. De nuevo hay que decir que no hay not estritas sobre ello, y las directrices que podemos dar son tan generales como las q dimos en aquel caso, En general, un nimero de tallos superior a cinco y que no de veinte suele ser apropiado. Aparte de ser mas facil de construr, el diagrama tallo y hojas tiene varias ventajas sobre la distribucion de frecuencias, y tambien a inconveniente: 4) Usia primera ventaja es que permite identificar cada puntuacién individi En las distribuciones tradicionales s6lo conocemos la frecuencia del interva- lo, y eso nos obliga a tratar los datos de ciertas maneras distorsionan (asumir la concentracién en el punto medio o Ia distribucién homogén dentro del intervalo). Sin embargo, la ventaja de retener cada valor indivi dual viene acompafiada del inconveniente de que el diagrama de tall hhojas no faclita, como la distribucién de frecuencias clisica, el célculo de I estadisticos que estudiaremos més adelante. 5) Ofrece simultineamente tanto un listado de las puntuaciones como wi dibujo de la distribucién. Efectivaniente, si tumbamos el diagrama obtene- ‘mos una especie de histograma, ©) Al contener los valores de cada observacién, es més fécil de modificar para ‘obtener un dibujo con un nivel de detalle distinto, mayor 0 menor, de la distribucién (véase un ejemplo en la parte final del euadro 2.5) 4) Otra ventaja de esta técnica es que pueden representarse dos conjuntos de. datos simulténeamente en el mismo diagrama, con lo que se facilita la comparacion. En el cuadro 2.6 presentamos un ejemplo. Oxganizacién y representacién de datos | 71 CUADRO 25 Ejemplo de confeccién de un diagrama de tallo y hojas ‘Hemos obtenido las puntuaciones de 30 sujetos en una variable (el grupo de datos de la inquiorda, y los hemos ordenado de menor a mayor (grupo de datos de la derechay: 31, 72, T, 65, 54, 78, 85, 42, 49, 63, 61, 32, 51, 33, 77, 93, 85, 83, 63, 55, 98, 46, 57, 73, 73, 68, TR, 91, 75, 77 32, 33, 37, 42, 46, 9 St, 54, 55, 57, 58, 61 63, 63, 65, 68, 71, 72 13,73, 73,75, 77.7 78, 83, 85, 85, 91, 93, @) Los valores mayor y menor son 93 y 32, respectivamente, 2) Si tomamos la decena como tallo tendremos siete tallos distintos, que parece tun niimero apropiado. Por tanto, separamos las puntuaciones en dos partes, con un digito cada una, Los tall distntos ordenados de menor a mayor son 3,4,5,6,7, 899. yd) Colocamos en columna los tallos y escribimos cada hoja junto a su tallo ‘correspondiente: 3/237 4} 269 5] 14578 6) 13358 3) 123338778 8 ]355 913 Si a continuacién decidimos rehacer el diagrama con un grado mayor de detalle, Podemos hacerlo a partir del diagrama anterior, dividiendo cada tallo en dos partes: 3 ]23 3+ [7 a |2 44 foo s— fia s+ [78 j6— [133 6+ [58 — = La hoja toma valores entre 0 y 4 7— |12333 + = La hoja toma valores entre 5 y 9 7+ |s778 s— |3 s+ [55 o— li3 ecco eetnenes PSS eee 72 | Ansisis do datos en psicologia | CUADRO 26 Ejemplo de un diagrama de tallo y hojas conjunto Disponemos de los datos de un grupo de control y otro experimental, ambos con 25, sujetos cada uno. Confeecionamos un diagrama de tllo y hojas en el que los tals son ‘comunes y las hojas de cada grupo aparecen por separado, Controt Experimental 23, 21, 31,30, 17 30, 27, 24, 19, 28 15, 15, 24, 27, 30 29, 33, 35, 22,30 25, 28, 21, 22, 16 33, 28, 24, 26, 30, 18, 31, 30, 24, 22 34, 35, 35, 25, 26 20, 31, 26, 25, 26 32, 28, 28, 27, 34 Control Experimental 87655 ] 1+ [9 aqsz2i0 |2— | 124 876655 | 2+ | 5667788899 111000 | 3— | 00023348 34 | 558 En este diagrama de tallo y hojas conjunto se aprecia de forma inmediata que en general los datos del grupo experimental tienden a concentrarse mis en los valores altos que los del grupo de control (Jos tallos més repetidos son, respectivamente, veintes altos y veintes bajos) 2.5. Problemas y ejercicios (4. Los datos que se presentan a continuscién corrsponden a las puntuaciones obtenidas por ‘50 alumnos en una prueba objetiva de andlisis de datos. Obtenga une distibueién de fecuencas completa con ios valores agrupados en interalos de amplitud 2 6 15 10 8 2 5 13 6 6 19 12 0 16 15 Bt Ger 5m 1 15) a) 9) ton otha a) 9 il £4 8 § i) O 9 © oo ob is BRU 1 « 0 Mm 5 Ovganizaciin y representacién de datos | 73 5 @2. A continuacién se dan los resultados obtenidos por una muestra de 50 universitarios. La caracteristica medida es el tiempo de reaccién ante un estimulo auditivo O11 O11 0126 0112 0,117 0,113 0,135 0,107 0,122 0,113 0,098 0,122 0,105 0,103 0119 0,1 O17 0113 0,124 0,118 0,132 0108 0,115 012010704123 0,109 0,117 O111 0,112 O01 0112 0,111 0,119 0,103 010,108 0,12 0.099 0,102 0,129 0,115 0,121 0,130 0,134 0,118 0,108 0,128 0,094 0114 4) Obtenga la dstribucion de frecuencias absolutas y relativas con diez interva- los de amplitud 0,005, }) Obtenga la distribucién de frecuencias acumuladas absolutas y relativas con los intervalos anteriores. ¢) Obtenga 10s limites exactos de dichos intervalos y los puntos medics. 4) Dibuje un poligono de frecuencias relativas. ) Dibuje un poligono de frecuencias relativas acumuladas. “A. 3. Confeosione un diagrama de tallo y hojas con los datos dl ejercicio 2 4. {Qué valores asignariamos a los cinco sujetos incluidos en el intervalo 15-16 dc una distribucién de frecuencias, en caso de asumir cada uno de los supuestos de distribucién intraintervalo que hemos descrito en este capitulo? % 5. Los sujetos de una muestra han respondido a una escala de agresividad. La Aistribucién de frecuencias ha sido la que aparece a continuacién. Dibuje un poligo- To de frecuencias comparativo y coméntelo, a, 16-18 9 9 345 10 12 10-1214 6 1925 3 46 (12 0 74 | Andtisis de datos en psicologis | 2.6.1, Soluciones 1 = 8] am manuesw a) yb) x, 0,135-0,139 0,130-0,134 03125-0,129 0,120-0,124 115-0,119 0,110-0,114 0,105-0,109 0,100-0,104 0,095-0,099 0,090-0,094 Limites exactos 0,1345-0,1395 0,1295-0,1345 0,1245.0,1295 0,1195-0,1245 0,1145-0,1195 0,1095-0,1145 0,1045-0,1095 (0,0995-0,1045 0,0945-0,0995 0,0895-0,0945 Organizacin y representacién de detos | 75 ss 04s 05 QIK LBS Q1S LIV LMS Ws QS LHS als 8s ops gs OS Ons mL OBS L805 OL 0185 Os 3. El diagrama de tallo y hojas quedaria de la siguiente forma: 0,09 0,10 out 012 013 489 (0012335677889 (00112223334557778899 0012234689 024s 4. Enel caso del supuesto de concentracién en ¢l punto medio, los cinco sujetos ‘tendrian la puntuacién correspondiente al punto medio, es decir, 15,5; en el caso del ‘Supuesto de distribucién homogénea, serian los puntos medios de cinco subinterva- los de amplitud igual, es decir, 147, 151, 155, 159 y 163. 76 | Ansisis de dotos en psicologa | 5. Como se trata de dos mucstras de tamafios marcadamente distintos (70 y respectivamente), confeccionamos poligonos a partir de las frecuencias relativas, x aso 030 o10 35 65 9S SASS RS APENDICE INFORMATICO. Todos los paquetes estadisticosincluyen procedimientos para obtener distribu ciones de frecuencias y representaciones grificas, aunque para estas ‘ltimas hay otros programas especificos que permiten obtener representaciones de mayor cali dad y variedad, El programa frequencies del SPSS/PC-+ proporciona distribuciones de frecuen- cias y representaciones graficas. Las distribuciones de frecuencias se confeccionan con unos eriterios ligeramente diferentes a los que nosotros hemos utilizado, Pot ejemplo, los valores erecen de arriba hacia abajo, y en lugar de proporcionar las frecuencias relativas proporciona los porcentajes. También proporciona los porcen- tajes acumulados. Con el subcomando histogram se consigue un histograma, Con el subcomando barchart se consigue un diagrama de barras. Estas dos representacio- nes Son muy parecidas entre si; ambas se realizan en horizontal. Las inicas diferen- Son que mientras que en cl diagrama de barras s6lo se incluyen las barras y las frecuencias en los extremos derechos de éstas, en el histograma se incluye la frecuen= cia de cada valor a la izquierda (columna encabezada con count) y un eje de abscisas en Ia parte inferior de la grifica. Con el subcomando hbar es el programa el que decide entre la realizacién de un histograma o un diagrama de barras, en funcidn del nimero de valores distintos que adopta la variable, Para hacer un diagrama de tallo Y hojas hay que utilizar el programa manova, con la opcién stemleaf, dentro del subcomando plot. Como ejemplos de todo ello, hemos aplicado estos programas a algunas de las Ovgantzecién y epresentacién de dstos | 77 variables del ejemplo numérico que introduciamos en el primer capitulo. En el cuadro 2.7 aparece la salida del programa frequencies aplicado a la variable westrés anles», con el subcomando histogram. En el cuadro 28 se ha utilizado al subcoman- {do barchart para representar la variable «nivel culturaly. En el cuadro 2.9 aparece la salida proporcionada al utilizar el subcomando hbar con las variables «inteligencia» y «estrés después». En el cuadro 2.10 aparece el diagrama de tallo y hojas obtenido con el programa manova, opcién stemleaf, sobre la variable «inteligencian. CUADRO 27 Salida de ordenador Salida proporcionada por el SPS$/PC-+ al aplcar el programa frequencies, subeoman- do histogram, sobre la variable westxés antes el Estrés antes valid cum Value Label Value Frequency Porcent Percent 2.00 25 25 123 10:0 62.5 85.0 1000, a Pa 4 8 Histogram Frequency Valid Cases Missing Cases 7B / Ansisis de datos en pscologle | CUADRO 28 Salida de ordenador Cvgarizacon y epretemscion oe dete / 79 CUADRO 289 (continuacién) Salida proporcionada por el SPSS/PC+ al aplicar el programa frequencies, subeoman- do barchart, sobre la variable «nivel cultural», Ne Nivel cutturat valid cum Value Label Value Frequency Percent Percent Percent sinestudios 1.00 DL ofS: Mees os. tae primer ios 200 $5. 305) 4 ss eas. Secundarios $100 $3! “pees sees) Yazes superiores 4200 7 a5 4780.0 ToTAL 40 “700-0 “400.0 sin estudios primarios setundartos Superiores Valid cases 40 Missing Cases © CUADRO 29 Salida de ordenador ee ea roporcionada por el SPSS/PC+ al aplicar el programa frequencies, subcoman- do hbar, sobre las variables «intligenciay y westrés después, En ella aparecen las dlistribuciones de frecuencias de ambas variables. Para In representacion gratica el programa ha confeccionado un histograma de la variable winteligencia» y un diagrama Ge barras de la variable «estrés después». Para el histograma se han agrupado los valores en intervalos de amplitud 3, de los que se presenta el punto medio (eolumna Midpoin, I InteLigencia valid cum Velue Label Value Frequency Percent Percent Percent 77.00 81:00 35-00 87:00, 89:00, 90:00, 91:00 92!00 98:00 SESSSzees2 3888888888 Se 108200, re100 TOTAL count Midpoint 0.75 valid cases “0 1 2 2 2 1 1 1 1 1 3 2 2 i 1 1 1 i 1 1 1 i i Histogram Frequency Kissing Cases RELSVSAISSLUNSSSSSS 80 / Aniisis de datos on psicologte | CUADRO 29 (continuacién) £2 Estrés después a ge 2.00 rt 5 0 £8 ig 38 Fe #8 8888ess 2 Valid cases 40M ssing Cases CUADRO 2.10 Salida de ordenador Salida proporeionada por el SPSS/PC-+ al aplicar el programa manova, subcomando plot, opcién stemleaf, sobre la variable «inteligencia». Stem-and-Leaf display for variable InteLigencia Tu alts B 012334 566889 102 0123406 10: 667789 141 0124 1139 12101 Medidas de posicién Introduceién. Centiles 0 percentiles. 3.3. Otro cuantiles. 3.3.1. Deciles. 3.3.2. Cuartil 3.3.3. Equi 3.4, Problemas y ejercicios. 3.4.1, Soluciones. 8. lencia entre cuantiles. Apéndice informatico.

También podría gustarte