Está en la página 1de 106
ESTADISTICA DESCRIPTIVA APLICADA, INTRODUCLIONATA ESTADISTOADESCRITVA PARA ELPROFESIONALDELASALID 8. PP FP riviowocin wasn | CONCEPTOS GENERALES DE LA ESTADISTICA La estadistica a ‘ravés de los tienpos fue rigrardo su concepto en forma permenente debide al aporte de las demés ciencias, pasando desde el simple conieo de personas, bienes y riquezas hasta los caloulos de probabililades, el aporte de las malematices, enriquecié las aplicaciones y su campe, logrando incluitas en investigaciones, entre los diferentes cenceptos poremos: mencionar los siguientes: Kendall y Buckland (cilados por G ai V. Glas / Julian C, Stanley, 1980) defiren la estacistica “como un valor recumido, calculads, como base en una muestra cle observaciones que {generalments, aurque no por necesidad, 3° cosidera corti uns estimacién de parémeiro de determinada poblecén; 2s decir, una funcién de valores de muestra. (Gini, 1953 ‘La estadisiica es una técnica especial apta para el estudio cuantitativo de los, 4 fenémenos ie mesa o coleciivo, cuya niediacién requien> una masa’ de observacionas de lros fenémenos nas simples llamado individ. ales © particulares", Murria R. Spiegel, (1991) dice: "La estatlstics estucla los méledos cientificos para recoger, organizar, resumir y aralizar dates, asi como para sacar conclusiones validas y tomar decisiones razonaisles basadas on tal anélisis, Yale y Kendal, 1954°La estadistica es ln ciencia que trata de Ia recoleccion, clesificacion y Presenlacién de los techos sujctos a una apreciacién rumérica como base a la explicacién, descripcién y comparacién de los fenémenas" ). Cualquiera s2a el punto de vista, jo fundamental es la impotancia cientfica que tiene la eestadistica, debido al gran campo de apizacién que posee. Otrcs autores tisnen siefiniciones: e la Estadistica samejantes a las anteriores, y algunos otros no fan semejantes, Para Chacén este se define como " La giancia que tiene por objeto el estucio curintitatvo de los colsctivas; otr2s la definen com la expresién cuantitativa del ento dispuesta en forma adecuiada para el escrutinio y andlisis. La més acepinda, sin embargo, es la de Minguez, que define la Estadistica como “La ciancia que ane por objeto aplicar Iss leyes de la cantad « los rachos socieles para medi 8. intesdad, deduces leyes que ls rigen y hhacer su presices61 provima" GONCEPTO: Divisién de ta Es La Estadistica para su mejor estudio se ha dividido an dos grendes ramas: LAESTADISTICA DESCRIPTIVA Y LA ESTADISTICA INFERENCIAL fest nsiste en la present ie ia de tablas y graficas. Esta comprende cualay actividad relacionada con los datos y esté disefiada para resumir 0 describir los mismos sin nferir rada que vaya mas alla de lo ‘Como consecuencia, la caracteristica mar ‘importante det recionte crecimiento de la estadistica ha sido un cambio en Sa ree n a actin aes gre bcec pecans EJEMPLO DE LA ESTADISTICA APLICADA, ANALISIS DE RESULTADOS Biologia (Revista CIENCIA HOY - Volumen 5- N°26) (APUNTES ,PROF, CRISTINA ‘AHUMADA) La peninsula Valdés se encuentra rodeada por una amplia plataforma continental de menos de 200 m de profundidad, que se extiende vatias centenas de Km. hacia e. este antes de alcanzar aguas profundas. Las colonias de reproduocién de elefantes marinos ten general se ubican cerca de declives ocednices que conducen rapidamente @ aguas profundas. Este no es el caso de la peninsula Valdés, sin embargo, la agrupacion de tlefantes marinos de esa costa es la nica en ol mundo que sv encuentra en crecimiento, So desconace la causa de la disminucidn poblecional de otras agrupaciones importantes, pero = posible que esté igado a lo que sucede durante la permanencia de los animales en el mar. El ‘Comporiamiento de estos animales en el mar es entonces importante desde el punto de vst de conservacién de la especie. Un elefante marino pasa s6lo el 20% de su vida en la tierra, e! 80% restante permanece en el mar. Sofisticados aparatos permilen registrar la duracién y profundidad de los buceos de elefantes marinos, de donde los bidlogos sacan conclusiones de ‘comportamniento del animal en el mar. Cientificos argentinos realizaron una investigacion colocando aparalos registradores de descriptivo que lame més la atencién del lector es el pictograma. Pero se debe torer cuidado de no provocar una impresion exagerada Supongamos que los sueldos promedios de los ernpleados de dos empresas se quieren ‘comparar. Una empresa paga a sus empleados una surna promedio de $1200 y la otra aga $800, Los nmeros estan en una relacién de 2 a ‘. Bastar hacer un diagrama de barras con las alturas que cumplan esa relacién. Pero supongamos que presentamos el siguiente dibujo: $600 $1.200 Las bolsas representan dinero, y eso es vilido. La informacién estd en la altura (igual que en las barras) ‘pero la visudizacién ya no es la misma porque el hecho de que sean bolsas da una idea de vokmen y el ojo aprecia 2 ‘nds que el doble en la bolsa mds grande, De esta manera se logra dar una ‘impresin exagerada de la informacion verdadera. El uso de pictogramas hace mds atractivo el disefo de los gréficos, pero debe tenerse en cuenta lo siguiente’ "= Usar sinboles sencillos Repetir los simbolos para indicar mayor cantidad (no agrandarlos) + Usarlos sobre todo para hacer comparaciones PLAN DE TABULAGION, PROCESAMIENTO DE LOS DATOS. Consiste en determinar el tipo de presentacién de los resullados del estudio y ‘especialmente que relaciones entre variables se debe presentara fin de dar respuestas al problema, los objetivos y la hipdtesis plantesdas. Estos resullados se presentan mediante tablas y gréffcos estedisticos, que realiza la presentacién sistematica y organizada de los hallazgos, permitiendo su interpretacién y analsis, El plan de tabulacién debe seguir una secuencia ligica, presentando ordenadamente la Informacion necesaria, Para ellos debe realizarse previamente el andlsis y seleccién de la variable que debe analizarse individualmente, (tablas simples) y las variables que eben cruzarse, (mediante tablas de doble entradas, asi como identificar las variables Que deben destacarse, siendo acompatiadas por gréficos, sele:cionados segiin tipo y ‘segun adecuacion a resaltar. PROCESO. 1S Y SELECCION DE LAS VARIABLES, (TABLAS y GRAFICOS DEBE RESPONDER AL PROBLEMA, ALOS OBJETIVOS Y LA HIPOTESIS) TIPOS DE TABLAS. ‘Tablas simples: presenta la distibucién de una sola DISTRIBUCION DE SEXO POBLACION, 1 RAMON FUENTE: cétedra de estadistica. Instituto DR Ramén Carrilo. 22 En este caso ol investigador se preguntd, ,. Cudl es la composicién por sexo de la Poblacién bajo estudio? ‘Tabla de doble entrada, DISTRIBUCION DE FUMADORES POR SEXO, DE LA POBLACION ESTUDIADA. SALTA, 2018. 40 | 23,47 102 | 71,83 Total 67] a7as | 75 | s2s2 | 142 | 100 FUENTE: cdtedra de estadistica. institute DR Ramén Carrillo. (Permite presentar el cruce de dos variables, sexo y consumo de tabaco, aqui et investigador se pregunté zsegiin sexo? ,Quiénes fuman?) tabla de sexo y consumo de tabaco. PARTES DE UNA TABLA Una tabla consta de: 5 ELEMENTOS, titulo, matriz o molde, cuerpo, tolales y fuente de datos, ‘* Titulo: debe responder alas preguntas: zqué datos son? zcémo se clasifican? adénde se abtuvieran? gouando? Las tablas son respuestas a preguntas que se hace el investigador y el titulo de a tabla lo dobe indicar: '* Molde o Matti es ol encabazamionto de fils y columnas que ta Componen, deben estar claramente rotuladas, indicando las categorias do anaiisis y si corresponde la unidad de medicién, ‘+ Cuerpo: esta constituido por las casillas que formen las fila y columnas. al cruzarse, + Tolales, © Fuentes de datos: debe indicar donde se obtuvieron los datos. (primarios, secundarios...). 23 Ejemplo: Titulo: esponde a preguntas: que, quien como, donde cuando, TABLA distribucién de grupo segiin edad y sexo, referencias ‘comedor comunitario, B° Lafta, Salta Capital, enero ‘titulo Totales M- En general las tablas se presentan con resultados expresados en frecuencias absolutas, (numero de observaciones) y frecuencias relatives (proporcién o porcentajes del total de ‘observaciones) en algunos casos es conveniente solo a los fines del estudio, presentar, frecuencias acumuladas (sumatoria de las frecuencias absolutas o relalivas @ partir del primer intervalo de la distnbuci6n), En ocasiones se presenta en la tabla, solo la frecuencia relatva, indicando el nimero de observaciones solo en los totales, esta eleccién puede realzarse cuando es alto el numero de observaciones en todos fos casileros, pues el uso de las frecuencias relativas ‘exclusivamente puede sesgar la interpretacion de los resultados. Pero cuando las observaciones son escasas. (n< 50 casos) se pueden presentar solo las frecuencias absolutas). 24 CONSTRUCCION DE TABLAS DE DISTRIBUCION DE FRECUENCIAS. ‘Vamos a ver, como se construye on general, una tabla de distribucién de frecuencias, {que nos presenia de una manera ordenada los datos recogidos en una muestra, ‘Supongamos una muestra formada por*N" individuos que respecio a una determinada variable X presenta ‘m’ modalidades en que se manifiesta de la variable, recordar que ddeben cumplir con los conceptos de exhaustiva y excluyente, modalidades | “ecuenel2® | proporcién | Porcentaie dela variable | APO Py (6) mt nt pi et | m2 n2 _p2 P2 | _m3 na ps P3 iss pe P. ae pe P. mi ni pi Pi Designamos por ni ‘la frecuencia absoluta, de la modalidad ‘mi, y representa el ndmero de datos que pertenecen a la modalidad "mi PProporcién o frecuencia relatva, ‘pi, representa el tanto por uno de cada madalidad con Fespecto al otal "N’, se obliene dividiando la frecuencia ebsoluta de cada modalidad por ae Porcentaje: (Pi), representa el tanto por ciento de cada modalidad con respecto al total N, ‘se obfiene multiplicando la proporcién por 100, Piz _ni_.100 N 25 ‘Vamos a ver como se construye una tabla de distribucién de frecuencia en funcién del ‘ipo de variable Estudiada, Variable cualitativa: Supongamos los siguientes datos obtenidos en la seccién de sginecologia de un hospital de 200 camas, respecto a la variable "x", razén de internacién, ue dividimos en cuatro modalidades, Frecuencia | Proporcién internadas im (py | Poreentae | posparto 60 03 30% preparto 50 0,25 25% preoperatorio 30 0,15 15% post operatorio | 60 0.3, 30% total 200 1 100% ‘Se cumple que: fa suma de todas las frecuencias absolutas es igual al niimero totalde casos Eni (60+50*30+60= 200) La proporcién se obtiene dividiendo la frecuencia absoluta por el numero total de datos. pie ni N via summa de | eo 60_:020) todasias | 0.90+0.25+0.15+0.30 200 proporciones 200 fesigualat De tal forma que: El porcentaje se obtiene multiplicando la proporcién por 100 0.30 x 100 = 30 0.25 x 100 = 25 0.15 x 100 = 15 0.30.x 100 = 30 Porcentaje (%)= _ni_100 N (la suma de los porcentajes de cada modalidad es gual a 100). 26 Variable cuasicuantitativa, (cualitativa ordinal La tabla de distribucién de frecuencia para las variables cuasicuantitativas se rige por los mismos principios que en el caso anterior, ademas de calcular las, frecuenclas, proporcién y porcentajes, podemos calcular las frecuencias acumuladas proporcién acumuladas y porcentaje acumulados. fj; se ha administrado un nuevo medicamento a 622 pacientes con trastornos digestivos, de acuerdo a criterios médicos se ha clasificado la variable mejoria de los pacientes en las siguientes cuatro categorias; maxima, moderada, leve y nula. La primera columna contiene las modalidades de la variable, (cuatro), las columnas 2,3 y ‘4 corresponden a las frecuencias, proporcion y porcentajes, que se obliene como ya se hha expuesto en ejemplo anterior. Las columnas restentes son acumuladas las que se obtienen de la siguiente manera, Las frecuencias acumuladas se empiezan calculando a partir de la categoria inferior, (mejoria nula) cuya frecuencia acumulada es ta frecuencia absoluta de su categoria, es decir 134, la frecuencia acumulada de la segunda categoria (mejoria leve) es la suma de las frecuencias de esia més la de la categoria anterior (134#212" 346)... y asi sucesivamente De modo analogo se obtiene las proporciones y porcentajes acumulados. Observaciones: las cantidades de filas de a tabla de distibucién va a depender de las ‘modalidades que tenga la variable en estudio, asi por ej. sexo presenta dos (masculinolfemenino), estas filas de la primera columna son las manifestaciones de la variable 0 categorias. Las tablas para variables cualiativas nominal y ordinal y las Variables cuantitativas diseretas tienen practicamente el mismo pracediminto, no asi si se trata de una variable cuantitava continua, que se trata a continuacién su elaboracién. 27 Variable cuantitaiva discreta o discontinua, Las tablas de distribucién de frecuencias para variables cuanilativas discretas se construyen de igual forma que para la variable cualtatva ordinal o cuasi cuantitativa, Poniendo en lugar de las modalidades los distinos valores que toma la variable, también fen este caso tiene sentide hablar de frecuencias, proporcién y porcentajes acumulados. EJ; nero de hijos en un estudio realizado sobre 107 familias 5 goa | 467 5 cos | 47 0,005 854 2 ont2 4121 10 003 | 9.35 2 0208 | 20.86 1% ones | 1682 0 oss | 3738 16 ona | 1495 58 ose; | 5234 4 o30_| 13,08 a cose | 65,42 13 osat_| 1215 33 os | _rs7 2 ona | 121 95 oge7 | 26,79 10 923 | 9.35 405 | ose1_| 96.13 z cow | 187 sor__| 1,000 | 100,00 tot | 107 Afni [Ss oy se ee) (Con independencia de cémo se coloquen las modalidades o catecorias dela variable, la -acumulacién comienza con la categoria de menor valor, termina er la categoria de mayor valor). Variables cuantitativas continua: Deciamos anteriorments que un variable cuanitativa continua puede tomar cualquier valor, entre dos valores consecutivos dados, asi la presién sanguinea es una variable cuantitaiva continua, poro debido a la limitacién de nuestro instrumento de medida, aparecen como valores discretos, en el Ejemplo seftalado, la presiin sanguinea presenta luna discontinuided aparente de 1 mm, y decimos que una persora tiene 162 mm 0 163, mm de Hg de tensién sistblica y raramente damos un valor como 152,17 mm de Hg La tabla de distibucién de frecuencias para variables cuanttatives conlinuas se realiza ‘con datos agrupados en intervals. ‘Vamos a desglosar los pasos a seguir para la construccién de la tabla de distibucién de frecuencias, 28 1° paso, ordenar la serie de datos de la muestra, de menor a mayor, esto permitrd incluso poder tener idea de como se comportan los daios, cudntos de olos se repiton, cuales la diferencia entre ellos, etc. 2°, Paso, Detemminar la Ampitud de la distribucién. Es decir, el intervalo dentro de! cual Varian os datos de la muestra, se calcula restando la puntuacion maxima de la minima. “AM = X max. ~ Xin A. = Ampltudde a serie X max, = puntuacin Maxima, Xin. = puntuacton Minima, 8° paso, far el nimero de intervalos que se van a utlizar, el nlimero de intervalo dependerd del tamaio de la muestra, debemos tener en cuenta que si hay pocos intervalos se produce una notable perdida de informacion y si hay muchas intervals la tabla puede resultar excesivamente larga, algunos auteres recomiendan que el ndmero de intervalos no supere el valor de VN, y esta sera la norma que nosotros seguiremos, w 3 otal de observaciones). 4° paso, calcular Ia ampltud de los intervalos que se va a ullizar, esta amplitud se representa por i", y es el resullado de dividirla amplitudde fa distibucion por el nimero de intervalos que se van a ublizar. ‘Ampiitud de fa distribucién N° do intervalos '5* paso, determinar el limite inferior del primer intervalo, es decir la puntuacién mas equefa a partirde la cual empezamos a contar. Empecemos, EJ: 6e han obtenido las siguientes medidas (en Cm), de la tall de nifios de 7° grado, correspondiente a 30 alumnos, “Esc, San Andrés” Construimos fa tabla de distibucién de frecuencias siguiendo los pasos propuestos anteriormente, 29 Datos recogides para la muestra 124 116144133 1204811412109 M0 1230115128 127111125 187138 132 40121 128-130 130131125126 2124122, Datos ordenados ws 1100111112 A 148 tt 120 420 122° 123123124 12k 1251251268128 wr 130131 132,133,137 138139140 42 146148 (Vamos a tener en cuenta, que el procedimiento se realzara con lnites aparentes y no ‘reales para faciiiar su construcci6n). ‘Amplitud de la distbucién, *A’. = X max -X mi 146 - 109 = 37... (145.5 - 109.5 = 38), La puntuacién maxima es de 146, pero suponemas que 146 representa a todos los ‘valores comprendidos entre media unidad a su izquierda y media unidad a su derecha, es decir que 146 representa todos los valores comprendidos en eliintervalo de 145.5 — 148.8. por esta razén X max, = 145.5, lo mismo ocurre con 108, que representa a todos los valores del intervalo 108.5 ~ 109.5, por lo que X min = 109.5. (Limites reales), Numero de intervatos: YN= : ¥30= 5.477 = =5, [N= al ndmero total de observaciones, en este caso son 30, al obtener un nimero real, 62 redondea y se decide hacer 5 intervalos, Amplitud dela distibucién 37 Amplitud de os intervalosi= IN* de intervalos. Esta divisién nomalmente, no nos da un numero entero, pero conviene que la ampitud det intervalo si que lo sea, por lo que resulta de la division se redondes al entero superior ‘en nuestro casoa8: i= 8. Limite interior de! primer intervalo, no hay reglas fas para determinar esta puntuacién. ‘Septin unos autores debe sera puntuacién minima observada, (en nuestro caso 109), siguiendo esta regia, el primer intervalo seria 109-—117. Sogin otros, debe ser miiliplo de la amplitud det intervalo, estas reglas son ‘convencionaies y no hay porque seguirlas, 30 En nuestro caso, la distibucién de frecuencia fijando el limite inferior en 109 podria ser. wm | 7 |0233 | 23333 7 | 0233 | 23,39 ‘mim | 9 | 0,300 | 30,000 | 45 _| 0533 | 53,333 tu | 7 |0233 | 23533 | 2s | ozer | e667 in| 5 | one 2s | 0933 | 95,33 u__| 2 |ooe| eser | a» | 4 100 {otal z= ls] 1 | 100 Ya solo nos queda eslablecer las ftecuencias de cada intervalo, para ello, podemos uilizar un método rudimentario, pero practico, para eviter errores. Consiste en leer cada uno de los valores de la variable y en la tabla se coloca una marca junto al intervalo at que pertenece el valor que ha sido leo. ‘Aciuando asi y después de finalizar el recuento, encontramos junto al intervalo, (109-117), 7 marcas (Ill), que corresponden a la frecuencia de ese intervalo, de igual forma junto al segundo intervalo (118125) encontramos 9 mareas (Ill), y lo mismo Con fos otros intervalos. SSi representamos en un diagrama nuestros intervalos, observamos que estos estén elimitados por dos valores exiremos que se denominan limites aparentes del intervalo y que corresponden a valores realmente observados en nuestro aparto de medida, Limite real inte = mas ae Dame ite [om-t7]_ | [res wos] 7s ia65 Sin embargo, raléndose de una variable cuaniativa continua, observamos interrupciones 0 discontinuidad on le variable, por ello, y para salvar la continuidad, suponemos que cada valor discreto representa a todos los infinitos valores situados media unidad a su izquierda y media unidad a su derecha, de esta forma 118/125 representa a todos los valores comprendidos entre. 117.5 y 125.5 y 114 representa a todos los valores comprendides entre 113.5 y 114.5, de esta forma respetamos la ccontinuidad de la variable y definimos unos nuevos limites a los que se denominamos: limites exacios del intervalo (limites reales), a Cuadro de las diferencias entre limes aparentes y exactos (0 reales) 108,5--117,5_ Por imo, es importante sefalar que la agrupacién de datos en inlervalos supone una Pérdida de informacién, pues al integrarse los datos en intervalos pierden sus valores originales, ahora solo sabemos que hay 7 datos en el intervalo 109—117 estas Puntuaciones quedan representadas desde este momento por el Punto medio det Intervalo, El punto medio det intervalo se calcula: Limite inferior + limite superior Punto medio = 2 Es decir so calcula como la semisuma de los limites del intervalo, obteniendo el mismo ‘esullado ullizando limites aparentes o limites (exactos) reales. Cuactro del cétculo de la marca. 118126 32 Observaciones: el punto medio o marca de clases, es un valor promedio de los limites {el intervalo, este representara al intervalo en la aplicacién de algunas férmulas para los Celculos pertinente. Solamente puede realizarse en datos agrupados en intervalos, de las variables cuantiativas continuas, Segtin la importancia del estudio, hace necesario ono laullizacién de datos exactos 0 ‘aparentes, en nuestro caso es mas practico para lainterpretacion, eélculos,y andlisis de los datos, uilizar los limites aparentes, REPRESENTACIONES GRAFICAS, ‘Vamos a ver a continuacién los distintos tipos de representaciones graficas, Los gréficos, con algunas excepciones se construyen utlizando como referencias ejes de ‘coordenadas 0 coordenadas cartesianas, donde la linea horizontal, eje de las (X), 86 llama “abscisa”y la linea vertical (Y) se lama ‘ordenada’,siendo el punto de interseccién el origen (cero u omega). En los gréticos donde se usan solo valores positivos se emplea solamente el cuadran superior externo (1) eje ¥ Ordenada T° cuadrante superior Eje X inferior Dobe tenerse en cuenta: ‘Ambas escalas deben ser aproximadamente, de igual longitu, no distorsionar el dibujo que se presenta se acepla una proporcién vericalihorizontal de 1:1 a 1,2. las escalas deben comenzar en cero, cuando algunos de sus valores a representar resultan exageradamente elevado, puede quebrase la escala en un punto adecuado ‘mediante una sefial, pero no es una practica aconsejable y debe evitarse en lo posible 33 Las dos escalas deben poseer sola la magnitud necesaria para covtener con razonable holgura los valores que se han de manejar, por ejemplo, si en la escala de las frecuencias tenemos como frecuencia maxima 88 observaciones, segiin la escala elegida padremos llevar hasta 90,95 0 100, en general se acepta como conweniente para la scala que va en la vertical u ordona Tipos de graficos. Diagrama de barras, Se ulliza para represeniar variables cualitativas y cuantiativas disoretas o discontinuas uit para representar varios atributos (variables) 0 diferenciar las calegorias dentro de una variable. ‘Cada atributo (0 categoria) esté representado por una barra o rectingulo, la altura de ‘cada recténgulo indica la frecuencia con que se observé el enémeno estudiado. El ancho de la barra debe ser igual para todas, la separacion entre barras adistancias constante, por regla general, se deja entre barras una separacin igual ala ritad del ancho de la barra Las barras se clasifcan en: Barras simples: un grafico que presenta las categorias de una sola variable, Barras agrupadas; perme la comparacién de dos o mas variables y sus categorias. Barras proporcionales: donde cada barra representa el total de la observacion y su area se divide segtin las proporciones encontradas de cada calegcria dela variable. BARRAS SIMPLES, BARRAS PRCPORCIONALES. i | aoane Gico £4 Pblain sein es Cuba, 290, fae ff? 34 BARRAS AGRUPADAS. Gréfico # 3, Poblacién segtin zones. Cuba, 2002. 0 imunicip 1 municip 2 muniip 3 municip 4 [owhana arurd osem-urbana Diagrama de sectores: Se utiliza principalmente para representar fenémenos que no presenian muchas categoria. Estd constituido por e! drea de un circulo dividido en citerentes sectores, cuyos ngulos son proporcionales a fos porcentajes que se deben cistibuir, si el area total del circulo correspond a 360°, para encontrar al Angulo a graficar debe ruliplicarse el porcentaje ‘encontrado por 360°, Por ejemplo, en relacién a la salisfaccién con el servico de comida del hospital '55% de los encuestades dij SI, y el 45 % dijo NO. Satisfaccion en el Servicio de comida Hosp X 55% Ed: (65 /100 x 360" 198") 35, Pictogramas: Es la representacion de las frecuencias encontradas mediante figuras, antes de graficar, ‘es necesario determinar unidades de medidas, para permitr a interpretacion del grtfico. Hay dos variantes en este tipo de gréfica,repitiendo la unidad de medida 0 agrandando proporcionalmente la imagen. EJEMPLOS measidner tiaras suonnoe suseenowooe gn aerenancns ARERR TA RRRARR RAR FH RRRRRR FORRARRRRRRRAR RRR aR RRR RRR pce ee eC Mec Histograma, ‘Se utiiza para representar variables cuantitatvas continuas, puesto que al estar formado por barras adyacentes da idea de continuidad, Elancho de las barras esta determinado por la amplitud de la clase 0 intervalo. La altura indica la frecuencia de las observaciones (quarda la relacién geométrica: base por altura). Debe dejar el espacio d por lo menos 1 intervalo de clase entre el origen y el 1” intervalo representado cuando la variable representada en la abscisa no comienza en coro. 36 En general se construye a partir de los extremos de los itervalos, pero segtin los fines de la investigacién también pueden ublizarse los limites inferiores de cada intervalo o los ccontros de clase, Histograma de freatencia sbsoluta Poligono de frecuencias: Es una variante del histograma, sive para representar datos cuanttativos continuos & fines comparativos (de dos variables, de dos calegorias, etc), Una variante especifica de este grafico es aquella que utliza en la abscisa la variable tiempo, en este caso, el grafico se llama de series cronoligicas. ‘Se construye formando una figura que resulta de unir con segmentos de recta la intorseccién del punto medio de los inlervalos de clase, (abscisa) y de Ia frecuencia {ordenada). Ha : 37 38 Histograma y Poligono de Frecuencias. PSA post INTRODUCCION: ‘Supongamos que un investigador, ha obtenido un conjurto de datos (la muestra), de una ppoblacién detetminada. Como vimos en el tema anterior, el primer paso es la ordenacién do los datos en tablas de distrbucién de frecuencias y sus representaciones gréficas, Posteriormente es necesario sintetizar 0 analizar este conjunto de datos do alguna manera. Esto lo hacemos mediante dos indices que representan dos aspectos fundamentales de la distribucin de las frecuencias: ‘Su tendencia central y ‘Su dispersion, Estos dos indices nos permiten estudiar y comparar las dstibuciones entre si. Imaginemos que comparamas la presién sanguinea de dos grupos (el grafico muestra 5 (grupos) de personas A y B que representamos esquemiticamente en un mismo grafico adoptando ta forma dela figura 2.1 Estas dos distibuciones de frecuencias se diferencian en cuanto a su posicién, La presion sanguinea del grupo A tiende a agruparse alrecedor del valor X1, mientras que fen el grupo B tienden a agruparse alrededor del valor, X2 mayor que X1, (X2 > X1) Los valores de K 1 y 2 reciben el nombre de Medidas de Tendencia Central ‘Medidas de Tendencia Centra: Indices estadisticos que nos dan el valor de la variable hacia el cual iendien a agruparse los datos. Los mas estudiados son: la media, mediana y moda. Estas (mic), refleja un valor que se ubicaria en el centro de la distribucién por lo {ue la media nunca puede ser < que el valor minimo, 0 > que el valor maximo, (> x <) Figura 2 x Xe 39 ‘Supongamos ahora que los fendmenos A y B adoptan la posicion de la figura 2.2. xt En este caso, los datos de las distribuciones se agrupan alrededor de un mismo valor Central Sin embargo, ambas distribuciones son diferentes, ya que los datos de la istribucidn B estén mas dispersos que los de la distibucion A ‘Se ve, pues, la necesidad de definir unas nuevas caracteristicas que sea un indice del ‘grado con que los datos se agrupan alrededor de la medida de tendencia central, Estas se donominan medidas de dispersion. Medidas de Dispersién: Son indices estadislices que nos permiten conocer el grado de variabilidad o dispersién de los datos de una distibucién. Los mas utlzados son: la varianza, desviacién tipica, amplitud semiintercuaril, amplitud 0 rango y coeficiente de variacion EISUMATORIO: © Antes de comenzar con la explosién sobre las distintas medidas de tendencia central y de dlspersién, es necesario conocer el uso del simbolo del sumatorio, "5" por su gran uso ¥yullidad dentro de la notacién estadistica El simbolo “=” se utiiza para expresar la suma de los dstintos valores de una variable. La Ham + tms t+ Lmia t+ ln Las notaciones encima y debajo del simbolo F, designan fos limites de la suma, asi pues ‘Dai, se lee: sumatoria de Xi, (equis sub ) donde | toma los valores de 1 hasta“ 40. _ NEDIDAS DE TENDENCIA CENTRAL Pueden definise varias medidas de tendencia cental. Las mas comunes y mas utiizadas son; la media, la mediana y la moda, Cada una de ellas tiene sus ventajas y desventajas, dependiendo la aplicacién de una u otra, del tipo de variables que cestudiemos y de la forma 0 dibujo que adquiera a distibucién, -La media, La media aritmética o media de una serie de N datos de observacién Xnt, Xn2, Xn3 Xn se representa por Fy se define como la suma de todos os valores de una variable ividida por el nimero total de datos. Es un promedio, es un dato calculado ‘matematicamente, por lo que es la mas recomendada como medida de tendencia central. El céloulo de la media s6lo se puede aplicar a variables cuanttativas, Por tanto, debemos tener en cuenta la siguiente distincién Datos no agrupados: ‘Cuando los datos no se encuentran agrupados en intervalos, ! céleulo de la media se reduce a la simple aplicacién de la formula, Ejemplo 2.9: Supongamos que hemos medio los niveles de colesterol en cinco personas y los resultados o valores son: 240 , 248, 242, 240 y 260, mg/100 mi La media seria ‘® =2404245+242+1404250 = 244 mg /100m! 5 Datos agrupades en intervals; Si, porel contraro, tenemos los cistntos valores de la variable agrupados en intervalos, el procedimiento para calcula la media varia en algunos aspectos, Para empezar, se uliza el punto medio de cada intervalo para representar todos los valores contenidos dentro del mismo, I punto medio de cada intervalo se multilica por la frecuencia correspondiente ‘a cada intervalo; Se suman estos productos y el resullado se divide por N (admero total do datos). a 5 A.A) + (2.2) + (3. 13} + 04. 4) = Donde: ‘= media letra mayiscula “sigma que indica una suma, j= punto mecio de cada intervalo {f= frecuencia del intervalo. n= ntimero total de datos, Ejemplo 2.10: Se han registrado los siguientes valores del nivel de colesterol (medicos en mg/100 ml) en una muestra de 30 varones de edades comprendidas entre los 40 y 45 afios. 237 210 185 220 208 160 242 165 295 210 205 180 212 190 192 225 155 230 195 200 174 218 190 255 152 222 214 213 170 190 N=30 Tntervales | Reaiento | Freaienda | Punto medio | frecuencia por ites ‘absoluta | omarcade | marcade dase aparentes (oi) dase (X*) (nx) ise-172 | TIT 5 182 10 arzs—a93s | a7ea93 | 71/111) 7 183 1281 aoas—ai4s | 19¢-24 | I/II 8 208 1336 21as—29555 | 215-235 | //IIH/ 6 2s 1380 2355-2565 | 236-256 | /// 3 26 738 30. ois _ Aplicando la formula de la media: SG2AA7 1831419 204946 22614(9.246) = BD15.= 200.5 mg/t0Omi 20 30 42 NOTA: Al determinar la media con los datos agrupads, el valor obtenido es un valor aproximado de la media real, que obtendriamos con los datos sin agrupar. Esto es debido a que utiizamos e! punto medio de cada intervalo como representante de todas las puntuaciones que caen dentro del mismo, produciéndose en consecuencia una Pérdida de informacion. Por lo tanto, no es aconsejabls el calculo de la media con los datos agrupados cuando les datos no sean muy numerosos. (Compruebe el lector como el célculo de la media con los datos agrupades y sin agrupar del ejemplo 2.10 toma valores dlstinto). Si representamos la dstribucién de frecuencias mediante un histograma, la media ‘orresponderia al centro de gravedad o punta de equilibso del histograma, 10 235,5-256,5 2145-235,5 1935-214,5 1725-1935 1515-1725 La media ¥ es el centro de gravedad delhistograma ‘Caractaristicas de la media: ‘+ Lamedia es muy sensible ala variacior de las puntuaciones. Basta con ‘que varie una sola puntuacién, para que varie la media. Ejemplo 2.11: La media de las puntuaciones. 2,9,3,7,4 es + Sivaria una de las puntuaciones, la media también varia, Cambiando et 9 por 8, tenemos que la media de los datos. 2,8,3,7,4es X= 4.8 + Con los datos agrupados en intervalos, la media depende del nimero de intervalos elegidos, de su ampitud y de los limites de los mismos. (Compruebe el lector este punto de los datos agrupado del ejemplo 2.1 en cuatro intervalos en lugar de cinco) + No se puede caicular la media si alguno de sus intorvalos carece de limites, 4a Ejemplo: Edades de aparicin del sarampién en un grupo de 100 indlviduos. Esta tabla carece de limites en el ultimo intervalo, lo cual difculta el célculo de la marca de clase y Por consiguiente no se puede mullipicar por la frecuencia, para obtener la media ‘Alo conocer el limite superior del ditimo intervalo, no podemos ealcular su punto medio ‘o marca de clase, (Xi) y, en consecuencia, no podemos calcular lamedia, No es recomendable calcular la media cuando la distrbucién de frecuenci tiene puntuaciones muy extremas. La media es en funcion de todas y cada una de I unluaciones y se verd muy afectada por esas puntuaciones extremas de la istribucion, ¥ 61 resultado no seré representativo del grupo 0 muesira, se ve sesgada por valores andmalos, diferentes, alos 32,Lamediana, La mediana de una sere de N daios ordenados en orden crecienle o decreciente 36 representa por Md y es la puntuacién que ocupa el valor central de la clstrbucién estadistica, Divide al (olal de datos en dos partes iguales, dejando 50 % hacia la ‘zquierta y otro 50 % hacia fa derecha, como un espejo. ‘Aunque el célculo de la mediana es posibie reaizarioen ol caso de variables ‘cuasicuantitativas, de hecho, siempre suele ser calculada para variables cuantitaivas, Por tanto, hay que tener en cuenta la siguiente distincién: a4 ¥* ‘Datos sin agrupar: ‘Supongamos los datos ordenados de menor a mayor. > Sihay un nimero impar de datos, la medians viene dada por el valor central Ejemplo: la mediana de los dates 18, 3,7, 12,1, 24,29. COrdenamos los datos de menor a mayor: 4,3,7,42,15, 21,29, Tenemos site datos (N= 7).La mediana es el valor central dela serie Md = 12. > Sihay un nimero par de datos, la medana es la media artmética de las dos puntuaciones centrales: [Ejemplo: calcilese la mediana de las puntuaciones: 12, 2,10,8, 5,7 ‘Ordenamos los datos de menor a mayor: 2,5, 9, 10, 12, Los dos valores centrales son el 6 y 9 y su media aritmétca es: 6+9 ‘mediana 5. Porto tanto, la 12 |15 | 21 |29 Xx [Xe |X [Xe | Xs [Xe [Xr ‘mediana es 12, pero la posicion central {que ocupa es X4, son dos cosas distnias. (vélory posicién) Datos agrupados en intervals, En este caso el valor de la mediana se obtione mediante la siguiente frmula: que se expresaria de la siguiente manera: (Me) mediana es igual) limite inferior del intervalo critico, mas,(1n/2) ene sobre dos, (Fi) menos la frecuencia acumulada anterior de! intervalo critco, (f) sobre la frecuencia absoluta del intervalo critica, mulipicado () por la ‘amplitud del intervalo, 45, Donde: Li= mite exacto inferior del intervalo critica. f= nGimero total de datos. Fi(-) = ndimero de datos por debajo del intervalo crtco, fi= frecuencia absoluta del intervalo critic i= amplitud del intervalo crite. Ejemplo: Calculeros la meciana para ls datos del ejempio anterior, TT aertec apes | 6 = 236-256 a 7 total 30 Tenemos los intervaios ordenados de menor a mayor. El primer paso es locaiizar el Intervalo critica, es decir, el intervalo que contiene a la mediana o valor que deja por encima y por debajo de si el 60 %, (la mitad) de los datos. Para ello construimos la ccolummna de frecuencias acurnuladas y localizamos el intervalo que contiene el 50 % de N, (60 % de 30 = 15). Este serd el intervalo critco, de la frecuencia acumulada igual 0 superior a 15. En nuestro caso, el intervalo rico esl 194.214 El siguiente paso es localizar en este intervalo el valor que corresronde ala mediana Para ello aplicamos la formula, 46 Donde: Li= 194 limite exact inferior del interval eric = N=2Q= 15 (N= nimero total de datos) Fi te 12 nimero de datos por debajo (anterior) del intervalo critico. =9 frecuencia absoluta dol interval critica. i= 194-214 = 20 amplitud det interval. Md = 194 + 6.66 = 200.66 (valor calculado) ‘Geométricamente la mediana es el valor del eje de abscisa que divide al histograma y Poligono de frecuencias en dos partes de igual éroa. oh NwevanreeS 23552865 21452355 1035h4s, ‘Md= 200.66 17281935 15151725, 1 Fig. 2.4—La mediana divide al histograma en dos partes de igual érea. ‘Observaciones: la mediana es una medida de tendencia central, que debe usarse en distribuciones muy asiméticas, ya que la media no rosutaria apropiada por el sesgo de valores que inclinarian la balanza, dejéndola sin represertatvidad. a7 En este caso, al remplazar con los datos que pide la formula, quedaria de la siguiente forma: 3* paso "paso 2 paso Resolver por pasos: 1°,2° y 3° Caracteristicas de la mediana > Es menos sensible que la media a la variacin de cada una de las puntuaciones. [Ejemplo 2.16: Calculamas a mediana y la media de las siguientes series de datos: 7 Xe7. Media 2,5,7,9,25 Md=7 x 2,5,7,9,12 Me Mediana 8. ‘Al variar una puntuacién cambia la media, mientras que la mediana puede permanecer invariable, como en el ejemplo propuesto, > Con los datos agrupados en inlorvalos, la mediana depende del ‘numero de intervalos elegidos, de su amplitud y de los limites de los ‘mismos. (Compruebe el lector este punto con ele). anterior), > Puede ser calculada, aunque alguno de sus intervalos carezca de limites, siempre y cuando la medians no se encuentre en ese intervalo, fen cuyo caso tampoco pod ser calculada, 48 Ejernplo: Con los datos del ejemplo vamos a calcularla mediana, 5= 562 afos. > Es mas representativa que la media cusndo Ia distibucién de ‘recuencias tiene puntuaciones muy oxtremas, puesto que la mediana depende de los valores centrales de ladisirbucion y no es alectada por los valores oxiremos, Ejemplo: Edades de aparicién del sarampién en un grupo de 100 individuos, > Md 62 afios. > KR =5,75 alos En este tipo de distibucién donde casi de la mitad de los indviduos se encuentran en el primer intervalo, la mediana es mas representativa que la media como medida de {endencia central Esta definicion nos recuerda a la que ya hemos estudiado de la mediana, que es el valor dea variable que deja por debajo el 50 % de los datos y por encima ol otro 60 %, Por fo tonto. (Ps0= Q2= Md) (P25=02) (P75= 03) 49 Los Cuattiles v Percentiles, ‘No son medidas de tendencia central, sino medidas de posicién que nos informan del ‘orden o de la posicién que ocupa un dato dentro del total de los dstos observados. Por ejemplo, ol percentil 65, simbolizado por P65 os ol valor de la variable que deja por debajo de si al 65 % del total de las observaciones. Y poor encima la diferencia hasta egar al 100 % Por su parte los cuartils son los valores de la variable que deja por debajo desi el 25 %, 50% y 75%, del total de las puntuaciones, hay por lo tanto tres cuartles que se ‘simbolizan Q1, G2, y Q3, respectivamente, > _Elprimer cuartl (1) es el valor de la variable que deja por debajo el 25% de los datos, > El segundo cuertil (Q2) es el valor de la variable que deja por debajo et 50% de los datos, > Eltercer cuartl (Q3) es el valor de la variable que deja por debajo e! "75% de los datos, Los percentiles y cuartles se calculan de modo similar al ya estudado para la medina, realizando en la formula las correcciones correspondientes. Veémoslo sobre un ejemplo. Ejemplo (2.15): Con los mismos dalos del ejemplo 2.15, calculames (11 y 3. 152--172 5 5 173-193 7 2 a + Q2 interval 215-235 6 2 ls—o@ 236-256 3 30 total 30 50 De fa misma forma que haciamos para calcular la medina, el primer paso es localizar el intervalo critico, es decir, el intervalo que contiene el prmer cuertl o valor que deja por dobajo de si el 25 % de los cao. E125 % de 30 es 2530.= 75. 100 Ena columna de frecuencias acumuladas vemos que hesta el intervalo 173 -193 hay 12 datos, por io que en este intervalo se encuentra el valor sorrespondiente al primer cuart, 250-5 100 at=173+ 20 73 +7 = 180 mg/ 100 ml 7 (De igual forma se calcula percentil 75 (23). Solamente reemplazar 25% por 75%, y ‘encontrar el intervalo que lo centenga), La moda de un conjunto de presenta por” Mo" y correspont variable mas se pte dentro de la se 8 El célculo de la moda se puede aplicar tanto a variables cuaitaivas nominal y ordinal ‘como asi también cuantitatvas. (Cuando estamos trabajando con variables cualitaivas nominal y ‘ordinal, la moda corresponde a la modalidad de la veriable que Presenta mayor Fecuencia, Ejemplo: Un estudio realizado sobre un conjunto de 10 varones para determinar un grupo ‘sanguineo ha conducide a la siguiente tabla de distribucién de frecuencias, Grupo sanguineo eee 8 AB La moda coresponde al grupo sanguineo A, 51 ‘Cuando trabajamos con variables cuantitativas hay que hacer la siguiente distincién: Datos no agrupados: La moda corresponde al valor de la variable de mayor frecuencia, Ejemplo: Las edades de los 40 varones del ejemplo eran: moda La moda cortesponde al valor 34: (Md = 34), el valor de la moda es 34, porque tiene una frecuencia de 10, que es mayor que las resiantes. ‘Datos aarunados en infervalos: la moda corresponde al punto medio del intervalo de ‘mayor frecuencia, Ejemplo: La moda de la tabla de distibucién de frecuencias det ejemplo (2.18) corresponde al valor 204, puesto que es el punto medio del intervalo de mayor frecuencia 104-214. Las distribuciones de frecuencias con una sola moda se denominan unimodales, sin embargo, puede darse el caso de distribuciones con dos modas, que se denominan distribuciones bimodales, Una distribucin que contenga més de dos modas se denomina multimodal, En un histograma y poligono de frecuencia, la mada correspond al valor del eje de abscisas al cual corresponde el punto més allo del histograma o poligono de frecuencias. > La moda corresponde al punto mas allo del poligono de frecuencias. Caractoristicas de la moda: > Es muy sencilla de calcular, ya que se determina generaimente por inspeccién y no por eéleulo numérico. > Com os datos agrupados en intervalos, la moda depende del nimero de intervalos elegidos, de su amplitud y de sus limites. > Puede ser calculada, aunque alguno de los intervalos carezca de limites, siempre y cuando la moda no se encuerire en ese interval. 82 Weta “weciara Woda | Camedia es muy sensible | Es menos sensibe que Ta ala variacionde cada | media la variacion de cada ‘una de tas puntuaciones. | una de las puntuaciones. Basiacon que varia sola puntuacién para que ame F.23. 4.7,9= B5, 19-R-7 | Con Tos datos aprupados Contos datos agTUPROT enintervaos, io media Ja. moda depende det depende de! nimerode rnimerodeintervalos intervals elegios, de su legidos, do suampltud ampitud y de ls tmites y de susiimites. ‘delos mismos. Ta medines afcentode Tamoda es lvaior de ‘oravedade a mayor trecuencio deta distribucion. es de igual res. Aistibucion. Wo se puede CaIcaraT— Pubs ser atc songs | Pat CIC USTSCaTRONS uno de os intervalos | alguno de os intervalos | alguno de los inervalos cearece delimtes. carezcade imites,siempre | carezca delimites, ‘que la medianano se siempre y cuando ia ‘encuentreen elintervalo,en_| moda no se encuentre en ‘cuyo casotampocopodra ser | ese intervaio. ccalculada. ‘Wo se debe calcularta | Es més representativa quela | Cs poco representatwva. ‘media cuandola ‘media, cuandola distrbucién | Solo se calcula cuando to distribucion de de frecuencias tiene que se deseaes una frecuencias tiene ‘puntuaciones muy extremes. | medidade tendencia ‘puntuaciones muy centalrapiay extremas, aproximada ‘Téngase en cuenta, que las medidas de tendencia central deben ser usadas de acuerdo al tipo de distribuciones que se presentan, por ejemplo, una serie de datos que tiende @ tuna distibucién normal, fa mas adecuada para calcular, seria la media aritmética, en ‘cambio si existe una asimetria marcada por valores demasiados extremos, se ‘ecomionda la mediana, se podria tener como guia los resultados de la media y la ‘mediana, en una distribucién normal. Los dos célculos estarian aproximadamente cerca, ‘no asi con asimetria negativa o positiva, los resultados estarian més distanciados o separados entre ellos J, distribucidn normal: media 5 afios, mediana 5,5 afios.(ndlese que estén cerca los. valores) Distribucién asimétrica: media § afos.... Mediana 7.6 aos. Las caracteristicas de cada una ayuda en su aplicacién, 53, ‘Normas de aplicacién de ia media, mediana y moda, En general, la utiizacién de uno y otro indice depende de varias cuestiones: * Por un lado, del objelve de nuestra investigacién. Por ejemplo, si ‘estamos interesados en conocer la opinién de les pacientes ingresados fen un determinado Hospital sobre el funcionamiento del mismo, interesa més conocer ta opinion mas generalizada (la moda), que ‘cualquier otro indice de tendencia cen ‘= Por ol lado, depende del tipo de variable estusiada, de tal forma que ‘si trabajamos con variables cuasicuantitativas (ordinal), no podemos aplicar la media, pero sila mediana y la moda. * Por titimo, la utlizacién de un indice u otro depende de cémo estén istibuidos los datos. Cuando trabajamos con variables cuantiativas, a madia es ol indice mas adecuado debido a que os funcién de todas las puntuaciones; Sin embargo, hay situaciones en que es preferble utiizar la mediana o incluso la moda como indice deseriptvo. Estas situaciones se dan cuando existen puntuaciones muy extremas a un solo lado de la distibucién que afectan a la media. En estos casos, es preferible calcular la mediana, puesto que se basa en las puntuaciones Ccontrales de la distibucién y no se ve afectada por las puntuaciones extremas, Veamos esto en el siguiente ejemplo: EL REY QUE DE ESTADISTA ASCENDIOA ESTADISTICO(), Grose una vez en el pais de Morbilandia.. El rey, que era un gran estodista, estaba desesperade. Su principe heredero, aquel que estaba destinado a cefir el dla de ‘mahana las pesadas responsabiidedes de la corone, padecte precisamente en la base de su auguste erdneo un tumor maligno que, a decir de los mécices, agoreres y otras _gentes, se extendia de manera irremediable. Un mes de vide era el breve tiempo que concedia al enfermo el mejor especialista del pals, el Curandero Mayor. El desespero del rey no carecia, pues, de fundamento, “Majestad -solia decir el Curendero Mayor del reino-, no os desesperéis, que la Providencia es sabia." Pero a pesar de que no desconfieba el Monarca de la sabiduria de le providencie, pensé que acoso serla mejor consuitar varias sabiderias que una sola, ¥ ast lo hizo. Mando llamar a un joven y enterads médico, a uno de los que ‘monejan gran centided de informciones estadisticas recién incorporadas @ sus

También podría gustarte