Está en la página 1de 5
Introducci6n a los métodos estadisticos. Estadistica descriptiva. J. Liorca, T. Dierssen Sotos, I. Gomez Acebo OBJETIVOS DE APRENDIZAJE © Clasificar una variable segun su escala de medida en categoricas (dicot6micas u ordi- nales) 0 en cuantitativas (discretas 0 cuan- titativas). * Caloular las medidas de tendencia central y dispersi6n de una variable cuantitativa. « Identificar el gréfico més adecuado a la ve- table que se va a representar. Introduccion En bioestadistica se llama variable a cualquier ca- racteristica que se mide en un individuo o en una poblacin: la frecuencia cardiaca es diferente de unos individuos a otros (variacién interindividuos), pero también cambia cuando se mide varias veces en el mismo individuo (variacion intraindividuo). Una de las funciones més clementales de la estadistica es ‘medir esa variacién; para ello, se deben utilizar méto- dos gréficos, medidas de tendencia central y medidas de dispersién. Un paso previo es identificar de qué tipo de variable se tata. La clasficacién més sencilla divide las variables en dos grupos: cuanttativas (en las que tiene sentido preguntar cuénto) y cualitativas (en las que tiene sentido preguntar de queé tipo). Esta distincién es importante porque condiciona la forma cen que los datos se analizan y se presentan. Variables cuantitativas: colesterol total Las variables cuantitativas pueden ser continuas, ‘cuando pueden tomar cualquier valor en cierto rango {p.¢jn el nivel de colesterol total en sangre), y discretas, Probabilidad ‘cuando slo pueden tomar una serie de valores pre- leterminados (p. ej. el niimero de embarazos de una mujero el nimero de casos de gripe en una poblacién). ‘Al describir una variable cuantitativa ¢s necesario presentar siempre dos tipos de medidas: una medida de tendencia central (media o mediana) y una medi- da de dispersién (desviacisn estindar, rango, rango intercuartlic). La media se calcula sumando todos los datos y di- vidiendo entre el nimero de datos. Por ejemplo, los 15 datos de la tabla 6-1 suman 3.1195 por lo tanto, su media es 3.119115 = 207.9. La medida de disper- sién que suele acompafiar a la media es la desviacidn estindar (0 desviaci6n tipica) y se calcula siguiendo {os siguientes pasos: 1. Para cada dato, se calcula la diferencia con la me- dia. 2, El resultado se eleva al cuadrado. 3, Se suman los cuadrados obtenidos para cocos los datos y se divide entre el nimeto de datos. El re- sultado obtenido se conoce como variancia. 4, Finalmente, se obtiene la raiz cuadrada (nota: si en lugar de trabajar con una poblacién se trabaja con una muestra, en el paso 3 no se divide entre el ntimero de datos sino entre el ntimero de daros menos 1) (Tabla 6-2). En los datos de la tabla 6-1, Ja desviaci6n estindar es 26,9. ci ac 20 | 208 [ 213 223 202 (27 aie 204 202 213 Tee | 26 | Secei6n i. Epiemiclogi,estacstica y demogratiasanitaia Rte ner aca cee ul? Vvarencia ot Recut a Saar | esvacon estinaor of | [te ara obtener la mediana, se ordenan los datos de menor a mayor y se obtiene el valor central. En el cjemplo de la tabla 6-1 hay 15 valores, por lo que la imediana seri el que ocupe el puesto octavo (mediana = 205); si el niimero de valores hubiera sido 16 (un niimero par), entonces la mediana se caleularia su- ‘mando los que ocupen los pucstos octavo y noveno y dividiendo entre 2. La medida de dispersién que suele urilizarse junco 2 la mediana es el rango inter- cuartilico, Se obtiene a partir de los datos ordenados de menor a mayor y extrayendo el valor que deja por debajo el 25% de los datos (primer cuartil) y el que deja por debajo el 75% de los datos (tercer cuartil). En el ejemplo de la tabla 6-1, el primer cuartil corr ponde al valor 197 y el cercero al 218. Es menos iil usilizar el rango, que es la diferencia entre la observa- cién mayor y la menor. Cuando la distribucidn de datos es simetrica (es de- cis, no predominan los valores extremos en uno de los lados de la distribucién), es més frecuente presentar la media y la desviacién estindar. Si la distribucién 5 asimétriea, resulea més del presentar la mediana y el rango intercuatilico porque, en esta situacién, la media y la desviacién estindar son muy sensibles 4 unos pocos datos alejados. Por ejemplo, si en lugar del dato 233 se hubiera tenido el dato 300, la media y la desviacién estindar cambiarian de forma impor- tante (212,4 y 26,9, respectivamente), mientras que la mediana y el rango intercuartlico no tendrian nin- giin cambio (205 y 197-218, respectivamente). La figura 6-1 muestra la distribuci6n de la concen- tracién de colesterol en una poblacién de 500 indi- viduos, tipo de representacién que se conoce como histograma, Las barras que lo forman se presentan juntas, y el ndimero de individuos incluidos en cada categoria es proporcional a la altura la anchura de la barra. En la figura 6-2 aparece otra forma de re- presentar los dates de una variable cuantitativa: un diagrama de caja. Es frecuente que una variable cuantitativa conti- rua se presente de forma discreta. Por ejemplo, en la tabla 6-3 aparecen los mismos datos de las figuras 6-1 y 6-2 pero divididos en sdlo cinco categorias; esta forma de actuar pierde parte de la informacién (no se sabe el valor concreto del colesterol coral de cada individuo), pero permite utilizar un formato mas ma- rejable, Este tipo de variables (cuantiativasdiscretas) suele representarse como en la figura 6-3, median- te un diagrama de barras; en cambio, ¢s incorrecto 104 orcatae de plentas Al | ual Cotes! taat 20 ae ee ee ee eee eT | ‘Haura 6-1. Histograma de la distribucion de coles | | i Capitulo 6. introduccién a los métodos estadisticos. Estadistica descriptive, Probablidad Pa 260. Coles tt 3 Figura 62. Diagrama de caja (es mis descriptivo el nombre inglés: box and whiskers: caja y bigotes) ob- tenido con los mismos datos de la figura 1. La linea dentro dela caja Tepresenta la mediana: Ia caja repre- senta el ¥ango intercuartico; el limite de los bigotes representa la media ~2 desviaciones estindar ya me~ dia +2 desviaciones esténdar; los puntos por fuera de Jos bigotes son los valores extrernos de l distribucion 250 350 | 150 200200 oletara ttat Figura 63. Diagrama de barras con los datos de a tabla 6-2, Se mantiene la idea de orden: cuanto mas ala derecha, mayor es el nivel de colesterol. utilizar un diagrama de sectores (wtarta») como en la figura 6-4, Obsérvese que en la figura 6-3 se man tiene una idea del orden (las barras situadas més a la derecha indican valores de colesterol més elevados) ‘mientras que esta idea ha desaparecido totalmente en la figura 6-4 Variables categéricas: el color de los ojos ‘Una persona puede tener los ojos de color negro, azul, verde 0 marrén, Este tipo de variables se conoce ‘como categoticas y su caractetistica principal es que no se puede operat con ellas(p. esi se conoce que las sujetos de la tabla 6-2 tienen ojos de color negro [BO personas), azul (50 personas), verde [15] y ma- rrén [405], no es posible calcular un «color medio» aplicando la formula de la media). En estos casos sélo Tabla 63. Los c ee puis! Porcentale 120449 3 06 150479 77 15.4 180209 269 69.8 piozse— | io 28.0 2a026e | a 22 se pueden presentar los datos como porcentajes. Otros ejemplos de variables categéricas son el grupo sangui- rico 0 la nacionalidad. Hay dos tipos de variables categoricas que requieren atencién por separado: las ordinales y las dicotémi- cas. Como ejemplo de variable ordinal, la New York ‘Heart Asociation dlasfica a los pacientes con insufi- ciencia cardiaca en cuatro categoria, lo que permite establecer un orden de gravedad (los pacientes en cla- se IV estin més graves que los pacientes en clase 1), pero no permite operar (no se puede decir que la clase TV seael doble de gravedad que la clase Il, y no es co- rrecto calcular una gravedad media). Una variable di- ‘cotdmica es la que s6lo puede tomar dos valores; por ejemplo, el sexo (var6n/mujer), la enfermedad (en- fermo/sano), 0 la muerte (vivo/muerto). Es frecuente aque una variable cuantitativa se convierta en dicoté- mica; por ejemplo, si se define la hipercolesterolemia como «tener al menos 210 mg/dL. de colesterol to- tabs, entonces los sujetos de la tabla 6-2 quedarian clasificados en una variable con dos categorias: tienen hipercolesterolemia el 30,2%, no la tienen el 68,8%. Las variables categéricas pueden representarse en iagramas de barras (como en la Fig. 6-3) 0 en diagra- ‘mas de sectores (Fig, 6-4). Los diagramas de sectores, a pesar de ser muy utilizados, tienen una densidad de datos muy baja y suelen ser menos claros que una tabla sencilla, incluso hay autores que recomiendan no utilizar nunca diagramas de sectores

También podría gustarte