Introducci N A Los M Todos Estad Sticos

Introducci6n a los métodos estadisticos. Estadistica descriptiva. J. Liorca, T. Dierssen Sotos, I. Gomez Acebo OBJETIVOS DE APRENDIZAJE © Clasificar una variable segun su escala de medida en categoricas (dicot6micas u ordinales) 0 en cuantitativas (discretas 0 cuantitativas). * Caloular las medidas de tendencia central y dispersi6n de una variable cuantitativa. « Identificar el gréfico més adecuado a la ve- table que se va a representar. Introduccion En bioestadistica se llama variable a cualquier ca- racteristica que se mide en un individuo o en una poblacin: la frecuencia cardiaca es diferente de unos individuos a otros (variacién interindividuos), pero también cambia cuando se mide varias veces en el mismo individuo (variacion intraindividuo). Una de las funciones més clementales de la estadistica es ‘medir esa variacién; para ello, se deben utilizar méto- dos gréficos, medidas de tendencia central y medidas de dispersién. Un paso previo es identificar de qué tipo de variable se tata. La clasficacién més sencilla divide las variables en dos grupos: cuanttativas (en las que tiene sentido preguntar cuénto) y cualitativas (en las que tiene sentido preguntar de queé tipo). Esta distincién es importante porque condiciona la forma cen que los datos se analizan y se presentan. Variables cuantitativas: colesterol total Las variables cuantitativas pueden ser continuas, ‘cuando pueden tomar cualquier valor en cierto rango {p.¢jn el nivel de colesterol total en sangre), y discretas, Probabilidad ‘cuando slo pueden tomar una serie de valores pre- leterminados (p. ej. el niimero de embarazos de una mujero el nimero de casos de gripe en una poblacién). ‘Al describir una variable cuantitativa ¢s necesario presentar siempre dos tipos de medidas: una medida de tendencia central (media o mediana) y una medida de dispersién (desviacisn estindar, rango, rango intercuartlic). La media se calcula sumando todos los datos y dividiendo entre el nimero de datos. Por ejemplo, los 15 datos de la tabla 6-1 suman 3.1195 por lo tanto, su media es 3.119115 = 207.9. La medida de disper- sién que suele acompafiar a la media es la desviacidn estindar (0 desviaci6n tipica) y se calcula siguiendo {os siguientes pasos: 1. Para cada dato, se calcula la diferencia con la media. 2, El resultado se eleva al cuadrado. 3, Se suman los cuadrados obtenidos para cocos los datos y se divide entre el nimeto de datos. El resultado obtenido se conoce como variancia. 4, Finalmente, se obtiene la raiz cuadrada (nota: si en lugar de trabajar con una poblacién se trabaja con una muestra, en el paso 3 no se divide entre el ntimero de datos sino entre el ntimero de daros menos 1) (Tabla 6-2). En los datos de la tabla 6-1, Ja desviaci6n estindar es 26,9. ci ac 20 | 208 [ 213 223 202 (27 aie 204 202 213 Tee |26 | Secei6n i. Epiemiclogi,estacstica y demogratiasanitaia Rte ner aca cee ul? Vvarencia ot Recut a Saar | esvacon estinaor of | [te ara obtener la mediana, se ordenan los datos de menor a mayor y se obtiene el valor central. En el cjemplo de la tabla 6-1 hay 15 valores, por lo que la imediana seri el que ocupe el puesto octavo (mediana = 205); si el niimero de valores hubiera sido 16 (un niimero par), entonces la mediana se caleularia su- ‘mando los que ocupen los pucstos octavo y noveno y dividiendo entre 2. La medida de dispersién que suele urilizarse junco 2 la mediana es el rango inter- cuartilico, Se obtiene a partir de los datos ordenados de menor a mayor y extrayendo el valor que deja por debajo el 25% de los datos (primer cuartil) y el que deja por debajo el 75% de los datos (tercer cuartil). En el ejemplo de la tabla 6-1, el primer cuartil corr ponde al valor 197 y el cercero al 218. Es menos iil usilizar el rango, que es la diferencia entre la observa- cién mayor y la menor. Cuando la distribucidn de datos es simetrica (es de- cis, no predominan los valores extremos en uno de los lados de la distribucién), es més frecuente presentar la media y la desviacién estindar. Si la distribucién 5 asimétriea, resulea més del presentar la mediana y el rango intercuatilico porque, en esta situacién, la media y la desviacién estindar son muy sensibles 4 unos pocos datos alejados. Por ejemplo, si en lugar del dato 233 se hubiera tenido el dato 300, la media y la desviacién estindar cambiarian de forma importante (212,4 y 26,9, respectivamente), mientras que la mediana y el rango intercuartlico no tendrian nin- giin cambio (205 y 197-218, respectivamente). La figura 6-1 muestra la distribuci6n de la concen- tracién de colesterol en una poblacién de 500 individuos, tipo de representacién que se conoce como histograma, Las barras que lo forman se presentan juntas, y el ndimero de individuos incluidos en cada categoria es proporcional a la altura la anchura de la barra. En la figura 6-2 aparece otra forma de representar los dates de una variable cuantitativa: un diagrama de caja. Es frecuente que una variable cuantitativa conti- rua se presente de forma discreta. Por ejemplo, en la tabla 6-3 aparecen los mismos datos de las figuras 6-1 y 6-2 pero divididos en sdlo cinco categorias; esta forma de actuar pierde parte de la informacién (no se sabe el valor concreto del colesterol coral de cada individuo), pero permite utilizar un formato mas ma- rejable, Este tipo de variables (cuantiativasdiscretas) suele representarse como en la figura 6-3, median- te un diagrama de barras; en cambio, ¢s incorrecto 104 orcatae de plentas Al | ual Cotes! taat 20 ae ee ee ee eee eT | ‘Haura 6-1. Histograma de la distribucion de coles | | iCapitulo 6. introduccién a los métodos estadisticos. Estadistica descriptive, Probablidad Pa 260. Coles tt 3 Figura 62. Diagrama de caja (es mis descriptivo el nombre inglés: box and whiskers: caja y bigotes) obtenido con los mismos datos de la figura 1. La linea dentro dela caja Tepresenta la mediana: Ia caja representa el ¥ango intercuartico; el limite de los bigotes representa la media ~2 desviaciones estindar ya me~ dia +2 desviaciones esténdar; los puntos por fuera de Jos bigotes son los valores extrernos de l distribucion 250 350 | 150 200200 oletara ttat Figura 63. Diagrama de barras con los datos de a tabla 6-2, Se mantiene la idea de orden: cuanto mas ala derecha, mayor es el nivel de colesterol. utilizar un diagrama de sectores (wtarta») como en la figura 6-4, Obsérvese que en la figura 6-3 se man tiene una idea del orden (las barras situadas més a la derecha indican valores de colesterol més elevados) ‘mientras que esta idea ha desaparecido totalmente en la figura 6-4 Variables categéricas: el color de los ojos ‘Una persona puede tener los ojos de color negro, azul, verde 0 marrén, Este tipo de variables se conoce ‘como categoticas y su caractetistica principal es que no se puede operat con ellas(p. esi se conoce que las sujetos de la tabla 6-2 tienen ojos de color negro [BO personas), azul (50 personas), verde [15] y ma- rrén [405], no es posible calcular un «color medio» aplicando la formula de la media). En estos casos sélo Tabla 63. Los c ee puis! Porcentale 120449 3 06 150479 77 15.4 180209 269 69.8 piozse— | io 28.0 2a026e | a 22 se pueden presentar los datos como porcentajes. Otros ejemplos de variables categéricas son el grupo sangui- rico 0 la nacionalidad. Hay dos tipos de variables categoricas que requieren atencién por separado: las ordinales y las dicotémi- cas. Como ejemplo de variable ordinal, la New York ‘Heart Asociation dlasfica a los pacientes con insufi- ciencia cardiaca en cuatro categoria, lo que permite establecer un orden de gravedad (los pacientes en clase IV estin més graves que los pacientes en clase 1), pero no permite operar (no se puede decir que la clase TV seael doble de gravedad que la clase Il, y no es co- rrecto calcular una gravedad media). Una variable di- ‘cotdmica es la que s6lo puede tomar dos valores; por ejemplo, el sexo (var6n/mujer), la enfermedad (en- fermo/sano), 0 la muerte (vivo/muerto). Es frecuente aque una variable cuantitativa se convierta en dicoté- mica; por ejemplo, si se define la hipercolesterolemia como «tener al menos 210 mg/dL. de colesterol to- tabs, entonces los sujetos de la tabla 6-2 quedarian clasificados en una variable con dos categorias: tienen hipercolesterolemia el 30,2%, no la tienen el 68,8%. Las variables categéricas pueden representarse en iagramas de barras (como en la Fig. 6-3) 0 en diagra- ‘mas de sectores (Fig, 6-4). Los diagramas de sectores, a pesar de ser muy utilizados, tienen una densidad de datos muy baja y suelen ser menos claros que una tabla sencilla, incluso hay autores que recomiendan no utilizar nunca diagramas de sectores

Introducci N A Los M Todos Estad Sticos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Introducci N A Los M Todos Estad Sticos

Cargado por

Copyright:

Formatos disponibles

También podría gustarte