0% encontró este documento útil (0 votos)
87 vistas8 páginas

Conceptos Basicos de Bioestadistica

El documento aborda conceptos básicos de bioestadística, dividiéndolos en bioestadística descriptiva y analítica. Se explican medidas de tendencia central, dispersión y la importancia de la distribución normal en el análisis de datos. Además, se discuten intervalos de confianza y contrastes de hipótesis como herramientas para inferir sobre poblaciones a partir de muestras.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
87 vistas8 páginas

Conceptos Basicos de Bioestadistica

El documento aborda conceptos básicos de bioestadística, dividiéndolos en bioestadística descriptiva y analítica. Se explican medidas de tendencia central, dispersión y la importancia de la distribución normal en el análisis de datos. Además, se discuten intervalos de confianza y contrastes de hipótesis como herramientas para inferir sobre poblaciones a partir de muestras.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF o lee en línea desde Scribd
Conceptss es saled peb +hves. Un Sey pare reven a ealod tshates as e aences l= MicuelAnael Mortar Gor2tea Ca Conceptos basicos de bioestadistica Estefania Toledo Atucha, Jorge M.* Niiiiex-Cérdoba, Miguel Angel Martinez-Gonzalez INTRODUCCION Se puede definir la estadistica’ como: Resulta, por tanto, fundamental adquirir unas nociones basicas de estadistica para poder analizar y comprender los problemas de Salud Pablica. Dentro de la bioestadistica, se distinguen dos grandes apartados: © Bioestadistica descriptiva: se ocupa de resumir la infor- macién bien mediante indices (atimeros que resumen de manera sencilla la informacién contenida en los datos), bien mediante representaciones gréficas. * Bioestadistica analitica o inferencial: se ocupa de estu- diar la relacin entre distintas variables para valorar si puede existir una asociaci6n entre ellas. ESTADISTICA DESCRIPTIVA Tipos de variables Enle figura 3-1 se presentan los principales tipos de varia- bles’, Para trabajar con variables cualitativas se usan pro- porciones (p}, mientras que para trabajar con variables cuantitativas se usan habitualmente sus medias (=). Medidas de tendencia central Estiman endl es él valor mas tipico o representativo de una muestra’. La media aritmética es cl promedio de todos los valores y es la medida de tendencia central mas usada. Por ejemplo, fa media aritmética de los valores 1, 2 y 3 es 2: te) 14243 _ ote e El inconveniente de la media aritmética es que, en muestras pequeiias, se deja influir mucho por valores extremos, por lo que puede no ser representativa de la mayoria de los datos de la muestra. Por eso se dice que es poco robusta’. Si el tercer valor en vez de ser 3 fuese 24, Je media aritmética subiria a 9. En cambio, la mediana 10 se déja influirpor extremos, ya que es aquel valor que deja la mitad de las observaciones por debajo y la mitad por encima (si los datos son pares, seria la media de los dos valores centrales), Seria 2 en ambos casos. Sirve también para variables ordinales. Su inconveniente es que no usa todos los datos. ‘La media ponderada otorga.a unas observaciones mas importancia o peso (w) que a otras. Por ejemplo, si la tercera observacién (3) tiene un peso del 80% y las otras dos (1 y 2) sélo del 10%: Blin) G1 x1401x2408%3_ > Eli) O10 +08 La moda es aquel vslor que se repite con mayor fre- cuencia, ‘Media ponderada = =" (© 2013, Elsevict Espa, SL Reservas rods los derechos 6 Medidas de posicién Indican el lugaro el orden que ocupe un dato dentro de la dis- tribucién a la que pertenece. Los cuantilesindican qué puesto tiene un determinado valor de una variable en el conjunto ordenado de los datos’. Los percentiles dividen la muestra en partes porcentuales acurnulativamente. Por ejemplo, el ppercentil 30 ese valor que deja el 30% de las abservaciones de la muestra por debajo, Mediana=percentil SO. Medidas de dispersion Estiman la variabilidad de los datos. La varianza se parece al promedio de las desviaciones cuadraticas de cada valor respecto a la media (elevar al cuadrado la diferencia entre media y cada valor), pero su denominador es n—1 en vez deser n, Este denominador(n-~ 1) corresponde a los grados de libertad de la varianca. Al numerador de la varianza, se lo conoce como stima de cuadrados'. Por ejemplo, la varianza de 3 valores, 1, 2 y 3, scx: E0-8F Vorianza muestra (3) = ‘onveniente de la varianza es que tiene unidades al cuadrado de los datos originales. La desviacién esténdar o desviacién tipica elimina las unidades al cuadzado, pues ‘CONCEPTOS DE SALUD PUBLICA Y ESTRATEGIAS PREVENTIVAS FIGURA 3-1. Tipos de variables consiste en extraer la rafz cuadrada de la varianza. La desviacintipica (6) tiene, por tanto, las mismas unidades que la media y es el indice de dispersién més utilizado* TH) Wet El coeficiente de variacién compara la dispersi6n de variables con distintas unidades (es adimensional). Bs el cociente entre la desviacién tipica y la media aritméti tice? Coeficiente de varacin = EaCN tea _ § 44 eda Se suele expresar en porcentaje (en el ejemplo, el coc- ficiente de variacién indicasia que la desvizeiéa tipica es el 50% de la media). Podria ser >100%. Un concepto trascendental en estadistica es el de error «estdndar (EB) de un estimador (no confundir con la des- viaci6n estindar). Se habla de pardmetros para refecirse a lo que realmente existe en toda la poblacién. En cambio, los estimadores (muestrales) son cantidades andlogas que se calculan s6lo en un subgrupo (muestra) en vez de calcalarlas en toda la poblacién. El EE mide el grado de dispetsiGn de los estimadores muestrales de todas las po- sibles muestras de igual tamafio que se pudiesen obtener aleatoriamente de una poblacién. A modo de ejemplo, se presentan los EE de una media y de una proporcigin: ‘BVELSEVIER. Forocopae sin auorlzaciga es un deft, Pore una media EE, = Fy Para una propor: &, =f OAL Cada estimador tiene su propio error estindar con su correspondiente formula. Rango intercuariflico: es la diferencia entre el percen- til 75 y el percentil 25. Representaciones grdficas En la tabla 3-1 se presentan las caracteristicas de algunas de las representaciones gréficas ms empleadas junto con sus caracteristicas mas importantes. DISTRIBUCIONES DE PROBABI DISTRIBUCION NORMAL Concepto de distribucién de probabilidad La distribucién de frecuencias 0 distribucién empirica de una variable viene dada por le frecuencia con que se observan realmente en la muestra estudiada cada uno de los posibles valores que puede tomar esa variable. En cambio, la distribucidn de probabilidad se cefiere al con- junto de todos los valores que tedricamrente puede tomar la variable, junto con sus correspondientes probabilidades calculadas siguiendo leyes matemiticas universales, como Ja distribucién normal u otras. Distribucién normal La distribucién normal es una distribuci6n para variables ccuantitativas continvas. Se conace también como curva‘o campana de Gauss. La distibucién normal tebrica nunca se da exactamente en la realidad, s6lo hay aproximaciones sella, pero se puede expresar como ecuacién materéti- ca. Al ser un modelo 0 ecuacién, fa distribucién se hace continua y, teéricamente, hay infinitos valores posibles. Se caracteriza por: ‘+ Tener forma de campana, Ser simétrica (no tiene una cola més larga que otra). Ser mesoctictica (ni aplastada ni apuntada), Coincidir en ella la media, la mediana y la moda. La distancia entre su centro y el punto de inflexién es una desviacién esténdar (DE). Una aplicacién de la distribucién normal es que cual- quier punto se puede expresar como la distancia entre dicho punto y Ia media, expresada en unidades de des- viaciones estindar™ A esta distancia se la conoce como yalor 2, Por ejemplo, sise nos pregunta qué porcentaje de stujetos estard por encima de los 70 afios en una poblacién cuya edad sigue una normal con media=60 afios y se calcularé: CAPITULO 3 Conceptos basicos de bioestadistica "7 Elvalor obtenido (7=2) indica que los 70 afios correspon- den a 2 desviaciones estndar por encima de la media, EL valor z es, por tanto, el nimero de desviaciones estandar que un determinado dato se aleja de la media, Para cada valor z, las tablas de la distribucién normal indican el pporcentaje de valores que quedan mas alejados de la media (écea de la cola). Para 2=2, la cola dea derecha contendré aproximadamente el 2,5% de los valores. Para z= ~2, la cola de la inquierda contendra el 2,5% de los valores. En el intervalo media=?2s estarén, por tanto, el 95% central de los valores. La tabla 3-2 contiene diversos valores z de las tablas de la normal", La distribucién normal es la distribucién que siguen muchos indices 0 estimadares estadisticos calculados en una muestra. Esta propiedad es [a més importante. Significa que si se toman muestras de una poblacién que sigue cualquier distribuci6n, aunque no siga una normal, los estimadores que sé calculen en las sucesivas muestras tenderdn a la distribucién normal (teorema central del Himite)*’. Aunque la poblacién de Ia que procedan las, ‘muestras no siga una distribucién normal, los estimadores calculados en las sucesivas muestras sf la siguen, siempre. ‘que las muestras tengan suficiente tamatio {n> 30). INTERVALOS DE CONFIANZA. Y CONTRASTES DE HIPOTESIS* Error sistematico y error aleatorio Los errores sistematicos 0 seégos esta producidos por un defecto del instrumento.de medida o por una tendencia, cecr6nea de observador y, por tanto, tienden a registrarse en. elmismo sentido. Los errores aleatorios o accidentales son los debidos a pequefias causas imponderables e imposi- bles de controlar”, Las principales diferencias entre los cerrores sistemsticos y los errores aleatorios se presentan, enle tabla 3-3, Intervalos de confianza Casi siempre resulta impracticable recoger la informacién de las variables de interés de toda la poblaci6n. Por ello, se suele trabajar con muestras extraidas de una poblacién en las que se deverminan los estimadores muestrales (media, proporcién, etc.). A partic de elas se necesita indagar un rango de valores donde sea crefble que se encuentre el verdadero parémetro poblacional (verdadera media de la poblacién total, verdadera proporcién, etc.) que no suele ser factible determinar (pues para hacerlo se hubiesen sequetido los datos de toda Ia poblacién). Al rango u hor- cuilla de valores crefbles para ese pardmetco poblacional {que ahors es inaccesible se lo denomina interualo de con- fianza**. Se calcule el intervalo usando sélo los datos de Ja muestra, Pero en ese intervalo craomos 0 confiamos que cestard incluido el verdadero valor poblacional (pardme- tro). Lo importante es saber que si se repitiese el mucstreo CONCEPTOS DE SALUD PUBLICA Y ESTRATEGIAS PREVENTIVAS Caracteristicas ‘Cuaitativas nominales La fecuencia es proporconal al res. tevalo puede dar tuto a cada ‘ectangulo La frecuencia es proporcional al rea de las bares ah ‘Se suman ls frecuencia de los itervalos precedentes, Representa cuéntos suetos de la muestra Dtesentan por lo menes un determinado valor dela variable, Representa a relacién entre dos variables ruméricas continues. +n valor pririo es aque que est muy lead, por encima del percent 750 por dbo del percent 25. 3 © ELSEVIER. Faxocopia sn autor CAPITULO 3 Conceptos basics de bioestadistica tos exculdos del intervalo se reparten a ambos lados de dstibucin normal puede ntl la exaresién =DISTTLNORMLESTAND(2) y dav el dea que queda en la cole del euler para cada valor doz que se ecb, por 96) devuelve p=0,025 (tcl. | eubvelea fat de precsién STE De Martinez-Gorzalez et a "100 veces, ya partic de las 100 muestras se calculasen 100 in~ teryalos de confianzs del 95%, habria 95 intecvalos que zealmente contendsfan al verdadero valor del pardrmetro ‘poblacional y 5 que no lo contendrfan, Los intervalos de confianza se calculan usando el ercor csténdar (BE), que es un indicador de la variabilidad de log estimadores calculados en muchas posibles muestras de igual tamafio que se tomen de una poblacién’7, En definitiva, el EE de un estimador mide el grado de incer- tidumbre respecto a la capacidad de ese estimador para averiguar el parimetzo poblacional. El cilculo del intervalo de confianza presupone que los estimadores muestrales de un pardmetro siguen una distribucién normal (teorema central del limite). La férmula para el célculo del intervalo de confianza variard en fancidn del pariimetro que se desee estima. Sin ‘embargo, en general, podemos afirmar que: Porametropoblacional« estimadars 2% EE Aqut, zesel valor correspondiente «la distribuciéa normal. Contraste de hipéte: Un contraste de hip6tesis implica una comparacién entre un efecto y la variabilidad aleatoria esperada (error). Si Ia magnitud del efecto observado en la muestra es muy superior al error, se dird que la muestra apoya la existencia, de tal efecto en la poblacién. Si el efecto observado en la muestra es similar o inferior en magnitud al errox, se concluiré que la muestra no apoya la existencia de dicho efecto”, Pera tomar una u otra decisién se establecen dos hipétesis (a nivel de la poblacién): © Hipstesis nula (Hy): mantiene gue el efecto de interés no existe (es nulo, es decig, vale 0) en la poblacién de la que procede la muestra. SiH, fuese cierta, toda la variaiidad observa se pode explcar meramente por el azar. HipStesis alternativa (H,): mantiene que existe algiin efecto distinto de 0 en la poblacién de la que procede a muestra. La variabilidad observada no se explicarfa totalmente por el azar Las hipétesis (nula y alternativa) se plantean siempre a nivel de la poblacién; sin embargo, los datos usados para apoyarlas 0 rechazarlas procederdn de la muestra. Se calcula después un valor p de significacién estadisti- ca, que estima Ia probabilidad de encontrar un efecto como 20 CONCEPTOS DE SALUD PUBLICA Y ESTRATEGIAS PREVENTIVAS el encontrado 0 wo todavia mayor en Ia muestra si el efecto fuese 0 en la poblacién (es decir, si H, fuese ciesta). Esa probabilidad en muchas ocasiones corresponderé al rea de la cola de la distribucién normal para un valor 2 ‘alculado. El célculo de tal valor z se hari muchas veces dividiendo el efecto entre el error (error esténdar). Cuanto oe papal menor sea esa cola, menos compatible sera el resultado encontrado en la muestra con la hipétesis nula en la po- blacién. Interpretacién del contraste de bipétesis: el valor p es tuna probabilidad condicionada. Su condicién es que la hi- pétesis nula sea cierta, Indica !a probabilidad de observar cn la mucsiza diferencias mayores o iguales a las realmente observadas sila hipétesis nula fuera cierta™, Valor p= plclif> observadas| H,) En la tabla 3-4 se presentan las decisiones que se toman en un contraste de hipétesis en funcién del valor p de significacién estadistica. couclos concepts desig EXTOF tipo 1 y-error tipo 2. Potencia cacién escadistica y de signficacién o relevancia prictica (Gignificacién clinica en la investigacién médica). La signi- ficacién estadistica es la mayor o menor probabilidad de obtener un resultado como el observado (o més extremo) en el estudio si todo se debiera sélo al azar. Puede que una asociaciéa que hallemos sea estadisticamente significativa pero tenga poca significacién (relevancia) clinica porque Ja magnitud de la diferencia observada no tiene ninguna trascendencia para la salad de un paciente. En el ejemplo de la cuadro 3-1, la signficacién clinica vendria dada por la pregunta: ¢cémo afectard a la salud de un varén de El valor p (de significaci6n estadistica) estima Ia pro- esas caracteristicas que su perimetco abdominal aumente _babilidad de cometer un error de tipo 1 una vex que se en 3cm? . han analizado los datos; en cambio, el riesgo alfa es el Eoin Peer ees p<0,05 Se rechaza la hipdtesis nula Ne parece qu el zal ead td El efectoy es mayor que el eertors diferencias extadsteente signal NL Existenevdencas a favor dela hipaa alteratva ‘os limites 0,05 y 0,10 son en certo modo arbitrarosy apoximadesy no eles debe dar una consderacén dogmétceo absolua, Entre ,05 y 0,10 se puede ‘admitr que, design mada, se est en alera de nadie y podria dcise ques resultados se aproniman o esti cecanos ala sigalicacé, ‘daptado de Martinez-Gonziiez et a. (© ELSEVIER. Fotocopiar sin auoraacin es un delta FIGURA 3-2 Decsiones que se pueden tomar después de un contraste de hipdtesis. De Martinez Gonzslez eta? riterio de decisién previamente establecido (fig. 3-2). Puede parecer a primera vista que alfa coincide con el valor p, pero lo que sucede es que el riesgo alfa se refiere als probabilidad que el investigador fija de antemano, estableciendo qué riesgo de cometer una equivocacién est dispuesto a admitir; es, por tanto, un mimero cons- tante y se especifica sin necesidad de conocer los datos; en cambio, p se calcula a posteriori al analizar los datos, de la muestra y es, por tanto, variable”, PRUEBAS DE CONTRASTE DE HIPOTESIS Principales pruebas de contraste de hipétesis Las pruebas de contraste de hip6tesis més utilizadas apa- recen en la tabla 3-5, agrupadas segtin el tipo de variables que se analicen, Las pruebas paramétrices se llaman asi porque se basan en pardmetros (media, varianza, etc.) de una distribucién tedrica de probabilidad y requieren el cumplimiento de unas condiciones de aplicacién més, estrictas. Cuando no se cumplen tales supuestos o si las variables dependientes siguen una escala ordinal, se deben. usar las pruebas no paramétricas. Las muestras independientes son aquellas en las que no hay ninguna relacién particular entre cada par de individuos de los grupos que se comparan. En cambio, los tests emparejados, pareados o de medidas repetidas son los que estén indicados cuando se trata de un mismo sajeto medido en dos ocasiones o de disefios donde se establecen comparaciones entre parejas especificas y bien relacionadas de sujetos (hermanos, famniliares 0 controles emparejados individualmente con cada caso}. Pruebas a una cola y pruebas a dos colas Sila hip6tesis alternativa en un test de hip6tesis apunta sélo en una direccién, indicando la superioridad de un grupo frente al otro, se tratara de un test de hipdtesis unilateral. Si, por el contrario, la hipétesis alternati- va mantiene la diferencia de los grupos, pudiendo ser cualquiera de ellos et mayor, se tratard de un test de hipétesis bilateral. En el primer caso, los valores p serfan, sélo a una cola. Si una prueba bilateral es significativa, también lo sera una prueba unilateral. Las pruebas a dos colas darén valores p mayores (y, por tanto, con menor significacién estadistica). Las pruebas a una cola se empleardn excepcionalmente. Se aconseja usar pruebas 2 dos colas. ESTADISTICA BAYESIANA Se suele abasar de las pruebas de significacién estadistica (valores p del contraste de hipétesis). Deberia darse mayor importancia a los intervalos de confianza, pues son una aproximacién més directa y ficil de entender. Las normas STROBE (Strengthening the Reporting of Observational studies in Epidemiology Statément) indican explicitamente {que los estudios epidemiol6gicos observacionales presen- ten las medidas de asociacién ajustadas y acompaiiadas de sus intervalos de confianza. Los intervalos de confianza habitualmente usan el con- cepto frecuencista de probabilidad. Existe otra corriente dlistinta de Is frecuencista para definir le probabilidad: la filosofia bayesiana. Por ejemplo, para la probabilidad de obtener cara al tirar al aire una moneda, la definicién fre- cuencista mantiene que las probabilidades son los limites alos que tiende la proporcién con la que saldra cara sila ‘moneda se lanzase infinitas veces. Pero nadic ha lanzado tuna moneda infinitas veces. En cambio, la filosoffa ba siana maneja fa probabilidad como un concepto subjetivo ‘que aiiade a la interpretacién frecuencista el grado de certeza previa del investigador. Se usa la certeza previa para matizar el resultado obtenido en una muestra pe- quefia. El grado de credibilidad que se tiene de antemano sobre un fenémeno y hasta qué punto se esta dispuesto a predecir cada posible valor del resultado en la muestra se integra con los resultados observados realmente en. Ja muestra. Asi, para el planteamiento bayesiano seria muy poco crefble @ priori que llevar piercing protegiese frente a la hepatitis, pero seria muy crefble que comer menos llevase a adelgazar. Esta creencia se integra formal y cuantitativamente en el andlisis para matizar ala baja 0 al alza los resultados de la muestra. varigblé dependiente Pruebas empleadas Jialawdada Sila ruesta es grande Jal cuadrado de tendencia lineal Categoria que siguen agin orden o vaablesorinales Sila muestra es pequen ‘Medias repetidas Prueba exacta de Fisher Test de McNemar + Rearesién lon SS sie tines Pregice une variable a partir de Asociacén lineal ‘Asociacién Multivariable “as variables independiente (oj de abscisas ox son los predictres que habitulmente anteceden alos supuestos efectos (ratemlentoasgnad, grupo a que pertenecee suet, caecertstic inca o bal as verables dependents (je de ardenadas oy son el efecto, resuitadoo respuesta que —conceptualmente al menos— ocuapostrixmente al predictor, se trata de comprobars esa valabie depres de las prelctores, ‘EIANOVA, a Incr muchos grupos suetenecesitar que secotan o penalcen los valores p por las comperaciones matiles que se pueden haces ya que al ‘compart todo con todo alguna comparacién resultarasignficativa slo por azar. El métode césico mas empleedo para esta correction es el de Banfeoa, También se ha usado ef método de Schelt Hay tras menos conservadres(Sdak, Tukey, Tamane, Gabril, Duncer, Dnt). Recentemente se esté usando ‘mucho el métado de Berjamini-ochberg que sa un limite de signifcaclén estaisica progesvamente distinto para cada camparadin, tres ordznaras de tmencr a mayor segtin us valores p El test de Jonetheere-erstra, mis reciente, puode usrse para la misma fnalidad que el de Kruskl- Well "Se trata en realidad de un método descrip, La expresién mas general y simple serfa: cds posterior = odds «prion x Factor Boyes La odds posterior seria el esultado del andlisis bayesiano. La odds previa serfa subjetiva (la creencia que se tiene an- tes de iniciar el estudio). El Factor Bayes se obtiene a partir de los datos recogidos en la muestra. Existen métodos sencillos y que no requieren ningin ‘software especial paca calcular intervalos de confianza con procedimientos bayesianos aproximados?*, BIBLIOGRAFIA. 4. Last JM. A dictionary of public health, Nueva York: Oxford ‘University Press; 2007. 2. Martin Andrés A, Luna del Castillo J. Bioestadistica para las Ciencias de Ia Salcd. 2* ed. Madrid: Norma; 1994, 3. Martinez Gonzilez MA, Sinchee Viegas A, Faun Fajardo FJ, ‘eds. Biosstadistica amigable,2*ed. Madrid: Diaz de Santos; 2006. 4, Rosner B. Fundamentals of biostatistics 7 ed. Belmont: Duxbury Press; 2010, 5. Machin D, Campbell Mj, Walters SJ. Medical statistics. A textbook for the Health siencies, #* ed, Chichester: John Wiley 8 Sons; 2007, 6. Motulsky H. Intuitive Biostatistics. A nonmathematial guide to statistical thinking. 2" ed, Nueva York: Oxford Univessity Press; 2010. 7. Altrian DG. Practical statistics for medical research, Londres: ‘Chapman 8 Hall; 1991. 8. Bailar JCI, Hoaplin DC. Medical uses of statistics, 3* ed, Hoboken: John Wiley & Sons; 2009, 9. Rothman Kj, Greenland S, Lash TL. Modern Epidemiology. ‘3 ed. Filadelfis: Lippincott Wiliams & Wilkins; 2008, 10. De Irala J, Martinez-Gonaalez MA, Segut-Gamez M, Epidemiologia aplicada. 2* ed. Barcelona: Ariel Ciencias ‘Médicas; 2008. 111, Martinez-Gonaélez. MA, Segu-Gomez M, Delgado-Rodefguez, 'M, ¢Cémo mejorar los intervalos de conflanza? Med Clin (Bare). 2009;135:30-4,

También podría gustarte