Está en la página 1de 102

[Index FAC] [Index CCVC]

Bioingenieria e Informatica M dica/Bioengineering- Medical Informatics

Curso: Bioestad stica bsica para m dicos asistenciales


Index Curso

Introduccin

Definicin y semntica Veamos una de las tantas definiciones de Estadstica: "Ciencia que pretende crear, desarrollar, y aplicar tcnicas que permitan evaluar la incertidumbre de las inferencias inductivas". Muchos de nosotros tenemos una sensacin semejante a escuchar hablar en un idioma en el cual reconocemos palabras aisladas pero no captamos la idea. No nos va mucho mejor con el diccionario, podemos leer en el Diccionario Enciclopdico Joyan de la Editorial Ruy Daz en su primera edicin de mayo de 1991 que la Estadstica es: "Parte de la matemtica que estudia las propiedades variables de las cosas, generalmente a partir de muestras, para describir, inferir y predecir acerca de los sucesos o fenmenos". Si no se comprende el qu, el por qu y el para qu , no conviene avanzar en detalles de procedimientos especficos. Creemos ms importante reflexionar y discutir sobre las ideas que proponemos a continuacin, que intentar memorizar cualquier frmula estadstica. Si sabemos lo que necesitamos, las frmulas nos esperan eternamente en el libro.

Causa y efecto Creemos que la dificultad es previa a intentar entender la definicin. Nos parece que la dificultad est en la base de elaboracin de muchas de nuestras ideas, y que proponemos sintetizar como un binomio conceptual: "causa efecto" . Un binomio constru do, muchas veces, sobre percepciones sensoriales no procesadas; an hoy decimos que el sol "sale" por el Este, que a cierta hora "cae" el roco y ni hablar de los "afectos" del corazn o de la determinacin y valenta que "se pone" con los testculos. El concepto en el binomio es: "en presencia de la misma causa sucede el mismo efecto". Los fundamentos para esta afirmacin los encontramos en el modo "natural" con que el que manejamos muchas de nuestras actividades cotidianas. Nuestra razn relaciona con ese concepto binomial datos presentes y pasados, propios y ajenos, para decidir cual ha de ser nuestro proceder para obtener determinado resultado, con ese mtodo planificamos nuestro accionar. Sucede que no siempre las cosas resultan conforme al planeamiento. En esas circunstancias, con el mismo mtodo, intentamos explicar la discordancia y entre las razones habituales encontramos: "datos insuficientes", "error de procedimiento", etc. Si con esa metodologa las explicaciones no satisfacen, surgen las "irracionales": "mala suerte", "el destino", "los astros no fueron favorables", etc. Son expresiones de que la "causa" no se conoce; no se duda del concepto binomial. Si el efecto fue diferente al esperado, la explicacin "natural" es que hubo una causa diferente a la considerada. Parece "antinatural", ilgico si se prefiere, plantearse si "efectos" desiguales podran suceder en presencia de la misma "causa", de las mismas circunstancias.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Leyes de Murphy y la perplejidad Las diferencias entre lo planeado y el resultado est n magnficamente descriptas en la mayor recopilacin de annimas citas destacables de todos los tiempos, nos referimos a las "Leyes de Murphy". Esas "Leyes" no nos parecen otra cosa que un modo irnico de expresar perplejidad. Cuando la realidad no se ajusta a lo "razonable" segn el binomio "causa-efecto" nuestro desconcierto intelectual se refugia en conceptos que trascienden a la razn, como son: "visi n", "intuicin", "sexto sentido", "percepcin extrasensorial", etc.

Determinismo y casualidad Esta tendencia "natural" a encontrar una ligazn estable y reproducible entre "las causas y los efectos" de todo lo que acaece, es quiz la base de que nuestra educacin m dica, como la mayora de las formaciones "cientficas", sea an hoy, esencialmente "Determinista" . Nuestro modo bsico de pensar lo es. El Determinismo proponemos entenderlo como una estructura intelectual que asume que todo lo que sucede est sujeto a leyes de cumplimiento inexorable. Son "deterministas" por ejemplo: la "Ley de la Gravedad" de Isaac Newton y la m s prxima a nuestros tiempos, "Teora de la Relatividad" de Albert Einstein. Pierre Simon Laplace afirmaba que el Universo era completamente "Determinista", y que un conjunto de "leyes" cientficas permitiran describir y predecir todos los sucesos del universo. El determinismo se constituy en el paradigma cientfico durante siglos. Las nicas objeciones eran religiosas Dios no puede intervenir una vez que cre una ley? Dios tiene poder para crear la ley y no para transgredirla? Si nos pidiesen expresar el determinismo en una sentencia arriesgaramos la siguiente: "En las mismas condiciones sucede el mismo fenmeno". La falta de correspondencia entre las condiciones preexistentes y el suceso previsto se explica, "naturalmente", porque "faltan datos" o por "errores" de cualquier tipo. No se pone en duda el "Principio Determinista" . "Dios no juega a los dados", sola decir Einstein, quien recibi el premio Nobel por su contribucin a la teora Cu ntica pero nunca acept que el universo estuviese "gobernado" por el azar. Si la casualidad no existe, cmo explicar la lotera, o cualquier "juego de azar"? Creemos que en la necesidad de coherencia intelectual est la concepci n de un componente Metafsico vinculado al universo conocido. Lo metafsico, con leyes propias, inaccesibles de momento y prevalentes sobre las conocidas del universo Fsico, explicara las aparentes "casualidades" bajo el com n denominador del destino determinado. Ese universo dual complementario (fsico y metafsico) con sus leyes, es una respuesta a nuestra perplejidad y una base para dejar "a salvo" el determinismo.

Incertidumbre y aleatoriedad Un enfoque diferente aparece como opcin si se acepta la existencia de fen menos casuales (aleatorios, azarosos). Si aceptamos lo impredecible de ciertos fenmenos deberemos cambiar tambin el modo de estudiarlos, de analizarlos. El Principio de Incertidumbre lo propuso en 1926 un fsico, el Dr. Werner Heisemberg, que investigaba el movimiento de las partculas atmicas y trataba de establecer las "leyes" que lo rigen en sus diversos aspectos (velocidad, posicin, etc). Quiz en lo que para los doctos es un exceso en la sntesis, podramos decir que las observaciones de Heisemberg lo llevaron, entre otras, a estas conclusiones:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

El diseo del experimento compromete el resultado . Por ejemplo: la luz que Heisemberg utilizaba para estudiar posicin y velocidad de las partculas, modificaba el movimiento espontneo de las mismas. Condicionar variables distorsiona al conjunto. En otros trminos, la reproducibilidad es garanta de antinaturalidad . Diseos experimentales que fijan condiciones muy rgidas, tratando de acotar las variables en juego para poder concentrarse en la observacin de una de ellas, lo que logran es distorsionar las relaciones del conjunto incluyendo al comportamiento espontneo (natural) de la variable en estudio. A Heisemberg le pasaba esto cuando pretenda estudiar simultneamente velocidad y posicin de las partculas atmicas. Es comn en biologa cuando se intenta comprender las diferencias de ciertos fenmenos "in vitro " al estudiarlos " in vivo ", "in situ", etc. Impredecible en cuanto inmensurable. No se pueden predecir con exactitud los acontecimientos futuros, en parte porque, como ya vimos, tampoco se pueden medir exactamente los presentes. Estos estudios llevaron a que Heisemberg, Schrdinger y Dirac entre otros, expusieran que "En general, la mecnica cuntica no predice un nico resultado de cada observacin particular. En su lugar, predice un cierto nmero de resultados posibles y nos da las probabilidades de cada uno de ellos" . No es ocioso aclarar que la tecnologa moderna con sus transistores, las computadoras, los circuitos integrados de video, los satlites, etc. se basa en esta concepcin "no determinista" de los fenmenos fsicos.

Incertidumbre y Agradecimiento No podemos avanzar en estos temas sin mencionar lo que nos ayud a apreciar estas ideas el libro del Dr Stephen Hawking "A Brief History of Time, From the Big-Bang to Black Holes" traducido como "Historia del Tiempo" Ed. Crtica Barcelona, 1988. Recomendamos a los interesados a completar y corregir nuestro resumen el cap 4 pg 81 dnde el Dr Hawking desarrolla "El Principio de Incertidumbre".

Aleatoriedad y Probabilidad Si no se puede predecir exactamente el suceso individual, se puede intentar calcular la probabilidad de que ocurra de determinada manera. Blas Pascal (1623-1662) desarroll la teora de las combinaciones y cre las bases del clculo de probabilidades. Si se observa el "dado" que mencionaba Einstein se constata que no se necesita tirarlo ni una sola vez para pronosticar cuantas veces "saldr" un nmero cuando se tire el dado 100 veces o que probabilidad tiene de "salir" ese nmero en un solo tiro. En estudios como los de Heisemberg, en las conductas mdicas, y en otras ciencias, enfrentar al azar con la razn surge como desafo y como necesidad . Ms an, y por otro lado, medtese en desarrollar completamente la idea de libertad en un universo "determinista". Para aceptar un universo aleatorio no es necesario el complemento metafsico ni creer que "Dios juega a los dados". Un creyente slo necesita creer que Dios se reserva el derecho de actuar cuando y como quiera, de manera que su intervencin, aleatoria, no contrara la libertad implcita para todo(s) en esa aleatoriedad.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Estadstica y Aleatoriedad La Estadstica es una ciencia que agrupa conocimientos matemticos para intentar trabajar racionalmente en la observacin de fenmenos aleatorios . La Estadstica es una respuesta racional a la incertidumbre, a la aleatoriedad. A las definiciones que no entendamos proponemos resumirlas en estas ideas: La Estadstica es una rama de la Matemtica. El objeto de estudio de la Estadstica son los fen menos casuales. La Estadstica expresa lo casual matemticamente. La Estadstica utiliza la observacin de las caractersticas de pocos casos para elaborar conclusiones que pueda proyectar con una probabilidad conocida a la generalidad de d nde salieron los casos observados. Ese es el sentido de expresarse en porcentajes. La Estadstica asume que no siempre en idnticas condiciones sucede id ntico fenmeno. En realidad, la Estadstica asume que las diferencias fenomenolgicas en condiciones similares son la regla, y que la igualdad, es la excepcin. La Estadstica pretende reconocer, cuantificar y pronosticar esas diferencias. Una meta de la Estadstica es darle significado a las diferencias observadas. La Estadstica da respuesta matemtica (probabilidad) a una pregunta constante: Las diferencias observadas expresan ( significan ) simplemente la variacin casual, lo aleatorio, el azar, o que realmente cambiaron las circunstancias? La Estadstica trata de inferir si una diferencia observada es o no casual, y para ello calcula y expresa la probabilidad de que esa diferencia haya sido casual. Si la probabilidad de observar esa diferencia casualmente es muy baja, el investigador interpreta que cambiaron las condiciones e infiere que esa diferencia no es casual . La Estadstica es un Mtodo Inductivo ya que el camino del conocimiento va de lo particular a lo general. Una vez inferido ( conocido desde la particularidad) el comportamiento de la generalidad, se puede pronosticar (establecer probabilidad) conductas particulares. As, el conocimiento estad stico deviene deductivo en la reversa hacia lo particular: Un tratamiento quirrgico a un paciente concreto, le ofrecer mayores probabilidades de sobrevida que el tratamiento no quirrgico alternativo, si esa diferencia en la sobrevida (mayor en este caso) se observ y se infiri no casual , en estudios previos comparativos de ambos tratamientos y que incluyeron pacientes como el de la consideracin. La Estadstica es el idioma con el que nos referimos a los fenmenos aleatorios.

Publicacin: Septiembre 2005 Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingenieria e Inform tica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico 1994-2005

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

CETIFAC - Bioingenier a UNER

Webmaster - Actualizacin: 05-Sep-2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingeniera e Informtica M dica/Bioengineering- Medical Informatics

Curso: Bioestad stica bsica para m dicos asistenciales


Index Curso

Clase N 1: Terminologa Bsica


Ra l E. Ortego, Carlos R. Secotaro

Intentaremos algunas definiciones de trminos, pero como en los idiomas, trataremos de aprender su significado mediante la utilizacin, y con la reiteracin como mtodo, aun a riesgo de recibir el calificativo de tautlogos.

Aleatorio y evento Su equipo de trabajo resuelve estudiar si la dieta influye en la mortalidad durante el ao del egreso de personas que se internaron en su hospital por un Infarto Agudo de Miocardio, a los cuales durante esa internacin se les diagnstic por primera vez que padecan diabetes. El tratamiento que su servicio recomienda durante el primer ao post alta incluye un control diettico estricto. Resuelven dividir a los pacientes en dos grupos denominados Dieta Controlada y Dieta Libre respectivamente. Todos los pacientes egresados en esas condiciones, y cada uno de ellos, estn expuestos a morir en el ao de observacin post alta hospitalaria. El equipo de estudio no sabe si va a ocurrir siquiera alguna muerte en ese lapso (el tiempo de exposicin, u observacin en este caso). Tampoco se sabe, en caso de que ocurra, que personas fallecern en ese lapso. En resumen, la muerte, el suceso a observar en estos pacientes, no se sabe cuando ocurrir, a quin le va a ocurrir y ni siquiera si va a ocurrir alguna vez. La ocurrencia de ese suceso es Aleatoria, o si se prefiere Casual o Azarosa. Un fen meno acontecimiento circunstancia suceso (algo) de aparicin (ocurrencia) aleatoria es denominado Evento . Para el estudio de marras, la muerte ser el evento a contabilizar. Ntese la diferencia semntica coloquial para ese trmino, ya que an personas instrudas se refieren a la "organizacin" de eventos (Fiestas, Congresos, etc). Si hay algo desorganizado por definicin es un evento . El concepto de Evento est asociado indisolublemente al azar, a la casualidad. El Evento es esencialmente aleatorio .

Poblacin y muestra En los censos de las personas que habitan un lugar los gobiernos procuran obtener ciertos datos de todos y de cada uno de los habitantes, sin excluir a ninguno por ninguna razn, se habla de censo de la Poblacin. Las empresas que desean analizar ciertos gustos o necesidades de la Poblacin para intentar satisfacerla y obtener con ello un beneficio, solicitan recabar los datos pertinentes a una parte de la Poblacin que denominan Muestra . Se intenta inferir desde la muestra lo que se quiere conocer de la poblacin. La Poblacin es una totalidad; la muestra es una parte de esa totalidad.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

La poblacin como objeto de estudio es una totalidad de datos obtenibles, no necesariamente de personas. Nuevamente la estadstica se aleja del significado coloquial del idioma. La totalidad de peces del mar es una poblacin, pero tambin lo son la totalidad de las flores, la totalidad de las rosas, la totalidad de los colores de las rosas, etc. Una parte de una poblacin, las rosas de las flores, se puede considerar poblacin en cuanto esa sea la totalidad que interese. Una poblacin puede ser la totalidad de pacientes diabticos; pero tambin puede serlo la totalidad de los pacientes Diabticos Tipo I o la totalidad de los pacientes con Infarto y Diabetes diagnosticada durante la internacin. En el estudio de su hospital no se intern una totalidad, slo una parte. Cualquier parte de una poblacin no es una muestra de la misma. La muestra es una parte que representa a una poblacin de referencia. Para que desde la muestra se pueda inferir el conocimiento de la poblacin , la muestra debe representarla en su totalidad, en todas sus caractersticas. Para que la muestra represente a la poblacin, todos y cada uno de los individuos de la poblacin deben tener la oportunidad de estar considerados para participar de la muestra. La totalidad debe estar disponible para el fraccionamiento, para el muestreo (a un sustantivo la Estadstica necesita transformarlo en verbo para su idioma: muestrear). Los miembros de la poblacin que efectivamente son includos en la muestra deben serlo por casualidad, por azar, aleatoriamente . La muestra es esencialmente de constitucin aleatoria.

Representacin y Sesgo Cuando una parte de la poblacin es includa o excluda de un fraccionamiento por alguna caracterstica peculiar se dice que es "cortada", " sesgada" de la poblacin y por lo tanto los miembros de la poblacin que carecen de la caracterstica utilizada para sesgar no estn representados en la fraccin; se fraccion pero no se muestre . El sesgo descalifica a la fraccin como muestra ya que no representa a la totalidad. En el estudio de su hospital se resolvi dividir a los pacientes en dos grupos. Se decidi que los ingresados en das pares seran asignados al grupo Dieta Libre y los ingresados en d as impares al grupo Dieta Controlada. Otras opciones consideradas fueron: 1) Incluir en el grupo Dieta Controlada slo a los que hubiesen completado el segundo nivel de escolaridad porque haba ms garanta de cumplimiento y 2) Incluir en Dieta Libre a todos los desocupados ya que de hecho comeran lo que pudiesen. Se rechazaron esas opciones porque implicaban un sesgo en el estudio. Para m s detalles, si las consecuencias alimentarias de la desocupacin son tan serias, una opcin es excluir a los desocupados de ambos grupos del estudio; en consecuencia se debe agregar al ttulo del trabajo un item que diga" en pacientes con ocupacin conocida", ya que los pacientes con Infarto y diabetes "de novo" desocupados no estarn representados. Lo que no se debe hacer cuando se pretende muestrear, es seleccionar para la distribucin con cualquier criterio que no sea esencialmente aleatorio. En medicina se sabe si un paciente est representado en determinado trabajo cient fico, en otras palabras, si pertenece a la poblacin que se ha estudiado, analizando las caractersticas del " Material y Mtodo" del trabajo en cuestin. Si el paciente se ajusta a los criterios de inclusin y a los de exclusin y no fue includo en el estudio por una razn fortuita, azarosa, como por ejemplo que naci despus de que el estudio finaliz, lo mismo pertenece a la poblacin estudiada, est representado en esa muestra . Esa es la base que permite aplicar en el presente estudios de antao, sin necesidad de repetirlos con cada generacin.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Constantes y Variables Quiz estos trminos son el ejemplo paradigmtico de que con las mismas palabras no se expresan las mismas ideas en el lenguaje coloquial y en la Estadstica. En el uso corriente son predicados de significado opuesto; en los trabajos cient ficos son el sujeto, y lo variable puede hacerse constante y viceversa. En el estudio ALLHAT (The Antihypertensive and Lipid-Lowering Treatment to Prevent Heart Attack Trial JAMA, December 18, 2002 - Vol 288, N23: 2981 -2997) la aparicin de Diabetes con el tratamiento hipotensor fue una variable. Si para algn trabajo de Metaanlisis sobre tratamiento hipotensor y aparicin de Diabetes se tomase al subgrupo del ALLHAT en los que apareci Diabetes, la aparicin de la Diabetes sera la constante de ese subgrupo como lo es de todo el metaanlisis. La caracterstica de constante o variable deja de pertenecer a la "cosa" en estudio para depender sobre todo de "cmo se estudia a la cosa". En un "material de estudio" hay caractersticas, cualidades, que lo identifican, que le son esenciales (si cambian, ese "material" ya sera otro distinto), a esas cualidades se las llama Constantes . Las Variables son cualidades del "material de estudio" que an modificndose ellas, no cambian al "material" que sigue siendo el mismo. Esta vez el concepto est en el lenguaje popular, ya que "la mona aunque se vista de seda mona queda". En el estudio de su hospital la variable es la mortalidad anual, para ello contar esos eventos (las muertes) durante ese lapso; podra haber estudiado la tasa de reinfarto o la necesidad de indicar insulina sin que variase lo constante . Su equipo de estudio quiere saber si las caractersticas de la Dieta (libre o controlada) incide en la mortalidad (la variable ) ms all de lo meramente casual, ya que, por supuesto, descuentan que habr diferencias de mortalidad entre ambos grupos con un ao de observacin para cada paciente. Constantes y Variables, de cualidades del material de estudio se tornan sujeto (sustantivo) de estudio, as se escucha decir: "La variable fue tal o cual". Ntese que estudiando la variable , lo que en realidad su equipo quiere saber es si hubo cambios en lo presumido constante . Si verifican que hubo tales cambios, concluirn que el control de la dieta cambia las circunstancias, las condiciones, que se alter lo constante, que los dos grupos no representan a la misma poblacin, que son muestras de poblaciones diferentes , que la dieta divide en poblaciones diferentes, que el control de la dieta marca una diferencia en el pron stico de los pacientes porque dejan de pertenecer a la misma poblacin. Que no es lo mismo haber tenido un Infarto, ser diabtico y cumplir la dieta que su hospital sugiere, que no cumplir tal recomendacin. Por las caractersticas variables de fenmenos aleatorios, la Estadstica procura inferir si hay condiciones basales, constantes, diferentes. Conocer lo constante a travs de lo variable es la razn de ser de la Estad stica.

Uso combinado de constantes y variables Reconocemos si una meloda es ejecutada con una trompeta o con un violn o con un instrumento de percusin por las constantes que caracterizan a los sonidos emitidos por esos instrumentos. Reconocemos que se trata de la misma meloda por las constantes (partitura) que la caracterizan. Las relaciones temporales variables de frecuencia de los sonidos emitidos por los instrumentos, las notas musicales, permitirn interpretar diferentes melodas con el mismo o con diferentes instrumentos. Las constantes de la meloda son las variables que pueden compartir los instrumentos sin perder sus propias constantes de emisin de sonidos. El material de estudio puede ser un instrumento con sus constantes y usar diversas melodas como variables o cualquier otra combinacin. Veamos otros ejemplos: Morir es una constante en la vida (ciclo) del hombre. La muerte de individuos es un evento en un lapso de observacin de un grupo de hombres.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

La mortalidad [Relacin Muertos/(Muertos +Vivos )] en un lapso de observacin (por ejemplo: anual) es una variable de las Poblaciones Humanas.

Tipos de Variable Las variables pueden ser Cualitativas o Cuantitativas. Las variables cualitativas pueden ser Nominales u Ordinales. A) Cualitativa Nominal : Las variables se describen con palabras o nmeros. El estudio o anlisis de las mismas no admite operaciones matemticas aunque la variable se exprese con nmeros (por ejemplo el directorio telefnico). Son un ejemplo de estas variables el Infarto Agudo de Miocardio (IAM), la Insuficiencia Cardaca Derecha, la Diabetes , etc. Estas variables nominales pueden ser dicotmicas cuando admiten solo dos posibilidades, por ejemplo: vivo o muerto, operado o no operado. B) Cualitativa Ordinal : Las variables admiten graduaciones jerrquicas, pero sin cuantificar, por ejemplo: "mayor o menor que". El estudio o anlisis de las mismas no admite operaciones matemticas, pero s se pueden comparar. Son ejemplo de estas variables cualitativas ordinales las Clases Funcionales I, II, III IV de la Insuficiencia Cardaca o del Angor. Las variables cuantitativas o cardinales admiten en su estudio a todas las operaciones matemticas. Estas variables pueden ser Continuas o Discontinuas (Discretas) . A) Cuantitativa Continua : El valor de la variable admite las infinitas posibilidades de los nmeros reales y las fracciones tienen sentido. En estudios con la variable Peso Corporal se admite que entre dos valores existan infinitos valores, por ejemplo entre 30 y 31 Kg se admite todos los decimales que se considere necesario: 30,1; 30,11; 30,111, 30,1111, etc. B) Cuantitativa Discreta o Discontinua: El valor de la variable entre dos valores no admite infinitas posibilidades ya que las fracciones no tienen sentido. Por ejemplo: el nmero de dedos faltantes para determinar capacidad laboral, el nmero de "piezas" obtenidas en una cacera, el nmero de piezas dentales para hacer una prtesis, etc. Funciones Estadsticas Son la expresin de procedimientos matemticos realizados con los valores de las variables, por ejemplo el promedio A) Parmetros Son las funciones de la Poblacin y por lo tanto son una Constante de la misma. Ntese la diferencia con el significado coloquial del trmino cuando se lo utiliza para decir por ejemplo: "los parmetros de control del paciente se mantuvieron en el rango normal" dnde va implcita la variabilidad. Se simboliza a los parmetros con letras Griegas, por ejemplo el Promedio se simboliza (mu ) y el Desvo Standard G ( giga ). B) Estadgrafos Son las mismas funciones, pero referidas a la Muestra , son por lo tanto Inconstantes y se las simboliza con letras Latinas , por ejemplo el Promedio es y el Desvo Standard es DS .

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Tipos de Estadstica A) Estadstica Descriptiva Es la que se limita a caracterizar poblaciones o muestras mediante funciones de las mismas, Parmetros o Estadgrafos respectivamente. Desde los datos obtenidos por muestreo se pueden hacer proyecciones a la poblacin mediante la expresin de las funciones en porcentajes. B) Estadstica Inferencial Es la que procura saber si muestras que exhiben diferentes valores y funciones pertenecen a la misma poblacin. La Estadstica Inferencial trata de establecer cual es la probabilidad de que la diferencia observada se deba slo al azar del muestreo. Procura inferir con sus conclusiones el significado de las diferencias. En el estudio que se plante su equipo, al estudiar la mortalidad anual de pacientes que no saban que eran diabticos y que padecieron un IAM comparando dos muestras segn los pacientes siguiesen una dieta estricta luego del alta, dan por obvio que observarn diferencias en la mortalidad de ambos grupos (Dieta Libre vs Controlada). La estadstica inferencial operando matemticamente con los valores y/o las funciones obtenidas en cada muestra aporta datos para ayudar a interpretar esa diferencia. El tratamiento estadstico (matemtico) de los datos le asignar una probabilidad a que la diferencia observada sea casual. Su equipo ha decidido que si la p robabilidad de que la diferencia sea casual es menor de 1% (uno por ciento) o expresado de otro modo que la p < 0.01 inferirn que la dieta marc la diferencia, que la diferencia no fue casual, que la dieta divide poblaciones. La Estadstica Inferencial concluye informando la p robabilidad de que la diferencia sea casual. No niega que haya sido casual. No pretende negar la casualidad . Procure explicarle a alguien que ya gan u$s 1.000.000 en la lotera jugando un nmero de 5 cifras y habiendo sido la probabilidad de ganar < 0.000001, que la casualidad no existe y que por lo tanto no gan?!. Por el contrario:Recomendara jugar para "zafar"? La Estadstica infiere en el sentido de proponer conclusiones sobre la totalidad con datos parciales. Entre las varias definiciones del diccionario (ibid) para el verbo inferir proponemos elegir " inducir una cosa de otra ". En el estudio de su hospital, el equipo de trabajo procurar inducir si el control diettico es eficaz disminuyendo la mortalidad post Infarto en diabticos "de novo" si la diferencia a observar entre los dos grupos tiene baja probabilidad de ser slo casual. El valor de probabilidad que llamar "baja" su equipo, ha decidido que sea 1% ( p < 0.01 ). El equipo sabe que puede ser simplemente una casualidad encontrar una diferencia de mortalidad entre ambos grupos de control de dieta, aunque los clculos inferenciales den que la probabilidad de un hallazgo casual sea p < 0.000001 (como el de la lotera). Ntese que la medicina " Basada en la Evidencia" no transmite " verdades reveladas "; slo dice que es evidencia una interpretacin de datos que asigna un valor "arbitrario" (elegido si se prefiere) a la casualidad. Arbitrario no quiere decir "infalible". La medicina "Basada en la Evidencia" por los clculos de la Estadstica Inferencial recomendara en nuestros ejemplos que jugar a la lotera no es la forma ms probable (segura?) de "zafar". Quizs, veremos su estudio, la "evidencia" obtenida recomiende que es ms seguro cumplir con la dieta que no hacerlo, aun sabiendo "a priori" que algn incumplidor "zafar" o que el ms cumplidor de todos podra morir a los tres meses.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Publicacin: Septiembre 2005 Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingeniera e Informtica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

1994-2005

CETIFAC - Bioingenier a UNER

Webmaster Actualizacin: 13-sep-05

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingeniera e Informtica M dica/Bioengineering- Medical Informatics

Curso: Bioestad stica bsica para m dicos asistenciales Clase N 2: Estadstica Descriptiva
Ra l E. Ortego, Carlos R. Secotaro

Index curso - Clase anterior - Clase siguiente

Cuantificar para comparar En conversaciones cotidianas se comparan variables cualitativas utilizando adverbios de cantidad y adjetivos calificativos. Las seoras comentan que tal afamado diseador de ropas es contradictorio porque en verano elije colores "clidos" y entre ellos se inclina "ms" por el rojo. Los caballeros, dialogando sobre automviles, opinan sobre la "mayor o menor confiabilidad" de ciertas marcas reconocidas. Ha sido reconocido que los pacientes diabticos tienen ms riesgo de arteriopatas. Ciertas recomendaciones procuran que ese riesgo en pacientes diabticos sea menor. El lenguaje coloquial deja librado a la imaginacin, a las vivencias previas, en ocasiones a las expectativas de los interlocutores, la magnitud , el impacto, de tales apreciaciones. Cu nto, y en ocasiones Qu, es "ms", "mayor", "mejor", etc?. La Estadstica Descriptiva , acorde a su esencia, debe expresarse matemticamente. Para describir a las variables cualitativas con nmeros, la primera accin es contar. Finalmente, si es apropiado, se puede inferir comparando relaciones de muestras.

Frecuencia: mediciones y relaciones 1. Frecuencia Absoluta"f" : Cantidad de veces que se repite determinado valor de la variable (cuantitativas) o atributo (cualitativa). 2. Frecuencia Relativa "fr = f/n" : Es el cociente entre la "f" y el n mero total de datos "n" . 3. Frecuencia Absoluta Acumulada"fa" : Es la suma de las "f" hasta un valor de la variable. Por ejemplo: si decimos que 40 estudiantes han "sacado" 4 o menos de 4 como nota, en realidad hemos sumado la cantidad de "0", de "1", de "2", de "3" y de "4". La expresin correcta (porque no "sumamos" estudiantes) hubiese sido: hay 40 notas con 4 o menos de 4. 4. Frecuencia Relativa Acumulada"fra" : Es la suma de las "f" hasta un valor de la variable. En el ejemplo anterior, si los alumnos (notas) son 80, afirmaramos que el 50% saco 4 o menos de 4. 5. Distribucin de Frecuencia: Es una "Tabla" donde se presentan, en columnas, los valores de la variable y su correspondientes frecuencias. Por ejemplo, si "tiramos" un dado 50 veces podramos obtener algo as:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Prevalencia e incidencia A una clnica le han ofrecido la posibilidad de atender por sistema de "cpita" a una poblacin de jubilados. Se trata de 9.900 personas de ambos sexos y con una edad promedio de 60 aos. El sanatorio que los atiende actualmente realiz un relevamiento de todos ellos investigando Diabetes; encontraron 1980 personas que cumplan con los criterios diagnstico de Diabetes. El sanatorio referido ha solicitado un incremento en el monto de "cpita" por paciente en razn de que la diabetes aumenta los costos de atencin. Argumentan que la prevalencia de Diabetes en ese grupo es "m s" alta que en la poblacin general que se toma como referencia para establecer el monto de la cpita. El diabetlogo de la clnica es convocado para asesorar al respecto. La Estadstica Descriptiva utiliza la palabra Prevalencia para referirse a la proporcin de una totalidad , los jubilados en este caso, que cumple los criterios particulares que interesan ( variable cualitativa ), en nuestro ejemplo, de Diabetes. Siguiendo los pasos necesarios para transformar variables cualitativas en nmeros, se cont el total de personas ( 9.900 ) y se cont para conocer la frecuencia absoluta ( 1980 ) de diabticos. La relacin de esos nmeros informa que del total de esos jubilados son Diabticos 1980/9.900 (0,2) o en trminos porcentuales para hacer proyecciones , que la Prevalencia es del 20% . Ntese que Prevalencia es una manera de referirse a una Frecuencia Relativa . El Diabetlogo informa que en la poblacin general la Diabetes se presenta con una Prevalencia del 5% . Ms an, el diabetlogo informa que con la edad promedio de esa poblacin de jubilados, se debe esperar que la aparicin anual de nuevos casos de Diabetes, en el nuevo idioma, que la Incidencia de Diabetes, sea superior a la tasa de mortalidad y por lo tanto, con el transcurso del tiempo, la prevalencia aumentar. La relacin de una prevalencia con alguna unidad de tiempo, anual en el ejemplo, es lo que la Estadstica Descriptiva denomina Incidencia. Prevalencia e Incidencia son maneras matemticas de presentar mediciones y relaciones (Frecuencias ). Son datos obtenidos con variables cualitativas y que la Estadstica Descriptiva ofrece para hacer proyecciones y/o inferencias.

Riesgo y Odds Si la variable cualitativa tiene connotacin peligrosa o desagradable en algn sentido, su frecuencia relativa en los estudios puede incluir esa idea si se la expresa utilizando el trmino Riesgo , es una alternativa en reemplazo de Prevalencia. El servicio de ginecologa del hospital regional ha realizado un estudio en el que observ una frecuencia relativa de 30% de Recin Nacidos de Bajo Peso (RNBP) en embarazos de mujeres menores de 18 aos, mientras que en mayores de 18 aos fue del 5% .

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

La comunicacin de esos datos podra hacerse diciendo que la Prevalencia de RNBP en embarazos de menores de 18 aos es del 30%, lo cual es mayor que la Prevalencia del grupo control que es del 5%. En el programa de prevencin de embarazos no deseados el servicio opt por distribuir una circular que advierte que el Riesgo de RNBP en embarazos de adolescentes es del 30%, siendo el Riesgo habitual del 5% . La misma idea de frecuencia relativa puede ser expresada matemticamente con una diferencia, sutil con poblaciones grandes, relevante con poblaciones pequeas o en proceso de cambio. Se trata de la relacin " Odds ". La Prevalencia es la relacin entre el nmero obtenido de la variable y el total. En ese total estn includos los "variable positivo" y los "variable negativo". En el ejemplo de los jubilados se relacion los 1980 diabticos con los 9900 jubilados. En esos 9900 jubilados estaban includos los 1980 diabticos. La relacin Odds resulta de dividir el nmero de "variable positivo" con el nmero de "variable Negativo". En el ejemplo la Odds Ratio es 1980 /7920 (Diabetes+/Diabetes -). Esta palabra inglesa tiene muchas acepciones: "impar" (odd shoe), "extra" (odd player in a game), "chances" ( odds are against us), etc. La relacin Odds , en ingls Odds Ratio (OR) , proponemos emplearla como Riesgo Agregado o Riesgo Extra o Probabilidad Adicional ya que relaciona " los que S con los que NO" , a "los que les pas con los que no les pas". OR simultneamente informa el Riesgo de que SI con la Probabilidad de que NO . Si se analiza la evolucin durante 10 aos de observacin de una afeccin con un determinado tratamiento y el evento a contabilizar es la muerte, puede expresarse la frecuencia relativa de la muerte (la mortalidad) con el criterio que vimos para Riesgo . En ese caso, el denominador ser siempre el total de pacientes observados, son los que se van muriendo, van pasando del denominador al numerador pero no se los descuenta del denominador. Es como si los muertos siguiesen "votando", como si continuasen en el grupo, vigentes para nuevos eventos. Vemoslo con nmeros: muestra original de 1000 pacientes. El primer ao mueren 25 pacientes: mortalidad 25/1000 = 0.025 = 2.5%, a los 5 aos han muerto 350 pacientes luego: mortalidad 350 / 1000 = 0.35 = 35%. Si la relacin se hiciese con OR , se informara el primer ao 25 / 975 = 0.0256 = 2.56% ; pero a los 5 aos se informara 350 / 650 = 0.538 =53.8% Ninguna de las dos relaciones es "mentirosa", pero: Mortalidad 35% o 53.8% a 5 aos ? Han muerto el 35% de los que iniciaron; los vivos saben que la relacin muertos / vivos actualmente es casi 54%. OR informa con m s precisin la situaci n al momento del anlisis. OR es una manera de mantener actualizada la informacin .

Nmeros y localizacin Para expresar las direcciones de nuestras viviendas hemos elegido hacerlo con nmeros que establecen nuestra localizacin relacionndola con una posicin conocida. Referido al planeta deberemos citar Latitud y Longitud de un punto ubicado en nuestra vivienda. Lo comn es fijar un punto cero en la localidad, al cual se lo denomina punto o Lugar o Centro de Referencia. Ntese que el Centro de Referencia , o Km 0 en el lenguaje ciudadano, habitualmente no se ubica en la vivienda de nadie, por cierto que siendo el punto una localizacin virtual , l mismo no es una vivienda real . Cualquier ubicacin en una localidad est referida a ese Centro y se urbaniza con las calles perpendiculares cada 100 metros hacia los cuatro puntos cardinales. Si se dice que alguien reside en Calle 12 Oeste 1464 Norte, queda claro que vive en un lugar al cual pertenece el punto donde se cruzan dos lneas perpendiculares imaginarias que distan del Centro de Referencia: la primera 1200 m al Oeste y la otra 1464 m al Norte. En Estad stica Descriptiva las funciones ( Parmetros y Estadgrafos ) son utilizados como Referencia de localizacin de los valores de las variables. Como veremos poco m s adelante es muy til

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

saber la localizacin de un valor con respecto a otro utilizado como referencia. En lenguaje coloquial, es importante saber que tan lejos o cerca del centro de referencia est un determinado valor y cmo se agrupa el conjunto. En el lenguaje estadstico se denominan a estos nmeros referenciales, calculados con las mediciones realizadas, Medidas de Referencia .

Medidas de referencia Se utilizan dos tipos de medidas , las que identifican el Centro de Referencia de la Poblacin o de la Muestra y las que expresan la distribucin ( Dispersin en la jerga Estadstica) de los valores de esa poblacin o de esa Muestra alrededor del centro. En el nuevo idioma que estamos aprendiendo se habla entonces de Medidas de Tendencia Central y de Medidas de Dispersin, respectivamente. En la traduccin a nuestro lenguaje cotidiano, proponemos entenderlo como las referencias para localizar los valores individuales o reales de la variable en estudio.

Medidas de tendencia central 1. Media o Promedio : Se calcula dividiendo el valor resultante de sumar todos los valores obtenidos (Sumatoria ) de la Variable (v) por el nmero de valores obtenidos ( n ).

2. Mediana : Es un valor de la variable que separa al conjunto en igual nmero de valores mayores y menores que l mismo. Como se refiere a localizacin sera ms apropiado decir igual nmero de valores a un lado y a otro , o por encima y por debajo . Por ejemplo, si los valores obtenidos fueron: -2, 0, +2, +4, +6 , la mediana de esa serie es +2. Se la puede definir slo con la jerga estadstica, veamos dnde estamos con el idioma: "la mediana es el valor de la variable cuya frecuencia acumulada es mayor que la mitad de la frecuencia del valor total". Todava no lo manejamos? Quiz sea oportuno repasar el item Frecuencia: Mediciones y Relaciones. En series grandes y/o "pares" de valores existe una frmula para calcular la mediana que utiliza la Distribucin de frecuencias y el rango entre cada par de valores inmediatos. A ese rango se lo denomina: Intervalo de clase. 3. Modo: Es el valor de la variable ms frecuente. Por ejemplo, si los valores obtenidos fueron: 2,2,2,3,5,7, el modo es 2 . En series grandes y/o "empatadas" el modo se calcula tambin con frmulas que utilizan la Distribucin de frecuencias y el Intervalo de clase .

Medidas de dispersin 1. Rango: Es una manera de sealar los lmites de las localizaciones posibles. Se expresa con dos valores, el valor m s alto y el valor ms bajo obtenidos de la variable. Por ejemplo: los valores obtenidos fueron: 2,3,3,4,5,6, el rango es 2 y 6 . 2. Cuantilo : Es un valor de la variable que separa al conjunto dejando ubicados una parte, un

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

porcentaje o una proporcin por encima y otra por debajo de ese valor. Por ejemplo, el Percentilo 25 es el valor de la variable que deja por debajo al 25% de los valores obtenidos y por encima al 75% de esos valores. 3. Desvo: El promedio o media o medio, se construye sumando los valores reales y dividiendo esa sumatoria por el nmero de valores reales que se sumaron. Por ejemplo: los valores obtenidos son 2, 2, 3, 3, 4, 4, 7, 7, 8, 10; la media es 5. En este caso el valor promedio no es uno de los valores reales obtenidos. No importa, aprendimos que al promedio lo necesitamos como una referencia para ubicar a los valores reales y relacionarlos al respecto entre ellos mismos. Esa es la idea del concepto Desvo en este nuevo idioma, expresa la localizacin de un valor real con respecto al centro de referencia. El Desvo se calcula restando el valor al promedio. En el ejemplo de marras los desvos de los valores reales obtenidos son: -3, -3, -2, -2, -1, -1, +2, +2, +3 , +5. En el leguaje coloquial diramos que hay valores que estn m s cerca y otros ms lejos del promedio; con otras palabras, el desvo nos dice la ubicacin relativa del valor respecto al promedio y por ende, tambin de los valores entre s. Para que tenga sentido , entonces, el desvo se expresa conjuntamente con el promedio de referencia ; para legos, es la "direccin" de un valor de la variable. Varianza y desvo standard o medio Si la intencin es inferir como se distribuye la poblacin, la totalidad, sealar cada desvo es engorroso y poco prctico, por lo tanto, para esa finalidad, si la distribucin de los valores de la variable es ms o menos simtrica tiene sentido calcular el Desvo Medio (Promedio de los Desv os) o Desvo Standard ( DS ) de los valores de la variable. Se calcula mediante la siguiente frmula:

La frmula expresa que la sumatoria ( ? ) de los desvos al cuadrado (x )2 debe dividirse por el nmero de valores obtenidos ( n) ; eso ya lo conocemos, es calcular el promedio de los desvos, lo novedoso es elevar los desvos al cuadrado para luego extraer la raz cuadrada ( v ) al promedio obtenido. Suele usarse ( n 1) en lugar de n, y en eses caso se habla de "grados de libertad". Para el lenguaje de nuestras conversaciones cotidianas es un galimatas. Los valores reales obtenidos de la variable son nmeros mayores y menores que el promedio. Eso significa que habr desvos positivos y negativos , como ya vimos en los ejemplos previos. Hicimos la analoga de que el desvo es la "direccin" del valor. Imagine qu sentido podra tener dar su direccin o su telfono con nmeros negativos. Trabajar con "direcciones negativas" es todo un tema, ms an porque en realidad los desvos son localizaciones reales , positivas en la jerga comn, y no valores negativos en el sentido de tales nmeros reales. Lo que interesa, ms que una localizacin precisa de los valores, es inferir la dispersin promedio , la ubicacin promedio , comn, Standard, o si se prefiere, cmo se agrupan. Recordemos algunas cosas simples de matemtica, nos ensearon que nmeros reales que se elevan al cuadrado dan como resultado un nmero real con signo positivo. Por ejemplo: (-2) 2 = +4 (+2) 2 = +4 4 ya que la positividad est implcita por omisin. Elevar al cuadrado la sumatoria de los desvos, antes de dividirlo por el nmero de datos, da como resultado que la direccin promedio de los desvos es positiva. El Desvo promedio Positivo, en tanto cuadrtico, se denomina Varianza. En las comparaciones de muestras, podremos estudiar no solamente las diferencias en las medidas de

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

tendencia central, promedios, medianas o modos; tenemos la posibilidad de comparar las dispersiones, en otros trminos, de analizar la varianza de muestras. Se abre la posibilidad de apreciar que muestras que parecen similares, que parecen representar a la misma poblacin por la similitud de sus medidas de tendencia central , en realidad al analizar la varianza exhiben una dispersin tan distinta que podran representar a poblaciones diferentes. El conjunto se agrupa de manera diferente. La varianza es muy cmoda para trabajar matemticamente, pero convengamos que como expresin de dispersin, de ubicaciones, de "direcciones", alrededor de una medida de tendencia central, al tener un solo signo se autolimita como idea de ubicacin. Recordbamos que un nmero elevado al cuadrado da un resultado positivo, el procedimiento inverso, extraer la raz cuadrada de un nmero, da un resultado que admite (tiene) los dos signos conocidos.

Si la varianza es la expresin cuadrtica de la dispersin promedio, parece m s inteligible referirse, generalizando, a la ubicacin de los valores de la variable por medio de su Raz Cuadrada, ya que al tener los dos signos expresaremos mejor la idea que queremos transmitir, esto es, que "los valores de la variable estn localizados ms o menos tanto alrededor de ". A la Raz cuadrada de la Varianza se la denomina Desvo Medio o Standard y se lo simboliza como DS. Por supuesto, para que tenga sentido el DS debe expresarse conjuntamente con la medida de tendencia central de referencia; para legos, es la ubicacin promedio (la dispersin) de los valores de la variable alrededor del "Km 0". Comparemos dos muestras, una caracterizada por 50 y DS 1, otra por 50 DS 15. El DS expresa como se dispersan los valores en general. Si volvemos a nuestra analoga de ver al desvo como las "direcciones" de los valores, la primer muestra ( 50 1 ), nos sugiere que los valores estn ubicados muy prximos, si fuesen viviendas pensaramos en un vecindario urbano, la segunda muestra ( 50 15) describira una zona rural. Los datos de la Estadstica Descriptiva son utilizados por la Estadstica Inferencial . El problema es resolver si las dos muestras del ejemplo representan a una misma poblacin. Piense la conclusin si compara solo los (50 y 50) , sin hacer ningn clculo no parece la misma conclusin si compara DS ( 50 1 y 50 15 ) o si se concentra en analizar las varianzas (1 y 225 ). 1 y 225 resultan de DS2 ya que DS = v v y por lo tanto v = DS 2. Queda claro que para inferir comparando muestras, son importantes los valores, pero tambin las funciones, todas ellas, especialmente las que expresan la manera en que se "localizan", se distribuyen, se dispersan los valores de la variable. En biologa es frecuente comparar muestras contra s mismas ; por ejemplo, antes y despus de un determinado tratamiento. Si se comparan slo los promedios puede pasar algo semejante a lo del ejemplo previo, no apreciar diferencias, a pesar de que el tratamiento realmente cambi las condiciones basales. En otros trminos, que la muestra post tratamiento no representa a la misma poblacin que la muestra pre tratamiento, pero eso, a veces, slo se percibe con claridad analizando la varianza de las muestras.

Distribucin y localizaciones conflictivas Algunos valores reales de la variable pueden tener una localizacin tan distante de la medida de tendencia central que surjan dudas sobre su pertenencia a la poblacin. La Estadstica Descriptiva contempla estas situaciones analizando los posibles modos de distribucin de los valores de la variable: Distribucin Simtrica o Asimtrica.

Distribucin simtrica y marginalidad

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Se la reconoce por la coincidencia del valor de media, mediana y modo. A un valor que impresiona fuera de contexto, que es difcil aceptarlo como perteneciente a la poblacin muestreada, se lo denomina Marginal . Su equipo de trabajo explor los valores de colesterol sanguneo en 100 varones de 30 a 50 aos asintomticos y sin antecedentes personales ni familiares de factores de riesgo para aterosclerosis con examen fsico normal. El 68% de los valores se encontraron en el rango 170 a 190 mg%; el 95% en el rango 160 a 200 mg% y el 99% en el rango 150 a 210 mg%. Un valor hallado, y corroborado que no se trataba de un error tcnico, fue 450 mg%.La duda es considerarlo un valor normal casual y por lo tanto incluirlo para los clculos o, una rara enfermedad gentica con hipercolesterolemia sin impacto clnico temprano. Se trata claramente de un valor marginal. Su equipo decide comunicar su hallazgo y aclarar que no se lo incluy en los clculos hasta no completar estudios genticos .

Distribucin asimtrica Se las reconoce por la falta de coincidencia entre media y mediana. Los valores de la variable tienden a agruparse (modo) hacia alguno de los extremos. El reconocimiento de la distribucin es muy importante para el tratamiento estadstico. Aplicar frmulas propias de una distribucin simtrica a valores dispersos de manera asimtrica provoca errores con trascendencia en la proyeccin y en las inferencias . En dispersiones asimtricas se debe optar entre media y mediana como medida de Tendencia Central ; hay que decidir y elegir la que se crea ms til como referencia para caracterizar la distribucin de los valores de la variable. La media esta muy influenciada por los valores extremos, por marginales. Por ejemplo: los valores obtenidos son 2, 4, 6, 8, 40; la media es 15 ; la mediana es 6 . El tratamiento matemtico para proyectar e inferir conclusiones de las muestras a la poblacin vara segn el tipo y la distribuci n de los valores obtenidos.

Index curso - Clase anterior - Clase siguiente

Publicacin: Septiembre 2005 Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingeniera e Informtica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

1994-2005

CETIFAC - Bioingenier a UNER

Webmaster Actualizacin: 13-sep-05

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingeniera e Informtica Mdica/Bioengineering- Medical Informatics

Curso: Bioestadstica bsica para mdicos asistenciales

Clase N 3: Tablas y Grficos


Raul E. Ortego Carlos R. Secotaro
Index curso - Clase anterior - Clase siguiente

Es un acervo de los pedagogos que "una imagen expresa ms que mil palabras". La Estadstica incorpora esta idea a su modo de transmitir seales, datos, conclusiones. Tablas Es una manera de presentar datos agrupados para facilitar comparaciones. Se ordenan las Variables en Filas (Horizontales) y los Datos en columnas (Verticales). Los datos de las variables quedan ordenados en Tablas de "Contingencia" (lo que ha sucedido y lo que no ha sucedido). Veamos un ejemplo imaginario utilizando las Columnas para anotar pacientes con y sin Diabetes; las filas para anotar los pacientes con y sin Infarto de Miocardio (IAM).

Coordenadas cartesianas Son dos lneas perpendiculares (Ejes) que se cruzan en un punto que funciona como el 0 (cero) para las cuatro semirrectas resultantes. Por convencin hacia arriba y hacia la derecha son valores positivos. El Eje horizontal o Eje de las Abscisas o Eje de las X es el Eje de la Variable. El Eje Vertical o Eje de las Ordenadas o Eje de las Y es el Eje de la Frecuencia.

Histograma

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

La frecuencia de la variable se expresa con un rea determinada (vg: barras)

Polgonos de Frecuencia Se unen los extremos de las barras y se puede comparar en un mismo grfico distintas poblaciones o muestras.

Polgonos de distribucin acumulativa Son polgonos de frecuencia en los que se coloca en el eje de ordenadas la frecuencia acumulada. Permite observar y eventualmente comparar, la evolucin temporal de la variable en una o ms muestras simultneamente.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Scatter Se representa cada valor de la variable con un punto en un grfico de coordenadas cartesianas. Es la imagen de la dispersin de los valores de la variable, del modo de distribucin (Simtrica o Asimtrica) y permite observar valores marginales en el contexto global. Trazar lineas de Correlacin.

Campana de Gauss Los fenmenos biolgicos tienen habitualmente la Distribucin de Frecuencia de los valores de la variable prcticamente simtrica. El Polgono de Frecuencia resultante adopta una forma particular denominada: " Campana de Gauss "

Imgenes e ideas En nuestra idea de estudiar la Estadstica como idioma, la "Bioestadstica" sera un "dialecto" especfico, por el que nos interesamos especialmente. No conviene avanzar en Bioestadstica sin reflexionar sobre la "Campana de Gauss". Este simple Polgono de Frecuencia se convierte de un grfico en una "piedra fundamental" de las ideas, en un cimiento del anlisis de fenmenos biolgicos. Para tenerla in mente simplificaremos la "campana" a su expresin basal: el par de coordenadas cartesianas tradicionales para Variable y Frecuencia (X e Y) con el agregado de sealar el valor Promedio o Medio o Media ( ) recordando que por ser simtrica la distribucin, ese valor es el mismo de

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

la mediana y del modo. La lnea de la campana proponemos imaginarla "punteada", siendo cada punto una localizacin, una ubicacin, como veremos a continuacin. En la imagen de la Distribucin Simtrica que pretendemos instalar como idea, como base de pensamiento y de expresin, agregaremos dos lneas perpendiculares. Una contiene al punto del valor medio, la otra contiene al de mayor frecuencia. Se cortan, coinciden, en un punto cspide de la campana.

Valor y localizacin En una distribucin de frecuencias simtrica, el valor real "x" de frecuencia de aparicin "y" se ubica, se localiza, en el punto A "xy" de la curva.

Para nuestro idioma asumamos que esa es una localizacin absoluta, "cruda", no referida a ningn otro valor de la variable. Cada punto de la lnea de la "campana" es la localizacin de cada valor de la variable. La lnea de puntos es la sucesin de localizaciones del conjunto de valores de la variable. La "campana" es un smbolo grfico de cmo se distribuye, se dispersa o si se prefiere, cmo se agrupa, la poblacin o muestra estudiada. Proponemos hablar y pensar de cada "campana" como si fuese el "mapa", la "localidad", de una poblacin o de una muestra.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Pertenencia por localizacin En la analoga propuesta pensamos a la localizacin de un valor concreto como la "residencia" de ese valor de la variable identificado en el Eje de las X. La localizacin no es el valor de la variable (su identidad), la localizacin es dnde se ubica ese valor de la variable acorde al nmero de veces que se repite. Por la ubicacin, por la direccin de una residencia, reconocemos a la localidad y dentro de ella al "barrio" (la localidad pequea, ntima) a la que pertenece. Pensemos al punto A (xy desde ahora) desde la perspectiva de la lnea punteada que es la "campana" dnde se localizan el conjunto de valores de la variable (la poblacin). El punto xy pertenece a la localizacin en general del conjunto de valores de la variable que se est estudiando. El punto xy de una localidad puede pertenecer a ms de una poblacin.

En realidad a cada localizacin es mejor an que nos la imaginemos para nuestras conversaciones y pensamientos como una posada, un albergue, dnde conviven, cohabitan, muchas identidades, miembros de diferentes "comunidades", de diferentes conjuntos de valores de la variable, de diferentes poblaciones o muestras. Un estudio compar el efecto de una gaseosa "light" sobre la glucemia en ayunas. Analiz una muestra de pacientes diabticos y una ms pequea de pacientes NO diabticos como control. En los resultados vieron que un valor absoluto (x) de glucemia de 100 mg% se encontr en la muestra de glucemias de pacientes diabticos pero tambin en la muestra de glucemias de pacientes NO diabticos. Por el valor (x) no se reconoce a la muestra ( poblacin) de pertenencia. La localizacin xy "cruda","pura", "absoluta" pertenece a ms de una muestra, por ende, tampoco la ubicacin aislada indica muestra o poblacin de pertenencia. Observe la localizacin xy y su relacin espacial (distancia) a la vertical (en color rojo) que pasa por el valor medio de cada una de las campana a las que pertenece xy. Sin aplicar frmulas, con su lxico cotidiano, observando esa relacin, piense a cual de las dos muestras descriptas por cada campana (podran ser poblaciones) tiene ms probabilidad de pertenecer el valor x de localizacin xy. Por la localizacin relativa de un valor de la variable se puede establecer la probabilidad de pertenecer a determinada poblacin o muestra segn corresponda.

Valores reales y virtuales Los valores reales se identifican (son), en el Eje de las X. Los valores reales "x" se localizan en un punto xy, se ubican, "existen", conforme a su frecuencia de aparicin en la lnea de la campana de su poblacin.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Se localizan exactamente en el punto de interseccin, entre la vertical que pasa por el Eje de las X (su identidad, el "valor") y la horizontal que pasa por el Eje de las Y (su frecuencia de aparicin). La lnea curva, la " campana ", en esta analoga de ubicaciones, es la lnea que recorre las localizaciones de todos y cada uno de los valores reales de la variable. El valor medio, el promedio, la media, como medida de Tendencia Central que es, habamos propuesto presentarla como el "Km 0", como el centro de referencia. La vertical que pasa por el valor medio es una lnea de referencia para localizar con respecto a ella misma a cada uno y al conjunto de valores reales de la variable; esa lnea es una referencia para ubicar el conjunto con sus relaciones intrnsecas. El promedio o valor medio o media ( ) es una idea, una construccin, un valor de referencia, un valor virtual, que a veces, puede ser el mismo que uno real; siempre es un valor virtual, puede coincidir con un valor real. Un valor real, aunque eventualmente coincida numricamente, "no es" el promedio. Proponemos como ejercicio de abstraccin abandonar la idea de que el promedio es el valor real ms frecuente; resistirse a aceptar al promedio como que "vive", que "existe", que es "real" y que se "localiza" en el punto de mayor frecuencia. Es una trampa intelectual creer que al promedio se lo "encuentra" fabricndolo con los valores reales hallados; es una falacia comn creer que el promedio es un valor real que exista y estaba "oculto", disimulado entre esos valores reales. Un simple ejemplo para luego continuar. Suponga una variable discreta con valores siempre PAR, por ejemplo, dados los valores 2, 4, 6, 8; el promedio es 20/4 = 5 ?! Los valores reales son siempre pares, el promedio es impar. NO hay problema, es un valor virtual alrededor del cual se distribuyen los valores reales.

El promedio y el conjunto

El valor del promedio y la lnea vertical que lo contiene es una referencia comn a diversas poblaciones o muestras. La coincidencia en el promedio es claramente insuficiente para identificar a un conjunto determinado, especfico, de valores de una variable, es decir a una muestra o poblacin. Slo observar la figura basta como argumento probatorio de estas afirmaciones.

El mensaje de la campana Los valores reales de la variable son insuficientes para identificar la muestra o poblacin a la cual

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

pertenecen esos valores. Las localizaciones de los valores reales de la variable son insuficientes para identificar la muestra o poblacin a la cual pertenecen esos valores. Poblaciones o muestras diferentes comparten valores reales, localizaciones de los mismos y pueden compartir tambin al valor virtual de referencia que se denomina promedio. La localizacin de un valor de la variable con respecto, referida, al promedio del conjunto de valores de la variable, permite calcular la p robabilidad de pertenencia de ese valor, a ese conjunto de valores de la variable (poblacin o muestra).

Index curso - Clase anterior - Clase siguiente

Publicacin: Septiembre 2005

Tope

Preguntas, aportes y comentarios sern respondidos por el relator o por expertos en el tema a travs de la lista de Bioingeniera e Informtica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

Enviar

Borrar

Dr. Diego Esandi Co-Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co-Presidente Comit Cientfico


Correo electrnico

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

1994-2005

CETIFAC - Bioingeniera UNER

Webmaster Actualizacin: 15-sep-05

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingeniera e Informtica Mdica/Bioengineering- Medical Informatics

Curso: Bioestadstica bsica para mdicos asistenciales

Clase N 4: Error Standard


Raul E. Ortego, Carlos R. Secotaro
Index curso - Clase anterior - Clase siguiente

El Error Standard podramos expresarlo conceptualmente como el error que se puede cometer al intentar conocer a una Poblacin por una Mue s tra de s misma. La frecuencia absoluta de aparicin de rangos de glucemias en una Poblacin (estn todos, no es una muestra) de 4600 pacientes No diabticos fue la siguiente:

Tabla de Resultados

Histograma de frecuencia y polgono de frecuencia

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Conceptos y tipo de variable Para facilitar la comprensin del ejemplo hemos transformado una variable continua como es la Glucemia en una cardinal como es el "rango de glucemia". Lo hemos hecho para que la "localizacin" de los valores de la variable sea ms simple. Los conceptos sobre las limitaciones (el Error ) de conocer a la poblacin por una muestra se aplican en los estudios que utilizan variables cualitativas nominales o cardinales, que "cuentan" para obtener la frecuencia de aparicin en cualquiera de sus modalidades. Por supuesto que ocurre lo mismo si se trabaja con relaciones de las frecuencias obtenidas, como son el "Riesgo o Prevalencia", el "Odds Ratio", etc. Es conveniente destacar que las "ideas fuerzas" que expondremos a continuacin son las mismas cuando se trabaja con variables cuantitativas continuas o discontinuas. En la analoga propuesta en este ensayo, se trata del mismo idioma, el mismo lenguaje.

Localizacin en la "Campana": Al histograma de frecuencia que se denomina "Campana", lo simplificaremos para trabajar, "colgando" en cada "localizacin" el nmero de "habitantes" de ese valor de la variable all "alojados" o "ubicados" si se prefiere.

La lnea gruesa vertical que divide a esta "campana" con distribucin simtrica en fracciones iguales, es la lnea que ya estudiamos pasando simultnemente por el valor PROMEDIO , por el valor de la MEDIANA y por el valor del MODO. No est de ms recordar que en cada "localizacin" se alojan habitantes que comparten la identidad en cuanto al valor de la variable en el Eje de las X, pero que pertenecen a otras comunidades (Poblaciones). En este caso, esos otros "ocupantes" en cada "rango", podran pertenecer a poblaciones de pacientes Diabticos y de diversos tipos de Diabetes. A esos valores de la variable ("individuos") "alojados" en la misma localizacin que los miembros de la poblacin en estudio, pero que no pertenecen a ella, los ignoraremos, los discriminaremos, como si no "existiesen".

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

El Azar del Muestreo Si observa la campana de la poblacin del ejemplo encontrar, a los 4600 "pobladores", la totalidad, "localizados" segn cada valor de la variable de la poblacin. Observe que los valores en este caso son 7 (siete) rangos, las localizaciones tambin son 7 (siete), los pobladores son 4600 distribudos simtricamente. Una muestra es una fraccin de una poblacin que se obtiene tomando azarosamente a algunos miembros de la poblacin "muestreada". Idealmente una muestra sera una "miniatura " de la poblacin. La idea de muestra est concebida imaginando que la misma es una "copia a escala" de la poblacin. En el imaginario, la muestra no slo representa sino que reproduce (a escala) a la poblacin con sus caractersticas de distribucin. En nuestro ejemplo, no necesitamos hacer ningn "clculo de probabilidades" para saber que una muestra del 10% de la poblacin (460 pacientes) no ser obtenida, si de verdad es por azar, tomando un 10% de cada "localizacin". El azar, que garantiza ecuanimidad en la representacin; conspira contra la exactitud de la "copia a escala". Obtener tal tipo de copia sera "sacar la lotera", es posible pero muy poco probable.

Cantidad y representacin Si por el azar del muestreo la "extraccin" no es proporcionalmente idntica para cada "localizacin", no hacen falta frmulas para intuir que las campanas de diversas muestras no sern iguales entre s, ni tampoco una "miniatura" exacta de la poblacin. Las campanas de las muestras no son un calco entre s; tampoco la contraccin (fraccin proporcional exacta si se prefiere) de la campana de la poblacin.

La muestra "ideal", la "miniatura" o "copia" a escala, en color rojo en el grfico, es muy til para captar algunas ideas que luego se expresarn en el "lenguaje" estadstico. Las localizaciones con pocos "habitantes" tienen menos probabilidades de obtener representantes en el muestreo; sin hacer clculos de probabilidades, slo observe las flechas punteadas en color rojo "buscando" representantes y en color celeste la frecuencia de aparicin de ese valor en la poblacin y en la muestra. No slo eso, mirando el grfico, reflexione sobre las chances de lograr "copia exacta" en la representacin si las posibilidades de simplemente "aparecer" ya son escasas.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Tampoco es necesario un clculo matemtico complejo para percibir que cuanto menor proporcin de la poblacin sea includa en la muestra (ms pequea la muestra), mayor ser el Error en la Representacin de la Poblacin. Error por muestreo Comprendida la idea de que la muestra no es una representacin "exacta" de la poblacin, debemos asumir un Error en la representacin, un Error por muestreo, en las proyecciones y en las inferencias que inducimos desde una muestra a su poblacin. Si la mala noticia es que las muestras tienen ERROR, la buena noticia es que ese error puede ser calculado con notable precisin. En los prrafos y grficos anteriores se explic la idea de que hay una relacin inversa entre tamao de la muestra y Error por muestreo. El concepto "cuanto menor la muestra, mayor el Error" tiene una expresin matemtica que la Estadstica incluye en los clculos de proyeccin e inferencias. Error promedio o error standard En nuestro conocida campana, dejamos la muestra ideal (miniatura) en color negro e incorporamos al grfico las imgenes de dos muestras de diferente tamao. La muestra mayor en color celeste y la muestra menor en color rojo. En la poblacin y en cada una de las muestras inclumos la lnea vertical que divide en dos fracciones iguales a cada campana. Es la lnea que contiene a la medida de tendencia central ; la lnea que en nuestro intento de comprensin, asumamos como referencia de localizacin o "Km 0".

El grfico no es "caprichoso" al dibujar cada lnea de referencia de localizacin, la referencia obtenida con la muestra ideal "miniatura" es coincidente con la medida de tendencia central verdadera, es decir la de la poblacin. No tiene Error de Muestreo. Conforme a las ideas que se discutieron previamente, las muestras reales no tendrn la medida de tendencia central igual a la de la poblacin de origen. En la realidad hay Error de Muestreo. La diferencia de la medida de tendencia central de la muestra con la referencia verdadera de la poblacin depender inversamente del tamao de la muestra.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

En el grfico, la muestra celeste, ms grande, tiene una referencia de localizacin ms prxima a la verdadera, con menor Error, que la muestra roja, ms pequea. El Error de muestreo se expresa en el lenguaje estadstico agregando a la medida de tendencia central de la muestra un valor, calculado teniendo en cuenta el tamao de la muestra, que informa cuan alejada est esa referencia de la real de la poblacin. El valor del Error de la muestra se denomina Error Promedio o Error Standard.

Clculo del error standard Conocemos el nmero que figurar en el denominador de cualquier frmula que calcule el Error Standard (ES), ser el nmero de casos analizados, ser el tamao de la muestra en relacin inversa al ES. Nos falta colocar un nmero en el numerador de la Ecuacin que calcule el Error. En el caso de variables cuantitativas continuas , se utiliza como numerador al Desvo Standard obtenido en el muestreo. El Desvo Standard la estudiamos como una medida de distribucin; para nosotros, legos, una expresin de la dispersin de las localizaciones, de la manera en que se ubican con respecto a la lnea de referencia los valores de la variable. En nuestras humildes analogas, entendamos al Desvo como el "domicilio" del valor de la variable. En esa idea, el Desvo Standard (DS) o Desvo Promedio, como valor agregado a la medida de tendencia central (media y/o mediana) informa con la expresin DS si las localizaciones en general estn ms o menos alejadas de la lnea de referencia, del "Km 0" para nuestra traduccin al lenguaje cotidiano. Una muestra con gran DS, con mucha dispersin de las localizaciones, con amplia distribucin si se prefiere, ser ms difcil asumirla como representacin homognea (sin error de representacin) de una poblacin, ms an si las inclusiones son azarosas. Se comprende que para calcular el Error Standard de muestreo, el DS es directamente proporcional al ES ; DS y ES tienen relacin directa ( mayor DS , mayor ES ). As se llega a la expresin matemtica, en la que "n" es el tamao de la muestra.

Las razones matemticas para utilizar como denominador la raz cuadrada del tamao de la muestra escapan a la finalidad de este ensayo, nos basta con entender que tal artilugio aritmtico no cambia la esencia de las ideas que hemos discutido. Para trabajar matemticamente con variables cualitativas, la estadstica apela al recurso simple de contar las apariciones (frecuencia de aparicin) de cada opcin de la variable, ya que contamos cualidades y no valores cuantitativos. Obtenidas las frecuencias de aparicin en la muestra, la Estadstica relaciona estas frecuencias entre s de diversas maneras para trabajar con ellas (Riesgo, Odds , etc.) Estas relaciones o proporciones resultan de referir un nmero a otro. Ese otro nmero es el utilizado como referencia. Si de Riesgo o Prevalencia se trata, la relacin o proporcin se construye colocando en el numerador el nmero de Eventos contados y en el denominador el nmero total de referencia, el tamao de la muestra . De esta manera se expresa, por ejemplo, que el Riesgo de muerte durante la internacin por Infarto de miocardio (IAM) es de 0.1 o lo que es lo mismo 10% 10 / 100 . Con ello se dice que de cada 100 pacientes internados por IAM se mueren 10 pacientes. En realidad la muestra de estudio fue de 1040 pacientes y la cantidad de pacientes fallecidos fue de 104. El clculo de 104/1040 arroja como

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

resultado 0.1 o sus expresiones porcentuales. En estos tratamientos matemticos se capta rpidamente que cuanto mayor sea el tamao de la muestra, cuanto ms cercano el tamao de la muestra al total de la poblacin, mayor ser la probabilidad de que la relacin hallada sea verdadera, se percibe que el Error de muestreo, el error por "reclutamiento" azaroso sea menor. Se ratifica la idea previa, a mayor tamao de la muestra, menor error. Estas relaciones proporcionales o, simplemente proporciones, aritmticamente, se calculan utilizando al tamao de la muestra como denominador, como referente; luego la proporcin hallada tiene relacin inversa con el tamao de la muestra. En un sentido aritmtico estricto, se podra decir que a mayor tamao de muestra, menor proporcin; "Riesgo" si fuese esa la proporcin estudiada. Esto carece de sentido porque es evidente que a mayor tamao de la muestra, mayor nmero de eventos, mayor numerador; el resultado neto es una proporcin ms cercana a la verdadera. En la expresin Riesgo, es mejor como idea interpretar que a mayor tamao de muestra, menor Error en la estimacin del Riesgo. Por la construccin matemtica del Riesgo, surge que el Error del Riesgo est en relacin directa al valor calculado . En realidad se sigue vinculando al Error con el tamao de la muestra y de manera inversa; mayor tamao de muestra, menor error. Si "P " es la proporcin hallada en la muestra, la ecuacin para calcular el Error Estndar (ES) que utilizan los expertos en Estadstica es:

Si repasamos lo expuesto previamente, caemos en la cuenta que el tamao de la muestra ( n ) aparece explcito en el denominador y est implcito en el numerador. Quizs lo nico que debamos recordar de esta ecuacin para nuestras expresiones idiomticas estadsticas es que, para calcular el ES en las relaciones obtenidas con variables cualitativas, el nmero "llave" es el tamao de la muestra; ratificando la idea de que a mayor tamao de muestra, menor error de muestreo, menor ES.

Index curso - Clase anterior - Clase siguiente

Publicacin: Septiembre 2005

Tope

Preguntas, aportes y comentarios sern respondidos por el relator o por expertos en el tema a travs de la lista de Bioingeniera e Informtica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

Enviar

Borrar

Dr. Diego Esandi Co-Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co-Presidente Comit Cientfico


Correo electrnico

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

1994-2005

CETIFAC - Bioingeniera UNER

Webmaster Actualizacin: 15-sep-05

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingenieria e Informatica M dica/Bioengineering- Medical Informatics

Curso: Bioestadstica bsica para m dicos asistenciales Clase N 5: Probabilidad de Pertenecer


Ra l E. Ortego, Carlos R. Secotaro
Index curso - Clase anterior - Clase siguiente

En su hospital deciden probar un adminculo que determina la glucemia de manera incruenta en el lecho subungueal. El paciente slo debe introducir en el mismo un dedo de la mano y en 3 segundos aparece en una pequea pantalla el nivel de la glucemia en mg%. Se resuelve hacer un control con personas a los cuales se les determinar la glucemia por m todos tradicionales. Se planifica aparear para comparar , es decir cotejar el par de datos obtenidos en el mismo paciente, uno con el aparato de marras y otro suministrado por el laboratorio. En el laboratorio del hospital se realizan ms de 300 glucemias diariamente en pacientes con diversas patolog as y en personas normales por exmenes de admisin laboral. Para asegurarse la aleatoriedad en las muestras, se decide que durante los cinco das h biles de la prxima semana, un residente diferente por da, har la determinacin subungueal en cada uno de los pacientes que concurren al laboratorio con un pedido de glucemia. Cada residente deber presentar en un grfico de coordenadas cartesianas los polgonos de frecuencia superpuestos de glucemias obtenidos por ambos mtodos. Cada grfico exhibe dos curvas bimodales, una curva con los valores obtenidos con el aparato nuevo (color rojo) y una con los obtenidos de manera tradicional (color negro); un modo corresponde a glucemias de personas NO diabticas y el segundo modo a la distribucin de glucemias de pacientes diabticos.

La situacin se complica al comprobarse que en realidad el grfico de cada residente es parecido pero NO idntico al de sus compaeros de trabajo. Los datos apareados obtenidos por cada residente no son idnticos. Al superponer las 10 curvas obtenidas se observa lo siguiente:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Le proponemos que desde cualquier valor de la variable levante una vertical, por ejemplo desde un valor alrededor de 110 mg%; observe en cuantas muestras puede alojarse ese valor. Ahora traze una horizontal desde cualquier frecuencia de aparicin, por ejemplo a una altura del 25% de la mxima frecuencia absoluta obtenida; observe cuantas curvas presentan una interseccin con esa lnea. Cambiemos la perspectiva, en un grfico de coordenadas cartesianas representaremos un punto de interseccin entre la vertical levantada desde un valor u opcin de la variable y la horizontal de un valor de frecuencia. En nuestras analogas el punto de interseccin "xy" es un "lugar de localizacin".

Si proyecta cualquier localizacin xy de un valor u opcin de la variable en un grfico como el de los residentes, es evidente que una localizacin puede pertenecer a ms de una muestra, o ms de una poblacin ya que la situacin es la misma.

Localizacin e Incertidumbre Nos encontramos en el meollo del problema que aborda la Estadstica, buscando certezas obtuvimos incertidumbre. En la problemtica del aparato y las glucemias se observa que el valor de la variable glucemia 110 mg% se "localiza" en un punto xy que pertenece tanto a la curva de los pacientes diabticos como a la curva de las personas No diabticas. En otros trminos, en la "localizacin" xy se alojan valores u opciones de la variable que siendo iguales en identidad, pertenecen a ms de una muestra o poblacin. El problema prctico aparece cuando se debe responder a una persona con glucemia 110 mg% si es o no diabtico; otro tema trascendente es establecer el valor de corte, el nmero con el que se dividir a la poblacin en Diabticos y No Diabticos. En el grfico superponemos en color negro la "campana" de la poblacin no diabtica; en colores rojo y verde, dos de las curvas obtenidas por los residentes.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Probabilidad de Pertenencia Una localizacin xy admite el mismo valor de la variable de varias muestras o poblaciones. No se puede certificar a qu curva pertenece una localizacin. Se puede calcular la probabilidad de que una determinada localizacin pertenezca a una curva.

Observe el grfico, tiene frente a ud. dos curvas de glucemias, una curva roja y una curva verde, ambas con dos campanas. Las campanas ms altas corresponden a los pacientes NO diab ticos, las ms bajas (menor frecuencia de aparicin) a los pacientes diabticos. El punto xy seala la localizacin del valor 110 (x =110 mg %) . Observe la lnea horizontal de la frecuencia de aparicin, repare en qu "rama" de qu "campana" se produce la interseccin con la curva verde; repita el procedimiento con la curva roja. Sin hacer ningn clculo, slo con el significado coloquial del trmino probabilidad (que suele simplificarse usando la letra "p"), seguramente coincidir en que para el residente que obtuvo la curva roja el valor 110 corresponde, pertenece, con mayor "p" a una persona del grupo de pacientes diabticos. Con el mismo razonamiento, el residente que obtuvo la curva verde opinar que el valor 110 tiene mayor "p" de pertenecer a una persona del grupo NO diabtico. En otros trminos, que una persona con glucemia 110mg%, para un residente tendr mayor "p" de ser diabtico, y para el otro residente, mayor "p" de ser NO diabtico. La verdad no est a nuestro alcance para el caso individual, slo podemos acceder a la "p" de pertenecer a una muestra o poblacin de referencia, lo cual como veremos no es poca cosa, y nos permitir manejarnos razonablemente con la incertidumbre.

La Ecuacin de la Distribucin Simtrica Enfrentemos la ecuacin de la "campana", confesando que a primera vista asusta, parece slo para elegidos, para inteligentes que "dominan" las matemticas.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Si observamos detenidamente esa ecuacin, advertimos que la podemos simplificar bastante para nuestra pretensin de slo pensar y hablar sin hacer cuentas. Esa ecuacin presenta constantes universales como son el nmero "1", el n mero "2", el nmero "" y el nmero "e" (base de los logaritmos "naturales"). Adems presenta constantes de cada poblacin como son los parmetros y G.

No supone ningn error matemtico asumir que constantes de cada poblacin relacionadas, vinculadas con cualquier operacin aritmtica a constantes universales, mantienen su caracterstica de Constante Poblacional. En la campana de cada poblacin, o muestra, ya que es la misma idea, la frecuencia de aparicin "y" para un valor "x", en otras palabras la localizacin xy, depender del exponente que afecta al n mero "e". Ese exponente es la clave, ese exponente es lo nico No constante en la Ecuacin de la Distribucin Simtrica.

Un nmero llamado "Zeta" o "Chi" En lgebra del ciclo bsico nos ensearon que podemos utilizar letras para construir y trabajar con ecuaciones de aplicacin general; en cada aplicacin prctica slo deberemos reemplazar la letra por el valor numrico especfico del problema. El exponente del nmero "e" en la ecuacin de la campana es en s mismo, una "mini" ecuacin, al resultado de esa mini ecuacin se lo denomina "Z" (zeta). Veamos:

En la frmula ecuacin de la "campana", Z es un exponente negativo para el nmero e. Recordemos un poco ms, elevar un nmero a un exponente negativo es lo mismo que elevar la inversa de ese nmero al mismo exponente con signo positivo. Es importante destacar esto porque significa que cuanto ms grande el exponente, ms pequeo el resultado final. veamos:

No hace falta que vuelva a su texto de aritmtica elemental, solamente recuerde que esos artilugios algebraicos no modifican lo esencial.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Lo esencial est en la magnitud del nmero " Z" y en que es un exponente negativo. En algunos clculos estadsticos, con modificaciones operativas NO esenciales, cambia de nombre, por ejemplo adopta el de ( Chi) ; como dice un amigo mexicano que entiende de estas cosas "se trata de la misma gata, pero revolcada", en efecto: Z 2=
2

"Z" " " es un exponente y un exponente negativo en una ecuacin que tiene como variable dependiente "y" que en este caso es la Frecuencia de Aparicin de un valor u opcin de la variable. En sntesis, cuanto mayor magnitud tenga "Z", menos frecuente que aparezca en la poblacin, o muestra, el valor de la variable "x" con el que se calcul ese nmero "Z".

La magnitud de "Z" Los valores con que se calculan "Z" son la diferencia entre un valor de la variable "x" y el promedio de la poblacin " ", es decir, el Desvo ; ya vimos por qu se lo eleva al cuadrado, en el denominador est el Desvo Standard "G" tambin elevado al cuadrado, lo que se denomina Varianza.

Se destaca como idea de esta ecuacin que cuanto mayor el desvo de un valor "x", mayor es "Z" y por lo tanto menor su frecuencia de aparicin "y" . Eso es coherente con nuestras analogas, es menos probable que una localizacin "xy" pertenezca a la poblacin o muestra a la que se la pretende referir, si se trata de un valor "x" muy "desviado", muy lejos del "Km 0" ; cuanto ms alejada la "localizacin", cuanto ms grande "Z" o " ", menos probable la pertenencia. No es imposible, slo es poco probable ; conviene recordar que alguno "gana la lotera". Como veremos a continuacin con mayor detalle, si el valor de la variable "x" coincide con el valor virtual del promedio " ", el desvo es 0 (cero) ; el exponente es 0 y cualquier nmero elevado a la 0 da resultado 1. La menor magnitud de "Z" es 0, corresponde a la mayor frecuencia de aparicin "y" ; se obtiene con un valor de la variable que sea igual al promedio. En realidad esta ecuacin no s lo plantea el Desvo como factor gravitante, lo que pone como dato crucial es la relacin entre el desvo y el desvo promedio. En nuestra traduccin a la jerga coloquial sera, la "direccin del valor" con respecto a la "Direccin en general"; si se prefiere un lenguaje ms tcnico, la dispersin espec fica con respecto a la dispersin genrica. Este concepto implica que un Desvo "grande" puede "amortiguarse" en su impacto sobre la magnitud de "Z" si la Varianza es "grande" en proporcin similar. La magnitud de "Z" depende de la relacin Desvo/Desvo Standard, o lo que es lo mismo, de la relacin Desvo Cuadrtico/Varianza.

Zeta es Universal La relacin matemtica que concluir en Z tiene en numerador y denominador la misma unidad en cada poblacin o muestra, pueden ser unidades de peso, de volumen o cualquier otra en cualquier modalidad. Lo constante es que se trata de la misma unidad de medida en numerador y denominador, luego, se simplifican (se anulan a s mismas) y el resultado final es que siempre Z es un nmero SIN UNIDAD. Lo mismo ocurre cuando Z adopta la presentacin (Chi).

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Z no tiene unidad de medida y en realidad es una relacin entre el Desvo de un valor de la variable y el Desvo promedio construido con todos los valores de la variable. En numerador y denominador de esa proporcin hay nmeros de similares rangos de mangnitud; as por ejemplo la relacin 1.000.00/2.000.000 arroja el resultado 1/2 o 0.5 idntico al que se obtiene con una relacin como 0.001/0.002 150/300, etc.

Z es una proporcin sin unidad, luego, Z es universal para la Estadstica. Los expertos en Estadstica han elaborado tablas con diferentes valores de "x", asignando al promedio m un valor de 0 (cero) y al Desvo Standard (G ) un valor de 1 (uno) . Si el valor de la variable es igual al promedio (x = ) , como ya vimos, el desvo es 0 (cero) y todo termina en que Z = 0 ( cero); como Z es un exponente, y como cualquier nmero elevado a la 0 (cero) es 1 resulta que el valor de "y" ser 1. El mnimo valor que puede exhibir Z es 0 y esa es la mxima frecuencia de aparicin "y" que puede alcanzar un valor real de la variable "x". Ese valor real "x" ser uno que coincida con el promedio ; un valor que sea igual a ese n mero virtual de referencia, a esa que es el promedio. Cualquier valor de la variable "x" diferente de resultar en un nmero Z mayor que 0 ( cero) en valores absolutos. Ya habamos enfatizado al analizar la ecuacin de la distribucin simtrica que cuanto mayor es Z menor es "y"; mayor Z, menor frecuencia de aparicin. En esas tablas a las que hacamos referencia, elaboradas con diferentes valores de "x" , que resultan en diferentes valores de Z se encuentra para cada uno de estos Z un valor de "y" . La frecuencia de aparicin "y" para cada Z se puede expresar como tal o como el porcentaje de aparicin con respecto al conjunto. Por ejemplo si Z = 0 corresponde a 1 (la mxima frecuencia de aparicin), Z = 2 podra corresponder a 0.025 (el 2.5% de las "apariciones"). La probabilidad de pertenencia de un valor de la variable "x" para un Desvo Standard (G ), a partir de calcular la frecuencia de aparicin "y" con Z puede expresarse como ese porcentaje de aparicin. Conocido Z, se calcula la frecuencia de aparicin "y" que se puede expresar como un porcentaje de las apariciones del conjunto, como la probabilidad de aparecer. La situacin habitual es que ante la aparicin de un valor de la variable "x" en una recoleccin de datos, muy alejado (Desviado) del promedio, el investigador quiere saber si ese valor pertenece o no a la muestra o poblacin estudiada; quiere saber la probabilidad de que ese valor "sea de ", que pertenezca a la poblacin y que su aparicin sea simplemente el resultado de la casualidad, del azar. Calcular el nmero Z informar la probabilidad que tiene un valor de la variable "x" de aparecer y por ende de pertenecer a la poblacin o muestra del estudio. En el lenguaje estadstico, a la frecuencia de aparicin "y" de un valor de la variable "x" se la expresa de manera indirecta, se hace referencia a la probabilidad de aparecer en una muestra o poblacin en estudio se valor "x" de la variable. Si a la frecuencia de aparicin, se la expresa referida a las apariciones del conjunto, sa ser la probabilidad ("p") de pertenencia a la campana del conjunto, un nmero agregado a la letra "p", por ej.: p < 0.01 o dicho de otro modo: la p robabilidad de pertenecer es < del 1%. En sntesis, dado un valor de la variable "x" de una muestra o poblacin estudiada, calculando el nmero Z se establece la probabilidad que tiene de pertenecer a la muestra o poblacin asumiendo que su aparicin es simplemente el resultado del azar. Z permite calcular la probabilidad de pertenecer.

La Probabilidad de Pertenecer

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

La Ecuacin de la Distribucin Simtrica (la "campana") es universal y la variable dependiente es la frecuencia de aparicin "y" . La proporcin sin unidad, tambin universal, denominada "Z" es una funcin del Desvo cuadrtico de un valor de la variable "X" en el numerador y del Desvo Standard cuadrtico o Varianza en el denominador. "Z" es un exponente negativo y por lo tanto afecta de modo inverso al resultado final que es la frecuencia de aparicin "y". .

Dijimos que en el lenguaje estadstico la frecuencia de aparicin "y" de un valor de la variable "X" es referida de manera indirecta, se menciona su probabilidad de aparicin. El problema habitual que enfrenta la bioestadstica m dica es el inverso. La investigacin debe establecer la probabilidad de que un valor real y concreto "X" menos frecuente, pertenezca, o no , a una muestra o poblacin de referencia. Al ser el valor real diferente del promedio, del valor referencial, la Bioestadstica calcula la probabilidad de que ese valor de la poblacin haya aparecido simplemente por azar. La bioestadstica debe asignar a una diferencia hallada la probabilidad de que sea simplemente casual, azaroso. El mecanismo para establecer esa probabilidad (p) se entiende analizando la "Campana" y su Ecuacin. En realidad como ya vimos, de la ecuacin slo nos interesa el clculo de Z. Estudiaremos ahora que probabilidad tienen de aparecer valores de la variable "X" diferentes del promedio en uno, dos o tres Desvos Standard. Observe la "ecuacin" de Z , veamos que probabilidad tiene de aparecer un valor de X que genera Z = 1 Z = 2 Z = 3. Recordemos que si ( X = ) resulta Z = 0 y la frecuencia es 1 ; la mxima posible: 100%.

Se aplica la Ecuacin de la campana, se "localizan" los valores "X" acorde a su frecuencia de aparicin "y" observndose que:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

La manera de expresar lo mismo en la jerga estadstica dijimos que era indirecta, y por lo tanto, la probabilidad (p) de un valor de la variable de pertenecer a una poblacin y haber aparecido slo por casualidad es , segn se "aleje" del promedio:

Lo anterior es una generalidad, queda claro que a partir de calcular el nmero "Z", se puede conocer la probabilidad (p) precisa de que un valor o una diferencia sea casual. Esta es la forma de construir las tablas que mencionbamos previamente. Reiteremos una vez ms que los mismos fundamentos estn implcitos en el clculo del nmero (chi) cuya aplicacin veremos ms adelante.

Index curso - Clase anterior - Clase siguiente

Publicacin: Octubre 2005 Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingenieria e Inform tica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico 1994-2005

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

CETIFAC - Bioingenier a UNER

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Webmaster - Actualizacin: 03-Oct-2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingeniera e Informtica M dica/Bioengineering- Medical Informatics

Curso: Bioestadstica bsica para m dicos asistenciales Clase N 6: Hiptesis de Trabajo


Ra l E. Ortego, Carlos R. Secotaro
Index curso - Clase anterior - Clase siguiente

Podramos comenzar parafraseando a Shakespeare, ya que trataremos de responder a una pregunta esencial: Ser diferente o NO ser (parece) diferente? . Hemos aceptado que estudiamos un universo aleatorio y que las tcnicas utilizadas para proyectar e inferir trabajan con fracciones de las poblaciones denominadas "muestras". La definicin de una fraccin de la poblacin como "muestra" implica como condicin sine qua non que los valores de la variable de la poblacin includos en tal fraccin hayan sido incorporados rigurosamente por azar . Hemos comprendido en el anlisis del Error Standard , que el "muestreo" supone la consecuencia de que las muestras tienen diferentes funciones estadsticas (promedios, desvos, etc) que la poblacin de origen y an entre ellas mismas. Muestras de la misma poblacin son "funcionalmente" diferentes entre s. Este concepto es primordial en la interpretacin de los datos estadsticos. En efecto, las comparaciones en biologa, como discutamos en los primeros captulos, procuran averiguar, cambiando circunstancias en una muestra, si se producen modificaciones en las funciones estadsticas de la misma, modificaciones "de fondo", modificaciones "significativas". Si se modifican de manera significativa las funciones estadsticas de la muestra , se concluir que las circunstancias operativas han cambiado a la poblacin de referencia. Analizemos un ejemplo de lo expuesto: 1. Los pacientes Diabticos sin control estricto de la glucemia , como poblacin, est n caracterizados por determinados indicadores de complicaciones microvasculares en retina, rin, etc. Los pacientes diabticos con control estricto de la glucemia estn caracterizados por diferentes (menores) ndices de tales complicaciones. Controlar estrictamente la glucemia ha determinado que exista una nueva poblacin de pacientes diabticos con caractersticas (expresadas por las funciones estadsticas ) significativamente diferentes de la poblacin de diab ticos que no tienen esa circunstancia del control estricto de la glucemia.

2. 3.

Repitamos un concepto que expusimos a propsito de introducirnos en la Estadstica Inferencial: se analizan las funciones estadsticas de las muestras para procurar saber (inferir), si esas muestras provienen o no de la misma poblacin. Si la circunstancia estudiada modifica caractersticas funcionales (los parmetros) de la poblacin, significa que en realidad ha cambiado la poblacin de referencia , ya que los parmetros son esencialmente constantes para cada poblacin. La estadstica trabaja habitualmente con estadgrafos (funciones de muestras) y a partir de ellos proyecta y/o infiere parmetros (funciones de poblaci n). De la discusin previa sugerimos recordar que en las comparaciones estadsticas la diferencia entre muestras es la regla . Hiptesis sobre el significado de la diferencias

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

El tema es darle un significado a las diferencias e inferir si se trata de representantes de diferentes poblaciones o simplemente de consecuencias del azar que supone el muestreo. La pregunta inicial, " es diferente o parece diferente?", en el lenguaje estadstico se plantea en trminos de "hiptesis" . En trminos coloquiales: la presuncin a verificar . La hiptesis nula, implica que la diferencia observada se atribuye al azar. La hiptesis alternativa, interpreta que la diferencia observada significa que se est frente a representantes (muestras ) de poblaciones diferentes. El anlisis de los trabajos de investigacin culmina en aceptar la hiptesis nula o la hiptesis alternativa. La conclusin es dar significado a las diferencias observadas. El uso de los verbos atribuir e interpretar es absolutamente tendencioso, procura como finalidad ratificar que el significado estadstico es slo una respuesta razonable. Frente a la incertidumbre, el significado estadstico es una aproximacin a la verdad, acorde a una probabilidad calculada, de ninguna manera es una pretensin de certeza, ya que un hallazgo "estadsticamente significativo" no es una verdad de cumplimiento inexorable para individualidades. Creemos muy conveniente recordar una vez ms que "comprar billetes de lotera" no es un mecanismo estadsticamente significativo para "zafar" econmicamente; intente explicrselo a una persona que se "sac la grande" o a alguien que no le gusta trabajar y "compra billetes de lotera" con dinero que otro gan trabajando. Estamos empleando reiteradamente dos palabras de gran importancia en el lenguaje estadstico y con asociacin implcita indisoluble: "probabilidad y significado". Para la estadstica, por la probabilidad (p) se asume el significado .

"Estadsticamente significativo" Estadsticamente significativo es un par de vocablos, que asociados expresan sobre el hallazgo al que hacen referencia, que es poco probable que sea slo casual. Subrayar el trmino "poco" lo creemos necesario para sealar que en las conclusiones estadsticas se debe indicar precisamente el nivel de probabilidad (p) al cual se le asignar "significado estad stico" . El lector de los datos presentados tiene la opcin de plantearse otro nivel de probabilidad para descartar la hiptesis nula. Veamos un ejemplo: 1. 2. 3. 4. 5. 6. Un trabajo concluye que la prescripcin de determinada droga disminuye de manera "significativa" la mortalidad del Infarto Agudo de Miocardio. En "material y mtodo" los autores describen el tratamiento estadstico que hacen de los datos obtenidos; expresan que interpretarn las diferencias como "significativo" con una p < 0.05 . Los datos obtenidos muestran una disminucin de la mortalidad en el grupo tratado con la droga con respecto al control "con p < 0.03" . Para los autores la diferencia es estadsticamente significativa, descartan la hiptesis nula y aceptan la hiptesis alternativa. Un eventual lector decide no trasladar esa prescripcin a su prctica hasta que no se presenten trabajos similares que tengan "p < 0.01" . El lector piensa que la evidencia no es suficiente para descartar la hiptesis nula, a su juicio, la diferencia hallada en la mortalidad puede haber sido slo casual.

Clculo de "p" Estimamos que todava puede persistir la desazn que nuestros lectores experimentaron al leer el artculo "probabilidad de pertenecer".

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Haya Paz!! y tranquilidad. No insistiremos con las ecuaciones por ahora. Baste, por el momento, con tener "in mente" que trabajando con las diferencias obtenidas, con los estadgrafos apropiados; teniendo en cuenta el tipo de variable estudiada, y la distribucin (sim trica o asimtrica), se puede estimar con notable precisin la probabilidad de que las diferencias observadas, "aparecidas", sean slo casuales, la consecuencia del muestreo. La probabilidad de hallazgo casual se expresa con la conocida "p = un nmero". Los diversos tratamientos estadsticos de los datos, que veremos someramente en prximos artculos, procuran establecer la "p" de las diferencias observadas.

Errores de significado Con la "p" de que el hallazgo sea casual se interpreta el significado de ese dato; si se lo acepta como diferencia casual, se confirma la hiptesis nula y se concluye que todos los datos corresponden a muestra (s) de una sola poblacin. Por el contrario, la interpretacin de que la diferencia hallada no fue casual, significa que los datos corresponden a muestras de poblaciones diferentes, por lo tanto se acepta la hiptesis alternativa. Con este planteo existen slo dos errores posibles: 1. Error (alfa) o Tipo I. Consiste en equivocarse dndole a los hallazgos un significado que implica descartar la Hiptesis Nula y Aceptar la Hip tesis Alternativa. En trminos coloquiales: parece diferente pero es ms de lo mismo. Error (beta) o tipo II . Es la equivocacin opuesta, negar la diferencia como significativa cuando en realidad efectivamente corresponde a muestra (s) de poblaciones diferentes. En la calle se dice que " se equivocaron ya que es "sincero" porque no slo parece , en realidad es ."

2.

El error o tipo I La manera ms sencilla de cometer un error es aceptar diferencias como significativas con niveles "altos" de que las mismas sean casuales. En general, en bioestadstica se interpreta como casual a cualquier diferencia que tenga una p > de 0.05 de serlo . Recordando algo del clculo de "p" , se interpreta como casuales a diferencias que tengan un desvo < a dos Desvos Standard . Sin profundizar en teora del Error por cuanto no slo escapa a la finalidad de estos artculos, sino tambin, y especialmente, al conocimiento acabado de los autores, creemos importante sealar algunas actitudes que subyacen, disimuladas, en interpretaciones con error tipo I "falso positivo ": 1. Extraer de los datos ms informacin de la pretendida : Los investigadores ensayan todo tipo de comparacin y combinacin posible no prevista en el diseo que calcul el nivel de "p" aceptable y el tamao de la muestra. A mayor nmero de comparaciones y combinaciones de datos entre las muestras, mayor probabilidad de Error tipo I en alguna de las comparaciones. Anlisis de fracciones de datos : Son los conocidos subgrupos, en el tratamiento de conjunto no se alcanz "significacin" pero en tal o cual "subgrupo" "la p di significativa" . Nuevamente, fraccionamiento de datos no previstos en el diseo aumenta la probabilidad de Error tipo I. Obstinacin : Como la idea es "buena" si la "p" no "d" es porque el tratamiento estad stico es "malo". A mayor nmero de enfoques (tratamientos) estadsticos, mayor probabilidad de Error tipo I al obtener "p significativa" con alguno de ellos.

2.

3.

Mayores y mejores especificaciones sobre este trascendente tema pueden hallarse en el libro " Investigacin Clnica en Cardiologa" del Dr Arturo Cagide, editado por Propulsora Literaria (1991) en el cap 5 pag 39 a 46. Slo destaquemos que se puede calcular matemticamente el error al comienzo del estudio, en el diseo, o an despus si se considera necesario o conveniente realizar algunas de las acciones descriptas en los prrafos previos. Le proponemos a nuestros lectores recordar al error o tipo I como la equivocacin por el "s fcil" o

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

por empecinamiento, popularmente expresado como "s s ".

El error

o tipo II y la potencia del estudio

El error o tipo II quizs podramos guardarlo en nuestra memoria idiomtica como el error por trabajar con una muestra pequea para la diferencia observada. En efecto, error es negar significado a una diferencia porque el clculo de "p" arroja un resultado superior al lmite de corte asumido para las diferencias casuales. Coloquialmente "no di la p" o "di una p alta". Sostenemos la intencin de cumplir con los postulados iniciales de este ensayo, pedimos perdn, pero debemos retomar el tema de las ecuaciones, aunque slo para mirar.

Al observar las ecuaciones del Desvo Standard (DS G ) y del Error Standard (ES ), que son a su vez los denominadores en el clculo de Z (Zeta) o de (chi), se aprecia que ambos ( DS G y ES ) tienen relacin inversa con el tamao de la muestra (n ). Cuanto menor tamao la muestra, mayor DS, mayor ES . Recordemos el ejemplo del exponente negativo: Si se observa la ecuacin de la distribucin simtrica, especialmente la "mini" ecuacin para calcular el exponente negativo Z (Zeta), o la ecuacin similar para calcular (chi) como veremos ms adelante; la relacin es tal que a mayor DS ( G) menor Z (Zeta), y ocurre lo mismo con la relacin del ES para calcular (chi). Cuanto menor Z (Zeta) o menor (chi), mayor probabilidad de aparicin "y". La mxima frecuencia de aparicin "y" coincide con Z = 0, (Valor de x = ).

Una diferencia pequea en el numerador de la mini ecuacin de Z (Zeta) o de (chi), que se mantuviese prcticamente sin variaciones a medida que aumenta el tamao de la muestra (n) se traducir en un Z (Zeta) o (chi) progresivamente mayor porque ir disminuyendo gradualmente G ( DS) o el ES (si se est calculando ). A mayor tamao de la muestra , menor DS y/o ES, mayor Z (Zeta) y/o (chi). El numerador prcticamente no vara porque en el caso que nos ocupa la diferencia es de poblaciones , no parece, es real, genuina, no es slo casual por muestreo ; el resultado final al aumentar ( n) en estas circunstancias es que la misma diferencia tendr progresivamente menor chance de parecer casual, ir disminuyendo la "p". En el diseo de un estudio se determina el error o tipo II "aceptable", en general en el orden del 20%, se expresa de modo inverso indicando que la "potencia" del estudio es del 80%, y se introduce en los clculos para establecer el tamao de la muestra. La potencia del estudio es su capacidad de detectar pequeas diferencias y asume una determinada probabilidad de error o tipo II. Si resulta que "la p no da significativa" , se confirma la Hiptesis Nula y se descarta la Hiptesis Alternativa, sabiendo que la probabilidad de una interpretacin errneamente negativa ( Falso Negativo) es la inversa de la potencia, predeterminada al calcular el tamao de la muestra (vg: 0.20 20%).

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

La Hiptesis, el Error, y la Biotica Hemos discutido estos temas ex profeso antes de analizar diseos de protocolos para investigar cualquier tema que necesite de la Bioestadstica. Creemos que es muy buena prctica de los equipos de trabajo revisar sistemticamente sus rutinas laborales, sus resultados, y las propuestas y resultados de otros equipos. Nos parece tambin muy bueno, incluir en la revisin sistemtica las bases te ricas de los procedimientos implementados. Los temas a investigar suelen decidirse en el marco de las discusiones que implican esas revisiones sistemticas. La propuesta de una investigacin debera superar siempre y en primera instancia la infranqueable barrera del respeto, a los derechos humanos y a la conservacin del ambiente en el que la vida es posible. Estamos convencidos de que el diseo de un protocolo es esencial en las consideraciones bioticas; en conjunciones expresivas, diramos el "qu" y el "cmo". Nos parece un tema relevante, trascendente, un tema "mayor", discutir con el experto en estad stica los aspectos vinculados al "cmo" se debe y se puede percibir si una suposicin tiene, marca, manifiesta, una diferencia significativa. La "presin por publicar", cuando no tambin la bsqueda del natural "reconocimiento social" o su desviacin frecuente, el afn de notoriedad; y por qu negarlo, tambin intereses econmicos financieros, se manifiestan en tratar a la bioestadstica como un tema "menor"; es "nada ms que el anlisis matemtico de los datos obtenidos ". Por el simple recurso de descubrir que el tamao de la muestra necesario para lograr una "potencia" razonable en una determinada investigacin escapa a las factibilidades reales del equipo, se puede decidir presentar "slo" una estadstica descriptiva. En biotica se discuten temas como la equidad y la justicia en el uso de los recursos . No es un tema "menor" la discusin sobre invertir recursos humanos, recursos limitados y "no renovables" de los humanos como lo es el tiempo, recursos comunitarios como los econ micos financieros, insumos comunitarios como son los recursos tecnolgicos, an los "privados" por aquello de la "responsabilidad social del capital", etc. Este apartado procur destacar algunos trminos de significado muy preciso en la jerga estadstica para nuestras conversaciones proyectando eventuales investigaciones.

Index curso - Clase anterior - Clase siguiente

Publicacin: Octubre 2005 Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingeniera e Informtica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

1994-2005

CETIFAC - Bioingenier a UNER

Webmaster Updated: 08/17/2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingenieria e Informatica M dica/Bioengineering- Medical Informatics

Curso: Bioestadstica bsica para m dicos asistenciales Clase N 7: Intervalo de Confianza


Raul E. Ortego, Carlos R. Secotaro

Index curso - Clase anterior - Clase siguiente

En este tema los conceptos se desarrollan tambin con palabras conocidas, pero acorde a su significado, en el marco de conversaciones cotidianas, la asociacin "suena" ininteligible; por el contrario, en bioestadstica, expresan un concepto muy preciso. Nos parece que la principal dificultad para entender este tema es que, justamente, se lo aborda desde el significado habitual de los trminos en el lenguaje coloquial. En el diccionario de nuestras consultas (ibid), intervalo es un espacio o un tiempo que separa dos lugares o dos momentos. En m sica tiene una acepcin, que aunque esencialmente matemtica, no nos ayuda mucho a nuestros propios intrngulis.

A qu espacio o tiempo est refirindose intervalo en bioestadstica? Nuestras analogas sobre "localizacin" (espacio) de los valores de la variable, tal vez, nos sirvan tambin en este caso, ya veremos. En los coloquios, y para el diccionario (ibid), confianza tiene varias acepciones: "Esperanza firme en una persona o cosa" , " nimo, aliento y vigor para obrar", "Familiaridad en el trato". La "cosa" en bioestadstica es un determinado hallazgo. Por otro lado, una de las acepciones del verbo confiar (ibid) es: "Esperar que ocurra algo" . El "algo" de referencia para la bioestadstica es una repeticin, un "bis". Proponemos utilizar para el lenguaje de la Estadstica el siguiente significado de confianza : la esperanza firme en la veracidad de un hallazgo; tambin es til la acepcin de esperar que ocurra algo parecido a lo que ya sucedi. Para ratificar que seguimos dentro de la lengua de Cervantes, quizs en un dialecto en realidad, sugerimos interpretar el intervalo de confianza como la esperanza de que un fenmeno sucedido se repita dentro de lmites determinados. En el tema intervalo de confianza (IC) se analiza la probabilidad de que el hallazgo en una sola muestra no slo represente, sino que permita identificar (confianza) constantes de la poblacin de referencia, si no exactamente, al menos aproximadamente (intervalo) .

Por una muestra inferir la poblacin El anlisis de muestras es el procedimiento que usa la Estadstica para conocer las caractersticas de una poblacin determinada. Los estadgrafos (funciones de las muestras) son variables y excepcionalmente coincidirn con los parmetros (funciones de la poblacin). Ms an, en el caso de que Estadgrafos y Parmetros sean iguales, no se reconocer esa circunstancia por cuanto los parmetros son desconocidos.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Asumido que el promedio de una muestra no coincide con el promedio de la poblacin que se desea conocer (inferir); la estadstica apela a procedimientos matemticos para calcular la probabilidad de que el promedio de la poblacin () se ubique dentro de un rango determinado a partir de los estadgrafos hallados. No est dems recordar que rango , como vimos en Estadstica Descriptiva, es una manera de sealar los lmites de las localizaciones posibles , los lmites del intervalo . El espacio limitado por el rango es un intervalo . La esperanza de que el promedio poblacional se encuentre en ese rango es el grado, el nivel de confianza que desea establecer. La probabilidad con la que se establecen los lmites del intervalo es un coeficiente a elegir, habitualmente se opta por 95% 99%. Los estadgrafos se distribuyen simtricamente alrededor de los parmetros ; tanto ms cierta esta afirmacin, cuanto ms grande sea la muestra. Si se analizan experiencias con varias muestras, la confianza (esperanza) es que los diversos estadgrafos se ubicarn en el intervalo calculado con una sola de esas muestras (cualquiera) con una probabilidad predeterminada (coeficiente elegido) . Quedan as definidos intervalo de confianza y coeficiente de confianza .

La representacin no es una reproduccin en escala Trataremos de integrar el IC con ideas y expresiones que ya hemos analizado:
l l l

La Distribucin Simtrica o "Campana". El Error Standard (ES ) o "Error por Muestreo". Confianza, esperanza, en que se repitan funciones en sucesivos muestreos. Utilizaremos nuevamente uno de los grficos empleados para discutir ES .

En el grfico est la "campana" de la localizacin de cada valor de la variable de la poblacin, la muestra "miniatura" ideal, la muestra roja 2 y la muestra celeste 1. Reutilizaremos tambin uno de los grficos de la "Probabilidad de pertenecer ".

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Este grfico de distribucin simtrica expresa que el 68% ( 34% en cada lado de la campana ) de los valores de la variable se "localizan" ( y X ) en la campana en el rango del promedio 1 G ( Desvo Standard ); tambin se observa que el 95% de ellos ( 47,5% en cada lado de la campana ) se ubican en el rango 2 G , y en el rango de 3 G se ubica el 99% (49,5% en cada lado de la campana). Los expertos suelen manejarse con la "sombra" de la curva denominada "rea bajo la curva" (en relleno rojo del grfico a la derecha se observa el 99% del " rea bajo la curva ")

Sin hacer ningn clculo se aprecia que los promedios (estadgrafos) de las muestras de las dos poblaciones de esta comparacin (No Diabticos y Diabticos) se distribuyen alrededor de sus respectivos promedios (parmetros) poblacionales. La distribucin de los estadgrafos de las muestras alrededor de los parmetros de su poblacin de referencia tambin es prcticamente sim trica. Esto parece natural, las muestras no slo representan, son ellas mismas expresin de fenmenos biolgicos. Tanto ms grandes las muestras, cuanto ms simtrica cada una de ellas, y m s simtrica la distribucin de estad grafos alrededor de los parmetros. Proponemos retener estas ideas para comprender el lenguaje: 1. 2. 3. Las muestras tienen funciones diferentes a la poblacin que representan. Las muestras de una misma poblacin tienen funciones diferentes entre s. Las funciones de muestras de una misma poblacin se distribuyen simtricamente alrededor de las funciones de la poblacin representada.

Para muestra basta un botn

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Se puede retomar nuestra conocida "campana", por su universalidad, tambin para una cuestin que podramos resumir en una afirmacin y una pregunta:
l l

Los estadgrafos difieren con los parmetros y an entre s representando a la misma poblaci n. Cu ntas muestras analizar para proyectar y/o inferir razonablemente sobre la realidad de una poblacin? Veamos lo que sucede cuando superponemos una sola muestra con su promedio y su Desvo Standard ( DS ) sobre su poblacin representada ( G).

El 95% de los valores de la variable de la poblacin que se localizan en la campana se encuentran dentro del rango 2 G. No hace falta hacer cuentas para percibir que el promedio de una muestra de esa poblacin ser un valor que aunque calculado (virtual) tendr aproximadamente un 95% de probabilidades de estar dentro del mismo rango poblacional ( 2G ). En otros trminos, analizando 100 muestras, 95 de ellas tendrn un promedio dentro de ese rango poblacional ( 2 G).

En la bsqueda de Dado el promedio de una muestra : Qu tan alejado est de el promedio de la poblacin ? Se puede intentar una respuesta slo con el Desvo Standard ( DS) de la muestra. Ser ms precisa la respuesta si se corrige ese DS con el tamao de la muestra (n), a esa correccin del DS se la denomina Error Standard ( ES ) y es, como ya hemos visto, una expresin matemtica del error por muestreo .

Si observa el grfico con las campanas superpuestas de una poblacin con una de sus posibles muestras, no necesita demasiados clculos para percibir que el promedio se encuentra dentro del rango de la muestra. 2 DS

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Si en lugar de X (un valor de la variable) se emplea el promedio de la muestra ES , se mantienen las probabilidades de encontrar a .

y se reemplaza DS por el

Introducir ES significa hacer participar de los clculos de Z al tamao de la muestra (n ). La consecuencia es: "Z" tendr valores diferentes segn se modifique "n". El valor de "Z" en el cual la probabilidad de aparicin de un valor es 2.5% (p=0.025) para una muestra con "n" "grande" es 1.96. En otros trminos, el 95% de los valores de la variable (47,5% a ambos lados de la campana) se localizarn en el rango " Z" = 1.96.

En lenguaje matemtico el 95% de los valores posibles de " Z" sern:

En cualquier texto de Estadstica se puede comprobar que simplemente despejando trminos a partir de esta "mini" ecuacin de "Z" de una muestra "grande" se concluye:

Expresndolo con palabras se puede afirmar que con "Z" = 1.96 se verifica que el promedio de la poblacin se localizar con un 95% de probabilidades en el intervalo.

El intervalo sealado por "Z" = -1.96 y "Z" = +1.96 es el que corresponde en una campana a los valores de la muestra X de igual valor absoluto y signo opuesto que delimitan el 95% de los valores aparecidos de la muestra. Las secuencias algebraicas citadas se pueden ampliar y comprender mejor en el captulo 10 pag 214 a 220 del libro "Modern Elementary Statistics", Second Edition del Profesor John E. Freund. Editorial Prentice Hall, Inc. Englewood Cliffs, N.J. (Prentice Hall Mathematics Series. Dr Albert A. Bennett, Editor).

Muestra grande muestra pequea En los clculos aritmticos para despejar al promedio de la poblacin " " se trabaja con el Desvo Standard ( G) de la poblaci n. En realidad ese dato (parmetro) tampoco es conocido; se cuenta con el estadgrafo Desvo Standard ( DS) . Se admite como lgico, y lo confirma la observacin, que "DS" se aproxima progresivamente a "G" en la medida que aumenta el tamao de la muestra ( n) . La correccin del "DS" segn "n" lo expresamos como el Error Standard (ES ). En muestras con variables cuantitativas continuas se considera "grande " una muestra cuando "n" es de 30 valores o ms; la muestra es pequea cuando es < 30. Para nuestra pretensin de poder entender lo que leemos y omos en trabajos cientficos que utilizan estos conceptos para sustentar conclusiones o "evidencias" , quizs nos baste con recordar que con una sola

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

muestra se puede inferir con probabilidad conocida, razonablemente, el promedio de la poblacin de referencia. Ms an, para memorizar, sugerimos redondear el valor de "Z" de 1.96 a 2 y retener este concepto: El promedio poblacional tiene alrededor de un 95 % de probabilidades de ser un valor de la variable includo en el intervalo comprendido entre los valores extremos

.
La salvedad "alrededor de" se origina en que el factor que corrige al ES ya sabemos que no es siempre exactamente "2" ni tampoco siempre es 1.96 ya que es un valor inconstante influenciado por el tama o de la muestra. En realidad al factor de correccin, que se lo denomina "t ", se lo calcula desde una mini ecuacin que tiene las mismas ideas que Z.

El factor de correccin " t " es un valor que depende del tamao de la muestra ( n ) o si se prefiere luego de una sutileza aritm tica ( n 1 ) de los "grados de libertad". La distribucin t erica "t " de las muestras o " Theoretical Sampling Distribution" no es otra cosa que una construccin similar de curvas y tablas como las que vimos al estudiar la "universalidad" de la "campana", cuando citbamos que se pod a calcular Z para cualquier distribucin simtrica asignando un valor a y otro a G (vimos entonces que se poda hacer con 0 y 1 respectivamente). En 1908 W. S. Gosset a quien en su empleo le impedan publicar sus investigaciones, opt por hacerlo de todos modos, pero con el pseudnimo "Student" . "Student" comunic en esa poca las consecuencias del tamao de las muestras "n" sobre la distribucin. Desde entonces, a la familia de curvas y tablas de distribucin investigadas originalmente para muestras "pequeas" (n < 30) pero no limitadas por ese nmero, se las denomina "Distribucin t de Student" o "Distribucin t". Existen tablas con el valor de "t "; como ejemplos citaremos que para una muestra de 60 valores t = 2, y que no vara demasiado entre 20 ( t = 2.09) y 100 ( t = 1.98). Por lo expuesto insistimos en la sugerencia de recordar que el promedio de una poblacin se encuentra con un 95% de probabilidades en el rango del promedio de una de sus muestras "2" ES.

Informes con intervalo de confianza El sentido de conocer el rango dentro del cual se encuentra el promedio "" a partir de los estadgrafos DS trasciende a lo meramente acad mico. Simbolizaremos intervalo de confianza como "IC" agregando a continuacin el coeficiente de confianza elegido, la expresin ser, por ejemplo, IC 95 . Un informe expresa que durante el seguimiento a 5 aos un determinado tratamiento disminuye la mortalidad de la cardiopata isqumica segn OR 0.75 (IC 95 0.45 1.05). OR 0.75 (OR<1) seala que mueren 75 pacientes que tienen prescripto el tratamiento referido cada 100 pacientes que mueren sin recibir ese tratamiento. Est claro que OR = 1 nos dira que mueren igual nmero de pacientes con y sin tratamiento; en otros trminos, el tratamiento no caracteriza a una poblacin particular, distinta de la enfermedad original al inferir diferentes parmetros. Por el contrario, OR > 1 indicara que entre los pacientes con ese tratamiento hay ms muertes que entre los pacientes que no lo tienen prescripto. Con palabras populares, que es "peor el remedio que la enfermedad".

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Intervalo de confianza graficado Se construye con lneas horizontales expresando el informe con el IC y lneas verticales como referencia de las cuales la ms relevante es la correspondiente a la relacin 1 (uno) ya que simboliza la ausencia de diferencias significativas. El informe que debemos analizar expresa OR 0.75 ( IC 95 0.45 1.05)

El intervalo de confianza en este caso agrega al OR de 0.75 que existe una confianza con el 95% de probabilidades de que la relacin real entre la muestra de pacientes que tena prescripto el tratamiento estudiado y la muestra de pacientes a los que no se les instituy, sea un valor de OR localizado en el intervalo limitado por el rango 0.45 a 1.05 . Se puede expresar la misma idea afirmando que si se repite 100 veces la experiencia, en 95 de ellas se espera el OR localizado en el intervalo del rango 0.45 -1.05. No se dice nada diferente si se confa en que existe un 95% de probabilidades de que en sucesivas investigaciones el OR est comprendido en el rango 0.45 1.05.

La interpretacin del IC y el significado estadstico En Hiptesis de Trabajo aprendimos que para dar significado estadstico a una diferencia entre muestras , esto es que representan a poblaciones diferentes , se exiga, al menos, un probabilidad menor al 5% de que la misma fuese casual ( p < 0.05). Con la misma idea en la mente, si confiamos en que con 95 % de probabilidades el OR 0.75 informado representa a una relacin entre muestras que se localiza en el intervalo 0.45 1.05, va de suyo que existe ms de un 5% de probabilidades de que la relacin OR sea > 1 ya que se ubicara por dentro de uno de los lmites (1.05) del intervalo . OR > 1 significa en trminos de interpretacin de la relacin entre las muestras exactamente lo contrario de lo que sugiere OR 0.75 ( OR < 1). Con un 95% de confianza en que la relacin entre muestras puede ser tanto superior como inferior a 1 (uno) se concluye que se est frente a una relacin casualmente diferente de 1; en realidad son muestras de una misma poblacin. En idioma tcnico, se confirma la hiptesis nula y se descarta la Hiptesis Alternativa. Sugerimos que observe nuevamente el Intervalo de Confianza graficado y seguramente coincidir que con slo un "vistazo" descarta la Hiptesis Alternativa y confirma la Nula. Es el rango del intervalo el que da la confianza en que se trate de muestras de la misma o de diferentes poblaciones .

Index curso - Clase anterior - Clase siguiente Publicacin: Octubre 2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingenieria e Inform tica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico 1994-2005

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

CETIFAC - Bioingenier a UNER

Webmaster - Actualizacin: 10-Oct-2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingenieria e Informatica M dica/Bioengineering- Medical Informatics

Curso: Bioestadstica bsica para m dicos asistenciales Clase N 8: Introduccin a las Pruebas Estadsticas
Raul E. Ortego, Carlos R. Secotaro

Index curso - Clase anterior - Clase siguiente

Los conceptos analizados se sustentan en que los valores (los "individuos") de la poblacin de referencia se distribuyen (frecuencia de aparicin) de manera conocida . En captulos previos, propusimos como analoga, imaginar que el valor de la variable y su frecuencia de aparicin determinan la localizacin de ese valor en un grfico ; el conjunto de localizaciones configura curvas de distribucin. Las distribuciones grficas tienen expresiones matemticas , en otros trminos, se puede describir la curva sin palabras , utilizando una ecuacin o frmula matemtica. A modo de ejemplo recordemos el grfico y la ecuacin de la distribucin simtrica.

En la metfora propuesta, para comunicarse con el lenguaje que pretendemos utilizar un poco mejor, ante la palabra distribucin proponemos proyectar nuestra mente a las formas grficas que resultan de la relacin entre los valores en la Abscisas y sus frecuencias de aparicin en la ordenadas. En una conversacin o en una lectura en la que se mencionan pruebas estadsticas, sugerimos tratar de pensar, discutir, leer, con un grfico de coordenadas cartesianas in mente. En el "idioma" estadstico, el grfico es, con mucha frecuencia, una manera ms eficaz que las palabras de transmitir y captar ideas . A la hora de la prueba (test), la comunicacin es con imgenes (grficos).

Dime como se distribuyen tus pares y te dir quien eres probablemente.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Las pruebas o Tests Estad sticos son diferentes "enfoques" matemticos para comparar valores de la variable, sus frecuencias de aparicin y sus funciones derivadas , los estadgrafos, de manera que esas comparaciones permitan inferir si los mismos representan a parmetros de una sola poblacin (hiptesis nula) o a parmetros de diferentes poblaciones (hiptesis alternativa). Tanto estadgrafos como Parmetros son funciones matemticas calculadas a partir de los valores de la variable y sus frecuencias de aparicin, aplicando ecuaciones que asumen determinadas , especficas, distribuciones de la poblacin. Se denominan Tests Paramtricos , a procedimientos estadsticos que utilizan como base para el clculo de probabilidades de pertenencia de valores, de diferencias, o de proporciones, hallados en muestras, a distribuciones especficas de la poblacin, como son la distribucin normal de Gauss, la distribucin terica de Student y muchas ms. Una distribucin particular de la poblacin es la esencia del concepto parmetro; los parmetros son medidas constantes de referencia (tendencia central y dispersin) . Por el contrario, Tests NO Paramtricos , son procedimientos estadsticos que realizan clculos matemticos con los datos obtenidos, sin asumir una distribucin particular , precisa, de la poblacin de referencia; es decir, tratamientos matemticos con datos obtenidos que hacen abstraccin de la distribucin original de los mismos.

Si est bien planteado, la solucin es ms probable Es interesante para diletantes como los autores de este ensayo, que textos de estadstica como los referidos del Profesor Freund (ibid), presentan a las pruebas no parmetricas como ms simples y ms fciles de entender. Al lego, al lector que est necesitado de entender lo que transmiten, pero no de saber como implementarlos, seamos sinceros, hasta el nombre "Test no paramtrico" lo espanta. Si no se conoce la distribucin de la poblacin, es conceptualmente atrevido, quizs hasta errneo, plantear el problema de modo de intentar la solucin, con procedimientos que en su fundamento de comparacin e inferencia, asumen una distribucin particular, especfica, precisa, de la poblacin. Por el contrario, con poblaciones o muestras de distribuciones conocidas, no hay ningn problema conceptual en aplicar tratamientos matemticos que hacen abstraccin de esa distribucin conocida, o de cualquier tipo de distribucin de la poblacin. Para nuestra pretensin idiomtica acerca de la estadstica, proponemos retener que los Tests No Paramtricos son de aplicacin ms genrica, por lo tanto, ms inespecficos y ms "criticables", atentos a las comparaciones y a las ideas que se pretendan inferir mediante su utilizacin. De lo expuesto, quizs lo ms importante, es que en el planteo del problema para cuya solucin requerimos emplear la estadstica, analizar la distribucin de los datos del problema, es esencial para que el enfoque sea apropiado . No se trata de "llenar" casilleros en un software actualizado y "pesado" de estadstica para ver si "da la p". En la siguiente descripcin de diversas pruebas, haremos mencin a las etapas de los procedimientos matemticos que nos fueron tiles para entender las ideas; de ninguna manera pretenderemos ensear el uso prctico del test. Si luego de la lectura de nuestra descripcin de un test, alguien sin m s estudios pudiese aplicarlo, habramos excedido los lmites que nos impusimos al escribir este ensayo. En el cierre de estos captulos, profundizaremos nuestra opinin sobre los "softwares" con los que, adelantemos, no se debe reemplazar a los expertos en estadstica . Nuestra humilde pretensin es slo ayudar a comunicarse con los expertos.

El "Sign Test" o Prueba de los Signos En este test no paramtrico se prescinde de valores absolutos, an con variables cuantitativas

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

continuas; se adjudica un signo ( +) al desplazamiento de la variable en un sentido, y el signo contrario ( -) para el desplazamiento opuesto. Se cuentan el total de "casos" de ambos signos y se cotejan cuantitativamente. Como ejemplo, se ha publicado un trabajo de medicina alternativa que prueba una infusin con una hierba "natural" como mtodo para adelgazar. Al comienzo de la experiencia se determin el peso corporal de 30 pacientes y se les indic la infusin 3 veces por da durante un mes. Al cabo de ese lapso se determin el peso corporal de los pacientes. Se constata que 17 pacientes descendieron de peso, se les adjudica el signo (-), a los 3 pacientes que aumentaron de peso, el signo ( +). Se desestima a los pacientes que no variaron el peso. 20 pacientes variaron su peso. La hiptesis nula se confirmara si 10 pacientes hubiesen sido ( -) y 10 pacientes (+ ). En el ejemplo, los investigadores necesitan conocer la probabilidad de que esa diferencia (17"-" vs 3 "+") haya ocurrido slo por azar y as poder confirmar la hiptesis alternativa interpretando que la hierba en infusin es efectiva para adelgazar. Podran ingresar el total de los casos (17 y 3) a ecuaciones como las que vimos para "Z" , calculando "" y "G" con las ecuaciones de la distribucin binomial. Bsicamente teniendo en cuenta el total de casos que variaron el peso, la probabilidad de cambio para aceptar la hiptesis nula, en este caso 50% (que sea efectiva o que no lo sea), y el tamao de la muestra. Con el "Z" obtenido consultaran en la tabla correspondiente para conocer la "p" de que la diferencia sea casual. El lector ya percibe que los investigadores han asumido una distribucin simtrica de los signos en la muestra. Es fcil observar que el dato final en cada paciente, depende del dato inicial en ese paciente; en esos casos quizs conviene ms, analizar las diferencias que los promedios. En realidad, no se sabe si la distribucin de las diferencias de peso corporal observadas, es la normal de Gauss, la de "t" para ese tamao de muestra o siquiera a cual se parece. Exponer el resultado con nmeros calculados con estas ideas y dar un "significado estadstico" al tratamiento de estos nmeros no cambia la esencia del planteo. Tampoco la simplicidad del m todo necesariamente invalida sus conclusiones.

The U-Test (Mann - Whitney Test) o Prueba de Mann - Whitney La estadstica inferencial procura reconocer a las poblaciones desde las muestras; desde los primeros captulos hemos enfatizado de diferentes maneras que los estadgrafos son conceptualmente inconstantes entre muestras de una nica poblacin, con mayor razn si se trata de muestras de ms de una poblacin. El U - Test es un test no paramtrico utilizado para comparar dos o ms muestras, como una aproximacin antes de aplicar test paramtricos , o cuando se ha desestimado aplicarlos , por tener fundadas sospechas de que las muestras provienen de poblaciones con diferentes modalidades de distribucin. Para confirmar o descartar las hiptesis nula y/o alternativa, los clculos que infieren las probabilidades en los test paramtricos , asumen como condicin necesaria, que tanto los estadgrafos hallados, como los parmetros (constantes) subyacentes, aunque con diferentes valores, pertenecen a poblaciones que se distribuyen de la misma manera, ya sea sta sim trica o con alguna, cualquier asimetra. El test propuesto por Mann y Whitney, que como veremos procura construir una distribucin simtrica especfica (la del nmero "U" ), obviamente, puede aplicarse sin problemas a muestras de poblaciones con distribucin simtrica espontnea. El Mann - Whitney test comienza por integrar a los datos obtenidos , ordenarlos como si se tratase de una sola muestra; establecer un conjunto con los datos. Establecido el orden, creciente por ejemplo, se reagrupa a los valores segn el origen y el rango que ocupan en el ordenamiento conjunto .

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

El test contempla modos de resolver eventuales "empates" de valores y rangos. Se realiza la sumatoria ( ) de los rangos con que se distribuyen los valores:

Se transformaron los valores de las muestras de manera que se pueda utilizar slo un nmero para cada una de ellas (la sumatoria de rangos o el rango promedio) permitiendo as una primera comparacin: Queda por asignarle una probabilidad de azar a las diferencias observadas. Se calcula el nmero "U" de cada muestra: Al lector que pertenezca a la poblacin de personas que no se sienten cmodos en el mundo de las matemticas, le sugerimos que simplemente observe las frmulas para captar la idea de que el experto elabora el nmero "U" , el Promedio y el Desvo trabajando con el total de los datos obtenidos y NO con el dato propiamente. 1. Se calcula con la sumatoria de los rangos de cada muestra en particular, pero, considerando para la obtencin de cada "U" un factor resultante del tamao de las muestras, operando (no la simple suma) con el total de valores obtenidos.

2. Se calcula un promedio "" para "U" tambin considerando un factor calculado con el total de los valores obtenidos.

3. Se estima un desvo Standard "G" de "U" de manera semejante a lo que vimos para proporciones y siempre procediendo con el total de los valores obtenidos.

4. Se aplica la miniecuacin de "Z" con el "U" de cada muestra, "U" y G "U"

5. Los valores de Z permiten calcular probabilidades de pertenencia. En lenguaje matemtico el 95% de los valores de " Z" sern:

Expresado de otra manera, el 95% de los valores de U estarn comprendidos entre:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

que es lo mismo que decir que el intervalo de confianza 95 estar en ese rango. Con la misma idea un Z 1.96 para alguna muestra significa que la probabilidad de que ese U N pertenezca a la poblacin del n mero U es < 5%, en la jerga especfica p < 0.05. En ese caso se interpreta que debe rechazarse la Hiptesis Nula y aceptar la Hip tesis Alternativa. La muestra N representa a una poblacin diferente de las otras muestras. El test no paramtrico de Mann Whitney termina aplicando clculos paramtricos , sustentndose en que la distribucin de "U" es simtrica , aunque no se conozca la manera de distribuirse de los valores a partir de los cuales se lo calcul. Proponemos para el lenguaje con el cual solo deseamos comunicarnos razonablemente, que se piense en el Mann - Whitney Test como un procedimiento matemtico, que a partir de integrar los valores de diferentes muestras en un solo conjunto, procura lograr una distribucin normal (la "campana" del nmero "U"), an cuando no lo hiciesen las muestras aisladas o sus poblaciones de referencia, y en esa distribucin elaborada, estimar el significado de las diferencias halladas.

Teora de las corridas (Theory of runs)

En esta jerga especfica que nos ocupa se denomina "corridas" a sucesiones de datos idnticos interrumpidos por algunos datos diferentes, estos ltimos a su vez en sucesin o aislados. Es muy fcil captar el concepto con un ejemplo. Las letras I (Idntico) y D (defectuosos) simbolizan una produccin en serie: IIIIIIIIIDDDIIIIIIIIIIDDDIIIIIIIIIIDDDIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIDDDIIIIIIIIIIDDDIIIIIIIIIIIII Se observa que hay 7 "corridas" de I y 6 "corridas" de D. Las corridas de I tienen un nmero variable de componentes. Las corridas de D tienen todas el mismo nmero de componentes. Las corridas de D aparecen tras corridas de diferente tamao de I. El dueo de la fbrica que produce en serie lo que al lector se le ocurra, desea saber si se trata de defectos "casuales" o de defectos "causados" por algo corregible. Este es un fenmeno de todos los das en los hospitales grandes. El jefe de Clnica discute con el Jefe de Laboratorio sobre las diferencias, m s all de lo razonable, de los datos de una variable con la que se pretende correlacionar un dato clnico o paraclnico en la evaluacin seriada ( evolucin) de la afeccin de un paciente.

Datos seriados ("corridas") que exhiben inconsistencias. Ambos jefes tienen dudas sobre si se trata de variaciones casuales o de variaciones que expresan cambios en el proceso del paciente. Dudan sobre si convendra cambiar los criterios de evaluacin, pero antes estiman necesario descartar que se trate de un error sistemtico del laboratorio con presentacin intermitente, como sera un tcnico, de los muchos que all trabajan, que calibra desaprensivamente los aparatos, o una de las "marcas" de "Kits" de reactivo, en uso simultneo, que tiene alguna peculiaridad, etc. Si los datos de una serie son diferentes entre ellos, resulta pertinente preguntarse si las variaciones tienen alguna particularidad de aparicin o si son azarosas. Pruebas no paramtricas procuran dar una respuesta razonable a estos interrogantes, mediante algunos Tests que establecen la probabilidad de aleatoriedad en los datos obtenidos . Son procedimientos matemticos que procuran encontrar en series, en "corridas" con variaciones , la probabilidad de tendencias, con eventuales ciclos, en esas variaciones. Son pruebas que pretender desenmascarar poblaciones mezcladas con la poblacin de la serie estudiada.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Varias corridas en una sola carrera

El procedimiento ms simple e inmediato es construir un nmero con la totalidad de las corridas y luego elaborar un promedio y un Desvo Standard procesando la cantidad de valores que tiene cada corrida. Tambin es ms fcil verlo con ejemplos. Sigamos con el mismo de la introduccin. Las letras I (Idntico) y D (defectuosos) simbolizan una produccin en serie: IIIIIIIIIDDDIIIIIIIIIIDDDIIIIIIIIIIDDDIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIDDDIIIIIIIIIIDDDIIIIIIIIIIIII Se observa que hay 7 "corridas" de I y 6 "corridas" de D. El nmero total de corridas "u" = 13 (7 I + 6 D)

El promedio de "u" se calcula con una ecuacin binomial (es la manera de asumir una distribucin). Solamente para ver como lo hara un experto:

Se presume para el nmero elaborado una distribucin simtrica, a menos que las corridas fuesen muy pequeas, llamando "pequeas" a < 10. El desvo est ndar G de "u" se calcula en consecuencia:

Nuevamente, a los lectores que pertenecen a la poblacin de personas que no se sienten cmodos en el lenguaje matemtico, les sugerimos, que simplemente observen en las frmulas que el experto calcula trabajando con el nmero de total de componentes de las corridas, en este caso semejante a lo que ocurre en el Mann Whitney Test . Finalmente se llega a las tablas de nuestra conocida "Z" . Algo

El significado estadstico de la diferencia del nmero de corridas con respecto al promedio construdo con el total de valores en las diversas corridas, se interpreta de una manera semejante a lo que analizbamos en Intervalo de Confianza o en el Mann Whitney Test. En lenguaje matemtico el 95% de los valores posibles de " Z" sern :

o expresado de otra manera, el rango del intervalo de confianza 95 ser:

Un Z1.96 calculado con u significa que la probabilidad de que ese nmero particular de corridas , pertenezca a la poblacin de corridas definidas por es <5%, en la jerga especfica p<0.05. En ese caso se interpreta que debe rechazarse la Hiptesis Nula y aceptar la Hip tesis Alternativa; las corridas representan a poblaciones diferentes , no son casuales. Los jefes de clnica y de laboratorio que tienen el problema de datos seriados ("corridas") que

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

exhiben inconsistencias, quizs, deberan darle participacin en el problema al experto en estadstica del hospital y plantearle algo semejante a: 1. 2. 3. En cierta afeccin, frecuente, estn sustentando la evolucin de los pacientes en la concordancia de un criterio clnico y un criterio paraclnico. En general la asociacin de los dos criterios es coherente , sucede que con cierta frecuencia la concordancia o la discordancia son incoherentes . En otras palabras, la asociacin es coherente la mayora de las veces, pero en un nmero no despreciable es incoherente ; o, si se prefiere, de interpretacin errtica para el caso en que ambos datos fuesen correctos. Antes de cambiar la sistemtica de control de la evolucin por otros criterios o asociaciones, desean saber si las incoherencias son casuales, variaci n espontnea, azarosa de la asociacin elegida; o por el contrario, si est n expresando alguna tendencia como podra ser alguna diferencia clnica, un error sistemtico en el laboratorio, o alguna otra posibilidad. Pueden presentarle series de varios pacientes a modo de "corridas", llamando "C" a las asociaciones coherentes e "I" a las incoherentes ; tienen series como: CCCCCCCIIIICCCIICIICIIICCCCCCICCIICCIICIIICCCCCCCIICCCCCCIICICCCI: Podra decirles con algn grado de razonabilidad si se trata de un fenmeno casual o de una tendencia, eventualmente de algn patrn cclico oculto? Propone algn otro enfoque estadstico? Cuntas series necesita?Tiene alguna sugerencia para la recoleccin de datos? Pueden ser los obrantes en las Historias Clnicas (retrospectivos) o deben ser prospectivos?

4.

5.

6. 7.

Proponemos a nuestros sufridos lectores, recordar a la teora de las corridas como la base de pruebas no paramtricas que exploran el azar en las variaciones de una serie.

Desenmascarar tendencias y patrones cclicos Los procedimientos no paramtricos pueden utilizarse para explorar tendencias o patrones cclicos, ocultos, disimulados, enmascarados en una multitud de datos en serie. Trataremos de entender las ideas desde la aplicacin, para ello utilizaremos inicialmente la serie de nmeros que propone el Prof Freund (pag 304) en su libro (ibid). Se le pide a un experto que averige si las variaciones de la siguiente serie num rica, del fenmeno que al lector se le ocurra, son casuales o si sus valores representan a diferentes poblaciones: 55, 57, 52, 46, 50, 48, 45, 44, 50, 52, 55, 41, 42, 58, 60, 45, 53, 54, 48, 46, 51, 49, 44, 43, 56 . Confesemos de inmediato, que encontrar algo parecido a una tendencia o a un patrn cclico en una serie semejante, parece un truco de magia para el pblico adulto comn. No asustarse, procuraremos transformar la serie en "corridas" , para ello: 1. Se calcula la mediana con las frmulas apropiadas, en la serie presentada es 50 . Recordemos que la mediana es una medida de tendencia central; es un valor de la variable que separa, divide, al conjunto de valores de la variable. La mediana divide al conjunto en un n mero igual de valores por encima y por debajo del valor de la mediana ; si se prefiere, igual nmero de valores a derecha y a izquierda de la misma, o igual nmero de valores superiores (S) e inferiores (I) al valor de la mediana. Se reemplaza a los valores de la variable en la serie de datos por la letra S si son superiores al valor de la mediana y por la letra I a los inferiores a la mediana. Se desestiman los valores de la variable que coinciden con la mediana. Nos independizamos de la serie del ejemplo, para ampliar nuestra perspectiva, y comprender que, entre otras alternativas, se podran obtener "corridas" como: SSSSSSIIIIISSSSSSIIIIISSSSSSIIIIISSSSSSIIIIISSSSSSIIIIISSSSSSIIIIISSSSSS, apareci un patr n cclico.

2. 3. 4.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

5.

Obtenidas las "corridas" se pueden aplicar las ideas y ecuaciones de la teora de las corridas y en consecuencia podrn aparecer tendencias (corridas con escasas probabilidades de ser casuales) o por el contrario, confirmar que se trata de series con variaciones absolutamente casuales.

No es para tanto A nuestros atribulados lectores les proponemos retener para la comunicacin con terceras personas las siguientes ideas, ya sea para lectura de publicaciones cient ficas o para eventuales conversaciones con expertos: 1. 2. 3. 4. Las pruebas no paramtricas se aplican como una primera aproximacin al problema de distinguir poblaciones mezcladas, confundidas entre numerosos datos de valores de una variable. Un test no paramtrico, en ocasiones, puede ser el nico enfoque posible ante serias dudas sobre el modo de distribucin de los valores de la variable en estudio. Las pruebas no paramtricas elaboran una poblacin de datos. La nueva poblacin, la poblacin de datos, prescinde de los valores absolutos de la variable en cuestin. Por ejemplo: un valor "2" es un dato positivo simbolizado "+" y un valor "- 2390" es un dato negativo simbolizado"-"; o, el valor 2 es el primer dato y el valor 2390 puede ser el segundo dato ; o, los valores superiores a una mediana son los datos "S" y los inferiores a esa mediana los datos "I". Los datos se cuentan y se los procesa segn diferentes opciones. La poblacin de datos se ordena segn un rango (Mann Whitney Test), se agrupa por una caracterstica dicotmica (Sign Test) o en series (teora de las corridas). La poblacin de datos, as elaborada, tiene una distribucin conocida, de modo que conceptualmente, la nueva poblacin admite procedimientos paramtricos . Poder aplicar el procedimiento clsico, paramtrico , le permite al experto conocer la probabilidad (p) de que las variaciones en esa poblacin de datos sean casuales (Hiptesis Nula) o por el contrario, interpretar que las variaciones sugieren la presencia de datos de ms de una poblacin (Hip tesis Alternativa).

5. 6. 7. 8.

Index curso - Clase anterior - Clase siguiente

Publicacin: Octubres 2005 Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingenieria e Inform tica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Direccin de E-Mail:

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico 1994-2005

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

CETIFAC - Bioingenier a UNER

Webmaster - Actualizacin: 14-Oct-2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingenieria e Informatica M dica/Bioengineering- Medical Informatics

Curso: Bioestadstica bsica para m dicos asistenciales Clase N 9: Pruebas Estadsticas Param tricas
Primera Parte Raul E. Ortego, Carlos R. Secotaro
Index curso - Clase anterior - Clase siguiente

Los procedimientos estadsticos paramtricos consisten en la aplicacin de ecuaciones matemticas que tienen como condicin necesaria la existencia de una particular y reconocida distribucin de la poblacin. La distribucin de la poblacin es para el lenguaje que pretendemos comprender, la forma particular que adopta en un grfico de abscisas y ordenadas, la sucesin de puntos en que coinciden el valor de la variable y su frecuencia de aparicin. La distribucin de la poblacin es para nosotros la curva de distribucin. Las curvas de distribucin, manifestaciones grficas, tienen tambin su expresin matemtica particular, cada curva puede describirse por su propia ecuacin o frmula matemtica. Como "idea fuerza": cada curva con su ecuacin (frmula) que la identifica. Repitamos la afirmacin de que es condicin necesaria para usar apropiadamente un test paramtrico que exista una especfica y reconocida distribucin de la poblacin . Esto es as, porque las ecuaciones que emplea cada test paramtrico , lo que en definitiva arrojarn como resultado, es la probabilidad de que un valor, una diferencia, una proporcin investigada, pertenezca a la curva que expresan las ecuaciones aplicadas . En nuestras humildes e infantiles metforas, permtasenos decir que el test con sus ecuaciones , es el "mapa" con el que se busca una determinada localizacin. Imagine el significado de "bsquedas" (y hallazgos) con "mapas" inapropiados.

El software no aumenta el coeficiente intelectual Es interesante observar modalidades de uso de programas de estadsticas a los cuales se tiene un fcil acceso. Para el experto, son herramientas poderosas que le permite, sobre todo, un inestimable acortamiento en los tiempos de clculos. Algunos aficionados dan por sentado que "saben" usar el "software" si pueden llenar ciertos casilleros con los datos de su investigacin. Si llenan los casilleros que el programa exige, el resultado final es una "p" y eureka!! ya se sabe si "di la p" o "no di la p". Si la "p no di" el maravilloso programa ofrece otras alternativas de llenado de casilleros, todo parece reducirse a encontrar la opcin del software que "d la p". Subtitulamos este apartado tratando de suavizar la expresin popular sobre que la tecnologa no "aviva tontos" o algn equivalente del lunfardo, pocas veces tan aplicable. Nos parece necesario reiterar, enfatizando, que un paso esencial en la utilizacin de cualquier test paramtrico , es cerciorarse de que la distribucin de los datos corresponde a la distribucin de la poblacin cuya curva est expresada en las ecuaciones que se emplearn; para la metfora: que el "mapa" sea de la regin! A modo de ejemplo citaremos algunas distribuciones continuas: la distribucin "t", la distribucin "chi cuadrado" , la distribucin "F" . En otros trminos, si bien es verdad que las distribuciones binomiales, que la distribucin "normal" (la "campana"), tienen importantsimas aplicaciones, es fuente de groseros errores creer que son las

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

nicas curvas posibles y por ende, las nicas expresiones matemticas para explorar probabilidades de pertenencia. Sugerimos retener para las conversaciones y la lectura, que un paso previo, esencial , a la aplicacin de un test paramtrico, es conocer la curva de distribucin del fenmeno que se est investigando. El experto tiene formas de averiguar como se distribuye el fenmeno, o al menos cmo lo hacen los datos obtenidos. Un clculo de tamao de muestra puede ocasionalmente ser revisado, a posteriori, al cotejar la distribucin de los datos obtenidos con la distribucin esperada o conocida de la poblacin de referencia. El clculo del tama o de la muestra, que el "software", por supuesto, permite realizar, presume una determinada , especfica, distribucin de la poblacin. Comentar procedimientos para determinar si una distribucin, binomial por ejemplo, se aproxima a la curva normal, escapa a la finalidad de este ensayo, y al conocimiento de sus autores, que slo pretenden desde sus propias dificultades, mejorar su comprensin de las "evidencias" con las que deben? pueden? tratar pacientes ( personas)! .

Es/est lindo (a)! comparado con quin y cmo? Un procedimiento esencial de la Estadstica Inferencial es comparar datos. Si muestras y poblacin se distribuyen de la misma manera, comparar estadgrafos permitir inferir la comparacin de parmetros . En poblaciones de distribucin simtrica y con muestras grandes ( >30 ) la hiptesis nula, es decir que la diferencia es asume casual , se acepta o se rechaza buscando en la distribucin "Z" la probabilidad que tienen los estadgrafos hallados de pertenecer a la poblacin de referencia. Si las muestras son pequeas ( <30 ) el tamao de la muestra ( n) es un factor m s condicionante de los resultados, y en consecuencia la probabilidad de pertenencia se busca en la curva de la distribucin "t" de Student (" Student t distribution "), preservando el pseudnimo que inmortaliz a W.S. Gosset. La distribucin "t" es una distribucin tanto ms simtrica cuanto mayor n , se aproxima a la normal de Gauss ("campana ") en relacin directa al tamao de la muestra. La distribucin de Student o "t" no es una nica curva, son varias curvas diferenciadas al considerarse en la frmula (una sola) de las mismas diferentes tamaos de muestras denominados "grados de libertad" y expresados genricamente como "n - 1" siendo n el tamao de la muestra . Proponemos retener de estas ideas que en las pruebas o test paramtricos de "Gauss" o de "Student", el experto se cuestiona en primer lugar la distribucin de la poblacin . Para distribuciones simtricas busca la probabilidad de pertenencia (la "p" ) segn las tablas construdas con la ecuacin de "Z" o, en las tablas construdas con la ecuacin modificada, que culmina en "t" cuando el tamao de las muestras es pequeo. El modo de hacer las comparaciones debe ser definido precisamente. El experto analizar entre otras consideraciones, la distribucin de las poblaciones a comparar, la expectativa de la eventual diferencia a reconocer para determinar el tamao de las muestras, etc. En la lista del etc., una consideracin particularmente importante, es determinar la influencia del valor de un dato sobre el valor del dato con el cual se lo comparar; en otras palabras, si los valores comparados son independientes entre s. En esta l nea de pensamiento, es comn leer trabajos dnde se "aparean" los datos . En la comparacin de datos, se pueden elegir para esa finalidad diversos estad grafos, asumiendo una vez ms, que la muestra de distribuye como lo hace la poblacin.

El error de la representacin Antes de proseguir, repasaremos algunas ideas expresadas en el captulo del Error Standard ( ES ). No nos preocupa reiterarnos, lo hacemos ex profeso . El concepto ES se asocia habitualmente a la inferencia de la media o de proporciones; en realidad, los

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

expertos han propuesto teoremas con ecuaciones que permiten calcular el ES de la inferencia de todos y de cada uno de los parmetros de la poblacin. En efecto, analizando la distribucin de las muestras con referencia a la distribucin de la poblacin se han desarrollado frmulas que estiman el IC (Intervalo de Confianza 68 95 99 ) de parmetros como el Desvo Standard, la mediana, quartilos, Coeficientes de Variacin, etc. Los conceptos son los mismos, ya que en muestras grandes , la distribucin te rica, se aproxima a la distribucin simtrica de Gauss (la campana ). Antes de aplicar frmulas el experto analizar la distribucin real de las muestras donde las emplear. Esta afirmacin puede ser generalizada en una expresin matemtica para IC95 de cualquier parmetro a partir de conocer su estadgrafo correspondiente: Estadgrafo 1.96 "ES" < Parmetro < Estad grafo + 1.96 "ES" En muestras "grandes" de tamao n , el ES de la estimacin del Desvo Standard de la poblacin ( G), a partir del Desvo Standard de la muestra ( DS), es aproximadamente:

El IC 95 para G se expresa:

Con las mismas ideas existen modificaciones matemticas que corrigen deformaciones en la distribucin cuando las muestras son "pequeas" (<30). Una vez ms, no es de nuestro inters reemplazar al experto, adems no sabramos, slo pretendemos dialogar con l y poder leer un trabajo cientfico entendiendo un poco mejor de dnde sale la "evidencia" que modificar nuestras conductas mdicas. Por lo tanto, proponemos un "acto de FE", y creer que se puede, matemticamente, estimar el ES tambin para inferir proporciones, diferencias poblacionales , o para la inferencia de cualquier otro parmetro . En prximos subttulos emplearemos diversas "frmulas" de DS y de ES sin haber siquiera intentado previamente, ilustrar cmo se probaron los teoremas que las respaldan; pero siempre concientes de que el ES de la estimacin de los parmetros es un elemento esencial, vaya verdad de Perogrullo, en las pruebas (test ) paramtricas. Quien no est dispuesto a creer o aceptar sin cuestionamientos que con las mismas ideas se elaboran las "frmulas" que usaremos, no es un destinatario de estas lneas, sino que debe referirse a los textos matemticos (estadsticos) especficos y apropiados; debe prepararse para ser experto, con nosotros no lo conseguir. Acorde con el prefacio de este ensayo, para usar el auto es necesario saber que "necesita combustible" an sin saber que sucede con ese combustible adentro del motor.

Sealar lo que hace diferente no es indiferente. Observe los siguientes grficos, en ordenadas ( Eje de la "y") la FR ( Frecuencia Relativa ), por lo tanto el mximo es 100%. Las muestras "negra" y " roja " podrn diferir en frecuencia absoluta, graficamos la FR , por lo tanto las alturas son iguales (100% 1). Sin aplicar frmulas, conforme a la sugerencia de pensar grficamente , concntrese en la diferencia de los promedios y en la diferencia de los Desvos Standard .

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Pregntese el lector si las muestras comparadas en el grfico A , y las comparadas en el grfico B, respectivamente corresponden a la misma poblacin en cada comparacin. En el estudio A, tal vez buscar respuestas con el promedio ; en el ensayo B quizs prefiera las diferencias, o el Desvo Standard o su versin cuadrtica: la Varianza .

La dependencia en las parejas En bioestadstica es muy frecuente comparar un conjunto de datos con otro obtenido en circunstancias particulares. En ocasiones, se comparan datos "apareados". Un dato "apareado" es el mismo dato obtenido en dos circunstancias que se estn evaluando en cuanto a la posibilidad que tienen de discriminar en dos poblaciones a un conjunto que en principio parece, impresiona, es, una sola poblacin. Los datos son el instrumento con el cual se evalan las circunstancias. Se aparean los mismos datos de los mismos individuos, obtenidos antes de (sin) y despus de (con) un tratamiento especfico, por ejemplo: el peso corporal mediando una sustancia para adelgazar, la Presin Arterial sin y con un medicamento hipotensor, etc. De otra manera, se pueden comparar los mismos datos en diferentes individuos, en ese caso dos grupos (muestras) de pacientes en todo semejantes (la misma poblacin), excepto en la circunstancia que se est investigando (la sustancia para adelgazar, el hipotensor, etc.); en este caso se comparan datos NO apareados . El apareamiento implica que el valor del dato final depende no slo de la circunstancia a investigar, sino tambin del valor del dato inicial . En el apareamiento los valores son dependientes uno del otro . En las comparaciones de muestras con valores dependientes analizar los promedios finales, aunque participen en la ecuacin los desvos obtenidos, puede arrojar una interpretacin diferente que si se analizan las diferencias, constituyndolas en una muestra, cuya poblacin de referencia para aceptar la Hiptesis Nula, tiene promedio de diferencia cero ( = 0 ). Suponga un grupo de personas que cumplen una indicacin para adelgazar:

En ese caso "Z" , o "t" segn el tamao de la muestra, se calcula con el promedio de las diferencias observadas vs = 0 y con el Desvo Standard de esas diferencias . El resultado ser la probabilidad de que el promedio obtenido de la diferencia de peso sea casual (la "p") y conforme a ello aceptar o rechazar la Hiptesis Nula.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Otra posible comparacin sera analizar la varianza pre "T" vs la varianza post "T".

Diferencias entre promedios Los conceptos que expresaremos a continuacin se aplican, especialmente, a diferencias de promedios obtenidos con muestras cuyos valores son independientes. El procesamiento de diferencias consiste, como ya dijimos, en asumir que la diferencia en cuestin es una poblacin de distribucin sim trica, normal (la campana). Si las muestras son grandes, tambin tienen una distribucin casi normal . La poblacin 1 de tamao n1 y promedio 1. La poblacin 2 de tamao n2 y promedio 2 . La Hiptesis Nula afirma que se trata de una sola poblacin , por lo tanto: 1 = 2 . La diferencia: 1- 2=0 .

El Desvo Standard ( G ) es: Con muestras slo debe reemplazar a por y a G por DS .

Diferencias entre proporciones Es un problema muy frecuente en bioestadstica, particularmente cuando se trabaja con variables cualitativas. Las proporciones son referidas frecuentemente con otros trminos, con alguna sutileza en la relacin, por ejemplo: Prevalencia, Riesgo , Odds . Sin repasar todo el captulo de estadstica descriptiva recordemos que prevalencia es la relacin entre el nmero de veces que ocurri un evento (numerador) y el total de individuos expuestos a que ocurriese ( denominador). Por ejemplo en un estudio regional se informa que la prevalencia de infarto de miocardio (IAM) en diabetes tipo II en mayores de 50 aos es de 15%. La expresi n 15% podra escribirse 15/100 con lo cual se informa que de cada 100 pacientes mayores de 50 aos con diabetes tipo II, 15 han presentado un IAM. En realidad el estudio relev a 500 pacientes con diabetes constatando entre ellos 75 pacientes con IAM; 75/500=15/100 = 15%. Al numerador (eventos ) lo simbolizaremos con una letra X. Al denominador (muestra o poblacin expuesta o de referencia ) lo simbolizaremos con una letra n. La proporcin en que ocurre el evento es p, y la de que no ocurre es ( 1 p). Estas expresiones aritmticas suelen desconcertar al lego. Veamos: un evento ocurre en p = 37% = 37/100 = 0.37 ; no ocurre ( 1 p) = (1 0.37) = 0.63 = 63%. No era para tanto! A las poblaciones o muestras a comparar les asignaremos un nmero correlativo como subndice de X, de n y de p. El problema "diferencia de proporciones" queda planteado en los siguientes trminos:

El Desvo Standard , asumido tambin como el Error Standard de (p 1 p2) es:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Para el clculo del Error Standard se asume que la proporcin ( p) en el conjunto de las dos muestras es:

De esta manera se llega a estimar Z

La hiptesis nula en una diferencia de proporciones (p 1 p2) es:

Se confirma la Hipotesis Nula si se verifica que Z es un valor comprendido entre 1.96: -1.96 < Z < +1.96 Se acepta la Hipotsis Aternativa con una p < 0.05 si se verifica alguna de estas opciones del valor de Z: -1.96 > Z Z > +1.96 Si p 1p2 es diferente de 0, por ejemplo p12 0, con las mismas ideas se puede calcular el IC 95 y expresar la diferencia como: p12 (IC 95 p12 ES 1.96) A nuestros esforzados lectores les proponemos recordar para la lectura o los dilogos, las siguientes ideas sobre el tratamiento estadstico de la diferencia de dos proporciones ( p1 p 2), obtenidas en muestras "grandes": 1. 2. La hiptesis nula dice que la diferencia p1 p 2 es casual porque en realidad son proporciones de una sola poblacin cuya proporcin verdadera es p , es decir que para la hiptesis nula p 1 = p 2 = p . Se busca el nmero Z con las mismas ideas que discutimos en "Probabilidad de Pertenecer" , all vimos que el Z menor, el que coincide con la mayor frecuencia de aparicin, el vrtice de la campana, corresponde a un numerador 0. En este caso sera la poblacin de p 1 = p 2 = p , por lo tanto el 0 = p1 p 2. El Desvo Standard de la ecuacin de Z, en realidad, para las diferencias de proporciones es un Error Standard , que se calcula con una proporcin ( p) de ocurrencia y una de no ocurrencia (1 p), como si fuese un solo conjunto; considerando como siempre, el tama o de las muestras ( n 1 y n 2). La diferencia p1 p 2, si p = Riesgo puede tambin expresarse agregando el IC95 con lo cual se agregar a la disminucin de riesgo " p 12" el rango del intervalo en el cual est con 95 % de probabilidades la verdadera disminucin de riesgo. Si el rango del IC 95 en uno de sus lmites es 1 y en el otro 1 (Por ejemplo: Riesgo 0.90 IC 95 0.78 1.02) implica que el Riesgo en otro estudio con un 95% de probabilidad , podra ser exactamente opuesto (1.02) a la del estudio ( 0.90) del cual se tomaron los datos. La conclusin

3.

4.

5.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

tambin sera opuesta?!. Se acepta la Hiptesis Nula y se atribuye a la casualidad la diferencia observada , sea sta la del estudio realizado 0.90 o la del estudio eventual 1.02. Nos tomamos un descanso hasta la entrega de la segunda parte de test paramtricos.
Index curso - Clase anterior - Clase siguiente

Publicacin: Octubre 2005 Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingenieria e Inform tica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico 1994-2005

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

CETIFAC - Bioingenier a UNER

Webmaster - Actualizacin: 17-Oct-2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingeniera e Informtica M dica/Bioengineering- Medical Informatics

Curso: Bioestadstica bsica para m dicos asistenciales Clase N10: Pruebas Estadsticas Param tricas
Segunda Parte Ra l E. Ortego, Carlos R. Secotaro

Index curso - Clase anterior - clase siguiente

Datos ordenados en tablas de contingencia Un modo frecuente de presentar un problema para su estudio es ordenar las variables en filas (ordenamiento horizontal ) y columnas (ordenamiento vertical ). Los datos de las variables quedan ordenados en tablas de "contingencia" (lo que ha sucedido y lo que no ha sucedido). Veamos un ejemplo imaginario utilizando las columnas para anotar pacientes con y sin diabetes; las filas para anotar los pacientes con y sin infarto de miocardio ( IAM ).

La tabla est presentando un problema que puede ser analizado como diferencia de proporciones . Lemosla como relaciones Odds ; como Riesgo, sera contra el total de cada columna respectivamente en cuyo caso el denominador sera inicialmente 120.

La proporcin "Odds" de IAM en pacientes con Diabetes es:

La proporcin "Odds" de IAM en pacientes sin Diabetes es:

Diferencias entre mltiples proporciones En el captulo anterior analizamos las ideas con que trabaja el experto para estudiar la diferencia entre dos proporciones ; de la necesidad de analizar diferencias entre ms de dos proporciones, se suscitan consideraciones matemticas que culminan en una distribucin particular, la de ( chi cuadrado). El problema se percibe rpidamente si deseamos discriminar a los pacientes con y sin diabetes segn gnero (M= Masculino y F= Femenino) y a los pacientes con y sin IAM segn tengan o no el antecedente de hipertensin arterial (HTA). Supongamos que la tabla con los datos se transforma en la siguiente:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Se pueden constituir muchas proporciones con los datos de una Tabla como sta. Para leer y hablar de pruebas paramtricas con las que se analizan los datos de Tablas como la expuesta, es necesario discutir algunas ideas previamente. Distribucin de (chi cuadrado)

Consecuentes con la propuesta de pensar con grficos in mente , adelantemos que la distribucin es una distribucin terica, cuya curva de distribucin es semejante a la siguiente figura. En la figura inclumos un valor correspondiente a la frecuencia de distribucin 0.05 (5%) que ser un valor de rechazo (no aceptacin) de la hiptesis nula con p < 0.05. Culminamos la "cola" de la campana en color rojo sealando las localizaciones (o imagine su "sombra" que es el "rea bajo la curva") que se considerarn "extraas" a la campana, propias de la hiptesis alternativa. Otro valor para rechazo de la hiptesis nula podra ser el correspondiente a la frecuencia de distribucin 0.01 (p < 0.01); variar el valor de rechazo segn lo diseado por los expertos en cada investigacin para aceptar la hiptesis alternativa.

Un mensaje clave del grfico es que, al igual que sucede con " Z" , con "t", etc, cuanto mayor la magnitud del calculado, menos probable la "probabilidad de pertenecer". Fieles tambin a la premisa de que procuramos slo entender un poco m s, y desde la utilizacin prctica, retornamos al tipo de problemas para el cual los expertos tuvieron que disear un enfoque estadstico matemtico que culmin en la distribucin Diferencias entre varias proporciones En los casilleros de la tabla que ofreca mltiples proporciones haremos modificaciones para introducirnos en las ideas que subyacen en la distribucin y sus ecuaciones. Veamos una tabla ejemplo modificando ligeramente lo del Prof Freund (pag 274, Ibid). Las filas ( rows ) sern B, y las columnas A, en secuencia numrica hasta la fila r y la columna k, respectivamente. En cada casillero el n mero es el r.k que le corresponde y nij es un casillero "ejemplo", la generalizacin de un casillero (fila i, columna j). .

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Observe en la tabla que al nmero total se llega de manera indistinta, sumando el total de las columnas o el total de las filas. Si todos y cada uno de los valores de las variables asignadas a las columnas son independientes de todos y cada uno de los valores de la variables asignadas a las filas, resulta que el valor matemticamente esperado en cualquier casillero ser:

Pedimos la dispensa de demostrar la deduccin de esta ecuacin del valor esperado, podemos asegurarle que es aritmticamente simple, slo que extiende el texto y no lo creemos necesario para la finalidad de estas lneas. Ubique la ecuacin en la tabla ejemplo, observando los casilleros con recuadro rojo. La hiptesis nula afirma que el nij (valor hallado en el casillero "ejemplo") es igual a eij (valor esperado en ese casillero si no hay ninguna relacin especial entre la variable de esa fila y la variable de esa columna; es decir si todo ocurre por azar. La hiptesis nula es: nij = eij luego (nij - eij) = 0 La hiptesis alternativa es: nij eij y se interpreta que la relacin r.k no es casual, los sucesos no son independientes, no ocurren simplemente por azar. De esta manera se llega a la ecuacin que expresa la distribucin

La ecuacin expresa que se debe calcular la diferencia entre los que sucede en cada casillero ( n ij ) con respecto a lo sucedera si el fenmeno fuese azaroso ( eij ); la diferencia se la relaciona con lo esperado ( eij ) para ver cuantas veces "cabe" ese valor en la diferencia hallada. Con tantos smbolos, los legos solemos "perder el rumbo"; recordemos aritmtica del ciclo bsico: 8/2 = 4 significa que 2 (el denominador) "cabe" 4 veces en el numerador, o lo que es lo mismo, que el numerador es 4 veces ms grande que el denominador . En el clculo de , en cada casillero, se averigua que tanto se aleja nij de eij. En realidad expresa la suma ( ) de lo que sucede en el conjunto de casilleros, y a su vez, en cada casillero lo que se hace es calcular cuantas veces ms grande es la diferencia, objetivamente hallada, con respecto al valor esperado . Es obvio que si lo hallado es igual a lo esperado, todo termina en un gran 0 (cero) en el numerador y en el resultado final. La hiptesis nula es que = 0 ; por lo tanto cuanto ms se aleje de 0 (cero) menos probable que las relaciones r.k (fila columna) sean casuales. Debemos advertir que la distribucin est influenciada por el tamao de la muestra. Al igual que en la distribucin de Student se trabaja con el concepto "grados de libertad". En el caso de

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

las filas es (r 1 ) y para las columnas es (k 1 ). Cuanto mayor el tamao de la muestra, menor el impacto de los grados de libertad. Cuanto mayor el tamao, ms se parece la distribuci n a la campana de . La figura de la distribucin que le propusimos est "distorsionada", no es simtrica, con la intencin de compartir con nuestros lectores el modo en que procuramos recordar para los dilogos y la lectura, cmo impacta en la distribucin, el tamao de la muestra . Tambin se puede analizar con una diferencia de dos proporciones . Se estudia la aparicin de un suceso x; en una muestra sucede y en una muestra sucede . Las proporciones son / y / ; aunque al lector com n le cueste creerlo, el experto trabajando con los trminos de la misma ecuacin un software): calcula (actualmente se hace llenando los casilleros correspondientes en

La sorpresa no termina para el diletante, la ecuacin precedente es una presentacin de la misma frmula con que se calculaba Z investigando dos proporciones.

Ponemos a consideracin de nuestros lectores las ideas que nosotros procuramos, y por ende sugerimos, retener a propsito de la distribucin 1. :

2. 3.

4.

El test paramtrico de se aplica en situaciones en las que se desea inferir si la diferencia entre frecuencia observada y frecuencia esperada de un evento significa algo m s que la mera casualidad. La esencia del planteo matemtico es obtener una relacin aritmtica entre la diferencia observada (numerador) y el valor esperado (denominador). La esencia de la distribucin es que a mayor relacin, menor probabilidad de que el dato obtenido pertenezca a la poblacin; menor probabilidad de que sea simplemente un hallazgo casual . El tamao de la muestra es relevante no slo para el resultado final; los expertos discuten entre ellos sobre el mnimo "dato esperado" que permita una aplicacin razonable del test de Si el tamao de la muestra se considera inapropiado suele aplicarse otro test, que con las mismas ideas alcanza con las ecuaciones directamente una "p", nos referimos al Test Exacto de Fisher.

5.

El test de tiene, conservando su esencia, varias aplicaciones. Por ejemplo es til para decidir si los datos de una muestra (hallados) se distribuyen de manera simtrica como lo hace su poblacin de referencia (esperados).

Diferencias entre mltiples promedios La distribucin la presentamos como una respuesta a la necesidad de resolver la interpretacin de diferencias entre mltiples proporciones . En captulos previos habamos discutido formas de interpretar las diferencias entre los promedios de dos muestras para inferir si pertenecen a una poblacin asumiendo que la diferencia observada es casual (Hiptesis Nula ) o no (Hiptesis Alternativa). Una prueba paramtrica tradicional consiste en analizar los estadgrafos obtenidos con datos de las muestras (promedios y Desvos Standard ), calculando su probabilidad de pertenecer a una

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

distribucin " t" de Student, de manera de poder inferir si esos estadgrafos representan a parmetros de una o de dos poblaciones . La comparacin de resultados entre ms de dos muestras con un punto final comn plantea necesidades matemticas que el experto debe intentar resolver. A modo de ejemplo de la problemtica referida suponga que un grupo de trabajo quiere saber si en el valor de la Hemoglobina Glicosilada (un punto final), como expresin de control de la diabetes, una combinacin de tres drogas (una sulfonilurea, una biguanida y un activador de Peroxisomas) es superior al tratamiento de cada una de ellas por separado. Se conforman cuatro (4) grupos de pacientes (muestras) a saber, un grupo por cada monodroga (tres muestras en total) y un grupo con la combinacin. Descontamos que los cuatro grupos son iguales en todo (una sola poblaci n) excepto en los tratamientos para los cuales se desea averiguar si alguno (s) de ellos discrimina a la poblacin en una o ms mejor controlada ( el punto final) que el resto. Si los cuatro grupos se descompusieran para la comparacin en pares, realizando todas las combinaciones posibles y aplicando a cada par un test de "t"; lo que en realidad se obtendra es una gran probabilidad de error tipo I (alfa) o FALSO POSITIVO . El desafo para el experto es analizar al conjunto con un solo test. ANOVA ( AN alisys Of VA riance) En lugar de estudiar las diferencias entre los promedios (en el ejemplo sera el promedio de la Hemoglobina Glicosilada final en cada grupo), al trabajar los datos en conjunto se elije otro estadgrafo para inferir el parmetro de referencia: la Varianza. Recordemos que la Varianza (V) es la versin cuadrtica del desvo Standard.

Antes de avanzar destaquemos que el experto tiene in mente un concepto de lgebra del ciclo bsico: un cuadrado es igual a la suma de los cuadrados que lo componen.

La varianza de los cuatro grupos de nuestro ejemplo, como conjunto ( Vn ), ser la suma de las Varianzas de cada grupo:

La hiptesis nula afirma que se trata de una sola poblacin, por lo tanto las varianzas son iguales ( Vn = varianza del conjunto de n muestras)

Relaciones entre varianzas y distribucin " F"

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

El grfico de la izquierda es el que le sugerimos tener in mente para el dilogo o la lectura cuando el tema es: inferir parmetros a partir de mltiples comparaciones simultneas de estadgrafos . Si se cuenta con promedios y desvos y no se elige la varianza , en realidad se ha optado por comparaciones secuenciales , en lugar de simultneas ; quizs sin quererlo, se incurre en una de las actitudes que describamos a prop sito de Error . Fieles al estilo confeso de repetir: " Obstinacin: Como la idea es "buena" si la "p" no "d" se debe a que el tratamiento estad stico es "malo". A mayor nmero de enfoques (tratamientos) estadsticos, mayor probabilidad de Error tipo I al obtener "p significativa" con alguno de ellos". El grfico de la derecha es una simple adaptacin del que presentbamos para ; sucede que tambin nos parece importante recordar una " campana " distorsionada por los grados de libertad (n 1), para nosotros: impacto del tama o de la muestra . La distribucin F que tiene una ecuacin a primera vista compleja es en definitiva la que resulta de relacionar el ES (Error Standard) de los promedios de las muestras con el promedio de la Varianza ( V ). Slo para ver en la ecuaci n de la distribucin F, adaptada a nuestras limitaciones, lo que figura en numerador y denominador:

Superado el impacto inicial slo observe que en el numerador est la sumatoria ( ) del Error Standard de las muestras y en el denominador la (doble en este caso) de las Varianzas de las muestras . En segundo lugar observe que en la ecuacin F los grados de libertad, para nosotros legos, el tamao de las muestras ( n 1), est presente en numerador y denominador. ANOVA y el test de student En profundizaciones del tema que se pueden encontrar en internet, por ejemplo: http://www.psyc.memphis.edu/students/craig/3001/13anova.ppt#257,2 , What is ANOVA, se comprende que el test ANOVA (I, II y ms) es el "Hermano Mayor" del "t" Test ya que puede hacer lo mismo, comparar dos muestras, pero le permite mucho mas, es decir comparaciones mltiples sin aumentar el Error . Las mismas ideas con tratamientos matemticos de complejidad creciente subyacen cuando las comparaciones mltiples se concentran en un criterio (en nuestro ejemplo el esquema de tratamiento en cuanto a drogas) o en ms de un criterio (en nuestro ejemplo las mismas drogas con diferentes esquemas posolgicos). ANOVA y muestras heterogneas Un test paramtrico ANOVA informar las probabilidades con que se puede aceptar o rechazar la hiptesis nula. En el caso de rechazarla, lo que se reconoce es que las varianzas no son homogneas .

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Al aceptar la hiptesis alternativa, lo que se infiere es que las varianzas heterog neas expresan un conjunto de diferentes poblaciones . Resta un trabajo por realizar, discriminar esa heterogeneidad proveniente de las muestras y reconocer si todas difieren entre s o slo algunas. En otras palabras, reconocer a cuntas poblaciones representan las muestras analizadas. Estos resultados se pueden obtener con diferentes mtodos. Por ejemplo: Test de Bonferroni, Test de Tukey-Keuls, Test de Duncan. En definitiva lo que procura lograr el experto es dar significacin estadstica a las diferencias observadas, a la heterogeneidad .

Index curso - Clase anterior - clase siguiente

Publicacin: Octubre 2005 Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingeniera e Informtica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

1994-2005

CETIFAC - Bioingenier a UNER

Webmaster Updated: 08/17/2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingeniera e Informtica M dica/Bioengineering- Medical Informatics

Curso: Bioestadstica bsica para m dicos asistenciales Clase N 11: Correlaciones Grficas
Ra l E. Ortego, Carlos R. Secotaro

Index curso - Clase anterior - Clase siguiente

Hemos discutido y enfatizado la utilidad de presentar los datos de una investigacin, los hallazgos, en grficos de coordenadas cartesianas. En el Eje de las x ( abscisas ) los valores de la variable ; en el Eje de las y ( ordenadas) los hallazgos observados. Hasta este captulo, el dato o hallazgo observado, ha sido la Frecuencia de Aparicin ( y) de cada valor de la variable ( x ). El hallazgo observado, el dato " y" que se relaciona con el valor de la variable " x", puede ser tambin una cantidad en trminos absolutos, o una cantidad en trminos relativos, es decir un cambio o modificacin, expresado como proporcin, por ejemplo como porcentaje. El Grfico ms simple, el " Scatter ", localiza, dispersos , cada uno de los puntos (* ) que tienen un valor " x" y una magnitud " y" en la interseccin de dos lneas; una lnea vertical correspondiente al valor de la variable "x" y una lnea horizontal correspondiente al hallazgo " y"; cada interseccin determina una localizacin xy.

Imagine 12 hallazgos " y" de magnitudes, o frecuencias relativa de aparicin, o cambios proporcionales, que est n vinculados, relacionados, a una variable continua " x"; en ese caso quedan determinadas 12 localizaciones xy representadas en el grfico precedente. Regresin Lineal

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

En el grfico observe que, sobre el ejemplo previo, se ha trazado una lnea punteada ( negra ) uniendo de manera secuencial, progresiva segn los valores de x , todos los puntos, las localizaciones xy dispersas (scatter ed). Resulta una lnea quebrada, un polgono con expresin matemtica sumamente compleja. Posteriormente, ya veremos de qu manera, se traz una lnea punteada ( azul), virtual , que pretende representar a las localizaciones reales obtenidas y a n a las potenciales.

Se modifica el grfico suprimiendo las localizaciones reales xy y conservando slo la lnea "representante" obtenida, en realidad calculada; que en este caso es una lnea recta con una expresin matemtica precisa: y=a + bx . Esta ecuacin de lnea recta expresa que cuando x=0, la magnitud y=a; adems que cuando x=1 , la magnitud y=a+b . La magnitud b es lo que aumenta " y" por cada unidad de aumento de " x"; ese aumento es la inclinacin o " pendiente" de la recta ; b = pendiente de la recta. La lnea slo incluye algunas localizaciones reales , podra no incluir a ninguna, se trata de una relacin virtual que dice cual es la magnitud probable de "y" para cada valor de " x". En el grfico del polgono "real" y la lnea virtual, observe que las localizaciones reales se ubican "alrededor" de la lnea, unas por "encima", otras por "debajo" y algunas prcticamente "coincidentes". Las localizaciones xy reales pueden describirse con referencia a la lnea virtual elaborada, calculada. Representante y/o Referente?. Quizs acuerde con nosotros en que esta lnea de correlacin xy , virtual , representa , expresa , una idea semejante a la que discutimos a propsito del promedio . En efecto, el promedio es un valor calculado , virtual , que puede o no coincidir con uno real, y que en realidad tiene utilidad como Medida de Referencia , es una "Medida de Tendencia Central". El promedio es un valor virtual de x que sirve de referencia para localizar al conjunto de los valores reales de x . En las poblaciones es un valor constante ( parmetro) y en las muestras es un valor inconstante ( estadgrafo ). La lnea virtual , calculada a partir de localizaciones reales xy dispersas (Scatter) en un grfico hom nimo, cuando es una recta se denomina "Recta de Regresin" y ms que "representante", la asumiremos como una lnea de referencia . Enfatizemos que la lnea de referencia , y su ecuacin por supuesto, no necesariamente es una recta, dado que la relacin "y funcin de x" puede tener varias connotaciones. Observe algunos ejemplos en los siguientes grficos.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Obtencin de Rectas de Regresin La lnea azul del ejemplo previo se realiz a "mano alzada", en realidad con una regla y "a ojo"; como mtodo tiene un grado de aproximacin a la referencia pretendida que es "operador" dependiente, y es obvia la dudosa posibilidad de reproduccin exacta an para el mismo dibujante. Su principal limitacin, no obstante, es que no permite comparaciones precisas que den lugar a inferencias, proyecciones, predicciones . Una comparacin de correlaciones podra imaginarse como la siguiente: el servicio de Ecocardiografa desea averiguar si al cambiar las condiciones basales procurando modificaciones en la funcin sistlica (la infusin de una droga en diferentes dosis por ejemplo) se modifica la relacin con algunas manifestaciones de la funcin diastlica. Los residentes que realizan "Stress Test" para cardiopata isqumica con dopamina, ubican en un grfico las relaciones de FE (Fraccin de Eyecci n de Ventrculo Izquierdo como expresin de funcin sistlica ) y E/A (relacin velocidad de llenado rpido sobre velocidad de llenado por sstole auricular como expresin de funcin diastlica ) de 12 pacientes sucesivos en condiciones basales y con las tres dosis de dopamina que establece su protocolo. En el eje de las abscisas ( x) la FE , en el eje de las ordenadas ( y) la relacin E/A . El grfico que los residentes elaboran con sus datos, expresa que los pacientes presentan ante los valores de la variable " x" (FE) las magnitudes "y" (E/A ) Los puntos negros son la relacin xy basal, los azules con la dosis menor de dopamina, los rojos con la dosis intermedia y los verdes con la dosis mayor.

Los residentes concurren con su grfico al experto en estadstica porque desean conocer en primer lugar, si existe una correlacin entre el valor de la FE ( x) y la relacin E/A (y); tambin les interesa saber, si las diferentes dosis de la droga influyen en la eventual relacin FEE/A (xy) y en qu sentido suceden las eventuales modificaciones. Seguramente coincidir con nosotros en que las respuestas impresionan ms fciles de obtener si el grfico lo permuta por uno que tenga "lneas de referencia" . Imaginemos las siguientes rectas de regresin:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Las comparaciones parecen no slo m s sencillas; confesmoslo: recin ahora factibles. Observe el grfico imaginario elaborado con los datos de los residentes y reflexione en el grado de confiabilidad que le daran inferencias obtenidas a "mano alzada". Hemos llegado al punto que queramos, se necesita un mtodo m s reproducible, m s confiable, ms comparable que la "mano alzada". El costo del mtodo es que hay que utilizar ecuaciones, frmulas, aunque actualmente estn escondidas en un software, y que sean slo a modo meramente ilustrativo para nosotros, legos necesitados de entender lo que estudiamos un poco mejor, y de expresarnos con mayor precisin semntica.

Mtodo de los Cuadrados M nimos (Method of least squares) El mtodo para encontrar la lnea de referencia de datos presentados como puntos de localizacin xy en un grfico de coordenadas cartesianas lo propuso a principios del siglo XIX el matemtico francs Adrien Legendre . A "ojo" y con la ayuda de la regla, habamos dibujado una recta que procuraba distribuir homogneamente a los puntos xy por encima y por debajo de la misma. El problema que resolvi Legendre fue calcular exactamente una recta que deje una distancia "promedio" homognea entre ella misma y el conjunto de puntos localizados xy . El nombre proviene de la premisa (o condicin) que debe cumplir la recta de regresin : " la suma de los cuadrados de las distancias verticales ( desvos) de los puntos a la recta debe ser el menor posible".

Trabajar aritmticamente con " cuadrados " obedece a las mismas ideas que discutimos a propsito de los desvos . Es un desatino hablar de distancias "negativas"; sin embargo para localizar por "encima" y por

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

"debajo" de la recta, lo ms simple es colocar signos diferentes a cada una de esas localizaciones. Ese "truco" matemtico obliga, para los clculos, a elevar al cuadrado los valores de las distancias, de manera que todos tengan el mismo signo (+). El problema se resuelve planteando para los clculos la recta y=a + bx que satisfaga la condicin sine qua non de los "cuadrados mnimos" . Un elemento esencial de la ecuacin de la recta es " b": la pendiente de la recta . En efecto si "b " es 0 (cero), luego y = a para cualquier valor de x , no hay relacin alguna entre x e y , se dice que no hay "correlacin" como modo de negar asociacin vinculante. El matemtico ha introducido en el software de clculos estadsticos, ecuaciones que permiten calcular las constantes "a" y "b" a partir de los hallazgos xy. Slo a ttulo de ejemplo veamos una de las formas de calcular "b ": (J. Freund Ibid)

Por lo tanto, los datos a suministrar para el clculo son cada par de valores x e y. El primer dato calculado ser la pendiente de la recta: "b ". Por supuesto que la pendiente puede ser positiva o negativa.

El segundo dato calculado ser la dispersin promedio (el Desvo Standard ) de las localizaciones xy por encima y por debajo de la recta de pendiente "b" . Para ello el experto ha incorporado al programa la frmula para calcular el DS tanto para x como para y . Con esos desvos y la pendiente "b" obtiene el DS xy .

Los "grados de libertad" son "n 2" en estos clculos. El tercer dato calculado ser el Error Standard ( ES) de la pendiente b.

Finalmente se calcula el Intervalo de Confianza para b (95 99 seg n lo previsto). Por ejemplo: IC 95 = b ESb t. El factor de correccin "t" se busca en tablas elaboradas con "n2" grados de libertad. Reiteremos la idea fuerza: "Un elemento esencial de la ecuacin de la recta es "b": la pendiente de la recta ; si "b" es 0 (cero), luego y=a para cualquier valor de x, no hay correlacin alguna vinculante, explcitamente, no hay vinculacin causal entre x e y". Si uno de los lmites del IC95 de b es 0 (cero) significa que el valor paramtrico de la pendiente (la constante poblacional) tiene un 95% de probabilidades de ser un valor dentro de un rango que incluye una pendiente nula (cero). En ese caso se interpreta que la pendiente hallada fue una variacin

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

casual; que no hay asociacin vinculante xy. En otras palabras, se acepta la hiptesis nula porque no hay correlacin. La existencia de una correlacin significativa no implica necesariamente asociacin casual entre x e y . Ambas podran estar determinadas, en el mismo sentido y en la misma proporcin por una tercera variable no considerada, y en consecuencia hallar una correlacin (asociacin) significativa entre "x y" sin que una de ellas sea causa del cambio de la otra, sino que simplemente van "cambiando juntas".

Coeficiente de Correlacin Es la manera m s tradicional de expresar las mismas ideas anteriores. Como atrevida sntesis que quizs nos criticaran fuertemente los expertos les contamos a nuestros lectores que para el lenguaje que pretendemos mejorar, retenemos el concepto de Coeficiente de Correlacin (r) con la raz cuadrada de la relacin entre cunto se dispersan las localizaciones reales xy de la recta de regresin calculada (numerador ), con lo que se dispersan de un promedio simplemente aritmtico (denominador) , como si la recta fuese horizontal (b =0).

De la ecuacin se desprende que las correlaciones pueden ser positivas o negativas.

Observe los grficos y entender que cuando la pendiente de la recta de regresin se aproxima a cero (ms horizontal) el numerador y denominador se asemejan y r=0. El coeficiente de correlacin aislado no es suficiente para aceptar o descartar la hiptesis nula. La dispersin debe ser considerada. Por lo tanto y por supuesto, tambin se debe calcular el ES de r, como asimismo establecer el IC 95 y las ideas para aceptar o rechazar la Hiptesis Nula son las expresadas para la pendiente de la recta de regresin. Nuevamente, un coeficiente de correlacin "significativo" no implica vinculacin causal entre las variables consideradas. El lector seguramente ya percibi que cargando los datos obtenidos (x e y), el programa calcula "b" , "r", "IC 95", etc., y expresa el significado estadstico. Parafraseando la expresin atribuda al gran Arqumedes, podramos gritar un Eureka!, conseguir un buen software de estadstica y liberarnos del experto. Cerramos este captulo entonces, con una pregunta para alg n entusiasta lector que se sintiese "liberado" y si la relacin no es "recta" sino exponencial, parablica u otra? . La autosuficiencia cuando no directamente la soberbia, es fuente inagotable de errores.

Index curso - Clase anterior - clase siguiente

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Publicacin: Octubre 2005 Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingeniera e Informtica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

1994-2005

CETIFAC - Bioingenier a UNER

Webmaster Updated: 08/17/2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingeniera e Informtica M dica/Bioengineering- Medical Informatics

Curso: Bioestadstica bsica para m dicos asistenciales Clase N 12: Pruebas para evaluar Evoluci n
Ra l E. Ortego, Carlos R. Secotaro

Index curso - Clase anterior - clase siguiente

Proponemos al lector que imagine observar una pelcula en la cual los protagonistas son grupos de cientos o miles de personas. Nos parece que lo ms parecido a los estudios evolutivos son las pelculas "de guerra"; los casos individuales son anecdticos. En todos los grupos participantes hay testimonios de casos similares; no es la calidad de los fenmenos lo que marca la diferencia. Las pruebas estadsticas que discutiremos a continuacin, son algunas de las maneras con que los expertos realizan comparaciones cuantitativas de sucesos especficos en lapsos predeterminados de observacin en grupos humanos. Estos anlisis cuantitativos son quizs la diferencia esencial entre la oferta teraputica de la medicina "tradicional" y de la medicina "alternativa" para diversas afecciones. La primera se apoya en la evaluacin matemtica comparada de algunos eventos prefijados, habitualmente dicotmicos (s / no), que acontecen en un tiempo y en un conjunto de individuos determinado . Con las conclusiones se propone la conducta mdica a pacientes individuales que padezcan la afeccin estudiada. Se aconseja al paciente en base a las evidencias ( probabilidades calculadas, no certezas ) obtenidas comparando cuantitativamente "muestras", en las cuales se presume, que el paciente en cuestin no fue incluido solamente por casualidad. La medicina "basada en la evidencia" supone la aceptacin lisa y llana del "principio de incertidumbre", por lo tanto es imposible predecir el comportamiento individual ("la suerte"). La falta de comprensin del principio por ambas partes (terapeutas y pacientes), conlleva vivenciar como "fracaso" la evolucin indeseada. Quizs, algunos litigios por "mala praxis" no sucederan evitando expectativas desmesuradas. El otro tipo de medicina aconseja al paciente afectado que trate de reproducir alguna(s) circunstancia(s) observada(s) en evoluciones definidas genricamente como "favorables" pero no comparadas! . Los que a ella acuden "ya tienen el no van por el s", asumen la evolucin "desfavorable" como inexorable, por ello es que no se suele registrar como "fracaso" sino como "mala suerte" la ausencia de la respuesta pretendida. No deja de parecernos interesante que a este tipo de oferta teraputica se la aconseja denostando "conclusiones estadsticas" por gen ricas y "no personalizadas", pero se la evala naturalmente con el principio de incertidumbre in mente .

Confusiones por Heterogeneidad El ingreso de pacientes a un estudio de evolucin a largo plazo es progresivo; mientras se completa el nmero de pacientes pretendido (tamao de la muestra) ya suceden eventos registrables. Tambin sucede que la cantidad de pacientes vara a lo largo del perodo de registro de eventos por diversas causas ajenas a la investigacin. Estas circunstancias son fuente de "confusin" ya que: 1. La observacin temporal es heterognea : no slo por serlo el ingreso; algunos egresan por

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

2. 3.

4.

motivos ajenos al estudio y en momentos imprevistos, aleatorios. El nmero de pacientes es heterogneo : consecuencia directa de lo expuesto. La ocurrencia de los eventos es naturalmente heterognea : an para sucesos "duros" y comunes como la muerte, el evento no les suceder a todos los participantes en un lapso prefijado y heterogneo como vimos, de observacin. La causa de los eventos suele ser heterognea : puede obedecer a mecanismos absolutamente diferentes a las variables consideradas. Por ejemplo: En estudio de control de mortalidad post operatoria suceden eventos acaecidos por epidemias o diversas catstrofes individuales o generales.

Anlisis de Supervivencia : Mtodo de Kaplan Meier El mtodo al cual nos referiremos es aplicable a observaciones temporales en la cual el sujeto afectado por el evento de inters, abandona "para siempre" al conjunto original, a "la poblacin expuesta". No es necesario que el suceso sea mortal; podra ser que el participante reciba un tratamiento quirrgico, o necesite un frmaco, etc. Aunque el evento fuese transitorio y/o indeleble, el receptor ya no pertenece a la poblacin original que "nunca" haba recibido o le haba pasado tal cosa en el lapso y en las condiciones preestablecidas de observacin. El lector ya puede percibir como influye en la interpretaci n de los resultados del conjunto las heterogeneidades descriptas. Una pelcula se "anima" al exponer a cierta velocidad fotografas secuenciales. Algunos expertos propusieron atenuar la heterogeneidad temporal "inmovilizando" al conjunto en el instante de cada evento (fotografas) para "observarlas" secuencialmente. Las filmaciones en "blanco y negro" tenan fotos instant neas que no podran competir con las actuales, sin embargo, la secuencia permita apreciar guin e interpretaciones. El mtodo de Kaplan Meier procura una actualizacin instantnea de la proporcin residual, de la proporcin de participantes "no afectados" ; por ello, cuando el evento es la muerte, el porcentaje remanente expresa la supervivencia. Comenzaremos por ver la ecuacin de actualizacin que propone el mtodo: S = Supervivencia Ri = Pacientes expuestos en el instante i Ei = Nmero de eventos en el instantes i Observe a continuacin el resultado al aplicarla cuando sucede el primer evento (S p=1 ) en una poblacin expuesta al momento del suceso de 1000 personas. Luego, al cabo de un tiempo, al procesar otro evento con una Supervivencia Previa del 50% ( Sp =0,5) siendo la poblacin expuesta en ese momento tambin !? de 1000 personas . Repetir el n mero de personas expuestas en diferentes instantes del estudio evolutivo es una manera de poner en evidencia las consecuencias de la heterogeneidad referida y el modo de obviarla: en cada instante importa el nmero efectivamente expuesto. Esta heterogeneidad implica que una lnea que recorra la tasa de supervivencia no es paralela con una lnea que recorra el nmero de personas expuestas.

La supervivencia instantnea (S a) cuando ocurre el primer evento es 99%; el evento con supervivencia previa de 50% , la modifica a 49% ( Sa o supervivencia instantnea). Esta descripcin de los acontecimientos, se manifiesta grficamente en descensos "escalonados" ya que ocurren perodos variables sin modificaciones (sin eventos).

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

El mtodo permite estimar un Error Standard ( ES ) con razonamientos comunes a las distribuciones binomiales. Con el ES se puede establecer una "banda" o rango de supervivencia con un valor superior y uno inferior que correspondan a un IC 95 .

Evolucin Observada vs Evolucin Esperada Las Tablas de Contingencias permiten aplicar el test de 2 (Chi cuadrado) La siguiente Tabla muestra como sera el registro de mortalidad y supervivencia durante un lapso determinado, de pacientes con una afeccin especfica que han recibido o no (Grupo Control) para la misma un Tratamiento Quirrgico.

Para las generalizaciones usaremos la siguiente nomenclatura n : el nmero total de pacientes. n m : los muertos n v: los vivos n.q : los operados n. c : los no operados o "controles"

La ecuacin de la distribucin 2 calcula la diferencia entre lo hallado en cada casillero ( n ij ) con lo esperado si el fen meno fuese azaroso ( eij) ; esta diferencia se relaciona con lo esperado ( eij) para expresar cuantas veces "cabe" ese valor en la diferencia hallada. En el ejemplo de la mortalidad con tratamiento quirrgico vs tratamiento mdico (control) el valor esperado eijse calcula como vimos en la ecuacin
2para

cada casillero.

Chi Cuadrado ( 2) de Pearson Es la misma prueba estadstica X 2 de los prrafos previos y de cap tulos previos compararando dos proporciones; dnde se verifica, adems, que X2 =Z2. Recordemos:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Tambin se puede analizar con 2 una diferencia de dos proporciones. Se estudia la aparicin de un suceso x; en una muestra n1 sucede x 1 y en una muestra n2 sucede x2. Las proporciones son x1/ n1 y x2 / n 2 ; aunque al lector comn le cueste creerlo, el experto trabajando con los trminos de la misma ecuacin
2

calcula que:

Actualmente se calcula 2 llenando los casilleros correspondientes en un software, ya que n 1 podra ser el grupo operado ; n 2 el grupo control y as sucesivamente. El recorrido "largo" precedente para llegar al 2 de Pearson no ha tenido otra intencin que tomar conciencia junto a nuestros lectores de que el tratamiento matemtico contina siendo comparar lo esperado con lo sucedido ( observado) . En las ecuaciones del proceso "largo" se comprende que si lo "observado" y lo "esperado" es similar, la diferencia entre ambos se aproxima a 0 (cero) y 2 tambin se aproxima a 0 (cero) con lo cual se aceptar la hiptesis nula. La ecuacin compleja con proceso "sencillo", slo se completan casilleros ( n n y xn), es la misma ; slo que nos parece ms difcil percibir en esta presentacin matemtica la esencia de la comparacin estadstica intrnseca de 2. Por supuesto que las comparaciones pueden ser sobre los muertos, para analizar mortalidad , o con los casilleros de los vivos para analizar supervivencia .

Observado vs Esperado por Perodos de Control o "Estratos" El procedimiento explicado para 2 puede hacerse por etapas o perodos de observacin, por ejemplo anuales, hasta completar el lapso programado ( 5, 10 , n aos). En cada ciclo, perodo o etapa o " estrato" cambia el tamao de las muestras. Hay que descontar lo que ya pas. En la tabla de contingencia del ejemplo, el primer ao comenz con 120 pacientes en el grupo Quirrgico y 120 en el grupo Control; el segundo ao comenzar descontando los muertos acaecidos; en esa Tabla: 25 y 15 respectivamente.

Otros factores de confusin en observacin secuencial Es emblemtica la llamada "Paradoja" de Simpson. Es el caso que una variable ignorada o no considerada (muestras errneamente interpretadas como independientes) establece en la prueba X2 de Pearson una asociacin espuria, inexistente, entre las variables consideradas; en otros trminos, una asociacin "Positiva Falsa". Tambin puede suceder exactamente lo contrario, que la variable "escondida" desdibuja una asociacin existente ("Negativa Falsa"). En un anlisis por estratos puede suceder que se pierda la independencia entre los datos; en otras palabras: el dato previo influye sobre el dato posterior . La muestra analizada en cada perodo (en el "estrato" n ) tiene valores dependientes del perodo (estrato) previo, pasan a ser datos "apareados" . Sin saberlo, se pierde independencia de las muestras y no se traslada esta circunstancia al tratamiento estadstico. La estratificacin que procura salvar motivos de confusin "per se" puede confundir la interpretacin (paradoja de Simpson). Las pruebas que mencionaremos a continuacin proponemos retenerlas como modalidades de 2 para comparar evoluciones de manera secuencial programada y con las cuales se procura "salvar", por lo menos atenuar errores o confusiones.

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Previamente nos pareci oportuno recordar algunos conceptos de lgebra elemental.

Recordemos Matemtica Con la confianza en que nadie se ofenda recordaremos que: "logaritmo en base a de un nmero b es un nmero c tal que a elevado a la c es igual a b".

Los logaritmos ms comunes son los logaritmos "decimales" ( base=10) y los logaritmos "naturales" con base en un nmero simbolizado como "e". En los logaritmos decimales se omite la base, se da por supuesta: Log 100=2 porque 102=100. La transformacin logartmica tiene efectos muy interesantes en los grficos de funciones en coordenadas cartesianas. Veamos un ejemplo de ello:

A lectores con fuerte rechazo a las ecuaciones, les proponemos observar en el grfico de la izquierda la lnea punteada roja, que expresa como "decae" la magnitud "y" cuando aumenta el valor de "x". A la derecha , el mismo fenmeno, expresado con logaritmos. La aplicacin de logaritmos transform una ecuacin exponencial en una ecuacin de primer grado (exponente=1) con el consiguiente cambio grfico: se obtuvo una recta , en este caso con pendiente = log 0,2 . Es comprensible que los expertos aprovechen estas propiedades para sus comparaciones estadsticas. Imagine el lector que "100000" podra ser una poblacin ; 20% ("0,2") una Tasa Libre de Eventos, supervivencia por ejemplo, pero tambin podra ser un OR o un RR ; " x" el tiempo en la unidad que desee, y finalmente "y" el resultado del tiempo en las variaciones de esa poblacin expuesta a lo que exprese "0.2". Las ecuaciones son la manera de "hablar" de grficos sin dibujarlos. Insistimos en nuestra sugerencia de procurar "pensar grficamente" . Sugerimos que observe nuevamente ambos grficos previos. Quizs coincida en que no necesita realizar clculos complejos, para comprender que es ms sencillo comparar evoluciones, con ecuaciones lineales (rectas) que con otro tipo de ecuaciones. Continuamos con algunas pruebas que "trabajan" al test de
2

para "salvar" confusiones.

LOG - RANK TEST (Pruebas de Rango Logartmico) obtiene por la sumatoria ( ) de diferentes perodos o etapas o estratos. Se calcula en cada uno el 2 de Pearson, actualizando el tamao de la muestra en la etapa o estrato, e incorporando lo acaecido
2se

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

durante la misma. Sumatoria de instantneas.

El lector seguramente ya percibi que en cada perodo, para las comparaciones, se consider el n mero de sucesos ( Eventos + ) referido al total expuesto en cada grupo; es decir que se ha trabajado con la prevalencia denominada Riesgo . Al relacionar un grupo con respecto al otro, se considera el Riesgo Relativo ( RR). Podra trabajarse con el modo Odds, en cada muestra la proporcin a considerar sera Eventos (+) sobre Eventos (-) en lugar del total expuesto y al relacionar una muestra con la otra se obtendra el Odds Ratio (OR ). El RR (OR ) se aproximar a 1 cuando lo acaecido en ambos grupos sea semejante; recordemos que si lo sucedido es similar a lo esperado, el nmero 2 tambin se aproxima a 0 ( cero ) y en consecuencia se acepta la hiptesis nula (son muestras de la misma poblaci n). El procedimiento investigado no marc diferencias. Queda por resolver si un RR 1 obtenido es casual ( hiptesis nula) o corresponde a la comparacin de muestras de poblaciones diferentes (hiptesis alternativa). Una primer respuesta es el nmero 2 muy distinto de 0 ( cero ) que dar en las tablas correspondientes una p de hallazgo casual que decidir cual hiptesis aceptar. Es habitual expresar los resultados con el Intervalo de Confianza 95 para el RR (IC 95 ). El RR 1 puede ser < 1 > 1 ; se aceptar la hip tesis nula ( diferencia casual ) si uno de los lmites del IC95 es un RR "opuesto", es decir, si es 1 1 respectivamente. Y la transformacin logartmica? El Log Rank Test plantea algo semejante al ejemplo usado para recordar logaritmos. En efecto, el log del OR (o del RR) es usado como la pendiente de la recta . El IC 95 expresado con logaritmos ser un par de rectas paralelas , cada OR una pendiente de recta, un OR "superior" y un OR "inferior" al OR original calculado. La hiptesis nula afirma que en ambos grupos suceden los mismos eventos en la misma proporcin, por lo tanto el OR es 1 (igual numerador y denominador). El logaritmo de 1 es 0 (cero) ya que cualquier nmero elevado a la " cero " es 1 . La pendiente 0 (cero) significa que los eventos que suceden a lo largo del tiempo son semejantes en ambos grupos, ratifica que son muestras de una misma poblacin. La hiptesis alternativa plantea que el OR 1 es una constante porque relaciona dos constantes; afirma que los grupos son muestras de diferentes poblaciones y cada una de ellas tiene su propia tasa (constante) de ocurrencia de eventos. La regresin log stica procura "ver" si hay cambios en el OR a lo largo del tiemp Si eso ocurre, una primer consideracin es que hay factores que se introducen en los clculos y "confunden" la interpretacin. En trminos sencillos, que quizs nos criticarn los expertos, dudar, por lo menos dudar, que un procedimiento realizado en un momento motivar "saltos" en la aparici n de eventos a lo largo del tiempo. Para nuestras humildes pretensiones de entender un poco mejor, asumamos que la esencia de las ideas es la misma, no son cambios conceptuales, sino cambios prcticos que permiten, por ejemplo, comparaciones lineales.

TEST DE MANTEL HAENSZEL Es un modo de procurar que el reconocimiento de la asociacin dentro del perodo (estrato) se haga considerando, teniendo en cuenta, la dependencia que los datos adquieren examinando la muestra original segn se va modificando por los sucesos a lo largo de los perodos (a travs de los estratos). Trata de evitar la "paradoja de Simpson". Un test con algo de historia: " Mantel N & Haenszel W . Statistical aspects of the analysis of data from

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

retrospective studies of disease . J. Nat. Cancer Inst. 22:719 -48, 1959 " En un artculo de 1981, Nathan Mantel a propsito de comentar que desde 1961 hasta esa fecha, su trabajo haba sido citado 815 veces, relata como el investigador junior William Haenszel le present sus ideas para aplicar en comparaciones utilizando tablas de contingencia. Al decir del propio Mantel: " This paper was the conception of its junior author, William Haenszel, who had the practical familiarity with the problems of retrospective studies. My experience had been largely in the application of statistics and statistical thinking to laboratory investigations and Haenszel suggested that I augment his own work by any statistical concepts I thought appropriate. Those concepts were, in a way, simple and I was not satisfied to give them only as mathematical formulas. In the end, there was a blending of Haenszel's practical ideas with my own Haenszel, in his generosity, suggested that the order of authorship be reversed." Lo novedoso fue modificar un diseo para estudios retrospectivos y en general usado con muestras homogneas, en uno que consolidase lo que otros expertos ya estaban intentando; es decir aplicarlo a estudios prospectivos, con heterogeneidades diversas. La esencia del planteo es examinar el OR (RR) en cada estrato para cada grupo, con el clsico 2 : [(observado esperado)2 dividido lo esperado] pero, sin terminar en ese punto el an lisis, proseguir relacionando ese valor 2 calculado con informacin evolutiva obtenida como si las dos muestras fuesen una sola. La informacin evolutiva es ni m s ni menos que la Varianza . En lugar de trabajar matemticamente solo con las proporciones de los muertos, se pueden procesar las varianzas de las proporciones de los VIVOS en cada perodo, se trabaja entonces con Datos de Sobrevida o Supervivencia . Veamos: p v es la proporcin de vivos (sobrevida) pv1 = xv1 / n 1 y pv2 = xv2 /n 2 Para cada perodo la Varianza o Desvo Standard cuadrtico ser:

Luego se sumarn las Varianzas de todos los perodos: V La compleja frmula que elaboraron Mantel y Haenszel ( MH) podramos recordarla para nuestras lecturas de trabajos cientficos que implican evolucin y para los dilogos con los expertos en estadstica que nos asesoran, como la de los 2 de los diversos estratos, relacionados con la de las Varianzas calculadas en cada estrato:

La Hiptesis nula afirma que el OR (RR) es 1 (uno), que sucede en ambas muestras lo mismo a lo largo del tiempo; un 2 cercano a 0 (cero) sustentar la hiptesis nula. Un OR (RR) 1 se expresar incorporando la "banda", el rango (usando logaritmos) del IC 95 de manera de darle significado segn algn lmite del OR sea o no de 1 .

Index curso - Clase anterior - clase siguiente

Publicacin: Octubre 2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingeniera e Informtica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

1994-2005

CETIFAC - Bioingenier a UNER

Webmaster Updated: 08/17/2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingeniera e Informtica M dica/Bioengineering- Medical Informatics

Curso: Bioestadstica bsica para m dicos asistenciales Clase N 13: Investigar Investigaciones

Index curso - Clase anterior - clase siguiente

La informtica con su aplicacin en la transmisin de conocimientos ha logrado desbordar al hombre en su capacidad de adquirirlos. El antiguo estudioso "enciclopedista", vituperado por sus pares en la infancia y adolescencia, admirado y hasta envidiado en la madurez, siempre una rara avis , es hoy quizs, una especie en peligro de extincin. Los programas de preguntas y repuestas televisivos los presentan como "rarezas" mas dignas de exhibicin que de emulacin. Como sea, la superabundancia de mensajes informacin? emitidos obliga a que los receptores usen "filtros" o barreras (Firewalls?) para seleccionarlos protegerse?. Curtidos en polmicas, y con indiferencia a juicios peyorativos adquirida sin pretenderlo, slo por el transcurrir de nuestra vida, pondremos a consideracin de los lectores opiniones discutibles sobre estudiar y/o investigar en lo publicado. Antes de comentar Meta-anlisis por ejemplo, sentimos la necesidad de compartir algunas ideas que a nosotros nos son tiles para ejercer nuestra profesin.

Revisiones sistemticas En la actualidad suele denostarse, indirectamente, la lectura reflexiva comparativa cualitativa como fundamento del accionar mdico. Se predica de tal manera, que todo parece como si las conclusiones cientficas son vlidas, slo si se obtienen por la revisin sistemtica comparativa cuantitativa . Nos parece que se trata de actitudes complementarias; es ms, creemos importante desarrollar en la enseanza de la medicina, aptitudes para ambas. En efecto, estamos convencidos que la primer etapa en la bsqueda del conocimiento es la reflexin sobre las "cosas", que incluye leer y escuchar hallazgos y opiniones ajenas, comparar y " cualificar " crticamente. La "cuantificaci n" la vemos como un valor agregado, a veces opcional, en ocasiones imprescindible, pero no siempre insoslayable para el progreso del conocimiento cientfico. Nos parece importante tener en cuenta que la cuantificacin se apoya y se ejecuta la mayora de las veces, en y con los conocimientos preexistentes. Esta obviedad, lleva a rechazar ideas durante mucho tiempo, por la imposibilidad de cuantificarlas con los medios conocidos al momento de su presentacin. La historia del conocimiento humano es riqu sima en ejemplos al respecto; un pensador moderno dedic un libro al tema, nos referimos a Paul Feyerabend y su obra " Contra el Mtodo: Esquema de una Teora Anarquista del Conocimiento " (Hyspamerica, 1984). Finalmente, y para no abundar ms, en su libro " Tiempos Modernos " (Ediciones B Argentina S.A., por Javier Vergara Editor, 2000) Paul Johnson propone como comienzo de los mismos al 29 de mayo de 1919 . Fue durante el eclipse de sol ocurrido ese da cuando "termin" el universo de las lneas rectas de Euclides y el tiempo absoluto de Galileo, al comprobarse cuantitativamente que la luz poda desviarse doblaba ?! confirmando la Teora de la Relatividad que Albert Einstein hab a propuesto en 1905 .

Meta anlisis Es una revisin cuantitativa y reproducible de publicaciones sobre un tema de inters. Cuantificar, agrupando los datos de publicaciones afines y haciendo un tratamiento estadstico como si fuesen datos de un solo estudio permite satisfacer dos importantes objetivos, ya sea ambos o solo uno de ellos:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

1. 2.

Calcular un efecto global sobre la base de una "muestra" ms grande que cada una de las muestras (estudios) tomadas para el meta -anlisis. Ponderar la heterogeneidad de los estudios como etapa previa a la discusin de protocolos que resuelvan eventuales contradicciones.

Es un trabajo cientfico " virtual " desarrollado con datos reales . Es el resultado de la combinacin de estudios afines . Es un "alto en el camino" para reconsiderar futuras acciones (direcciones). NO ES una sntesis de lo publicado sobre un tema. NO ES un resumen de publicaciones selectas. NO ES la conclusin, el cierre, de temas controvertidos. Proponemos al lector que para el lenguaje estadstico, relacione la idea de meta-anlisis con "reflexiones sobre la marcha", ms que con "conclusiones finales".

Protocolo y Aleatoriedad en Meta-Anlisis En el protocolo se describe la razn del ser del meta-anlisis, fundamentos y objetivos, eventualmente la hiptesis de trabajo; el material de trabajo con los criterios empleados para buscar , incluir y excluir trabajos, el mtodo empleado para combinar y tratar los datos, los resultados del tratamiento estadstico y la discusin de los mismos. Algunas prevenciones sobre los meta-anlisis son muy difundidas, citemos por ejemplo: 1. Sesgo de Publicacin : se publica ms lo "significativo", ms en ciertos idiomas, ms lo auspiciado que lo independiente, ms lo de grupos reconocidos con investigadores de carrera que lo de contribuciones aisladas, m s lo de centros con experiencia que concentran variantes infrecuentes de afecciones comunes, etc. Sesgo por "tendencia" del grupo investigador: Sin pensar en intenciones aviesas, solamente por inclinacin natural (intervencionistas, farmaclogos, clnicos, especialistas, homepatas, alpatas, etc). Quizs tan importante como sealar con pulcritud los datos de estudios incluidos es, por lo menos, citar en la bibliografa los estudios excluidos y no solamente los criterios de exclusin.

2.

La heterogeneidad entre los estudios, como son las caractersticas de la poblacin incluida, la duraci n, los puntos finales, etc., es motivo de intenso trabajo y reflexin previa. Los investigadores pueden optar por construir la homogeneidad. Por ejemplo: si la menor duracin de los estudios incluidos es un ao, para el meta-anlisis se toman del resto de los estudios slo los datos del primer ao, y as con planteos semejantes. Estos temas son motivo de discusin tcnica intensa entre los expertos, que lectores inocentes, a veces ansiosos por evidencias que nos den " seguridad " en el obrar, como somos los mdicos asistenciales, dejamos pasar inadvertidamente, veamos: 1. Modelo de Combinacin de estudios : el tema polmico es resolver de manera adecuada (matemtica) la mayor o menor heterogeneidad de los estudios incluidos estimando la aleatoriedad resultante de la agrupacin. Solamente para nombrarlos porque no estamos capacitados para explicarlos: a) Modelo de Efectos Fijos: Los estudios participan con sus datos pero adems con diferente "peso" segn su precisin. La Varianza es una medida de dispersin, por lo tanto este modelo propicia como medida de precisin el uso de la Inversa de la Varianza b) Modelo de Efectos Aleatorios : Se asume que los estudios incluidos son una muestra de la poblacin de estudios realizados. Cada estudio (con la inversa

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

de su varianza por ejemplo) se pondera con respecto al conjunto de estudios. c) Otros modelos ms complejos (Bayesiano por ejemplo). Estas discusiones que como dijimos nos exceden, culminan en un punto que s nos compete directamente: resolver cuan vlido es el conjunto reunido de estudios, para satisfacer el o los objetivos del meta-anlisis. Repetimos que estos pueden ser: ponderar un efecto comn y/o la heterogeneidad como explicacin de contradicciones.

Una Tabla de Contingencia Superados ( obviados!?) estos preliminares, de los cuales ahora pretenderemos por lo menos, algn comentario de los autores, ver el lector una simple Tabla de Contingencia en la cual cada estudio ocupa una fila con datos encolumnados. En las columnas entonces, el tamao de las muestras, el OR o RR, el IC 95, etc. A la tabla de contingencia se la analiza conforme al clsico 2 ponderando lo sucedido contra lo esperado. El tema entonces en un meta-anlisis no es aplicar 2 a una Tabla de Contingencia, sino llegar a conformarla apropiadamente.

Index curso - Clase anterior - clase siguiente

Publicacin: Noviembre 2005 Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingeniera e Informtica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

1994-2005

CETIFAC - Bioingenier a UNER

Webmaster Updated: 08/17/2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

[Index FAC] [Index CCVC]

Bioingeniera e Informtica M dica/Bioengineering- Medical Informatics

Curso: Bioestadstica bsica para m dicos asistenciales Clase N 14: Bibliografa y Comentarios
Ra l E. Ortego, Carlos R. Secotaro

Index curso - Clase anterior

Compartiremos con nuestros lectores un mail en el que analizbamos el ttulo de estas entregas secuenciales: "Sobre el ttulo del curso tengo varias alternativas no excluyentes. Escuchar y aceptar gustoso sugerencias al respecto (va con copias a quienes saben ms que yo). Creo que los ttulos deben tener en cuenta no solo el contenido (el "Qu") sino tambin el pblico objetivo presunto (el "A quin"). En este caso es obvio que el contenido es: elemental, parcial, asistemtico, con imprecisiones matemticas e intencionalmente sin aplicacin tcnica. En cuanto al pblico "target": el sujeto paradigmtico sera un residente (y/o cursante universitario post grado) que pretende, necesita, entender un poco mejor lo que le presentan en los trabajos cientficos desde el subttulo "Material y Mtodo", el apartado "tratamiento estadstico" y los resultados. Est dirigido a personas que, a lo sumo, son parte de un equipo de trabajo, pero que no tienen la responsabilidad directa en el diseo de protocolos ni mucho menos en la eleccin del tratamiento estadstico de los datos ." Afortunadamente se puede conseguir en bibliotecas y por Internet abundante material para profundizar estos temas con variados grados de complejidad. Nos parece muy til el material que ofrece la Asociacin de la Sociedad Espaola de Hipertensin; Liga Espaola para la lucha contra la Hipertensin Arterial : http://www.seh-lelha.org/stat1.htm . Elaborado por un experto ( Ingeniero Luis Miguel Molinero Casares ) capaz de escribir en un lenguaje ameno para los legos, permite ingresar a temticas espec ficas para completar ideas y tambin para corregir nuestras imprecisiones. El Dr Arturo Cagide en el libro que citamos nuevamente: " Investigacin clnica en Cardiologa" (Editado por Propulsora Literaria, 1991) trata los temas abordados en estas entregas con el rigor cientfico por el cual es reconocido. El libro del Dr Cagide tiene a nuestro juicio el valor agregado de la proyeccin sobre aspectos de Metodologa de la Investigacin Clnica manteniendo el estilo preciso, claro y sencillo de la obra.

Para novedades los clsicos Con una seguridad que nos gustara tener para muchas cosas, les decimos a nuestros lectores jvenes que el tiempo que "inviertan" en leer y reflexionar sobre textos "clsicos", se manifestar en "ganancias" al "actualizar" vuestros temas especficos. En los libros de la Biblia (Eclesiasts y otros) y en las obras de filsofos m s citados que "escuchados", tratando de conocer aunque ms no sea su pensamiento en simpticos resmenes como "El mundo de Sofa", encontrar el mdico ms "evidencias" para "basar" su ejercicio profesional que en enjundiosos trabajos donde el procesamiento matemtico de miradas de nmeros, demuestra a menudo, la "cuadratura del crculo". Con los clsicos se aprende a criticar , entendiendo por tal accin a "distinguir lo verdadero de lo falso", lo "superficial de lo esencial" y tambin sin duda, con todo lo que tenga de opinable: "lo bueno de lo malo". La primera leccin es aprender " autocrtica ", que genera el buen humor de no tomarse demasiado en serio a uno mismo, y como eficaz camino de humildad sin prdida de

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

autoestima. Es por lo menos dudoso, el beneficio de prestar mucha atencin a quien habla demasiado de s mismo, y de sus "importantsimas" contribuciones al conocimiento.

Ms papistas que el Papa Es interesante observar como la necesidad de manejarse con la incertidumbre de un modo racional, ha generado generaciones de entusiastas defensores a ultranza de la "medicina basada en la evidencia". Se la expone como si sus orientaciones ("guidelines") fuesen "verdades reveladas". Qu lejos suelen sitiarse los discpulos de sus maestros! Paul Johnson (ibid) cita a Karl Popper para referirse a Einstein: " Lo que me impresion ms, fue el claro enunciado del mismo Einstein en el sentido de que considerara insostenible su teora si no satisfaca ciertas pruebas". Desde el primer cuarto del siglo XX la humanidad asisti a la difusin y puesta en prctica de tres teoras "cientficas": 1) El Marxismo Leninismo para entender aspectos socio poltico econmicos 2) El Psicoanlisis de Freud para explicar comportamientos humanos y, 3) La Teora de la Relatividad de Einstein para entender los "vacos" conceptuales y prcticos que tena la fsica clsica (Euclides, Galileo y Newton). El "Marxismo Leninismo" y el "Psicoanlisis" eran presentados como nuevas religiones, quiz s por eso dedicaron tanto esfuerzo a denostar a las mismas, se promocionaban como verdades irrefutables, en tanto seguan un pensamiento lgico. Sigamos con la cita de Karl Popper: " Era una actitud completamente distinta del dogmatismo de Marx, Freud, Adler y aun ms de sus adeptos. Einstein estaba buscando experimentos fundamentales cuya coincidencia con sus predicciones de ningn modo demostrara su teora; en cambio, como l mismo lo sealara, una discrepancia determinara que su teora fuese insostenible. Por mi parte, yo pensaba que sa era la autntica actitud cientfica". Creemos digno de comentarios "leer" las evidencias mdicas segn distintos enfoques.

Riesgos y eufemismos Recordemos que Riesgo es un modo de hablar de prevalencia, y que la misma es una proporcin. El Riesgo de muerte por una afeccin en un grupo es de 5% ( 0,05) si se comprueba que se mueren por esa afeccin 5 personas cada 100 que la padecen. Un grupo tratado con una droga exhibe una mortalidad (Riesgo ) de 3.5% (0.035 ) que es" estadsticamente significativa " (la p robabilidad de que sea casual es < lo " aceptado") La Reduccin de Riesgo Absoluto es 1.5% (5% - 3.5%) El Riesgo Relativo del grupo "tratado" con respecto al no tratado es 70 % (0.7) ya que resulta de dividir (0.035 / 0.05). La Reduccin de Riesgo Relativo es 30%. Es matemticamente correcto decir que se mueren 70 pacientes tratados cada 100 pacientes muertos no tratados, o lo que es lo mismo que se mueren un 30% menos. Lo que tambin es cierto, pero no se suele decir, es que para que contar 70 muertos entre pacientes "tratados", hay que "tratar" a 2000 pacientes, ya que mortalidad 3.5% implica que se mueren 35 cada 1000 pacientes tratados. En trminos absolutos, si la mortalidad sin tratamiento es 5%, y con el tratamiento es 3.5%; se "salvan" con el tratamiento 1.5 %; para no usar fracciones que confundan, se "salvan" 15 pacientes cada 1000 tratados. Claro que esta manera de contar los sucesos implica que para que se "salve" 1 paciente hay que tratar aproximadamente 67 pacientes (1000 / 15). El Nmero Necesario de Pacientes a Tratar es 67 . Esto implica que 66 personas recibirn un tratamiento que no los beneficiar; no deja de ser reconfortante tal demostracin de altruismo. Lo sabrn los abnegados altruistas? Suponga ahora que el tratamiento salvador tiene un efecto secundario molesto que afecta al 30% de los pacientes, slo molesto, no fatal, Tos persistente por ejemplo?. Si las matemticas no fallan el 30% de

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

66 es aproximadamente 20 pacientes. El Nmero de Pacientes con la afeccin que motiv el tratamiento, ms un efecto secundario agregado molesto persistente ser de 20 pacientes por cada uno que se "salva". Se podr argumentar que no es altruismo porque cada uno de los participantes quiere sacar el premio de ser " el que se salve ", el " premiado". Saben los participantes que es as? Saben algunos pacientes asintomticos que se van a "operar" slo para cambiar de grupo de prevalencia? Saben los abnegados y/o arriesgados participantes que el argumento: "quiere vivir o morir" puede ser casi una extorsin? Saque el lector cuentas con un efecto secundario grave; si se anima, haga cuentas con una afeccin frecuente con baja tasa de un riesgo impactante, tratado con recursos con mayor prevalencia de efectos secundarios que la tasa de beneficios eventuales a recibir. Si a esas cuentas le agrega la variable costos pecuniarios ($$$) y redistribucin de los montos entre los involucrados en la afeccin y sus "tratamientos", arriesga sentir, por lo menos, una fuerte preocupacin. Agradecimiento y deslindar responsabilidades Una vez ms, no hemos pretendido ensearle estadstica a nadie, slo compartir ideas que aplicamos para estudiar y ejercer nuestra profesin. Adquirirlas llev mucho tiempo, y por qu no, esfuerzo para intentar comprender conceptos de uso infrecuente. Los autores no somos investigadores de profesin ("tiempo completo"), hemos hecho comunicaciones ocasionales que no han producido ninguna inflexin del conocimiento; somos mdicos cuya mayor dedicacin temporal es la asistencia personal de pacientes, con actividad docente "dedicacin simple" de grado y post grado. Esperamos que se entienda entonces nuestra intencin de compartir con nuestros pares desde un mismo nivel mdico, sto, lo que tenemos. El Profesor Dr. Armando Pacher y el Dr. Jorge Ral Rodrguez han tenido la deferencia de supervisar estas entregas. Les debemos no slo el agradecimiento por el tiempo dedicado, sino tambin porque arriesgando su prestigio duramente ganado, nos han permitido verdaderas "licencias literarias", al "dejarnos pasar" imprecisiones matemticas, al filo muchas veces del error conceptual, en post del objetivo de poner en lenguaje llano, coloquial, conceptos que subyacen en la "medicina basada en la evidencia". Sepan los expertos disculparnos, y tolerarnos, como nuestros amigos.

Index curso - Clase anterior

Publicacin: Noviembre 2005 Tope

Preguntas, aportes y comentarios ser n respondidos por el relator o por expertos en el tema a travs de la lista de Bioingeniera e Informtica Mdica Llene los campos del formulario y oprima el botn "Enviar"

Preguntas, aportes o comentarios:

Nombre y apellido: Pas: Argentina Direccin de E-Mail:

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Enviar

Borrar

Dr. Diego Esandi Co -Presidente Comit Cientfico


Correo electrnico

Dra. Silvia Nanfara Co -Presidente Comit Cientfico


Correo electrnico

Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador


Correo electrnico

1994-2005

CETIFAC - Bioingenier a UNER

Webmaster Updated: 08/17/2005

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology