Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Médica - UNMSM
Estadistica Médica - UNMSM
ESTADSTICA MDICA
Colaboradores: Dr. JORGE ALARCN VILLAVERDE Ing. EDITH ALARCN MATUTI Ing. LUZ BULLN CAMARENA Dra. ELSY CUELLAR FRETEL Lic. ESPERANZA GARCA CRIBILLEROS Dr. CSAR GUTIERREZ VILLAFUERTE Mg. MARTHA MARTINA CHVEZ Dra. MARA TERESA PERALES DAZ
2005
ESTADSTICA
Dra. Julia Piscoya S.
Antiguamente la estadstica solo era considerada para hacer los consolidados numricos de hechos ocurridos, hoy en da la estadstica juega un papel muy importante tanto en nuestra vida cotidiana como en la investigacin y situaciones especiales para la toma de decisiones, que sera muy extenso de mencionar. Las diferentes tcnicas que ha desarrollado hacen que su uso sea aplicable en las diferentes reas del conocimiento cientfico: fsica, qumica, antropologa, biologa, por mencionar algunas. En lo que respecta a nuestro campo, la Bioestadstica cada vez es ms utilizada tanto para describir, extrapolar resultados, tomar decisiones, establecer diseos de investigacin, etc, lo cual hace que sea imposible concebir un especialista de la salud que no tenga conocimientos y un mnimo de habilidades de esta disciplina. La estadstica es una rama de la matemtica referida a un sistema o mtodo cientfico usado en la recoleccin, organizacin, anlisis e interpretacin numrica de la informacin. El mtodo estadstico nos ayuda a elaborar inferencias inductivas a partir de la constatacin de hechos particulares, independientemente del mtodo de investigacin con que se haga esta constatacin. Desde el punto de vista descriptivo-analtico la estadstica se define como u conjunto sistemtico de procedimientos para observar y describir numricamente los fenmenos y descubrir las leyes que regulan la aparicin, transformacin y desaparicin de los mismos. En el campo de la Estadstica se diferencian dos partes:
ESTADSTICA DESCRIPTIVA O DEDUCTIVA es la que, como su nombre lo indica, se limita a la descripcin de un conjunto de datos sin llegar a generalizar con respecto a un grupo mayor. ESTADSTICA INFERENCIAL O INDUCTIVA es la que se dedica al anlisis y trata de llegar a conclusiones o generalizaciones acerca de un grupo mayor, basado en un grupo menor o muestra.
EL METODO ESTADSTICO
El mtodo estadstico comprende las siguientes etapas: 1. 2. 3. 4. 1.Planificacin de estudio Recoleccin de la informacin Elaboracin o tabulacin de los datos recogidos Anlisis e interpretacin PLANIFICACIN DEL ESTUDIO
En la planificacin des estudio tenemos que tener en cuenta : 1. Planteamiento del problema 2
2. 3. 4. 5.
Naturaleza e importancia del problema que se estudia Determinacin de los objetivos Bsqueda y evaluacin de la informacin existente. Diseo del estudio Problema Hiptesis Variables: tipo, definicin operacional de variables, control de variables extraas, instrumentos de medicin Sujetos de estudio (Poblacin, muestra) Tipo de estudio (Descriptivo, analtico) Fuentes de informacin (Primaria, secundaria) Plan de Anlisis 6. Cronograma de Actividades 7. Presupuesto Es importante notar que en la planificacin del estudio se debe desarrollar el PLAN DE ANLISIS. Uno de los errores frecuentes es obviar este punto y solo despus de que se ha recolectado la informacin se piensa en cmo debe presentarse la informacin; esto trae consigo una recoleccin inadecuada de la informacin, ya sea por exceso o por defecto. 2.RECOLECCIN DE INFORMACIN
Preparada la investigacin comienza la recoleccin de datos. La recoleccin de la informacin puede hacerse de muchas manera. El mtodo seleccionado depender de:
Los objetivos y diseo de estudio Disponibilidad de los recursos humanos Recursos financieros
Esta etapa es muy importante, deber hacerse con mucho cuidado, porque en muchos casos esta no puede repetirse para una correccin. De ella depende todo el resultado posterior; si esta mal realizada se har una elaboracin y tabulacin inadecuada de los datos, dando origen a un anlisis errneo e interpretaciones equivocadas. Otro punto a tenerse en cuenta es que tipo de resultados se quieren producir, si se pretende producir resultados cuantitativos con cierto grado de precisin o bien datos cualitativos que proporcionen informacin de tipo descriptivo. Es frecuente que los objetivos del estudio requieran de informacin cuantitativa y cualitativa, lo que implica que se debe emplear ms de un mtodo de recoleccin de informacin. 2.1. MTODOS DE RECOLECCIN CUALITATIVA
Entrevista no estructurada Grupos focales Observacin directa y otros 2.2. MTODOS DE RECOLECCIN CUANTITATIVA
2.2.1. ENCUESTA Es una tcnica o procedimiento de recoleccin de datos en muestras poblacionales. El instrumento que se utiliza en una encuesta es el cuestionario. Este consiste en un conjunto de preguntas formuladas y escritas que sirven para recoger datos orientados a un fin especfico; puede ser desarrollado a travs de una entrevista o auto administrado. La entrevista es una conversacin guiada por preguntas que el entrevistador (llamado tambin encuestador) realiza a la persona entrevistada. En este caso, las preguntas del cuestionario son ledas por el entrevistador, quien a su vez consigna las respuestas del entrevistado en el cuestionario correspondiente. Cuando es auto administrado, el entrevistado recibe el cuestionario directamente o por correo para que l mismo consigne sus respuestas. ETAPAS DE UNA ENCUESTA: 1. Definicin de los objetivos de la encuesta. El objetivo de la encuesta es recoger informacin (datos) para resolver un problema cientfico determinado. Esta informacin estar en relacin a la/las hiptesis que formule el investigador y al conjunto de variables que le permitan describir o explicar el fenmeno en estudio. Por ejemplo: si el problema es saber Cul es la relacin entre hipertensin y consumo de sal? y la hiptesis es que El excesivo consumo de sal en la dieta est asociado a la hipertensin el objetivo de la encuesta ser recoger datos acerca de presin arterial y la historia de consumo de sal en la dieta. Pero adems de estas dos variables principales sabemos que hay otros factores que pueden tener importancia en la hipertensin arterial como: edad, raza, sexo, ocupacin, antecedentes familiares, etc. Por lo tanto los objetivos de esta encuesta sern: Recoger datos sobre presin arterial Recoger datos sobre historia de consumo de sal en la dieta Recoger datos respecto a la edad, sexo, raza, ocupacin, historia familiar, etc.
2. Delimitacin de la poblacin a estudiar. Es importante delimitar la poblacin que va ser estudiada, por lo que ser necesario definir criterios precisos que permitan establecer qu sujetos pertenecen o no a la poblacin objeto de estudio. 3. Hacer un estudio exploratorio. El estudio exploratorio consiste en reconocer las caractersticas sociales, culturales, ambientales y la distribucin geogrfica de la poblacin en estudio. Tiene por finalidad establecer la factibilidad del estudio y los instrumentos ms adecuados para recoger informacin. Por ejemplo, si un alto porcentaje de la poblacin es analfabeta no se podr aplicar un cuestionario auto administrado. En esta etapa es til el empleo de tcnicas como el estudio de grupos focales y la observacin. Tambin nos permitir evaluar el grado de aceptabilidad que tendr el estudio en la poblacin seleccionada
3. Preparacin del instrumento. El cuestionario es un instrumento con objetivos definidos que servir para obtener informacin de las variables que se han seleccionado en el estudio, hay que tener en cuenta lo siguiente: - Tipo de pregunta. El cuestionario es un conjunto de preguntas o tems, en donde cada pregunta puede corresponder a una variable, una clasificacin de la variable o a un indicador de la variable. Las preguntas pueden ser de dos tipos: cerradas y abiertas. Las preguntas cerradas son aquellas que ya tienen escritas las opciones de respuesta. Las preguntas abiertas son aquellas que no tienen ninguna opcin de respuesta por lo que el entrevistador tendr que escribir la respuesta que le d el entrevistado. - Orden de las preguntas. Es importante tener en cuenta el orden de las preguntas. Uno de los criterios importantes es la ubicacin de las preguntas llamadas sensitivas, debido a la reaccin que producen en el entrevistado. Por este motivo, se colocarn primero las preguntas menos sensitivas. Otro criterio importante es mantener el orden lgico de las preguntas. Por ejemplo, no se puede preguntar qu resultados tuvo en la alimentacin de su nio con la leche materna, si previamente no se sabe si tiene hijos. - Claridad de las preguntas. Las preguntas deben expresar claramente el contenido de la variable, deben ser comprensibles para la persona que va ser entrevistada, no debe haber dos preguntas en una sola, no deben ser ambiguas, no deben sugerir ninguna respuesta. - Diseo del cuestionario. El diseo del cuestionario es importante para que la persona que entrevista no se equivoque en el llenado. En el diseo hay que tener en cuenta que para una mejor disposicin de las preguntas es conveniente reunir todas las de una determinada rea en bloques. Debe ser gil, es decir que cada pregunta tenga las indicaciones pertinentes para ser respondidas, as como la forma de pasar a la siguiente en el caso de que ella se derive otro grupo de preguntas (se debe indicar el salto de los tems). 5. Prueba piloto. Cuando se tiene diseado el cuestionario se procede al pretest o prueba piloto. La prueba piloto consiste en aplicar el cuestionario en una pequea muestra de la poblacin o en una poblacin con caractersticas similares. El nmero adecuado para aplicarla es entre 5-30, segn sea el nmero de personas del grupo a quien va dirigido; si el grupo poblacional es pequeo no se puede tomar muchos individuos para la prueba piloto, pues ellos ya no sern incluidos en la aplicacin del cuestionario final. Esta prueba piloto se podr repetir las veces que sean necesarias, pero como hemos mencionado depender del nmero de individuos a quien va dirigida. Es importante que el investigador y los encuestadores participen de esta prueba piloto, mediante esta prueba se puede obtener mucha informacin. Por ejemplo, de la entrevista: qu hora es la ms adecuada para hacer la entrevista, el tiempo que demora; del cuestionario: es necesaria la pregunta; las alternativas para las preguntas 5
son suficientes, han sido demasiadas, han sido pocas; en las preguntas abiertas hay suficiente espacio para el llenado; orden de las preguntas; reaccin del entrevistado frente al cuestionario, alguna de las preguntas despierta una reaccin inadecuada al cuestionario; han sido claras las preguntas para el entrevistado; el diseo del cuestionario permite un llenado fcil o tiene elementos que dificultan su manejo. Para el investigador, la prueba piloto puede servir para aprender algo nuevo del problema, introducir nuevas preguntas e incluso reformular su hiptesis. Tambin le sirve para decidir cules de los encuestadores son aptos para participar en el estudio, ver el tiempo que demoran en cada encuesta, evaluar el tiempo que demoran para desplazarse en la zona, lo que le permitir ajustar mejor los tiempos y hacer un cronograma de actividades ms exacto. Para los encuestadores les sirve para familiarizarse con el cuestionario. 6. Aplicacin del cuestionario. Concluida la prueba piloto se tiene el cuestionario final para su aplicacin, cabe sealar que para esta etapa los encuestadores ya deben estar capacitados y con el manual de encuestadores aprendido. Es importante que durante el desarrollo de la encuesta halla una o ms personas encargadas de la supervisin del llenado completo del cuestionario; as, si alguno de los encuestadores omiti alguna pregunta puede regresar a completar la informacin. 3. ELABORACIN O TABULACIN DE LOS DATOS RECOGIDOS
Revisin y correccin de la informacin recogida Procesamiento de los datos Preparacin y seleccin de tablas y grficos ms adecuados
Una vez recogida toda la informacin es necesario someterla a un examen crtico con la finalidad de comprobar que cumple con las condiciones indispensables. El objeto de la crtica es clasificar el material en tres grupos: material bueno, material incorrecto pero corregible y material incorregible o desechable; la clase e importancia del error cometido determinan la admisin o no de los datos recogidos.
PROCESAMIENTO DE LA INFORMACIN
Terminada la revisin y correccin se inicia la etapa del procesamiento de los datos. Si es que se ha aplicado una encuesta o si es que se han recolectado los datos en un formato determinado, la primera etapa del procesamiento es la codificacin. Esta consiste en el traslado de las respuestas a un lenguaje sencillo (nmeros) con el objeto de facilitar el anlisis; antes de iniciar la codificacin es necesario tener el "libro de cdigos", que no es sino un listado de valores para cada una de las respuestas que existen en el cuestionario. Es importante que una vez terminada la codificacin se haga un control de calidad, seleccionando un pequeo grupo de encuestas y revisando si ha sido correcta la codificacin; si hay muchos errores habr que revisar nuevamente este paso, pues esta es una fuente de error en los resultados. Si el cuestionario o el formato utilizado ha sido precodificado, no se tendr que hacer este paso. Terminada la codificacin se proceder a la tabulacin de los datos, sta puede realizarse en forma manual o mediante el uso de mquinas (computadoras). En el caso de usar computadoras, concluida la codificacin se procede a la digitacin que no es sino la introduccin de los datos a una "base de datos" de algn programa 6
determinado. Una vez terminada la digitacin es conveniente que se realice un control de calidad de este ingreso, para hacer la correccin respectiva, sino se puede convertir en otra fuente de error. Posteriormente, se podr usar para el anlisis algn programa estadstico (SPSS, EPI INFO, MINITAB, etc) que facilitar la obtencin de los resultados.
Realizada la tabulacin inicial, es importante que se seleccionen algunas tablas y grficos para que describan de una manera sencilla y adecuada el tipo de datos que se ha recolectado. 4. ANLISIS E INTERPRETACIN
El anlisis puede ser de tipo descriptivo o inferencial, de acuerdo a lo que el investigador propuso en el plan de anlisis, esta etapa no es sino la consolidacin de lo que ya estuvo planificado anteriormente. Los resultados sern interpretados por el investigador quien se encargar de la descripcin de los hallazgos en relacin a su/sus hiptesis planteadas. Es muy importante que una vez finalizado un estudio se den a conocer los resultados obtenidos, mejor si estos son publicados; si es as, se deber incluir como anexo el cuestionario utilizado, con el objeto de facilitar la interpretacin a otros investigadores, quienes podrn efectuar rplicas si lo creen necesario.
USOS DE LA ESTADSTICA
1. En el diseo de investigaciones.
2. En el anlisis de resultados.
VARIABLES
Dra. Julia Piscoya Sara Dra. Mara Teresa Perales Daz
Variable es toda caracterstica o atributo susceptible de tomar un valor y ser medido. Esta caracterstica puede ser de las personas, objetos, lugares o cosas. Como su nombre lo dice, vara de acuerdo a cada sujeto de estudio; por lo tanto, para convertirse en variable la caracterstica debe tener mas de dos valores. Ejemplos: Sexo, numero de hijos por familia, peso, numero de intervenciones quirrgicas por paciente, edad, episodios de crisis asmtica por paciente, estatura, nivel de educacin, etc.
CLASIFICACIN DE VARIABLES
Las variables pueden ser de dos tipos: 1.- CUALITATIVAS O CATEGRICAS Son variables que determinan una cualidad o atributo, solo se pueden clasificar o categorizar mediante el conteo. Pueden ser: Dicotmicas, si solo tienen dos categoras. Por ejemplo, la variable estado de salud tiene dos categoras: Sano y Enfermo. Politmicas, si tienen ms de dos categoras. Por ejemplo, la variable estado civil tiene ms de dos categoras: Soltero, Casado, Divorciado, Viudo.
2.- CUANTITATIVAS O NUMRICAS Son variables que se expresan numricamente, se pueden medir. Estas a su vez pueden ser discretas o continuas. Variables cuantitativas discretas o discontinuas, toman valores enteros y no pueden tomar un valor entre dos consecutivos. Por ejemplo: nmero de camas hospitalarias, nmero de mdicos por pas. Variables cuantitativas continuas, toman valores que pueden ser cualquiera de los nmeros reales, encontrando infinitos valores entre dos distintos. Por ejemplo: edad, peso.
ESCALAS DE MEDICION
La escala de medicin es el grado de precisin con que se va expresar la medida de una variable. Esta va determinar la forma de presentacin de la informacin y resumen, as como los mtodos estadsticos que se usarn para analizar los datos. Existen cuatro escalas de medicin: nominal, ordinal, intervalo y razn
1.
ESCALA NOMINAL
Como su nombre lo indica, slo nomina o nombra, es la ms simple de las escalas de medicin, clasifica los valores de los datos sin indicar orden o jerarqua. Por ejemplo, en datos dicotmicos, las categoras, valores o clases de las variables sern: si y no, presencia y ausencia, sano y enfermo. En otros datos, como departamentos del Per, los valores de la escala sern: Ica, Lima, Moquegua, Tumbes, etc, dependiendo de los departamentos que se estudie. 2. ESCALA ORDINAL
Esta escala no slo clasifica sino que existe un orden o jerarqua inherente entre las categoras, las observaciones se clasifican como en la escala nominal pero algunas tienen mas o son mas grandes que otras. Por ejemplo, en la variable desnutricin, las categoras o clases sern: leve, moderada y severa o tambin o tambin: tipo I, tipo II y tipo III 3. ESCALA INTERVALO
Esta escala ya no solo nomina y ordena sino que establece distancias es decir que permite medir. El cero de la escala de intervalo es arbitrario o convencional, este no indica la ausencia del fenmeno estudiado. Por ejemplo, en la variable temperatura, el valor 0 de las escalas Centgrada y Fahrenheit no indican la ausencia del fenmeno, sino que se han tomado como punto de partida con relacin a determinados fenmenos fsicos; a esto es lo que se llama cero convencional. 4. ESCALA DE RAZN
Al igual que la anterior, esta escala tambin nomina, ordena y establece distancias, permite hacer mediciones. El cero de la escala de razn es real; esto quiere decir que el valor 0 indica la ausencia del fenmeno estudiado. Por ejemplo, en la variable temperatura, el valor 0 de la escala Kelvin indica la ausencia del fenmeno. La escala de razn permite todas las operaciones matemticas. PROCEDIMIENTOS PARA HACER UNA ESCALA DE MEDICION 1. Determinar el tipo de variable para la que se quiere construir la escala de medicin. 2. Ver el instrumento de medicin que se va utilizar (ser un resultado numrico o solo dar un resultado como mayor, igual o menor que etc. ) 3. Dar nombres a las categoras o clases, algunas veces se pueden usar nmeros. 4. Cuidar que las categoras sean: Exhaustivas: es decir que en las categoras o clases deben estar contenidas todos los valores de la variables estudiada Mutuamente excluyentes: las categoras o clases deben estar claramente delimitadas, de manera que cuando se tenga que clasificar un dato no haya duda en dnde debe ser ubicado.
5. Tener en cuenta que si la variable es cualitativa, los nmeros que se utilicen para designar las categoras no se pueden emplear para realizar operaciones aritmticas. Si voy a usar una escala ordinal con valores 1, 2, 3, estos no servirn para realizar operaciones aritmticas.
DISTRIBUCIN DE FRECUENCIAS
Dra. Julia Piscoya S.
Antes de desarrollar el procedimiento para construir una distribucin de frecuencia es necesario que se definan algunos conceptos importantes que se utilizan en este procedimiento.
DATOS
Conjunto de valores que representan los diversos estados que pueden tomar una o ms caractersticas de uno o ms individuos.
FRECUENCIA
Es el nmero de veces que una caracterstica o valor se repite en un conjunto de datos (poblacin o muestra). A esta frecuencia es la que se le conoce como FRECUENCIA ABSOLUTA. La suma de esta frecuencia nos dar el tamao de la poblacin o muestra estudiada.
FRECUENCIA RELATIVA
Es la relacin que existe entre las frecuencias absolutas y el tamao de la poblacin o muestra estudiadas. Siempre es menor que la unidad.
FRECUENCIA ACUMULADA
Es el nmero de observaciones menores o iguales a un determinado valor de la variable.
Serie Simple
a.- Para datos cualitativos Ejemplo: estado civil de los trabajadores de una empresa soltero-conviviente-divorciado-casado-casado-soltero-casado-conviviente-viudosoltero-casado-soltero-viudo-soltero-conviviente-casado-soltero-soltero-soltero-solteroconviviente- divorciado-casado-conviviente-conviviente Tabla N 1. Estado civil de los trabajadores de una Empresa ESTADO CIVIL Fc % Soltero Casado Conviviente Divorciado Viudo TOTAL b.- Para datos cuantitativos Para organizar una serie simple solo se ordenarn los valores y se contar las veces que se repite cada uno de ellos obtenindose la frecuencia, as como sigue: Edad 10 11 12 13 14 15 TOTAL Conteo IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII III IIIII IIIII II IIII I Fc 5 20 28 12 4 1 70 9 6 6 2 2 25 36 24 24 8 8 100
Ejemplo: edad de 30 pacientes: 28-28-28-28-28-30-30-30-30-30-35-35-35-35-45-45-45-45-56-56- 56-56-68-68-68-6870-70-70-70Tabla N 2. Edad de 30 pacientes Fc % 28 30 35 45 56 68 70 TOTAL 5 5 4 4 4 4 4 30 32.5 32.5 13 13 13 13 13 100
11
Serie Agrupada
Para organizar una serie agrupada hay que seguir algunos pasos previos, antes de obtener la frecuencia. Veamos el siguiente ejemplo: Peso en onzas de tumores malignos extrados a 57 pacientes 68-65-12-23-63-43-32-43-42-25-49-27-27-74-38-49-30-51-42-28-36-36-27-23-28-4231-19-32-28-50-46-79-31-38-30-27-28-21-43-22-25-16-49-23-45-24-12-24-12-69-2557-47-44-51-23 Cuntos intervalos debo formar con estos datos? Segn Daniel, lo ms importante es el conocimiento de los datos. Si se usan pocos, se pierde informacin. Si son muchos, se pierde el objetivo de resumir la informacin El recomienda una regla emprica es que no sea menor de 5, ni mayor de 15. Si se quiere algo ms exacto se puede usar el siguiente procedimiento. REGLA DE STURGES: k= 1+3.322 Log10 n k es el de intervalos y n el de observaciones Cunto sera la amplitud de cada intervalo? W= Rango / de intervalos W es el ancho del intervalo, Rango= V. Max - V. min En el ejemplo sera k= 1+3.322 Log10 57 7 w=79 12 / 7 = 9.6 10 Veamos la distribucin de serie agrupada con los otros clculos de frecuencias:
Int de clase 10-19 20-29 30-39 40-49 50-59 60-69 70-79 TOTAL Fc 5 19 10 13 4 4 2 57 Fc. Acum. 5 24 34 47 51 55 57 Fc. Relat. .0887 .3333 .1754 .2281 .0702 .0702 .0351 1.00 % 8.87 33.33 17.54 22.81 7.02 7.02 3.51 100.00 Fc. Relat. Acum. .0887 .4210 .5964 .8245 .8947 .9649 1.0000 % Ac. 8.87 42.10 59.64 82.45 89.47 96.49 100.00 Punto medio 15 25 35 45 55 65 75
Otro valor a tener en cuenta en la serie agrupada es el Punto Medio, este es importante porque representa al conjunto de valores del intervalo del cual es calculado. Se calcula: 12
Punto medio = Lmite real inferior + Amplitud del Intervalo / 2 En el ejemplo, para el primer intervalo ser: Punto Medio = 10 + 10/2= 10 + 5= 15 Cabe sealar que en la organizacin de frecuencias no es necesario que se muestren todos estos clculos (frecuencia relativa, frecuencia acumulada, frecuencia relativa acumulada, etc.) el investigador seleccionar los que sean necesarios para demostrar su hiptesis. En el ejemplo, hemos puesto todos estos clculos por fines didcticos. Observaciones a tener en cuenta: Algunas veces, con este procedimiento no se obtiene una amplitud del intervalo muy conveniente, se debe usar el sentido comn para elegir la amplitud. Algunas reglas empricas recomiendan, que si los datos lo permiten, la amplitud del intervalo sea de 5 10 unidades, ya que estas hacen el resumen ms comprensible. El lmite inferior del primer intervalo debe contener a la medicin ms pequea y el lmite superior del ltimo a la medicin ms grande.
13
PRESENTACIN DE DATOS
Dra. Julia Piscoya S.
Efectuada la recoleccin de datos estos deben ser sometidos a tratamiento estadstico y deben seguir los siguientes pasos: descripcin, anlisis y generalizacin. Para la descripcin se utiliza tres formas de presentacin: Tabular Grfica Medidas resumen numrico
1.-
PRESENTACION TABULAR
La presentacin tabular es bsica, insustituible y fundamental; es donde se reflejan los conceptos e hiptesis que plantea el investigador. Se utiliza tanto para las variables cualitativas como para las cuantitativas PARTES DE UNA TABLA Ttulo Taln Cuerpo Notas explicativas
Taln
Ttulo
Cuerpo
N orden 1 2 3 4 5
Edad 3 4 2 1 4
Edad 1 2 3 4 5 TOTAL
Fc 2 3 2 1 2 10
% 20 30 20 10 20 100
Fc 5 7 18 13 7 50
% 10 14 36 26 14 100
14
REQUISITOS QUE DEBE TENER UNA TABLA: 1. 2. Ser lo ms simple posible, es mejor 2 3 tablas sencillas a una muy compleja. Debe explicarse por si misma, por eso: Si se usan abreviaturas o smbolos deben aclararse en las notas explicativas. Cada fila y columna deben estar tituladas clara y concisamente El ttulo debe ser claro, conciso y exacto, debe responder a las preguntas Qu? Dnde? Cundo? Y en algunos casos Cmo?. Asimismo, debe consignarse el nmero de tabla. Debern colocarse los totales, se dispondrn en la ltima fila inferior y en la ltima columna de la derecha. 3. Si los datos no son originales debe mencionarse la fuente en las notas explicativas
2.-
PRESENTACIN GRFICA
Es la forma de exponer los datos de manera que permita su comprensin global y de una manera rpida permite una impresin panormica del material presentado. El grfico depende del tipo de variable y de la escala de medicin que se ha utilizado. PARTES DE UN GRFICO Ttulo Escalas Grfico propiamente dicho Notas explicativas
Grfico propiamente dicho
100
0 1 2 Notas explicativas TTULO 3 4
REQUISITOS QUE DEBE TENER UN GRFICO 1. El tipo de grfico que alcance su objetivo con la mayor sencillez ser el ms efectivo. No debe contener ms lneas o smbolos que los que el ojo pueda seguir cmodamente. 2. Todo grfico debe explicarse por s mismo; por eso debe indicarse claramente ttulo, origen, escalas y leyendas. 3. No deben indicarse ms ejes coordenados que los necesarios. 4. Las lneas del grfico deben ser ms gruesas que los ejes. 5. Por lo general, la frecuencia se presenta en el eje vertical y el mtodo de clasificacin en el eje horizontal. La escala de las frecuencias debe comenzar en 0 (Excepcin del grfico semilogartmico que empieza en 1). 15
Adems de estos requisitos, cada tipo de grfico tiene sus particularidades que se deben de tener en cuenta en el momento de construirlos. Antes de seleccionar el grfico debemos tener en cuenta el tipo de variable, qu escala de medicin se ha utilizado, cul es el propsito que se persigue con la construccin; es decir queremos mostrar las frecuencias, queremos mostrar la proporcin de determinados datos, queremos mostrar cmo evoluciona la variable en relacin al tiempo. El siguiente cuadro nos dar algunas ideas para la seleccin, hay que sealar que hay otros tipos de grficos (de caja o boxplot, de hojas, de correlacin, etc), pero los que aqu se mencionan son los que se usan con mayor frecuencia. SELECCIN DEL GRFICO DE ACUERDO AL TIPO DE VARIABLE
TIPOS DE DATOS VARIABLE Cualitativa Cuantitativa discreta Cuantitativa Continua Cuantitativa TIPO DE GRFICO Barras: simples y todas sus variedades Grficos circulares Pictogramas Histogramas Polgonos de frecuencia Curvas Grficos lineales Grficos Semilogartmicos
DISTRIBUCIONES DE FRECUENCIA
TENDENCIAS
Ancn Surco San Isidro La Victoria Distritos Pueblo Libre Jess Mara Lince Miraflores S.J. Lurigancho Lima 0 200 400 600 800 1000 1200 1400
N de hogares
16
Grfico Circular
Figura N2.- Estado Civil de las Madres Adolescentes. Instituto Materno Perinatal. 2003
9%
38%
53%
Polgono de frecuencia
40 30 20 10 0
17
Grfico lineal
Fc
45 40 35 30 25 20 15 10 5 0
Meses
Existen otros grficos como el grfico de tallo y hojas (stemplot), el grfico de caja (boxplot) usados en el anlisis exploratorio de datos. GRFICO DE TALLO Y HOJAS Se utiliza en el anlisis exploratorio de datos Muestra la distribucin de datos cuantitativos. Tiene gran similitud con el histograma No se pierden los datos individuales Es fcil notar la mayor concentracin de los datos En su construccin se usan los datos originales Se observa con facilidad los valores mximo y mnimo. Son ms eficientes en conjuntos relativamente pequeos de datos Ejemplo: Edad de pacientes en un estudio sobre diabetes: 54-59-35-41-46-25-47-60-54-46-49-46-41-34-22 Ordenamos los datos: 22, 25, 34, 35, 41, 41, 46, 46, 46, 47, 49, 54, 54, 59, 60
2 3 4 5 6
2 3 4 5 6
25 45 1166679 449 0
Tallo
Hojas
18
El mdico en el desempeo de su profesin actuar a nivel individual y a nivel de comunidad, en el primer caso llegar a un diagnstico y a un plan de tratamiento para un solo paciente mediante la historia clnica, el examen fsico y pruebas de laboratorio; pero desempear esta misma funcin en el segundo caso, es decir en el campo de la salud pblica, exige utilizar herramientas y tcnicas estadsticas adecuadas para evaluar el estado de salud de una comunidad. Tradicionalmente, estos medios consisten en los datos demogrficos que incluyen el nmero de nacimientos, muertes, enfermedades y diversas mediciones que pueden calcularse a partir de ellos. Cuando tenemos un conjunto de datos y ya los hemos ordenado y clasificado (distribucin de frecuencias) es importante que con uno o dos valores podamos tener una idea del conjunto de los datos. La tarea de resumir consiste en presentar, en lugar de toda la distribucin, solamente unas pocas caractersticas que indiquen los aspectos fundamentales de la distribucin de frecuencias. Estas medidas de resumen varan de acuerdo al tipo de variable y los datos que stas generen. En el caso de los datos cualitativos, cul es la relacin, cul es la mayor proporcin de un determinado valor. En el caso de los datos cuantitativos, cul es la regularidad (medidas de tendencia central) y cul es la variabilidad (medidas de dispersin) de los datos estudiados.
RAZN
Es la comparacin por cociente entre dos cifras de diferente o similar naturaleza, en donde el numerador y el denominador son excluyentes. Por ejemplo, si tengo 380 camas hospitalarias y 95 enfermeras y quiero encontrar la razn entre ellas, tengo que dividir: 380 camas hospitalarias / 95 enfermeras = 4
19
Este nmero constituye un valor que refleja una relacin. En este caso, el nmero 4 se interpreta como que por cada cuatro camas hospitalarias hay una enfermera. Otro ejemplo, en la enfermedad del SIDA en el Per, en 1987 por cada caso notificado en una mujer se haban registrado 25 casos en varones a diferencia de 1998 donde la razn disminuye a 1 de 4 ( Una mujer infectada por cada 4 varones infectados) La manera correcta de expresar el resultado del clculo de una razn es sealar el nmero de elementos del numerador que existen por cada elemento del denominador.
PROPORCIN
Es la comparacin por cociente entre el nmero de elementos de un subconjunto y el nmero de elementos de un conjunto al que pertenece dicho subconjunto. En este caso el numerador esta incluido en el denominador, por este motivo los valores siempre van a ser menores que la unidad. Por ejemplo, si en la poblacin existen 175 casos de cncer pulmonar de un total de 1925 casos de todos los tipos de cncer, la proporcin se calcular 175 / 1925 = 0.09 Este valor indica la magnitud o importancia del subconjunto de casos de cncer pulmonar entre todos los tipos de cncer. Si en otra poblacin los casos de cncer de pulmn fueran 194 y los casos totales de cncer fueran 13 486 194/13 496 = 0,01 Este nuevo clculo de la proporcin en la segunda poblacin, no permite comparar la magnitud o importancia del cncer pulmonar entre las dos poblaciones, no podemos afirmar que la primera poblacin tiene mayor riego de cncer pulmonar que la segunda en base a las proporciones obtenidas, a pesar de que 0,01 es menor que 0,09. Como hemos expresado, los valores que se obtienen en el clculo de las proporciones son menores que la unidad, lo cual no es muy prctico, por esta razn estas proporciones son multiplicadas por 100 obtenindose los porcentajes, facilitando la comprensin y comunicacin.
TASA
Cuando los clnicos dicen que una enfermedad es frecuente y otra es rara presuponen una diferencia en las tasas. Todos los clnicos saben que la enfermedad coronaria es mucho ms frecuente en un hombre de mediana edad que en una adolescente. Saben que el cncer del pncreas es mucho ms comn en las personas de edad avanzada que en los jvenes. Saben que la anemia de clulas falciformes es mucho ms probable en una persona de raza negra que en una de raza blanca. El mdico puede apreciar el significado de las tasas sobre la base de su experiencia clnica personal y la valoracin cientfica y objetiva de artculos de investigacin. Qu es una TASA?
20
Es la comparacin por cociente entre un nmero de eventos ocurridos en un tiempo y lugar determinados y la poblacin que estuvo expuesta al riesgo de que le ocurrieran dichos eventos en el mismo tiempo y lugar. Otra definicin dice que: la tasa es una proporcin en la que el denominador representa a la poblacin expuesta al riesgo de sufrir un dao en un lugar y tiempo determinados. En la composicin de la tasa tiene mucha importancia el denominador, del cual se supone que salen los casos que conforman el numerador. La Tasa es una probabilidad o frecuencia relativa o proporcin, en la cual el numerador es el nmero de veces que ocurre un suceso y el denominador es el nmero de veces que podra haber ocurrido. Como en todas las proporciones el numerador est incluido en el denominador. Las tasas realmente son un tipo especial de medida en la que el denominador tambin incluye una unidad de tiempo. En epidemiologa, las mediciones ms empleadas estn referidas a la magnitud del dao, la velocidad de propagacin y las asociaciones. Las dos primeras se expresan por tasas. La tasa est constituida por tres elementos: 1) El numerador del cociente, que consiste en el nmero de veces que ocurri el evento en un lugar y tiempo determinado. 2) El denominador del cociente que es la poblacin expuesta al riesgo de que le ocurra el fenmeno en el mismo lugar y tiempo. 3) Una constante por la cual se multiplica el resultado del cociente. Debido a que usualmente la divisin del numerador entre el denominador resulta en una cifra inferior a la unidad el resultado suele multiplicarse por 100, 1000, 10000 100000 para una mejor comprensin y fcil lectura. La frmula matemtica corresponde a: N de veces de ocurrencia de un evento en un lugar y tiempo determinados TASA= ________________________________________________________ x 10n Pob. expuesta al riesgo de sufrir el evento, en el mismo lugar y tiempo TASAS DE USO FRECUENTE En medicina, una funcin importante de las tasas y de las proporciones es la de caracterizar la historia natural de la enfermedad. Con frecuencia se usan tres tipos de medidas: 1) Tasa de prevalencia: toma en cuenta los casos antiguos y nuevos, mide la probabilidad de tener una enfermedad en un momento dado. La prevalencia slo proporciona una idea de magnitud del problema. 2) Tasa de incidencia: slo toma en cuenta los casos nuevos, los cuales provienen de la poblacin expuesta, delimitada al inicio del perodo de observacin. Esta caracterstica hace que la Incidencia tenga un poder predictivo mayor que el de la tasa de prevalencia. Una incidencia alta nos
21
informa que el problema se extender en poco tiempo a toda la poblacin susceptible. 3) Tasa de Letalidad: probabilidad de morir por una enfermedad durante un espacio de tiempo a partir de su diagnstico. (Ver construccin de frmulas en Cuadro de Indicadores de Morbilidad y Mortalidad) AJUSTE DE TASAS Una tasa permite expresar de manera cuantitativa y sinttica la relacin entre un evento y la poblacin en que dicho evento puede ocurrir. En este sentido, una tasa refleja la concurrencia de toda una constelacin de factores que influyen para que el resultado de la tasa sea mayor o menor. As por ejemplo, al encontrar que la tasa de intoxicacin crnica por plomo es ms alta en una poblacin que en otra, de inmediato se evoca una imagen mental en la que la poblacin con tasa alta tiene condiciones que favorecen el contacto a la exposicin con dicho metal, tal vez ms repetida o intensamente que la poblacin con tasa baja. Algunas tasas suelen ser consideradas como indicadores que reflejan condiciones ambientales y se emplean para comparar el riesgo que una poblacin tiene con respecto a otra de padecer problemas colectivos de salud derivados de la contaminacin. Sin embargo, la comparacin de tasas puede perder casi totalmente su validez si no se efectan procedimientos que corrijan el importante efecto que suele tener la diferente estructura, respecto a una caracterstica (grupos de edad, sexo, etc.), de las poblaciones a comparar; a ese procedimiento que permite una buena comparacin entre dos poblaciones diferentes se llama AJUSTE DE TASAS. Veamos por ejemplo: 1. ANTECEDENTES MORTALIDAD POR EDADES EN DOS CIUDADES Edad (aos) 0-14 15-20 30-44 45-59 60-74 75 y ms Total Poblacin Ciudad A 500 2000 2000 1000 500 100 6100 Tasa de Defuncio- Mortalidad en nes en A A por 1000 2 4,0 8 4,0 12 6,0 10 10,0 10 40,0 15 150,0 67 11,0 Poblacin Ciudad B 400 300 1000 2000 2000 400 6100 Defunciones en B 1 1 5 18 70 50 145 Tasa Mortalidad en B por 1000 2,5 3,3 5,0 9,0 35,0 125,0 23,77
Segn esta tabla vemos que la mortalidad en la ciudad B es casi el doble que en la ciudad A, as tambin vemos que la composicin de las poblaciones es diferente, por lo que es necesario hacer el ajuste de tasas, en este caso se har el ajuste por edad.
22
AJUSTE DE TASAS 1.- Construccin de Poblacin tipo La poblacin tipo puede ser cualquiera de las dos poblaciones, la A, la B, o la suma de ambas, generalmente se usa la suma de ambas, como lo vamos a ver en el ejemplo. Edad 0-14 15-29 30-44 45-59 60-74 75 y ms Poblacin A 500 2000 2000 1000 500 100 Poblacin B 400 300 1000 2000 2000 400 Poblacin tipo AB 900 2300 3000 3000 2500 500
A la poblacin tipo AB se le aplica las tasas de mortalidad especfica de A y de B y se tiene el N de muertes esperadas que habra ocurrido en la poblacin tipo si sta hubiese estado en las condiciones de A o de B. Con este nmero de muertes se calcula la tasa de mortalidad general ajustada. 2.- Las defunciones tericas se calculan por un despeje de la frmula de la tasa de mortalidad: Tasa de mortalidad = N de defunciones x 1000 Poblacin N de defunciones = Tasa de mortalidad x Poblacin 1000 Edades (aos) 0-14 15-29 30-44 45-59 60-74 75 y ms TOTAL Edades (aos) 0-14 15-29 30-44 45-59 60-74 75 y ms TOTAL N de individuos 900 2300 3000 3000 2500 500 12200 N de individuos 900 2300 3000 3000 2500 500 12200 Tasa Poblacin A 4,0 4,0 6,0 10,0 40,0 150,0 19,32 Tasa Poblacin B 2,5 3,3 5,0 9,0 35,0 125,0 16,54 N de muertes Esperadas 3,6 9,2 18,0 30,0 100,0 75,0 235,8 N de muertes Esperadas 2,25 7,59 15,0 27,0 87,0 62,5 201,84
3.- Con estas muertes esperadas se calcula la tasa para cada una de las ciudades. La tasa ajustada para la poblacin A es de 19,32 por 1000 y para la poblacin B es de 16,54 por 1000. Como podemos apreciar, estas cifras son completamente distintas de las primeras que vimos en la tabla, porque en estas ltimas se control el factor edad.
23
INDICADORES DE SALUD
MORTALIDAD Medida Tasa de mortalidad Numerador N muertes durante un perodo de tiempo Denominador Poblacin entre la que ocurrieron las muertes. Poblacin a mitad del perodo. Poblacin a mitad del perodo. N total de muertes por causas durante el mismo perodo. N de nacidos vivos durante el mismo perodo. N de nacidos vivos durante el mismo perodo. N de nacidos vivos durante el mismo perodo. N de casos diagnosticados con la misma enfermedad al inicio del perodo Unidad Poblacional (10n) 1.000 100.000 1.000 100.000 100.000 100 1.000 1.000 1.000
N total de muertes Tasa cruda o bruta de durante un perodo de mortalidad. tiempo N muertes asignadas a Tasa de mortalidad una causa durante un por causas. perodo. N de muertes asignadas Tasa de Mortalidad a una causa especfica proporcional durante un perodo. N total de muertes por Tasa de mortalidad debajo de 28 das de neonatal edad durante un perodo. N de muertes por debajo Tasa de mortalidad de 1 ao de edad durante infantil. un perodo. N de muertes asignadas Tasa de mortalidad a causas relacionadas materna con el embarazo, parto y puerperio. Tasa de Letalidad N de muertes por una enfermedad durante un perodo MORBILIDAD Medida Tasa de incidencia Numerador N de casos nuevos de enfermedad en un perodo determinado de tiempo. N de casos antiguos y nuevos de una enfermedad en un perodo determinado. N de casos nuevos de enfermedad en un perodo epidmico. N de casos nuevos en contactos de casos conocidos.
10.000 100.000
100
Denominador Poblacin sujeta a riesgo en el mismo perodo. Poblacin sujeta a riesgo en el mismo perodo. Poblacin expuesta al inicio del perodo de estudio. Poblacin de contactos a riesgo
Tasa de prevalencia
1.000 100.000
1.000 1.000
24
Las tres medidas de tendencia central usadas con ms frecuencia en el rea biomdica son: la media, la mediana y el modo.
MEDIA ARITMTICA
Llamada tambin promedio, resulta de sumar los valores de todas las observaciones y dividir la sumatoria entre el total de ellas. Se caracteriza por ser nica, fcil de calcular y porque es afectada por todos y cada uno de los valores del conjunto, de tal manera
25
que los muy grandes o muy pequeos que salen del rango esperado pueden distorcionarla, en tal caso, el valor discordante se analizar por separado. Ejemplo; si se analiza un conjunto de datos de la variable talla (cm) de un grupo de varones adultos, donde uno de ellos mide 230 centmetros, el valor discordante ser 230, ste distorcionar la media, luego, para evitar esa inconveniencia ser mejor analizarlo por separado o de lo contrario, se debe calcular una mediana. La media se calcula con las siguientes frmulas: a.- A partir de una muestra (estadstico)
X =
xi
n
x + x 2 + x 3 + ... + x n = 1 n
xi
N
Donde: N es la poblacin n es la muestra x1, x2,x3, xn son los valores de la variable X es la media.
Ejemplo 1 En la prctica del curso de Bioestadstica, del II Semestre Acadmico de 2004, los estudiantes del tercer ao, entre otros datos, contabilizaron el nmero de respiraciones por minuto en situacin de reposo. Se desea saber la media de las respiraciones de los estudiantes. Los datos se presentan a continuacin:
19 24 16 24 20 14 20 19 19 20 16 24 22 23 17 19 20 24 18 21 28 20 20 17 15 17 22 22 16 18 20 19 18 19 23 14 20 20 20 18 21 18 20 15 22 20 20 18 16 21 18 20 15 17 26 24 16 18 18 21 22 18 22 15 16 20 23 17 16 20 20 22 18 21 16 17 18 20 24 16 24 19 21 22 20 19 21 21 20 22 13 16 17 22 24 21 17 20
Poblacin de alumnos: 98, la media se calcular de la siguiente manera: PASOS PARA CALCULAR LA MEDIA 1. Se verifica la normalidad de la distribucin de los datos, en este caso usamos un histograma, se observa que los datos tienen una distribucin aproximadamente normal, entonces podemos calcular la media.
RESPIRACIONES DE 20 ALUMNOS
4
Frequency
0 16 17 18 19 20 21 22 23 24
respiraciones n
26
= =
xi
N
19 + 19 + ... + 20 = 19.5 98
INTERPRETACIN: Los alumnos del tercer ao que llevaron la asignatura de Bioestadstica el ao 2004, tuvieron en promedio 20 respiraciones por minuto. Ejemplo 2: De la misma poblacin se obtuvo una muestra de 20 alumnos para calcular el promedio de las respiraciones en las mismas condiciones. Los datos se presentan a continuacin. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 19 16 20 22 21 24 23 19 22 17 20 20 20 21 18 22 18 17 19 23
RESPIRACIONES DE 20 ALUMNOS
4
Frequency
0 16 17 18 19 20 21 22 23 24
respiraciones n
En el grfico observamos la tendencia a simetra de la distribucin, por lo tanto la media es la medida de resumen adecuada.
X =
xi =
n
15
15
MEDIANA
Es el valor que divide al conjunto ordenado de datos en dos grupos de igual tamao en cuanto al nmero de observaciones se refiere. El primero ser igual o menor que la mediana y el otro igual o mayor. Se usa con datos ordinales o con numricos de distribucin normal preferentemente. La mediana de un conjunto de datos se
27
caracteriza por ser nica, su clculo es muy fcil y a diferencia de la media los valores extremos no afectan su valor. Pasos: 1. Los datos se ordenan en forma creciente: x1 + x2 ++xn 2. Calcular la posicin de la mediana teniendo en cuenta la frmula:
Me =
n +1 2
3.- Se establece el valor de acuerdo a la posicin calculado, teniendo en cuenta si n es par o impar. Ejemplo 3: Con los datos usados para obtener la media, ahora calculamos la mediana. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 19 16 20 22 21 24 23 19 22 17 20 20 20 21 18 22 18 17 19 23 1.- Se ordenan los datos de menor a mayor, 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 16 17 17 18 18 19 19 19 20 20 20 20 21 21 22 22 22 23 23 24 2.- Calcular la posicin de la mediana teniendo en cuenta la frmula:
Me =
n +1 2
Me =
20 + 1 = 10.5 2
3.- Como n es par, la posicin de la mediana es 10.5, en este caso el valor de la mediana se localiza entre los dos valores centrales de la distribucin. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 16 17 17 18 18 19 19 19 20 20 20 20 21 21 22 22 22 23 23 24 Me Valor de la mediana: promedio de los valores que se encuentran en las posiciones diez y once, es decir Valor de la Me =
INTERPRETACIN: El 50% de los alumnos tuvieron 20 respiraciones o menos y el otro 50% , 20 respiraciones o ms.
28
3.1.-Si n es impar:
Me =
n +1 2
Me =
21 + 1 = 11 2
La posicin de la mediana se encuentra en el onceavo lugar 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 16 17 17 18 18 19 19 19 20 20 20 20 21 21 22 22 22 23 23 24 25 Me ; El valor de la mediana ser el dato que se encuentre en el centro de la distribucin, en este caso es 20. INTERPRETACIN: El 50% de los estudiantes, tuvieron 20 respiraciones o menos y el otro 50% 20 respiraciones o ms.
MODA
Valor que se presenta con mayor frecuencia en un conjunto de datos. Se usa solamente cuando se tiene inters en resaltar el o los valores ms frecuentes. Un conjunto de datos puede tener ms de una moda o ninguna. Ejemplo 4: Una muestra de 17 alumnos, ingresantes a la universidad, fueron sometidos a un examen bucodental para determinar la presencia de alguna enfermedad oral. Entre otros datos se registr la edad de cada uno de ellos, los cuales se presentan a continuacin, Cul es el valor modal? Alumno Edad Alumno Edad 1 16 1 15 2 15 2 15 3 17 3 16 4 18 4 16 5 18 5 16 6 16 6 16 7 18 7 17 8 15 8 17 9 18 9 17 10 19 10 18 11 18 11 12 17 12 13 17 13 18 14 16 14 18 15 19 15 19 16 20 16 19 17 16 17 20
Para una mejor visualizacin del valor ms frecuente se ordenan los datos: 18 18 Mo
CUANTILES
Se conocen tambin como medidas de localizacin. Se usan con datos numricos sesgados o cualitativos medidos en escala ordinal. 1.- PERCENTILES (P) Son 99 valores que dividen a un conjunto de datos en 100 partes iguales. Un percentil indica el porcentaje de los valores de un conjunto de datos que es menor o igual al valor de un determinado percentil. Su importancia radica en su uso para comparar un valor individual con una norma. Se usa intensamente en la interpretacin y desarrollo de tablas de crecimiento fsico, y de mediciones de destreza de inteligencia, as como tambin para determinar rangos normales de valores de laboratorio. Los lmites
29
normales para la mayora de los anlisis de laboratorio se establecen en los percentiles 2.5 y 97.5, de modo que estos lmites normales contienen el 95% central de la distribucin. Los percentiles se emplean cuando se usa la mediana, tambin se emplea cuando se usa la media, pero el inters es comparar un valor individual de la variable con un conjunto de normas. Por ejemplo, comparar el peso de un nio de 24 meses con lo establecido para esa edad en una tabla de control del nio sano. La frmula para calcular percentiles es:
Pk =
Donde:
k ( n + 1) 100
k es el nmero del percentil n es la muestra Pk Es el percentil que se desea calcular. Con esta frmula se calcula la posicin que tiene el percentil k en el arreglo ordenado, luego se procede a ubicar el valor de la variable en la posicin que le corresponde. Ejemplo: Calcular el percentil 90 en la distribucin de los niveles de glucosa de 100 nios. 1. Ordenar los datos de menor a mayor: 50 61 65 68 73 2. 55 61 65 68 73 55 61 65 68 73 55 62 65 68 74 56 62 65 68 74 56 62 65 68 75 56 62 65 69 75 57 62 65 69 75 57 63 66 69 75 57 63 66 69 75 57 63 66 71 75 58 63 66 71 76 58 64 66 72 76 59 64 67 72 77 59 64 67 72 79 59 64 67 72 80 P95 60 65 67 73 80 60 65 67 73 80 60 61 65 65 67 68 73 73 81 81
P95 =
El percentil 95 (P95) es un valor que est ubicado en la posicin 95.95 del segmento de datos, entonces hay que calcular el valor de la variable en esa posicin haciendo exrtapolacin. A la posicin 95 le corresponde el valor 79 y a la 96 el valor 80, a partir de estos valores se obtendr el valor del percentil 95, finalmente: P95 = 79+0.95(80-79) = 79.95
USOS: Se usa para comparar un valor individual con un conjunto de normas. Ampliamente se utiliza para desarrollar e interpretar tablas de crecimiento fsico, mediciones de destreza e inteligencia y especialmente para determinar rangos normales de valores de laboratorio. Para muchos de los anlisis, los lmites normales estn entre el
30
percentil 2.5 y 97.5, de modo que el 95% central de los valores se encuentran entre estos dos percentiles.
2.- CUARTILES
Son tres medidas de posicin que dividen a un conjunto de datos cuyos valores estn ordenados generalmente de menor a mayor en cuatro partes iguales. Se les nombra como Q1 , Q2 , Q3. Las frmulas para su clculo son tres, a saber:
Q1 =
n+1 4
Q2 =
2( n + 1) 4
Q3 =
3( n + 1) 4
Donde: Qi es el cuartil que se desea calculari n tamao de muestra 25% 25% 25% 25%
Q1
Intervalo Intercuartilar (IQ)
Q2
Q3
Es la medida que describe el 50 % central de una distribucin, sin importar su forma, no es afectada por las fluctuaciones extremas de la serie. Mide la dispersin de los valores de la variable alrededor de la mediana. Mientras ms prximos estn sus lmites, mayor ser la concentracin alrededor de sta. Comprende entre el percentil 25 y 75, entre Q1 y Q3, tiene como centro el percentil 50, el cuartil 2 o la mediana.
IQ = Q 3 Q1
Desviacin cuartilar (Q) Es la mitad del intervalo cuartilar. Si la serie es perfectamente simtrica, la mediana es el punto que divide a la serie en dos partes iguales. Se calcula con la frmula:
Q=
Q3 Q2 2
CLCULO DEL INTERVALO CUARTILAR Y DE LOS CUARTILES Con los datos ordenados de mayor a menor se calcula los cuartiles 1 y 3. Usaremos los datos: 50 61 65 68 73 55 61 65 68 73 55 61 65 68 73 55 62 65 68 74 56 62 65 68 74 Q1 56 62 65 68 75 56 62 65 69 75 57 62 65 69 75 57 63 66 69 75 57 57 63 63 66 66 69 71 75 75 Q2 58 63 66 71 76 58 64 66 72 76 59 64 67 72 77 59 64 67 72 79 Q3 59 64 67 72 80 60 65 67 73 80 60 65 67 73 80 60 65 67 73 81 61 65 68 73 82
Q1 =
100 + 1 = 25 . 25 4
El valor Q 1 = 62
Interpretacin: El 25% de los nios tienen un nivel de glucosa igual o menor que 62
31
El Q2 es la mediana
Q3 =
3(n + 1) = 75 . 75 posicin 4
El valor
Q 3 = 72
Interpretacin: El 75% de los nios tienen un nivel de glucosa igual o menor que 72. Encontrar el intervalo cuartilar
IQ = Q3 Q1 = 72 62 = 10
Interpretacin: el 50% central de los nios tuvieron un nivel de glucosa entre 62 y 72. 3. Dividir el valor del intervalo cuartilar entre 2 para obtener la desviacin cuartilar
Q=
10 =5 2
USO DE LOS CUARTILES: Para describir el 50% central de una distribucin En epidemiologa, para construir la curva endmica Para construir el grfico de caja, til en el anlisis exploratorio de datos y para comparar poblaciones. Ejemplo: El siguiente grfico es la curva endmica de malaria por Plasmodium falciparum del Per en el ao 1994 al 2 000). La curva endmica es un patrn de comportamiento de la enfermedad a partir de la incidencia mensual de la enfermedad en varios aos. En el siguiente grfico, Q1 est representado por la lnea inferior (*), Q2 por la lnea intermedia (), Q3 por la superior () y la lnea con tringulos representa el comportamiento de la enfermedad en el ao 2001 (ao que interesa estudiar).
Curva Endmica de Malaria por Plasmodium falciparum. Per 1994 - 2000
Casos 12000
zona de epidemia
10000 8000
zona de alarma
6000 4000 2000
zona de seguridad
zona de xito
0 Ene Feb Mar Abr May Jun Jul Ago Set Oct Nov Dic Meses
Q1
Q2
Q3
Ao 2001
32
MEDIDAS DE DISPERSIN
Son aquellas que miden la variabilidad de un conjunto de datos. La magnitud de la variabilidad es pequea cuando los valores son diferentes pero estn cercanos entre s; si stos son muy diferentes la dispersin es grande. Los sinnimos de dispersin son variabilidad y expansin. Ejemplo: si 10 estudiantes son pesados en una misma balanza bajo las mismas condiciones, y se encuentra que cada uno pesa 50 kilos, entonces no hay variacin en los pesos., el peso es constante. Otro grupo de 10 estudiantes. fueron pesados en iguales condiciones, los pesos fueron: 55, 60, 53, 56, 48, 50, 51, 58, 62, 59, en este caso, se observa que son diferentes, entonces hay dispersin. Las medidas de dispersin que estudiaremos son: rango, varianza, desviacin estndar y coeficiente de variacin.
RANGO
Es la diferencia entre el valor mximo y el mnimo de un conjunto de datos. Los dems valores se encuentran entre estos. Es una medida apropiada cuando se quiere enfatizar los valores extremos. Su uso es limitado por que toma en consideracin solo la diferencia de dos valores. La frmula para calcularlo es:
R = x mximo x mnimo
Donde: x mximo xmnimo es el valor ms grande lde la variable es el valor ms pequeo dela variable
Ejemplo: La siguiente serie corresponde a las edades aos de una muestra de 11 nios. 2 5 6 8 11 14 15 17 21 24 26 R= 26 2 = 24 El rango, es decir la diferencia entre el valor mximo y el mnimo es 24, obsrvese que los dems valores estn entre los valores extremos.
VARIANZA
Es la medida que cuantifica la variabilidad de los datos respecto al valor de la media. Si los valores de las distancias son iguales, el valor de la varianza es cero. Si los datos son diferentes pero cercanos entre s, la varianza es pequea. Si los datos estn muy distantes, la varianza es grande. Se puede definir tambin como la sumatoria de las diferencias de cada uno de los datos con respecto a la media dividida entre n-1. Se calcula restando de cada observacin el valor de la media; las diferencias se elevan al cuadrado, luego la sumatoria se divide entre n-1 si los datos corresponden a una muestra, o, entre N si pertenecen a una poblacin. Las diferencias se elevan al cuadrado para desaparecer los signos negativas que se generan al restar la media a cada uno de los valores xi, de esta manera se evita que la suma algebrica de stas diferencias den como resultado cero. La varianza tiene las propiedades matemticas necesarias para analizar mejor los datos en comparacin a la desviacin media, medida que se obtiene de sumar las diferencia de los valores xi con su media, sin tomar en cuenta el signo y dividiendo la sumatoria entre el nmero de observaciones.
33
Cuando se trata de una muestra el smbolo de la varianza es s2 y cuando corresponde a una poblacin 2 . La frmula para obtener la varianza cuando los datos no estn agrupados es la siguiente:
2
s =
)2 = (x x )2
n1
Donde: xi representa los valores de la variable, x1 , x2 , ., etc. n nmero de observaciones de la muetra x es la media aritmtica La frmula alternativa para un gran nmero de datos es:
2 (x12 + x22 + ... + xn ) n( x)2 = i =1 n xi2 n( x )2
s2 =
USOS: 1.
n1
n1
Se usa como elemento importante para realizar diferentes pruebas de inferencia estadstica. 2. Sirve para calcular la desviacin estndar, medida muy utilizada en las ciencias de la salud para analizar la variabilidad de los datos cuantitativos. 3. Sirve para calcular el tamao de muestras cuando se requiere estudiar una variable cuantitativa. PASOS PARA CALCULAR LA VARIANZA Ejemplo: Los datos de la siguiente tabla son los mismos del ejemplo 2 que se usaron para el clculo de las media y mediana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 19 16 20 22 21 24 23 19 22 17 20 20 20 21 18 22 18 17 19 23 1. Antes de aplicar cualquier tcnica de resumen, es necesario un anlisis previo de los datos que se dispone para evaluar las bondades de los mismos y solucionar problemas en el diseo de la investigacin y en la recogida de los datos(ausentes y atpicos) . Las tareas que suelen realizarse en un anlisis previo son: Anlisis exploratorio y tratamiento de los datos ausentes y atpicos (outliers). En el ejemplo, se construye un grfico de caja en el cual observamos que la distribucin de los datos tiende a ser simtrica por lo tanto la medida de resumen ms adecuada en este caso es la media y la desviacin estndar.
34
RESPIRACIONES DE 20 ALUMNOS
24
respiraciones n
23 22 21 20 19 18 17 16
Q1 Me Q3
Tambin se puede apreciar que la mediana se ubica aproximadamente a la misma distancia del cuartil 1 y 3. No hay ningn dato que sea discordante (outlier) en el conjunto. 2.- Calcular la media aritmtica:
X=
x
n
3.- Calcular la varianza, para lo cual se usar la frmula que corresponde a una muestra, dado que es la medida con suficientes propiedades para usarla en inferencia estadstica.
La varianza es 4.89 respiraciones2. Se puede apreciar que la variabilidad de los datos es pequea, debido a que estos son valores cercanos entre s. La medida se expresa en unidades al cuadrado, y por lo tanto no se usa para su interpretacin; sin embargo, a partir de ella podemos calcular la desviacin estndar, medida muy usada en el anlisis de datos en salud.
DESVIACIN ESTNDAR
Es la raz cuadrada positiva de la varianza. Mide la variabilidad de los datos en las unidades en que se midieron originalmente. Los smbolos son: s si se trata de una muestra y 2 ; si es una poblacin. La frmula es:
S == s 2
La desviacin estndar se calcula cuando tambin es apropiado el clculo de la media, es decir, cuando la variable es cuantitativa y adems su distribucin es o tiende a ser simtrica, la media se ubica al centro de la distribucin o muy cercana a ella.
35
Caractersticas de la desviacin estndar: 1. Siempre es un valor positivo 2. Est influenciada por todos los valores de la muestra o poblacin. Mayor influencia ejercen los valores extremos que los que estn cerca al promedio, debido a que son elevados al cuadrado en el clculo. 3. Sirve para definir la dispersin de los datos alrededor de la media. Si la distribucin de la poblacin sigue una distribucin normal, en forma de campana (campana de Gauss), las observaciones se concentrarn en la parte central e incluirn, aproximadamente: 1 2 3 68% 95% 99%
Estos valores son importantes a tener en cuenta cuando tenemos que hacer la interpretacin de la desviacin estndar. CLCULO DE LA DESVIACIN ESTNDAR: El clculo es sumamente fcil, consiste en extraer la raz cuadrada de la varianza. En el ejemplo se tiene que:
INTERPRETACION: El 68% de los estudiantes tienen entre 17.84 y 22.26 (20.05 2.21) respiraciones por minuto, o mejor an, entre 18 y 22 respiraciones por minuto, por ser una variable cuantitativa discreta.
36
DESVIACIN MEDIA
Es una medida que expresa la forma en que las observaciones se dispersan alrededor de la media. Consiste en sumar las desviaciones de las observaciones respecto a su media y dividir la sumatoria entre n. Es el promedio simple de las desviaciones, la frmula es la siguiente.
DM =
( xi x )
n
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 19 16 20 22 21 24 23 19 22 17 20 20 20 21 18 22 18 17 19 23 El clculo se hace considerando los valores absolutos de las desviaciones, se obvia los signos. La sumatoria de stas diferencias se divide entre el nmero de observaciones.
DM =
COEFICIENTE DE VARIACION
Es una medida de relativa, til para comparar la dispersin en dos o ms conjuntos de datos, los que pueden ser medidos en las mismas unidades o no. Expresa en porcentaje la relacin de la desviacin estndar y la media, la frnula es:
CV =
s 100 x
La media y la desviacin estndar se expresan en la misma unidad de medida, las que se anulan cuando se hace el clculo, obtenindose una medida independiente a la unidad de medicin. El coeficiente de variacin es til tambin para comparar los resultados obtenidos por diferentes personas que efectan investigaciones en las que se estudian la misma variable. Ejemplo: comparar la dispersin de los pesos de una muestra de sujetos obtenidos en libras con el peso de otra muestra expresada en kilogramos. Si el coeficiente es: < 10 % se dice que hay poca dispersin 10 33% la dispersin es aceptable 34 50% dispersin es alta > 50% la dispersin es muy alta CALCULO DEL COEFICIENTE DE VARIACION
CV =
37
Ejercicios de repaso En los siguientes ejercicios: Identifique la naturaleza de la variable y la escala de medicin. Calcule: la media, mediana, desviacin estndar y el coeficiente de variacin. Interprete los resultados 1. En un programa para la deteccin de hipertensin, en una muestra de 30 hombres en edades entre 30 y 40 aos, la distribucin de la presin diastlica (mnima) en mm Hg fue la siguiente: 95 70 90 85 70 100 85 75 65 65 80 90 90 110 95 95 90 90 95 110 100 70 60 75 85 80 80 120 75 85
2. Nios atendidos diariamente, en una clnica peditrica, durante el ltimo trimestre del ao 2004. 7 1 8 7 10 13 13 7 12 10 1 12 4 4 7 8 8 6 17 3 7 4 3 3 5 4 8 5 5 5 8 5 7 7 4 12 7 3 11 3 1 3 2 17 8 3 10 1 5 4
38
ANLISIS ESTADSTICO
El anlisis estadstico sigue una secuencia ordenada de procedimientos; primero evala el valor de los datos, para ello analiza las fuentes y examina la validez, exactitud, consistencia; asimismo examina sus caractersticas, construye modelos, as como extrae el conocimiento que brindan los mismos generando informacin ENFOQUES DEL ANLISIS ESTADSTICO El anlisis estadstico tiene dos enfoques: el confirmatorio o clsico y el exploratorio (Tukey, 1977). Ambos enfoques tienen sus particularidades, segn Bertrand, podriamos hacer la siguiente comparacin. EXPLORATORIO Enfoque descriptivo Indica las hiptesis a probar Usa estadsticos resistentes Plan de investigacin flexible y poco definido Usa los datos disponibles Privilegia la representacin grfica. Tiene visin intuitiva de los datos. Semeja una investigacin policial. CONFIRMATORIO Enfoque inferencial Prueba hiptesis Usa estadsticos sensibles Plan de investigacin riguroso y bien definido. Usa datos sin error (ideal) Poca importancia a la representacin grfica. Tiene una visin precisa de los datos. Semeja un juicio