Está en la página 1de 14

Determinacin del tamao muestral

Autores: Pita Unidad CAD de Fernndez, Epidemiologa Clnica ATEN y S. [ Correo de Bioestadstica. Complexo Hospitalario Universitario PRIMARIA 1996; 3: de A contacto ] Corua 138-14.

Actualizada el 01/12/2010.

Tabla de contenidos:

Estudios para determinar parmetros


Clculos online

- Estimar una proporcin - Estimar una media [Seguridad-Precisin-Proporcin esperada] [Poblacin infinita-Poblacin finita] Estudios para contraste de hiptesis - Comparacin de dos proporciones - Comparacin de dos medias Tamao muestral ajustado a las prdidas Valores de Z y Z ms frecuentes Bibliografa

Calculadora en Excel para calcular el tamao muestral

Todo estudio epidemiolgico lleva implcito en la fase de diseo la determinacin del tamao muestral necesario para la ejecucin del mismo (1-4). El no realizar dicho proceso, puede llevarnos a dos situaciones diferentes: primera que realicemos el estudio sin el nmero adecuado de pacientes, con lo cual no podremos ser precisos al estimar los parmetros y adems no encontraremos diferencias significativas cuando en la realidad s existen. La segunda situacin es que podramos estudiar un nmero innecesario de pacientes, lo cual lleva implcito no solo la prdida de tiempo e incremento de recursos innecesarios sino que adems la calidad del estudio, dado dicho incremento, puede verse afectada en sentido negativo. Para determinar el tamao muestral de un estudio, debemos considerar diferentes situaciones (5-7): A. Estudios para determinar parmetros. Es decir pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra (Tabla 1). B. Estudios para contraste de hiptesis. Es decir pretendemos comparar si las medias o las proporciones de las muestras son diferentes. Tabla 1. Elementos de la Inferencia Estadstica

A. Estudios para determinar parmetros Con estos estudios pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra. A.1. Estimar una proporcin: Si deseamos estimar una proporcin, debemos saber: 1. 2. 3. El nivel de confianza o seguridad (1- ). El nivel de confianza prefijado da lugar a un coeficiente (Za ). Para una seguridad del 95% = 1.96, para una seguridad del 99% = 2.58. La precisin que deseamos para nuestro estudio. Una idea del valor aproximado del parmetro que queremos medir (en este caso una proporcin). Esta idea se puede obtener revisando la literatura, por estudio pilotos previos. En caso de no tener dicha informacin utilizaremos el valor p = 0.5 (50%).

Ejemplo: A cuantas personas tendramos que estudiar para conocer la prevalencia de diabetes? Seguridad = 95%; Precisin = 3%: Proporcin esperada = asumamos que puede ser prxima al 5%; si no tuvisemos ninguna idea de dicha proporcin utilizaramos el valor p = 0,5 (50%) que maximiza el tamao muestral:

donde:

Z 2 = 1.962 (ya que la seguridad es del 95%) p = proporcin esperada (en este caso 5% = 0.05) q = 1 p (en este caso 1 0.05 = 0.95) d = precisin (en este caso deseamos un 3%)

Si la poblacin es finita, es decir conocemos el total de la poblacin y desesemos saber cuntos del total tendremos que estudiar la respuesta seria:

donde:

N = Total de la poblacin Za2 = 1.962 (si la seguridad es del 95%) p = proporcin esperada (en este caso 5% = 0.05) q = 1 p (en este caso 1-0.05 = 0.95) d = precisin (en este caso deseamos un 3%).

A cuntas personas tendra que estudiar de una poblacin de 15.000 habitantes para conocer la prevalencia de diabetes? Seguridad = 95%; Precisin = 3%; proporcin esperada = asumamos que puede ser prxima al 5% ; si no tuviese ninguna idea de dicha proporcin utilizaramos el valor p = 0.5 (50%) que maximiza el tamao muestral.

Segn diferentes seguridades el coeficiente de Za vara, as: Si la seguridad Za fuese del 90% el coeficiente sera 1.645 Si la seguridad Za fuese del 95% el coeficiente sera 1.96 Si la seguridad Za fuese del 97.5% el coeficiente sera 2.24 Si la seguridad Za fuese del 99% el coeficiente sera 2.576 A.2. Estimar una media: Si deseamos estimar una media: debemos saber:

El nivel de confianza o seguridad (1- ). El nivel de confianza prefijado da lugar a un coeficiente (Za ). Para una seguridad del 95% = 1.96; para una seguridad del 99% = 2.58. La precisin con que se desea estimar el parmetro (2 * d es la amplitud del intervalo de confianza). Una idea de la varianza S2 de la distribucin de la variable cuantitativa que se supone existe en la poblacin.

Ejemplo: Si deseamos conocer la media de la glucemia basal de una poblacin, con una seguridad del 95 % y una precisin de 3 mg/dl y tenemos informacin por un estudio piloto o revisin bibliogrfica que la varianza es de 250 mg/dl

Si la poblacin es finita, como previamente se seal, es decir conocemos el total de la poblacin y desearamos saber cuantos del total tendramos que estudiar, la respuesta sera:

B. Estudios para contraste de hiptesis: Estos estudios pretenden comparar si las medias o las proporciones de las muestras son diferentes. Habitualmente el investigador pretende comparar dos tratamientos. Para el clculo del tamao muestral se precisa conocer: Magnitud de la diferencia a detectar que tenga inters clnicamente relevante. Se pueden comparar dos proporciones o dos medias. 2. Tener una idea aproximada de los parmetros de la variable que se estudia (bibliografa, estudios previos). 3. Seguridad del estudio (riesgo de cometer un error ) 4. Poder estadstico (1 - ) (riesgo de cometer un error ) 5. Definir si la hiptesis va a ser unilateral o bilateral. Bilateral: Cualquiera de los dos parmetros a comparar (medias o proporciones) puede ser mayor o menor que el otro. No se establece direccin. Unilateral: Cuando se considera que uno de los parmetros debe ser mayor que el otro, indicando por tanto una direccin de las diferencias. La hiptesis bilateral es una hiptesis ms conservadora y disminuye el riesgo de cometer un error de tipo I (rechazar la H0 cuando en realidad es verdadera). B1. Comparacin de dos proporciones: 1.

Donde:

n = sujetos necesarios en cada una de las muestras Za = Valor Z correspondiente al riesgo deseado Zb = Valor Z correspondiente al riesgo deseado p1 = Valor de la proporcin en el grupo de referencia, placebo, control o tratamiento habitual. p2 = Valor de la proporcin en el grupo del nuevo tratamiento, intervencin o tcnica. p = Media de las dos proporciones p1 y p2

Los valores Za segn la seguridad y Zb segn el poder se indican en la Tabla 2 (8). B2. Comparacin de dos medias:

Donde: n = sujetos necesarios en cada una de las muestras Za = Valor Z correspondiente al riesgo deseado Zb = Valor Z correspondiente al riesgo deseado S2 = Varianza de la variable cuantitativa que tiene el grupo control o de referencia. d = Valor mnimo de la diferencia que se desea detectar (datos cuantitativos) Los valores Za segn la seguridad y Zb segn el poder se indican en la Tabla 2 (8). Tabla 2. Valores de Z y Z ms frecuentemente utilizados

Za

0.200 0.150 0.100 0.050 0.025 0.010 Potencia

Test unilateral 0.842 1.036 1.282 1.645 1.960 2.326

Test bilateral 1.282 1.440 1.645 1.960 2.240 2.576

0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 Ejemplo de comparacin de dos medias:

(1- ) 0.99 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50

Zb 2.326 1.645 1.282 1.036 0.842 0.674 0.524 0.385 0.253 0.126 0.000

Deseamos utilizar un nuevo frmaco antidiabtico y consideramos que seria clnicamente eficaz si lograse un descenso de 15 mg/dl respecto al tto. Habitual con el antidiabtico estndar. Por estudios previos sabemos que la desviacin tpica de la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Aceptamos un riesgo de 0.05 y deseamos un poder estadstico de 90% para detectar diferencias si es que existen.

precisamos 20 pacientes en cada grupo. Ejemplo de comparacin de dos proporciones: Deseamos evaluar si el Tratamiento T2 es mejor que el tratamiento T1 para el alivio del dolor para lo que diseamos un ensayo clnico. Sabemos por datos previos que la eficacia del frmaco habitual est alrededor del 70% y consideramos clnicamente relevante si el nuevo frmaco alivia el dolor en un 90%. Nuestro nivel de riesgo lo fijamos en 0.05 y deseamos un poder estadstico de un 80%.

n = 48 pacientes. En cada grupo precisamos 48 pacientes. El tamao muestral ajustado a las prdidas: En todos los estudios es preciso estimar las posibles perdidas de pacientes por razones diversas (prdida de informacin, abandono, no respuesta.) por lo que se debe incrementar el tamao muestral respecto a dichas prdidas. El tamao muestral ajustado a las prdidas se puede calcular: Muestra ajustada a las prdidas = n (1 / 1R)

n = nmero de sujetos sin prdidas R = proporcin esperada de prdidas

As por ejemplo si en el estudio anterior esperamos tener un 15% de prdidas el tamao muestral necesario seria: 48 (1 / 1-0.15) = 56 pacientes en cada grupo.

Bibliografa 1. 2. 3. 4. 5. 6. 7. 8. Contandriopoulos AP, Champagne F, Potvin L, Denis JL, Boyle P. Preparar un proyecto de investigacin. Barcelona: SG Editores ; 1991. Hulley SB, Cummings SR. Diseo de la investigacin clnica. Un enfoque epidemiolgico. Barcelona: Doyma; 1993. Cook TD., Campbell DT. Quasi-Experimentation. Design & Analysis Issues for Field Settings. Boston: Houghton Mifflin Company; 1979. Kleinbaum DG., Kupper LL., Morgenstern H. Epidemiologic Research. Principles and Quantitative Methods. Belmont, California: Lifetime Learning Publications. Wadsworth; 1982. Dawson-Saunders B, Trapp RG. Bioestadstica Mdica . 2 ed. Mxico: Editorial el Manual Moderno; 1996. Milton JS, Tsokos JO. Estadstica para biologa y ciencias de la salud. Madrid: Interamericana M cGraw Hill; 2001. Martn Andrs A, Luna del Castillo JD. Bioestadstica para las ciencias de la salud. 4 ed. Madrid: NORMA; 1993. Argimn Pallas J.M., Jimnez Villa J. Mtodos de investigacin aplicados a la atencin primaria de salud. 2 ed. Barcelona: Mosby-Doyma; 1994.

Clculo del tamao de la muestra


En este caso, por tamao de la muestra se entiende el nmero de nios que deben incluirse en la encuesta. Etapa 1: Clculo del tamao de la muestra de base El tamao adecuado de la muestra para una encuesta relativa a la poblacin est determinado en gran medida por tres factores: i) prevalencia estimada de la variable considerada (en este caso, la malnutricin crnica);ii) nivel deseado de fiabilidad; y iii) margen de error aceptable. El tamao de la muestra para un diseo de encuesta basado en una muestra aleatoria simple, puede calcularse mediante la siguiente frmula. Frmula: n= t x p(1-p) m

Descripcin: n = tamao de la muestra requerido t = nivel de fiabilidad de 95% (valor estndar de 1,96) p = prevalencia estimada de la malnultricin en la zona del proyecto m = margen de error de 5% (valor estndar de 0,05) Ejemplo En el proyecto de Al Haouz en Marruecos, se ha calculado que cerca del 30% (0,3) de los nios de la zona del proyecto padecen de malnutricin crnica. Este dato se basa en estadsticas nacionales sobre malnutricin en las zonas rurales. Utilizando los valores estndar indicados supra se efecta el clculo siguiente: Clculo: Calcul: n= 1.96 x .3(1-.3) .05 n = 3.8416 x .21 .0025 n = .8068 .0025 n = 322.72 ~ 323

Etapa 2: Efecto de diseo La encuesta antropomtrica est diseada como una muestra por conglomerados (una seleccin representativa de aldeas) y no como una muestra aleatoria simple. A fin de corregir la diferencia en el diseo, el tamao de la muestra se multiplica por el efecto de diseo (D). Por lo general se presupone un efecto de diseo igual a 2 para las encuestas nutricionales que utilizan una metodologa de muestreo por conglomerados. Ejemplo n x D = 323 x 2 = 646 Etapa 3: Imprevistos El tamao de la muestra se aumenta en un 5% para hacer frente a imprevistos como la ausencia de respuesta o errores de registro. Ejemplo n + 5% = 646 x 1,05 = 678,3 678 Etapa 4: Distribucin de las observaciones Por ltimo, el resultado del clculo se redondea hasta el nmero ms prximo que mejor corresponda al nmero de conglomerados (30 aldeas) objeto de la encuesta. En las encuestas por conglomerados del PAI (Programa Ampliado de Inmunizacin) de la OMS se suele fijar un nmero de 30 conglomerados. Desde un punto de vista estadstico no es necesario mantener exactamente 30 conglomerados y este nmero puede ajustarse si existen motivos que obliguen a hacerlo. Ejemplo Tamao de la muestra final: N = 690 nios Posteriormente, el tamao de la muestra final (N) se divide por el nmero de conglomerados (30) a fin de determinar el nmero de observaciones por conglomerado. Ejemplo N N de conglomerados = 690 30 = 23 nios por aldea Norma General: Tamao uniforme de las muestras para las encuestas nutricionales En el cuadro que figura a continuacin se indica el tamao recomendado de las muestras para los diversos niveles estimados de malnutricin, con inclusin de los valores estndar para el nivel de fiabilidad y el margen de error. El tamao de la muestra final comprende un porcentaje para imprevistos y se redondea hasta corresponder a una encuesta de 30 conglomerados. P (porcentaje estimado de malnutricin) 0.2 (20%) 0.25 (25%) 0.3 (30%) 0.35 (35%) n nxD N (tamao de la muestra final) 540 600 690 720

(tamao de la (n x efecto de muestra de base) diseo) 246 288 323 350 492 576 646 700

0.4 (40%) 0.45 (45%) 0.5 (50%)

369 380 384

738 760 768

750 780 810

Nota: En caso de que no sea posible hallar una prevalencia estimada de malnutricin para la zona del proyecto, se recomienda fijar en 810 el tamao de la muestra.

Referencias FAO. 1990. Conducting small-scale nutrition surveys: A field manual, Roma. Magnani, Robert. 1997. Sampling guide. IMPACT Food Security and Nutrition Monitoring Project, Arlington, Va. UNICEF. 1995. Monitoring progress toward the goals of the World Food Summit for Children: A practical handbook for multiple indicator surveys . Nueva York.

Unidad 5. Teora de muestreo


I. Introduccin
Una parte fundamental para realizar un estudio estadstico de cualquier tipo es obtener unos resultados confiables y que puedan ser aplicables. Como ya se coment anteriormente, resulta casi imposible o imprctico llevar a cabo algunos estudios sobre toda una poblacin, por lo que la solucin es llevar a cabo el estudio basndose en un subconjunto de sta denominada muestra. Sin embargo, para que los estudios tengan la validez y confiabilidad buscada es necesario que tal subconjunto de datos, o muestra, posea algunas caractersticas especficas que permitan, al final, generalizar los resultados hacia la poblacin en total. Esas caractersticas tienen que ver principalmente con el tamao de la muestra y con la manera de obtenerla. En las siguientes secciones de esta unidad lo comentaremos.

2. Importancia del muestreo


A lo largo del curso se hacen uso de dos tipos de razonamiento: el deductivo y el inductivo. El primero est relacionado directamente con la teora de probabilidad, que se aborda en la unidad 4, y que a partir de las caractersticas de la poblacin se obtienen las posibles caractersticas de una muestra. El segundo tipo de razonamiento se relaciona con la denominada inferencia estadstica: utilizar las caractersticas de un subconjunto de la poblacin (la muestra) para hacer afirmaciones (inferir) sobre la poblacin en general. ste ser el caso de esta unidad. El muestro, como ya se mencion, implica algo de incertidumbre que debe ser aceptada para poder realizar el trabajo, pues aparte de que estudiar una poblacin resulta ser un trabajo en ocasiones demasiado grande, Wonnacott y Wonnacott ofrecen las siguientes razones extras: Recursos limitados. Es decir, no existen los recursos humanos, materiales o econmicos para realizar el estudio sobre el total de la poblacin. Es como cuando se compra un aparato, un automvil usado (por ejemplo), que se prueba unos minutos (el encendido, una carrerita, etc.) para ver si funciona correctamente y luego se adquiere, pero no se espera a probarlo toda la vida (encendindolo y apagndolo o, simplemente, dejndolo encendida) antes de realizar la adquisicin.

Escasez. Es el caso en que se dispone de una sola muestra. Por ejemplo, para el estudio paleontolgico de los dinosaurios (el T. Rex por ejemplo) sera muy bueno contar con, al menos, muchos restos fsiles y as realizar tales investigaciones; sin embargo, se cuenta slo con una docena de esqueletos fosilizados (casi todos incompletos) de esas criaturas en todo el mundo. Pruebas destructivas. Es el caso en el que realizar el estudio sobre toda la poblacin llevara a la destruccin misma de la poblacin. Por ejemplo, si se quisiese saber el conteo exacto de hemoglobina de una persona habra que extraerle toda la sangre. El muestreo puede ser ms exacto. Esto es en el caso en el que el estudio sobre la poblacin total puede causar errores por su tamao o, en el caso de los censos, que sea necesario utilizar personal no lo suficientemente capacitado; mientras que, por otro lado, el estudio sobre una muestra podra ser realizada con menos personal pero ms capacitado.

Ya que hemos mencionado la necesidad de realizar muestras, continuaremos con algunas caractersticas que deben tener stas para que, realmente, se puedan realizar inferencias (inducciones) sobre ellas hacia la poblacin total.

3. Tamao de las muestras


Para calcular el tamao de una muestra hay que tomar en cuenta tres factores: 1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la poblacin total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. 3. El nivel de variabilidad que se calcula para comprobar la hiptesis. La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin. Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser prcticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor. Comnmente en las investigaciones sociales se busca un 95%. El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hiptesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hiptesis verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamao que la poblacin, por lo que conviene correr un cierto riesgo de equivocarse. Comnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error. La variabilidad es la probabilidad (o porcentaje) con el que se acept y se rechaz la hiptesis que se quiere investigar en alguna investigacin anterior o en un ensayo previo a la investigacin actual. El porcentaje con que se acept tal hiptesis se denomina variabilidad positiva y se denota por p, y el porcentaje con el que se rechaz se la hiptesis es la variabilidad megativa, denotada por q. Hay que considerar que p y q son complementarios, es decir, que su suma es igual a la unidad: p+q=1. Adems, cuando se habla de la mxima variabilidad, en el caso de no existir antecedentes sobre la investigacin (no hay otras o no se pudo aplicar una prueba previa), entonces los valores de variabilidad es p=q=0.5.

Una vez que se han determinado estos tres factores, entonces se puede calcular el tamao de la muestra como a continuacin se expone. Hablando de una poblacin de alrededor de 10,000 casos, o mnimamente esa cantidad, podemos pensar en la manera de calcular el tamao de la muestra a travs de las siguientes frmulas. Hay que mencionar que estas frmulas se pueden aplicar de manera aceptable pensando en instrumentos que no incluyan preguntas abiertas y que sean un total de alrededor de 30. Vamos a presentar dos frmulas, siendo la primera la que se aplica en el caso de que no se conozca con precisin el tamao de la poblacin, y es:

donde: n es el tamao de la muestra; Z es el nivel de confianza; p es la variabilidad positiva; q es la variabilidad negativa; E es la precisin o error. Hay que tomar nota de que debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, hay que convertir todos esos valores a proporciones en el caso necesario. Tambin hay que tomar en cuenta que el nivel de confianza no es ni un porcentaje, ni la proporcin que le correspondera, a pesar de que se expresa en trminos de porcentajes. El nivel de confianza se obtiene a partir de la distribucin normal estndar, pues la proporcin correspondiente al porcentaje de confianza es el rea simtrica bajo la curva normal que se toma como la confianza, y la intencin es buscar el valor Z de la variable aleatoria que corresponda a tal rea.

Por ejemplo: Si se quiere un porcentaje de confianza del 95%, entonces hay que considerar la proporcin correspondiente, que es 0.95. Lo que se buscara en seguida es el valor Z para la variable aleatoria z tal que el rea simtrica bajo la curva normal desde Z hasta Z sea igual a 0.95, es decir, P(-Z<z<Z)=0.95. Utilizando las tablas, o la funcin DISTR.NORM.ESTAND.INV() del Excel, se puede calcular el valor de Z, que sera 1.96 (con una aproximacin a dos decimales). Esto quiere decir que P(-1.96<z<1.96)=0.95.

En el caso de que s se conozca el tamao de la poblacin entonces se aplica la siguiente frmula:

donde n Z p q N E es el tamao de la muestra; es el nivel de confianza; es la variabilidad positiva; es la variabilidad negativa; es el tamao de la poblacin; es la precisin o el error.

La ventaja sobre la primera frmula es que al conocer exactamente el tamao de la poblacin, el tamao de la muestra resulta con mayor precisin y se pueden incluso ahorrarse recursos y tiempo para la aplicacin y desarrollo de una investigacin. Por ejemplo: En el Colegio de Bachilleres, una institucin de nivel medio superior, se desea realizar una investigacin sobre los alumnos inscritos en primer y segundo aos, para lo cual se aplicar un cuestionario de manera aleatoria a una muestra, pues los recursos econmicos y el tiempo para procesar la informacin resultara insuficiente en el caso de aplicrsele a la poblacin estudiantil completa. En primera instancia, suponiendo que no se conoce el tamao exacto de la poblacin, pero con la seguridad de que sta se encuentra cerca a los diez millares, se aplicar la primera frmula. Se considerar una confianza del 95%, un porcentaje de error del 5% y la mxima variabilidad por no existir antecedentes en la institucin sobre la investigacin y porque no se puede aplicar una prueba previa. Primero habr que obtener el valor de Z de tal forma que la confianza sea del 95%, es decir, buscar un valor de Z tal que P(-Z<z<Z)=0.95. Utilizando las tablas o las funciones de Excel se pueden obtener, o viendo (en este caso) el ejemplo anterior, resulta que Z=1.96. De esta manera se realiza la sustitucin y se obtiene:

Esto quiere decir que el tamao de la muestra es de 385 alumnos. Supongamos ahora que s se conoce el tamao de la poblacin estudiantil y es de 9,408, entonces se aplicar la segunda frmula. Utilizando los mismos parmetros la sustitucin queda como:

Con lo que se tiene una cota mnima de 370 alumnos para la muestra y as poder realizar la investigacin sin ms costo del necesario, pero con la seguridad de que las condiciones aceptadas para la generalizacin (confiabilidad, variabilidad y error) se mantienen.

Quieres probar? Considerando un nivel de confianza del 95%, introduce la variabilidad positiva: , y la precisin o error (porcentaje de error): %.

Si conoces el tamao de la poblacin introdcelo (si no lo conoces no escribas nada): .

Presiona el botn para realizar el clculo: Dada la variabilidad positiva, la negativa es: .

Por tanto, si no se conoce el tamao de la poblacin el tamao de la muestra es: , . si se conoce el tamao de la poblacin el tamao de la muestra es:
4. Muestreos probabilsticos
Las tcnicas de muestreo probabilstico son aquellas en las que se determina al azar los individuos que constituirn la muestra. Estas tcnicas nos sirven cuando se desean generalizar los resultados que se obtienen a partir de la muestra hacia toda la poblacin. Lo anterior se dice dado que se supone que el proceso aleatorio permitir la obtencin de una muestra representativa de la poblacin. Los muestreos probabilsticos pueden ser con o sin reemplazo. Los muestreos con reemplazo son aquellos en los que una vez que ha sido seleccionado un individuo (y estudiado) se le toma en cuenta nuevamente al elegir el siguiente individuo a ser estudiado. En este caso cada una de las observaciones permanece independiente de las dems, pero con poblaciones pequeas (un grupo de escuela de 30 alumnos, por ejemplo) tal procedimiento debe ser considerado ante la posibilidad de repetir observaciones. En el caso de poblaciones grandes no importa tal proceder, pues no afecta sustacialmente una repeticin a las frecuencias relativas. Los muestreos sin reemplazo son los que una vez que se ha tomado en cuenta un individuo para formar parte de la muestra, no se le vuelve a tomar en cuenta nuevamente. En este caso, y hablando especficamente para el caso de poblaciones pequeas, las observaciones son dependientes entre s, pues al no tomar en cuenta nuevamente el individuo se altera la probabilidad para la seleccin de otro individuo de la poblacin. Para el caso de las poblaciones grandes (por ejemplo la poblacin de un pas) dicha probabilidad para la seleccin de un individuo se mantiene prcticamente igual, por lo que se puede decir que existe independencia en las observaciones. Las tcnicas de muestreo probabilstico que mencionaremos sern bsicamente tres: el aleatorio simple, el aleatorio estratificado y el sistemtico.

4.2 Muestreo aleatorio simple


Podemos aqu mencionar que para el caso de que se estuviese estudiando un propocin dentro de la poblacin (una eleccin de candidato, la aceptacin o rechazo de una propuesta en una comunidad, la presencia o ausencia de una caracterstica hereditaria), y el en caso de un muestreo aleatorio simple, la estimacin que se puede hacer de la proporcin buscada a partir de la proporcin hallada en la muestra se obtiene mediante la construccin de un intervalo de confianza:

= P tolerancia de la muestra

Donde es la proporcin buscada en la poblacin y P es la proporcin presente en la muestra. Por otro lado, la tolerancia de la muestra est relacionada directamente con el nivel de confianza y se obtiene a partir de la distribucin normal al igual que como se obtuvo para el clculo del tamao de las muestras. La representaremos con Z para obtener la frmula:

ESTIMAR UNA PROPORCIN


Total de la poblacin (N)
(Si la poblacin es infinita, dejar la casilla en blanco) 15000

Nivel de confianza o seguridad (1-) Precisin (d) Proporcin (valor aproximado del parmetro que queremos medir)
(Si no tenemos dicha informacin p=0.5 que maximiza el tamao muestral)

95% 3% 5%

TAMAO MUESTRAL (n)

200

EL TAMAO MUESTRAL AJUSTADO A PRDIDAS


Proporcion esperada de prdidas (R) MUESTRA AJUSTADA A LAS PRDIDAS
15% 235

Beatriz Lpez Calvio Salvador Pita Fernndez Sonia Prtega Daz Teresa Seoane Pillado Unidad de epidemiologa cl Complexo Hospitalario Univ

ESTIMAR UNA MEDIA


Total de la poblacin (N)
(Si la poblacin es infinita, dejar la casilla en blanco) 15000

Nivel de confianza o seguridad (1-)


(El nivel de confianza puede ser al 95% o 99%)

95%

Precisin (d) Varianza (S2)


(De la variable cuantitativa que se supone que existe en la poblacin)

3 250

TAMAO MUESTRAL (n)

106

EL TAMAO MUESTRAL AJUSTADO A PRDIDAS


Proporcion esperada de prdidas ( R ) MUESTRA AJUSTADA A LAS PRDIDAS
15%

125

Beatriz Lpez Calvio Salvador Pita Fernndez Sonia Prtega Daz Teresa Seoane Pillado Unidad de epidemiologa cln bioestadstica Complexo Hospitalario Univ

COMPARACIN DE DOS PROPORCIONES


(Se pretende comparar si las proporciones son diferentes)

Indique nmero del tip

Tipo de test (1.unilateral o 2.bilateral) Nivel de confianza o seguridad (1-) Poder estadstico P1 (proporcin en el grupo de referencia, placebo, control o tratamiento habitual) P2 (proporcin en el grupo del nuevo tratamiento, intervencin o tcnica) TAMAO MUESTRAL (n)

UNILATE

EL TAMAO MUESTRAL AJUSTADO A PRDIDAS


Proporcion esperada de prdidas ( R ) MUESTRA AJUSTADA A LAS PRDIDAS

Beatriz Lpez Calvi Salvador Pita Fernn Sonia Prtega Daz Teresa Seoane Pillad Unidad de epidemiol Complexo Hospitala