Está en la página 1de 16

CAPITULO III

INTRODUCCIÓN
AL MUESTREO
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

3.1. INTRODUCCIÓN.

El objetivo de la estadística es hacer inferencias acerca de una población con


base a la información contenida en una muestra. Este mismo objetivo motiva el
estudio del problema de muestreo.
En lo referente al muestreo, la inferencia consiste en la estimación de un pará­
metro de población, tal como una media, proporción con un margen de error de
estimación (precisión).
Para un buen entendimiento del problema de muestreo, introduciremos ense­
guida, ciertosaspectos técnicos de muestreo.

3.2. DEFINICIÓN DE TÉRMINOS, REVISIÓN DE CONCEPTOS

Población: Es una colección finita o infinita de individuos o elementos, con


una característica de interés para el estudio.
Una tarea importante para el investigador es definir cuidadosa y completamen­
te la población antes de recolectar la muestra. La definición debe contener una
descripción de los elementos que serán incluidos y una especificación de las
mediciones que se van a considerar, ya que estas dos componentes están inter-
relacionadas.

Muestra: Es un subconjunto representativo de la población. Una muestra pue­


de ser probabilística (aleatoria) o no probabilística.

Unidad de Muestreo: Es una colección de uno o más elementos de la pobla­


ción. Las unidades de muestreo cubren toda la población. Una unidad de mues­
treo debe ser claramente definida, identificable y observable.

-32-
Capítulo III Introducción al Múestreo

Unidad de Análisis: Es la que suministra la información estadística requeri­


da.

Marco de Muestreo: Se presenta en forma de lista o mapa de las unidades


de muestreo que conforman la población. Forma el material básico para la se­
lección de la muestra. El marco muestral debe contener todas las unidades de
muestreo que conforman la población bajo estudio, y debe excluir unidades
de cualquier otra población.

Paj’ámetro: Es un valor numérico de la población usualmente desconocido


que representa cierta característica de la población.

Estadístico: Es una función real de la muestra aleatoria, usado para estimar


un parámetro, si un parámetro se denota con 0, el estimador se denotará con

0.

Estimación: Es el valor que toma el estimador en los datos de la muestra.

Error de Estimación: Es la diferencia absoluta entre el parámetro y su esti­

mador, es decir 10 —Q\ . Como se puede apreciar, es imposible conocer con

exactitud el error de estimación, pero podemos, al menos aproximadamente


encontrar un límite E tal que:
/V

P(\ 0 — 0 \< E ) = y , para cualquier y entre 0 y 1.

Si 0 tiene distribución aproximadamente normal, entonces para

E = 1.9 6 t¡V (0 ) se cumple:

P ( \ 0 - 0 \ < E ) = O.95

-33-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

Límite para el error de estimación: Denotado por E es dado por

E = 1.96tJ v 0 ) . El factor E es llamado también precisión. Si E esta expre­

sado en las mismas unidades de la medida de la variable, se le llama precisión


absoluta. Si E está expresado como un porcentaje del parámetro que se está
estimando, se le llama precisión relativa.
Una vez estimado el límite E, podemos afirmar que el parámetro 0 se encuen­

tra en el intervalo (Ó - E , 0 + E ^ con una confianza del 95%. El interva­

lo anterior es llamado intervalo de confianza.

Error de Muestreo: Este error se debe a que una muestra no produce infor­
mación completa sobre una población. Puede ser controlado por un diseño
cuidadoso de la muestra y es estimado en gran parte por el factor E. Por esta
razón, algunos autores denominan al factor E, error de muestreo.

Error de no Muestreo: Son los errores que se introducen imperceptiblemen­


te a la encuesta y estos son más difíciles de controlar, infortunadamente estos
errores no se pueden medir fácilmente, y aumentan a medida que aumenta el
tamaño de la muestra. Los tipos errores no muéstrales que suelen presentarse
son:
Definición equivocada del problema.
Definición defectuosa de la población.
Marco imperfecto o desactualizado.
- La no respuesta.
El sesgo de respuesta.
Diseño pobre del instrumento de medición.

- 34 -
Capítulo III Introducción al Muestreo

Sin embargo, los errores de no muestreo pueden ser controlados mediante


una atención cuidadosa en todas las etapas de la encuesta.

3.3. ENCUESTA.

La función de la encuesta es la medición del comportamiento, actitudes o ca­


racterísticas del encuestado, que es un individuo de la población en estudio se­
leccionado para la muestra.

Diseño de la encuesta
Pasos a seguir, para diseñar una encuesta:
4 Definir los objetivos
4 Determinar el marco
4 Diseñar el procedimiento de muestreo
4 Diseñar el cuestionario
4 Diseñar y realizar el trabajo de campo
4 Codificar, depurar y analizar las respuestas
4 Redactar el informe

Diseño de la m uestra
El diseño de la muestra incluye:
❖ La elección del procedimiento de muestreo
❖ La determinación del tamaño de la muestra
Existen varios procedimientos de muestreo, entre las principales se tiene
muestreo: aleatorio simple, estratificado y sistemático.

3.4. M UESTREO ALEATORIO SIM PLE

Definición. Si una muestra de tamaño n, es seleccionado de una población de


tamaño N de tal manera que cada muestra posible tiene la misma probabilidad
de ser seleccionada, el procedimiento de muestreo se llama Muestreo Aleatorio
Simple (M. A. S.)

-35-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

El M.A.S. puede ser de 2 formas, sin reposición (muestreo irrestricto aleato­


rio) y con reposición.

Procedimiento de selección.
El procedimiento de selección de una Muestra Aleatoria Simple (M.A.S.) con­
siste en:
i) Enumerar las unidades de la población, desde 1 hasta N.
ii) Usando la tabla de números aleatorios seleccionar la primera unidad
para la muestra.
iii) Continuar la selección excluyendo las unidades repetidas (si es sin re­
posición) o incluyendo las unidades repetidas (si es con reposición)
hasta completar el tamaño de muestra n.
Tam año de la m uestra
Una parte fundamental para realizar un estudio estadístico de cualquier tipo
es obtener unos resultados confiables y que puedan ser aplicables. Como ya
se comentó anteriormente, resulta casi imposible o impráctico llevar a cabo
algunos estudios sobre toda una población, por lo que la solución es llevar a
cabo el estudio basándose en un subconjunto de ésta denominada muestra.
Sin embargo, para que los estudios tengan la validez y confiabilidad buscada
es necesario que tal subconjunto de datos, o muestra, posea algunas carac­
terísticas específicas que permitan, al final, generalizar los resultados hacia la
población en total. Esas características tienen que ver principalmente con el
tamaño de la muestra y con la manera de obtenerla.

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:
El nivel de confianza con el cual se quiere generalizar los datos desde la
muestra hacia la población total.
El error que se pretende aceptar al momento de hacer la estimación.
La varianza

-36-
Capítulo III Introducción a! Muestreo

1. Tamaño de muestra para estimar la media poblacionaL

Si se desea estimar la media poblacional p, con precisión £ fijada por el in­


vestigador, el tamaño de muestra necesario es dado por:

Z<í-«/2) * v 2 + ( N - 1) { e f Poblaci6n

n _
2
(l-g /2 )
* <7 2
°
2 , Población infinita.
*
Donde
_2
CT Es la varianza poblacional

_ 2 2
En la practica el valor de C7 estimado por S a partir de una encuesta ante­
rior o de una muestra piloto

2. Tamaño de la muestra para estimar la proporción poblacional.


De manera simular, la fórmula del tamaño de muestra n para la estimación de la

proporción poblacional, p con un error máximo de estimación de £ y un ni­


vel de confianza del 100(1 - a)% , esta dado por:

-37-
Cteto De La Torre Dueñas Yeny M. Accostupa Quispe

* N * p (\~ p )
n= , Población finita.
7 2 ^ *
Z ,( l - a / 2 ) p (l- p )+ (A r -l)(í)2

Si N —

n , Población infinita.

En este caso el valor de S esta entre 0 y 1, el valor de p es desconocido, por


lo que debe ser estimado preliminarmente a partir de una encuesta anterior, o
de una muestra piloto. En última instancia el valor de p se puede sustituir por
0.5 y se obtendrá un tamaño de muestra mayor que el requerido.

Recomendaciones para el uso del M. A. S.


El M. A. S. Está orientada a encuestas de pequeña escala y raras veces a en­
cuestas de gran escala, debido a que otros diseños proporcionan mayor o igual
precisión a menor costo.
En las encuestas por muestreo a gran escala, el M. A. S. es usado
como parte de un diseño de muestreo mucho más complejo.
El M. A. S. es muy eficiente cuando la población es homogénea.

3.5. M UESTREO ESTRATIFICADO.

Una muestra estratificada es obtenida mediante la separación de los elementos


de la población en grupos heterogéneos disjuntos, llamados estratos y la selec­
ción posterior de una muestra aleatoria simple en cada estrato.

-38-
Capítulo III Introducción al Muestreo

Consideremos una población de tamaño N, la cual es dividida en k estratos


(sub poblaciones) de tamaños N¡, i= 1,2...., k, tal que:
N = N , + N j + ... + N k

El tamaño de muestra se estima mediante:


k

/=!

W i : Es el peso asignados al estrato i

El tamaño de muestra necesario de cada estrato, se puede obtener por afijación


proporcional al tamaño de cada estrato, es decir:

n (, = n * = n * w i, i = l k

Cuando se realiza un muestreo estratificado, los tamaños muéstrales en cada


uno de los estratos, ni, los elige quien hace el muestreo, Así en un estrato dado,
se tiende a tomar una muestra más grande cuando:
El estrato es más grande;
El estrato posee mayor variabilidad interna (varianza).

-39-
Gleto De La Torre Dueñas Yeny M. Accostupa Quispe

3.6. M UESTREO SISTEM ÁTICO

Definición.- Una muestra obtenida al seleccionar aleatoriamente un elemento


de los primeros k elementos en el marco y después cada k-ésimo elemento, se
denomina muestra sistemática de intervalo de selección k.
Una muestre sistemática simple se obtiene cuando el intervalo de selección k
es exactamente un número entero.
El procedimiento de selección de una muestra sistemática simple consiste:
i) Las unidades del marco deben ser ordenados en magnitud de acuerdo
con algún esquema de ordenación (población ordenada) es base al orden
se establece la numeración desde 1 hasta N
N
ii) Determinar el intervalo de selección & = — (k exactamente un número
n
entero)
iii) Seleccionar un número aleatorio entre 1 y k (arranque aleatorio) sea “a”
el arranque aleatorio elegido, entonces los elementos de la muestra sis­
temática, son los que ocupan las posiciones en el marco:
a, k+a, 2k+a, 3k+a, (n-l)k+a
iv) El tamaño de muestra, para el muestreo sistemático es el mismo que el
M.A.S

-40-
Capítulo III Introducción al Muestreo

EJERCICIOS DESARROLLADOS

I. Un investigador, desea hacer una estimación del egreso medio que tienen los
pacientes en un hospital, con 99% de confianza, suponiendo qué el máximo
error permitido es de 1 sol, además de una muestra piloto se obtuvo una varian­
za de 25. También se sabe que el hospital atiende semanalmente 2500 pacientes
por año. ¿Qué tamaño de muestra necesitara para tal estudio?

Solución

N = 2 5 0 0 , S = 1,

<J — 2 5 , Z(i_a/2) — 2 .5 8

n=

2 .5 8 2 * 2 5 0 0 * 2 5
n= = 1 5 6 .0 8 « 1 5 7

Se debe utilizar como mínimo 157 pacientes para el estudio.

2. Por encargo del Ministerio de Salud, un grupo de especialistas debe-realizar un


estudio, para determinar el nivel de automedicación en una ciudad. La estima­
ción debe presentar un nivel de confianza del 95% y un margen de error de 5%,
suponiendo que la población es de 25000 ¿Cuál es el tamaño de muestra míni­
mo para este estudio?

-41-
Cleto De La Torre Duefias Yeny M. Accostupa Quispe

Solución:
Consideremos que no se tiene ningún estudio de este tipo, por tanto

P ~ 0*5, del problema:


N = 25000, £ - 0.05, Z(1_a/2) =1.96

n_ z l - a i2)*Np( ' - p y

z l - a n ) * p < y - p ) + ( N - xÁ s ) 2

f1,962) *25000*0.5(1 -0.5)


n=- i 1-------------- ------- -------5-=378.361 * 379
(l .%2) *0.5(1 -0.5 )+ (2 5 0 0 0 -l)(0 .0 5 )

Se debe utilizar como mínimo 379 personas para el estudio.

3. Un funcionario del sector de Salud, desea estimar el porcentaje de personas que


presentan problemas de desnutrición en cierta región, con un nivel de confianza
del 95% y un margen de error del 5%. Suponiendo que en estudio realizado
hace 10 años, el porcentaje estimado de personas con desnutrición fue de 15%
¿Cuál debe ser el tamaño de muestra para este estudio?

Solución:
La población materia de estudio, no es finita, por tanto la relación para estimar
el tamaño de muestra es:

n = — --------- -— ; --------1—

(4
-42-
Capítulo III Introducción al Muestreo

Del problema se tiene los siguientes datos

P = 0.15, £- = 0.05, Z(\-a /2) =

1.962 * 0.15(1-0.15)
n-' = 195.92 «196
(0.05)2

4. Un grupo de especialistas en Salud, planifican realizar un estudio sobre el porcen­


taje de personas que presentan problemas de TBC, en una región del Perú. Su­
poniendo que esta región se divide en tres provincias, cuyo tamaño poblacional
se muestra en el cuadro siguiente:

Provincia Tamaño de población


A 2000
B 1200
C 5000
Total 8200

Considere que el tamaño de muestra es 245, calcule el tamaño de muestra por


cada provincia, necesario para este estudio.

Solución:
En este ejemplo, las ciudades forman los estratos:

Provincia N¡ w¡
A 2000 =2000/8200=0.24
B 1200 =1200/8200=0.15
C 5000 =5000/8200=0.61
Total N=8200 1

n = 245.

-43-
Cleto Del¿a Torre Dueñas Yeny M. Accostupa Quispe

Usando la relación:

na . •
=/?* Se determina el tamaño de muestra para cada

provincia.

— nM * N
n A= á- | = „ * wA = 2 4 5 * 0.2 4 = 5 9 . 7 6 * 60
N

n B = «*[ = n * ^ B = 245 * 0.15 = 35.85 * 36

n r* - n n * Wr- = 2 45 * 0.61 = 1 4 9 . 3 9 « 149


N

-44-
Capítulo III Introducción al Muestreo

EJERCICIOS PROPUESTOS

1. Un investigador está interesado en estimar la proporción de muertes debidas a


cáncer de estómago en relación con el número de defunciones por cualquier ti­
po de neoplasia. Su experiencia le indica que sería sorprendente que tal propor­
ción supere el valor de 1/3. ¿Qué tamaño de muestra debe tomar para estimar la
anterior proporción, con una confianza del 99 %, para que el valor estimado no
difiera del valor real en más de 0,03?.

2. Sólo una parte de los pacientes que sufren un determinado síndrome neurológi-
co consiguen una curación completa; Si de 64 pacientes observados se han cu­
rado 41,¿Qué número de enfermos habría que observar para estimar la propor­
ción de curados con un error inferior a 0,05 y una confianza del 95%?

3. Se desea estimar el tiempo medio de sangría en fumadores de más de 20 ciga­


rrillos diarios, con edades comprendidas entre 35 y 40 años, con una precisión
de 5 segundos. Ante la ausencia de cualquier información acerca de la variabi­
lidad del tiempo de sangría es este tipo de individuos, se tomó una muestra pre­
liminar de 5 individuos, en los que se obtuvieron los siguientes tiempos (en se­
gundos): 9 7 ,80,67,91, 73.
a) Determinar el tamaño mínimo de muestra, al 95 %, para cumplir el obje­
tivo anterior.
b) Qué tipo de muestreo se debe aplicar para este estudio.

4. Se quiere estimar la incidencia de la hipertensión arterial en el embarazo.


¿Cuántas embarazadas tenemos que observar, con una confianza del 95 %, pa­
ra estimar dicha incidencia con un error del 2% en los siguientes casos:
a) Sabiendo que un sondeo previo se ha observado un 9% de hipertensas.
b) Sin ninguna información previa.

-45-
Cleto De La Torre Dueñas Yeny M. Accostupa Quispe

5. Un investigador a cuyo cargo está un departamento de educación física, desea


hacer una estimación del consumo de oxígeno (en litros por minuto) de los es­
tudiantes normales qué estén entre los 17 y 21 años de edad, después de haber
hecho un tipo especial de ejercicio. El investigador desea que su estimación se
encuentre por lo menos a 0,1 litros de la media verdadera con un nivel de con­
fianza del 95%. Los estudios que se han hecho indican que la varianza del con­
sumo de oxígeno de éste tipo de sujetos, bajo ías condiciones especificadas, es
aproximadamente igual a 0,09 litros por minutos al cuadrado ¿Qué tamaño de­
be tener la muestra que necesita éste investigador?

6. Un especialista tiene que estimar la prevalecía de TBC en la Provincia de la


Convención. La estimación debe presentar un nivel de confianza del 95% y un
margen de error de 5%, suponiendo que la población es de 166000 habitantes
¿Cuál es el tamaño de muestra mínimo para este estudio? ¿Qué proceso de se­
lección es la más adecuada?

7. En un estudio de seguimiento del programa de niño sano en la región Cusco.


a) Cuál es el tamaño de muestra para este estudio.
b) Que suposiciones considero para estimar el tamaño de muestra.
c) ¿Qué tipo de muestreo se debe aplicar?.

8. Un investigador desea estimar el porcentaje de niños hiperactivos que existe en


una ciudad con un nivel de confianza del 98%.
¿Cuántos niños debería seleccionar para su estudio y que criterio de selección
de la muestra debe utilizar?. Justifique adecuadamente su respuesta.

-46-

También podría gustarte