Está en la página 1de 11

Curso: Estadística y probabilidades

INTRODUCCION AL MUESTREO

En toda investigación estadística existe un conjunto de elementos sobre los que se toma información.
Ese conjunto de elementos es lo que se denota con el nombre de población.
En ocasiones en que no es posible analizar a todos los elementos de una población, se selecciona una
muestra, entendiendo por tal una parte representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es
determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre
dicha población.
La muestra debe lograr una representación adecuada de la población, en la que se reproduzca de la
mejor manera los rasgos esenciales de dicha población que son importantes para la investigación. Para
que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias
encontradas en la población, y esto se consigue empleando el muestreo probabilístico (en general
utilizando una muestra aleatoria).

MUESTREO
El muestreo es el proceso de seleccionar un conjunto de individuos de una población con el fin de
estudiarlos y poder caracterizar al total de la población.

Marco muestral.- Es la lista de todos los elementos (unidades de muestreo) pertenecientes a la


población de la cual se obtendrá la muestra.
Ejemplo:
- Un padrón electoral
- Un directorio telefónico
- Listado de clientes de la empresa de cable Telecom en la provincia de Lima

RECORDANDO
Población
Es el conjunto de elementos que presentan alguna característica en común, y sobre los que se toma
información para un determinado estudio.
Ejemplo
- La población formada por todos los clientes de una empresa.
- La población formada por todos los habitantes del distrito de Pueblo Libre.

Muestra
Es una parte o subconjunto de una población. Este subconjunto de la población debe ser representativo,
es decir, tiene que presentar todas las características de la población.

1
Variable
Es una característica definida en la población que se va a investigar, que puede tomar diferentes valores
(cualidades o números).

Parámetro
Es una medida de resumen usada para describir alguna característica de la población.
Las más usadas son:
- La media o promedio poblacional (  ).
- La varianza poblacional (  2 ) .
- La proporción poblacional ( p ).
Estadística
Es una medida de resumen usada para describir alguna característica de la muestra.
Las más usadas son:
- La media o promedio muestral ( X ).
- La varianza muestral ( S 2 ) .
- La proporción muestral ( p̂ ).

TIPOS DE MUESTREO
El muestreo puede ser de dos tipos:
- Muestreo probabilístico
- Muestreo no probabilístico

MUESTREO PROBABILISTICO
Es cuando cada elemento de la población tiene una probabilidad de ser seleccionada en la muestra. Los
principales métodos de muestreo probabilístico son:
- Muestreo aleatorio simple
- Muestreo estratificado
- Muestreo sistemático
- Muestreo por conglomerados

Muestreo aleatorio simple


Es cuando cada elemento de la población tiene la misma probabilidad de ser seleccionada en la
muestra.
Para garantizar que cada elemento de la población tenga la misma probabilidad de ser elegida en la
muestra, se emplea un procedimiento de selección aleatoria que se basa en el uso de números
aleatorios.
Una condición importante para el empleó del muestreo aleatorio simple, es que elementos de la
población deben ser lo más homogéneos posibles con respecto a las características de la(s) variable(s)
en estudio.

2
Pasos:
1) Enumerar los elementos de la población de 1 hasta N. (Marco muestral)
2) Seleccionar los “n” elementos de la población que conforman la muestra, utilizando algún
procedimiento que genere números aleatorios, como: Tabla de números aleatorios o el uso de un
programa computacional.

Ejemplo: Una empresa tiene 120 trabajadores y se quiere extraer una muestra aleatoria simple de 30
trabajadores.
Solución:
Pasos:
1) Para ello se numeran los trabajadores del 1 al 120,
2) Se seleccionan sorteando 30 números de entre los 120.

Entonces, la muestra estará formada por los 30 trabajadores a los que les correspondan los números
obtenidos.

Utilizando el programa SPSS

Ir a Datos / Seleccionar casos… / Muestra aleatoria de casos

Muestreo estratificado
Muestreo en el que la población se divide en segmentos o estratos y se selecciona una muestra para
cada segmento.
Esto es, una vez definidos los estratos, para obtener la muestra se seleccionan individuos empleando
una técnica de muestreo cualquiera (muestreo aleatorio simple, muestreo sistemático, etc.) a cada uno
de los estratos por separado.
Los estratos deben ser homogéneos dentro de sí y heterogéneos entre ellos.
El uso del muestreo aleatorio estratificado reduce el error muestral, mejorando la precisión de los
resultados.
Es relativamente habitual definir estratos de acuerdo a algunas variables características de la población
como son la edad, sexo, clase social o región geográfica.
Pasos:
1) Estratificar previamente los elementos de la población, en base a alguna variable prefijada.
2) Tomar una muestra de cada estrato (por ejemplo un muestreo aleatorio simple en cada estrato) y la
muestra final estará formada por todas las muestras elegidas en cada estrato.
Ejemplo: Si en un estudio esperamos encontrar un comportamiento muy diferente entre hombres y
mujeres, puede ser conveniente definir dos estratos, uno por cada sexo, luego se selecciona individuos
de cada estrato los que formarán la muestra requerida.

3
Muestreo sistemático
Es un tipo de muestreo probabilístico donde se hace una selección aleatoria del primer elemento para la
muestra, y luego se seleccionan los elementos posteriores utilizando intervalos fijos o sistemáticos
hasta alcanzar el tamaño de la muestra deseado.
Como desventaja, existe la posibilidad de que el orden en que se han listado los candidatos a la muestra
tenga algún tipo de periodicidad oculta que coincida con el intervalo escogido para generar la muestra
sistemática. En este caso, podríamos generar una muestra sesgada.
Pasos:
1) Enumerar los elementos de la población de 1 hasta N. (Marco muestral)
2) Se elige en forma aleatoria un elemento de inicio entre los “k” primeros. Con k=N/n.
3) Luego se elige de manera sistemática cada k lugares después del primer elemento, y así
sucesivamente. Esto equivale a decir que seleccionaremos los individuos
c, c+k, c+2k, … , c+(n-1)k

Ejemplo: Una empresa tiene 50 trabajadores y se quiere extraer una muestra aleatoria sistemática de
10 trabajadores, con un arranque de 2.
Solución:
Pasos:
1) Enumerar los elementos de la población de 1 hasta N=50.
1, 2, 3, …, 50

2) Se elige en forma aleatoria un elemento de inicio (arranque) entre los “k” primeros.
N 50
Hallando k  = = 5.
n 10
Elegir un valor de 1 a k , según el ejercicio, posición del elemento de inicio c= 2 .

3) Luego se elige de manera sistemática cada k lugares después del primer elemento, y así
sucesivamente.
Posición de los elementos de la muestra:
c, c+k, c+2k, … , c+(n-1)k
2, 7, 12, , 47
Los trabajadores seleccionados para la muestra serían los que se correspondan a los números:
2, 7, 12, 17, 22, 27, 32, 37, 42, 47.

4
Muestreo por conglomerados
En este método, la población se divide en grupos (o conglomerados) que sean homogéneos entre ellos,
y se selecciona un grupo de conglomerados para luego elegir a los elementos de cada conglomerado
seleccionado los que conformarán la muestra de estudio.
Podemos definir como conglomerados a familias, a salones de clase, a manzanas de viviendas, centros
de salud, comunidades, etc. Un criterio habitual para definir conglomerados es el geográfico.
Los conglomerados deben ser heterogéneos dentro de sí y homogéneos entre ellos.
Las ventajas son que, es muy eficiente cuando la población es muy grande y dispersa; reduce costos; no
es necesario tener un listado de toda la población, solo de las unidades primarias (conglomerados).
Pasos:
1) Definir y listar los conglomerados.
2) Seleccionar aleatoriamente una muestra de conglomerados. (por muestreo aleatorio simple,
sistemático, etc.)
3) Cada conglomerado se revisará completamente y la muestra estará conformada por todos los
elementos de los conglomerados seleccionados.

Por ejemplo: Si se desea investigar la proporción de personas desocupadas en el distrito de Jesús


María, la población será el total de personas en edad productiva, esto es, que pueden trabajar. Para este
caso no hay una lista de esas personas, además sería muy costoso que la muestra quedara dispersa en
toda la ciudad. Para remediar esta situación se pueden formar conglomerados, en este caso, serían las
“manzanas”, de las cuales sí se tiene un marco, los mapas del distrito, y lo que se hace es seleccionar en
forma aleatoria algunas manzanas, para luego investigar a todas las personas (en edad productiva) de
las manzanas seleccionadas.

MUESTREO NO PROBABILISTICO
Se refiere cuando no se tiene acceso a una lista completa de los individuos que forman la población
(marco muestral) y, por lo tanto, no se conoce la probabilidad de que cada individuo sea seleccionado
para la muestra.
La principal consecuencia de esta falta de información es que no podremos generalizar resultados con
precisión estadística.
Principalmente se basa en opinión (criterio o juicio) personal del investigador para seleccionar que
unidades formarán la muestra.
Este tipo de muestreo no probabilístico suele aplicarse a menudo en la vida corriente, sobre todo en el
comercio y en encuestas de opinión, y siempre que en caso de equivocación las consecuencias no sean
demasiado graves.
Las ventajas de los métodos de muestreo no probabilísticos son su bajo costo y su fácil realización. El
muestreo no probabilístico puede ser:
- Muestreo por conveniencia
- Muestreo por cuotas
- Muestreo por bola de nieve

5
Muestreo por conveniencia
Consiste en seleccionar a los individuos que convienen al investigador para la muestra. Esta
conveniencia se produce porque al investigador le resulta más fácil examinar a estos sujetos, ya sea por
proximidad geográfica, por ser sus conocidos, etc., esto es, los individuos están fácilmente disponibles
o están más al alcance.

Muestreo por cuotas


En este método se divide la población de estudio en varios estratos definidos por algunas variables
(como el sexo, edad, etc.), luego los elementos de la muestra se seleccionan según las cuotas
establecidas que hacen que la composición de la muestra sea proporcional a la de la población respecto
al número de elementos de esos estratos.

Muestreo por bola de nieve


Se realiza sobre poblaciones donde no se conoce a sus individuos o es muy difícil acceder a ellos. Se
llama muestreo de bola de nieve porque cada sujeto estudiado propone a otros, produciendo un efecto
acumulativo parecido a una bola de nieve.

6
TAMAÑO DE MUESTRA
El tamaño de la muestra es el número de elementos que componen la muestra extraída de una
población, necesarios para que los datos obtenidos sean representativos de la población.

El objetivo principal de seleccionar la muestra es hacer inferencias estadísticas acerca de la población


de la que proviene. Dichas inferencias pueden ser de dos tipos: estimar parámetros o contrastar
hipótesis.
En la estimación de parámetros, se pretende hacer inferencias a valores poblacionales (medias,
proporciones), a partir de los resultados en una muestra. Por ejemplo, la media de los sueldos de los
trabajadores de una ciudad, la media de la duración de las baterías producidas por una empresa, o la
proporción de estudiantes de pregrado con obesidad.
La generalización de resultados de la muestra hacia la población conlleva a cometer cierto error,
afortunadamente, el error que se comete al generalizar resultados puede acotarse. Para ello se emplea
el margen de error (e), que es la máxima diferencia que esperamos que haya entre la
estimación observada en la muestra y el parámetro de estudio en la población, y el nivel de confianza,
que es el nivel de certeza que se tiene de que realmente la diferencia esté dentro del margen de error,
que puede ser al 95%, 99%, etc.

El tamaño de muestra necesario para estudiar cierta población, se basa principalmente en el margen de
de error que se esté dispuesto a aceptar en la estimación y en el nivel de confianza.

Esto es,
P(|    |  e)  1   ,  : Parámetro
 : Estimador
e : Margen de error
1   : Nivel de confianza (probabilidad)

Tamaño de muestra para estimar la media “  ”


Para obtener el tamaño de muestra necesario para estimar la media de una variable de la población de
estudio, se debe de aplicar la siguiente fórmula:

z 2 / 2 2
n
e2
donde
n : Tamaño de la muestra Nivel de Valor Z calculado
e: Error admisible confianza en tablas
z  : Valor Z normal estándar del nivel de confianza fijado. 90% 1,64
2
95% 1,96
 : Es desviación estándar de la variable. Si no se tiene,
obtener de una muestra piloto, trabajos pasados, etc. 99% 2,58

7
Prueba,

Sea X: Variable en estudio X N (  , 2 ) Sea la población: X1 , X 2 , X 3 , . . . .

Se toma una muestra aleatoria (x1, x 2 ,..., x n )

n
1-α
x 2
N ( , )
i
X  i 1 se comprueba X α/2 0.95 α/2
n n

- Zα/2 0 Zα/2
De la condición P(|    |  e)  1  
P(| X   |  e)  1   Ejemplo: 1   = 0.95
P ( e  X    e)  1  
e X  e
P(   ) 1
/ n / n / n
e e
P( Z ) 1
/ n / n
igualando con P(Z / 2  Z  Z / 2 )  1  

Se puede establecer,
e
Z / 2 
/ n
Z / 2
n
e
Z2 /2 2
n
e2

OBSERVACION: Si se conoce el tamaño de población (N), la fórmula para el tamaño de la muestra


será:
N z 2 / 2 2
n
e2 ( N  1)  z 2 / 2 2

8
Ejemplo: Se desea conocer la media del coeficiente intelectual de una población, para ello se desea
obtener una muestra. La estimación deberá tener un error máximo de 3 puntos y un nivel de confianza
del 95% y tenemos información por un estudio piloto o revisión bibliográfica que la desviación
estándar es de 10 puntos. Hallar el tamaño de muestra apropiado para la estimación.
Solución:
Sea
X: Coeficiente intelectual.
e=3
Nivel de confianza: 95% , 1   = 0.95 , z  = 1.96 1-α
2
 = 10 α/2 0.95 α/2

- Zα/2 0 Zα/2
Se desea estimar la media del coeficiente intelectual
 : Media del coeficiente intelectual en la población.

Se pide el tamaño de la muestra,

Se sabe
z 2 / 2 2
n
e2
1.962 *102
n
32
n = 42.68
n 43

El tamaño de muestra apropiado para estimar la media del coeficiente intelectual es de 43 personas.

9
Tamaño de muestra para estimar una proporción “p”
Para obtener el tamaño de muestra necesario para estimar la proporción de la característica en la
población de estudio, se debe de aplicar la siguiente fórmula:

z2 / 2 pq
n
e2
donde
n : Tamaño de la muestra
e: Error de muestreo admitido
z : Valor Z normal estándar del nivel de confianza fijado.
2

p : Proporción de la característica en estudio. Es un valor que se estima de un estudio piloto o de


alguna otra fuente, sino fuera así se puede tomar un valor de p  0.5 .
q  1 p

OBSERVACION: Si se conoce el tamaño de población (N), la fórmula para el tamaño de la muestra


será:
N z2 / 2 pq
n 2
e ( N  1)  z2 / 2 pq
Ejemplo: Se quiere estimar la proporción de analfabetos de una población. ¿Qué tamaño debe tener la
muestra para estimar con un error del 3% (0.03) y un nivel de confianza del 95% la proporción de
analfabetos? Se sabe que de una muestra piloto la proporción de analfabetos es de 0.40 .
Solución:
Sea
X: Condición de analfabeto (si o no)
e = 0.03 (3%)
Nivel de confianza: 95% , 1   = 0.95 , z  = 1.96
2
p= 0.4 .

Se desea estimar la proporción de analfabetos “p”


p: proporción de analfabetos en la población.

Se pide el tamaño de la muestra,


Se sabe
z2 / 2 pq
n
e2
1.962 *0.4*0.6
n
0.032
n  1024.42
n 1025

El tamaño de muestra apropiado para estimar la proporción de analfabetos es de 1025 personas.

10
Ejercicios:
1) De una población de universitarios se desea obtener una muestra para conocer la proporción de
estudiantes con obesidad. La estimación deberá tener un error máximo de 4%. y un nivel de confianza
del 95%. Se sabe que el tamaño de la población de universitarios es de 15000 alumnos.
Hallar el tamaño de muestra apropiado para la estimación.
Solución:
Sea
X: Obesidad (si o no)
e = 0.04 (4%)
Nivel de confianza: 95% , 1   = 0.95 , z = 1.96
2
N= 15000

p= 0.5 . (cuando no se da de dato) Obs. 0<p<1

Se desea estimar la proporción de estudiantes con obesidad “p”


p: proporción de estudiantes con obesidad en la población.

Se pide el tamaño de la muestra,


Se sabe
N z2 / 2 pq
n
e 2 ( N  1)  z2 / 2 pq
15000*1.962 * 0.5* 0.5
n
0.042 (14999)  1.962 * 0.5* 0.5
n  577.19
n  578

11

También podría gustarte