Está en la página 1de 43

Sabiduría que vive en ti

Curso: Estadística II
Unidad 1: DISTRIBUCIÓN NORMAL,
INTRODUCCIÓN AL MUESTREO E INTERVALOS
DE CONFIANZA

Tema: Muestreo

Mgt. Milagros Echegaray Mayorga


Introducción

• La utilización del muestreo para aproximarse al


conocimiento de la realidad es práctica habitual en el
campo de la investigación científica. Sin embargo,
para que sea posible, que a través de una muestra se
pueda inferir hacia una población con la precisión y
confiabilidad deseada, es necesario que el diseño
muestral y su desarrollo se ajusten a los
requerimientos que exige la teoría del muestreo.
Tipos de muestreo
¿Cuáles son las ventajas de un
muestreo probabilístico y uno no
probabilístico?
El muestreo probabilístico consiste en tomar una muestra de manera
aleatoria a partir de un marco muestral, en donde todos y cada uno de los
elementos del marco tienen una probabilidad conocida y distinta de cero.
La selección de la muestra se realiza con base en fundamentos de la
teoría de probabilidad, lo cual permite hacer una evaluación objetiva de
los resultados y, por ende, se está en posibilidad de conocer el grado de
precisión y confianza de los mismos. Por tanto, en el muestreo
probabilístico, una vez definida la población de estudio, configurado el
marco de muestreo y definida la forma de selección, la conformación de
la muestra no depende de los criterios selectivos o preferencias del
investigador.
A diferencia del muestreo probabilístico, en el no probabilístico la
conformación de la muestra depende en gran medida de los “criterios”
del investigador, entonces, no hay una manera objetiva de asignar
probabilidades de selección a los elementos del marco de muestreo, en
caso de que se conozca.
Este último punto es importante, porque en algunas ocasiones, aunque
quisiera utilizarse un muestreo probabilístico, no se lograría por la
imposibilidad de contar con un marco muestral, así, se recurre a un
muestreo no probabilístico.
En general puede decirse que se recomienda
el uso del muestreo probabilístico cuando se
desea conocer de manera objetiva la precisión
y confianza de los resultados obtenidos, para
lo que deberá contar con marco de muestreo
confiable. En tanto que si lo que se desea es
obtener información de cierta población para
la cual es difícil contar con un listado
confiable, o únicamente se desea conocer
información de manera exploratoria, el
método de muestreo que se utilizará será uno
no probabilístico.
En este caso, le toca al investigador
argumentar la representatividad de la muestra,
la cual dependerá en gran medida del objetivo
de la investigación.
MUESTREO NO PROBABILÍSTICO
En el muestreo no probabilístico, la representatividad de la muestra
depende de criterios no probabilísticos, es decir, la inclusión o no de un
elemento en la muestra se determina en gran medida por el criterio de los
investigadores y, en algunos casos, de los propios entrevistadores y no de
un proceso aleatorio, por lo que no se está en posibilidades de conocer las
probabilidades de inclusión en muestra de cada uno de los elementos de la
población objetivo.
Por otro lado, a partir de la definición general, anteriormente mencionada,
en la que se considera que un muestreo probabilístico requiere de un
marco muestral para conocer la probabilidad de selección de cada uno de
los elementos que conformarán la muestra, para el caso del muestreo no
probabilístico, este no es un requisito.
De juicio
La característica principal de este tipo de muestreo es que tanto el tamaño
de muestra como la elección de los elementos están sujetos al juicio del
investigador, esto es, para realizar un estudio mediante este tipo de
muestreo debe recurrirse a la experiencia que se tenga. Es decir, la muestra
se forma con los elementos que el investigador considera (según su juicio)
que son los más representativos de la población que va a estudiar.
El juicio del investigador se rige por el conocimiento y experiencia que
tenga sobre el tema. Por consiguiente, el éxito y la eficacia de la muestra
dependen de la opinión del investigador que haya seleccionado los
elementos. En virtud de que el conocimiento y experiencia dependen de la
persona que realiza el muestreo, entonces, la muestra estará sujeta a estas
características. Esta subjetividad en la selección de los elementos de la
muestra es lo que hace que se clasifique como un muestreo no
probabilístico.
Existen muchas situaciones en las que el muestreo de juicio es útil y aun
aconsejable. Un caso puede ser cuando es muy complicado contar con un
marco de muestreo confiable que permita obtener una muestra
probabilística. Por ejemplo, suponga que desea hacer un estudio acerca de
la opinión de los líderes de organizaciones sociales informales acerca de la
situación política del país. Es difícil que exista un listado completo de
todos estos líderes, y armarlo resultaría muy costoso, en cuanto a tiempo y
recursos económicos. Por consiguiente, una opción en este caso es que el
investigador realice un listado de los líderes “más representativos” que él
considere que deben ser encuestados.
Por cuotas
Para el caso del muestreo por cuotas, al igual que las muestras generadas
por muestreo de juicio, tampoco son probabilísticas. Sin embargo, el
muestreo por cuotas permite obtener muestras representativas en cuanto a
la distribución de algunas variables relevantes de la población.
Esta representatividad se basa principalmente en la obtención de un número
específico de casos, de acuerdo con las variables que se consideren más
relevantes. Sin embargo, al igual que en el muestreo de juicio, la selección
de los elementos de la muestra no es probabilística, como se verá a
continuación.
El procedimiento general del muestreo por cuotas es el siguiente:
1. Variables relevantes. Un primer paso es identificar las variables que van
a permitir asignar cuotas. Estas variables se definen de acuerdo con la
importancia o la posible influencia que pudieran tener sobre el
fenómeno que está estudiándose (por ejemplo, sexo, escolaridad, edad,
ingreso, etcétera).
2. Recabar información sobre la distribución de las variables relevantes
para la población objetivo. Con esta información se asigna el número de
casos de acuerdo con la distribución porcentual de dichas variables.
3. Asignar a cada entrevistador el número de cuestionarios a aplicar, así
como la distribución de los mismos de acuerdo con las variables
relevantes.
4. En este último, donde se realiza el proceso de selección† de los
entrevistados, es donde se introduce el sesgo de los entrevistadores, ya
que ellos deciden a quién entrevistar y no hay manera de saber la
probabilidad de selección de cada uno de los incluidos en muestra.
Bola de nieve
Al igual que en los casos anteriores, cuando no se cuenta con un marco de muestreo
confiable o cuando es muy difícil contactar a la población objetivo, es recomendable un
muestreo por bola de nieve.
El muestreo de bola de nieve involucra los siguientes pasos:
1. Definición de la población objetivo.
2. Elección de uno o varios elementos para el inicio del levantamiento.†† En este punto es
donde se define, directa (consciente) o indirectamente (inconscientemente), la
composición final de la muestra.
3. A cada uno de los elementos encuestados se le solicitará referencia de otro u otros
elementos que cumplan con las características de la población objetivo. Estas referencias
serán los siguientes integrantes de la muestra. Y así sucesivamente, hasta un determinado
número de referencias o hasta que de acuerdo con los criterios del investigador, se cuente
con la información suficiente. En consecuencia con este procedimiento, la composición
de la muestra se conocerá hasta el final.
Ejemplo 1
Suponga que busca realizar un estudio de la opinión que tienen los
empresarios acerca de la aprobación de determinada ley arancelaria. A
primera vista puede decirse que, aunque es complicado, se podría
contar con un marco de muestreo confiable, lo cual sería de gran
ayuda. Sin embargo, por otro lado, se percata de que es complicado
hacer contacto con los empresarios. Por tanto, un muestreo por bola de
nieve es recomendable, ya que únicamente se tendrá que garantizar el
contacto con un número reducido de empresarios, los cuales remitirán
con empresarios conocidos por éstos, lo que facilitará su inclusión en
la muestra para conformar la muestra final.
Por conveniencia
Cuando una muestra está conformada únicamente por elementos
disponibles o con los más dispuestos, entonces se trata de una muestra
por conveniencia. A diferencia del muestreo de juicio, en el que se
buscan elementos que a juicio del investigador sean los convenientes,
una muestra por conveniencia estará constituida por los que se “tengan a
la mano”.
Obvio, este tipo de muestreo tiene muchas ventajas prácticas; sin
embargo, sus resultados sólo harán referencia a los que fueron
entrevistados y no a un grupo más grande. A pesar de esto, el muestreo
por conveniencia tiene aplicaciones importantes, por ejemplo en estudios
de mercado en los cuales se desee realizar la evaluación de un producto,
o cuando se quiere llevar a prueba el diseño de algún cuestionario
(prueba piloto en una encuesta), etcétera.
MUESTREO PROBABILÍSTICO
Parta de que el objetivo básico del muestreo probabilístico es entender el
comportamiento de determinado fenómeno, así como el grado de precisión con que se
conoce, es decir, se desea estimar lo mejor posible el valor de una determinada variable y
conocer la magnitud del posible error que esté cometiéndose.
Por tanto, cuando sea necesario contar con el grado de representatividad de una muestra,
así como con los errores de muestreo, es recomendable el uso de un muestreo
probabilístico.
Pero, ¿qué implica un muestreo probabilístico? Básicamente el conocimiento de las
probabilidades de selección (de estar en la muestra) de cada uno de los elementos de la
población objetivo y, por ende, que sea posible conocer las probabilidades de selección
de todas y cada una de las posibles muestras que se puedan tomar de la población.† Este
hecho es el que da sustento al muestreo probabilístico, ya que a partir de dicha
distribución muestral será posible aplicar las leyes de probabilidad en dicho espacio y,
por tanto, calcular los estimadores deseados con sus respectivos niveles de confianza y
errores de muestreo.
Cuando se va a seleccionar una muestra
básicamente debemos de preocuparnos por dos
cosas:
¿Cuántos elementos
muestrear?
• La solución a este problema nos indica cuál es el
mínimo de elementos que se requieren para lograr
un propósito específico de inferencia con una
precisión y confiabilidad establecida.
¿Cómo seleccionar los
elementos que componen la
muestra?
• Este problema se resuelve con un esquema de
muestreo apropiado; es decir, con un método
que nos lleve a obtener una muestra de los
elementos de la población bajo estudio.
Los esquemas de muestreo se
dividen en:
• Aleatorios
• No aleatorios
Ambos pueden producir buenos resultados,
aunque la aleatoriedad es un elemento que
se valora más como científico. Razón por la
que es preferible el uso de esquemas
aleatorios.
Censos y muestras
En la siguiente tabla se comparan algunos aspectos relacionados a los
censos y las muestras:

Censo Muestra
- Costoso - Un bajo costo

- Muchos recursos humanos - Pocos recursos humanos

- Organización compleja - Organización poco compleja

- Gran duración en la - Obtención y análisis de la


obtención y análisis de la información en un corto
información periodo de tiempo
- Resultados precisos - Resultados muy precisos 19
Planeación de una encuesta
La realización de una encuesta requiere
de la implementación de una metodología
cuidadosamente diseñada.

Se recomienda siempre tomar en cuenta


los siguientes aspectos para el desarrollo de
una encuesta por muestreo:
1. Establecimiento de objetivos
2. Definición de la población objetivo
3. Obtención del marco muestral
4. Seleccionar el diseño o esquema de muestreo
5. Determinar los métodos de medición
6. Escoger el instrumento de medición
7. Selección y adiestramiento de los investigadores de campo
8. Prueba piloto
9. Organización del trabajo de campo
10. Organización del manejo de datos
11. Análisis de datos
12. Elaborar un reporte
Muestreo aleatorio simple

En este esquema se supone que se tiene una población


homogénea de tamaño N, lo cual es poco frecuente en
problemas reales. La idea es darle a cada elemento la misma
probabilidad de salir seleccionada en la muestra, lo que se
garantiza a través de una rifa simple o seleccionando n
números aleatorios de entre 1 a n , a partir de una tabla o con
la ayuda de una calculadora. Estos números nos indicarán
cuáles elementos debo elegir y observar. Para hacer esta rifa
debo tener un listado de los elementos de la población de
muestro que se denomina marco.
Esquema de un muestreo aleatorio
simple
8
N-6 N
Población finita de
2 5

1 6 ... N-2

tamaño N
4 N-3 N-5
3
7 N-1
N-4

Selección aleatoria simple

1 2 5
...
n Muestra aleatoria
4 6
simple de tamaño n
3
Muestreo aleatorio
estratificado
En los problemas reales es más frecuente tener
una población estratificada; es decir, una población
de muestreo compuesta por varios grupos bien
identificados, a los que se les llama estratos. Los
individuos pertenecen a uno y solamente uno de los
estratos. Para seleccionar una muestra estratificada
de tamaño n , procedemos de la siguiente manera.
Sea N=N1+N2+...+Nh. Donde Nh= número de
elementos o unidades en el estrato h-ésimo.
Determinamos n y lo distribuimos en los H estratos,
por ejemplo usando asignación proporcional; es decir:

Nh
nh = n
N
Una vez determinado nh se procede a realizar
un muestreo aleatorio simple en cada estrato.
Esquema de un muestreo aleatorio estratificado
Población finita de tamaño
N1 +N 2 + ... +Nh = N
Estrato 1 Estrato 2 . . . Estrato H
N1 N2 Nh
2 2 1
1 1 2 3
4 5
4 3 4 5 6 6
...
3 7
6 7 8
5 N 8
... 9 ... N2 ... NL
7
Muestra aleatoria Muestra aleatoria
Muestra aleatoria
simple simple
simple

1 2 1 3 2 1 2
... ... ...
3 n1 4 3 nL
n2

Muestra aleatoria estratificada de tamaño


1 2n =n + n + ...+ n
L
Muestreo por
conglomerados
A veces es muy costoso obtener un marco de
unidades elementales, pero éstas aparecen
naturalmente agrupadas en pequeños grupos
llamados conglomerados. Si podemos obtener un
listado de conglomerados. Sea 1, 2, ...M el marco
de conglomerados. Nosotros podemos seleccionar
una muestra de unidades básicas en dos etapas:
1. Primero seleccionamos una muestra de m
conglomerados usando muestreo aleatorio simple.
2. De cada conglomerado seleccionado obtenemos un
marco de las Ni unidades i=1,2,...,m
3. Seleccionamos una muestra aleatoria de tamaño ni,
i=1,2,...,m de cada uno de los conglomerados.

Así la muestra total será de tamaño n=n1+n2+...nm. La


forma de determinar ni para cada conglomerado puede ser
hecha por separado o bien determinar n y después
distribuirla sobre los m conglomerados.
Esquema de un muestreo por conglomerados en dos etapas
Población finita de M conglomerados

3
1 5

4
2 ...
6 M

Muestra aleatoria simple


de m conglomerados
..
3 .
1
m Muestra aleatoria simple de
2 elementos en cada
conglomerado seleccionado en
la primera etapa

... ...
n1
n2
... ...
n3 nm
Muestreo sistemático
Algunas poblaciones aparecen
ordenadas físicamente, en filas, gavetas,
etc., o bien en el tiempo. Una manera de
aprovechar el orden para elegir una
muestra es haciendo una selección
sistemática.
Para esto el total N de la población
debe dividirse en n grupos cada uno de
tamaño k ; así N = nk.
Entonces de los primero k elementos
seleccionamos uno aleatoriamente. El resto
de los elementos de la muestra se obtiene
sistemáticamente tomado siempre el
elemento j+ik donde j es el lugar elegido
entre los primeros k e i=1,2,...(n-1). Esto es
j, J+k, J+2k, J+3k,...

Si la población tiene un comportamiento


cíclico la muestra puede ser poco representativa.
Esquema de un muestreo sistemático
Población ordenada de tamaño N=nk
GRUPO 1 GRUPO 2 GRUPO k

. . .

. . . . . . . . . . . .

j J+k ... J+(n-1)k

Muestra sistemática de tamaño n


Otros esquemas aleatorios
En la práctica resulta, con mucha frecuencia,
necesario combinar varios esquemas. Así
podríamos tener un muestreo estratificado y por
conglomerados, que en la segunda etapa utilice el
procedimiento sistemático. En general las
características de la población y el problema bajo
estudio nos darán los elementos que nos permitan
confeccionar nuestro plan de la forma más
adecuada.
Muestras no aleatorias
Las muestras aleatorias no necesariamente son
más representativas.
Incluso una muestra aleatoria puede ser muy
mala.
Las muestras aleatorias únicamente garantizan,
que en promedio, obtendremos muestras con pocos
sesgos de elección propiciados por las preferencias del
que esta eligiendo.
En la medida en la que tengamos conocimiento de
la población podemos, con métodos no aleatorios,
seleccionar muestras adecuadas y bastante
representativas.

Si hay un experto de la población bajo estudio,


podría proponer una muestra “a juicio” que garantice
representatividad. Esta muestra no necesita ser muy
grande para proporcionar información de buena calidad.
Dado que esta muestra proviene del buen juicio de un
experto podría ser cuestionada, pero la experiencia es
garantía en muchas situaciones.
Otra forma de construir una muestra es a
través de cuotas, estas establecidas en términos de
algunas variables que definen representatividad.
Estas cuotas se les establecen a los trabajadores
de campo y encuestadores y ellos arbitrariamente
eligen a las unidades específicas que pertenecerán
a la muestra.
Otro es a conveniencia, esto por la consideración
de complejidad.
Tamaño de muestra
Los factores más importantes que deben tomarse en
cuenta para la determinación del tamaño de
muestra son:

1. La variabilidad de la característica de interés en


los elementos de la población.
2. El tamaño de la población bajo estudio.
3. El nivel de precisión que se desea para estimar el
parámetro de interés.
4. El nivel de confiabilidad deseado.
Una manera simple de determinar el
tamaño de muestra es cuando se puede
fijar el interés en una sola variable y el
objetivo de inferencia es estimar por
intervalo una media, un total o una
proporción. Así el tamaño de muestra se
obtendría usando alguna de las
siguientes fórmulas:
Media poblacional: 

Estimador: x
Z 2 s 2
n = a /2
E 2

Ns 2
n =
E 2
( N - 1) +s 2
Z 2
a /2

Za /2: Es Un valor de tablas que determina un nivel de confianza


(90%, Z= 1.65, 95%, Z= 1.96, 99%, Z= 2.34).

s 2
: Varianza poblacional.
E : Es la precisión con la que se desea obtener la estimación
(Error).
N : Tamaño de la población bajo estudio.
Proporción poblacional: p Estimador: p̂

Z a2 / 2 pq
n=
B2

Npq
n=
B2
( N - 1) 2 2
+ pq
Z a /2 N
p : Proporción de elementos que presentan la característica de interés en la
población.
q : Proporción de elementos que no presentan la característica de interés en
la población.

También podría gustarte