Está en la página 1de 84

Unidad 1: Teoría del Muestreo

Prof. John Ortega

1
TEORÍA DEL MUESTREO
Uno de los propósitos de la estadística inferencial es estimar las
características poblacionales desconocidas, examinando la
información obtenida de una muestra, de una población. El punto
de interés es la muestra, la cual debe ser representativa de la
población objeto de estudio.
El muestreo son operaciones que se realizan para estudiar la
distribución de determinadas características en la totalidad de una
población, a partir de una parte o subconjunto de la población,
denominada muestra.
Cuando se utilizan métodos estadísticos con datos muestrales
para obtener conclusiones sobre una población, es esencial
recopilar los datos de muestra en forma apropiada.
El pensamiento estadístico involucra pensamiento crítico y
capacidad de dar sentido a los resultados. El pensamiento
estadístico exige mucho más que hacer cálculos complicados.
¿Por qué tomar una muestra en lugar de estudiar a cada
miembro de la población?
Una muestra de votantes registrados se hace necesaria en virtud
de los costos prohibitivos de ponerse en contacto con millones
de electores antes de una elección.
La toma de muestras para aprender algo sobre una población es
de uso frecuente en administración, agricultura, política y
acciones de gobierno, según lo muestran los siguientes
ejemplos:
• En una muestra de 800 televidentes que ven televisión a la hora
de mayor audiencia, 320, o 40%, señaló que vio American Idol en
Fox la semana pasada. Estos índices de audiencia se emplean
para establecer tarifas de publicidad o para suspender programas
• Una firma de contadores públicos, realiza una auditoría a
Jugueterías La Grande, para comenzar, la firma contable elige una
muestra aleatoria de 100 facturas y verifica la exactitud de cada
una de ellas. Por lo menos hay un error en cinco facturas; por
consiguiente, la firma de contadores calcula que 5% de la
población de facturas contiene al menos un error.
Errores en el Muestreo
Cuando se utilizan valores muéstrales, o estadísticos para
estimar valores poblacionales, o parámetros, pueden ocurrir dos
tipos generales de errores: el error muestral y el error no
muestral.
Los errores que surgen al tomar las muestras y que no pueden
clasificarse como errores muéstrales se denominan errores no
muéstrales. El sesgo de las muestras es un tipo de error no
muestral.
El sesgo muestral se refiere a una tendencia sistemática inherente
a un método de muestreo que da estimaciones de un parámetro
que son, en promedio, menores (sesgo negativo), o mayores
(sesgo positivo) que el parámetro real. El sesgo muestral puede
suprimirse, o minimizarse, usando la aleatorización
Aleatorización
La aleatorización se refiere a cualquier proceso de selección de
una muestra de la población en el que la selección es imparcial
o no está sesgada.
Una muestra elegida con procedimientos aleatorios se llama
muestra aleatoria.
Ventajas del método de muestreo
• Costo reducido: Si los datos se obtienen únicamente de una
pequeña fracción del total, los gastos son menores que los
que se realizarían en un censo.
• Mayor rapidez: Los datos pueden ser recolectados y
resumidos más rápidamente con una muestra que con un
censo.
• Mayor exactitud: Si el volumen de trabajo es reducido se
puede emplear personal capacitado al cual se le puede
someter a entrenamiento intensivo.
Tipos de muestreo
Existen dos tipos e muestreo: El probabilístico y el no
probabilístico.
Muestreo probabilístico
Todos los elementos de la población tienen la misma
probabilidad de ser elegidos. Los elementos muestrales tendrán
valores muy parecidos a los de la población, sus elementos son
seleccionados de forma aleatoria.
TIPOS DE MUESTREO PROBABILISTICO
La aleatorización nos garantiza seleccionar una muestra
representativa.
Muestreo aleatorio simple

Muestreo estratificado

Muestreo por conglomerados

Muestreo sistemático
MUESTRA ALEATORIA SIMPLE
Si una muestra aleatoria se elige de tal forma que todos los
elementos de la población tengan la misma probabilidad de ser
seleccionados, la llamamos muestra aleatoria simple
Las observaciones se realizan de forma independiente y al azar.
El propósito de seleccionar muestras aleatorias es obtener
información acerca de los parámetros conocidos de la población.
COMO OBTENER UN MUESTREO ALEATORIO SIMPLE

métodos de selección
Ejemplo: Suponga que nos interesa elegir una muestra aleatoria de 5
estudiantes en un grupo de Análisis Estadístico de 16 .
16C5 da el número total de formas de elegir una muestra no ordenada y este
resultado es 87,360 maneras diferentes de tomar la muestra.
Si listamos las 87,360 maneras en trozos separados de papel, una tarea
tremenda, luego los colocamos en un recipiente y después los revolvemos,
entonces podremos tener una muestra aleatoria de 5 si seleccionamos un
trozo de papel con cinco nombres. Un procedimiento más simple para elegir
una muestra aleatoria sería escribir cada uno de los 16 nombres en pedazos
separados de papel, colocarlos en un recipiente, revolverlos y después
extraer cinco papeles al mismo tiempo.
Otro método parea obtener una muestra aleatoria de 5
estudiantes en un grupo de 16 es utilizando una tabla de
números aleatorios. Se puede construir la tabla usando
una calculadora o una computadora.
También se puede hacer la tabla escribiendo diez dígitos del 0 al 9
en tiras de papel, las colocamos en un recipiente y los revolvemos,
de ahí, la primera tira seleccionada determina el primer número de
la tabla, se regresa al recipiente y después de revolver otra vez se
selecciona la segunda tira que determina el segundo número de la
tabla; el proceso continúa hasta obtener una tabla de dígitos
aleatorios con tantos números como se desee
Tabla de números aleatorios con Excel
Para ejemplificar el muestreo aleatorio simple y la selección,
suponga que una población consta de 845 empleados de
Supermercados Nacional, de la cual se va a elegir una muestra
de 52 empleados. Una forma de asegurarse de que todos los
empleados de la población tienen las mismas posibilidades de
que se les elija consiste en escribir primero el nombre de cada
empleado en un papel y depositarlos todos en una caja.
Después de mezclar todos los papeles, se efectúa la primera
selección tomando uno de la caja sin mirarlo. Se repite este
proceso hasta terminar de elegir la muestra de 52 empleados.
Un método más conveniente de seleccionar una muestra aleatoria consiste
en utilizar un número de identificación por cada empleado y una tabla de
números aleatorios. Como su nombre lo indica, estos números se
generaron mediante un proceso aleatorio (en este caso, con una
computadora). La probabilidad de 0, 1, 2, …, 9 es la misma
para cada dígito de un número. Por consiguiente, la probabilidad de que se
seleccione al empleado 011 es la misma que tienen los empleados 722 o
382. Cuando se emplean números aleatorios para seleccionar empleados,
se elimina la influencia o sesgo del proceso de selección.
Para seleccionar una muestra de empleados, elija primero un punto de
partida en la tabla; cualquier punto sirve. Ahora suponga que el reloj marca
las 3:04. Puede observar la tercera columna y en seguida desplazarse hacia
abajo hasta el cuarto conjunto de números. El número es 03759. Como sólo
hay 845 empleados, utilizará los tres primeros dígitos de un número
aleatorio de cinco dígitos. Por lo tanto, 037 es el número del primer
empleado que se convertirá en miembro de la muestra. Otra forma de elegir
el punto de partida consiste en cerrar los ojos y señalar un número de la
tabla. Para continuar, puede desplazarse en cualquier sentido. Suponga que
lo hace hacia la derecha. Los primeros tres dígitos del número a la derecha
de 03759 son 447, el número del siguiente empleado seleccionado para
integrar la muestra. El siguiente número de tres dígitos a la derecha es 961.
Omita 961, pues sólo hay 845 empleados. Continúe hacia la derecha y
seleccione al empleado 784; después el 189 y así en lo sucesivo..
.
MUESTREO ESTRATIFICADO
El muestreo estratificado es una técnica de muestreo
probabilístico en donde el investigador divide a toda la población
en diferentes subgrupos o estratos. Luego, selecciona
aleatoriamente a los sujetos finales de los diferentes estratos en
forma proporcional.
Ejemplo:
1) Suponga que nos interesa obtener una muestra de las
opiniones de los profesores del INTEC sobre las buenas
practicas Docentes. Puede ser difícil obtener una muestra con
todos los profesores, así que supongamos que elegimos una
muestra aleatoria de cada departamento académico; los
estratos vendrían a ser los departamentos académicos.
2) Si se va a investigar algún aspecto de la educación en el Distrito
Nacional, las universidades pueden considerarse estratos; luego
se puede seleccionar una muestra de cada estrato.
MUESTREO POR CONGLOMERADOS

El muestreo por conglomerados requiere de elegir una muestra


aleatoria simple de unidades heterogéneas entre sí de la
población llamadas conglomerados. Cada elemento de la
población pertenece exactamente a un conglomerado, y los
elementos dentro de cada conglomerado son usualmente
heterogéneos o disímiles.
Ejemplo:
Suponga que desea determinar la opinión de los residentes de alguna provincia con
referencia a las políticas nacionales y estatales de protección ambiental. Seleccionar
una muestra aleatoria de residentes y ponerse en contacto con cada persona
requeriría mucho tiempo y resultaría muy costoso. Sería mejor aplicar el muestreo por
conglomerados y subdividir la provincia en pequeñas unidades: regiones. Con
frecuencia se les conoce como unidades primarias.
Suponga que dividió la provincia en 12 unidades primarias, seleccionó al azar cuatro
regiones, 2, 7, 4 y 12, y concentró su atención en estas unidades primarias. Usted
puede tomar una muestra aleatoria de los residentes de cada una de estas regiones y
entrevistarse con ellos(observe que se trata de una combinación de un muestreo por
conglomerados y un muestreo aleatorio simple).
MUESTREO SISTEMATICO
El muestreo sistemático es una técnica de muestreo que
requiere de una selección aleatoria inicial de observaciones
seguida de otra selección de observaciones obtenida usando
algún sistema o regla.
Ejemplo:
1) Para obtener una muestra de suscriptores telefónicos en la Provincia de
Santiago de los caballeros, puede obtenerse primero una muestra aleatoria
de los números de las páginas del directorio telefónico; al elegir el vigésimo
nombre de cada página obtendríamos un muestreo sistemático, también
podemos escoger un nombre de la primera página del directorio y después
seleccionar cada nombre del lugar número cien a partir del ya seleccionado.
Por ejemplo, podríamos seleccionar un número al azar entre los primeros
100; supongamos que el elegido es el 40, entonces seleccionamos los
nombres del directorio que corresponden a los números 40, 140, 240, 340 y
así sucesivamente
Ejemplo:
En algunos estudios, el procedimiento de muestreo aleatorio simple resulta
complicado. Por ejemplo, suponga que la división de ventas de Computer Z,
necesita calcular rápidamente el ingreso medio por venta del mes pasado. La
división confirmó que se registraron 2 000 ventas y se almacenaron en cajones
de archivo, y se decidió seleccionar 100 recibos para calcular el ingreso medio
en dólares.
El muestreo aleatorio simple requiere la numeración de cada recibo antes de
utilizar la tabla de números aleatorios para seleccionar los 100 recibos. Dicho
proceso de numeración puede tardar mucho tiempo. En su lugar, es posible
aplicar el muestreo aleatorio sistemático.
Primero se calcula k, que es el resultado de dividir el tamaño de la población
entre el tamaño de la muestra. En el caso de Computer Z seleccione cada
vigésimo recibo (2000/100) de los cajones del archivo; al hacerlo evita el
proceso de numeración. Si k no es un número entero, hay que redondearlo.
Para seleccionar el primer recibo emplee el muestreo aleatorio simple. Por
ejemplo, seleccione un número de la tabla de números aleatorios entre 1 y k, en
este caso, 20. Suponga que el número aleatorio resultó ser 18. Entonces, a
partir del recibo 18, se seleccionará cada vigésimo recibo (18, 38, 58, etc.)
como muestra.
Antes de aplicar el muestreo aleatorio sistemático, debe observar con cuidado
el orden físico de la población. Cuando el orden físico se relaciona con la
característica de la población, no debe aplicar el muestreo aleatorio sistemático.
Por ejemplo, si los recibos se archivan en orden creciente de ventas, el
muestreo aleatorio sistemático no garantiza una muestra aleatoria. Debe aplicar
otros métodos de muestreo.
Ejemplo:
De los 450 estudiantes matriculados en el INTEC en la Carrera de psicologia se
quiere tomar una muestra de 15 de ellos. Indica cómo hay que hacerlo
utilizando el muestreo sistemático.
Muestreo no probabilístico
• Aplicado cuando el muestreo probabilístico resulta
excesivamente costoso.
• Todos los individuos no tienen la misma probabilidad de ser
elegidos.
• No se tiene la certeza de que muestra extraída sea
representativa.
• No es posible generalizar conclusiones.
Muestreo no probabilístico
Las muestras no probabilísticas se conocen también como
dirigidas. Son seleccionadas de manera informal y un poco
arbitraria, depende del criterio y conveniencia del investigador, y
son:
a) Muestra de sujetos voluntarios (casual).- Muy utilizado en
medicina. Se seleccionan a los n primeros voluntarios con
características similares para someterles por ejemplo a un
experimento, hay que asegurar su representatividad.
Muestreo no probabilístico
b) Muestra intencional (por ejemplo de expertos).- En
estudios cualitativos, cuanti-cualitativos y exploratorios
es necesario la opinión de expertos; el investigador
forma una muestra de n expertos, seleccionada de
manera representativa, apropiada y conveniente para
los fines de la investigación.
Muestreo no probabilístico
c) Muestra por cuotas.- Utilizados en estudios de opinión, se
prefiere por su comodidad y economía: 1) Se divide la población
en subgrupos (o estratos), se fijan unas cuotas de individuos de
cada subgrupo con determinadas características: edad, sexo,
estado civil, agrupación afín; etc., de acuerdo al tamaño de la
muestra. 2) Se seleccionan los primeros elementos localizados
con dichas características hasta completar las cuotas.
Ejemplo: De 4 escuelas debo encuestar a 5 padres de familia de
cada una, serán encuestados los 5 primeros padres de familia de
cada escuela que encuentre en mi ruta.
Muestreo no probabilístico
d) Muestra mediante bola de nieve.- Se localizan a los primeros
elementos de la muestra y estos nos llevan a los demás hasta
completar la muestra. Se utiliza esta forma para completar
cuotas de subgrupos.
Ejemplo: Un médico ha tratado a un paciente con
una enfermedad rara y decide hacer un estudio sobre ella. Para
ello, recurre al paciente, que le va derivando a sus conocidos
con dicha enfermedad y a través del muestreo de bola de
nieve entrevista al número de individuos que precisa.
Error Muestral
Cualquier medida conlleva algún error. Si se usa la media para
medir, estimar, la media poblacional 𝜇 entonces la media
muestral, como medida, conlleva algún error.
Por ejemplo, supongamos que se ha obtenido una muestra
aleatoria de tamaño 25 de una población con media 𝜇 = 15: si la
media de la muestra es 𝑋 = 12 , entonces a la diferencia
observada 𝑋 − 𝜇 = −3 se le denomina el error muestral. Una
media muestral 𝑋 puede pensarse como la suma de dos
cantidades, la media poblacional 𝜇 y el error muestral; si 𝑒
denota el error muestral, entonces: 𝑋 = 𝜇 + 𝑒
Ejemplo:
Se toman muestras de tamaño 2 de una población consistente en tres valores,
2, 4 y 6, para simular una población “grande” de manera que el muestreo
pueda realizarse un gran número de veces, supondremos que éste se hace
con reemplazo, es decir, el número elegido se reemplaza antes de seleccionar
el siguiente, además, se seleccionan muestras ordenadas. En una muestra
ordenada, el orden en que se seleccionan las observaciones es importante,
por tanto, la muestra ordenada (2,4) es distinta de la muestra ordenada (4,2).
En la muestra (4,2), se seleccionó primero 4 y después 2.
Determine la media poblacional, la media de cada muestra, el error muestral y
el promedio de todos los errores muéstrales.
DISTRIBUCIONES MUESTRALES
Las muestras aleatorias obtenidas de una población son, por naturaleza propia,
impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y
tomadas de la misma población tenga la misma media muestral o que sean
completamente parecidas; puede esperarse que cualquier estadístico, como la media
muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor
de una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores
posibles de un estadístico. Tales distribuciones serán muy importantes en el estudio
de la estadística inferencial, porque las inferencias sobre las poblaciones se harán
usando estadísticas muestrales. Como el análisis de las distribuciones asociadas con
los estadísticos muéstrales, podremos juzgar la confiabilidad de un estadístico
muestral como un instrumento para hacer inferencias sobre un parámetro poblacional
desconocido.
DISTRIBUCIONES DE MUESTREO
➢Distribución muestral de un estadístico
➢Distribución muestral de medias muéstrales.
➢Distribución muestral de la diferencia de dos
medias muéstrales
➢Distribución muestral de proporciones
➢Distribución muestral de diferencia de
proporciones
DISTRIBUCION MUESTRAL DE UN
ESTADISTICO
Como los valores de un estadístico, tal como x, varían de una
muestra aleatoria a otra, se le puede considerar como una
variable aleatoria con su correspondiente distribución de
frecuencias.
La distribución de frecuencia de un estadístico muestral se
denomina distribución muestral. En general, la distribución
muestral de un estadístico es la de todos sus valores posibles
calculados a partir de muestras del mismo tamaño.
DISTRIBUCION MUESTRAL DE MEDIAS
Suponga que se han seleccionado muestras aleatorias de
tamaño 20 en una población grande. Se calcula la media
muestral 𝑿𝒊 para cada muestra; la colección de todas estas
medias muéstrales recibe el nombre de distribución muestral de
medias
DISTRIBUCION MUESTRAL DE LA
DESVIACION ESTANDAR
Suponga que se eligen muestras aleatorias de tamaño 20, de
una población grande, y se calcula la deviación estándar de
cada una. La colección de todas estas desviaciones estándar
muestrales se llama distribución muestral de la desviación
estándar
Ejercicio 1:
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la
población de valores 0, 2, 4 y 6. Encuentre:
𝜇, la media poblacional.
𝜎, la desviación estándar poblacional,
𝜇 𝑥 , la media de la distribución muestral de medias,
𝜎𝑋 , la desviación estándar de la distribución muestral de medias.
Además, grafique las frecuencias para la población y para la
distribución muestral de medias.
Solución :
0+2+4+6
Media poblacional: 𝜇= =3
4

σ(𝑥−𝜇)2
Desviación estándar poblacional: 𝜎 =
2

(0 − 3)2 +(2 − 3)2 +(4 − 3)2 +(6 − 3)2


𝜎= = 2.236
4
σ 𝑓𝑖 .𝑿𝒊
Media de la distribución muestral de medias: 𝜇𝑥=
Ԧ σ 𝑓𝑖

0𝑥1 + 1𝑥2 + 3𝑥3 + 3𝑥4 + 4𝑥3 + 5𝑥2 + 6𝑥1


𝜇𝑥=
Ԧ =3
16

Desviación estándar de la distribución muestral de medias

σ(𝑥Ԧ − 𝜇𝑥Ԧ )2 . 𝑓𝑖
𝜎𝑥Ԧ =
σ 𝑓𝑖

(0 − 3)2 . 1 + (1 − 3)2 . 2 + (2 − 3)2 . 3 + (3 − 3)2 . 4 + (4 − 3)2 . 3 + (5 − 3)2 . 2 + (6 − 3)2 . 1


𝜎𝑥Ԧ = = 1.58
16

De aquí que podamos deducir que:

𝜎 2.236
𝜎𝑥Ԧ = = = 1.58
𝑛 2
Después de haber realizado el ejercicio anterior se puede ver que
una distribución muestral se genera extrayendo todas las posibles
muestras del mismo tamaño de la población y calculándoles a
éstas su estadístico.
Como para cualquier variable aleatoria, la distribución muestral de
medias tiene una media o valor esperado, una varianza y una
desviación estándar, se puede demostrar que la distribución
muestral de medias tiene una media igual a la media poblacional.
Esto es:

𝜇𝑋 = 𝐸 𝑥 = 𝜇
Una distribución muestral se genera extrayendo todas las posibles
muestras del mismo tamaño de la población y calculándoles a
éstas su estadístico. Si la población de la que se extraen las
muestras es normal, la distribución muestral de medias será normal
sin importar el tamaño de la muestra.
Si la población de donde se extraen las muestras no es normal,
entonces el tamaño de la muestra debe ser mayor o igual a 30,
para que la distribución muestral tenga una forma acampanada.
Mientras mayor sea el tamaño de la muestra, más cerca estará la
distribución muestral de ser normal. Para muchos propósitos, la
aproximación normal se considera buena si se cumple n=30. La
forma de la distribución muestral de medias sea aproximadamente
normal, aún en casos donde la población original es bimodal, es
realmente notable.
Ejemplo:
Para la distribución muestral de medias del ejercicio pasado,
encuentre:
a) El error muestral de cada media
b) La media de los errores muéstrales
c) c) La desviación estándar de los errores muéstrales.
La desviación estándar de la distribución muestral de un estadístico
se conoce como error estándar del estadístico. Para el ejercicio
anterior el error estándar de la media denotado por 𝜎𝑋 = 1.58 . Con
esto se puede demostrar que si de una población se eligen
muestras de tamaño n con reemplazo, entonces el error estándar
de la media es igual a la desviación estándar de la distribución de
los errores muestrales.
En general se tiene: 𝜎𝑋 = 𝜎𝑒
Cuando las muestras se toman de una población pequeña y sin
reemplazo, se puede usar la formula siguiente para encontrar 𝜎𝑋
𝜎 𝑁−𝑛
𝜎𝑋 =
𝑛 𝑁−1
donde :
𝜎 es la desviación estándar de la población de donde se toman las
muestras,
n es el tamaño de la muestra
N el tamaño de la población.
Como regla de cálculo, si el muestreo se hace sin reemplazo y el
tamaño de la población es al menos 20 veces el tamaño de la
muestra 𝑁 ≥ 20 entonces se puede usar la fórmula.
𝑁−𝑛
El factor se denomina factor de corrección para una
𝑁−1
población finita
Ejemplo:
Suponga que la tabla siguiente muestra la antigüedad en años en el
trabajo de tres profesores universitarios de Análisis Estadístico.
Maestro de Análisis Estadístico Antiguedad
A 6
B 4
C 2

Suponga además que se seleccionan muestras aleatorias de tamaño 2


sin reemplazo. Calcule la antiguedad media para cada muestra, la media
de la distribución muestral y el error estándar, o la desviación estándar
de la distribución muestral.
El diagrama de flujo resume las decisiones que deben tomarse
cuando se calcula el valor del error estándar
Ejercicio:
Una población está formada por N = 5 números: 3, 6, 9, 12, 15. Si
una muestra aleatoria de tamaño n = 3 se selecciona sin
reemplazo, encuentre las distribuciones muestrales para la media
muestral x y la mediana m.
Solución Contiene cinco números distintos y cada uno es
igualmente probable, con probabilidad p(x) = 1/5. Con facilidad
puede hallar la media poblacional y mediana como
Hay 10 posibles muestras aleatorias de tamaño n = 3 y cada una
de ellas es igualmente probable, con probabilidad 1/10. Estas
muestras, junto con los valores calculados de 𝑋 y m para cada
una, se ven en la tabla siguiente. Observe que algunos valores
de 𝑋 son más probables que otros porque se presentan en más
de una muestra. Por ejemplo,
P(𝑋 = 8) = 2 /10 =0 .2 y P(m = 6) = 3 /0 = 0.3

También podría gustarte