Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
TEORÍA DEL MUESTREO
Uno de los propósitos de la estadística inferencial es estimar las
características poblacionales desconocidas, examinando la
información obtenida de una muestra, de una población. El punto
de interés es la muestra, la cual debe ser representativa de la
población objeto de estudio.
El muestreo son operaciones que se realizan para estudiar la
distribución de determinadas características en la totalidad de una
población, a partir de una parte o subconjunto de la población,
denominada muestra.
Cuando se utilizan métodos estadísticos con datos muestrales
para obtener conclusiones sobre una población, es esencial
recopilar los datos de muestra en forma apropiada.
El pensamiento estadístico involucra pensamiento crítico y
capacidad de dar sentido a los resultados. El pensamiento
estadístico exige mucho más que hacer cálculos complicados.
¿Por qué tomar una muestra en lugar de estudiar a cada
miembro de la población?
Una muestra de votantes registrados se hace necesaria en virtud
de los costos prohibitivos de ponerse en contacto con millones
de electores antes de una elección.
La toma de muestras para aprender algo sobre una población es
de uso frecuente en administración, agricultura, política y
acciones de gobierno, según lo muestran los siguientes
ejemplos:
• En una muestra de 800 televidentes que ven televisión a la hora
de mayor audiencia, 320, o 40%, señaló que vio American Idol en
Fox la semana pasada. Estos índices de audiencia se emplean
para establecer tarifas de publicidad o para suspender programas
• Una firma de contadores públicos, realiza una auditoría a
Jugueterías La Grande, para comenzar, la firma contable elige una
muestra aleatoria de 100 facturas y verifica la exactitud de cada
una de ellas. Por lo menos hay un error en cinco facturas; por
consiguiente, la firma de contadores calcula que 5% de la
población de facturas contiene al menos un error.
Errores en el Muestreo
Cuando se utilizan valores muéstrales, o estadísticos para
estimar valores poblacionales, o parámetros, pueden ocurrir dos
tipos generales de errores: el error muestral y el error no
muestral.
Los errores que surgen al tomar las muestras y que no pueden
clasificarse como errores muéstrales se denominan errores no
muéstrales. El sesgo de las muestras es un tipo de error no
muestral.
El sesgo muestral se refiere a una tendencia sistemática inherente
a un método de muestreo que da estimaciones de un parámetro
que son, en promedio, menores (sesgo negativo), o mayores
(sesgo positivo) que el parámetro real. El sesgo muestral puede
suprimirse, o minimizarse, usando la aleatorización
Aleatorización
La aleatorización se refiere a cualquier proceso de selección de
una muestra de la población en el que la selección es imparcial
o no está sesgada.
Una muestra elegida con procedimientos aleatorios se llama
muestra aleatoria.
Ventajas del método de muestreo
• Costo reducido: Si los datos se obtienen únicamente de una
pequeña fracción del total, los gastos son menores que los
que se realizarían en un censo.
• Mayor rapidez: Los datos pueden ser recolectados y
resumidos más rápidamente con una muestra que con un
censo.
• Mayor exactitud: Si el volumen de trabajo es reducido se
puede emplear personal capacitado al cual se le puede
someter a entrenamiento intensivo.
Tipos de muestreo
Existen dos tipos e muestreo: El probabilístico y el no
probabilístico.
Muestreo probabilístico
Todos los elementos de la población tienen la misma
probabilidad de ser elegidos. Los elementos muestrales tendrán
valores muy parecidos a los de la población, sus elementos son
seleccionados de forma aleatoria.
TIPOS DE MUESTREO PROBABILISTICO
La aleatorización nos garantiza seleccionar una muestra
representativa.
Muestreo aleatorio simple
Muestreo estratificado
Muestreo sistemático
MUESTRA ALEATORIA SIMPLE
Si una muestra aleatoria se elige de tal forma que todos los
elementos de la población tengan la misma probabilidad de ser
seleccionados, la llamamos muestra aleatoria simple
Las observaciones se realizan de forma independiente y al azar.
El propósito de seleccionar muestras aleatorias es obtener
información acerca de los parámetros conocidos de la población.
COMO OBTENER UN MUESTREO ALEATORIO SIMPLE
métodos de selección
Ejemplo: Suponga que nos interesa elegir una muestra aleatoria de 5
estudiantes en un grupo de Análisis Estadístico de 16 .
16C5 da el número total de formas de elegir una muestra no ordenada y este
resultado es 87,360 maneras diferentes de tomar la muestra.
Si listamos las 87,360 maneras en trozos separados de papel, una tarea
tremenda, luego los colocamos en un recipiente y después los revolvemos,
entonces podremos tener una muestra aleatoria de 5 si seleccionamos un
trozo de papel con cinco nombres. Un procedimiento más simple para elegir
una muestra aleatoria sería escribir cada uno de los 16 nombres en pedazos
separados de papel, colocarlos en un recipiente, revolverlos y después
extraer cinco papeles al mismo tiempo.
Otro método parea obtener una muestra aleatoria de 5
estudiantes en un grupo de 16 es utilizando una tabla de
números aleatorios. Se puede construir la tabla usando
una calculadora o una computadora.
También se puede hacer la tabla escribiendo diez dígitos del 0 al 9
en tiras de papel, las colocamos en un recipiente y los revolvemos,
de ahí, la primera tira seleccionada determina el primer número de
la tabla, se regresa al recipiente y después de revolver otra vez se
selecciona la segunda tira que determina el segundo número de la
tabla; el proceso continúa hasta obtener una tabla de dígitos
aleatorios con tantos números como se desee
Tabla de números aleatorios con Excel
Para ejemplificar el muestreo aleatorio simple y la selección,
suponga que una población consta de 845 empleados de
Supermercados Nacional, de la cual se va a elegir una muestra
de 52 empleados. Una forma de asegurarse de que todos los
empleados de la población tienen las mismas posibilidades de
que se les elija consiste en escribir primero el nombre de cada
empleado en un papel y depositarlos todos en una caja.
Después de mezclar todos los papeles, se efectúa la primera
selección tomando uno de la caja sin mirarlo. Se repite este
proceso hasta terminar de elegir la muestra de 52 empleados.
Un método más conveniente de seleccionar una muestra aleatoria consiste
en utilizar un número de identificación por cada empleado y una tabla de
números aleatorios. Como su nombre lo indica, estos números se
generaron mediante un proceso aleatorio (en este caso, con una
computadora). La probabilidad de 0, 1, 2, …, 9 es la misma
para cada dígito de un número. Por consiguiente, la probabilidad de que se
seleccione al empleado 011 es la misma que tienen los empleados 722 o
382. Cuando se emplean números aleatorios para seleccionar empleados,
se elimina la influencia o sesgo del proceso de selección.
Para seleccionar una muestra de empleados, elija primero un punto de
partida en la tabla; cualquier punto sirve. Ahora suponga que el reloj marca
las 3:04. Puede observar la tercera columna y en seguida desplazarse hacia
abajo hasta el cuarto conjunto de números. El número es 03759. Como sólo
hay 845 empleados, utilizará los tres primeros dígitos de un número
aleatorio de cinco dígitos. Por lo tanto, 037 es el número del primer
empleado que se convertirá en miembro de la muestra. Otra forma de elegir
el punto de partida consiste en cerrar los ojos y señalar un número de la
tabla. Para continuar, puede desplazarse en cualquier sentido. Suponga que
lo hace hacia la derecha. Los primeros tres dígitos del número a la derecha
de 03759 son 447, el número del siguiente empleado seleccionado para
integrar la muestra. El siguiente número de tres dígitos a la derecha es 961.
Omita 961, pues sólo hay 845 empleados. Continúe hacia la derecha y
seleccione al empleado 784; después el 189 y así en lo sucesivo..
.
MUESTREO ESTRATIFICADO
El muestreo estratificado es una técnica de muestreo
probabilístico en donde el investigador divide a toda la población
en diferentes subgrupos o estratos. Luego, selecciona
aleatoriamente a los sujetos finales de los diferentes estratos en
forma proporcional.
Ejemplo:
1) Suponga que nos interesa obtener una muestra de las
opiniones de los profesores del INTEC sobre las buenas
practicas Docentes. Puede ser difícil obtener una muestra con
todos los profesores, así que supongamos que elegimos una
muestra aleatoria de cada departamento académico; los
estratos vendrían a ser los departamentos académicos.
2) Si se va a investigar algún aspecto de la educación en el Distrito
Nacional, las universidades pueden considerarse estratos; luego
se puede seleccionar una muestra de cada estrato.
MUESTREO POR CONGLOMERADOS
σ(𝑥−𝜇)2
Desviación estándar poblacional: 𝜎 =
2
σ(𝑥Ԧ − 𝜇𝑥Ԧ )2 . 𝑓𝑖
𝜎𝑥Ԧ =
σ 𝑓𝑖
𝜎 2.236
𝜎𝑥Ԧ = = = 1.58
𝑛 2
Después de haber realizado el ejercicio anterior se puede ver que
una distribución muestral se genera extrayendo todas las posibles
muestras del mismo tamaño de la población y calculándoles a
éstas su estadístico.
Como para cualquier variable aleatoria, la distribución muestral de
medias tiene una media o valor esperado, una varianza y una
desviación estándar, se puede demostrar que la distribución
muestral de medias tiene una media igual a la media poblacional.
Esto es:
𝜇𝑋 = 𝐸 𝑥 = 𝜇
Una distribución muestral se genera extrayendo todas las posibles
muestras del mismo tamaño de la población y calculándoles a
éstas su estadístico. Si la población de la que se extraen las
muestras es normal, la distribución muestral de medias será normal
sin importar el tamaño de la muestra.
Si la población de donde se extraen las muestras no es normal,
entonces el tamaño de la muestra debe ser mayor o igual a 30,
para que la distribución muestral tenga una forma acampanada.
Mientras mayor sea el tamaño de la muestra, más cerca estará la
distribución muestral de ser normal. Para muchos propósitos, la
aproximación normal se considera buena si se cumple n=30. La
forma de la distribución muestral de medias sea aproximadamente
normal, aún en casos donde la población original es bimodal, es
realmente notable.
Ejemplo:
Para la distribución muestral de medias del ejercicio pasado,
encuentre:
a) El error muestral de cada media
b) La media de los errores muéstrales
c) c) La desviación estándar de los errores muéstrales.
La desviación estándar de la distribución muestral de un estadístico
se conoce como error estándar del estadístico. Para el ejercicio
anterior el error estándar de la media denotado por 𝜎𝑋 = 1.58 . Con
esto se puede demostrar que si de una población se eligen
muestras de tamaño n con reemplazo, entonces el error estándar
de la media es igual a la desviación estándar de la distribución de
los errores muestrales.
En general se tiene: 𝜎𝑋 = 𝜎𝑒
Cuando las muestras se toman de una población pequeña y sin
reemplazo, se puede usar la formula siguiente para encontrar 𝜎𝑋
𝜎 𝑁−𝑛
𝜎𝑋 =
𝑛 𝑁−1
donde :
𝜎 es la desviación estándar de la población de donde se toman las
muestras,
n es el tamaño de la muestra
N el tamaño de la población.
Como regla de cálculo, si el muestreo se hace sin reemplazo y el
tamaño de la población es al menos 20 veces el tamaño de la
muestra 𝑁 ≥ 20 entonces se puede usar la fórmula.
𝑁−𝑛
El factor se denomina factor de corrección para una
𝑁−1
población finita
Ejemplo:
Suponga que la tabla siguiente muestra la antigüedad en años en el
trabajo de tres profesores universitarios de Análisis Estadístico.
Maestro de Análisis Estadístico Antiguedad
A 6
B 4
C 2