Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diseño de muestreo: métodos para seleccionar la muestra, cuyo principal objetivo es que sea
representativa de la población bajo estudio; proporcionando así una cantidad especificada de información
a un costo mínimo (cuando la población es uniforme casi cualquier muestra produce resultados
aceptables).
La muestra debe ser aleatoria: toda combinación de ‘n’ mediciones tienen que tener la misma
probabilidad de ser seleccionada. De esta manera, es posible hacer afirmaciones de tipo probabilística
acerca de la población. En cambio, cuando es no aleatoria o determinista solo se pueden hacer
afirmaciones de tipo descriptivo.
Estadística inferencial: son los métodos usados para determinar algo acerca de la población basándose en
una muestra probabilística extraída de la misma.
La población objetivo es aquella de la cual deseamos hacer inferencias mientras que la población
muestreada es aquella de la que se selecciona realmente la muestra. No siempre son iguales. Las
conclusiones de una muestra sólo se aplican a la población muestreada. La población muestreada es
representativa de la población objetiva si han de ser válidas las inferencias a partir de una muestra. Antes
de muestrear se debe dividir a la población en unidades de muestreo. Se llama MARCO a una lista de las
unidades de muestreo de un estudio. Depende de la disponibilidad y la confiabilidad de una lista.
Probabilísticas:
• Muestra aleatoria simple o simple al azar: cada individuo o elemento de la población tiene la
misma probabilidad de ser seleccionado. Constituye la base para otras técnicas y conviene
aplicarlo en poblaciones homogéneas. Siempre se usa ‘n’ para el tamaño de la muestra y ‘N’ para
el de la población. La probabilidad de seleccionar a cualquier miembro en particular de la
población la primera vez es 1/N.
- Con reposición: implica que una vez seleccionada una persona o elemento, se regresa al marco,
donde tiene la probabilidad de ser elegido de nuevo.
- Sin reposición: no se regresa la persona o elemento al marco una vez seleccionado y, por lo tanto,
no puede elegirse otra vez.
La tabla de números aleatorios está formada por una serie de dígitos que se generan en forma aleatoria
y se colocan en la secuencia en que se generaron. Como el sistema numérico usa 10 dígitos, la
probabilidad de generar aleatoriamente un dígito es igual a la probabilidad de generar cualquier otro.
Esta probabilidad es de 1 a 10.
• Muestreo sistemático: se obtiene seleccionando un elemento cada k elementos donde k se obtiene
haciendo un cociente entre N y n. K=N/n (se redondea al entero más cercano). Para cualquier
muestra que se adquiere mediante muestreo aleatorio simple o sistemático, los datos obtenidos
pueden o no ser una buena representación de los parámetros de la población.
• Muestra estratificada: consiste en dividir la población en estratos a través de diferentes criterios:
demográficos (sexo), geográficos (zonas), socio-económicos (clase social). Todos los elementos
dentro de cada estrato deben ser lo más homogéneos posibles mientras que entre estratos deben
ser lo más heterogéneos posibles. Se utiliza mucho porque asegura que la población está bien
representada y es de bajo costo. Se realiza un muestreo aleatorio simple en cada estrato y después
se combinan los resultados de las muestras aleatorias separadas.
• Muestra conglomerada: se divide a la población en fracciones, radios, segmentos. Los
conglomerados deben ser heterogéneos dentro de ellos y similares entre ellos, sobre todo si la
población se encuentra esparcida en una vasta región geográfica. Sin embargo, necesitan una
muestra total más grande para obtener resultados muy precisos.
No probabilísticas:
• Muestreo por conveniencia: las unidades que forman la muestra se eligen por su accesibilidad. Es
de bajo costo pero puede o no producir buenos resultados, por lo que se debe tener cuidado al
hacer inferencias estadísticas sobre la población.
• Muestreo de juicio o por juicio: una persona conocedora del tema de estudio selecciona las
unidades de muestreo más representativas de la población, según su criterio. Quienes usan los
resultados de la encuesta deben reconocer que la calidad de los resultados depende del juicio de la
persona que define a la muestra.
• Por cuotas: se seleccionan sabiendo que tipos de características tienen las personas.
Error de muestreo: magnitud de la diferencia entre el estimador puntual obtenido con la muestra y el
parámetro poblacional; es aquel que se presenta por no encuestar a cada elemento de la población. El
error de muestreo surge de encuestar a una muestra y no el total de la población
Error ajeno al muestreo o error de no muestreo: se refiere a los demás tipos de errores que se pueden
presentar al hacer una encuesta. Los más comunes son:
- Medir la característica de interés en forma incorrecta.
- Errores por falta de respuestas: deben preocupar tanto al responsable de diseñar la encuesta como
a quien usa los resultados. Se presenta cuando no se pueden obtener datos para algunas de las
unidades encuestadas o cuando sólo se obtienen datos parciales.
- Errores por falta de conocimientos del encuestado: comunes en encuestas técnicas.
- Error de selección: cuando en la encuesta se incluye un elemento inadecuado.
- Error de procesamiento: se presenta si los datos se anotan en forma incorrecta o se transfieren mal
de las formas de registro.
El informe final de una encuesta debe mencionar el impacto probable de los errores ajenos al muestreo en
los resultados.
El error ajeno al muestreo se puede minimizar con un buen adiestramiento del encuestador, buen diseño
del cuestionario, ensayos previos y con una administración cuidadosa del proceso de codificación y
captura de los datos en computadora.
UNIDAD 6: Distribuciones muestrales.
Muestreo aleatorio simple: se presenta cuando se extrae una muestra de tamaño ‘n’ de una población de
tamaño N, de manera tal que toda muestra posible de tamaño ‘n’ tenga la misma probabilidad de ser
seleccionada. Existen dos tipos de muestreos probabilístico y no probabilístico, donde sólo se considera el
primero ya que existen procedimientos seguros que permiten inferir. Las muestras pueden ser con
reemplazo (todo miembro de la población está disponible en cada extracción) o sin reemplazo.
Muestra probabilística: es aquella extraída de una población de manera tal que todo miembro de la
misma tenga una probabilidad conocida de ser incluido en la muestra.
Distribución muestral: es la distribución de todos los valores posibles que pueden ser tomados por alguna
estadística, calculados a partir de muestras del mismo tamaño extraídas aleatoriamente de la misma
población.
La media de la distribución muestral de x tiene el mismo valor que la media de al población original.
Cuando se extraen sin reemplazo muestras de tamaño n a partir de una población finita de tamaño N y se
ignora el orden en el que se extrajeron los valores muestra, el número de muestras posibles está dado por
la combinación de N cosas tomadas de n.
Cuando se muestrea sin reemplazo una población finita, la distribución muestral de x tendrá media u y
variancia:
Si el tamaño de la muestra es grande se aplica el teorema central del límite y la distribución muestral de x
estará distribuida aproximadamente en forma normal.
El factor (N-n)/(N-1) se llama corrección por población finita y puede ignorarse cuando el tamaño de la
muestra es pequeño en comparación con el de la población. Cuando la población es mucho más grande
que la muestra, la diferencia entre la variancia y la variancia corregida será despreciable.
La corrección por población finita no se utiliza cuando la muestra contiene menos del 5 por ciento de las
observaciones en la población. Por definición, una población distribuida normalmente es una población
infinita, de modo que cuando el muestreo es de una población distribuida normalmente, no es necesaria la
corrección por población finita.
El objetivo de la estadística es hacer inferencias acerca de una población con base en la información
contenida en una muestra. La población se caracteriza por medidas descriptivas numéricas llamadas
parámetros, la inferencia estadística se ocupa de hacer inferencias acerca de los parámetros de una
población. Parámetros típicos de una población son la media, la desviación estándar.
Un estimador es la regla o procedimiento generalmente expresado como fórmula, que se utiliza para
obtener la estimación. Una estimación es el resultado numérico del estimador.
Una estimación por intervalo especifica el rango dentro del cual está el parámetro desconocido. Tal
intervalo con frecuencia va acompañado de una afirmación sobre el nivel de confianza que se da en
exactitud. Por tanto se denomina intervalo de confianza.
Un estimador puntual utiliza un número único o valor para localizar una estimación del parámetro. Un
intervalo de confianza denota un rango dentro del cual puede encontrarse el parámetro, y el nivel de
confianza que el intervalo contiene en el parámetro.
Hay tres niveles de confianza: 99% 95% y 90%.
Las estimaciones por intervalo gozan de ciertas ventajas sobre las puntuales debido a que el error de
muestreo probablemente x no será igual a u.
Coeficiente de confianza: es el nivel de confianza que se tiene en el que el intervalo contenga el valor
desconocido del parámetro.
Valor alfa: es la probabilidad de error o la probabilidad de que un intervalo dado no contenga la media
poblacional desconocida.
Incremento del tamaño muestral: Incrementando el tamaño muestral se puede reducir el error estándar.
Donde:
p es la proporción muestral.
z es el valor z del grado de confianza seleccionado.
n es el tamaño de la muestra.