Está en la página 1de 7

MÉTODOS ESTADÍSTICOS

UNIDAD 5: Métodos de selección de muestreo.

Diseño de muestreo: métodos para seleccionar la muestra, cuyo principal objetivo es que sea
representativa de la población bajo estudio; proporcionando así una cantidad especificada de información
a un costo mínimo (cuando la población es uniforme casi cualquier muestra produce resultados
aceptables).

Censo: registro de cada elemento de la población.

Ventajas del muestreo:


- Económicas y prácticas.
- Proporciona resultados más oportunos: obtención rápida de información en un proceso variable.
- Es útil sobretodo cuando los datos se obtienen con la destrucción de los elementos.
- A veces proporciona resultados más exactos que un censo debido a la fatiga de los investigadores
de los mismos y cuando la población es tan dinámica y ‘no permite tiempo suficiente para medir
sus características’.

La muestra debe ser aleatoria: toda combinación de ‘n’ mediciones tienen que tener la misma
probabilidad de ser seleccionada. De esta manera, es posible hacer afirmaciones de tipo probabilística
acerca de la población. En cambio, cuando es no aleatoria o determinista solo se pueden hacer
afirmaciones de tipo descriptivo.

Razones por las que el muestreo es necesario:


1) El costo de estudiar a todos los integrantes de la población con frecuencia es prohibitivo.
2) La idoneidad de los resultados de la muestra: muchas veces no se justifica el costo por un poco
más de precisión.
3) Ponerse en contacto con toda la población supondría mucho tiempo.
4) La naturaleza destructiva de ciertas pruebas: usando la población para verificar no quedaría nada
para vender en el caso de los productos de venta.
5) La imposibilidad física de verificar todos los elementos de la población que generalmente están en
constante movimiento.

Estadística inferencial: son los métodos usados para determinar algo acerca de la población basándose en
una muestra probabilística extraída de la misma.

Población: conjunto de todos los posibles individuos, objetos o mediciones de interés.

Muestra: subconjunto de la población de interés.

Elemento: entidad acerca de la cual se reúnen datos.

La población objetivo es aquella de la cual deseamos hacer inferencias mientras que la población
muestreada es aquella de la que se selecciona realmente la muestra. No siempre son iguales. Las
conclusiones de una muestra sólo se aplican a la población muestreada. La población muestreada es
representativa de la población objetiva si han de ser válidas las inferencias a partir de una muestra. Antes
de muestrear se debe dividir a la población en unidades de muestreo. Se llama MARCO a una lista de las
unidades de muestreo de un estudio. Depende de la disponibilidad y la confiabilidad de una lista.

Tipos de encuestas y métodos de muestreo:


Los tipos de encuestas más comunes son por correo, teléfono y en forma personal que implican diseñar y
aplicar un cuestionario. También hay otras encuestas que no lo requieren como llevar el inventario de una
empresa mediante un conteo. Los cuestionarios no deben ser largos y deben estar cuidadosamente
redactados y organizados.
También las encuestas pueden ser con muestreo probabilística (se puede calcular la probabilidad de
obtener cada muestra posible) o con un muestreo no probabilístico (esa probabilidad se desconoce, en una
muestra probabilística los elementos incluidos se eligen sin tomar en cuenta su probabilidad de
ocurrencia, son de bajo costo y facultad de instrumentación. Desventajas: falta de precisión debido al
sesgo en la selección y de capacidad para generalizar los resultados).

Probabilísticas:
• Muestra aleatoria simple o simple al azar: cada individuo o elemento de la población tiene la
misma probabilidad de ser seleccionado. Constituye la base para otras técnicas y conviene
aplicarlo en poblaciones homogéneas. Siempre se usa ‘n’ para el tamaño de la muestra y ‘N’ para
el de la población. La probabilidad de seleccionar a cualquier miembro en particular de la
población la primera vez es 1/N.
- Con reposición: implica que una vez seleccionada una persona o elemento, se regresa al marco,
donde tiene la probabilidad de ser elegido de nuevo.
- Sin reposición: no se regresa la persona o elemento al marco una vez seleccionado y, por lo tanto,
no puede elegirse otra vez.
La tabla de números aleatorios está formada por una serie de dígitos que se generan en forma aleatoria
y se colocan en la secuencia en que se generaron. Como el sistema numérico usa 10 dígitos, la
probabilidad de generar aleatoriamente un dígito es igual a la probabilidad de generar cualquier otro.
Esta probabilidad es de 1 a 10.
• Muestreo sistemático: se obtiene seleccionando un elemento cada k elementos donde k se obtiene
haciendo un cociente entre N y n. K=N/n (se redondea al entero más cercano). Para cualquier
muestra que se adquiere mediante muestreo aleatorio simple o sistemático, los datos obtenidos
pueden o no ser una buena representación de los parámetros de la población.
• Muestra estratificada: consiste en dividir la población en estratos a través de diferentes criterios:
demográficos (sexo), geográficos (zonas), socio-económicos (clase social). Todos los elementos
dentro de cada estrato deben ser lo más homogéneos posibles mientras que entre estratos deben
ser lo más heterogéneos posibles. Se utiliza mucho porque asegura que la población está bien
representada y es de bajo costo. Se realiza un muestreo aleatorio simple en cada estrato y después
se combinan los resultados de las muestras aleatorias separadas.
• Muestra conglomerada: se divide a la población en fracciones, radios, segmentos. Los
conglomerados deben ser heterogéneos dentro de ellos y similares entre ellos, sobre todo si la
población se encuentra esparcida en una vasta región geográfica. Sin embargo, necesitan una
muestra total más grande para obtener resultados muy precisos.

No probabilísticas:
• Muestreo por conveniencia: las unidades que forman la muestra se eligen por su accesibilidad. Es
de bajo costo pero puede o no producir buenos resultados, por lo que se debe tener cuidado al
hacer inferencias estadísticas sobre la población.
• Muestreo de juicio o por juicio: una persona conocedora del tema de estudio selecciona las
unidades de muestreo más representativas de la población, según su criterio. Quienes usan los
resultados de la encuesta deben reconocer que la calidad de los resultados depende del juicio de la
persona que define a la muestra.
• Por cuotas: se seleccionan sabiendo que tipos de características tienen las personas.

Error de muestreo: magnitud de la diferencia entre el estimador puntual obtenido con la muestra y el
parámetro poblacional; es aquel que se presenta por no encuestar a cada elemento de la población. El
error de muestreo surge de encuestar a una muestra y no el total de la población

Error ajeno al muestreo o error de no muestreo: se refiere a los demás tipos de errores que se pueden
presentar al hacer una encuesta. Los más comunes son:
- Medir la característica de interés en forma incorrecta.
- Errores por falta de respuestas: deben preocupar tanto al responsable de diseñar la encuesta como
a quien usa los resultados. Se presenta cuando no se pueden obtener datos para algunas de las
unidades encuestadas o cuando sólo se obtienen datos parciales.
- Errores por falta de conocimientos del encuestado: comunes en encuestas técnicas.
- Error de selección: cuando en la encuesta se incluye un elemento inadecuado.
- Error de procesamiento: se presenta si los datos se anotan en forma incorrecta o se transfieren mal
de las formas de registro.
El informe final de una encuesta debe mencionar el impacto probable de los errores ajenos al muestreo en
los resultados.
El error ajeno al muestreo se puede minimizar con un buen adiestramiento del encuestador, buen diseño
del cuestionario, ensayos previos y con una administración cuidadosa del proceso de codificación y
captura de los datos en computadora.
UNIDAD 6: Distribuciones muestrales.

Muestreo aleatorio simple: se presenta cuando se extrae una muestra de tamaño ‘n’ de una población de
tamaño N, de manera tal que toda muestra posible de tamaño ‘n’ tenga la misma probabilidad de ser
seleccionada. Existen dos tipos de muestreos probabilístico y no probabilístico, donde sólo se considera el
primero ya que existen procedimientos seguros que permiten inferir. Las muestras pueden ser con
reemplazo (todo miembro de la población está disponible en cada extracción) o sin reemplazo.

Muestra probabilística: es aquella extraída de una población de manera tal que todo miembro de la
misma tenga una probabilidad conocida de ser incluido en la muestra.

Distribución muestral: es la distribución de todos los valores posibles que pueden ser tomados por alguna
estadística, calculados a partir de muestras del mismo tamaño extraídas aleatoriamente de la misma
población.

Pasos para construir una distribución muestral:


1) De una población finita, discreta, de tamaño N, se extraen aleatoriamente todas las muestras
posibles de tamaño n.
2) Se calcula la estadística de interés para cada muestra.
3) Se enumeran en una columna, la frecuencia correspondiente de la ocurrencia de cada uno de esos
valores.
Se tiene interés en conocer tres cosas acerca de una distribución muestral dada: su media, su variancia y
su forma funcional (gráfica).
Construir esta distribución puede ser dificultoso cuando la población es de tamaño apreciable o cuando la
variable es continua, y lo mejor que puede hacerse es aproximar la distribución muestral de una
estadística.

Distribución muestral de la media:


Cuando el muestreo es con reemplazo, o se trata de una población infinita, el número de muestras
posibles es igual a N elevado a la n.

La media de la distribución muestral de x tiene el mismo valor que la media de al población original.

La variancia de la distribución muestral no es igual a la variancia de la población. La variancia de la


distribución muestral es igual a la variancia de la población, dividida entre el tamaño de la muestra usado
para obtener la distribución muestral.

El error estándar es la raíz cuadrada de la variancia de la distribución muestral.

Cuando el muestreo es a partir de una población distribuida normalmente, la distribución de la media de


la muestra poseerá las propiedades siguientes:
1) La distribución de x será normal.
2) La media, ux, de la distribución de x será igual a la media de la población de la cual se extrajeron
las muestras.
3) La variancia, , de la distribución de x será igual a la variancia de la población dividida por el
tamaño de la muestra.
Cuando el muestreo es a partir de una población no distribuida normalmente, nos referiremos al Teorema
central del límite.

Teorema central del límite: se utiliza cuando no conozco la distribución de la población o se


positivamente que no se distribuye en forma normal, aumentando suficientemente el tamaño de la
muestra, x se va a seguir distribuyendo con media u y desvío , nos preguntamos cuando n es
suficientemente grande: cuando es mayor a 30.

Cuando se extraen sin reemplazo muestras de tamaño n a partir de una población finita de tamaño N y se
ignora el orden en el que se extrajeron los valores muestra, el número de muestras posibles está dado por
la combinación de N cosas tomadas de n.

La media de la distribución muestral es igual a la media de la población

La variancia de la distribución muestral no es igual a la variancia de la población dividida por el tamaño


de la muestra. No obstante, si se multiplica la variancia de la distribución muestral, que se obtendría si el
muestreo fuera con reemplazo, por el factor (N-n)/(N-1), se obtiene el valor de la variancia de la
distribución muestral que resulta cuando se lleva a cabo éste con reemplazo.

Cuando se muestrea sin reemplazo una población finita, la distribución muestral de x tendrá media u y
variancia:

Si el tamaño de la muestra es grande se aplica el teorema central del límite y la distribución muestral de x
estará distribuida aproximadamente en forma normal.
El factor (N-n)/(N-1) se llama corrección por población finita y puede ignorarse cuando el tamaño de la
muestra es pequeño en comparación con el de la población. Cuando la población es mucho más grande
que la muestra, la diferencia entre la variancia y la variancia corregida será despreciable.
La corrección por población finita no se utiliza cuando la muestra contiene menos del 5 por ciento de las
observaciones en la población. Por definición, una población distribuida normalmente es una población
infinita, de modo que cuando el muestreo es de una población distribuida normalmente, no es necesaria la
corrección por población finita.

Distribución muestral de la proporción de la muestra:


De la población que se supone infinita, se tomarían todas las muestras posibles de un tamaño dado y, para
cada muestra, se calcularía la proporción de la muestra: p. Entonces se prepararía una distribución de
frecuencias de p.
UNIDAD 7: Estimación de parámetros.

El objetivo de la estadística es hacer inferencias acerca de una población con base en la información
contenida en una muestra. La población se caracteriza por medidas descriptivas numéricas llamadas
parámetros, la inferencia estadística se ocupa de hacer inferencias acerca de los parámetros de una
población. Parámetros típicos de una población son la media, la desviación estándar.
Un estimador es la regla o procedimiento generalmente expresado como fórmula, que se utiliza para
obtener la estimación. Una estimación es el resultado numérico del estimador.
Una estimación por intervalo especifica el rango dentro del cual está el parámetro desconocido. Tal
intervalo con frecuencia va acompañado de una afirmación sobre el nivel de confianza que se da en
exactitud. Por tanto se denomina intervalo de confianza.
Un estimador puntual utiliza un número único o valor para localizar una estimación del parámetro. Un
intervalo de confianza denota un rango dentro del cual puede encontrarse el parámetro, y el nivel de
confianza que el intervalo contiene en el parámetro.
Hay tres niveles de confianza: 99% 95% y 90%.
Las estimaciones por intervalo gozan de ciertas ventajas sobre las puntuales debido a que el error de
muestreo probablemente x no será igual a u.

Propiedades de los estimadores:


1) Estimador insesgado: es insesgado si la media de su distribución muestral es igual al parámetro
correspondiente.
2) Estimador eficiente: es aquel que tenga la varianza más pequeña.
3) Estimador consistente: si a medida que aumenta el tamaño de la muestra su valor se aproxima al
valor del parámetro.
4) Estimador suficiente: es suficiente si ningún otro estimador puede proporcionar más información
sobre el parámetro.

El fundamento de un intervalo de confianza:


Un intervalo de confianza tiene un límite inferior de confianza (LIC) y un límite superior de confianza
(LSC). Estos límites se hallan calculando primero la media muestral x. luego se suma cierta cantidad a x
para obtener el LSC y la misma cantidad se resta de x para obtener el LIC. La determinación de dicha
cantidad es el tema a averiguar. Si se desea construir un intervalo más convencional del 95%. Se debe
dividir 95 por dos produciendo 0.475. Luego se halla el valor de Z correspondiente a un área de 0.475 el
cual es Z=1.96. Así, para construir un intervalo de confianza del 95%, simplemente se especifica un
intervalo de 1.96 errores estándar por encima y por debajo de la media muestral. Este valor del 95% es
llamado coeficiente de confianza.

Coeficiente de confianza: es el nivel de confianza que se tiene en el que el intervalo contenga el valor
desconocido del parámetro.

Intervalo de confianza para la media poblacional-muestras grandes:


Uno de los usos más comunes de los intervalos de confianza es estimar la media poblacional.

Valor alfa: es la probabilidad de error o la probabilidad de que un intervalo dado no contenga la media
poblacional desconocida.

Intervalo de confianza cuando o es desconocida:

Intervalo de confianza para la media en el caso de muestras pequeñas- la distribución t


Se utiliza cuando la muestra es pequeña, cuando o es desconocida, y la población es normal o casi
normal.
Reducción del nivel de confianza: Para reducir el intervalo sin sufrir una pérdida de confianza hay que
incrementar el tamaño muestral.

Incremento del tamaño muestral: Incrementando el tamaño muestral se puede reducir el error estándar.

Determinación del tamaño apropiado de la muestra:


Una vez que se ha seleccionado el nivel de confianza, dos factores importantes influyen en el tamaño
muestral. Primero la varianza de la población o2 y segundo el tamaño del error tolerable. El primer factor
está más allá del control del investigador, si es posible limitar el tamaño del error. El tamaño del error
depende de qué tan crítico es el trabajo. Algunas tareas requieren de resultados exactos. En otros casos,
los errores pueden tener consecuencias menos graves. Todo intervalo dado es dos veces el error tolerable.

Intervalo de confianza para una proporción de la población:


Intervalo de confianza:

Donde:
p es la proporción muestral.
z es el valor z del grado de confianza seleccionado.
n es el tamaño de la muestra.

MATERIAL APORTADO POR: DANIELA RAMOS

También podría gustarte