Está en la página 1de 9

Segundo Parcial Probabilidad y Estadística

Muestreo

¿Qué es el muestreo?

Es una herramienta de la investigación científica para obtener una muestra a partir de cierta
población. Obviamente el tamaño “n” de la muestra debe ser menor que el tamaño “N” de la
población.

Tipos de muestreo:

- Muestreo no probabilístico: Solo para estudios exploratorios y las conclusiones son


solo para las muestras
- Muestreo probabilístico: Estos muestreos aleatorios permiten generalizaciones para
toda la población

Razones para el muestreo:

• Costo

• Tiempo

• Pruebas destructivas

Métodos para seleccionar muestras:

•Muestreo irrestricto aleatorio: También llamado muestreo aleatorio simple. Es considerado


el método más sencillo. Mediante una tabla de números al azar o alguna otra herramienta
aleatoria se eligen los datos que se quieren muestrear.

•Muestreo aleatorio sistemático: Es un tipo de muestreo probabilístico donde se hace una


selección aleatoria del primer elemento para la muestra, y luego se seleccionan los elementos
posteriores utilizando intervalos fijos o sistemáticos hasta alcanzar el tamaño de la muestra
deseado.

¿Cómo se utiliza?

Calcular el intervalo de muestreo (k) dividiendo el número de elementos en el marco de


muestreo (N) por el tamaño de la muestra específica (n). 𝐾 = 𝑁 / 𝑛

•Muestreo aleatorio estratificado: Una muestra aleatoria estratificada es la obtenida mediante


la separación de los elementos de la población, en grupos o estratos. Esos elementos son
homogéneos dentro del grupo y heterogéneos entre los grupos.
Ejemplo:

•Muestreo por conglomerados: Es un muestreo en el cual nosotros dividimos la población en


conglomerados. Estos son lo contrario a los estratos. Son heterogéneos internamente y
homogéneos entre los conglomerados, es decir, nosotros vamos a separar a la población en
grupos, y que cada uno de los grupos representan a toda la población.

Distribuciones de muestreo

¿Qué es?

Una distribución de muestreo es la distribución de probabilidad de un estadístico dado, como


la media.

Distribución de la media muestral

¿Qué es?

Es una distribución de probabilidades de todas las medias de las muestras de un determinado


tamaño de una población.
Teorema Central del Límite: la distribución de la media de una muestra aleatoria proveniente
de una población que puede no ser normal sigue aproximadamente una distribución normal
siempre que el tamaño de la muestra sea lo suficientemente grande (>30).

•Distribución de la proporción muestral:

Proporción (p;P): Es el número de observaciones con una característica en particular entre la


población o muestra de referencia. El numerador siempre está incluido en el denominador.
Ejemplo: si hay 50 alumnos y 20 son mujeres decimos que la proporción es igual al 40%

Probabilidad es la posibilidad de que ocurra en el futuro y proporción es la parte que existe


actualmente.

¿Cómo se hace?

Esta distribución se genera de igual manera que la distribución muestral de medias, a


excepción de que, al extraer las muestras de la población, se calcula el estadístico proporción
(p=x/n en donde "x" es el número de éxitos u observaciones de interés y "n" el tamaño de la
muestra), en lugar del estadístico promedio
Estimación de parámetros

¿Qué es?

La estadística inferencial es el proceso de uso de los resultados derivados de las muestras para
obtener conclusiones acerca de las características de una población. Un estimador θ es un
valor que puede calcularse a partir de los datos muéstrales y que proporciona información
sobre el valor del parámetro θ.

Propiedades de los estimadores

• Insesgabilidad: Se dice que un estimador es insesgado cuando la esperanza matemática de su


distribución en el muestreo coincide con el valor del parámetro. E(θ) = θ

• Eficiencia: Se dice que un estimador es eficiente u óptimo cuando su varianza es mínima.

• Consistencia: El estimador θ se acerca al parámetro θ a medida que crece el tamaño de la


muestra, si el tamaño muestral “n” tiende a infinito el estimador es insesgado y de varianza
cero.

• Suficiencia: Un estimador es suficiente cuando incluye toda la información relevante de la


muestra, de forma que ningún otro estimador puede considerar información adicional.

• Invariabilidad: Un estimador es invariable cuando si transformamos el parámetro a estimar


mediante una función f(θ), dicha función puede ser estimada por la función del estimador f(θ).

• Robustez: Un estimador es robusto cuando si se vulnera alguno de los supuestos en los que
se basa el proceso de estimación, la estimación no cambia significativamente y sigue
ofreciendo resultados fiables.

Existen dos tipos de estimaciones usadas para estimar los parámetros de la población:

- Estimación puntual: consiste en la estimación del valor del parámetro mediante un


sólo valor, obtenido de una fórmula determinada
- Estimación por intervalos: una estimación del intervalo de confianza es un rango de
números, llamado intervalo, construido alrededor de la estimación puntual. La
estimación por intervalos consiste en establecer el intervalo de valores donde es más
probable se encuentre el parámetro.

El intervalo de confianza se construye de manera que la probabilidad del parámetro de la


población se localice en algún lugar dentro del intervalo conocido
Distribución t de student

Es una distribución de probabilidad que surge del problema de estimar la media de una
población normalmente distribuida cuando el tamaño de la muestra es pequeño.

• Continua

• Simétrica

• Cambia para cada grado de libertad

• A medida que aumentan los grados de libertad tiende a Z

Grados de libertad

¿Qué son?

Son los valores que yo puedo dejar libre y seguir llegando al resultado
Pruebas de hipótesis

¿Qué es?

Es un procedimiento estadístico que permite aceptar o rechazar una afirmación hecha con
respecto a un fenómeno o suceso.

Etapas en una prueba de hipótesis

1. Formular la hipótesis nula y alternativa

2. Especificar el nivel de significación (α), el nivel de significancia, también denotado como


alfa o α, es la probabilidad de rechazar la hipótesis nula cuando es verdadera. Por ejemplo,
un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una
diferencia cuando en realidad no hay ninguna diferencia

3. Obtener el resto de los datos y con eso determinar el estadístico

4. Establecer los valores críticos que dividen las regiones de rechazo y de no rechazo
5. Calcular el valor del estadístico apropiado y determinar si el estadístico ha caído en la
región de rechazo o en la región de no rechazo y tomar la decisión estadística

6. Expresar la decisión estadística en términos del problema

También podría gustarte