Distribuciones muestrales • Las distribuciones de probabilidad sirven para dos propósitos: 1. Permiten responder a preguntas de probabilidad acerca de estadísticas muestrales. 2. Proporciona la teoría necesaria para hacer válidos los procedimientos de inferencias estadística. Distribuciones muéstrales • La distribución de todos los valores posibles que puede asumir una estadística, calculados a partir de muestras del mismo tamaño, seleccionadas aleatoriamente de la misma población, se llama distribución muestral de esa estadística. Distribuciones muéstrales 1. Una población finita de tamaño N, se extraen de manera aleatoria todas las muestras posibles de tamaño n. 2. Se calcula la estadística de interés para cada muestra. 3. Se ordenan en una columna los distintos valores observados de la estadística y, en otra columna, las frecuencias de ocurrencia correspondientes de cada valor observado. Características importantes • Para una distribución muestral se tiene interés en conocer tres cosas: • Media • Varianza • Forma funcional Muestreo a partir de poblaciones que siguen la distribución normal Teorema del límite central • Cuando el muestreo se realiza a partir de muestras que no siguen una distribución normal, se utiliza el Teorema del límite central. • Dada una población de cualquier forma funcional no normal, con una media µ y varianza finita σ², la distribución muestral de , calculada a partir de muestras de tamaño n de dicha población, será casi normal con media µ y σ²/n cuando la muestra es muy grande. Teorema del límite central • Sin importar la distribución de la población las medias muestrales tienen una distribución normal. • La media de la media muestra coincide con la media poblacional. • La varianza de las medias muestrales, esta relacionada con la varianza de la media poblacional. • A mayor n la variabilidad disminuye, si no se tiene la varianza, se puede decir que la varianza muestral es igual a la varianza poblacional Distribución aproximadamente normal • Se debe cumplir uno de los siguientes aspectos: 1. Cuando se hace el muestreo a partir de una población con distribución normal. 2. Cuando se hace un muestreo a partir de una población que no exhibe una distribución normal y la muestra es grande. 3. Cuando se hace el muestreo a partir de una población cuya forma funcional se desconoce, siempre que el tamaño de la muestra sea grande. Nota: El tamaño de la muestra depende de la condición de no- normalidad en la población. Una regla empírica establece que en la mayoría de situaciones un n de tamaño 30 es suficiente (NO SIEMPRE). Al final la muestra debe ser lo más grande posible. Distribuciones muéstrales • Qué tantas muestras se pueden tomar a partir de una población finita: Determinar probabilidades de distribución Ejemplo • Se tiene una población grande de seres humanos, la dimensión del diámetro craneal sigue una distribución aproximadamente normal, con una media de 185.6 mm y una desviación estándar de 12.7 mm ¿Cuál es la probabilidad de que una muestra aleatoria de tamaño 10 de esta población tenga una media mayor de 190 mm? Distribución de diferencia entre las medias de dos muestras • Se tiene interés en dos poblaciones, es decir determinar si dos medias poblacionales son diferentes. • También se puede establecer la magnitud de la diferencia entre dichas medias. • Puede ser el objetivo de una investigación establecer, dichas diferencias. Diferencia de la media de dos muestras Ejemplos • Se estableció que para cierto tipo de pacientes el tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviación estándar de 15 minutos, y para un segundo tipo de paciente, el promedio de visita domiciliaria es de 30 minutos con una desviación estándar de 20 minutos. Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo. ¿Cuál es a probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos o más? Ejemplos • Dadas dos poblaciones con distribución normal, con medias iguales y varianzas de σ² = 100 y σ² = 80. ¿Cuál es la probabilidad de que dos muestras de tamaño n1 = 25 y n2= 16, proporcionen un valor de X1 – X2 = 8? Distribución de la proporción de la muestra • Se utiliza cuando si se tiene interés en la distribución muestral estadística, como la proporción de muestras, que resulta de los datos de conteo o frecuencias. • La distribución muestral de la proporción de la muestra se puede obtener experimentalmente de la misma forma que se sugiere en el caso de la media o diferencia entre dos medias. Distribución de la proporción de la muestra • Cuando la muestra es grande, la distribución de las proporciones de la muestra es aproximadamente normal, en virtud del teorema del límite central. • Para que se considere una muestra los suficientemente grande, para poder aplicar la aproximación normal, np y n(1 - p) deben ser mayores que 5. Ejemplo • En una población de mujeres, 90% de quienes comienzan su tercer trimestre de embarazo han tenido algún cuidado prenatal. Si se extra de esta población una muestra aleatoria de tamaño 200, ¿cuál es la probabilidad de que la proporción de la muestra de las mujeres que han tenido algún cuidado prenatal sea menor que 0.85? Ejemplo • Una muestra del Centro Nacional para la Estadística en salud encontró que 33.2 porciento de las mujeres de 40 años de edad o más se practicó un examen de pecho durante el año anterior. Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa población, ¿Cuál es la probabilidad de que la proporción de la muestra de mujeres a las que se les practico el examen durante el año anterior este entre 0.28 y 0.38? Distribución de la diferencia entre las proporciones de dos muestras • Si se extraen muestras aleatorias independientes de tamaños n1 y n2 de dos poblaciones de variables bionomiales donde las proporciones de las observaciones con la característica de interés en las dos poblaciones son, respectivamente p1 y p2, la distribución de la diferencia entre las proporciones de la muestra ṗ - ṗ, es casi normal con:
• Cuando n1 y n2 son grandes.
Distribución de la diferencia entre las proporciones de dos muestras • Ejemplo: • Supóngase que la proporción de personas que consumen, moderada o intensamente, drogas ilegales de una población, grupo 1, es de 0.50, mientras que en otra población, grupo 2, la proporción es de 0.33. • ¿Cuál es la probabilidad de que muestras tamaño 100, estraídas de cada una de las poblaciones, tengan un valor de ṗ1 - ṗ2, tan grande como 0.30?