Está en la página 1de 36

MODULO III

Lic. Mario Santiago Zetina


Distribuciones muestrales
Media muestral

Es la distribución que resulta de calcular la media muestral de cada


muestra posible de una población.

En estadística, la distribución muestral de la media sirve para calcular


la probabilidad que se tiene de acercarse al valor de la media de la
población al analizar una sola muestra.
¿Cómo calcular la media
muestral?
• Dada una población que sigue una
distribución de probabilidad normal de
media µ muy desviación estándar σ y se
extraen de ella muestras de tamaño n.
• La distribución muestral de la media
también estará definida por una
distribución normal con las siguientes
características.
• Si la población no sigue una
distribución normal pero el tamaño
muestral es grande (n>30), la
distribución muestral de la media
también se puede aproximar a la
distribución normal anterior por el
teorema central del límite.
• Por tanto, si la distribución
muestral de la media sigue una
distribución normal, la fórmula
para calcular cualquier
probabilidad relacionada con la
media de una muestra es la
siguiente:
Ejemplo 1
El peso de los estudiantes de una universidad sigue una distribución normal de
media 68 kg y desviación estándar 9 kg. Determina:
a. ¿Cuál es la probabilidad de que la media de una muestra aleatoria de 25 alumnos esté
por debajo de 66 kg?
b. Si se extraen 300 muestras con un tamaño de 25 alumnos cada una, ¿cuántas medias
muestrales tendrán un valor por debajo de 66 kg?
Ejemplo 2
La Escuela de Ciencias Médicas de la Universidad Mariano Gálvez tiene 800 alumnos recién egresados de Bachiller en Ciencias y Letras.
El departamento de Registro y Estadística emitió un informe sobre la calificación promedio de los estudiantes que ingresaron en el
último año de secundario, donde se evidencia que la calificación tiene una distribución aproximada normal de media 3.5 y desviación
estándar de 2.5.
Si tomamos una muestra de 40 alumnos ¿Cuál es la probabilidad de que el promedio de calificaciones sea menor de 2.8?
Varianza y error estándar

La varianza de las medias


muestrales es igual a la varianza
poblacional dividida por n. En
consecuencia, la desviación
estándar de las medias muestrales
(llamada también el error estándar
de la media muestral), es igual a la
deviación estándar poblacional
dividida por la raíz cuadrada de n.
Teorema del Límite Central
• El teorema de límite central declara que, sin importar la distribución, la
suma de todas las variables aleatorias generadas va a tender a una
distribución normal o gaussiana.
• Bajo este teorema las variables estudiadas no necesitan ser
obligatoriamente normales, pudiendo trabajar con cualquier tipo, y
obteniendo un resultado con esta misma distribución.
• Es necesario que el tamaño de la muestra sea grande, utilizando un
número grande de variables. Al realizar la suma de todas estas, se asegura
que el teorema se cumple, si y solo si es igual a una distribución de Gauss.
• En la definición de esta teoría, se habla de número de variables grandes.
Esto se debe a que, en su definición, se dice que n tiende a infinito.
El teorema central del límite
afirma que la media muestral se
acercará al valor de la media
poblacional a medida que
aumenta el tamaño de la
muestra. Esto nos permite
aproximar los parámetros de la
población estadística.
Ejemplo 1
Una empresa comercializa unas piezas que sirven de recambio para algunos componentes de los juguetes, una pieza de
estas tiene de media un peso de 300 g y una desviación estándar de 50 g. Si un cliente ha pedido un lote de 100 piezas,
¿Cuál es la probabilidad de que la media de los pesos de las piezas del lote sea mayor que 305 g? ¿Cuál es la probabilidad
de que un lote de 100 piezas pese más de 31 kg?
Métodos de muestreo

Si una muestra no se
Es la forma en la que se selecciona aleatoriamente, es
selecciona a los miembros de probable que presente algún
la población que van a tipo de sesgo, y los datos
participar en el estudio. puedan no ser representativos
de la población.
Malas formas de hacer un muestreo

• Muestra de conveniencia: el investigador selecciona una muestra que está fácilmente


disponible de alguna manera no aleatoria. Ejemplo: un investigador encuesta a las
personas que caminan por la calle.
o La razón por la que probablemente es sesgada: la ubicación, la hora del día y otros
factores pueden producir una muestra sesgada de personas.
• Muestra de respuesta voluntaria: el investigador hace una solicitud a los miembros de
una población para que se unan a la muestra, y las personas deciden si participan o no.
Ejemplo: una presentadora de televisión pide a sus espectadores visitar su sitio web y
responder a una encuesta en línea.
o La razón por la que probablemente es sesgada: las personas que toman el tiempo
para responder tienden a tener opiniones claras similares a las del resto de la
población.
Buenas formas de hacer un muestreo

• Muestra aleatoria simple: cada miembro y conjunto de miembros tienen una probabilidad igual de
ser incluidos en la muestra. Se necesita usar la tecnología, generadores de números aleatorios, o
algún otro tipo de proceso de azar para obtener una muestra aleatoria simple.
o Las muestras aleatorias suelen ser bastante representativas ya que no favorecen a ciertos
miembros.
• Muestra aleatoria estratificada: primero se divide la población en grupos. La muestra general se
compone de algunos miembros de cada grupo. Los miembros de cada grupo se eligen al azar.
o Una muestra estratificada garantiza que todos los miembros de cada grupo estarán
representados en la muestra, por lo que este método es útil cuando queremos algunos
miembros de cada grupo.
• Muestra aleatoria por clústeres: primero se divide la población en grupos. La
muestra global consta de todos los miembros de algunos de los grupos. Los
grupos se seleccionan aleatoriamente.
• Un ejemplo de muestra por clústeres toma cada miembro de algunos grupos, así
que es bueno cuando cada grupo refleja a la población en su conjunto.
• Muestra aleatoria sistemática: se pone en cierto orden a los miembros de la
población. Se selecciona al azar un punto de partida y se elige a cada miembro
como parte de la muestra.
Indique a qué tipo de muestreo corresponde cada enunciado

1. Cada estudiante en una escuela tiene un número de identificación. Los consejeros tienen una
computadora que genera 50 números de identificación aleatoriamente, y a los estudiantes con esos
números se les pide participar en una encuesta.
2. Una inspectora ordena camisas y quiere revisar algunas para asegurarse que se imprimieron
correctamente. Ella selecciona aleatoriamente 2 de las 10 cajas de camisas y revisa cada camisa dentro
de esas 22 cajas.
3. Una escuela elige 3 atletas seleccionados aleatoriamente de cada uno de sus equipos deportivos para
participar en una encuesta sobre el atletismo en la escuela.
4. Mientras que los estudiantes están haciendo fila para las fotografías de la escuela, un maestro le
hace una encuesta a cada 10mo alumno.
Intervalos de confianza
• El intervalo de confianza describe la variabilidad
entre la medida obtenida en un estudio y la medida
real de la población (el valor real).
• Un intervalo de confianza nos va a permitir calcular
dos valores alrededor de una media muestral (uno
superior y otro inferior). Estos valores van a acotar
¿Qué son los un rango dentro del cual, con una determinada
probabilidad, se va a localizar el parámetro
intervalos de poblacional.
confianza? • Un intervalo de confianza nos va a permitir calcular
dos valores alrededor de una media muestral (uno
superior y otro inferior). Estos valores van a acotar
un rango dentro del cual, con una determinada
probabilidad, se va a localizar el parámetro
poblacional.
• El tamaño de la selección de la muestra:
¿Cuáles son depende de la proporción de datos que se
utilicen para el cálculo del valor muestral.
los • El nivel de confianza: este informa en qué
componentes porcentaje de casos la estimación es certera.
Frecuentemente, los niveles oscilan entre el 95%
de un intervalo y el 99%.
de confianza? • El margen de error de la estimación: se señala
como alfa y marca la probabilidad que existe para
que el valor poblacional esté fuera del intervalo.
• Estimación de la muestra: se relaciona con los
valores de la media, la varianza y las diferencias
de las medias. En dichos valores se fundamente
el cálculo del intervalo.
Pruebas de hipótesis
¿Qué indica la prueba
de hipótesis?

• La prueba de hipótesis consiste en recopilar


datos de una muestra y evaluarlos.
Posteriormente, el estadístico decide si existen o
no prueba suficientes basándose en el análisis
de los datos para rechazar la hipótesis nula.
• Entonces, una prueba de hipótesis evalúa la
probabilidad asociada a la hipótesis nula (Ho) de
que no hay efecto o diferencia.
La prueba de hipótesis implica dos hipótesis ¿Cómo así mi Lic. favorito?

Se deben considerar dos hipótesis para corroborar si el valor o los


valores obtenidos coinciden con la hipótesis planteada en la
investigación o no.
1. La hipótesis nula (Ho): Es una afirmación de que no hay diferencia entre las
variables: no están relacionadas. A menudo, esto puede considerarse el
statu quo y, como resultado, si no se puede aceptar lo nulo, se requiere
alguna acción.
2. La hipótesis alternativa (Ha): Es una afirmación sobre la población que es
contradictoria con H0 y lo que concluimos cuando no podemos aceptar H0.
Esto es normalmente lo que el investigador está tratando de probar. La
hipótesis alternativa es la contendiente y debe ganar con pruebas
significativas para derrocar el statu quo.
“Dado que las hipótesis nula y alternativa son contradictorias,
debe examinar las pruebas para decidir si tiene suficiente
evidencia para rechazar la hipótesis nula o no. Las pruebas se
presentan en forma de datos de muestra”.
Tabla 1. Presenta las distintas hipótesis en los pares correspondientes. Por ejemplo, si la hipótesis nula es
igual a algún valor, la alternativa no puede ser igual a ese valor.
Cuando se realiza una prueba de hipótesis hay cuatro resultados posibles en según la verdad (o falsedad) de la
hipótesis nula Ho y de la decisión de rechazarla o no. Los resultados se resumen en el siguiente cuadro:

Los cuatro resultados posibles en la tabla son:


1. La decisión es que no rechaza H0 cuando Ho es verdadera (decisión correcta).
2. La decisión es no aceptar H0 cuando Ho es verdadera (decisión incorrecta, conocida como error de tipo I). Este caso se describe
como “rechazar un buen nulo”. Como veremos más adelante, es este tipo de error el que evitaremos al fijar la probabilidad de
cometerlo. El objetivo es NO realizar ninguna acción que sea un error.
3. La decisión es no rechazar Ho cuando, de hecho, Ho es falsa (decisión incorrecta, conocida como error de tipo II). Esto se llama
“aceptar un falso nulo”. En esta situación ha permitido que el statu quo siga en vigor cuando debió anularse. Como veremos, la
hipótesis nula tiene ventaja en la competencia con la alternativa.
4. La decisión es no aceptar Ho cuando Ho es falsa (decisión correcta).
• Error tipo I (α) es un falso negativo:
Error de Tipo I rechazar Ho cuando esta es verdadera.
y de
• Error tipo II (β) es un falso negativo:
Tipo II aceptar Ho la cuando esta es falsa.
• El valor crítico consiste en determinar
un valor para un estadístico que sirve
Valores como punto de referencia para
críticos de Z determinar si el valor del estadístico de
prueba es lo suficientemente pequeño
y zonas de para rechazar la hipótesis nula.
rechazo • La zona de rechazo es aquella que está
fuera de los límites de la hipótesis
nula.
• Nivel de confianza: viene de la probabilidad de
contener el verdadero valor de la población
(1-α).
• Nivel de significancia: es una medida de
precisión. Cuánta es mi capacidad conclusiva
del test. Es a su vez la probabilidad de cometer
error tipo I (α).
Valor de p
• El valor p se utiliza para rechazar o mantener (no
rechazar) la hipótesis nula en una prueba de hipótesis.
Si el valor p calculado es menor que el nivel de
significación, que en la mayoría de los casos es del 5%,
se rechaza la hipótesis nula; en caso contrario, se
mantiene.
• El valor de p en ningún caso prueba que la hipótesis
alternativa, de que si hay efecto o diferencia, sea
verdadera.
Ejemplo 1
Se selecciona una muestra de 64 observaciones de una población normal. La media de la muestra es de 215 y la desviación
estándar de la población corresponde a 15. realice la prueba de hipótesis utilizando un nivel de significancia de 0.03.
Ho: µ ≥ 220
Ha: µ < 220
Ejemplo 2 utilizando valor de p
La empresa Abbott fabricante de Pedialyte desea saber si el peso promedio de su producto es mayor a 400 gramos. El nivel de
significancia es igual a 0.05. La muestra de 172 productos obtuvo una media de 407 gramos y una desviación estándar muestral
s=38.
¿Se puede concluir que la media poblacional es mayor a 400?
Ejemplo 3. Prueba de hipótesis a dos colas
Una compañía refresquera dice que su proceso de embotellado es de
16 onzas por lo que indica que sus productos son de alta calidad de
acuerdo al contenido. Para proar dicha decisión se selecciona una
muestra de 50 botellas obteniendo una media de 16.357 onzas y una
D.E.= 0.866. con un nivel de significancia del 5%. ‘Qué decisión debería
tomar el gerente de la compañía de sus productos completos?
Ejemplo 4

También podría gustarte