Documentos de Académico
Documentos de Profesional
Documentos de Cultura
U3 Pruebas de Hipótesis y Análisis de Varianza
U3 Pruebas de Hipótesis y Análisis de Varianza
Propósitos de Formación
Video 1: https://s3-eu-west-
1.amazonaws.com/iep1738.frooze.tv/3ba672f72d1eb92a9e52e5d0499df8efUnidad3.
mp4
Prueba de Hipótesis
¿Qué es una hipótesis estadística?
Hipótesis Estadística: se trata de una afirmación o conjetura acerca de una distribución de una o
más variables aleatorias. Tipos:
Hipótesis Simple. Si se especifica por completo la probabilidad en cuestión.
Hipótesis Compuesta. Si no se especifica por completo la probabilidad en cuestión.
PRUEBAS DE HIPÓTESIS
Tipos de Errores:
Se cree que el nivel medio de protrombina en una población normal es de 20 mg/100 ml de plasma
con una desviación típica de 4 miligramos/100 ml. Para comprobarlo, se toma una muestra de 40
individuos en los que la media es de 18.5 mg/100 ml. ¿Se puede aceptar la hipótesis, con un nivel de
significación del 5%?
1. Enunciamos las hipótesis nula y alternativa:
H0 : μ =20 mg/100 ml
H1 : μ ≠ 20 mg/100 ml
2. Zona de aceptación
Para α = 0.05, le corresponde un valor crítico: z = 1.96.
Determinamos el intervalo de confianza para la media:
(20 -1.96 . 4/√20 ; 20 + 1.96 . 4)/√20 = (18.77 ; 21.23)
3. Verificación.
Valor obtenido de la media de la muestra: 18.5.
4. Decisión
Rechazamos la hipótesis nula H0, con un nivel de significación del 5%.
Pruebas de Hipótesis
¿Cuáles son las pruebas para la media de una distribución normal?
Al decir una o dos colas nos estamos refiriendo a las gráficas unilaterales y bilaterales,
respectivamente.
Una prueba es de una cola cuando la hipótesis alternativa H1 indica una sola dirección. Si no se
especifica dirección en la hipótesis alternativa, se acusa una prueba de dos colas.
Pruebas de Hipótesis
¿Qué es el p-Valor?
Usted pone a prueba 35 automóviles y descubre que las millas por galón que registran los vehículos varían de
14.4 a 28.8. Después de colocar los datos en la columna MPG, usted realiza la prueba t de Minitab (el
comando de menú Estadísticas > Estadísticas básicas > t de 1 muestra, o el comando de sesión TTEST) y
obtiene estos resultados:
Los resultados revelan que la media de la muestra de 35 vehículos es 23.657. Sin embargo, la media de millas
por galón de todos los automóviles de este tipo (μ) podría seguir siendo 25. Necesita saber si hay suficiente
evidencia en la muestra para rechazar H0. La manera más común es comparando el valor p con el nivel de
significancia (α). α es la probabilidad de rechazar H0 cuando H0 es verdadera.
Para cualquier valor de α > valor p, usted no puede rechazar H0, y para cualquier valor de α ≤ valor p,
usted rechaza H0.
En nuestro ejemplo de la prueba t, el estadístico de prueba depende de la media y el valor p es .026. Esto
indica que el 2.6% de las muestras con un tamaño de 35, extraídas de la población donde μ = 25, producirá
una media que proporciona una evidencia tan (o más) fuerte que la muestra actual de que μ no es igual a 25.
Suponemos que el valor de α es .05. El valor p de .026 indica que la media de millas por galón de todos los
automóviles de este tipo (no solo la media de los 35 vehículos incluidos en el estudio) probablemente no sea
igual a 25.
“a un nivel de significancia de 0.05, la media de millas por galón parece ser significativamente diferente
de 25”.
Pruebas de Hipótesis
¿Cuáles son las distintas pruebas de hipótesis en dos poblaciones?
PRUEBAS DE HIPÓTESIS
Denotamos µA y µB a las medias poblacionales de tensión antes y después de empezar la dieta,
respectivamente. De este modo, el contraste de hipótesis que debemos plantear es:
H0: µA = µB
H1: µA < µB ( ≠ ; > )
Observación: en el caso que tuviéramos la creencia de que el hacer dieta supone una disminución de la
presión de 2 puntos, entonces el contraste debería plantearse de la siguiente forma.
H0: µA - µB = 2
H1: µA - µB < 2 ( ≠ ; > )
Para realizar el contraste observamos en primer lugar que las muestras de antes, XA, y después de la dieta,
XB, son dependientes, puesto que se han tomado del mismo individuo.
Para realizar este contraste consideramos la diferencia de ambas muestras: d = XA - XB. Denotaremos por µd
= µA-µB y σd a su media y desviación estándar respectivamente. Observamos pues que el contraste anterior
es equivalente al contraste:
H0: µd = 0
H1: µA < 0 ( ≠ ; > )
Supuesto: XA y XB siguen una distribución normal. Observación: d = XA-XB ∼ N(µA-µB ,σd) . El intervalo
de confianza, a nivel 1-α, para µd = µA-µB viene dado por la expresión:
donde t(n-1,α/2) es el valor que, en una t-Student con n-1 grados de libertad, deja a su derecha un área de α/2 ,
y Sd es la desviación estándar muestral de la v.a. d.
En el caso de la observación donde sospechábamos que la tensión bajaba dos puntos, µo= 2. Así siguiendo
nuestro ejemplo: d = −1 y = 2.390 d S.
Entonces con un 95% de confianza ∈ (−3,1) µ d . Y el estadístico de contraste es t* = -1.18. Mirando la tabla
de la t (7, 0.05) =1.895. De este modo, como t* < -1.18 no tenemos evidencias significativas que realmente
hacer dieta sea ventajoso.
Análisis de Varianza
¿Qué diferencia a los modelos de efectos aleatorios y fijos?
De efectos fijos: es aquel en el que los tratamientos son fijados de antemano para el estudio
de interés. Aquí el interés se centra en la existencia de diferencias significativas entre
estimaciones.
De efectos aleatorios: es aquel en el que los tratamientos son escogidos de manera aleatoria
para el estudio de interés.
Análisis de Varianza
¿Qué distintos supuestos de modelo existen para el diseño no balanceado?
Nos topamos con un diseño no balanceado cuando nos encontramos con un solo factor que contiene
distintos números de observaciones por cada nivel de factor.
El hecho de que la descomposición de la varianza por grupos, dentro y entre los tratamientos,
explique la variabilidad de las medias de los tratamientos, depende enteramente de que el modelo
asociado al diseño cumpla con unos supuestos.
SUPUESTOS DE NORMALIDAD
Un procedimiento es hacer una gráfica para verificar las definiciones de la normal con el llamado Q-Q plot. Pruebas formales
acogidas como estándar para la verificación del supuesto.
HOMOGENEIDAD DE VARIANZA: Indica que la varianza es constante en todos los errores.
Errores de Tipo I
El siguiente vídeo trata de explicar a través de un ejemplo cuáles son los errores de tipo I.
Video 2: https://s3-eu-west-
1.amazonaws.com/iep1738.frooze.tv/f3c2af3c2818940055b5b53fe2861cfd3.Errorest
ipo1.mp4
Ejercicio
Selecciona solo la opción que consideres correcta
¡EXCELENTE!
Esta es la respuesta correcta. Dicha definición correspondería al error de tipo I, con probabilidad
α.
Video 3: https://s3-eu-west-
1.amazonaws.com/iep1738.frooze.tv/acf4bddc13412d085b5c7384a6b61c893.1Prueb
asdeunaydoscolas.mp4
Ejercicio
Selecciona solo la opción que consideres correcta
A través de la prueba de una cola, ¿qué importante dato se obtiene?
a) El intervalo de confianza.
b) El p-Valor.
¡EXCELENTE!
Esta es la respuesta correcta. El p-Valor es el nivel de significancia al cual se pude rechazar la
Hipótesis Nula (H 0 ).