Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
prueba aporta una clase de prueba más allá de una duda razonable. Analizaremos cada
paso en detalle
Objetivo de la prueba de hipótesis.
El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico
(maestral), sino hacer
Un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del
parámetro.
3.- Procedimiento sistemático para una prueba de hipótesis de una muestra
.Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1.
Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones
acerca de las poblaciones que se estudian.
La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de
población, no a una estadística de muestra. La letra H significa hipótesis y el subíndice
cero no hay diferencia. Por lo general hay un "no" en la hipótesis nula que indica que "no
hay cambio" Podemos rechazar o aceptar Ho.
La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales
proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula
siempre contiene un signo de igualdad con respecto al valor especificado del parámetro.
La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una
afirmación que se acepta si los datos maestrales proporcionan evidencia suficiente de que
la hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación. El
planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con
respecto al valor especificado del parámetro.
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o
más poblaciones.
Ho; = 50 cm/s
H1; 50 cm/s
Es importante recordar que las hipótesis siempre son proposiciones sobre la población o
distribución bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parámetro de la población especificado en la hipótesis nula se determina en una de tres
maneras diferentes:
Un procedimiento que conduce a una decisión sobre una hipótesis en particular recibe el
nombre de prueba de hipótesis. Los procedimientos de prueba de hipótesis dependen del
empleo de la información contenida en la muestra aleatoria de la población de interés. Si
esta información es consistente con la hipótesis, se concluye que ésta es verdadera; sin
embargo si esta información es inconsistente con la hipótesis, se concluye que esta es
falsa. Debe hacerse hincapié en que la verdad o falsedad de una hipótesis en particular
nunca puede conocerse con certidumbre, a menos que pueda examinarse a toda la
población. Usualmente esto es imposible en muchas situaciones prácticas. Por tanto, es
necesario desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la
probabilidad de llegar a una conclusión equivocada.
La hipótesis nula, representada por Ho, es la afirmación sobre una o más características
de poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
Ho; = 50 cm/s
H1; 50 cm/s
Supóngase que se realiza una prueba sobre una muestra de 10 especímenes, y que se
observa cual es la rapidez de combustión promedio muestral. La media muestral es un
estimador de la media verdadera de la población. Un valor de la media muestral que
este próximo al valor hipotético = 50 cm/s es una evidencia de que el verdadero valor
de la media es realmente 50 cm/s; esto es, tal evidencia apoya la hipótesis nula H o. Por
otra parte, una media muestral muy diferente de 50 cm/s constituye una evidencia que
apoya la hipótesis alternativa H1. Por tanto, en este caso, la media muestral es el
estadístico de prueba.
La media muestral puede tomar muchos valores diferentes. Supóngase que si 48.5
51.5, entonces no se rechaza la hipótesis nula Ho; = 50 cm/s, y que si <48.5 ó
>51.5, entonces se acepta la hipótesis alternativa H1; 50 cm/s.
Los valores de que son menores que 48.5 o mayores que 51.5 constituyen la región
crítica de la prueba, mientras que todos los valores que están en el intervalo 48.5
51.5 forman la región de aceptación. Las fronteras entre las regiones críticas y de
aceptación reciben el nombre de valores críticos. La costumbre es establecer
conclusiones con respecto a la hipótesis nula Ho. Por tanto, se rechaza Ho en favor de H1
si el estadístico de prueba cae en la región crítica, de lo contrario, no se rechaza Ho.
Este procedimiento de decisión puede conducir a una de dos conclusiones erróneas. Por
ejemplo, es posible que el valor verdadero de la rapidez promedio de combustión del
agente propulsor sea igual a 50 cm/s. Sin embargo, para todos los especímenes bajo
prueba, bien puede observarse un valor del estadístico de prueba que cae en la región
crítica. En este caso, la hipótesis nula H o será rechazada en favor de la alternativa
H1cuando, de hecho, Ho en realidad es verdadera. Este tipo de conclusión equivocada se
conoce como error tipo I.
El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es verdadera.
También es conocido como ó nivel de significancia.
Si tuviéramos un nivel de confianza del 95% entonces el nivel de significancia sería del
5%. Análogamente si se tiene un nivel de confianza del 90% entonces el nivel de
significancia sería del 10%.
El error tipo II ó error se define como la aceptación de la hipótesis nula cuando ésta es
falsa.
Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes
que determinan si la decisión final es correcta o errónea.
3) Ho: m = m0 H1: m ¹ m0
Las pruebas de hipótesis para la media se basan en el estadístico dado por la media
muestral cuya distribución tiende a la distribución normal (m, s
/n) para muestras grandes.
Para el caso de las hipótesis Ho: m = m0 contra H1: m > m0 vimos, al analizar las mejores
pruebas, que la mejor región crítica de tamaño a consistía en rechazar H0 si la media
muestral era mayor o igual que una constante c dada por. Por lo tanto, una vez tomada la
muestra y obtenidos los valores x1, x2,…, xn, se calcula la media muestral dada por:
Para el caso de las hipótesis Ho: m = m0 contra H1: m < m0 la mejor región crítica de
tamaño a consiste en rechazar H0 si la media muestral es menor o igual que una
constante c dada por. Por lo tanto, una vez tomada la muestra y obtenidos los valores x1,
x2,…, xn, se calcula la media muestral, y los criterios de decisión sería los siguientes:
Por último, si las hipótesis fueran Ho:m = m0 contra H1:m ¹ m0 la mejor región crítica de
tamaño a (aunque no es uniformemente más potente como en el caso de las dos
anteriores) consiste en rechazar H0 si la media muestral es menor o igual que una
constante c1 ó mayor igual que otra constante c2. Por lo tanto, una vez tomada la muestra
y obtenidos los valores x1, x2,…, xn, se calcula la media muestral, y los criterios de
decisión serían los siguientes:
Ejemplo. Un inspector de pesos y medidas visita una planta de empacado para verificar
que el peso neto de las cajas sea el indicado en la etiqueta. El gerente de la planta
asegura al inspector que el peso promedio de cada caja es de 750 gramos con una
desviación estándar de 5 gr. El inspector selecciona, al azar, 100 cajas y encuentra que el
peso promedio es de 748 gr. Bajo estas condiciones y usando un nivel de significancia de
0.05,¿Qué actitud debe tomar el inspector?.
Solución. Este problema lo podemos plantear como una prueba de hipótesis del siguiente
tipo:
1) Ho: m = m0 = 750 H1: m < m0 (hay preocupación si el peso medio es inferior al
especificado)
Con n = 100, a = 0.05, s = 5 gramos. Se tiene que Z0.05 = 1.645. Por lo tanto, la región
crítica está dada por = 750 - 1.645 x 5/10 =749.18. Por lo tanto como la media muestral es
748 gramos, se rechaza la hipótesis de que el promedio de cada caja sea 750 gramos.
Por lo tanto, deben tomarse las medias necesarias para corregir esta situación, que va en
contra de los intereses del consumidor. Usando los otros criterios de aceptación tenemos
que Z = - 4.0 y el valor P es aproximadamente cero (P = 0.0).
Concepto de proporción.
n = tamaño de la muestra
x = número de éxitos en la muestra
Ho: p = p0
H1: p ¹ p0
La situación más frecuente es suponer que existen diferencias entre las proporciones de
dos poblaciones, para ello suelen enunciarse las hipótesis de forma similar al caso de las
medias:
Ho: p1 = p2 Þ p1 - p2 = 0
H1: p1 ¹ p2
H1: p1 ¹ p2
Observaciones:
A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en
cuenta varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral
admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar
algunos casos sencillos de cálculo del tamaño muestral delimitemos estos factores.
Parámetro. Son las medidas o datos que se obtienen sobre la población.
Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una
estimación de los parámetros.
Veamos los pasos necesarios para determinar el tamaño de una muestra empleando el
muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar
el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error máximo
que estamos dispuestos a admitir en nuestra estimación. Así pues los pasos a seguir son:
Dónde:
: varianza poblacional
e: error máximo
Buscamos en las tablas de la curva normal el valor de que corresponde con el nivel de
confianza elegido: = ±1.96 y seguimos los pasos propuestos arriba.
1.
=1
176
= 0,015
por lo que
Es decir para realizar la investigación se necesita una muestra de al menos 298
adolescentes.
Donde
e: error máximo
N: tamaño de la población
Seguridad = 95%; Precisión = 3%: Proporción esperada = asumamos que puede ser
próxima al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p
= 0,5 (50%) que maximiza el tamaño muestral:
Dónde:
N = Total de la población
¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para
conocer la prevalencia de diabetes?
Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser
próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p =
0.5 (50%) que maximiza el tamaño muestral.