Está en la página 1de 8

Qu es una prueba de hiptesis?

Cul es su funcin o
utilidad en la vida real? Cules son los tipos de errores que
hay?
Qu es una prueba de hiptesis?
Hiptesis estadstica
Una hiptesis estadstica es una afirmacin sobre los valores de los parmetros
de una poblacin o proceso, la cual es susceptible de probarse a partir de la
informacin contenida en una muestra representativa que se obtiene de la
poblacin. (Pulido & de la Vara Salazar, 2009)
Una hiptesis estadstica o simplemente hiptesis es una pretensin o
aseveracin sobre el valor de un solo parmetro (caracterstica de una
poblacin o caracterstica de una distribucin de probabilidad), sobre los
valores de varios parmetros o sobre la forma de una distribucin de
probabilidad completa. Un ejemplo de una hiptesis es la pretensin de que =
0.75, donde es el dimetro interno promedio verdadero de un cierto tipo de
tubo de PVC. Otro ejemplo es la proposicin p < 0.10, donde p es la proporcin
de tarjetas de circuito defectuosas entre todas las tarjetas de circuito
producidas por un cierto fabricante. Si 1 y 2 denotan las resistencias a la
ruptura promedio verdaderas de dos tipos diferentes de cuerdas, una hiptesis
es la aseveracin de que 1 - 2 = 0 y otra es que 1 - 2 > 5. (Devore, 2008)
En cualquier problema de prueba de hiptesis, existen dos hiptesis
contradictorias consideradas. Una podra ser la pretensin de que = 0.75 y la
otra 0.75 o las dos proposiciones contradictorias podran ser p 0.10 y p <
0.10. El objetivo es decidir, con base en informacin muestral, cul de las dos
hiptesis es la correcta.
Existe una analoga conocida de esto en un juicio criminal. Una pretensin es la
aseveracin de que el individuo acusado es inocente. En el sistema judicial
estadounidense, esta es la pretensin que inicialmente se cree que es cierta.
Slo de cara a una fuerte evidencia que diga lo contrario el jurado deber
rechazar esta pretensin a favor de la aseveracin alternativa de que el
acusado es culpable.
En este sentido, la pretensin de inocencia es la hiptesis favorecida o
protegida y el agobio de comprobacin recae en aquellos que creen en la
pretensin alternativa. Asimismo, al probar hiptesis estadsticas, el problema
se formular de modo que una de las pretensiones sea inicialmente favorecida.
Esta pretensin inicialmente favorecida no ser rechazada a favor de la
pretensin alternativa a menos que la evidencia muestral la contradiga y apoye
fuertemente la aseveracin alternativa.
La hiptesis nula denotada por H0, es la pretensin de que inicialmente se
supone cierta (la pretensin de creencia previa). La hiptesis alternativa
denotada por Ha, es la aseveracin contradictoria a H0. La hiptesis nula ser

rechazada en favor de la hiptesis alternativa slo si la evidencia muestral


sugiere que H0 es falsa. Si la muestra no contradice fuertemente a H0, se
continuar creyendo en la verdad de la hiptesis nula. Las dos posibles
conclusiones derivadas de un anlisis de prueba de hiptesis son entonces
rechazar H0 o no rechazar H0.
Prueba de hiptesis
Una prueba de hiptesis es un mtodo de utilizar datos muestrales para decidir
si la hiptesis nula debe ser rechazada. Por consiguiente se podra probar H0:
= 0.75 contra la Ha alternativa: 0.75. Slo si los datos muestrales sugieren
fuertemente que es otra diferente de 0.75 deber ser rechazada la hiptesis
nula. Sin semejante evidencia, H0 no deber ser rechazada, puesto que sigue
siendo bastante plausible.
En ocasiones un investigador no desea aceptar una aseveracin particular a
menos y hasta que los datos apoyan fuertemente la aseveracin. Como
ejemplo, supngase que una compaa est considerando aplicar un nuevo
tipo de recubrimiento en los cojinetes que fabrica. Se sabe que la vida de
desgaste promedio verdadera con el recubrimiento actual es de 1000 horas. Si
denota la vida promedio verdadera del nuevo recubrimiento, la compaa no
desea cambiar a menos que la evidencia sugiera fuertemente que excede de
1000. Una formulacin apropiada del problema implicara probar H0: = 1000
contra Ha: > 1000. La conclusin de que se justifica un cambio est
identificada con Ha y se requerira evidencia conclusiva para justificar el
rechazo de H0 y cambiar al nuevo recubrimiento.
La investigacin cientfica a menudo implica tratar de decidir si una teora
actual debe ser reemplazada por una explicacin ms plausible y satisfactoria
del fenmeno investigado. Un mtodo conservador es identificar la teora actual
con H0 y la explicacin alternativa del investigador con Ha. El rechazo de la
teora actual ocurrir entonces slo cuando la evidencia es mucho ms
compatible con la nueva teora.
En muchas situaciones, Ha se conoce como hiptesis del investigador, puesto
que es la pretensin que al investigador en realidad le gustara validar. La
palabra nulo significa sin ningn valor, efecto o consecuencia, la que sugiere
que H0 no deber ser identificada con la hiptesis de ningn cambio (de la
opinin actual), ninguna diferencia, ninguna mejora, y as sucesivamente.
Supngase, por ejemplo, que 10% de todas las tarjetas de circuito producidas
por un cierto fabricante durante un periodo reciente estaban defectuosas.
Un ingeniero ha sugerido un cambio del proceso de produccin en la creencia
de que dar por resultado una proporcin reducida de tarjetas defectuosas.
Sea p la proporcin verdadera de tarjetas defectuosas que resultan del proceso
cambiado. Entonces la hiptesis de investigacin en la cual recae el agobio de
comprobacin, es la aseveracin de que p < 0.10. Por consiguiente la hiptesis
alternativa es Ha: p < 0.10.

En el tratamiento de la prueba de hiptesis, H0 siempre ser formulada como


una afirmacin de igualdad. Si denota el parmetro de inters, la hiptesis
nula tendr la forma H0: = 0 donde 0 es un nmero especfico llamado valor
nulo del parmetro (valor pretendido para por la hiptesis nula). Como
ejemplo, considrese la situacin de la tarjeta de circuito que se acaba de
discutir. La hiptesis alternativa sugerida fue Ha: p < 0.10, la pretensin de que
la modificacin del proceso redujo la proporcin de tarjetas defectuosas. Una
opcin natural de H0 en esta situacin es la pretensin de que p 0.10 de
acuerdo a la cual el nuevo proceso no es mejor o peor que el actualmente
utilizado. En su lugar se considerar H0: p = 0.10 contra Ha: p < 0.10. El
razonamiento para utilizar esta hiptesis nula simplificada es que cualquier
procedimiento de decisin razonable para decidir entre H0: p = 0.10 y Ha: p <
0.10 tambin ser razonable para decidir entre la pretensin de que p 0.10 y
Ha. Se prefiere utilizar una H0 simplificada porque tiene ciertos beneficios
tcnicos, los que en breve sern aparentes.
La alternativa de la hiptesis nula H0: = 0 se ver como una de las
siguientes tres aseveraciones: 1) Ha: > 0 (en cuyo caso la hiptesis nula
implcita es 0), 2) Ha: < 0 (por consiguiente la hiptesis implcita nula
establece que 0) o 3) Ha: 0. Por ejemplo, sea la desviacin estndar
de la distribucin de dimetros internos (pulgadas) de un cierto tipo de
manguito de metal. Si se decidi utilizar el manguito a menos que la evidencia
muestral demuestre conclusivamente que > 0.001, la hiptesis apropiada
sera H0: = 0.001 contra Ha: > 0.001. El nmero 0 que aparece tanto en H0
como en Ha (separa la alternativa de la nula) se llama valor nulo. (Devore,
2008)
Un procedimiento de prueba se especifica como sigue:
1. Un estadstico de prueba, una funcin de los datos muestrales en los
cuales ha de basarse la decisin (rechazar H0 o no rechazar H0)
(Devore, 2008)
2. Una regin de rechazo, el conjunto de todos los valores estadsticos de
prueba por los cuales H0 ser rechazada. La hiptesis nula ser
rechazada entonces s y slo si el valor estadstico de prueba observado
o calculado queda en la regin de rechazo. (Devore, 2008)

Cul es su funcin o utilidad en la vida real?


En un estudio estadstico por lo general se busca responder con cierta
confianza ciertas preguntas y/o tomar decisiones. En este contexto, la persona
que hace el estudio puede tener a priori ciertas creencias o hiptesis que desea
comprobar.
Por ejemplo:
Los dos proveedores del material x tienen el mismo nivel de calidad.
El porcentaje de cierto ingrediente afecta el resultado de la mezcla.
El tiempo de espera de esta operacin es de tres horas en promedio.

La variacin del proceso se redujo con los cambios realizados.

Cules son los tipos de errores que hay?


El riesgo de una decisin equivocada: errores tipo I y tipo II
Probar una hiptesis estadstica es una decisin probabilstica, por lo tanto,
existe el riesgo de cometer un error tipo I o un error tipo II. El primero ocurre
cuando se rechaza H0 y es verdadera, y el error tipo II es cuando se acepta H0
y es falsa. En toda prueba de hiptesis cada tipo de error tiene una
probabilidad de ocurrir.
Con y se denotan las probabilidades de los errores tipo I y II,
respectivamente. As,
= P {error tipo I} = probabilidad de rechazar H0 cuando es verdadera
= P {error tipo II} = probabilidad de aceptar H0 que es falsa
A 1 = P {rechazar H0 cuando es falsa} se le llama potencia de la prueba. En
tanto, tambin se le conoce a como la significancia dada de la prueba y es la
probabilidad de la regin o intervalo de rechazo; su valor se especifica desde
que se planea el estudio. Por lo general se utilizan los valores = 0.05 o 0.01.
Mientras ms pequeo es el valor de se requiere ms evidencia en los datos
para rechazar H0. Es comn que en las pruebas de hiptesis se especifique el
valor de y se disee la prueba de tal forma que el valor de sea pequeo. Lo
anterior se puede lograr con muestras grandes, lo que da mayor potencia de la
prueba. Es posible afirmar que, en general, es deseable que una prueba
estadstica sea potente. Sin embargo, cuando el tamao de la muestra se
incrementa en exceso (a tamaos en cientos), se llega a tener una potencia
excesiva que lleva al extremo de rechazar H0 cuando es verdadera desde el
punto de vista prctico. (Pulido & de la Vara Salazar, 2009)
En la prctica suele ser ms delicado cometer el error tipo I que el error tipo II,
porque en la mayora de las hiptesis el rechazar H0 implica objetar algo que se
acepta de manera convencional. Pero no rechazar H0 representa, en muchos
casos, seguir como hasta ahora. Por lo anterior, es comn que se controle solo
el error tipo I, mientras que el error tipo II se deja libre como si su magnitud no
importara. (Pulido & de la Vara Salazar, 2009)
Lo cierto es que el error tipo II tambin importa y la magnitud de su probabilidad
debe ser pequea (se recomienda = 0.10). El problema es que controlar a
tiene varias implicaciones; por ejemplo, muchas veces se requieren grandes
tamaos mustrales. (Pulido & de la Vara Salazar, 2009)

Qu es una prueba de normalidad? Cul es su funcin?


Es indispensable conocer que cuando se aplica una herramienta estadstica en
donde se involucran variables continuas o cuantitativas es fundamental
determinar si la informacin obtenida en el proceso, tiene un comportamiento
mediante una distribucin normal. Para ello la estadstica posee algunas
pruebas, entre el las encontramos la prueba de Ji-cuadrado, KolmogorovSmirnov Lilliefors, Shapiro y Wilks o la prueba de Anderson Darling; pero una
manera muy sencilla de realizar la prueba de normalidad es construyendo un
histograma de frecuencia.
La funcin de las pruebas de normalidad es pues que estas se aplican a un
conjunto de datos para determinar su similitud con una distribucin normal. La
hiptesis nula es, en estos casos, si el conjunto de datos es similar a una
distribucin normal, por lo que un P-valor suficientemente pequeo indica datos
no normales.
En particular, uno de los mtodos grficos de mayor uso y que se puede usar
para una prueba de normalidad, sobre todo en diseo de experimentos,
confiabilidad y en Seis Sigma, es la grfica de probabilidad.
La grafica de probabilidad es un procedimiento que permite determinar en
forma visual si los datos muestrales se ajustan a una distribucin especfica. La
grfica de probabilidad es una grfica del tipo X-Y cuyas escalas son
determinadas por la distribucin elegida. Supongamos que se tienen los
siguientes datos: x1, x2,..., xn, y que se desea construir una grfica de
probabilidad para verificar si estos datos siguen cierta distribucin. Para ello,
primero se ordenan los datos de menor a mayor: denotemos al dato ms
pequeo con x(1), al segundo ms pequeo con x(2), y as sucesivamente hasta
el ms grande que se denota con x(n). En seguida, los datos ordenados x( j) se
grafican frente a la frecuencia acumulada observada ( j 0.5)/n (distribucin
emprica) en el papel de probabilidad ms apropiado a la distribucin que se
quiere probar.
Si la distribucin propuesta describe de manera adecuada los datos, los puntos
en la grfica tendern a ubicarse a lo largo de una lnea recta; pero si los
puntos se desvan de manera significativa de una lnea recta, entonces eso
ser evidencia de que los datos no siguen tal distribucin. El hecho de que los
datos se ajusten o no a una lnea recta para concluir que siguen o no la
distribucin especificada es una decisin subjetiva, pero con frecuencia la
grfica resulta un procedimiento suficiente para tomar la decisin correcta.

Qu es intervalo de confianza? Para que sirve? Cmo se


utiliza?

En la mayora de los casos la media, la varianza, desviacin estndar se


estiman a partir de los datos de una muestra, y no del conjunto total de la
poblacin. Para poder tener una media del grado de fiabilidad de la estimacin
es necesario calcular el intervalo de confianza.
El intervalo de confianza es un parmetro al nivel 1 es aquel que cumple la
propiedad de que la probabilidad de que sus extremos tomen valores tales que
el parmetro este comprendido entre ellos es igual a 1 . Los extremos del
intervalo de confianza de un parmetro se denominan lmites de confianza.
(Alarcn, Vergara Castao, & Vaamonde, 2006)
El intervalo de confianza describe la variabilidad entre la medida obtenida en un
estudio y la medida real de la poblacin (el valor real). Corresponde a un rango
de valores, cuya distribucin es normal y en el cual se encuentra, con alta
probabilidad, el valor real de una determinada variable. Esta alta probabilidad
se ha establecido por consenso en 95%. As, un intervalo de confianza de 95%
nos indica que dentro del rango dado se encuentra el valor real de un
parmetro con 95% de certeza. (Roberto & Gianella, 2005)
Estimacin por intervalo
Como la estimacin puntual de un parmetro se genera a travs de un
estadstico, y como el valor de este es aleatorio porque depende de los
elementos que fueron seleccionados en la muestra, entonces la estimacin que
se hace sobre el parmetro depender y variara de una muestra a otra. De esta
forma, cuando se quiere tener mayor certidumbre acerca del verdadero valor
del parmetro poblacional, ser necesario obtener la informacin sobre qu tan
precisa es la estimacin puntual. As, la estimacin puntual dir poco sobre el
parmetro cuando la variacin entre una estimacin y otra es muy grande. Una
forma de saber que tan variable es el estimador consiste en calcular la
desviacin estndar o error estndar del estadstico, visto como una variable
aleatoria. Por ejemplo, consideremos la desviacin estndar S y la media X
de una muestra de tamao n. Puesto que X es una variable aleatoria, esta
tiene su propia desviacin o error estndar que se estima mediante

Una forma operativa de saber qu tan precisa es la estimacin consiste en


calcular un intervalo de confianza que indique un rango donde puede estar el
parmetro con cierto nivel de seguridad o confianza. Construir un intervalo al
100(1 - ) % de confianza para un parmetro desconocido consiste en estimar
dos nmeros (estadsticos) L y U, de manera que la probabilidad de que se
encuentre entre ellos sea 1 , es decir,
P (L U) 1
Donde L y U forman el intervalo de confianza buscado [L, U].

Intervalo de confianza para una media

Si se trata de encontrar dos nmeros L y U, tales que el parmetro se


encuentre entre ellos con una probabilidad de 1 . Esto es,
Sea xl, x2,..., xn una muestra aleatoria de tamao n de una poblacin, con una
distribucin normal con media y varianza 2, ambas desconocidas. El
procedimiento general para deducir el intervalo consiste en partir de un
estadstico que involucra al parmetro de inters y que tenga una distribucin
conocida. En el caso de , tal estadstico es:

El cual tiene una distribucin T de Student con n - 1 grados de libertad. Por lo


tanto, en la tabla de esta distribucin o en su grafica se pueden ubicar dos
valores crticos t/2 y t/2, tales que:

De aqu, al despejar hasta dejar al parmetro de inters solo en medio de las


desigualdades, se llega a que

As,

Forman el intervalo al 100(1 ) % para la media desconocida . En la tabla de


la distribucin T de Student se observa que para una muestra mayor o igual a
30, el intervalo al 100(1 ) % para la media es aproximadamente,

o sea, la media ms menos dos veces la estimacin de su error estndar.


Es importante enfatizar que un anlisis inferencial, como es la estimacin
mediante un intervalo de confianza, siempre debe incluir un anlisis descriptivo
de los datos, ya que de esa manera se comprende mejor tanto la informacin
contenida en la muestra como lo que se est afirmando acerca de la poblacin.
Interpretacin de un intervalo
En general, la correcta interpretacin de un intervalo de confianza es de la
siguiente manera: si se obtuvieran 100 muestras independientes de la misma
poblacin o proceso, cada una de tamao n y para cada muestra se calculara
el intervalo de confianza a 95% para el mismo parmetro, entonces se espera
que 95 de los 100 intervalos contengan el verdadero valor de dicho parmetro.
En la prctica, como vimos en el ejemplo anterior, solo se obtiene un intervalo y
se dice que el intervalo [L, U] tiene una confianza de 100(1 - ) %; es decir, se
realiza una interpretacin frecuentista en el sentido de que el parmetro estar

en el intervalo 100(1 - ) % de las veces que apliquemos el procedimiento. La


longitud del intervalo de confianza es una medida de la precisin de la
estimacin; por ello, es deseable que la longitud de los intervalos sea pequea.
Pero esta longitud depende de tres aspectos; de la varianza de la poblacin,
que depender de los datos; del tamao de muestra y por ultimo del nivel de
confianza de la estimacin. En particular, la persona decide este ltimo aspecto
cuando hace el estudio. Mientras que la amplitud del intervalo en una
aplicacin especfica se reduce conforme se incrementa el tamao de la
muestra. (Pulido & de la Vara Salazar, 2009)

También podría gustarte