Está en la página 1de 8

Estadstica Aplicada

CONTRASTE DE HIPTESIS Con el contraste de hiptesis se intenta dar respuesta a la pregunta: es razonable pensar que un parmetro toma tal valor? El contraste de hiptesis puede ser entendido como un mtodo de toma de decisiones, es decir, un procedimiento que nos permite decidir si una proposicin acerca de una poblacin puede ser mantenida o rechazada. Necesitamos lo primero formular una hiptesis cientfica, es decir, una afirmacin verificable. Necesitamos transformar la hiptesis cientfica (la cual se refiere a algn aspecto de la realidad), en hiptesis estadstica (la cual se refiere a algn aspecto de la distribucin de probabilidad). El segundo paso del proceso de verificacin consiste en buscar evidencia emprica relevante capaz de informar sobre si la hiptesis establecida es o no sostenible. Es decir, una hiptesis ser compatible con los datos empricos cuando a partir de ella sea posible deducir o predecir un resultado muestral (un estadstico) con cierta precisin. Se nos plantea una cuestin clave que es la de determinar cuando la discrepancia encontrada es lo bastante grande como para considerar que el resultado muestral observado es incompatible con la hiptesis formulada y, en consecuencia, para hacernos pensar que esa discrepancia encontrada no es explicable por fluctuaciones debidas al azar sino por el hecho de que la hiptesis planteada es incorrecta. El tercer paso es determinar una regla de decisin y esta regla debe establecerse en trminos de probabilidad, ya que se trabaja con muestras). En general, la regla de decisin que utilizaremos ser una afirmacin de este tipo: si el resultado muestral observado es, suponiendo correcta nuestra hiptesis, muy poco probable, consideraremos que nuestra hiptesis es incompatible con los datos. Por el contrario, si el resultado muestral observado es, suponiendo correcta nuestra hiptesis, probable, consideraremos que nuestra hiptesis es compatible con los datos. En definitiva, un contraste de hiptesis es un proceso de decisin en el que una hiptesis formulada en trminos estadsticos es puesta en relacin con los datos empricos para determinar si es o no compatible con ellos. Hiptesis Estadstica Todo contraste de hiptesis se basa en la formulacin de dos hiptesis: 1. Hiptesis nula (Ho). 2. Hiptesis alternativa (H1 ).

Inferencia estadstica

1/8

Estadstica Aplicada

La Ho es la que se somete a contraste. Consiste generalmente en una afirmacin concreta sobre la forma de una distribucin de probabilidad o sobre el valor de alguno de los parmetros de esa distribucin. La H1 es la negacin de la nula. Incluye todo lo que Ho excluye. Son hiptesis exhaustivas y mutuamente exclusivas. Ejemplos: Contraste bilateral. Ho : v = m H1 : v m Contraste unilateral Ho : acierto 0,5 H1 : acierto > 0,5 Qu asignamos como Ho y H1? La Ho asigna un valor especfico al parmetro en cuestin y por lo tanto el igual siempre forma parte de Ho . La idea bsica de la prueba de hiptesis es que los hechos tengan probabilidad de refutar la Ho. La Ho es la afirmacin que podra ser rechazada por los hechos. El inters del investigador se expresa, por lo tanto, en la H1. Hay tres posibles afirmaciones de las Ho y H1. Ho = H1 < >

Ejemplos: 1. Suponga que cierto organismo quiere demandar a una compaa por no cumplir las normas de emisin de monxido de carbono en el aire. El organismo desea demostrar que el nivel medio de monxido de carbono en el aire es peligrosamente alto, superior a 4,9 partes por milln (ppm). Ho : 4,9 ppm H1 : > 4,9 ppm 2. Un ingeniero desea demostrar que las aplicaciones de una pintura hecha con una nueva frmula secan y estn listas, para la capa siguiente,en un tiempo menor a 30 minutos. Ho : 30 minutos H1 : < 30 minutos

Inferencia estadstica

2/8

Estadstica Aplicada

3. La satisfaccin en el trabajo es muy importante cuando se trata de hacer producir a los trabajadores. Directivos sindicalistas aplicaron un cuestionario estndar de satisfaccin en el trabajo a una muestra de obreros de lnea de montaje de una gran planta, con la esperanza de mostrar que el puntaje medio de estos trabajadores en el cuestionario es distinto de la media establecida de 68. Ho : = 68 H1 : 68 El punto de vista del investigador afecta en gran medida la forma en que se plantean las hiptesis. En general, el experimentador trata de demostrar que el valor del parmetro es diferente al especificado. As espera rechazar la Ho, de modo que se justifique su teora. Una vez establecidas las hiptesis, se trabaja en el supuesto de que la Ho es una afirmacin verdadera hasta que hay suficientes evidencias como para rechazarla. Supuestos Es necesario que la distribucin poblacional con la que se va a trabajar est completamente especificada. Este tipo de hiptesis se les llama simples. Tambin se debe conocer ciertas caractersticas de los datos muestrales (si la muestra es aleatoria, si los experimentos son independientes, etc.) En definitiva, los supuestos de un contraste de hiptesis son un conjunto de afirmaciones que necesitamos establecer (sobre la poblacin de partida y sobre la muestra utilizada) para conseguir determinar la distribucin de probabilidad en la que se basar nuestra decisin. El estadstico de contraste. Un estadstico de contraste es un resultado muestral que cumple la doble condicin de: proporcionar informacin emprica relevante sobre la afirmacin propuesta en la Ho. poseer una distribucin muestral conocida. La regla de decisin. Es el criterio que vamos a utilizar para decidir si la hiptesis nula planteada debe o no ser rechazada. Este criterio se basa en la particin de la distribucin muestral del estadstico de contraste en dos zonas mutuamente excluyentes: la zona de rechazo y zona de aceptacin. Zona de rechazo o zona crtica , es el rea de distribucin muestral (distribucin del estadstico) que corresponde a los valores del estadstico de contraste que se encuentran tan alejados de la afirmacin establecida en
Inferencia estadstica 3/8

Estadstica Aplicada

Ho, que es muy poco probable que ocurran si Ho es verdadera. Su probabilidad se denomina nivel de significacin o nivel de riesgo y se representa con la letra . Zona de aceptacin es el rea de la distribucin muestral que corresponde a los valores del estadstico de contraste prximos a la afirmacin establecida en Ho. Es, por tanto, el rea correspondiente a los valores del estadstico de contraste que es probable que ocurran si Ho es verdadera. Su probabilidad se denomina nivel de confianza y se representa por 1 . Ya definidas las dos zonas, la regla de decisin consiste en rechazar Ho si el estadstico de contraste toma un valor perteneciente a la zona de rechazo, o mantener Ho si el estadstico de contraste toma un valor perteneciente a la zona de aceptacin. El tamao de las zonas de rechazo y de aceptacin se determina fijando el valor de , es decir, fijando el nivel de significacin con el que se desea trabajar. Se suele tomar un 1% o un 5%. La forma de dividir la distribucin muestral en zona de rechazo y de aceptacin depende de si el contraste es bilateral o unilateral. La zona crtica debe situarse donde puedan aparecer los valores muestrales incompatibles con Ho. Ejemplos: Contraste bilateral. Ho : v = m H1 : v m

Contraste unilateral Ho : acierto 0,5 H1 : acierto > 0,5

Inferencia estadstica

4/8

Estadstica Aplicada

En los contrastes bilaterales, la zona crtica se encuentra, generalmente, repartida a partes iguales entre las dos colas de la distribucin muestral. En los contrastes unilaterales, la zona crtica se encuentra en una de las dos colas de la distribucin muestral. La Reglas de decisin son: a) Contrastes bilaterales: Rechazar Ho si el estadstico de contraste cae en la zona crtica, es decir, si el estadstico de contraste toma un valor tan grande o tan pequeo que la probabilidad de obtener un valor tan extremo o ms que el encontrado es menor que /2. b) Contraste unilateral: Rechazar Ho si el estadstico de contraste cae en la zona crtica, es decir, si toma un valor tan grande que la probabilidad de obtener un valor como ese o mayor es menor que . La decisin: Planteada la hiptesis, formulados los supuestos, definido el estadstico de contraste y su distribucin muestral, y establecida la regla de decisin, el paso siguiente es obtener una muestra aleatoria de tamao n, calcular el estadstico de contraste y tomar una decisin. Si es estadstico de contraste cae en la zona crtica se rechaza Ho. Si es estadstico cae en la zona de aceptacin se mantiene Ho. Si la rechazamos afirmamos que la hiptesis es falsa, es decir, que afirmamos con una probabilidad de equivocarnos, que hemos conseguido probar que esa hiptesis es falsa. Por el contrario, si la mantenemos, no estamos afirmando que la hiptesis es verdadera. Simplemente que no tenemos evidencia emprica suficiente para rechazarla y que se considera compatible con los datos. Como conclusin, si se mantiene o no rechaza Ho, nunca se puede afirmar que es verdadera. Errores de Tipo I y II: Error de tipo I (e1): Se comete cuando se decide rechazar una Ho que en realidad es verdadera. La probabilidad de cometer ese error es . Error de tipo II (e2): Se comete cuando se decide mantener una Ho que en realidad es falsa. La probabilidad de cometer ese error es . Por tanto, 1 ser la probabilidad de tomar una decisin correcta cuando Ho es verdadera. Y 1 ser la probabilidad de tomar una decisin correcta cuando Ho es falsa. El siguiente cuadro resume las ideas:

Inferencia estadstica

5/8

Estadstica Aplicada

Decisin

Mantener Ho Rechazar Ho

Naturaleza de Ho Verdadera Falsa Decisin correcta error tipo II p= 1 P= error tipo I Decisin correcta p= p= 1

La probabilidad de cometer un error de tipo I con nuestra decisin es una probabilidad conocida, pues el valor de lo fija el propio investigador. Sin embargo, la probabilidad de cometer un error de tipo II, , es un valor desconocido que depende de tres factores: 1. La H1 que consideremos verdadera. 2. El valor de . 3. El tamao del error tpico (desviacin tpica) de la distribucin muestral utilizada para efectuar el contraste. Ejemplo:

Se utiliza la informacin muestral proporcionada por el estadstico media muestral (8). 1. Cualquier valor atribuido a en H1 (siempre mayor a 0) generar distribuciones muestrales distintas para 8. Aunque todas tendrn la misma forma, unas estarn ms alejadas que otras de la curva de Ho, es decir, unas sern distintas de otras nicamente en el valor asignado a . Cuanto ms se aleje el valor 1 de 0, ms hacia la derecha se desplazar la curva H1, y en consecuencia, ms pequea se har el rea

Inferencia estadstica

6/8

Estadstica Aplicada

. Por lo tanto, el valor de depende del valor concreto de 1 que consideremos verdadero dentro de todos los afirmados por H1. 2. Cuanto mayo es , menor es . Se relacionan de forma inversa. 3. Para una distancia dada entre 0 y 1, el solapamiento entre las curvas correspondientes a uno y otro parmetro ser tanto mayor cuanto mayor sea el error tpico de la distribucin muestral representada por esas curvas (cuanto mayor es el error tpico de una distribucin, ms ancha es esa distribucin). Y cuanto mayor sea el solapamiento, mayor ser el valor de . En el mejor de todos los mundos posibles, podran desarrollarse procedimientos de prueba para los que ningn tipo de error es posible. Sin embargo, este ideal puede alcanzarse slo si se basa una decisin en un examen de toda la poblacin, lo que no es posible realizar prcticamente nunca. La dificultad al usar un procedimiento basado en datos muestrales es que debido a la variabilidad de muestreo, puede resultar una muestra no representativa, y por tanto, resultara un rechazo errneo de Ho. En lugar de buscar procedimientos libres de error, debemos buscar procedimientos para los que no sea probable que ocurra ningn tipo de estos errores. Esto es, un buen procedimiento es aquel para el que es pequea la probabilidad de cometer cualquier tipo de error. La eleccin de un valor particular de corte de la regin de rechazo fija las probabilidades de errores tipo I y tipo II. Debido a que Ho especifica un valor nico del parmetro, hay un solo valor de . Sin embargo, hay un valor diferente de por cada valor del parmetro recogido en H1. Ejemplo: Se sabe que cierto tipo de automvil no presenta daos visibles el 25% de las veces en pruebas de choques a 10 millas por hora (mph). Se ha propuesto un diseo modificado de parachoques en un esfuerzo por aumentar este porcentaje. Denotemos por p la proporcin de todos los choques a 10 mph con este nuevo para choques que resultan sin dao visible. La hiptesis a probarse son: Ho : p 0,25 H1 : p> 0,25 La prueba estar basada en un experimento en donde ocurran n=20 choques independientes con prototipos del nuevo diseo. Intuitivamente, Ho debe ser rechazada si un nmero importante de los choques no muestra averas. Considrese el siguiente procedimiento de prueba: X nmero de choques sin dao visible. Se establece la siguiente particin de la distribucin de probabilidad de x:
Inferencia estadstica 7/8

Estadstica Aplicada

R={8,9,10, , 20}; esto es, rechazar Ho si x 8 donde x es el valor observado del estadstico de prueba. Cuando Ho es verdadera, X tiene una distribucin binomial de probabilidad con n=20 y p=0,25. Por lo tanto, = P(e1)= P(Ho es rechazada siendo verdadera)= P(x8 cuando X? B(20,0,25))= 1t7= 0,102 Esto es, cuando Ho es realmente verdadera, aproximadamente el 10% de todos los experimentos formados por 20 choques derivaran en que Ho sera incorrectamente rechazada (Error tipo I). En contraste con , no hay una sola . Existe una diferente para cada p distinta que exceda de 0,25. Por lo tanto, hay un valor de para p=0,3 y otro para p=0,5, etc. Por ejemplo para p=0,3 = P(e2)=P(mantener Ho si es falsa porque p=0,3)=P(x7 cuando X? B(20,0,3))= t7 = 0,772 Cuando p, en realidad, es 0,3 en lugar de 0,25 (una pequea desviacin de Ho) casi el 77% de todos los experimentos de este tipo derivaran en que Ho se mantendra incorrectamente. La tabla siguiente muestra para valores seleccionados de p con la misma regin de rechazo (R). Es claro que disminuye a medida que el valor de p se aleja a la derecha del valor nulo de 0,25. Intuitivamente, cuanto mayor sea la desviacin de Ho es menos probable que dicha desviacin no sea detectada. p 0,3 0,772 0,4 0,416 0,5 0,132 0,6 0,021 0,7 0,001 0,8 0,000

Si cambiamos la Regin de rechazo (R) por R={9,10, , 20} siendo X? B(20,0,25) entonces = P(e1)= P(rechazar Ho cuando p= 0,25)= P(x9 cuando X? B(20,0,25))= 1t8= 0,041 La P(e1) se ha reducido mediante el uso de la nueva Regin de rechazo. Sin embargo, se ha pagado un precio por esta reduccin ya que = P(e2)=P(mantener Ho si es falsa porque p=0,3)=P(x8 cuando X? B(20,0,3))= t8 = 0,887 En general, un buen contraste o buena regla de decisin debe tender a minimizar los dos tipos de error inherentes a toda decisin. Como queda fijado por el investigador, trataremos de elegir una regin donde la probabilidad de cometer el error de tipo II sea la menor.

Inferencia estadstica

8/8

También podría gustarte