Está en la página 1de 15

qwertyuiopasdfghjklzxcvbnmqwertyui Pruebas de Hiptesis opasdfghjklzxcvbnmqwertyuiopasdfgh jklzxcvbnmqwertyuiopasdfghjklzxcvb nmqwertyuiopasdfghjklzxcvbnmqwer tyuiopasdfghjklzxcvbnmqwertyuiopas Pruebas de Hiptesis dfghjklzxcvbnmqwertyuiopasdfghjklzx Probabilidad Y Estadstica cvbnmqwertyuiopasdfghjklzxcvbnmq wertyuiopasdfghjklzxcvbnmqwertyuio Giovanna

Karina Coba Jimnez pasdfghjklzxcvbnmqwertyuiopasdfghj klzxcvbnmqwertyuiopasdfghjklzxcvbn mqwertyuiopasdfghjklzxcvbnmqwerty uiopasdfghjklzxcvbnmqwertyuiopasdf ghjklzxcvbnmqwertyuiopasdfghjklzxc vbnmrtyuiopasdfghjklzxcvbnmqwerty uiopasdfghjklzxcvbnmqwertyuiopasdf ghjklzxcvbnmqwertyuiopasdfghjklzxc
25/05/2011 Alumno: [Escribir texto] Pgina 1

Pruebas de Hiptesis
PRUEBAS DE HIPOTESIS

Estadsticamente una prueba de hiptesis es cualquier afirmacin acerca de una poblacin y/o sus parmetros.

Una prueba de hiptesis consiste en contrastar dos hiptesis estadsticas. Tal contraste involucra la toma de decisin acerca de las hiptesis. La decisin consiste en rechazar o no una hiptesis en favor de la otra. Una hiptesis estadstica se denota por H y son dos:

- Ho: hiptesis nula - H1: hiptesis alternativa

ERROR TIPO 1 Y 2

El error tipo I se define como el rechazo de la hiptesis nula Ho cuando sta es verdadera. Tambin es conocido como nivel de significancia. Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del 5%. Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de significancia sera del 10%. Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50 cm/s, aunque la media muestral caiga dentro de la regin de aceptacin. En este caso se acepta Ho cuando sta es falsa. Este tipo de conclusin recibe el nombre de error tipo II.

El error tipo II error se define como la aceptacin de la hiptesis nula cuando sta es falsa. Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones diferentes que determinan si la decisin final es correcta o errnea.

Ingeniera Ambiental

Pgina 2

Pruebas de Hiptesis
Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de uno por lo general tiene como resultado un aumento en la probabilidad del otro. El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I, siempre se puede reducir al ajustar el o los valores crticos. Un aumento en el tamao muestral n reducir y de forma simultnea. Si la hiptesis nula es falsa, es un mximo cuando el valor real del parmetro se aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y el valor hipottico, ser menor

PRUEBAS DE HIPOTEIS PARA LA MEDIA

Cuando se van a realizar pruebas de hiptesis relativas a la media poblacional m se debe saber si la varianza poblacional s es conocida o desconocida, ya que la distribucin subyacente al estadstico de prueba ser la normal estndar si la varianza es conocida, y la distribucin t en caso contrario. Las diferentes hiptesis que se pueden presentar son las siguientes: 1) Ho: m = m0 H1: m > m0 2) Ho: m = m0 H1: m < m0 3) Ho: m = m0 H1: m m0 Las pruebas de hiptesis para la media se basan en el estadstico dado por la media muestral cuya distribucin tiende a la distribucin normal (m, s /n) para muestras grandes. Prueba de hiptesis para la media con varianza conocida Cuando la varianza s es conocida, las pruebas de hiptesis se basan en el hecho de que la variable aleatoria Z definida como , se distribuye normalmente con media cero y varianza unitaria. Para el caso de las hiptesis Ho: m = m0 contra H1: m > m0 vimos, al analizar las mejores pruebas, que la mejor regin crtica de tamao a consista en rechazar H0 si la media muestral era mayor o igual que una constante c dada por . Por lo tanto,

Ingeniera Ambiental

Pgina 3

Pruebas de Hiptesis
una vez tomada la muestra y obtenidos los valores x1, x2,, xn, se calcula la media muestral dada por: y los criterios de decisin seran los siguientes: a) Rechace Ho: m = m0 si c, donde . b) Calcule el estadstico de prueba y rechace Ho: m = m0 si Z Za. c) Calcule el estadstico de prueba y estime P como el rea en la distribucin normal estndar a la derecha del valor Z calculado, y rechace Ho: m = m0 si P < a. Para el caso de las hiptesis Ho: m = m0 contra H1: m < m0 la mejor regin crtica de tamao a consiste en rechazar H0 si la media muestral es menor o igual que una constante c dada por . Por lo tanto, una vez tomada la muestra y obtenidos los valores x1, x2,, xn, se calcula la media muestral , y los criterios de decisin sera los siguientes: a) Rechace Ho: m = m0 si c, donde . b) Calcule el estadstico de prueba y rechace Ho: m = m0 si Z Z1-a. Como Za = -Z1-a se rechaza Ho si Z -Za o equivalentemente, si Z Z a. c) Calcule el estadstico de prueba y estime P como el rea en la distribucin normal estndar a la izquierda del valor Z calculado, y rechace Ho: m = m0 si P < a. Por ltimo, si las hiptesis fueran Ho:m = m0 contra H1:m m0 la mejor regin crtica de tamao a (aunque no es uniformemente ms potente como en el caso de las dos anteriores) consiste en rechazar H0 si la media muestral es menor o igual que una constante c1 mayor igual que otra constante c2. Por lo tanto, una vez tomada la muestra y obtenidos los valores x1, x2,, xn, se calcula la media muestral , y los criterios de decisin seran los siguientes: a) Rechace Ho: m = m0 si c1 c2, donde y . b) Calcule el estadstico de prueba y rechace Ho: m = m0 si Z -Za/2 Z Za/2, simplemente, si Z Z a/2. c) Calcule el estadstico de prueba y estime P como el rea en la distribucin normal estndar a la izquierda del valor Z calculado si Z es negativo, o a la derecha del valor de Z si Z es positivo, y rechace Ho:m = m0 si P < a. Tambin P se puede calcular como el rea a derecha del valor absoluto de Z

Ingeniera Ambiental

Pgina 4

Pruebas de Hiptesis

PRUEBAS DE HIPOTESIS PARA UNA VARIANZA

Es frecuente que se desee comprobar si la variacin o dispersin de una variable ha tenido alguna modificacin, lo cual se hace con la prueba de hiptesis para la varianza. Hiptesis Se puede plantear uno de los siguientes tres tipos de hiptesis: - Prueba de hiptesis a dos colas H0 : H1 : =k k

- Prueba de hiptesis a una cola superior H0 : H1 : =k >k H0 : H1 : k >k

- Prueba de hiptesis a una cola inferior H0 : H1 : =k <k H1 : H1 : k <k

En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o corregida. Si se utiliza la varianza sin corregir ( (1.4): ) la estadstica de trabajo es la expresin

(3.6) Si se utiliza la varianza corregida, la estadstica de trabajo es la expresin (1.5):

(3.7) REGLA DE DECISION - Si se ha planteado la hiptesis alternativa como:


Ingeniera Ambiental Pgina 5

Pruebas de Hiptesis
H1 : k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de ) se divide en dos partes iguales, quedando estos valores en los

significancia (

extremos de la distribucin como se aprecia en la figura 3.8

Figura 3.8 Regla de decisin para una prueba de hiptesis a dos colas y pertenecen a una distribucin X2 con (n-1) grado de libertad. Si el valor y no se rechaza la hiptesis nula, <T<

de la estadstica de trabajo (T) est entre

en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si no se rechaza H0. - Si se ha planteado la hiptesis alternativa como: H1 :

> k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel

de significancia ( ) en la parte superior de la distribucin, vease figura 3.9

Figura 3.9 Regla de decisin para una prueba de hiptesis a una cola superior Z1pertenece a una distribucin X2 con (n-1) grado de libertad. Si el valor de la no se rechaza la hiptesis nula, en no se

estadstica de trabajo (T) es menor que

caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si T < rechaza H0 . - Si se ha planteado la hiptesis alternativa como:
Ingeniera Ambiental

Pgina 6

Pruebas de Hiptesis
H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel

de significancia ( ) en la parte inferior de la distribucin, vease figura 3.10

Figura 3.10 Regla de decisin para una prueba de hiptesis a una cola inferior Z pertenece a una distribucin X2 con (n-1) grado de libertad. Si el valor de la no se rechaza la hiptesis nula, en no se

estadstica de trabajo (T) es mayor que Z

caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si T >Z rechaza H0.

PRUEBAS DE HIPOTESIS, DIFERENCIA DE MEDIAS PARA LA TSTUDENT Y DISTRIBUCION NORMAL Se tienen dos poblaciones y se toman muestras aleatorias independientes de tamaos n 1 y n 2 , se puede comparar el comportamiento de dichas poblaciones a travs de los promedios. Hiptesis Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de hiptesis: - Prueba de hiptesis a dos colas H0 : = H0 : =k

Ingeniera Ambiental

Pgina 7

Pruebas de Hiptesis
H1 : H1 : k

- Prueba de hiptesis a una cola superior H0 : H1 : = > H0 : H1 : k >k

- Prueba de hiptesis a una cola inferior H0 : H1 : = < H0 : H1 : k <k

La estadstica de trabajo depende de las caractersticas de las poblaciones y del tamao de las muestras.

RAZON DE VARIANZA DE FISHER

Las tcnicas englobadas bajo la denominacin de anlisis de la varianza o abreviadamente ANOVA (del ingls analysis of variance) han jugado un papel crucial en la metodologa estadstica moderna, desde que fueran ideadas por R.A. Fisher en 1925, y como sucede en tantas ocasiones, aunque conocidas por la gran mayora, quizs no son adecuadamente comprendidas por los no especialistas. Casi siempre se introduce el tema del anlisis de la varianza como respuesta a la necesidad de utilizar una tcnica de comparacin de ms de dos grupos, es decir como un mtodo para comparar ms de dos tratamientos: si disponemos de medidas cuantitativas continuas, que se puede suponer como procedentes de una distribucin de probabilidad normal, y queremos comparar dos grupos -dos
Ingeniera Ambiental Pgina 8

Pruebas de Hiptesis
tratamientos-, la prueba estadstica que se utiliza es un contraste de medias basado en la t de Student, y cuando se dispone de ms de dos grupos, la prueba a emplear es el anlisis de la varianza. Personalmente, aunque el enfoque es adecuado, me parece que refleja solo una parte del inters de la tcnica, ideada no slo para analizar los datos sino tambin para planificar los experimentos, y creo ms apropiado hablar de que el anlisis de la varianza es un procedimiento estadstico que nos permite dividir la variabilidad observada en componentes independientes que pueden atribuirse a diferentes causas de inters. En el planteamiento ms simple de anlisis de la varianza tenemos una variable numrica cuantitativa (resultado), y queremos determinar en qu medida se puede atribuir la variabilidad de sta a otra variable cualitativa nominal que vamos a denominar factor. Estamos hablando por tanto de anlisis de la varianza para un solo factor, que puede tener 2 o ms categoras o niveles. Este factor, cuyo posible efecto sobre la variable medida queremos analizar, puede tener unos niveles fijos, por ejemplo el nivel educativo alcanzado por los sujetos que intervienen (sin estudios, estudios primarios, secundarios, formacin universitaria), y hablamos entonces de modelo de efectos fijos; o bien puede tratarse de una muestra procedente de un conjunto de niveles ms amplio, como puede ser por ejemplo el caso de un estudio en el que se seleccionan varios hospitales y se analiza las posibles diferencias entre hospitales. Entonces lo denominamos modelo de efectos aleatorios. En el anlisis de la varianza de 1 factor es mucho ms frecuente el modelo de efectos fijos. Vamos a plantear el problema y comentar los clculos que se efectan en un anlisis de la varianza para un factor. Estudiamos K grupos clasificados de acuerdo a los niveles 1,2 .. K del factor. En cada nivel tenemos n1, n2, ... nk observaciones independientes y obtenidas de forma aleatoria. Si designamos de forma general cada observacin como yij, el subndice i indica el grupo al que pertenece, j es el nmero de la observacin dentro de ese grupo, de tal manera que por ejemplo y25 corresponder al valor observado en el quinto sujeto del segundo grupo. Por tanto en el grupo 2 tenemos las observaciones y21 hasta y2n2.

Ingeniera Ambiental

Pgina 9

Pruebas de Hiptesis
Si juntamos todas las observaciones N=n1+n2+...+nk, calculamos la media global que vamos a denominar .

Tambin podemos calcular la media dentro de cada uno de los K grupos. La media para el grupo i la designamos como .

Es obvio que la diferencia entre cada observacin y la media global se puede descomponer de la siguiente forma: [1] Es decir que la diferencia entre el valor observado y la media global es igual a la suma de la diferencia de la observacin con la media de su grupo y la diferencia de la media del grupo con la media global. Se puede comprobar que si cada trmino de esa expresin se eleva al cuadrado y se suma para todas las observaciones, se mantiene la igualdad, lo que curiosamente no es ms que la aplicacin del famoso teorema de Pitgoras a este diseo:

Cada uno de los trminos es pues una suma de desviaciones cuadrticas, que denominaremos de forma abreviada como suma de cuadrados (SC). La primera SC del lado de la derecha corresponde a las desviaciones de cada observacin respecto de la media de su propio grupo, por lo que se la conoce como "dentro del grupo" o "intra grupo" (en ingls within). El segundo sumando de la derecha corresponde a las desviaciones de la media de cada grupo respecto de la media global, por lo que cuantifica las diferencias medias entre los grupos, y se conoce como suma de cuadrados "entre grupos" (en ingls between): SCTotal=SCIntra grupo+SCEntre grupos El cuadrado medio intra-grupo, equivalente a una varianza, lo calculamos dividiendo la suma de cuadrados entre los grados de libertad

Ingeniera Ambiental

Pgina 10

Pruebas de Hiptesis
y se puede comprobar que es en realidad una media ponderada de las varianzas muestrales de cada grupo, con la siguiente expresin:

Queda claro que constituye por tanto una estimacin de la varianza comn De igual manera podemos calcular el cuadrado medio entre grupos:

Si la media de todos los grupos es la misma, MSE tambin es una estimacin de la varianza comn . Esto se puede entender mejor de una forma intuitiva si

consideramos el caso particular en el que todos los grupos tienen el mismo tamao n. Sabemos que la desviacin estndar al cuadrado (varianza) de la media obtenida en muestras de tamao n extradas de una poblacin normal es lo que conocemos como error estndar de la media), por lo /n (es tanto

ser una estimacin de es una estimacin de .

/n y por tanto

Ahora bien, si las medias de los grupos s son diferentes, MSE no slo contiene el valor de la varianza intrnseca , sino que adems estar aumentada segn las

variaciones entre las medias de los tratamientos, y ser tanto mayor cuanto mayor sean estas diferencias. El cociente:

que compara la variabilidad entre grupos y la variabilidad intra grupos, ser por tanto prximo a 1 si las medias de los grupos son similares y tanto mayor que 1 cuanto mayores sean las diferencias entre los grupos. El valor de F obtenido se contrastar con el valor de la distribucin terica con grados de libertad K-1,N-K, y si la probabilidad de obtener un valor tan grande como el observado es baja, rechazaremos la hiptesis de igualdad de medias entre los grupos. La utilizacin de este parmetro de contraste, que tiene una rigurosa justificacin metodolgica
Ingeniera Ambiental Pgina 11

Pruebas de Hiptesis
estadstica, tambin tiene pues una interpretacin intuitiva: estamos comparando la variabilidad entre los grupos con la variabilidad intrnseca dentro de los grupos. Por otro lado hemos visto que la variabilidad total la hemos dividido en dos partes: una variabilidad debida o explicada por pertenecer a cada uno de los grupos o niveles del factor, y una parte de variabilidad individual, que no atribuimos a ninguna causa concreta, y que por ello se suele denominar tambin variabilidad residual. Esto podemos reflejarlo de una forma clara manipulando un poco la frmula [1] en la que se desglosa la variabilidad de cada observacin en dos trminos: [2] Es decir que el modelo postulado (trmino de la derecha) para nuestras observaciones corresponde a tres sumandos: una media global diferencial debido a la pertenencia al grupo o tratamiento no explicado . , un efecto

y un termino residual

PRUEBAS DE BONDAD DE AJUSTE PARA LA JI CUADRADA

De los datos obtenidos en una experimentacin, a veces es necesario conocer el tipo de distribucin a la cual se ajustan adecuadamente (normal, binomial o de Poisson). As, el investigador podr tambin elegir el procedimiento estadstico ms adecuado. Al respecto, es vlido el ejemplo siguiente: Ejemplo: Ajuste de datos para una distribucin normal, de un conjunto de mediciones en la tabla de nios de 5 aos. Tamao de la muestra 100. Eleccin de la prueba estadstica.

El modelo experimental tiene una muestra y nuestro objetivo es la bondad del ajuste.

Ingeniera Ambiental

Pgina 12

Pruebas de Hiptesis

Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Las frecuencias observadas difieren de las que corresponden a una distribucin normal.

Hiptesis nula (Ho). Las diferencias observadas entre los valores observados y los tericos se deben al azar.

Nivel

de

significacin.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho. Zona de rechazo.

Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha. Talla de nios de 5 aos de edad.

Aplicacin

de

la

prueba

estadstica.

Para calcular el valor terico, se debe aplicar el valor Z; por lo tanto, primero se debe obtener el valor promedio y la desviacin estndar de los valores por ajustar. = s = 3.91 En seguida se determinan los lmites reales de cada clase y se calcula el valor Z para cada lmite real. Para cada valor de Z, se localiza el valor del rea bajo la curva de valores Z. 100.1

Ingeniera Ambiental

Pgina 13

Pruebas de Hiptesis
Obtencin de valores tericos de la distribucin normal.

Una vez anotados los valores del rea bajo la curva normal para cada Z, se calcula el rea que corresponde a cada talla. Para fines prcticos y a fin de ejecutar el procedimiento, el signo de Z se mantiene en el valor del rea bajo la curva, y se realiza de la manera siguiente: Clase Clase Clase Clase 90 94 98 102 93 97 101 105 = = = = -0.4656 -0.2852 0.091 0.3944 (-0.4951) (-0.4656) (-0.2852) 0.091 = = = = 0.0295 0.1804 0.3762 0.3034

Clase 106 - 109 = 0.4884 - 0.3944 = 0.094 Cada valor del rea para la curva de clase se multiplica por el tamao de la muestra (N); en este caso corresponde a 100. Para obtener los valores tericos, se selecciona el valor entero ms cercano. En seguida se aplica la ecuacin de X2.

X2 = S 1.333 + 0 + 0.105 + (-0.1) + (-0.111) = 1.227 Clculo de los grados de libertad.

gl = K - 1 - 1 = 5 - 1 - 1 = 3 El valor de X2 calculado con 3 gl se compara con los respectivos valores crticos de la tabla de valores crticos de X2 y corresponde a 7.82 para una probabilidad de 0.05.

Ingeniera Ambiental

Pgina 14

Pruebas de Hiptesis
Decisin. En virtud de que el valor calculado cae en la zona de rechazo, se acepta Ho y se rechaza Ha. Interpretacin. Los valores de las frecuencias observadas para las cinco series de talla tienen una distribucin normal y no difiere de los valores calculados en funcin de las reas bajo la curva normal tipificada.

Ingeniera Ambiental

Pgina 15

También podría gustarte