Está en la página 1de 27

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA

CICLO 2012-1

PRCTICA No. 06: INFERENCIA ESTIMACIN Y PRUEBA DE HIPTESIS Ejemplo 1: Un grupo de investigadores en Medicina desea estimar el cambio medio de presin sangunea por paciente en un sanatorio. Se ha seleccionado una muestra al azar de 30 pacientes y se hall que puls/seg. Los investigadores saben que la desviacin estndar de los cambios de presin sangunea para todos los pacientes es = 3 puls/seg segn estudios anteriores. Ellos desean estimar el cambio medio de la presin sangunea por paciente con un intervalo del 95% de confianza, suponiendo que la variable aleatoria "cambios de presin sangunea" tiene asociada una distribucin normal de probabilidad. Respuesta: X = cambio en la presin sangunea por paciente del sanatorio (en pulsaciones por segundo) n = 30 Por tabla: = 3 1 - = 0.95 Entonces:

Lmite inferior (LI) =

Lmite superior (LS) = Por lo tanto resulta el Intervalo del 95% de confianza para la media: ICM0,95 = (3,9 ; 6,1) Luego, puede decirse que el cambio medio en la presin sangunea por paciente, pertenece al intervalo (3,9 ; 6,1) pulsaciones, con un nivel de confianza del 95%. Observacin: Ntese que se cae en un abuso de lenguaje pues se debera decir que el intervalo (3,9 ; 6,1) pulsaciones pertenece a la sucesin que ofrece un nivel de confianza del 95% para estimar el cambio medio de presin sangunea, pero se simplifica la expresin para hacerla menos engorrosa o extensa.

En cuanto al tamao ptimo de muestra, = e determina el error mximo admitido de muestreo e indica la precisin de la estimacin. Lgicamente se pretende que sea lo ms pequeo posible. Por otra parte, (1 - ) es el coeficiente de confianza y se pretende que sea lo ms grande posible. Pero depende del valor de y al hacer

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA

CICLO 2012-1

mayor el coeficiente de confianza (1 - ), el valor ser mayor y por lo tanto el error aumentar. Esto se puede regular aumentando el tamao de la muestra con lo que el error disminuir.

Para el ejemplo 1,

con un nivel de confianza del 95%.

Si se desea elevar el nivel de confianza a 99%, pero sin aumentar el error e de estimacin, el tamao de la muestra debera ser:

O sea que debe tomarse una muestra de aproximadamente 52 pacientes en lugar de 30. Por el contrario, si el investigador deseara un error de estimacin menor, por ejemplo 1 puls/seg, manteniendo el nivel de confianza en 95%, el tamao de la muestra requerido ser:

pacientes. [Vuelve al ndice] CASO 2) Con desconocido Para estimar se debe utilizar el desvo estndar muestral corregido.

, ya que segn se ha visto, es un estimador insesgado del correspondiente parmetro poblacional . Reemplazando en la variable tipificada por resulta:

Por lo tanto:

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA = 1- [Vuelve al ndice]

CICLO 2012-1

Ejemplo 2: Una muestra de 15 aves tomadas al azar en un establecimiento con 5000 aves, (que elabora alimentos balanceados), permiti establecer un aumento de peso promedio de 90 g por semana y por ave, y un desvo tpico de 10 g. Se busca estimar el incremento de peso promedio para las 5000 aves del establecimiento con un intervalo de confianza del 90%. Respuesta: X = aumento de peso por ave n = 15 = 90 g S = 10 g ICM0,90?

Por tabla: y el intervalo resulta:

Interpretando este resultado, se dice que el aumento de peso por ave por semana en el establecimiento est entre 85,5 y 94,6 gramos, con un 90% de confianza. [Vuelve al ndice] INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CASO 1: Poblaciones normales y con y conocidos.

Se fija el nivel de confianza (1 - ), se extraen dos muestras independientes de X1 y X2 de tamao n. Ya se ha visto que:

y el estadstico tipificado tiene la siguiente

distribucin:

(1)

Adems,

(2)

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA Reemplazando en (2), a Z por la expresin (1), se obtiene:

CICLO 2012-1

Donde:

[Vuelve al ndice] Ejemplo 3: Al determinar la superficie en miles de hectreas de las explotaciones agrcolo-ganaderas de cierta zona, una muestra de 40 explotaciones dio una superficie media de 900 ha, con una desviacin tpica de 300 ha. En otra zona, al muestrear tambin 40 explotaciones, la superficie media fue de 600 ha con una desviacin tpica de 150 ha. Suponiendo que en ambas zonas la variable "superficie en ha por explotacin" se distribuye normalmente, estimar por un intervalo de confianza del 90%, la diferencia entre las superficies medias de las explotaciones de ambas zonas. Respuesta: X1 = superficie de cada explotacin agrop. de la primera zona X2 = superficie de cada explotacin agrop. de la segunda zona , Por tabla: Luego: n = 40 ICDM0,90?

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA = 300 87,24 = (212,76 ; 387,24) = (212,8 ; 387,2)

CICLO 2012-1

Interpretando este resultado, se dice que la diferencia entre las superficies medias de las explotaciones agrcolo-ganaderas de ambas zonas, se encuentra entre 212,8 y 387,2 ha, con un 90% de confianza. Observacin: En la frmula tambin puede utilizarse considerarse en lugar de [Vuelve al ndice] CASO 2: Poblaciones normales desconocidos y con y y en ese caso debe

Se extraen dos muestras independientes (una de cada poblacin) de tamaos n1 y n2 respectivamente, se fija (1 - ), se calculan y su diferencia. a) Si 1 y 2 son desconocidos pero estadsticamente pueden considerares iguales ( 1 = 2), se estiman por variancia amalgamada o mancomunada) y se procede como en el caso 1. (S a es la

b) Si 1 y 2 son desconocidos pero estadsticamente no pueden considerarse iguales ( 1 2), Se fija (1 - ), se extraen dos muestras independientes, se calcula distribucin en el muestreo del estadstico de prueba, ya tipificado, es: y la

t donde el nmero de grados de libertad de la distribucin t de Student viene dado por la frmula:

De manera anloga al primer caso, se deduce que:

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA

CICLO 2012-1

[Vuelve al ndice] Ejemplo 4: Las variables aleatorias X1 y X2 distribuidas normalmente, representan las edades al morir de tuberculosis de los individuos en dos ciudades. Una muestra de 10 individuos que murieron por tal enfermedad en la primera ciudad dio una edad media de 48 aos y una desviacin tpica de 5 aos. En la segunda ciudad, una muestra de 12 individuos dio una edad media de 41 aos y una desviacin tpica de 3 aos. Se desea estimar por intervalos con un 95% de confianza, la diferencia entre las edades medias de los muertos por tuberculosis en ambas ciudades, sabiendo que investigaciones anteriores no permiten tomar las desviaciones tpicas de ambas variables como iguales. X1 = edad al morir de tuberculosis en la ciudad A. X2 = edad al morir de tuberculosis en la ciudad B.

n1 = 10,

, S1 = 5 , S2 = 3, 1 2 ICDM0,95?

n2 = 12,

Respuesta:(corresponde al item b) del caso 2) Con estos datos, reemplazamos en la frmula para calcular los grados de libertad:

grados de libertad. Luego, por tabla, t0,05; 15 = 2,1315 y finalmente el intervalo resulta:

ICDM0,95 = = 7 3,843 = (3,157 ; 10,843) (3 ; 11) Interpretando el resultado se puede decir que la diferencia entre las edades medias de las personas que murieron de tuberculosis en ambas ciudades, se encuentra entre 3 y 11 aos, con una confianza del 95%.

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA

CICLO 2012-1

INTERVALO DE CONFIANZA PARA LA VARIANCIA POBLACIONAL Suponemos: Poblacin normal X N( , ) Se fija (1 - ) y el estadstico tipificado de prueba tiene una distribucin muestral:

(1) donde 2 es la variancia poblacional.

Adems: Reemplazando (1) en (2) resulta:

(2)

Invirtiendo fracciones:

Multiplicando miembro a miembro por (n - 1) .S2 para despejar 2, se obtiene:

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA

CICLO 2012-1

Invirtiendo la desigualdad: [Vuelve al ndice] Ejemplo 5: Un productor de fertilizantes, para controlar el buen embolsado de sus productos, pesa 15 bolsas del mismo, obteniendo una desviacin tpica de 0,50 kg. Qu varianza puede inferirse con un 98% de confianza que tendr la produccin total? Respuesta: X = peso de cada bolsa de fertilizante n = 15 S = 0,50 kg. ICV0,98?

Por tabla: Luego, el intervalo buscado es:

Se interpreta este resultado diciendo que existe un 98% de confianza de que la variancia del peso por bolsa en toda la produccin de bolsas de fertilizantes de ese productor est entre 0,12 y 0,75 Observaciones: 1) Del intervalo de confianza visto para la variancia, se deduce el correspondiente para el desvo tpico:

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA

CICLO 2012-1

Para el ejemplo 5: 2) Si n > 100 , los valores ya no se encuentran en la tabla de la distribucin Chi cuadrado, y por lo tanto se la aproxima a una normal, utilizando para aproximar percentiles en esta distribucin:

Y el intervalo buscado es:

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA PRUEBA DE HIPTESIS

CICLO 2012-1

INTRODUCCIN.- Recurdese que muchas veces el objetivo de la Estadstica es hacer inferencias con respecto a parmetros poblacionales desconocidos, basadas en la informacin obtenida mediante datos muestrales. Estas inferencias se expresan en una de dos maneras, como estimaciones de los parmetros respectivos o como pruebas de hiptesis referentes a sus valores. En este captulo o parte se estudiar el tema de la prueba (o contraste, o test) de hiptesis. Con frecuencia, los problemas a los que se enfrenta el cientfico o el experimentador no se refieren slo a la estimacin de un parmetro poblacional como se indic en el captulo precedente, sino, y es an ms frecuente en los problemas prcticos, el que se tenga que formular un procedimiento de decisin basado en los datos que conduzcan a una conclusin acerca de algn planteamiento cientfico. Esta es la situacin en que se encuentra, por ejemplo, un investigador que pretende demostrar que la droga A es ms efectiva para el tratamiento de cierta enfermedad que la droga B; cuando un siclogo desea comprobar si cierto formato de instruccin incrementar la eficiencia en el aprendizajes; cuando un ingeniero agrnomo desea comprobar si una nueva distancia de siembra entre surcos, para un cultivo, produce mejores rendimientos que las distancias que se usaban comnmente en la zona; cuando el jefe de marketing asegura que determinado producto se aceptado por el 60% de la poblacin consumidora, etc. En cada uno de los anteriores casos el responsable del estudio postula o conjetura algo acerca de un sistema. Estos constituyen enunciados provisionales, puesto que al no poder integrar el cmulo de sus conocimientos todo lo concerniente a la situacin, aparece la incertidumbre. La funcin de la estadstica en su aspecto inferencial es la de apoyar el razonamiento para llegar a decisiones slidas a pesar de la incertidumbre. Al respecto, es tan importante el papel que desempea la estadstica en estas situaciones que se suele hablar de la estadstica moderna como "el estudio de las decisiones ante la incertidumbre" . Se puede decir que se llaman decisiones estadsticas a las decisiones que deben tomarse con respecto a las poblaciones a partir de una informacin obtenida de una muestra de las mismas. Por ejemplo, a partir de los datos del muestreo podemos querer llegar a decidir si un suero nuevo es realmente efectivo para la cura de una enfermedad, si un sistema educacional es mejor que otro, si una moneda est o no cargada, etc. En los casos que se han sealado se observa que se deben tomar decisiones con base en datos experimentales. Y si hay que tomar decisiones es porque hay alternativas; cada una de estas alternativas es formalizada como una hiptesis estadstica y el proceso mediante el cual se enfrentan o confrontan las hiptesis al tomar como punto de apoyo los datos muestrales constituye lo que se denomina prueba o contraste de hiptesis. ELEMENTOS DE UN TEST DE HIPTESIS.- Una hiptesis es una suposicin sobre la naturaleza de una poblacin. Las hiptesis generalmente estn expresadas en trminos de parmetros poblacionales. Las siguientes son algunos ejemplos de hiptesis: Ho : = 5 (la media poblacional es igual a 5) H1 : < 67 (la media poblacional es menor que 67)

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA 2 = 4 (la variancia poblacional es igual a 4)
2

CICLO 2012-1

>11 (la variancia poblacional es mayor que 11)

Un test de una hiptesis es un procedimiento estadstico usado para tomar una decisin sobre el valor de un parmetro poblacional. La hiptesis nula ( H0) especifica el valor de un parmetro poblacional. Se conduce un experimento para ver si el valor especificado no es razonable. Ejemplo: Un semillero publicita que el peso promedio de una espiga de una cierta variedad es de 180 gramos con una desvo estndar de 30 gramos. Un productor de avanzada sospecha que el peso es distinto de 180 gramos, decide por lo tanto conducir un experimento. El propsito del mismo es ver si el peso de 180 gramos es incorrecto. Por lo tanto la hiptesis nula de inters es: H0 : = 180 gramos La hiptesis alternativa (H1) da una suposicin opuesta a aquella presentada en la hiptesis nula. El experimento se lleva a cabo para conocer si la hiptesis alternativa puede ser sustentada. En el ejemplo previo el productor sospecha que el peso medio es distinto de 180 gramos. Esta es la hiptesis a ser sustentada y as la hiptesis alternativa es: H1 > 180 gramos < 180 gramos 180 gramos Se puede ver que las hiptesis son excluyentes. La hiptesis alternativa frecuentemente se llama hiptesis de investigacin, porque este tipo de hiptesis expresa la teora que el investigador o experimentador cree va a ser verdadera. Un test estadstico es una cantidad calculada de la muestra y se usa cuando se va a hacer una decisin sobre la hiptesis de inters. Despus que el productor de este ejemplo prueba la variedad en 50 parcelas sembradas al azar, seleccionando un conjunto de espigas por parcela, el test estadstico debe ser calculado. Por ejemplo la media de la muestra se podra usar como test estadstico para tomar una decisin acerca del valor de , o si se obtiene una muestra suficientemente grande se podra utilizar una estadstica z para comparar el valor observado de con respecto a 180 gramos especificado en la hiptesis nula. As un posible test estadstico cuando 2 se conoce, sera:

Para interpretar el valor del test estadstico es necesario introducir un elemento ms al test de hiptesis: la regin de rechazo, que especifica los valores del test estadstico para los cuales la hiptesis nula es rechazada ( y para los cuales la hiptesis alternativa no es rechazada). La regin de rechazo identifica los valores del test estadstico que sostienen o sustentan la alternativa y seran improbables, (raros) si la hiptesis nula fuera verdadera. Ya que no se espera observar sucesos raros (valores improbables del test estadstico) la hiptesis nula se rechazar cuando la muestra produzca un valor tal.

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA

CICLO 2012-1

CURSO: ESTADSTICA Y DEMOGRAFA Para el ejemplo si la media fuera menor que 180 gr o mayor que 180 gr esta sustentara la hiptesis alternativa: ( 180) y un valor de ms de 2, (1,96) errores estndares por debajo o por encima de 180 sera raro o poco probable. El propsito de cualquier test de hiptesis es decidir cual hiptesis - la nula o la alternativa - sera rechazada. Ya que cualquier decisin estar basada sobre informacin parcial de una poblacin, contenida en una muestra, habr siempre una posibilidad de una decisin incorrecta. La siguiente tabla resume cuatro posibles situaciones que pueden surgir en un test de hiptesis.

Verdadero estado de la poblacin Decisin posible Se rechazo H0 No se rechaza H0 H0 es cierta Error de tipo I ( ) Decisin correcta H1 es cierta Decisin correcta Error de tipo II ( )

Si la hiptesis nula es rechazada y de hecho, la hiptesis nula es verdadera, se cometi un error, que se llama Error de tipo I ( ). Un Error de tipo II ( ) ocurrira si la hiptesis nula fuera aceptada y de hecho, la hiptesis alternativa es verdadera. Ya que nunca se puede eliminar la posibilidad de cometer un error de tipo I o un error de tipo II cuando se usan muestras para hacer inferencias, se considerarn las posibilidades de cometer estos errores. = P (error de tipo I) P (rechazar H0 si H0 es verdadera) = P (error de tipo II) P (aceptar H0 si H0 es falsa) Es deseable que tanto como estn prximos a cero pero en general esto no es posible, ya que el experimentador desea concluir que H 1 es verdadera (rechazar H0 ) el inters est en que tenga una probabilidad pequea tal como 0,01 0,05. En otras palabras , se desea estar seguro que si H0 es verdadera, ser muy raro que sea rechazada. El experimentador es libre de elegir el valor de , esto es, determinar cun raro un suceso observado debe ser para rechazar H0. Determinar si el valor de estar presente para el test de hiptesis es algo ms complicado, de modo que no se intentar su clculo. Manteniendo pequeo se evita aceptar la hiptesis de investigacin (alternativa) si la hiptesis nula es verdadera. De otra forma se inducira a la crtica de que se ha sesgado la investigacin para probar la alternativa. El sacrificio de mantener pequea es que la

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA

CICLO 2012-1

"chance" de aceptar la hiptesis nula, si la hiptesis de investigacin es verdadera ( ), puede ser mayor de lo que se desea. Resumiendo, en el ejemplo considerado el productor aceptando un error de 0,05 (5%), conocido tambin como nivel de significacin y utilizando la estadstica z, planteara la hiptesis como sigue: H0 : = 180 gramos H1 : 180 gramos

Suponiendo que los resultados del experimento produjeron una media muestral de 187 gramos, el test estadstico se construira como:

donde : 187 = media de la muestra ( 180 = media hipottica (poblacional

= 187) = 180)

30 = desvo estndar poblacional (conocido) ( =30) 50 = tamao de la muestra o repeticiones (n=50) Para decidir si la hiptesis nula (H0) se rechaza o no se compara el valor de z calculado ( 1,65) con el valor de z tabulado N (0,1), para un nivel de probabilidad = 0,05. Por tratarse de una prueba bilateral, indicado por la desigualdad de la hiptesis alternativa ( 180) el valor de se particiona en dos /2 = 0,025, lo que implica que la probabilidad con la que se busca el valor de z, en la tabla de la distribucin normal es 0,975, el valor de z correspondiente a esta probabilidad es 1,96.
Grficamente las zonas de rechazo y aceptacin seran:

Como el valor de z calculado= 1,65 es menor que l,96 o sea cae en la regin de aceptacin , no hay evidencias sufucientes como para rechazar la hiptesis de que la media de la poblacin es igual a 180.

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA

CICLO 2012-1

CURSO: ESTADSTICA Y DEMOGRAFA Conclusin: la publicidad que hace el semillero de que el peso promedio de las espigas de una cierta variedad es de 180 gramos, es correcta, aunque podra existir una probabilidad de error tipo II, si de hecho la media de tal variedad no fuera 180 gramos HIPTESIS UNILATERALES Si en el mismo ejemplo, el productor, basndose en algn conocimiento de la variedad en cuestin sospechara que el peso promedio de las espigas es menor que 180, las hiptesis se plantearan como: H0: = 180 gramos o H0 : > 180 gramos H1: < 180 gramos = 0,05 En este caso la desigualdad de la hiptesis alternativa indica cul sera la zona de rechazo, el valor de ya no se particiona sino que se acumula todo hacia un solo lado, el izquierdo en este ejemplo y el valor tabulado de z se busca en la tabla con un valor de probabilidad del 95% siendo z= -1,64 (el signo negativo no figura en la tabla ya que siendo la distribucin normal simtrica, lo que se hace es anteponer el signo negativo al valor de z que corresponde al nivel de probabilidad especificado)

Si por otra parte, el productor sospechara que el peso promedio es mayor que 180 gramos, la hiptesis y la zona de rechazo se plantearan como: H0: = 180 gramos H0: < 180 gramos H1: > 180 gramos = 0,05

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA en ambas situaciones el test estadstico se construye como:

CICLO 2012-1

cuando

se desconose, el test estadstico se construye como:

Este valor difiere del anterior en que, en lugar de aparecer la desviacin estndar de la poblacin, nos encontramos con su estimador muestral insesgado S, que se distribuye, t de Student (t t(n-1)) POTENCIA DEL CONTRASTE Partiendo del planteo de las siguientes hiptesis: H0 : = 0 H1 : 0

La probabilidad de error tipo I ( ) est dada por el nivel de significacin; en cambio, la probabilidad del error tipo II ( ) ya no es una cantidad determinada para cada nivel de significacin, sino que depende del valor de . La probabilidad del error tipo II ( ) para valores de prximos a 0 es grande en comparacin con la probabilidad de este error para valores de que estn alejados de 0.

Por ejemplo, si H0 afirma que la media es igual a 20, la probabilidad de no rechazar H 0 es evidentemente mayor si la verdadera media es 25 que si es 30. Esto se detalla con mayor claridad en la siguiente figura en el que el rea rayada indica la probabilidad de error tipo II ( ).

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA

CICLO 2012-1

CURSO: ESTADSTICA Y DEMOGRAFA Por supuesto se puede calcular la probabilidad de error tipo II para cualquier valor de . Cuanto menor sea esta probabilidad mejor ser el contraste para distinguir entre hiptesis ciertas y falsas, o sea, cuanto menor sea la probabilidad de no rechazar H0, cuando esta sea falsa, ms "potente" es el contraste. La potencia de un contraste se mide por la probabilidad de rechazar H0 cuando sea falsa. Al ser la probabilidad de no rechazar H0 cuando esta es falsa, la potencia del contraste es igual a: 1 - P ( error tipo II ) ESQUEMA PARA CONTRASTAR HIPTESIS Cuando se tiene que contrastar una hiptesis estadstica es conveniente seguir un esquema, el cual debe incluir las siguientes etapas: 1) Enunciado de la hiptesis nula y alternativa 2) Eleccin del nivel de significacin ( ) 3) Seleccin del estadstico de prueba. 4) Determinacin de la regin crtica. 5) Clculo del estadstico. 6) Exposicin de las conclusiones. CONTRASTE DE HIPTESIS RESPECTO A UNA MEDIA POBLACIONAL ( desconocido) Las hiptesis se plantean de forma similar al caso en que es conocido, pero la estadstica de prueba es la "t" de Student. Ejemplo: Para estimar el rendimiento de parcelas plantadas con papa de una cierta variedad, se cosecharon ocho de ellas, obtenindose la siguiente informacin expresada en kg/parcela: 4,5 5,3 5,4 4,9 5,3 5,7 6,2 4,8 Se puede asegurar, con =0,05, de que esta variedad de papas tiene un rendimiento promedio de 5,25 kg? H0 : = 5,25 H1 : 5,25 y S, para este ejemplo = 5,5625 y S =0,2884.

A partir de los datos se calcula

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA

CICLO 2012-1

= Como el valor de t calculado cae entre 2,365 y 2,365 (valor tabulado de t para 7 grados de libertad y = 0,025, no se rechaza la hiptesis nula. Conclusin: No hay duficiente evidencia, a partir de los datos de la muestra, para decir que el rendimiento de papa por parcela no es igual a 5,25. CONTRASTE DE HIPTESIS POBLACIONAL (P) Las hiptesis formuladas son: H0: P P0 REFERENTES A UNA PROPORCIN

H1: P < P0 : 0,05 En el caso del parmetro poblacional "P", cuando el tamao de la muestra es grande, la variable aleatoria proporcin muestral "p" se distribuye aproximadamente normal con esperanza igual a P y desviacin estandar igual Por eso se puede utilizar "p" como criterio de test para probar la hiptesis con respecto al parmetro proporcin poblacional. El test estadsto z se calcula:

Grficamente podemos establecer la correspondiente regin de rechazo de H0 en la cola de la distribucin normal

Ejemplo: Se supone que en un cierto partido de la provincia de Buenos Aires, el 90% de los productores cultivan maz. De 110 productores de la zona que se encuestaron, 95 hacen maz. Est este resultado en conformidad con el valor supuesto?. ( = 0,05)

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA H0: P = 0,90 H1: P 0,90

CICLO 2012-1

Como el valor calculado de Z = 0,97 reside entre los valores tabulados 1,96 y 1,96 (valores crticos de la distribucion normal ) no se rechaza H0. Conclusin, la informacin proporcionada por la muestra no es suficiente como para decir que la proporcin de productos de tal partido que cultivan maz es distinto de 90%. CONTRASTE DE HIPTESIS REFERENTES AL PARMETRO VARIANZA POBLACIONAL Por ejemplo, un operador en la bolsa de cereales, aconseja a un cliente con respecto a una inversin de compra y destaca la poca variabilidad de dicha cotizacin. De acuerdo a lo estipulado por l, esta accin presentara una varianza en las cotizaciones diarias = 0,2. El cliente, quien debe realizar una fuerte inversin, decide poner a prueba la hiptesis del operador, estableciendo las siguientes hiptesis estadsticas: H0) H1) 0,2 > 0,2 = 0,05, como nivel de significacin.

Fijamos:

Para probar esta hiptesis selecciona una muestra de 15 das donde se registra la cotizacin diaria. El clculo de la varianza en la muestra es S2 = 0,4. El test estadstico es:

que se distribuye como una

con (n - 1) grados de libertad.

Se calcula el valor del estadstico planeado:

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA

CICLO 2012-1

Grficamente se tendr:

Como se puede observar, el estadstico utilizado como criterio para realizar el test, cae en la zona de rechazo de la hiptesis nula. Conclusin: La evidencia muestral parece indicar que el operador estaba equivocado y que en realidad la cotizacin diaria es bastante ms variable de lo que l cree. PRUEBAS DE HIPTESIS DE LAS VARIANCIAS DE DOS POBLACIONES NORMALES Cuando se trata de comparar las variancias se utiliza la variable F=S1/S2, que como se sabe est relacionada con la distribucin F con (n1-1, n2-1) grados de libertad. Se recomienda colocar siempre en el numerador la variancia muestral asociada a la variancia poblacional mayor estos es, a. Si H1: 1 > 2 La estadstica de prueba se toma como F=S1/S2 . b. Si H1: 2 > 1 La estadstica de prueba se toma como F=S2/S1. c. Si H1: 1 2 La estadstica de prueba se toma de tal manera que la mayor de las variancias muestrales aparezca en el numerador. Las tablas de la distribucin F generalmente proporcionan los puntos de la cola superior de la distribucin F as que para encontrar utilizarse valor de la cola inferior, debe

, donde f es el valor tabulado de F

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA

CICLO 2012-1

CURSO: ESTADSTICA Y DEMOGRAFA Ejemplo 1: Se compar la eficacia de dos tipos de aceites para evitar el desgaste en ciertas piezas sometidas a intenso trabajo. En trece piezas se utiliz el aceite 1 y en otras trece el aceite 2. Las variancias muestrales fueron S 1 = 64, S2 = 16. Se desea verificar la hiptesis nula segn la cual las variancias de las dos poblaciones son iguales. ( = 0,05) H0: 1 = 2 H1: 1 2 n1 = n2 = 13, = 0,05

Como el valor calculado de F =4 supera el valor tabulado de la cola superior de la distribucin, no puede concluirse, al nivel del 5% que las variancias sean iguales. Siguiendo el criterio de colocar en el numerador siempre la variancia mayor, es suficiente considerar el valor tabulado de la zona derecha de la distribucin F. CONTRASTE DE HIPTESIS REFERENTE POBLACIONALES: MUESTRAS INDEPENDIENTES Los desvos de las poblaciones son conocidos Los supuestos que se deben cumplir son que las medias poblacionales
1

DOS

MEDIAS

son

normales, los desvos poblacionales y conocidos y las muestras, independientes, de tamao n1 y n2 respectivamente, estableciendo las siguientes hiptesis: H0 ) 1 - 2 = 0 1 = 2 a ) H1 ) 1 2

b) H1 ) 1 > 2 c) H1 ) 1 < 2 = 0,05 En cualquiera de estos casos el test estadstico que se utiliza es

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA que se distribuye como una N ( 0,1).

CICLO 2012-1

Si y son iguales, lo que equivale a decir que hay una sola variancia, la frmula anterior se puede reemplazar por la siguiente:

En el contraste a) valores grandes y pequeos de( )y por lo tanto pequeos de Z son suficientes para confirmar H1. Por lo tanto para un ensayo bilateral con nivel de significacin , la hiptesis H0 se rechaza si : Z< Z> ) y de Z confirman la hiptesis H1.

En el contraste b) slo valores grandes de ( En un ensayo unilateral, rechazamos H0 cuando: Z > Z 1-

En el contraste c) valores pequeos de la diferencias de medias muestrales y por lo tanto valores pequeos de Z confirman H1 y rechazamos H0 cuando: Z<Z Ejemplo 2: El porcentaje de calcio de dos muestras de soja se determin por dos mtodos de mineralizacin: (A) cenizas secas y (B) mineralizacin hmeda. Los datos obtenidos fueron: (A): 0,32 3,32 0,36 0,29 0,27 0,29 0,28 (B): 0,35 0,35 0,34 0,36 0,31 0,28 0,28 Se sabe, por experiencias anteriores que 1 = 1 = 0,03. Se desea verificar si ambos mtodos producen los mismos resultados. ( = 0,05). H0 ) A = B A - B = 0 H1 ) A B

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA

CICLO 2012-1

CURSO: ESTADSTICA Y DEMOGRAFA Por ser un test bilateral, los valores crticos de la distribucin normal, para = 0,05 son 1,96 y 1,96. Como el valor de la estadstica calculada cae entre los valores crticos, no hay evidencias como para rechazar la hiptesis nula. Por lo tanto las media de los dos metodos de mineralizacin no difieren. Los desvos de las poblaciones son desconocidos: a) Se suponen iguales ( ):

Los supuestos que se deben cumplir son: datos extrados de dos muestras aleatorias independientes de tamao n1 y n2 respectivamente, cuyas poblaciones son normales con medias poblacionales 1 y 2. Las variancias poblacionales no se conocen y se supone que son iguales. Primero se debera docimar la igualdad de dichas varianzas, en particular si los tamaos de las muestras son distintos, a travs de la prueba de F de Snedecor. Si son estadsticamente iguales, aplicamos el siguiente test estadstico:

donde que se distribuye aproximadamente como una t de Student con n 1 + n2 -2 grados de libertad. (tn1 + n2 - 2) Ejemplo 3: Dieciocho plantas de una misma variedad de naranjos fueron tratadas con fertilizantes. A nueve de ellas se les aplico una cierta dosis de nitrgeno (N) y al resto una de nitrgeno y fsforo (NP). Se midi el rendimiento en Kg. por planta; los resultados obtenidos fueron: _ N: X = 28 kg S = 9 _ NP: X = 21 kg S = 7 Interesa conocer si existen diferencias significativas entre los rendimientos de las plantas tratadas con los dos tipos de fertilizante. ( = 0,01). H0 ) N = NP N - NP = 0 H1 ) N NP

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA

CICLO 2012-1

CURSO: ESTADSTICA Y DEMOGRAFA Suponiendo que las variancias poblacionales son iguales, de las cuales S N y SNP son estimaciones, se calcula la variancia amalgmada. Si el supuesto no fuera vlido debera verificarse primeramente la homogneidad de varinacia a travs del test F, en particular si las muestras de las poblaciones no son iguales.

Donde

El valor tabulado de t, para 16 grados de libertad y nivel de significacin del 1% es igual a 2,921. Como el valor de la estadstica calculada supera al valor tabulado, se rechas H0 . Conclusin existen diferencias estadsticamente significativas entre los tratamientos, siendo superior el promedio por planta de naranjo, de aquellas que reciben el tratamiento NP. b) se suponen distintos ( )

Los supuestos son los mismos, pero el test estadstico es:

estadstica que se distribuye aproximadamente como una t de Student con libertad que se obtienen mediante la frmula de Satterwitte:

grados de

Grficamente podemos representar la zona de aceptacin y rechazo en la distribucin t

si t < -t

t>t

si t < -t

t>t

Se rechaza H0 Se rechaza H0 Se rechaza H0

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA CONTRASTE DE HIPTESIS REFERENTE POBLACIONALES: MUESTRAS APAREADAS

CICLO 2012-1 A DOS MEDIAS

Esta estrategia de la investigacin surge cuando cada observacin para un tratamiento est apareada con otra observacin para el otro tratamiento. Este par est compuesto por las mismas unidades experimentales observadas dos veces en distintos momentos de la investigacin, o por unidades semejantes. El procedimiento consiste en buscar pares de unidades experimentales con caractersticas similares y asignar aleatoriamente cada unidad del par a cada uno de los dos tratamientos en estudio. Por ejemplo parejas de gemelos pueden ser asignadas al azar para que reciban dos tratamientos, de tal manera que los miembros de una sola pareja, reciban tratamientos distintos. Pueden as mismo ensayarse dos raciones distintas en dos lotes de terneros formando pares de raza de la misma edad, sexo, etc. y ocurrir que al cabo de un tiempo , exista diferencia significativa o no, entre los promedios de ganancia de peso de ambos lotes, (se elimina la influencia diferencia de calidad entre los lotes). Tambin puede ocurrir que al estudiar en dos lotes de plantas homogneas de a pares, la aplicacin de herbicidas (uno en cada lote), para ciertas plagas (se obtenga diferencias de resistencia entre los lotes de plantas). La hiptesis planteada es: H0 ) H1 ) = 0,05 Como se establece una hipotesis de un nico parmetro poblaciona (se podra pensar en una sola muestra)
,

H0) H1)

H0) > 0 H1) <0

el nmero de grados de liberatd es (n - 1) el test estadstico es:

donde

luego se compara el tc con tn -1 . Las reglas de decisin son: No se rechaza H0 cuando -t <t<t

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA Rechazar H0 si t < -t t > t

CICLO 2012-1

Ejemplo 4: La siguiente tabla muestra los niveles de colesterol en suero para 12 individuos , al principio del programa (ANTES) y al final del mismo (DESPUES).

INDIVIDUO 1 2 3 4 5 6 7 8 9 10 11 12 TOTAL

ANTES XI 201 231 221 260 228 237 226 235 210 267 284 201

DESPUES YI 200 236 216 233 224 216 296 195 207 247 210 209

di -1 +5 -5 - 27 -4 - 21 - 30 - 40 - 33 - 20 - 74 +8 -242

di2 1 25 25 625 16 441 900 1600 1089 400 5176 64 10.766

La pregunta que se plantea es: proporcionan los datos suficiente evidencia cmo para concluir que el programa es efectivo en la reduccin de los niveles de colesterol en suero? Aplicar un test de hiptesis para llegar a una decisin al repecto, utilizando un 0,05. Las hiptesis planteadas son: H0) del

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA H1) <0

CICLO 2012-1

= 0,05

t (11; 0,05) = - 1,7959 (valor de tabla) Se rechaza H0 ya que -3,02 es menor que -1,7959 Conclusin: Se rechaza la hiptesis nula, existen diferencias altamente significativas entre ANTES y DESPUES. El programa es efectivo. PRUEBA DE HIPTESIS POBLACIONALES REFERENTE A DOS PROPORCIONES

Sean y las proporciones muestrales de dos grandes muestras de tamaos n1 y n2 extradas de poblaciones que tienen proporciones P1 y P2 respectivamente. Considrese la H0 de que no hay diferencias entre los parmetros poblacionales, es decir: H0 : P1 = P2, implica que (P1 P2) = 0 H1: P1 P2 Una estimacin de la proporcin poblacional se puede obtener como:

La distribucin muestral de la diferencia de proporciones aproximadamente normal con media y variancia dadas por:

se

distribuye

p1-p2 = 0 p1-p2 = pq(1/n1+1/n2) (los p de los subndice tienen sombrero)

y Por lo tanto la estadstica de prueba esta dada por:

UNIVERSIDAD RICARDO PALMA FACULTAD DE MEDICINA HUMANA CURSO: ESTADSTICA Y DEMOGRAFA

CICLO 2012-1

N(0, 1)

Ejemplo 5: Sobre parcelas sembradas con dos variedades distintas de maz (A y B), se aplic un herbicida que result ser nocivo en el sentido que destruy gran parte de las plantas. De un total de 500 plantas de la primera variedad fueron destruidas 200 y de 570 plantas de la segunda variedad, murieron tambin 200. Se puede considerar que el herbicida es igualmente nocivo para las dos variedades?. ( = 0,05). H0 : PA = PB, implica que (PA PB) = 0 H1: PA PB

Por ser una prueba bilateral, los valores crticos de la distribucin normal son 1,96 y 1,96 ( =0,05), como el valor de Z = 1,l8 cae entre estos valores, no se rechaza la hiptesis nula. Conclusin: Se puede considerar que el herbicida es igualmente nocivo para las dos variedades.

También podría gustarte