Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRUEBA DE HIPTESIS
6.1 INTRODUCCIN
Los mtodos estudiados en el captulo anterior usan la informacin proporcionada por los
estadsticos muestrales para estimar con cierta probabilidad el valor de un parmetro
poblacional. En ste captulo se introducir la prueba de hiptesis que es un enfoque diferente.
En ste caso, se supone a priori el valor del parmetro y sobre la base de la informacin
obtenida en una muestra se somete a prueba la suposicin, para luego tomar con cierta
probabilidad, la decisin de rechazar o no rechazar la hiptesis. En ste punto es importante
sealar que la expresin no rechazar pudiera ser sustituida por aceptar, sin embargo antes
de hacerlo es necesario atender cuidadosamente algunas explicaciones que se darn ms
adelante. La prueba de hiptesis tambin conocida como docimasia o contrastacin de
hiptesis es uno de los mtodos estadsticos ms usados en las ciencias naturales por ser un
procedimiento que le proporciona al investigador un criterio objetivo para tomar decisiones
con base a un nmero limitado de observaciones. Frecuentemente el bilogo tiene que decidir:
a) al comparar magnitudes de propiedades fsicas, qumicas o biolgicas en dos o ms
condiciones o categoras, como es el caso de confrontar el valor medio de la presin arterial en
personas pertenecientes a dos grupos etarios; b) al valorar los efectos de diferentes niveles de
algn factor ambiental como la temperatura, la humedad, el contenido de oxgeno sobre algn
proceso, caracterstica o propiedad de un organismo; y c) al relacionar dos o ms variables,
como la intensidad lumnica y la tasa fotosinttica. En ste captulo y en los siguientes se
trataran varios procedimientos para probar hiptesis que dan respuesta a este tipo de
problemas o a otros similares.
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
109
encuentra ante una disyuntiva: a) si el valor promedio de peso para cada grupo se considera
como una simple desviacin fortuita de los 30 g dada la variabilidad caracterstica de las
muestras aleatorias, no hay necesidad de reorganizar el grupo, y b) si el valor medido esta
verdaderamente desviado del valor esperado de 30 g es necesario reorganizar el grupo
sustituyendo los ratones causantes de la desviacin.
A fin de tener un criterio objetivo que le ayude a tomar la mejor decisin, el investigador
establece como premisa que el peso promedio de la poblacin de donde provienen los pesos
de los ratones es de 30 g. Si es cierto que = 30 es de esperar que el valor promedio del grupo
o muestra x sea muy cercano a dicho valor y su probabilidad de ocurrencia sea alta. Si esto
sucede se acepta la hiptesis y se considera que la desviacin del peso promedio de la muestra
con respecto a la media esperada, x - , es producto de la naturaleza aleatoria de la variable
peso, siendo innecesario reorganizar el grupo de ratones. Pero an siendo cierto que = 30,
es posible que los 36 ratones tengan un peso promedio alejado del peso esperado de 30 g, lo
cual es improbable, En ste caso, el investigador puede aceptar que = 30 y considerar que
ocurri un hecho poco probable o alternativamente decidir que en lugar de haber sucedido
algo poco probable considerar que el valor de la media poblacional es menor a 30 ( < 30).
Ilustremos la situacin anterior en forma real y supongamos que el investigador encontr que
uno de los grupos dio como resultado un promedio de 29.3 g con una desviacin de 2 g. De
acuerdo a lo dicho anteriormente, para poder tomar la decisin de reorganizar o no el grupo de
ratones, se debe proceder a determinar si 29.3 ocurre con una probabilidad alta o baja teniendo
como hiptesis que = 30. Como el peso promedio observado es menor a 30 se debe proceder
a hallar la P( X 30 ). Para tal fin tenemos que saber como es la distribucin de la media
muestral. Aunque desconocemos la distribucin de la variable peso promedio, como el tamao
de la muestra es grande (n = 36) se puede afirmar, de acuerdo al Teorema del Lmite Central,
que dicha variable se distribuye normalmente con media igual a 30 y desviacin igual a
S x = 2 36 = 0.33 . Por lo tanto la probabilidad buscada ser:
29.3 30
P ( X 29.3) = P ( Z z ) = P ( Z
= P ( Z 2.1) = 0.0179
2 36
Esta probabilidad tan baja (Figura 6.1),
tiene dos explicaciones: a) La hiptesis de
que = 30 es cierta y ocurri un hecho casi
imposible como el de obtener un peso
promedio igual a 29.3 el cul esta muy
alejada del valor esperado de 30 g, y b) la
hiptesis anterior no es cierta y el valor
esperado es mucho menor a 30. La
explicacin b resulta obviamente ms
razonable.
Figura 6.1.
Pero veamos que habra ocurrido si el valor de la media muestral hubiese sido ms prximo a
30, por ejemplo 29.9. En ste caso la probabilidad de que ocurra un valor igual o menor a 29.9
sera:
Samuel Segnini
Fundamentos de Bioestadstica
P ( X 29.9) = P ( Z
Captulo 6
110
29.9 30
= P ( Z 0.3) = 0.382
2 36
Figura 6.2
29.6 30
= P ( Z 1.2) = 0.1151
2 36
Figura 6.3
x x
Sx
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
111
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
112
plasma sanguneo. Estas hiptesis de investigacin para poderse someter a prueba deben
concretarse en trminos cuantitativos, transformndose en hiptesis estadsticas. Para el
ejemplo anterior, se puede proponer como hiptesis estadstica que bajo cierto programa de
ejercicio la tasa promedio de disminucin de la concentracin del colesterol ser mayor a 30
unidades. Consecuentemente existe una hiptesis estadstica alternativa que en este caso
plantea que con el ejercicio la tasa promedio de disminucin del colesterol ser igual a 30
unidades. De manera que las hiptesis de investigacin se derivan de las teoras que se estn
probando y las hiptesis estadsticas hacen factible su contrastacin.
En forma general las hiptesis estadsticas son afirmaciones que involucran una propiedad de
la distribucin probabilstica de la variable aleatoria que se est estudiando, propiedades como
son la media (), la varianza (2), un valor de proporcin () o la forma de la distribucin. De
modo que el primer paso en un proceso de decisin es formular las hiptesis estadstica, las
cuales reciben el nombre de hiptesis nula (H0) e hiptesis alternativa (H1). La hiptesis nula
se dice que es una hiptesis simple, porque es una afirmacin de igualdad con un valor
especifico, mientras que las hiptesis alternativa se dicen que es compuesta porque puede
asumir diferentes valores.
Si se representa un parmetro poblacional por letra griega y con o un valor cualquiera del
parmetro, la forma genrica de la hiptesis nula sera una igualdad entre el parmetro y un
valor especfico del mismo,
H0 : =
Por su parte la hiptesis alternativa se puede representar con una de las tres posibilidades
siguientes:
>
H1: <
La expresin > se interpreta como que el parmetro puede asumir cualquier valor mayor
a y se dice que la prueba de hiptesis es de una cola a la derecha. Por su parte < indica
que el parmetro puede ser cualquier valor menor a y la prueba de hiptesis se llama de
una cola a la izquierda. Finalmente representa la posibilidad que el parmetro asuma
cualquier valor diferente (mayor o menor) al valor y la prueba de hiptesis se denomina de
dos colas. Ms adelante, cuando se trate lo referente al establecimiento de la zona de decisin,
se aclarar la razn de esta nomenclatura.
Para el caso del ejemplo del programa de ejercicios y la disminucin del nivel de colesterol en
la sangre, las hiptesis se pueden plantear de la manera siguiente:
Hiptesis nula
Hiptesis alternativa :
H0 : = 30
H1: > 30
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
113
cientfica muy fuerte para poder rechazar una hiptesis nula. Por lo tanto la consecuencia de
rechazar una hiptesis nula es un gran apoyo a la hiptesis alternativa. Ilustremos esta
situacin con la analoga siguiente: en los procesos judiciales donde hay alguien acusado de
un delito, hay dos hiptesis: inocente (H0) y culpable (H1). El fiscal pblico tiene inters en
probar que el acusado es culpable. Para poder llegar a una decisin de culpable es necesario
presentar suficientes evidencias que garanticen que la decisin es correcta. De no tenerse
evidencias fuertes la hiptesis nula de inocencia no puede ser rechazada, pero esto no significa
que se comprob la inocencia del acusado, sino que no se logr acumular suficientes
elementos para rechazar H0. De hecho es posible que con nuevas investigaciones se determine
la culpabilidad del acusado. Por el contrario habindose obtenido fuertes evidencias de
culpabilidad, se acepta la hiptesis alternativa, decisin que es mucho ms difcil revertir. En
otras palabras la probabilidad de cometer un error es mucho menor al rechazar H0 que al no
rechazarla. En la prctica jurdica, si la evidencia es dbil es preferible equivocarse declarando
inocente a alguien culpable que condenando a un inocente. Un razonamiento similar a ste es
el que usan los investigadores cuando plantean como hiptesis alternativa el evento que se
quiere probar. Si los datos usados para probar las hiptesis proporcionan suficiente evidencia
para rechazar la hiptesis nula, como consecuencia inmediata la hiptesis alternativa recibe un
respaldo muy fuerte. Pero si el investigador hubiese planteado el mismo evento como hiptesis
nula, su no rechazo no demuestra que el evento de inters sea verdad, sino que los datos no
proporcionaron evidencia para rechazarla, dejando abierta la posibilidad de poder ser refutada
con otro conjunto de datos o que otra hiptesis sea la verdadera. Por esta razn, es que la
sustitucin del trmino no rechazar H0 por el trmino aceptar H0, no es muy conveniente y
de hacerlo se debe estar consciente que la aceptacin de H0 es slo temporal. Veamos un
ejemplo biolgico: durante mucho tiempo los taxnomos, al describir los mamferos le
asignaban como una caracterstica nica el hecho de ser vivparos, es decir que los individuos
se desarrollaban en el vientre de la madre y cuando nacan ya haban completado en gran parte
su desarrollo, lo cual los diferenciaba de los animales ovparos y ovovivparos cuyo desarrollo
se completa dentro de un huevo. Esta era una hiptesis que haba recibido mucho respaldo,
puesto que cada vez que apareca una nueva especie de mamfero reciba apoyo la hiptesis.
Pero esto fue as hasta finales del siglo XVIII cuando fueron descubiertos los ornitorrincos,
mamferos que viven en Oceana que junto con los equidna, descubiertos posteriormente, son
los nicos mamferos ovparos porque sus cras se desarrollan dentro de huevos fuera del
cuerpo de la madre. Es decir que la hiptesis de la viviparidad que pareca un hecho
fuertemente comprobado se vino abajo cuando apareci la primera evidencia contradictoria.
En otras palabras la hiptesis alternativa implcita que era que no todos los mamferos eran
vivparos, qued definitivamente comprobada al negarse la hiptesis nula. Esto demuestra lo
conveniente de probar un hecho no por el aporte directo de evidencias sino por el rechazo de
un hecho opuesto.
Volviendo al ejemplo del colesterol, si se refuta H0: = 30, es porque los datos obtenidos en
la muestra fueron concluyentes, por lo cual la hiptesis alternativa H1: > 30 recibe un apoyo
muy fuerte. Por el contrario si no se rechaza H0 las implicaciones de este hecho no son
concluyentes. El no rechazo no significa que necesariamente = 30, porque se hubiese
llegado a la misma conclusin con cualquier otro valor de menor a 30, lo cual deja muchas
dudas con relacin al verdadero valor de . Tambin el no rechazo de H0 solo indica que la
proposicin es aceptada temporalmente dado que puede ser revertida con un nuevo conjunto
de datos. El ejemplo que sigue puede aclarar la temporalidad de una aceptacin de H0.
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
114
Suponga que alguien afirma que todos los granos de frijol que hay en un saco son de color
verde. Para probarlo toma un puado de granos y observa su color. Si todos los frijoles del
puado son verdes, no significa que prob su premisa, solamente le dio apoyo. Puede repetir el
ensayo muchas veces con el mismo resultado, pero mientras existan granos de frijol en el saco
su hiptesis no esta probada, porque si en alguno de los ensayos encuentra un solo grano de
otro color, la hiptesis nula queda definitivamente negada y por el contrario la hiptesis
alternativa implcita de que no todos los granos de frijol del saco son verdes queda plenamente
confirmada.
Como vimos existen tres formas distintas de planteamiento para la hiptesis alternativa. La
seleccin de una de ellas depende de la naturaleza del problema que se quiere docimar.
Algunos ejemplos pueden ayudar a entender la lgica para seleccionar una hiptesis
alternativa.
Ejemplo 6.2. Un bilogo sospecha que debido a la escasez de alimento que hay en un ro, la
talla promedio de las truchas adultas que viven en el mismo no alcanza el tamao mnimo de
pesca permitido que es de 25 cm. Si se comprueba la sospecha del investigador se prohibir la
pesca de truchas en ese ro, de lo contrario no se tomar ninguna medida.
Puesto que el planteamiento que quiere probar el bilogo es que la talla promedio de las
truchas es menor al valor mnimo permitido, las hiptesis a probar deben ser las siguientes:
H0 : = 25
H1: < 25
Ejemplo 6.3. Se quiere saber si una nueva droga es eficaz como tratamiento del SIDA. Para
lo cual a un grupo de paciente se le aplica un tratamiento con la droga.
La eficacia de la droga implica que la mayora de los pacientes, es decir que ms de la mitad
de los pacientes a los cuales se les aplic el tratamiento con la droga, respondieron
positivamente a la enfermedad. Si se considera que es la proporcin de la poblacin de
pacientes para los cuales la droga es eficaz, las hiptesis que se deben someter a prueba sern
las siguientes:
H0 : = 0.5
H1: > 0.5
Ejemplo 6.4. Un especialista en nutricin sospecha que el contenido de protena total en la
sangre de pacientes que estn sometidos a cierto rgimen de alimentacin no es el mismo que
el registrado en otro grupo de pacientes sometidos a otro tratamiento, para el cual se sabe que
el contenido de protena total tiene un valor promedio igual a 7.0 unidades.
El especialista sospecha que el contenido de protena total no es el mismo en los dos grupos de
pacientes, lo cual implica que el valor de esta variable para el grupo problema puede ser
mayor, menor o igual al grupo de referencia, por lo tanto las hiptesis a probar deben ser las
siguientes:
H1: 7.0
H0 : = 7.0
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
115
La formulacin de hiptesis no siempre es una tarea fcil debido a que no todas las
situaciones son tan obvias como las planteadas en los ejemplos anteriores. Como no existen
normas ni procedimientos que se puedan aplicar para plantear correctamente las hiptesis
estadsticas, el investigador debe apelar a la experiencia y a su conocimiento del sistema bajo
estudio. Muchas veces, se plantean las hiptesis con base a los resultados obtenidos en una
muestra. Pero esto no es correcto, porque de hacerlo, se estara usando la informacin que
proporciona la muestra con el doble propsito de formular y docimar las hiptesis. Esta
manera de proceder puede llevar a cometer errores graves. Ilustremos esta situacin con el
caso del Ejemplo 6.4. Como vimos se plante una hiptesis alternativa de diferencia, lo cual
conduce a una prueba de hiptesis de dos colas. Supngase que la hiptesis nula ( = 7.0) es
cierta. Si la formulacin de hiptesis se hubiese hecho despus de obtener los datos de una
muestra, en lugar de plantearse una hiptesis alternativa de dos colas, necesariamente se
hubiese tenido que plantear una hiptesis de una sola cola, hacia la derecha o la izquierda,
porque difcilmente una muestra hubiese dado un valor promedio igual a 7.0. Las
consecuencias de este proceder es que aumenta la posibilidad de rechazar la hiptesis nula
cuando de hecho es verdadera. Esto quedar ms claro cuando se traten los problemas que se
derivan de la toma de decisiones estadsticas.
Especificacin del nivel de significacin. Cualquier decisin dentro del proceso de prueba de
hiptesis lleva asociado cierto riesgo de fallar. Es decir que siempre existe la posibilidad de
tomar una decisin equivocada, slo que en este tipo de prueba se tiene la ventaja de conocer
de antemano la probabilidad de equivocarse. En la Tabla 6.1 se muestran las posibles
consecuencias de tomar una decisin con relacin a la hiptesis nula.
Tabla 6.1. Situaciones derivadas de una decisin estadstica
CONDICIN REAL
DECISIN
Rechazar Ho
No Rechazar Ho
H0 cierta
Error (Tipo I)
Acierto
H0 falsa
Acierto
Figura 6.5
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
116
a)
b)
Figura 6.6
Figura 6.7
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
117
Figura 6.8
De acuerdo a lo visto hasta ahora, sera lgico concluir que es necesario conocer la magnitud
con la cual ambos errores operan en una prueba de hiptesis. Lamentablemente, esto slo es
posible para el Error Tipo I. Debido a la naturaleza del procedimiento, al formular una
hiptesis nula no slo se supone el valor de un parmetro, sino que se presume la ubicacin de
la distribucin de probabilidades del estadstico de prueba. La consecuencia de esto es que
puede fijarse un valor de y establecerse la respectiva regin de rechazo de H0. Esto no es
posible para el caso del Error Tipo II. Aun cuando se rehace H0 se desconoce el valor de la
hiptesis alternativa y por lo tanto la ubicacin de la distribucin probabilstica del estadstico
de prueba, no pudindose fijar el valor de .
Por tales razones en toda prueba de hiptesis una vez que se han formulado la hiptesis se fija
el valor de con el cual se cuantifica el riesgo que se esta dispuesto a correr al rechazar una
hiptesis nula cierta. El valor de se conoce como nivel de significacin, trmino con el cual
se quiere destacar que cualquier estadstico cuya probabilidad de ocurrencia sea igual o menor
al valor de , mantiene una diferencia tan grande con el valor del parmetro supuesto que se
puede concluir que no pertenece a la distribucin con la cual se est trabajando y por lo tanto
asegurar que H0 es falsa y otra hiptesis es la verdadera.
Comnmente los niveles de significacin usados son 0.05, 0.01 y 0.001. El grado de
importancia de la significacin se califica de distintas formas dependiendo de donde se ubique
el valor de probabilidad del estadstico.
Si 0.05 > P( ) > 0.01 se dice que la prueba de hiptesis es significativa (*).
Si 0.01 > P( ) > 0.001 se dice que la prueba de hiptesis es muy significativa (**).
Si 0.001 > P( ) se dice que la prueba de hiptesis es altamente significativa (***).
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
118
Ro A
64.6
22.7
40.7
256.8
Ro B
***
107.1
**
38.5
*
57.9
ns
259.4
Tambin dentro de los textos cientficos se suele presentar el resultado de una prueba
estadstica indicando el nivel de significacin o el rango de probabilidad dentro del cual se
ubica el estadstico de prueba, Ejemplo: ... la densidad de insectos no mostr relacin con
los valores acumulados de precipitacin (rs = 0.14; p < 0.05)....
Seleccin del estadstico de prueba. Para poder someter a prueba las hiptesis formuladas, es
necesario usar alguna propiedad o estadstico de las muestras que est relacionado con el
parmetro objeto de la inferencia. Estas propiedades muestrales reciben el nombre genrico de
estadsticos de prueba. En la Tabla 6.3 se muestran algunos parmetros y sus estadsticos de
prueba correspondiente.
Tabla 6.3. Parmetros y estadsticos de prueba ms comunes
Parmetro
Estadstico de prueba
Media ()
x 2 x1
Varianza (2)
s2
Proporcin ()
Coeficiente de correlacin ()
Sin embargo, por razones prcticas, muchas veces los estadsticos de prueba no se usan en su
forma original sino con otras formas equivalentes o derivadas (Tabla 6.4)
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
119
Estadstico de prueba
Media ()
Diferencia de medias
(2 1)
x 2 x1
z = ( x ) (
n)
z = ( x ) (s
n)
t = ( x ) (s
n)
Z = ( x 2 x1 ) ( 2 1 )
22 12
+
n 2 n1
Z = ( x 2 x1 ) ( 2 1 )
s 22 s 12
+
n 2 n1
T = ( x 2 x1 ) ( 2 1 )
s 22 s 12
+
n 2 n1
2 = (n 1) s 2 02
Varianza
Razn de varianzas
2 1
F = ( s 22 22 ) ( s 12 12 )
La utilidad de estos y otros estadsticos de prueba se ver cuando se traten particularmente las
pruebas de hiptesis para algunos parmetros.
Establecer una zona de aceptacin para H0. Una vez conocido el estadstico de prueba a
utilizar, as como su distribucin, es necesario definir en la distribucin del estadstico
muestral una zona de aceptacin y una zona de rechazo de la hiptesis nula. La zona de
aceptacin de H0 est formada por todos los valores del estadstico de prueba con una
probabilidad de ocurrencia mayor al establecido en el nivel de significacin.. Por el contrario
la zona de rechazo est formada por todos los valores del estadstico de prueba cuya
probabilidad de ocurrencia es igual o menor al valor establecido en el nivel de significacin.
La zona de rechazo a diferencia de la zona de aceptacin y dependiendo de la hiptesis
alternativa planteada puede estar orientada en diferentes direcciones a lo largo del eje de
valores de la variable aleatoria.
Zona de rechazo a la derecha: esta formada por todos los valores del estadstico de prueba
ubicados a la derecha del parmetro cuya probabilidad de ocurrencia es menor a la del
nivel de significacin. Esta zona se especifica cuando H1: > 0 y la docimasia se llama
prueba de una cola a la derecha (Figura 6.9A)
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
120
Zona de rechazo a la izquierda: esta formada por todos los valores del estadstico de prueba
ubicados a la izquierda del parmetro cuya probabilidad de ocurrencia es menor a la del
nivel de significacin. Esta zona se especifica cuando H1: < 0 y la docimasia se llama
prueba de una cola a la izquierda (Figura 6.9B)
Zona de rechazo doble: La zona de rechazo puede ser dividida en dos partes iguales ubicadas
a cada lado del parmetro. La zona de la derecha y de la izquierda estn formadas por todos
los valores del estadstico de prueba cuya probabilidad de ocurrencia es menor a la mitad de
la probabilidad del nivel de significacin . Esta zona se especifica cuando H1: 0 y la
docimasia se llama prueba de dos colas (Figura 6.9C).
z (0.90) = 1.29
z (0.95) = 1.65
z (0.975) = 1.96
z (0.99) = 2.33
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
121
El valor crtico del estadstico de prueba marca el punto de separacin de las zonas de
aceptacin y de rechazo de la hiptesis nula. En la Tabla 6.6 se muestra algunos de estos
valores cuando se somete a prueba la hiptesis nula = 0. Se seleccion como estadstico de
prueba a Z y el nivel de confianza especificado fue = 0.05.
Tabla 6.6
Cmputos necesarios. Con los datos proporcionados por una muestra de tamao n se calcula
el estadstico de prueba. La mayora de las veces no se usa el estadstico de prueba
directamente sino alguna de sus formas equivalentes (Tabla 6.4), algunas de las cuales
requieren para su uso que tambin se calcule la desviacin estndar (s). La otra cantidad que
hay que cuantificar es el valor crtico el cual depende del nivel de significacin especificado y
de la distribucin probabilstica que siga el estadstico de prueba.
Decisin. En la ltima etapa en el procedimiento de prueba de hiptesis se debe tomar la
decisin de rechazar o no la hiptesis nula. Si el estadstico de prueba cae dentro de la regin
de rechazo, se considera que la diferencia entre el parmetro que se est docimando y el
estadstico de prueba es significativa y que la misma no puede atribuirse nicamente a las
variaciones aleatorias de las muestras, por lo tanto se rechaza la hiptesis nula y se declara
como falsa. Si por el contrario el estadstico de prueba se ubica en la zona de aceptacin se
considera que la diferencia entre el parmetro que se est docimando y el estadstico de prueba
es no significativa y que dicha diferencia es simplemente aleatoria, en consecuencia se
puede aceptar la hiptesis nula planteada. Aqu es necesario recordar que la decisin de
aceptar H0 es una forma corta de decir que no existe suficiente evidencia para rechazarla y que
en modo alguno se est concluyendo que la hiptesis nula es verdadera. Slo se est aceptando
temporalmente, hasta que se pruebe lo contrario.
Un aspecto importante, para la toma de una decisin esta relacionada con la escogencia del
nivel de significacin. Como hemos visto, los valores de son fijados previamente al clculo
del estadstico de prueba y usualmente los valores escogidos son 0.05 y 0.01. De modo que el
rechazo o la aceptacin de H0 dependen de que el estadstico de prueba se ubique o no dentro
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
122
de la regin de rechazo previamente definida. Sin embargo, un investigador puede tomar una
decisin diferente. Por ejemplo, si la probabilidad de ocurrencia de un estadstico de prueba es
muy cercana a la regin de rechazo, digamos que la P( ) = 0.0614, se debe aceptar H0 con un
= 0.05 si se acta estrictamente. Pero el investigador puede decidir rechazar H0 puesto que
la probabilidad de cometer un error tipo I no aumento mucho, siempre y cuando quede
explicito en el informe de investigacin el valor del nivel de significacin usado.
Actualmente, esta forma de proceder es muy usada debido a la facilidad que ofrecen los
paquetes estadsticos y otros programas de aplicacin de calcular los valores de P para
cualquier estadstico de prueba. Por esta razn es comn ver dentro de un texto cientfico
afirmaciones parecidas a las siguientes: se encontr que el nivel promedio de calcio en los
huesos del grupo de personas enfermas con osteoporosis fue significativamente menor al del
grupo de personas sanas (P < 0.08).
En los inicios de ste captulo se dijo que la resolucin de todo problema cientfico se iniciaba
con la formulacin de las hiptesis de investigacin, que luego eran transformadas en
hiptesis estadsticas, que como hemos visto son las premisas sometidas al proceso de
docimasia. De modo que para cerrar el ciclo del proceso, es necesario que las conclusiones
estadsticas se transformen en conclusiones de investigacin. Si regresamos al ejemplo del
programa de ejercicios y la disminucin del nivel de colesterol en la sangre las hiptesis de
investigacin que se formularon fueron las siguientes:
H0: El ejercicio constante no disminuye el nivel de colesterol en el plasma sanguneo.
H1: El ejercicio constante disminuye el nivel de colesterol en el plasma sanguneo.
Las hiptesis estadsticas fueron las siguientes:
H0: = 30 (La tasa media de disminucin de la concentracin de colesterol es igual a 30 unidades).
H1: > 30 (La tasa media de disminucin de la concentracin de colesterol es mayor a 30 unidades).
Si despus de efectuar todo el proceso de prueba de hiptesis se tomo la decisin de rechazar
H0: = 30, la conclusin del investigador en relacin con el problema de investigacin
planteado es que los datos de la muestra proporcionaron evidencia concluyente para apoyar la
suposicin que el ejercicio fsico disminuye el nivel de colesterol en la sangre. La diferencia
entre ambas es que la conclusin estadstica esta particularizada a un aspecto de la situacin,
en esta caso al valor de 30, mientras que la conclusin de investigacin es generalizada a una
parte o todos los valores de la variable estudiada.
Finalmente es importante enfatizar que las decisiones de un investigador no tienen que ser
siempre consecuentes con las decisiones estadsticas. Los mtodos estadsticos slo
proporcionan elementos de juicios objetivos y poderosos, que deben ser tomados en cuenta por
el investigador al momento de decidir, pero no son los nicos, hay otros elementos de juicio
de naturaleza no estadstica que el cientfico puede considerar para tomar una decisin. En
otras palabras decidir entre dos o ms alternativas siempre queda a juicio del investigador.
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
123
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
124
n)
36) = 40 20 = 2
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
125
enfermedad, ha cambiado en relacin con el valor determinado hace 5 aos el cual era igual a
205 individuos. Con tal propsito determin el valor de Ro a 40 hembras criadas en el
laboratorio y pertenecientes a una cepa desarrollada a partir de mosquitos capturados en la
zona estudiada. Los resultados fueron los siguientes:
N
1
2
3
4
5
6
7
8
9
10
Ro
228
173
182
197
205
260
233
289
158
199
N
11
12
13
14
15
16
17
18
19
20
Ro
201
212
162
282
216
181
249
174
196
220
N
21
22
23
24
25
26
27
28
29
30
Ro
141
169
163
159
192
231
257
174
206
149
N
31
32
33
34
35
36
37
38
39
40
Ro
144
226
228
192
205
237
223
226
182
195
n)
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
126
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
127
afectada por la contaminacin con fertilizantes y cuyo valor promedio se cuantific en 14.6
mg/g de nitrgeno. El anlisis de 25 hojas jvenes provenientes de la zona protegida produjo
los resultados siguientes:
N
1
2
3
4
5
N2
10,5
15.0
12,4
6,8
7,9
N
6
7
8
9
10
N2
13,1
11,6
8,2
9,5
11,7
N
11
12
13
14
15
N2
14,2
13,8
15,1
6,9
8,9
N
16
17
18
19
20
N2
9,5
11,1
10,3
10,2
9,9
N
21
22
23
24
25
N2
8,9
10,8
9,8
7,8
8,1
n)
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
128
n ser el estadstico de
prueba usado.
Ejemplo 6.8. En cierto nervio del cuerpo humano, los impulsos elctricos viajan a una
velocidad promedio de 4.3 m/seg con una desviacin igual a 1.2 m/seg. Un fisilogo observ
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
129
que la velocidad promedio de conduccin del impulso elctrico en 45 individuos con una
distrofia fue de 3.7 m/seg. Basado en estos resultados el investigador presume que con
relacin a los individuos sanos en los individuos con distrofia el impulso elctrico viaja a
menor velocidad en el nervio estudiado. Soportan sta hiptesis los resultados obtenidos?.
Las hiptesis de investigacin son:
Ho : En los individuos con distrofia la velocidad de transmisin del impulso nervioso es igual
a la observada en individuos normales.
H1 : En los individuos con distrofia la velocidad de transmisin del impulso nervioso es
menor a la observada en individuos normales.
Prueba de las hiptesis estadsticas.
a. Formulacin de hiptesis
Ho : = 4.3
H1 : < 4.3
b. Especificacin de un valor de probabilidad crtico o nivel de significacin.
Como no se especific el nivel de significacin se puede selecciona = 0.05
c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las
hiptesis.
Aunque no se conoce la distribucin de la variable, como el tamao de la muestra es
grande se aplica el Teorema del Lmite Central. Por lo tanto se puede considerar que la
media muestral se distribuye normalmente y lo ms conveniente es usar Z como
estadstico de prueba.
Z = ( x ) ( n )
d. Establecer una zona de aceptacin para Ho.
Como H1: < o se trata de una prueba de una cola hacia la izquierda, siendo la zona de
rechazo la siguiente:
ZA = {Z / Z > -z(1) }
e. Cmputos necesarios.
e.1) Estadstico de prueba: Z = ( x ) (
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
130
f. Decisin.
Como z = -3.33 < -z(0.95) = -1.65, el valor del estadstico de prueba se encuentra dentro de
la zona de rechazo de Ho. Por lo tanto se concluye que los datos proporcionan suficiente
evidencia para rechazar Ho
Los datos soportan la suposicin del investigador que en los individuos con distrofia la
velocidad de transmisin del impulso nervioso es menor a la observada en individuos
normales.
Cul debe ser el menor valor de x que permite rechazar Ho?
Ejemplo 6.9. Una compaa productora de leche pasteurizada tiene como norma no aceptar
leche cruda con un contenido de grasa superior a los 34 g/100g. Una muestra de 36 litros de
leche obtenidos de otras tantas vacas pertenecientes a una misma finca, dio un valor medio del
contenido de grasa en la leche de 35.2 g/100g con una desviacin de 4.1 g/100g. Puede ser
aceptada la leche por la pasteurizadora? La compaa admite un nivel de error del 1%.
Las hiptesis de investigacin son:
Ho : El contenido promedio de grasa en la leche es igual al valor mximo permitido para su
procesamiento.
H1 : El contenido promedio de grasa en la leche es superior al valor mximo permitido para su
procesamiento
Prueba de las hiptesis estadsticas.
a. Formulacin de hiptesis
Ho : = 34
H1 : > 34
b. Especificacin de un valor de probabilidad crtico o nivel de significacin.
El nivel de significacin especificado es = 0.01
c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las
hiptesis.
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
131
n)
Se puede concluir que el contenido promedio de grasa en la leche de la finca tiene un valor
igual al valor mximo permitido para su procesamiento.
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
132
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
133
12 22
+
n1 n 2
x 1 = 66.0 ; x 2 = 39.43
22 12
+
= ( 66.0 39.43) 0
n 2 n1
144 144
+
= 26.57 6.41 = 4.14
7
7
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
134
Se puede concluir con un 97% de confianza que la evidencia aportada por la muestra
apoya la hiptesis de la disminucin del nivel de estroncio en los huesos de las personas
con la edad.
6.5.2. Prueba de hiptesis para dos medias poblacionales cuando las muestras provienen
de poblaciones distribuidas normalmente, con varianzas desconocidas y tamao de
muestras grandes (n1 y n2 30).
Ejemplo 6.11. En el Departamento de Toxicologa del Ministerio de Salud se necesita saber si
el contenido de nicotina en dos marcas de cigarrillos importados es la misma. Con el propsito
de resolver la situacin se le determina el contenido de nicotina a un lote de cigarrillos de
cada marca, encontrndose los resultados siguientes:
Contenido de nicotina (mg)
Marca Kill me softly
Marca Little life
49
36
24.0
25.2
2.30
2.90
n
Media
Desviacin estndar
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
135
H1 : 1 2 1 - 2 0
b. Especificacin de un valor de probabilidad crtico o nivel de significacin.
El nivel de significacin especificado es = 0.10
c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las
hiptesis.
Puesto que el parmetro involucrado en la docimasia es la diferencia de medias
poblacionales 1 2, y como la variable se distribuye normalmente con varianza
desconocida y tamao de la muestra grande lo ms conveniente es usar como estadstico
de prueba la diferencia de medias muestrales en su forma derivada Z. El valor de la
2
2
2
2
varianzas s1 y s 2 de las muestras se usa para estimar el valor de 1 y 2 .
Z = ( x 2 x1 ) ( 2 1 )
s 12 s 22
+
n1 n 2
s 22 s 12
+
= ( 24.0 25.2 ) 0
n 2 n1
5.29 8.41
+
= 1.2 0.58 = 2.06
49
36
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
136
Se puede concluir que la evidencia aportada por la muestra apoya como hiptesis que el
contenido de nicotina en las dos marcas es diferente.
6.5.3. Prueba de hiptesis para dos medias poblacionales cuando las muestras provienen
de poblaciones distribuidas normalmente, con varianzas desconocidas y tamao de
muestras pequeas (n1 y n2 < 30).
Cuando se presenta una situacin de ste tipo, es necesario considerar adicionalmente si las
dos varianzas poblacionales, aunque desconocidas, son iguales o diferentes. Si se supone que
las varianzas son iguales se debe utilizar como estadstico de prueba a:
T=
( x 2 x1 ) ( 2 1 )
s 2p
n2
s 2p
; donde s 2p =
( n 1) s 12 + ( n 1) s 22
n1 + n 2 2
n1
Si se presume que las varianzas son diferentes, y si la prueba de hiptesis para la diferencia de
medias es de dos colas, se debe usar como estadstico de prueba a:
T=
( x 2 x1 ) ( 2 1 )
s 22 s 12
+
n 2 n1
t (*1 2 )
s 12
t (1-
n
= 1
s 22
+
t (1-
2;n 1 1)
n2
s 12 s 22
+
n1 n 2
2;n 2 1)
Ejemplo 6.12. En un estudio sobre la condicin ecolgica de los ros altiandinos, se determin
la temperatura del agua en ros de pramo (> 2800 m.s.n.m.) y de selva nublada (1800 <
m.s.n.m. < 2800), obtenindose los resultados siguientes:
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
137
Conociendo que la temperatura del agua es una variable que se distribuye normalmente, se
quiere saber si los ros de selva son ms calientes.
Las hiptesis de investigacin son:
Ho : La temperatura del agua en los ros es la misma en las dos unidades ecolgicas
H1 : La temperatura del agua es mayor en los ros de la zona de selva.
Prueba de las hiptesis estadsticas.
a. Formulacin de hiptesis: si se considera a 1 y 2 como el valor promedio de la
temperatura del agua en los ros de pramo y de selva nublada respectivamente, las
hiptesis estadsticas a probar son las siguientes:
H0 : 1 = 2 1 - 2 = 0
H1 : 2 > 1
2 - 1 > 0
Como = 0.05 y RV =
T=
( x 2 x1 ) ( 2 1 )
s 2p
n2
s 2p
n1
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
138
( n1 1) s 12 + ( n 2 1)
n1 + n 2 2
s 22
= 7.74
( x 2 x1 ) ( 2 1 ) (15.38 12.69 ) 0
s 2p
n2
s 2p
n1
7.74 7.74
+
16
16
2.69
= 2.73
0.9836
Se puede concluir que se tiene un 95% de confianza que la temperatura del agua es mayor en
los ros de selva nublada que en los ros de pramo.
Ejemplo 6.1.3. Un investigador que trabaja sobre la interaccin insecto/planta piensa que las
plantas cianognicas, es decir las que producen HCN, tienden a ser rechazadas por los
insectos herbvoros no especializados. Para poner a prueba sta hiptesis se efectu un
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
139
experimento en el cual se le ofreci a las larvas de un insecto generalista hojas de una planta
cianognica como la parchita (Passiflora capsularis) y hojas de una planta no cianognica
como la espinaca (Spinacia olercea). Como una medida de la aceptacin o rechazo del
alimento ofrecido se determin el peso de tejido foliar consumido por las larvas de la polilla
Spodoptera frugiperda. Los resultados fueron los siguientes:
Especie Vegetal
Passiflora capsularis
Spinacia olercea
n
5
5
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
140
s 12 (20.13) 2
=
= 5.9 es mayor a 3.5 se acepta que las dos varianzas
s 22
(8.28) 2
son diferentes. Por lo tanto se debe usar como estadstico de prueba a:
Como = 0.01 y RV =
T=
( x 2 x1 ) ( 2 1 )
s 22 s 12
+
n 2 n1
( x1 x 2 ) ( 1 2 ) = ( 74.70 124.44 ) 0
s 12 s 22
( 20.13) 2 + ( 8.28) 2
+
n1
n2
49.74
= 5.11
9.73
t (*0.99 ) =
s 12
s 22
t ( 0.99;4 ) + t ( 0.99;4 )
n1
n2
s 12 s 22
+
n1 n 2
(20.13) 2
(8.28) 2
(3.747)
+
(3.747) 355.05
5
5
=
=
= 3.75
94.76
(20.13) 2 (8.28) 2
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
141
Se puede concluir que se tiene un 99% de confianza que las larvas de Spodoptera frugiperda
tienden a rechazar los tejidos de plantas cianognicas.
6.5.4. Prueba de hiptesis para dos medias poblacionales cuando las muestras provienen
de poblaciones con distribucin no normal y tamao de muestras grandes (n1 y n2 30).
Cuando las muestras provienen de dos poblaciones con distribucin no normal pero el tamao
de las muestras es grande se puede aplicar el Teorema del Lmite Central y considerar que la
diferencia de medias muestrales, x 2 x 1 , se distribuye normalmente. Si las varianzas
poblacionales se conocen el estadstico de prueba a usar es:
Z = ( x 2 x1 ) ( 2 1 )
22 12
+
n 2 n1
En caso de no conocerse las varianzas poblacionales, estas se sustituyen por las varianzas de
las muestras y el estadstico de prueba a usar es:
Z = ( x 2 x1 ) ( 2 1 )
s 22 s 12
+
n 2 n1
Ejemplo 6.14. Se sabe que el contenido de calcio en los huesos de los animales de cierta
especie se distribuye normalmente con una varianza 12 = 57.6 para las hembras y una
2
varianza 2 = 51.2 para los machos. Con el propsito de determinar si existen diferencias en el
contenido de calcio entre machos y hembras se le determin a 31 hembras y 33 machos el
contenido de calcio en el tejido seo encontrndose que para la muestra de hembras el valor
promedio fue de 400.45 g/g y para la muestra de machos fue de 395.24 g/g. Cul debe ser
la respuesta?. Use a = 0.05.
Las hiptesis de investigacin son:
Ho : El contenido de calcio en los huesos de los animales de los dos sexos es el mismo.
H1 : El contenido de calcio en los huesos de los animales de ambos sexos es diferente.
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
142
22 12
+
n 2 n1
12 22
+
= ( 400.45 395.24 ) 0
n1 n 2
57.6 51.2
+
= 5.21 1.84 = 2.83
31
33
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
143
Se puede afirmar con un 95% de confianza que el nivel de calcio en los huesos de los
animales de los dos sexos es diferente.
Ejemplo 6.15. En una investigacin sobre el papel que juega el marsupial Marmosa robinsoni
sobre la dispersin de semillas de dos especies de cactus, se piensa que este animal prefiere las
semillas de uno de los dos tipos de cactus que hay en la zona de estudio. Para averiguar si esto
es cierto, se determin bajo condiciones de laboratorio la cantidad (grs) de pulpa del fruto de
las dos especies de cactus que fue consumida por el marsupial. Los resultados encontrados
fueron los siguientes:
Especie de cactus
Stenocereus griseus
Subpilocereus repandus
n
32
38
x
19.99
21.20
s
2.37
1.47
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
144
( x 2 x1) ( 2 1 )
s 12 s 22
+
n1 n 2
Se puede afirmar con un 99% de confianza que la marmosa no tiene preferencia por ninguno
de los dos frutos.
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
145
6.5.5. Prueba de hiptesis para dos medias poblacionales usando observaciones apareadas.
La efectividad con la cual las pruebas de hiptesis pueden detectar diferencias entre dos
medias poblacionales, depende de que las dos muestras sean independientes, es decir que los
valores obtenidos en cada una unidad de muestra no afecten los valores de la otra muestra.
Adems, la variacin dentro de las muestras no debe ser tan grande que impida detectar las
eventuales diferencias entre las medias. Si se pone atencin a las ecuaciones de los estadsticos
de prueba usados para comparar dos medias poblacionales, es fcil deducir la importancia de
la variacin dentro de las muestras. Cualquier aumento de la variacin dentro de las muestras
disminuye el valor del estadstico de prueba, anulando cualquier pequea diferencia que
pudiera existir entre las medias muestrales, diferencia que eventualmente podra permitir
rechazar H0. Por ejemplo, cuando se obtienen dos muestras pequeas de poblaciones normales
con las mismas varianzas, el valor del estadstico,
( x x 2 ) ( 1 2 )
T= 1
s 2p s 2p
+
n1 n 2
2
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
146
observaciones de las muestras. Esto significa que las unidades muestrales donde se quiere
medir el efecto de las variables controladas por el investigador sean lo ms parecida posibles.
En el ejemplo de los fertilizantes, tendran que ubicarse los cultivos en parcelas muy parecidas
en cuanto a las condiciones ambientales. Otras maneras de aparear es usando un mismo
individuo y medir la respuesta antes y despus de aplicrsele un tratamiento. Si no es posible
usar el mismo sujeto se buscan pares de individuos muy parecidos en cuanto a edad, sexo,
peso, raza, estatura, etc. Tambin se puede dividir un mismo material en dos partes y efectuar
las experiencias que interesan, como probar la eficiencia de dos mtodos de medicin.
Una vez que se tienen las muestras emparejadas, en lugar de trabajar individualmente con cada
una, es mejor usar la diferencia entre las respuestas, di = xi1 xi2. Los diferentes valores de di
se diferencias entre s principalmente por los efectos del factor controlado por el investigador,
puesto que la sustraccin del valor de una observacin al valor de la otra observacin, elimina
la mayor parte de la variacin debido a los factores extraos.
Si las muestras provienen de poblaciones distribuidas normalmente la media, D , de las
diferencias di = xi1 xi2, es una variable aleatoria que se distribuye normalmente alrededor de
una media d con una desviacin s d = s d n
Bajo esta nueva situacin, la hiptesis nula a contrastar sera d = 0, lo que equivale a
contrastar la hiptesis nula 1 2 = 0. Por lo tanto, cuando las observaciones son pareadas;
H0 : d = 0 y H1 : d 0 son las hiptesis a plantear. El estadstico de prueba a usar es:
T = (d d ) ( s d n ) y la zona de rechazo sera ZR = {T / -t(1/2; n-1) > T > t(1/2; n-1)}
Ejemplo 6.16. - La -dimetil digoxina es una droga que afecta el ritmo cardaco. En un
estudio efectuado para determinar los efectos agudos de esta droga se le determin la
frecuencia cardiaca a 10 acures (Cavia porcellus) antes y despus de la administracin de la
droga. En la tabla siguiente se muestran los resultados.
Acure N
di
1
2
3
4
5
6
7
8
9
10
260
390
350
400
380
240
360
270
410
270
230
350
290
420
330
190
370
240
350
260
30
40
60
-20
50
50
-10
30
60
10
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
147
Sabiendo que la frecuencia cardaca de los acures se distribuye normalmente, determine con
un nivel de significacin igual 0.05 si la droga altera dicha variable.
Prueba de las hiptesis estadsticas
g. Formulacin de hiptesis
Ho : d = 0
H1 : d 0
h. Especificacin de un valor de probabilidad crtico o nivel de significacin.
El nivel de significacin especificado es = 0.05
i. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las
hiptesis.
Puesto que se trata de la comparacin de muestras apareadas el estadstico de prueba es:
T = (d d ) ( s d
n)
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
148
( 22
Samuel Segnini
Hiptesis nula:
Fundamentos de Bioestadstica
H0 : 22 = 12
Captulo 6
149
22 12 = 1
Hiptesis alternativas:
22 12 22 12 1
H1: 22 > 12 22 12 > 1
22 < 12 22 12 < 1
Como estadstico de pruebas se usa la razn de las varianzas muestrales, Fo = s 22 s 12 . Es
conveniente por razones prcticas que veremos ms adelante, que las hiptesis se planteen de
forma que la varianza mayor siempre este en el numerador. Si las muestras provienen de dos
poblaciones con la misma varianza o de una misma poblacin, la distribucin de
probabilidades de la razn de varianzas sigue el modelo probabilstico conocido como
distribucin F de Snedecor, cuya funcin de probabilidad es la siguiente:
h( f ) =
[ ( 1 + 2 ) 2]
( 1 / 2 ) 1 2 f
( 1 2) ( 2 2)
( 1 2)
- 1 [1 + ( ) f ] 1
2
(1 2)( 1 + 2 )
f >0
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
150
La tabla tiene dos entradas: los grados de libertad del numerador (1) que identifican las
columnas y los grados de libertad del denominador (2) que identifican las filas. Cada fila est
subdividida en hileras que corresponden a seis diferentes niveles de significacin (1-).
Los valores que se encuentran en la
interseccin de una hilera con una columna
corresponden a un percentil, es decir a un
valor de f a la izquierda del cual se
encuentra una porporcin 1- del rea. Por
ejemplo si se tiene que 1 = 12 y 2 = 13,
entonces un 0.95 del rea bajo la curva de
F se encuentra a la izquierda del percentil
f = 2.6 (Tabla 6.7 y Figura 6.12).
Figura 6.12
Suponiendo que la razn de varianzas de dos muestras es menor al valor lmite 2.6, eso
significa que su probabilidad de ocurrencia es mayor a 0.05. En ste caso se considera que las
diferencias entre las dos varianzas muestrales son aleatorias. Pero si la razn de varianza es
mayor a 2.6, es porque su probabilidad de ocurrencia es menor a 0.05, de lo que se deduce que
las diferencias entre las dos varianzas muestrales no son simplemente fortutas y por tanto las
varianzas son diferentes. En trminos generales se puede decir que cuando se trata de una
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
151
prueba con una cola a la derecha el valor f(1- ; 1/2) define el lmite entre las zonas de
aceptacin y rechazo de la hiptesis nula (H0 : 22 = 12 ).
Cuando la prueba de hiptesis es de dos
colas, debido a la asimetra de la
distribucin de F, la zona de rechazo de H0
es diferente para ambos lados de la
distribucin. El valor f(1- /2; 1/2) sera el
lmite de la derecha y el valor f(/2; 1/2) el
lmite de la izquierda (Figura 6.13). Aqu
surge un pequeo inconveniente, porque
las tablas de la funcin acumulada slo
Figura 6.13
presentan valores de f para la cola derecha.
Esta situacin se puede solventar de dos maneras. La forma ms fcil es plantear las hiptesis
de modo que la varianza muestral mayor siempre quede en el numerador. La otra solucin es
calcular el valor crtico de la cola izquierda mediante la expresin siguiente:
1
f ( 2 ; 1 2 ) =
f (1- 2) ; 2 1 )
Por ejemplo, si f ( 0.975 ; 8 12) = 3.5 es el lmite crtico para la cola de la derecha, en las tablas no
se encuentra el valor de f ( 0.025 ; 8/12) que sera el lmite crtico de la cola de la izquierda, pero se
puede calcular usando la relacin anterior. En primer lugar se encuentra el valor de
f ( 0.975 ; 12 8) = 4.2 (observe que los grados de libertad se intercambiaron), luego se obtiene el
inverso de 4.2, siendo entonces f ( 0.025 ; 8/12) = 0.238. Este mismo procedimiento se debe usar
para calcular el valor crtico de la zona de rechazo cuando la prueba de hiptesis es de una
cola a la izquierda.
Ejemplo 6.17. En un estudio taxonmico sobre una especie de insecto se quiere usar una
caracterstica morfolgica del cuerpo para estimar el tamao de los adultos. Se escoger como
carcterstica aquella que tenga la menor variabilidad. Con ste propsito se midieron en 10
individuos la longitud del ala anterior y la longitud total del cuerpo. Con base a los resultados
que se presentan a continuacin y sabiendo que las dos variables se distribuyen normalmente,
escoja la que mejor estima el tamao de los insectos?
N de Individuo
Alas anteriores (mm)
Tamao del cuerpo (mm)
1
17,1
17,6
2
17
16,5
3
17,1
15,5
H0 : 22 12 = 1
H1 : 22 12 1
4
16,3
16,9
5
16,9
17,1
6
15,9
15,2
7
16,2
16,7
8
17,2
17,7
9
17,1
16,9
10
16,8
15,1
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
152
2 ; n 2 -1 n 1 -1) <
F < f (1-
2 ; n 2 -1 n 1 -1) }
e. Cmputos necesarios.
2
s 22 0.8907
=
= 4.26
s 12 0.2093
2 ; n 2 -1 n 1 -1) C <
F < f (1-
f (0.025;9 / 9) =
1
f (0.975;9 / 9)
1
= 0.248
4.03
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
153
Ejemplo 6.18. Un eclogo afirma que la temperatura del agua en los ros de pramo es ms
homognea que la temperatura del agua en los ros de selva nublada, para lo cual determin la
temperatura mxima diaria en ros de ambas zonas.Apoyan los resultados la hiptesis del
investigador?. Se sabe que la temperatura tiene una distribucin normal y se dispone de la
informacin siguiente:
Pramo
17.0
11.9
1.39
N ros
Media
Desviacin
Selva nublada
26.0
16.5
2.28
H0 : 22 12 = 1
Hiptesis alternativa:
H1 : 22 12 > 1
s 22 5.2
=
= 2.69
s 12 1.93
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
154
6.7 EJERCICIOS
6.7.1)
6.7.2)
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
155
6.7.4)
El Profesor de Mtodos Estadsticos supone que el CI de los alumnos del curso actual
es superior al promedio de los cursos anteriores que ha sido igual a 100 con una
desviacin igual a 10. Para poner a prueba tal suposicin le midi el CI a los 25 alumnos del curso presente y encontr que el CI fue de 104. Tiene razn el profesor?.
Use un = 0.04
6.7.5)
Despus de haberse realizado una campaa publicitaria sobre los efectos dainos del
cigarrillo sobre la salud de las personas, el Ministerio de Sanidad, quiere comprobar
si la misma tuvo efecto y si como consecuencia de la misma disminuy el consumo
medio de cigarrillos por adulto, valor que al inicio de la campaa era de 10
cigarrillos/dia con una desviacin de 1.5 cigarrillos/dia. Para tal fin eligieron
aleatoriamente 144 individuos y encontraon que la media muestral fue de 8.5
cigarrillos/dia. tuvo la campaa algun efecto benfico a un nivel de significacin de
0.01.
6.7.6)
6.7.7)
Un mdico dice haber elaborado una crema para la comezn, y que la misma es
efectiva en mas del 70%. El Dpto. de Control de Medicamentos del MSAS, piensa lo
contrario y decide probar tal afirmacin con una probabilidad no mayor al 0.01 de
tomar una decisin equivocada. El efecto de la crema se evaluo en 200 pacientes, de
los cuales 125 dijeron haber experimentado un alivio inmediato. Quin tiene la
razn?.
6.7.8)
Samuel Segnini
6.7.9)
Fundamentos de Bioestadstica
Captulo 6
156
En el caso del problema 6.7.2 sobre cromatografa Se podra afirmar que la distancia
promedio recorrida por cada sustancia es distinta?
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
157
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
158
desviacin de 0.02 cm. Cual debe ser la decisin del entomlogo?. La variable talla
se distribuye normalmente. La probabilidad mxima de cometer error es igual a 0.01.
6.7.24) Un pas con una carencia crtica de alimentos recibe como ayuda internacional un
cargamento de varias toneladas de yuca, la cual se contamin en el viaje con una toxina
que afecta el sistema nervioso. Estudios de la Organizacin Mundial de la Salud han
demostrado que alimentos que contengan concentraciones iguales o menores a 40 ppm
de la toxina pueden ser ingeridos sin mayor riesgo. Las autoridades sanitarias del pas
en cuestin determinan la presencia de la toxina en 100 muestras tomadas al azar del
cargamento (el costo y el tiempo requerido del anlisis no permite hacer ms
determinaciones) y obtienen una concentracin promedio de la toxina de 37.8 ppm. con
una desviacin tpica de 10 ppm.. A Ud. se le consulta para decidir si el cargamento
debe utilizarse o destruirse. En base a la informacin suministrada y teniendo en cuenta
que lo siguiente:
6.7.24.1) Cual nivel de significacin escogera para probar la hiptesis? Por qu?
Recuerde que estan en juego la salud y/o vida de miles de personas.
6.7.24.2) Haga los clculos correspondientes y formule su decisin estadstica?
6.7.24.3) Que recomendara hacer con el cargamento de yuca?. Tenga presente que su
decisin puede implicar a) impedir que miles de personas mueran de
inanicin o b) envenenarlas con la toxina.
6.7.25) En un estudio sobre el ciclo de vida de un insecto, se desea determinar si existen
diferencias en cuanto a la duracin entre las fases de huevo y de larva. A una muestra
de 12 huevos y a otra muestra de 12 larvas se les determina el tiempo de duracin, los
cuales resultan ser los siguientes:
Huevos
(horas)
31
34
29
26
32
35
38
34
30
29
32
31
Larvas
(horas)
26
24
28
29
30
29
32
26
31
29
32
28
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
159
6.7.26) El oxgeno consumido (ml) durante la incubacin de dos suspensiones de clulas, una
en un buffer y la otra no, fue el siguiente:
Suspensin con Suspensin sin
buffer
buffer
13.0
6.7
13.2
7.2
15.0
9.1
13.2
8.3
14.2
7.6
14.8
9.2
14.1
7.8
12.2
8.7
12.1
6.9
13.4
6.8
13.8
7.7
13.1
7.2
13.5
8.5
14.7
7.5
15.1
7.8
12.9
7.5
15.0
13.9
Existen diferencias en el consumo de oxgeno entre los dos grupos de clulas?. El
error tipo I debe ser igual o menor a 0,01%.
6.7.27) Dos mtodos de recuperacin de nitrgeno se utilizaron para analizar 36 porciones de
un material orgnico. Los resultados fueron los siguientes:
Media
Desviacin
Mtodo A Mtodo B
75.8%
76.0%
3.10%
2.50%
1000 m.s.n.m.
6.5
1.11
2.700 m.s.n.m.
8.4
1.65
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
160
6.7.29) Se sabe que la maquinaria para llenar un medicamento en polvo lo vierte en frascos
de un detrminado tamao con una desviacin estndar de 0.6 g. A fin de mantener
ajustada la maquina, diariamente se verifican los pesos netos de las cajas. Dos
muestras tomadas en dos das presentan la informacin siguiente:
Media
n
Muestra 1 Muestra 2
18.7 g
21.9 g
30
35
Profundidad
(m)
1
2
3
4
5
6
Nmero de individuos /
litro
Especie A
Especie B
35
37
32
27
29
30
28
31
32
30
28
27
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
161
Mtodo B
31.51
31.30
31.50
31.81
31.66
31.65
31.57
31.42
31.76
31.71
6.7.34) A Ud. como profesional al Servicio del Ministerio del Ambiente le corresponde
investigar la denuncia de un grupo de cultivadores de ajo en la poblacin de
Mucuchis que afirman que los efluvios de una planta industrial instalada en los
alrededores de los plantos y que son vertidos en un canal de aguas servidas, estan
disminuyendo el tamao de los ajos que cultivan. Como primer paso Ud. hace analizar
muestras de las aguas residuales de la planta y en repetidos intentos no logra detectar
ninguna sustancia que se pueda suponer afecte a los ajos. Como segundo paso decide
verificar si hay evidencias de que los ajos sembrados en las riberas del canal son de
menosr peso que los de otras zonas de los cultivos. Para ello toma una muestra de 51
cabezas de ajos de plantas situadas en la ribera del canal de desage y otra muestra de
Samuel Segnini
Fundamentos de Bioestadstica
Captulo 6
162
igual tamao y tomada con un procedimiento anlogo de una zona de los cultivos fuera
de la influencia del canal y procedi a pesar las cabezas. Los resultados del pesaje
fueron los siguientes: para las plantas fuera de la influencia del canal el promedio de la
muestra fue de 29.9 g con una desviacin de 2.44 g; para las plantas en la zona de
influencia la muestra proporcion una media de 28.7 g con una desviacin de 2.89 g.
Se podra afirmar, que existen diferencias en el peso promedio de los ajos cultivados
en ambas zonas?. Para responder la pregunta anterior use el nivel de significacin que
le parezca ms adecuado y explique las razones de esta seleccin.