Está en la página 1de 69

UNIDAD 1 INFERENCIA ESTADISTICA

1.1 CONCEPTOS BSICOS


1.2 DISTRIBUCIONES DE MUESTREO
Es evidente que los resultados obtenidos del estudio de una muestra no son del todo
fiables, pero s en buena medida. Los parmetros que obtienen de una muestra
(estimadores estadsticos) nos permitirn arriesgarnos a predecir una serie de resultados
para toda la poblacin. De estas predicciones y del riesgo que conllevan se ocupa la
Inferencia Estadstica.
Distribucin de medias muestrales
Si una poblacin tiene N elementos, el n de muestras distintas de tamao n que se
pueden elegir es

N

n

Nn
. Si pueden repetirse individuos, el nmero de muestras ser igual a

Ejemplo: calcular el n de muestra de tamao 21 que pueden elegirse en una poblacin


de 120 alumnos:
a) sin reemplazamiento
b) con reemplazamiento
Repaso de la distribucin normal
Ejercicios:
1) Si Z es una N(0, 1), calcular las siguientes probabilidades:
a) p(Z<1)

b) p( Z>13)

c) p(Z<-05)

d) p(-05<Z<13)

2) Si X es una N(15, 3), responder a las siguientes cuestiones:

Z
a) tipificarla a una N(0, 1) con el cambio
b) calcular las siguientes probabilidades:
p(X<21)

p(X<-7)

Parmetros muestrales

p(X>31)

Elegida una muestra, hallaremos en ella la media


y la desviacin tpica S. Lo que
tendremos que estudiar ser la representatividad de estos parmetros muestrales con los
parmetros reales de la poblacin, es decir: la media poblacional , y la desviacin tpica
de la poblacin .
Si en una poblacin de N individuos tomamos todas las muestras posibles de tamao n,
se puede demostrar que la media de las medias muestrales coincide con la media

X
poblacional, esto es
Sin embargo, no se cumple lo mismo para la desviacin tpica de las medias muestrales,

S
sino que se verifica que

n
, siendo n el tamao de las muestras.

Teorema central del lmite

La distribucin de las medias muestrales de tamao n, extradas de una poblacin

N ( ,

N ( , )
normal

, se ajustan a una normal

)
n
.

Si las medias muestrales provienen de una poblacin no normal, pero el tamao de


las mismas es n30, la distribucin de las medias muestrales tambin se ajusta a una

N ( ,

)
n
.

www.elalmanaque.com/.../Muestreo%20y%20Estimacin%20estadstica....
1.3 ESTIMACIN PUNTUAL

La estimacin puntual consiste en obtener un nico nmero calculado a partir de las


observaciones muestrales, y que es utilizado como estimacin del valor del parmetro .
Se le llama estimacin puntual porque a ese nmero, que se utiliza como estimacin del
parmetro , se le puede asignar un punto sobre la recta real. En la estimacin por
intervalos se obtienen dos puntos ( un extremo inferior y un extremo superior) que
definen un intervalo sobre la recta real, el cual contendr con cierta seguridad el valor del
parmetro .
El estimador del parmetro poblacional es una funcin de las variables aleatorias u
observaciones muestrales y se representa por

X 1 , X 2 ,..., X n
=g (

x1 , x2 ,..., xn
Para una realizacin particular de la muestra (
) se obtiene un valor especfico
del estimador que recibe el nombre de estimacin del parmetro poblacional y lo
notaremos por

x1 , x2 ,..., xn
=g(

Vemos pues que existe diferencia entre estimador y estimacin. El estimador es un


estadstico y, por tanto, una variable aleatoria y el valor de esta variable para una muestra

x1 , x2 ,..., xn
concreta (
muestral.

) ser la estimacin puntual. El estimador tendr su distribucin

En la tabla 2.1 expresamos diferentes parmetros poblacionales, sus estimadores y sus


estimaciones.

Parmetro

Estimador

Estimacin

poblacional
n

Media

Varianza

i 1

2 S 2

p
Proporcin

Xi

n
1 n
( X i X )2

n 1 i 1

X
nmeroxitos

n nmeropruebas

x
i 1

s2

1 n
xi x
n 1 i 1

x
n

TABLA 2.1 Parmetros poblacionales, estimadores y estimaciones.

Para la eleccin de estos estimadores puntuales nos hemos basado, principalmente en la


intuicin y en la posible analoga de los parmetros poblacionales con sus
correspondientes valores muestrales, pero ste no ser el mtodo ms adecuado para la
obtencin de estimadores puntuales, aunque en este caso se obtienen estimadores
satisfactorios para los parmetros poblacionales. En general, el problema de obtener
estimadores puntuales no ser tan sencillo, por ello tenemos que dar propiedades que
seran deseables que se cumplieran por los diferentes estimadores puntuales obtenidos,
aunque no existe un mecanismo o mtodo nico que nos permita obtener el mejor
estimador puntual en todas las circunstancias.
Nuestro objetivo ahora ser dar algunas propiedades deseables de los estimadores
puntuales, con el fin de poder conocer la bondad de los mismos, pues cuantas ms
propiedades verifiquen los estimadores puntuales mejores sern.

* PROPIEDADES DESEABLES DE LOS ESTIMADORES PUNTUALES

a) Estimador insesgado
Si tenemos un gran nmero de muestras de tamao n y obtenemos el valor del
estimador en cada una de ellas, sera deseable que la media de todas estas estimaciones
coincidiera con el valor de .
Se dice que un estimador es insesgado si su esperanza matemtica coincide con el
valor del parmetro a estimar.
b) Estimador eficiente
Se dice que los estimadores son eficientes cuando generan una distribucin muestral
con el mnimo error estndar ,es decir, entre dos estimadores insesgados de un
parmetro dado es ms eficiente el de menor varianza.
c) Estimador consistente

Un estimador se dice consistente cuando su valor tiende hacia el verdadero valor del
parmetro a medida que aumenta el tamao de la muestra. Es decir, la probabilidad de
que la estimacin sea el verdadero valor del parmetro tiende a 1.
d) Estimador suficiente
Se dice de un estimador que es suficiente cuando es capaz de extraer de los datos toda la
informacin importante sobre el parmetro.

1.4 ESTIMACIN POR INTERVALOS


La estimacin puntual es poco til, pues solo obtenemos un valor como aproximacin al
que tratamos de estimar. Es mucho ms interesante obtener un intervalo dentro del cual
se tiene una cierta confianza de que se encuentre el parmetro que tratamos de estimar.
El objetivo que se pretende con los intervalos de confianza es obtener un intervalo de
poca amplitud y con una alta probabilidad de que el parmetro se encuentre en su
interior. As pues, elegiremos probabilidades cercanas a la unidad, que se representan por
1- y cuyos valores ms frecuentes suelen ser 0'90, 0'95 y 0'99.
Luego si deseamos obtener una estimacin por intervalo del parmetro poblacional

X 1 , X 2 ,..., X n
desconocido,

tendremos

que

obtener

dos

estadsticos

X 1 , X 2 ,..., X n
que nos darn los valores extremos del intervalo, tales que

P X 1 , X 2 ,..., X n X 1 , X 2 ,..., X n 1

Al valor 1- se le llama coeficiente de confianza, y


Al valor 100(1-) % se le llama nivel de confianza.

a) Intervalo de confianza para la proporcin poblacional.


Si p representa la proporcin de xitos en una muestra aleatoria de tamao n
suficientemente grande y q=1-p, entonces un intervalo de confianza aproximado para la
proporcin poblacional p al nivel de confianza del 100(1-)% viene dado por:

p z

p q
, p z
n
2

p q

z / 2
en donde

es tal que

z / 2
P[Z>

]=

y la variable aleatoria Z sigue una distribucin N(0,1).

b) Intervalo de confianza para la media de una poblacin normal, siendo conocida


Supongamos que tenemos una muestra aleatoria de n observaciones de una

x
distribucin N(, ). Si es conocida, y la media muestral observada es , entonces el
intervalo de confianza para la media poblacional , al nivel de confianza del 100(1-)%
viene dado por:

x z / 2

, x z / 2
n
n

z / 2
donde

es tal que

P ( Z z / 2 )

y la variable aleatoria ZN(0,1).


c) Intervalo de confianza para la media de una poblacin normal, siendo
desconocida y n<30.
Supongamos que tenemos una muestra aleatoria de n<30 observaciones de una
distribucin N(,). Si es desconocida, y la media y la desviacin tpica muestral
observadas son x y s, respectivamente, entonces el intervalo de confianza para la media
poblacional , al nivel de confianza del 100(1-)% viene dado por:

x t / 2

s$
s$
, x t / 2
n
n

t / 2
donde

es tal que

P tn 1 t / 2

tn 1
y la variable

sigue una distribucin t-Student con n-1 grados de libertad.

d) Intervalo de confianza para la varianza de una poblacin normal.


Supongamos una muestra aleatoria de n observaciones de una distribucin N(,). Si
2
s$

es desconocida y la varianza muestral observada es


para la varianza poblacional

al nivel de confianza del 100(1-)% viene dado por:

(n 1) s (n 1) s
, 2
2

n 1, / 2 n 1,1 / 2

n21,1 / 2
donde

es tal que:

P n21 n21,1 / 2

n21, / 2
y

entonces el intervalo de confianza

es tal que:

P n21 n21, / 2 1

n21

y la variable aleatoria
libertad.

sigue una distribucin

de Pearson con n-1 grados de

e) Intervalo de confianza para la diferencia de medias en poblaciones normales


independientes

ny

nx
Supongamos dos muestras independientes de tamao
poblaciones normales.

procedentes de

N y , y

N x , x
y

, respectivamente. Si las medias para las muestras observadas

x
son

, entonces un intervalo de confianza, al nivel de confianza del 100(1-)%,

x y
para las diferencias de medias poblacionales

( x y ) z / 2

viene dado por:

2
2
x2 y
x2 y

, ( x y ) z / 2

nx n y
nx n y

P Z z / 2

z / 2
en donde
aleatoria Z sigue una N(0, 1).

es el nmero tal que:

2
y la variable

ESTIMACIN DEL TAMAO MUESTRAL


Sabemos que si tomamos una muestra aleatoria simple de tamao n procedente de
una poblacin N(,), siendo conocida, el intervalo de confianza al nivel del 100(1-)%
para la media poblacional vena dado por:

I x z / 2
, x z / 2
n
n

Siendo la amplitud del intervalo

L ( x z / 2

) ( x z / 2
) 2 z / 2
n
n
n
(*)

Si, previamente, se fija la longitud del intervalo L y deseamos conocer el tamao de la


muestra para obtener ese intervalo al nivel de confianza del 100(1-)%, bastar despejar

z / 2
n de la expresin (*), pues L,
muestra ser:

y son conocidos, y tendremos que el tamao de la

n 4 z2 / 2

2
L2

el cual nos permitir construir un intervalo al nivel de confianza del 100(1-)% y de


amplitud L para la media de una poblacin normal con conocida.

Tambin podramos hacer el siguiente razonamiento cuando sea conocido, si la media


fuera el valor central del intervalo, entonces x estimara puntualmente a sin error
alguno,

|---------------------------|----------------|---------------------------|
error

x z / 2

x z / 2

Pero generalmente x no ser exactamente igual a y entonces se comete un error, E=|

x
-|, que como mximo ser:

z / 2

E=
entonces si queremos determinar el tamao de muestra necesario para obtener un
intervalo de confianza para la media poblacional , admitiendo un error E, tendremos que
despejando de la expresin anterior:

n z2 / 2

2
E2

Igualmente se tendra para una proporcin: n=4

z2 / 2 p q
L2

z2 / 2 p q
E2

https://www.google.com.mx/url?
sa=t&rct=j&q=&esrc=s&source=web&cd=9&ved=0CE4QFjAIahUKEwjR4IiB34vGAhWGTpIKHZkFAI
Y&url=http%3A%2F%2Fmancomunidadcg.info%2FUniversidad%2FDocs%2FJaioneFernandez
%2FEstad%25C3%25ADstica%2520Administrativa.%25202%25C2%25BA%2520GAP%2FTema
%25202.doc&ei=X6V7VZG1FYadyQSZi4CwCA&usg=AFQjCNF3U5G5eyOgvsz3_iHsqJaHcba3fg
1-5 INTERVALOS DE CONFIANZA PARA MEDIAS
Intervalo de confianza para la media, cuando se selecciona una muestra aleatoria de tamao
n de una poblacin con distribucin normal con media y varianza
conocida.
En este caso, por las condiciones de la muestra se utiliza la distribucin normal estndar, por lo
tanto
y
pertenecen a una distribucin normal estndar. Como se trabaja con una
distribucin normal,
y
son iguales pero con diferente signo,
es negativo y
es
positivo, por lo tanto en la frmula se incluye el signo y
y
se reemplazan por Z. Para
obtener el intervalo de confianza para la media se utiliza la siguiente expresin:
(2.1)
Donde Z pertenece a una distribucin normal estndar.
Interpretando este intervalo se dir que el promedio poblacional estar entre:
con una confiabilidad del (1-

) por ciento.

EJEMPLO
Un proceso manufacturero usado por una fbrica durante los ltimos 10 aos, tiene una
distribucin normal con desviacin estndar de 8 unidades por hora. Se desea estimar un intervalo

de confianza del 90 por ciento para el promedio de unidades por hora producido con dicho proceso.
Para tal efecto, se toma una muestra aleatoria de la produccin por hora durante 25 horas y se
obtiene un promedio de 160 unidades.
Solucin . Como la distribucin de la poblacin es normal y se conoce la desviacin estndar
poblacional, se utiliza la expresin 2.1 para calcular el intervalo de confianza.
El valor de Z se halla en una tabla de la distribucin normal. La confiabilidad es del 90 por ciento,
por lo tanto el nivel de significancia o a (0.1) se divide en dos y se deja a /2 en la cola inferior y a /2
en la cola superior. En la figura 2.2, el rea que hay de - a Z es 0,95 y para sta rea el valor de
Z en la distribucin normal es 1,64

Figura 2.2 Percentil de la distribucin normal

Interpretacin. El promedio de unidades por hora producidas en dicha fbrica est entre 157 y 163
con una confiabilidad del 90 por ciento.
http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/lecciones/capitulodos/tema2.htm
1.6 INTERVALO DE CONFIANZA PARA DIFERENCIA ENTRE MEDIAS

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE


DOS DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS
En esta seccin se ver el caso en donde se tienen dos poblaciones con medias y
varianzas desconocidas, y se desea encontrar un intervalo de confianza para la
diferencia de dos medias Si los tamaos de muestras n1 y n2 son
mayores que 30, entonces, puede emplearse el intervalo de confianza de
la distribucin normal. Sin embargo, cuando se toman muestras
pequeas se supone que las poblaciones de inters estn distribuidas de

manera normal, y los intervalos de confianza se basan en la distribucin


t.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE
DOS DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS
PERO IGUALES
Si
s12 y s22 son las medias y las varianzas de dos muestras
aleatorias de tamao n1 y n2, respectivamente, tomadas de dos
poblaciones normales e independientes con varianzas desconocidas
pero iguales, entonces un intervalo de confianza del 100(
) por
ciento para la diferencia entre medias es:

en donde:

es el estimador combinado de la desviacin estndar comn de la


poblacin con n1+n2 2 grados de libertad.
Ejemplos:
1. Un artculo publicado dio a conocer los resultados de un anlisis
del peso de calcio en cemento estndar y en cemento contaminado
con plomo. Los niveles bajos de calcio indican que el mecanismo
de hidratacin del cemento queda bloqueado y esto permite que el
agua ataque varias partes de una estructura de cemento. Al tomar
diez muestras de cemento estndar, se encontr que el peso
promedio de calcio es de 90 con una desviacin estndar de 5; los
resultados obtenidos con 15 muestras de cemento contaminado
con plomo fueron de 87 en promedio con una desviacin estndar
de 4. Supngase que el porcentaje de peso de calcio est
distribuido de manera normal. Encuntrese un intervalo de
confianza del 95% para la diferencia entre medias de los dos tipos
de cementos. Por otra parte, supngase que las dos poblaciones
normales tienen la misma desviacin estndar.

Solucin:
El estimador combinado de la desviacin estndar es:

Al calcularle raz cuadrada a este valor nos queda que sp = 4.41

expresin que se reduce a 0.72

6.72

Ntese que el intervalo de confianza del 95% incluye al cero; por


consiguiente, para este nivel confianza, no puede concluirse la
existencia de una diferencia entre las medias.

2. Se realiz un experimento para comparar el tiempo promedio


requerido por el cuerpo humano para absorber dos medicamentos,
A y B. Suponga que el tiempo necesario para que cada
medicamento alcance un nivel especfico en el torrente sanguneo
se distribuye normalmente. Se eligieron al azar a doce personas
para ensayar cada frmaco registrndose el tiempo en minutos que
tard en alcanzar un nivel especfico en la sangre. Calcule un
intervalo de confianza del 95% para la diferencia del tiempo
promedio. Suponga varianzas iguales.
Medicamento A

Medicamento B

nA = 12

nB = 12

SA2= 15.57

SB2 = 17.54

Solucin:

2.35

9.25

Con un nivel confianza del 95% se sabe que el tiempo promedio para
alcanzar un nivel especfico es mayor para el medicamento B.

PRUEBA SOBRE DOS MEDIAS, POBLACIONES


VARIANZAS DESCONOCIDAS PERO IGUALES

NORMALES,

Las situaciones que ms prevalecen e implican pruebas sobre dos medias son las que tienen
varianzas desconocidas. Si el cientfico prueba mediante una prueba F, que las varianzas de las
dos poblaciones son iguales, se utiliza la siguiente frmula:

donde:

Los grados de libertad estn dados por:

Ejemplos:
1. Para encontrar si un nuevo suero detiene la leucemia, se
seleccionan nueve ratones, todos con una etapa avanzada de la
enfermedad. Cinco ratones reciben el tratamiento y cuatro no. Los
tiempos de sobrevivencia en aos, a partir del momento en que
comienza el experimento son los siguientes:
Con Tratamiento

2.1

5.3

1.4

4.6

Sin Tratamiento

1.9

0.5

2.8

3.1

0.9

Se puede decir en el nivel de significancia del 0.05 que el suero


es efectivo? Suponga que las dos poblaciones se distribuyen
normalmente con varianzas iguales.
Solucin:
Primero se probar el supuesto de varianzas iguales con un ensayo de
hiptesis bilateral utilizando la distribucin Fisher.
Datos:
Con tratamiento

s= 1.97
n=5

Sin tratamiento

s = 1.1672
n=4
Ensayo de hiptesis:

Estadstico de prueba:

La sugerencia que se hace es que el numerador sea el de valor


mayor .
Entonces los grados de libertad uno ser el tamao de la muestra de la
poblacin uno menos uno. 1= 5-1 = 4 y 2 = 4-1=3.

Regla de decisin:
Si 0.10 Fc

15.1 No se rechaza Ho,

Si la Fc < 0.10 si Fc > 15.1 se rechaza Ho.


Clculo:

Decisin y Justificacin:
Como 2.85 esta entre los dos valores de Ho no se rechaza , y se concluye
con un
= 0.05 que existe suficiente evidencia para decir que las
varianza de las poblaciones son iguales.
Con la decisin anterior se procede a comparar las medias:
Ensayo de Hiptesis
Ho;

CT

ST

H1;

CT

=0

ST

>0

Los grados de libertad son (5+4-2) = 7


Regla de decisin:
Si tR 1.895 No se Rechaza Ho
Si tR > 1.895 se rechaza Ho
Clculos:

por lo tanto sp = 1.848

Justificacin y decisin:

Como 0.6332 es menor que 1.895, no se rechaza H o, y se concluye con


un nivel de significancia del 0.05 que no existe suficiente evidencia para
decir que el suero detiene la leucemia.
2. Se realiz un experimento para comparar el tiempo promedio
requerido por el cuerpo humano para absorber dos medicamentos,
A y B. Suponga que el tiempo necesario para que cada
medicamento alcance un nivel especfico en el torrente sanguneo
se distribuye normalmente. Se eligieron al azar a doce personas
para ensayar cada frmaco registrndose el tiempo en minutos que
tard en alcanzar un nivel especfico en la sangre. Calcule con
= 0.05 si existe diferencia entre los tiempos promedio y obtenga el valor
de P. Suponga varianzas iguales.
Medicamento A

Medicamento B

nA = 12

nB = 12

SA2= 15.57

SB2 = 17.54

Solucin:
Primero se pondr a prueba el supuesto de varianzas iguales mediante
una prueba de hiptesis con
= 0.10.
Ensayo de hiptesis:

Estadstico de prueba:

La sugerencia que se hace es que el numerador sea el de valor


mayor .
Entonces los grados de libertad uno ser el tamao de la muestra de la
poblacin uno menos uno. 1=12-1=11 y 2=12-1=11.

Regla de decisin:
Si 0.355

Fc

2.82 No se rechaza Ho,

Si la Fc < 0.355 si Fc > 2.82 se rechaza Ho.


Clculo:

Decisin y Justificacin:
Como 1.13 esta entre los dos valores de Ho no se rechaza , y se concluye
con un
= 0.10 que existe suficiente evidencia para decir que las
varianza de las poblaciones son iguales.
Con la decisin anterior se procede a comparar las medias:

Ensayo de Hiptesis
Ho;

H1;

=0
0

Los grados de libertad son (12+12-2) = 22


Regla de decisin:
Si 2.074

tc

2.074 No se rechaza Ho,

Si la tc < -2.074 si tc > 2.074 se rechaza Ho.


Clculos:

Justificacin y decisin:

Como 3.49 es mayor que 2.074, no se rechaza Ho, y se concluye con un


nivel de significancia del 0.05 que la media del tiempo para que el
medicamento A llegue a un nivel especfico en el torrente sanguneo es
distinta de la que toma al frmaco B alcanzar ese mismo nivel.
Para calcular el valor de P se ubicar la t calculada en la grfica para
proceder a buscar el rea y multiplicarla por dos ya que es bilateral.

P = (2)(0.00139) = 0.00278

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE


DOS DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS
PERO DIFERENTES
Consideremos ahora el problema de encontrar una estimacin por
intervalos de cuando no es probable que las varianzas
poblacionales desconocidas sean iguales. La estadstica que se usa con
ms frecuencia en este caso es:

que tiene aproximadamente una distribucin t con


donde:

grados de libertad,

Como
rara vez es nmero entero, lo redondeamos al nmero entero
ms cercano menor. Esto es si el valor de nu es de 15.9 se redondear a
15.
Al despejar la diferencia de medias poblacionales de la formula de t nos
queda:

Ejemplos:
1. El departamento de zoologa de la Universidad de Virginia llev a
cabo un estudio para estimar la diferencia en la cantidad de
ortofsforo qumico medido en dos estaciones diferentes del ro
James. El ortofsforo se mide en miligramos por litro. Se reunieron
15 muestras de la estacin 1 y se ontuvo una media de 3.84 con
una desviacin estndar de 3.07 miligramos por litro, mientras que
12 muestras de la estacin 2 tuvieron un contenido promedio de
1.49 con una desviacin estndar 0.80 miligramos por litro.
Encuentre un intervalo de confianza de 95% para la diferencia del
contenido promedio real de ortofsforo en estas dos estaciones,
suponga que las observaciones vienen de poblaciones normales
con varianzas diferentes.
Solucin:
Datos:
Estacin 1

Estacin 2

n1 = 15

n2 = 12

S1= 3.07

S2 = 0.80

Primero se proceder a calcular los grados de libertad:

Al usar
=0.05, encontramos en la tabla con 16 grados de libertad que
el valor de t es 2.120, por lo tanto:

que se simplifica a:
0.60

4.10

Por ello se tiene una confianza del 95% de que el intervalo de 0.60 a 4.10
miligramos por litro contiene la diferencia de los contenidos promedios
reales de ortofsforo para estos dos lugares.

PRUEBA SOBRE DOS MEDIAS, POBLACIONES


VARIANZAS DESCONOCIDAS PERO DIFERENTES

NORMALES,

Ejemplo:

1. Un fabricante de monitores prueba dos diseos de microcircuitos


para determinar si producen un flujo de corriente equivalente. El
departamento de ingeniera ha obtenido los datos siguientes:

Diseo 1

n1 = 16

s12 = 10

Diseo 2

n2 = 10

s22 = 40

Con
= 0.05, se desea determinar si existe alguna diferencia
significativa en el flujo de corriente promedio entre los dos diseos,
donde se supone que las dos poblaciones son normales, pero no
es posible suponer que las varianzas desconocidas sean iguales.
Solucin:
Primero se probarn varianzas desiguales.
Ensayo de hiptesis:

Estadstico de prueba:

La sugerencia que se hace es que el numerador sea el de


valor mayor .
Entonces los grados de libertad uno ser el tamao de la muestra
de la poblacin uno menos uno. 1= 10-1 = 9 y 2 = 16-1=15.

Regla de decisin:
Si 0.265 Fc

3.12 No se rechaza Ho,

Si la Fc < 0.265 si Fc > 3.12 se rechaza Ho.


Clculo:

Decisin y Justificacin:
Como 4 es mayor que 3.12 se rechaza Ho , y se concluye con
un
= 0.05 que existe suficiente evidencia para decir que las
varianza de las poblaciones son diferentes.
Con la decisin anterior se procede a comparar las medias:
Ensayo de Hiptesis
Ho;

H1;

=0
0

Para poder buscar el valor de t en la tabla, se necesita saber el


valor de los grados de libertad:

Este valor se redondea al prximo menor que sera 11.

Regla de decisin:
Si 2.201 tR

2.201 No se rechaza Ho

Si tR < -2.201 si tR > 2.201 se rechaza Ho


Clculos:

Justificacin y decisin:

Como 0.1395 esta entre 2.201 y 2.201, no se rechaza H o y se


concluye con un
= 0.05, que no existe diferencia significativa
en el flujo de corriente promedio entre los dos diseos.
2. Dos proveedores fabrican un engrane de plstico utilizado en una
impresora lser. Una caracterstica importante de estos engranes
es la resistencia al impacto la cual se mide en pies-libras. Una
muestra aleatoria de 10 engranes suministrados por el primer
proveedor arroja los siguientes resultados:
y s1 = 12. Del
segundo proveedor se toma una muestra aleatoria de 16 engranes,
donde los resultados son
y s2 = 45. Existe evidencia que apoye la afirmacin de que los engranes
del proveedor 2 tienen una mayor resistencia promedio al impacto. Use
un nivel de significancia de 0.05. Calcule el valor de P.
Solucin:
Datos:

Proveedor 1

Proveedor 2

n1 = 10

n2 = 16

S1= 12

S2 = 45

Primero se probarn varianzas desiguales.


Ensayo de hiptesis:

Estadstico de prueba:

La sugerencia que se hace es que el numerador sea el de valor


mayor .
Entonces los grados de libertad uno ser el tamao de la muestra de la
poblacin uno menos uno. 1= 16-1 = 15 y 2 = 10-1=9.

Regla de decisin:
Si 0.320 Fc

3.01 No se rechaza Ho,

Si la Fc < 0.320 si Fc > 3.01 se rechaza Ho.


Clculo:

Decisin y Justificacin:
Como 14.06 es mayor que 3.01 se rechaza Ho , y se concluye con un
= 0.05 que existe suficiente evidencia para decir que las varianza de las
poblaciones son diferentes.
Con la decisin anterior se procede a comparar las medias:
Ensayo de Hiptesis
Ho;

=0

H1;

>0

Para poder buscar el valor de t en la tabla, se necesita saber el valor de


los grados de libertad:

Este valor se redondea al prximo menor que sera 18.

Regla de decisin:
Si tR

1.734 No se rechaza Ho

Si tR > 1.734 se rechaza Ho


Clculos:

Justificacin y decisin:

Como 2.61 es mayor que 1.734, se rechaza H o y se concluye con un


=0.05, que existe evidencia suficiente para decir que el promedio de
resistencia de los engranes del proveedor 2 es mayor a el promedio de
resistencia de los engranes del proveedor 1.
Para calcular el valor de P se busca adentro de la tabla de t el valor de
2.61 con 18 grados de libertad y se observa que se encuentra entre dos
reas que son 0.01 y 0.0075, al interpolar nos da un valor de P =
0.00894.

1.7 INTERVALO DE CONFIANZA PARA UNA PROPORCIN


Dada una variable aleatoria con distribucin Binomial B(n, p), el objetivo es la construccin de un
intervalo de confianza para el parmetro p, basada en una observacin de la variable que ha dado
como valor x. El mismo caso se aplica si estudiamos una Binomial B(1, p) y consideramos el nmero
de veces que ocurre el suceso que define la variable al repetir el experimento n veces en condiciones
de independencia.
Existen dos alternativas a la hora de construir un intervalo de confianza para p:
Considerar la aproximacin asinttica de la distribucin Binomial en la distribucin Normal.
Utilizar un mtodo exacto.
Aproximacin asinttica
Tiene la ventaja de la simplicidad en la expresin y en los clculos, y es la ms referenciada en la
mayora de textos de estadstica. Se basa en la aproximacin

que, trasladada a la frecuencia relativa, resulta

Tomando como estadstico pivote

que sigue una distribucin N(0, 1), y aadiendo una correccin por continuidad al pasar de una
variable discreta a una continua, se obtiene el intervalo de confianza asinttico:

donde z/2 es el valor de una distribucin Normal estndar que deja a su derecha una probabilidad
de /2 para un intervalo de confianza de (1 ) 100 %. Las condiciones generalmente aceptadas
para considerar vlida la aproximacin asinttica anterior son:

El intervalo obtenido es un intervalo asinttico y por tanto condicionado a la validez de la aproximacin


utilizada. Una informacin ms general sobre los intervalos de confianza asintticos puede
encontrase aqu.
Intervalo exacto
Aun cuando las condiciones anteriores no se verifiquen, es posible la construccin de un intervalo
exacto, vlido siempre pero algo ms complicado en los clculos. Es posible demostrar que un intervalo
exacto para el parmetro p viene dado por los valores siguientes:

donde F/2,a,b es el valor de una distribucin F de Fisher-Snedecor con a y b grados de libertad que deja
a su derecha una probabilidad de /2 para un intervalo de confianza de (1 ) 100 %.
1.8 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES
Sea X1, X2,..., Xn1 una muestra aleatoria extrada de una poblacin Bernoulli. Sea X la variable
Binomial definida como el nmero de xitos en esta muestra y con parmetro 1, proporcin
poblacional de xitos.
Sea Y1, Y2,..., Yn2 una muestra aleatoria extrada de una poblacin Bernoulli. Sea Y la variable
Binomial definida como el nmero de xitos en esta muestra y tomemos a 2 como la proporcin
de xitos en esta otra poblacin. Supongamos que ambas muestras son independientes.
Si p1 y p2 son los estadsticos muestrales y definimos a

= p1-p2 como el estimador de la

diferencia de proporciones poblacionales = 1-2 entonces se debe cumplir que

Nota:
Si n1 y n2 son bastante grandes el radical se calcula usando los estadsticos de la muestra; es decir,
las proporciones muestrales.
Ejemplo 44
MillWard Brown, empresa investigadora de mercado es requerida para hacer un estudio sobre la
preferencia de un producto. Se le pide que estime la proporcin de hombres y mujeres que
conocen el producto que est siendo promocionado en toda la ciudad.
En una muestra aleatoria de 100 hombres y 200 mujeres se determina que 20 hombres y 60
mujeres estn familiarizados con el producto indicado. Construya un intervalo de confianza del 95%
para la diferencia de proporciones de hombres y mujeres que conocen el producto. En base a
estos resultados, se estara inclinado a concluir que existe una diferencia significativa entre las
dos proporciones?
Solucin
Sea 1 la proporcin de mujeres que prefieren el producto.
Sea 2 la proporcin de hombres que prefieren el producto.
Segn los datos: Se trata de un problema de diferencia de proporciones. Los datos son:

Luego el intervalo de confianza del 95% ser -0.0009 1 2 0.2009.


Segn esto, existe diferencia significativa? . No hay diferencia significativa porque no se puede
saber cul de las proporciones es mayor.

1.9 INTERVALOS DE CONFIANZA PARA VARIANZA


De una poblacin con distribucin normal con media m y varianza s 2 se obtiene una muestra
aleatoria de tamao n. Para obtener el intervalo de confianza para la varianza ( s 2 ) se parte de
la expresin (1.4):

Se divide por ns2 :

Se invierte:

Reescribiendo:

(2.6)
Donde

pertenecen a una distribucin chi-cuadrado con (n-1) grado de libertad, por lo

tanto,

son diferentes y

<

Ejemplo
La varianza de la resistencia a la rotura de 30 cables probados fu de 32.000 lbs 2. Halle un
intervalo de confianza del 90 por ciento, para la varianza de la resistencia de todos los cables de
sta marca.
Solucin . Se utiliza la expresin 2.6. Los valores de
y
pertenecen a una distribucin
chi-cuadrado con 29 grados de libertad. como puede observarse en la figura 2.3 el rea que hay
por debajo de Z a /2 es 0,05, por lo tanto
0,95, por lo tanto

=42,56

=17,71 y el rea que hay por debajo de

es

Figura 2.3 Percentiles de la distribucin chi-cuadrado

Reemplazando en la expresin 2.6 se obtiene:

Por razones de utilidad se halla el intervalo de confianza para la desviacin estndar, sacando la
raz cuadrada de los lmites, por lo tanto:

Interpretacin. El promedio de variacin o de dispersin de la rotura de los cables de dicha


marca, est entre 150 y 233 lbs. con una confiabilidad del 90 por ciento.

1.10
Intervalo de confianza para el cociente de varianzas de distribuciones normales independientes
Supondremos la existencia de dos poblaciones sobre las que una determinada variable sigue una
distribucin Normal. Sobre la poblacin 1 la variable sigue una distribucin N( 1, 1) y sobre la
poblacin 2 sigue una distribucin N( 2, 2). Igualmente supondremos que disponemos de
dos muestras aleatorias independientes, una para cada poblacin, de tamaos
muestrales n1 y n2 respectivamente.
El objetivo es construir un intervalo de confianza, con nivel de confianza (1 ) 100 %, para el
cociente de varianzas

El estadstico pivote utilizado es

que sigue una distribucin F de Fisher con n1 1 y n2 1 grados de libertad.


El intervalo de confianza que resulta es

donde F/2 es el valor de una distribucin F de Fisher-Snedecor con n1 1 y n2 1 grados de


libertad que deja a su derecha una probabilidad de /2.
UNIDAD 2 PRUEBAS DE HIPTESIS CON UNA MUESTRA
2.1 METODOLOGIA PARA LA PRUEBA DE HIPTESIS

Una hiptesis estadstica es una proposicin o supuesto sobre los


parmetros de una o ms poblaciones.
Suponga que se tiene inters en la rapidez de combustin de un agente
propulsor slido utilizado en los sistemas de salida de emergencia para la
tripulacin de aeronaves. El inters se centra sobre la rapidez de
combustin promedio. De manera especfica, el inters recae en decir si
la rapidez de combustin promedio es o no 50 cm/s. Esto puede
expresarse de manera formal como
Ho;
H1;

= 50 cm/s
50 cm/s

La proposicin Ho;

= 50 cm/s, se conoce como hiptesis nula,

mientras que la proposicin H1;


50 cm/s, recibe el nombre
de hiptesis alternativa.Puesto que la hiptesis alternativa especifica
valores de
que pueden ser mayores o menores que 50 cm/s, tambin
se conoce como hiptesis alternativa bilateral. En algunas situaciones,
lo que se desea es formular una hiptesis alternativa unilateral, como
en
Ho;

= 50 cm/s Ho;

= 50 cm/s

< 50 cm/s H1;

> 50 cm/s

H1;

Es importante recordar que las hiptesis siempre son proposiciones


sobre la poblacin o distribucin bajo estudio, no proposiciones sobre la
muestra. Por lo general, el valor del parmetro de la poblacin
especificado en la hiptesis nula se determina en una de tres maneras
diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento
del proceso, entonces el objetivo de la prueba de hiptesis
usualmente es determinar si ha cambiado el valor del parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se
relaciona con el proceso bajo estudio. En este caso, el objetivo de
la prueba de hiptesis es verificar la teora o modelo.
3. Cuando el valor del parmetro proviene de consideraciones
externas, tales como las especificaciones de diseo o ingeniera, o
de obligaciones contractuales. En esta situacin, el objetivo usual
de la prueba de hiptesis es probar el cumplimiento de las
especificaciones.
Un procedimiento que conduce a una decisin sobre una hiptesis en
particular recibe el nombre de prueba de hiptesis. Los procedimientos
de prueba de hiptesis dependen del empleo de la informacin contenida
en la muestra aleatoria de la poblacin de inters. Si esta informacin es
consistente con la hiptesis, se concluye que sta es verdadera; sin
embargo si esta informacin es inconsistente con la hiptesis, se
concluye que esta es falsa. Debe hacerse hincapi en que la verdad o
falsedad de una hiptesis en particular nunca puede conocerse con
certidumbre, a menos que pueda examinarse a toda la poblacin.
Usualmente esto es imposible en muchas situaciones prcticas. Por
tanto, es necesario desarrollar un procedimiento de prueba de hiptesis
teniendo en cuenta la probabilidad de llegar a una conclusin
equivocada.
La hiptesis nula, representada por Ho, es la afirmacin sobre una o
ms caractersticas de poblaciones que al inicio se supone cierta (es
decir, la "creencia a priori").

La hiptesis alternativa, representada por H1, es la


contradictoria a Ho, y sta es la hiptesis del investigador.

afirmacin

La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la


evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice
decididamente a Ho, se contina creyendo en la validez de la hiptesis
nula. Entonces, las dos conclusiones posibles de un anlisis por prueba
de hiptesis son rechazar Ho o no rechazar Ho.
Prueba de una Hiptesis Estadstica
Para ilustrar los conceptos generales, considere el problema de la
rapidez de combustin del agente propulsor presentado con anterioridad.
La hiptesis nula es que la rapidez promedio de combustin es 50 cm/s,
mientras que la hiptesis alternativa es que sta no es igual a 50 cm/s.
Esto es, se desea probar:
Ho;
H1;

= 50 cm/s
50 cm/s

Supngase que se realiza una prueba sobre una muestra de 10


especmenes, y que se observa cual es la rapidez de combustin
promedio muestral. La media muestral es un estimador de la media
verdadera de la poblacin. Un valor de la media muestral que este
prximo al valor hipottico
= 50 cm/s es una evidencia de que el
verdadero valor de la media
es realmente 50 cm/s; esto es, tal
evidencia apoya la hiptesis nula H o. Por otra parte, una media muestral
muy diferente de 50 cm/s constituye una evidencia que apoya la hiptesis
alternativa H1. Por tanto, en este caso, la media muestral es el estadstico
de prueba.
La media muestral puede tomar muchos valores diferentes. Supngase
que si 48.5
51.5, entonces no se rechaza la hiptesis nula Ho;
=
50 cm/s, y que si <48.5 >51.5, entonces se acepta la hiptesis
alternativa H1;

50 cm/s.

Los valores de que son menores que 48.5 o mayores que 51.5
constituyen la regin crtica de la prueba, mientras que todos los valores
que estn en el intervalo 48.5
51.5 forman la regin de aceptacin.
Las fronteras entre las regiones crtica y de aceptacin reciben el nombre
de valores crticos. La costumbre es establecer conclusiones con
respecto a la hiptesis nula Ho. Por tanto, se rechaza Ho en favor de H1 si
el estadstico de prueba cae en la regin crtica, de lo contrario, no se
rechaza Ho.
Este procedimiento de decisin puede conducir a una de dos
conclusiones errneas. Por ejemplo, es posible que el valor verdadero de
la rapidez promedio de combustin del agente propulsor sea igual a 50
cm/s. Sin embargo, para todos los especmenes bajo prueba, bien puede
observarse un valor del estadstico de prueba que cae en la regin
crtica. En este caso, la hiptesis nula H o ser rechazada en favor de la
alternativa H1cuando, de hecho, Ho en realidad es verdadera. Este tipo de
conclusin equivocada se conoce como error tipo I.
El error tipo I se define como el rechazo de la hiptesis nula Ho cuando
sta es verdadera. Tambin es conocido como
nivel de
significancia.
Si tuviramos un nivel de confianza del 95% entonces el nivel de
significancia sera del 5%. Anlogamente si se tiene un nivel de confianza
del 90% entonces el nivel de significancia sera del 10%.
Ahora supngase que la verdadera rapidez promedio de combustin es
diferente de 50 cm/s, aunque la media muestral caiga dentro de la
regin de aceptacin. En este caso se acepta H o cuando sta es falsa.
Este tipo de conclusin recibe el nombre de error tipo II.
El error tipo II error
se define como la aceptacin de la hiptesis
nula cuando sta es falsa.
Por tanto, al probar cualquier hiptesis estadstica, existen cuatro
situaciones diferentes que determinan si la decisin final es correcta o
errnea.

Decisin

Ho es verdadera

Ho es falsa

Aceptar Ho

No hay error

Error tipo II

Rechazar Ho

Error tipo I

No hay error

1. Los errores tipo I y tipo II estn relacionados. Una disminucin en


la probabilidad de uno por lo general tiene como resultado un
aumento en la probabilidad del otro.
2. El tamao de la regin crtica, y por tanto la probabilidad de
cometer un error tipo I, siempre se puede reducir al ajustar el o los
valores crticos.
3. Un aumento en el tamao muestral n reducir
simultnea.

de forma

4. Si la hiptesis nula es falsa,


es un mximo cuando el valor real
del parmetro se aproxima al hipottico. Entre ms grande sea la
distancia entre el valor real y el valor hipottico, ser menor
2.2 HIPOTESIS NULA
La hiptesis nula (H0) constituye una parte esencial de cualquier
diseo de investigacin y siempre es puesta a prueba, aunque sea
indirectamente.
La definicin simplista de la hiptesis nula es casi contraria a la de
la hiptesis alternativa (H1), aunque el principio es un poco ms complejo.
La hiptesis nula (H0) es una hiptesis que el investigador trata de refutar,
rechazar o anular.
Generalmente, "nula" se refiere a la opinin general de algo, mientras
que la hiptesis alternativa es lo que el investigador realmente piensa
que es la causa de un fenmeno.
La conclusin de un experimento siempre se refiere a la nula, es decir,
rechaza o acepta la H0 en lugar de la H1.
A pesar de esto, muchos investigadores descuidan la hiptesis nula
cuando estn probando hiptesis, lo que constituye una prctica mala y
puede tener efectos adversos.

Ejemplos de la hiptesis nula


Un investigador puede postular una hiptesis:
H1: las plantas de tomate exhiben una mayor tasa de crecimiento
cuando se plantan en compost en lugar del suelo.
Y una hiptesis nula:
H0: las plantas de tomate no presentan una mayor tasa de
crecimiento cuando se plantan en el compost en lugar del suelo.
Es importante seleccionar cuidadosamente el texto de la nula y
asegurarse de que sea lo ms especfico posible. Por ejemplo, el
investigador puede postular una hiptesis nula:
H0: las plantas de tomate no muestran ninguna diferencia en sus
tasas de crecimiento cuando se plantan en compost en lugar del
suelo.
Hay un gran defecto con esta H 0. Si las plantas realmente crecen ms
lentamente en el compost que en el suelo, se llega a un callejn sin
salida. H1 no est respaldada y tampoco la H 0, ya que existe una
diferencia en las tasas de crecimiento.
Si se rechaza la hiptesis nula y no hay otra opcin, el experimento
puede ser invlido. Por esta razn, la ciencia utiliza una serie de
procesos deductivos einductivos para asegurar que no existan errores en
las hiptesis.

Muchos cientficos descuidan la hiptesis nula, suponiendo que es


simplemente lo contrario a la alternativa, pero lo correcto es tomarse un

tiempo para crear una hiptesis slida. No es posible cambiar una


hiptesis retrospectivamente, ni siquiera la H0.
Pruebas de significacin
Si las pruebas de significacin generan 95% o 99% de probabilidad de
que los resultados no se ajusten a la hiptesis nula, entonces sta es
rechazada en favor de la alternativa.
De lo contrario, se acepta la hiptesis nula. stos son los nicos
supuestos correctos y es incorrecto rechazar o aceptar la H1.
La aceptacin de la hiptesis nula no significa que sea cierta. Sigue
siendo una hiptesis y debe cumplir el principio de falsabilidad, de la
misma manera que el rechazo de la hiptesis nula no prueba la
alternativa.
Problemas percibidos con la nula
El principal problema con la H0 es que muchos investigadores y revisores
sienten que aceptar la hiptesis nula constituye el fracaso
del experimento. Esto es ciencia muy mala, as como que aceptar o
rechazar cualquier hiptesis es un resultado positivo.
Aunque la hiptesis nula no sea refutada, el mundo de la ciencia ha
aprendido algo nuevo. En sentido estricto, el trmino "fracaso" slo debe
aplicarse a errores en el diseo experimental o suposiciones iniciales
incorrectas.

Desarrollo de la nula
El modelo de la Tierra Plana era comn en los tiempos antiguos, tales
como en las civilizaciones de la Edad del Bronce y la Edad de Hierro.
Esto podra ser considerado la hiptesis nula (H0) del momento.
H0: el mundo es plano
Muchos de los antiguos filsofos griegos suponan que el sol, la luna y
otros objetos en el universo daban vueltas alrededor de la Tierra. La
astronoma helenstica estableci la forma esfrica de la tierra alrededor
del ao 300 a.C.
H0: el modelo geocntrico: la Tierra es el centro del universo y es
esfrica
Coprnico tena una hiptesis alternativa (H1) que indicaba que el mundo
en realidad daba vueltas alrededor del Sol, centro del universo. Con el
tiempo, las personas se convencieron y la aceptaron como la nula o H0.
H0: el modelo heliocntrico: el Sol es el centro del universo
Posteriormente, alguien propuso una hiptesis alternativa de que el
mismo sol tambin daba vueltas alrededor de algo dentro de la galaxia,

creando as una nueva H0. As funciona la investigacin: la H 0 se acerca


cada vez ms a la realidad. Aunque no sea correcta, es mejor que la
ltima H0.
2.3 ERROR TIPO 1 Y ERROR TIPO 2
Errores experimentales en la investigacin
Si bien muchos no habrn odo hablar de error de tipo I o error de tipo II, la mayora de las
personas estar familiarizada con los trminos "falso positivo" y "falso negativo",
principalmente como trminos mdicos.
Un paciente se puede realizar una prueba de VIH que promete una precisin del 99,9%. Esto
significa que 1 de cada 1.000 pruebas podra arrojar un "falso positivo", comunicando a un paciente
que tiene el virus cuando en realidad no es as.
Por el contrario, la prueba tambin podra mostrar una lectura de falso negativo, dndole a un
paciente VIH positivo el visto bueno. Por esta causa, la mayora de las pruebas mdicas exigen
muestras duplicadas para tener las probabilidades a su favor. Una probabilidad de uno en mil se
convierte en una probabilidad de 1 en 1 000 000 si se prueban dos muestras independientes.
En cualquier proceso cientfico no existe el ideal de prueba total o rechazo total. Por eso, los
investigadores deben necesariamente trabajar sobre las probabilidades. Esto significa que,
independientemente del nivel de prueba alcanzado, todava existe la posibilidad de que los
resultados sean incorrectos.
Esto podra adoptar la forma de una aceptacin o rechazo falso de la hiptesis nula.

Cmo se traduce esto a la ciencia


Error de tipo I
Por lo general, un error de tipo I se denomina "falso positivo" y es el proceso de rechazar
incorrectamente la hiptesis nula en favor de la alternativa. En el caso anterior, la hiptesis nula se
refiere al estado natural de las cosas que indica que el paciente no es VIH positivo.
La hiptesis alternativa indica que el paciente porta el virus. Un error de tipo I indicara que el
paciente tiene el virus cuando no lo tiene, un falso rechazo de la hiptesis nula.
Error de tipo II
Un error de tipo II es lo contrario al error de tipo I y es la falsa aceptacin de la hiptesis nula. Un
error de tipo II, tambin conocido como falso negativo, implicara que el paciente no tiene VIH
cuando no es as, un diagnstico peligroso.
En la mayora de los campos de la ciencia, los errores de tipo II no son considerados tan
problemticos como los errores de tipo I. En el caso del error de tipo II, se pierde la posibilidad de
rechazar la hiptesis nula y no se desprende ninguna conclusin de la hiptesis nula no rechazada.
El error de tipo I es ms grave, ya que se habr rechazado errneamente la hiptesis nula.
No obstante, la medicina es una excepcin. Comunicarle a un paciente que no tiene una
enfermedad cuando s la tiene es potencialmente peligroso.
Replicacin
Por esta razn se deben replicar los experimentos cientficos y otros cientficos deben tener la
oportunidad de seguir la metodologa exacta.
Aunque se alcance el nivel ms alto de prueba, es decir, P <0,01 (probabilidad inferior al 1%), cada
100 experimentos habr un resultado falso. Hasta cierto punto, duplicar o triplicar las muestras
reduce la posibilidad de error, pero todava se puede enmascarar una oportunidad si el error que
causa una variable est presente en todas las muestras.
Sin embargo, si otros investigadores que usan el mismo equipo replican el experimento y
descubren que los resultados son los mismos, las posibilidades de 5 o 10 experimentos que den

resultados falsos son increblemente pequeas. As la ciencia regula y reduce al mnimo la


posibilidad de errores de tipo I y tipo II.
Por supuesto, en experimentos no replicables y en el diagnstico mdico la replicacin no siempre
es posible. Por esta causa, la posibilidad de errores de tipo I y II es siempre un factor.
Un rea que es culpable de ignorar los errores de tipo I y II es el tribunal de justicia, donde no se le
comunica al jurado que las pruebas de huellas dactilares y ADN pueden dar resultados falsos. Se
han documentado muchos errores de justicia con estas pruebas. Muchos tribunales ya no aceptan
estas pruebas solas como prueba de culpabilidad y exigen ms evidencia.
Errores de tipo III
Muchos estadsticos estn adoptando un tercer tipo de error, de tipo III, que ocurre cuando la
hiptesis nula fue rechazada por la razn equivocada.
En un experimento, un investigador podra postular una hiptesis y llevar a cabo una investigacin.
Despus de analizar estadsticamente los resultados, la hiptesis nula es rechazada.
El problema es que puede existir cierta relacin entre las variables, pero podra ser por una razn
diferente de la indicada en la hiptesis. Un proceso desconocido puede ser la base de la relacin.
2.4 PRUEBAS DE HIPTESIS Z PARA LA MEDIA (DESVIACIN ESTANDAR POBLACIONAL
CONOCIDA)
PRUEBAS DE HIPTESIS PARA LA MEDIA
Debido a la dificultad de explicar este tema se enfocar un problema basado en un estudio en una
fbrica de llantas. En este problema la fbrica de llantas tiene dos turnos de operarios, turno de da
y turno mixto. Se selecciona una muestra aleatoria de 100 llantas producidas por cada turno para
ayudar al gerente a sacar conclusiones de cada una de las siguientes preguntas
-

Es la duracin promedio de las llantas producidas en el turno de da igual a 25 000 millas?


Es la duracin promedio de las llantas producidas en el turno mixto menor de 25 000 millas?
Se revienta ms de un 8% de las llantas producidas por el turno de da antes de las 10 000
millas?

Prueba de Hiptesis para la media. En la fbrica de llantas la hiptesis nula y alternativa para el
problema se plantearon como,
Ho: = 25 000
H1: 25 000
Si se considera la desviacin estndar las llantas producidas en el turno de da, entonces, con
base en el teorema de limite central, la distribucin en el muestreo de la media seguira la
distribucin normal, y la prueba estadstica que esta basada en la diferencia entre la media

X de la

muestra y la media hipottica se encontrara como

x o
/ n

Si el tamao de la regin de rechazo se estableciera en 5% entonces se podran determinar los


valores crticos de la distribucin. Dado que la regin de rechazo esta dividida en las dos colas de
la distribucin, el 5% se divide en dos partes iguales de 2.5%.
Dado que ya se tiene la distribucin normal, los valores crticos se pueden expresar en unidades
de desviacin. Una regin de rechazo de 0.25 en cada cola de la distribucin normal, da por
resultado un rea de .475 entre la media hipottica y el valor crtico. Si se busca est rea en la
distribucin normal, se encuentra que los valores crticos que dividen las regiones de rechazo y no
rechazo son + 1.96 y - 1.96

Por tanto, la regla para decisin sera rechazar Ho si Z > +1.96 o s z < -1.96, de lo contrario, no
rechazar Ho. No obstante, en la mayor parte de los casos se desconoce la desviacin estndar

de la poblacin. La desviacin estndar se estima al calcular S, la desviacin estndar de la


muestra. Si se supone que la poblacin es normal la distribucin en el muestreo de la media
seguira una distribucin t con n-1 grados de libertad.
En la prctica, se a encontrado que siempre y cuando el tamao de la muestra no sea muy
pequeo y la poblacin no este muy sesgada, la distribucin t da una buena aproximacin a la
distribucin de muestra de la media. La prueba estadstica para determinar la diferencia entre la
media

x de la muestra y la media

de la poblacin cuando se utiliza la desviacin estndar S de

la muestra, se expresa

t n 1

X
s/ n

Para una muestra de 100, si se selecciona un nivel de significancia de 0.05, los valores crticos de
la distribucin t con 100-1= 99 grados de libertad se puede obtener como se indica en la siguiente
tabla tenemos el valor de 1.9842. Como esta prueba de dos colas, la regin de rechazo de 0.05 se
vuelve a dividir en dos partes iguales de 0.025 cada una. Con el uso de las tablas para t, los
valores crticos son 1.984 y +1.984. La regla para la decisin es,
Rechazar Ho si
Los

t 99 1.9842

resultados

de

la

X da 25.430, Sda 4.000

o t 99 1.9842
muestra

para

n da 100

el

de lo contrario, no rechazar Ho
turno

de

da

(en

millas)

fueron

millas. Puesto que se esta probando si la media

es diferente a 25 000 millas, se tiene con la ecuacin

t n 1

X
S/ n

t 1001

25.430 25.00
4.000 / 100

1.075

Dado que t100-1=1.075, se ve que -1.984 < +1.075 < + 1.984, entonces no se rechaza Ho.
Por ello, la decisin de no rechazar la hiptesis nula Ho. En conclusin es que la duracin
promedio de las llantas es 25 000 millas. A fin de tener en cuenta la posibilidad de un error de tipo

II, este enunciado se puede redactar como no hay pruebas de que la duracin promedio de las
llantas sea diferente a 25 000 millas en las llantas producidas en el turno de da.

2.5 PRUEBAS PARA PROPORCIONES


El concepto de prueba de hiptesis se puede utilizar para probar hiptesis en relacin con datos
cualitativos. Por ejemplo, en el problema anterior el gerente de la fbrica de llantas quera
determinar la proporcin de llantas que se reventaban antes de 10.000 millas. Este es un ejemplo
de una variable cualitativa, dado que se desea llegar a conclusiones en cuanto a la proporcin de
los valores que tienen una caracterstica particular.
El gerente de la fbrica de llantas quiere que la calidad de llantas producidas, sea lo bastante alta
para que muy pocas se revienten antes de las 10.000 millas. Si ms de un 8% de las llantas se
revientan antes de las 10.000 millas, se llegara a concluir que el proceso no funciona
correctamente. La hiptesis nula y alternativa se pueden expresar como sigue:

H 0 P 0.08

(Funciona correctamente)

H 1 P 0.08

(No funciona correctamente)

La prueba estadstica se puede expresar en trminos de la proporcin de xitos como sigue:

Ps P
Pq
n

Ps

X
n

siendo X y N el nmero de xitos de la muestra y n el tamao de la muestra, P la proporcin de


xitos de la hiptesis nula. Ahora se determinar si el proceso funciona correctamente para las
llantas producidas para el turno de da. Los resultados del turno de da indican que cinco llantas en
una muestra de 100 se reventaron antes de 10,000 millas para este problema, si se selecciona un
nivel de significancia

0.05 , las regiones de rechazo y no rechazo se estableceran como a

continuacin se muestra. Y la regla de decisin sera: Rechazar Ho si z> + 1.645; de lo contrario no


rechazar Ho. Con los datos que se tienen,

Ps 0.05 Z

Ps P
Pq
n

1.107

una vez reemplazado, recuerde p+q=1


Z=-1.107 +1.645; por tanto no rechazar Ho.
La hiptesis nula no se rechazara por que la prueba estadstica no ha cado en la regin de
rechazo. Se llegara a la conclusin de que no hay pruebas de que ms del 8% de las llantas
producidas en el turno de da se revienten antes de 10,000 millas. El gerente no ha encontrado
ninguna prueba de que ocurra un nmero excesivo de reventones en las llantas producidas en el
turno de da.

Una hiptesis estadstica es una suposicin hecha con respecto a la funcin de distribucin de una
variable aleatoria. Para establecer la verdad o falsedad de una hiptesis estadstica con certeza
total, ser necesario examinar toda la poblacin. En la mayora de las situaciones reales no es
posible o practico efectuar este examen, y el camino mas aconsejable es tomar una muestra
aleatoria de la poblacin y en base a ella, decidir si la hiptesis es verdadera o falsa.
En la prueba de una hiptesis estadstica, es costumbre declarar la hiptesis como verdadera si la
probabilidad calculada excede el valor tabular llamado el nivel de significacin y se declara falsa si
la probabilidad calculada es menor que el valor tabular. La prueba a realizar depender del tamao
de las muestras, de la homogeneidad de las varianzas y de la dependencia o no de las variables.
Si las muestras a probar involucran a ms de 30 observaciones, se aplicar la prueba de Z, si las
muestras a evaluar involucran un nmero de observaciones menor o igual que 30 se emplea la
prueba de t de student. La frmula de clculo depende de si las varianzas son homogneas o
heterogneas, si el nmero de observaciones es igual o diferente, o si son variables dependientes.
Para determinar la homogeneidad de las varianzas se toma la varianza mayor y se divide por la
menor, este resultado es un estimado de la F de Fisher. Luego se busca en la tabla de F usando
como numerador los grados de libertad (n-1) de la varianza mayor y como denominador (n-1) de la
varianza menor para encontrar la F de Fisher tabular. Si la F estimada es menor que la F tabular se
declara que las varianzas son homogneas. Si por el contrario, se declaran las varianzas
heterogneas. Cuando son variables dependientes (el valor de una depende del valor de la otra),
se emplea la tcnica de pruebas pareadas.
Como en general estas pruebas se aplican a dos muestras, se denominarn a y b para referirse a
ellas, as entenderemos por:
- na al nmero de elementos de la muestra a
- nb al nmero de elementos de la muestra b
- xb al promedio de la muestra b
- s2a la varianza de la muestra a
- Y as sucesivamente
Entonces se pueden distinguir 6 casos a saber:
- Caso de muestras grandes (n>30)
- Caso de na = nb y s2a = s2b
- Caso de na = nb y s2a s2b
- Caso de na nb y s2a = s2b
- Caso de na nb y s2a s2b
- Caso de variables dependientes

1.-Cuando las muestras a probar involucran


2.-Caso de nmero igual de observaciones y a ms
de 30 observaciones
varianzas homogneas

zc

aX b X
as 2 bs 2

na
nb

tc

aX b X
2

as 2 bs 2
(2 / n )

3.-Caso de igual nmero de observaciones


y varianzas heterogneas.

tc

aX b X

4.-Caso de diferente nmero de observaciones y varianzas homogneas

tc

as 2 bs 2
n

aX bX
cs 2 cs 2

an bn

5.- Caso de diferente nmero de observaciones y varianzas heterogneas. En este caso, la tc es


comparada con la tg (t generada), que a diferencia de los casos anteriores, hay que calcularla.

ta
tg

s a2
s2
tb b
na
nb
2
2
sa sb

na nn

tc

Xa Xb
s a2 s 2b

na nn

Donde: ta y tb son los valores de la tabla con n-1 grados de libertad para a y b respectivamente
6.- Caso de muestras pareadas (de variables dependientes). En este caso, se asume que las
muestras han sido distribuidas por pares.
tc

n
(D D ) 2

n 1

2.6 SELECCIN DEL TAMAO DE LA MUESTRA (PARA ESTIMAR LA MEDIA POBLACIONAL)


Veamos los pasos necesarios para determinar el tamao de una muestra empleando el muestreo
aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de
confianza al que queremos trabajar; en segundo lugar, cual es el error mximo que estamos
dispuestos a admitir en nuestra estimacin. As pues los pasos a seguir son:
Obtener el tamao muestral imaginando que

n , siendo Z / 2 el Z con el valor del nivel de

confianza elegido, varianza poblacional y e el error mximo


2

Z 2 / 2 2
e2

n
1 n / n

o aplicar

Para obtener el tamao de la muestra si hay grandes diferencias en el tamao muestral o hay
escasez de informacin

Ejemplo, Una poblacin a encuestar tiene 10000 personas y una varianza de 9.648. Trabajando
con un nivel de confianza de 0.95 y estando dispuestos a admitir un error mximo del 10%, cul
debe ser el tamao muestral para trabajar?
En las tablas de la curva Normal el valor de
elegido,

Z / 2

que corresponde con el nivel de confianza

Z / 2 1.96

n 1.96 2 9.648 / 0.12 3.706


Comprobamos que no se cumple, pues en este caso 10.000 < 3.706 (3.706 - 1); 10.000 <
13.730.730, por tanto, usamos

n 3.706 /(1 (3.706 / 10.000)) 2.704

2.7 SELECCIN DEL TAMAO DE LA MUESTRA( PARA ESTIMAR LA PROPORCIN


POBLACIONAL)
El concepto de prueba de hiptesis se puede utilizar para probar hiptesis en relacin con datos
cualitativos. Por ejemplo, en el problema anterior el gerente de la fbrica de llantas quera
determinar la proporcin de llantas que se reventaban antes de 10.000 millas. Este es un ejemplo
de una variable cualitativa, dado que se desea llegar a conclusiones en cuanto a la proporcin de
los valores que tienen una caracterstica particular.
El gerente de la fbrica de llantas quiere que la calidad de llantas producidas, sea lo bastante alta
para que muy pocas se revienten antes de las 10.000 millas. Si ms de un 8% de las llantas se
revientan antes de las 10.000 millas, se llegara a concluir que el proceso no funciona
correctamente. La hiptesis nula y alternativa se pueden expresar como sigue:

H 0 P 0.08

(Funciona correctamente)

H1 P 0.08

(No funciona correctamente)

La prueba estadstica se puede expresar en trminos de la proporcin de xitos como sigue:

Ps P
Pq
n

Ps

X
n

siendo X y N el nmero de xitos de la muestra y n el tamao de la muestra, P la proporcin de


xitos de la hiptesis nula. Ahora se determinar si el proceso funciona correctamente para las
llantas producidas para el turno de da. Los resultados del turno de da indican que cinco llantas en
una muestra de 100 se reventaron antes de 10,000 millas para este problema, si se selecciona un
nivel de significancia

0.05 , las regiones de rechazo y no rechazo se estableceran como a

continuacin se muestra. Y la regla de decisin sera: Rechazar Ho si z> + 1.645; de lo contrario no


rechazar Ho. Con los datos que se tienen,

Ps 0.05 Z

Ps P
Pq
n

1.107

una vez reemplazado, recuerde p+q=1


Z=-1.107 +1.645; por tanto no rechazar Ho.
La hiptesis nula no se rechazara por que la prueba estadstica no ha cado en la regin de
rechazo. Se llegara a la conclusin de que no hay pruebas de que ms del 8% de las llantas
producidas en el turno de da se revienten antes de 10,000 millas. El gerente no ha encontrado
ninguna prueba de que ocurra un nmero excesivo de reventones en las llantas producidas en el
turno de da.
Una hiptesis estadstica es una suposicin hecha con respecto a la funcin de distribucin de una
variable aleatoria. Para establecer la verdad o falsedad de una hiptesis estadstica con certeza
total, ser necesario examinar toda la poblacin. En la mayora de las situaciones reales no es
posible o practico efectuar este examen, y el camino mas aconsejable es tomar una muestra
aleatoria de la poblacin y en base a ella, decidir si la hiptesis es verdadera o falsa.
En la prueba de una hiptesis estadstica, es costumbre declarar la hiptesis como verdadera si la
probabilidad calculada excede el valor tabular llamado el nivel de significacin y se declara falsa si
la probabilidad calculada es menor que el valor tabular. La prueba a realizar depender del tamao
de las muestras, de la homogeneidad de las varianzas y de la dependencia o no de las variables.
Si las muestras a probar involucran a ms de 30 observaciones, se aplicar la prueba de Z, si las
muestras a evaluar involucran un nmero de observaciones menor o igual que 30 se emplea la
prueba de t de student. La frmula de clculo depende de si las varianzas son homogneas o
heterogneas, si el nmero de observaciones es igual o diferente, o si son variables dependientes.
Para determinar la homogeneidad de las varianzas se toma la varianza mayor y se divide por la
menor, este resultado es un estimado de la F de Fisher. Luego se busca en la tabla de F usando
como numerador los grados de libertad (n-1) de la varianza mayor y como denominador (n-1) de la
varianza menor para encontrar la F de Fisher tabular. Si la F estimada es menor que la F tabular se
declara que las varianzas son homogneas. Si por el contrario, se declaran las varianzas
heterogneas. Cuando son variables dependientes (el valor de una depende del valor de la otra),
se emplea la tcnica de pruebas pareadas.
Como en general estas pruebas se aplican a dos muestras, se denominarn a y b para referirse a
ellas, as entenderemos por:
- na al nmero de elementos de la muestra a
- nb al nmero de elementos de la muestra b
- xb al promedio de la muestra b
- s2a la varianza de la muestra a
- Y as sucesivamente
Entonces se pueden distinguir 6 casos a saber:
- Caso de muestras grandes (n>30)
- Caso de na = nb y s2a = s2b
- Caso de na = nb y s2a s2b
- Caso de na nb y s2a = s2b
- Caso de na nb y s2a s2b
- Caso de variables dependientes

1.-Cuando las muestras a probar involucran


2.-Caso de nmero igual de observaciones y a ms
de 30 observaciones
varianzas homogneas

zc

aX b X

tc

as 2 bs 2

na
nb

3.-Caso de igual nmero de observaciones


y varianzas heterogneas.

tc

aX b X

aX b X

4.-Caso de diferente nmero de observaciones y varianzas homogneas

tc

as 2 bs 2
n

as 2 bs 2
(2 / n )

aX bX
cs 2 cs 2

an bn

5.- Caso de diferente nmero de observaciones y varianzas heterogneas. En este caso, la tc es


comparada con la tg (t generada), que a diferencia de los casos anteriores, hay que calcularla.

s a2
s 2b
ta
tb
na
nb
tg
2
2
sa sb

na nn

tc

Xa Xb
s a2 s 2b

na nn

Donde: ta y tb son los valores de la tabla con n-1 grados de libertad para a y b respectivamente
6.- Caso de muestras pareadas (de variables dependientes). En este caso, se asume que las
muestras han sido distribuidas por pares.
tc

(D D )
n 1

UNIDAD 3 PRUEBAS DE HIPTESIS CON 2 MUESTRAS Y VARIAS MUESTRAS DE DATOS


NUMERICOS
3.1 DISTRIBUCIONES NORMALES Y T DE STUDENT
La distribucin normal fue estudiada por Gauss. Se trata de una variable aleatoria continua (la
variable puede tomar cualquier valor real). La funcin de densidad tiene forma de campana.
Dos parmetros determinan una distribucin normal: la media y la desviacin tpica. Cuanto mayor
sea la desviacin tpica mayor es la dispersin de la variable.
La distribucin normal es simtrica respecto de la media.

La media est representada por un tringulo y se puede interpretar como un punto de equilibrio. Al
arrastrarlo se modifica tambin la media. El mismo efecto tiene el mover el punto correspondiente
en la cspide de la curva.
Arrastrando el otro punto sobre la curva (que es uno de los dos puntos de inflexin de la curva) se
modifica la desviacin tpica.
Podemos ver la funcin de distribucin acumulada y cmo cambia al modificar la media (simple
traslacin) y la desviacin tpica (reflejando la mayor o menor dispersin de la variable).
Los puntos grises controlan la escala vertical y horizontal de la grfica y pulsando el boton derecho
y arrastrando podemos moverla a derecha e izquierda.
Las distribuciones t de Student fueron descubiertas por William S. Gosset (1876-1937) en 1908
cuando trabajaba para la compaa de cervezas Guinness en Dubln (Irlanda). No pudo publicar
sus descubrimientos usando su propio nombre porque Guinness haba prohibido a sus empleados
que publicaran informacin confidencial. Gosset firm sus publicaciones usando el nombre de
"Student". Gosset tena buena relacin con Karl Pearson que haba sido su maestro. Necesitaba
una distribucin que pudiera usar cuando el tamao de la muestra fuera pequeo y la varianza
desconocida y tena que ser estimada a partir de los datos. Las distribuciones t se usan para tener
en cuenta la incertidumbre aadida que resulta por esta estimacin. Fisher comprendi la
importancia de los trabajos de Gosset para muestras pequeas.
Si el tamao de la muestra es n entonces decimos que la distribucin t tiene n-1 grados de libertad.
Hay una distribucin t diferente para cada tamao de la muestra. Estas distribuciones son una
familia de distribuciones de probabilidad continuas. Las curvas de densidad son simtricas y con
forma de campana como la distribucin normal estndar. Sus medias son 0 y sus varianzas son
mayores que 1 (tienen colas ms pesadas). Las colas de las distribuciones t disminuyen ms
lentamente que las colas de la distribucin normal. Si los grados de libertad son mayores ms
prxima a 1 es la varianza y la funcin de densidad es ms parecida a la densidad normal.

Cuando n es mayor que 30, la diferencia entre la normal y la distribucin t de Student no suele ser
muy importante. En la imagen podemos ver varios ejemplos de funciones de distribucin
acumulada.

En Probabilidades en Distribuciones t-Student puedes ver una comparacin ms precisa entre


las distribuciones t-Student y la normal estndar.
En el applet podemos ver varios ejemplos de distribucin t de Student junto con la normal estndar.
Se aprecia cmo cuando el parmetro es 25 la distribucin es muy parecida a la normal estndar.
Los puntos grises controlan la escala vertical y horizontal de la grfica y pulsando el boton derecho
y arrastrando podemos moverla a derecha e izquierda.
3.2 PRUEBAS DE SIGNIFICANCIA
Pruebas

de

II.A)

significacin

Pruebas

1.

Prueba

paramtricas

de

Student

Con esta prueba se pretende averiguar si dos muestras que tienen medias iguales, provienen de la
misma poblacin.
Hiptesis
nula
"H0"

1 =
2;
Hiptesis alternativa "H1" 1 2
La prueba permite comparar la media con su valor verdadero o bien las medias de dos
poblaciones. Se basa en los lmites de confianza "LC" para el promedio x de n mediciones
repetidas
(Ec.
2.1).
A
partir
de
dicha
ecuacin
tenemos:
=

t(s/n)

(Ec.

2.1)

s/n

(Ec.

2.2)

s/n: error estndar "EE" o desviacin estndar "DE" de la distribucin muestral de medias. Como
las medias son n veces ms probables que los resultados aislados, la DE de las medias es n
veces menor que la DE de resultados aislados, siendo n el nmero de determinaciones con las que
se
calcula
la
media.

t: "t de student" (tabla 2). Es un parmetro tabulado que depende de los grados de libertad de la
muestra (n-1) "gl" y del intervalo de confianza que se quiera (generalmente 95%).

Si x - obtenida en la muestra a comparar es menor que la calculada para un cierto nivel de


probabilidad, no se rechaza la hiptesis nula de que x y sean iguales; es decir, sus diferencias
son debidas a errores aleatorios y no existe un error sistemtico significativo.
Para comparar 2 medias experimentales el proceso es semejante. Se ha de tener en cuenta si los
datos de las 2 muestras estn apareados o no (figura 1):

* Datos apareados: tienen la ventaja de permitir trabajar simplificando a una sola muestra (cuyos
valores corresponden a la diferencia "Di" entre cada par de datos apareados). Sustituimos x - (Ec.
2.2) por Di - 0 porque el valor real de las diferencias, suponiendo que las dos muestras tienen la
misma media, es 0. La DE se calcula con la muestra de diferencias.
* Datos no apareados: como no se puede simplificar a una sola muestra, se ha de introducir el
concepto de desviacin estndar ponderada "sp" (Ec. 2.3). En la ecuacin 2.2 se sustituye s por
sp y x - por x1 - x2 y el tamao de muestra "n" se sustituye por N ponderado "(N1 + N2)/ N1N2".
Sp=[S(x1 - x1)2+S(x2 - x2)2+ ...]/(n1+ n2+ ... - Ns) (Ec. 2.3)
n1,
n2,
...:
el
tamao
de
las
muestras.
Ns:
nmero
de
muestras.
(n1+n2+...-Ns):
nmero
de
grados
de
libertad.
Ejemplo 1: se analizaron dos sueros control (A y B) para la determinacin de la glucemia. Se

realiz sobre cada uno de ellos 5 determinaciones (tabla 3a) y se quiere determinar si estos dos
sueros control son diferentes en relacin al nivel de glucosa.

Aunque el nmero de determinaciones es reducido podemos suponer que si realizramos ms


determinaciones la distribucin sera normal (teorema central del lmite). Realizamos la prueba t de
student de datos no apareados, ya que aunque las dos muestras tienen el mismo tamao
provienen del anlisis de dos sueros supuestamente diferentes (tabla 3b):

Como la diferencia de las medias es menor que 13.8, puede decirse que las dos muestras son
significativamente
iguales
(p<
0.05).
2.

Pruebas

de

una

dos

colas

En las "pruebas bilaterales o de dos colas" se comparan dos muestras para saber si difieren
entre s, sin preguntarse cul de ellas tiene mayor estadstico (Ej. media). Si se pretende evaluar
qu muestra tiene el estadstico mayor (sesgo positivo) se realiza una "prueba unilateral o de una
cola". Para un tamao "n" determinado y un nivel de probabilidad concreto, los valores crticos de
ambas pruebas difieren. Suponiendo una poblacin simtrica, la probabilidad de la prueba
unilateral es la mitad de la probabilidad de la prueba bilateral. Por ello, para encontrar el valor
adecuado para una significacin del 95% (p=0.05) en una prueba de una cola, se busca en la
columna de p=0.1 de la tabla de pruebas bilaterales.

La decisin de utilizar una prueba de una o dos colas, depende del grado de conocimiento del
sesgo positivo o negativo que se tenga a priori. Nunca debe decidirse despus de realizar el
experimento,
pues
la
decisin
est
influenciada
por
los
resultados.
Ejemplo 2: antes de analizar la vitamina A por cromatografa se realiza una extraccin lquidolquido. Si se quiere evaluar la recuperacin de la vitamina A en el proceso de extraccin, el sesgo
ser forzosamente negativo, pues nunca puede extraerse ms de lo que hay. En este caso se
aplicar
una
prueba
de
una
cola.
3.

Comparacin

de

variancias

por

contraste

de

Fisher

Para comparar las variancias de dos muestras (S 12 y S22) se plantea la hiptesis nula y la
alternativa.
Hiptesis
Hiptesis

nula
alternativa

"H0"
"H1"

S12 =
S12

S22
S22

Dos muestras tienen variancias diferentes cuando la razn de sus variancias "F", colocando en el
numerador la variancia mayor para que siempre sea mayor de uno, excede el valor crtico F
tabulado. El valor crtico de F se escoge de la tabla 5 segn los tamaos de muestra (n1, n2) y el
nivel de significacin deseado (generalmente 95%). Hay que tener en cuenta que aunque slo se
exponga la tabla de dos colas, se debe aplicar la tabla de valores F para pruebas de una o dos
colas
segn
el
caso.
F=S12/S22 (Ec. 2.4) F Ftabulado (g l=n1-1; n2-1 y 95% significacin) no se puede rechazar H 0 con
una probabilidad de error menor del 5% (p < 0.05).

4.

Anlisis

de

variancia

(Anova)

de

un

factor

Est basada en la prueba de Cochran para estudiar la homogeneidad de las variancias de


poblaciones origen de varias muestras. Si las muestras proceden de la misma poblacin tendrn
variancias semejantes, por lo que un anlisis de variancias permitir comparar sus medias. Es una
prueba bilateral de comparacin por contraste de Fisher de k medias, en la que se compara las
variancias de las k medias (s 2y), con la variancia que debiera obtenerse si las k muestras
procedieran de poblaciones con igual media [Sp 2/n siendo Sp la desviacin estndar ponderada
calculada entre las distintas muestras (Ec. 2.3)].
F= s2y/ s2/n = CMMedias/CMResiduales (Ec. 2.5)
El ANOVA de un factor se aplica para anlisis donde, adems del error aleatorio inevitable en las
mediciones, hay un factor controlado (Ej. temperatura) o aleatorio (Ej. toma de muestra al azar).
Hay que indicar que el ANOVA es una generalizacin de la "prueba t de student" (t y F son
equivalentes
al
comparar
slo
2
grupos).
Planteamos la hiptesis nula y alternativa:
Ho:M1=M2=M3=
...
=Mk;
H1 :
M1M2M3
...
Mk
(siendo Mk, la media k-sima).
Se define el tamao de la poblacin total como:
N= n1+n2+n3+ ...+nk.
Para una mejor comprensin pondremos un ejemplo para realizar el clculo sencillo "con papel y
lpiz":
Ejemplo 3: se dan los resultados de cuatro anlisis de purezas en % realizados sobre 5 muestras
(tabla 5). Los datos se manejan respecto a una pureza basal de 98.5% para manejar nmeros
pequeos y simplificar los clculos. Se pretende comparar si las medias son significativamente
iguales:

F= CMMedias/CMResiduales= 0.195/0.133= 1.47. Se compara con el F crtico tabulado para una


cola porque es de suponer que la variacin intermuestra, si las muestras proceden de distinta
poblacin, sea mayor que la variacin intramuestra. Si Fcalculado > Ftabulado p 0.05 se puede
rechazar H0 y admitir H1, osea que las muestras provienen de distinta poblacin.
5.

Regresin

correlacin

Ambas tcnicas permiten analizar la relacin entre dos variables cuantitativas. Es muy comn la
confusin entre regresin y correlacin a pesar de que son completamente distintas.

5A) Correlacin por ajuste de una recta con el criterio de mnimos cuadrados
A partir de la matriz de datos con n pares de valores (x i, yi) se pueden representar los pares de
valores por puntos en un diagrama de ejes cartesianos (figura 2). El eje de abscisas representa la
variable X y el eje de ordenadas la variable Y. Los pares de valores (x i, yi) se representan por los
puntos de interseccin de las rectas que perpendicularmente a los ejes X e Y, pasan por los puntos
xi e yi de dichos ejes. Para buscar la recta que mejor se ajusta al conjunto de puntos representados
y evaluar el grado de ajuste a dicha recta, se determinan los coeficientes A y B de la recta de ajuste
(Ec. 2.6) que hagan mnima la suma de los residuales "ei" al cuadrado (Ec. 2.7).

y = A + Bx (Ec. 2.6)

Los residuales "ei" representan la distancia, perpendicular a la recta, de los puntos a la recta.
ei2= 1n [yi-(A+Bxi)]2 (Ec. 2.7)
Como las derivadas de una funcin al alcanzar los valores mnimos deben ser cero, los valores A y
B se calculan (Ec. 2.8) haciendo cero las derivadas parciales del sumatorio de residuales (Ec. 2.7)
con respecto a A y B, ordenada en el origen y pendiente 1 de la recta de correlacin (figura 2):
A= y-B x , B = [xiyi - xiyi/n]/xi2-(xi)2/n (Ec. 2.8)
1
Recordar que la pendiente es el valor de la tangente del ngulo que forma la recta con el eje de
abscisas.
Nota: es importante saber que la recta de correlacin pasa por el punto (x, y) siendo x, y las
medias de los datos xi e yi. Aplicando la ecuacin punto-pendiente de una recta podemos obtener
la ecuacin de la recta de mnimos cuadrados:
y= y + B(x- x)
5.a.1.
Descomposicin
de
la
suma
de
cuadrados
Como se observa en la figura 2 para un sujeto "i" cualquiera, se verifica que:
(yi - y)TOTAL= (^yi - y)REGRESIN+(yi-^yi)RESIDUAL (Ec. 2.9)
yi:
valor
aislado
de
y
del
sujeto
i.
y:
media
del
conjunto
de
valores
y i.
Se
supone
el
valor
verdadero.
^yi: valor de y del sujeto i, calculado por la ecuacin de la recta de mnimos cuadrados.
Total:
variacin
total,
distancia
desde
yi al
valor
medio
de
y.
Regresin:
variacin
explicada
por
la
recta
de
regresin.
Residual: variacin no explicada.
Y para el conjunto de los sujetos se demuestra que la variacin total se descompone como:
(yi - y)2= (^yi - y)2+(yi-^yi)2 (Ec. 2.10)
5.
a.2
Valoracin
del
ajuste
de
la
recta
En el laboratorio es muy comn el ajuste de datos experimentales a una recta, por ejemplo para
construir la recta de calibracin de una determinada tcnica. El ajuste perfecto se da cuando la
variancia residual es nula y todos los puntos estn sobre la recta de regresin. El ajuste nulo se da
cuando
la
variacin
explicada
por
la
regresin
es
cero.
Se define el coeficiente de correlacin "r 2" como la relacin entre la variacin explicada y la
variacin total.
r2 = SCRegresin/SCTotal = B2 (SCx/SCy) (Ec. 2.11)
El coeficiente toma valor de 1 cuando el ajuste es perfecto y 0 cuando es nulo. Es importante
indicar que un ajuste nulo no quiere decir ausencia de relacin, ya que slo indica ausencia de
relacin lineal (puede existir una relacin de tipo parablico, exponencial...). Hay que indicar que es
preferible hablar de r2 que de r porque r vara desde 1 hasta +1, correspondiendo con una
pendiente de la recta negativa o positiva, sin embargo r 2 siempre toma valores positivos.
En algunas circunstancias se obtienen valores bajos de "r". Para valuar si el coeficiente es
significativo se debe considerar el nmero de pares de valores usados en su clculo. El mtodo
ms simple es calcular un valor de t usando la ecuacin 2.12.
t= [|r|(n-2)]/(1-r2) (Ec. 2.12)
El valor de t calculado se compara con el tabulado para el nivel de significacin deseado, usando
una prueba de t de dos colas con (n-2) gl. Si t calculado es mayor que el tabulado, H0 se rechaza
(hay
correlacin
significativa).
H0:
no
existe
correlacin
entre
x
e
y.
Hay que indicar que los clculos anteriores permiten obtener la "recta de regresin de y sobre x" es
decir, la recta que evala cmo vara y cuando x se ajusta a los valores elegidos. La "recta de
regresin de x sobre y", la que supone que todos los errores ocurren en x , no coincide con la
anterior salvo cuando r =1.
http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S0034-79732001000400008

3.3 COMPARACIN DE 2 MUESTRAS INDEPENDIENTES (PRUEBAS T PARA LAS


DIFERENCIAS ENTRE 2 MEDIAS
t de Student para dos muestras independientes

Uno de los anlisis estadsticos ms comunes en la prctica es probablemente el utilizado para comparar dos
grupos independientes de observaciones con respecto a una variable numrica. Como ejemplo, consideremos
los datos que se muestran en la Tabla 1, correspondientes a 75 individuos con sobrepeso sometidos a dos
dietas alimenticias distintas, de modo que se desea comparar el peso de los individuos que iniciaron cada una
de las dietas.
Como ya se ha adelantado, la aplicacin de un contraste paramtrico requiere la normalidad de las
observaciones para cada uno de los grupos. La comprobacin de esta hiptesis puede realizarse tanto por
mtodos grficos (por medio de histogramas, diagramas de cajas o grficos de normalidad) como mediante
tests estadsticos5 (test de Kolmogorov-Smirnov, test de Shapiro-Wilks). Un nmero suficiente de
observaciones (digamos mayor de 30) como ocurre en el ejemplo planteado justifica, no obstante, la
utilizacin del mismo test. As mismo, este tipo de metodologa exigir que la varianza en ambos grupos de
observaciones sea la misma. En primer lugar se desarrollar el test t de Student para el caso en el que se
verifiquen ambas condiciones, discutiendo posteriormente el modo de abordar formalmente el caso en el que
las varianzas no sean similares.
Bajo las hiptesis de normalidad e igual varianza la comparacin de ambos grupos puede realizarse en
trminos de un nico parmetro como el valor medio (Figura 1a), de modo que en el ejemplo planteado la
hiptesis de partida ser, por lo tanto:
H0: La media de peso inicial es igual en ambos grupos
Se denotar por {X1, X2,...,Xn} e {Y1,Y2,...,Ym} al peso observado en cada uno de los sujetos sometidos a la dieta
A y a la dieta B respectivamente. En general no se exigir que coincida el nmero de observaciones en cada
uno de los grupos que se comparan, de modo que en el ejemplo n=40 y m=35.
El t test para dos muestras independientes se basa en el estadstico:

(1)

donde

denotan el peso medio en cada uno de los grupos:

las cuasivarianzas muestrales correspondientes:

Con lo cual, en este caso particular, el valor utilizado para el contraste ser:

Si la hiptesis de partida es cierta el estadstico (1) seguir una distribucin t de Student con n+m-2 grados de
libertad. De ser as, el valor obtenido debera estar dentro del rango de mayor probabilidad segn esta
distribucin (Figura 2). Usualmente se toma como referencia el rango de datos en el que se concentra el 95%
de la probabilidad. El valor-p que usualmente reportan la mayora de paquetes estadsticos no es ms que la
probabilidad de obtener, segn esa distribucin, un dato ms extremo que el que proporciona el test. Como ya
se dijo, refleja tambin la probabilidad de obtener los datos observados si fuese cierta la hiptesis inicial. Si el
valor-p es muy pequeo (usualmente se considera p<0.05) es poco probable que se cumpla la hiptesis de
partida y se debera de rechazar. La regin de aceptacin corresponde por lo tanto a los valores centrales de
la distribucin para los que p>0.05. En el ejemplo planteado el valor-p correspondiente es de 0.425, de modo
que no existe evidencia estadstica de que el peso medio en ambos grupos sea diferente. En la Tabla 2, se
determina los grados de libertad (en la primera columna) y el valor de (en la primera fila). El nmero que
determina su interseccin es el valor crtico correspondiente. De este modo, si el estadstico que se obtiene
toma un valor mayor se dir que la diferencia es significativa.
Otro modo de obtener esta misma informacin es mediante el clculo de intervalos de confianza para la
diferencia de la respuesta media en ambos grupos. A mayores, el intervalo de confianza constituye una
medida de la incertidumbre con la que se estima esa diferencia a partir de la muestra, permitiendo valorar
tanto la significacin estadstica como la magnitud clnica de esa diferencia6. En el caso que nos ocupa, el
intervalo de confianza vendr dado como:

donde
denota el valor que segn la distribucin t de Student con n+m-2 grados de libertad deja a su
derecha el 2.5% de los datos. En el ejemplo, el intervalo de confianza con una seguridad del 95% para la
diferencia de peso viene dado por:

que expresa en definitiva un rango de valores entre los que se puede encontrar el valor real de la diferencia
entre los pesos de ambos grupos. Proporciona adems la misma informacin que obtenamos del contraste

estadstico. El hecho de que el valor cero pertenezca al intervalo indica que no se dispone de evidencia para
concluir que el peso sea distinto en ambos grupos.
A medida que el tamao muestral aumenta, la distribucin del estadstico (1) se hace ms prxima a la de una
variable Normal estndar. De este modo, en algunos textos se opta por utilizar esta distribucin para realizar
la comparacin de medias. Aunque esta aproximacin es correcta para muestras suficientemente grandes,
ambos mtodos proporcionan en este caso resultados prcticamente idnticos, por lo que resulta ms simple
utilizar, independientemente del tamao de la muestra, la misma metodologa a partir de la distribucin t. El
mismo planteamiento podra utilizarse en el caso de varianzas distintas o de muestras apareadas.

Dos muestras independientes con Varianza distinta

El caso en el que se dispone de dos grupos de observaciones independientes con diferentes varianzas, la
distribucin de los datos en cada grupo no puede compararse nicamente en trminos de su valor medio
(Figura 1b). El contraste estadstico planteado en el apartado anterior requiere de alguna modificacin que
tenga en cuenta la variabilidad de los datos en cada poblacin. Obviamente, el primer problema a resolver es
el de encontrar un mtodo estadstico que nos permita decidir si la varianza en ambos grupos es o no la
misma. El F test o test de la razn de varianzas viene a resolver este problema. Bajo la suposicin de que las
dos poblaciones siguen una distribucin normal y tienen igual varianza se espera que la razn de varianzas:

siga una distribucin F de Snedecor con parmetros (n-1) y (m-1).


Supongamos que en el ejemplo anterior se desee comparar la prdida de peso en los sujetos sometidos a
cada una de las dos dietas. La aplicacin del estadstico (1) no ser factible, ya que las varianzas en ambos
grupos son sustancialmente distintas. En este caso la razn de varianzas es de 3.97 / 0.80 = 4.96, valor que
se debe comparar con una distribucin F39,34. El valor-p asociado ser p<0.01, siendo muy poco probable que
las observaciones provengan de poblaciones con igual variabilidad.
En este tipo de situaciones, donde no se debe aplicar el contraste basado en (1), podemos utilizar una
modificacin del t test para el caso de varianzas desiguales, conocido como el test de Welch7 basada en el
estadstico:

que, bajo la hiptesis nula seguir una distribucin t de Student con un nmero f de grados de libertad que
depender de las varianzas muestrales segn la expresin:

La tcnica para realizar el contraste es anloga a la vista anteriormente cuando las varianzas son
desconocidas e iguales. Por ejemplo, en el caso planteado, la prdida media de peso para los individuos en
cada una de las dietas fue de
e
con las variabilidades anteriormente expresadas. Esto
conduce a un valor del estadstico de t=5.58 a relacionar con una distribucin t de Student con
aproximadamente 56 grados de libertad. El valor-p resultante es, por lo tanto, p<0.001 con lo cual podemos
rechazar la hiptesis de partida y concluir que la reduccin de peso experimentada es distinta segn la dieta
que se siga.
Al igual que en el caso anterior, podr optarse por calcular el correspondiente 95% intervalo de confianza para
la diferencia de medias dado por:

Dos muestras dependientes

Ya se ha comentado que cuando se trata de comparar dos grupos de observaciones, es importante distinguir
el caso en el que son independientes de aquel en el que los datos estn apareados. Las series dependientes
surgen normalmente cuando se evala un mismo dato ms de una vez en cada sujeto de la muestra. Tambin
se puede encontrar este tipo de observaciones en estudios de casos y controles donde cada caso se aparea
individualmente con un control.
Supongamos que queremos comprobar, en los datos de la Tabla 1 si realmente se produce una prdida de
peso significativa en esos individuos, para lo que se recoge en cada sujeto su peso antes y despus de
someterse a la dieta. En este tipo de anlisis el inters no se centra en la variabilidad que puede haber entre
los individuos, sino en las diferencias que se observan en un mismo sujeto entre un momento y otro. Por este
motivo, resulta intuitivo trabajar con la diferencia de ambas observaciones (en el ejemplo ser la prdida de
peso), de modo que se quiere contrastar la hiptesis:
H0: La prdida de peso es nula
frente a la alternativa de que la prdida de peso sea importante (es decir, distinta de cero).
La veracidad de dicha hiptesis puede ser contrastada igualmente mediante el test t de Student. Como se ha
dicho, este tipo de mtodos tienen como hiptesis fundamental la normalidad de los datos. En este caso, sin
embargo, no ser necesario que las observaciones en ambos grupos provengan de poblaciones normales,
sino que nicamente se requiere verificar la normalidad de su diferencia. Denotando por
de peso la hiptesis de la que se parte es que:

la prdida media

frente a la alternativa

A partir de las observaciones muestrales {Y1,Y2,...,Yn} e {Y1,Y2,...,Yn} en cada uno de los grupos se calcula la
diferencia de peso para cada sujeto {d1,d2,...,dn} con dj=Xj-Yj
j=1,2,...,n. Ntese que en este caso un
requisito fundamental es que se tenga un nmero igual de observaciones en ambos grupos. A partir de estos
datos, el contraste se basa en el estadstico:

o en el clculo del 95% intervalo de confianza:

donde

denota la media de la prdida de peso estimada a partir de la muestra:

denota la cuasivarianza muestral de la diferencia dada por:

En nuestro ejemplo el valor del estadstico vendra dado por:

a comparar del modo habitual con la distribucin t de Student con n-1=74 grados de libertad. El intervalo de
confianza para la prdida media de peso correspondiente a una seguridad del 95% es de (3.56;4.41), lo cual
se traduce en una prdida de peso significativamente distinta de cero, tal y como indica el valor-p
correspondiente de p<0.001.

Figura 1. Comparacin de dos poblaciones normales

a) Poblaciones normales con igual varianza y medias distintas

b) Poblaciones normales con igual y diferentes varianzas.

Figura 2. Regiones de aceptacin y rechazo en el contraste de hiptesis

Tabla 1. Datos de 75 pacientes con sobrepeso sometidos a dos dietas


alimenticias.

Dieta

Peso inicial

Peso final

Dieta

Peso inicial

Peso final

94,07

86,59

88,02

84,12

96,79

93,08

88,22

86,13

92,15

87,85

103,45

101,21

92,30

86,83

82,94

79,08

96,50

92,70

89,71

86,19

83,11

76,80

94,83

91,93

91,16

83,40

81,93

78,97

90,81

86,74

83,41

78,89

81,37

77,67

73,59

69,76

89,81

85,70

108,47

104,20

84,92

79,96

72,67

70,01

84,43

79,80

96,84

93,66

86,33

81,15

88,48

87,00

87,60

81,92

89,57

87,24

81,08

76,32

85,22

82,09

92,07

90,20

103,76

102,24

81,14

73,34

87,84

84,66

96,87

93,58

91,50

88,95

99,59

92,36

93,04

88,73

83,90

77,23

92,14

88,07

89,41

85,45

85,26

81,36

85,31

84,59

89,42

86,64

89,25

84,89

92,42

88,99

93,20

93,10

93,13

89,73

89,17

86,87

80,86

77,81

93,51

86,36

88,75

85,93

88,85

83,24

95,02

91,90

88,40

81,20

92,29

91,28

82,45

77,18

89,43

87,22

96,47

88,61

93,32

89,77

99,48

94,67

92,88

89,38

99,95

93,87

89,88

88,00

100,05

94,15

82,25

80,81

87,33

82,17

88,99

86,87

87,61

86,01

82,07

79,74

89,28

83,78

89,72

83,56

95,57

89,58

97,71

91,35

98,73

97,82

Tabla 2. Distribucin t de Student

3.4 PRUEBA DE FISHER PARA VARIANZAS Y DE IGUALDAD DE VARIANZAS DE 2


POBLACIONES NORMALES