Está en la página 1de 62

Estadstica inferencial

ndice.

1. Introduccin a la estadstica inferencial................................................................1
1.1 Introduccin a la estadstica inferencial......................................................1
1.2 Objetivo de la estadstica............................................................................1
1.2.1 Estadstica descriptiva.....................................................................2
1.2.2 Estadstica inferencial......................................................................2
1.3 Poblacin y muestra....................................................................................2
1.3.1 Poblacin......................................................................................... 2
1.3.2 Muestra........................................................................................... 3
1. Par!metros y estadsticas...........................................................................3
1..1 "uncin de par!metros y estadstica...............................................3
1..2 #so de estadsticas para estimar par!metros..................................
1..3 $mbolos est!ndar...........................................................................
1.% Muestreo aleatorio simple...........................................................................

2. &istribuciones muestrales y el teorema central del limite....................................'
2.1 (oncepto de distribucin de muestreo........................................................'
2.1.1 Media............................................................................................... '
2.1.2 )arian*a.......................................................................................... '
2.1.3 &esviacin tpica o est!ndar..........................................................1+
2.2 &istribucin muestral de medias..............................................................1+
2.2.1 Muestreo con reempla*o...............................................................1+
2.2.2 Muestreo sin reempla*o.................................................................12
2.3 El teorema del lmite central.....................................................................1
2. ,a distribucin t de $tudent......................................................................1-
2.% &istribucin Ji cuadrada............................................................................2+

3. Propiedades de los estimadores y Estimacin puntual........................................22
3.1 &e.nicin de estimador............................................................................22
3.2 &e.nicin de estimacin...........................................................................22
3.3 (riterios para seleccionar un buen estimador...........................................22
3.3.1 (ualidades de un buen estimador.................................................22
3.3.2 /0s1ueda del mejor estimador......................................................2
3. 2ipos de estimacin..................................................................................2
3..1 &e.nicin de estimacin puntual..................................................2
3..2 &esventajas de las estimaciones puntuales..................................2
3..3 &e.nicin de estimacin de intervalo............................................2%
3.% Estimador ses3ado e inses3ado................................................................2%

. Estimacin por intervalos....................................................................................2-
.1 Intervalos de con.an*a para la diferencia entre dos medias con
el uso de la distribucin normal..............................................................2-
.2 &istribucin t e intervalos de con.an*a para la diferencia
entre dos medias....................................................................................24
.3 Intervalos de con.an*a para la proporcin de la poblacin.......................2'
. &eterminacin del tama5o de muestra re1uerido para la estimacin
de la proporcin..................................................................................... 3+
.% Intervalos de con.an*a para la diferencia entre dos proporciones............3+
.- &istribucin ji cuadrada e intervalos de con.an*a para la
varian*a y desviacin est!ndar..............................................................31

%. Pruebas de 6iptesis param7tricas.....................................................................3
%.1 Introduccin.............................................................................................. 3
%.2 Pasos b!sicos de la prueba de 6iptesis con el m7todo de valor crtico...3
%.3 Prueba de una 6iptesis referente a la media usando
la distribucin normal.............................................................................3-
1
%. Errores 2ipo I y 2ipo II en pruebas de 6iptesis.........................................3'
%.% &eterminacin del tama5o de muestra re1uerido para probar la media...1
%.- Prueba de una 6iptesis referente a la media usando la distribucin t.....2
%.4 M7todo del valor P para pruebas de 6iptesis referentes a la
media de la poblacin............................................................................3
%.8 M7todo de intervalos de con.an*a para pruebas de 6iptesis
referentes a la media.............................................................................
%.' Pruebas respecto de la media del proceso en el control
estadstico de procesos..........................................................................%
%.1+ 2abla de resumen de la prueba de un valor 6ipot7tico de la medida......%
%.11 Pruebas de la diferencia entre dos medidas usando la
distribucin normal.................................................................................-
%.12 Prueba de la diferencia entre medias usando la distribucin t................8
%.13 Prueba de la diferencia entre medias con base en
observaciones apareadas.......................................................................8
%.1 Prueba de una 6iptesis referente al valor de la proporcin
de la poblacin....................................................................................... %+
%.1% &eterminacin del tama5o de muestra re1uerido para
probar la proporcin...............................................................................%1
%.1- Pruebas respecto de la proporcin del proceso en el control
estadstico de procesos..........................................................................%2
%.14 Prueba de la diferencia entre dos proporciones poblacionales................%3
%.18 Prueba de un valor 6ipot7tico de la varian*a usando la
distribucin 9i cuadrada..........................................................................%
%.1' Pruebas respecto de la variabilidad del proceso en el control
estadstico de procesos..........................................................................%%
%.2+ &istribucin " y prueba de la i3ualdad de dos varian*as poblacionales. .%-
%.21 Otros m7todos para la prueba de 6iptesis nulas...................................%4
-. Estadstica no param7trica.................................................................................%8
-.1 Escalas de medicin.................................................................................%8
-.2 M7todos estadsticos param7tricos contra no param7tricos.....................%'
-.3 Prueba de corridas para aleatoriedad.......................................................%'
-. #na muestra: Prueba de los si3nos...........................................................-+
-.% #na muestra: Prueba de ;ilco<on............................................................-1
-.- &os muestras independientes: Prueba de Mann=;6itney.........................-2
-.4 Observaciones apareadas: Prueba de los $i3nos......................................-3
-.8 Observaciones apareadas: Prueba de ;ilco<on........................................-3
-.' )arias muestras independientes: Prueba de >rus?al=;allis.......................-

4. Muestreo .......................................................................................................... --
4.1 Introduccin.............................................................................................. --
4.2 Muestreo @leatorio....................................................................................--
4.3 &ise5os de muestras................................................................................4+
4. Muestreo sistem!tico................................................................................41
4.% Muestreo estrati.cado..............................................................................41
4.- Muestreo por con3lomerados....................................................................4
(onclusiones ...................................................................................................... 4-

/iblio3rafa.............................................................................................................. 4-


1. Introduccin a la estadstica inferencial.
2
1.1 Introduccin a la estadstica inferencial
,a estadstica InferencialA es el proceso por el cual se deducen Bin.erenC propiedades o
caractersticas de una poblacin a partir de una muestra si3ni.cativa. #no de los aspectos
principales de la inferencia es la estimacin de par!metros estadsticos. Por ejemploA para
averi3uar la mediaA DA de las estaturas de todos los soldados de un reempla*oA se e<trae una
muestra y se obtiene su mediaA <. ,a media de la muestra Bmedia muestralCA <. es un estimador
de la media poblacionalA D. $i el proceso de muestreo est! bien reali*ado Bes decirA la muestra
tiene el tama5o adecuado y 6a sido seleccionada aleatoriamenteCA entonces el valor de DA
desconocidoA puede ser inferido a partir de <.
,a inferencia siempre se reali*a en t7rminos apro<imados y declarando un cierto nivel de
confian*a. Por ejemploA si en una muestra de n E %++ soldados se obtiene una estatura media < E
142 cmA se puede lle3ar a una conclusin del si3uiente tipo: la estatura mediaA DA de todos los
soldados del reempla*o est! comprendida entre 141 cm y 143 cmA y esta a.rmacin se reali*a con
un nivel de con.an*a de un '+F. BEsto 1uiere decir 1ue se acertar! en el '+F de los estudios
reali*ados en las mismas condiciones 1ue 7ste y en el 1+F restante se cometer! error.C
$i se 1uiere mejorar el nivel de con.an*aA se deber! aumentar el tama5o de la muestraA o bien
disminuir la precisin de la estimacin dando un tramo m!s amplio 1ue el formado por el de
e<tremos 141A 143. GecprocamenteA si se 1uiere aumentar la precisin en la estimacin
disminuyendo el tama5o del intervaloA entonces 6ay 1ue aumentar el tama5o de la muestra o bien
consentir un nivel de con.an*a menor. "inalmenteA si se 1uiere mejorar tanto la precisin como el
nivel de con.an*aA 6ay 1ue tomar una muestra su.cientemente 3rande.
1.2 Objetivo de la estadstica
,a estadstica es el conjunto de t7cnicas 1ue se emplean para la recoleccinA or3ani*acinA an!lisis
e interpretacin de datos. ,os datos pueden ser cuantitativosA con valores e<presados
num7ricamenteA o cualitativosA en cuyo caso se tabulan las caractersticas de las observaciones.
,a estadstica sirve en administracin y economa para tomar mejores decisiones a partir de la
comprensin de las fuentes de variacin y de la deteccin de patrones y relaciones en datos
econmicos y administrativos.
1.2.1 Estadstica descriptiva
,a estadstica descriptiva comprende las t7cnicas 1ue se emplean para resumir y describir datos
num7ricos. Estos m7todos pueden ser 3r!.cos o implicar an!lisis computacional.
Ejemplo. El volumen mensual de ventas de un producto durante el a5o anterior puede describirse
y cobrar si3ni.cado elaborando un dia3rama de barras o una 3r!.ca de lneas. ,as ventas
relativas por mes pueden resaltarse calculando un n0mero Hndice para cada mesA con lo 1ue la
desviacin respecto de 1++ de cual1uier mes indicara la desviacin porcentual de ventas de ese
mes en comparacin con las ventas mensuales promedio durante todo el a5o.
1.2.2 Estadstica inferencial
,a estadstica inferencial comprende las t7cnicas con las 1ueA con base 0nicamente en una
muestra sometida a observacinA se toman decisiones sobre una poblacin o proceso estadsticos.
&ado 1ue estas decisiones se toman en condiciones de incertidumbreA suponen el uso de
conceptos de probabilidad. Mientras 1ue a las caractersticas medidas de una muestra se les llama
estadsticas muestralesA a las caractersticas medidas de una poblacin estadsticaA o universoA se
les llama par!metros de la poblacin. El procedimiento para la medicin de las caractersticas de
todos los miembros de una poblacin de.nida se llama censo. (uando la inferencia estadstica se
usa en el control de procesosA al muestreoA le interesa en particular el descubrimiento y control de
las fuentes de variacin en la calidad de la produccin.
3
Ejemplo. Para estimar el voltaje re1uerido para provocar fallas en un dispositivo el7ctricoA una
muestra de estos dispositivos puede someterse a voltajes crecientes 6asta 1ue falle cada uno de
ellos. (on base en estos resultados muestrales puede estimarse la probabilidad de falla a varios
niveles de voltaje de los dem!s dispositivos de la poblacin muestreada.
1.3 Poblacin y muestra
1.3.1 Poblacin
,a poblacin es un a3re3ado de unidades individualesA compuesto de personas o cosas 1ue se
6allan en una situacin determinada. ,as unidades individuales se llaman unidades elementales.
&e.nir una poblacin es determinar sus unidades elementales de acuerdo con el inter7s 1ue se
tiene respecto a al3una caracterstica de a1u7lla.
2anto la de.nicin de una poblacin como la caracterstica por observar de sus unidades
elementales dependen de la naturale*a del problema. Por ejemploA si el problema es I(amisas
para personas adultas de El $alvadorIA se trata de determinar la cantidad adecuada de produccin
de camisas de acuerdo con las diversas medidas. ,a poblacin son todas las personas adultas de
El $alvador. ,a caracterstica de inter7s son las medidas del cuello de las personas adultas en
dic6o pas.
)eamos otro ejemplo: las cuotas diferenciadas para alumnos de la #E$ B#niversidad de El
$alvadorC. El problema por resolver es la asi3nacin de las cuotas a los estudiantes. ,a poblacin
son los alumnos Bo sus padresC de la #E$J la caracterstica de inter7s es el monto de los in3resos
de dic6os estudiantes.
,as poblaciones pueden ser in.nitas o .nitas. #na poblacin in.nita es la 1ue contiene un n0mero
in.nito de unidades elementalesJ por ejemploA el conjunto de pie*as 1ue se obtienen en un
proceso productivoJ en el sentido de 1ue se si3uen produciendo inde.nidamente. Otro ejemplo son
todos los posibles resultados al lan*ar una moneda sin cesar.
#na poblacin es .nita cuando tiene un n0mero .nito de unidades elementales. Por ejemploA los
estudiantes de una determinada universidadJ el n0mero de escuelas 1ue e<isten en una
determinada ciudadA el n0mero de !rboles de coco sembrados en una determinada parcelaA
etc7tera. El n0mero de unidades elementales de una poblacin se denota con la letra K.
1.3.2 uestra
#na muestra es una parte de la poblacinJ por ejemploA cuando se desea 6acer un estudio relativo
al rendimiento acad7mico de los alumnos de cierta universidadA y para esto se toma slo un 3rupo
de estudiantes de la misma. 2odos los estudiantes de ella son la poblacin y el 3rupo esco3ido
constituye la muestra. Es importante 6acer notar 1ue para 6acer una investi3acin mediante el
an!lisis de una muestraA 7sta tiene 1ue serA necesariamenteA representativa. ,a representatividad
de la muestra implica 1ue cada unidad de la poblacin debe tener i3ual probabilidad de ser
seleccionada. En estas condicionesA se dice 1ue la muestra es aleatoria. ,a obtencin de una
muestra representativa es uno de los aspectos m!s importantes de la teora estadstica. Incluye
pre3untas comoA L1u7 tan 3rande debe ser la muestraMA L1u7 tipo de datos deben ser
recolectadosMA Lcmo se reco3er!n 7stosM Estas pre3untas ser!n contestadas m!s adelante. BEl
n0mero de unidades elementales de una muestra se denota con la letra nC.
1.! Par"metros y estadsticas
1.!.1 #uncin de par"metros y estadstica
Matem!ticamenteA podemos describir muestras y poblaciones al emplear mediciones como la
mediaA la medianaA la moda y la desviacin est!ndar. (uando estos t7rminos describen las
caractersticas de una muestraA se denominan estadsticas. (uando describen las caractersticas
4
de una poblacinA se llaman par!metros. #na estadstica es una caracterstica de una muestra y
un par!metro es una caracterstica de una poblacin.
1.!.2 $so de estadsticas para estimar par"metros
$upon3amos 1ue la estatura media en centmetros de todos los alumnos de se<to a5o en M7<ico
es de 1%2 cm. En este casoA 1%2 cm es una caracterstica de la poblacin de Itodos los alumnos de
d7cimo a5oI y puede llamarse un par!metro de poblacin. Por otra parteA si decimos 1ue la
estatura media en la clase de d7cimo a5o de la maestra $!nc6e*A en NuadalajaraA es de 1%2 cmA
estamos usando 1%2 cm para describir una caracterstica de la muestra Ialumnos de se<to 3rado
de la maestra $!nc6e*I. En ese casoA 1%2 cm sera una estadstica de muestra. $i estamos
convencidos de 1ue la estatura media de los alumnos de d7cimo a5o de la maestra $!nc6e* es
una estimacin e<acta de la estatura media de todos los alumnos de dic6o nivel de M7<icoA
podramos usar la estadstica de muestra Iestatura media de los alumnos de d7cimo 3rado de la
maestra $!nc6e*I para estimar el par!metro de poblacin Iestatura media de los alumnos de
d7cimo 3rado de M7<icoI sin tener 1ue medir a todos los millones de alumnos de M7<ico 1ue
est!n en ese 3rado.
Tabla 1 - Diferencias entre poblaciones y muestras:

Poblacin
Muestra
&e.nicin (oleccin de elementos considerados Parte o porcin de la
poblacin seleccionada para
su estudio
(aracterstic
as
OPar!metrosP OEstadsticasP
$mbolos 2ama5o de la poblacin E N 2ama5o de la muestra E n
Media de la poblacin E %
Media de la muestra = x
&esviacin est!ndar de la poblacin
E
&esviacin est!ndar de la
muestra E s
1.& uestreo aleatorio simple
El muestreo aleatorio simple es un procedimiento de seleccin por el cual todos y cada uno de los
elementos de la poblacin tienen i3ual probabilidad de ser incluidos en la muestra. EntoncesA si
toda unidad de muestreo tiene la misma probabilidad de ser esco3idaA se si3ue 1ue las muestras
aleatorias de i3ual tama5oA tomadas de una poblacin dadaA tienen la misma probabilidad de ser
tomadas.
PartamosA por ejemploA de la poblacin de tres cali.caciones: 2A y -. &e esta poblacin podemos
tomar muestras de tama5o n E 2J con o sin reempla*o. (on reempla*o si3ni.ca 1ue se selecciona
una unidad elemental y lue3o 7sta se re3resa a la poblacin antes de tomar la si3uienteJ por
tantoA cada unidad puede ser seleccionada m!s de una ve* en la misma muestra. Es sin
reempla*oA cuandoA una ve* esco3ida una unidad elementalA 7sta ya no se re3resa a la poblacinA
y por tantoA cada unidad puede aparecer slo una ve*.
)eamos el caso de muestreo con reempla*oA tomando todas las posibles muestras de n E 2 1ue se
pueden tomar de la poblacin: 2A y -. El n0mero de muestras por tomar es KI E 3
2
E '.
,as muestras son:
2A2 2A 2A-
A2 A A-
-A2 %A -A-
5
(ada una de estas muestras tiene 1Q' de probabilidad de ser esco3ida.
@6ora veamos el caso de muestreo sin reempla*o. 2omemos siempre muestras de tama5o n E 2.
El n0mero de muestras por tomar es el resultado del desarrollo del combinatorio


@l sustituir:
,as muestras son:
2A 2A- A-
(ada una de estas muestras tiene 1Q3 de probabilidad de ser esco3ida. L(mo esco3er una
muestra aleatoria simpleM #no de los m7todos sencillos consiste en numerar todos los elementos
de la poblacinA escribir los n0meros en tarjetasA .c6as o bolasA poner lue3o en una caja o bolsa
estos objetos numerados y me*clarlos completamente. $e determina entonces el tama5o n de la
muestra y se sacan los objetos al a*arA uno por unoA 6asta tener el n0mero deseado.
Otro m7todo m!s t7cnico y con.able consiste en usar tablas de n0meros aleatorios. En la mayor
parte de los libros de estadstica aparece este tipo de tablasJ sin embar3oA uno mismo puede
elaborar las suyasA 6aciendo uso de una urna con 1+ bolas =de pin3 pon3A por ejemplo= numeradas
del + al 'J se sacan las bolas con reempla*amientoA se anotan los n0meros 1ue sal3an y se forman
blo1ues de n0meros con los d3itos 1ue se desee. El proceso es eminentemente aleatorioA ya 1ue
cada d3ito tiene la misma probabilidad de salir: 1Q1+.
6
2abla 2 K0meros aleatorios
)eamos al3unos ejemplos donde se utili*a la tabla 2 de n0meros aleatorios.
$upn3ase 1ue tenemos una poblacin de tama5o K E 1++ y deseamos tomar una muestra de
tama5o n E 1%. Primero se numera la poblacin de la si3uiente manera: por ser K E 1++ potencia
de 1+A la numeracin de la poblacin 1ueda as: ++=+1=+2=+3=+=+%=+-=+4=+8=+'1+=11=12 ... ''.
#na ve* numerados los elementos de la poblacinA se toman los primeros dos d3itos de los
blo1ues de n0meros de la tablaA con un comien*o aleatorio. $upon3amos 1ue el comien*o fue a
partir del tercer blo1ue y 1uinto ren3lnJ es decir:
%88%
%-1
+118
4842
.
.
.
7
,os n0meros esco3idos =si3uiendo 6acia abajo= son: %8=%-=+1=48=-1=81=%'=4'=+4=82=14=22=8'=21
y 4+. Obs7rvese 1ue despu7s del 22 si3ue el %'A el cual no se tomA por1ue ya 6aba sido
seleccionado.
$upn3ase a6ora 1ue la poblacin tiene K E 82% elementosA de los cuales tomaremos una
muestra de n E 2+. Por no ser K potencia de 1+ y constar de tres cifrasA los elementos de la
poblacin se numeran as: ++1=++2=++3=++=++%=++-=++4=++8=++'=+1+=+11=+12=+13 ... 82%. Ra
numerados esos elementosA se toman de la tabla n0meros de tres cifrasA sin pasar de 82%.
$upon3amos 1ue el comien*o aleatorio es el se<to blo1ue y el onceavo ren3lnJ es decir:
%8-
32'1+
4-1%'
.
.
.
,os n0meros seleccionados =si3uiendo 6acia abajo= son: %8=32'=4-1=38-=++1=-48=823=442=3+=
81%=8'=3=424=1'-=-24A y as sucesivamente 6asta completar la muestra. Obs7rvese 1ue
despu7s del n0mero 38- si3ue el '+A 1ue no se tom por ser mayor 1ue 82%J lo mismo se 6i*o
con los n0meros 888 y 84-A mayores 1ue el tama5o de la poblacin.
)amos a suponerA esta ve*A 1ue K E 3 -%A y la muestra tomada es n E ++. ,os elementos de la
poblacin 1uedan numerados as: +++ 1 +++2=+++3=+++ ... 3-%. $upon3amos 1ue el comien*o
aleatorio es el octavo blo1ue y el veinteavo ren3lnJ es decir:
%%-24
1812
28A etc7tera.
Esta ve* los n0meros ser!n esco3idos si3uiendo 6acia arriba: %%-2=++38=+-1=%3=%111=+%-4=
''+=3848=13'1=%-2+=%8=%4+=3+%+=3438=21%J en este n0mero termina el blo1ue octavo. ,os
si3uientes se pueden esco3er ya sea el s7ptimo o el doceavo blo1ue de n0merosJ si optamos por
el s7ptimoA los n0meros 1ue si3uen son: 1228=31%-=%-2+=%8'3=+8A y as sucesivamente 6asta
tener toda la muestra.
2. 'istribuciones muestrales y el teorema central del limite.
2.1 (oncepto de distribucin de muestreo
,a comprensin del concepto de la distribucin de muestreo es fundamental para el correcto
entendimiento de la inferencia estadstica. (omo ya se estableciA una distribucin de la poblacin
es la distribucin de la totalidad de las medidas individuales de una poblacinA en tanto 1ue una
distribucin muestral es la distribucin de los valores individuales incluidos en una muestra. En
contraste con estas distribuciones de medidas individualesA una distribucin de muestreo se
re.ere a la distribucin de los diferentes valores 1ue una estadstica muestralA o estimadorA podra
adoptar en muc6as muestras del mismo tama5o. @sA aun1ue por lo 3eneral disponemos
0nicamente de una muestra aleatoria o sub3rupoA racionalA reconocemos 1ue la estadstica
muestral particular 1ue determinamosA como la media o mediana de la muestraA no es
e<actamente i3ual al respectivo par!metro de la poblacin. M!s a0nA el valor de una estadstica
muestral variar! de una muestra a otraA a causa de la variabilidad del muestreo aleatorioA o error
de muestreo. Ssta es la idea en la 1ue se apoya el concepto de 1ue toda estadstica muestral es
de 6ec6o un tipo de variable cuya distribucin de valores est! representada por una distribucin
de muestreo.
2.1.1 edia )% *.
Es el promedio aritm7tico de las medias del conjunto de datosJ ya sea de la poblacin o de la
muestra.
8
2ambi7n 6abremos de referirnos a la media como el valor esperado de TA y se denotar! con E BTC.
2.1.2 +arian,a )-
2
*.
Es el promedio de la suma de los cuadrados de las desviaciones. $e entiende por desviacin la
diferencia de una media respecto a la media: Ti = D .
(omo puede verseA la varian*a es una medida de dispersin. IndicaA en promedioA 1u7 tan alejados
est!n los datos respecto de la media.
2.1.3 'esviacin tpica o est"ndar B-C.
Es la ra* cuadrada de la varian*a.
Por simplicidadA en las e<presiones anteriores se acostumbra suprimir el subndice iA as como los
lmites de las sumatorias:
2.2 'istribucin muestral de medias
#na distribucin muestral de medias o una distribucin en el muestreo de la media se de.ne como
el conjunto de todas las medias 1ue se pueden calcular en todas las muestras posibles 1ue se
pueden e<traerA con o sin reempla*oA de una determinada poblacin. Para detectar las relaciones a
1ue nos 6emos referidoA partiremos de un ejemplo con una poblacin pe1ue5a.
2.2.1 uestreo con reempla,amiento
$ea la si3uiente poblacin de cinco cali.caciones Bv7ase la tabla 3C: A %A -A 4 y 8J calcular:
aC ,a media y varian*a de la poblacin.
bC ,as medias de todas las muestras de tama5o 2 1ue se pueden
e<traer de esa poblacinA con reempla*amiento.
cC 2ransformar la serie de medias en una distribucin muestral de
medias.
dC ,a media de las medias muestrales.
e C ,a desviacin tpica o est!ndar de la distribucin muestral de
medias Berror est!ndar de las mediasC.
f C ,as probabilidades de las medias muestrales.
2abla 3 (ali.caciones de cinco estudiantes y c!lculo de la media y la varian*a.
9
$olucin
2abla Muestras de tama5o n E 2 y sus respectivas mediasA tomadas de una poblacin de cinco
cali.cacionesJ con reempla*o.
bC El n0mero de muestras de tama5o 2A con reempla*amiento Bv7ase la tabla CA 1ue se
pueden e<traer de una poblacin de cinco observacionesA es: K E %1 E 2% muestras.

cC @1u introduciremos un t7rmino muy utili*ado en la estadsticas: la frecuencia BfC. Ssta se
re.ere al n0mero de veces 1ue ocurre un valor determinado. En t7rminos de frecuenciasA la media
y la
varian*a se pueden e<presar as:U
(ada f en las sumatorias representa la frecuencia con 1ue aparece cada valor Ti.
,a serie de medias la transformamos en una distribucin muestral de medas de la si3uiente
manera.

UEstas frmulas se pueden aplicar cuando todos los eventos son i3ual mente probablesA como es
el casoA por tratarse de muestreo aleatorio simple.
10
Observacin. Vemos obtenido al
2
Q< E 1J a .n de relacionar este valor con el de
2
A notemos
1ue
Es decir:
2abla % &istribucin muestral de medias calculadas en muestras de tama5o n E 2 de las
cali.caciones de cinco estudiantesA y c!lculo de la media de las medias y desviacin tpica de la
distribucin muestral de medias.
relacin 1ue nos dice 1ue la desviacin tpica o est!ndar de la distribucin muestral de mediasA
1ue llamaremos error est!ndar de la distribucin muestral de mediasA es directamente
proporcional a la desviacin tpica poblacional e inversamente proporcional a la ra* cuadrada del
tama5o de la muestra. Esta frmulaA deducida a1u a partir de un caso particularA resulta ser
v!lida en 3eneralA es de 3ran utilidad para la inferencia estadstica. $i aplicamos la frmula del
error est!ndar de la distribucin muestral de medias encontrada para nuestro ejercicioA tenemos:
f C ,as probabilidades de las 2% medias muestrales se presentan en la 0ltima columna de la
tabla %. (uando las 2% muestras se seleccionan al a*arA cada muestra tendr! la probabilidad de
1Q2% de ser seleccionada. Puesto 1ue 6ay cuatro muestras con media %.%A por ejemploA y el total
de medias es 2%A la probabilidad de 1ue una muestra seleccionada ten3a media de %.% esA
entoncesA Q2%.
2.2.2 uestreo sin reempla,amiento
(on la misma poblacin de las cali.caciones de cinco estudiantesA vamos a contestar las mismas
pre3untas:
aC ,a media poblacional fue: E -A la varian*a:
2
E 2 y la desviacin tpica: E 1.12.
bC El n0mero de muestras de tama5o 2A sin reempla*oA resulta del
desarrollo del combinatorio
2abla -. Muestras de tama5o n E 2 y sus respectivas medias tomadas de una poblacin de cinco
cali.cacionesA sin reempla*o.
11
cC

2abla 4. &istribucin muestral de medias calculadas en muestras de tama5o n E 2 de las
cali.caciones de cinco estudiantes y c!lculo de la media de las medias y desviacin tpica de la
distribucin muestral de medias.


Observacin. El muestreo sin reempla*o 3enera poblaciones .nitasA de tal manera 1ue para
calcular la desviacin tpica de la distribucin muestral de mediasA o seaA el error est!ndar de las
mediasA en muestreo sin reempla*oA se tiene 1ue introducir el factor de correccin .nita
J por tantoA la frmula del error est!ndar 1ueda as:
@l aplicar esta relacin a nuestro problemaA tenemos:
Gesultado 1ue es i3ual al encontrado anteriormente.

fC ,as probabilidades de las 1+ medias muestrales .3uran en la 0ltima columna de la 0ltima tabla.
(uando las 1+ muestras se seleccionan al a*arA cada muestra tendr! la probabilidad de 1Q1+ de
ser seleccionada. Puesto 1ue 6ay dos muestras con medias %.%A -.+ y -.%A por ejemploA la
probabilidad de seleccionar cada una de ellas es 2Q1+J la probabilidad del resto de las mediases 1 Q
1+ para cada una.

2.3 El teorema del lmite central

(uando usamos la media de una muestra para estimar la media de una poblacinA podemos
e<presar de varias maneras las incertidumbres acerca del error. (uando conocemos la distribucin
muestral e<acta de la mediaA 1ue rara ve* la conocemosA podramos proceder como en el ejemplo
anterior y calcular las probabilidades asociadas con errores de diversos tama5os. @s mismoA
12
siempre podernos usar el teorema de (6ebys6ev y a.rmar con una probabilidad de como
mnimo 1ue la media de una muestra aleatoria diferir! de la media de la poblacin de la 1ue se
efect0a el muestreo por menos de ? . <J no obstanteA en la pr!ctica no podemos 6acer esto.

Ejemplo (on base en el teorema de (6ebys6ev con ? E 2A L1u7 podemos decir acerca del tama5o
de nuestro errorA si vamos a usar la media de una muestra aleatoria de tama5o n E - para
estimar la media de una poblacin in.nita con
< E 2+M

.olucin $ustituyendo n E - y . < E 2+ en la frmula apropiada para el error est!ndar de la
mediaA obtenemos
y se deriva 1ue podemos a.rmar con una probabilidad como mnimo de
1 = 1 Q 2
2
E +.4% 1ue el error ser! menor 1ue ? . . < E 2

@1uA el problema es 1ue Icomo mnimo de +.4%I no nos dice su.ciente cuando en realidad la
probabilidad puede serA di3amosA +.'8 o aun +.'''.

El teorema de (6ebys6ev ofrece una relacin l3ica entre los errores y las probabilidades de 1ue
7stos se cometanA pero e<iste otro teorema 1ue en muc6os casos nos permite 6acer
aseveraciones m!s .rmes acerca de la probabilidad de nuestros errores potenciales. Este teoremaA
1ue es el se3undo de los 1ue mencionamos se conoce como el teorema del lmite central y se
puede e<presar como si3ue:

/eorema del lmite central0

Para muestras 1randes2 se puede obtener una apro3imacin cercana de la
distribucin muestral de la media con una distribucin normal.

$i combinamos este teorema con el de la seccin anteriorA de acuerdo con el cual
para muestras aleatorias de poblaciones in.nitasA encontramos 1ue si es la
media de una muestra aleatoria de tama5o n de una poblacin in.nita con la media y la
desviacin est!ndar _ y n es 3randeA entonces


es un valor de una variable aleatoria 1ue tiene apro<imadamente la distribucin normal est!ndar.

El teorema del lmite central es de importancia fundamental para la estadstica por1ue justi.ca el
uso de m7todos de curva normal en una 3ran variedad de problemasJ se aplica a poblaciones
in.nitas y tambi7n a poblaciones .nitas cuando nA a pesar de ser 3randeA no constituye m!s 1ue
una pe1ue5a porcin de la poblacin. Es difcil se5alar con precisin 1u7 tan 3rande debe ser n de
modo 1ue se pueda aplicar el teorema del lmite centralA pero a menos de 1ue la distribucin de la
poblacin ten3a una forma muy inusualA por lo re3ular se considera 1ue n E 3+ es lo
su.cientemente alto. Ktese 1ue cuando en realidad estamos tomando una muestra de una
poblacinA la distribucin del muestreo de la media es una distribucin normalA no obstante el
tama5o de n.

@6ora veamos 1u7 probabilidad ocupar! el lu3ar de Icomo mnimo de +.4%IA si usamos el teorema
del lmite central en ve* del teorema de (6ebys6ev en el ejemplo anterior.

13
Ejemplo base en el teorema del lmite centralA Lcu!l es la probabilidad de 1ue el error sea menor
1ue %A cuando se usa la media de una muestra aleatoria de tama5o n E - para estimar la media
de una poblacin in.nita con < E 2+M

Solucin ,a probabilidad se obtiene por medio del !rea de la *ona blanca bajo la curva de la .3ura
1A espec.camenteA por medio del !rea de curva normal est!ndar entre



"IN#G@ 1 &istribucin muestral de la media.

&ado 1ue la entrada de la tabla correspondiente a * E 2.++ es +.442A la probabilidad 1ue se pide
es +.442 W +.442 E +.'%. @sA sustituimos la a.rmacin de 1ue la probabilidad es Icomo
mnimo de +.4%I por una aseveracin m!s .rme de 1ue la probabilidad es apro<imadamente de
+.'% Bde 1ue la media de una muestra aleatoria de tama5o n E - de la poblacin de referencia
di.era de la poblacin por menos de %C.

2ambi7n se puede usar el teorema del lmite central para poblaciones .nitasA pero una descripcin
precisa de las situaciones en 1ue se puede 6acer esto sera m!s bien complicada. El uso apropiado
m!s com0n es en el caso en 1ue n es 3rande mientras 1ue n Q K es pe1ue5a. Este es el caso en la
mayora de las encuestas polticas.

2.! 4a distribucin t de .tudent

(uando 6icimos la estimacin por intervalo por medio de la distribucin XA o seaA con un muestreo
3rande Bn 3+CA establecimos el intervalo de confian*a para estimar la media poblacionalA as: _ Y
Z n ____-_ A dado 1ue conocamos la desviacin tpica de la poblacinA . $in embar3oA
cuando no conocemos este valorA establecimos 1ue se poda sustituir por la desviacin tpica
muestral $A y el intervalo 1uedaba as: Y Z S Q n -_ . @6oraA cuando el tama5o de la muestra es
menor 1ue 3+A o seaA para el 1ue llamamos muestreo pe1ue5oA la sustitucin de por $ no es
apropiadaJ en consecuenciaA se 6ace necesario considerar una forma alternativa para estimar la
media poblacional a partir de una muestra pe1ue5a.

Muc6os problemas cient.cos 6an sido resueltos por la va de la e<perimentacin. $upon3amos
1ue se toman todas las muestras posiblesA de tama5o n menor 1ue 3+A de una determinada
poblacin con distribucin normalA y se calcula la estadstica de prueba t para construir un
pol3ono de frecuencias con los valores calculados y S de cada una de estas muestras y visuali*ar
as la forma de la distribucin. t se de.ne as:


14
BEl si3no en la parte superior de indica 1ue se trata de un estimador.C

&onde


o seaA el error est!ndar de la distribucin muestral de medias.

% E media poblacional.

,a distribucin t 1ueda as:

Esta distribucin t fue descubierta por ;illiam NossetA 1uien la public en 1'+8 con el seudnimo
de $tudent. &esde entonces se le conoce como distribucin t de $tudent. Por la naturale*a de este
ensayoA omitimos la e<plicacin matem!tica de esta distribucin. $lo manejaremos su aplicacin
para la estimacin y prueba de 6iptesis. @l i3ual 1ue la distribucin ZA la distribucin t tiene
forma acampanada y perfectamente sim7trica con respecto a t E +A pero con una dispersin
mayorA la cual aumenta a medida 1ue disminuye el tama5o de la muestra.

@ntes de estudiar la distribucin t debemos se5alar 1ue no slo e<iste unaA sino varias
distribuciones t. (ada una de ellas est! asociada con lo 1ue se denomina graos e liberta !"#A
1ue se de.nen como el n0mero de observaciones menos unoJ es decirA " $ n - 1. En otras
palabrasA la forma de la distribucin depender! del tama5o de la muestra. Por ejemploA los valores
de t para muestras de tama5o 1uedan descritos por la distribucin t con tres 3rados de libertad
B = 1 E 3CJ la distribucin t con 2' 3rados de libertad describe la distribucin de los valores t para
muestras de tama5o 3+. En la .3ura 2 ilustramos dos distribuciones t con tres y 2' 3rados de
libertad y la distribucin normal:


"i3ura 2 (omparacin de dos distribuciones t con la distribucin normal.


Podemos observar en la 3r!.ca 1ue tanto la distribucin normal como las distribuciones t tienen
forma de campana y son sim7tricas. 2ambi7n puede observarse 1ue las distribuciones t tienen
mayor dispersin 1ue la normal. Por ejemploA en la 3r!.ca se 6an marcado valores crticos de Z y t
para un coe.ciente de con.an*a de +.''. @sA el valor crtico de Z para +.'' es Y 2.%8 y el valor
crtico de t para tres 3rados de libertad es Y %.8.

@l e<aminar esta distribucin encontramos 1ue el valor crtico de t para 3 3rados de libertad
Bren3ln 3 y 0ltima columnaA rotulada t+.++%C es Y %.8. Este valor indica 1ue +.%F B+.++% T 1++ E
15
+.%FC del !rea bajo esta curva t est! a la derec6a de W %.8 o a la i*1uierda de = %.8. En
consecuenciaA ''F del !rea bajo t est! incluida en el intervalo Y %.8J es decirA 6ay una
probabilidad de +.'' de 1ue la variable t est7 en el intervalo Z = %.8A %.8[.

En forma an!lo3aA el valor 2.4-A ubicado en la 0ltima columnaA rotulada t+.++%A y el ren3ln 2'A
corresponde al valor crtico de la distribucin t para 2' 3rados de libertadA e indica 1ue +.%F del
!rea bajo esta curva est! a la derec6a de 2.4- o a la i*1uierda de = 2.4-. En consecuenciaA +.'' del
!rea bajo la curva t est! incluida en el intervalo Y 2.4-J o seaA 6ay una probabilidad de +.'' de
1ue la variable t est7 en el intervalo Z = 2.4-A 2.4-[.

Es importante observar 1ue el valor crtico de t 6a disminuido al crecer el n0mero de 3rados de
libertad. $i el tama5o de la muestra 6ubiese aumentado en forma in.nitaA el valor de t tomara el
valor de 2.%8A 1ue es i3ual al valor de Z para la curva normal.

&e la misma manera podemos interpretar los otros valores de la tabla. Por ejemploA para una
distribucin t con 1% 3rados de libertad y un coe.ciente de con.an*a de +.'%A el valor crtico de t
se ubica en la


2abla 8 2abla de la distribucin t de $tudent con " 3rados de libertad.
16

novena columna Bt+.++2%C y el ren3ln 1%J o seaA Y 2.13. En esta misma distribucinA si n tiende a
in.nitoA el valor 1ue tomara t sera 1.'-A el cual se encuentra en la columna ' y 0ltimo ren3lnA
i3ual al valor de Z para la curva normal.

Para la distribucin t con 1 3rados de libertadA obtenemos en la tabla 1ue '+F del !rea bajo esta
curva t est! en el intervalo Y 1.4-A es decirA 1ue 6ay una probabilidad de +.'+ de 1ue la variable t
se encuentre en el intervalo

(omo
la desi3ualdad se convierte en:
1ue tambi7n puede escribirse as:
17
Por tantoA a.rmamos 1ue 6ay una probabilidad de +.'+ de 1ue la media de la poblacin est7 en
este intervalo. @sA puesA podemos decir 1ue cuando el tama5o de la muestra es 1%Bv E n = 1 E 1%
= 1 E 1CA 6ay una con.an*a de +.'+ de 1ue el par!metro est7 en el intervalo
$i el tama5o de la muestra fuese 1+A los 3rados de libertad seran ' B1+ = 1 E 'C y para un
coe.ciente de con.an*a de 8+F el intervalo de con.an*a para estimar la media poblacional
sera:
En 3eneralA para estimar la media poblacional A en cual1uier intervalo de con.an*aA utili*amos la
relacin

2.& 'istribucin 5i (uadrada

(on el objeto de comparar la media de una muestra con la media 6ipot7tica de una poblacinA en
muestreo pe1ue5oA utili*amos una distribucin t y un estadstico t. &e la distribucin de t
obtuvimos una tabla de valores t con los cuales comparamos los estadsticos t calculados.
@n!lo3amenteA para comparar la varian*a de una muestra con la varian*a 6ipot7tica de una
poblacinA utili*amos la distribucin 9i cuadradaA la cual se denota por la letra 3rie3a TB9iCA elevada
al cuadrado: T
2
.

&ada la naturale*a de este ensayo elementalA no 6aremos inferencia para este tipo de problemasA
1ue corresponde al campo de la estadstica param7trica. 9i cuadrada se puede manejar en forma
param7trica y no param7tricaJ para los .nes de este libro nos restrin3iremos a la 0ltima forma.

(omo ocurre con las distribuciones tA la distribucin 9i cuadrada tiene una forma 1ue depende del
n0mero de 3rados de libertad asociados a un determinado problema. )arias de estas curvas se
ilustran en la .3ura 3. &ebido a esta tendenciaA el valor crtico de . ser! funcin de los 3rados
de libertad. @sA para obtener un valor crtico a partir de una tabla de .A debemos seleccionar un
nivel de si3ni.cacin y determinar los 3rados de libertad para el problema bajo an!lisis.


"i3ura 3 &istribucin Ji cuadrada para " E 2A % y 1+.

3. Estimador y estimaciones

3.1 'e6nicin de estimador

(ual1uier estadstica de muestra 1ue se utilice para estimar un par!metro de poblacin se conoce
como estimadorA es decirA un estimador es una estadstica de muestra utili*ada para estimar un
par!metro de poblacin. ,a media de la muestra puede ser un estimado de la media de la
18
poblacin A y la porcin de la muestra se puede utili*ar como estimador de la porcin de la
poblacin. 2ambi7n podemos utili*ar el alcance de la muestra como un estimador del alcance de la
poblacin.

3.2 'e6nicin de estimacin

(uando 6emos observado un valor num7rico espec.co de nuestro estimadorA nos referimos a ese
valor como una estimacin. En otras palabrasA una estimacin es un valor espec.co observado de
una estadstica. Vacemos una estimacin si tomamos una muestra y calculamos el valor 1ue toma
nuestro estimador en esa muestra. $upon3a 1ue calculamos la lectura media de un odmetro
B?ilometrajeC a partir de una muestra de ta<is en sevicio y encontramos 1ue 7sta es de 1-+A+++
?ilmetros. $i utili*amos este valor espec.co para estimar el ?ilometraje de la \otilla de ta<is
completaA el valor obtenido de 1-+A+++ ?ilmetros sera una estimacin. En la tabla ' ilustramos
varias poblacionesA par!metros de poblacinA estimadores y estimaciones.


3.3 (riterios para seleccionar un buen estimador

3.3.1 (ualidades de un buen estimador

@l3unas estadsticas son mejores estimadores 1ue otras. @fortunadamenteA podemos evaluar la
calidad de una estadstica como estimador mediante el uso de cuatro criterios:

1 . Imparcialidad. Ssta es una propiedad deseable para un buen estimador. El t7rmino
imparcialidad se re.ere al 6ec6o de 1ue una media de muestra es un estimador no sesgado de
una media de poblacin por1ue la media de la distribucin de muestreo de las medias de muestra
tomadas de la misma poblacin es i3ual a la media de la poblacin misma. Podemos decir 1ue una
estadstica es un estimador imparcial Bo no ses3adoC siA en promedioA tiende a tomar valores 1ue
est!n por encima del par!metro de

2abla '

la poblacin 1ue se est! estimando con la misma frecuencia y la misma e<tensin con la 1ue
tiende a asumir valores por debajo del par!metro de poblacin 1ue se est! estiman.

2. Eciencia. Otra propiedad deseable de un buen estimador es 1ue sea e.ciente. ,a e.ciencia
se re.ere al tama5o del error est!ndar de la estadstica. $i comparamos dos estadsticas de una
muestra del mismo tama5o y tratamos de decidir cu!l de ellas es un estimador m!s e.cienteA
esco3eramos la estadstica 1ue tuviera el menor error est!ndar o la menor desviacin est!ndar
de la distribucin de muestreo. $upon3a 1ue esco3emos una muestra de un tama5o determinado
y debemos decidir si utili*amos o no la media de la muestra para estimar la media de la poblacin.
$i calculamos el error est!ndar de la media de la muestra y encontramos 1ue es de 1.+% y lue3o
calculamos el error est!ndar de la mediana de la muestra y tenemos 1ue 7ste es de 1.-A diramos
1ue la media de la muestra es un estimador m!s e.ciente de la media de la muestra ya 1ue su
error est!ndar es menor. 2iene sentido pensar 1ue un estimador con un error est!ndar menor Bcon
menos variacinC tendr! una mayor oportunidad de producir una estimacin m!s cercana al
par!metro de poblacin 1ue se est! considerando.

19
3. !o"erencia. #na estadstica es un estimador co6erente de un par!metro de poblacin si al
aumentar el tama5o de la muestraA se tiene casi la certe*a de 1ue el valor de la estadstica se
apro<ima bastante al valor del par!metro de la poblacin. $i un estimador es co6erenteA se vuelve
m!s con.able si tenemos tama5os de muestra m!s 3randes. $i usted se pre3unta acerca de la
posibilidad de aumentar el tama5o de la muestra para obtener m!s informacin sobre un
par!metro de poblacinA encuentre primero si su estadstica es un estimador co6erente o no. $i
noA usted desperdiciar! tiempo y dinero al tomar muestras m!s 3randes.

#. $uciencia. #n estimador es su.ciente si utili*a una cantidad de la informacin contenida en
la muestra 1ue nin30n otro estimador podra e<traer informacin adicional de la muestra sobre el
par!metro de la poblacin 1ue se est! estimando.

Presentamos estos criterios con anticipacin para 6acerlo consciente del cuidado 1ue los
estadsticos deben tener a la 6ora de esco3er un estimador.

3.3.2 78s9ueda del mejor estimador

#na estadstica de muestra dada no siempre es el mejor estimador de su par!metro de estimador
poblacin correspondiente. (onsidere una poblacin distribuida de manera sim7tricaA en la
1ue los valores de la mediana y de la media coinciden. En este casoA la media de la muestra sera
un estimador imparcial de la mediana de la poblacin debido a 1ue asumira valores 1ue en
promedio seran i3uales a la mediana de la poblacin. 2ambi7nA la media de la muestra sera un
estimador consistente de la mediana de la poblacin puesto 1ueA conforme aumenta el tama5o de
la muestraA el valor de la meda de la muestra tender! a acercarse bastante a la mediana de la
poblacin. R la media de la muestra sera un estimador m!s e.ciente de la mediana de la
poblacin 1ue la mediana de la muestra mismaA ya 1ue en muestras 3randesA la media de la
muestra tiene una desviacin est!ndar menor 1ue la de la mediana de la muestra. @l mismo
tiempoA la mediana de la muestra de una poblacin distribuida sim7tricamente sera un estimador
imparcial y consistente de la media de la poblacinA pero no el m!s e.ciente estimador por1ue en
muestras 3randes su error est!ndar es mayor 1ue el de la media de la muestra.

3.! /ipos de estimacin

3.!.1 'e6nicin de estimacin puntual

Podemos 6acer dos tipos de estimaciones concernientes a una poblacin: una estimacin puntual
y una estimacin de intervalo. #na estimacin puntual es un solo n0mero 1ue se utili*a para
estimar un par!metro de poblacin desconocido. $iA mientras observamos al primer inte3rante de
un e1uipo de f0tbol americano salir al campo de jue3oA usted se dice: ]@nda^ @puesto a 1ue su
lnea defensiva pesar! unos 12% ?ilo3ramosA usted 6a 6ec6o una estimacin puntual. El jefe de
departamento de al3una universidad estara 6aciendo una estimacin puntual si a.rmara:
IKuestros datos actuales indican 1ue en esta materia tendremos 3%+ estudiantes en el si3uiente
semestreI.

3.!.2 'esventajas de las estimaciones puntuales

#na estimacin puntual a menudo resulta insu.cienteA debido a 1ue slo tiene dos opciones: es
correcta o est! e1uivocada. $i se nos dice solamente 1ue la a.rmacin del jefe de departamento
sobre la inscripcin est! e1uivocadaA usted no sabe 1u7 tanto est! malA y no puede tener la
certe*a de la con.abilidad de la estimacin. $i usted se entera de 1ue slo est! errada por 1+
estudiantesA podra aceptar a 3%+ estudiantes como una buena estimacin de la inscripcin futura.
Pero si est! e1uivocada en '+ estudiantesA podra usted rec6a*ar la estimacin por poco con.able.
En consecuenciaA una estimacin puntual es muc6o m!s 0til si viene acompa5ada por una
estimacin del error 1ue podra estar implicado.

3.!.3 'e6nicin de estimacin de intervalo

#na estimacin de intervalo es un intervalo de valores 1ue se utili*a para estimar de intervalo un
par!metro de poblacin. Esta estimacin indica el error de dos maneras: por la e<tensin del
intervalo y por la probabilidad de obtener el verdadero par!metro de la poblacin 1ue se
20
encuentra dentro del intervalo. En este casoA el jefe de departamento dira al3o como lo si3uiente:
Estimo 1ue la inscripcin real de este curso para el pr<imo semestre estar! entre 33+ y 38+A y es
muy probable 1ue la inscripcin e<acta cai3a dentro de este intervalo. 2iene una mejor idea de la
con.abilidad de su estimacin. $i el curso se imparte en 3rupos de 1++ estudiantes cada uno y siA
tentativamenteA 6a pro3ramado cinco cursosA entoncesA bas!ndose en su estimacinA puede
cancelar uno de tales 3rupos y dejarlo como optativo.

3.& Estimador ses1ado e inses1ado.

#n estimador puntual es el valor num7rico de una estadstica muestral empleado para estimar el
valor de un par!metro de la poblacin o proceso. #na de las caractersticas m!s importantes de un
estimador es 1ue sea insesgao. #n estimador inses1ado es una estadstica muestral cuyo valor
esperado es i3ual al par!metro por estimar. #n "alor esperao es el promedio a lar3o pla*o de la
estadstica muestral. ,a eliminacin de todo ses1o sistem!tico est! ase3urada cuando la
estadstica muestral corresponde a una muestra aleatoria tomada de una poblacin o a un
sub3rupo racional tomado de un proceso. @mbos m7todos de muestreo 3aranti*an 1ue la muestra
sea inses3adaA aun1ue no eliminan la variabilidad del muestreoA o error de muestreoA como se
e<plicar! en la si3uiente seccin.

En la tabla 1+ se presentan al3unos de los estimadores puntuales de par!metros de la poblacin
de uso m!s frecuente. En todos los casosA el estimador apropiado de un par!metro de la poblacin
es sencillamente la estadstica muestral correspondiente.

2abla 1+
21
!. Estimacin por intervalos

!.1 Intervalos de con6an,a para la diferencia entre dos medias con el uso de la
distribucin normal

@ menudo es necesario estimar la diferencia entre dos medias poblacionalesA como la diferencia
entre los niveles sal!riales de dos empresas. El estimador puntual inses3ado de B1 = 2C ($ B1= 2C .
El intervalo de con.an*a se elabora en forma similar al usado para la estimacin de la mediaA
e<cepto 1ue el error est!ndar pertinente para la distribucin de muestreo es el error est!ndar de
la diferencia entre medias. El uso de la distribucin normal se basa en las mismas condiciones 1ue
en el caso de la distribucin de muestreo de la mediaA salvo 1ue est!n implicadas dos muestras.
,a frmula empleada para estimar la diferencia entre dos medias poblacionales con intervalos de
con.an*a es



(uando se conocen las desviaciones est!ndar de las dos poblacionesA el error est!ndar de la
diferencia entre medias es
(uando se desconocen las desviaciones est!ndar de las poblacionesA el error est!ndar estimado
de la diferencia entre medias dado el uso apropiado de la distribucin normal es

,os valores de los errores est!ndar de las respectivas medias incluidos en estas frmulas se
calculan con las frmulas dadasA incluida la posibilidad de usar factores de correccin por .nitud
cuando corresponda

Ejemplo. El salario medio semanal de una muestra de n E 3+ empleados de una 3ran empresa
manufacturera esA ' E _28+.++A con una desviacin est!ndar muestral de s E _1.++. En otra
3ran empresaA una muestra aleatoria de n E + empleados por 6ora tiene un salario medio
semanal de _24+.++A con una desviacin est!ndar muestral de s E _1+.++. El intervalo de
con.an*a de ''F para la estimacin de la diferencia entre los niveles salariales medios semanales
de las dos empresas es
donde


@sA podemos a.rmar 1ue el salario promedio semanal de la primera empresa es mayor 1ue el
promedio de la se3unda Empresa por un monto de entre _2.23 y _14.44A con una con.an*a de
22
''F en esta estimacin por intervalo. @dvi7rtase 1ue los = tama5os de las muestras son
su.cientemente 3randes para permitir el uso de X para apro<imar el valor t.

@dem!s del intervalo de con.an*a de dos e<tremosA tambi7n puede elaborarse un intervalo de
con.an*a de un e<tremo =ara la diferencia entre medias.

!.2 'istribucin t e intervalos de con6an,a para la diferencia entre dos medias

El uso de la distribucin t en conjuncin con una muestra es necesario cuando

1 C $e desconocen las desviaciones est!ndar a de la poblacin.

2C ,as muestras son pe1ue5as Bn ` 3+C. $i las muestras son 3randesA los valores t pueden ser
apro<imados por la normal est!ndar *.

3C $e supone 1ue las poblaciones tienen una distribucin apro<imadamente normal Brecuerde 1ue
el teorema central del lmite no puede aplicarse en muestras pe1ue5asC.

@dem!s de lo anteriorA cuando se usa la distribucin t para de.nir intervalos de con.an*a para la
diferencia entre dos mediasA no para inferencias sobre slo una media poblacionalA por lo 3eneral
se re1uiere del si3uiente supuesto adicional:

C ,as dos varian*as poblacionales BdesconocidasC son i3ualesA a
2
1 E
2
2


@ causa del anterior supuesto de i3ualdadA el primer paso para determinar el error est!ndar de la
diferencia entre medias cuando procede el uso de la distribucin t es combinar las dos varian*as
muestrales:
El error est!ndar de la diferencia entre muestras basado en el uso de la varian*a combinada
estimada
2
es
(on gl E n1A W n2 = 2A el intervalo de con.an*a es
Nota% En cierto softaare de cmputo no se re1uiere el supuesto de 1ue las dos varian*as de la
poblacin sean i3uales. $e determina en cambio un valor corre3ido para los 3rados de libertadA lo
1ue resulta en menos 31A y esto a su ve* en un valor de t li3eramente mayor y en un intervalo de
con.an*a li3eramente m!s amplio.

E9EMP,+2. En relacin con una muestra aleatoria de n1AE 1+ focosA el ciclo medio de vida de los
focos es 1 E -++ 6orasA con s1A E 2%+ 6r. El ciclo medio de vida y la desviacin est!ndar de una
muestra de n2 E 8 focos de otra marca son 2 E +++ 6r R $2 E 2++ Vr. $e supone 1ue el ciclo de
vida de ambas marcas tiene una distribucin normal. El intervalo de con.an*a de '+F para
estimar la diferencia entre el ciclo medio de vida 0til de las dos marcas de focos es

23
@sA podemos a.rmar con una con.an*a de '+F 1ue la primera marca de focos tiene una vida
media superior a la de la se3unda marca en un monto de entre 1+ y 4'+ 6r.

Obs7rvese 1ue en el caso de dos muestras es posible 1ue 7stas sean pe1ue5as Bn ` 3+C y 1ue aun
as sea factible utili*ar la distribucin normal para apro<imar tA por1ue 3l _:2'. $in embar3oA en
este caso se debe partir del supuesto de 1ue las dos poblaciones si3uen una distribucin
apro<imadamente normalA dado 1ue es imposible apelar al teorema central del lmite respecto de
una muestra pe1ue5a.

!.3 Intervalos de con6an,a para la proporcin de la poblacin

,a distribucin de probabilidad aplicable a las proporciones es la distribucin binormial de
probabilidad. Ko obstanteA los c!lculos matem!ticos asociados con la determinacin de un
intervalo de con.an*a para una proporcin poblacional desconocida con base en el proceso de
/emoulli son complejos. Por lo tantoA en todos los libros de te<to orientados a aplicaciones se
utili*a la distribucin normal como apro<imacin de la solucin e<acta de intervalos de con.an*a
para proporciones. Esta apro<imacin es adecuada cuando n _ 3+ y tanto np como n1 % Bdonde _
1 E 1 = pC. $in embar3oA cuando la proporcin de la poblacin p Bo C es desconocidaA la mayora
de los e<pertos en estadstica recomienda tomar una muestra de n 1++. Ktese 1ueA en el _
conte<to de la estimacin estadsticaA es desconocidaA pero es estimada por bp. _

,a varian*a de la distribucin de proporciones sirve de base para el error est!ndar. &ada una
proporcin muestral observadaA bpA el error est!ndar de la proporcin estimado es
En el conte<to de la estimacin estadsticaA la p Bo C de la poblacin se desconoceA por1ue es
justamente el valor por estimar. $i la poblacin es por .nitudA procede el uso del factor de
correccin por .nitud. (omo en el caso del error est!ndar de la mediaA por lo 3eneral se considera
innecesario el uso de esta correccin si n ` +.+% K.

El intervalo de con.an*a apro<imado para una proporcin poblacional es
@dem!s del intervalo de con.an*a de dos e<tremosA tambi7n puede determinarse un intervalo de
con.an*a de un e<tremo para la proporcin poblacional.

Ejemplo. #na empresa de investi3acin de mercado contacta a una muestra aleatoria de 1++
varones en una comunidad e<tensa y determina 1ue una proporcin muestral de +.+ pre.ere las
navajas de afeitar fabricadas por el cliente de esa empresa sobre todas las dem!s marcas. El
intervalo de con.an*a de '%F para la proporcin de todos los varones de la comunidad 1ue
pre.eren las navajas de afeitar del cliente de la empresa se determina de la si3uiente manera:

24
Por lo tantoA con una con.an*a de '%F estimamos la proporcin de todos los varones de la
comunidad 1ue pre.eren las navajas del cliente de la empresa con un valor entre +.3+ y +.%+.

!.! 'eterminacin del tama:o de muestra re9uerido para la estimacin de la
proporcin

@ntes de recolectada una muestraA el tama5o de muestra mnimo re1uerido puede determinarse
especi.cando el nivel de con.an*a re1uerido y el error de muestreo aceptable y 6aciendo una
estimacin inicial BsubjetivaC de A la proporcin poblacional desconocida:

* es el valor usado para el intervalo de confian*a especificadoA es la estimacin inicial de la
proporcin poblacional y E es el error de muestreo Ide m!s o de menosI permitido en el intervalo
Bsiempre la mitad del intervalo de con.an*a completoC.

$i no es posible determinar un estimado inicial de A se le deber! estimar en +.%+. Esta
estimacin es conservadora en tanto 1ue representa el valor para el 1ue se re1uerira del tama5o
de muestra mayor. (on base en este supuestoA la frmula 3eneral para el tama5o de muestra se
simpli.ca en esta forma:
ZNota: (uando se busca determinar el tama5o de muestraA todo resultado fraccionario se
redondea siempre al valor inmediato superior. @dem!sA todo tama5o de muestra calculado por
debajo de 1++ se debe incrementar a 1++A por1ue las frmulas se basan en el uso de la
distribucin normal.[

Ejemplo% En referencia al estudio mencionado en el ejemplo anteriorA supon3amos 1ue con
anterioridad ala recoleccin de los datos se especi.c 1ue la estimacin del intervalo de '%F
deba tener un mar3en de error inferior a Y +.+% y 1ue no se 6i*o juicio preliminar al3uno sobre el
probable valor de . El tama5o de muestra mnimo por recolectar es
@parte de estimar la proporcin de la poblacinA tambi7n puede estimarse el n0mero total en una
cate3ora de la poblacin.


!.& Intervalos de con6an,a para la diferencia entre dos proporciones

Para estimar la diferencia entre las proporciones de dos poblacionesA el estimador puntual
inses3ado de B1 = 2 C es Bp1 c p2C. El intervalo de con.an*a implica el uso del error est!ndar de la
diferencia entre proporciones. El uso de la distribucin normal se basa en las mismas condiciones
1ue las e<puestas en relacin con la distribucin de muestreo de la proporcinA salvo 1ue este
caso involucra a dos muestras y los re1uerimientos se aplican a cada una de ellas. El intervalo de
con.an*a para la estimacin de la diferencia entre dos proporciones poblacionales es
El error est!ndar de la diferencia entre proporciones se determina por medio de la frmulaA en la
1ue el valor de cada respectivo error est!ndar de la proporcin se calcula tal como se describi:
Ejemplo% (omo se indic 1ue una proporcin de +.+ varones de una muestra aleatoria de 1++ de
una comunidad e<tensa pre.ri las navajas de afeitar del cliente de la empresa sobre todas las
25
dem!s. En otra comunidad e<tensaA -+ varones de una muestra aleatoria de 2++ pre.eren las
navajas del cliente de la empresa. El intervalo de con.an*a de '+F para la diferencia en la
proporcin de varones de las dos comunidades 1ue pre.eren las navajas del cliente de la empresa
es


!.; 'istribucin ji cuadrada e intervalos de con6an,a para la varian,a y desviacin
est"ndar

&ada una poblacin de valores con distribucin normalA puede demostrarse 1ue las distribuciones
T
2
9i cuadradaC son las distribuciones de probabilidad adecuadas para la ra*n Bn = 1C s
2
Q
__
. Vay
una distribucin Ji cuadrada diferente se30n el valor de n =1A lo cual representa los 3rados de
libertad. @sA
&ado 1ue la varian*a muestral es el estimador inses3ado de la varian*a poblacionalA el valor
esperado a lar3o pla*o de la ra*n anterior es i3ual a los 3rados de libertadA o n = 1. $in embar3oA
en cual1uier muestra dada por lo 3eneral la varian*a muestral no es id7ntica en valor a la varian*a
poblacional. Puesto 1ue se sabe 1ue la ra*n anterior si3ue una distribucin ji cuadradaA esta
distribucin de probabilidad puede servir para la reali*acin de inferencias estadsticas sobre una
varian*a o desviacin est!ndar desconocida.

,as distribuciones ji cuadrada no son sim7tricas. En consecuenciaA un intervalo de con.an*a de
dos e<tremos para una varian*a o desviacin est!ndar implica el uso de dos valores diferentes de
T
2
A no del m7todo Ide m!s o de menosI utili*ado en los intervalos de con.an*a basados en las
distribuciones normal y t. ,a frmula para la elaboracin de un intervalo de con.an*a para la
varian*a de la poblacin es
El intervalo de con.an*a para la desviacin est!ndar de la poblacin es
En la anterior frmula 3eneralA los subndices IsuperiorI e IinferiorI identi.can los puntos
percentiles de la distribucin T
2
particular por usar en la elaboracin del intervalo de con.an*a.
Por ejemploA para un intervalo de con.an*a de '+F el punto superior es T
2
+.'% y el punto inferior
26
T
2
+.+% . @l e<cluir el %F mayor y el %F menor de la distribucin ji cuadradaA lo 1ue resta es el '+F
IcentralI.

Ejemplo. El salario medio semanal de una muestra de 3+ empleados por 6orade una 3ran empresa
es E _28+.++A con una desviacin est!ndar muestral de s E _1.++. $e supone 1ue los montos
salariales semanales de la empresa tienen una distribucin apro<imadamente normal. El intervalo
de con.an*a de '%F para estimar la desviacin est!ndar de los salarios semanales de la
poblacin es


En relacin con el ejemplo anteriorA rep!rese en el 6ec6o de 1ueA dado 1ue los encabe*ados son
probabilidades de la cola derec6a m!s 1ue valores percentilesA los encabe*ados de columnas 1ue
aparecen en la tabla se re.eren a los valores complementarios de los valores percentiles superior
e inferior re1ueridos.

(omo alternativa a un intervalo de con.an*a de dos e<tremosA tambi7n puede determinarse un
intervalo de con.an*a de un e<tremo para la varian*a o desviacin est!ndar.

&. Pruebas de <iptesis param=tricas

&.1 Introduccin

El propsito de la prueba de 6iptesis es determinar si el valor supuesto B6ipot7ticoC de un
par!metro poblacionalA como la media de la poblacinA debe aceptarse como verosmil con base
en evidencias muestrales. Gecu7rdese 1ue sobre distribuciones de muestreoA se dijo 1ueA en
3eneralA una media muestral diferir! en valor de la media poblacional. $i el valor observado de
una estadstica muestralA como la media muestralA se acerca al valor param7trico supuesto y slo
di.ere de 7l en un monto 1ue cabra esperar del muestreo aleatorioA el valor 6ipot7tico no se
rec6a*a. $i la estadstica muestral di.ere de la supuesta en un monto 1ue no es posible atribuir al
a*arA la 6iptesis se rec6a*a por inverosmil.

$e 6an desarrollado tres procedimientos distintos para la prueba de 6iptesisA todos los cuales
conducen a las mismas decisiones cuando se emplean los mismos est!ndares de probabilidad By
ries3oC. En este captulo describiremos primeramente el m7todo del valor crtico para la prueba de
6iptesis. &e acuerdo con este m7todoA se determinan los as llamados valores crticos de la
estadstica de prueba 1ue dictaran el rec6a*o de una 6iptesisA tras de lo cual la estadstica de
prueba observada se compara con los valores crticos. Sste fue el primer m7todo en desarrollarseA
motivo por el cual buena parte de la terminolo3a de las pruebas de 6iptesis se deriva de 7l. M!s
recientementeA el m7todo del valor P 6a cobrado popularidad a causa de ser el m!s f!cilmente
aplicable a softaare de cmputo. Este m7todo se basa en la determinacin de la probabilidad
condicional de 1ue el valor observado de una estadstica muestral pueda ocurrir al a*arA dado 1ue
un supuesto particular sobre el valor del par!metro poblacional asociado sea en efecto correcto. El
m7todo de intervalos de con.an*a se basa en la observacin de si el valor supuesto de un
par!metro poblacional est! incluido en el ran3o de valores 1ue de.ne a un intervalo de con.an*a
para ese par!metro.

Pero m!s all! del m7todo de prueba de 6iptesis 1ue se useA debe 6acerse notar 1ue si un valor
6ipot7tico no se rec6a*aA y por lo tanto se aceptaA ello no constituye una IpruebaI de 1ue sea
27
correcto. ,a aceptacin de un valor supuesto de un par!metro indica simplemente 1ue se trata de
un valor verosmilA con base en el valor observado de la estadstica muestral.

&.2 Pasos b"sicos de la prueba de <iptesis con el m=todo de valor crtico

Paso1. "ormule la 6iptesis nula y la 6iptesis alternativa. ,a 6iptesis nula BV+ es el valor
param7trico 6ipot7tico 1ue se compara con el resultado muestral. $e le rec6a*a slo si es poco
probable 1ue el resultado muestral 6aya ocurrido dado lo correcto de la 6iptesis. ,a 6iptesis
alternativa BV1C se acepta slo si la 6iptesis nula es rec6a*ada. En muc6os libros de te<to la
6iptesis alternativa tambi7n se desi3na como Va.

Ejemplo #n auditor desea probar el supuesto de 1ue el valor medio de la totalidad de las cuentas
por cobrar de una empresa dada es de _2-+.++ tomando una muestra de n E 3- y calculando la
media muestral. El auditor desea rec6a*ar el valor supuesto de _2-+.++ slo si es claramente
contradic6o por la media muestralA caso 7ste en el 1ue el valor 6ipot7tico recibira el bene.cio de
la duda en el procedimiento de prueba. ,as 6iptesis nula y alternativa de esta prueba son V+ :& E
_2-+.++ y V1 : &' _2-+.++.

Paso 2. Especi.1ue el nivel de si3ni.cancia por aplicar. El nivel de si3ni.cancia es el est!ndar
estadstico 1ue se especi.ca para rec6a*ar la 6iptesis nula. $i se especi.ca un nivel de
si3ni.cancia de %FA la 6iptesis nula se rec6a*a slo si el resultado muestral es tan diferente del
valor 6ipot7tico 1ue una diferencia por ese monto o un monto superior ocurrira al a*ar con una
probabilidad de +.+% o menos.

Ktese 1ue si se usa el nivel de si3ni.cancia de %FA 6ay una probabilidad de +.+% de rec6a*ar la
6iptesis nula aun siendo efectivamente cierta. Esto se llama error tipo I ,a probabilidad del error
tipo I siempre es i3ual al nivel de si3ni.cancia empleado como est!ndar para rec6a*ar la 6iptesis
nulaJ se le desi3na con la letra 3rie3a min0scula BalfaCA de modo 1ue a desi3na tambi7n al nivel
de si3ni.cancia. ,os niveles de si3ni.cancia de uso m!s frecuente en la prueba de 6iptesis son
los de %F y 1F.
Ocurre un error tipo II si la 6iptesis nula no se rec6a*aA y es por lo tanto aceptadaA cuando en
realidad es falsa. ,a determinacin de la probabilidad del error tipo II se e<plica. En la tabla
correspondiente se resumen los tipos de decisiones y las posibles consecuencias de las decisiones
tomadas en pruebas de 6iptesis.

Paso 3. $eleccione la estadstica de prueba. ,a estadstica de prueba ser! ya sea la estadstica
muestral Bel estimador inses3ado del par!metro a pruebaC o una versin estandari*ada de la
estadstica muestral. Por ejemploA para probar un valor 6ipot7tico de la media poblacionalA la
media de una muestra aleatoria tomada de esa poblacin podra servir como la estadstica de
prueba. $in embar3oA si la distribucin de muestreo de la media es normalA el valor de la media
muestral se convierte usualmente en un valor *A el cual fun3e entonces como la estadstica de
prueba.

Paso . Estable*ca el valor o valores crticos de la estadstica de prueba. Vabiendo especi.cado la
6iptesis nulaA el nivel de si3ni.cancia y la estadstica de prueba por usarA se establece entonces
elBlosC valorBesC crticoBsC de la estadstica de prueba. Estos valores pueden ser uno o dosA
dependiendo de si est!n implicadas las as llamadas pruebas unilaterales o bilaterales. En
cual1uier casoA un valor crtico identi.ca el valor de la estadstica de prueba re1uerido para
rec6a*ar la 6iptesis nula.

Paso %. &etermine el valor de la estadstica de prueba. Por ejemploA al probar un valor 6ipot7tico
de la media poblacionalA se recolecta una muestra aleatoria y se determina el valor de la media
muestral. $i el valor crtico fue establecido como un valor *A la media muestral se convierte a un
valor *.

Paso -. 2ome la decisin. El valor observado de la estadstica muestral se compara con el valor Bo
valoresC crticoBsC de la estadstica de prueba. $e rec6a*a o no entonces la 6iptesis nula. $i la
6iptesis nula es rec6a*adaA se acepta la 6iptesis alternativa. Esta decisin tendr! relevancia a
su ve* para otras decisiones por tomar por los 3erentes de operacinA como la de si se est!
28
sosteniendo o no cierto est!ndar de desempe5o o cu!l de dos estrate3ias de comerciali*acin
se3uir.

&.3 Prueba de una <iptesis referente a la media usando la distribucin normal

,a distribucin normal de probabilidad puede usarse para probar un valor 6ipot7tico de la media
de la poblacin 1C si n E 3+A por efecto del teorema central del lmiteA o 2C cuando n ` 3+ pero la
poblacin tiene una distribucin normal y a es conocida.

&na prueba bilateral se aplica cuando nos interesa una posible desviacin en cual1uier
direccin respecto del valor 6ipot7tico de la media. ,a frmula 1ue se emplea para establecer los
valores crticos de la media muestral es similar a la frmula para determinar los lmites de
con.an*a para la estimacin de la media de la poblacinA e<cepto 1ue el valor 6ipot7tico de la
media poblacional ' es en este caso el punto de referenciaA en lu3ar de la media muestral. ,os
valores crticos de la media muestral para una prueba de dos e<tremosA de acuerdo con el 6ec6o
de si se conoce o noA son
Ejemplo. En relacin con la 6iptesis nula formulada en el ejemplo anteriorA determine los valores
crticos de la media muestral para probar la 6iptesis al nivel de si3ni.cancia del %F. &ado 1ue se
sabe 1ue la desviacin est!ndar de los montos de las cuentas por cobrar es _E _3.++A los
valores crticos son

Viptesis: V+ : E _2-+.++J ViA : d _2-+.++

Kivel de si3nificancia: eE +.+%

Estadstica de prueba:< A con base en una muestra de n E 3- y con ( E 3.++

(G E valores crticos de la media muestral
En consecuenciaA para rec6a*ar la 6iptesis nula la media muestral debe tener un valor inferior a
_2%.'% o superior a _24.+%. @sA en el caso de una prueba de dos e<tremos e<isten dos re3iones
de rec6a*o. ,os valores * de Y1.'- sirven para establecer los lmites crticosA dado 1ueA por efecto
de la distribucin normal est!ndarA una proporcin de +.+% del !rea permanece en las dos colasA lo
1ue corresponde a la e E +.+% especi.cada.
"i3.

En lu3ar de establecer los valores crticos en t7rminos de la media muestralA en la prueba de
6iptesis los valores crticos suelen especi.carse en t7rminos de valores *. Para el nivel de
si3ni.cancia del %F los valores crticos de * para una prueba de dos e<tremos son =1.'- y W 1 .'-A
por ejemplo. #na ve* determinado el valor de la media muestralA se le convierte a un valor * para
29
1ue pueda compar!rsele con los valores crticos de *. ,a frmula de conversinA se30n si ores
conocida o noA es


Ejemplo. En referencia al problema de prueba de 6iptesis de los dos ejemplos anterioresA
supon3amos 1ue la media muestral es E _2+.++. &eterminamos si la 6iptesis nula debe
rec6a*arse convirtiendo esta media a un valor * y compar!ndolo con los valores crticos de Y1.'-A
en esta forma:

Este valor de * se 6alla en la re3in de rec6a*o de la cola i*1uierda del modelo de prueba de
6iptesis 1ue aparece en la .3ura %. &e este modoA la 6iptesis nula es rec6a*adaA y la
alternativaA de 1ue '__ _2-+.++A aceptada. @dvi7rtase 1ue en el ejemplo se 6abra lle3ado a la
misma conclusin comparando la media muestral E _2+.++ con los lmites crticos para la media
identi.cados en la .3ura .

"i3. %

#na prueba unilateral resulta apropiada cuando nos interesan posibles desviaciones slo en una
direccin respecto del valor 6ipot7tico de la media. Podra ocurrir 1ue al auditor del ejemplo no le
interesara 1ue el promedio real de la totalidad de las cuentas por cobrar e<ceda de _2-+.++A sino
slo 1ue pudiera ser inferior a _2-+.++. @sA si el auditor le concede el bene.cio de la duda al
supuesto establecido de 1ue la media real es de al menos _2-+.++A las 6iptesis nula y alternativa
son
Kota: En muc6os libros de te<toA la 6iptesis nula anterior se enunciara como VO:
'__ _2-+.++. Por nuestra parteA 6emos incluido 0nicamente el si3no de i3ual por1ueA incluso __
en una prueba de un e<tremoA el procedimiento se reali*a en relacin con este valor en particular.
Para decirlo de otra maneraA es la 6iptesis alternativa la 1ue es unilateral.

En una prueba unilateral slo e<iste una re3in de rec6a*oA de modo 1ue la prueba del ejemplo
anterior es una prueba de la cola inferior. ,a re3in de rec6a*o de una prueba unilateral se
encuentra siempre en la cola 1ue representa el sustento de la 6iptesis alternativa. (omo en el
caso de una prueba bilateralA el valor crtico puede determinarse para la media como tal o en
t7rminos de un valor *. $in embar3oA los valores crticos para pruebas unilaterales se diferencian
de a1uellos para pruebas bilateralesA por1ue la proporcin de !rea dada se 6alla en su totalidad en
una de las colas de la distribucin. En la tabla 11 se presentan los valores de * necesarios para
pruebas unilaterales y bilaterales. ,a frmula 3eneral para establecer el valor crtico de la media
muestral para una prueba unilateralA se30n si a se conoce o noA es
30
Obs7rvese en las frmulas inmediatamente anterioresA 1ue * puede ser ne3ativaA lo 1ue resulta en
una sustraccin del se3undo t7rmino de cada frmula.
2abla 11 )alores crticos de X en pruebas de 6iptesis

&.! Errores /ipo I y /ipo II en pruebas de <iptesis

En esta seccin consideraremos los errores tipo I y tipo II en relacin estrictamente con pruebas
unilaterales de una media 6ipot7tica. $in embar3oA los conceptos b!sicos a1u ilustrados se
aplican tambi7n a otros modelos de pruebas de 6iptesis.

,a probabilidad m!<ima del error tipo I siempre es i3ual al nivel de si3ni.cancia empleado en la
prueba de la 6iptesis nula. Esto es as a causa de 1ueA por de.nicinA la proporcin de !rea en la
re3in de rec6a*o es i3ual a la proporcin de los resultados muestrales 1ue ocurriran en esa
re3in en caso de 1ue la 6iptesis nula sea cierta.

,a probabilidad del error tipo II suele indicarse con la letra 3rie3a _ BbetaC. ,a 0nica manera en
1ue se te puede determinar es respecto de un valor especi.co incluido en el ran3o de la 6iptesis
alternativa.

Ejemplo. ,a 6iptesis nula es 1ue la media de la totalidad de las cuentas por cobrar es de _2-+.++
y la 6iptesis alternativa 1ue la media es inferior a esta cantidadA prueba 1ue 6abr! de reali*arse
al nivel de si3ni.cancia de %F. @dem!sA el auditor indica 1ue una media de _2+.++ Bo menosC
sera considerada una diferencia material importante con el valor 6ipot7tico de _2-+.++. (omo en
el caso anteriorA E _3.++ y el tama5o de muestra es n E 3- cuentas. ,a determinacin de la
probabilidad del error tipo II implica 1ue

1C formulemos las 6iptesis nula y alternativa para esta situacin de pruebaA

2C determinemos el valor crtico de la media muestral por emplearen la prueba de la 6iptesis nula
al nivel de si3ni.cancia de %FA

3C identi.1uemos la probabilidad de error tipo I asociada con el uso del valor crtico calculado en el
paso anterior como base para la re3la de decisinA

C determinemos la probabilidad de error tipo II asociada con la re3la de decisin dado el valor
medio alternativo espec.co de _2+.++.

,a solucin completa es

31

3C ,a probabilidad m!<ima de error tipo 1 es i3ual a +.+% Bel nivel de si3ni.cancia usado en la
prueba de la 6iptesis nulaC.

C ,a probabilidad de error tipo II es la probabilidad de 1ue la media de la muestra aleatoria
sea i3ual o mayor de _28.21A dado 1ue la media de la totalidad de las cuentas en realidad
_2+.++.

En la .3ura - se ilustra el m7todo se3uido en el ultimo ejemplo. En 3eneralA el valor crtico de la
media determinado en relacin con la 6iptesis nula se IreduceI y se emplea como el valor crtico
en relacin con la 6iptesis alternativa espec.ca. El problema ilustra la determinacin de la
probabilidad del error tipo II en una prueba bilateral.

"i3. -

(uando el nivel de si3ni.cancia y el tama5o de muestra se mantienen constantesA la probabilidad
del error tipo II disminuye a medida 1ue el valor alternativo espec.co de la media se aleja del
valor de la 6iptesis nula y aumenta a medida 1ue el valor alternativo se acerca al valor de la
6iptesis nula. #na curva caracterstica operativa B(+C describe 3r!.camente la probabilidad de
aceptar la 6iptesis nula dados diversos valores alternativos de la media de la poblacin. ,a .3ura
es la curva (O aplicable a cual1uier prueba de cola inferior de una media 6ipot7tica al nivel de
si3ni.cancia de %F basada en el uso de la distribucin normal de probabilidad. Ktese 1ue es
aplicable a cual1uier prueba de este tipoA por1ue los valores del eje 6ori*ontal 6an sido
enunciados en unidades del error est!ndar de la media. Para cuales1uiera valores a la i*1uierda de
' la probabilidad de aceptacin indica la probabilidad del error tipo II. @ la derec6a de 'A las
probabilidades indican la aceptacin correcta de la 6iptesis nula. 2al como lo indican las lneas
punteadasA cuando $ '_ 'A la probabilidad de aceptar la 6iptesis nula es 1= oA en este casoA 1
= +.+% E +.'%.

32

"i3. 4

&.& 'eterminacin del tama:o de muestra re9uerido para probar la media

@ntes de la efectiva recoleccin de una muestraA el tama5o de muestra re1uerido puede
determinarse especi.cando 1C el valor 6ipot7tico de la mediaA 2C un valor alternativo espec.co de
la media tal 1ue la diferencia con el valor 6ipot7tico nulo se considere importanteA 3C el nivel de
si3ni.cancia por emplear en la pruebaA C la probabilidad del error tipo II 1ue 6abr! de permitirse y
%C el valor de la desviacin est!ndar de la poblacin .

,a frmula para determinar el tama5o de muestra mnimo re1uerido en conjuncin con la prueba
de un valor 6ipot7tico de la mediaA con base en el uso de la distribucin normalA es

*+ es el valor crtico de * usado en conjuncin con el nivel de si3ni.cancia especi.cado Bnivel de
CA mientras 1ue *1 es el valor de * respecto de la probabilidad del error tipo II asi3nada Bnivel de
_C. El valor de _debe conocerse o estimarse. ,a ultima frmula puede emplearse lo mismo para
pruebas unilaterales 1ue bilaterales. El 0nico valor 1ue di.ere en estos dos tipos de pruebas es el
valor de *+ utili*ado.

ZKota: (uando se busca determinar el tama5o de muestra mnimoA todo resultado fraccionario se
redondea siempre al valor inmediato superior. @dem!sA a menos 1ue sea conocida y la
poblacin ten3a una distribucin normalA todo tama5o de muestra calculado por debajo de 3+
debe aumentar a 3+A basado en el uso de la distribucin normal.[

&.; Prueba de una <iptesis referente a la media usando la distribucin t

,a distribucin t es la base adecuada para la determinacin de la estadstica de prueba
estandari*ada cuando la distribucin de muestreo de la media tiene una distribucin normal pero
es desconocida. Puede suponerse 1ue la distribucin de muestreo es normal ya sea por1ue la
poblacin es normal o por1ue la muestra es su.cientemente 3rande para apelar al teorema
central del lmite. $e re1uiere de la distribucin t cuando la muestra es pe1ue5a Bn ` 3+C. Para
muestras m!s 3randes puede usarse la apro<imacin normal. En cuanto al m7todo del valor
crticoA el procedimiento es id7ntico al descrito anteriormente para la distribucin normalA e<cepto
por el uso de t en lu3ar de * como la estadstica de prueba. ,a estadstica de prueba es
Ejemplo. ,a 6iptesis nula de 1ue el ciclo medio de vida 0til de los focos de cierta marca es de
2++ 6oras se formula contra la alternativa de 1ue es menor. El cielo medio de vida 0til de una
muestra aleatoria de n E 1+ focos es E +++ 6rA con una desviacin est!ndar muestral de s E
33
2++ 6r. $e supone 1ueA en 3eneralA el ciclo de vida 0til de los focos si3ue una distribucin normal.
Probamos la 6iptesis nula al nivel de si3ni.cancia de %F de la si3uiente manera:
&ado 1ue =3.1- se 6alla en la re3in de rec6a*o de la cola i*1uierda Ba la i*1uierda de[ valor crtico
=1.833CA la 6iptesis nula es rec6a*ada y la 6iptesis alternativaA de 1ue el ciclo medio de vida 0til
real es menor de 2++ 6rA aceptada.


&.> =todo del valor P para pruebas de <iptesis referentes a la media de la poblacin

,a probabilidad de 1ue ocurra el resultado muestral observadoA dado 1ue la 6iptesis nula es
ciertaA se determina por medio del m7todo del valor PA probabilidad 1ue se compara despu7s con
el nivel de si3ni.cancia a asi3nado. En consonancia con el m7todo del valor crtico 1ue
describimos en las secciones anterioresA la idea es 1ue un valor P bajo indica 1ue es poco probable
1ue la muestra ocurra cuando la 6iptesis nula es ciertaJ por lo tantoA la obtencin de un valor P
bajo conduce al rec6a*o de la 6iptesis nula. @dvi7rtase 1ue el valor P no es la probabilidad de
1ue la 6iptesis nula sea cierta dado el resultado muestral. EsA en cambioA la probabilidad del
resultado muestral dado 1ue la 6iptesis nula es cierta.

Ejemplo. Gemtase al ejemplo anteriorA en el 1ue V+ : 'E _2-+.++A V1 : '_` _2-+.++A _E +.+% y
E _2+.++. Puesto 1ue en esta prueba unilateral la media muestral se 6alla en la direccin de la
6iptesis alternativaA determinamos la probabilidad de 1ue una media muestral ten3a un valor tan
pe1ue5o como 7ste o a0n menor:
En la .3ura 8 se describe 3r!.camente el !rea de la cola i*1uierda para la 1ue se 6a determinado
la probabilidad. &ado 1ue el valor P de +.++2- es menor 1ue el nivel de si3ni.cancia asi3nado de
E +.+%A se rec6a*a la 6iptesis nula.
"i3. 8
En pruebas bilateralesA se determina el valor P de la cola m!s pe1ue5a de la distribucinA tras de
lo cual se le duplica. El valor resultante indica la probabilidad del monto de diferencia observado
en cual1uier direccin entre los valores de la media muestral y la media poblacional 6ipot7tica.

34
El m7todo del valor P debe su difusin al 6ec6o de 1ue el formato est!ndar de los resultados en
computadora de pruebas de 6iptesis incluye valores P. El lector de los resultados determina si se
rec6a*a una 6iptesis nula comparando el valor P reportado con el nivel de si3ni.cancia deseado.

(uando se re1uiere de c!lculos manuales de probabilidades basadas en el uso de la distribucin t
es imposible determinar un valor P e<actoA a causa de las limitaciones de la tabla est!ndar. En
cambioA el uso de softaare de cmputo no implica nin3una limitacin de esta clase.

&.? =todo de intervalos de con6an,a para pruebas de <iptesis referentes a la media

&e acuerdo con este m7todo se elabora un intervalo de con.an*a para la media de la poblacin
con base en los resultados muestralesA tras de lo cual observamos si el valor 6ipot7tico de la
media poblacional est! incluido en el intervalo de con.an*a. $i el valor 6ipot7tico est! incluido en
el intervaloA la 6iptesis nula no puede ser rec6a*ada. $i el valor 6ipot7tico no est! incluido en el
intervaloA la 6iptesis nula se rec6a*a. (uando a es el nivel de si3ni.cancia por utili*ar en la
pruebaA se elabora el intervalo de con.an*a 1 = .

Ejemplo. Gemtase al ejemplo anteriorA en el 1ue V+ : ' E _2-+.++A V1A : '______2-+.++A E
+.+%A E _2+.++ y E 4.14. Podemos probar la 6iptesis nula al nivel de si3ni.cancia de %F
elaborando el intervalo de con.an*a de '%F:
&ado 1ue el valor 6ipot7tico de _2-+.++ no est! incluido en el intervalo de con.an*a de '%FA la
6iptesis nula se rec6a*a al nivel de si3ni.cancia de %F.

Para una prueba de una cola lo apropiado es un intervalo de con.an*a unilateral. $in embar3oA un
m7todo m!s simple consiste en determinar un intervalo bilateralA pero al nivel de con.an*a 1ue
incluira el !rea deseada en la cola de inter7s. Espec.camenteA para una prueba unilateral con
_ E +.+% lo apropiado es el intervalo de con.an*a bilateral de '+FA por1ue este intervalo
incluye el !rea de +.+% en la cola de inter7s.

El m7todo de intervalos de con.an*a es favorecido en libros de te<to 1ue enfati*an el llamado
m7todo de an!lisis de datos para la estadstica aplicada a la administracin y la economa. En el
!rea de la estadstica descriptivaA el m7todo de an!lisis de datos concede especial atencin al
an!lisis e<ploratorio de datos. En el !rea de la inferencia estadsticaA la .losofa del m7todo de
an!lisis de datos es 1ue a los administradores les interesan m!s la estimacin y los intervalos de
con.an*a referentes a par!metros desconocidos Bcomo el incierto nivel de ventas de un nuevo
productoC 1ue los conceptos de las pruebas de 6iptesis.

&.@ Pruebas respecto de la media del proceso en el control estadstico de procesos
El uso e interpretacin de 3r!.cas de control en el control estadstico de procesos es una
aplicacin directa de los m7todos y conceptos de la prueba de 6iptesis. ,a 6iptesis nula es 1ue
el proceso es estable y 1ue slo e<isten causas comunes de variacin. ,a 6iptesis alternativa es
1ue el proceso es inestable e incluye variacin por causas atribuibles. El m7todo 1ue se emplea
para la prueba de 6iptesis es el m7todo del valor crticoA sobre la norma de 1ue los lmites de
control inferior y superior Bi3uales a los Ivalores crticosI del presente captuloC se de.nen en Y3
unidades de error est!ndar respecto de la media 6ipot7tica del proceso.

Ejemplo. $e presenta una secuencia de pesos medios para muestras de n E pa1uetes de papas
fritas tomadas en un proceso de empacamiento. $upon3amos 1ue las especi.caciones del proceso
demandan un peso medio de E 1%.+ on*as. Podra inducir la pre3unta de si esta norma se
mantiene a lo lar3o de todo el procesoA y particularmente en las muestras f8 y f'. En los
problemas anteriores observaremos 1ue estas dos medias muestrales se 6allan m!s all! del lmite
de control inferior y 1ue es poco probable 1ue 6ayan ocurrido debido simplemente a variacin por
causas comunes. En consecuenciaA rec6a*aremos la 6iptesis nula de 1ue la media del proceso en
el periodo 6a sido de 1%.+ y concluiremos 1ue e<isten slidas evidencias de variacin por causas
atribuibles respecto de la media del proceso.

&.1A /abla de resumen de la prueba de un valor <ipot=tico de la medida
35

2abla 12 Prueba de un valor 6ipot7tico de la media
U $e aplica el teorema central del lmite.
UU * se utili*a como apro<imacin de t.
W $e aplica el teorema central del lmite y * se utili*a como apro<imacin de t.
&.11 Pruebas de la diferencia entre dos medidas usando la distribucin normal

El procedimiento asociado con la prueba de una 6iptesis referente a la diferencia entre dos
medias de la poblacin es similar al de la prueba de una 6iptesis referente al valor de una media
poblacional. $lo di.ere en 1ue el error est!ndar de la diferencia entre las medias se usa para
determinar el valor * Bo tC asociado con el resultado muestral. El uso de la distribucin normal se
basa en las mismas condiciones 1ue en el caso de una muestraA e<cepto 1ue est!n implicadas dos
muestras aleatorias independientes. ,a frmula 3eneral para determinar el valor * para probar una
6iptesis referente a la diferencia entre dos mediasA se30n si los valores _ para las dos
poblaciones son conocidosA es

(omo se deduceA podemos comen*ar con cual1uier diferencia 6ipot7tica particularA B1 2C+A por
probar. $in embar3oA la 6iptesis nula usual es 1ue las dos muestras se 6an obtenido de
poblaciones con medias i3uales. En este casoA B 1 2C+ E +A de modo 1ue las frmulas anteriores
se simpli.can de la si3uiente manera:
En 3eneralA el error est!ndar de la diferencia entre medias se calcula tal como se describi. Ko
obstanteA al probar la diferencia entre dos medias por lo 3eneral la 6iptesis nula de inter7s no es
slo 1ue las medias muestrales se obtuvieron de poblaciones con medias i3ualesA sino tambi7n
1ueA en realidadA las dos muestras se obtuvieron de la misma poblacin de valores. Esto si3ni.ca
1ue 1 2) lo 1ue podemos desi3nar sencillamente como . ,a supuesta varian*a com0n suele
estimarse mediante la combinacin de las dos varian*as muestralesA tras de lo cual el valor
36
estimado de
2
sirve como base para el error est!ndar de la diferencia. ,a estimacin combinada
de la varian*a de la poblacin es
El error est!ndar estimado de la diferencia basado en el supuesto de 1ue las desviaciones
est!ndar By las varian*asC de la poblacin son i3uales es
El supuesto mismo de 1ue las dos varian*as muestrales se obtuvieron de poblaciones con
varian*as i3uales puede probarse como la 6iptesis nula. ,as pruebas referentes a la diferencia
entre medias pueden ser bilaterales o unilateralesA como se ilustra en los si3uientes ejemplos.

Ejemplo. El salario medio semanal de una muestra de n1 E 3+ empleados de una 3ran empresa
manufacturera es 1A E _28+.++A con una desviacin est!ndar muestral de s1A E _1.++. En otra
3ran empresaA una muestra aleatoria de n2 E + empleados tiene un salario medio de 2 E _24+.++A
con una desviacin est!ndar de $2 E _1+.++. Ko se supone 1ue las desviaciones est!ndar de las
dos poblaciones de montos salariales son i3uales. Probamos la 6iptesis de 1ue no e<iste
diferencia entre los montos salariales semanales medios de las dos empresasA con un nivel de
si3ni.cancia del %FA de la si3uiente manera:

,a * calculada de W3.32 se encuentra en la re3in de rec6a*o del modelo de prueba de 6iptesis
1ue aparece en la .3ura '. En consecuenciaA la 6iptesis nula se rec6a*aA y la 6iptesis
alternativaA de 1ue el salario semanal promedio de las dos empresas es diferenteA se acepta.
"i3 '

&.12 Prueba de la diferencia entre medias usando la distribucin t

(uando la diferencia entre dos medias se prueba con el uso de la distribucin tA un supuesto
necesario en el procedimiento est!ndar se3uido en la mayora de los libros de te<to es 1ue las
37
varian*as de las dos poblaciones son i3uales. En consecuenciaA en una prueba de este tipo el error
est!ndar estimado de la media se calcula con base en las formulas antes descritas.

Ejemplo. En una muestra aleatoria de n1 E 1+ focosA el ciclo medio de vida de los focos es 1 E
+++ 6orasA con s1 E 2++. Para otra marca de focos de cuya vida 0til tambi7n se presume 1ue si3ue
una distribucin normalA una muestra aleatoria de n2 E 8 tiene una media muestral de 2 E 3++ 6r
y una desviacin est!ndar muestral de s E 2%+. Probamos la 6iptesis de 1ue no e<iste nin3una
diferencia entre el ciclo medio de vida 0til de las dos marcas de focosA con un nivel de si3ni.cancia
de 1FA de la si3uiente manera:
,a t calculada de =2.833 se encuentra en la re3in de aceptacin de la 6iptesis nula. Por lo tantoA
la 6iptesis nula no puede rec6a*arse al nivel de si3ni.cancia de 1F.

&.13 Prueba de la diferencia entre medias con base en observaciones apareadas

,os procedimientos anteriores se basan en el supuesto de 1ue las dos muestras fueron
recolectadas como muestras aleatorias independientes. $in embar3oA en muc6as situaciones las
muestras se recolectan como pares de valoresA como cuando se determina el nivel de
productividad de cada trabajador antes y despu7s de un curso de capacitacin. Estos valores se
llaman observaciones apareadas o pares asociados. @simismoA y a diferencia de las muestras
independientesA dos muestras 1ue contienen observaciones apareadas se llaman muestras
dependientes.

En el caso de observaciones apareadasA el m7todo apropiado para probar la diferencia entre las
medias de dos muestras consiste en determinar primero la diferencia d entre cada par de valoresA
para despu7s probar la 6iptesis nula de 1ue la diferencia poblacional media es de cero. @sA desde
el punto de vista de los c!lculosA la prueba se aplica a una muestra de valores dA con V+ : ' E +.

,a media y desviacin est!ndar de la muestra de valores d se obtienen por medio de la aplicacin
de las frmulas b!sicas de los captulos anteriores e<cepto 1ue d es sustituida por T. ,a diferencia
media de un conjunto de diferencias entre observaciones apareadas es
,a frmula de desviaciones y la frmula de c!lculo para la desviacin est!ndar de las diferencias
entre observaciones apareadas sonA respectivamenteA
El error est!ndar de la diferencia media entre observaciones apareadas se obtiene por medio de la
frmula B8. CA para el error est!ndar de la mediaA e<cepto 1ue d es sustituida de nueva cuenta por
T
38
&ado 1ue el error est!ndar de la diferencia media se calcula con base en la desviacin est!ndar de
la muestra de diferencias Besto esA el valor poblacional es desconocidoC y puesto 1ue por lo
3eneral puede suponerse 1ue los valores de d si3uen una distribucin normalA la distribucin t es
adecuada para probar la 6iptesis nula de 1ue ' E +.

,os 3rados de libertad e1uivalen al n0mero de diferencias menos unoA o n c 1A la distribucin *
normal est!ndar puede utili*arse como una apro<imacin de las distribuciones t cuando n 3+. El _
ejemplo ilustra una prueba bilateralA mientras 1ue en otro problema ilustra una prueba unilateral.
,a estadstica de prueba empleada para probar la 6iptesis de 1ue no e<iste diferencia entre las
medias de un conjunto de observaciones apareadas es
Ejemplo. #n fabricante de automviles recolecta datos sobre millaje para una muestra de n E 1+
autos de diversas cate3oras de peso usando 3asolina de calidad est!ndar con y sin cierto aditivo.
Por supuestoA los motores fueron ajustados a las mismas especi.caciones antes de cada corridaA y
los mismos conductores sirvieron para los dos casos de 3asolina Baun1ue no se les 6i*o saber 1u7
3asolina se usaba en una corrida en particularC. &ados los datos de millaje en la tabla 13A
probamos la 6iptesis de 1ue no e<iste diferencia entre el millaje medio obtenido con y sin el
aditivoA empleando el nivel de si3ni.cancia de %FA de la si3uiente manera:

2abla 13 &atos de millaje de automviles y 6oja de trabajo para calcular la diferencia media y la
desviacin est!ndar de la diferencia
39
,a t calculada de W1.%' no se 6alla en la re3in de rec6a*o de la 6iptesis nula. En consecuenciaA
la 6iptesis nula de 1ue no e<iste nin3una diferencia en las millas por 3aln obtenidas con el
aditivo cuando se les compara con las obtenidas sin el aditivo se acepta como verosmil.

&.1! Prueba de una <iptesis referente al valor de la proporcin de la poblacin

,a distribucin normal puede servir como apro<imacin de una distribucin binomial cuando n E
3+ y tanto np E % como nB1C E %A donde 1 E 1 = p. Ssta es la base para la determinacin de
intervalos de con.an*a para la proporcinA en la 1ue tambi7n se e<plica el error est!ndar de la
proporcin. $in embar3oA en el caso de intervalos de con.an*a se re1uiere por lo 3eneral de un
tama5o de muestra de al menos n E 1++A como se e<plic en la seccin correspondiente.

En la determinacin de intervalos de con.an*a e<puesta en la seccin correspondienteA la
proporcin muestral Pb sirve de base para el error est!ndar. En la prueba de 6iptesisA el valor del
error est!ndar de la proporcin se basa por lo 3eneral en el uso del valor 6ipot7tico g+:
El procedimiento asociado con la prueba de un valor 6ipot7tico de la proporcin de la poblacin es
id7ntico al descrito en la seccin correspondienteA salvo 1ue la 6iptesis nula se re.ere al valor de
la proporcin poblacionalA no de la media poblacional. @sA la frmula de la estadstica * para
probar una 6iptesis referente al valor de la proporcin de la poblacin es
Ejemplo. El director de la a3encia de colocaciones de una universidad sostuvo 1ue al menos %+F
de los estudiantes a punto de 3raduarse 6aban cerrado un trato de empleo para el 1 de mar*o.
$upon3amos 1ue se re0ne una muestra aleatoria de n E 3+ estudiantes a punto de 3raduarse y
1ue slo 1+ de ellos indican 6aber cerrado un trato de empleo para el 1 de mar*o. LPuede
rec6a*arse el ar3umento del director de la a3encia de colocaciones al nivel de si3ni.cancia de
%FM #tili*amos * como la estadstica de pruebaA en esta forma:
'El uso de la distribucin normal est( garanti)ado* por+ue n 3,* n , - . n/1 0 , 1
-.12
,a * calculada de =1.88 es menor 1ue el valor crtico de =1.-% para esta prueba de la cola inferior.
Por lo tantoA el ar3umento del director se rec6a*a al nivel de si3ni.cancia de %F.

&.1& 'eterminacin del tama:o de muestra re9uerido para probar la proporcin

@ntes de la efectiva recoleccin de una muestraA el tama5o de muestra re1uerido para probar una
6iptesis referente a la proporcin poblacional puede determinarse especi.cando 1C el valor
6ipot7tico de la proporcinA 2C un valor alternativo espec.co de la proporcin tal 1ue la diferencia
con el valor 6ipot7tico nulo se considere importanteA 3C el nivel de si3ni.cancia por aplicar en la
prueba y C la probabilidad de error tipo II 1ue se permitir!. ,a frmula para determinar el tama5o
de muestra mnimo re1uerido para probar un valor 6ipot7tico de la proporcin es
40
*+ es el valor crtico de * usado en conjuncin con el nivel de si3ni.cancia especi.cado Bnivel de
CA mientras 1ue *1A es el valor de * respecto de la probabilidad de error tipo II asi3nada Bnivel de
_C. 2al como se a.rm en la seccin correspondiente en relacin con la determinacin del tama5o
de muestra para probar la mediaA *+ y *1A siempre tienen si3nos al3ebraicos opuestos. El resultado
es 1ue los dos productos en el numerador siempre se acumular!n. @simismoA la frmula puede
utili*arse en conjuncin con pruebas ya sea de una cola o de dos colasA y todo tama5o de muestra
fraccionario se redondea al valor inmediato superior. "inalmenteA el tama5o de muestra debe ser
su.cientemente 3rande para 3aranti*ar el uso de la distribucin normal de probabilidad en
conjuncin con h+h 1.

Ejemplo% #n miembro del (on3reso desea probarla 6iptesis de 1ue al menos -+F de los votantes
est! a favor de la le3islacin laboral 1ue acaba de ser presentada a la (!maraA con un nivel de
si3ni.cancia de %F. ,a discrepancia con esta 6iptesis se considerar! importante si slo %+F Bo
menosC favorece la le3islacinA mientras 1ue el ries3o de un error tipo II de _ E +.+% es aceptable.
El tama5o de muestra 1ue debera recolectarseA como mnimoA para satisfacer estas
especi.caciones de toma de decisiones es

&.1; Pruebas respecto de la proporcin del proceso en el control estadstico de
procesos

El uso e interpretacin de 3r!.cas de control en el control estadstico de procesos es una
aplicacin directa de los m7todos y conceptos de la prueba de 6iptesis. @l i3ual 1ue en el caso de
la media del procesoA los lmites de control para una proporcin del proceso se de.nen en Y3
unidades de error est!ndar para el valor 6ipot7tico BaceptableC.

Ejemplo. (uando un proceso de canje de cupones se 6alla bajo controlA un m!<imo de 3F de los
descuentos se ejecuta incorrectamenteA para una proporcin m!<ima aceptable de errores de
+.+3. En relacin con 2+ muestras secuenciales de 1++ canjes de cupones cada unaA una auditoria
revela 1ue el n0mero de errores detectados en las muestras de sub3rupos racionales son: 2A 2A 3A
-A 1A 3A -A A 4A 2A %A +A 3A 2A A %A 3A 8A 1 y . ,a 3r!.ca de corridas de la secuencia de proporciones
muestrales de error para las 2+ muestras aparece en la .3ura anterior. #na revisin 3eneral de
esta .3ura podra inducir la pre3unta de si efectivamente se mantiene la norma de permitir en el
proceso una proporcin m!<ima de errores de +.+3A particularmente en las muestras f' y f18. En
los problemas observaremos 1ue estas dos proporciones muestrales no est!n m!s all! de los
lmites superiores de controlA de modo 1ue podran 6aber ocurrido debido simplemente a una
variacin por causa com0n. En consecuenciaA no rec6a*aremos la 6iptesis nula de 1ue la
proporcin del proceso de errores se mantiene en +.+3 y de 1ue el proceso es estable.

&.1> Prueba de la diferencia entre dos proporciones poblacionales

(uando deseamos probar la 6iptesis de 1ue las proporciones de dos poblaciones no son
diferentesA las dos proporciones muestrales se combinan como base para determinar el error
est!ndar de la diferencia entre proporciones. @dvi7rtase 1ue este procedimiento di.ere del
empleado para la estimacin estadsticaA en el cual no se 6i*o el supuesto de 1ue no 6ay
diferencia. @dem!sA el presente procedimiento es conceptualmente similar al e<puestoA en el 1ue
las dos varian*as muestrales se combinan como base para calcular el error est!ndar de la
diferencia entre medias. ,a estimacin combinada de la proporcin de la poblacinA con base en
las proporciones obtenidas de dos muestras independientesA es
El error est!ndar de la diferencia entre proporciones usado en conjuncin con la prueba del
supuesto de 1ue no 6ay diferencia es
41
,a frmula de la estadstica * para probar la 6iptesis nula de 1ue no e<iste diferencia entre dos
proporciones poblacionales es
#na prueba de la diferencia entre proporciones puede reali*arse ya sea como prueba unilateral o
como prueba bilateral.

Ejemplo% #na muestra de %+ 6o3ares de una comunidad revela 1ue 1+ de ellos vieron un
pro3rama especial de televisin sobre la economa nacional. En una se3unda comunidadA 1%
6o3ares de una muestra aleatoria de %+ vieron ese pro3rama especial de televisin. Probamos la
6iptesis de 1ue la proporcin 3lobal de espectadores de las dos comunidades no di.ereA con un
nivel de si3ni.cancia de 1FA de la si3uiente manera:
,a * calculada de = 1. 1% se encuentra en la re3in de aceptacin de la 6iptesis nula. Por lo tantoA
la 6iptesis de 1ue no e<iste diferencia en la proporcin de espectadores de las dos *onas no
puede rec6a*arse.

&.1? Prueba de un valor <ipot=tico de la varian,a usando la distribucin 5i cuadrada

En el caso de una poblacin con distribucin normal la ra*n Bn = lCs
2
Q
2
si3ue una distribucin de
probabilidad T
2
A la cual es diferente de acuerdo con los Bn = 1C 3rados de libertad. En consecuenciaA
la estadstica 1ue se utili*a para probar una 6iptesis referente al valor de la varian*a de la
poblacin es
,a prueba puede ser una prueba unilateral o una prueba bilateralA aun1ue las 6iptesis m!s
frecuentes sobre una varian*a poblacional se relacionan con pruebas unilaterales.

Ejemplo% El ciclo medio de vida 0til de una muestra aleatoria de n E 1+ focos es E +++ 6orasA
con una desviacin est!ndar de s E 2++ 6r. $e supone 1ueA en 3eneralA el ciclo de vida 0til de los
focos tiene una distribucin normal. $upon3amos 1ue antes de 1ue se recolectara la muestra se
estableci la 6iptesis de 1ue la desviacin est!ndar de la poblacin no es mayor de _E 1%+.
(on base en los resultados muestralesA esta 6iptesis se prueba al nivel de si3ni.cancia de 1 F de
la si3uiente manera:
&ado 1ue la estadstica de prueba calculada de 1-.+ no e<cede el valor crtico de 21.-4 en esta
prueba de cola superiorA la 6iptesis nula de 1ue 1%+ no puede rec6a*arse al nivel de
si3ni.cancia de 1F.
42

&.1@ Pruebas respecto de la variabilidad del proceso en el control estadstico de
procesos

El uso e interpretacin de 3r!.cas de control en el control estadstico de procesos es una
aplicacin directa de los m7todos y conceptos de la prueba de 6iptesis. ,a variabilidad del
proceso se vi3ila y controla ya sea respecto de la desviacin est!ndar del proceso o del ran3o del
proceso. (omo en el caso de las 3r!.cas de control para la media del proceso y la proporcin del
procesoA los lmites de control se de.nen en Y 3 unidades de error est!ndar respecto del valor
central esperado de la 3r!.ca cuando la 6iptesis nula de 1ue no e<iste variacin por causas
atribuibles es cierta.

Ejemplo% Muestras de sub3rupo racional de n E pa1uetes de papas fritas se toman en un
proceso de empacamiento. En un ejemplo antes descrito consideramos si el proceso parece ser
estable respecto de la media del proceso. Para la secuencia de 1% muestrasA las desviaciones
est!ndar muestrales Ben on*asC son: .18A .+%A .+88A .+%4A .+2A .+41A .+83A .11-A .124A .+--A .11A
.+%-A .+4A .+-8 y. 12%. ,a .3ura 1+ es la 3r!.ca de corridas de esta secuencia de desviaciones
est!ndar. @l revisar la 3r!.ca de corridasA no 1ueda claro si e<iste al3una desviacin est!ndar
muestral inusualA ya 1ue el evidente alto 3rado de variabilidad en la 3r!.ca podra ser
consecuencia slo de la escala usada en el eje vertical. En los problemas resueltos observaremos
1ueA en efectoA todas las desviaciones est!ndar muestrales se 6allan dentro de los lmites de
control inferior y superior. @sA la 6iptesis nula de 1ue no 6ay variacin por causa atribuible no se
rec6a*ar!A y concluiremos 1ue el proceso es estable respecto de la desviacin est!ndar del
contenido de los pa1uetes. @ todo estoA el solo 6ec6o de 1ue no 6aya variacin por causa
atribuible no si3ni.ca por s mismo 1ue la variabilidad del proceso sea aceptable. En caso de
e<istir un alto 3rado de variabilidad continua debida a causas comunesA el proceso deber!
redise5arse y ser mejorado.
"i3. 1+ Nr!.ca de corridas.

&.2A 'istribucin # y prueba de la i1ualdad de dos varian,as poblacionales

Puede demostrarse 1ue la distribucin " es el modelo de probabilidad apropiado para la ra*n de
las varian*as de dos muestras tomadas independientemente de poblaciones con distribucin
normalA 6abiendo una distribucin " diferente para cada combinacin de los 3rados de libertad 3l
asociados con cada muestra. Para cada muestraA 3l E n = 1. ,a estadstica 1ue sirve para probar la
6iptesis nula de 1ue dos varian*as poblacionales son i3uales es
43
&ado 1ue cada varian*a muestral es un estimador inses3ado de la varian*a de la misma
poblacinA el valor esperado a lar3o pla*o de la ra*n anterior es de alrededor de 1.+. ZKota: El
valor esperado no es de e<actamente 1.+A sino de 3l2QB3l2 = 2CA por ra*ones matem!ticas 1ue
escapan al alcance de este libro.[ $in embar3oA es improbable 1ue las varian*as muestrales de
cual1uier par de muestras dado sean id7nticas en valorA aun si la 6iptesis nula es cierta. Puesto
1ue se sabe 1ue esta ra*n si3ue una distribucin "A esta distribucin de probabilidad puede
utili*arse en conjuncin con la prueba de la diferencia entre dos varian*as. @un1ue un supuesto
matem!tico necesario es 1ue las dos poblaciones tienen una distribucin normalA se 6a
demostrado 1ue la distribucin " es relativamente robustaA e insensible a desviaciones respecto
de la normalidad cuando cada poblacin es unimodal y los tama5os de muestra son
apro<imadamente i3uales.

,os 3rados de libertad 3l asociados con el numerador de la ra*n " calculada son los encabe*ados
de columnas de esa tablaA mientras 1ue los 3rados de libertad para el denominador son los
encabe*ados de lneas. En la tabla no se identi.can valores crticos de " para la cola inferior de la
distribucinA debido en parte a 1ueA 6abitualmenteA la distribucin " se emplea en pruebas 1ue
slo re1uieren de probabilidades de la cola superior. Esto es particularmente cierto en el caso del
uso de la distribucin " en el an!lisis de varian*a. Otro motivo de 1ue slo se ofre*can valores " de
la cola superior es 1ue los valores de " de cola inferior re1ueridos pueden calcularse mediante la
llamada propiedad del recproco de la distribucin "A de este modo:
@l aplicar la frmulaA un valor " en el punto de %F inferior se determina introduciendo en el
denominador un valor de cola superior en el punto de %F. KteseA sin embar3oA 1ue los dos
valores 31 del denominador si3uen un orden inverso en comparacin con el valor " re1uerido.

Ejemplo% $e supone 1ue el ciclo de vida de los focos tiene una distribucin normal. Probarnos la
6iptesis nula de 1ue las muestras se obtuvieron de poblaciones con varian*as i3ualesA con un
nivel de si3ni.cancia de 1+FA mediante el uso de la distribucin ".
Para la prueba al nivel de si3ni.cancia de 1+FA el punto de %F superior para " y el punto de %F
inferior para " son los valores crticos.
&ado 1ue la ra*n " calculada no es ni menor de +.3+ ni mayor de 3.-8A se 6alla en la re3in de
aceptacin de la 6iptesis nula. @sA el supuesto de 1ue las varian*as de las dos poblaciones son
i3uales no puede rec6a*arse al nivel de si3ni.cancia de 1+F.

-.21 Otros m3todos para la prueba de "iptesis nulas

El m7todo del valor P y el m7todo de intervalos de con.an*a son alternativas al m7todo del valor
crtico para las pruebas de 6iptesis referidas en las secciones anteriores de este captulo.

$i se aplica el m7todo del valor PA en lu3ar de comparar el valor observado de una estadstica de
prueba con un valor crticoA la probabilidad de ocurrencia de la estadstica de pruebaA dado 1ue la
6iptesis nula es ciertaA se determina y compara con el nivel de si3ni.cancia a. ,a 6iptesis nula
se rec6a*a si el valor P es menor 1ue la a asi3nada. ,os problemas anteriores ilustran la aplicacin
44
de este m7todo a pruebas de dos colas y una colaA respectivamenteA sobre la diferencia entre
medias.

$i se aplica el m7todo de intervalos de con.an*aA se elabora el intervalo de con.an*a 1 = a para el
valor param7trico de inter7s. $i el valor 6ipot7tico del par!metro no est! incluido en el intervaloA la
6iptesis nula se rec6a*a. ,os problemas 11. 1% y 11. 1- ilustran la aplicacin de este m7todo a
pruebas de dos colas y una colaA respectivamenteA sobre la diferencia entre medias.

;. Estadstica no param=trica

;.1 Escalas de medicin

@ntes de considerar las diferencias entre los m7todos estadsticos no param7tricos y los
procedimientos param7tricos 1ue constituyen la mayor parte de este libro conviene de.nir cuatro
tipos de escalas de medicin en t7rminos de la precisin representada por los valores reportados.

En la escala nominalA los n0meros slo se usan para identi.car cate3oras. Ko representan nin30n
monto o cantidad propiamente dic6os.

Ejemplo% $i cuatro re3iones de ventas se numeran del 1 al 0nicamente como n0meros de
identi.cacin 3eneralA en ello est! implicada la escala nominalA puesto 1ue los n0meros sirven
sencillamente como nombres de cate3oras.

En la escala ordinalA los n0meros representan ran3os o jerar1uas. Indican ma3nitud relativaA
aun1ue las diferencias entre los ran3os no se asumen como i3uales.

Ejemplo% #n analista de inversin clasi.ca cinco emisiones accionaras del 1 al % en t7rminos de
potencial de apreciacin. ,a diferencia en el potencial de apreciacin entre las emisiones
clasi.cadas como 1 y 2 no sera 3eneralmente la misma 1ueA di3amosA la diferencia entre las
emisiones clasi.cadas como 3 y .

En la escala de intervalo se representan medidas 1ue son diferencias entre valores. $in embar3oA
el punto cero es arbitrarioA y no se trata de un cero IabsolutoI. Por lo tantoA los n0meros no
pueden compararse usando ra*ones.

Ejemplo% En las escalas de temperatura ya sea "a6ren6eit o (elsiusA una diferencia de %
o
de 4+
o
" a
4%
o
" por ejemploA es el mismo monto de diferencia en temperatura de 8+
o
" a 8%
o
" $in embar3oA no
podemos decir 1ue -+
o
" sea dos veces m!s caliente 1ue 3+
o
"A por1ue el punto +
o
" no es un punto
cero absoluto Bausencia absoluta de calorC.

En la escala de ra*n s e<iste un punto cero realA y en consecuencia las medidas pueden
compararse en forma de ra*ones.

Ejemplo% @dem!s de ser cierto 1ue una diferencia en valor de inventario de _% +++ es el mismo
monto de diferencia entreA por decir al3oA _%+ +++ y _%% +++ o entre _-+ +++ y _-% +++A tambi7n
lo es 1ue un valor de inventario de _1++ +++ es dos veces m!s 3rande 1ue un valor de inventario
de _%+ +++.

;.2 =todos estadsticos param=tricos contra no param=tricos

,a mayora de los m7todos estadsticos descritos en este libro se llaman m7todos param7tricos. El
punto focal del an!lisis param7trico es al30n par!metro de la poblacin en relacin con el cual la
estadstica de muestreo si3ue una distribucin conocidaA con medidas tomadas en la escala de
intervalo o ra*n. (uando no se cumplen uno o m!s de estos re1uisitos o supuestosA pueden
usarse los as llamados m7todos no param7tricos. @ estos m7todos se les conoce tambi7n como
m7todos libres de distribucinA con lo 1ue se enfati*a en particular el 6ec6o de 1ue no se conoce
la distribucin de la estadstica de muestreo.

$i el uso de una prueba param7tricaA como la prueba tA est! 3aranti*adoA siempre es preferible
recurrir a 7l 1ue al uso del e1uivalente no param7trico. Esto se debe a 1ue si aplic!ramos el
45
mismo nivel de si3ni.cancia en ambas pruebasA la potencia asociada con la prueba no
param7trica se revelara siempre inferior a la del e1uivalente param7trico. ,as pruebas no
param7tricas suelen emplearse en conjunto con muestras pe1ue5as respecto de las cuales es
imposible apelar al teorema central del lmite.

,as pruebas no param7tricas pueden diri3irse a 6iptesis referentes a la formaA dispersin
oposicin BmedianaC de la poblacin. En la mayora de las aplicacionesA las 6iptesis aluden al
valor de una medianaA la diferencia entre dos medianas o la diferencia entre varias medianas. Esto
contrasta con los procedimientos param7tricosA centrados principalmente en medias
poblacionales.

&e las pruebas estadsticas ya descritas en este libroA la prueba ji cuadrada es una prueba no
param7trica. Gecu7rdeseA por ejemploA 1ue los datos 1ue se anali*an corresponden a la escala
nominal Bdatos cate3ricosC. &edicamos un captulo espec.co a la prueba ji cuadrada a causa de
la amplia difusin de su uso y de la variedad de sus aplicaciones.

;.3 Prueba de corridas para aleatoriedad

#na corrida es una serie de observaciones similares. ,a prueba de corridas se usa para probar la
aleatoriedad de una serie de observaciones cuando cada observacin puede ser asi3nada a una
de dos cate3oras.

Ejemplo% En relacin con una muestra aleatoria de n E 1+ individuosA supon3amos 1ue cuando se
les clasi.ca por se<o la secuencia de observaciones es: MA MA MA MA "A "A "A "A MA M. Estos datos
contienen tres corridasA o series de elementos semejantes.

Gespecto de datos num7ricosA un medio para obtener el es1uema re1uerido de dos cate3oras es
clasi.car cada observacin se30n si es superior o inferior a la mediana del 3rupo. En 3eneralA
muc6o menos corridas o muc6o m!s corridas 1ue las 1ue sera de esperar al a*ar resultaran en el
rec6a*o de la 6iptesis nula de 1ue la secuencia de observaciones es una secuencia aleatoria.

El n0mero de corridas de elementos semejantes se determina de acuerdo con los datos
muestralesA con el uso del smbolo G para desi3nar el n0mero de corridas observadas. $i n1
e1uivale al n0mero de elementos muestreados de un tipo y n2 al n0mero de elementos
muestreados del se3undo tipoA la media y el error est!ndar asociados con la distribucin de
muestreo de la estadstica de prueba G cuando la secuencia es aleatoria son
$inA n1 i 2+ o n2 i 2+A la distribucin de muestreo de r apro<ima la distribucin normal. Por lo
tantoA en estas circunstancias la estadstica G puede convertirse a la estadstica de prueba * de la
si3uiente manera:

(uando n1 E 2+ y n2 E 2+A en libros de te<to especiali*ados en estadstica no param7trica se
dispone de tablas de valores crticos de la estadstica de prueba G.

;.! $na muestra0 Prueba de los si1nos

,a prueba de los si3nos puede utili*arse para probar una 6iptesis nula referente al valor de la
mediana de la poblacin. En consecuenciaA es el e1uivalente no param7trico a la prueba de una
6iptesis referente al valor de la media de la poblacin. Es necesario 1ue los valores de la muestra
aleatoria se encuentren al menos en la escala ordinalA aun1ue no se re1uiere de supuestos acerca
de la forma de la distribucin de la poblacin.
46

,as 6iptesis nula y alternativa pueden aludir ya sea a una prueba bilateral o unilateral. $i Med+
denota la mediana de la poblacin y Medo desi3na al valor 6ipot7ticoA las 6iptesis nula y
alternativa para una prueba de dos e<tremos son
$e aplica un si3no de m!s a cada valor muestral observado mayor 1ue el valor 6ipot7tico de la
mediana y un si3no de menos a cada valor menor 1ue el valor 6ipot7tico de la mediana. $i un
valor muestral es e<actamente i3ual a la mediana 6ipot7ticaA no se le aplica nin30n si3noA con lo
1ue el tama5o de muestra efectivo se reduce. $i la 6iptesis nula sobre el valor de la mediana es
ciertaA el n0mero de si3nos de m!s debera ser apro<imadamente i3ual al n0mero de si3nos de
menos. +A para decirlo de otra maneraA la proporcin de si3nos de m!s Bo de si3nos de menosC
debe ser de alrededor de +.%+. Por consi3uienteA la 6iptesis nula 1ue se prueba en una prueba
bilateral es V+: E +.%+A donde es la proporcin de la poblacin de los si3nos de m!s Bo de
menosC. @sA una 6iptesis referente al valor de la mediana se prueba en realidad como una
6iptesis sobre . $i la muestra es 3randeA se puede 6acer uso de la distribucin normal.

;.& $na muestra0 Prueba de Bilco3on

,o mismo 1ue en el caso de la prueba de los si3nosA la prueba de ;ilco<on puede usarse para
probar una 6iptesis nula referente al valor de la mediana de la poblacin. Pero dado 1ue la
prueba de ;ilco<on considera[ a ma3nitud de la diferencia entre cada valor muestral y el valor
6ipot7tico de la medianaA es una prueba m!s sensible 1ue la prueba de los si3nos. Por otra parteA
puesto 1ue se determinan las diferenciasA los valores deben estar al menos en la escala de
intervalo. Ko se re1uiere de nin30n supuesto acerca de la forma de la distribucin de la poblacin.

,as 6iptesis nula y alternativa se formulan respecto de la mediana de la poblacin ya sea para
una prueba unilateral o bilateral. $e determina la diferencia entre cada valor observado y el valor
6ipot7tico de la medianaA diferencia 1ueA con el si3no aritm7tico 1ue le correspondaA se desi3na
como d : d E BT c Med+C. $i al3una diferencia es i3ual a ceroA la observacin asociada se e<cluye
del an!lisis y el tama5o de muestra efectivo se reduce. ,os valores absolutos de las diferencias se
clasi.can entonces de menor a mayorA asi3n!ndose el ran3o de 1 a la menor diferencia absoluta.
(uando las diferencias absolutas son i3ualesA se asi3na el ran3o medio a los valores as
relacionados. "inalmenteA se obtiene la suma de los ran3os en forma separada para las diferencias
positivas y para las ne3ativas. ,a menor de estas dos sumas es la estadstica 2 de ;ilco<on para
una prueba bilateral. En el caso de una prueba unilateralA la suma menor debe asociarse con la
direccionalidad de la 6iptesis nula. Para rec6a*ar la 6iptesis nulaA el valor obtenido de 2 debe
ser menor 1ue el valor crtico dado en la tabla.

(uando n 2% y la 6iptesis nula es ciertaA la estadstica 2 tiene una distribucin _
apro<imadamente normal. ,a media y el error est!ndar asociados con esta distribucin de
muestreo sonA respectivamenteA
Por lo tantoA en el caso de una muestra relativamente 3rande la prueba puede reali*arse usando la
distribucin normal de probabilidad y calculando la estadstica de prueba *A de la si3uiente
manera:
)7ase el problema anterior para una aplicacin de la prueba de ;ilco<on a la prueba de una
6iptesis nula referente a la mediana de la poblacin.

;.; 'os muestras independientes0 Prueba de annCB<itney
47

,a prueba de Mann=;6itney puede utili*arse para probar la 6iptesis nula de 1ue las medianas de
dos poblaciones son i3uales. $e supone 1ue las dos poblaciones tienen la misma forma y
dispersinA por1ue tales diferencias tambi7n podran conducir al rec6a*o de la 6iptesis nula. Es
necesario 1ue los valores de las dos muestras aleatorias independientes est7n al menos en la
escala ordinal.

,as dos muestras se combinan en un conjunto ordenadoA en el 1ue cada valor muestral se
identi.ca se30n el 3rupo muestral ori3inal. ,os valores se clasi.can entonces de menor a mayorA
asi3nando el ran3o 1 al menor valor muestral observado. En caso de valores i3ualesA se les asi3na
el ran3o medio. $i la 6iptesis nula es ciertaA el promedio de los ran3os de cada 3rupo muestral
debera ser apro<imadamente i3ual. ,a estadstica calculada para efectuar esta prueba se
denomina #A y puede basarse en la suma de los ran3os de cual1uiera de las dos muestras
aleatoriasA de este modo:
donde n1 E tama5o de la primera muestra
n2 E tama5o de la se3unda muestra
G1 E suma de los ran3os de la primera muestra
G2 E suma de los ran3os de la se3unda muestra

&ado 1ue n1 i 1+A n2 i 1+ y la 6iptesis nula sea ciertaA la distribucin de muestreo de # es
apro<imadamente normalA con los si3uientes par!metros:
Por lo tantoA la estadstica de prueba para probar la 6iptesis nula de 1ue las medianas de dos
poblaciones son i3uales es
donde # es i3ual a #1 o #2.

En situaciones en las 1ue n1 ` 1+A n2 ` 1+ o tanto n1 como n2 ` 1+A la distribucin normal de
probabilidad no puede emplearse en esta prueba. Ko obstanteA en libros de te<to especiali*ados
en estadstica no param7trica se dispone de tablas especiales de la estadstica # para esas
pe1ue5as muestras.

El problema ilustra el uso de la prueba de Mann=;6itney.

;.> Observaciones apareadas0 Prueba de los .i1nos

En el caso de dos muestras recolectadas como observaciones apareadasA la prueba de los si3nos
descrita en la seccin anterior puede usarse para probar la 6iptesis nula de 1ue las dos medianas
de la poblacin son i3uales. ,os valores muestrales deben estar al menos en la escala ordinalA y no
se re1uiere de nin30n supuesto acerca de las formas de las dos distribuciones poblacionales.

$e aplica un si3no de m!s a cada par de valores cuya medida en la primera muestra es mayor 1ue
la medida en la se3unda muestraA y un si3no de menos cuando ocurre lo contrario. $i un par de
medidas tiene el mismo valorA estos valores relacionados se e<cluyen del an!lisisA con lo 1ue el
tama5o de muestra efectivo se reduce. $i la 6iptesis de 1ue las dos poblaciones son de i3ual
nivel de ma3nitud es ciertaA el n0mero de si3nos de m!s debera ser apro<imadamente i3ual al
48
n0mero de si3nos de menos. Por lo tantoA la 6iptesis nula a prueba es V+ : E +.%+A donde es
la proporcin de la poblacin de si3nos de m!s Bo de menosC. $i la muestra es 3rande Bn i 3+CA
puede usarse la distribucin normalA como se e<plica en la seccin 11.%. Ktese 1ue aun1ue se
recolectan dos muestrasA la prueba se aplica al conjunto de si3nos de m!s y de menos 1ue resulta
de la comparacin de los pares de medidas.

El problema ilustra el uso de la prueba de los si3nos para probar la diferencia entre dos medianas
de datos recolectados como observaciones apareadas.

;.? Observaciones apareadas0 Prueba de Bilco3on

En el caso de dos muestras recolectadas como observaciones apareadasA la prueba de ;ilco<on
descrita en la seccin anterior puede usarse para probar la 6iptesis nula de 1ue las dos medianas
de la poblacin son i3uales. &ado 1ue la prueba de ;ilco<on considera la ma3nitud de las
diferencias entre los valores de cada par asociadoA y no slo la direccin o si3no de la diferenciaA
es una prueba m!s sensible 1ue la prueba de los si3nos. $in embar3oA los valores muestrales
deben 6allarse en la escala de intervalo. Ko se re1uiere de nin30n supuesto acerca de las formas
de las dos distribuciones.

$e determina la diferencia entre cada par de valoresA la cualA junto con el si3no aritm7tico
asociadoA se desi3na como d. $i al3una diferencia es i3ual a ceroA ese par de observaciones se
e<cluye del an!lisisA con lo 1ue el tama5o de muestra efectivo se reduce. &espu7sA los valores
absolutos de las diferencias se clasi.can de menor a mayorA asi3nando el ran3o de 1 a la
diferencia absoluta menor. (uando las diferencias absolutas son i3ualesA se asi3na el ran3o medio
a los valores as relacionados. "inalmenteA se obtiene por separado la suma de los ran3os de las
diferencias positivas y de las ne3ativas. ,a menor de estas dos sumas es la estadstica 2 de
;ilco<on para una prueba de dos e<tremos. En el caso de una prueba de un e<tremoA la suma
menor debe asociarse con la direccionalidad de la 6iptesis nulaA como se ilustra en la aplicacin
de una muestra de la prueba de ;ilco<on en el problema.

(uando n $ 2% y la 6iptesis nula es ciertaA la estadstica 2 tiene una distribucin
apro<imadamente normal. ,as frmulas para la media y error est!ndar de la distribucin de
muestreo de 2 y la frmula para la estadstica de prueba * se especi.can en la seccin 21.%A sobre
la aplicacin de la prueba de ;ilco<on con una muestra .

El problema ilustra el uso de la prueba de ;ilco<on para probar la diferencia entre dos medianas
de datos recolectados como observaciones apareadas.

;.@ +arias muestras independientes0 Prueba de DrusEalCBallis

,a prueba de >rus?al=;allis sirve para probar la 6iptesis nula de 1ue varias poblaciones tienen las
mismas medianas. @sA es el e1uivalente no param7trico del dise5o completamente aleatori*ado
de un factor de an!lisis de varian*a. $e supone 1ue las diversas poblaciones tienen la misma
forma y dispersin para 1ue la 6iptesis anterior sea aplicableA ya 1ue diferencias en forma o
dispersin podran tambi7n conducir al rec6a*o de la 6iptesis nula. Es necesario 1ue los valores
de las diversas muestras aleatorias independientes est7n al menos en la escala ordinal.

,as varias muestras son vistas primeramente como un conjunto de valoresA y cada valor de este
3rupo combinado se clasi.ca de menor a mayor. En caso de valores i3ualesA se les asi3na el ran3o
medio. $i la 6iptesis nula es ciertaA el promedio de los ran3os de cada 3rupo muestral debera ser
m!s o menos i3ual. ,a estadstica de prueba calculada se denomina V y se basa en la suma de los
ran3os de cada una de las varias muestras aleatoriasA de la si3uiente manera:
donde K E tama5o de muestra combinado de las diversas muestras Bntese 1ue en este caso K
no desi3na al tama5o de la poblacinC
Gj . E suma de los ran3os de la j7sima muestra o 3rupo de tratamiento
nj. E n0mero de observaciones de la j7sima muestra
49

&ado 1ue el tama5o de cada 3rupo muestral sea de al menos nj % y la 6iptesis nula sea ciertaA _
la distribucin de muestreo de V es similar a la distribucin T
2
con 31 E > = 1A donde > es el
n0mero de tratamientos o 3rupos muestrales. El valor de T
2
1ue apro<ima el valor crtico de la
estadstica de prueba es siempre el valor de la cola superior. Este procedimiento de prueba es
an!lo3o a la cola superior de la distribucin " 1ue se emplea en el an!lisis de varian*a.

En el caso de ran3os empatadosA la estadstica de prueba V debe corre3irse. El valor corre3ido de
la estadstica de prueba se denomina V( y se calcula en la si3uiente forma:
donde tj representa el n0mero de puntajes empatados en la j7sima muestra.

El efecto de esta correccin es incrementar el valor de la estadstica V calculada. En consecuenciaA
si el valor no corre3ido de V conduce al rec6a*o de la 6iptesis nulaA no 6ay necesidad de corre3ir
este valor para el efecto de ran3os empatados.

El problema ilustra el uso de la prueba de >rus?al=;allis para probar la 6iptesis nula de 1ue
varias poblaciones tienen la misma mediana.
>. uestreo

>.1 Introduccin.

El principal objetivo de la mayora de los estudiosA an!lisis o investi3acionesA es 6acer
3enerali*aciones acertadas con base en muestras de poblaciones de las 1ue se derivan tales
muestras. Obs7rvese la palabra IacertadasI por1ue no es f!cil responder cu!ndo y en 1u7
condiciones las muestras permiten tales 3enerali*aciones. Por ejemploA si 1ueremos calcular la
cantidad de dinero promedio 1ue una persona 3asta en unas vacacionesA Ltomaramos como una
muestra las cantidades 1ue 3astan los pasajeros de primera clase de un crucero de cuatro dasJ o
trataramos de estimar o pronosticar el precio al mayoreo de todos los productos a3rcolas
0nicamente con base en el precio de los esp!rra3os frescosM Es obvio 1ue noA pero saber a 1u7
vacacionistas y 1u7 productos a3rcolas debemos incluir en las muestras no es al3o intuitivo ni
evidente.

En la mayor parte de los m7todos 1ue estudiaremos en lo 1ue resta del libroA supondremos 1ue
estamos manejando las llamadas muestras aleatorias. Vacemos 7nfasis en las muestras
aleatoriasA 1ue estudiamos y de.nimos en la seccin anterior por1ue permiten 3enerali*aciones
v!lidas o l3icas. Ko obstanteA como veremosA el muestreo aleatorio no siempre es viable o aun
deseableA mencionaremos al3unos procedimientos alternativos de muestreo.

El concepto relacionado de una distribucin de muestreoA 1ue nos indica cmo las cantidades
determinadas con base en muestras pueden variar de una muestra a otra. ,ue3oA de la secciones
anteriores aprenderemos cmo se pueden medirA pronosticar o inclusive controlar tales
variaciones de la probabilidad.

>.2 uestreo Fleatorio

&iferenciamos entre poblaciones y muestrasA se5alando 1ue una poblacin consiste en todas las
observaciones concebible Bo 6ipot7ticamenteC posibles de un fenmeno determinadoA mientras
1ue una muestra es slo una parte de una poblacin. En se3uidaA tambi7n diferenciaremos entre
dos clases de poblaciones: las poblaciones .nitas y las poblaciones in.nitas.

#na poblacin es .nita si consta de un n0mero .nito o .jo de elementosA medidas u
observaciones. (omo ejemplos de poblaciones .nitas podemos mencionar los pesos netos de
3A+++ latas de pintura de cierta produccinA las cali.caciones $@2 de todos los estudiantes de
primer a5o admitidos en una preparatoria determinada en el oto5o de 1''1 y las temperaturas
diarias re3istradas en una estacin meteorol3ica durante los a5os de 1'84 a 1''1.
50

@ diferencia de las poblaciones .nitasA una poblacin in.nitaA al menos 6ipot7ticamenteA contiene
una in.nidad de elementos. Este es el casoA por ejemploA cuando observamos un valor de una
variable aleatoria continua y 6ay una in.nidad de resultados distintos. 2ambi7n es el caso cuando
observamos los totales obtenidos en lan*amientos repetidos de un par de dadosA cuando medimos
en repetidas ocasiones el punto de ebullicin de un compuesto de silicio y cuando tomamos una
muestra con reempla*o de una poblacin .nita. Ko 6ay lmite para los n0meros de veces 1ue
podemos lan*ar un par de dadosA para el n0mero de veces 1ue podemos medir el punto de
ebullicin del compuesto de silicioA ni para el n0mero de veces 1ue podemos tomar una muestra
de una poblacin .nita y reempla*arla antes de tomar la si3uiente.

Para presentar la idea del muestreo aleatorio de una poblacin .nita primero veamos cu!ntas
muestras diferentes de tama5o n podemos tomar de una poblacin .nita de tama5o K.
Ge.ri7ndonos a la re3la para el n0mero de combinaciones de n objetos tomando r a la ve* de la
p!3ina 1+1A encontramos 1ueA con un cambio de las letrasA la respuesta es j

E9EMP,O L(u!ntas muestras distintas de n podemos tomar de una poblacin .nita de tama5o
KA cuando

BaC n E 2 y K E 12J

BbC n E 3 y K E l++M

$olucin
(on base en el resultado de 1ue 6ay muestras distintas de tama5o n de una poblacin .nita
de tama5o KA presentaremos la si3uiente de.nicin de una muestra aleatoria Ben ocasiones
conocida tambi7n como muestra aleatoria simpleC de una poblacin .nita:

#na muestra de tama5o n de una poblacin .nita de tama5o K es una variable
aleatoria si se selecciona de manera tal 1ue cada una de las muestras
posibles tiene la misma probabilidadA de ser seleccionada.

Por ejemploA si una poblacin consiste en los K E % elementos aA bA cA d y e B1ue podran ser los
in3resos anuales de cinco personasA los pesos de cinco vacas o los precios de cinco artculosCA 6ay
muestras posibles de tama5o n E 3. Estas constan de los elementos abcA abdA abeA acdA
aceA adeA bcdA bceA bde y cde. $i seleccionamos una de estas muestras= de tal forma 1ue cada
muestra ten3a una probabilidad de 1Q1+ de ser seleccionadaA decimos 1ue 7sta es una muestra
aleatoria.

@ continuacin si3ue la pre3unta de cmo se toman las muestras aleatorias en la pr!ctica real en
una situacin simple como la 1ue acabamos de describirA podramos escribir cada una de las die*
51
muestras aleatorias en una tira de papelA ponerlas en un sombreroA revolverlas bien y lue3o retirar
una sin ver. EmperoA es obvio 1ue esto sera poco pr!ctico en una situacin real complicada en la
1ue n y K o slo K son 3randes. Por ejemploA para n E y K E 2++ tendramos 1ue clasi.car
E -A-8A'%+ tiras de papel y retirar una de 7stas.

Por fortunaA podemos tomar una muestra aleatoria de una poblacin .nita sin 6acer una lista de
todas las muestras posiblesA 1ue 6emos mencionado a1u slo para enfati*ar el punto de 1ue la
seleccin de una muestra aleatoria debe depender por completo del a*ar. En ve* de 6acer una
lista de todas las muestras posiblesA podemos escribir cada uno de los K elementos de la
poblacin .nita en una tira de papel y retirar n de 7stas a la ve* sin reempla*oA ase3ur!ndonos de
1ue cada ve* 1ue retiremos otro papel todos los elementos restantes de la poblacin ten3an la
misma posibilidad de ser seleccionados. (omo se pedir! al lector 1ue lo veri.1ue en el ejercicio
1+. 1 de la p!3ina 28A este procedimiento tambi7n lleva a la misma probabilidadA =A para
cada muestra posible.

Podemos simpli.car a0n m!s este procedimiento relativamente f!cil seleccionando n0meros
aleatorios en ve* de retirar tiras de papel o bienA podemos dejar 1ue una computadora 6a3a todo
el trabajo. (omo se5alamos en la p!3ina 2+%A las tablas editadas de n0meros aleatorios Bcomo la
1ue se condens en la tabla TIA de este libroC consisten en p!3inas en las 1ue se disponen los
d3itos +A 1A 2A...A y ' en forma parecida a si se 3eneraran por medio de un jue3o de probabilidad o
a*ar 1ue da a cada d3ito la misma probabilidadA 1Q1+A de aparecer en cual1uier lu3ar determinado
de la tabla.


E9EMP,O 2ome una muestra aleatoria de tama5o n E 12 de la poblacin consistente en las
cantidades de impuestos sobre las ventas cobradas por 24 farmacias de una ciudad en diciembre
de 1''+ numerando las farmacias como ++1A ++2A ++3A...A y 24 Bdi3amosA en el orden en 1ue
aparecen en el directorio telefnicoC y leyendo n0meros aleatorios de tres d3itos de la se3unda
p!3ina de la tabla TIA usando la vi3esimose<taA la vi3esimos7ptima y la vi3esimoctava columnas
empe*ando en el se<to ren3ln y continuando p!3ina abajo.

$olucin $i3uiendo estas instruccionesA obtenemos

+- 23+ +4' +22 11' 1%+ +%- +- 1'3 232 ++ 1-

donde i3noramos los n0meros mayores 1ue 24J s cual1uier n0mero se 6ubiera repetidoA tambi7n
lo 6abramos i3norado. ,os doce n0meros 1ue tenemos a1u son los n0meros asi3nados a las
farmaciasJ las cifras de impuestos sobre las ventas correspondientes constituyen la muestra
aleatoria deseada.

El procedimiento 1ue usamos en este ejemplo fue bastante sencilloA pero lo 6abra sido m!s si
6ubi7ramos tenido el softaare 1ue deja la mayor parte del trabajo a una computadora. Por
ejemploA la impresin de la .3ura 11 presenta una muestra aleatoria 3enerada por computadora
de tama5o n E 12 de la poblacin .nita 1ue consta de los n0meros 1A 2A 3A...A 2- y 24. ,os
valores de la muestra son 1'4A 14A 82A 141A -+A 3'A %1A 12'A 41A %A 8- y 22.

52
"i3ura 11 Muestra aleatoria 3enerada por computadora.

(uando tenemos acceso a listas de manera 1ue podemos numerar artculos f!cilmenteA es sencillo
tomar muestras aleatorias con la ayuda de tablas de n0meros aleatorios o computadoras. Por
des3raciaA no obstanteA 6ay muc6as situaciones en 1ue es imposible proceder del modo en 1ue
acabamos de describir. Por ejemploA si 1ueremos utili*ar una muestra para estimar el di!metro
e<terior medio de miles de balas para rodamientos empacadas en un lote 3rande o si deseamos
estimar la altura media de los !rboles de un bos1ueA sera imposible numerar las balas o los
!rbolesA seleccionar n0meros aleatorios y lue3o locali*ar y medir las balas o !rboles
correspondientes. En 7stas y en muc6as situaciones similaresA todo lo 1ue podemos 6acer es
proceder de acuerdo con la de.nicin del diccionario de la palabra IaleatorioIA espec.camenteA
Ial a*arA sin objetivo o propsitoI. Esto esA no debemos seleccionar o rec6a*ar nin30n elemento de
una poblacin por1ue pare*ca tpico o noA tampoco debemos favorecer o i3norar nin3una parte de
la poblacin por su disponibilidad o falta de la misma y as sucesivamente. (on cierta reservaA a
menudo podemos tratar al3unas de dic6as muestrasA de 6ec6oA como si fueran muestras
aleatorias.

Vasta a6ora 6emos anali*ado el muestreo aleatorio slo en relacin con las poblaciones .nitas.
Para las poblaciones in.nitasA decimos 1ue

*na muestra e tama+o n e una poblacin in,nita es aleatoria si consta e "alores
e "ariables aleatorias inepenientes -ue tienen la misma istribucin%

(omo lo se5alamos en relacin con las distribuciones binomiales y normalesA 7sta es la ImismaI
distribucin a la 1ue nos referimos como la poblacin de la 1ue efectuamos un muestreo. @s
mismoA por IindependienteI 1ueremos decir 1ue las probabilidades relacionadas con cual1uiera de
las variables aleatorias son las mismas sin 1ue ten3an importancia los valores 1ue se 6ayan
observado para las otras variables aleatorias.

Por ejemploA si en doce lan*amientos de un dado obtenemos 2A %A 1A 3A -A A A %A 2A A 1 y 2A estos
n0meros constituyen una muestra aleatoria si son valores de variables aleatorias independientes
1ue tienen la misma distribucin de la probabilidad
Para dar otro ejemplo de una muestra aleatoria d7 una poblacin in.nitaA supon3a 1ue oc6o
estudiantes obtuvieron las si3uientes lecturas del punto de ebullicin de un compuesto de silicio:
13-A 1%3A 14+A 18A 1%4A 1%2A 13 y 1%+ 3rados (elsius. &e acuerdo con la de.nicinA estos
valores constituyen una muestra aleatoria si son valores de variables aleatorias independientes
1ue tienen la misma distribucinA di3amosA la distribucin normal con ' E 1%2 y E 1+. Para
ju*3ar si en realidad 7ste es el casoA tendramos 1ue cerciorarnosA entre otras cosasA de 1ue las
t7cnicas de medida de los oc6o estudiantes sean i3ualmente precisas Bde modo 1ue sea la misma
para cada una de las variables aleatoriasCA 1ue no 6aya colaboracin B1ue pueda 6acer 1ue las
variables aleatorias sean dependientesC y 1ue no 6aya impure*as en las materias primas.

>.3 'ise:os de muestras

,a 0nica clase de muestras 1ue 6asta a6ora 6emos estudiado son las muestras aleatorias y no
6emos considerado ni si1uiera la posibilidad de 1ue en ciertas condiciones pueda 6aber muestras
1ue son mejores Bdi3amosA m!s f!ciles de obtenerA m!s econmicas o m!s informativasC 1ue las
muestras aleatorias y no 6emos entrado en detalles sobre la pre3unta de lo 1ue podra 6acerse
cuando el muestreo aleatorio es imposible. &e 6ec6oA 6ay muc6as otras maneras de seleccionar
una muestra de una poblacin y 6ay una 3ran cantidad de biblio3rafa sobre el tema de los
procedimientos del dise5o del muestreo.

En estadsticaA un dise5o de una muestra es un plan de.nitivoA determinado por completo antes
de recopilar cual1uier datoA para tomar una muestra de una poblacin de referencia. @sA el plan
de tomar una muestra aleatoria simple de 12 de 24 farmacias de una ciudad usando una tabla de
n0meros aleatorios de una manera espec.ca constituye una muestra aleatoria. En las tres
secciones si3uientes estudiaremos brevemente al3unas de las clases m!s comunes de dise5os de
muestras.
53

>.! uestreo sistem"tico

En al3unos casosA la manera m!s pr!ctica de efectuar un muestreo consiste en seleccionarA
di3amosA cada vi37simo nombre de una listaA cada decimose3unda casa de un lado de una calleA
cada 1uincua37sima pie*a de una lnea de ensamble y as sucesivamente. Esto se conoce como
muestreo sistem!tico y se puede inte3rar un elemento de a*ar en esta clase de muestreo usando
n0meros aleatorios para seleccionar la unidad en la 1ue se debe comen*ar. @un1ue una muestra
sistem!tica puede no ser una muestra aleatoria de acuerdo con la de.nicinA a menudo es
ra*onable tratar las muestras sistem!ticas como si fueran muestras aleatoriasJ de 6ec6oA en
al3unos casosA las muestras sistem!ticas en realidad pueden ser mejores 1ue las muestras
aleatorias simples por1ue las primeras se e<tienden en forma m!s re3ular sobre las poblaciones
enteras.

$i los miembros de la poblacin aparecen secuencialmente en el tiempoA como en el caso de las
pie*as de una lnea de produccin o de automviles 1ue se apro<iman a una caseta de peajeA el
muestreo sistem!tico dispersara el trabajo del muestreo en el tiempo. Esta deseable caracterstica
del muestreo sistem!tico ayuda a reducir el n0mero de errores de o.cina.

El verdadero ries3o del muestreo sistem!tico yace en la posible presencia de periodicidades
ocultas. Por ejemploA si inspeccionamos cada cuadra37sima pie*a fabricada por una m!1uina
particularA los resultados seran poco acertados siA como consecuencia de un fracaso recurrente
re3ularmenteA cada d7cima pie*a producida por la m!1uina tiene imperfecciones. &el mismo
modoA una muestra sistem!tica podra dar resultados ses3ados si entrevistamos a los residentes
de cada decimose3unda casa a lo lar3o de cierta calle y as sucede 1ue cada decimose3unda casa
a lo lar3o de la calle es una casa en es1uina o un lote doble.

>.& uestreo estrati6cado

$i tenemos informacin acerca de la constitucin de una poblacin Bes decirA su composicinC y
7sta es importante para nuestra investi3acinA podemos mejorar el muestreo aleatorio por medio
de la estrati.cacin. Este es un procedimiento 1ue consiste en estrati.car Bo dividirC en un n0mero
de subpoblaciones o estratos 1ue no se traslapen y lue3o tomar una muestra de cada estrato. $i
los artculos seleccionados de cada estrato constituyen muestras aleatorias simplesA el
procedimiento completo Bprimero la estrati.cacin y lue3o el muestreo aleatorioC se conoce como
muestreo aleatorio BsimpleC estrati.cado.

$upon3aA por ejemploA 1ue 1ueremos estimar el peso medio de cuatro personas con base en una
muestra de tama5o 2 y 1ue los pesos BdesconocidosC de las cuatro personas son 11%A 13%A 1 8% y
2+% libras. Por tantoA el peso medio 1ue 1ueremos estimar es
$i tomamos una muestra aleatoria ordinaria de tama5o 2 de esta poblacinA las

E - muestras posibles son 11% y 13%A 11% y 18%A 11% y 2+%A 13% y 18%A 13% y 2+%A y 18%
y 2+% y las medias correspondientes son 12%A 1%+A 1-+A 1-+A 14+ y 1'%. Obs7rvese 1ue ya 1ue
cada una de estas muestras tiene una probabilidad de 1Q- las probabilidades de 1ue nuestro error
Bla diferencia entre la media de la muestra y ' E 1-+C sea +A 1+ o 3% son 1Q3A 1Q3 y 1Q3. @6oraA
supon3a 1ue sabemos 1ue dos de estas personas son 6ombres y dos son mujeres y 1ue los pesos
BdesconocidosC de los 6ombres son 18% y 2+% librasA mientras 1ue los pesos BdesconocidosC de las
mujeres son 11% y 13% libras. Estrati.cando la muestra Bpor se<oC y seleccionando aleatoriamente
a uno de los dos 6ombres y a una de las dos mujeresA encontramos 1ue slo 6ay cuatro muestras
estrati.cadasA 11% y 18%A 11% y 2+%A 13% y 18%A y 13% y 2+%. ,as medias de estas muestras son
1%+A 1-+A 1-+ y 14+ y a6ora las probabilidades de 1ue nuestro error sea + o 1+ son 1Q2 y 1Q2 . Es
evidente 1ue la estrati.cacin 6a incrementado en 3ran medida nuestras probabilidades de tener
una estimacin buena BcercanaC de[ peso medio de las cuatro personas.

54
EsencialmenteA el objetivo de la estrati.cacin es formar estratos de tal forma 1ue 6aya al3una
relacin entre estar en un estrato particular y la respuesta 1ue se busca en el estudio estadstico y
1ue en los estratos separados 6aya tanta 6omo3eneidad BuniformidadC como sea posible. En
nuestro ejemplo e<iste tal relacin entre el se<o y el peso y 6ay muc6a menos variabilidad en el
peso de cada uno de los dos 3rupos de la 1ue 6ay en la poblacin completa.

En el ejemplo anteriorA usamos la distribucin proporciona]A 1ue implica 1ue los tama5os de las
muestras de estratos diferentes son proporcionales a los tama5os de los estratos. En 3eneralA si
dividimos una poblacin de tama5o K en ? estratos de tama5o K1A K2A...A y K? y tomamos una
muestra de tama5o n1 del primer estratoA una muestra de tama5o n2 del se3undo estratoA...A y una
muestra de tama5o n? del >
7simo
estratoA decimos 1ue la poblacin es proporcional si
o si estas ra*ones tienen casi la misma posibilidad. En el ejemplo sobre los pesosA tuvimos Ki E 2A
K2 E 2A n1 E 1 y n2 E 1A de modo 1ue
y de 6ec6oA la distribucin fue proporcional.


Tama+os e muestra para la istribucin proporcional
donde n E n1 W n2 W = = = W n? es el tama5o total de la muestra. (uando es necesarioA usamos los
n0meros enteros m!s pr<imos a los valores obtenidos por medio de esta frmula.

E9EMP,O $e debe tomar una muestra estrati.cada de tama5o n E -+ de una muestra de
tama5o KE A+++A 1ue consta de tres estratos de tama5o K1 E 2A+++A K2 E 1A2++ y K3 E 8++. L$i
la distribucin debe ser proporcionalA cu!n 3rande debe ser la muestra tomada de cada estratoM

Solucin $ustituyendo en la frmulaA obtenemos
Esto ilustra la distribucin proporcionalA pero debemos a3re3ar 1ue 6ay otras maneras de distribuir
porciones de una muestra entre los diferentes estratos. #na de 7stasA conocida como la
distribucin ptimaA se describe en el ejercicio 1+.2- de la p!3ina 2%. Ko slo maneja el tama5o
del estratoA como en la distribucin proporcionalA sino 1ue tambi7n maneja la variabilidad Bo
cual1uier otra caracterstica pertinenteC del estrato.

,a estrati.cacin no se limita a una variable 0nica de clasi.cacin o una caracterstica y las
poblaciones a menudo se estrati.can de acuerdo con varias caractersticas. Por ejemploA en una
encuesta sistemati*ada dise5ada para determinar la actitud de sus estudiantesA di3amosA 6acia un
nuevo plan de ense5an*aA un sistema estatal de educacin preparatoria con 14 escuelas podra
estrati.car su muestra no slo con respecto a las preparatoriasA sino tambi7n en relacin con el
3rado escolarA el se<o y la especialidad. @sA parte de la muestra se destinara a los alumnos de
se<o femenino de primer 3rado de la preparatoria @ en la especialidad de in3enieraA otra parte de
la muestra se distribuira a los alumnos de se<o masculino de se3undo 3rado de la preparatoria ,
en la especialidad de in3l7s y as sucesivamente. Vasta cierto puntoA la estrati.cacin como 7staA
llamada estrati.cacin cru*adaA incrementar! la precisin Bcon.abilidadC de ]as estimaciones y
otras 3enerali*aciones y se usa com0nmenteA en particular en el muestreo de la opinin y la
investi3acin de mercado.

55
En el muestreo estrati.cadoA el costo de la toma de muestras aleatorias de los estratos
individuales con frecuencia es tan alto 1ue a los encuestadores slo se les dan cuotas 1ue deben
cubrir de los diferentes estratosA con al3unas restricciones Bsi no es 1ue nin3unaC sobre la manera
en 1ue las deben cubrir. Por ejemploA al determinar las actitudes de los electores 6acia las mejoras
de los servicios de salud para las personas de edad avan*adaA a un encuestador 1ue trabaja en
cierta !rea se le podra pedir 1ue entreviste a - 6ombres 1ue vivan en casa propiaA trabajen en
forma independiente y 1ue sean menores de 3+ a5os de edadA a 1+ mujeres asalariadas de % a
-+ a5os de edad 1ue vivan en departamentoA a 3 6ombres jubilados mayores de -+ a5os 1ue
vivan en casas mviles y as en forma consecutivaA con la seleccin real a discrecin del
encuestador. Este procedimiento se conoce como un muestreo por cuotas y es convenienteA
relativamente econmico y en ocasiones necesarioA pero como se efect0a con frecuenciaA las
muestras resultantes no tienen las caractersticas esenciales de las muestras aleatorias. $in contar
con nin30n control a su disposicinA los encuestadores tienden naturalmente a seleccionar a
individuos a 1uienes se tiene acceso m!s f!cil ==personas 1ue trabajan en el mismo edi.cioA
personas 1ue compran en la misma tienda o 1ui*! residen en la misma !rea 3eneral. Por tantoA los
muestreos por cuotas en esencia son muestras de la opinin y las inferencias basadas en tales
muestras por lo re3ular no llevan a nin3una clase de evaluacin estadstica formal.

>.; uestreo por con1lomerados

Para ilustrar otra importante clase de muestreoA supon3a 1ue una 3ran empresa 1uiere estudiar
los patrones variables de los 3astos familiares en el !rea de $an &ie3o. @l intentar elaborar los
pro3ramas de 3asto de 1A2++ familiasA la empresa encuentra 1ue el muestreo aleatorio simple es
pr!cticamente imposibleA dado 1ue no se cuenta con las listas adecuadas y el costo de ponerse en
contacto con las familias dispersas en una vasta !rea Btal ve* teniendo 1ue llamar dos o tres veces
a 1uienes no se encuentren en casaC es muy alto. #na manera en 1ue se puede tomar una
muestra de esta situacin es dividiendo el !rea total de inter7s en varias !reas m!s pe1ue5as 1ue
no se traslapenA di3amosA man*anas de una ciudad. Entonces se seleccionan al3unas casas al
a*arA y toda^ las familias Bo muestras de 7stasC 1ue residen en estas man*anas constituyen la
muestra de.nitiva.

En este tipo de muestreoA llamado muestreo por con3lomeradosA se divide la poblacin total en un
n0mero determinado de subdivisiones relativamente pe1ue5as y se seleccionan al a*ar al3unas de
estas subdivisiones o con3lomerados para incluirlos en la muestra 3eneral. $i los con3lomerados
son subdivisiones 3eo3r!.casA como en el ejemplo anteriorA este muestreo se llama tambi7n
muestreo por !reas. Para dar otro ejemplo del muestreo por con3lomeradosA supon3a 1ue el
decano de estudiantes de una universidad 1uiere saber la opinin de la fraternidad 6acia la
escuela acerca de cierta disposicin nueva. Puede tomar una muestra de con3lomerados
entrevistando a al3unos o a todos los miembros de varias fraternidades seleccionadas al a*ar.

@un1ue las estimaciones basadas en el muestreo por con3lomerados por lo 3eneral no son tan
con.ables como las estimaciones 1ue se basan en muestras aleatorias simples del mismo tama5oA
a menudo son m!s con.ables por costo unitario. Ge.ri7ndonos de nuevo a la encuesta sobre los
3astos familiares en el !rea de $an &ie3oA es f!cil apreciar 1ue bien puede ser posible tomar una
muestra de con3lomerados de varias veces el tama5o de una muestra aleatoria simple por el
mismo costo. Es muc6o m!s econmico visitar y entrevistar en conjunto a familias 1ue viven cerca
1ue seleccionar al a*ar a familias 1ue viven en un !rea e<tensa.

En la pr!cticaA se pueden aplicar varios de los m7todos de muestreo 1ue 6emos anali*ado para el
mismo estudio. Por ejemploA si estadistas del 3obierno 1uieren estudiar la opinin de los
profesores de escuelas primarias estadounidenses 6acia ciertos pro3ramas federalesA podran
estrati.car primero el pas por estados o al3unas otras subdivisiones 3eo3r!.cas. Para tomar una
media de cada estratoA podran usar el muestreo de con3lomerados subdividiendo cada estrato en
un n0mero determinado de subdivisiones 3eo3r!.cas m!s pe1ue5as Bdi3amosA distritos escolaresC
y .nalmente podran usar un muestreo aleatorio simple o un muestreo sistem!tico para
seleccionar una muestra de profesores de educacin primaria de cada con3lomerado.

(onclusiones

56
,a estadstica es la rama de las matem!ticas 1ue se ocupa de reunirA or3ani*arA y anali*ar
informacin cuantitativa o cualitativaA y deducir de ellaA 3racias al an!lisis de estos datosA unos
si3ni.cados precisos o unas previsiones para el futuroA siendo un au<iliar en la toma de decisiones
al proporcionar variacionesA deteccin de patrones y relaciones de datos econmicos y
administrativos.

Por el tipo de informacin 1ue se trateA podemos dividir la estadstica en dos cate3orasA la
esta.stica escripti"a 1ue trabaja con todo el universo de la poblacinA por ejemplo la venta de
una empresaA en la cual se consideran la totalidad de los productos o servicio facturadosA y la
esta.stica inferencial) 1ue utili*a para su manejo solo una muestra representativa de la poblacinA
como por ejemplo con la estatura promedio de una escuelaA se puede inferir la estatura promedio
de la poblacin estudiantil de ese 3rado de estudio.

@ las caractersticas medidas de una muestra se les llama estad4stica muestralA y a las
caractersticas medidas de una poblacin estadsticaA o universoA se les llama par(metros de la
poblacin. En otras palabras las caractersticas de una muestra se llaman estadsticasA y las
caractersticas de una poblacin se llaman par!metros.

En estadstica se conoce como poblacin al a3re3ado de todas la unidades individualesA sean
personasA cosas...A 1ue se 6allan en una situacin determinadaA pudiendo ser estas .nitas e
in.nitas. #na muestra es solo una parte de la poblacin.
Por claridadA para la representacin de variables en esta.sticas se emplean letras latinas
min0sculasA y en par/metros se emplean letras 3rie3as o letras latinas may0sculasA en la si3uiente
tabla se muestran las mas
usualesA as comoA sus diferencias.
Poblacin Muestra


&e.nicin (oleccin de elementos
considerados
Parte o porcin de la
poblacin seleccionada para
su estudio
(aractersticas OPar!metrosP OEstadsticasP
$mbolos 2ama5o de la poblacin E N 2ama5o de la muestra E n
Media de la poblacin E h Media de la muestra E<
&esviacin est!ndar de la
poblacin E k
&esviacin est!ndar de la
muestra E s

El muestreo aleatorio simpleA es un procedimiento de seleccinA donde todos los elementos de
una poblacin tienen la misma probabilidad de ser seleccionados en una muestra.

,a distribucin muestralA es la distribucin de los valores individuales en una muestraA la cual
sea representativa de la poblacin. (abe se5alar 1ue el valor de una estadstica muestral varia de
una muestra a otraA a causa de la variabilidad del muestreo aleatorioA o el error de muestreo.

,a media /5 es el promedio aritm7tico de los valores ya sea de la poblacin o de la muestra.

,a varian)a /6
2
C indica en promedio 1ue tan alejados est!n los datos de la mediaA es el promedio
de la suma de los cuadrados de las desviacionesA entendi7ndose como desviacin la diferencia de
un datos con respecto a la media.

,a desviacin t4pica o est(ndar /6CA es la ra* cuadrada de la varian*a.

,a distribucin muestral de mediasA es el conjunto de todas las mediasA de todas las muestras
posibles 1ue se pueden e<traerA con o sin repla*o de una determinada poblacin.

57
!on reempla)amiento se entiende 1ue para inte3rar una muestraA se selecciona una unidad
elemental y lue3o esta se re3resa a la poblacin antes de tomar la si3uiente unidadA y sin
reempla)amientoA la unidad seleccionada no es re3resada a la poblacin. (omo es observable
una unidad elemental puede repetirse con el primer m7todo.
El 7eorema del 84mite central determina la incertidumbre acerca del error cuando usamos la
media de una muestra para estimar la media de una poblacin. Kos sirve para muestral 3randesA
se puede obtener una apro<imacin cercana de la distribucin muestral de la media con una
distribucin normal. 9usti.ca el uso de m7todos de curva normal en una 3ran variedad de
problemasA se aplica a poblaciones in.nitas y tambi7n a poblaciones .nitas cuando el tama5o de
la muestraA a pesar de ser 3randeA no constituye m!s 1ue una pe1ue5a porcin de la poblacin.
,a 9istribucin t de $tudent es utili*ada para estimar la media poblacional a partir de una
muestra pe1ue5aA o sea menores a 3+. E<isten variasA cada una asociada con el grao e libertaA
esto es el numero de observadores menos uno.
,a 9istribucin :i cuadrada tiene por objeto comparar la media de una muestra 6ipot7tica de
una poblacinA en un muestreo pe1ue5o. $e utili*a para comprara la varian*a de una muestra con
la varian*a Vipot7tica de una poblacin. $e denota con la letra 3rie3a TB9iC elevada al cuadrado.
Este m7todo corresponde al campo de la estadstica param7trica. I3ual 1ue la istribucin t
depende del numero de 3rados de libertad asociados al problema.
#n estimador es una estadstica de muestra utili*ada para estimar un par!metro de poblacin. ,a
media de la muestra BC puede ser un estimado de la media de la poblacin BC y la porcin de la
muestra se puede utili*ar como estimador de la porcin de la poblacin. Mientras 1ue una
estimacin es una valor espec.co observado de una estadsticaA 6acemos una estimacin si
tomamos una muestra y calculamos el valor 1ue toma nuestro estimador es esa muestra.
,as cualidades de un buen estimador son: Imparcialidad BKo ses3adoCA e.cienciaA co6erencia y
su.ciencia.
Para buscar el me;or estimadorA la muestra debe ser distribuida de manera sim7tricaA en la 1ue
los valores de la mediana y de la media coinciden.
#na estimacin puntual es un solo numero 1ue se utili*a para estimar un par!metro de
poblacin desconocidoA una desventaja es 1ue a menudo resulta insu.cienteA debido a 1ue solo
tiene dos opcionesA correcta o e1uivocada. #na estimacin de intervaloA se utili*a para la
estimacin de intervalo de un par!metro de poblacinA teniendo un mayor mar3en en la
estimacin.
#n estimador insesgado es una estadstica muestral cuyo valor esperado es i3ual al par!metro
por estimar. ,a eliminacin de todo sesgo se ase3ura cuando la estadstica muestral corresponde
a una muestra aleatoria tomada de una poblacin o un sub3rupo racional.
En los Intervalos de conan)a para la di<erencia entre dos medias con el uso de la
distribucin normalA el uso de la distribucin normal se basa en las mismas condiciones 1ue en
el caso de la distribucin de muestreo de la mediaA salvo 1ue est!n implicadas dos muestras. El
error est!ndar pertinente para la distribucin de muestreo es el error est!ndar de la diferencia
entre medias.
El uso de la distribucin t e intervalos de conan)a para la di<erencia entre dos mediasA
es necesario cuando: $e desconocen las desviaciones est!ndar de la poblacinA las muestras son
pe1ue5asA se supone 1ue las poblaciones tiene una distribucin apro<imadamente uniformeA las
dos varian*as poblacionales BdesconocidasC son i3uales.
,a determinacin de un intervalo de con.an*a para una proporcin poblacional desconocida con
base en el proceso de /emoulli son complejoA los libros de te<to recomiendan se utilice la
58
distribucin normal con apro<imacin de la solucin e<acta de intervalos de conan)a para la
proporcin de la poblacin.
Para la determinacin del tama=o de muestra re+uerido para la estimacin de la
proporcinA puede determinarse especi.cando el nivel de con.an*a re1uerido y el error de
muestreo aceptable y 6aciendo una estimacin inicial BsubjetivaC de la proporcin poblacional
desconocida.
,os intervalos de conan)a para la di<erencia entre dos proporcionesA se basa en las
mismas condiciones 1ue las e<puestas en relacin con la distribucin de muestreo de la
proporcinA salvo 1ue este caso involucra a dos muestras y los re1uerimientos se aplican a cada
una de ellas.
En la distribucin :i cuadrada e intervalos de conan)a para la varian)a . desviacin
est(ndarA las distribuciones 9i cuadradas no son sim7tricasA en consecuenciaA un intervalo de
con.an*a de dos e<tremos para una varian*a o desviacin est!ndar implica el uso de dos valores
diferentes de T
2
A no del m7todo Ode mas o menosP utili*ados en los intervalos de con.an*a
basados en las distribuciones normales y t.
,as pruebas de "iptesis param3tricas tienen como propsito determinar si el valor supuesto
B6ipot7ticoC de un par!metro poblacionalA como la media de la poblacinA debe aceptarse como
verosmil con base en evidencias muestrales. E<isten tres procedimientosA los cuales conducen a
las mismas decisiones cuando se emplean los mismos est!ndares de probabilidad By ries3oCA estos
son: m7todo del valor crticoA m7todo del valor PA m7todo de intervalos de con.an*a.
En el M3todo del valor cr4ticoA se determinan los as llamados valores crticos de la
estadstica de prueba 1ue dictaran el rec6a*o de una 6iptesisA tras de lo cual la estadstica de
prueba observada e compara con los valores crticos.
El m3todo del valor PA se basa en la determinacin de la probabilidad condicional de 1ue el
valor observado de una estadstica muestral puede ocurrir al a*arA dado 1ue un supuesto
particular sobre el valor del par!metro poblacional asociado sea en efecto correcto.
El m3todo de intervalos de conan)aA se basa en la observacin de si el valor supuesto de
un par!metro poblacional est! incluido en el ran3o de valores 1ue de.ne a un intervalo de
con.an*a para ese par!metro.
En la prueba de una "iptesis re<erente a la media usando la distribucin normalA puede
usarse para probar un valor 6ipot7tico de la media de la poblacinA si n 3+A o bien cuando n ` _
3+ pero la poblacin tiene una distribucin normal y a es conocida.

Errores /ipo I y /ipo II en pruebas de <iptesis

En la probabilidad de Error tipo IA por de.nicinA la proporcin de !rea en la re3in de rec6a*o es
i3ual a la proporcin de los resultados muestrales 1ue ocurriran en esa re3in en caso de 1ue la
6iptesis nula sea cierta.
,a probabilidad del error tipo II 6incado con la letra 3rie3a _ BbetaCA la 0nica manera en 1ue se
puede determinar es respecto de un valor espec.co incluido en el ran3o de la 6iptesis
alternativa.
Para la determinacin del tama=o de muestra re+uerido para probar la mediaA puede
determinarse especi.cando: El valor 6ipot7tico de la mediaA un valor alternativo espec.co de la
media tal 1ue la diferencia con el valor 6ipot7tico nulo se considere importanteA el nivel de
si3ni.cancia por emplear en la pruebaA la probabilidad del error tipo II 1ue 6abr! de permitirse y el
valor de la desviacin est!ndar de la poblacin k.
59
Prueba de una "iptesis re<erente a la media usando la distribucin tA el procedimiento es
id7ntico al descrito anteriormente para la distribucin normalA e<cepto por el uso de t en lu3ar de *
como la estadstica de prueba.
=todo del valor P para pruebas de <iptesis referentes a la media de la poblacin) se
determina por medio del m7todo del valor PA probabilidad 1ue se compara despu7s con el nivel de
si3ni.cancia a asi3nadoA la idea es 1ue un valor P bajo indica 1ue es poco probable 1ue la muestra
ocurra cuando la 6iptesis nula es ciertaJ por lo tantoA la obtencin de un valor P bajo conduce al
rec6a*o de la 6iptesis nula.

=todo de intervalos de con6an,a para pruebas de <iptesis referentes a la media) de
acuerdo con este m7todo se elabora un intervalo de con.an*a para la media de la poblacin con
base en los resultados muestralesA tras de lo cual observamos si el valor 6ipot7tico de la media
poblacional est! incluido en el intervalo de con.an*a.

Pruebas respecto de la media del proceso en el control estadstico de procesos) la
6iptesis nula es 1ue el proceso es estable y 1ue slo e<isten causas comunes de variacin. ,a
6iptesis alternativa es 1ue el proceso es inestable e incluye variacin por causas atribuibles.

Pruebas de la diferencia entre dos medidas usando la distribucin normal) . el uso de la
distribucin normal se basa en las mismas condiciones 1ue en el caso de una muestraA e<cepto
1ue est!n implicadas dos muestras aleatorias independientes. Es similar al de la prueba de una
6iptesis referente al valor de una media poblacionalA slo di.ere en 1ue el error est!ndar de la
diferencia entre las medias se usa para determinar el valor * Bo tC asociado con el resultado
muestral.

Prueba de la diferencia entre medias usando la distribucin t) cuando la diferencia entre
dos medias se prueba con el uso de la distribucin tA un supuesto necesario en el procedimiento
est!ndarA es 1ue las varian*as de las dos poblaciones son i3uales.

Prueba de la diferencia entre medias con base en observaciones apareadasA en muc6as
situaciones las muestras se recolectan como pares de valoresA como cuando se determina el nivel
de productividad de cada trabajador antes y despu7s de un curso de capacitacin. Estos valores
se llaman observaciones apareadas o pares asociados.

Prueba de una <iptesis referente al valor de la proporcin de la poblacinA Ssta es la
base para la determinacin de intervalos de con.an*a para la proporcinA en la 1ue tambi7n se
e<plica el error est!ndar de la proporcinA sin embar3oA en el caso de intervalos de con.an*a se
re1uiere por lo 3eneral de un tama5o de muestra de al menos n E 1++.

'eterminacin del tama:o de muestra re9uerido para probar la proporcinA puede
determinarse especi.cando: el valor 6ipot7tico de la proporcinA un valor alternativo espec.co de
la proporcin tal 1ue la diferencia con el valor 6ipot7tico nulo se considere importanteA el nivel de
si3ni.cancia por aplicar en la prueba y la probabilidad de error tipo II 1ue se permitir!.

Pruebas respecto de la proporcin del proceso en el control estadstico de procesosA al
i3ual 1ue en el caso de la media del procesoA los lmites de control para una proporcin del
proceso se de.nen en Y3 unidades de error est!ndar para el valor 6ipot7tico BaceptableC.

Prueba de la diferencia entre dos proporciones poblacionalesA las dos proporciones
muestrales se combinan como base para determinar el error est!ndar de la diferencia entre
proporcionesA las dos varian*as muestrales se combinan como base para calcular el error est!ndar
de la diferencia entre medias.

Prueba de un valor <ipot=tico de la varian,a usando la distribucin 5i cuadradaA ,a
prueba puede ser una prueba unilateral o una prueba bilateralA aun1ue las 6iptesis m!s
frecuentes sobre una varian*a poblacional se relacionan con pruebas unilaterales.

60
Pruebas respecto de la variabilidad del proceso en el control estadstico de procesosA ,a
variabilidad del proceso se vi3ila y controla ya sea respecto de la desviacin est!ndar del proceso
o del ran3o del proceso.

'istribucin # y prueba de la i1ualdad de dos varian,as poblacionalesA dado 1ue cada
varian*a muestral es un estimador inses3ado de la varian*a de la misma poblacinA el valor
esperado a lar3o pla*o de la ra*n anterior es de alrededor de 1.+.

Otros m=todos para la prueba de <iptesis nulasA $i se aplica el m7todo del valor PA en lu3ar
de comparar el valor observado de una estadstica de prueba con un valor crticoA la probabilidad
de ocurrencia de la estadstica de pruebaA dado 1ue la 6iptesis nula es ciertaA se determina y
compara con el nivel de si3ni.cancia.

Estadsticas no param=tricas.

Escalas de medicinA podemos considerar 1ue son cuatro tipos de escalas de medicin en
t7rminos de la precisin representada por los valores reportados.

Kominal = los n0meros slo se usan para identi.car cate3oras.
Ordinal = los n0meros representan ran3os o jerar1uas.
Intervalo = se representan medidas 1ue son diferencias entre valores.
&e ra*n = s e<iste un punto cero realA y en consecuencia las medidas pueden compararse
en forma de ra*ones.

=todos estadsticos param=tricos contra no param=tricos G ,a base para un an!lisis
param7trico es al30n par!metro de la poblacin teniendo una distribucin conocidaA con medidas
tomadas en la escala de intervalo o ra*n. En caso de no tenerse uno o m!s de estos re1uisitos o
supuestosA pueden usarse los m7todos no param7tricosA conocidos tambi7n como m7todos libres
de distribucin.

Prueba de corridas para aleatoriedad c $e conoce como corrida a una serie de observaciones
similaresA la prueba de corridas se usa para probar la aleatoriedad de una serie de observaciones
cuando cada observacin puede ser asi3nada a una de dos cate3oras.

$na muestra0 Prueba de los si1nos = es el e1uivalente no param7trico a la prueba de una
6iptesis referente al valor de la media de la poblacin.
$na muestra0 Prueba de Bilco3on = puede usarse para probar una 6iptesis nula referente al
valor de la mediana de la poblacinA como es considera la ma3nitud de la diferencia entre cada
valor muestral y el valor 6ipot7tico de la medianaA es una prueba m!s sensible 1ue la prueba de
los si3nos.
'os muestras independientes0 Prueba de annCB<itney = puede utili*arse para probar la
6iptesis nula de 1ue las medianas de dos poblaciones son i3uales. $e supone 1ue las dos
poblaciones tienen la misma forma y dispersinA por1ue tales diferencias tambi7n podran
conducir al rec6a*o de la 6iptesis nula
Observaciones apareadas0 Prueba de los .i1nos = puede usarse para probar la 6iptesis nula
de 1ue las dos medianas de la poblacin son i3ualesA los valores muestrales deben estar al menos
en la escala ordinalA y no se re1uiere de nin30n supuesto acerca de las formas de las dos
distribuciones poblacionales.

Observaciones apareadas0 Prueba de Bilco3on = puede usarse para probar la 6iptesis nula
de 1ue las dos medianas de la poblacin son i3ualesA dado 1ue considera la ma3nitud de las
diferencias entre los valores de cada par asociadoA y no slo la direccin o si3no de la diferenciaA
es una prueba m!s sensible 1ue la prueba de los si3nos.

61
+arias muestras independientes0 Prueba de DrusEalCBallis = sirve para probar la 6iptesis
nula de 1ue varias poblaciones tienen las mismas medianasA asA es el e1uivalente no param7trico
del dise5o completamente aleatori*ado de un factor de an!lisis de varian*a.

uestreo
,os estudiosA an!lisis o investi3acionesA tienen como objetivo 6acer 3enerali*aciones acertadas
con base en muestrasA suponiendo 1ue estamos manejando las llamadas muestras aleatoriasA sin
embar3oA el muestreo aleatorio no siempre es viable o aun deseable.
uestreo Fleatorio = E<isten dos clases de poblaciones: las .nitas y las in.nitas. #na
muestra de una poblacin in.nita es aleatoria si consta de valores de variables aleatorias
independientes 1ue tienen la misma distribucin.

'ise:os de muestras = es un plan de.nitivoA determinado por completo antes de recopilar
cual1uier datoA para tomar una muestra de una poblacin de referencia.
uestreo sistem"tico = la manera m!s pr!ctica de efectuar un muestreo consiste es
seleccionarA di3amosA cada vi37simo nombre de una listaA cada decimose3unda casa de un lado
de una calle. $e puede inte3rar un elemento de a*ar en esta clase de muestreo usando n0meros
aleatorios para seleccionar la unidad en la 1ue se debe comen*ar.
uestreo estrati6cado = Este es un procedimiento 1ue consiste en estrati.car Bo dividirC en un
n0mero de subpoblaciones o estratos 1ue no se traslapen y lue3o tomar una muestra de cada
estrato.
uestreo por con1lomerados = se divide la poblacin total en un n0mero determinado de
subdivisiones relativamente pe1ue5as y se seleccionan al a*ar al3unas de estas subdivisiones o
con3lomerados para incluirlos en la muestra 3eneral.
7iblio1rafa
/onilla NildabertoA 01toos pr/cticos e inferencia esta.sticaA 2rillas 1''1. I$/K '-8=2=3'-+=.
>a*mier ,eonard 9.A Esta.stica aplicaa a la aministracin y a la econom.aA McNraaVillA 3l ed
1''8. I$/K '4+=1+=+'-1=.
"reund 9o6n E. y $imonA Esta.stica elementalA Prentice VallA 8l ed 1''. I$/K +=13=-+2-''=+.
,evin Gic6ard I y GubinA Esta.stica para aministraores) Prentice mayA -
a
edA I$/K '-8=88+=-4%=4
2iblioteca e 3onsulta Encarta 2445A Microsoft (orporation.
62

También podría gustarte