Está en la página 1de 36

ESTADISTICA II

PROFESOR WALTER LOPEZ

Estadistica Inferencial: Estimacin para una y dos poblaciones. Medias y

Proporciones.

Definicin de estimacin

Cuando hemos observado un valor numrico especfico de nuestro estimador,

nos referimos a ese valor como una estimacin. En otras palabras, una

estimacin es un valor especfico observado de una estadstica. Hacemos una

estimacin si tomamos una muestra y calculamos el valor que toma nuestro

estimador en esa muestra. Suponga que calculamos la lectura media de un

odmetro (kilometraje) a partir de una muestra de taxis en sevicio y encontramos

que sta es de 160,000 kilmetros. Si utilizamos este valor especfico para

estimar el kilometraje de la flotilla de taxis completa, el valor obtenido de 160,000

kilmetros sera una estimacin. En la tabla 9 ilustramos varias poblaciones,

parmetros de poblacin, estimadores y estimaciones.

Estimador sesgado e insesgado.

Un estimador puntual es el valor numrico de una estadstica muestral empleado

para estimar el valor de un parmetro de la poblacin o proceso. Una de las

caractersticas ms importantes de un estimador es que sea insesgado. Un

estimador insesgado es una estadstica muestral cuyo valor esperado es igual al

parmetro por estimar. Un valor esperado es el promedio a largo plazo de la

estadstica muestral. La eliminacin de todo sesgo sistemtico est asegurada

cuando la estadstica muestral corresponde a una muestra aleatoria tomada de

1
ESTADISTICA II
PROFESOR WALTER LOPEZ

una poblacin o a un subgrupo racional tomado de un proceso. Ambos mtodos

de muestreo garantizan que la muestra sea insesgada, aunque no eliminan la

variabilidad del muestreo, o error de muestreo, como se explicar en la siguiente

seccin.

En la tabla 10 se presentan algunos de los estimadores puntuales de parmetros

de la poblacin de uso ms frecuente. En todos los casos, el estimador

apropiado de un parmetro de la poblacin es sencillamente la estadstica

muestral correspondiente.

Tabla 10

Una o Dos poblaciones

Intervalos de confianza para la diferencia entre dos medias con el uso de la

distribucin normal

2
ESTADISTICA II
PROFESOR WALTER LOPEZ

A menudo es necesario estimar la diferencia entre dos medias poblacionales,

como la diferencia entre los niveles salariales de dos empresas. El estimador

puntual insesgado de (1 - 2) CS (1- 2). El intervalo de confianza se

elabora en forma similar al usado para la estimacin de la media, excepto que el

error estndar pertinente para la distribucin de muestreo es el error estndar de

la diferencia entre medias. El uso de la distribucin normal se basa en las

mismas condiciones que en el caso de la distribucin de muestreo de la media,

salvo que estn implicadas dos muestras. La frmula empleada para estimar la

diferencia entre dos medias poblacionales con intervalos de confianza es

Cuando se conocen las desviaciones estndar de las dos poblaciones, el error

estndar de la diferencia entre medias es

Cuando se desconocen las desviaciones estndar de las poblaciones, el error

estndar estimado de la diferencia entre medias dado el uso apropiado de la

distribucin normal es

3
ESTADISTICA II
PROFESOR WALTER LOPEZ

Los valores de los errores estndar de las respectivas medias incluidos en estas

frmulas se calculan con las frmulas dadas, incluida la posibilidad de usar

factores de correccin por finitud cuando corresponda

Ejemplo. El salario medio semanal de una muestra de n = 30 empleados de una

gran empresa manufacturera es, = $280.00, con una desviacin estndar

muestral de s = $14.00. En otra gran empresa, una muestra aleatoria de n = 40

empleados por hora tiene un salario medio semanal de $270.00, con una

desviacin estndar muestral de s = $10.00. El intervalo de confianza de 99%

para la estimacin de la diferencia entre los niveles salariales medios semanales

de las dos empresas es

donde

4
ESTADISTICA II
PROFESOR WALTER LOPEZ

As, podemos afirmar que el salario promedio semanal de la primera empresa es

mayor que el promedio de la segunda Empresa por un monto de entre $2.23 y

$17.77, con una confianza de 99% en esta estimacin por intervalo. Advirtase

que los - tamaos de las muestras son suficientemente grandes para permitir el

uso de Z para aproximar el valor t.

Adems del intervalo de confianza de dos extremos, tambin puede elaborarse

un intervalo de confianza de un extremo -ara la diferencia entre medias.

Distribucin t e intervalos de confianza para la diferencia entre dos medias

El uso de la distribucin t en conjuncin con una muestra es necesario cuando

1 ) Se desconocen las desviaciones estndar a de la poblacin.

2) Las muestras son pequeas (n < 30). Si las muestras son grandes, los valores

t pueden ser aproximados por la normal estndar z.

3) Se supone que las poblaciones tienen una distribucin aproximadamente

normal (recuerde que el teorema central del lmite no puede aplicarse en

muestras pequeas).

5
ESTADISTICA II
PROFESOR WALTER LOPEZ

Adems de lo anterior, cuando se usa la distribucin t para definir intervalos de

confianza para la diferencia entre dos medias, no para inferencias sobre slo

una media poblacional, por lo general se requiere del siguiente supuesto

adicional:

4) Las dos varianzas poblacionales (desconocidas) son iguales, a 21 = 22

A causa del anterior supuesto de igualdad, el primer paso para determinar el

error estndar de la diferencia entre medias cuando procede el uso de la

distribucin t es combinar las dos varianzas muestrales:

El error estndar de la diferencia entre muestras basado en el uso de la varianza

combinada estimada 2 es

Con gl = n1, + n2 - 2, el intervalo de confianza es

Intervalos de confianza para la proporcin de la poblacin

6
ESTADISTICA II
PROFESOR WALTER LOPEZ

La distribucin de probabilidad aplicable a las proporciones es la distribucin

binormial de probabilidad. No obstante, los clculos matemticos asociados con

la determinacin de un intervalo de confianza para una proporcin poblacional

desconocida con base en el proceso de Bemoulli son complejos. Por lo tanto, en

todos los libros de texto orientados a aplicaciones se utiliza la distribucin normal

como aproximacin de la solucin exacta de intervalos de confianza para

proporciones. Esta aproximacin es adecuada cuando n 30 y tanto np como

nq 5 (donde q = 1 - p). Sin embargo, cuando la proporcin de la poblacin p (o

) es desconocida, la mayora de los expertos en estadstica recomienda tomar

una muestra de n 100. Ntese que, en el contexto de la estimacin

estadstica, es desconocida, pero es estimada por ^p.

La varianza de la distribucin de proporciones sirve de base para el error

estndar. Dada una proporcin muestral observada, ^p, el error estndar de la

proporcin estimado es

En el contexto de la estimacin estadstica, la p (o ) de la poblacin se

desconoce, porque es justamente el valor por estimar. Si la poblacin es por

finitud, procede el uso del factor de correccin por finitud. Como en el caso del

error estndar de la media, por lo general se considera innecesario el uso de

esta correccin si n < 0.05 N.

7
ESTADISTICA II
PROFESOR WALTER LOPEZ

El intervalo de confianza aproximado para una proporcin poblacional es

Adems del intervalo de confianza de dos extremos, tambin puede

determinarse un intervalo de confianza de un extremo para la proporcin

poblacional.

Ejemplo. Una empresa de investigacin de mercado contacta a una muestra

aleatoria de 100 varones en una comunidad extensa y determina que una

proporcin muestral de 0.40 prefiere las navajas de afeitar fabricadas por el

cliente de esa empresa sobre todas las dems marcas. El intervalo de confianza

de 95% para la proporcin de todos los varones de la comunidad que prefieren

las navajas de afeitar del cliente de la empresa se determina de la siguiente

manera:

Por lo tanto, con una confianza de 95% estimamos la proporcin de todos los

varones de la comunidad que prefieren las navajas del cliente de la empresa con

un valor entre 0.30 y 0.50.

8
ESTADISTICA II
PROFESOR WALTER LOPEZ

Medias y proporciones

Estimacin de Parmetros

La teora de muestreo puede emplearse para obtener informacin acerca de

muestras obtenidas aleatoriamente de una poblacin conocida. Sin embargo,

desde un punto de vista prctico, suele ser ms importante y ser capaz de inferir

informacin acerca de una poblacin a partir de muestras de ellas. Dichos

problemas son tratados por la inferencia estadstica que utiliza principios de

muestreo. Un problema importante de la inferencia estadstica es la estimacin

de parmetros poblacionales o simplemente parmetros (como la media y la

varianza poblacionales), a partir de los estadsticos mustrales correspondientes

o estadsticos ( como la media y la varianza muestral.

Estimados sin Sesgo

Si la media de la distribucin muestral de un estadstico es igual al parmetro

poblacional correspondiente, el estadstico se denomina estimador sin sesgo del

parmetro; de otra manera, es denominado estimador sesgado. Los valores

correspondientes de dichos estadsticos se llaman estimados sin sesgo o

sesgados, respectivamente.

1.- La media de la distribucin muestral de las medias es x , la media

poblacional. Por lo tanto, la media muestral x es un estimado sin sesgo de la

media poblacional .

9
ESTADISTICA II
PROFESOR WALTER LOPEZ

2.- La media de la distribucin muestral de las varianzas es :

s2 = ( N-1/ N ) 2

donde 2 es la varianza poblacional y N es el tamao de la muestra .Entonces, la

varianza muestral s2 es un estimado sesgado de la varianza poblacional 2.

Usando la varianza modificada.

2 =( N/ N-1 )s2

Se encuentra que 2 = 2 , de modo que 2 es un estimado sin sesgo de 2 .Sin

embargo es un estimado de .En trminos de esperanza matemtica se poda

decir que un estadstico no esta sesgado si su esperanza es igual al parmetro

poblacional correspondiente. Por lo tanto, x y 2 no estn sesgados , porque E

Estimados Eficientes

Si las distribuciones mustrales de dos estadsticos tienen la misma media o

esperanza matemtica entonces el estadstico con la menor varianza se

denomina estimador eficiente de la media, mientras que el otro estadstico se le

llama estimador ineficiente. Los valores correspondientes de los estadsticos se

conocen, respectivamente, como estimadores eficientes. Si se consideran todos

los estadsticos posibles, cuyas distribuciones mustrales tienen la misma

media, aquel con la menor varianza suele denominarse el mejor o mas eficiente

estimador de dicha media.

10
ESTADISTICA II
PROFESOR WALTER LOPEZ

La distribucin muestral de la media y la mediana tienen la misma media; a

saber la media poblacional. Sin embargo, la varianza de la distribucin muestral

de las medias es mas pequea que la varianza de la distribucin muestral de las

medianas por lo tanto, la media muestral ofrece un estimado ineficiente de esta

De todos los estadsticos que estiman la media poblacional, la media muestral

ofrece el mejor o mas eficiente estimado. En la practica, suelen usarse los

estimados ineficientes debido a la relativa facilidad con que se obtienen algunos

de ellos.

Estimados por Punto y Estimados por Intervalo; su Confiabilidad

El estimado de un parmetro poblacional dado por un solo nmero se denomina

estimado puntual del parmetro. El estimado de un parmetro poblacional dado

por dos nmeros, entre los cuales se considera esta el parmetro, se denomina

estimado por intervalo del parmetro. Los estimados por intervalo indican la

precisin de un estimado y son, por lo tanto preferibles a los estimados por

punto.

Ejemplo: Si se dice que una distancia medida es de 5.28 metros se esta dando

un estimado por punto. Si por otro lado, la distancia es de 5.28 mas menos

0.03metros ( es decir , la distancia esta entre 5.25m y 5.31 m ) , se esta dando

un estimado por intervalo .

La informacin sobre el error o precisin de un estimado se conoce como

confiabilidad.

11
ESTADISTICA II
PROFESOR WALTER LOPEZ

Estimados por Intervalo de Confianza de Parmetros Poblacionales

Sean s y s la media y la desviacin estndar (error estndar), en ese orden, de

la distribucin muestral de un estadstico S. Entonces, si la distribucin muestral

de S es en formas aproximadas a la normal ( lo cual es verdadero para muchos

estadsticos si el tamao de la muestra es N mayor o menor que 30.

Intervalos de Confianza para Medias

Si el estadstico S es la media muestral x, entonces los limites de confianza de

95% y 99% para estimar la media poblacional estn dados por x mas menos

1.96 x y 2.50x respectivamente. De manera mas general , los limites de

confianza estn dados por x zc x donde zc que depende del nivel particular de

confianza deseado , usando los valores de x obtenidos se ve que los limites de

confianza para la media poblacional estn dados por :

X Zc /

si el muestreo se lleva a cabo a partir de una poblacin infinita o de una

poblacin finita con reemplazamiento y estn dados por :

X Zc /

12
ESTADISTICA II
PROFESOR WALTER LOPEZ

si el muestreo se realizo sin reempalzamiento de una poblacin de tamao finito

Np . generalmente , la desviacin estndar poblacional es desconocida ; por

consiguiente , para obtener los limites de confianza anteriores, se utiliza la

estimacin muestral o s .Esta mostrara ser satisfactoria cuando N se mayor o

menor que 30 para N menor que 30 , la aproximacin es pobre y se debe usar la

teora de pequeas muestras .

Intervalos de Confianza para Proporciones

Si el estadstico S es la proporcin de xitos en una muestra de tamao,

obtenida de una poblacin binomial en la que p es la proporcin de xitos es

decir la probabilidad de xito, entonces los limites de confianza para p estn

dados por la proporcin de xitos en la muestra de tamao N. Usando los

valores de p obtenidos, ve que los limites de confianza para la proporcin

poblacional estn dados por:

P Zc

Si el muestreo se efectu de una poblacin finita o de una poblacin infinita con

reemplazamiento y estn dados por:

P Zc

Si el muestreo se hizo sin el reemplazamiento de una poblacin de tamao finito

Np. Para calcular estos limites de confianza se puede usar el estimado muestral

P que por lo general, mostrara ser satisfactorio si N es mayor o igual a 30.

13
ESTADISTICA II
PROFESOR WALTER LOPEZ

Intervalos de Confianza para Diferencias y Sumas

Si S1 y S2 son dos estadsticos mustrales con distribuciones de muestreo

aproximadamente normales, entonces los limites de confianza se puede usar

para la diferencia de los parmetros poblacionales correspondientes a S1 y S2

estn dados por:

S1 y S2 zc s1 - s2

Intervalos de Confianza para Desviaciones Estndar

Los limites de confianza para la desviacin estndar de una poblacin

normalmente distribuida, estimados a partir de una muestra con desviacin

estndar s, estn dados por :

S + - Zc s = s Zc /

Para calcular estos limites de confianza se utiliza s o para estimar

Error Probable

Los limites de confianza de 50% de los parmetros poblacionales

correspondientes al estadstico S dados por S + - 0.675 s la cantidad de 0.675 s

es conocida como error probable de la estimacin.

7. Estadistica inferencial: Prueba de Hiptesis= introduccin, tipos de

error, prueba de hiptesis en una poblacin y dos poblaciones.

14
ESTADISTICA II
PROFESOR WALTER LOPEZ

Pruebas de hiptesis

El propsito de la prueba de hiptesis es determinar si el valor supuesto

(hipottico) de un parmetro poblacional, como la media de la poblacin, debe

aceptarse como verosmil con base en evidencias muestrales. Recurdese que

sobre distribuciones de muestreo, se dijo que, en general, una media muestral

diferir en valor de la media poblacional. Si el valor observado de una estadstica

muestral, como la media muestral, se acerca al valor paramtrico supuesto y

slo difiere de l en un monto que cabra esperar del muestreo aleatorio, el valor

hipottico no se rechaza. Si la estadstica muestral difiere de la supuesta en un

monto que no es posible atribuir al azar, la hiptesis se rechaza por inverosmil.

Se han desarrollado tres procedimientos distintos para la prueba de hiptesis,

todos los cuales conducen a las mismas decisiones cuando se emplean los

mismos estndares de probabilidad (y riesgo). De acuerdo con este mtodo, se

determinan los as llamados valores crticos de la estadstica de prueba que

dictaran el rechazo de una hiptesis, tras de lo cual la estadstica de prueba

observada se compara con los valores crticos. ste fue el primer mtodo en

desarrollarse, motivo por el cual buena parte de la terminologa de las pruebas

de hiptesis se deriva de l. Ms recientemente, el mtodo del valor P ha

cobrado popularidad a causa de ser el ms fcilmente aplicable a software de

cmputo. Este mtodo se basa en la determinacin de la probabilidad

condicional de que el valor observado de una estadstica muestral pueda ocurrir

15
ESTADISTICA II
PROFESOR WALTER LOPEZ

al azar, dado que un supuesto particular sobre el valor del parmetro poblacional

asociado sea en efecto correcto. El mtodo de intervalos de confianza se basa

en la observacin de si el valor supuesto de un parmetro poblacional est

incluido en el rango de valores que define a un intervalo de confianza para ese

parmetro.

Pero ms all del mtodo de prueba de hiptesis que se use, debe hacerse

notar que si un valor hipottico no se rechaza, y por lo tanto se acepta, ello no

constituye una "prueba" de que sea correcto. La aceptacin de un valor

supuesto de un parmetro indica simplemente que se trata de un valor verosmil,

con base en el valor observado de la estadstica muestral.

Pasos bsicos de la prueba de hiptesis con el mtodo de valor crtico

Paso1. Formule la hiptesis nula y la hiptesis alternativa. La hiptesis nula (H0

es el valor paramtrico hipottico que se compara con el resultado muestral. Se

le rechaza slo si es poco probable que el resultado muestral haya ocurrido

dado lo correcto de la hiptesis. La hiptesis alternativa (H1) se acepta slo si la

hiptesis nula es rechazada. En muchos libros de texto la hiptesis alternativa

tambin se designa como Ha.

Ejemplo Un auditor desea probar el supuesto de que el valor medio de la

totalidad de las cuentas por cobrar de una empresa dada es de $260.00

16
ESTADISTICA II
PROFESOR WALTER LOPEZ

tomando una muestra de n = 36 y calculando la media muestral. El auditor desea

rechazar el valor supuesto de $260.00 slo si es claramente contradicho por la

media muestral, caso ste en el que el valor hipottico recibira el beneficio de la

duda en el procedimiento de prueba. Las hiptesis nula y alternativa de esta

prueba son H0 : = $260.00 y H1 : $260.00.

Paso 2. Especifique el nivel de significancia por aplicar. El nivel de significancia

es el estndar estadstico que se especifica para rechazar la hiptesis nula. Si

se especifica un nivel de significancia de 5%, la hiptesis nula se rechaza slo si

el resultado muestral es tan diferente del valor hipottico que una diferencia por

ese monto o un monto superior ocurrira al azar con una probabilidad de 0.05 o

menos.

Ntese que si se usa el nivel de significancia de 5%, hay una probabilidad de

0.05 de rechazar la hiptesis nula aun siendo efectivamente cierta. Esto se llama

error tipo I La probabilidad del error tipo I siempre es igual al nivel de

significancia empleado como estndar para rechazar la hiptesis nula; se le

designa con la letra griega minscula (alfa), de modo que a designa tambin al

nivel de significancia. Los niveles de significancia de uso ms frecuente en la

prueba de hiptesis son los de 5% y 1%.

Ocurre un error tipo II si la hiptesis nula no se rechaza, y es por lo tanto

aceptada, cuando en realidad es falsa. La determinacin de la probabilidad del

error tipo II se explica. En la tabla correspondiente se resumen los tipos de

17
ESTADISTICA II
PROFESOR WALTER LOPEZ

decisiones y las posibles consecuencias de las decisiones tomadas en pruebas

de hiptesis.

Paso 3. Seleccione la estadstica de prueba. La estadstica de prueba ser ya

sea la estadstica muestral (el estimador insesgado del parmetro a prueba) o

una versin estandarizada de la estadstica muestral. Por ejemplo, para probar

un valor hipottico de la media poblacional, la media de una muestra aleatoria

tomada de esa poblacin podra servir como la estadstica de prueba. Sin

embargo, si la distribucin de muestreo de la media es normal, el valor de la

media muestral se convierte usualmente en un valor z, el cual funge entonces

como la estadstica de prueba.

Paso 4. Establezca el valor o valores crticos de la estadstica de prueba.

Habiendo especificado la hiptesis nula, el nivel de significancia y la estadstica

de prueba por usar, se establece entonces el(los) valor(es) crtico(s) de la

estadstica de prueba. Estos valores pueden ser uno o dos, dependiendo de si

estn implicadas las as llamadas pruebas unilaterales o bilaterales. En cualquier

caso, un valor crtico identifica el valor de la estadstica de prueba requerido para

rechazar la hiptesis nula.

Paso 5. Determine el valor de la estadstica de prueba. Por ejemplo, al probar un

valor hipottico de la media poblacional, se recolecta una muestra aleatoria y se

18
ESTADISTICA II
PROFESOR WALTER LOPEZ

determina el valor de la media muestral. Si el valor crtico fue establecido como

un valor z, la media muestral se convierte a un valor z.

Paso 6. Tome la decisin. El valor observado de la estadstica muestral se

compara con el valor (o valores) crtico(s) de la estadstica de prueba. Se

rechaza o no entonces la hiptesis nula. Si la hiptesis nula es rechazada, se

acepta la hiptesis alternativa. Esta decisin tendr relevancia a su vez para

otras decisiones por tomar por los gerentes de operacin, como la de si se est

sosteniendo o no cierto estndar de desempeo o cul de dos estrategias de

comercializacin seguir.

Prueba de una hiptesis referente a la media usando la distribucin normal

La distribucin normal de probabilidad puede usarse para probar un valor

hipottico de la media de la poblacin 1) si n 30, por efecto del teorema

central del lmite, o 2) cuando n < 30 pero la poblacin tiene una distribucin

normal y a es conocida.

Una prueba bilateral se aplica cuando nos interesa una posible desviacin en

cualquier direccin respecto del valor hipottico de la media. La frmula que se

emplea para establecer los valores crticos de la media muestral es similar a la

frmula para determinar los lmites de confianza para la estimacin de la media

de la poblacin, excepto que el valor hipottico de la media poblacional es

19
ESTADISTICA II
PROFESOR WALTER LOPEZ

en este caso el punto de referencia, en lugar de la media muestral. Los valores

crticos de la media muestral para una prueba de dos extremos, de acuerdo con

el hecho de si se conoce o no, son

Ejemplo. En relacin con la hiptesis nula formulada en el ejemplo anterior,

determine los valores crticos de la media muestral para probar la hiptesis al

nivel de significancia del 5%. Dado que se sabe que la desviacin estndar de

los montos de las cuentas por cobrar es = $43.00, los valores crticos son

Hiptesis: H0 := $260.00; Hi, : $260.00

Nivel de significancia: = 0.05

Estadstica de prueba: , con base en una muestra de n = 36 y con =

43.00

CR = valores crticos de la media muestral

En consecuencia, para rechazar la hiptesis nula la media muestral debe tener

un valor inferior a $245.95 o superior a $274.05. As, en el caso de una prueba

20
ESTADISTICA II
PROFESOR WALTER LOPEZ

de dos extremos existen dos regiones de rechazo. Los valores z de 1.96 sirven

para establecer los lmites crticos, dado que, por efecto de la distribucin normal

estndar, una proporcin de 0.05 del rea permanece en las dos colas, lo que

corresponde a la = 0.05 especificada.

Fig. 4

En lugar de establecer los valores crticos en trminos de la media muestral, en

la prueba de hiptesis los valores crticos suelen especificarse en trminos de

valores z. Para el nivel de significancia del 5% los valores crticos de z para una

prueba de dos extremos son -1.96 y + 1 .96, por ejemplo. Una vez determinado

el valor de la media muestral, se le convierte a un valor z para que pueda

comparrsele con los valores crticos de z. La frmula de conversin, segn si

ores conocida o no, es

21
ESTADISTICA II
PROFESOR WALTER LOPEZ

Ejemplo. En referencia al problema de prueba de hiptesis de los dos ejemplos

anteriores, supongamos que la media muestral es = $240.00. Determinamos

si la hiptesis nula debe rechazarse convirtiendo esta media a un valor z y

comparndolo con los valores crticos de 1.96, en esta forma:

Este valor de z se halla en la regin de rechazo de la cola izquierda del modelo

de prueba de hiptesis que aparece en la figura 5. De este modo, la hiptesis

nula es rechazada, y la alternativa, de que $260.00, aceptada. Advirtase

que en el ejemplo se habra llegado a la misma conclusin comparando la media

muestral = $240.00 con los lmites crticos para la media identificados en la

figura 4.

Fig. 5

22
ESTADISTICA II
PROFESOR WALTER LOPEZ

Una prueba unilateral resulta apropiada cuando nos interesan posibles

desviaciones slo en una direccin respecto del valor hipottico de la media.

Podra ocurrir que al auditor del ejemplo no le interesara que el promedio real de

la totalidad de las cuentas por cobrar exceda de $260.00, sino slo que pudiera

ser inferior a $260.00. As, si el auditor le concede el beneficio de la duda al

supuesto establecido de que la media real es de al menos $260.00, las hiptesis

nula y alternativa son

Nota: En muchos libros de texto, la hiptesis nula anterior se enunciara como

HO : $260.00. Por nuestra parte, hemos incluido nicamente el signo de

igual porque, incluso en una prueba de un extremo, el procedimiento se realiza

en relacin con este valor en particular. Para decirlo de otra manera, es la

hiptesis alternativa la que es unilateral.

En una prueba unilateral slo existe una regin de rechazo, de modo que la

prueba del ejemplo anterior es una prueba de la cola inferior. La regin de

rechazo de una prueba unilateral se encuentra siempre en la cola que

representa el sustento de la hiptesis alternativa. Como en el caso de una

prueba bilateral, el valor crtico puede determinarse para la media como tal o en

trminos de un valor z. Sin embargo, los valores crticos para pruebas

unilaterales se diferencian de aquellos para pruebas bilaterales, porque la

proporcin de rea dada se halla en su totalidad en una de las colas de la

distribucin. En la tabla 11 se presentan los valores de z necesarios para

23
ESTADISTICA II
PROFESOR WALTER LOPEZ

pruebas unilaterales y bilaterales. La frmula general para establecer el valor

crtico de la media muestral para una prueba unilateral, segn si a se conoce o

no, es

Obsrvese en las frmulas inmediatamente anteriores, que z puede ser

negativa, lo que resulta en una sustraccin del segundo trmino de cada

frmula.

Tabla 11 Valores crticos de Z en pruebas de hiptesis

Errores Tipo I y Tipo II en pruebas de hiptesis

En esta seccin consideraremos los errores tipo I y tipo II en relacin

estrictamente con pruebas unilaterales de una media hipottica. Sin embargo,

los conceptos bsicos aqu ilustrados se aplican tambin a otros modelos de

pruebas de hiptesis.

24
ESTADISTICA II
PROFESOR WALTER LOPEZ

La probabilidad mxima del error tipo I siempre es igual al nivel de significancia

empleado en la prueba de la hiptesis nula. Esto es as a causa de que, por

definicin, la proporcin de rea en la regin de rechazo es igual a la proporcin

de los resultados muestrales que ocurriran en esa regin en caso de que la

hiptesis nula sea cierta.

La probabilidad del error tipo II suele indicarse con la letra griega (beta). La

nica manera en que se te puede determinar es respecto de un valor especiffico

incluido en el rango de la hiptesis alternativa.

Ejemplo. La hiptesis nula es que la media de la totalidad de las cuentas por

cobrar es de $260.00 y la hiptesis alternativa que la media es inferior a esta

cantidad, prueba que habr de realizarse al nivel de significancia de 5%.

Adems, el auditor indica que una media de $240.00 (o menos) sera

considerada una diferencia material importante con el valor hipottico de

$260.00. Como en el caso anterior, = $43.00 y el tamao de muestra es n = 36

cuentas. La determinacin de la probabilidad del error tipo II implica que

1) formulemos las hiptesis nula y alternativa para esta situacin de prueba,

2) determinemos el valor crtico de la media muestral por emplearen la prueba

de la hiptesis nula al nivel de significancia de 5%,

25
ESTADISTICA II
PROFESOR WALTER LOPEZ

3) identifiquemos la probabilidad de error tipo I asociada con el uso del valor

crtico calculado en el paso anterior como base para la regla de decisin,

4) determinemos la probabilidad de error tipo II asociada con la regla de decisin

dado el valor medio alternativo especfico de $240.00.

La solucin completa es

3) La probabilidad mxima de error tipo 1 es igual a 0.05 (el nivel de

significancia usado en la prueba de la hiptesis nula).

4) La probabilidad de error tipo II es la probabilidad de que la media de la

muestra aleatoria sea igual o mayor de $248.21, dado que la media de la

totalidad de las cuentas en realidad $240.00.

26
ESTADISTICA II
PROFESOR WALTER LOPEZ

En la figura 6 se ilustra el mtodo seguido en el ultimo ejemplo. En general, el

valor crtico de la media determinado en relacin con la hiptesis nula se

"reduce" y se emplea como el valor crtico en relacin con la hiptesis alternativa

especfica. El problema ilustra la determinacin de la probabilidad del error tipo II

en una prueba bilateral.

Fig. 6

Cuando el nivel de significancia y el tamao de muestra se mantienen

constantes, la probabilidad del error tipo II disminuye a medida que el valor

alternativo especfico de la media se aleja del valor de la hiptesis nula y

aumenta a medida que el valor alternativo se acerca al valor de la hiptesis nula.

Una curva caracterstica operativa (C0) describe grficamente la probabilidad de

aceptar la hiptesis nula dados diversos valores alternativos de la media de la

poblacin. La figura es la curva CO aplicable a cualquier prueba de cola inferior

de una media hipottica al nivel de significancia de 5% basada en el uso de la

27
ESTADISTICA II
PROFESOR WALTER LOPEZ

distribucin normal de probabilidad. Ntese que es aplicable a cualquier prueba

de este tipo, porque los valores del eje horizontal han sido enunciados en

unidades del error estndar de la media. Para cualesquiera valores a la

izquierda de la probabilidad de aceptacin indica la probabilidad del error

tipo II. A la derecha de , las probabilidades indican la aceptacin correcta de

la hiptesis nula. Tal como lo indican las lneas punteadas, cuando =, la

probabilidad de aceptar la hiptesis nula es 1- o, en este caso, 1 - 0.05 = 0.95.

Fig. 7

Estimacin para una y dos poblaciones

NOTACIN GENERAL

A la hiptesis nula la denotamos por "H0:" y despus escribimos la afirmacin

que supone la nula. Por ejemplo, escribimos:

28
ESTADISTICA II
PROFESOR WALTER LOPEZ

H0: mu = 236

para querer decir la hiptesis de que el promedio de la poblacin es 236.

A la hiptesis alterna la denotamos, de igual manera, por "H1:". Por ejemplo, la

hiptesis de que menos del 43% de la poblacin prefiere nuestra marca la

denotamos

H1: p < 0.43

Para decidir si se rechaza o n la hiptesis nula vemos el valor de una

estadstica calculada de la muestra. A esta estadstica la llamamos estadstica

de prueba.

La decisin de rechazar se toma si la estadstica de prueba cae en una regin

que llamamos regin crtica o regin de rechazo.

Las regiones de rechazo se presentan de acuerdo a la hiptesis alterna.

Para determinar la regin crtica, tenemos en cuenta la significacin que

queremos para la prueba, sta se refleja en el valor crtico que se lee en la tabla

normal o t, segn sea el caso.

PRUEBAS COMUNES (con una muestra)

(1) PRUEBA z PARA UNA MEDIA

29
ESTADISTICA II
PROFESOR WALTER LOPEZ

Hiptesis Nula:

H0: mu = mu0

Estadstica de prueba:

zc = [ X-barra - mu0 ] / [ sigma / raiz(n)]

Regin Crtica:

Alternativa Regin Crtica


H1: mu < mu0 zc < -z
H1: mu > mu0 zc > z
H1: mu <> mu0 zc < -z1 zc > z1
o zc es la estadstica calculada de la muestra.

o z es un valor ledo en la tabla normal, relacionado con la

significacin de la prueba.

o z1 es, tambin un valor ledo en la tabla normal, pero distinto de z.

Esta prueba supone que sabemos el valor de sigma.

En el saln hacemos ejemplos de cmo funciona. Si Ud. no puede asistir al

saln debe revisar ejemplos y ejercicios en un libro de texto, en la seccin de

pruebas de hiptesis de una media.

EN CASO DE NO CONOCER sigma

Cuando sigma es desconocida hacemos alguna de estas dos cosas:

30
ESTADISTICA II
PROFESOR WALTER LOPEZ

Si n > 30. Usamos la misma prueba anterior pero al calcular zc lo

hacemos con la desviacin estndar de la muestra: s.

Si n <= 30. Usamos la prueba enterior con dos modificaciones

o Usamos s en lugar de sigma al calcular zc

o Los valores de la regin crtica los vemos en la tabla t de Student

en lugar de la normal; con n - 1 grados de libertad.

Hay que tener en cuenta que en el caso n <= 30 la prueba es vlida slo

si la poblacin de la que se extrae la muestra es normal. A esta prueba se

le llama: prueba t de una media

(2) PRUEBA z DE UNA PROPORCIN.

Hiptesis Nula:

H0: p = p0

Estadstica de prueba :

zc = [ p - p0 ] / [ raiz( {p0(1 - p0)} / n ) ]

Regin Crtica:

Alternativa Regin Crtica


H1: p < p0 zc < -z
H1: p > p0 zc > z
H1: p <> p0 zc < -z1 zc > z1
o en el clculo de zc, la cantidad p es la proporcin observada en la

muestra.

31
ESTADISTICA II
PROFESOR WALTER LOPEZ

o en el denominador de zc se usa el valor que asigna la hiptesis

nula: p0

o z es un valor ledo en la tabla normal, relacionado con la

significacin de la prueba.

o z1 es, tambin un valor ledo en la tabla normal, pero distinto de z.

MS NOTACIN. DOS MUESTRAS INDEPENDIENTES DE DOS

POBLACIONES.

Estudiamos ahora una situacin especial. Nuestro inters no recae ahora en una

poblacin, sino en dos. Los casos ms frecuentes de esta situacin son:

Cuando se tienen dos poblaciones por comparar. Por ejemplo, cuando se

compara el rendimiento de dos establecimientos.

Cuando se tiene una misma poblacin, pero estudiada antes de alguna

intervencin y despus de la misma. Por ejemplo, si comparamos el

porcentaje de quejas despus de hacer una mejora administrativa y antes

de hacerla.

Cuando se comparan dos modos distintos de hacer las cosas, en una

misma poblacin. Por ejemplo, al comparar los rendimientos de dos tipos

de empaque para un producto, en trminos de los costos y beneficios

asociados.

En trminos de parmetros, estudiamos:

La diferencia de promedios de las poblaciones: mu1 - mu2.

32
ESTADISTICA II
PROFESOR WALTER LOPEZ

La diferencia de proporciones en las dos poblaciones: p1 - p2.

Podramos estar interesados en la diferencia de desviaciones estndares, pero

no vamos a enfatizar esa prueba en este curso.

Para probar hiptesis acerca de esas diferencias vamos a tomar dos muestras

independientes. Esto quiere decir que las observaciones individuales en una

muestra no estn relacionadas con las de la otra muestra. Por ejemplo, si le

damos un examen a los mismos alumnos antes y despus de darles un curso de

capacitacin, no estamos haciendo muestras independientes, si quisiramos

estudiar un problema as, deberamos estudiar las diferencias individuales de

antes y despus. En cambio, si estudiamos la diferencia en la proporcin de

quejas de los clientes antes y despus de hacer el entrenamiento, tenemos dos

muestras independientes (o casi), porque los clientes seleccionados para la

muestra "antes" y "despus" son independientes.

Como las muestras son independientes, los tamaos de las dos muestras no tienen por que ser iguales y

usamos la siguiente notacin:

Estadstica Muestra 1 Muestra 2


Tamao n1 n2
Media X-barra1 X-barra2
Desv. Estndar s1 s2
Proporcin p1 p1

PRUEBAS COMUNES (con dos muestras)

(3) PRUEBA z DE DIFERENCIA DE DOS MEDIAS.

33
ESTADISTICA II
PROFESOR WALTER LOPEZ

Hiptesis Nula:

H0: mu1 = mu2

Estadstica de prueba:

zc = [ X-barra1 - X-barra2 ] / [ raiz{ (sigma1)^2 / n1 + (sigma2)^2 / n2 } ]

Regin Crtica:

Alternativa Regin Crtica


H1: mu1 < mu2 zc < -z
H1: mu1 > mu2 zc > z
H1: mu1 <> mu2 zc < -z1 zc > z1
o zc es la estadstica calculada de la muestra.

o z es un valor ledo en la tabla normal, relacionado con la

significacin de la prueba.

o z1 es, tambin un valor ledo en la tabla normal, pero distinto de z.

Esta prueba supone que sabemos el valor de las desviaciones estndares de

ambas poblaciones.

En el saln hacemos ejemplos de como funciona. Si Ud. no puede asistir al

saln,consulte un texto en la seccin: prueba de diferencia de dos medias

EN CASO DE NO CONOCER LAS DESVIACIONES ESTNDARES.

Si tenemos muestras grandes: n1 > 30 y n2 > 30, hacemos la misma prueba,

pero al calcular la estadstica de prueba usamos s1 y s2.

34
ESTADISTICA II
PROFESOR WALTER LOPEZ

Si tenemos muestras pequeas, hacemos la siguiente prueba.

(4) PRUEBA t DE DIFERENCIA DE DOS MEDIAS.

Hiptesis Nula:

H0: mu1 = mu2

Estadstica de prueba:

tc = [ X-barra1 - X-barra2 ] / [ s raiz{ 1 / n1 + 1 / n2 } ]

donde la s del denominador se calcula as

s = raiz[ { (n1 - 1)(s1)^2 + (n2 - 1)(s2)^2 } / {n1 + n2 - 2} ]

Para calcular esta tc, le sugiero que proceda as:

o calcule X-barra y s de cada muestra.

o calcule la s del denominador.

o finalmente calcule la tc.

Regin Crtica:

Alternativa Regin Crtica


H1: mu1 < mu2 tc < -t
H1: mu1 > mu2 tc > t
H1: mu1 <> mu2 tc < -t1 tc > t1
o t es un valor ledo en la tabla de Student, relacionado con la

significacin de la prueba.

35
ESTADISTICA II
PROFESOR WALTER LOPEZ

o t1 es, tambin un valor ledo en la tabla t, pero distinto de t.

Esta prueba se usa cuando las muestras son pequeas y suponemos que las

desviaciones estndares de las poblaciones son iguales. En este curso no

estudiamos qu hacer si las dos desviaciones estndares de las poblaciones

son diferentes y las muestras son pequeas.

Para usar la tabla t el nmero de grados de libertad es: n1 + n2 - 2.

36

También podría gustarte