Está en la página 1de 35

INFERENCIA ESTADSTICA

La toma de decisiones es una actividad vital en todas nuestras actividades y fundamentalmente


en aquellas relacionadas con las gerenciales, por lo que se requiere el manejo de informacin
precisa que nos permita tomar decisiones adecuadas y oportunas. Es por esta y otras razones
que de manera frecuente estamos interesados en conocer o verificar informacin sobre las
principales caractersticas de una poblacin (entre ellas Media, Varianza y Proporcin), las cuales
desde el punto de vista estadstico describen a esta ltima de manera satisfactoria. Todas y cada
una de las caractersticas de una poblacin son denominadas parmetros, que como se mencion
anteriormente son valores fijos pero generalmente desconocidos. Normalmente para llevar a cabo
la tarea de tomar decisiones utilizamos las investigaciones empricas, es decir estudios de campo
sobre muestras a travs de encuestas o ensayos experimentales.
Inferencia Estadstica: Se define como Inferencia Estadstica al proceso mediante el cual se
extraen conclusiones respecto de uno o varios de los parmetros de una poblacin, basados en la
informacin proporcionada por una muestra proveniente de dicho poblacin.
La Inferencia Estadstica se divide en dos partes:
a.- Estimacin Estadstica

'

Intervalos Por
Puntual
b.- Dcima de Hiptesis Estadstica
Estimacin Estadstica: La palabra Estimacin dentro de la estadstica est referida a
consideraciones tanto objetivas como sujetivas que pueden derivarse del anlisis de una situacin
particular, en pro de conocer el valor de un parmetro. Por su parte la Estimacin Estadstica
consiste en aplicacin de tcnicas estadsticas que nos permitan aproximarnos al valor de uno o
varios de los parmetros de una poblacin. La estimacin puede ser puntual o por intervalos.
De este punto en adelante y con la intencin de abreviar nos referiremos a la Estimacin
Estadstica simplemente como Estimacin.
El proceso de Estimacin es como se describe a continuacin: Dada la necesidad de conocer el
valor de uno o varios de los parmetros de una o ms poblaciones, nos vemos en la necesidad de
realizar investigaciones empricas que nos permitan arribar a conclusiones razonablemente
confiables a cerca de los valores de dichos parmetros.
A manera de ejemplo, supongamos que deseamos conocer el valor de un parmetro desconocido
perteneciente a una determinada poblacin. Para ello seleccionamos una muestra (x1, x2,
x3, . . ., xn) a partir de la poblacin en cuestin y nos aproximamos al valor del parmetro de inters
a travs del uso de un tipo de funciones especiales denominadas Estadstica o Estimadores.
Estadstica o Estimador: Una Estadstica o Estimador es una funcin de las observaciones de
la muestra, la cual no incluye parmetros desconocidos en su forma funcional. Cada valor
particular proporcionado por una estadstica o estimador, recibe el nombre de estimacin.
Normalmente denotamos por

a un estimador de . De forma simblica, un estimador puede ser


representado como:
57

= f(x1, x2, x3, . . ., xn)


Error Tpico de Estimacin: Dado que un estimador (

) es una variable aleatoria, esta puede


tomar diferentes valores para distintas muestras, as cada estimador tiene asociada una media y
una varianza. A la raz cuadrada positiva de la varianza de un estimador ( )
2

+ se le denomina
Error Tpico de Estimacin
( )

y representa una medida de la precisin de la estimacin, es


decir, nos muestra en promedio que tan cerca o lejos se encuentra una estimacin respecto del
valor que estamos estimando. Cuando el valor resultante de

se aproxima a cero decimos que


la estimacin es satisfactoria y concluimos lo contrario a medida que el valor se aleja de cero.
Observemos que pueden existir varios estimadores
1

,
2

,
3

, ... ,
k

, para estimar un mismo


parmetro , lo que da lugar de manera inmediata a la pregunta Cul es el mejor estimador? o lo
que es lo mismo, entre los estimadores disponibles Cul debo usar para estimar el parmetro
deseado?
Para dar respuesta a estas interrogantes, estudiaremos un conjunto de propiedades que resultan
deseables en los estimadores.
Propiedades deseables de los estimadores: Existen cuatro (04) propiedades clsicas que
definen a un buen estimador.
Insesgamiento: Se dice que

es un estimador insesgado de , si E(

) = , esto quiere decir,


que un estimador insesgado es aquel cuyo valor esperado o promedio es igual al parmetro que
intenta estimar.
Eficiencia: Sean

1 y

2 dos estimadores diferentes para , decimos que

1 es ms eficiente
que

2, si la varianza de

1 es menor que la varianza de

2 [Var(

1) < Var(

2)]. En general , un
estimador se denomina eficiente cuando este posee la menor varianza entre todos los estimadores
de un parmetro particular.
Consistencia: Decimos que un estimador

es consistente si la diferencia

- puede hacerse
tan pequea como se quiera aumentando el tamao de la muestra. Esto indica que tamaos de
muestras ms grandes generan estimaciones ms precisas.
Suficiencia: Este es quizs el concepto ms abstracto dentro de las propiedades de los
estimadores, sin embargo de forma coloquial, podemos decir que un estimador

es suficiente si
este contiene toda la informacin que est contenida en la muestra.
Recientemente se han incorporado otras propiedades deseables para los estimadores, entre ellas
tenemos:
Robustez: Decimos que un estimador

es robusto, si este es poco sensible ante el


incumplimiento o desviaciones respecto de los supuestos bsicos de los modelos estadsticos.
Resistencia: Decimos que un estimador

es resistente, si este posee la caracterstica de no ser


alterado de manera significativa por la presencia de valores extraos o atpicos, es decir, es
insensibles ante tales situaciones.
58
De acuerdo con las propiedades mencionadas anteriormente, el mejor estimador para estimar un
parmetro cualquiera, es aquel que cumpla con todas estas o con el mayor nmero posible de
dichas propiedades.
Estimacin puntual: La Estimacin Puntual consiste en la obtencin de un valor nico como
estimacin para representar el verdadero valor de un parmetro desconocido . El proceso
consiste en seleccionar una muestra y aplicar una funcin (estadstica) sobre las observaciones
obtenidas en dicha muestra, lo que finalmente producir el valor buscado o estimacin.
Ejemplo 23: Supongamos que una clase de bioestadstica de la Facultad de Farmacia est
compuesta por 25 estudiantes cuyas edades son:
21 22 20 20 19
19 26 24 20 18
22 25 19 18 21
25 21 21 22 20
29 22 19 22 21
Imaginemos por un momento que es imposible conocer todas las edades de dichos estudiantes, a
la vez que se hace indispensable conocer la edad promedio de los mismos.
Para solventar esa situacin, se decide seleccionar una muestra de tamao 5 (n=5) y tomar el
promedio aritmtico de la muestra como una estimacin de la edad promedio de los estudiantes en
cuestin. Luego de utilizar una tabla de nmeros aleatorios, la muestra queda compuesta por los
valores encerrados con crculos.
Nota 15: La seleccin de la media aritmtica de la muestra (
X
) como estimador puntual de la
media de la poblacin (x), est justificada en el hecho de que esta satisface las cuatro
propiedades clsicas deseables de los estimadores.
Sea X la variable aleatoria que representa las edades de los estudiantes, la varianza de dicha
variable ( )
2
x
es 5,04.
La media aritmtica de la muestra (
X
) es 21,4, por lo que podemos concluir que la edad
promedio de los estudiantes est alrededor de este valor.
El error tpico de estimacin para la media muestral ( ) /n
2
x x
es
5
04 5,
= 1,0040. Esta
expresin muestra en alguna mediada el error cometido al estimar la media de la poblacin a
travs de la media aritmtica a partir de una muestra de tamao n.
La edad promedio de los 25 estudiantes (x) es 21,44, que evidencia una diferencia de apenas
0,04 con respecto al valor de la media aritmtica de la muestra.
Los parmetros de uso ms comn y sus correspondientes estimadores puntuales se resumen en
la tabla siguiente:
59
TABLA # 1
PARMETRO ESTIMADOR / ESTADSTICO

x
P
x
p

2
S
2
2
2
2
1

2
2
2
1
s s
La estimacin puntual presenta dos marcadas desventajas:
- Produce un valor nico, por lo que existe una posibilidad de acertar el resultado e infinitos
chances para errar
- No podemos medir en trminos de probabilidad, la veracidad de los resultados que
estamos obteniendo
ESTIMACIN POR INTERVALOS: Dados los inconvenientes mostrados por la estimacin
puntual, es necesario recurrir a otro tipo de procedimiento que nos permita superar los problemas
presentados por ese metodologa, a la vez que proporcione una opcin viable de estimacin. Un
intervalo de confianza consiste en dos valores (Li ; Ls) denominamos lmite inferior y limite
superior respectivamente y entre los cuales se hallar el valor del parmetro en estudio con una
certeza predeterminada.
P(Li Ls) = (1 - )%
Donde :
es el nivel de significacin (0< <1)
1 - es el nivel de confianza
Longitud del intervalo: Se define la Longitud del Intervalo ( L )como la diferencia entre el Lmite
Superior (Ls) y el Lmite Inferior (Li). La tcnica de construccin de estos intervalos garantiza que
la longitud de los mismos sea mnima.
Intervalo de confianza para un parmetro : De forma general, construir un intervalo de
confianza para un parmetro determinado, consiste en demarcar un rango de valores
alrededor de un estimador (

) del correspondiente parmetro, medido en trminos del error


tpico de estimacin del estimador seleccionado.
La expresin matemtica para uno de dichos intervalos es:
P(

- K



+ K

) = 1 -
Donde
parmetro a estimar

estimador elegido
K factor de confianza

error tpico del estimador


60
Debido a sus dos colas este intervalo recibe la denominacin de bilateral.
Nota 16: El valor del factor de confianza ( K ) depender entre otras cosas de la distribucin
muestral del estimador escogido, as como del nivel de significacin seleccionado para construir el
intervalo.
En algunas situaciones estamos interesados en conocer si el valor de un parmetro ( )
cualquiera es mayor o menor que una cierta cantidad, por lo que alternativamente es posible
establecer intervalos de confianza unilaterales para dicho parmetro. Esta clase de intervalos
posee la misma conformacin terica que los intervalos bilaterales, pero uno de los extremos es
infinito.
P(

- K

< ) = 1 - Cola izquierda


P(-

<

+ K

) = 1 - Cola derecha
Dado que en este punto no se conocen los valores de

, K y

todos los anteriores intervalos


de confianza son denominados intervalos aleatorios. Cada uno de estos intervalos indican que
el valor del parmetro que se quiere estimar estar dentro de los correspondientes lmites
con una probabilidad de 1 - .
61
INTERVALO DE CONFIANZA PARA MEDIA DE UNA POBLACIN ()
Caso I: La poblacin bajo estudio sigue una ley de formacin normal con varianza (
2
)
conocida
Suponiendo que X representa los valores de la poblacin y considerando el supuesto de
distribucin normal, podemos escribir:

X ~ N ( ;
2
)
De acuerdo con la nota 13, se tiene que:
x
~ N ( ;
2
x
), donde
2
x
=
2
/n
Por consiguiente,
x
X
Z

N(0,1)
Finalmente el intervalo deseado es:
P(
x
- Z
/2
x


x
+ Z
/2
x

) = 1 -
Ejemplo 24: Suponiendo que los datos del Ejemplo 23 siguen una distribucin normal con
varianza conocida, construir un intervalo del 95% de confianza para la media de las edades.
Solucin:
Sea X la variable aleatoria que representa las edades de los estudiantes, si suponemos que X
sigue una distribucin normal, tenemos:
X ~ N ( ; 5,04

) Y
x
~ N ( ; 1,0080 )
x
= 21,4
= 5%
Z
/2 = Z0,025 = 1,96
x

= 0080 1, = 1,0040
x
t Z
/2
x

21,4 t (1,96)(1,0040)
as el intervalo resultante es: ( 19,4322 ; 23,3678 )
Observe que una vez conocidos los valores de

, K y

el intervalo deja de ser aleatorio y se


convierte en un intervalo fijo y por tanto su interpretacin ahora se realiza de forma frecuentista y
no probabilistica. Esto quiere decir que por cada cien intervalos como este que se construyan, el
95% de ellos contendrn el verdadero valor del parmetro.
Caso II: La poblacin bajo estudio sigue una ley de formacin normal con varianza (
2
)
desconocida y tamao de muestra ( n ) pequeo
62
Como en el caso anterior, supongamos que X representa los valores de la poblacin y
considerando el supuesto de distribucin normal, podemos escribir que:
X ~ N ( ;
2
)
A diferencia del caso anterior la varianza de la poblacin (
2
) es desconocida y por tanto no es
posible utilizar la expresin
x
X
Z

,
en su lugar debemos definir y trabajar con una nueva variable que denotamos por t, y que
definimos como:
x
S
X
t

donde
n
S
S
x
2

en consecuencia debemos estimar la varianza de la poblacin a travs de su contraparte muestral


(S
2
).
Esta nueva variable ya no obedece a una ley normal, y en su lugar responde a la forma de una
distribucin denominada t de Student, cuyo nico parmetro viene dado por los grados de
libertad (gl), lo que representamos a travs de la expresin siguiente.
x
S
X
t

~ t(gl)
Grados de Libertad: Los grados de libertad representan el nico parmetro de la distribucin t
de Student . El concepto de grados de libertad est ms all del alcance de estas notas
metodolgicas, sin embargo podemos decir que representan el nmero de observaciones menos
el nmero de restricciones lineales impuestas sobre estas.
Para ilustrar el concepto de grados de libertad, consideremos el peso promedio de cinco ratas de
laboratorios (
x
= 165grs ).
Si quisiramos conocer y trabajar con todos y cada uno de los pesos originales que proporcionaron
las ratas, podemos asignar un valor cualquiera al peso de cuatro de las ratas, pero el quinto valor
queda fijado automticamente. Dado el hecho que
x
es una combinacin lineal de las variables y
donde la suma de los pesos debe ser igual a
x
n, que en este caso particular toma el valor de 825
grs, si asignamos los pesos 160, 180, 138 y 159 a las primeras cuatro ratas, entonces el peso de
la ltima es 825-160-180-138-159 = 188, con lo que hemos perdido un grado de libertad, es decir,
un peso que no pudimos asignar libremente.
Nota 17: La distribucin t al igual que la distribucin normal es una distribucin de tipo continuo,
simtrica y centrada en el valor t igual a cero ( t = 0 ), aun cuando es un poco ms ancha y
aplanada que esta ltima. Sin embargo a medida que aumentan los grados de libertad, ambas
distribuciones tienden a ser idnticas.
El intervalo de confianza para este caso est dado por la siguiente expresin:
63
P(
x
- t(/2);(gl)
X
S +
x
+ t(/2);(gl)
X
S ) = 1 -
En este caso los grados de libertad se calculan como el nmero de observaciones menos uno (1),
as gl = n-1.
Ejemplo 25: Supongamos que se quiere conocer el nivel promedio de hemoglobina en la sangre
de las personas que padecen un tipo particular de afeccin. Para ello se tom una muestra de 12
pacientes, los cuales arrojaron un nivel promedio de hemoglobina de 11,3 y una varianza de 1,75.
Asumiendo que el contenido de hemoglobina en la sangre sigue una distribucin normal, construya
un intervalo del 99% de confianza para el verdadero nivel promedio de hemoglobina en la sangre
de los afectados.
Solucin: Sea X el contenido de hemoglobina en la sangre de los afectados, entonces, de
acuerdo con los supuestos.
X ~ N ( ;
2
),
x
~ N ( ;
2
x
) y
x
s
X
t

~ t(11)
x
= 11,3,
n
S
S
x
2

=
12
75 1,
= 0,3819
= 1%
De las tablas correspondientes a la distribucin t, se tiene que:
t(/2);(n-1) = t(0,005);(11) = 3,106
El intervalo buscado es 11,3 t (3,106)(0,3819) o lo que es lo mismo (10.1139 ; 12,4860).
Este resultado pudiera sugerir que la afeccin en cuestin tiende a producir descensos en los
niveles de hemoglobina de las personas que la padecen la afeccin en cuestin, con respecto a
los niveles que se consideran normales.
Caso III: La distribucin de probabilidad de la Poblacin bajo estudio es desconocida y el
tamao de la muestra (n) es grande
Observe que en esta situacin nada se dice respecto de la varianza (
2
) de la poblacin, ahora
bien si
2
es desconocida la estimamos a travs de S
2
. Dado que el tamao de la muestra es
grande, esperamos que el valor de S
2
sea muy prximo al valor del parmetro, por lo que se
puede suponer que ellos son iguales.
Por otro lado, si
2
es conocida o de acuerdo al contenido del prrafo anterior, podemos definir a la
variable Z de la manera acostumbrada como una buena aproximacin de t, y haciendo uso del
Teorema Central de Lmite (TCL) concluimos que tanto
x
como Z siguen una distribucin normal.
x
~ N ( ;
2
x
), donde
2
x
=
2
/n
64
x
X
Z

N(0, 1)

Esta conclusin nos indica que la expresin del intervalo de confianza para este caso es idntica a
la utilizada en el primer caso.
P(
x
- Z
/2
x


x
+ Z
/2
x

) = 1 -
Ejemplo 26: Supngase que se desea estimar el ingreso promedio del personal docente de la
UCV a travs de un intervalo del 90% de confianza. Para ello se seleccionaron 80 de dicho
profesores, obtenindose un ingreso promedio (
x
) de 655.000 bolvares y una varianza ( S
2
) de
133.000 bolvares.
Solucin: Como el tamao de la muestra es grande (n > 30) podemos asumir que la varianza de
la poblacin (
2
) es 133.000 bolvares y el uso del TCL nos permite establecer que:
x
~ N ( ; 133.000/80 )
x
= 655.000
x

=
80
133.000
= 40,77
= 10%
Z
/2 = Z0,05 =1.645
El intervalo requerido es:
x
t Z
/2
x

655.000 t (1,645)(40,77)
( 654932,933 ; 655067,067 )
Caso IV: La distribucin de probabilidad de la Poblacin bajo estudio es desconocida y el
tamao de la muestra (n) es pequeo
Aun cuando este caso se escapa del propsito de estas notas, es conveniente sealar que existe
una solucin debida a ruso Chebichev.
TAMAO DE MUESTRA NECESARIO PARA ESTIMAR UNA MEDIA
El Tamao de muestra ( n ) es un punto primordial dentro de la estimacin, es decir, cuantos
elementos de la poblacin de inters debemos muestrear para obtener resultados confiables y
compatibles con los recursos disponibles.
Para el caso de seleccin con reemplazo a partir de poblaciones finitas, as como para los casos
de seleccin de muestras a partir de poblaciones infinitas o aquellas muy grandes donde se pueda
obviar el uso del factor de correccin por finitud y suponiendo normalidad en la poblacin de
inters, definimos la longitud para un intervalo de confianza para la media, como:
L = (
x
+ Z
/2
x

) (
x
- Z
/2
x

) = 2 Z
/2
x

65
Sustituyendo
x

por su expresin, tenemos


L = 2Z
/2
n
2

Definiendo el error mximo de estimacin ( d ) como la mitad de la longitud de un intervalo ( d =


L/2 ), podemos rescribir la expresin anterior de la siguiente forma:
d = Z
/2
n
2

Despejando n de la expresin anterior obtenemos lo buscado.


2
2 2
2
d

/
Z
n
Ejemplo 27: Se quiere estimar el contenido promedio del suero en la sangre de una poblacin
especfica a travs de un intervalo del 95% confianza con un error mximo de estimacin de 0,85.
Suponiendo que dicha variable sigue una distribucin normal con varianza 6, cul debe ser el
tamao de la muestra?
Solucin:
= 5%
2
2
) 85 , 0 (
6 ) 96 , 1 (
n
Z
/2 = Z0,025 = 1.96
7225 , 0
6 ) 8416 , 3 (

d = 0,85 = 31,90256

2
= 6 32
Siempre que el resultado de evaluar la expresin para n finalice con un valor fraccionario, se
requiere que dicho resultado sea redondeado al entero inmediato superior, ya que el tamao de
una muestra est representado por un nmero entero no negativo.
Cuando realizamos la seleccin sin reemplazo a partir de poblaciones finitas y es necesario
considerar el factor de correccin por finitud, la expresin para la varianza de la media aritmtica
es:
2
x
=
1 N
n N
n
2
x

En este caso tenemos que el tamao de la muestra presenta la expresin siguiente:


2 2
2 /
2
2 2
2 /
) 1 (

Z N d
NZ
n
INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS ()
66
Existen situaciones en las cuales estamos interesados en comparar el valor promedio de una
variable particular observada en dos poblaciones diferentes. Lo anterior puede presentarse de dos
maneras, a partir de muestras independientes o a partir de muestras dependientes.
Iniciamos con el caso de muestras independientes de tamaos n1 y n2 respectivamente y
pospondremos hasta la seccin dedicada a la dcima de hiptesis el estudio del segundo caso.
Caso I: Ambas poblaciones siguen una distribucin normal con varianzas conocidas
El correspondiente intervalo de confianza aleatorio est dado por la expresin:
P(
x
-
2 /
Z
x

x
+
2 /
Z
x
) = 1 -
Donde
x
=
x
1 -
x
2 o
x
2 -
x
1
= 1 - 2 o 2 - 1
x
=
2
2
2
1
2
1
n n

+

2 /
Z es el factor de confianza para una distribucin normal con un nivel de significacin ( ) dado.
Ejemplo 28: Se quiere estimar la diferencia promedio en las calificaciones obtenidas por los
alumnos de dos colegios diferentes. Para ello se seleccion una muestra de 25 alumnos del
colegio A y 20 del colegio B, las cuales arrojaron una rendimiento promedio de 14.72 y 15.79
respectivamente. Suponiendo que el rendimiento es una variable normalmente distribuida en
ambos colegios con varianzas 2.35 y 3.51 respectivamente, estimar a travs de un intervalo del
95% confianza la verdadera diferencia entre las medias.
Solucin:
x
=
x
A-
x
B = 14.72-15.79 = -1,07
x
=
2
2
2
1
2
1
n n

+

=
20
51 , 3
25
35 , 2
+ = 18 , 0 09 , 0 + =0,52
=0,05
2 /
Z = Z0,025 = 1,96
as el intervalo buscado es:
x t
2 /
Z
x

(-1,07) t (1,96)(0,52)
(-1,07) t 1,02
(-2,09; -0,05)
Este resultado indica que los alumnos del colegio B obtuvieron una calificacin promedio superior
a la obtenida por los alumnos del colegio A. La diferencia oscila en el rango del intervalo calculado.
Caso II: Ambas poblaciones siguen una distribucin normal con varianzas desconocidas
y tamaos de muestras pequeos
67
Como en el caso de su contraparte para una solo media, en esta ocasin debemos utilizar la
distribucin t por las mismas razones explicadas anteriormente.
En esta variante del problema se pueden considerar dos alternativas, una es suponer que las
varianzas aunque desconocidas son iguales, y la segunda suponer que ellas son diferentes.
Varianzas iguales (
2
1
=
2
2
=
2
): Es plausible el uso de este supuesto en aquellas situaciones en
las cuales se cuenta con informacin previa sobre las varianzas de las poblaciones, o donde sea
justificables desde algn punto de vista asumir tal situacin.
En esta ocasin el intervalo de confianza posee la misma estructura que el caso anterior, con una
variante para el calculo de la varianza del estimador.
Dado que estamos suponiendo que las varianzas son iguales resulta conveniente combinar la
dispersin de ambas muestras para obtener una mejor estimacin de la varianza comn
2
aunque
esta sea desconocida. Para ello utilizamos la estadstica
2
P
S , la cual definimos a continuacin.
) 2 (
) 1 ( ) 1 (
+
+

2 1
2
2 2
2
1 1 2
P
n n
S n S n
S
Ahora esta expresin es incorporada al calculo de la varianza y por ende al calculo de la
desviacin tpica del estimador (
2
X
S

,
X
S

)
Varianza Desviacin Tpica
2
X
S

=
2
2
P
1
2
P
n
S
n
S
+
X
S

=
2
2
P
1
2
P
n
S
n
S
+
De forma equivalente al caso de la media de una poblacin, la siguiente expresin
X
S
- X


sigue una distribucin t de Student con n1 + n2 - 2 grados de libertad (gl)
En consecuencia el intervalo resultante tiene la forma siguiente:
P(
x
- t(/2);gl
x
S


x
+ t(/2);gl
x
S

) = 1 -
Ejemplo 29: Se administr un test de razonamiento a 20 estudiantes de colegios privados y a 35
de colegios pblicos. Los resultados fueron los siguientes: los alumnos de los colegios privados
obtuvieron una calificacin promedio de 14 puntos con una desviacin tpica de 6, mientras que su
contraparte en los colegios pblicos alcanzaron una evaluacin promedio de 13 puntos con una
varianza de 1.2. Asumiendo que los resultados de las pruebas responden a un esquema de
formacin normal, estime a travs de un intervalo de confianza del 99% la verdadera diferencia
entre las medias.
Solucin:
68
Sean
1
X ,
2
1
S ,
2
X y
2
2
S los promedios y varianzas muestrales correspondientes a los alumnos de
los colegios privados y pblicos respectivamente, as
x
=
1
X -
2
X = 14 13 = 1
= 0,01 /2 = 0,005
t(/2);gl = t(0,005; , 53) = 2,67
Dado que asumimos que las varianzas poblacionales son iguales, estimamos la varianza comn a
travs de
2
X
S

.
) 2 (
) 1 ( ) 1 (
+
+

2 1
2
2 2
2
1 1 2
P
n n
S n S n
S =
2 35 20
2 1 1 35 6 1 20
+
+ . ) ( ) (
= 2,9208
ahora obtenemos la varianza del estimador de acuerdo con las expresiones anteriores
2
X
S

=
2
2
P
1
2
P
n
S
n
S
+ =
35
9208 2
20
9208 2 , ,
+ = 0,2295
X
S

= 0,4790
Finalmente el intervalo fijo resultante es:
x
t t(/2);gl
x
S

1 t (2,67)(0,4790)
1 t 1,2791
(-0,2791 ; 2,2791)
Este resultado muestra que no existe diferencia significativa entre los rendimientos promedios
obtenidos por los alumnos de los colegios privados y los estudiantes de los colegios pblicos
respecto del test que se aplic. Esta conclusin se deriva del hecho que el intervalo resultante
contiene el valor cero.
En general, cuando el valor cero est contenido en el intervalo resultante debemos concluir que no
existe diferencia entre los valores promedios de ambas poblaciones. De forma contraria, si ambos
lmites del intervalo poseen signos iguales, esto sugiere que la media de una poblacin es mayor
que la otra. La media con mayor valor ser aquella que en la variable
x
(
x
=
1
X -
2
X ) muestre
el mismo signo que los lmites del intervalo.
Varianzas diferentes (
2
1

2
2
): La otra situacin posible es carecer de informacin precisa a
cerca de las varianzas de las poblaciones de inters, por lo que resulta razonable asumir que las
varianzas de las poblaciones aunque desconocidas sean diferentes.
Bajo esta situacin la expresin
X
S
- X


no responde de manera exacta a una distribucin t de
Student como en el caso de una sola media. Sin embargo un ligero ajuste en el calculo de los
grados de libertad, da como resultado una satisfactoria aproximacin a dicha distribucin, por lo
que la expresin del intervalo no vara en su forma funcional.
P(
x
-t(/2);gl
x
S


x
+ t(/2);gl
x
S

) = 1 -
Donde:
Varianza Desviacin Tpica Grados de libertad
69
2
X
S

=
2
2
2
1
2
1
n
S
n
S
+
X
S

=
2
2
2
1
2
1
n
S
n
S
+ gl =
( ) ( )
2
1
/
1
/
2
2
1
2
2

+
+
+

,
_

+
n
n S
n
n S
n
S
n
S
2
2
2 1
2
1
2
2
2
1
2
1
Ejemplo 30: Se quiere estimar la verdadera diferencia entre las edades promedio de los
estudiantes de la escuela de Sicologa de la UCV y los estudiantes de la facultad de Farmacia de
la misma universidad a travs de un intervalo del 95% de confianza. Para ello se tomaron las
muestras correspondientes, las cuales arrojaron los siguientes resultados:
Sicologa Farmacia
n1= 15 n2= 22
1
X = 21,81
2
X = 22,36
2
1
S = 2,74
2
2
S = 3,01
Construir dicho intervalo, asumiendo que la edad de los estudiantes de ambas facultades es una
variable que sigue una ley de formacin normal.
Solucin:
El intervalo a construir es de la forma
x
t t(/2);gl
x
S

, por lo que debemos calcular todos y cada


uno de los elementos que lo componen.
x
= 1
X
- 2
X
= 21,81 - 22,36 = -0,55
X
S

=
2
2
2
1
2
1
n
S
n
S
+ =
22
3,01
15
2,74
+ = 0,5652
gl=
( ) ( )
2
1
/
1
/
2
2
1
2
2

+
+
+

,
_

+
n
n S
n
n S
n
S
n
S
2
2
2 1
2
1
2
2
2
1
2
1
=
2
1 1
2 2
2

,
_

+
+

,
_

,
_

+
22
22
3,01
15
15
2,74
22
3,01
15
2,74
=
2
+
23
(0,1368)
16
(0,1827)
(0,3195)
2 2
2
= 33,2017 34
t(/2);gl = t(0,025);34 = 2,0322
-0,55 t (2,0301)(0,5652)
(-1,6986 ; 0,5986)
De manera similar al ejemplo anterior, podemos concluir que no existe diferencia entre las edades
promedios de los estudiantes de ambas facultades, dado que el valor cero est incluido dentro del
intervalo resultante.
Caso III: La forma de la distribucin de las poblaciones se desconocen y los tamaos de
muestras son grandes
Dado que no es frecuente satisfacer el supuesto de normalidad en las poblaciones bajo estudio,
analizaremos la forma de construir un intervalo de confianza para la diferencia entre dos medias de
poblaciones cuyas distribuciones no son normales, pero los tamaos de muestras seleccionados
de dichas poblaciones son grandes.
70
Podemos concluir como regla emprica que cuando n1 + n2 > 30, entonces los tamao de muestra
se pueden considerar grandes y por lo tanto las estimaciones obtenidas de dichas de dichas
muestras pueden asumirse iguales a los valores poblacionales.
Por otra parte, basados en el TCL debemos recordar que bajo estas condiciones y de acuerdo a lo
establecido en el caso III para una media, tanto
1
X como
2
X siguen una distribucin normal con
medias 1, 2 y varianzas
2
1
,
2
2
respectivamente y en consecuencia x tambin se ajusta a una
distribucin normal con media y varianza
2
x

y cuyas expresiones son similares al caso I para


construir un intervalo de confianza para la diferencia entre dos medias y aproximando la
distribucin t a travs de la distribucin normal.
P(
x
-
2 /
Z
x

x
+
2 /
Z
x
) = 1 -
Donde
x
=
x
1 -
x
2 o
x
2 -
x
1
= 1 - 2 o 2 - 1
x
=
2
2
2
1
2
1
n n

+

2 /
Z es el factor de confianza para una distribucin normal con un nivel de significacin ( ) dado.
Ejemplo 31: Para detectar los efectos producidos por cierta afeccin sobre los niveles de
hemoglobina en las que padecen dicha afeccin a travs de un intervalo del 99% de confianza, se
tom una muestra de 36 enfermos y otra de 40 personas sanas como control. De dichas muestras
se obtuvieron los siguientes resultados:
Enfermos Sanos
n1= 36 n2= 40
1
X = 10,1
2
X =12.96
2
1
S = 1,05
2
2
S = 1,29
Solucin:
Como se mencion antes, este caso es tratado de manera idntica al caso I, por lo que el intervalo
deseado tiene la siguiente forma:
x t
2 /
Z
x

Notemos que los valores de las varianzas muestrales sern utilizados en lugar de las varianzas
poblacionales.
x
= 2,86
2 /
Z = 2,576
x
=
2
2
2
1
2
1
n n

+

=
40
29 1
36
05 1 . ,
+ = 0,2478
71
El intervalo resultante es: (2,2216 ; 3,4984) y ya que ambas extremos del intervalo muestran
signos idnticos, podemos concluir que la afeccin en cuestin si disminuye los niveles de
hemoglobina.
INTERVALO DE CONFIANZA PARA LA PROPORCIN ()
Otro parmetro que comnmente estaremos interesados en estimar es la proporcin de una
poblacin (). La proporcin se define como el nmero de elementos que poseen una
caracterstica determinada, dividido por el total de elementos considerados.
El correspondiente estimador de la proporcin poblacional es la proporcin muestral p, definido
de la misma forma que su contraparte poblacional.
La distribucin apropiada a efectos de construir un intervalo de confianza para una proporcin es la
distribucin binomial, sin embargo lo complicado que resulta el empleo de esta distribucin,
fomenta el uso de la distribucin normal como una buena aproximacin para llevar a cabo esta
tarea. El uso de la normal en lugar de la binomial resulta adecuado, cuando tanto nxp como nxq
(q = 1- p) son simultneamente mayores que cinco (5).
El intervalo aleatorio resultante es:
P(p - Z
/2
p

p + Z
/2 p

) = 1 -
Donde
P = proporcin muestral
p

=
n
) (1
Z
/2 = factor de confianza para una distribucin normal con un nivel de significacin ( ) dado.
Ejemplo 32: Para efectos de conocer el estado del proceso de produccin de un laboratorio
farmacutico, un inspector de calidad desea estimar a travs de un intervalo del 95% de confianza
la proporcin de unidades defectuosas que se producen en dicho laboratorio. Para ello toma una
muestra de 60 unidades y la examina, encontrando que 16 de ellas muestran defectos de
manufactura.
Solucin:
Dado que los valores de nxp (16) y nxq (44) son mayores que cinco (5), resulta apropiado realizar
la construccin del intervalo requerido mediante una aproximacin a travs de la distribucin
normal.
El intervalo en cuestin es: p t Z
/2
p

P = 16/60 = 0,2667
q = 44/60 = 0,7333
Z
/2 = 1,96
p

=
n
) (1

n
p) p(1
=
60
) 0,2667(1 2667 0,
= 0,0571
72
Debemos realizar esta aproximacin para
p

debido a que justamente estamos estimando a


dado que este es desconocido.
El intervalo fijo resultante es (0,1548 ; 0,3786), lo que sin duda alguna sugiere que el proceso
actual de manufactura no est en buen estado o no es ptimo.
TAMAO DE MUESTRA NECESARIO PARA ESTIMAR UNA PROPORCIN
Como para el caso de la media de la poblacin, resulta de inters conocer cuantas unidades
estudiar para obtener resultados satisfactorios. El anlisis es similar al anterior por lo que:
Para el caso de seleccin con reemplazo a partir de poblaciones finitas, as como para los casos
de seleccin de muestras a partir de poblaciones infinitas o aquellas muy grandes donde se pueda
obviar el uso del factor de correccin por finitud y suponiendo normalidad en la poblacin de
inters, el tamao de la muestra se obtiene a travs de la siguiente expresin:
2
2
2
d
pq
/
Z

n
Cuando realizamos la seleccin sin reemplazo a partir de poblaciones finitas y es necesario
considerar el factor de correccin por finitud, la expresin para la varianza de la media aritmtica
es:
n =
pq Z 1) (N d
pq NZ
2 2
2
+
INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES ()
Con frecuencia estamos interesados en comparar las proporciones de dos poblaciones, para ello
seleccionamos muestras independientes de cada poblacin y a partir de ellas podemos estimar la
verdadera diferencia que pudiera existir entre ambas proporciones poblacionales. La forma de
ejecutar este procedimiento es similar al empleado en la diferencia entre dos medias.
El correspondiente intervalo de confianza aleatorio es:
P(p - Z
/2
p

p + Z
/2 p

) = 1 -
Donde
p = Diferencia proporcional muestral
p

=
2
2 2
1
1 1
n
) (1
n
) (1
+

Z
/2 = factor de confianza para una distribucin normal con un nivel de significacin ( ) dado.
Ejemplo 33: Con el objeto de comparar el tiempo de recuperacin experimentado por los
pacientes que sufren cierta enfermedad frente a la aplicacin de dos tipos diferentes de
tratamiento, se trataron 80 pacientes con el tratamiento A, mientras que otros 90 fueron tratados
con el tratamiento B. Al cabo de una semana 57 de los pacientes del primer grupo se haban
recuperado, mientras que del segundo grupo se haban recuperado un total de 79. Los
73
patrocinantes de ambos tratamientos decidieron comparar estos resultados a travs de un
intervalo del 99% de confianza.
Solucin:
Tal como en el caso de una proporcin, el hecho de contar con muestras grandes y proporciones
alejadas de 0 y de 1, podemos apoyarnos en el TCL y emplear la aproximacin mediante el
empleo de la distribucin normal y para construir el intervalo de confianza requerido, el cual
muestra la siguiente estructura:
p t Z
/2
p

p = 0,7125 0,8778 = 0,1653


Z
/2
p

=
2
2 2
1
1 1
n
) (1
n
) (1
+


2
2 2
1
1 1
n
) p (1 p
n
) p (1 p
+

=
90
) 0,8778(1
80
) 0,7125(1 8778 0 7125 0 , ,
+

= 0,0613
el intervalo deseado es (-0,3231 ; -0,0075), de este se desprende claramente que el tratamiento B
produce mejores tiempos de recuperacin en una semana que el tratamiento A.
INTERVALO DE CONFIANZA PARA LA VARIANZA (
2
) DE UNA POBLACIN
La varianza de una poblacin es un parmetro de bastante relevancia, por lo que resulta til contar
con un procedimiento que nos permita alcanzar una estimacin lo ms precisa posible del mismo.
A continuacin se describe un procedimiento basado en el hecho de que la poblacin en cuestin
sigue una distribucin normal.
Sabemos que el estimador puntual por excelencia de
2
es S
2
,sin embargo la distribucin muestral
de este no es conocida, aun cuando puede ser aproximada por la distribucin normal cuando el
tamao de muestra es de por lo menos 100. Pero en lugar de S
2
tomaremos a la expresin
2
2

1)s (n
como base para construir el intervalo para
2
.
La cantidad
2
2

1)s (n
sigue una distribucin Chi-cuadrado con n-1 grados de libertad
1
]
1

2
1) (n
2
2
~

1)s (n
, por lo que,
2
) 2 / ( 1



2
2

1)s (n

2
) 2 / (

ahora, manipulando la expresin anterior y despejando


2
, se obtiene el intervalo de confianza
aleatorio deseado. Para ello, primero multiplicamos por (n -1)s
2
cada trmino de la inecuacin
precedente, quedando
74
2 2 2
1)s (n 1)s (n

2
2 1
2
2 1 ) / ( ) / (



tomando el reciproco de esta ltima expresin se obtiene
2
2
2
2 1 ) / ( ) / (


2
2
2
1)s (n

1)s (n

el cual constituye el intervalo buscado.


Para conseguir un intervalo de confianza aleatorio para la desviacin tpica de la poblacin, basta
con tomar raz cuadrada al intervalo de la varianza.
2
2
2
2 1 ) / ( ) / (


2 2
1)s (n

1)s (n

A diferencia de los intervalos de dos colas estudiados hasta ahora, los presentes intervalos
muestra dos valores diferentes de la distribucin chi-cuadrado, esto debido al hecho de que dicha
distribucin no es simtrica.
Ejemplo 34: Supngase que el contenido (ml) de los envases de 25 ml utilizados por un
laboratorio farmacutico para presentar sus productos, es una variable aleatoria normalmente
distribuida, de la cual desea conocer su valor. Con ese objetivo en mente selecciona una muestra
de 38 unidades y calcula su varianza muestral, la cual result tener un valor de 5ml (s
2
= 5).
Calcular un intervalo del 90% de confianza para la varianza y otro para la desviacin tpica.
Solucin:
n 1 = 38 1= 37
s
2
= 5
(/2);n-1 = (0,05);37 = 24,0749
(1 - /2);n-1 = (0,95);37 = 52,1923
los intervalo resultantes son (3,5446 ; 7,6843) y (1,8827 ; 2,7721) respectivamente, de donde
podemos concluir que el contenido de los envases presentan una alta variacin (entre un 7% y un
11%), si consideramos la capacidad total de los envases.
INTERVALO DE CONFIANZA PARA EL COCIENTE ENTRE DOS VARIANZAS (
2
2
2
1
/ )
De forma anloga a lo visto para el caso de las medias y las proporciones, con frecuencia se
desea comparar las varianzas de dos poblaciones diferentes.
Para desarrollar un procedimiento que nos permita comparar las varianzas de dos poblaciones
diferentes, debemos seleccionar muestras independientes de cada una de dichas poblaciones, las
cuales a su vez deben estar distribuidas de manera normal.
Como en el caso anterior, los estimadores puntuales
2
1
s y
2
2
s por si solos no pueden ser
empleados para construir un intervalo de confianza para el cociente de dos varianzas y en su lugar
75
empleamos como punto de partida la expresin
2
2
2
2
2
1
2
1
/ s
/ s

, la cual sigue una distribucin F de


Sdenecor con n1 - 1 y n2 1 grados de libertad para el numerador y denominador respectivamente.
Al igual que la chi-cuadrado, la distribucin F es asimtrica.
As
F(1-/2)

2
2
2
2
2
1
2
1
/ s
/ s

F(/2)
manipulando la expresin anterior vemos que el intervalo de confianza aleatorio buscado es
2) - (1
2
2
2
1
2
2
2
1
2) (
2
2
2
1
F
s s
F
s s
/ /
/

/

a efectos de interpretacin debe verificar si el intervalo resultante contiene o no el valor uno (1), lo
que sin duda indica que las varianzas son iguales. En caso contrario, si ambos limites son
inferiores (superiores) a uno (1), entonces la variabilidad del grupo 2 es mayor (menor) que la
variabilidad del grupo 1.
Ejemplo 35: Para comparar la variabilidad del tiempo de reaccin ante un estimulo visual, se
seleccion una muestra de 25 personas aparentemente sanas y una segunda muestra de 30
personas con problemas visuales. Las varianzas muestrales fueron 0,5 seg. y 2.1 seg.
respectivamente. Se requiere construir un intervalo del 95% de confianza para el verdadero
cociente entre las variables.
Solucin:
Para emplear la solucin planteada anteriormente, es necesario suponer que la variable en estudio
sigue en ambas poblaciones una distribucin normal.
2
2
2
1
s s / = 0,5/2.1 = 0,2381
F(/2); (n1-1), (n2 1) = F(0,025); (24), (29) = 2,1540
F(1-/2); (n1-1), (n2 1) = F(0,975); (24), (29) = 0,4510
Normalmente las tablas de la distribucin F muestran solo uno de los dos valores anteriores, para
hallar el otro se debe hacer uso de una interesante propiedad de dicha distribucin.
Supongamos que a partir de nuestra tabla conseguimos el valor de F(0,025); (24), (29) = 2,1540, entonces
para obtener el valor de F(0,975); (24), (29) buscamos F(0,025); (29), (24) = 2,2174 en la misma tabla (invertidos
los grado de libertad), luego el reciproco del valor hallado, es la cantidad buscada F(0,975); (24), (29) = 1 /
2,2174.
De manera similar, si nuestra tabla nos proporciona el valor de F(0,975); (24), (29) = 0,4510, entonces el
valor de F(0,025); (24), (29), lo obtenemos como el reciproco de F(0,975); (29), (24) = 0,4643.
El intervalo resultante es (0,1105 ; 0,5280), de aqu podemos concluir que la variabilidad del grupo
2 es mayor que la variabilidad del grupo 1, esto sugiere que las personas con problemas visuales
76
estn viendo afecto su tiempo de reaccin ante el estimulo en cuestin, motivado a dichos
problemas.
77
DCIMAS DE HIPTESIS ESTADSTICAS
A fin de tomar las ms certeras decisiones respecto de una determinada situacin, es conveniente
basarse en la mayor cantidad y calidad de informacin posible. La tcnica de la dcima de
hiptesis estadstica constituye una va confiable para verificar la informacin relacionada con uno
a varios de los parmetros de una poblacin de inters, por lo que las conclusiones obtenidas a
travs de este tipo de procedimientos, pueden servir de base para trazar las directrices de una
exitosa estrategia.
Como se mencion en la introduccin del punto referente a la inferencia estadstica, la dcima de
hiptesis es una forma de hacer inferencia. Aun cuando la estimacin por intervalos y la dcima de
hiptesis son conceptualmente diferente y en consecuencia se tratan de manera separada, ambas
tcnicas estn ntimamente relacionadas, al punto que es posible emplear los intervalos de
confianza para chequear la valides de una hiptesis estadstica, a la vez que resulta factible invertir
el orden de presentacin de estas tcnicas.
Una Hiptesis Estadstica es una proposicin, afirmacin o conjetura acerca del valor de uno o
varios de los parmetros de una poblacin, relacin entre los parmetros de poblaciones diferentes
o la forma de la distribucin de una poblacin determinada, entre otras aplicaciones.
Por lo dicho hasta el momento, siempre estaremos interesados y dispuestos a validar una
hiptesis estadstica, antes de hacer uso de la informacin en ella contenida. La Dcima de
Hiptesis es el procedimiento a travs del cual, apoyados en la informacin proporcionada por
una muestra aleatoria proveniente de la poblacin de inters o por los datos obtenidos a travs de
un experimento, nos permite verificar la validez de una hiptesis estadstica.
Un posible esquema a seguir para realizar la dcima de una hiptesis estadstica, es como se
muestra en el conjunto de pasos siguientes:
PASO 1: Establecimiento de las hiptesis de inters
El procedimiento de dcima de hiptesis estadstica requiere del establecimiento de dos
proposiciones denominadas hiptesis nula (Ho) e hiptesis alternativa (H1) respectivamente, las
cuales no siempre resulta obvio como deben formularse, de suerte que las conclusiones a que se
arribe sean adecuadas para el investigador o para quien deba tomar las decisiones pertinentes. A
continuacin se describen las pautas generales que se emplean para plantear las hiptesis nula y
alternativa, en tres de las aplicaciones en las cuales resulta bastantes comn el empleo de sta
tcnica.
Establecimiento de Ho y H1 en problemas de investigacin
Supongamos que histricamente conocemos que los estudiantes de psicologa de la UCV que
cursaron la signatura estadstica bajo el mtodo clsico de enseanza, muestran un promedio de
12 puntos en dicha materia. Un grupo de docentes que se han dedicado a estudiar esta situacin,
plantearon un enfoque diferente para la enseanza de dicha asignatura en la mencionada escuela,
el cual segn su opinin mejorar el rendimiento promedio de los referidos estudiantes. Para
probar dicho enfoque se sometieron a este, un total de tres cursos.
Debe tenerse presente que los docentes que promueven el nuevo enfoque estn a la bsqueda de
informacin que les permita confirmar que ste, efectivamente mejora el rendimiento promedio de
los estudiantes (>12). Las hiptesis de investigacin adecuadas para el caso que acaba de
78
plantearse, debe establecerse como una hiptesis alternativa, por lo que para este caso las
hiptesis quedaran como:
Ho: 12 H1: >12
Observe que en primer trmino se tiene el beneficio de la duda y se considera que el nuevo
enfoque es tan o menos efectivo que el enfoque clsico, lo cual podr ser rebatido solo si se
rechaza la hiptesis nula propuesta.
Establecimiento de Ho y H1 en problemas de validacin de una afirmacin
Imaginemos que el gerente de un laboratorio farmacutico asegura que en la lnea de produccin
de un determinado frmaco, el contenido promedio de los envases que salen de su laboratorio es
de 125 cc. Seleccionando una muestra de dichos envases y midiendo su contenido se podra
verificar la afirmacin del gerente. En este tipo de procedimiento por lo general se presume la
buena fe, y por lo tanto aceptamos como cierta la afirmacin del gerente a menos que la evidencia
demuestre lo contrario, as las hiptesis son:
Ho: 125 H1: <125
Aqu presumimos la buena fe por parte del laboratorio, y damos por descontado que este
efectivamente cumple con todas las especificaciones tcnicas del producto que comercializa.
Establecimiento de Ho y H1 en problemas de toma de decisiones
La eficacia de un frmaco depende de manera crucial de la cantidad de principio activo que este
contiene en su composicin qumica. Si dicha cantidad es baja, el medicamento se comporta como
un placebo y pudiera considerarse como una estafa, por el contrario si es ms alta que los lmites
considerados tolerables por el cuerpo humano, existe el riesgo de intoxicacin y muerte, por lo que
pudieran enfrentarse cargos judiciales. Por tal razn, es de vital importancia que la cantidad
promedio de principio activo en cada dosis est entre los lmites tolerables.
Suponiendo que los requerimientos promedios por dosis sean de 100 mg, entonces las hiptesis
se plantean como:
Ho: =100 H1: 100
En estos casos es posible clasificar como adecuada o inadecuada la formulacin del frmaco, de
acuerdo con la informacin disponible y los fines para los cuales es manufacturado.
De acuerdo a la naturaleza de la proposicin establecida en la hiptesis nula, sta puede
clasificarse como simple (=) o compuesta ( o ).

simple Hiptesis
0 0
: H


compuestas Hiptesis
0 0 0 0
: H y : H
La aceptacin de H0 implica que los datos de la muestra muestran evidencia suficiente para apoyar
dicha hiptesis; mientras que su rechazo indica la incompatibilidad entre los datos disponibles y la
hiptesis nula planteada, por lo que consideramos que apoyan a otra hiptesis complementaria,
llamada hiptesis alternativa.
79
Zonas de
rechazo
de Ho (*)
-V
t
V
t
Zona de
rechazo
de Ho (*)
V
t
Zona de
rechazo
de Ho (*)
-V
t

La Hiptesis alternativa, corresponde generalmente al conjunto de los valores complementarios
del parmetro de inters, con respecto de la proposicin establecida en la hiptesis nula.

simple Hiptesis
0 1
: H


compuestas Hiptesis
0 1 0 1 1
: H y : H : H < >
PASO 2: Fijacin del nivel de significacin ()
Es conveniente e indispensable fijar el nivel de error (0<<1) que estamos dispuestos a tolerar
durante la ejecucin del procedimiento. Normalmente este valor es igual a 1%, 5% o 10%,
pudiendo ser utilizados otros valores porcentuales. La eleccin del nivel de significacin depende
de manera crucial de los recursos disponibles, entre los que destacan tiempo y dinero, recursos
siempre limitados a la hora de realizar una investigacin.
Al fijar el nivel de significacin tambin queda fijado de manera automtica el nivel de confianza
(1- ), el cual determina la seguridad con la cual podremos emplear los resultados obtenidos.

PASO 3: Seleccin del estadstico para la dcima
De acuerdo con el parmetro y las condiciones bajo las cuales se est realizando la verificacin de
la hiptesis, debemos elegir entre los posibles Estadsticos (

) o sus funciones ( )

f( ), que en
concordancia con las propiedades deseables de los estimadores, nos permita de manera
adecuada comparar los resultados muestrales o experimentales con las hiptesis planteadas.
Aqu debemos establecer tanto el valor del estadstico o la funcin de ste que hayamos
seleccionado, como la forma de la distribucin de probabilidad asociada.
PASO 4: Determinacin de las Regiones Crticas
Regin de Aceptacin: es un conjunto de valores determinado bajo ciertas reglas, tal que si el
valor de la estadstica o la funcin de sta seleccionada para la dcima, evaluada en el paso 3 cae
dentro de esta zona, la hiptesis H0 se declara no contraria al valor de la estadstica (esto no
significa que sea verdadera sino que su falsedad no ha sido comprobada).
Regin de Rechazo: es un conjunto de valores ubicados hacia los extremos de las distribuciones
de probabilidad que se emplean en la verificacin de las hiptesis estadsticas. Si la estadstica de
prueba o la funcin de sta seleccionada para la prueba, toma un valor que est dentro de la(s)
regin(es) crtica(s), se declara como una evidencia contraria a lo establecido en H0, por lo que
dicha hiptesis debe ser rechazada, ya que la evidencia de los datos no la respaldan.
Valores Crticos: son aquellos valores que separan la regin de aceptacin de la(s) regin(es) de
rechazo, en general denotamos un valor crtico por aquella letra que identifica a la distribucin que
estamos empleando, acompaada por un subndice t, que seala que se trata de un valor tomado
de las tablas correspondiente a dicha distribucin (Vt).
80
Zonas de
rechazo
de Ho (*)
-V
t
V
t
Zona de
rechazo
de Ho (*)
V
t
Zona de
rechazo
de Ho (*)
-V
t

En las siguientes figuras se muestran las regiones crticas para el caso de una dcima de
hiptesis, empleando una distribucin simtrica.
Figura 1
Regiones crticas para una dcima de dos colas (H1: o)
Figura 2
Regiones crticas para una dcima de hiptesis de cola derecha (H1: > o)
Figura 3
Regiones crticas para una dcima de hiptesis de cola izquierda (H1: < o)
PASO 5: Construccin de la regla de decisin
Una vez delimitadas las zonas crticas, establecemos las reglas de decisin de acuerdo con ellas.
Las reglas de decisin nos permitirn decidir si aceptamos o rechazamos la hiptesis nula que
estamos sometiendo a evaluacin. La regla de decisin se expresar siempre en trminos de Ho.
Aceptar Ho, si el valor del estadstico o la funcin de este que fue seleccionado y evaluado en el
paso 3, muestra un valor que se encuentra en la regin de aceptacin.
De manera equivalente se puede indicar lo anterior como:
81
Zona de
aceptacin
de Ho
(1-) * (/2) * (/2)
Zonas de
rechazo
de Ho (*)
-V
t
V
t
Zona de
aceptacin
de Ho
(1-) * ()
Zona de
rechazo
de Ho (*)
V
t
Zona de
aceptacin
de Ho
(1-)
* ()
Zona de
rechazo
de Ho (*)
-V
t

Rechazar Ho, si el valor del estadstico o la funcin de este que fue seleccionado y evaluado en el
paso 3 muestra un valor que se encuentra fuera de la regin de aceptacin, o lo que es lo mismo,
rechazamos Ho, si el valor del estadstico o la funcin de este que fue seleccionado y evaluado en
el paso 3 muestra un valor que se encuentra en la(s) regin(es) de rechazo.
PASO 6: Conclusiones
De acuerdo con la decisin adoptada en el paso 5 debemos describir de forma explicita el
significado de aceptar o rechazar Ho, segn sea el caso, lo que constituye en una conclusin
estadstica. Adems se deben realizar las conclusiones o recomendaciones tcnicas que dicha
decisin implica, como antesala a las decisiones que habrn que adoptarse.
Errores que se pueden cometer a la hora de ejecutar una dcima de hiptesis
Durante la ejecucin de un procedimiento de dcima de hiptesis se desea aceptar la hiptesis
nula si ella es cierta y en consecuencia rechazarla si es falsa, sin embargo el hecho de ejecutar
dicha tcnica basada en el empleo de informacin muestral, hace que este procedimiento no sea
infalible, es decir, es posible cometer errores, en particular dos tipos de errores denominados error
tipo I y error tipo II respectivamente.
Error Tipo I: es el error que se comete cuando se rechaza H0, cuando en realidad ella es
verdadera. Este error se denotar por alfa (), es decir, coincide con el nivel de significacin.
= P(Rechazar Ho / Siendo Ho cierta)
Error Tipo II: es el error que se comete cuando aceptamos H0, siendo esta falsa. Este error se
denotar por beta ().
= P(Aceptar Ho / Siendo Ho falsa)
Estado de naturaleza
DECISIN
Aceptar H0 Descartar H0
H0 es Cierta Accin correcta (1-) Error Tipo I ()
H0 es Falsa Error Tipo II () Accin Correcta (1-)
DCIMA DE HIPTESIS PARA LA MEDIA DE UNA POBLACIN ()
Al igual que ocurri con la estimacin por intervalos, al momento de ejecutar un procedimiento de
dcima de hiptesis respecto de la media de una poblacin, se pueden presentan diferentes
situaciones, de acuerdo con la informacin disponible para tal fin. A continuacin revisaremos
algunos de los casos que pueden surgir:
Caso I: La poblacin bajo estudio se distribuye de forma normal con varianza conocida
Este caso lejos de considerarse real puede ser visto como una mera referencia acadmica, ya que
est basado en el hecho de que la varianza de la poblacin es conocida, cuando en realidad y
como se mencion anteriormente, las parmetros son valores fijo pero generalmente
desconocidos, de aqu que tratemos este caso como poco prctico en la vida real.
82
En el cuadro 1 se muestran tanto el estadstico como la funcin del estadstico que se emplean
para este caso.
Cuadro 1
Estadstico y funcin del estadstico
H0 H1 Estadstico / funcin
0 < 0
X
x
c

X
Z

0 > 0
= 0 0
Ejemplo 36: El laboratorio farmacutico ALFA afirma en las etiquetas de presentacin del frmaco
A, que el contenido de los envase (X) donde se expende dicho medicamento es de 125 cc, y de
acuerdo a la experiencia de observacin en el proceso de llenado de dichos envases, le permite a
la gerencia del laboratorio indicar que la varianza de dicha variable es igual a 2,5 cc tal y como lo
establecen las especificaciones tcnicas de la maquinaria empelada para tal fin.
Para verificar la informacin suministrada por la gerencia a travs de una dcima de hiptesis,
durante una visita de inspeccin a dicho laboratorio por parte de las autoridades competentes se
tom una muestra de 25 envases del frmaco A y se midi el contenido en cc a cada uno de ellos.
Si los datos obtenidos a travs de la muestra soportan una hiptesis nula de que el contenido
promedio de los envases es mayor o igual a 125 cc, el laboratorio se ver libre de cualquier
sancin: De modo contrario se estara violentado lo indicado en las etiquetas, considerndose tal
situacin como un engao al pblico y por tanto el laboratorio sera susceptible a la aplicacin de
medidas de sancin.
Supongamos que en contenido en cc de los envases del frmaco A (X) es una variable
normalmente distribuida y que los resultados de la muestra arrojaron una media aritmtica igual a
124 cc.
PASO 1: Establecimiento de las hiptesis
Como primer paso establecemos las hiptesis: la hiptesis nula otorga el beneficio de la duda al
laboratorio y en consecuencia se asume que el contenido promedio de los envases es de 125 cc o
mayor, es decir, aceptamos que el laboratorio cumple con la informacin indicada en las etiquetas.
Mientras que la hiptesis alternativa indica que el laboratorio no cumple con lo sealado en las
etiquetas de los envases.
Ho: 125
H1: < 125
El conjunto de hiptesis indica que se trata de una dcima de hiptesis de una cola o unilateral
inferior o de cola izquierda.
PASO 2: Eleccin del nivel de significacin
Como se mencion oportunamente, el nivel de significacin mide la probabilidad de cometer error
tipo I, por ende este debe ser bajo para no correr el riesgo de acusar y sancionar errneamente al
laboratorio. Como ya sabemos 1, 5 y 10 por ciento son los valores tradicionales, por lo que aqu
asumiremos un valor de 5%.
83
-1,645
z
= 0
Zona de
rechazo
de Ho (*)
124
z
= 125

Zona de
rechazo
de Ho (*)
= 0,05
PASO 3: Seleccin del estadstico para la dcima
Como se mencion en el tema relativo a las distribuciones maestrales y la construccin de los
intervalos de confianza, el estimador que emplearemos a la momento de trabajar con la media de
una poblacin, ser la media de aritmtica de la muestra o una funcin de ella, tal y como se
muestra en el cuadro 1.
A modo de ejemplo ilustraremos el procedimiento de dcima de hiptesis empleando tanto el
estadstico como la funcin de ste.
Dado que X sigue una distribucin normal, podemos concluir que tanto
X
como Z tambin siguen
una distribucin normal.
Bajo el supuesto de hiptesis nula cierta:
X ~ N (125 ; 2,5)
X
~ N (125 ; 2,5/25)
Zc ~ N (0 ; 1)
De los datos de la muestra obtuvimos un valor de 124 cc para la media aritmtica (
X
= 124 cc),
mientras que la Z calculada (Zc) a partir de
X
es igual a (124-125)/ (2,5/25) = -3,16.
PASO 4: Determinacin de las Regiones Crticas
En este caso utilizaremos la distribucin normal, ya que tanto el estadstico como la funcin de
este responder a una distribucin normal. La cola en la distribucin terica se ubica en el sentido
que lo seala la hiptesis alternativa, luego el valor de la distribucin o valor terico que buscamos
remos en la respectiva tabla, divide las zonas de aceptacin y rechazo de Ho. Este valor se busca
en funcin del nivel de significacin.
En este ejemplo = 0,05 5%, por lo que el nivel de confianza (1-) de nuestros resultados es de
0,95 95%. Si decidimos ejecutar la dcima empleando la funcin del estadstico, debemos en
primer lugar ubicar en la tabla de la distribucin normal estndar un valor de Z (denominado Z de
tabla o Zt), digamos Z

tal que dicho valor deje a su izquierda un rea equivalente a . Al realizar la


bsqueda en la referida tabla encontramos que el valor en cuestin es -1,645. Observe que dicho
valor divide la curva en dos partes: una a su izquierda y cuya rea es de 0,05 y la otra ubicada a
su derecha y cuya rea es de 0,95 que constituyen las zonas de rechazo y aceptacin de Ho
respectivamente.
84
-1,645
z
= 0
Zona de
rechazo
de Ho (*)
124
z
= 125

Zona de
rechazo
de Ho (*)
124,48 = 125

Zona de
rechazo
de Ho (*)
124 124,48 = 125

Zona de
rechazo
de Ho (*)
Figura 4
Regiones crticas basadas en valores de X y Z
PASO 5: Regla de decisin
Rechazar Ho si Z calculada (Zc) es menor que el negativo de la Z de la tabla (Zt), es decir, debemos
rechazar la hiptesis nula si el valor de Zc se ubica en la regin de rechazo.
Sabemos del paso 3 que Zc = -3,16, al ubicar este valor en la figura 4 vemos claramente que dicho
valor cae en la zona de rechazo de Ho, por lo tanto debemos rechazar la referida hiptesis.
PASO 6: Conclusiones
La conclusin estadstica se refiere a la redaccin de una explicacin en lenguaje sencillo del
significado de rechazar Ho.
En el ejemplo que nos ocupa, rechazar Ho implica decir que la evidencia aportada por lo datos no
respaldan la hiptesis nula y en consecuencia podemos afirmar que el contenido promedio de los
envases del frmaco A, es menor de lo que indican las etiquetas de dicho producto.
Una posible conclusin tcnica por parte de las autoridades puede estar referida a la obligacin
por parte de la empresa a revisar y ajustar el proceso de manufactura del frmaco A, de modo que
se cumplan las especificaciones comerciales del mismo.
Similarmente, las autoridades competentes pueden concluir ordenando una inspeccin ms
detallada del proceso de manufactura de este y otros frmacos producidos por el laboratorio en
cuestin y la aplicacin de sanciones administrativas contra ste por fraude.
Alternativamente podemos llegar a la conclusin anterior operando directamente con el estadstico
y no con una funcin del mismo. Los pasos 1, 2 3 y 6 se mantienen inalterados.
PASO 4: Determinacin de las Regiones Crticas
Una vez que se ubica el valor Z en la tabla correspondiente, se procede a construir un intervalo de
confianza unilateral (izquierdo en este caso) partiendo del valor establecido en Ho. Recordemos
85
-1,645
z
= 0
Zona de
aceptacin
de Ho
(95%)
* (5%)
Zona de
rechazo
de Ho (*)
z
124
z
= 125

Zona de
aceptacin
de Ho
(95%)
* (5%)
Zona de
rechazo
de Ho (*)
x
124,48 = 125

Zona de
rechazo
de Ho (*)
124 124,48 = 125

Zona de
rechazo
de Ho (*)
que estamos asumiendo que Ho es cierta y en consecuencia el intervalo tiene la siguiente forma (o
- Z

*
X
). As el resultado de aplicar la expresin anterior es:
125 (1.645)* (2,5/25) = 124,48
Figura 5
Regiones crticas basadas en valores de
X
PASO 5: Regla de decisin
Rechazar Ho si la media de la muestra (
X
) es menor que el limite inferior del intervalo, es decir,
debemos rechazar la hiptesis nula si el valor de
X
se ubica en la regin de rechazo.
Sabemos del paso 3 que
X
= 124, al ubicar este valor en la figura 5 vemos claramente que dicho
valor cae en la zona de rechazo de Ho, por lo tanto debemos rechazar la referida hiptesis.
Empleo de los valores p en la ejecucin de una dcima de hiptesis
Alternativamente se pueden usar los valores p para decidir si rechazamos o no una hiptesis nula
durante la ejecucin de una dcima de hiptesis. Bajo el supuesto de hiptesis nula cierta, los
valores p representan la probabilidad de obtener un valor al menos tan improbable como el
obtenido en el paso 3 de procedimiento. Los valores p tambin reciben el nombre de nivel
observado de significacin.
Figura 6
Regiones crticas y valores de valores p
86
124,48 = 125

Zona de
aceptacin
de Ho
(95%)
* (5%)
Zona de
rechazo
de Ho (*)
x
124 124,48 = 125

Zona de
aceptacin
de Ho
(95%)
(0,001)
Zona de
rechazo
de Ho (*)
x
Zonas de
rechazo
de Ho (*)
-2,72 0 2,72
Dado que el caso que nos ocupa se trata de una dcima de cola izquierda, el valor p representa la
probabilidad de observar en la muestra seleccionada un contenido promedio que sea igual o
inferior que el valor observado. Aqu p = 0,001 que representa el rea a la izquierda de valor 124
como se puede observar de la figura 6..
Este valor de p indica que es muy poco probable encontrar un contenido promedio de 124 cc o
menos en los envases de la muestra, cuando la verdadera media de la poblacin es 125 cc como
se establece en Ho. El hecho que p < nos lleva a rechazar Ho, llegando as a la misma conclusin
a la que habamos arribado antes.
Caso II: La poblacin bajo estudio se distribuye de forma normal con varianza desconocida y el
tamao de la muestra es pequeo (n<30).
A diferencia del caso anterior sta es la situacin que de manera automtica emplean los sistemas
de computacin (software) especializados en el rea de la estadstica, esto debido a que considera
una situacin bastante frecuente, es decir, la varianza de la poblacin es desconocida y tamao de
la muestra es pequeo.
En el cuadro 2 se muestran tanto el estadstico como la funcin del estadstico que se emplean
para sta situacin.
Cuadro 2
Estadstico y funcin del estadstico
H0 H1 Estadstico / funcin
0 < 0
X
x
X
Z

cambiar Z
por tc y por S
0 > 0
= 0 0
Observe el hecho de no conocer la varianza de la poblacin (
2
), hace necesario estimar su valor
a travs de la varianza de la muestra (S
2
). Consecuentemente la funcin del estadstico sufre una
modificacin en su denominador con respecto al caso I, dando lugar al surgimiento de una nueva
variable denominada tc, la cual responde a una distribucin t de Student con n-1 grados de libertad,
tal y como se mencion en el tema referido a la construccin de intervalos de confianza.
Ejemplo 37: Tradicionalmente se sabe que el promedio (
X
) de las calificaciones obtenidas en la
Prueba Interna de Admisin (PIA) (X) por los estudiantes que ingresan a la escuela de psicologa
de la UCV es de 16 puntos. La direccin de la escuela desea verificar a travs de una dcima de
hiptesis con un nivel de significacin del 1%, si para el presente ao se mantiene dicho
rendimiento en los alumnos de nuevo ingreso. Para ello decide estudiar una muestra de 25 de
dichos estudiantes, la cual arroja un valor medio de 15,20 en las calificaciones con una varianza de
2,3.
PASO 1: Establecimiento de las hiptesis
Ho: = 16
87
Zonas de
rechazo
de Ho (*)
-2,72 0 2,72
H1: 16
PASO 2: Eleccin del nivel de significacin
= 0,01 1%
PASO 3: Seleccin del estadstico para la dcima
De acuerdo con el cuadro 2, debemos emplear
X
tc a fin de poder verificar la validez o no de la
hiptesis nula planteada.
Como hemos asumido que la poblacin bajo estudio est normalmente distribuida, entonces
X

tambin lo est, pero tc sigue una distribucin t de Student con n-1 grados de libertad.
Bajo el supuesto de hiptesis nula cierta tenemos:
X ~ N (16 ;
2
)
X
~ N (16 ;
2
/25)
tc ~ t(n-1)
De los resultados de la muestra se sabe que la media de la muestra (
X
) es igual a 15,20, mientras
que el valor de la variable tc es igual a -2,64
PASO 4:
Dado que la hiptesis alternativa establece una relacin de diferencia, estamos frente a la tcnica
de dcima de hiptesis de dos colas. A diferencia de la situacin de una cola, la zona de rechazo
de Ho est compuesta por las dos porciones extremas de la distribucin muestral del estadstico.
Figura 7
Regiones crticas para una dcima de dos colas (H1: o)
PASO 5: Regla de decisin
Rechazo Ho si el t calculado (tc) es menor que el negativo del t de la tabla (tt) o si el tc es mayor
que el t de la tabla (tt). Como tc = -2,60 se ubica entre -tc y tc, la evidencia de la muestra no permite
rechazar Ho.
PASO 6: Conclusiones
88
Zonas de
rechazo
de Ho (*)
0 1,28
Zona de
aceptacin
de Ho
(99%)
* (0,5%) * (0,5%)
Zonas de
rechazo
de Ho (*)
-2,72 0 2,72
t
Los datos respaldan la hiptesis nula, por lo tanto podemos concluir que el puntaje promedio
obtenido por los alumnos de nuevo ingreso de la escuela de psicologa de la UCV en la PIA del
ao en cuestin, se mantiene en diecisis puntos (16) como histricamente viene sucediendo.
Caso I II: Tamao de muestra grande (n 30)
Cuando se dispone de muestras de tamao grande (n 30), podemos apoyarnos sobre tres
aspectos tericos que nos permitirn con relativo poco esfuerzo, resolver el planteamiento inicial a
travs del mecanismo empleado en la resolucin de los problemas enmarcados en el primero de
los casos revisados (caso I).
En primer lugar podemos invocar el teorema central del lmite (TCL), el cual nos permite concluir
que la media aritmtica de una muestra grande, proveniente de una poblacin cuya media y
varianza son ambas finitas, se distribuye de manera normal con media igual a la media de la
poblacin y varianza igual a la varianza de la poblacin dividida por el tamao de la muestra, a
medida que n crece de manera indefinida o lo que es lo mismo, a medida que n tiende a infinito.
En segundo lugar podemos decir que al trabajar con una muestra grande, no se hace necesario
exigir ni suponer nada respecto de la forma de la distribucin de probabilidad de la poblacin de la
cual proviene la muestra.
Por ltimo, si la varianza de la poblacin es desconocida tal y como ocurre en la mayora de las
situaciones reales, entonces el valor de la varianza de la muestra (S
2
) puede considerarse
idnticamente igual a la varianza de la poblacin (
2
), ya que el elevado nmero de elementos
considerados en su clculo (muestra) permite suponer que no existe diferencia entre ambas y en
caso de existir diferencia, esta es insignificante.
Ejemplo 38:
Un investigador patrocinante de una determinada dieta afirma que la misma permite a quienes se
someta dicho rgimen, reducir su peso corporal en ms de ocho kilos en un perodo de 30 das.
Para verificar la informacin aportada por el patrocinante, se selecciona una muestra aleatoria de
68 personas interesadas en participar en el experimento de prueba de la dieta. Luego de 30 das
se registro el nmero de kilo en que descendi el peso corporal de cada participante y se obtuvo
un promedio de 8,75 con una varianza de 2,45.
PASO 1: Establecimiento de las hiptesis
Ho: 8
H1: > 8
PASO 2: Eleccin del nivel de significacin
= 0,1 10%
PASO 3: Seleccin del estadstico para la dcima
Dado que el tamao de la muestra es grande (n>30), podemos emplear el TCL y concluir que el
descenso promedio del peso observado por los participantes es una variable normalmente
distribuida, con media establecida por Ho y varianza igual a (2,45/68).
89
Zonas de
rechazo
de Ho (*)
0 1,28
Del hecho de asumir que la varianza muestral y la varianza poblacional son iguales debido al
tamao de la muestra, podemos emplear el estadstico o la funcin del estadstico que se
muestran en el cuadro 1, tal y como lo hicimos con el caso I.

Bajo el supuesto de hiptesis nula cierta tenemos:
X ~ N (8 ; 2,45
2
)
X
~ N (8 ; 2,45/68)
Zc ~ N(0 ; 1)
De los resultados de la muestra se sabe que la media de la muestra (
X
) es igual a 8,75, mientras
que el valor de la variable Zc es igual a 3,95.
PASO 4:
Dado que la hiptesis alternativa establece una relacin mayor que, estamos frente a la tcnica de
dcima de hiptesis de una cola derecha.
Figura 8
Regiones crticas para una dcima de cola derecha (H1: > o)
PASO 5: Regla de decisin
Rechazo Ho si el Z calculado (Zc) es mayor que el Z de la tabla (Zt). Como Zc = 3,95 es mayor que
el Zt, la evidencia de la muestra no apoya a la hiptesis nula (Ho).
PASO 6: Conclusiones
Los datos no respaldan la hiptesis nula, por lo tanto podemos concluir que la disminucin
promedio del peso corporal de las personas sometidas a la dieta bajo experimento es mayor de 8
kilos.
Tal como lo afirma el patrocinante, la referida dieta puede ser aconsejable para aquellas personas
que deseen experimentar marcadas disminuciones del peso corporal, en perodos relativamente
corto de tiempo.
DCIMA PARA LA PROPORCIN
La distribucin muestral de la proporcin posee una expresin muy prxima a la distribucin
binomial. Recordemos que una variable definida como el nmero de xitos en una cantidad finita
90
Zona de
aceptacin de
Ho
(90%)
* (0,1%)
Zonas de
rechazo
de Ho (*)
0 1,28
z
de pruebas sigue exactamente una distribucin binomial y la proporcin de una muestra, se define
como el nmero de xitos dividido por el total de ensayos u observaciones realizadas.
De la misma forma como que es aceptable aproximar probabilidades de una distribucin binomial a
travs de la distribucin normal cuando los productos nxp y nxq son ambos mayores que 5, donde
como se recordar, n representa el nmero de veces que se repite el experimento de Bernoulli y p
es la probabilidad de xito y q=1-p, es tambin aceptable aproximar la distribucin muestral de la
proporcin muestral a travs de la normal.
En el cuadro 3 se muestra un resumen de las hiptesis y el estadstico con su respectiva funcin.
Cuadro 3
H0 H1 Estadstico de contraste y su funcin
P P0 P < P0
p
Zc = (p - ) /p
P P0 P > P0
P = P0 P P0
91

También podría gustarte