UNIDAD III-Parte II

Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en

Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
Capítulo 5. Inferencia Estadística
Una estimación puntual del valor de un parámetro poblacional desconocido (como puede ser la
media μ, o la desviación estándar σ), es un número que se utiliza para aproximar el verdadero
valor de dicho parámetro poblacional. A fin de realizar tal estimación, se toma una muestra de
la población y se calcula el estadístico muestral asociado al parámetro (𝑥̅ para la media, s para
la desviación estándar, etc.). El valor de este estadístico será la estimación puntual del
parámetro poblacional.
No siempre resulta conveniente realizar la estimación puntual, debido a que no proporciona

suficiente información acerca del parámetro de interés, ya que un solo número puede no
resultar muy significativo, es decir, que no puede estimar con exactitud el valor del parámetro
de la población. Por esta razón resulta más conveniente determinar un intervalo dentro del
cual se esperaría que se encuentre el valor del parámetro, a este método se le conoce como
estimación por intervalo.
A los estimadores por intervalo generalmente se les llama intervalos de confianza, este
contiene un conjunto de valores posibles del parámetro a estimar obtenidos a partir de la
muestra aleatoria de la cual se determina el estadístico de interés. Para llevar a cabo la
estimación por intervalo es necesario conocer: el nivel de confianza y el error estándar.
Por otra parte, en inferencia estadística se plantean hipótesis sobre los posibles valores que
puede tomar un parámetro de la población y se verifica la validez o no, a través de los datos
muestrales haciendo uso de las distribuciones muestrales de los estadísticos de interés, este
procedimiento se conoce como contraste de hipótesis.
5.1. Estimación puntual de un parámetro poblacional.
La mayoría de las distribuciones de probabilidad dependen de cierto número de parámetros.

Por ejemplo: 𝑃(𝜆) , N( 𝜇, 𝜎 ), B(n, p), etc. Salvo que estos parámetros se conozcan, deben
estimarse a partir de los datos muestrales.
El objetivo de la estimación puntual es usar una muestra para obtener números que, en algún
sentido, sean los que mejor representan a los verdaderos valores de los parámetros de interés.
Supongamos que se selecciona una muestra de tamaño n de una población. Antes de obtener la
muestra no sabemos cuál será el valor de cada observación. Así, la primera observación puede
ser considerada una variable aleatoria X1, la segunda una variable aleatoria X2, etc. Por lo tanto,
antes de obtener la muestra denote por X1 , X2 ,..., Xn a las observaciones y, una vez obtenida la
muestra, denote por 𝑥1 , 𝑥2 , … , 𝑥𝑛 a los valores observados.
Del mismo modo, antes de obtener una muestra, cualquier función de ella será una variable
aleatoria, por ejemplo:𝑋̅, 𝜎 2 , etc. Una vez obtenida la muestra los valores calculados serán
denotados por 𝑥̅ , 𝑠 2 .
1/24
Definición5.1. Un estimador puntual de un parámetro 𝜃 es un valor que puede ser considerado

representativo de 𝜃 y se indicará por 𝜃̂ . Se obtiene a partir de alguna función de la muestra.
Métodos de estimación puntual
¿Cómo obtener estimadores para un problema dado? Se estudian dos métodos que
proporcionan estimadores puntuales: el método de momentos y el método de máxima
verosimilitud.
Método de momentos: La idea básica consiste en igualar ciertas características muestrales con
las correspondientes características poblacionales.
Definición 5.2. Sean X1 , X2 ,..., Xn una muestra aleatoria de una distribución con función de
probabilidad o función de densidad que depende de m parámetros 𝜃1 , 𝜃2 , … , 𝜃𝑚 . Los
estimadores de momentos son los valores 𝜃̂1 , 𝜃̂2 , … , 𝜃̂𝑚 que se obtienen igualando m momentos
poblacionales con los correspondientes momentos muestrales.
Ejemplo 5.1. Sean X1 , X2 ,..., Xn una muestra aleatoria de una distribución de Poisson de
parámetro 𝜆, obtener el estimador de momentos para 𝜆.
Solución.
Como 𝜆 representa la media en una distribución de Poisson, se iguala la media muestral a 𝜆, así:
𝑛
𝑋𝑖
∑ = 𝜆̂
𝑛
𝑖=1
Ejemplo 5.2. Sean X1 , X2 ,..., Xn una muestra aleatoria de una distribución 𝑁(𝜇, 𝜎 2 ), obtener los
estimadores de momentos para 𝜇 y 𝜎 2 .
Solución.
Como 𝜇 representa la media en una distribución normal, entonces el estimador de momentos

de 𝜇 es:
𝑛
𝑋𝑖
∑ = 𝜇̂
𝑛
𝑖=1
El estimador de momentos de 𝜎 2 , es la varianza muestral:

𝑛
(𝑋𝑖 − 𝑥̅ )2
∑ = 𝜎̂ 2
𝑛−1
𝑖=1
Método de máxima verosimilitud (EMV): Este método fue introducido por Fisher en la década
de 1920. Se basa en la idea de hallar los valores de los parámetros que hacen que la probabilidad
de obtener una muestra dada sea máxima.
Ejemplo 5.3. Se realiza una encuesta de opinión a una muestra aleatoria de 20 personas. Se les
formula una única pregunta que será respondida por Si o por NO. Sean X1, X2 ,..., X20 las variables
aleatorias correspondientes a la respuesta, tales que
2/24
1 𝑠𝑖 𝑙𝑎 𝑝𝑒𝑟𝑠𝑜𝑛𝑎 𝑖 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒 𝑆𝐼
𝑋𝑖 = {
0 𝑠𝑖 𝑙𝑎 𝑝𝑒𝑟𝑠𝑜𝑛𝑎 𝑖 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒 𝑁𝑂
para i=1, 2, …., 20 y sea p=P(Xi=1). Determinar el estimador de máxima verosimilitud de p.
Solución.
Observe que las variables aleatorias Xi son independientes y cada una de ellas tiene distribución
B(1, p). Entonces, la función de probabilidad conjunta del vector (X1, X2 ,..., X20) es:
𝑃 (𝑥1 , 𝑥2 , … , 𝑥20 ) = 𝑝 𝑥1 (1 − 𝑝)1−𝑥1 𝑝 𝑥2 (1 − 𝑝)1−𝑥2 … 𝑝 𝑥20 (1 − 𝑝)1−𝑥20

Si en la muestra obtenida se observan 7 NO’s (0) y 13 SI’s (1), sería
𝑃 (𝑥1 , 𝑥2 , … , 𝑥20 ) = 𝑝13 (1 − 𝑝)7
La pregunta es: ¿qué valor de p hace que los valores muestrales obtenidos sean los más
probables?
Es decir, se busca el valor de p que hace máxima 𝑃(𝑥1 , 𝑥2 , … , 𝑥20 ) o equivalentemente

𝐿𝑛𝑃 (𝑥1 , 𝑥2 , … , 𝑥20 ) ya que 𝐿𝑛 es una función monótona creciente, por tanto se debe maximizar
la siguiente función de p
𝐿𝑛(𝐿 (𝑝)) = 𝐿𝑛𝑃 (𝑥1 , 𝑥2 , … , 𝑥20 ) = 13 ln(𝑝) + 7𝐿𝑛(1 − 𝑝)
Para ello, como esta función es derivable respecto de p, se buscan los posibles puntos críticos,
igualando a 0 la derivada primera.
𝜕𝐿𝑛(𝐿(𝑝)) 13 7 13(1−𝑝)−7𝑝 13−20𝑝 13
𝜕𝑝
= 𝑝
− 1−𝑝 = 0 ⇒ 𝑝(1−𝑝)
= 𝑝(1−𝑝)
= 0 ⇔ 13 − 20𝑝 = 0 ⇒ 𝑝̂ = 20
Este valor es en efecto el que maximiza 𝐿 (𝑝) pues
𝜕 2 𝐿𝑛(𝐿(𝑝)) 13 7 6
| = − | = − (20)2 < 0
𝜕𝑝2 𝑝=
13 𝑝 2 (1 − 𝑝)2
𝑝=
13 7(13)
20 20
13
Por tanto, el estimador de máxima verosimilitud de p es 𝑝̂ = 20 ya que maximiza la función
𝑃 (𝑥1 , 𝑥2 , … , 𝑥20 ).
Definición 5.3. Sean X1 , X2 ,..., Xn variables aleatorias con función de probabilidad conjunta
𝑃 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) o función de densidad conjunta 𝑓 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) que depende de m parámetros
𝜃1 , 𝜃2 , … , 𝜃𝑚 . Cuando (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) son los valores observados y la función de probabilidad o
de densidad conjunta se considera función de los parámetros 𝜃1 , 𝜃2 , … , 𝜃𝑚 se denomina función
de verosimilitud y se denota 𝐿(𝜃1 , 𝜃2 , … , 𝜃𝑚 ) = 𝑃 (𝑥1 , 𝑥2 , … , 𝑥𝑛 /𝜃1 , 𝜃2 , … , 𝜃𝑚 ) .
Los estimadores de máxima verosimilitud (EMV) de 𝜃1 , 𝜃2 , … , 𝜃𝑚 son los valores 𝜃̂1 , 𝜃̂2 , … , 𝜃̂𝑚
que maximizan la función de verosimilitud, o sea los valores tales que
𝐿(𝜃̂1 , 𝜃̂2 , … , 𝜃̂𝑚 ) ≥ 𝐿(𝜃̃1 , 𝜃̃2 , … , 𝜃̃𝑚 ) ∀ 𝜃̃1 , 𝜃̃2 , … , 𝜃̃𝑚
La forma general de los EMV se obtiene reemplazando los valores observados 𝑥𝑖 por las
variables aleatorias Xi.
3/24
Ejemplo 5.4. Sean X1 , X2 ,..., Xn una muestra aleatoria de una distribución Poisson de parámetro
𝜆, obtener el estimador de máxima verosimilitud (EMV) para 𝜆.
Solución.
∑𝑛
𝑒 −𝑛𝜆 𝜆 𝑖=1 𝑥𝑖
La probabilidad conjunta es 𝑃 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) = ∏𝑛
𝑖=1 𝑥𝑖 !
La función de verosimilitud es:

𝑛
𝑒 −𝑛𝜆 𝜆∑𝑖=1 𝑥𝑖
𝐿(𝜆) =
∏𝑛𝑖=1 𝑥𝑖 !
El logaritmo de la función de verosimilitud es:

𝑛 𝑛
𝐿𝑛(𝐿(𝜆)) = −𝑛𝜆 + ∑ 𝑥𝑖 𝐿𝑛(𝜆) − ∑ 𝐿𝑛(𝑥𝑖 !)

𝑖=1 𝑖=1
Derivando e igualando a cero e tiene:

𝑛
𝜕𝐿𝑛(𝐿(𝜆)) 1 1 𝑛 ∑𝑛𝑖=1 𝑥𝑖
= −𝑛 + ∑ 𝑥𝑖 ( ) = 0 ⇒ ( ) = 𝑛 ⇒𝜆=
𝜕𝑝 𝜆 𝜆 ∑𝑖=1 𝑥𝑖 𝑛
𝑖=1
Esto es: 𝜆̂ = 𝑥̅ , el estimador de máxima verosimilitud de 𝜆 es igual al que se obtuvo con el

método de los momentos.
Ejemplo 5.5. Sean X1 , X2 ,..., Xn una muestra aleatoria de una distribución normal con media 𝜇
y varianza 𝜎 2 (𝑁(𝜇, 𝜎 2 ) obtener el estimador de máxima verosimilitud de 𝜇 y 𝜎 2 .
Solución.
Recordar que la función de densidad de la distribución normal está dada por:

(𝑋−𝜇)2
1 −
𝑓 (𝑥) = 𝑒 2𝜎2 para −∞ < 𝑋 < ∞
√2𝜋𝜎
La función de verosimilitud es:

𝑛
1 1
− 2 ∑𝑛 (𝑋 −𝜇)2
𝐿(𝜇, 𝜎 2 ) = ( ) 𝑒 2𝜎 𝑖=1 𝑖
√2𝜋𝜎 2
Maximizar la verosimilitud es equivalente a maximizar su logaritmo, por tanto el logaritmo de la
función de verosimilitud es:
𝑛 𝑛
1 −
1 𝑛
∑ (𝑋 −𝜇)2 1
𝐿𝑛(𝐿(𝜇, 𝜎 2 )) = 𝐿𝑛 [( ) 𝑒 2𝜎 2 𝑖=1 𝑖 ] = −𝑛𝐿𝑛 (√2𝜋𝜎 2 ) − ∑(𝑋𝑖 − 𝜇)2
√2𝜋𝜎 2 2𝜎 2
𝑖=1
Por propiedades del logaritmo se tiene:

𝑛
𝑛 𝑛 1
𝐿𝑛(𝐿(𝜇, 𝜎 2 )) = − 𝐿𝑛(2𝜋) − 𝐿𝑛 (𝜎 2 ) − 2 ∑(𝑋𝑖 − 𝜇)2
2 2 2𝜎
𝑖=1
4/24
2
Derivando e igualando con respecto a 𝜇 y 𝜎 e igualando a cero e tiene:
𝑛
𝜕𝐿𝑛(𝐿(𝜇, 𝜎 2 )) 2 ∑𝑛𝑖=1(𝑋𝑖 − 𝜇) ∑𝑛𝑖=1 𝑋𝑖
= = 0 ⇒ ∑(𝑋𝑖 − 𝜇 ) = 0 ⇒ 𝜇̂ =
𝜕𝜇 2𝜎 2 𝑛
𝑖=1
Esto es: 𝜇̂ = 𝑋̅ , el estimador de máxima verosimilitud de 𝜇 es igual a la media muestral.
Ahora:
𝑛 𝑛
𝜕𝐿𝑛(𝐿(𝜇, 𝜎 2 )) 𝑛 1 1
2
= − 2 + 4 ∑(𝑋𝑖 − 𝜇)2 = 0 ⇒ 𝑛 = 2 ∑(𝑋𝑖 − 𝜇)2
𝜕𝜎 2𝜎 2𝜎 𝜎
𝑖=1 𝑖=1
1
Por tanto, 𝜎 2 = 𝑛 ∑𝑛𝑖=1(𝑋𝑖 − 𝜇)2 , reemplazando el estimador de 𝜇 esto es: 𝜇̂ = 𝑋̅ , se tiene que
1
𝜎̂ 2 = ∑𝑛𝑖=1(𝑋𝑖 − 𝑥̅ )2 , se observa que el estimador de máxima verosimilitud de 𝜎 2 es la suma
𝑛
de las desviaciones al cuadrado de los datos respecto a la media divididos por n, este estimador
1
no coincide con la varianza muestral 𝑆 2 = ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑛−1
Propiedades de un buen estimador.
Observe que, dada una muestra X1 , X2 ,..., Xn , donde 𝑋~𝐹𝜃 , un estimador puntual del parámetro
𝜃, obtenido con base a muestra, es una variable aleatoria 𝜃̂ . La diferencia 𝜃̂ − 𝜃 es el error de
estimación y una estimación será más precisa cuanto menor sea este error.
Este error es también una variable aleatoria dado que depende de la muestra obtenida. Para
algunas muestras será positivo, para otras negativo. Una propiedad deseable es que la
esperanza del error sea 0, es decir que “en promedio” el error obtenido al estimar a partir de
diferentes muestras sea cero.
Definición 5.4. Un estimador puntual 𝜃̂ del parámetro 𝜃 es insesgado si 𝐸(𝜃̂) = 𝜃
Si 𝜃̂ no es insesgado, se denomina sesgo de 𝜃̂ a 𝑏(𝜃̂) = 𝐸(𝜃̂) − 𝜃. Por lo tanto, un estimador

es insesgado si su distribución tiene como valor esperado al parámetro a estimar.
Ejemplo 5.6. Sea X: número de éxitos en n repeticiones de un experimento binomial con

𝑋
probabilidad de éxito igual a p. Entonces X ~ Bi(n,p) y se tiene que el EMV de p es 𝑝̂ = 𝑛 o sea la
frecuencia relativa de éxitos. Verificar que este estimador es insesgado.
Solución.
Se tiene que calcular el valor esperado de 𝑝̂ , así:

𝑋 1 1
𝐸(𝑝̂ ) = 𝐸 ( 𝑛 ) = 𝑛 𝐸(𝑋) = 𝑛 𝑛𝑝 se ha utilizado el hecho que E(X)=np ya que 𝑋~𝐵𝑖(𝑛, 𝑝) ,
finalmente
𝐸(𝑝̂ ) = 𝑝
Lo cual verifica que 𝑝̂ es insesgado.
5/24
Ejemplo 5.7. Sean X1 , X2 ,..., Xn una muestra aleatoria de una distribución normal con media 𝜇
y varianza 𝜎 2 (𝑁(𝜇, 𝜎 2 ) los estimador de máxima verosimilitud de 𝜇 y 𝜎 2 son: 𝜇̂ = 𝑋̅ y 𝜎̂ 2 =
1 𝑛
∑𝑖=1(𝑋𝑖 − 𝑋̅)2 respectivamente, verificar si son insesgados.
𝑛
Solución.
𝑛 𝑛
∑𝑛𝑖=1 𝑋𝑖 1 1
𝐸 (𝜇̂ ) = 𝐸(𝑋̅ ) = 𝐸 ( ) = (∑ 𝐸(𝑋𝑖 )) = (∑ 𝜇) = 𝜇
𝑛 𝑛 𝑛
𝑖=1 𝑖=1
Se tiene que 𝜇̂ = 𝑋̅ es un estimador insesgado de 𝜇.

1
Ahora se obtiene la esperanza de 𝜎̂ 2 = 𝑛 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑛 𝑛 𝑛 𝑛
1 1 1
𝐸(𝜎̂ 2)
= 𝐸 ( ∑(𝑋𝑖 − 𝑋̅ )2 ) = 𝐸 (∑ 𝑋𝑖2 − 2𝑋̅ ∑ 𝑋𝑖 + 𝑛𝑋̅ 2 ) = 𝐸 (∑ 𝑋𝑖2 − 𝑛𝑋̅ 2 )
𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1 𝑖=1
1 1
= 𝑛 (∑𝑛𝑖=1 𝐸(𝑋𝑖2 )) − 𝐸(𝑋̅ 2 ) = 𝑛 𝑛𝐸(𝑋12 ) − 𝐸(𝑋̅ 2 ) = 𝐸(𝑋12 ) − 𝐸(𝑋̅ 2 )
Se ha tomado en cuenta que todos los 𝑋𝑖 ~𝑁(𝜇, 𝜎 2 ) por tanto 𝐸(𝑋𝑖2 ) = 𝐸(𝑋12 ) , además
recordar que: 𝐸(𝑋12 ) = 𝑉 (𝑋1 ) + [𝐸(𝑋1 )]2 y 𝑋̅~𝑁(𝜇, 𝜎 2 /𝑛) , así:
𝜎2 𝑛−1
𝐸(𝜎̂ 2 ) = 𝑉(𝑋1 ) + [𝐸(𝑋1 )]2 − 𝑉(𝑋̅) − [𝐸(𝑋̅)]2 = 𝜎 2 + 𝜇2 − − 𝜇2 = 𝜎 2 ( )
𝑛 𝑛
Por tanto el estimador 𝜎̂ 2 de máxima verosimilitud 𝜎 2 no es insesgado.
Actividad de autoevaluación
1. Sean X1 , X2 ,..., Xn una muestra aleatoria, indicar cuales de los siguientes estimadores
de la media población son insesgados:
𝑋
a) 𝑇1 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = ∑𝑛𝑖=1 𝑖 𝑛−1
𝑋1+𝑋𝑛
b) 𝑇2 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = 2
c) 𝑇3 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = 𝑋𝑛 − 𝑋1
(𝑋𝑖−𝑋̅ )2
2. Verificar que la varianza muestral 𝑆 2 = ∑𝑛𝑖=1 𝑛−1
es un estimador insesgado de la
varianza poblacional cualquiera sea la distribución.
3. El tiempo de realización en minutos de una determinada tarea dentro de un proceso

industrial es una variable aleatoria con función de densidad
𝑥
𝑓 (𝑥) = 𝜃2 𝑒 −𝑥/𝜃 para 𝑥 > 0 𝑦 𝜃 > 0
Calcular el estimador de máxima verosimilitud de 𝜃 para una muestra aleatoria simple

de tamaño n.
4. Mediante un muestreo aleatorio simple se han recogido los siguientes 15 tiempos de

realización de la tarea: 5.56, 2.23, 0.58, 1.37, 0.21, 1.98, 2.44, 2.71, 10.12, 4.69, 3.47,
1.73, 3.51, 1.19, 0.97. Obtener el estimador del tiempo medio de realización de tareas,
a través de los métodos de momentos y máxima verosimilitud.
6/24
5.2. Intervalo de confianza para la proporción de una población.
A menudo es necesario construir intervalos de confianza para una proporción. Por ejemplo,
supóngase que se toma una muestra de tamaño n de una población grande y que X
observaciones de esta muestra pertenecen a una clase de interés.
Si el estadístico es la proporción de éxitos en una muestra de tamaño 𝑛 ≥ 30 extraída de una

población binomial en la que p es la proporción de éxito (es decir, la probabilidad de éxito), se
puede obtener un estimador de p:
𝑋
𝑝̂ =
𝑛
donde X tiene una distribución Binomial de parámetro p, es decir, 𝑋~𝐵𝑖(𝑛, 𝑝), entonces:
𝐸(𝑝̂ ) = 𝑝
𝑋 1 𝑛𝑝𝑞 𝑝(1 − 𝑝)
𝑉(𝑝̂ ) = 𝑉 ( ) = 2 𝑉(𝑋) = 2 =
𝑛 𝑛 𝑛 𝑛
Teniendo en cuenta las expresiones anteriores, la tipificación (𝑍~𝑁(0,1)) que se utilizará para
construir el intervalos de confianza es:
𝑝̂ − 𝑝
𝑍= ~𝑁(0,1)
√𝑝(1 − 𝑝)
𝑛
Sin embargo la 𝑉 (𝑝̂ ) es desconocida, ya que p no se conoce (es parámetro) por lo que se
requiere utilizar su estimador:
𝑝̂ (1 − 𝑝̂ )
𝑉̂
(𝑝̂ ) =
𝑛
El intervalo de confianza del (1 − 𝛼 )100% para estimar una proporción p verifica:
𝑝̂ − 𝑝
𝑃 −𝑍𝛼 < < 𝑍𝛼 = 1−𝛼
√𝑝̂ (1 − 𝑝̂ )
2 2
( 𝑛 )
Realizando operaciones algebraicas al interior de la probabilidad se tiene:
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑃 (−𝑍𝛼 √ < 𝑝̂ − 𝑝 < 𝑍𝛼 √ )= 1−𝛼
2 𝑛 2 𝑛
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑃 (𝑝̂ − 𝑍𝛼 √ < 𝑝 < 𝑝̂ + 𝑍𝛼 √ )= 1−𝛼
2 𝑛 2 𝑛
El intervalo de confianza del (1 − 𝛼 )100% para estimar una proporción p, se expresa como:
7/24
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑝̂ − 𝑍𝛼 √ < 𝑝 < 𝑝̂ + 𝑍𝛼 √
2 𝑛 2 𝑛
Ejemplo 5.8. Un partido político pretende conocer la intención de votos de cara a las próximas
elecciones. Para ello encarga un sondeo sobre un total de 230 personas, de las que 69 contestan
que votarían por dicho partido.
a) Hallar un intervalo de confianza del 90% para la verdadera proporción población.

b) Encuentre un intervalo de confianza del 99% para la proporción poblacional.
Solución.
Datos:
69
n = 230, 𝑝̂ = 230 = 0.3 , 1 − 𝛼 = 0.9 ⇒ 𝛼 = 0.1 ⇒ 𝛼/2 = 0.05
a) Utilizando la tabla normal se obtiene 𝑍𝛼 = 1.645

2
tal que
𝑃 (𝑍 > 𝑍𝛼 ) = 0.05, esto es 𝑃 (𝑍 > 1.645) = 0.05

2
Finalmente el intervalo de confianza del 90% para p es:
0.3(1 − 0.3) 0.3(1 − 0.3)

0.3 − 1.645 √ < 𝑝 < 0.3 + 1.645√
230 230
0.3 − 0.03022 < 𝑝 < 0.3 + 0.03022 ⇒ 0.27 < 𝑝 < 0.33
Un intervalo de confianza del 90% para p es: 0.27 < 𝑝 < 0.33.
b) 𝛼 = 0.01 ⇒ 𝛼/2 = 0.005

Utilizando la tabla normal se obtiene 𝑍0.005 = 2.545 tal que
𝑃 (𝑍 > 2.545) = 0.005

El intervalo de confianza del 99% para p es:
0.3(1 − 0.3) 0.3(1 − 0.3)

0.3 − 2.545 √ < 𝑝 < 0.3 + 2.545√
230 230
0.3 − 0.0769 < 𝑝 < 0.3 + 0.0769 ⇒ 0.2231 < 𝑝 < 0.3769
Un intervalo de confianza del 99% para p es 0.2231 < 𝑝 < 0.3769 observe que es más amplio
que el intervalo del literal a) ya que ahora el nivel de confianza es mayor.
Ejemplo 5.9. En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres
mayores de 15 años en la Región Metropolitana, se encontró que el 17.6% eran hipertensas.
8/24
Construir un intervalo de 95% de confianza para la proporción de mujeres hipertensas en la

Región Metropolitana.
Solución
Datos:
n = 412, 𝑝̂ = 0.176 , 1 − 𝛼 = 0.95 ⇒ 𝛼 = 0.05 ⇒ 𝛼/2 = 0.025

a) Utilizando la tabla normal se obtiene 𝑍0.025 = 1.96 tal que
𝑃 (𝑍 > 𝑍𝛼 ) = 0.025, esto es 𝑃 (𝑍 > 1.96) = 0.025

2
0.176(1 − 0.176) 0.176(1 − 0.176)

0.176 − 1.96√ < 𝑝 < 0.176 + 1.96√
412 412
0.176 − 0.03677 < 𝑝 < 0.176 + 0.03677 ⇒ 0.139 < 𝑝 < 0.213
Intervalos de confianza para una proporción poblacional p para n < 30
Si el tamaño de la muestra es pequeña n < 30 los intervalos de confianza para proporciones se

obtienen mediante la fórmula siguiente:
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑝̂ − 𝑡𝛼,𝑛−1 √ < 𝑝 < 𝑝̂ + 𝑡𝛼 ,𝑛−1 √
2 𝑛 2 𝑛
Observe que se ha sustituido la t de Student con n-1 grados de libertad en vez de la Z, (N(0, 1)).
Ejemplo 5.10. La oficina gubernamental de salud desea realizar una campaña a fin de
disminuir el porcentaje de funcionarios públicos que tienen el hábito de fumar en horas de
trabajo, para ello decide realizar una investigación por muestreo a 28 funcionarios,
encontrando que 16 de ellos fuman. Determine el intervalo de confianza del 95% para la
proporción de fumadores.
Solución.
Datos:
16
n = 28, 𝑝̂ = 28 = 0.57 , 1 − 𝛼 = 0.95 ⇒ 𝛼 = 0.05 ⇒ 𝛼/2 = 0.025
Utilizando la tabla t de Student con n − 1 = 28 − 1 = 27 se obtiene 𝑡0.025,27 = 2.0518 tal que
𝑃 (𝑇 > 𝑡𝛼,27 ) = 0.025, esto es 𝑃(𝑇 > 2.0518) = 0.025

2
9/24
0.57(1 − 0.57) 0.57(1 − 0.57)

0.57 − 2.0518 √ < 𝑝 < 0.57 + 2.0518√
28 28
0.57 − 0.192 < 𝑝 < 0.57 + 0.192 ⇒ 0.378 < 𝑝 < 0.762
1. En una encuesta realizada a 800 personas elegidas al azar, 240 declaran su intención de
votar al partido A. Estima, con un nivel de confianza del 95%, entre qué valores se
encuentra la intención de voto del partido A en todo el país.
2. Se selecciona aleatoriamente una muestra de 300 personas en una ciudad y se les pregunta
si consideran que el tráfico es muy pesado. Responden afirmativamente 175 personas. ¿Cuál
es el intervalo de confianza de la proporción de ciudadanos de esa ciudad que consideran
que el tráfico es pesado, con un nivel de confianza del 90%?
3. Se hizo una encuesta a 325 personas mayores de 16 años y se encontró que 120 iban al cine
regularmente. Hallar, con un nivel de confianza del 99%, un intervalo para estudiar la
proporción de los ciudadanos que van al cine regularmente.
5.3. Intervalo de confianza para la media de una población con

varianza conocida o desconocida.
La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido

se denomina nivel de confianza, y se denota por 1 − 𝛼. La probabilidad de equivocarnos se
llama nivel de significancia y se simboliza 𝛼 . Generalmente se construyen intervalos con
confianza 1 − 𝛼 = 95% (o significancia 𝛼 =5%). Menos frecuentes son los intervalos con 𝛼 =
10% o 𝛼 = 1%.
5.3.1. Intervalo de confianza para la media de una población con

varianza conocida
Si se dispone de una población que tiene una variable aleatoria X con distribución 𝑁(𝜇, 𝜎 2 )
y con 𝜎 2 conocida. En la unidad 4 se estudió que la distribución muestral de la media
corresponde a: 𝑋̅~𝑁(𝜇, 𝜎 2 /𝑛).
El objetivo es estimar la media poblacional 𝜇 a partir de la media muestral 𝑋̅, obteniendo para
ello un intervalo de forma que tenga una probabilidad alta 1 − 𝛼 de que la media poblacional
esté en dicho intervalo, esto es:
𝑃 (𝑥1 < 𝑋̅ < 𝑥2 ) = 1 − 𝛼

𝑥1−𝜇 𝑋̅ −𝜇 𝑥2−𝜇
𝑃 (𝑥1 < 𝑋̅ < 𝑥2 ) = 𝑃 ( < < ) = 1−𝛼
𝜎/√𝑛 𝜎/√𝑛 𝜎/√𝑛
10/24
𝑋̅ −𝜇
Observe que: 𝑍 = 𝜎/√𝑛 ~𝑁(0,1) por lo tanto, se tiene un intervalo centrado y el límite inferior
sería 𝑍1−𝛼/2 donde 𝑍1−𝛼/2 es el valor de la variable aleatoria N(0,1) que deja a la derecha una
probabilidad de 1 − 𝛼/2 y el límite superior sería 𝑍𝛼/2 donde 𝑍𝛼/2 es el valor de la variable
aleatoria N(0,1) que deja a la derecha una probabilidad de 𝛼/2, obviamente se verifica que
𝑍𝛼/2 = −𝑍1−𝛼/2 . Tomando en cuenta estas consideraciones, volvamos a la construcción del
intervalo de confianza para 𝜇, así:
𝑥1−𝜇 𝑋̅ −𝜇 𝑥2−𝜇 𝑋̅ −𝜇
𝑃 (𝑥1 < 𝑋̅ < 𝑥2 ) = 𝑃 (𝜎/√𝑛 < 𝜎/√𝑛 < 𝜎/√𝑛) = 𝑃 (−𝑍𝛼/2 < 𝜎/√𝑛 < 𝑍𝛼/2 ) = 1 − 𝛼
Finalmente, realizando operaciones algebraicas al interior de la probabilidad en la expresión

anterior se tiene:
𝑃 (𝑥̅ − 𝑍𝛼 (𝜎/√𝑛) < 𝜇 < 𝑥̅ + 𝑍𝛼 (𝜎/√𝑛)) = 1 − 𝛼

2 2
Ejemplo 5.11. Una institución gubernamental conoce que la desviación estándar del gasto
promedio en cigarrillos es de $5 por semana. Una muestra de 49 fumadores revela que el gasto
promedio que invierten en cigarrillos durante una semana es de $20.00.
a) ¿Cuál es el estimador puntual de la media poblacional?

b) Utilizando un nivel de confianza del 95%, determinar el intervalo de confianza para 𝜇, e
interprete el resultado.
Solución
a) La media poblacional, 𝜇, se estima por la media muestral, 𝑥̅ , ya sea utilizando el método

de los momentos o máxima verosimilitud, así: 𝜇̂ = 𝑥̅ = $20 , esto es que el gasto
promedio semanal en cigarrillos es de $20.
b) Como se conoce el valor de 𝜎 desviación estándar poblacional y además el tamaño de
la muestra es mayor que 30, el intervalo de confianza para 𝜇 está dado por:
(𝑥̅ − 𝑍𝛼 (𝜎/√𝑛) < 𝜇 < 𝑥̅ + 𝑍𝛼 (𝜎/√𝑛))

2 2
𝛼
Teniendo en cuenta que el nivel de confianza es del 95%, entonces 𝛼 = 0.05, y =
2
0.025, luego utilizando la tabla de la normal estándar se tiene: 𝑍𝛼/2 = 𝑍0.025 = 1.96,
sustituyendo todos los valores conocidos en la expresión del intervalo de confianza se
tiene:
(20 − 1.96(5)/√49 < 𝜇 < 20 + 1.96 (5)/√49) = (18.6 < 𝜇 < 21.4)
Este intervalo se interpreta como: El 95% de las muestras de tamaño 49 que se tome de
la población de fumadores, su gasto promedio semanal estará entre (18.6, 21.4)
dólares.
11/24
5.3.2. Intervalo de confianza para la media de una población con

varianza desconocida
Generalmente, cuando se quiere construir un intervalo de confianza para la media poblacional

𝜇, y la varianza poblacional 𝜎 2 es desconocida, el intervalo para 𝜇 construido en el apartado
anterior es muy poco práctico, ya que requiere del conocimiento de 𝜎.
Si en el intervalo se reemplaza la desviación estándar poblacional 𝜎 por la desviación estándar

muestral s, el intervalo de confianza de (1 − 𝛼 )% toma la forma:
𝑥̅ − 𝑡𝛼,𝑛−1 𝑠/√𝑛 < 𝜇 < 𝑥̅ + 𝑡𝛼,𝑛−1 𝑠/√𝑛

2 2
Siempre que se sustituya la desviación estándar poblacional 𝜎 por la muestral, s, o bien que el
tamaño muestral sea pequeño (n < 30), en el intervalo de confianza se requiere utilizar la
distribución t de Student (con n-1 grados de libertad, siendo n el tamaño de la muestra), en vez
de la distribución normal.
Ejemplo 5.12. Los siguientes datos son los puntajes obtenidos para 45 personas de una escala
de depresión (mayor puntaje significa mayor depresión).
2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14
14 15 15 16 16 16 16 16 16
16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 20 20
Utilice la información anterior para construir un intervalo de confianza del 95% para el puntaje
promedio poblacional, suponga que los datos tienen distribución normal.
Solución.
No se tiene información de la desviación estándar poblacional, por lo tanto se supone

desconocida y en consecuencia debe utilizarse la desviación estándar muestral, 𝑠 = 4.32, bajo
estas condiciones el intervalo de confianza se construye utilizando la siguiente expresión:
𝑥̅ − 𝑡𝛼,𝑛−1 𝑠/√𝑛 < 𝜇 < 𝑥̅ + 𝑡𝛼,𝑛−1 𝑠/√𝑛

2 2
12/24
Se tiene que 1 − 𝛼 = 0.95 ⇒ 𝛼 = 0.05 ⇒ 𝛼/2 = 0.025, utilizando la tabla t de Student con
n − 1 = 45 − 1 = 44 se obtiene 𝑡0.025,44 = 2.009 tal que 𝑃 (𝑇 > 𝑡𝛼,44 ) = 0.025, esto es
2
𝑃 (𝑇 > 2.009) = 0.025
Finalmente, teniendo en cuenta que 𝑥̅ = 14.5, 𝑠 = 4.32, y 𝑡0.025,44 = 2.009 el intervalo de
confianza del 95% para 𝜇 es:
4.32 4.32
14.5 − 2.009 < 𝜇 < 14.5 − 2.009 = 13.21 < 𝜇 < 15.79
√45 √45
Luego, el intervalo de confianza del 95% para 𝜇 es (13.21, 15.79). Es decir, el puntaje promedio
poblacional se encuentra entre 13.2 y 15.8 con una confianza 95%.
Actividad de autoevaluación.
1. El número de horas semanales que los estudiantes de cierto centro educativo dedican
al deporte se distribuye según una ley normal con varianza 7.29 horas. Para muestras
de tamaño 36 se obtuvo una media de 4 horas, indique cuál es el intervalo de confianza
del 90% para la media poblacional.
2. Los ingresos mensuales de las familias de una comunidad se encuentran distribuidos

normalmente. De esta comunidad se selecciona una muestra de 16 familias para estimar
el ingreso promedio mensual. De la información de la muestra se obtuvo una desviación
estándar de $12 y una media de $300.
a) Encuentre un intervalo de confianza del 95% para el ingreso promedio de las familias
de la comunidad.
b) Encuentre un intervalo de confianza del 99% para el ingreso promedio de las familias
de la comunidad.
5.4. Introducción a los contrastes de hipótesis: tipos de

contrastes, tipos de errores y probabilidades
En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se
hacen las pruebas para verificar la aseveración o para determinar que no es verdadera. Por
tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de
probabilidad se emplea para determinar si la hipótesis es una afirmación razonable.
Procedimiento sistemático para una prueba de hipótesis de una muestra.
1) Plantear la hipótesis nula 𝐻0 y la hipótesis alternativa 𝐻1 .
La hipótesis nula 𝐻0 se refiere siempre a un valor especificado del parámetro de población, no

a un estadístico de la muestra.
13/24
La hipótesis nula es una afirmación que no se rechaza a menos que los datos muestrales
proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula
siempre contiene un signo de igualdad con respecto al valor especificado del parámetro.
La hipótesis alternativa 𝐻1 es cualquier aseveración que difiera de la hipótesis nula. Es una
afirmación que se acepta si los datos muestrales proporcionan evidencia suficiente de que la
hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación. El
planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al
valor especificado del parámetro.
2) Seleccionar el nivel de significancia 𝜶.
Nivel de significancia 𝛼: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Este

nivel esta bajo el control de la persona que realiza la prueba.
3) Definir el estadístico de prueba.
Hay que definir la distribución de trabajo: 𝑍~𝑁(0,1), t de Studen o cualquier otra distribución.
La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de
rechazo (conocida como región crítica, R.C) y una región de no rechazo (aceptación, R.A). Si la
estadística de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis
nula, caso contrario se rechaza 𝐻0 .
Tipos de errores.
Como se mencionó anteriormente, una hipótesis estadística es una aseveración respecto a un

parámetro poblacional, que puede ser cierta o no. Las hipótesis estadísticas se pueden
contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan
se puede cometer un error.
La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa por
𝐻0 . Rechazar 𝐻0 implica aceptar una hipótesis alternativa (𝐻1 ).
El esquema de los posibles errores que se pueden cometer al realizar un contraste de hipótesis
es el siguiente:
𝐻0 es cierta 𝐻0 es falsa (𝐻1 es cierta)
Se rechaza 𝐻0 Error tipo I (𝛼) Decisión correcta
No se rechaza 𝐻0 Decisión correcta Error tipo II (𝛽)
Error de Tipo I: consiste en rechazar una hipótesis nula correcta. La probabilidad de un error de
Tipo I es igual a 𝛼 y se denomina nivel de significación, su cálculo es el siguiente:
𝛼 = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 / 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎)
Error de Tipo II: no rechazar una hipótesis nula incorrecta. La probabilidad de un error de Tipo
II es igual a 𝛽 y se obtiene como:
𝛽 = 𝑃(𝑎𝑐𝑒𝑝𝑡𝑎𝑟 𝐻0 / 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎)
14/24
Potencia del test: probabilidad de rechazar una hipótesis nula cuando es incorrecta, se obtiene
como:
1 − 𝛽 = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 / 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎)
5.5. Prueba de hipótesis de normalidad

Un caso específico de ajuste a una distribución teórica es la correspondiente a la distribución
normal. Este contraste se realiza para comprobar si se verifica la hipótesis de normalidad
necesaria para que el resultado de algunos análisis sea fiable, como por ejemplo la distribución
de los residuos en un análisis de regresión (se estudiará en la Unidad 6).
Para comprobar la hipótesis nula de que la muestra ha sido extraída de una población con
distribución de probabilidad normal se puede realizar un estudio analítico, como es la prueba
de Kolmogorov-Smirnov que se presenta a continuación.
Prueba de Kolmogorov-Smirnov
La distribución del estadístico de Kolmogorov-Smirnov es independiente de la distribución

poblacional especificada en la hipótesis nula y los valores críticos de este estadístico están
tabulados.
Las hipótesis se definen de la siguiente forma:
 H0: Los datos siguen una distribución normal

 H1: Los datos no siguen una distribución normal
El estadístico de la prueba se define como:
𝐷 = 𝑚á𝑥{𝐷+ , 𝐷− }
𝑖 𝑖−1
Donde 𝐷+ = max {𝑛 − 𝐹0 (𝑥(𝑖) )}, 𝐷− = max {𝐹0 (𝑥(𝑖) ) − 𝑛
}, y 𝐹0 (𝑥(𝑖) ) es la probabilidad
1≤𝑖≤𝑛 1≤𝑖≤𝑛
de observar valores menores o iguales que 𝑥(𝑖) cuando 𝐻0 es cierta o la distribución acumulada
teórica correspondiente a la población normal especificada en la hipótesis nula y
𝑥(𝑖) es el i-ésimo valor observado en la muestra (cuyos valores se han ordenado previamente de
menor a mayor)
𝑥(𝑖) −𝑥̅
En general los 𝑥(𝑖) no están tipificado por tanto habrá que estandarizar, así: 𝑧(𝑖) = 𝑠
luego
calcular 𝐹0 (𝑧(𝑖) ) utilizando la tabla normal (N(0,1)).
La tabla utilizada para realizar el contraste de hipótesis proporciona los valores de 𝐷𝛼 o 𝐶𝛼 que
𝐶𝛼
se relacionan a través de la siguiente expresión: 𝐷𝛼 =
𝑘(𝑛)
0.85
Con 𝑘(𝑛) = √𝑛 − 0.01 + y 𝐶𝛼 para algunos valores de 𝛼 se presentan a
√𝑛
continuación:
15/24
𝛼
0.1 0.05 0.01
𝐶𝛼 0.819 0.895 1.035
Criterio de decisión:
Si 𝐷 ≤ 𝐷𝛼 entonces no se rechaza H0.
Si 𝐷 > 𝐷𝛼 entonces se rechaza H0.
Ejemplo 5.13. Verificar, a un nivel de confianza del 95% si los siguientes valores provienen de
una población normal: 6.0, 2.3, 4.8, 5.6, 4.5, 3.4, 3.3, 1.9, 4.8, y 4.5.
Solución.
Las hipótesis que se plantean son las siguientes:
 H0: Los datos siguen una distribución normal

 H1: Los datos no siguen una distribución normal
Datos:
𝑛 = 10, nivel de confianza es del 95%, esto es 1 − 𝛼 = 0.95, así 𝛼 = 0.05, también: 𝑥̅ = 4.11
y 𝑠 2 = 1.82.
Primeramente se obtendrá el estadístico de prueba: 𝐷 = 𝑚á𝑥{𝐷+ , 𝐷− }, para ello se ordenarán

los datos en una tabla de frecuencias.
𝑥𝑖 𝑥(𝑖) Orden 𝑖 𝑥(𝑖) − 𝑥̅ 𝐹0 (𝑥(𝑖) )* 𝐷+ 𝐷−
𝑧(𝑖) =
𝑛 𝑠
6.0 1.9 1 0.1 -1.64 0.05050 0.0495 0.0505
2.3 2.3 2 0.2 -1.34 0.09176 0.1082 -0.0082
4.8 3.3 3 0.3 -0.60 0.27425 0.0257 0.0743
5.6 3.4 4 0.4 -0.53 0.29806 0.1019 -0.0019
4.5 4.5 5 0.5 0.29 0.61409 -0.1141 0.2141
3.4 4.5 6 0.6 0.29 0.61409 -0.0141 0.1141
3.3 4.8 7 0.7 0.51 0.69497 0.0050 0.0950
1.9 4.8 8 0.8 0.51 0.69497 0.1050 -0.0050
4.8 5.6 9 0.9 1.10 0.86433 0.0357 0.0643
4.5 6.0 10 1 1.40 0.91924 0.0808 0.0192
*Los valores se obtuvieron de la tabla normal (N(0,1)).
El estadístico de la prueba que se definió anteriormente como:

𝐷 = 𝑚á𝑥{𝐷+ , 𝐷− } = 0.2141
A partir de la tabla de Kolmogorov-Smirnov se tiene que 𝐶𝛼 = 𝐶0.05 = 0.895, también 𝑘(𝑛) =
0.85 0.85
√𝑛 − 0.01 + √𝑛
= √10 − 0.01 +
√10
= 3.42, ahora el estadístico del Kolmogorov-Smirnov es:
𝐶𝛼 0.895
𝐷𝛼 = = = 0.262
𝑘(𝑛) 3.42
16/24
Tomando en cuenta el criterio de decisión 𝐷 = 0.2141 < 𝐷𝛼 = 0.262 , se concluye que no

existe suficiente evidencia para rechazar la hipótesis H0, en consecuencias los datos se
distribuyen normalmente.
Actividad de autoevaluación.
1. Verificar, a un nivel de confianza del 90% si los siguientes valores correspondientes a los
tiempos de duración de las baterías de automóvil, provienen de una población normal: 2.2,
3.4, 2.5, 3.3, 4.1, 4.7, 3.1, 2.9, 3.4, y 3.1.
5.6. Prueba de hipótesis sobre una proporción de una

población
Las pruebas de proporciones se basan en la ocurrencia de X características en un total de n
𝑋
observaciones, 𝑃̂ = 𝑛 , la cual se espera que sea igual a la proporción verdadera de la población,
tomando ciertos márgenes o tolerancias para la variabilidad muestral. La metodología de prueba
depende de si el número de observaciones de la muestra es grande o pequeño, en este
documento se trabajará con muestras grandes (𝑛 ≥ 30), de este modo, los valores estadísticos
de prueba miden la desviación de un valor estadístico de muestra a partir de un valor propuesto,
las pruebas se basan en la distribución normal estándar.
Las hipótesis que se plantean son las siguientes:
𝑯𝟎 : 𝒑 = 𝒑𝟎
𝑯𝟏 : 𝒑 ≠ 𝒑𝟎
El estadístico de prueba está definido como:
𝑥
− 𝑝0
𝑍𝑝𝑟𝑢𝑒𝑏𝑎 = 𝑛
√𝑝0 (1 − 𝑝0 )
𝑛
Donde
X: ocurrencias de la característica en estudio
n: total de observaciones
𝑥
𝑝̂ = 𝑛 proporción de la muestra
𝑝0: proporción propuesta
𝑝0(1−𝑝0 )
𝜎𝑝 = √ 𝑛
desviación estándar de la proporción
17/24
Ejemplo 5.14. Suponga que se ha tomado una muestra de n=200 y se obtuvo 𝑝̂ = 0.45 ,
realizar un contraste de hipótesis al 99% de confianza para:
H0 : p = 0.4
H1 : 𝑝 ≠ 0.4
Solución:
𝛼
Puesto que  = 0.01 entonces 2
= 0.005, utilizando la tabla de la
normal estándar se tiene: 𝑧𝛼 = 2.575 en el gráfico de la normal se
2
ilustran estos valores (gráfico de la derecha).
La desviación estándar está dada por:
0.4(1  0.4)
p   0.0346
200
Sustituyendo la desviación estándar, 𝑝0 = 0.4 y 𝑝̂ = 0.45 en el estadístico de prueba, se tiene:
0.45  0.4
Z=  1.45
0.0346 1.45
.005 .005
se observa que el valor de 1.45 se encuentra en la zona de
-2.575 2.575
aceptación de H0, por lo tanto no se rechaza la hipótesis nula.
En general las hipótesis pueden ser de la siguiente forma:

H0 : p = p0
H1 : p > p0
p < p0
p  p0
Si la hipótesis alternativa 𝐻1 : 𝑝 > 𝑝0 se conoce como hipótesis unilateral derecha y las zonas de
rechazo y aceptación vienen dada por: R.C = {Z: Z >𝑍𝛼 } R.A = {Z: Z ≤ 𝑍𝛼 }, de forma análoga se
interpreta si 𝐻1 : 𝑝 < 𝑝0, con la diferencia que: R.C = {Z: Z <𝑍𝛼 } R.A = {Z: Z ≥ 𝑍𝛼 }.
1. H0 : p = 0.6
H1 : p  0.6, n = 100,  = 0.01 y 𝑝̂ = 0.55
2. H0 : p = 0.29
H1 : p  0.29, n = 90,  = 0.01 y 𝑝̂ = 0.30

18/24
3. H0 : p = 0.36
H1 : p < 0.36, n = 630,  = 0.05 y 𝑝̂ = 0.4
4. Se cree que aproximadamente, una de cada 10 amas de casa prefieren el detergente

“X”. Después de una campaña publicitaria se entrevistan a 200 amas de casa para
determinar la eficiencia de la campaña. El resultado de la muestra es que un total de 26
amas de casa, inclinaron su preferencia por la marca “X”. ¿Existe evidencia en los datos
para indicar que ha habido un aumento en la aceptación de la marca? Pruebe para
α=0.05.
5. El dueño de un café desea saber si la proporción de mujeres que entran a su negocio es

igual al 60%. Para hacer lo anterior se realiza un muestreo aleatorio de 40 personas,
obteniendo un porcentaje del 58%. Realice el contraste de hipótesis adecuado con un
nivel de significancia del 0.1
6. Nacionalmente, un 16% de los hogares tienen una computadora personal. En una

muestra aleatoria de 80 hogares en un municipio, solo 13 poseían una computadora
personal. Con un nivel de significancia del 5%, pruebe si el porcentajes de hogares del
municipio en estudio que tienen computadoras personales es igual que el porcentaje
nacional.
7. Un partido político afirma que obtendrá el 60% de los votos en las próximas elecciones.
Encuestados 1,000 votantes afirman su intención de votar a dicho partido 540. ¿Se
puede aceptar la hipótesis del partido con un nivel de significación del 5%?
8. Una máquina fabrica piezas de precisión y se garantiza que la proporción de piezas

correctas producidas es al menos del 97%. Un cliente recibe un lote de 200 piezas y
aparecen 8 piezas defectuosas; a un nivel de confianza del 95% ¿rechazará el lote por
no cumplir las condiciones de la garantía?
5.7. Prueba de hipótesis sobre la media de una población
5.7.1. Prueba de hipótesis sobre la media con varianza conocida

Sea 𝑋1 , 𝑋2 , … . 𝑋𝑛 una muestra aleatoria de una distribución normal con media µ desconocida,
suponiendo conocido el valor de la varianza poblacional 𝜎 2 . Nos interesa probar uno de los
siguientes conjuntos de hipótesis respecto a µ:
 Hipótesis Bilateral:
H0: μ =μ0
H1: μ ≠ μ0
 Hipótesis Unilateral Derecho:
19/24
H0: μ =μ0 (μ ≤ μ0)

H1: μ > μ0
 Hipótesis Unilateral Izquierdo:
H0: μ = μ0 (μ ≥ μ0)
H1: μ<μ0
La media muestral, bajo las hipótesis nula (μ =μ0) sigue una distribución normal, 𝑁 (𝜇0 , 𝜎⁄ )
√𝑛
donde n es el tamaño de la muestra. La distribución de la variable tipificada:
𝑥̅ − µ0
𝑍= 𝜎
√𝑛
Si fijamos un nivel de significancia α y la hipótesis nula es cierta, el valor de z, obtenido de una
muestra real para el estadístico 𝑥̅ , se encontrará entre −𝑧𝛼⁄2 y 𝑧𝛼⁄2 , con una probabilidad de
1 – α.
Las regiones críticas (R.C: o de rechazo de la hipótesis nula) y de aceptación de 𝐻0 (R.A) serán
entonces:
Hipótesis bilaterales: R.C = {Z: |Z| >𝑍𝛼⁄2 } R.A = {Z: |Z| ≤ 𝑍𝛼⁄2 }
Hipótesis unilaterales a la derecha: R.C = {Z: Z >𝑍𝛼 } R.A = {Z: Z ≤ 𝑍𝛼 }
Hipótesis unilaterales a la izquierda: R.C = {Z: Z <𝑍𝛼 } R.A = {Z: Z ≥ 𝑍𝛼 }
Ejemplo 5.15. (𝜎 2 conocida o n ≥ 30) suponga una variable aleatoria X para designar el peso de
un pasajero de avión que se interesa en conocer el peso promedio de todos los pasajeros. Como
hay limitaciones de tiempo y dinero para pesarlos a todos, se toma una muestra de 36 pasajeros
de la cual se obtiene una media muestral de 160 libras. Suponga además que la distribución del
peso de los pasajeros es normal con desviación estándar 𝜎 = 30, con un nivel de significancia de
0.05. ¿Se puede concluir que el peso promedio de todos los pasajeros es menor que 170 libras?
Solución.
Datos:
𝑛 = 36 , 𝑥̅ = 160, 𝛼 = 0.05 y 𝜎 = 30
Es una hipótesis unilateral inferior o de cola izquierda, porque se rechaza HO : el peso promedio
es mayor o igual a 170. Estadísticamente las hipótesis son las siguientes:
𝐻0 ∶ µ = 170
𝐻1 ∶ µ < 170
20/24
La ilustración del planteamiento de la hipótesis anterior se presenta en la siguiente figura:
El valor de 𝑧𝛼 , 𝛼 = 0.05, se obtiene en la tabla de distribución normal, este es: 𝑧 = −1.64,
Calculando el estadístico de prueba:

𝑥̅ − µ0 160 − 170
𝑧= 𝜎 = = −2
30
√𝑛 √36
𝑧 = −2
Toma de decisión: Regiones críticas y de aceptación: R.C = {Z: Z <𝑍𝛼 } R.A = {Z: Z ≥ 𝑍𝛼 }, como
𝑧 < 𝑍𝛼 o (−2) < (−1.64). Se rechaza 𝐻0 , con un nivel de significancia de 0.05.
Conclusión: el peso promedio de todos los pasajeros corresponde a un valor menor de 170 libras
con un nivel de significancia de 0.05.
5.7.2. Prueba de hipótesis sobre la media con varianza desconocida

En este caso cabría distinguir dos situaciones, según que la muestra que tomemos sea grande
(>30) o pequeña (≤30).
Sea 𝑋1 , 𝑋2 , … . 𝑋𝑛 una muestra aleatoria de una distribución normal con media µ desconocida,
suponiendo también desconocido el valor de la varianza poblacional 𝜎 2 , por lo que se aproxima
por su estimación, la cuasi varianza muestral. Nos interesa probar uno de los siguientes
conjuntos de hipótesis respecto a µ:
 Hipótesis Bilateral:
H0: μ =μ0
H1: μ ≠ μ0
 Hipótesis Unilateral Derecho:
H0: μ =μ0 (μ ≤ μ0)
H1: μ > μ0
 Hipótesis Unilateral Izquierdo:
H0: μ = μ0 (μ ≥ μ0)
H1: μ<μ0
Se toma la media muestral 𝑥̅ para calcular el estadístico de prueba.
21/24
MUESTRAS GRANDES:
Bajo la hipótesis nula (μ =μ0) y para muestras grandes, el estadístico 𝑋̅ sigue una distribución
aproximadamente normal N( µ0 , 𝑠⁄√𝑛 ) donde n es el tamaño de la muestra. La variable
tipificada:
̅−µ𝟎
𝒙 1
𝒁= 𝒔 donde 𝑠 2 = 𝑛−1
∑(𝑥𝑖 − 𝑥̅ )2 sigue una distribución normal (N(0,1)).
√𝒏
Ejemplo 5.16. La duración promedio de las llantas producidas por una fábrica, según
experiencias registradas es de 46.050 km. Se desea probar con un nivel de confianza del 95% si
el promedio poblacional ha cambiado; para tal efecto se toma una muestra aleatoria de 60
llantas y se obtiene una duración promedio de 45.050 km. Con una desviación estándar de 3.070
km.
Solución
Datos:
𝑛 = 60, 𝑥̅ = 45.050, 𝛼 = 0.05 y 𝑠 = 3.070
Las hipótesis que se desea verificar son las siguientes:
H0 : Duración promedio de las llantas es igual a 46.050
H1 : Duración promedio de las llantas ha cambiado.
De forma estadística las hipótesis son:
𝐻0 ∶ µ = 46.050 y 𝐻1 ∶ µ ≠ 46.050
El estadístico 𝑋̅ sigue una distribución normal N(µ0 , 𝑠⁄√𝑛 ) donde n>30 es el tamaño de la
𝛼 0.05
muestra, como la hipótesis es bilateral: = = 0.025, y 𝑧𝛼/2 = − 1.96, y 𝑧1−𝛼/2 =
2 2
1.96. A partir del gráfico se observa la zona de rechazo y la zona de no rechazo de la hipótesis
nula.
Ahora se calcula el estadístico de prueba y se obtiene:

22/24
̅ − µ𝟎
𝒙 45.050 − 46.050
𝒁= 𝒔 = = −𝟐. 𝟓𝟐
𝟑. 𝟎𝟕𝟎
√𝒏 √𝟔𝟎
Conclusión: Como 𝑍 = −2. 52 se encuentra en la zona de no rechazo de la hipótesis nula, esto

es, es válido que la duración promedio de las llantas ha cambiado.
MUESTRAS PEQUEÑAS
En este caso recordemos que el estadístico elegido,

x̅ − µ0
t= s
√n
sigue una distribución t de Student con n – 1 grados de libertad, en lugar de una distribución
normal, y por tanto cambian las regiones críticas, tal como se muestran a continuación:
Hipótesis bilateral: R.C = { t: |t| >𝑡𝛼⁄2,𝑛−1 } R.A = { t: |t| ≤ 𝑡𝛼⁄2.𝑛−1 }
Hipótesis unilateral a la derecha R.C = { t : t>𝑡𝛼,𝑛−1 } R.A = { t: t ≤ 𝑡𝛼,𝑛−1 }
Hipótesis unilateral Izquierda R.C = { t: t <−𝑡𝛼,𝑛−1 } R.A = { Z: Z ≥ −𝑡𝛼,𝑛−1 }
Ejemplo 5.17. Se toma una muestra aleatoria de doce (12) sobres de café de una empacadora.
Se encuentra que el peso promedio del contenido de café de cada sobre es 15.97 gr. con una
desviación estándar de 0.15. La compañía empacadora afirma que el peso promedio mínimo del
café es de 16 gr. por sobre. ¿Puede aceptarse ésta afirmación si se asume un nivel de confianza
del 90 por ciento?
Solución.
Datos:
𝑛 = 12, 𝑥̅ = 15.97, 1 − 𝛼 = 0.9 o 𝛼 = 0.1 y s= 0.15
Debido a que la compañía empacadora afirma que el peso promedio de cada sobre de café es
de 16 gr. o más, se trata de plantear una hipótesis unilateral izquierda, así:
H0 : El peso promedio de los sobres de café es mayor o igual a 16gr
H1 : El peso promedio de los sobres de café es menor que 16gr.
Estadísticamente se plantea:
𝐻0 ∶ µ = 16 ( µ ≥ 16) y 𝐻1 ∶ µ < 16
El tamaño de la muestra es pequeño (n < 30) y se desconoce la varianza poblacional, se trabaja

con la distribución t de Student, a partir de dicha tabla se obtiene el valor 𝑡𝛼,𝑛−1 = 𝑡0.1,11 =
−1.36 y se ilustra en la siguiente gráfica.
23/24
Calculando el estadístico de prueba:

𝑥̅ − µ0 15.97 − 16
𝑡= 𝑠 = = − 0.69
0.15
√𝑛 √12
Toma de decisión: En vista que el valor -0.69 se encuentra en la zona de no rechazo (aceptación)
de 𝐻0 se concluye que el peso promedio de los sobres de café es mayor o igual a 16 kg.
1. Un fabricante de equipos deportivos ha desarrollado un nuevo hilo sintético para pescar
del cual afirma que tiene un coeficiente de ruptura de 8 kilogramos con una desviación
estándar de 0.5 kilogramos. Probar la hipótesis µ = 8𝑘𝑔 en contra de la alternativa µ ≠
8𝑘𝑔 si se prueba una muestra aleatoria de 50 hilos y se encuentra que tiene un
coeficiente medio de ruptura de 7.8 kg. Utilizar un nivel de significancia de 0.01.
2. Una compañía afirma que una aspiradora gasta en promedio 46 kilowatts–hora al año.
Si una muestra aleatoria de 12 hogares indica que una aspiradora gasta un promedio de
42 kilowatts–hora al año con una desviación estándar de 11.9 kilowatts–hora, ¿sugiere
esto, con un nivel de significancia de 0.05, que las aspiradoras gastan, en promedio,
menos de 46 kilowatts–hora anualmente? Suponga que la variable de kilowatts–hora es
normal.
24/24

UNIDAD III-Parte II

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

UNIDAD III-Parte II

Cargado por

Copyright:

Formatos disponibles

Universidad de El Salvador

Facultad de Ciencias Naturales y Matemática, Licenciatura en

Capítulo 5. Inferencia Estadística

No siempre resulta conveniente realizar la estimación puntual, debido a que no proporciona

5.1. Estimación puntual de un parámetro poblacional.

La mayoría de las distribuciones de probabilidad dependen de cierto número de parámetros.

Definición5.1. Un estimador puntual de un parámetro 𝜃 es un valor que puede ser considerado

Métodos de estimación puntual

Como 𝜇 representa la media en una distribución normal, entonces el estimador de momentos

El estimador de momentos de 𝜎 2 , es la varianza muestral:

𝑃 (𝑥1 , 𝑥2 , … , 𝑥20 ) = 𝑝 𝑥1 (1 − 𝑝)1−𝑥1 𝑝 𝑥2 (1 − 𝑝)1−𝑥2 … 𝑝 𝑥20 (1 − 𝑝)1−𝑥20

𝑃 (𝑥1 , 𝑥2 , … , 𝑥20 ) = 𝑝13 (1 − 𝑝)7

Es decir, se busca el valor de p que hace máxima 𝑃(𝑥1 , 𝑥2 , … , 𝑥20 ) o equivalentemente

𝐿𝑛(𝐿 (𝑝)) = 𝐿𝑛𝑃 (𝑥1 , 𝑥2 , … , 𝑥20 ) = 13 ln(𝑝) + 7𝐿𝑛(1 − 𝑝)

Este valor es en efecto el que maximiza 𝐿 (𝑝) pues

𝐿(𝜃̂1 , 𝜃̂2 , … , 𝜃̂𝑚 ) ≥ 𝐿(𝜃̃1 , 𝜃̃2 , … , 𝜃̃𝑚 ) ∀ 𝜃̃1 , 𝜃̃2 , … , 𝜃̃𝑚

La función de verosimilitud es:

El logaritmo de la función de verosimilitud es:

𝐿𝑛(𝐿(𝜆)) = −𝑛𝜆 + ∑ 𝑥𝑖 𝐿𝑛(𝜆) − ∑ 𝐿𝑛(𝑥𝑖 !)

Derivando e igualando a cero e tiene:

Esto es: 𝜆̂ = 𝑥̅ , el estimador de máxima verosimilitud de 𝜆 es igual al que se obtuvo con el

Recordar que la función de densidad de la distribución normal está dada por:

La función de verosimilitud es:

Por propiedades del logaritmo se tiene:

Esto es: 𝜇̂ = 𝑋̅ , el estimador de máxima verosimilitud de 𝜇 es igual a la media muestral.

Propiedades de un buen estimador.

Definición 5.4. Un estimador puntual 𝜃̂ del parámetro 𝜃 es insesgado si 𝐸(𝜃̂) = 𝜃

Si 𝜃̂ no es insesgado, se denomina sesgo de 𝜃̂ a 𝑏(𝜃̂) = 𝐸(𝜃̂) − 𝜃. Por lo tanto, un estimador

Ejemplo 5.6. Sea X: número de éxitos en n repeticiones de un experimento binomial con

Se tiene que calcular el valor esperado de 𝑝̂ , así:

Se tiene que 𝜇̂ = 𝑋̅ es un estimador insesgado de 𝜇.

3. El tiempo de realización en minutos de una determinada tarea dentro de un proceso

Calcular el estimador de máxima verosimilitud de 𝜃 para una muestra aleatoria simple

4. Mediante un muestreo aleatorio simple se han recogido los siguientes 15 tiempos de

5.2. Intervalo de confianza para la proporción de una población.

Si el estadístico es la proporción de éxitos en una muestra de tamaño 𝑛 ≥ 30 extraída de una

Realizando operaciones algebraicas al interior de la probabilidad se tiene:

a) Hallar un intervalo de confianza del 90% para la verdadera proporción población.

a) Utilizando la tabla normal se obtiene 𝑍𝛼 = 1.645

𝑃 (𝑍 > 𝑍𝛼 ) = 0.05, esto es 𝑃 (𝑍 > 1.645) = 0.05

Finalmente el intervalo de confianza del 90% para p es:

0.3(1 − 0.3) 0.3(1 − 0.3)

b) 𝛼 = 0.01 ⇒ 𝛼/2 = 0.005

𝑃 (𝑍 > 2.545) = 0.005

0.3(1 − 0.3) 0.3(1 − 0.3)

Construir un intervalo de 95% de confianza para la proporción de mujeres hipertensas en la

n = 412, 𝑝̂ = 0.176 , 1 − 𝛼 = 0.95 ⇒ 𝛼 = 0.05 ⇒ 𝛼/2 = 0.025

𝑃 (𝑍 > 𝑍𝛼 ) = 0.025, esto es 𝑃 (𝑍 > 1.96) = 0.025

Finalmente el intervalo de confianza del 95% para p es:

0.176(1 − 0.176) 0.176(1 − 0.176)

Intervalos de confianza para una proporción poblacional p para n < 30

Si el tamaño de la muestra es pequeña n < 30 los intervalos de confianza para proporciones se

Utilizando la tabla t de Student con n − 1 = 28 − 1 = 27 se obtiene 𝑡0.025,27 = 2.0518 tal que

𝑃 (𝑇 > 𝑡𝛼,27 ) = 0.025, esto es 𝑃(𝑇 > 2.0518) = 0.025

Finalmente el intervalo de confianza del 95% para p es:

0.57(1 − 0.57) 0.57(1 − 0.57)

5.3. Intervalo de confianza para la media de una población con

La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido

5.3.1. Intervalo de confianza para la media de una población con

𝑃 (𝑥1 < 𝑋̅ < 𝑥2 ) = 1 − 𝛼

Finalmente, realizando operaciones algebraicas al interior de la probabilidad en la expresión

𝑃 (𝑥̅ − 𝑍𝛼 (𝜎/√𝑛) < 𝜇 < 𝑥̅ + 𝑍𝛼 (𝜎/√𝑛)) = 1 − 𝛼

a) ¿Cuál es el estimador puntual de la media poblacional?