Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Una estimación puntual del valor de un parámetro poblacional desconocido (como puede ser la
media μ, o la desviación estándar σ), es un número que se utiliza para aproximar el verdadero
valor de dicho parámetro poblacional. A fin de realizar tal estimación, se toma una muestra de
la población y se calcula el estadístico muestral asociado al parámetro (𝑥̅ para la media, s para
la desviación estándar, etc.). El valor de este estadístico será la estimación puntual del
parámetro poblacional.
A los estimadores por intervalo generalmente se les llama intervalos de confianza, este
contiene un conjunto de valores posibles del parámetro a estimar obtenidos a partir de la
muestra aleatoria de la cual se determina el estadístico de interés. Para llevar a cabo la
estimación por intervalo es necesario conocer: el nivel de confianza y el error estándar.
Por otra parte, en inferencia estadística se plantean hipótesis sobre los posibles valores que
puede tomar un parámetro de la población y se verifica la validez o no, a través de los datos
muestrales haciendo uso de las distribuciones muestrales de los estadísticos de interés, este
procedimiento se conoce como contraste de hipótesis.
El objetivo de la estimación puntual es usar una muestra para obtener números que, en algún
sentido, sean los que mejor representan a los verdaderos valores de los parámetros de interés.
Supongamos que se selecciona una muestra de tamaño n de una población. Antes de obtener la
muestra no sabemos cuál será el valor de cada observación. Así, la primera observación puede
ser considerada una variable aleatoria X1, la segunda una variable aleatoria X2, etc. Por lo tanto,
antes de obtener la muestra denote por X1 , X2 ,..., Xn a las observaciones y, una vez obtenida la
muestra, denote por 𝑥1 , 𝑥2 , … , 𝑥𝑛 a los valores observados.
Del mismo modo, antes de obtener una muestra, cualquier función de ella será una variable
aleatoria, por ejemplo:𝑋̅, 𝜎 2 , etc. Una vez obtenida la muestra los valores calculados serán
denotados por 𝑥̅ , 𝑠 2 .
1/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
¿Cómo obtener estimadores para un problema dado? Se estudian dos métodos que
proporcionan estimadores puntuales: el método de momentos y el método de máxima
verosimilitud.
Método de momentos: La idea básica consiste en igualar ciertas características muestrales con
las correspondientes características poblacionales.
Definición 5.2. Sean X1 , X2 ,..., Xn una muestra aleatoria de una distribución con función de
probabilidad o función de densidad que depende de m parámetros 𝜃1 , 𝜃2 , … , 𝜃𝑚 . Los
estimadores de momentos son los valores 𝜃̂1 , 𝜃̂2 , … , 𝜃̂𝑚 que se obtienen igualando m momentos
poblacionales con los correspondientes momentos muestrales.
Ejemplo 5.1. Sean X1 , X2 ,..., Xn una muestra aleatoria de una distribución de Poisson de
parámetro 𝜆, obtener el estimador de momentos para 𝜆.
Solución.
Como 𝜆 representa la media en una distribución de Poisson, se iguala la media muestral a 𝜆, así:
𝑛
𝑋𝑖
∑ = 𝜆̂
𝑛
𝑖=1
Ejemplo 5.2. Sean X1 , X2 ,..., Xn una muestra aleatoria de una distribución 𝑁(𝜇, 𝜎 2 ), obtener los
estimadores de momentos para 𝜇 y 𝜎 2 .
Solución.
Método de máxima verosimilitud (EMV): Este método fue introducido por Fisher en la década
de 1920. Se basa en la idea de hallar los valores de los parámetros que hacen que la probabilidad
de obtener una muestra dada sea máxima.
Ejemplo 5.3. Se realiza una encuesta de opinión a una muestra aleatoria de 20 personas. Se les
formula una única pregunta que será respondida por Si o por NO. Sean X1, X2 ,..., X20 las variables
aleatorias correspondientes a la respuesta, tales que
2/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
1 𝑠𝑖 𝑙𝑎 𝑝𝑒𝑟𝑠𝑜𝑛𝑎 𝑖 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒 𝑆𝐼
𝑋𝑖 = {
0 𝑠𝑖 𝑙𝑎 𝑝𝑒𝑟𝑠𝑜𝑛𝑎 𝑖 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒 𝑁𝑂
para i=1, 2, …., 20 y sea p=P(Xi=1). Determinar el estimador de máxima verosimilitud de p.
Solución.
Observe que las variables aleatorias Xi son independientes y cada una de ellas tiene distribución
B(1, p). Entonces, la función de probabilidad conjunta del vector (X1, X2 ,..., X20) es:
La pregunta es: ¿qué valor de p hace que los valores muestrales obtenidos sean los más
probables?
Para ello, como esta función es derivable respecto de p, se buscan los posibles puntos críticos,
igualando a 0 la derivada primera.
𝜕𝐿𝑛(𝐿(𝑝)) 13 7 13(1−𝑝)−7𝑝 13−20𝑝 13
𝜕𝑝
= 𝑝
− 1−𝑝 = 0 ⇒ 𝑝(1−𝑝)
= 𝑝(1−𝑝)
= 0 ⇔ 13 − 20𝑝 = 0 ⇒ 𝑝̂ = 20
𝜕 2 𝐿𝑛(𝐿(𝑝)) 13 7 6
| = − | = − (20)2 < 0
𝜕𝑝2 𝑝=
13 𝑝 2 (1 − 𝑝)2
𝑝=
13 7(13)
20 20
13
Por tanto, el estimador de máxima verosimilitud de p es 𝑝̂ = 20 ya que maximiza la función
𝑃 (𝑥1 , 𝑥2 , … , 𝑥20 ).
Definición 5.3. Sean X1 , X2 ,..., Xn variables aleatorias con función de probabilidad conjunta
𝑃 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) o función de densidad conjunta 𝑓 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) que depende de m parámetros
𝜃1 , 𝜃2 , … , 𝜃𝑚 . Cuando (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) son los valores observados y la función de probabilidad o
de densidad conjunta se considera función de los parámetros 𝜃1 , 𝜃2 , … , 𝜃𝑚 se denomina función
de verosimilitud y se denota 𝐿(𝜃1 , 𝜃2 , … , 𝜃𝑚 ) = 𝑃 (𝑥1 , 𝑥2 , … , 𝑥𝑛 /𝜃1 , 𝜃2 , … , 𝜃𝑚 ) .
Los estimadores de máxima verosimilitud (EMV) de 𝜃1 , 𝜃2 , … , 𝜃𝑚 son los valores 𝜃̂1 , 𝜃̂2 , … , 𝜃̂𝑚
que maximizan la función de verosimilitud, o sea los valores tales que
La forma general de los EMV se obtiene reemplazando los valores observados 𝑥𝑖 por las
variables aleatorias Xi.
3/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
Ejemplo 5.4. Sean X1 , X2 ,..., Xn una muestra aleatoria de una distribución Poisson de parámetro
𝜆, obtener el estimador de máxima verosimilitud (EMV) para 𝜆.
Solución.
∑𝑛
𝑒 −𝑛𝜆 𝜆 𝑖=1 𝑥𝑖
La probabilidad conjunta es 𝑃 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) = ∏𝑛
𝑖=1 𝑥𝑖 !
Ejemplo 5.5. Sean X1 , X2 ,..., Xn una muestra aleatoria de una distribución normal con media 𝜇
y varianza 𝜎 2 (𝑁(𝜇, 𝜎 2 ) obtener el estimador de máxima verosimilitud de 𝜇 y 𝜎 2 .
Solución.
4/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
2
Derivando e igualando con respecto a 𝜇 y 𝜎 e igualando a cero e tiene:
𝑛
𝜕𝐿𝑛(𝐿(𝜇, 𝜎 2 )) 2 ∑𝑛𝑖=1(𝑋𝑖 − 𝜇) ∑𝑛𝑖=1 𝑋𝑖
= = 0 ⇒ ∑(𝑋𝑖 − 𝜇 ) = 0 ⇒ 𝜇̂ =
𝜕𝜇 2𝜎 2 𝑛
𝑖=1
Ahora:
𝑛 𝑛
𝜕𝐿𝑛(𝐿(𝜇, 𝜎 2 )) 𝑛 1 1
2
= − 2 + 4 ∑(𝑋𝑖 − 𝜇)2 = 0 ⇒ 𝑛 = 2 ∑(𝑋𝑖 − 𝜇)2
𝜕𝜎 2𝜎 2𝜎 𝜎
𝑖=1 𝑖=1
1
Por tanto, 𝜎 2 = 𝑛 ∑𝑛𝑖=1(𝑋𝑖 − 𝜇)2 , reemplazando el estimador de 𝜇 esto es: 𝜇̂ = 𝑋̅ , se tiene que
1
𝜎̂ 2 = ∑𝑛𝑖=1(𝑋𝑖 − 𝑥̅ )2 , se observa que el estimador de máxima verosimilitud de 𝜎 2 es la suma
𝑛
de las desviaciones al cuadrado de los datos respecto a la media divididos por n, este estimador
1
no coincide con la varianza muestral 𝑆 2 = ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑛−1
Observe que, dada una muestra X1 , X2 ,..., Xn , donde 𝑋~𝐹𝜃 , un estimador puntual del parámetro
𝜃, obtenido con base a muestra, es una variable aleatoria 𝜃̂ . La diferencia 𝜃̂ − 𝜃 es el error de
estimación y una estimación será más precisa cuanto menor sea este error.
Este error es también una variable aleatoria dado que depende de la muestra obtenida. Para
algunas muestras será positivo, para otras negativo. Una propiedad deseable es que la
esperanza del error sea 0, es decir que “en promedio” el error obtenido al estimar a partir de
diferentes muestras sea cero.
Solución.
𝐸(𝑝̂ ) = 𝑝
Lo cual verifica que 𝑝̂ es insesgado.
5/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
Ejemplo 5.7. Sean X1 , X2 ,..., Xn una muestra aleatoria de una distribución normal con media 𝜇
y varianza 𝜎 2 (𝑁(𝜇, 𝜎 2 ) los estimador de máxima verosimilitud de 𝜇 y 𝜎 2 son: 𝜇̂ = 𝑋̅ y 𝜎̂ 2 =
1 𝑛
∑𝑖=1(𝑋𝑖 − 𝑋̅)2 respectivamente, verificar si son insesgados.
𝑛
Solución.
𝑛 𝑛
∑𝑛𝑖=1 𝑋𝑖 1 1
𝐸 (𝜇̂ ) = 𝐸(𝑋̅ ) = 𝐸 ( ) = (∑ 𝐸(𝑋𝑖 )) = (∑ 𝜇) = 𝜇
𝑛 𝑛 𝑛
𝑖=1 𝑖=1
1 1
= 𝑛 (∑𝑛𝑖=1 𝐸(𝑋𝑖2 )) − 𝐸(𝑋̅ 2 ) = 𝑛 𝑛𝐸(𝑋12 ) − 𝐸(𝑋̅ 2 ) = 𝐸(𝑋12 ) − 𝐸(𝑋̅ 2 )
Se ha tomado en cuenta que todos los 𝑋𝑖 ~𝑁(𝜇, 𝜎 2 ) por tanto 𝐸(𝑋𝑖2 ) = 𝐸(𝑋12 ) , además
recordar que: 𝐸(𝑋12 ) = 𝑉 (𝑋1 ) + [𝐸(𝑋1 )]2 y 𝑋̅~𝑁(𝜇, 𝜎 2 /𝑛) , así:
𝜎2 𝑛−1
𝐸(𝜎̂ 2 ) = 𝑉(𝑋1 ) + [𝐸(𝑋1 )]2 − 𝑉(𝑋̅) − [𝐸(𝑋̅)]2 = 𝜎 2 + 𝜇2 − − 𝜇2 = 𝜎 2 ( )
𝑛 𝑛
Por tanto el estimador 𝜎̂ 2 de máxima verosimilitud 𝜎 2 no es insesgado.
Actividad de autoevaluación
1. Sean X1 , X2 ,..., Xn una muestra aleatoria, indicar cuales de los siguientes estimadores
de la media población son insesgados:
𝑋
a) 𝑇1 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = ∑𝑛𝑖=1 𝑖 𝑛−1
𝑋1+𝑋𝑛
b) 𝑇2 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = 2
c) 𝑇3 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = 𝑋𝑛 − 𝑋1
(𝑋𝑖−𝑋̅ )2
2. Verificar que la varianza muestral 𝑆 2 = ∑𝑛𝑖=1 𝑛−1
es un estimador insesgado de la
varianza poblacional cualquiera sea la distribución.
6/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
A menudo es necesario construir intervalos de confianza para una proporción. Por ejemplo,
supóngase que se toma una muestra de tamaño n de una población grande y que X
observaciones de esta muestra pertenecen a una clase de interés.
𝐸(𝑝̂ ) = 𝑝
𝑋 1 𝑛𝑝𝑞 𝑝(1 − 𝑝)
𝑉(𝑝̂ ) = 𝑉 ( ) = 2 𝑉(𝑋) = 2 =
𝑛 𝑛 𝑛 𝑛
Teniendo en cuenta las expresiones anteriores, la tipificación (𝑍~𝑁(0,1)) que se utilizará para
construir el intervalos de confianza es:
𝑝̂ − 𝑝
𝑍= ~𝑁(0,1)
√𝑝(1 − 𝑝)
𝑛
Sin embargo la 𝑉 (𝑝̂ ) es desconocida, ya que p no se conoce (es parámetro) por lo que se
requiere utilizar su estimador:
𝑝̂ (1 − 𝑝̂ )
𝑉̂
(𝑝̂ ) =
𝑛
El intervalo de confianza del (1 − 𝛼 )100% para estimar una proporción p verifica:
𝑝̂ − 𝑝
𝑃 −𝑍𝛼 < < 𝑍𝛼 = 1−𝛼
√𝑝̂ (1 − 𝑝̂ )
2 2
( 𝑛 )
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑃 (−𝑍𝛼 √ < 𝑝̂ − 𝑝 < 𝑍𝛼 √ )= 1−𝛼
2 𝑛 2 𝑛
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑃 (𝑝̂ − 𝑍𝛼 √ < 𝑝 < 𝑝̂ + 𝑍𝛼 √ )= 1−𝛼
2 𝑛 2 𝑛
El intervalo de confianza del (1 − 𝛼 )100% para estimar una proporción p, se expresa como:
7/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑝̂ − 𝑍𝛼 √ < 𝑝 < 𝑝̂ + 𝑍𝛼 √
2 𝑛 2 𝑛
Ejemplo 5.8. Un partido político pretende conocer la intención de votos de cara a las próximas
elecciones. Para ello encarga un sondeo sobre un total de 230 personas, de las que 69 contestan
que votarían por dicho partido.
Datos:
69
n = 230, 𝑝̂ = 230 = 0.3 , 1 − 𝛼 = 0.9 ⇒ 𝛼 = 0.1 ⇒ 𝛼/2 = 0.05
0.3 − 0.03022 < 𝑝 < 0.3 + 0.03022 ⇒ 0.27 < 𝑝 < 0.33
Un intervalo de confianza del 90% para p es: 0.27 < 𝑝 < 0.33.
0.3 − 0.0769 < 𝑝 < 0.3 + 0.0769 ⇒ 0.2231 < 𝑝 < 0.3769
Un intervalo de confianza del 99% para p es 0.2231 < 𝑝 < 0.3769 observe que es más amplio
que el intervalo del literal a) ya que ahora el nivel de confianza es mayor.
Ejemplo 5.9. En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres
mayores de 15 años en la Región Metropolitana, se encontró que el 17.6% eran hipertensas.
8/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
Datos:
0.176 − 0.03677 < 𝑝 < 0.176 + 0.03677 ⇒ 0.139 < 𝑝 < 0.213
Un intervalo de confianza del 95% para p es: 0.139 < 𝑝 < 0.213.
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑝̂ − 𝑡𝛼,𝑛−1 √ < 𝑝 < 𝑝̂ + 𝑡𝛼 ,𝑛−1 √
2 𝑛 2 𝑛
Observe que se ha sustituido la t de Student con n-1 grados de libertad en vez de la Z, (N(0, 1)).
Ejemplo 5.10. La oficina gubernamental de salud desea realizar una campaña a fin de
disminuir el porcentaje de funcionarios públicos que tienen el hábito de fumar en horas de
trabajo, para ello decide realizar una investigación por muestreo a 28 funcionarios,
encontrando que 16 de ellos fuman. Determine el intervalo de confianza del 95% para la
proporción de fumadores.
Solución.
Datos:
16
n = 28, 𝑝̂ = 28 = 0.57 , 1 − 𝛼 = 0.95 ⇒ 𝛼 = 0.05 ⇒ 𝛼/2 = 0.025
9/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
0.57 − 0.192 < 𝑝 < 0.57 + 0.192 ⇒ 0.378 < 𝑝 < 0.762
Un intervalo de confianza del 95% para p es: 0.378 < 𝑝 < 0.762.
Actividad de autoevaluación
1. En una encuesta realizada a 800 personas elegidas al azar, 240 declaran su intención de
votar al partido A. Estima, con un nivel de confianza del 95%, entre qué valores se
encuentra la intención de voto del partido A en todo el país.
2. Se selecciona aleatoriamente una muestra de 300 personas en una ciudad y se les pregunta
si consideran que el tráfico es muy pesado. Responden afirmativamente 175 personas. ¿Cuál
es el intervalo de confianza de la proporción de ciudadanos de esa ciudad que consideran
que el tráfico es pesado, con un nivel de confianza del 90%?
3. Se hizo una encuesta a 325 personas mayores de 16 años y se encontró que 120 iban al cine
regularmente. Hallar, con un nivel de confianza del 99%, un intervalo para estudiar la
proporción de los ciudadanos que van al cine regularmente.
Si se dispone de una población que tiene una variable aleatoria X con distribución 𝑁(𝜇, 𝜎 2 )
y con 𝜎 2 conocida. En la unidad 4 se estudió que la distribución muestral de la media
corresponde a: 𝑋̅~𝑁(𝜇, 𝜎 2 /𝑛).
El objetivo es estimar la media poblacional 𝜇 a partir de la media muestral 𝑋̅, obteniendo para
ello un intervalo de forma que tenga una probabilidad alta 1 − 𝛼 de que la media poblacional
esté en dicho intervalo, esto es:
10/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
𝑋̅ −𝜇
Observe que: 𝑍 = 𝜎/√𝑛 ~𝑁(0,1) por lo tanto, se tiene un intervalo centrado y el límite inferior
sería 𝑍1−𝛼/2 donde 𝑍1−𝛼/2 es el valor de la variable aleatoria N(0,1) que deja a la derecha una
probabilidad de 1 − 𝛼/2 y el límite superior sería 𝑍𝛼/2 donde 𝑍𝛼/2 es el valor de la variable
aleatoria N(0,1) que deja a la derecha una probabilidad de 𝛼/2, obviamente se verifica que
𝑍𝛼/2 = −𝑍1−𝛼/2 . Tomando en cuenta estas consideraciones, volvamos a la construcción del
intervalo de confianza para 𝜇, así:
𝑥1−𝜇 𝑋̅ −𝜇 𝑥2−𝜇 𝑋̅ −𝜇
𝑃 (𝑥1 < 𝑋̅ < 𝑥2 ) = 𝑃 (𝜎/√𝑛 < 𝜎/√𝑛 < 𝜎/√𝑛) = 𝑃 (−𝑍𝛼/2 < 𝜎/√𝑛 < 𝑍𝛼/2 ) = 1 − 𝛼
Ejemplo 5.11. Una institución gubernamental conoce que la desviación estándar del gasto
promedio en cigarrillos es de $5 por semana. Una muestra de 49 fumadores revela que el gasto
promedio que invierten en cigarrillos durante una semana es de $20.00.
Solución
Este intervalo se interpreta como: El 95% de las muestras de tamaño 49 que se tome de
la población de fumadores, su gasto promedio semanal estará entre (18.6, 21.4)
dólares.
11/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
Siempre que se sustituya la desviación estándar poblacional 𝜎 por la muestral, s, o bien que el
tamaño muestral sea pequeño (n < 30), en el intervalo de confianza se requiere utilizar la
distribución t de Student (con n-1 grados de libertad, siendo n el tamaño de la muestra), en vez
de la distribución normal.
Ejemplo 5.12. Los siguientes datos son los puntajes obtenidos para 45 personas de una escala
de depresión (mayor puntaje significa mayor depresión).
2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14
14 15 15 16 16 16 16 16 16
16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 20 20
Utilice la información anterior para construir un intervalo de confianza del 95% para el puntaje
promedio poblacional, suponga que los datos tienen distribución normal.
Solución.
12/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
Se tiene que 1 − 𝛼 = 0.95 ⇒ 𝛼 = 0.05 ⇒ 𝛼/2 = 0.025, utilizando la tabla t de Student con
n − 1 = 45 − 1 = 44 se obtiene 𝑡0.025,44 = 2.009 tal que 𝑃 (𝑇 > 𝑡𝛼,44 ) = 0.025, esto es
2
𝑃 (𝑇 > 2.009) = 0.025
Finalmente, teniendo en cuenta que 𝑥̅ = 14.5, 𝑠 = 4.32, y 𝑡0.025,44 = 2.009 el intervalo de
confianza del 95% para 𝜇 es:
4.32 4.32
14.5 − 2.009 < 𝜇 < 14.5 − 2.009 = 13.21 < 𝜇 < 15.79
√45 √45
Luego, el intervalo de confianza del 95% para 𝜇 es (13.21, 15.79). Es decir, el puntaje promedio
poblacional se encuentra entre 13.2 y 15.8 con una confianza 95%.
Actividad de autoevaluación.
1. El número de horas semanales que los estudiantes de cierto centro educativo dedican
al deporte se distribuye según una ley normal con varianza 7.29 horas. Para muestras
de tamaño 36 se obtuvo una media de 4 horas, indique cuál es el intervalo de confianza
del 90% para la media poblacional.
En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se
hacen las pruebas para verificar la aseveración o para determinar que no es verdadera. Por
tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de
probabilidad se emplea para determinar si la hipótesis es una afirmación razonable.
13/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
La hipótesis nula es una afirmación que no se rechaza a menos que los datos muestrales
proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula
siempre contiene un signo de igualdad con respecto al valor especificado del parámetro.
La hipótesis alternativa 𝐻1 es cualquier aseveración que difiera de la hipótesis nula. Es una
afirmación que se acepta si los datos muestrales proporcionan evidencia suficiente de que la
hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación. El
planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al
valor especificado del parámetro.
Hay que definir la distribución de trabajo: 𝑍~𝑁(0,1), t de Studen o cualquier otra distribución.
La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de
rechazo (conocida como región crítica, R.C) y una región de no rechazo (aceptación, R.A). Si la
estadística de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis
nula, caso contrario se rechaza 𝐻0 .
Tipos de errores.
La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa por
𝐻0 . Rechazar 𝐻0 implica aceptar una hipótesis alternativa (𝐻1 ).
El esquema de los posibles errores que se pueden cometer al realizar un contraste de hipótesis
es el siguiente:
𝐻0 es cierta 𝐻0 es falsa (𝐻1 es cierta)
Se rechaza 𝐻0 Error tipo I (𝛼) Decisión correcta
No se rechaza 𝐻0 Decisión correcta Error tipo II (𝛽)
Error de Tipo I: consiste en rechazar una hipótesis nula correcta. La probabilidad de un error de
Tipo I es igual a 𝛼 y se denomina nivel de significación, su cálculo es el siguiente:
𝛼 = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 / 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎)
Error de Tipo II: no rechazar una hipótesis nula incorrecta. La probabilidad de un error de Tipo
II es igual a 𝛽 y se obtiene como:
𝛽 = 𝑃(𝑎𝑐𝑒𝑝𝑡𝑎𝑟 𝐻0 / 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎)
14/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
Potencia del test: probabilidad de rechazar una hipótesis nula cuando es incorrecta, se obtiene
como:
1 − 𝛽 = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 / 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎)
Para comprobar la hipótesis nula de que la muestra ha sido extraída de una población con
distribución de probabilidad normal se puede realizar un estudio analítico, como es la prueba
de Kolmogorov-Smirnov que se presenta a continuación.
Prueba de Kolmogorov-Smirnov
𝐷 = 𝑚á𝑥{𝐷+ , 𝐷− }
𝑖 𝑖−1
Donde 𝐷+ = max {𝑛 − 𝐹0 (𝑥(𝑖) )}, 𝐷− = max {𝐹0 (𝑥(𝑖) ) − 𝑛
}, y 𝐹0 (𝑥(𝑖) ) es la probabilidad
1≤𝑖≤𝑛 1≤𝑖≤𝑛
de observar valores menores o iguales que 𝑥(𝑖) cuando 𝐻0 es cierta o la distribución acumulada
teórica correspondiente a la población normal especificada en la hipótesis nula y
𝑥(𝑖) es el i-ésimo valor observado en la muestra (cuyos valores se han ordenado previamente de
menor a mayor)
𝑥(𝑖) −𝑥̅
En general los 𝑥(𝑖) no están tipificado por tanto habrá que estandarizar, así: 𝑧(𝑖) = 𝑠
luego
calcular 𝐹0 (𝑧(𝑖) ) utilizando la tabla normal (N(0,1)).
La tabla utilizada para realizar el contraste de hipótesis proporciona los valores de 𝐷𝛼 o 𝐶𝛼 que
𝐶𝛼
se relacionan a través de la siguiente expresión: 𝐷𝛼 =
𝑘(𝑛)
0.85
Con 𝑘(𝑛) = √𝑛 − 0.01 + y 𝐶𝛼 para algunos valores de 𝛼 se presentan a
√𝑛
continuación:
15/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
𝛼
0.1 0.05 0.01
𝐶𝛼 0.819 0.895 1.035
Criterio de decisión:
Ejemplo 5.13. Verificar, a un nivel de confianza del 95% si los siguientes valores provienen de
una población normal: 6.0, 2.3, 4.8, 5.6, 4.5, 3.4, 3.3, 1.9, 4.8, y 4.5.
Solución.
Datos:
𝑛 = 10, nivel de confianza es del 95%, esto es 1 − 𝛼 = 0.95, así 𝛼 = 0.05, también: 𝑥̅ = 4.11
y 𝑠 2 = 1.82.
𝐶𝛼 0.895
𝐷𝛼 = = = 0.262
𝑘(𝑛) 3.42
16/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
Actividad de autoevaluación.
1. Verificar, a un nivel de confianza del 90% si los siguientes valores correspondientes a los
tiempos de duración de las baterías de automóvil, provienen de una población normal: 2.2,
3.4, 2.5, 3.3, 4.1, 4.7, 3.1, 2.9, 3.4, y 3.1.
𝑯𝟎 : 𝒑 = 𝒑𝟎
𝑯𝟏 : 𝒑 ≠ 𝒑𝟎
𝑥
− 𝑝0
𝑍𝑝𝑟𝑢𝑒𝑏𝑎 = 𝑛
√𝑝0 (1 − 𝑝0 )
𝑛
Donde
n: total de observaciones
𝑥
𝑝̂ = 𝑛 proporción de la muestra
𝑝0(1−𝑝0 )
𝜎𝑝 = √ 𝑛
desviación estándar de la proporción
17/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
Ejemplo 5.14. Suponga que se ha tomado una muestra de n=200 y se obtuvo 𝑝̂ = 0.45 ,
realizar un contraste de hipótesis al 99% de confianza para:
H0 : p = 0.4
H1 : 𝑝 ≠ 0.4
Solución:
𝛼
Puesto que = 0.01 entonces 2
= 0.005, utilizando la tabla de la
normal estándar se tiene: 𝑧𝛼 = 2.575 en el gráfico de la normal se
2
ilustran estos valores (gráfico de la derecha).
0.4(1 0.4)
p 0.0346
200
0.45 0.4
Z= 1.45
0.0346 1.45
.005 .005
se observa que el valor de 1.45 se encuentra en la zona de
-2.575 2.575
aceptación de H0, por lo tanto no se rechaza la hipótesis nula.
Actividad de autoevaluación
1. H0 : p = 0.6
2. H0 : p = 0.29
3. H0 : p = 0.36
7. Un partido político afirma que obtendrá el 60% de los votos en las próximas elecciones.
Encuestados 1,000 votantes afirman su intención de votar a dicho partido 540. ¿Se
puede aceptar la hipótesis del partido con un nivel de significación del 5%?
Hipótesis Bilateral:
H0: μ =μ0
H1: μ ≠ μ0
Hipótesis Unilateral Derecho:
19/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
La media muestral, bajo las hipótesis nula (μ =μ0) sigue una distribución normal, 𝑁 (𝜇0 , 𝜎⁄ )
√𝑛
donde n es el tamaño de la muestra. La distribución de la variable tipificada:
𝑥̅ − µ0
𝑍= 𝜎
√𝑛
Si fijamos un nivel de significancia α y la hipótesis nula es cierta, el valor de z, obtenido de una
muestra real para el estadístico 𝑥̅ , se encontrará entre −𝑧𝛼⁄2 y 𝑧𝛼⁄2 , con una probabilidad de
1 – α.
Las regiones críticas (R.C: o de rechazo de la hipótesis nula) y de aceptación de 𝐻0 (R.A) serán
entonces:
Hipótesis bilaterales: R.C = {Z: |Z| >𝑍𝛼⁄2 } R.A = {Z: |Z| ≤ 𝑍𝛼⁄2 }
Ejemplo 5.15. (𝜎 2 conocida o n ≥ 30) suponga una variable aleatoria X para designar el peso de
un pasajero de avión que se interesa en conocer el peso promedio de todos los pasajeros. Como
hay limitaciones de tiempo y dinero para pesarlos a todos, se toma una muestra de 36 pasajeros
de la cual se obtiene una media muestral de 160 libras. Suponga además que la distribución del
peso de los pasajeros es normal con desviación estándar 𝜎 = 30, con un nivel de significancia de
0.05. ¿Se puede concluir que el peso promedio de todos los pasajeros es menor que 170 libras?
Solución.
Datos:
𝑛 = 36 , 𝑥̅ = 160, 𝛼 = 0.05 y 𝜎 = 30
Es una hipótesis unilateral inferior o de cola izquierda, porque se rechaza HO : el peso promedio
es mayor o igual a 170. Estadísticamente las hipótesis son las siguientes:
𝐻0 ∶ µ = 170
𝐻1 ∶ µ < 170
20/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
Conclusión: el peso promedio de todos los pasajeros corresponde a un valor menor de 170 libras
con un nivel de significancia de 0.05.
Sea 𝑋1 , 𝑋2 , … . 𝑋𝑛 una muestra aleatoria de una distribución normal con media µ desconocida,
suponiendo también desconocido el valor de la varianza poblacional 𝜎 2 , por lo que se aproxima
por su estimación, la cuasi varianza muestral. Nos interesa probar uno de los siguientes
conjuntos de hipótesis respecto a µ:
Hipótesis Bilateral:
H0: μ =μ0
H1: μ ≠ μ0
Hipótesis Unilateral Derecho:
H0: μ =μ0 (μ ≤ μ0)
H1: μ > μ0
Hipótesis Unilateral Izquierdo:
H0: μ = μ0 (μ ≥ μ0)
H1: μ<μ0
Se toma la media muestral 𝑥̅ para calcular el estadístico de prueba.
21/24
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de las Ciencias Naturales, Educación a distancia.
Asignatura: Estadística Aplicada a la Educación, Unidad 3
MUESTRAS GRANDES:
Bajo la hipótesis nula (μ =μ0) y para muestras grandes, el estadístico 𝑋̅ sigue una distribución
aproximadamente normal N( µ0 , 𝑠⁄√𝑛 ) donde n es el tamaño de la muestra. La variable
tipificada:
̅−µ𝟎
𝒙 1
𝒁= 𝒔 donde 𝑠 2 = 𝑛−1
∑(𝑥𝑖 − 𝑥̅ )2 sigue una distribución normal (N(0,1)).
√𝒏
Ejemplo 5.16. La duración promedio de las llantas producidas por una fábrica, según
experiencias registradas es de 46.050 km. Se desea probar con un nivel de confianza del 95% si
el promedio poblacional ha cambiado; para tal efecto se toma una muestra aleatoria de 60
llantas y se obtiene una duración promedio de 45.050 km. Con una desviación estándar de 3.070
km.
Solución
Datos:
𝐻0 ∶ µ = 46.050 y 𝐻1 ∶ µ ≠ 46.050
El estadístico 𝑋̅ sigue una distribución normal N(µ0 , 𝑠⁄√𝑛 ) donde n>30 es el tamaño de la
𝛼 0.05
muestra, como la hipótesis es bilateral: = = 0.025, y 𝑧𝛼/2 = − 1.96, y 𝑧1−𝛼/2 =
2 2
1.96. A partir del gráfico se observa la zona de rechazo y la zona de no rechazo de la hipótesis
nula.
̅ − µ𝟎
𝒙 45.050 − 46.050
𝒁= 𝒔 = = −𝟐. 𝟓𝟐
𝟑. 𝟎𝟕𝟎
√𝒏 √𝟔𝟎
MUESTRAS PEQUEÑAS
Ejemplo 5.17. Se toma una muestra aleatoria de doce (12) sobres de café de una empacadora.
Se encuentra que el peso promedio del contenido de café de cada sobre es 15.97 gr. con una
desviación estándar de 0.15. La compañía empacadora afirma que el peso promedio mínimo del
café es de 16 gr. por sobre. ¿Puede aceptarse ésta afirmación si se asume un nivel de confianza
del 90 por ciento?
Solución.
Datos:
𝑛 = 12, 𝑥̅ = 15.97, 1 − 𝛼 = 0.9 o 𝛼 = 0.1 y s= 0.15
Debido a que la compañía empacadora afirma que el peso promedio de cada sobre de café es
de 16 gr. o más, se trata de plantear una hipótesis unilateral izquierda, así:
Estadísticamente se plantea:
𝐻0 ∶ µ = 16 ( µ ≥ 16) y 𝐻1 ∶ µ < 16
Actividad de autoevaluación
1. Un fabricante de equipos deportivos ha desarrollado un nuevo hilo sintético para pescar
del cual afirma que tiene un coeficiente de ruptura de 8 kilogramos con una desviación
estándar de 0.5 kilogramos. Probar la hipótesis µ = 8𝑘𝑔 en contra de la alternativa µ ≠
8𝑘𝑔 si se prueba una muestra aleatoria de 50 hilos y se encuentra que tiene un
coeficiente medio de ruptura de 7.8 kg. Utilizar un nivel de significancia de 0.01.
2. Una compañía afirma que una aspiradora gasta en promedio 46 kilowatts–hora al año.
Si una muestra aleatoria de 12 hogares indica que una aspiradora gasta un promedio de
42 kilowatts–hora al año con una desviación estándar de 11.9 kilowatts–hora, ¿sugiere
esto, con un nivel de significancia de 0.05, que las aspiradoras gastan, en promedio,
menos de 46 kilowatts–hora anualmente? Suponga que la variable de kilowatts–hora es
normal.
24/24