Clase 4

Estimación Puntual.
Estimación por Intervalos de Confianza.
Estadística Inferencial
Carlos Gaviria?
? Universidad de San Buenaventura, Departamento de Ciencias Básicas
29 de abril de 2021
Carlos Gaviria Estadística Inferencial

Ideas Preliminares.
Idea Informal
Considere seleccionar una muestra de tamaño n, x11 , x21 , · · · , xn1 de una población de interés. Aho-
ra, seleccione otra muestra de tamaño n, x12 , x22 , · · · , xn2 de la misma población. Claramente las
dos muestras son diferentes. Ahora, seleccione m muestras de tamaño n de la misma población:
x11 x21 ··· xn1

x12 x22 ··· xn2
· · ··· ·
· · ··· ·
· · ··· ·
x1m x2m ··· xnm
Claramente todas las muestras son diferentes; esto es, x1i 6= x1j , x2i 6= x2j , · · · , xni 6= xnj para i 6= j.

Ideas Preliminares.
Muestra Aleatoria
Debido a la incertidumbre presente, antes de que los datos estén disponibles, cada observación se
considera como una variable aleatoria y la muestra es representada por X1 , X2 , · · · , Xn . Es decir,
una muestra aleatoria es un conjunto de variables aleatorias.
Definición
Un estadístico es cualquier valor que puede ser calculado a partir de datos muestrales. Un esta-
dístico es una variable aleatoria que es función de una muestra aleatoria.
Definición
Una muestra aleatoria X1 , X2 , · · · , Xn es una muestra aleatoria simple si y sólo si:
1 Las Xi son v.a independientes.
2 Cada Xi tiene la misma distribución de probabilidad.

Teoremas Fundamentales.
Teorema 1.
Si X1 , X2 , · · · , Xn es una muestra aleatoria de una distribución con valor medio µ y desviación
estándar σ, entonces:
1 E(X) = µX = µ.
σ2
2 Var(X) = n
.
σ
3 σX = √
n
.
Teorema 2.
Si X1 , X2 , · · · , Xn es una muestra aleatoria de una distribución normal con valor medio µ y
desviación estándar σ, entonces X distribuye normal con:
1 E(X) = µX = µ.
σ2
2 Var(X) = n
.
σ
3 σX = √
n
.

Teoremas Fundamentales.
Teorema 3. Teorema del límite Central.

Si X1 , X2 , · · · , Xn es una muestra aleatoria de una distribución con valor medio µ y desviación
estándar σ. Si n es grande, entonces X distribuye aproximadamente normal con:
1 E(X) = µX = µ.
σ2
2 Var(X) = n
.
σ
3 σX = √
n
.
Observación
1 Matemáticamente n grande significa n → ∞.
2 A medida que n crece se tiene que X se aproxima más a una distribución normal con media
µ y desviación estándar √σn .
3 Si bien la distribución normal es una distribución ideal en términos prácticos, esta no se
puede dejar de lado, pues es la única que cuenta con el T.L.C.
4 De manera empírica se tiene que el T.L.C funciona bien cuando n > 30. Ahora; si no se da
una buena aproximación con ésta restricción entonces se toma n > 40 y así sucesivamente.

Distribución de la Media Muestral.
Distribución de X
El estudio de la distribución muestral de X se realiza considerando varios casos, dependiendo del
tamaño muestral, la distribución de la v.a X y del conocimiento de la varianza de X:
1 Caso 1. Si n ∈ N, X ∼ N(µ, σ 2 ) con σ 2 conocida.
2 Caso 2. Si n < 30 y X ∼ N(µ, σ 2 ) con σ 2 desconocida.
3 Caso 3. Si n ≥ 30 y X tiene una distribución con media µ y varianza σ 2 conocida o
desconocida.
Observación
Los casos 1 y 3 están fundamentados en los teoremas 2 y 3. El caso 2 se fundamenta en la
distribución t−student.

Distribución de la Media Muestral
Teorema 4
Sea X una v.a. distribuida normalmente con media E(X) = µ y varianza desconocida V(X) =
σ 2 . Si X1 , X2 , · · · , Xn es una m.a de tamaño n (n < 30) de X, entonces el estadístico X satisface:
X−µ
T= ∼ tn−1
√s
n
donde s es la desviación muestral y ν = n − 1 es el único parámetro de la distribución t−student

y se llama grados de libertad.
Propiedades Geométricas de la distribución t−student.

1 Cada curva tν tiene forma de campana y está centrada en 0.
2 Cada curva tν tiene cola más pesada que z.
3 A medida que ν se incrementa, la dispersión de tν se disminuye.
4 tν → z cuando ν → ∞.

Razón de Varianzas.
Idea Informal
Considere dos poblaciones de interés. Tome una m.a de tamaño n1 de la población 1 y una m.a
de tamaño n2 de la población 2 y construya los estadísticos S12 a partir de la primera m.a y S22 a
partir de la segunda m.a. La intención es investigar la distribución que sigue la variable aleatoria
S12 /σ12
S22 /σ22
.
Teorema 5
Sea X1 , X2 , Xn una muestra aleatoria de una distribución normal con parámetros µ y σ 2 , entonces
la variable aleatoria:
(Xi − X)2
P
(n − 1)S2 i
=
σ2 σ2
tiene una distribución Ji cuadrada con n − 1 grados de libertad.

Razón de Varianzas.
Teorema 6
Sean S12 y S22 las varianzas muestrales obtenidas a partir de m.a independientes de tamaño n1 y n2
tomadas de poblaciones normales con varianzas σ12 y σ22 , respectivamente. Entonces la variable
aleatoria:
S12 /σ12
S22 /σ22
Tiene una distribución F de Fisher con n1 − 1 grados de libertad para el numerador y n2 − 1
grados de libertad para el denominador.
Ejemplo 1
Si s21 y s22 representan las varianzas de m.a. independientes de tamaño n1 = 26 y n2 = 31, que se
toman de poblaciones normales con varianzas σ12 = 10 y σ22 = 15, respectivamente. Encuentre

S2
P S12 < 2.2 .
2

Diferencia de Medias.
Idea Informal
Considere dos poblaciones de interés. Tome una m.a X1 , X2 , · · · , Xn de la población 1 y una m.a
Y1 , Y2 , · · · , Yn de la población 2 y construya los estadísticos X a partir de la primera m.a y Y a
partir de la segunda m.a. La intención es investigar la distribución que sigue la variable aleatoria
X − Y.
Teorema
Si se toman dos m.a. independientes, de tamaños n1 y n2 procedentes de poblaciones con medias
µ1 y µ2 , y varianzas σ12 y σ22 respectivamente, entonces:
1 E(X − Y) = µ1 − µ2 .
σ12 σ22
2 Var(X − Y) = n1
+ n2
.

Casos a considerar para la distribución de X − Y.

1 Si n1 ≥ 30 y n2 ≥ 30 y las muestras provienen de una distribución normal o no normal,
entonces se consideran dos casos:
1 σ12 y σ22 son conocidas.
2 σ12 y σ22 son desconocidas.
2 Si n1 < 30 y n2 < 30, las muestras provienen de poblaciones normales y σ12 y σ22 son
conocidas.
desconocidas pero iguales.
desconocidas y diferentes.

Caso 1
Si n1 ≥ 30 y n2 ≥ 30 y las muestras provienen de una distribución normal o no normal y σ12 y
σ22 son conocidas o desconocidas, entonces:
(X − Y) − (µ1 − µ2 )
Z= r ∼ N(0, 1).
σ12 σ22
n1
+ n2
Si σ12 y σ22 son desconocidas entonces se utiliza el mismo estadístico pero reemplazando las
varianzas poblacionales por las varianzas muestrales S12 y S22 , respectivamente.
Caso 2
Si n1 < 30 y n2 < 30 y las muestras provienen de una distribución normal con σ12 y σ22
conocidas, entonces:
(X − Y) − (µ1 − µ2 )
Z= r ∼ N(0, 1).
σ12 σ22
n1
+ n2

Caso 3
Si n1 < 30 y n2 < 30, las muestras provienen de poblaciones normales y σ12 y σ22 son descono-
cidas pero iguales, entonces se usa el estadístico:
(X − Y) − (µ1 − µ2 )
T= r ∼ t(n1 +n2 −1) .
1 1 2
n
+ n
Sp
1 2
(n −1)S2 +(n −1)S2

Donde Sp2 = 1 n +n 1 2 2
es una estimador ponderado de la varianza poblacional σ 2 ,
1 2 −1
obtenida ponderando las varianzas muestrales por sus respectivos grados de libertad. Usualmente
Sp2 se denomina varianza conjunta.

Caso 4
Si n1 < 30 y n2 < 30, las muestras provienen de poblaciones normales y σ12 y σ22 son descono-
cidas pero diferentes, entonces se usa el estadístico:
(X − Y) − (µ1 − µ2 )
T= r ∼ tν .
S12 S22
n1
+ n2
Donde el número de grados de libertad ν está dado por:

2
S12 S22
n1
+ n2
ν= !2 !2
S2 S2
1 2
n1 n2
n1 −1
+ n2 −1

Ejemplo 2
Una compañía petrolífera está considerando la posibilidad de introducir un nuevo aditivo en
su gasolina, esperando incrementar el kilometraje medio por litro de gasolina. Se sabe que el
kilometraje medio recorrido con un litro de gasolina sin aditivo es 14.2 km/l y con aditivo es 15.4
km/l. Para tomar la decisión realizan un experimento: los ingenieros del grupo de investigación
prueban 10 automóviles con la gasolina habitual y otros 11 automóviles con la gasolina con el
nuevo aditivo. En cada automóvil se miden los kilómetros recorridos con un litro de combustible,
y se encuentra que la varianza muestral para los automóviles con gasolina sin aditivo es 3.24, y
para los que usaron aditivo es 5.76. Al comparar el kilometraje medio recorrido por litro obtenido
de los automóviles que usaron aditivo y los que no lo usaron ¿Cuál es la probabilidad de que el
hecho de no usar aditivo haga que se disminuya en por lo menos 3.57 el kilometraje medio
muestral recorrido ?

Ejemplo 3
Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos
compañías. Los tubos de la compañía A tienen una vida media de 7.2 años , mientras que los de
la B tienen una vida media de 6.7 años. Determine la probabilidad de que una muestra aleatoria de
34 tubos de la compañía A tenga una vida promedio de al menos un año más que la de una muestra
aleatoria de 40 tubos de la compañía B, si se encuentra que la desviación estándar muestral de
los tubos de la compañía A es 0.8, y la desviación estándar de los tubos de la compañía B es 0.7.

Proporción.
Proporción Poblacional
Se define por p = NX donde X es el número de individuos u objetos de la población que satisfacen
cierta característica y N es el tamaño de la población.
Proporción Muestral
Se define por bp = nx donde x es el número de individuos u objetos de la muestra que satisfacen
cierta característica y n es el tamaño de la muestra.
Teorema
Cuando se desea estimar una proporción y n ≥ 30, se utiliza el T.L.C y se tiene que:
p̂ − p
Z= q ∼ N(0, 1).
p(1−p)
n

Proporción.
Teorema
De dos poblaciones se toman dos m.a independientes de tamaños n1 ≤ 30 y n2 ≤ 30, y en cada
una de ellas se observa una característica o cualidad. Las proporciones muestrales de elementos
con la característica son p̂1 = nx y p̂2 = ny , de tal manera que:
1 2
1 E(p̂1 − p̂2 ) = p1 − p2 .
p1 (1−p1 ) p2 (1−p2 )
2 Var(p̂1 − p̂2 ) = n1
+ n2
Teorema
Cuando los tamaños de muestra n1 y n2 son grandes se tiene que:
(p̂1 − p̂2 ) − (p1 − p2 )

Z= q ∼ N(0, 1)
p1 (1−p1 ) p (1−p )
n
+ 2 n 2
1 2

Proporción.
Ejemplo 4
Se supone que el 12 % de la población de un país tiene una segunda residencia. Con el fin de
obtener una información más precisa se toma una m.a. de 250 familias. ¿Cuál es la probabilidad
de que la proporción de familias de la muestra con segunda residencia esté comprendida entre un
10 % y un 15 %?
Ejemplo 5
Se sospecha que el 15 % de los lápices que se venden a una escuela tienen defecto, por lo que
el director esta muy preocupado y le ha solicitado al proveedor que mejore su calidad. Para ello,
la empresa productora implementó un programa de control de calidad al final del cual, se tomó
una m.a. de 125 lápices para verificar la calidad del producto y se encontró que 18 de ellos
presentaban defectos, ¿cuál es la probabilidad de que Se tengan entre 10 % y 14 % de lápices
defectuosos.

Pruebas de normalidad
Para estudiar si una muestra proviene de una población con distribución normal se disponen de
tres herramientas que se listan a continuación:
1 Estadística descriptiva.
2 Gráficos cuantil cuantil (QQplot).
1 qqnorm() junto con qqline().
2 qqPlot().
3 Pruebas de hipótesis.
1 shapiro.test. Shapiro–Wilk.
2 ad.test. Anderson–Darling.
3 cvm.test. Cramer–von Misses.
4 lillie.test. Lilliefors (Kolmogorov–Smirnofv).
5 pearson.test. Pearson chi–square.
6 sf.test. Shapiro–Francia1 .
1
Para 2 a 6 se necesita la libreria nortest.
Ideas Preliminares.
Recuerde que:
1 Cuando se desea estimar el valor de un parámetro θ a partir de la información de una m.a
X1 , X2 , · · · Xn utilizamos un estimador θ.
b
2 El estimador θb de el parámetro θ es una v.a, por lo tanto tiene una distribución de probabi-
lidad, esperanza, varianza y desviación estándar.
3 Dicho estimador aplicado a una muestra nos proporcionará un valor numérico, que se de-
nomina estimación de θ.
4 La precisión de ese estimador está relacionada con la probabilidad de que θb nos proporcione
un valor próximo a θ.
En esta unidad se estudiará un método de estimación en el que no sólo se proporcionará el valor

estimado obtenido con la muestra, sino una medida de la incertidumbre de dicho valor como
estimación del parámetro θ.

Ideas Preliminares.
Definición
Se dice que un estimador puntual θb es un estimador insesgado de θ si E(θ)
b = θ para todo valor
b − θ se conoce como el sesgo de θ.
posible de θ. Si θb no es insesgado, entonces E(θ) b
Elección de Estimadores
1 De todos los estimadores de un parámetro θ se elige uno insesgado.
2 Si hay más de un estimador insesgado para θb entonces se elige el de mínima varianza. Esta
propiedad se conoce como eficiencia.
3 b → θ y Var(θ)
Un estimador θb se dice consistente siempre que E(θ) b → 0 cuando n → ∞.
4 El estimador θ es un estimador robusto del parámetro θ si la violación de los supuestos de
b
partida en los que se basa la estimación no altera de manera significativa los resultados que
éste proporciona.
5 Se dice que un estimador es suficiente cuando resume toda la información relevante
contenida en la muestra, de forma que ningún otro estimador pueda proporcionar
información adicional sobre el parámetro desconocido de la población.
6 Se dice que un estimador es invariante cuando el estimador de la función del parámetro
coincide con la función del estimador del parámetro, [f (θ)]∗ = f (θ∗ ).

Definición.
Definición
Sea θ un parámetro de interés y θb un estimador puntual para θ. Una estimación de θ por intervalo,
es un intervalo real de la forma:
(l, u),
donde l y u dependen del valor que toma el estimador θb en una muestra dada y de la distribución
muestral de θ.
b
Observaciones
1 Cada m.a. proporcionará un valor diferente para θb y por lo tanto valores diferentes para l y
para u.
2 El intervalo (l; u) es llamado Intervalo Aleatorio.
3 En general, usando θb y su distribución se pueden determinar l y u, tales que para un valor
0 < α < 1 dado se satisfaga P(l < θ < u) = 1 − α.
4 Para una m.a. particular se obtiene el intervalo (l; u), el cual se espera contenga el verdadero
valor de θ.

Observaciones.
Observaciones
5 l y u son llamados límites de confianza y el valor 1 − α se le llama coeficiente o nivel de
confianza.
6 Cuando se construye un I.C. al (1 − α)100 % para θ, éste se interpreta de la siguiente
manera: Si tuviésemos un número infinito de m.a. de la población, y construyésemos con
cada una un intervalo (l; u), entonces el (1 − α)100 % de dichos intervalos contendría al
verdadero valor del parámetro θ.
7 El intervalo de la forma (l; u) se conoce como intervalo bilateral. Los intervalos (l; +∞) ó
(−∞; u) son llamados intervalos unilaterales.
8 En un I.C. bilateral la longitud u − l es una medida de la calidad de la información obtenida.
El valor θ − l u − θ se conoce como precisión del estimador.
9 Lo ideal es tener I.C. angostos (esto es, con mayor precisión) con una alta confianza.

Observaciones.
Observaciones
10 No es correcto decir la probabilidad de que θ pertenezca al intervalo (l; u) es 1 − α porque
θ no es una v.a. El intervalo es aleatorio ya que sus extremos son funciones de la muestra y
por lo tanto, debemos decir la probabilidad de que el intervalo (l; u) contenga al parámetro
θ es 1 − α.
11 Una vez construido el intervalo a partir de una muestra dada, ya no tiene sentido hablar
de probabilidad. En todo caso, tenemos confianza de que el intervalo contenga a θ. La
confianza está puesta en el método de construcción de los intervalos, que nos asegura que
(1 − α)100 % de las muestras producirán intervalos que contienen a θ.

Valores críticos para Z
0.4
Densidad
0.2
α α
0.0
−4 −2 0 2 4
Figura 1: Valores críticos para la v.a. Z
zα : Valor sobre el eje z tal que P(Z ≥ zα ) = α.

−zα : Valor sobre el eje z tal que P(Z ≤ zα ) = α.

0.4
Densidad
0.2
α α
0.0
−4 −2 0 2 4
Figura 2: Valores críticos para la v.a. T
tα,ν : Valor sobre el eje t tal que P(T ≥ tα,ν ) = α.

−tα,ν : Valor sobre el eje t tal que P(T ≤ tα,ν ) = α.

Intervalo de Confianza para µ.
Caso 1. X ∼ N(µ, σ 2 ) con σ 2 conocida.

σ σ
x − zα √ ,x + zα √
2 n 2 n
Caso 2. n ≥ 30 con σ 2 conocida ó desconocida.

σ σ s s
x − zα √ ,x + zα √ o x − zα √ ,x + zα √
2 n 2 n 2 n 2 n
Caso 3. n < 30 y X ∼ N(µ, σ 2 ) con σ 2 desconocida.

s s
x − t( α ,n−1) √ , x + t( α ,n−1) √
2 n 2 n

Ejemplo 6
La duración de cierto tipo de foco es una v.a. aproximadamente normal con media µ horas y
varianza 625 horas2 . El fabricante afirma que la duración promedio real de sus focos es superior
a las 1010 horas. Para verificar esto se toma una m.a. de 20 focos y se miden sus duraciones.
La duración promedio obtenida en la muestra es de 1014 horas. ¿Es cierta la afirmación del
fabricante? Calcule un I.C. al 98 % para µ.
Ejemplo 7
Un artículo publicado en cierta revista presenta las mediciones de tiempos de combustión residual
(en seg) de especímenes tratados en ropa de dormir para niños. Se seleccionaron 50 especímenes
y se obtuvo un tiempo promedio de 9.8525 seg y una desviación típica de 0.0965 seg. Calcule e
interprete un IC aproximado al 98 % para el tiempo medio real de combustión.

Ejemplo 8.
Las mediciones humanas constituyen una rica área de aplicación de métodos estadísticos. El
artículo A Longitudinal Study of the Development of Elementary School Children’s Private
Speech(Merril-Palmer Q., 1990:443-463 ) reportó sobre un estudio de niños que hablan solos.
Se pensaba que la conversación a solas estaba relacionado con el IQ, dado que este mide la ma-
durez mental y se sabia que la conversación a solas disminuye conforme los estudiantes avanzan
a través de los años de la escuela primaria. El estudió incluyó 33 estudiantes de primer año de
escuela cuyos resultados de IQ se dan a continuación.
82 96 99 102 103 103 106 107 108 108 108

108 109 110 110 111 113 113 113 113 115 115
118 118 119 121 122 122 127 132 136 140 146
Calcule intervalos de confianza para µ

Ejemplo 9
Los siguientes datos corresponden al índice de desarrollo psicomotor para niños LBW.
96 120 112 100 125 96 86 124 89 104 116 89 127 89

89 124 102 104 120 102 112 92 92 102 120 124 83 116
108 96 108 96 92 108 108 95 120 86 92 100 104 100
120 120 89 92 102 98 92 98 100 108 89 117 112 126
Calcule intervalos de confianza para µ.

Ejemplo 10
Los siguientes datos corresponden a resultados de la medición de las aptitudes de estudiantes de
los cursos de capacitación en una universidad:
95 101 92 67 118 105 76 104 84 122

86 87 97 87 94 94 79 94 89 90
103 101 81 94 91 77 107 94 100 102
93 94 105 68 82 117 94 119 117 89
106 111 107 92 91 89 83 73 97 99
91 120 103 90 89 112 93 100 117 78
99 111 91 83 84 81 88 84 81 110
Calcule intervalos de confianza para µ.

Distribución de la Media Muestral.
Ejemplo 11
Las pruebas que se utilizan actualmente para los condones son sustitutos de los desafíos que se
enfrentan en uso, incluyendo una prueba de hoyos, una de inflación, una de sello del paquete y
las de dimensiones y calidad del lubricante. Los investigadores agregaron una nueva prueba que
agrega tensión cíclica a un nivel muy por debajo de la rotura y determina el número de ciclos
hasta llegar a la rotura. El número de ciclos hasta la rotura se puede modelar como una v.a normal
con media 1584. la rotura media muestral se obtendrá a partir de una muestra de 16 condones.
1569 1571 1573 1580 1584 1580 1583 1585

1590 1589 1588 1586 1584 1590 1580 1572
Calcule intervalos de confianza para µ

Valores críticos para χ2
0.20
Densidad
0.10
0.00
α α
0 5 10 15
Ji cuadrado
Figura 3: Valores críticos para la v.a. χ2
χ2α : Valor sobre el eje de medición tal que P(χ2 ≥ χ2α ) = α.

χ21−α : Valor sobre el eje de medición tal que P(χ2 ≤ χ21−α ) = α.

Intervalo de Confianza para σ 2 y σ
Intervalo de Confianza para σ 2 y σ

Suponga que se tiene una m.a.una población normal con medias µ y varianza σ 2 . Si s2 es las
varianza muestral procedente de una muestra de tamaño n, entonces un I.C. al nivel (1−α)100 %
para la varianza σ 2 :  
2 2
 (n − 1)s , (n − 1)s  .
2 2
χ α ,n−1 χ1− α ,n−1
2 2
Un intervalo de confianza para σ tiene límites superior e inferior que son las raíces cuadradas de
los límites correspondientes en el intervalo para σ 2 .

0.8
Densidad
0.4
α α
0.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0
Figura 4: Valores críticos para la v.a. F
fα,ν1 ,ν2 : Valor sobre el eje de medición tal que P(F ≥ fα,ν1 ,ν2 ) = α.
f1−α,ν : Valor sobre el eje de medición tal que P(F ≤ f1−α,ν1 ,ν2 ) = α.

σ12
Intervalo de Confianza para σ22
.
σ12
Suponga que se tienen m.a. indendientes, provenientes de dos distribuciones normales con me-
dias y varianzas desconocidas. Si S12 y S22 son las varianzas muestrales, procedentes de las mues-
tras de tamaños n1 y n2 , respectivamente, entonces un I.C. al nivel (1 − α)100 % para la razón
σ12
de las varianzas es σ22
:
!
S12 1 S12
, F
2 (α/2,n2 −1,n1 −1)
S22 F(α/2,n1 −1,n2 −1) S2

σ12
.
Ejemplo 12
Una compañía de taxis está tratando de decidir si comprar la Marca A o la Marca B de neumáticos
para una flota de automóviles. Para estimar la diferencia entre las dos marcas, se llevó a cabo un
experimento con 10 neumáticos de la marca A y 9 de la marca B. Los neumáticos se utilizaron
hasta que se gastaron y se midió la distancia recorrida. Los resultados (expresados en km) son:
Marca A Marca B
X 1 = 36300 X 2 = 38100
S1 = 5000 S2 = 6100
σ12
Halle un I.C. del 95 % para σ22
.

σ12
.
Ejemplo 13
El toxafen es un insecticida que ha sido identificado como contaminante en el ecosistema de los
Grandes Lagos. Para investigar los efectos de la exposición al toxafen en animales, a grupos de
ratas se le suministró toxafen en su dieta. El artículo Reproduction study of Toxaphene in the rat
reporta aumentos de peso (en gramos) de ratas a las que se le suministró una dosis baja (4 ppm)
y de ratas de control cuya diete no incluía el insecticida. La desviación estándar de la muestra de
23 ratas hembra de control fue de 32 gm y de 20 ratas hembra sometidas a dosis bajas fue de 54
σ12
gm. Suponiendo normalidad en las poblaciones de ratas, halle un I.C del 98 % para σ22
.

Intervalo de Confianza para µ1 − µ2 .
Caso 1. n1 ≥ 30, n2 ≥ 30, varianzas conocidas o desconocidas.

 s s 
σ12 σ22 σ12 σ22
(X 1 − X 2 ) − zα/2 + , (X 1 − X 2 ) + zα/2 + 
n1 n2 n1 n2
 s s 
S12 S22 S12 S22
(X 1 − X 2 ) − zα/2 + , (X 1 − X 2 ) + zα/2 + 
n1 n2 n1 n2
Caso 2. n1 < 30, n2 < 30, varianzas conocidas

 s s 
σ12 σ22 σ12 σ22
(X 1 − X 2 ) − zα/2 + , (X 1 − X 2 ) + zα/2 + 
n1 n2 n1 n2

Caso 3. n1 < 30, n2 < 30, varianzas desconocidas e iguales.

s
(n1 − 1)S12 + (n2 − 1)S22

1 1
(X 1 − X 2 ) ± tα/2,n1 +n2 −2 Sp2 + , Sp2 =
n1 n2 n1 + n2 − 1
Caso 4. n1 < 30, n2 < 30, varianzas desconocidas y diferentes.

2
S12 S22
+
s
2
S1 2
S2 n1 n2
(X 1 − X 2 ) ± tα/2,ν + , ν= !2 !2
n1 n2 S2
1
S2
2
n1 n2
n1 −1
+ n2 −1

Ejemplo 14
La confederación colombiana de consumidores esta interesada en estudiar la duración de las pilas
E y D, por lo que prueba el número de horas que duran las pilas, tomando una muestra de 21
pilas de cada una con los siguientes resultados:
Pilas E Pilas D
X 1 = 111,16 X 2 = 115,8
S1 = 10 S2 = 15
Halle un I.C del 95 % para la diferencia poblacional de medias.
Ejemplo 15
Un estudio de dos tipos de equipo de fotocopiado muestra que 60 fallas del primer tipo de equipo
tardaron un promedio de 80,7 minutos en ser reparadas, con una desviación estándar de 19,4 mi-
nutos; mientras que, 50 fallas del segundo tipo de equipo tardaron en promedio 88,1 minutos en
repararse con una desviación estándar de 18,8 minutos. Halle un I.C del 98 % para la diferencia
poblacional de medias.

Ejemplo 16
En dos ciudades se llevó a cabo una encuesta sobre el costo de vida para obtener el gasto prome-
dio en alimentación en familias constituidas por cuatro personas. De cada ciudad se seleccionó
aleatoriamente una muestra de 16 familias y se observaron sus gastos semanales en alimentación.
Las medias y las desviaciones estándares muestrales fueron las siguientes:
Muestra 1. Muestra 2.
X 1 = 135 X 2 = 122
S1 = 18 S2 = 10
Si se supone que se muestrearon dos poblaciones independientes con distribución normal cada
una, obtenga un I.C. del 95 % para µ1 −µ2 . ¿Estaría inclinado a concluir que existe una diferencia
real entre µ1 y µ2 ?

Ejemplo 17
Se tomaron dos grupos independientes de estudiantes universitarios que son conocidos por so-
bresalir en matemáticas y para quienes un buen desempeño en matemáticas se consideraba im-
portante. Se asignaron 11 estudiantes a un grupo de control al que simplemente se les pidió que
completaran un examen de matemáticas difícil. Se asignaron 12 estudiantes a una condición de
amenaza, en la que se les dijo que los estudiantes asiáticos generalmente obtuvieron mejores
resultados que otros estudiantes en las pruebas de matemáticas y que el propósito del examen
era ayudar al experimentador a comprender por qué este existe dicha diferencia. Se supone que
simplemente decirles a los estudiantes blancos que los asiáticos mejorar en las pruebas de ma-
temáticas despertaría sentimientos de amenaza estereotipada y disminuiría el rendimiento en los
exámenes. Los datos se dan a continuación:
Grupo de control Grupo en amenaza
4 9 12 8 7 8 7 2
9 13 12 13 6 9 7 10
13 7 6 5 0 10 8
1 Calcule un intervalo de 90 % para la razón de varianzas.

2 Calcule un intervalo de confianza de 90 % para la diferencia de medias.

Ejemplo 18
Los siguientes datos corresponden al nivel de exitación sexual en varones heterosexuales ho-
mofóbicos y varones heterosexuales no homofóbicos al presentarse videos de contenido sexual
explícito (contenido homesual y heterosexual).
Homophobic Nonhomophobic
39.1 38.0 14.9 20.7 19.5 32.2 24.0 17.0 35.8 18.0 -1.7 11.1
11.0 20.7 26.4 35.7 26.4 28.8 10.1 16.1 -0.7 14.1 25.9 23.0
33.4 13.7 46.1 13.7 23.0 20.7 20.06 14.1 -1.7 19.0 20.0 30.9
19.5 11.4 24.1 17.2 38.0 10.3 30.9 22.0 6.2 27.9 14.1 33.8
35.7 41.5 18.4 36.8 54.1 11.4 26.9 5.2 13.1 19.0 -15.5
8.7 23.0 14.3 5.3 6.3


Ejemplo 19
Considere un programa de intervención para mujeres abusadas por familiares. El estudio consi-
dera dos grupos: control y tratamiento. Además, el estudio mostró que durante el transcurso del
programa las mujeres subían de peso. Los siguientes datos corresponden a la ganancia de peso
de cada mujer en ambos grupos:
Grupo control Grupo tratamiento
-0.5 3.3 -9.3 11.3 -5.4 0.0 1.7 -9.1 0.7 2.1 -0.1 -1.4
12.3 -1.0 -2.0 -10.6 -10.2 -4.6 -0.7 1.4 -3.5 -0.3 14.9 -3.7
-12.2 -6.7 11.6 2.8 -7.1 0.3 3.5 -0.8 17.1 2.4 -7.6 12.6
6.2 1.8 -0.2 3.7 -9.2 15.9 1.6 1.9 11.7 3.9 6.1 0.1
8.3 -10.2 1.1 15.4 -4.0 -0.7 20.9


Intervalo de Confianza para p
Recuerde que:
X
p=
El estimador de p es la v.a b n
, donde X ∼ bin(n, p)
Caso 1. n < 30
r
z2α/2 p(1−b
p) z2α/2
p+ ± zα/2 +
b
2n n 4n2
b
z2α/2

1+ n
Caso 2. n ≥ 30
 s s 
p(1 − b
p) p(1 − b
p) 
p − zα/2
b b
b ,b
p + zα/2
n n

Intervalo de Confianza para p.
Ejemplo 18
Se recibe un lote grande de artículos proveniente de un proveedor que asegura que el porcentaje
de defectuosos en su proceso de producción es del 1 % o menos. Al seleccionar una m.a. de
200 artículos e inspeccionarlos se encontraron 8 defectuosos. Obtenga un I.C. al 98 % para la
verdadera proporción de artículos defectuosos del proceso de manufactura del fabricante. ¿Qué
puede concluir con respecto a la afirmación del proveedor?

Intervalo de Confianza para p1 − p2 .
Intervalo de Confianza para p1 − p2

Sean p1 y p2 dos proporciones de interés para dos poblaciones independientes. Se puede mostrar
que si n1 , n2 ≤ 30 , entonces un I.C. aproximado al nivel (1 − α)100 % para p1 − p2 es:
s
p1 (1 − b
p1 ) p2 (1 − b
p2 )
p1 − b
p2 ) ± zα/2
b b
(b +
n1 n2

Intervalo de Confianza para p1 − p2 .
Ejemplo 19
Entre 500 solicitudes de matrimonio, elegidas al azar en 1971, hubo 48 en las cuales las mujeres
eran cuando menos un año mayores que los hombres y entre 400 solicitudes de matrimonio, ele-
gidas al azar en 1977, hubo 68 en las cuales las mujeres eran cuando menos un año mayores que
los hombres. Construya un intervalo de confianza al 98 % para la diferencia entre las proporcio-
nes verdaderas correspondientes de solicitudes de matrimonio en las cuales las mujeres fueron
cuando menos un año mayores que los hombres.

Intervalos de confianza en R
1 t.test. La función t.test se usa para calcular intervalos de confianza para la media y
diferencia de medias, con muestras independientes y dependientes (o pareadas). La función
y sus argumentos son los siguientes:
t.test(x, y = NULL,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, var.equal = FALSE,
conf.level = 0.95, ...)
1 Intervalo de confianza para µ.
t.test(x, conf.level=0.90)$conf.int
2 Intervalo de confianza para µ1 − µ2 .
t.test(x, y,
paired=FALSE, var.equal=FALSE,
conf.level = 0.95)$conf.int
σ12
2 Intervalo de confianza para . Se usa la función var.test().
σ22
3 Intervalo de confianza para la proporción y diferencia de proporciones. Se usa prop.test.

Clase 4

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clase 4

Cargado por

Copyright:

Formatos disponibles

Estimación Puntual.

Estimación por Intervalos de Confianza.

? Universidad de San Buenaventura, Departamento de Ciencias Básicas

Carlos Gaviria Estadística Inferencial

x11 x21 ··· xn1

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Teorema 3. Teorema del límite Central.

Carlos Gaviria Estadística Inferencial

Distribución de la Media Muestral.

Carlos Gaviria Estadística Inferencial

Distribución de la Media Muestral

donde s es la desviación muestral y ν = n − 1 es el único parámetro de la distribución t−student

Propiedades Geométricas de la distribución t−student.

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Casos a considerar para la distribución de X − Y.

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

(n −1)S2 +(n −1)S2

Carlos Gaviria Estadística Inferencial

Donde el número de grados de libertad ν está dado por:

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

(p̂1 − p̂2 ) − (p1 − p2 )

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

En esta unidad se estudiará un método de estimación en el que no sólo se proporcionará el valor

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Carlos Gaviria Estadística Inferencial

Valores críticos para Z

Figura 1: Valores críticos para la v.a. Z

zα : Valor sobre el eje z tal que P(Z ≥ zα ) = α.

Carlos Gaviria Estadística Inferencial

Valores críticos para Z

Figura 2: Valores críticos para la v.a. T

tα,ν : Valor sobre el eje t tal que P(T ≥ tα,ν ) = α.

Carlos Gaviria Estadística Inferencial

Intervalo de Confianza para µ.

Caso 1. X ∼ N(µ, σ 2 ) con σ 2 conocida.

Caso 2. n ≥ 30 con σ 2 conocida ó desconocida.

Caso 3. n < 30 y X ∼ N(µ, σ 2 ) con σ 2 desconocida.

Carlos Gaviria Estadística Inferencial

Intervalo de Confianza para µ.

Carlos Gaviria Estadística Inferencial

Intervalo de Confianza para µ.

82 96 99 102 103 103 106 107 108 108 108

Carlos Gaviria Estadística Inferencial

Intervalo de Confianza para µ.

96 120 112 100 125 96 86 124 89 104 116 89 127 89

Calcule intervalos de confianza para µ.

Carlos Gaviria Estadística Inferencial

Intervalo de Confianza para µ.

95 101 92 67 118 105 76 104 84 122

Carlos Gaviria Estadística Inferencial