Documentos de Académico
Documentos de Profesional
Documentos de Cultura
acerca de una población con base en la información que se obtiene a partir de una muestra
seleccionada de esa población
► El proceso de Estimación implica calcular, a partir de los datos de una muestra, alguna
estadística que se ofrece como aproximación correspondiente de la población de la cual fue
extraída la muestra.
PUNTUAL
ESTIMACIÓN
POR INTERVALOS
► Una Estimación Puntual es solo un valor numérico utilizado para estimar el parámetro
correspondiente de la población.
ESTIMADORES PUNTUALES
Una estimación es puntual cuando se usa un solo valor extraído de la muestra para
estimar el parámetro desconocido de la población. Al valor usado se le llama
estimador.
Consisten en un solo valor o estadística muestral que se usa para estimar el verdadero
valor del parámetro poblacional.
2. También se puede hallar el intervalo o rango que es más probable que contenga
el valor del parámetro poblacional: intervalo de confianza. Una estimación de
este tipo indica el error de dos maneras: por la extensión del intervalo y por la
probabilidad de que el verdadero parámetro poblacional se encuentre dentro del
intervalo.
A menudo, una estimación puntual es insuficiente debido a que sólo tienen dos
opciones: es correcta o está equivocada. Una estimación puntual es mucho más útil si
viene acompañada por una estimación del error que podría estar implicando. Ambas
estimaciones, la puntual y el intervalo de confianza, son complementarias.
Consiste en dos valores entre los cuales esperamos que se encuente el verdadero
valor del parámetro
E(X)=µ
σx = n
σx = n
N n / N 1 Factor de Corrección
EJEMPLO:
Solución:
s 57
SX = n
N n / N 1 = 16
100 16 / 100 1 = 13,126 ≈ 13.13
En este ejemplo se estima el error estándar de la media con base en la desviación estándar
muestral, y se requiere utilizar el factor de corrección por población finita. Porque 16 > 5 %
de N (población).
► El Error Estándar de la Media ofrece la base principal para la Inferencia Estadística con
relación a la media de una población que se desconoce. Un teorema de la Estadística que
conduce a la utilidad del error estándar de la media es:
Nº 3
E ( X ) = µ = $ 26000 ( dado )
24500 26000
Z1 = 2 0.4772
750
27500 26000
Z2 = 2 0.4772 Z1 + Z2 = 0.9544 = 95 %
750
Una estimación por intervalos de confianza de dos valores numéricos que definen un intervalo
que, con un grado específico de confianza, se considera que incluye al parámetro por estimar.
Suponga que un grupo de investigadores quiere estimar la media de una población que sigue
una distribución normal. Para ello, extraen una muestra aleatoria de tamaño n de la población y
calculan el valor de X (media muestral), el cual utilizan como estimación puntual de µ. Aunque
este estimador de µ posee todas las cualidades de un buen estimador, se sabe que, debido a los
caprichos del muestreo aleatorio no se puede esperar que X (media muestral) sea igual µ
(media poblacional).
Por lo tanto, sería mucho más significativo estimar µ mediante un intervalo que de alguna forma
muestre su probable magnitud µ.
1.645 0.90
1.96 0.95
2.58 0.99
EMEPLO Nº 1
Suponga que se sabe que la desviación estándar de la vida útil de los lentes de una marca
especifica de microscopios es σ = 500 horas, pero no se conoce el promedio de vida útil en
términos generales, se supone que la vida útil de los lentes tiene una distribución
aproximadamente normal. Para una muestra de n = 15, la vida útil promedio es de X = 8900
horas. Construya intervalos de confianza para estimar la media de la población.
a) con el 95%
Nº 4
En este caso puede utilizarse la distribución normal porque la población tiene una distribución
normal y se conoce σ. .
Solución.
a.- datos
500 500
x = 8900 hrs. n = 15 σ = 500 σx = n
15 3.87
129.20
x z σx = 8900 1.96 * 129.20 = 8900 253.23 Intervalo 8647 a 9153 hrs
b.- 8900 1.645 (129.20) = 8900 212.53 Intervalo 8687 a 9113 hrs.
EJEMPLO Nº 2
Con relación al ejemplo anterior, suponga que no puede asumirse que la vida útil de la
población de los lentes tiene una distribución normal. Sin embargo, la media muestral X = 8900
hrs se basa en una muestra de n = 35. Construya un intervalo de confianza del 95 % para
estimar la media de la población.
En este caso, puede utilizarse la distribución normal de probabilidad utilizando el Teorema del
Límite Central, que señala que cuando n ≥ 30 puede asumirse que la distribución muestral tiene
una distribución normal, aun cuando no tenga distribución normal.
Solución.
500
X Z σx = 8900 1.96 * = 8900 165.5 Intervalo 8735 a 9066 hrs.
35
EJEMPLO Nº 3
Con relación al ejemplo nº 2, suponga que puede asumirse que la población tiene distribución,
pero que se desconoce la desviación estándar de la población, más bien, se sabe que la
desviación estándar muestral es S = 500 y X = 8900. Estime la media de la población
utilizando un intervalo de confianza del 90%.
Solución.
La distribución es normal.
El límite central.
500
X Z Sx 8900 1.645 * 8900 1.645 * 84.46
35
Intervalo 8761 a 9039
z
n= [ E
]²
Z = Al valor que se utiliza para el grado de confianza.
Nº 5
30, se debe incrementar a esta cantidad, por que la formula se basa en el uso de la distribución
normal.
EJEMPLO Nº 4
z 1.645 20
n= [ E
]² = [ 3
]² = [ 10.9 ]² = 118
x ttabla ; gl n 1 s x
EJEMPLO Nº 5
La vida útil promedio de una muestra aleatoria de n = 10 focos es X = 4000 horas, con una
desviación estándar muestral S = 200 horas. Se supone que la vida útil de los focos tiene una
distribución aproximadamente normal. Estimar la vida útil promedio de la población de los
focos de la cual se tomó la muestra, utilizando un intervalo de confianza del 95%
Solución.
200 200
4000 ± 2.262 · = 4000 ± 2.262 · = 4000 ± 143.16
10 3.16
Limite inferior 4000 - 143.16 = 3857 horas Limite superior = 4000 + 143.16 = 4143
horas
Con frecuencia es necesario estimar la diferencia entre dos medias poblacionales, tal como la
diferencia entre los niveles de sueldos en dos empresas.
Formula.
x x z
1 2 tabla
12 22
n1 n2
→ Error estándar de la diferencia entre dos medias, suponiendo que
Nº 6
Donde:
n1 : es el tamaño de la muestra tomada de la población 1
n1 : es el tamaño de la muestra tomada de la población 2
x1 : es la media de la muestra tomada de la población 1
x 2 : es la media de la muestra tomada de la población 2
1 : es la desviación estándar de la población 1
2 : es la desviación estándar de la población 2
N es el tamaño de la población
z tabla : es el valor z de la tabla N(0,1)
x1
x 2 z tabla
s12 s 22
n1 n 2
S1 = es la desviación estándar de la muestra 1
Nota: Se debe utilizar los factores de corrección por población finita cuando sea
apropiado.
EJEMPLO Nº 6
$ 1000 ± 773.92
Se puede afirmarse que el salario diario promedio del primer laboratorio es mayor que el
correspondiente al segundo, en una cantidad que va de $ 226 a $ 1774, con una confianza del
99% en esa estimación por intervalos.
2.- Las muestras son pequeñas ( n < 30 ). Si las muestras son grandes, entonces es posible
aproximar los valores t mediante la distribución normal estándar Z.
Nº 7
3.- Se supone que las poblaciones tienen distribuciones aproximadamente normales (debe
observarse que no se puede aplicarse el Teorema del Límite Central cuando se trata de muestras
pequeñas.
Sin embargo, cuando se utiliza la distribución t para definir los intervalos de confianza para la
diferencia entre dos medias, en vez de hacerlo para una sola, se requiere de una suposición
adicional.
4.- Las varianzas de las dos poblaciones (que se desconocen) son iguales, σ1 = σ2.
2
Donde las varianzas poblacionales, si bien son desconocidas, se considera que son iguales, s c
representa entonces la varianza común y se calcula:
sc2
n1 1 s12 n2 1 s22
n1 n2 2
x1
x 2 tgl tabla
s12 s 22
n1 n2
Donde gl = n1 + n2, = 2
Ejemplo Nº 7
La vida útil promedio de una muestra aleatoria de n1 = 10 focos es X = 4600 hrs, con S 1 = 250
horas. Para otra marca de focos, la vida útil promedio y la desviación para una muestra de n2 =
8 focos son X = 4000 hrs y S2 = 200 hrs. Se asume que la vida útil de los focos de ambas marcas
tienen una distribución normal. Determinar el intervalo de confianza del 90% para estimar la
diferencia entre las vidas útiles promedio de las dos marcas de focos.
Solución
x 1
x2 = 4600 – 4000 = 600
t gl = 10 + 8 = 18 – 2 = 16 1. 746
sc2
n1 1 s12 n2 1 s22 9( 250) 2 7( 200) 2
= 52656.25
n1 n2 2 10 8 2
x
1 x 2 tgl tabla
s12 s 22
n1 n2
= 600 ± 1.746 ( 108.847 ) = 410 a 790 horas
Puede afirmarse con una confianza del 90% que la primera marca de focos tiene una vida útil
promedio mayor que la segunda, en una cantidad de 410 y 790 hrs.
Nº 8
Formulas.
Pˆ ztabla sPˆ
Donde:
:
pˆ 1 pˆ
n
pˆ 1 pˆ N n
s Pˆ ; Si la población es finita o el muestreo es sin reemplazo
n N 1
n: es el tamaño de la muestra
p̂ : es la proporción de la muestra
N es el tamaño de la población
z tabla : es el valor z de la tabla N(0,1)
Ejemplo Nº 8
Una empresa de investigación de mercados entrevista a una muestra aleatoria de 100 hombres
de una comunidad grande y encuentra que una proporción muestral de 0,40 de ellos prefieren
maquinas de afeitar fabricadas por la empresa cliente de los investigadores, y no las demás
marcas. Determinar el intervalo de confianza del 95% para la proporción de todos los hombres
en esa comunidad que prefieren las maquinas de afeitar de la empresa cliente de los
investigadores.
Solución
Pˆ ztabla sPˆ
s Pˆ = (0.40)(0.60) 0.24
0.0024 ~ 0.05
100 100
Por lo tanto, puede estimarse con una confianza del 95% que la proporción de hombres de esa
comunidad que prefieren las maquinas de afeitar de la empresa está entre 0.30 y 0.50.
Para estimar la diferencia entre dos proporciones de dos poblaciones, el estimador puntual
sesgado de (π1 – π2) es (P1 – P2). El intervalo de confianza implica utilizar el error estándar de la
diferencia entre las proporciones. El uso de la distribución normal se basa en las mismas
condiciones que para la distribución muestral de la proporción, excepto que se trata de dos
muestras y se aplican los requerimientos para cada una de ellas. El intervalo de confianza para
estimar la diferencia entre las proporciones de dos poblaciones es:
Nº9
Formula.
Pˆ1 Qˆ 1 Pˆ2 Qˆ 2
pˆ 1 pˆ 2 z tabla
n1 n2
Donde:
n1 : es el tamaño de la muestra tomada de la población 1
n1 : es el tamaño de la muestra tomada de la población 2
ˆ 1 Pˆ
P̂1 : es la proporción en la muestra tomada de la población 1; Q 1 1
ˆ ˆ
P̂2 : es la proporción en la muestra tomada de la población 1; Q2 1 P2
N es el tamaño de la población
z tabla : es el valor z de la tabla N(0,1)
EJEMPLO Nº 9
En el ejemplo anterior se reporto que una proporción de 0.40 hombres de una muestra aleatoria
de 100 tomada de una comunidad grande, manifestó preferir las hojas de afeitar de la empresa
cliente de los investigadores y no de las demás marcas. En otra comunidad grande, 60 hombres
de una muestra aleatoria de 200 prefirieron las máquinas de afeitar de la empresa cliente.
Determinar el intervalo de confianza del 90% para la proporción de hombres de las dos
comunidades que prefirieron las maquinas de afeitar de la empresa cliente.
Solución
Z = 1.645
ˆ 1 Pˆ = 1 – 0.40 = 0.60
Q1 1 Qˆ 2 1 Pˆ2 = 1 – 0.30 = 0.70
Pˆ1 Qˆ 1 Pˆ2 Qˆ 2
=
n1 n2
(0.40)(0.60) (0.30)(0.70)
0.0024 0.00105 0.00345 0.059
100 200
0.10 ± 1.645(0.059)
EJERCICIOS DE INTERVALOS
1. De un lote de 3.500 pilas se probaron 98 al azar. La vida promedio en esa muestra resultó ser de 3,5
horas con una desviación estándar de 0,9 horas. Construya un intervalo de confianza del 99% para la
vida media del lote de pilas (suponer normalidad en la población).
2. Una muestra aleatoria de empleados de un grupo numeroso perteneciente a una empresa, entregó las
siguientes calificaciones en un examen de aptitud: 63; 72; 56; 65; 66; 74; 57; 59; 63. Construya un
intervalo de confianza del 95% para estimar la calificación promedio de todos los trabajadores de la
empresa, suponiendo normalidad en la población.
3. Se desea medir la diferencia en ventas entre dos tipos de empleados en la actividad de seguros, unos
con titulo profesional y otros de personas con estudios medios. Se toma una muestra de 41
empleados entre los primeros y la media de las ventas resulta ser 32($ miles), en tanto que la media
de una muestra de 30 empleados con sólo estudios medios es de 25. Se encontró también que la
varianza en la primera muestra es de 48 y en la segunda de 56. Determine el intervalo de confianza
del 95% para estimar la diferencia en las ventas medias de los dos tipos de vendedores. (suponer
normalidad).
Nº 10
Construya un intervalo del 95% de confianza para estimar la diferencia de medias (suponer
normalidad).
5. Una pequeña empresa compró un lote grande de piezas electrónicas a una firma. En una muestra
aleatoria de 50 piezas se comprobó que 5 eran defectuosas. Estime la proporción de piezas
defectuosas de todo el lote, empleando un intervalo de 95% de confianza.
6. En una muestra aleatoria de 100 posibles clientes se encontró que 30 dicen que prefieren cierto
producto. Estimar el verdadero % de todos los posibles clientes que prefieren el producto, usando un
intervalo de 95% de confianza.
7. En dos ciudades se tomaron muestras de automóviles, cada una de 100 automóviles. En una ciudad
72 automóviles pasaron con éxito la prueba de seguridad, en la otra solamente lo hicieron 66.
Construya un intervalo de 95% de confianza para estimar la diferencia de proporciones de autos
seguros en las dos ciudades.
8. Se desea hacer una encuesta para estimar el porcentaje de personas mayores de edad, de una ciudad,
que están a favor de cierto proyecto de ley. ¿Cuál debe ser el tamaño de la muestra, si se desea un
nivel de confianza del 95% y un error máximo de estimación de 4%?
9. Se desea estimar el gasto medio en movilización de los alumnos de cierta Universidad que tiene
5.000 alumnos. ¿Cuál es el tamaño de muestra necesario, si se desea un nivel de confianza del 95%,
un error máximo de ±$2.000, y se sabe por estudios anteriores que la desviación estándar es de
$15.000?