Está en la página 1de 13

APUNTES: ESTIMACIN PUNTUAL Y POR INTERVALOS

ASIGNATURA: ESTADSTICA

MATERIA: INFERENCIA ESTADSTICA

PROFESOR: Carlos Flores Carvajal.


INTRODUCCIN A LA INFERENCIA ESTADSTICA.

La Inferencia Estadstica es el procedimiento por medio del cual se llega a conclusiones
acerca de una poblacin con base en la informacin que se obtiene a partir de una muestra
seleccionada de esa poblacin

El proceso de Estimacin implica calcular, a partir de los datos de una muestra, alguna
estadstica que se ofrece como aproximacin correspondiente de la poblacin de la cual fue
extrada la muestra..
El razonamiento en el que se basa la estimacin en el campo de la administracin se apoya en
la suposicin de que los investigadores tengan inters en parmetros, como la Media y la
Proporcin, de varias poblaciones. Si ste es el caso, existe una buena razn por la que se debe
confiar en los procedimientos de la estimacin para obtener informacin respecto a dichos
parmetros: Muchas poblaciones de inters, aunque finitas, son tan grandes que el costo de un
estudio del 100% sera prohibitivo.

Suponga que el administrador de un gran hospital le interesa saber la edad promedio de los
pacientes internados en el transcurso de un ao. Es posible que considere demasiado laborioso
consultar el registro de cada paciente internado en el transcurso de ese ao y, en consecuencia,
decide examinar una muestra de los registros a partir de la cual sea posible calcular una
estimacin de la edad promedio de los pacientes internados en ese ao.
Este caso ejemplifica el inters por estimar la media y la proporcin de la poblacin. Otros
parmetros cuya estimacin, son la diferencia entre dos medias, entre dos proporciones, la
varianza de la poblacin.
Se encontrara para cada uno de los parmetros estudiados, es posible calcular dos tipos de
estimacin.

PUNTUAL


ESTIMACIN

POR INTERVALOS

Una Estimacin Puntual es solo un valor numrico utilizado para estimar el parmetro
correspondiente de la poblacin.

ESTIMADORES PUNTUALES

Parmetro de la Poblacin Estimados
Media
1 - 2
Proporcin,

1 - 2

Varianza
Desviacin Estndar
X
X1 - X2


P1 - P2

S

S


N 2


Se define el Valor Esperado de la Media y el Error Estndar de la media de la siguiente
manera.

E ( X ) =

x =
n
o
x = 1 / = N n N
n
o
Factor de Correccin

Nota: Cuando el tamao de la muestra es menor que el 5% del tamao de la poblacin. El
Factor de correccin se puede omitir. x = Poblacin S x = Muestra

EJEMPLO:

Un administrador de un hospital pblico, toma una muestra aleatoria de tamao n = 16 de
fichas de pacientes de un conjunto de N = 100 fichas. No se conoce la desviacin estndar de
los registros para el total de las 100 fichas . Sin embargo, la desviacin estndar de la muestra es
S = 57. Determinar el error estndar para la distribucin muestral de la media.

Solucin:

SX = 1 / N n N
n
s
= 1 100 / 16 100
16
57
= 13,126 13.13

En este ejemplo se estima el error estndar de la media con base en la desviacin estndar
muestral, y se requiere utilizar el factor de correccin por poblacin finita. Porque 16 > 5 %
de N (poblacin).

El Error Estndar de la Media ofrece la base principal para la Inferencia Estadstica con
relacin a la media de una poblacin que se desconoce. Un teorema de la Estadstica que
conduce a la utilidad del error estndar de la media es:

TEOREMA DEL LMITE CENTRAL.

Al aumentar el tamao de la muestra, la distribucin muestral de la media se aproxima a la
forma de la distribucin normal sin importar la forma de la distribucin de las mediciones
individuales de la poblacin. Para propsitos prcticos, puede suponerse que la distribucin que
la distribucin muestral de la media es aproximadamente normal cuando el tamao de la
muestra es n 30.

Por ello, si se tiene una muestra grande de n 30 puede utilizarse siempre la
DISTRIBUCIN NORMAL DE PROBABILIDAD junto con el error estndar de la media.
Adems, si la poblacin tiene distribucin normal y se conoce la desviacin estndar de la
poblacin, puede utilizarse la distribucin normal para hacer inferencias estadsticas a partir de
muestras pequeas.

EJEMPLO.

Un administrador de un banco toma una muestra de tamao n = 36 de una poblacin de 1000
cuentas por cobrar. El valor promedio de las cuentas por cobrar de la poblacin es = $ 26000
con una desviacin estndar poblacional de = $ 4500. Cul es la probabilidad de que la media
muestral sea inferior a $ 25000?

Se describe la distribucin muestral mediante la media y el error estndar.






N 3

E ( X ) = = $ 26000 ( dado )

x = 750
6
4500
36
4500
= = =
n
o
Z =
o
x
= 33 . 1
750
26000 25000
=



Valor de Z en la tabla = 0.0918 P ( X < 25000 = 26000; = 750 )

Con relacin al ejercicio anterior. Cul es la probabilidad de que la media muestral se
encuentre a no ms de $ 1500 de la media de la poblacin?

Z1 = 4772 . 0 2
750
26000 24500
=



Z2 = 4772 . 0 2
750
26000 27500
+ =

Z1 + Z2 = 0.9544 = 95 %

INTERVALOS DE CONFIANZA PARA ESTIMAR LA MEDIA UTILIZANDO LA
DISTRIBUCIN NORMAL.

Una estimacin por intervalos de confianza de dos valores numricos que definen un intervalo
que, con un grado especfico de confianza, se considera que incluye al parmetro por estimar.

Suponga que un grupo de investigadores quiere estimar la media de una poblacin que sigue
una distribucin normal. Para ello, extraen una muestra aleatoria de tamao n de la poblacin y
calculan el valor de X (media muestral), el cual utilizan como estimacin puntual de . Aunque
este estimador de posee todas las cualidades de un buen estimador, se sabe que, debido a los
caprichos del muestreo aleatorio no se puede esperar que X (media muestral) sea igual
(media poblacional).

Por lo tanto, sera mucho ms significativo estimar mediante un intervalo que de alguna forma
muestre su probable magnitud .

Cuando puede utilizarse la distribucin normal de probabilidad, el intervalo de confianza para la
media se determina mediante:

X
+
Z x ( Poblacin ) X
+
Z S x
Los intervalos de confianza que se utilizan con mayor frecuencia son los de 90, 95, y 99%.

PROPORCIONES SELECCIONADAS DE REAS
BAJO LA CURVA NORMAL.

Z (n de unidades de
desde la media
Proporcin reas en el
Intervalo

1.645 0.90
1.96 0.95
2.58 0.99

EMEPLO N 1

Suponga que se sabe que la desviacin estndar de la vida til de los lentes de una marca
especifica de microscopios es = 500 horas, pero no se conoce el promedio de vida til en
trminos generales, se supone que la vida til de los lentes tiene una distribucin
aproximadamente normal. Para una muestra de n = 15, la vida til promedio es de X = 8900
horas. Construya intervalos de confianza para estimar la media de la poblacin.

a) con el 95%

b) con el 90% de confianza.


N 4



En este caso puede utilizarse la distribucin normal porque la poblacin tiene una distribucin
normal y se conoce . .
Solucin.
a.- datos
x = 8900 hrs. n = 15 = 500 x = 20 . 129
87 . 3
500
15
500
= = =
n
o


x
+
z x = 8900
+
1.96 * 129.20 = 8900
+
253.23 Intervalo 8647 a 9153 hrs

b.- 8900
+
1.645 (129.20) = 8900
+
212.53 Intervalo 8687 a 9113 hrs.
EJEMPLO N 2

Con relacin al ejemplo anterior, suponga que no puede asumirse que la vida til de la
poblacin de los lentes tiene una distribucin normal. Sin embargo, la media muestral X = 8900
hrs se basa en una muestra de n = 35. Construya un intervalo de confianza del 95 % para
estimar la media de la poblacin.

En este caso, puede utilizarse la distribucin normal de probabilidad utilizando el Teorema del
Lmite Central, que seala que cuando n 30 puede asumirse que la distribucin muestral tiene
una distribucin normal, aun cuando no tenga distribucin normal.
Solucin.

X
+
Z x = 8900
+
1.96 *
35
500
= 8900
+
165.5 Intervalo 8735 a 9066 hrs.
EJEMPLO N 3

Con relacin al ejemplo n 2, suponga que puede asumirse que la poblacin tiene distribucin,
pero que se desconoce la desviacin estndar de la poblacin, ms bien, se sabe que la
desviacin estndar muestral es S = 500 y X = 8900. Estime la media de la poblacin
utilizando un intervalo de confianza del 90%.
Solucin.
La distribucin es normal.
El lmite central.

X
+
Z Sx 8900
+
1.645 *
35
500
8900
+
1.645 * 84.46
Intervalo 8761 a 9039

DETERMINACIN DEL TAMAO DE MUESTRA NECESARIO PARA ESTIMAR
LA MEDIA.


n = [
E
zo
]
Z = Al valor que se utiliza para el grado de confianza.

= La desviacin estndar de la poblacin ( o un estimador )

E = Es un factor de error mas o menos que se permite en el intervalo.

Nota : Cuando se determina el tamao de la muestra, cualquier resultado fraccionario siempre
se redondea hacia arriba. Adems, si el tamao de la muestra que se calcula est por debajo de




N 5

30, se debe incrementar a esta cantidad, por que la formula se basa en el uso de la distribucin
normal.

EJEMPLO N 4

Un administrador del departamento de personal del Ministerio de Salud desea estimar el
nmero promedio de horas de capacitacin que se dan a los mdicos de cierta especialidad,
con un error de ( ms o menos ) 3.0 horas y con una confianza del 90 %, con base en los datos
de otros departamentos, estima que la desviacin estndar de las horas de capacitacin es
= 20 horas. Determinar el tamao mnimo de la muestra que se requiere.
Solucin.

n = [
E
zo
] = [
3
20 645 . 1 -
] = [ 10.9 ] = 118


LA DISTRIBUCIN t DE STUDENT Y LOS INTERVALOS DE CONFIANZA PARA
LA MEDIA.

En los ejemplos anteriores se sealo que el uso de la distribucin normal en la estimacin de
una media poblacional es vlida para cualquier muestra grande ( n 30 ), y para una muestra
pequea ( n < 30 ) slo si la poblacin tiene distribucin y se conoce . Ahora, se revisa el
caso en el que la muestra es pequea y la poblacin tiene una distribucin normal pero se
desconoce . :
Formula.

x
n gl tabla
s t x -
= 1 ;



EJEMPLO N 5

La vida til promedio de una muestra aleatoria de n = 10 focos es X = 4000 horas, con una
desviacin estndar muestral S = 200 horas. Se supone que la vida til de los focos tiene una
distribucin aproximadamente normal. Estimar la vida til promedio de la poblacin de los
focos de la cual se tom la muestra, utilizando un intervalo de confianza del 95%
Solucin.

4000 2.262
10
200
= 4000 2.262
16 . 3
200
= 4000 143.16


Limite inferior 4000 - 143.16 = 3857 horas Limite superior = 4000 + 143.16 = 4143
horas

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS
POBLACIONALES.


Con frecuencia es necesario estimar la diferencia entre dos medias poblacionales, tal como la
diferencia entre los niveles de sueldos en dos empresas.

Formula.

Si se conoce las desviaciones estndar poblacionales (
1
o y
2
o ).
( )
2
2
2
1
2
1
2 1
n n
z x x
tabla
o o
+ - Error estndar de la diferencia entre dos medias, suponiendo
que resulta apropiado el uso de la distribucin normal.



N 6


Donde:
1
n : es el tamao de la muestra tomada de la poblacin 1
1
n : es el tamao de la muestra tomada de la poblacin 2
1
x : es la media de la muestra tomada de la poblacin 1
2
x : es la media de la muestra tomada de la poblacin 2
1
o : es la desviacin estndar de la poblacin 1
2
o : es la desviacin estndar de la poblacin 2
N es el tamao de la poblacin
tabla
z : es el valor z de la tabla N(0,1)

Cuando no se conocen las desviaciones estndar de las poblaciones, el error estndar de la
diferencia entre las dos medias, suponiendo que resulta apropiado el uso de la distribucin
normal.

( )
2
2
2
1
2
1
2 1
n
s
n
s
z x x
tabla
+ -
S1 = es la desviacin estndar de la muestra 1

S2 = es la desviacin estndar de la muestra 2


Nota: Se debe utilizar los factores de correccin por poblacin finita cuando sea
apropiado.

EJEMPLO N 6

El salario diario promedio para una muestra de n = 30 de un laboratorio farmacutico grande es
X = $ 28000 con una desviacin estndar de S = $ 1400. En otro laboratorio grande, una
muestra aleatoria de n = 40 empleados tiene un salario promedio diario de $ 27000, con una
desviacin estndar muestral de S = $ 1000. Determinar un intervalo de confianza del 99% para
estimar la diferencia entre los niveles diarios de salarios en las empresas.
Solucin.

28000 27000 2.575
40
) 1000 (
30
) 1400 (
2 2
+
2800 27000 2.575 300.55

$ 1000 773.92

$ 226.08 a $ 1773.92 $ 226 a $ 1774

Se puede afirmarse que el salario diario promedio del primer laboratorio es mayor que el
correspondiente al segundo, en una cantidad que va de $ 226 a $ 1774, con una confianza del
99% en esa estimacin por intervalos.

LA DIFERENCIA t STUDENT Y LOS INTERVALOS DE CONFIANZA PARA LA
DIFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES.

Resulta necesario utilizar la distribucin t student cuando:

1.- No se conocen las desviaciones estndar de las poblaciones.

2.- Las muestras son pequeas ( n < 30 ). Si las muestras son grandes, entonces es posible
aproximar los valores t mediante la distribucin normal estndar Z.




N 7


3.- Se supone que las poblaciones tienen distribuciones aproximadamente normales (debe
observarse que no se puede aplicarse el Teorema del Lmite Central cuando se trata de muestras
pequeas.
Sin embargo, cuando se utiliza la distribucin t para definir los intervalos de confianza para la
diferencia entre dos medias, en vez de hacerlo para una sola, se requiere de una suposicin
adicional.
4.- Las varianzas de las dos poblaciones (que se desconocen ) son iguales, 1 = 2.

Donde las varianzas poblacionales, si bien son desconocidas, se considera que son iguales,
2
c
s representa
entonces la varianza comn y se calcula:
( ) ( )
2
1 1
2 1
2
2 2
2
1 1 2
+
+
=
n n
s n s n
s
c



( )
2
2
2
1
2
1
2 1
n
s
n
s
tgl x x
tabla
+ - Donde gl = n1 + n2, = 2

Ejemplo N 7

La vida til promedio de una muestra aleatoria de n1 = 10 focos es X = 4600 hrs, con S1 = 250
horas. Para otra marca de focos, la vida til promedio y la desviacin para una muestra de n2 =
8 focos son X = 4000 hrs y S2 = 200 hrs. Se asume que la vida til de los focos de ambas marcas
tienen una distribucin normal. Determinar el intervalo de confianza del 90% para estimar la
diferencia entre las vidas tiles promedio de las dos marcas de focos.

Solucin

( )
2 1
x x = 4600 4000 = 600

t gl = 10 + 8 = 18 2 = 16 1. 746

( ) ( )
2
1 1
2 1
2
2 2
2
1 1 2
+
+
=
n n
s n s n
s
c
= 25 . 52656
2 8 10
) 200 ( 7 ) 250 ( 9
2 2
=
+
+


2
2
2
1
2
1
n
s
n
s
+ = 847 . 108
8
25 . 52656
10
25 . 52656
= +

( )
2
2
2
1
2
1
2 1
n
s
n
s
tgl x x
tabla
+ - = 600 1.746 ( 108.847 ) = 410 a 790 horas
Puede afirmarse con una confianza del 90% que la primera marca de focos tiene una vida til
promedio mayor que la segunda, en una cantidad de 410 y 790 hrs.


INTERVALOS DE CONFIANZA PARA LA PROPORCIN UTILIZANDO LA
DISTRIBUCIN NORMAL.

Cuando se desconoce la proporcin de la poblacin ( ), la mayor parte de los especialistas en
estadstica sugieren que se tome una muestra de n > 100. Debe observarse que, en el contexto
de la estimacin estadstica, no se conoce sino que se estima mediante P.








N 8

Formulas.

P
tabla
s z P

-

Donde:
:




Si la poblacin es finita o el muestreo es sin reemplazo


n: es el tamao de la muestra
p : es la proporcin de la muestra
N es el tamao de la poblacin
tabla
z : es el valor z de la tabla N(0,1)


Ejemplo N 8

Una empresa de investigacin de mercados entrevista a una muestra aleatoria de 100 hombres
de una comunidad grande y encuentra que una proporcin muestral de 0,40 de ellos prefieren
maquinas de afeitar fabricadas por la empresa cliente de los investigadores, y no las dems
marcas. Determinar el intervalo de confianza del 95% para la proporcin de todos los hombres
en esa comunidad que prefieren las maquinas de afeitar de la empresa cliente de los
investigadores.
Solucin

P
tabla
s z P

-

P
s
= 0024 . 0
100
24 . 0
100
) 60 . 0 )( 40 . 0 (
= = ~ 0.05

0.40 1.96 (0.05)

0.40 0.098 = 0.40 0.10 = 0.30 a 0.50

Por lo tanto, puede estimarse con una confianza del 95% que la proporcin de hombres de esa
comunidad que prefieren las maquinas de afeitar de la empresa est entre 0.30 y 0.50.


INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS
PROPORCIONES POBALCIONALES.


Para estimar la diferencia entre dos proporciones de dos poblaciones, el estimador puntual
sesgado de (1 2) es (P1 P2). El intervalo de confianza implica utilizar el error estndar de la
diferencia entre las proporciones. El uso de la distribucin normal se basa en las mismas
condiciones que para la distribucin muestral de la proporcin, excepto que se trata de dos
muestras y se aplican los requerimientos para cada una de ellas. El intervalo de confianza para
estimar la diferencia entre las proporciones de dos poblaciones es:



( )
( )

-
-
= ;
1
1
1

N
n N
n
p p
n
p p
s
P


N 9


Formula.

( )
2
2 2
1
1 1
2 1


n
Q P
n
Q P
z p p
tabla
-
+
-
-
Donde:
1
n : es el tamao de la muestra tomada de la poblacin 1
1
n : es el tamao de la muestra tomada de la poblacin 2
1

P : es la proporcin en la muestra tomada de la poblacin 1;


1 1

P Q =
2

P : es la proporcin en la muestra tomada de la poblacin 1;


2 2

P Q =
N es el tamao de la poblacin
tabla
z : es el valor z de la tabla N(0,1)

EJEMPLO N 9

En el ejemplo anterior se reporto que una proporcin de 0.40 hombres de una muestra aleatoria
de 100 tomada de una comunidad grande, manifest preferir las hojas de afeitar de la empresa
cliente de los investigadores y no de las dems marcas. En otra comunidad grande, 60 hombres
de una muestra aleatoria de 200 prefirieron las mquinas de afeitar de la empresa cliente.
Determinar el intervalo de confianza del 90% para la proporcin de hombres de las dos
comunidades que prefirieron las maquinas de afeitar de la empresa cliente.

Solucin

( )
2 1
p p = 0.40 0.30 = 0.10

Z = 1.645

1 1

P Q = = 1 0.40 = 0.60
2 2

P Q = = 1 0.30 = 0.70

2
2 2
1
1 1

n
Q P
n
Q P -
+
-
= 059 . 0 00345 . 0 00105 . 0 0024 . 0
200
) 70 . 0 )( 30 . 0 (
100
) 60 . 0 )( 40 . 0 (
= = + = +

0.10 1.645(0.059)

0.10 0.097 = 0.003 a 0.197



EJERCICIOS DE INTERVALOS


1. De un lote de 3.500 pilas se probaron 98 al azar. La vida promedio en esa muestra result ser de 3,5
horas con una desviacin estndar de 0,9 horas. Construya un intervalo de confianza del 99% para la
vida media del lote de pilas (suponer normalidad en la poblacin).

2. Una muestra aleatoria de empleados de un grupo numeroso perteneciente a una empresa, entreg las
siguientes calificaciones en un examen de aptitud: 63; 72; 56; 65; 66; 74; 57; 59; 63. Construya un
intervalo de confianza del 95% para estimar la calificacin promedio de todos los trabajadores de la
empresa, suponiendo normalidad en la poblacin.


3. Se desea medir la diferencia en ventas entre dos tipos de empleados en la actividad de seguros, unos
con titulo profesional y otros de personas con estudios medios. Se toma una muestra de 41
empleados entre los primeros y la media de las ventas resulta ser 32($ miles), en tanto que la media
de una muestra de 30 empleados con slo estudios medios es de 25. Se encontr tambin que la
varianza en la primera muestra es de 48 y en la segunda de 56. Determine el intervalo de confianza
del 95% para estimar la diferencia en las ventas medias de los dos tipos de vendedores. (suponer
normalidad).



N 10



4. Se desea estimar la diferencia ente los salarios semanales promedios de empleados y obreros. Se
toman dos muestras independientes de 61 personas cada una obtenindose:
Empleados Obreros
Media $150.000 $100.000
Varianza 100.000 81.000

Construya un intervalo del 95% de confianza para estimar la diferencia de medias (suponer
normalidad).

5. Una pequea empresa compr un lote grande de piezas electrnicas a una firma. En una muestra
aleatoria de 50 piezas se comprob que 5 eran defectuosas. Estime la proporcin de piezas
defectuosas de todo el lote, empleando un intervalo de 95% de confianza.


6. En una muestra aleatoria de 100 posibles clientes se encontr que 30 dicen que prefieren cierto
producto. Estimar el verdadero % de todos los posibles clientes que prefieren el producto, usando un
intervalo de 95% de confianza.


7. En dos ciudades se tomaron muestras de automviles, cada una de 100 automviles. En una ciudad
72 automviles pasaron con xito la prueba de seguridad, en la otra solamente lo hicieron 66.
Construya un intervalo de 95% de confianza para estimar la diferencia de proporciones de autos
seguros en las dos ciudades.


8. Se desea hacer una encuesta para estimar el porcentaje de personas mayores de edad, de una ciudad,
que estn a favor de cierto proyecto de ley. Cul debe ser el tamao de la muestra, si se desea un
nivel de confianza del 95% y un error mximo de estimacin de 4%?


9. Se desea estimar el gasto medio en movilizacin de los alumnos de cierta Universidad que tiene
5.000 alumnos. Cul es el tamao de muestra necesario, si se desea un nivel de confianza del 95%,
un error mximo de $2.000, y se sabe por estudios anteriores que la desviacin estndar es de
$15.000?

También podría gustarte