Está en la página 1de 82

ESTADSTICA

Muestreo y Estimacin

Introduccin

Preguntas:

Cul es el tiempo promedio de trabajo (en horas) de los


trabajadores de una empresa?

Cul es el tiempo promedio que demoran en hacer una


determinada tarea los trabajadores del rea de Mantenimiento?

En un da, qu porcentaje de los trabajadores solicitan permiso


para ausentarse por enfermedad?

En promedio, cunto autos pasan por da por la caseta de peaje?

Etc.

Inferencia Estadstica

La inferencia estadstica se refiere a los


mtodos y procesos para obtener
conclusiones acerca de Poblaciones,
basados en informacin muestral.

Combinamos nuestro conocimiento sobre


el manejo de informacin con la teora de
probabilidades para poder derivar
inferencias sobre la poblacin, tomando
como base informacin muestral.

El muestreo

En muchos problemas, los datos de slo una parte de


la poblacin (muestra), pueden dar la informacin
necesaria para tomar una decisin o probar una
hiptesis referente a la poblacin o universo.

El objetivo del muestreo es seleccionar una muestra


que sea representativa de la poblacin. Para esto, se
debe determinar el mtodo adecuado de seleccin,
el tamao correcto de la muestra y la tcnica de
estimacin de las caractersticas de la poblacin en
base a la muestra.

Parmetro y estadstico
Una caracterstica especial de la poblacin se
denomina un parmetro, su contra parte en la
muestra, se llama estadstico o estadgrafo.
Poblacin Muestra
Caractersticas
Parmetro Estadstico
Media

X
Proporcin p
P
Desviacin Estndar S
Varianza
S
En resumen, tomamos una muestra y usando las
leyes de probabilidades logramos un estimado de
los parmetros de la poblacin.

Propiedad de la media muestral


A medida que la muestra crece la media
muestral se acerca a la media verdadera
f X

Mayor tamao
de muestra

Menor tamao de
muestra

Qu tan grande debe ser la


muestra?

Para la mayora de las distribuciones se


obtiene una buena aproximacin para n 30

Para distribuciones casi simtricas, n 15

Para poblaciones distribuidas normalmente, la


distribucin muestral de la media siempre
ser

normalmente distribuida

Propiedad de la proporcin muestral


A medida que la muestra crece la
proporcin muestral se acerca a la
proporcin poblacional

f (P)
Tamao de
muestra mayor

Tamao de
muestra menor

Estimacin de
parmetros

Proceso de Estimacin
Estimado=
=???

Estimado= s

=???

Poblacin

Muestra
Poblacin
Estimador

Estimacin

Estimacin de parmetros

Definimos la poblacin que nos


interesa.
No conocemos sus parmetros.
De la poblacin se obtiene una
muestra aleatoria.
A partir de la muestra, obtenemos
informacin acerca los
parmetros desconocidos.

Mtodos de estimacin de
parmetros
Estimacin

Estimacin
Puntual

Parmetro =

Nmero

Estimacin
de Intervalo

Parmetro [a, b]

Mtodos de estimacin de
parmetros
Estimacin puntual

Parmetro = Nmero
El 24% de los limeos tiene temor a sufrir un atraco o
asalto con armas, segn sondeo PUCP de agosto 2009.

Estimacin por intervalos

Parmetro est en el intervalo [a, b]


El peso medio de las cajas de cereal est entre 248 y 252
gramos con una confianza del 95%

Estimacin Puntual

El estadstico muestral usado para


estimar un parmetro de la poblacin se
llama estimador puntual, y un valor
observado especfico, calculado con los
valores de la muestra se llama
estimacin puntual del parmetro de
inters.

Estimadores Puntuales
Estimador
Media
Proporcin
Varianza
Desv. Estndar

Poblacin

Muestra

s
s

15

Estimacin Puntual

El estimador puntual es una variable


aleatoria y por lo tanto tiene una
distribucin de probabilidades

Una estimacin puntual es


insesgada si el valor esperado del
estadstico es igual al parmetro
poblacional que se est estimando.

X es un estimador insesgado de

E X

P es un estimador insesgado de p
E P p

La varianza muestral o cuasi varianza


definida como:
n

S
2

(X
i 1

X)

n 1

Es un estimador insesgado de la
varianza poblacional pues:

E (S )
2

Ejemplo

Una pizzera est estudiando la posibilidad de


colocar como publicidad, los das viernes, que
garantiza sus entregas de pizzas en menos de 30
minutos, caso contrario la pizza ser gratis. Para
determinar si es capaz de lograrlo, un da viernes
se realiza un muestreo de 40 entregas de pizzas.

Determine las siguientes estimaciones puntuales


poblacionales (para todos los tiempos de entrega):

1.

Tiempo promedio de entrega


Desviacin estndar de los tiempos de entrega
Proporcin muestral de los tiempos de entrega
que demoran 30 minutos o ms.

2.
3.

REGISTRO DEL TIEMPO DE


ENTREGA DE PIZZAS

Ejemplo (Continuacin)
Las estimaciones respectivas
son:

=24.13 min

S =6.26 min
P

= 0.275

Estimacin por intervalos

Estimacin por
Intervalo

Describe un intervalo de valores dentro


del cual es posible que est el parmetro
de la poblacin.
Basado
en las observaciones de la
muestra.

Da informacin sobre el error de la


estimacin.

Proporciona un grado de confianza para


determinar donde se ubica el parmetro
de la poblacin.

Proceso de estimacin por


intervalos
Poblacin
Muestra aleatoria
La media, , es
desconocida

Media muestral
Media
X = 50

Muestra

Intervalo de
confianza
La verdadera media
de la poblacin se
encuentra entre 40 y
60 con una
confianza del 95%

Intervalo de Confianza
Amplitud de la estimacin que estamos haciendo

Intervalo de Confianza

Lmite de Confianza
Inferior

Estadstica de la
Muestra

Lmite de Confianza
Superior

Nivel de Confianza

Probabilidad de que el intervalo contenga al


parmetro de la poblacin que se est
estimando
Se denota (1 - )x100

es la rea bajo la curva en el ancho del


intervalo.
es el rea en cada extremo o cola.

Niveles de confianza tpicos son:

99%, 95%, 90%

Intervalo y Nivel de
Confianza

El IC se obtiene
de la Distrib. de
la
Media
Muestral

x
(1 - )x100% de
los intervalos de
las muestras
contienen a

27

Interpretacin del nivel de


confianza
Ejemplo: Nivel de confianza = 95%
Si se seleccionan repetidamente 100
muestras de tamao n, y calculamos las
medias de cada una de ellas, podremos
construir 100 intervalos de confianza. Se
espera o confa que 95 de ellos
contengan el parmetro y los 5
restantes no lo contengan.

z Scores

5% or 0.05

(z score will be positive)

z Scores

5% or 0.05

1.645
(z score will be positive)

z Scores

(One z score will be negative and


the other positive)

z Scores

(One z score will be negative and


the other positive)

z Scores

(One z score will be negative and


the other positive)

The Critical Value z

Finding z2 for 95% Degree


of Confidence
= 5%
2 = 2.5% = .025

-z2
Critical Values

z2

Finding z2 for 95% Degree


of Confidence
= 0.05

Use Table A-2


to find a z score of 1.96

z2 = 1.96

Intervalo de confianza para


Poblacin infinita

Varianza poblacional conocida

xz

xz
1
n
n
2

Varianza poblacional desconocida

x t
2

, n 1

s
s
x t
, n 1
n
n
2

Intervalo de confianza para


Poblacin finita

xz

x t
2

Varianza poblacional conocida

N n

xz
1
N 1
n
2

N n
N 1

Varianza poblacional desconocida

, n 1

s
n

N n
s
x t
, n 1
N 1
n
2

N n
N 1

Ejercicio

Se visit 20 restaurantes de una cadena


de comida rpida.
Durante cada visita se orden una
comida bsica (un sandwich, una
porcin de papas y una gaseosa).
Se registr el tiempo entre pedir y
recibir la orden. Los siguientes datos son
los tiempos (en minutos) para 20 visitas:

Ejercicio

Calcule e interprete un intervalo de


confianza de 95% para la media
poblacional

0,9

1,0

1,2

2,2

1,9

3,6

2,8

5,2

1,8

2,1

6,8

1,3

3,0

4,5

2,8

2,3

2,7

5,7

4,8

3,5

Ejercicio

De un grupo de 50 analistas, se tom


una muestra de tamao 12, los cuales
dieron sus opiniones acerca de las
ganancias, en dlares, por accin del
ao 2004 para la empresa El guila.
Los datos son:

1,40 1,55 1,40 1,42 1,48 1,63 1,40 1,40 1,45 1,49 1,37 1,27

Ejercicio

Estime e interprete, con un nivel


de confianza del 95%, la ganancia
promedio poblacional por accin
para la empresa El guila segn la
opinin de los analistas.

Ejercicio

Una oficina turstica de Huaraz, encuest


a 321 turistas de los 5 500 turistas que
llegaron a Huaraz en el mes de abril,
obteniendo un gasto promedio de $612
y una desviacin estndar de $200.
Estime e interprete, con un nivel de
confianza del 97%, el gasto medio de
todos los turistas en su visita a Huaraz
en el mes de abril.

Ejercicio

Se pide al director de una sucursal


bancaria que estime el tiempo medio que
se invierte en atender a un cliente. Quiere
confiar al 99% en que la estimacin de la
media muestral no supere en ms de 15
segundos a la media poblacional.
Cuntas observaciones debe recoger, si
se sabe que la desviacin estndar
poblacional es de 2,7 minutos?

Ejercicio

El gasto semanal de los estudiantes de


una universidad en fotocopias tiene una
desviacin estndar de 1.5 soles. Se
tom una muestra aleatoria de 50
alumnos y se encontr una media
muestral de 4 soles en fotocopias a la
semana.
Calcule e interprete un intervalo de
confianza del 95% para dicho gasto.

47

48

Intervalos de confianza
para p

Condiciones: Si n>30,np 5 n,1 p 5


Poblacin infinita
p z

p 1 p
p p z
1
n
2

p 1 p
n

Poblacin finita

p z

p 1 p
n

N n
p p z
1
N 1
2

p 1 p
n

N n
N 1

50

A una muestra aleatoria de 400 personas


mayores de 28 aos de una ciudad determinada
se les pregunt si estaban a favor de un nuevo
impuesto adicional del 4% en el precio de la
gasolina para obtener fondos necesarios que se
destinaran a un programa de asistencia social.
Si en la muestra elegida se encontr que 245
estaban a favor del impuesto adicional,
determine e interprete un intervalo de confianza
del 90% para la verdadera proporcin de
personas a favor del nuevo impuesto.

51

Ejercicio
Una empresa dedicada a la venta de
electrodomsticos, obtuvo una muestra
aleatoria de 500 clientes, encontrndose
que 311 clientes deseaban comprar sus
televisores bajo la forma de pago a plazos.
Calcule e interprete un intervalo de confianza
al 90% para la proporcin poblacional de
clientes que desean comprar sus
televisores a plazos si su cartera de clientes
est formada por 5000 clientes.

53

Ejercicio

El intervalo de confianza para la


proporcin poblacional a un nivel
de confianza del 95% es
0.22,0.38.
Si la poblacin es infinita, calcular
el tamao de muestra usado.

Estimating a Population
Variance
Assumptions
1. The sample is a simple random sample.
2. The population must have normally
distributed values (even if the sample is large).
Copyright 2004
Pearson Education, Inc.

Chi-Square Distribution
=
2

(n 1)

where
n = sample size
s 2 = sample variance

2 = population variance

Copyright 2004
Pearson Education, Inc.

Properties of the Distribution


of the Chi-Square Statistic
1. The chi-square distribution is not symmetric, unlike
the normal and Student t distributions.
As the number of degrees of freedom increases, the
distribution becomes more symmetric. (continued)

Figure 6-8 Chi-Square Distribution


Copyright 2004
Pearson Education, Inc.

Figure 6-9 Chi-Square Distribution for


df = 10 and df = 20

Properties of the Distribution


of the Chi-Square Statistic

(continued)

2. The values of chi-square can be zero or positive, but they


cannot be negative.
3. The chi-square distribution is different for each number of
degrees of freedom, which is df = n 1
in this section.
As the number increases, the chi- square distribution
approaches a normal distribution.
In Table A-4, each critical value of 2 corresponds to an area
given in the top row of the table, and that area represents
the total region located to the right of the critical value.

Copyright 2004
Pearson Education, Inc.

Example:

Find the critical values of 2 that determine


critical regions containing an area of 0.025 in each tail.
Assume that the relevant sample size is 10 so that the
number of degrees of freedom is 10 1, or 9.

= 0.05
/2 = 0.025
/2 =
0.975

Copyright 2004
Pearson Education, Inc.

Critical Values: Table A-4


Areas to the right of each tail

Copyright 2004
Pearson Education, Inc.

Estimators of

The sample variance s is the best


point estimate of the population
variance .
2

Copyright 2004
Pearson Education, Inc.

Intervalos de confianza
para la varianza

Varianza poblacional

n 1 s

n 1 s

n 1,1
2

n 1,

Desviacin estndar poblacional

n 1 s

n 1,1
2

n 1 s

2
n 1,

Procedure for
Constructing a
Confidence Interval for or 2
1. Verify that the required assumptions are met.
2. Using n 1 degrees of freedom, refer to Table A-4
and find the critical values 2R and 2Lthat
corresponds to the desired confidence level.
3. Evaluate the upper and lower confidence interval
limits using this format of the confidence
interval:

(n 1)s

2
R

Copyright 2004
Pearson Education, Inc.

(n 1)s

2
L

continued

Example:

A study found the body temperatures of


106 healthy adults. The sample mean was 98.2 degrees
and the sample standard deviation was 0.62 degrees.
Find the 95% confidence interval for .
n = 106
x = 98.2o
s = 0.62o

= 0.05
/2 = 0.025
1 /2 = 0.975

R= 129.561, 2L = 74.222

(106 1)(0.62)2 < 2 < (106 1)(0.62)2


129.561
74.222
0.31 < 2 < 0.54
0.56 < < 0.74

We are 95% confident that the limits of 0.56F and 0.74F contain
the true value of . We are 95% confident that the standard
deviation of body temperatures of all healthy people is between
0.56F and 0.74F.

Ejercicio

Un fabricante de bateras para automviles


tom una muestra aleatoria de diez bateras
y registr su duracin, en aos, obtenindose
los siguientes resultados:

3,2 4,4 3,5 2,0 3,4 1,9 2,4 3,0 3,5 4,2

Suponga que la duracin de una batera sigue


una distribucin normal. Calcule e interprete
un intervalo de confianza al 95% para la
desviacin estndar de la duracin de una
batera.

Ejemplo. Un fabricante de bateras para


automviles afirma que sus bateras durarn, en
promedio, tres aos con una varianza de un ao.
Si cinco de estas bateras tienen duraciones de
1.9, 2.4, 3.0, 3.5 y 4.2 aos, construya un
intervalo de confianza del 95% para la varianza
real y decida si la afirmacin del fabricante de es
vlida. Suponga que la poblacin de duraciones
de las bateras es de forma aproximadamente
normal.
66

Problema. Para estimar el tiempo promedio


que lleva ensamblar cierto componente de
una computadora, el supervisor de una
empresa electrnica tom el tiempo que 20
tcnicos tardaban en ejecutar esta tarea,
obtenindose una media de 12.73 minutos y
una desviacin estndar de 2.06 minutos.
Asuma que los tiempos tienen distribucin
normal. Construya e interprete un intervalo
de confianza de 98% para la varianza real
que
lleva ensamblar el componente de la
computadora.
67

Determining Sample Size

Copyright 2004
Pearson Education, Inc.

Example:

We want to estimate , the standard


deviation off all body temperatures. We want to be 95%
confident that our estimate is within 10% of the true value
of . How large should the sample be? Assume that the
population is normally distributed.

From Table 6-2, we can see that 95% confidence


and an error of 10% for correspond to a
sample of size 191.

Copyright 2004
Pearson Education, Inc.

Distribucin muestral de la razn de


varianzas

2
S
Si 1

2
S
y2

son las varianzas de


muestras independientes de tamao
y respectivamente de poblaciones
normales, entonces un intervalo de
confianza para la razn de varianzas
es: 2
2
2

S1
1 S1
1
2 2 f n2 1, n1 1, 2
2
S 2 f n1 1, n2 1, 2 2 S 2

Ejemplo

El gerente de un banco comercial de Lima


quiere evaluar el desempeo de dos
sucursales, la primera ubicada en el distrito
de Miraflores y la segunda en San Isidro.
Decide elegir dos muestras aleatorias del
total de operaciones realizadas la ltima
semana: 16 en Miraflores y 25 en San Isidro
donde se registr, entre otras variables, el
monto de operacin (en dlares). Los
resultados se muestran a continuacin:

Ejemplo

Hallar e interpretar un intervalo de


confianza del 95% para la razn de
varianzas de los montos de
operacin en las sucursales de
Miraflores y San Isidro. Asumir
normalidad donde corresponda.

Sucursal

Tamao de
muestra

Monto promedio
por operacin

Desviacin estndar del


monto por operacin

Miraflores

16

800

180

San Isidro

25

1200

220

Ejercicio

Una empresa fabrica polos deportivos


y compra los hilos a dos proveedores.
Para verificar que no existe diferencias
en la resistencia de los hilos adquiridos
a estos proveedores se toma una
muestra de piezas de cada clase de
hilo y se registr la resistencia en
condiciones similares. Los datos se
muestran a continuacin.

Ejercicio

Proveedor 1:n1 21 x 78.611 s 3.093


Proveedor 2:
84.32 82.61 86.16 78.78 82.76 86.93 85.56 84.84
81.22 89.77 83.91 84.92 89.80 88.74 84.06 59.92

Calcule e interprete un intervalo de


confianza del 90% para la razn de
varianzas de las resistencias de los hilos de
estos proveedores. Asumir poblaciones
normales.

Distribucin muestral de la
diferencia de medias

Varianzas poblacionales conocidas

X
Z

X 2 1 2

n1 n2
2
1

2
2

N 0,1

El intervalo de confianza es:

x1 x2 z

12 22
12 22

1 2 x1 x2 z

1
n1 n2
n1 n2
2

Distribucin muestral de la
diferencia de medias
Varianzas desconocidas supuestas
iguales

E X 1 X 2 1 2

V X1 X 2

2
p

n1

2
p

n2

S (n1 1) S (n 2 1)
S
n1 n 2 2
2
p

2
1

2
2

Distribucin muestral de la
diferencia de medias
La variable X X ( )
1

S p2

S p2

n1

n2

se distribuye t-Student con (n1+n22) g.l.

El intervalo de confianza es

x1 x2 t
2

S p2
, n1 n2 2

n1

S p2
n2

1 2 x1 x2 t
2

S p2
, n1 n2 2

n1

S p2
n2

Distribucin muestral de la
diferencia de medias
Varianzas desconocidas supuestas2
2
S
S
1
2
diferentes

V
X

E X 1 X 2 1 2
1
2
n1

n2

X 1 X 2 ( 1 2 )
S12 S 22

n1 n2

La variable
se distribuye tStudent con v grados de libertad.
El valor
S
S

n
n

de v es el entero ms cercano a
2
1

2
2

S12
S 22

n
n
1 2
n1 1 n2 1

Distribucin muestral de la
diferencia de medias

El intervalo es

x1 x2 t
2

S12 S 22

1 2 x1 x2 t
,
n1 n2
2

S12 S 22

n1 n2

Ejercicio

Construya un intervalo de confianza del


94% para la diferencia real entre las
duraciones de dos marcas de focos, si
una muestra de 40 focos tomada al azar
de la primera marca dio una duracin
media de 418 horas, y una muestra de 50
focos de otra marca dieron una duracin
media de 402 horas. Las desviaciones
estndares de las dos poblaciones son 26
horas y 22 horas, respectivamente.

Ejercicio

Los siguientes datos representan los


tiempos, en minutos, de secado de un tipo
de pintura, con y sin aditivo de secado.

Con aditivo

76

75

72

75

74

78

79

60

85

95

74

81

Sin aditivo

94

82

78

79

95

98

75

86

94

92

93

89

75

Calcule un intervalo de confianza de 90%


para la diferencia entre los tiempos de
secado promedio de la pintura con y sin
aditivo. Asuma varianzas poblacionales
iguales.

78

Ejercicio

Calcule un intervalo de confianza


de 90% para la diferencia entre los
tiempos de secado promedio de la
pintura con y sin aditivo. Asuma
varianzas poblacionales diferentes.