P. 1
UNIDAD 4. ESTADISTICA

UNIDAD 4. ESTADISTICA

|Views: 7.455|Likes:
Publicado porGASTH4C11

More info:

Categories:Types, School Work
Published by: GASTH4C11 on May 24, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

11/10/2015

pdf

text

original

MATERIA: estadística administrativa.

TITULO: unidad 4. Muestreo y
estimaciones.




Equipo:
Barbosa Arizpe teresa de Jesús.
Campos nava Sandra.
Carmona García Gabriela.
Coyote villaba Jesús Eduardo.
López Andrés Víctor hago.
Plata de la rosa dulce abril.




PROFESOR: Carlos Gutiérrez reynaga.




Grupo: 4c11.




UNIDAD 4. MUESTREO Y ESTIMACIONES

4.1 Definición de muestreo

Es un procedimiento empleado para obtener una o más muestras de una
población. Por ejemplo: religión y sexo de los estudiantes de educación del núcleo
San Carlos de la UNESR.

Muestra: Es la parte de la población a estudiar que sirve para representarla.

4.1.1 Tipos de muestreo aleatorio, sistematizado, estratificado y
conglomerados

Muestreo aleatorio simple

Para población finita: Una muestra seleccionada de tal manera que cada muestra
posible de tamaño n tiene la misma probabilidad de ser seleccionada.

Para población infinita: Una muestra seleccionada de tal manera que cada
elemento proviene de la misma población y los elementos sucesivos se
seleccionan en forma independiente.

EJEMPLO

Un muestreo aleatorio de todos los profesores de secundaria de California puede
resultar en la selección (altamente improbable, por cierto) de 20 profesoras de
francés. De hecho, nunca se puede tener la seguridad de que tal muestreo sea
representativo o no de la población y lo único que se puede afirmar es que, bajo
todo aspecto, es aleatoriamente representativo de ella.

Una característica mas importante del muestreo al azar es que puede
determinarse el tipo de ³no representatividad´ que, a la larga, cabe esperar de
numerosos muestreos similares, cosa que no es posible con otros tipos de
selección.

Muestreo aleatorio simple estratificado

Método para seleccionar una muestra en el que primero se divide a la población
en estratos y a continuación se toma una muestra aleatoria simple de cada
estrato.

EJEMPLO

Una base de formación de los estratos puede ser por departamentos, ubicación,
edad, giro industrial, etc., queda a discreción de quien diseña la muestra, sin
embargo los mejores resultados se obtienen cuando los elementos dentro de cada
estrato son tan semejantes como sea posible.
Después de formar los estratos se toma una muestra aleatoria simple de cada
uno. Se dispone de formulas para combinar los resultados para la muestra de
estrato individual en un estimado del parámetro poblacional de interés. El valor del
muestreo aleatorio estratificado depende de cuán homogéneos sean los
elementos dentro de los estratos. Si son similares, los estratos tendrán bajas
varianzas. Si los estratos son homogéneos, el procedimiento de muestreo
aleatorio estratificado producirá resultados tan precisos como el muestreo
aleatorio simple, pero con menor tamaño total de muestra.


Muestreo sistemático

Método para elegir una muestra seleccionando al a los primeros k elementos y a
continuación cada k-ésimo elemento.

EJEMPLO

Si se desea una muestra de tamaño de 50 de una población con 5,000 elementos,
podríamos muestrear un elemento de cada 5,000/50 = 100 en la población. Una
muestra sistemática en este caso implica seleccionar al azar uno de los primeros
100 elementos de la lista de la población. Se identifican los demás elementos de la
muestra comenzando por el primero obtenido al azar y a continuación
seleccionando cada 100. elementos. En efecto, se identifica la muestra de 50
recorriendo la población en forma sistemática, e identificando cada 100.
elemento después del primero que se selecciono al azar.

Muestreo por conglomerados

Método probabilístico de muestreo en el cual primero se divide la población en
conglomerados y después se selecciona uno o mas conglomerados para
muestrearlos.


EJEMPLO

Cuando se realiza el muestreo de áreas, en los que los conglomerados son
manzanas urbanas, u otras áreas, bien definida. Por lo general, el muestreo de
conglomerados requiere un tamaño de muestra total mayor que el muestreo
aleatorio simple o el muestreo aleatorio estratificado. Sin embargo, puede originar
ahorros porque cuando se manda a un entrevistador a aplicar un cuestionario a un
conglomerado muestreado (por ejemplo, una manzana urbana), se puede obtener
muchas observaciones muéstrales en un tiempo relativamente corto. En
consecuencia, se puede obtener un mayor tamaño de muestra con un costo
bastante menor por elemento, y por ende, probablemente un costo total menor.



4.2 Concepto de distribución de muestreo de la media

Una distribución muestral de medias o una distribución en el muestreo de la media
se define como el conjunto de todas las medias que se pueden calcular en todas
las muestras posibles que se pueden extraer, con o sin reemplazo, de una
determinada población. Para detectar las relaciones a que nos hemos referido,
partiremos de un ejemplo con una población pequeña.

4.2.1 Distribución muestral de la diferencia entre dos medias

Estadístico de la prueba de la diferencia entre dos medias con muestras grandes.

Formula:

ݖ ൌ
ݔҧ

െ ݔҧ


ܵ


݊


ܵ


݊



EJEMPLO 1:

En un estudio de una tienda de departamentos diseñado para probar el saldo
promedio en las cuentas de 30 días es el mismo en sus dos sucursales
suburbanas, muestras tomadas al azar arrojaron los siguientes resultados:
݊

ൌ ͺͲǡ ݊

ൌ ͳͲͲǡ ݔҧ

ൌ ̈́͸ͶǤʹͲǡ ݔҧ

ൌ ̈́͹ͳǤͶͳǡ ܵ

ൌ ̈́ͳ͸ǤͲͲǡ
ܵ

ൌ ̈́ʹʹǤͳ͵
ݖ ൌ
ݔҧ

െ ݔҧ


ܵ


݊


ܵ


݊



ݖ ൌ
͸ͶǤʹͲ െ ͹ͳǤͶͲ

ሺͳ͸ǤͲͲሻ

ͺͲ

ሺʹʹǤͳ͵ሻ

ͳͲͲ
ൌ െʹǤͷ͵

Y como este valor es menor que -1.96, se deduce que la diferencia observada de
$7.21 entre los saldos promedio de las dos sucursales es significativa. El valor de
z= -2.53 es de 0.0057.

Estadístico de la prueba de muestra pequeña.

Formula:

ݐ ൌ
ݔҧ

െݔҧ


σሺݔ

െ ݔҧ



൅σሺݔ

െ ݔҧ



݊

൅݊

െʹ
ȉ ቀ
ͳ
݊


ͳ
݊





EJEMPLO 2:

Las siguientes son mediciones de la capacidad de producción (en millones de
calorías por tonelada) de muestras aleatorias ejemplares cada una de carbón
proviene de dos minas:

Mina 1: 8380 8210 8360 7840 7910
Mina 2: 7540 7720 7750 8100 7690

Utilice un nivel de significación de 0.05 para probar si es importante la diferencia
entre las medias de estas dos muestras.
Las medias de las muestras son ݔҧ

ൌ ͺͳͶͲ ݕ ݔҧ

ൌ ͹͹͸Ͳ y para calcular ³t´ de
acuerdo a la formula anterior, primero se determina.

෍ሺݔ

െݔҧ



ൌ ሺͺ͵ͺͲ െͺͳͶͲሻ

ሻ ൅ڮ൅ሺ͹ͻͳͲ െͺͳͶͲሻ

ൌ ʹͷ͵ ͺͲͲ
Y
෍ሺݔ

െݔҧ



ൌ ሺ͹ͷͶͲ െ͹͹͸Ͳሻ

ሻ ൅ ڮ൅ሺ͹͸ͻͲ െ͹͹͸Ͳሻ

ൌ ͳ͹Ͳ ͸ͲͲ


Ahora bien, al sustituir estas sumas junto con ݊

ൌ ͷǡ ݊

ൌ ͷǡ ݔҧ

ൌ ͺͳͶͲǡ ݔҧ


͹͹͸Ͳ en la fórmula de ³t´, se obtiene:

ݐ ൌ
ͺͳͶͲ െ ͹͹͸Ͳ

ʹͷ͵ ͺͲͲ ൅ͳ͹Ͳ ͸ͲͲ
ͷ ൅ ͷ െ ʹ
ȉ ቀ
ͳ
ͷ

ͳ
ͷ

ൌ ʹǤ͸ͳ


4.3 Teorema del límite central

Sea X
1
, X
2
,...,

una muestra aleatoria de una distribución con media ߤ y varianza
ߪ

Entonces, si ݊ es suficientemente grande, ݔ tiene aproximadamente una
distribución normal con, ߤ

ൌ ߤ ݕ ߪ

; ൌ ɐ

n Τ y T
0
tiene también aproximadamente
una distribución normal con ߤ
்௢
ൌ ݊ כ ߤǡ ߪ
்௢

ൌ ݊ כ ߪ

. Cuanto mas grande sea el
valor de n, mejor será la aproximación.

El Teorema del Límite Central garantiza una distribución normal cuando n es
suficientemente grande.
Si n > 30, se puede usar el Teorema de Limite Central.
Si la distribución madre es normal, la distribución de la media muestral también es
normal, independientemente del tamaño.
ݔ ൎ ܰሺߤ

Ǣ ߪ

ሻ Þx ൎ ሺߤ

Ǣ ߪ


Ejemplo 1:
Si se sabe que la dureza Rockwell de pernos de cierto tipo tiene un valor medio de
50 y desviación estándar de 1,5.

a) Si la distribución es normal, ¿cuál es la probabilidad de que la dureza muestral
media para una muestra aleatoria de 9 pernos sea por lo menos 52?

b) ¿Cuál es la probabilidad (aproximada) de que la dureza muestral media para
una muestra aleatoria de 40 pernos sea al menos 52?
x = 50
ı = 1,5
x § N(50; 1,5)
a)
n = 9
x = 52
x § N(50; 1,5.¥9)
z =ሺݔ െ ߤሻȀሺߪȀξ݊ሻ

La probabilidad de que la media muestral sea superior a 52 es:

P(x • 52) =
ܲ ቌ
ݔҧ െߤ
ߪ
ξ݊

ͷʹ െͷͲ
ͳǤͷ
ξͻ
൲Þ PሺZ ൒ Ͷሻ ൌ Ͳ

Con el valor de z obtenido de y tablas:

P(x
1
” x ” x
2
) =

ܲሺݖ


ݔҧ െ ߤ
ߪ
ξ݊
൑ ݖ

ሻÞ Pሺzͳ ൑ z ൑ zʹሻ ൌ ɔሺzሻ

Tener en cuenta que los valores para:
ĭ (z) = P (z ” z
1
)
b)
n = 40


Con el valor de z obtenido de tablas:

P(x • 52) =
ܲ ቌ
ݔҧ െߤ
ߪ
ξ݊

ͷʹ െͷͲ
ͷ
ξͶͲ
൲Þ PሺZ ൒ ͺǡͶ͵ʹ͹ሻ ൌ Ͳ

EJEMPLO 2:

En una asignatura del colegio la probabilidad de que te saquen a la pizarra en
cada clase es del 10%. A lo largo del año tienes 100 clases de esa asignatura.
¿Cuál es la probabilidad de tener que salir a la pizarra más de 15 veces? Se
vuelve a aplicar el Teorema Central del Límite.
Salir a la pizarra es una variable independiente que sigue el modelo de distribución
de Bernoulli:
"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10
"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9
La media y la varianza de cada variable independiente es:

ߤ ൌ ͲǡͳͲ
ߪ

ൌ ͲǡͳͲ
כ
ͲǡͻͲ ൌ ͲǡͲͻ
Por tanto, la suma de las 100 variables se distribuye según una normal cuya
media y varianza son:
Media: n * m = 100 * 0,10 = 10
Varianza: n * s
2
= 100 * 0,09 = 9
Para calcular la probabilidad de salir a la pizarra más de 15 veces, calculamos el
valor equivalente de la variable normal tipificada:

ܻ ൌ
ଵହିଵ଴
ଷǡ଴
ൌ ͳǡ͸͹
Luego:
ܲሺܺ ൐ ͳͷሻ ൌ ܲሺܻ ൐ ͳǡ͸͹ሻ ൌ ͳ െ Ͳǡͻͷʹͷ ൌ ͲǡͲͶ͹ͷ
Es decir, la probabilidad de tener que salir más de 15 veces a la pizarra a lo largo
del curso es tan sólo del 4,75%.
4.4 Determinación del tamaño de la muestra de una población
El tamaño de la muestra para un diseño de encuesta basado en una muestra
aleatoria simple, puede calcularse mediante la siguiente fórmula:

݊ ൌ
ݖ

݌ݍ
ܤ


Donde:
n= Tamaño de la muestra,
z= 1.96 para el 95% de confianza, 2.56 para el 99%
p= Frecuencia esperada del factor a estudiar
q= 1- p
B= Precisión o error admitido
El valor de n obtenido por esta fórmula indica el tamaño de la muestra para una
población infinita, a efectos prácticos se considera población infinita cuando la
muestra supone menos del 5% de la población total.



EJEMPLO 1:

Supongamos que se desea realizar una encuesta sobre la brucelosis ovina. Se
estima una prevalencia del 15% y se requiere un 5% de precisión sobre una
población de 2.000.000 de cabezas. El nivel de confianza se fija en el 95%.

Formula:

݊ ൌ
ݖ

݌ݍ
ܤ



Datos:

Z= 1.96, p=0.15, q=0.85, B=0.05

݊ ൌ
ͳǤͻ͸

ȉ ͲǤͳͷ ȉ ͲǤͺͷ
ͲǤͲͷ



݊ ൌ
Ǥ ͶͺͻͺͲͶ
Ǥ ͲͲʹͷ
ൌ ͳͻ͸

׵ ݊ ൌ ͳͻ͸ ݈ܽ݊݅݉ܽ݁ݏ ݏ݈݁݁ܿܿ݅݋݊ܽ݀݋ݏ

EJEMPLO 2:

En un proyecto realizado en una determinada comunidad se ha calculado que
cerca del 30% (0,3) de los niños de la zona del proyecto padecen de malnutrición
crónica. Este dato se basa en estadísticas nacionales sobre malnutrición en las
zonas rurales. Si el nivel de confianza se fija en el 95%.

Formula:

݊ ൌ
ݖ

݌ݍ
ܤ



Datos:
Z= 1.96, p=0.30, q=0.70, B=0.05

݊ ൌ
ͳǤͻ͸

ȉ ͲǤ͵Ͳ ȉ ͲǤ͹Ͳ
ͲǤͲͷ



݊ ൌ
Ǥ ͺͲ͸͹͵͸
Ǥ ͲͲʹͷ
ൌ ͵ʹ͵

׵ ݊ ൌ ͵ʹ͵ ݊݅ñ݋ݏ ݏ݈݁݁ܿܿ݅݋݊ܽ݀݋ݏ

4.5 Intervalos de confianza para la media, con el uso de la distribución
Normal y la ³t´ student

Distribución normal
EJEMPLO 1:
Se encuentra que la concentración promedio de zinc que se saca del agua a partir
de la muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Encuentre el intervalo de confianza de 95% para la concentración media
de zinc en el rio. Suponga que la desviación estándar de la población es de 0.3

Datos:
ݔ ൌ ʹǤ͸
݊ ൌ ͵͸
Z = .90/2=.475=1.96
ߪ ൌ Ǥ͵

Formula:
ߤ ൌ ݔ േ
ݖ ߪ
ξ݊

ߤ ൌ ʹǤ͸ േ
ሺͳǤͻ͸ሻሺǤ ͵ሻ
ξ͵͸
ൌ ʹǤͷͲ ݕ ʹǤ͹Ͳ

EJEMPLO 2:

Una empresa eléctrica fabrica focos que tienen una duración aproximadamente
distribuida de forma normal con una distribución estándar de 40 horas. Si una
muestra de 30 focos tiene una duración promedio de 780 horas, encuentre un
intervalo de confianza de 96% para la media de la población de todos los focos
que produce esta empresa.

Datos:
ݔ ൌ ͹ͺͲ
݊ ൌ ͵Ͳ
Z = .96/2=.48=2.06
ߪ ൌ ͶͲ

FORMULA:
ߤ ൌ ݔ േ
ݖ ߪ
ξ݊

ߤ ൌ ͹ͺͲ േ
ሺʹǤͲ͸ሻሺͶͲሻ
ξ͵Ͳ
ൌ ͹͸ͷ ݕ ͹ͻͷ

³t´ student.
EJEMPLO 1:

Un fabricante de llantas desea investigar la durabilidad de sus productos. Una
muestra de 10 llantas para recorrer 50000 millas revelo una media muestral de
.32 pulgadas de cuerda restante con una desviación estándar de .09 pulgadas.
Constituya un intervalo de confianza de 95% para la media poblacional.
Datos:
݊ ൌ ͳͲ
ݔ ൌ Ǥ͵ʹ
ܵ ൌ ǤͲͻ
ן ൌ ͻͷΨ

Formula:
ߤ ൌ ݔ േ t ͳെן ʹ Τ ǡ n െ ͳ
ܵ
ξ݊

ߤ ൌ Ǥ͵ʹ േݐ ͳ െ Ǥͻͷ ʹ Τ ǡ ͳͲ െͳ
Ǥ Ͳͻ
ξͳͲ

ߤ ൌ Ǥ͵ʹ േݐǤ Ͳʹͷǡͻ
Ǥ Ͳͻ
ξͳͲ

ߤ ൌ Ǥ͵ʹ േݐʹǤʹ͸ʹ
Ǥ Ͳͻ
ξͳͲ

ߤ ൌ Ǥ͵ʹ േǤͲ͸Ͷ
ߤ ൌ ሺǤ ʹͷ͸ ǡ Ǥ͵ͺͶሻ

EJEMPLO 2:
El dueño de una tienda de abarrotes desea estimar la cantidad madia que gastan
los clientes que le consumen sus productos. Una muestra de 20 clientes revelo
que gastan $50, con una desviación estándar de 9.01. Determine un intervalo de
95% de confianza para la media poblacional.
Datos:
݊ ൌ ʹͲ
ݔ ൌ ͷͲ
ܵ ൌ ͻǤͲͳ
ן ൌ ͻͷΨ

Formula:
ߤ ൌ ݔ േ ݐ ͳെן ʹ Τ ǡ ݊ െͳ
ܵ
ξ݊

ߤ ൌ ͷͲ േ ݐ ͳ െǤͻͷ ʹ Τ ǡ ʹͲ െͳ
ͻǤͲͳ
ξʹͲ

ߤ ൌ ͷͲ േ ݐǤ Ͳʹͷǡͳͻ
ͻǤͲͳ
ξʹͲ

ߤ ൌ ͷͲ േ ݐʹǤͲͻ͵
ͻǤͲͳ
ξʹͲ

ߤ ൌ ͷͲ േ 4.22
ߤ ൌ ሺͶͷǤ͹ͺ ǡ ͷͶǤʹʹሻ

4.5.1 Determinación de la muestra con grado de confianza y estimación de ࣆ
Partiendo del primer ejemplo dado con la distribución ³z´ tenemos:
Datos:
ρ ൌ ʹǤ͸
݊ ൌ ͵͸
Z = .90/2=.475=1.96
ߪ ൌ Ǥ͵

Formula:

ܫܥ ൌ ߤ േ
ݖ ߪ
ξ݊

ܫܥ ൌ ʹǤ͸ േ
ሺͳǤͻ͸ሻሺǤ ͵ሻ
ξ͵͸
ൌ ʹǤͷͲ ݕ ʹǤ͹Ͳ

Para nuestro segundo ejemplo tomaremos los datos del ejemplo N°2 ³z´:


Datos:
ρ ൌ ͹ͺͲ
݊ ൌ ͵Ͳ
Z = .96/2=.48=2.06
ߪ ൌ ͶͲ

Formula:

ܫܥ ൌ ߤ േ
ݖ ߪ
ξ݊

ܫܥ ൌ ͹ͺͲ േ
ሺʹǤͲ͸ሻሺͶͲሻ
ξ͵Ͳ
ൌ ͹͸ͷ ݕ ͹ͻͷ


4.6 Intervalo de confianza para la diferencia entre dos medias ࣆ

െࣆ

con



࢟ ࣌





ൌ ࣌


pero conocidas, con el uso de la distribución normal y la
³t´ student

Si ݔҧ

y ݔҧ

son las medidas de muestras aleatorias independientes de tamaño ߤ

y
ߤ

tomadas de poblaciones normales que tienen las medidas ߤ

y ߤ

y la varianza
ߪ


y ߪ


, entonces ݔҧ

െ ݔҧ

es una variable aleatoria que tiene una distribución
normal con la media

ߤ
௫ҧ

ି௫ҧ

ൌ ߤ

െ ߤ



Y la varianza.
ߪ
௫ҧ

ି௫ҧ

















Se deduce que

ݖ ൌ
ሺݔҧ

െݔҧ

ሻ െ ሺߤ

െߤ



ߪ


݊


ߪ


݊




Tiene una distribución normal estándar. Sustituyendo esta expresión por z en:

ܲ ൬െݖ௔

൏ ݖ ൏ ݖ௔


൰ ൌ ͳ െܽ

El método de pivotes nos lleva a

ܲ ቎ሺ ݔҧ

െ ݔҧ

ሻ െ ݖ
௔Ȁଶ
ȉ ඨ
ߪ


݊


ߪ


݊

൏ ߤ

െߤ

൏ ሺݔҧ

െݔҧ

ሻ ൅ݖ
௔Ȁଶ
ȉ ඨ
ߪ


݊


ߪ


݊

ൌ ͳ െܽ቏

Y, por consiguiente, al siguiente intervalo de confianza de ߤ

െ ߤ

ǣ
(Intervalo de confianza para ߤ

െߤ

, ߪ

ݕ ߪ

conocidas). Si ݔҧ

ݕ ݔҧ

son valores de
las medias de muestra aleatorias independientes de tamaño ݊

ݕ ݊

tomadas de
poblaciones normales con las varianzas conocidas ߪ


ݕ ߪ


, un intervalo de
confianza del (1-w) 100% para ߤ

െ ߤ

esta dado por

ሺݔҧ

െ ݔҧ

ሻ െ ݖ
௔Ȁଶ
ȉ ඨ
ߪ


݊


ߪ


݊

൏ ߤ

െ ߤ

൏ ሺݔҧ

െ ݔҧ

൅ݖ
௔Ȁଶ
ȉ ඨ
ߪ


݊


ߪ


݊



Así mismo, en virtud del teorema del límite central, este resultado puede usarse
con muestras aleatorias independientes de poblaciones no normales con las
varianzas conocidas ߪ


ݕ ߪ


, siempre que ݊

ݕ ݊

sean lo suficientemente
grandes, esto es, cuando ݊

ݕ ݊

൒ ͵Ͳ


EJEMPLO 1:

Construya un intervalo de confianza del 94% de la diferencia real entre las
duraciones en promedio de dos tipos de focos eléctricos, dado que una muestra
tomada al azar de 40 focos de un tipo duro en promedio 418 horas de uso
continuo y 50 focos de otra clase duraron en promedio 402 horas. Las
desviaciones estándar de las poblaciones, según se sabe, son ߪ

ൌ ʹ͸ ݕ ߪ

ൌ ʹʹ.

Solución

Para w=0.06, tenemos a partir de la tabla III que ݖ
Ǥ଴ଷ
ൌ ͳǤͺͺǤ por lo tanto, el
intervalo de confianza del 94% de ߤ

െ ߤ

݁ݏ

ሺͶͳͺ െͶͲʹሻ െ ͳǤͺͺ

ʹ͸

ͶͲ

ʹʹ

ͷͲ
൏ ߤ

െ ߤ

൏ ሺͶͳͺ െͶͲʹ ൅ ͳǤͺͺ ȉ

ʹ͸

ͶͲ

ʹʹ

ͷͲ

Que se reduce a

͸Ǥ͵ ൏ ߤ

െߤ

൏ ʹͷǤ͹

Por lo tanto, tenemos el 94% de confianza en que el intervalo de 6.3 a 25.7
contiene la diferencia verdadera entre las duraciones en promedio de los dos tipos
de focos eléctricos. El hecho que ambos limites de confianza sean positivos
sugiere que, en promedio, el primes tipo de focos es superior al del segundo tipo.

EJEMPLO 2.

Construya un intervalo de confianza de 94% de la diferencia real entre las
duraciones en promedio de dos tipos de pilas, dado que una muestra tomada al
azar de 50 focos de un tipo duro en promedio 518 horas de uso continuo y 60
pilas de otra clase duraron en promedio 502. Las desviaciones estándar de las
poblaciones, según se sabe ߪ

ൌ ͵͸ ݕ ߪ

ൌ ͵ʹ

Solución:

Para w = 0.06, tenemos a partir de la tabla z=1.88. Por lo tanto, el intervalo de
confianza del 94 % de ߤ

െߤ

es:

ሺͷͳͺ െͷͲʹሻ െ ͳǤͺͺ ȉ

͵͸

ͷͲ

͵ʹ

͸Ͳ
൏ ߤ

െ ߤ

൏ ሺͷͳͺ െͷͲʹሻ ൅ ͳǤͺͺ ȉ

͵͸

ͷͲ

͵ʹ

͸Ͳ



Que se reduce a

Por lo tanto, tenemos el 94% de confianza en que el intervalo de 7.1 a 64.5 a
contiene la diferencia verdadera entre las duraciones en promedio de los dos tipos
de pilas. El hecho de que ambos límites de confianza sean positivos sugiere que,
en promedio la primera pila es superior al segundo tipo.

Con el fin de sustituir un intervalo de confianza del (1-w) 100% para ߤ

െ ߤ


cuando se desconoce ߪ

ݕ ߪ

pero ݊

ݕ ݊

൒ ͵Ͳ, sustituimos ߪ

ݕ ߪ

por los
valores de las desviaciones estándar de la muestra ݏ

ݕ ݏ

y continuamos como
antes. El procedimiento de estimaciones de la diferencia entre dos medias, cuando
se desconoce ߪ

ݕ ߪ

y los tamaños de la muestra son pequeños, no es directo a
monos que las desviaciones estándar desconocidas de las dos poblaciones
normales sean iguales. Si ߪ

ൌ ߪ

, entonces.

ݖ ൌ
ሺݔҧ

െݔҧ

ሻ െ ሺߤ

െߤ



ͳ
݊


ͳ
݊




Es una variable aleatoria que tiene una distribución normal estándar y ߪ

puede
obtenerse ponderando las desviaciones cuadradas (o elevadas al cuadrado) de
las medias de las dos muestras.

ݏ


ሺ݊

െͳሻݏ


൅ሺ݊

െ ͳሻݏ


݊

൅ ݊

െ ʹ


Es en realidad un estimador insesgado de ߪ

. Ahora bien, por los teoremas 8.10 y
8.8, las variables aleatorias independientes
ሺ௡

ିଵሻ௦




y
ሺ௡

ିଵሻ௦




tiene
distribuciones ji cuadradas con ݊

െͳ ݕ ݊

െ ͳ grados de libertad, y su sumas

ݕ ൌ
ሺ݊

െͳሻݏ


ߪ


ሺ݊

െͳሻݏ


ߪ


ሺ݊

൅ ݊

െʹͻሻݏ


ߪ



Tienen una distribución ji cuadrada con ݊

൅ ݊

െʹ grados de libertad. Como se
puede demostrar que las variables aleatorias anteriores ³z´ y ³y´ son
independientes, se deduce del teorema 8.11 que:

࢚ ൌ





൅ ࢔

െ ૛



ሺݔҧ

െݔҧ

ሻ െ ሺߤ

െߤ
ଶሻ

ͳ
݊




ͳ
݊



Tiene una distribución t con ݊

൅ ݊

െ ʹ grados de libertad. Al sustituir esta
expresión por t en:

ܲ ൬െݐ௔

ǡ௡
భశ


ିଶ
൏ ݐ ൏ ݐ ௔
ଶ ǡ௡

ା௡
మషమ
൰ ൌ ͳ െ w

Y simplificándolo algebraicamente el resultado. Llegamos al siguiente intervalo de
confianza del (1-w) 100% para ߤ

െ ߤ

ǣ

4.7 Una sola muestra: estimación de la proporción

La información de que suele disponerse al estimar una proporción es el número de
veces, x, que un evento considerado ocurre en n ensayos, ocasiones y
observaciones. La intimación puntual misma suele ser la proporción muestral


ǡ es
decir, la proporción de las veces que el evento ocurrió en realidad. Si los n
ensayos satisfacen las condiciones fundamentales de la distribución binomial
citadas en la página 94, sabemos que la media y la desviación estándar del
número de éxitos están dadas por np y por ඥ݊݌ሺͳ െ ݌ሻǤ Si dividimos ambas
cantidades entre n, encontraremos que la media y la desviación estándar de la
proporción de éxitos (es decir, de la proporción muestral) están dadas por.
௡௣

ൌ ݌ y
ඥ௡௣ሺଵି௣ሻ

ൌ ට
௣ሺଵି௣ሻ


El primero de estos resultados señala que la proporción muestral es un estimador
insesgado del parámetro binomial p, es decir, de la proporción real que deseamos
estimar a partir de una muestra.
Dado que los cálculos necesarios de complican, haremos una aproximación más
al sustituir


por p en ඥ݊݌ሺͳ െ݌ሻ. Esto produce
ݔ
݊
െ ݖ
ఈȀଶ

ݔ
݊
ሺͳ െ
ݔ
݊

݊
൏ ݌ ൏
ݔ
݊
൅ ݖ
ఈȀଶ


ݔ
݊
ሺͳ െ
ݔ
݊

݊

Donde el nivel de confianza es de (1 - a) 100%.
Ejemplo 1:
Si x = 36 de n = 100 entrevistados están familiarizados con los incentivos en los
impuestos que se ofrecen por instalar ciertos dispositivos para ahorrar energía,
constrúyase un intervalo con un nivel de confianza del 95% para la
correspondiente proporción real.
Solución:
Sustituyendo



ଷ଺
ଵ଴଴
ൌ ͲǤ͵͸ ݕ ݖ
ఈȀଶ
ൌ ͳǤͻ͸ en la fórmula anterior, se obtiene
ͲǤ͵͸ െ ͳͻ͸ට
ሺ଴Ǥଷ଺ሻሺ଴Ǥ଺ସሻ
ଵ଴଴
< p < ͲǤ͵͸ ൅ͳͻ͸ට
ሺ଴Ǥଷ଺ሻሺ଴Ǥ଺ସሻ
ଵ଴଴

O bien
ͲǤʹ͸͸ ൏ ݌ ൏ ͲǤͶͷͶ
Tenemos el 95% de confianza de que p puede en el intervalo de 0.266 o 0.454.
Nótese que, de habernos valido de la tabla 9ª), habríamos obtenido
ͲǤʹ͹ ൏ ݌ ൏ ͲǤͶ͸
La magnitud de error cometido cuando usamos


como una estimación de p está
dada por ቚ


െ ݌ቚ. Empleando nuevamente la distribución normal, podemos
asegurar con una probabilidad de 1 ± a que la desigualdad.

ݔ
݊
െ ݌ቚ ൑ ݖ
ఈȀଶ

݌ሺͳ െ ݌ሻ
݊

Se cumplirá, es decir, que el error será lo mismo de ݖ
ఈȀଶ

௣ሺଵି௣ሻ

. Con


sustituido
por p, esto produce
Error máximo de Estimación ܧ ൌ ܼ
ఈȀଶ



ሺଵି





Ejemplo 2:
En una encuesta en una gran ciudad, 136 de 400 personas respondieron
afirmativamente a la pregunta de si el servicio de transporte público es adecuado.
Con una confianza del 99%, ¿qué se puede decir acerca del error máximo, si



ଵଷଽ
ସ଴଴
ൌ ͲǤ͵Ͷ se emplea como una estimación de la correspondiente proporcional
real?
Solución
Sustituyendo



ଵଷ଺
ସ଴଴
ൌ ͲǤ͵Ͷ y ݖ
ఈȀଶ
ൌ ʹǤͷ͹ͷ en la fórmula anterior, se tiene que el
error es a lo sumo
ܧ ൌ ʹǤͷ͹ͷ

ሺͲǤ͵ͶሻሺͲǤ͸͸ሻ
ͶͲͲ
ൌ ͲǤͲ͸ͳ
La fórmula anterior de R puede utilizarse también para determinar el tamaño
muestral que es necesario para alcanzar un grado deseado de precisión.
Despejando n, obtenemos
݊ ൌ ݌ሺͳ െ ݌ሻ ൤
ܼ
ఈȀଶ
ܧ



Pero esta fórmula no puede utilizarse como se estableció, a menos de que
tengamos alguna información acerca de la posible magnitud de p (con base en
datos auxiliares; digamos, una muestra previa). Si no se dispone de tal
información, podemos valernos del hecho de que ݌ሺͳ െ ݌ሻ es a lo sumo


ǡ
correspondiente a ݌ ൌ


ǡ como puede mostrarse con métodos de cálculo
elemental. Por tanto, si
݊ ൌ
ͳ
Ͷ

ܼ
ఈȀଶ
ܧ



Podemos asegurar con una probabilidad al menos de ͳ െߙ que el error al
servirnos de


como una estimación de p no excede a E; una vez obtenidos los
datos, podremos asegurar con una confianza al menos de ͳ െ ߙ que el error no
sobrepasa E.
4.8 Tamaño de la muestra con una estimación de P y un grado de confianza
ሺ૚ െזሻ૚૙૙ Ψ

Donde ݖ
௔Ȁଶ
es el valor z que corresponde a un área w/2 en el extremo derecho de
una distribución normal estándar z. puesto que se desconocen los valores de p y
q, se estiman por medio de los mejores estimadores puntuales:݌ ෝ ݕ ݍො .se considera
que el tamaño de la muestra es grande cuando es adecuada la aproximación
normal a la distribución binomial; a saber, cuando ݊݌Ƹ ൐ ͷ ݕ ݊ݍො ൐ ͷ.

݌Ƹ േ ݖ
௔Ȁଶ

݌ݍ
݊


EJEMPLO 1:

Una muestra aleatoria de 985 votantes ³probables´ ± aquellos que votarían en las
próximas elecciones²fue encuestada un ³fonatón o encuesta telefónica´ dirigido
por el partido republicano. De los encuestados, 592 indicaron que piensan votar
por el candidato republicano en la próxima elección. Construya un intervalo de
confianza de 90% para ݌, la proporción de votantes probables en la población, que
piensa votar por el candidato republicano. Con base en esta información,
¿concluirá que el candidato ganara la elección?
Solución: la estimación puntual para ݌es entonces

݌Ƹ ൌ
ݔ
݊

ͷͻʹ
ͻͺͷ
ൌ Ǥ͸Ͳͳ

Y el error estándar es:


݌Ƹ ݍො
݊


ሺǤ ͸ͲͳሻሺǤ͵ͻͻሻ
ͻͺͷ
ൌ ǤͲͳ͸

El valor de ݖ para un intervalo de confianza de 90% es el valor que tiene el área
w/2 =.05 en el extremo superior de la distribución de ݖ ݋ ܾ݅݁݊ ݖ
Ǥ଴ହ
= 1.645 de la
tabla. El intervalo de confianza de 90% para p es entonces.

݌Ƹ േ ͳǤ͸Ͷͷ

݌Ƹ ݍො
ʹ

Ǥ ͸Ͳͳ േǤͲʹ͸

O Ǥ ͷ͹ͷ ൏ ݌ ൏ Ǥ͸ʹ͹. Usted estima que el porcentaje de votantes probables del
candidato republicano está entre 57.5 y 62.7%. ¿El candidato ganara la elección?
Si se supone que necesita más de 50% de los votas para ganar, y puesto que los
limites de confianza superior e inferior excede este valor mínimo podría decir que
tiene 90% de confianza de que ganara el candidato.

EJEMPLO 2:

Una muestra aleatoria de 999 votantes ³probables´ aquellos que votarían en
próximas elecciones que se van a realizar en el Tecnológico de Estudios
Superiores del Oriente del Estado de México de la Licenciatura en Contaduría
Pública con motivo del día del contador para elegir a su nueva jefa de carrera
fueron encuestadas durante dos días por el grupo 4C11. De los encuestados, 659
indicaron que piensan votar por la jefa de carrera actual en las próximas
elecciones. Construya un intervalo de confianza de 90% para p, la proporción de
votantes probables en la población, que piensa votar por la jefa de carrera actual.
Con base en esta información. ¿Concluirá que la jefa de carrera ganará la
elección?

Solución: La estimación para p es:

݌Ƹ ൌ
଺ହଽ
ଽଽଽ
ൌ Ǥ͸ͷͻ 1-.659= .341

Y el error estándar es:


݌Ƹ ݍො
݊


ሺǤ ͸ͷͻሻሺǤ ͵Ͷͳሻ
ͻͻͻ
ൌ ǤͲͳͷ

El valor z para un intervalo de confianza de 90% es el valor que tiene el ares
w/2=.05 en el extremo superior de la distribución de z, o bien ݖ
Ǥ଴ହ
ൌ ͳǤ͸Ͷͷ de la
tabla. El intervalo de confianza para p es entonces.

݌ ෝ േ ͳǤ͸Ͷͷ

݌Ƹ ݍො
݊

ͳǤ͸Ͷͷ ȉ ǤͲͳͷ ൌ ǤͲʹͷ
Ǥ ͸ͷͻ േǤͲʹͷ
Ǥ ͸ͷͻ ൅ǤͲʹͷ ൌ Ǥ͸ͺͶ
Ǥ ͸ͷͻ െǤͲʹͷ ൌ Ǥ͸͵Ͷ
O Ǥ ͸͵Ͷ ൏ ݌ ൏ Ǥ͸ͺͶǤ usted estima que el porcentaje de votantes probables del la
jefa de carrera está entre 63.4 y 68.4% la jefa de carrera actual será la ganadora.



























BIBLIOGRAFIA

Estadística para administración y economía
David R. Anderson, Dennis J. Sweeney y Thomas A. Williams
Editorial International Thomson Learning
225-227 páginas

Método estadístico aplicado a las ciencias sociales
Gene V. Glas, Julián C. Stanley
Editorial Pretice Hall
Página 243

Estadísticas matemáticas con aplicaciones
John E. Freund, Ronald E. Walpole
Editorial Prendicehall Hispoamericana S.A
380-385 páginas


Técnicas de muestreo
William G. Cochran
Editorial continental S.A
Página 149

Probabilidades y aprobaciones y estadísticas
Paul L. Meyer
Editorial: Addison Wesley Iberoamericana
Página 316

Métodos estadísticos
Said Infante G.I Guillermo P. Zarate de Lara
Editorial Trillas
335-337 páginas

Probabilidad y estadísticas para ingenieros
Irwin R. Miller/ John E. Freund
Editorial Prentice-Hall Hispoamericana S.A
273-277 páginas

Introducción a la probabilidad y estadísticas
William Mendenhall, Robert J.Beaver, Barbara M. Beaver
Editorial Thomson
308-311 Páginas

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->