Está en la página 1de 30

Probabilidad y Estadística Módulo 8

MÓDULO 8

ESTIMACIÓN

Mg. Adriana Noelia Poco

Lic. Stella Maris Farías


Ciclo lectivo 2014

1
Probabilidad y Estadística Módulo 8

Í NDI CE

ESTIMACIÓN DE PARÁMETROS ............................................................................................. 3


ESTIMACIÓN PUNTUAL........................................................................................................... 4
PROPIEDADES ........................................................................................................................... 5
ESTIMACIÓN POR INTERVALOS DE CONFIANZA ............................................................... 8
INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL µ X .............................. 11
Caso 1: Población con distribución normal, con σ X conocida y cualquier tamaño de la
muestra: .......................................................................................................................... 11
ACTIVIDAD 1 .................................................................................................................. 15
Caso 2: Población con distribución normal, con σ X desconocida y tamaño de la
muestra n ≥ 30 ................................................................................................................ 15
ACTIVIDAD 2 .................................................................................................................. 17
Caso 3: Población con distribución normal, con σ X desconocida y tamaño de la
muestra n < 30 ............................................................................................................... 17
ACTIVIDAD 3 .................................................................................................................. 19
Caso 4: Población con distribución no normal o desconocida, con σ X conocida y
tamaño de la muestra n ≥ 30 .......................................................................................... 20
ACTIVIDAD 4 .................................................................................................................. 20
Caso 5: Población con distribución no normal o desconocida, con σ X conocida y
tamaño de la muestra n < 30 .......................................................................................... 21
ACTIVIDAD 5 .................................................................................................................. 23
Caso 6: Población con distribución no normal o desconocida, con σ X desconocida y
tamaño de la muestra n ≥ 30 .......................................................................................... 24
ACTIVIDAD 6 .................................................................................................................. 25
Caso 7: Población con distribución no normal o desconocida, con σ X desconocida y
tamaño de la muestra n < 30 .......................................................................................... 25
Diagrama de decisión ...................................................................................................... 26
2
INTERVALO DE CONFIANZA PARA LA VARIANZA σX .................................................. 27
ACTIVIDAD 7 .................................................................................................................. 28
Respuestas a ejercicios ........................................................................................................ 29

2
Probabilidad y Estadística Módulo 8

ESTIMACIÓN DE PARÁMETROS

La compañía Max – Paint, exportadora de pinturas para el mundo debe someterse a


un control de calidad para que sus productos certifiquen normas ISO. El mercado
externo es muy estricto al respecto, exigiendo dicha certificación para cualquier
transacción comercial. Con el fin de obtener el certificado requerido, se realizará una
auditoría en su planta, en la cual se incluye la verificación del producto final.
Uno de los ítems a evaluar es el contenido de las latas de pintura de 4 litros, las que
serán aceptadas como conforme si contiene 4±0,10 litros. Según la historia del
proceso, el jefe de producción conoce que la desviación estándar del cada lote
semanal es de 0,08 litros.
Para la valoración del lote se toma una muestra aleatoria de 50 latas fabricadas en una
semana cualquiera y se mide su contenido, obteniéndose que la cantidad promedio de
pintura para este tipo de baldes es de 3,992 litros.
¿Certificará o no normas de calidad esta línea de pinturas, si se pretende un nivel de
significación del 5%?

Un problema como el planteado anteriormente nos motiva a realizar un estudio sobre


muestra y extender conclusiones a todo un lote, o sea a toda una población. Estamos aquí frente a
un nuevo aspecto de la Teoría Estadística, lo que no sólo exige conocimientos de Estadística
Descriptiva, sino también un buen manejo del Cálculo de Probabilidades.
La teoría clásica de la Inferencia Estadística trata de los métodos por los cuales se selecciona
una muestra de una población y basándose en las pruebas de la muestra se propone:
1) Estimar el valor de un parámetro desconocido.
2) Estimar si el parámetro es o no igual a cierto valor preconcebido.

El primer método se denomina estimación de un parámetro y el segundo se llama prueba


de una hipótesis acerca de un parámetro.

Los problemas que trata la Estadística Inferencial se dividen en problemas de contrastación


de hipótesis y problemas de estimación. La similitud entre dichos problemas es que ambos
investigan sobre un determinado valor de un parámetro tomando como base información muestral.
En la prueba de hipótesis, sin embargo, es necesario tener una idea previa del valor del
parámetro cuya veracidad o falsedad se va a discutir. No ocurre lo mismo en los problemas de
estimación, pues no se tiene una idea previa del valor a estudiar.

La teoría de la estimación puede dividirse, a su vez, en dos grandes ramas, la estimación


puntual y la estimación por intervalos de confianza.
Dentro del primer caso, la estimación de un parámetro puede tener por resultado un solo
punto y permite calcular un valor que represente el mejor pronóstico del valor del parámetro,
usando para ello información a priori y una muestra representativa de la población cuyo parámetro
se desea estimar.

3
Probabilidad y Estadística Módulo 8

En una estimación por intervalo de confianza, lo que se halla es un intervalo dentro del cual
exista cierta posibilidad de encontrar al parámetro estudiado.
La estimación por intervalos de confianza usa los datos de una muestra para establecer dos
límites que pretenden encerrar al verdadero valor del parámetro estimado con cierto grado de
confianza o seguridad.

Para interpretar claramente el concepto de estimador basaremos el estudio en un ejemplo


previo.
Supongamos que nos interesa conocer el ingreso promedio y la desviación estándar de todas
las personas que han comprado una marca determinada de automóvil en el presente año, en nuestro
país. Por razones de tiempo y costo, y tal vez por ser imposible conocer cuales son todos los
propietarios de ese tipo de automóvil, no podemos trabajar con la población.
Al no poder tener todos los datos de la población (realizar un censo) no podemos conocer las
constantes que la caracterizan, es decir, los parámetros poblacionales. Debemos extraer de dicha
población de N elementos una muestra de n ejemplares, siendo n < N.
Una vez realizado el muestreo podemos analizar los estadísticos de esta muestra que nos
interesan, es decir, el ingreso promedio y la desviación estándar muestral. A estas características
de la muestra las denominamos estimadores.
Teniendo en cuenta que el estimador es una característica de una muestra, su valor varía de
una muestra a otra, y por lo tanto, no es una constante; sino una variable aleatoria.
Al ser una variable aleatoria, tendrá asociada una distribución, una media, un desvío, etc.

Gráficamente:

Población
Muestra
N elementos
n elementos
Parámetros
Estimadores

µ X ;σ X ; σ X2
X ; s ; s2

ESTIMACIÓN PUNTUAL
Si a partir de las observaciones de una muestra se calcula un solo valor como estimación del
parámetro de población desconocido, estamos frente a una estimación puntual.
El estadístico que se usa para obtener una estimación puntual se llama estimador.
Para poder usar la información que se tenga de la mejor manera posible se necesita que los
estimadores cumplan con, al menos una de las propiedades que se detallarán más adelante.

4
Probabilidad y Estadística Módulo 8

Antes de analizar las propiedades mencionadas aclararemos algunos conceptos como:

• ERROR MUESTRAL: El error muestral es la diferencia que existe entre el valor del
estimador y el parámetro que intenta estimar. Este error se caracteriza por variar de una
muestra a otra.

• SESGO: El sesgo de un estimador es la diferencia entre la esperanza del estimador y


el valor del parámetro.

PROPIEDADES

1) Insesgabilidad: θɵ , estimador de θ es una VA que tiene su propia distribución de


probabilidad y por lo tanto su esperanza y su varianza, por lo que se puede definir:

“Si se usa un estadístico muestral θɵ para estimar el parámetro poblacional θ , se dice que
θɵ es un estimador insesgado θ , si la esperanza matemática de θɵ coincide con el parámetro θ
que se desea estimar”.

θ̂ es insesgado ⇔ E θɵ = θ ()
O sea que es de esperar que si se toman muchas muestras de igual tamaño y si de cada una se
obtiene un valor θɵ , la media de todos los valores de θɵ ha de estar muy cerca de θ .
Ejemplo:
a) La media muestral es un estimador insesgado de la media poblacional, o sea E ( X ) = µ X
o también µ X = µ X , según lo que hemos estudiado en la página 4 del módulo anterior.

b) La varianza muestral es un estimador insesgado de la varianza poblacional si se define a


2 2 n
la varianza muestral con la corrección: ŝ = s .
n −1
n 2
∑( Xi − X )
2
Siendo ŝ = i =1 la varianza muestral corregida.
n −1
Entonces: E ŝ ( )= σ2
X y ŝ2 2
es un estimador insesgado de σ X .

2) Eficiencia: Si se usan dos o más estimadores para un mismo parámetro, aquel cuya
distribución muestral tenga la menor varianza es un estimador más eficiente o eficaz.

Es decir: θɵ = es eficiente ⇔ σ θ2ɵ es mínima

5
Probabilidad y Estadística Módulo 8
Luego si tenemos dos estimadores θɵ 1 y θɵ 2 de un mismo parámetro θ , hallamos la razón
σ θ2ɵ
K = 1
Si K > 1 el estimador del denominador es el mejor.
2
σ θɵ
2
Si K < 1 el estimador del numerador es el mejor.
Si K = 1 Ambos son igualmente eficientes. Y podemos usar cualquiera de los dos
indistintamente.

Ejemplo:

En nuestra población 2 4 6 8

Seleccionamos una muestra de tres elementos: 2 4 8


Hallamos: X = 4 ,667 y la mediana Me = 4
Siendo
2
σX =
( 2 − 4 ,667 )2 + ( 4 − 4 , 667 )2 + (8 − 4 , 667 )2 = 6 , 22
3
2 2 2
2 (2 − 4) + ( 4 − 4 ) + (8 − 4 )
σ Me = = 6 , 667
3
2 2
Como σ X < σ Me la media aritmética es un estimador más eficiente que la mediana
muestral para estimar a la media poblacional µ X .

3) Consistencia : Si θɵ es un estimador muestral calculado a partir de una muestra de


tamaño n y si θ es el parámetro de la población que se desea estimar, entonces θɵ es un
estimador consistente de θ , si la probabilidad de que el valor absoluto de la diferencia
entre θɵ y su verdadero valor sea menor que e (error admitido) tienda a uno cuando el
número de elementos de la muestra tienda a infinito.

P  θɵ − θ < e  →1 si n → ∞
 

4) Suficiencia: un estimador suficiente del parámetro θ es aquel que agota toda la


información disponible. Por ejemplo si se toma una muestra de n = 30 valores con el fin
de estimar µ X . Puede utilizarse como estimadores la primera, la 15º o la última
observación o el promedio entre la primera y la quinta observación. Estos estimadores
no son estimadores suficientes porque no contienen toda la información disponible de la
muestra. La media X calculada con las 30 observaciones sí lo es, pues tiene en cuenta
todas las observaciones.
El rango, por ejemplo, no es un estimador suficiente de la dispersión pues solo tiene en
cuenta la primera y la última medición, desperdiciando el resto de la información.

6
Probabilidad y Estadística Módulo 8

En definitiva, por ejemplo, la media aritmética muestral y la forma corregida de la varianza


muestral son estadísticos que satisfacen las propiedades de los buenos estimadores.

Ejemplo:

Se ha seleccionado una muestra de 25 deportistas entre 20 y 40 años midiendo la absorción


máxima de oxígeno en cm3, los resultados son:

2676 2721 2750 2780 2794 2801 2852 2894 2906 2958 3002 2936
3001 2962 2976 2899 3010 3028 3056 3110 3118 3126 3148 3246
3316

Estadística descriptiva: datos obtenidos con el software Statistic


N MEAN SD muestral
25 2962.6 161.91
MINIMUM MAXIMUM
2676.0 3316.0

La distribución responde aproximadamente a


una ley normal.

La X = 2962, 6 estima a la media poblacional y


2
la s 2
=
∑( Xi − X )
= 26214.84 estima a la varianza poblacional.
n −1

Razonemos un poco ¿???!!!!!

Según analizamos en primer lugar la primera propiedad de un buen estimador es la


“Insesgabilidad”. ¿Puede Ud. comprobarla en la siguiente propuesta?
“Una empresa exportadora requiere personal especializado en Inglés técnico y evalúa a 4
postulantes. El test consiste en realizar una traducción e interpretación de un texto, en el cuál se
contaron posteriormente los errores cometidos, y los resultados se volcaron en la siguiente tabla,
donde cada postulante es identificado con una letra:
Postulante Número de errores
A 3
B 2
C 1
D 4

7
Probabilidad y Estadística Módulo 8

Muestre mediante un gráfico la distribución de la población y halle su media y su desviación


estándar.
Si seleccionamos muestras de dos postulantes con reemplazo de la población anterior,
¿puede Ud. confeccionar una tabla de todas las muestras posibles?
Efectúe el mismo trabajo pero efectuando el muestreo sin reemplazo.

ESTIMACIÓN POR INTERVALOS DE CONFIANZA


Hasta ahora hemos estudiado el caso correspondiente a la estimación puntual, es decir
estimar un parámetro a través de un único valor. Esta forma de estimar no es la óptima pues con
ella no se puede determinar el error de muestreo, ni la precisión de la estimación, ni la confianza
que merece tal estimación.
Comencemos a adquirir conocimientos básicos sobre la estimación por intervalos de
confianza estudiando un problema en el que se realiza un muestreo con reposición de una
población con distribución normal, cuya media es µ X y su desvío estándar σ X . Según vimos, la
distribución de muestreo de la media también tendrá una distribución normal para cualquier
σ
tamaño n de la muestra, con media µ X = µ X y error estándar de la media σ X = X .
n
Ejemplo:
Una máquina empacadora que llena cajas de arroz responde a una distribución normal con
media 468 g. Según datos históricos del proceso la desviación estándar de población es de 15 g.
Si se selecciona al azar una muestra de 20 cajas de las miles que se rellenan en un día, y se
calcula el peso promedio para esta 468g, 300 g o 465 g? ¿Cuál de estos valores estará más
próximo al verdadero valor del peso medio poblacional?
La muestra actúa como una representación en miniatura de la población y, por lo tanto, su
media muestral tiene una gran posibilidad de estar cerca de 468 g. Podría pensarse que 468 g o
465 g serían medias muestrales que permiten hacer inferencias correctas; mientras que 300 g nos
llevarían a predecir un valor muy lejano del verdadero que, para este ejemplo, se sabe que es de
468 g.
¿Cómo podemos determinar la probabilidad de que dicha media esté entre 465 y 468 g?

(
La probabilidad pedida es: P 465 ≤ X ≤ 468 )
X − µX X − µX 465 − 468
Si estandarizamos la variable resulta: Z = = = = −0, 8944
σX σX 15
n 20

(
P 465 ≤ X ≤ 468 ) = P ( −0, 8944 ≤ Z ≤ 0 ) = 0, 5 − ( 1 − 0, 8133 ) = 0, 3133

Esto indica que aproximadamente el 31% de todas las muestras de tamaño 20 tendrían una
media muestral entre 465 y 468 g.

8
Probabilidad y Estadística Módulo 8

¿Qué sucede si cambiamos el tamaño de la muestra a 100 cajas?

X − µX X − µX 465 − 468
Z = = = = −2
σX σX 15
n 100
(
P 465 ≤ X ≤ 468 ) = P ( −2 ≤ Z ≤ 0 ) = 0, 9772 − 0, 5 = 0, 4772
Por lo tanto se esperaría que el 48% de las muestras de 100 cajas cada una, tendrán peso
medio entre 465 y 468 g.
Si observa que aumentado el tamaño de la muestra el porcentaje de muestras que está
contenido en el intervalo dado es mayor. Se podría continuar de esta forma hasta lograr una
probabilidad mayor, o sea un nivel mayor de certeza.
Como este proceso resulta muy tedioso, en vez de hallar el porcentaje de medias muestrales
que se espera estén dentro de cierto intervalo conocido, se puede determinar el intervalo en el cuál
estarían contenidas un porcentaje fijo de medias muestrales.
• Primer problema: conocemos el intervalo → hallamos el % de medias que están
contenidas en él.
• Segundo problema: conocemos el % → hallamos el intervalo en el cuál está contenido
ese porcentaje.
Supongamos que se desea saber en qué intervalo estarán contenidas el 95% de las medias
muestrales que se obtienen a partir de muestras de tamaño 20.
Dicho 95% podría dividirse en dos partes iguales, la mitad a la derecha de la media y el resto
a su izquierda, por lo que el área contenida debajo de la curva normal a cada lado de 468 es de
0,475.

(
P Xi ≤ X ≤ Xd ) = P( Z i ≤ Z ≤ Zd )
Xd − µX σX
Zd = Z = ⇒ Xd = µX + Z .
σX n
n
Donde µ X = 468 , σ X = 15 , n = 20 y el valor de Z, de tabla es de 1,96.

σX 15
Xi = µX − Z . = 468 − 1, 96 . = 461, 43
n 20
σX 15
Xd = µX − Z . = 468 + 1, 96 . = 474, 57
n 20
La conclusión es que el 95 % de todas las medias muestrales, basadas en muestras de 20
cajas tendrán un peso promedio entre 461,43 y 474,57 gramos.

9
Probabilidad y Estadística Módulo 8

Una estimación por intervalo de un parámetro poblacional θ significa hallar un intervalo de


la forma θɵ i < θ < θɵ d donde θɵ i y θɵ d dependen del valor del estimador θɵ para una muestra en
particular y también de la distribución muestral de θɵ .
Cuanto mayor es el tamaño de la muestra la varianza de la variable media muestral
 2 σ2 
 σ X = X  disminuye y por consiguiente la estimación se acercará más al parámetro µ X , lo
 n 

que implica obtener un intervalo más pequeño.
Así el intervalo de estimación indica por su longitud la precisión de la estimación puntual.

Como al tomar muestras distintas se obtienen distintos valores de θɵ y, por lo tanto, se tienen
distintos valores de θɵ i y θɵ , los puntos extremos del intervalo son nuevas variables
d
aleatorias. A partir de la distribución muestral de θɵ será posible determinar los valores de θɵ i y
θɵ d (
tales que P θɵ < θ < θɵ
i d )sea igual a un valor racional positivo que se desee especificar.

Si, por ejemplo, se encuentran θɵ i ( )


y θɵ d , tales que: P θɵ i < θ < θɵ d = 1 − α para
0 < α < 1 , entonces se obtiene una probabilidad de 1− α de seleccionar una muestra aleatoria que
produzca un intervalo que contenga a θ . El intervalo θɵ i < θ < θɵ d , que se calcula a partir de la
muestra seleccionada se llama intervalo de confianza del 1− α %., la fracción 1− α se llama
coeficiente de confianza o grado de confianza y los parámetros θɵ i y θɵ , se denominan límites
d
de confianza inferior y superior.

Si se elige α = 0 ,05 se tiene un intervalo de confianza del 95% y si se selecciona α = 0 ,01


se tiene un intervalo más amplio del 99%. En el primer caso decimos que la probabilidad de que el
intervalo contenga al verdadero valor del parámetro es de 95% y en el segundo del 99%. Cuanto
mayor es la amplitud del intervalo de confianza se tienen más seguridad de que contiene al
parámetro desconocido. Por otro lado, cuanto mayor es la amplitud se pierde precisión, pues es
mejor estimar con un 95% de confianza que la vida útil de un componente de un aparato
electrónico está entre 6 y 7 años, que asegurar con un 99% de confianza que está entre 3 y 10 años.
Podemos interpretar que 1 significa certeza o seguridad y α significa riesgo; la seguridad
menos el riesgo, o sea 1− α nos da, por lo tanto, el coeficiente de confianza de nuestras
afirmaciones.
Al replicar un gran número de veces el muestreo, en el primer caso, tenderemos una
confianza de que 95 de cada 100 intervalos que extraemos del muestreo, contendrán el verdadero
valor del parámetro. Pero una vez calculado el intervalo, es decir hallados numéricamente los
extremos, ya no podemos hablar en términos probabilísticos ni de confiabilidad, pues la situación
pasa a ser determinística. Es decir que una vez conocido el intervalo de confianza sólo puede
suceder que el parámetro esté o no contenido en dicho intervalo y no existe otra opción.

10
Probabilidad y Estadística Módulo 8

En el caso de las estimaciones por intervalos de confianza, se trabaja también con


estimadores puntuales, es decir que en este aspecto, tanto la estimación puntual como la
estimación por intervalos, se relacionan. Por ejemplo el estimador X es un buen estimador
puntual de µ X y además el estimador del intervalo de confianza de µ X depende del
conocimiento que se tenga de la distribución muestral de X .

En general los pasos a seguir para estimar un parámetro son:


1) Fijar el coeficiente de confianza que se desea en la estimación.
2) Extraer la muestra y calcular de ella, el o los estadísticos necesarios.
3) Determinar la distribución en el muestreo que tiene el estadístico empleado, una vez
tipificado.

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL µ X

Caso 1: Población con distribución normal, con σ X conocida y cualquier


tamaño de la muestra:

Si la muestra se selecciona de una población infinita con distribución normal, con


desviación estándar conocida, se puede establecer un intervalo de confianza de µ X , cuyo valor se
desconoce, considerando la distribución muestral de X . Según el teorema del límite central, es de
esperar que la distribución muestral de X sea aproximadamente normal con media µ X = µ X y
σ
desviación típica σ X = X .
n
Si se considera el área central de la figura 1− α %, como nivel de confianza, resulta un nivel
de riesgo α % que se reparte en mitades en las colas de la distribución.

11
Probabilidad y Estadística Módulo 8

Por lo tanto:
X − µX
( )
P − z α 2 < Z < z α 2 = 1 − α donde Z =
σX
n
El intervalo de confianza de µ X conociendo σ X , si X es la media de una muestra
aleatoria de tamaño n de la población, para un nivel de confianza de (1 − α ) % es:

σ σ
X − z α 2 . X ≤ µX ≤ X + z α 2 . X
n n

donde z α 2 es el valor de z a la derecha del cual se tiene un área de α %.


2

Los valores de los límites de confianza son:

σ σ
θɵ i = X − z α 2 . X y θɵ d = X + z α 2 . X
n n
 σ σ 
O sea que: P  X − z α 2 . X ≤ µ X ≤ X + z α 2 . X  = 1− α
 n n

Ejemplo:

Un grupo de investigadores en medicina desea estimar el cambio en la presión sanguínea


por paciente de un sanatorio. Se ha seleccionado una muestra al azar de 30 pacientes y se halló que
la media es de 5 pulsaciones/seg.. Los investigadores saben que la σ X de los cambios de presión
para todos los pacientes es de 3 puls / seg. Según estudios anteriores. Ellos desean investigar el
cambio medio en la presión sanguínea con un intervalo de confianza del 95%, suponiendo que la
variable aleatoria "cambios de presión sanguínea” tienen una distribución normal.

X : cambio de presión sanguínea por paciente.


n = 30 X =5 σX =3 1 − α = 0,95 Z 0 ,025 = 1, 96
σ 3
θɵ i = X − z α 2 . X = 5 − 1,96 . ≃ 3, 9
n 30 Intervalo de confianza [3,9 ; 6 ,1]
σ 3
θɵ d = X + z α 2 . X = 5 + 1,96 . ≃ 6 ,1
n 30
Nota:

Si deseamos determinar el tamaño óptimo de la muestra a sacar de la población, vamos a


extraer el radio del entorno que se genera al hallar el intervalo de confianza. Dicho radio es:
σ
zα 2 . X
n

12
Probabilidad y Estadística Módulo 8

A la expresión anterior la llamamos error máximo admitido y la denotamos con e; o sea:


σ
e= z α 2 . X
n
y la misma indica la precisión de la estimación, por lo que se pretende tenga un valor lo más
pequeño posible.

Según definimos el valor (1 − α ) es el coeficiente de confianza y, por ello deseamos que sea
lo mayor posible, pero si lo aumentamos hace que crezca el valor de z α 2 y así crece el error
cometido.
3
En nuestro ejemplo e = 1, 96 = 1, 073 puls / seg. para un nivel de confianza del 95%.
30
Si deseamos un nivel del 99% será:
3
Z 0 ,005 = 2 , 575 y el error valdrá e = 2,575 = 1, 41 puls / seg.
30
Si queremos elevar el nivel de confianza pero sin aumentar el error de estimación debemos
hallar el tamaño de la muestra óptima despejando de la expresión anterior el valor de n.
zα .σ X zα 2 .σ2
X
n= 2 o también: n = 2
e 2
e
2
( 2,575 ) . 32
Para el ejemplo la muestra debe ser de: n= ≅ 52
1, 0732
Es decir que se debe tomar una muestra de 52 pacientes en vez de 30 para con un nivel del
99% cometer el mismo error de 1,073 pulsaciones por segundo.

Si los investigadores desearan disminuir el error de la estimación manteniendo el nivel del


95% a 1 pulsación por segundo, el tamaño requerido será:

n=
(1,96 )2 . 32 ≅ 35
pacientes.
12
De lo anterior se deduce que en la determinación del tamaño de la muestra juegan un papel
importante el nivel de confianza y error que cada investigador esté dispuesto a cometer; estando
estas cantidades íntimamente relacionadas, ya que una depende de la otra.
σ
Para calcular la desviación estándar de la media, utilizamos la ecuación σ X = X siempre
n
que la población sea infinita o que el muestreo se realice con reposición. Si la población es finta o
la experiencia se hace sin reposición, se debe afectar a esta desviación estándar del coeficiente de
corrección por población finita resultando:
σ N −n
σX = X .
n N −1

13
Probabilidad y Estadística Módulo 8

Con la correspondiente corrección el intervalo de confianza resulta:

 σ N −n σ N −n 
P  X − z α 2 . X . ≤ µX ≤ X + z α 2 . X .  = 1− α
 n N −1 n N − 1 

σX N −n
El error de muestreo es: zα .
2 n N −1

Ejemplo:

Un agricultor dueño de una parcela con 500 árboles frutales, seleccionó una muestra de 15
ejemplares para analizar el diámetro de los troncos a 1 metro del suelo. El objetivo de su
investigación es conocer la efectividad de un fertilizante que ha puesto en uso para mejorar el
crecimiento de los árboles. El diámetro medio de los 15 árboles medidos fue de 22,5 cm y además,
para dicha especie, se sabe que la desviación estándar es de 3 cm. El agricultor desea estimar
mediante un intervalo de confianza del 97% el diámetro promedio para esa tipo de árboles frutales.
Los datos son:
σ X = 3 cm X = 22 ,5 cm N = 500 n = 15 1 − α = 0,97
zα = 2 ,17
2

σ N −n 3 500 − 15
θɵ i = X − z α 2 . X . = 22 ,5 − 2 ,17 . . ≃ 20 ,84
n N −1 15 500 − 1

σ N −n 3 500 − 15
θɵ d = X − z α 2 . X . = 22 ,5 + 2 ,17 . . ≃ 24,16
n N −1 15 500 − 1

Por lo tanto el intervalo de confianza es [20,84; 24,16], o sea que se puede afirmar, con un
97% de confianza, que el 97% de los intervalos contendrán el verdadero valor del diámetro medio
poblacional.
Cuando se muestrea una pequeña fracción de la población entera (es decir, cuando el
tamaño de la población N es muy grande en relación con el tamaño de la muestra n), el
multiplicador de la población finita toma un valor cercano a 1. Los estadísticos se refieren a la
fracción n/N como la fracción de muestreo, porque es la fracción de la población N contenida en la
muestra.
Cuando la fracción de muestreo es pequeña, el error estándar de la media para poblaciones
finitas es tan cercano a la media para poblaciones infinitas, que bien podríamos utilizar la misma
fórmula para ambas desviaciones. La regla generalmente aceptada es: si la fracción de muestreo es
menor a 0,05, no se necesita usar el multiplicar para la población finita.

14
Probabilidad y Estadística Módulo 8

ACTIVIDAD 1

1) Un fabricante de papel para computadoras tiene un proceso de producción que opera


en forma continua a través de un turno de producción completo. Se espera que el
papel tenga una longitud promedio de 11 pulgadas y se sabe que la desviación
estándar en de 0,02 pulgadas. A intervalos periódicos se seleccionan muestras para
determinar si la longitud promedio del papel sigue siendo igual a 11 pulgadas o si
hay alguna falla en el proceso de producción que la altere. Si es así se habrá de
pensar en una acción correctiva. Se ha seleccionado una muestra de 100 hojas y se
ha encontrado que el largo del papel es de 10,998 pulgadas. Se desea un estimado
del intervalo de confianza del 95% de la longitud promedio del papel.
2) a) Determinar el intervalo de confianza del 95% y del 99% para el aumento medio
de las pulsaciones cardíacas de caballos de carrera entrenados. Se selecciona una
muestra de 35 caballos y se los somete a un test de trabajo normalizado, resultando
la media de 84 pulsaciones por minuto. Se conoce, por estudios previos, la
desviación estándar de la población es igual a 15 pulsaciones por minuto.
b) Determinar el intervalo de confianza del 95% de la situación anterior, si ahora te
informan que la muestra de 35 caballos fue extraída de un lote de 500 caballos.
3) A muchos pacientes con problemas cardíacos se les implantó un marcapasos para
contralor su ritmo cardíaco. Se monta un módulo conector de plástico sobre la parte
superior del marcapasos. Suponga una desviación estándar de 0,0015 y una
distribución aproximadamente normal, encuentre un intervalo de confianza de 95%
para la media de todos los módulos conectores que fabrica cierta compañía. Una
nuestra aleatoria de 75 módulos tiene un promedio de 0,310 pulgadas.

Caso 2: Población con distribución normal, con σX desconocida y


tamaño de la muestra n ≥ 30

El intervalo para inferir la media de una población infinita con esas características se basa
en la distribución Z, y se trabaja con s corregida para estimar σ X .
Si n ≥ 30 , la muestra es “grande” y se estima σ X por medio de s (desvío muestral)
resultando:
 sˆ   s 
X ≃ N  µX ;  ≃ N  µX ; 
 n  n −1 
El intervalo de confianza de µ X desconociendo σ X , si X es la media de una muestra
aleatoria de tamaño n de la población, con un nivel de confianza de (1− α ) % es, basándonos en el
Teorema del límite central:
s s
X − zα ≤ µ X ≤ X + zα
2 n −1 2 n −1

15
Probabilidad y Estadística Módulo 8

O sea que, para una población infinita resulta:

 s s 
P  X − zα ≤ µ X ≤ X + zα  = 1−α
 2 n −1 2 n −1 

Ejemplo:

Calcular una estimación por intervalo de confianza de la cantidad promedio de dinero que
gastan los fumadores crónicos por mes, si una investigación determinó que 36 de ellos,
seleccionados al azar, han gastado $120 mensuales con una varianza de $9 utilizando un nivel de
confianza del 0,90.
s s
Para este caso el intervalo es X − zα ≤ µ X ≤ X + zα con:
2 n −1 2 n −1

n = 36 X = 120 s2 = 9 s=3 1 − α = 0,90

α
1− = 0 ,95 Z1− α = 1,645
2 2

Sustituyendo en el intervalo de confianza obtenemos:

3 3
120 − 1,645 ≤ µ X ≤ 120 + 1, 645 o sea 119 ,166 ≤ µ X ≤ 120 ,834
35 35

Por lo que podemos concluir que el parámetro poblacional se encuentra en el intervalo


[119,17 ; 120,83], con un nivel de confianza del 90%, es decir, la cantidad de dinero promedio de
los fumadores consuetudinarios se encuentra entre $119,166 y $120,834.

Si la población es finita se debe afectar al intervalo de la correspondiente corrección, por lo


que el intervalo se modifica de la siguiente manera:

 s N −n s N −n 
P  X − zα . ≤ µ X ≤ X + zα .  = 1−α
 2 n −1 N −1 2 n − 1 N − 1 

16
Probabilidad y Estadística Módulo 8

ACTIVIDAD 2
1) Una muestra de los pesos de 35 plantas en una estación experimental dio un peso
medio de 50 gramos y una desviación típica de 8 grs. Sabiéndose que la VA “peso
de una planta” tiene una distribución normal de probabilidades, determinar un
intervalo de confianza del 90% para el peso medio de todas las plantas del
establecimiento de donde se extrajo la muestra.
2) Un nutricionista, especialista en nutrición animal desea estimar el contenido
vitamínico de cierto alimento. Tomo una muestra de 45 paquetes del alimento y
determina que el contenido promedio de vitaminas es de 12 mg con una desviación
estándar de 2 mg. Hallar el intervalo de confianza de 95% para el promedio
poblacional. La distribución del contenido vitamínico sigue una ley normal.
3) En un estudio de costos anuales de alquileres de departamentos de una determinada
inmobiliaria, que administra 300, una muestra de 35 de ellos, tienen un costo de
renta medio de $ 2500 y una desviación estándar de $ 550. Construya un intervalo
de confianza del 99% para el costo anual promedio de los alquileres de los
departamentos, si la distribución es aproximadamente normal.

Caso 3: Población con distribución normal, con σX desconocida y


tamaño de la muestra n < 30

Si la media y la desviación estándar de la población infinita son desconocidas, ¿cómo


perjudica esto a la estimación de intervalo? En este caso nuevamente la desviación estándar de la
población es desconocida, por lo que debemos estimarla mediante el cálculo de s, es decir la
desviación estándar de una sola muestra. Por supuesto que, al realizar esta estimación, siempre se
comete algún error.
En esta situación no podemos usar la distribución normal estándar ya que, para muestras
pequeñas, los resultados no están de acuerdo con la realidad. La distribución Z tiene una varianza
constante e igual a 1, mientras que la curva de la t tiene varianza que depende de los grados de
libertad, o sea del tamaño de la muestra. Si la muestra es “grande” la curva de la distribución t se
acerca a la forma y a las características de la normal estándar y por ello no vale la pena hacer
diferencias en la metodología de estimación. Por ejemplo, para 30 grados de libertad, la normal
estándar tiene una ordenada máxima (en Z = 0) cuyo valor es 0,399, mientras que la t tiene un
máximo (en t = 0) de valor 0,396; esto indica que en su punto máximo la diferencia de ordenadas
es de menos del 1%. Por el contrario en las experiencias con muestras pequeñas la curva t tiene
mayor dispersión y se aparta de la normal estándar cuanto más chica es la muestra en estudio.
Si la muestra es de menos de 30 unidades, debemos trabajar para estimar el intervalo de
confianza con la distribución t de Student, resultando la fórmula para dicha inferencia:
sˆ sˆ
X − t n −1;α ≤ µ X ≤ X + t n −1; α
2 n 2 n

17
Probabilidad y Estadística Módulo 8
n
Se estima σ X por sˆ = s , o sea, con la desviación estándar corregida.
n −1
Siendo tn −1;α el valor crítico a extraer de la tabla para la distribución de Student con n-1
2
grados de libertad y un nivel de confianza (1 − α ) . El intervalo de confianza correspondiente
puede expresarse también de la siguiente manera:
s s
X − t n −1;α ≤ µ X ≤ X + t n −1; α
n −1 n −1
O sea que:
 s s 
P  X − t n −1;α ≤ µ X ≤ X + t n −1; α  = 1− α
 n −1 n −1 

Ejemplo:

Una muestra de 15 aves tomadas al azar de un establecimiento elaborador de alimentos


balanceados permitió establecer un aumento de peso promedio de 90 gramos por semana y un
desvío típico de 10 gramos. Se desea estimar el aumento de peso promedio para las 5000 aves del
establecimiento con un intervalo de confianza del 90%.

X: aumento de peso de las aves.


n = 15, X = 90 , s = 10 , 1 − α = 0, 90
Por tabla: t 14;0,10 =1, 761 y el intervalo correspondiente es:

10
90 ± 1, 761 = 90 ± 4, 71 = [85, 29;94, 71] .
14
Decimos, entonces, que el aumento de peso por semana en el establecimiento para las 5000
aves del plantel está comprendido entre 85,3 ≤ µ X ≤ 94, 7 gramos con un 90 % de confianza.
Si la población es finita se debe afectar al intervalo de la correspondiente corrección, por lo
que el intervalo se modifica de la siguiente manera:

s N −n s N −n
X − t n −1;α . ≤ µ X ≤ X + t n −1; α .
n −1 N −1 n −1 N −1
Y la probabilidad resulta:
 s N −n s N −n 
P  X − t n −1;α . ≤ µ X ≤ X + t n −1; α .  = 1 − α
 n −1 N −1 n −1 N −1 

18
Probabilidad y Estadística Módulo 8

ACTIVIDAD 3

1) Se analiza la demanda diaria de vitamina E de personas no deportistas y de


deportistas para ejercicios de fuerza y velocidad. Se toma una muestra de 8
individuos de cada grupo y los resultados son:

No deportista: 4,52; 5,23; 4,68; 5,37; 4,75; 5,26; 4,98; 5,36 mg

Deportista: 6,98; 6,86; 7,12; 7,22; 5,98; 6,89; 7,35; 7,05 mg.

a) ¿Entre qué valores se encuentra la demanda media poblacional en cada caso para
un nivel de confianza de 95%?
b) ¿Cuál es el tamaño posible de nuestro error para un nivel de confianza del 95%?
c) ¿De qué tamaño debe ser la muestra si deseamos tener 95% de confianza que
nuestra media muestral no difiere en más de 0,25 mg de la media real de la
población? ¿Y si deseamos que el error sea menor o igual a 0,10 mg.?
d) Extraiga conclusiones.
2) Una muestra de 15 varillas metálicas tomadas al azar de un lote de producción,
permitió establecer una longitud promedio de 150 cm y un desvío típico de 10 cm.
Se busca estimar un intervalo de confianza del 90% para la longitud promedio de
todo el lote.
3) Una compañía produce piezas metálicas de forma cilíndrica. Se toma una muestra
de las piezas y los diámetros son 1,01;0,97; 1,03; 1,04; 0,99; 0,98; 0,99; 1,01; y 1.03
cm. Encuentre un intervalo de confianza de 99% para el diámetro medio de las
piezas de esta máquina, suponga una distribución aproximadamente normal.
4) Una muestra de 10 hombres de una gran ciudad dio para sus estaturas una media de
1,78 cm. y una varianza s 2 = 0,11 cm. Estimar un intervalo de confianza para la
media de las alturas de todos los habitantes varones de dicha ciudad con un
coeficiente de riesgo del 5%.
5) Una empresa de televisión por cable desea instalar torres que soporten velocidades
de vientos de hasta 90 km / hora. El proveedor de dichas torres instala 3 en las
inmediaciones de la empresa para comprobar que se ajustan a este requerimiento.
Dichas torres soportan en promedio vientos de hasta 78 km / hora con una s = 2
km/h. Estimar si el valor está o no incluido en la especificación del fabricante, con
un nivel de riesgo del 5%.
6) Construye un intervalo de confianza del 95% con los datos de la situación anterior si
te informan que las antenas fueron seleccionadas aleatoriamente de un lote de 20 de
iguales condiciones.

19
Probabilidad y Estadística Módulo 8

Caso 4: Población con distribución no normal o desconocida, con σX


conocida y tamaño de la muestra n ≥ 30
En este caso, el intervalo para inferir la media de una población infinita se determina de la
misma manera que en el Caso 1, o sea mediante la aplicación de la distribución normal, siendo el
intervalo:
σX σX
X −zα 2 . ≤ µX ≤ X + z α 2 .
n n

Para el caso de una población finita resulta el IC:

σ N −n σ N −n
X −z α 2 . X . ≤ µX ≤ X + z α 2 . X .
n N −1 n N −1

ACTIVIDAD 4

1) Un fabricante estudia por un largo período la producción semanal de sus máquinas y


determina que la desviación estándar del diámetro de los pernos fabricados es de
0,105 cm. Para determinar el diámetro medio del lote semanal de producción toma
una muestra de 40 pernos y obtiene el diámetro medio de dicha muestra
X = 1, 905 cm . Hallar los intervalos de confianza para el 95% y para el 99% en los
cuales se encontrará el diámetro medio poblacional.

2) Un profesor de lengua sabe que, en general los estudiantes cometen errores de


ortografía en sus redacciones con un desvío estándar de 2,44. Selecciona una
muestra de 50 estudiantes de un colegio y les hace redactar un texto. Determina
luego que el promedio de errores ortográficos de la muestra es de 6,12 palabras.
Obtener el intervalo de confianza para el 95% de confianza para el número medio de
palabras con errores en la población del colegio.

3) Hallar el error de estimación para el ejercicio 2).

4) Si se desea mantener el mismo nivel de confianza, es decir del 95%, pero se quiere
disminuir el error de estimación a 0,45, ¿cuál es el tamaño óptimo de la muestra
requerida?

5) Un estudiante de Ciencias Económicas investiga el ingreso medio de los


funcionarios de su municipio. Él desea que el error al estimar sea menor que $50
con un nivel de confianza del 95%. El estudiante encontró en los archivos del
municipio un informe realizado por la tesorería del mismo que indicaba que la
desviación estándar era de $200. ¿Cuál es el tamaño requerido de la muestra?

20
Probabilidad y Estadística Módulo 8
6) Si en el ejercicio anterior se desea aumentar el nivel de confianza a 99%, ¿Cuál es
ahora el tamaño de la muestra necesaria?
7) Una fábrica produce tubos fluorescentes cuya vida útil tiene una desviación estándar
de 65 horas. Si una muestra de 35 tubos fluorescentes tienen un promedio de vida de
830 hs, estimar con un intervalo del 98% el promedio de vida útil de todos los tubos
fluorescentes que produce esta fábrica, si se sabe que la cantidad de tubos que se
producen por día es de 160.

Caso 5: Población con distribución no normal o desconocida, con σX


conocida y tamaño de la muestra n < 30

Para este caso no se puede utilizar el teorema del límite central pues no se puede asegurar
que la distribución muestral de X se parece a la curva normal, ya que el número de elementos de
la muestra es pequeño y además la población no es normal. Tampoco se puede usar la distribución
t de Student pues ésta sólo es válida para muestras pequeñas extraídas de una población normal.
En este caso aplicaremos la desigualdad de Chebyshev, la que según vimos expresa:
1
P ( µ X − kσ X ≤ X ≤ µ X + kσ X ) ≥ 1 −
k2
Si en vez de considerar la variable X, con media µ X y desviación estándar σ X
σ
consideramos la variable aleatoria X , con media µ X = µ X y desviación estándar σ X = X , y
n
suponemos que la población es infinita, ahora la probabilidad de encontrar en una muestra
seleccionada al azar de tamaño n un valor de su media entre µ X ± kσ X es:

 kσ kσ  1
P  µX − X ≤ X ≤ µX + X  ≥ 1−
 n n  k2
1
Si definimos 1 − como el nivel mínimo de confianza, entonces la longitud del intervalo
k2
2kσ X
es y si centramos dicho intervalo en la media de la muestra seleccionada al azar, entonces
n
la probabilidad de que ese intervalo contenga a la media poblacional es:

 kσ kσ  1
P  X − X ≤ µX ≤ X + X  ≥ 1− con k > 1
 n n  k2

21
Probabilidad y Estadística Módulo 8

Por lo tanto, cuando la población tiene distribución desconocida o conocida como no normal,
el tamaño de la muestra es pequeño ( n < 30 ) y la desviación estándar de la población es conocida,
el intervalo que permite hacer una estimación de la media poblacional es:
kσ X kσ X
X− ≤ µX ≤ X +
n n

Para este intervalo no tenemos tablas de las cuales extraer el valor de k , por lo tanto si
seleccionamos un nivel de confianza (1 − α ) , para hallar dicho valor hacemos:

1 1
(1 − α ) = 1 − y resulta k = + con lo que el intervalo finalmente es de la forma:
k2 α
σX σ
X− ≤ µX ≤ X + X
α n α n
Por lo que se puede afirmar que:
 σ σ 
P  X − X ≤ µX ≤ X + X  = 1−α
 α n α n 

Ejemplo:

Un productor de disyuntores eléctricos sabe que la máquina de hacer el montaje de los


disyuntores se desgasta en forma constante durante el proceso de fabricación. Cada lote de
producción está integrado por 1000 disyuntores y terminado el lote se debe recalibrar la máquina.
Si el fabricante desea saber a que tensión se inutiliza el disyuntor, es decir hasta que tensión
funciona correctamente y cuándo queda fuera de servicio, o sea que el ensayo es destructivo, por
lo que sólo se ensayarán 9 dispositivos. Según la historia del proceso la varianza poblacional es de
48 voltios y la tensión media muestral del ensayo es de 290 voltios. Estimar con un nivel del 90%
el intervalo de confianza correspondiente.
La población es de forma desconocida o no normal y de ella sólo se sabe su σ X = 48 .

La distribución media muestral tiene forma y media µ X desconocida pero su desviación


σX
estándar es σ X = , por lo que según la teoría anterior el intervalo será:
n
σX σ
X− ≤ µ X ≤ X + X donde 1 − α = 0,90 , α = 0,10 k ≅ 3,1622
α n α n

3,1622 48 3,1622 48
290 − ≤ µ X ≤ 290 +
9 9

o sea 282, 7 voltios ≤ µ X ≤ 297,30 voltios

22
Probabilidad y Estadística Módulo 8

Para poblaciones finitas el intervalo de confianza es:


σX N −n σ N −n
X− . ≤ µX ≤ X + X .
α n N −1 α n N −1

ACTIVIDAD 5

1) Un fabricante de marcadores no recargables está interesado en la longitud


promedio de una línea continua que puede ser trazada con cada marcador antes de
que el mismo se quede sin tinta; esto define su “vida útil”. Debido a ajustes
técnicos realizados durante la producción, se sabe que la “vida útil” no se
distribuye normalmente, sino que es sesgada a la izquierda, es decir hacia la vida
útil más corta. La varianza poblacional es conocida y de 144 metros. Se toma una
muestra al azar de 20 marcadores dando una línea de longitud promedio 800
metros.
a) Construya el intervalo de confianza del 95% para la vida útil media en metros de
la producción de marcadores.
b) Resuelve la situación anterior si te informan que los marcadores fueron
seleccionados de una producción de 300 de ellos.
2) Un fabricante de termostatos para heladeras comerciales desea determinar el
correcto funcionamiento del mecanismo de control de temperatura. Para saber la
cantidad de horas promedio de duración de dichos dispositivos ensaya solo 8 de
ellos ya que, además de ser costosos, la prueba es destructiva. Del experimento
resulta que la duración promedio de la muestra es de 45.360 horas, conociéndose
por el análisis de lotes anteriores que la desviación estándar poblacional es de 1500
horas. Determine el intervalo de confianza del 99% y del 90% para la vida
promedio de los termostatos.
3) Una compañía manufacturera de CD desea saber la resistencia al aplastamiento de
las cajas que contienen a los mismos. Si una caja se rompe con facilidad la
empresa pierde presencia en el mercado. Se selecciona una muestra de 12 cajas y
se las somete a un ensayo de compresión resultando la resistencia media de la
muestra 4,5 kilogramos. Si se conoce la varianza poblacional que es de 0.75
kilogramos, construya un intervalo de confianza del 95% para la resistencia media
al aplastamiento.
4) a) La resistencia a la rotura, expresada en kg., de 5 cuerdas de 6 mm de diámetro
dieron por resultado 290, 230, 265, 292 y 270. Estime la resistencia media µ X
para la rotura mediante un intervalo de confianza del 99%, si se sabe que la
desviación estándar poblacional es de 18 Kg
b) Resuelve la situación anterior si te informan que la muestra fueron
seleccionadas de un lote de 70 cuerdas.

23
Probabilidad y Estadística Módulo 8

Caso 6: Población con distribución no normal o desconocida, con σX


desconocida y tamaño de la muestra n ≥ 30

Si n ≥ 30 , la muestra es “grande” y se estima σ X por medio de s (desvío muestral)


resultando, para el caso de una población infinita:
 sˆ 
X ≃ N  µX ; 
 n
2
Siendo ŝ =
∑ ( Xi − X ) dónde n es el número de individuos de la muestra.
n −1

El intervalo de confianza de µ X desconociendo σ X , si X es la media de una muestra


aleatoria de tamaño n de la población, con un nivel de confianza de (1− α ) % es, basándonos en
el Teorema del límite central:
s s
X − zα ≤ µ X ≤ X + zα
2 n −1 2 n −1

Ejemplo:

Una agencia de transporte desea probar un tipo de baterías para ser colocadas en sus micros
de larga distancia. Para tomar una decisión sobre la adquisición de ese tipo de batería o no, mide la
capacidad de una muestra aleatoria de 60 baterías resultando una X = 138, 47 horas con una
varianza muestral de 7.07 horas2. Construya el intervalo de confianza para el 95% para la
capacidad promedio.

n = 60 X = 138, 47 s = 7, 07 = 2, 6589

7, 07 7, 07
138, 47 − 1,96 ≤ µ X ≤ 138, 47 + 1, 96 ⇒ 137, 7972 ≤ µ X ≤ 139,148
59 59
Corregi el n-1=59
Es decir que con un 95% de confianza podemos decir que la capacidad promedio está entre
137,8 y 139,14 amperios – hora.
Si la población de la cual se extrae la muestra es finita, el IC resulta:

s N −n s N −n
X − zα . ≤ µ X ≤ X + zα .
2 n −1 N −1 2 n −1 N −1

24
Probabilidad y Estadística Módulo 8

O sea que:
 s N −n s N −n 
P  X − zα . ≤ µ X ≤ X + zα .  = 1−α
 2 n −1 N −1 2 n − 1 N − 1 

ACTIVIDAD 6
1) Las estaturas de una muestra aleatoria de 50 atletas universitarios proporcionan una
media de 174,5 cm. y una desviación estándar de 6,9 cm.
a) Construya un intervalo de confianza del 98% de para la estatura media de todos
los atletas de la universidad.
b) ¿Qué podemos afirmar del 98% sobre el tamaño posible de nuestro error si
estimamos que la estatura media de todos los atletas de la universidad es de 174,5
cm?
c) Construya un intervalo de confianza del 99% de para la estatura media de los 800
atletas universitarios inscriptos.

2) Una muestra aleatoria de 55 frascos de un complejo vitamínico contiene, en


promedio, 325,05 mg de vitamina A con una desviación estándar de 0,5 mg.
Construya un intervalo de confianza para un nivel de 95% y 99% para el promedio
de vitamina A.
3) ¿Cuál es el tamaño posible de nuestro error para lo estimado en el ejercicio 2, para
un nivel de confianza del 95%?
4) ¿De qué tamaño se necesita una muestra en el ejercicio 2) si deseamos tener 95% de
confianza que nuestra media muestral no difiere en más de 0,20 mg de la media real
de la población?
5) Construya un intervalo de confianza para un nivel de 95% para el promedio de
vitamina A del ejercicio 2) si los frascos fueron extraídos de un partida de 900 de
ellos.

Caso 7: Población con distribución no normal o desconocida, con σX


desconocida y tamaño de la muestra n < 30
En este caso no conocemos la forma general de la población, ni su desviación estándar, ni su
media, por lo que resulta imperioso tomar una muestra “grande” para que tenga aplicación el
teorema del límite central y para obtener una estimación precisa de σ X a partir de la desviación
estándar de la muestra s.
En el caso anterior seleccionar una muestra de tamaño n ≥ 30 implica cubrir esos aspectos,
pero si la muestra es menor que 30 individuos nada podemos asegurar sobre la estimación de la
media. No existe método alguno que nos permita hacer inferencia y construir un intervalo de la
media de una población.

25
Probabilidad y Estadística Módulo 8

Diagrama de decisión

Población normal

Sí σX No
¿Conocida?

σ σ
X − z α 2 . X ≤ µX ≤ X + z α 2 . X
n n Sí No
n ≥ 30

s s
X −zα 2 . ≤ µX ≤ X + z α 2 .
n −1 n −1

s s
X −t α 2; n−1 . ≤ µX ≤ X +t α 2 ; n−1 .
n −1 n −1

Población no normal

Sí σX No
¿Conocida?

Sí No
Sí No n ≥ 30
n ≥ 30

¿?
σ σ
X − z α 2 . X ≤ µX ≤ X + z α 2 . X
n n
s s
X −zα 2 . ≤ µX ≤ X + z α 2 .
n −1 n −1
kσ X kσ X
X− ≤ µX ≤ X +
n n

26
Probabilidad y Estadística Módulo 8

INTERVALO DE CONFIANZA PARA LA VARIANZA σX2


2
Si extraemos una muestra de tamaño n de una población normal con varianza σ X , y se
calcula la varianza muestral s 2 , obtenemos un valor para realizar una estimación puntual de la
varianza poblacional.

Por ello s 2 se llama estimador de σ X2 .

Puesto que s 2 no puede ser negativa, suponemos que esta distribución de muestreo no es
una curva normal; en efecto, se relaciona con la distribución gamma y es una ji cuadrada.
2
Se puede establecer una estimación por intervalos de σ X mediante el uso de la estadística
2
2 ( n −1 ) s
X = 2
σ
2
Esta última tiene una distribución χ con n – 1 grados de libertad.

 2 2 2

Podemos escribir el intervalo: P  χ ≤ X ≤ χ  = 1−α
 1− α α 
 2 2 

donde χ 2 y χ 2 son valores de la distribución ji cuadrada con n – 1 grados de libertad.,


1− α α
2 2
α α
que dejan áreas de 1 − y , respectivamente , a la derecha.
2 2
 2 ( n −1 ) s2 
Al sustituir X
2
resulta el intervalo: P  χ ≤ ≤ χ 2α  = 1 − α
 1− α σ2 
 2 2 

2
Dividimos cada miembro de la desigualdad por ( n − 1 ) s e invertimos las fracciones, lo
que invierte el sentido de la desigualdad es:

 
 ( n − 1 ) ˆs
2
( n − 1 ) ˆs 
2
2
P 2
≤ σX ≤ 2
 = 1−α
 χα χ α 
 1− 
 2 2 

27
Probabilidad y Estadística Módulo 8

Ejemplo:

Si los índices de refracción de 20 piezas de cristal aleatoriamente seleccionadas de un gran


empaque adquirido por una empresa óptica, tienen una varianza de 1,2 . 10 – 4. Estime el intervalo
de confianza del 95% para σ , la desviación estándar de la población muestreada.
2 2
Para 20-1=19 g de libertad, χ 0 ,975= 8, 907 y χ 0 ,025= 32 , 852 siendo el resultado:
−4 −4
19 . 1, 20 . 10 2 19 . 1, 20 . 10
<σ < por lo que 0 , 0083 < σ < 0 , 0160
32 , 852 8, 907
Ésto significa que estamos un 95% seguros de que el intervalo de 0,0083 a 0,0160 contiene a
la desviación real del índice de refacción de los cristales.

ACTIVIDAD 7

1) Un productor de fertilizantes para controlar la calidad de su producción pesa 20


bolsas del mismo, obteniendo una varianza de 0,48 kg. ¿Qué varianza puede
inferirse con un nivel de confianza del 95% que tendrá la producción total?

2) Se saca una muestra de 30 conejos y se los pesa. La desviación estándar de los pesos
fue de 210 gramos, ¿entre qué valores estará la desviación estándar de la población
para un nivel de riesgo del 5% y del 1% respectivamente?

3) Se determina que la tensión de rotura de 6 carreteles de un tipo de alambre son: 33;


32; 26; 27; 28 y 31 kg. Calcular un intervalo de confianza para la varianza
poblacional si se está dispuesto a aceptar un riesgo del 2%.

4) La desviación estándar de la vida útil de un cierto modelo de luminarias, para una


muestra de 15 de ellas fue de 100 horas. Hallar los intervalos de confianza del 95%
y del 99% para la desviación estándar de la población de luminarias.

* Observación: estamos ahora en inmejorables condiciones para resolver el problema


motivador de la página 3.

28
Probabilidad y Estadística Módulo 8

Respuestas a ejercicios

ACTIVIDAD 1

1) 10.994 ≤ µ X ≤ 11.001 2) a) 79.04 ≤ µ X ≤ 88.96


77.483 ≤ µ X ≤ 90.5161
b) 79.2028 ≤ µ X ≤ 88.7972
3) 0.3096 ≤ µ X ≤ 0.3103

ACTIVIDAD 2

1) 47.743 ≤ µ X ≤ 52.257 2) 11.41 ≤ µ X ≤ 12.59


3) 2271.253 ≤ µ X ≤ 2728, 747

ACTIVIDAD 3

1) a) No deportistas: 4.73 ≤ µ X ≤ 5.288 2) 145.29 ≤ µ X ≤ 154.706


Deportistas: 6.58 ≤ µ X ≤ 7.28
b) 0.278 y 0.349
c) 10 y 15

3) 0.977 ≤ µ X ≤ 1.032 4) 1.531 ≤ µ X ≤ 2.02

5) 71.9 ≤ µ X ≤ 84.08 (valor no incluido en la especificación)


6) 72.078 ≤ µ X ≤ 83.92

ACTIVIDAD 4

1) 1.87 ≤ µ X ≤ 1.937 2) 5.44 ≤ µ X ≤ 6.79 3) 0.676


1.862 ≤ µ X ≤ 1.947

4) 113 5) 61 6) 107
7) 807.3422 ≤ µ X ≤ 852.6577

ACTIVIDAD 5

1) a) 788 ≤ µ X ≤ 811.99 2) 40056.6 ≤ µ X ≤ 50663.30 3) 3.382 ≤ µ X ≤ 5.6179


b) 788.768 ≤ µ X ≤ 811.232 43682.9 ≤ µ X ≤ 47037
4) a) 188.9 ≤ µ X ≤ 349.89 b) 191.27 ≤ µ X ≤ 347.53

29
Probabilidad y Estadística Módulo 8
ACTIVIDAD 6

1) a) 172.2 ≤ µ X ≤ 176.79 2) a) 324.9 ≤ µ X ≤ 325.183 3) 0.132


b) 2.29 b) 324.87 ≤ µ X ≤ 325.225 4) 25
c) 172.04 ≤ µ X ≤ 176.96
5) 324.92 ≤ µ X ≤ 325.1792

ACTIVIDAD 7

5% → 167.24 ≤ σ X ≤ 282.3
1) 0.277 ≤ σ X2 ≤ 1.024 2)
1% → 156.32 ≤ σ X ≤ 312.2
95% → 7.32 ≤ σ X ≤ 15.77
3) 2.29 ≤ σ X2 ≤ 62.45 4) corregi resultado
99% → 6.68 ≤ σ X ≤ 18.53

30