Está en la página 1de 11

CÁTEDRA

PROBABILIDAD Y ESTADÍSTICA
Depto. Ms. Básicas

ESPECIALIDADES

Ingeniería Eléctrica
Ingeniería Mecánica
Ingeniería Metalúrgica

DOCENTES

Prof. Adjunto: Dra. Ana María Craveri


Ayudante de Primera: Est. Susana Carasai

Probabilidad y Estadística – Dra. Ana M. Craveri. Año 2017 Página 1


CAPÍTULO 7

ESTIMACIÓN DE PARÁMETROS

7.1. Introducción

Hemos visto al estudiar los modelos probabilísticos que éstos contienen parámetros,
generalmente desconocidos. En el caso de la Distribución de Probabilidad Normal estos
parámetros son µ y σ (el promedio y su correspondiente dispersión) y en el caso de la
Distribución de Probabilidad Binomial, nos referimos a p (por ejemplo proporción de
defectuoso en cierto proceso). La determinación de estos parámetros se convierte en un
objetivo de vital importancia. El problema es que el cálculo exacto del parámetro requiere
el conocimiento de la variable aleatoria en todos y cada uno de los individuos de la
población.
En el capítulo 6 hemos estudiado funciones de las observaciones de muestras (en particular
la media aritmética y la proporción muestral) llamadas estadísticas, que tienen
distribuciones de muestreo que contienen esos parámetros desconocidos.
Entonces deberíamos ser capaces de usar las medidas estadísticas para obtener información
acerca de los parámetros. Es decir, supongamos que se analiza el modelo probabilístico de
una población de observaciones de la cual sólo se sabe que tiene una media µ y una
variancia finita σ2. ¿Qué hacemos?: Tomamos una muestra aleatoria de tamaño n de esta
población, calculamos el promedio muestral que, de acuerdo con lo que hemos
desarrollado, bajo ciertas condiciones, tenderá a tener una distribución normal con
parámetros µ y σ2/ n.
La pregunta que nos hacemos es: ¿Cómo se puede utilizar esta información para decir algo
más específico del parámetro desconocido µ?
La respuesta a esta pregunta la provee una técnica de la Inferencia Estadística denominada
Estimación.
En este diagrama se puede visualizar lo expresado

Distribuciones de Distribuciones en el
Probabilidad muestreo

Parámetros Inferencia Funciones de


observaciones de la
muestra.Estadísticos

Estimamos

Probabilidad y Estadística – Dra. Ana M. Craveri. Año 2017 Página 2


En síntesis, el modelo de un experimento debe tener parámetros, éstos representan las
incógnitas de la investigación. Un experimento se realiza siempre con el fin de obtener
información acerca de tales incógnitas (o sea de los parámetros) Los métodos que permiten
obtener esta información se denominan métodos de estimación.
7.2.- Estimación Puntual y Estimación por intervalo

a) Estimación puntual: Un estimador puntual consiste en un solo estadístico muestral


que se usa para estimar el valor verdadero de un parámetro de una población. Es decir,
se estudia una variable cuya forma de distribución se conoce y se sabe que depende del
parámetro desconocido θ el que se estima con ese sólo estadístico muestral.
• El problema consiste en: encontrar, a partir de la muestra, el valor de una función que
dependa exclusivamente de las observaciones. A este valor lo denominaremos con
y será el estimador de

Ejemplos:
Estima a µ

proporción en la muestra Estima a p proporción de la población

Estima a σ2

Propiedades que debemos exigirle al estimador para poder llamarlo “buen estimador”:

1- Insesgado: todo estimador es una variable aleatoria, pues varía de muestra a


muestra y tendrá un valor medio que sería conveniente, ya que va a estimar a , que
fuera igual al valor del parámetro, es decir : . En este caso diremos que
es un estimador insesgado de .
Por ejemplo:
Hemos visto al estudiar la distribución muestral de la media que con lo
que la media muestral es un estimador insesgado de la media poblacional.
De la misma manera la proporción de la muestra es un estimador insesgado de la
proporción p de la población y p

2- Consistente: un estimador es consistente si se aproxima al verdadero valor del


parámetro, con una probabilidad que tiende a 1, al aumentar el tamaño de la muestra (n),
es decir: .
La variancia de la distribución muestral de las medias muestrales es tiene esta
propiedad .
La media muestral es un estimador consistente de µ puesto que:

Probabilidad y Estadística – Dra. Ana M. Craveri. Año 2017 Página 3


y al aumentar n ,

3- Eficiente: la eficiencia de un estimador depende de su variancia. Es por ello que se


dice que un estimador de θ, es más eficiente que otro , si al realizar muestreos
sucesivos con un mismo tamaño de muestra , resulta que . Esto se debe
a que si un estimador tiene menor variancia, la estimación tendrá más precisión. Lo
planteamos en el siguiente gráfico

La distribución muestral de s menor que la de θ


utilizando que producirá un error de muestreo menor que un estimador de
θ, utilizando la distribución muestral de .

4. Suficiente: Intuitivamente diremos que un estimador es suficiente si para su cálculo se


utiliza toda la información de la muestra y además ningún otro estimador puede
proporcionar más información sobre el parámetro. La media aritmética es un estimador
suficiente de µ pues en su cálculo intervienen todas las observaciones de la muestra.

b) Estimación por intervalo: hemos visto que un parámetro desconocido puede


estimarse mediante una única cantidad. Sin embargo una estimación de este tipo no es, por
lo general suficiente como solución de un problema práctico.
Un procedimiento de estimación puntual utiliza la información de una muestra para llegar a
un solo número que estima al parámetro de interés.

Pero, si nos interesa obtener una medida de la precisión de la estimación del parámetro θ
deberíamos proporcionar un intervalo de números reales tales que la probabilidad de que el
valor del parámetro θ quede incluido entre los límites de ese intervalo sea igual a
. Esto puede resumirse de la siguiente manera:

Probabilidad y Estadística – Dra. Ana M. Craveri. Año 2017 Página 4


Si existen estos dos números reales ( ), el intervalo se denominará: intervalo de
confianza del parámetro θ y la probabilidad se llamará coeficiente de confianza del
intervalo.

Las semi-amplitudes y son indicadores de la precisión de la estimación.


Cuanto mayor es la amplitud del Intervalo de Confianza, mayor es la confianza de que el
Intervalo contenga a θ, pero menor información proporciona sobre el valor de θ o sea
menor es la precisión de la estimación. Lo ideal es, por lo tanto, un Intervalo relativamente
pequeño con un alto nivel de confianza.
El siguiente esquema indica el cálculo de intervalos de confianza para un cierto número de
muestras extraídas de una población que contiene un parámetro desconocido θ.
Los intervalos se representan por segmentos situados por encima del eje vertical que indica
el valor del parámetro θ

Muestra 1 θ
Muestra 2

Muestra 3
Muestra 4

Muestra 5

Muestra 6
Muestra 7

Muestra 8

La figura indica el cálculo de intervalos de confianza del (1-α) % para un número n de


muestras extraídas de una población normal con µ=0 y σ2 = 1
Es de esperar que el (1 – α) % de ellos, aproximadamente, cubrirán el verdadero valor del
parámetro como ocurre con todas las muestras excepto la muestra 4

7.3.- Intervalo de confianza para la media de una población (σ conocida).

Supongamos que se desea contar con una estimación por intervalo del 95%, para el
diámetro promedio de cierta pieza producida por un torno. La desviación estándar σ es
conocida, por estudios previos, y puede considerarse estable en 15 mm. El promedio de una
muestra aleatoria de 40 piezas producidas por el torno es de 85 mm.

Probabilidad y Estadística – Dra. Ana M. Craveri. Año 2017 Página 5


Teniendo la idea de la interpretación de un Intervalo de Confianza para θ, planteamos lo
expresado en el punto anterior, enfocándonos en este caso en θ = µ.
Planteamos:

En este caso asumiríamos una distribución normal para el estadístico x con parámetros µ y
.basándonos en el enunciado del Teorema Central del Límite y en el tamaño de muestra
suficientemente grande considerado. En caso de que se probara la normalidad para la
distribución de los valores de la variable aleatoria X: diámetro de piezas producidas por el
torno podría reducirse el tamaño de la muestra sin pérdida de precisión en la estimación.
Para determinar el intervalo lo que debemos calcular es ε definido como “error de
estimación” Sabemos que si la muestra es aleatoria y la variable X está normalmente
distribuida, entonces:
σ
x ~ N (µ; ) independientemente del tamaño de muestra
n

Si calculamos la variable z:

µ +ε −µ σ
Z= , resulta: ε = z. es decir, ε depende de α
σ n
n
 σ σ 
El intervalo sería entonces P  x − z α . < µ < x + zα .  = 1 − α
 2 n 2 n

Volviendo al ejemplo El intervalo de confianza del 95% para estimar µ es:


15 15
85 − 1,96. < µ < 85 + 1,96.
40 40

Por lo que la estimación de µ será: 80,35<µ<89,65


Se interpreta:
Si se extraen todas las muestras posibles de un mismo tamaño (en este caso n=40) el 95%
de los intervalos calculados cubrirán el verdadero valor del parámetro y sólo un 5% de los
intervalos nos llevarán a sobrestimar o subestimar al parámetro.

7.4. Intervalo de confianza para la media de una población (σ desconocida)


Puede suceder que así como no se conoce la media de una población de valores de la
variable X, tampoco se conozca su desviación estándar, en este caso se la estima a través
del estadístico S calculado con los datos de la muestra.
Probabilidad y Estadística – Dra. Ana M. Craveri. Año 2017 Página 6
Supongamos que el gerente de producción de una empresa que produce alambre, desea
estimar con un 95% de confianza la producción diaria promedio de alambre.. Selecciona de
sus registros una muestra los valores de producción de 20 días en forma aleatoria y calcula
la producción media diaria siendo Kg y S = 34 Kg
En este caso la distribución de probabilidad a utilizar es la t de Student porque se
desconoce σ y n<30 (n=20)

Partiendo de

Entonces el Intervalo de Confianza en este caso será

Cuyos extremos son variables aleatorias ya que dependen de y S cuyos valores varían de
muestra en muestra.
Para una determinada muestra con y el intervalo será:

Cuando la muestra es suficientemente grande (n > 30) como ya lo hemos analizado se


puede admitir que:

En el ejemplo planteado, calculamos un Intervalo de confianza del 95% para :

s 34
x ± t n −1 . = 1250 ± 2,093.
n 20

Podemos concluir que con un 95% de confianza la producción promedio diaria de alambre
está entre 1234,09 y 1265,9 Kg con un 95% de confianza..
Podemos expresar que: tomando todas las muestras posibles de tamaño n = 20, el 95% de
los Intervalos de Confianza que se calcularán a partir de sus promedios muestrales incluirán
a la media poblacional dentro sus límites.

7.5.- Determinación del tamaño de muestra.


Un problema que se presenta con frecuencia es la determinación del tamaño de muestra
necesario para obtener un error estipulado con un nivel de confianza dado.

Probabilidad y Estadística – Dra. Ana M. Craveri. Año 2017 Página 7


σ
Siendo: ε = zα .
2 n
Despejando n, resulta:
2
 z α .σ 
 
n= 2 
 ε 
 

Por lo tanto que n depende de:


• El nivel de confianza.
• El error de muestreo ε estipulado.
• La desviación estándarσ.

En el caso en que σ es desconocido, se estima con S y se utilizará la distribución t de


Student.

Supongamos que el gerente de mercado del ejemplo del punto 7.4 quiera determinar el
tamaño de muestra y que sería aceptable un error máximo de 25 Kg en la estimación ¿en
cuánto se reduce la muestra?

7.6.- Estimación por Intervalo para la proporción.


Nos puede interesar, por ejemplo, conocer la estimación por intervalo de la proporción de la
proporción de piezas defectuosas producidas por un toro.
El mejor estimador puntual del parámetro p de una distribución binomial es ya que
es insesgado y de variancia mínima.

Donde: x = número total de éxitos.(en el ejemplo será el nº de piezas defectuosas) y ;


n = número total de pruebas.(en nuestro ejemplo la producción de un día)

Siendo:

p.q
σ ( pˆ ) =
n

La distribución de es aproximadamente normal cuando n es grande. Por lo que partimos


de esta suposición: teniendo en cuenta que si np y nq son al menos 5, la binomial puede ser
aproximada por la distribución normal entonces, el Intervalo de Confianza será:
 pˆ .qˆ pˆ .qˆ 
P  pˆ − z α . ≤ p ≤ pˆ + z α .  = 1−α
 2
n 2
n 

Ejemplo: en una muestra de 150 piezas extraídas de la producción diaria de una máquina,
30 son defectuosas. Nos interesa estimar la proporción de piezas defectuosas producidas
por la máquina con un nivel de Confianza del 95%

Probabilidad y Estadística – Dra. Ana M. Craveri. Año 2017 Página 8


y

Luego:
0,2 ± 1,96. 0,033

0,2 ± 0,06468

0,13532 ≤ p ≤ 0,26468

Por lo tanto, se estima con un 95% de confianza que la verdadera proporción de piezas
defectuosas está entre 13,5% y 26,5%. de la producción diaria con un 95% de confianza.

7.7.- Determinación el tamaño de muestra para una proporción.

pˆ .qˆ
Siendo: ε = z α .
2
n
Despejando n
2
 zα 
 
Resulta: n =  2  . pˆ .qˆ
 ε 
 
Al calcular el tamaño muestral para estimar una proporción se deben conocer:

• El nivel de confianza que se desea.


• El error de muestreo aceptado: ε.
• La proporción verdadera p de éxitos.

En la práctica, si no se dispone de resultados de experiencias anteriores para el valor de p


debe utilizarse p = 0,5 ya que en este caso el producto p.q logra su máximo valor dando así
la cota superior de n (mayor tamaño muestral posible).

En el ejemplo planteado en 7.6.-, si suponemos que por experiencias anteriores se estima


que la proporción de defectuoso es de 0,20.
Resulta:

¿Qué cantidad de piezas deberán ser muestreados para tener una confianza del 95% de que
el error, utilizando =0.2 como estimador p, sea ≤ 0,05?

Probabilidad y Estadística – Dra. Ana M. Craveri. Año 2017 Página 9


2
 zα 
 
n= 2  . pˆ .qˆ
 ε 
 

Se deberá tomar una muestra de 246 piezas de la producción diaria de esa máquina

Si no conocemos el valor de p y tampoco conocemos alguna estimación de él,


reemplazando por el valor p = 0,5 obtendríamos:
2
 zα 
 2
2
 1,96 
n =   .0,25 =   .0,25 ≅ 385
 ε   0,05 
 

Se observa que al conocer una estimación de p, ya sea a partir de experiencias anteriores


o del cálculo de un estudio piloto, la muestra será menor, manteniendo la precisión y el
nivel de confianza propuestos.

Probabilidad y Estadística – Dra. Ana M. Craveri. Año 2017 Página 10


7.8.- EJERCICIOS

7.8.1.- El gerente de control de calidad de una fábrica de lámparas necesita estimar la vida
promedio de un lote de lámparas. Se sabe que la desviación estándar del proceso es de 100 hs. En
una muestra de 50 lámparas se encontró una vida promedio en la muestra de 350 horas.
a) establecer una estimación de intervalo de confianza de 95% de la vida promedio verdadera de las
lámparas de luz del lote. Interpretar el intervalo de confianza.
b) Es indispensable en este problema que la variable vida útil de lámparas de luz en hs. se distribuya
normalmente? Justificar la respuesta
c) Explicar por qué, si seleccionada al azar una lámpara del lote que tiene una duración 320 hs, no
debería llamar la atención el que no esté dentro de los límites de nuestro intervalo.
d) Explique por qué un intervalo del 99% de confianza no es más preciso que el dado en el punto a)
e) Si es aceptable un error de estimación de ± 35hs ¿En cuánto se reduce el tamaño de muestra sin
modificar el nivel de confianza del 95%?

7.8.2.-El gerente del departamento de servicios al cliente de una compañía telefónica debe estimar
el tiempo promedio en días que transcurre entre la presentación de un reclamo y la prestación del
servicio de reparación. Se seleccionó una muestra aleatoria de 15 reclamos de los registros del año
pasado. Los datos de la muestra son:
114 – 78 – 96 – 137 – 78 – 103 – 117 – 86 – 126 – 99 – 114 – 72 – 104 – 73 – 86
a) Construir un intervalo de 99% confianza para estimar el promedio de días entre la
presentación del reclamo y la atención del mismo.
b) Qué supuesto es indispensable formular con respecto a la distribución de probabilidad de la
variable aleatoria en estudio.

7.8.3.- Al gerente de la Cía. de teléfono le interesa estimar la proporción de familias que


adquirirían una línea adicional a un costo de instalación reducido. Se seleccionó una muestra
aleatoria de 500 familias. Los resultados indicaron que 135 de las familias adquirirían la línea
telefónica adicional a un costo de instalación reducido. Establezca una estimación de intervalo de
confianza de 99% de la proporción verdadera de la población de familias que adquirirían la línea
telefónica adicional a un costo de instalación reducido.

7.8.4.- Al departamento de compras de la empresa llega una partida de filtros de aire. ¿Cuál debe
ser el tamaño de muestra para estimar la proporción de filtros defectuosos del lote si se quiere un
error de estimación de ± 0.07 con un nivel de confianza de 99% y por experiencias pasadas se
puede suponer una proporción de defectuosos de 0.10?

7.8.5.- Con relación al problema anterior calcular el tamaño de muestra en el caso de no contar con
ninguna información sobre la proporción de defectuosos, manteniendo constantes los datos
restantes.

Probabilidad y Estadística – Dra. Ana M. Craveri. Año 2017 Página 11

También podría gustarte