Está en la página 1de 16

MATERIA:

Probabilidad y Estadística

Unidad: 6-2022
UNIVERSIDAD DE EL SALVADOR
Contenidista: Ing. Virginia de Melara Facultad Multidisciplinaria de Occidente
Departamento de Ingeniería y Arquitectura
UNIDAD 6: ESTIMACIÓN
• Objetivos de la unidad:
• Comprender las características que poseen los estimadores.
• Aprender cual es la distribución de probabilidad correspondiente de cada estimador
estudiado.
• Aplicar y resolver ejercicios con intervalos de confianza para la media, para la proporción de
una población, para la media poblacional con muestras pequeñas (o desconocida), para la
diferencia entre medias, para la diferencia entre dos proporciones, para la varianza y el
cociente de dos varianzas.
Conceptos Generales de
Estimación Puntual
La estimación puntual de algún parámetro de la población θ es un solo valor 𝜃෠ de un
.estadístico Θ෡ . Por ejemplo, el valor 𝑥ҧ del estadístico 𝑋ത , que se calcula a partir de una
muestra de tamaño n, es una estimación puntual del parámetro de la población μ. De
manera similar, 𝑝Ƹ = 𝑥/𝑛 es una estimación puntual de la verdadera proporción p para un
experimento binomial.

෡ es un estimador insesgado del parámetro θ si


Se dice que un estadístico Θ

෡ =θ
𝜇Θ෡ = E Θ

Si consideramos todos los posibles estimadores insesgados de algún parámetro θ, al


que tiene la menor varianza lo llamamos estimador más eficaz de θ.
Parámetros y sus Estimadores
Parámetro: característica de la población, como la media y la varianza (o desviación típica)
en la distribución Normal o la probabilidad de éxito en la Binomial son parámetros. Si
.conocemos su valor (o si somos capaces de aproximarlo con suficiente precisión)
podremos responder a cualquier pregunta sobre la distribución.

Estimador: es un estadístico independiente del parámetro de la población, y que se utiliza


para aproximarlo. Si θ es el parámetro de interés, el estimador se denotará por 𝜃. ෠ En el
caso de una población Normal, podemos considerar la media muestral como estimador
de la media poblacional (es decir, 𝑋ത = µ) y la varianza muestral como estimador de la
varianza poblacional (s 2 = σ2). Para una distribución Bi(m, p), donde m denota el número de
pruebas de Bernoulli, la proporción p se puede estimar a partir de la proporción
poblacional (que denotaremos por 𝑝).Ƹ Por tanto, 𝑋, ത s 2 y 𝑝Ƹ son estimadores puntuales de µ,
σ2 (en distribución Normal) y p (en distribución Binomial), respectivamente.
Distribuciones, parámetros y estimadores
Estandarización del
Parámetro Estimador Distribución
estimador
𝑥ҧ − 𝜇
Media: μ 𝑥ҧ 𝜎 N(μ,σ2) (Normal)
𝑁
𝑥ҧ − 𝜇
Media: μ (muestras pequeñas) 𝑥ҧ 𝜎 tn-1 (Student)
𝑁

Proporción de casos en una 𝑝Ƹ − 𝑃 𝑃∗(1−𝑃)


𝑝Ƹ N(P, ) (Normal)
categoría: P (muestras grandes) 𝜎𝑝ො 𝑛

𝑛 − 1 ∗ 𝑠2 2
Varianza: σ2 s2 𝑋𝑛−1 (Chi Cuadrado)
𝜎2
𝜎12 𝑠12 𝑠12 ∗ 𝜎22 𝐹𝑛1 −1,𝑛2 −1 (Fisher-
Cociente de varianzas:
𝜎22 𝑠22 𝑠22 ∗ 𝜎12 Snedecor)
Intervalos de Confianza
El intervalo de confianza está determinado por dos valores dentro de los
cuales afirmamos que está el verdadero parámetro con cierta probabilidad.
Son unos límites o margen de variabilidad que damos al valor estimado,
para poder afirmar, bajo un criterio de probabilidad, que el verdadero valor no
los rebasará. Es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el
parámetro a estimar. Este intervalo contiene al parámetro estimado con una
determinada certeza o nivel de confianza.

En la estimación por intervalos se usan los siguientes conceptos:

• Variabilidad del parámetro: Si no se conoce, puede obtenerse una


aproximación en los datos o en un estudio piloto. También hay métodos
para calcular el tamaño de la muestra que prescinden de este aspecto.
Intervalos de Confianza
Habitualmente se usa como medida de esta variabilidad la desviación típica
poblacional y se denota σ.

• Error de la estimación: Es una medida de su precisión que se corresponde


con la amplitud del intervalo de confianza. Cuanta más precisión se desee
en la estimación de un parámetro, más estrecho deberá ser el intervalo de
confianza, por tanto, menor el error, y más sujetos deberán incluirse en la
muestra estudiada. Se llamará a esta precisión E, según fórmula E = θ2 – θ1.

• Nivel de confianza: Es la probabilidad de que el verdadero valor del


parámetro estimado en la población se sitúe en el intervalo de confianza
obtenido. El nivel de confianza se denota por (1-α), aunque habitualmente
suele expresarse con un porcentaje ((1-α)·100%). Es habitual tomar como
Intervalos de Confianza
nivel de confianza un 95% o un 99%, que se corresponden con valores α de
0,05 y 0,01, respectivamente.

• Valor α: También llamado nivel de significación. Es la probabilidad (en tanto


por uno) de fallar en nuestra estimación, esto es, la diferencia entre la
certeza (1) y el nivel de confianza (1-α). Por ejemplo, en una estimación con
un nivel de confianza del 95%, el valor α es (100-95)/100 = 0,05.

• Valor crítico: Se representa por Zα/2. Es el valor de la abscisa en una


determinada distribución que deja a su derecha un área igual a α/2, siendo
1-α el nivel de confianza. Normalmente los valores críticos están tabulados o
pueden calcularse en función de la distribución de la población. Por ejemplo,
para una distribución normal, de media 0 y desviación típica 1, el valor crítico
Intervalos de Confianza
para α = 0,05 se calcularía del siguiente modo: se busca en la tabla de la
distribución ese valor (o el más aproximado), bajo la columna "Área"; se
observa que se corresponde con -0,64. Entonces Zα/2 = 0,64. Si la media o
desviación típica de la distribución normal no coinciden con las de la tabla,
se puede realizar el cambio de variable t=(X-μ)/σ para su cálculo.

Con estas definiciones, si tras la extracción de una muestra se dice que "3 es
una estimación de la media con un margen de error de 0,6 y un nivel de
confianza del 99%", podemos interpretar que el verdadero valor de la media
se encuentra entre 2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y
3,3 se obtienen restando y sumando, respectivamente, la mitad del error,
para obtener el intervalo de confianza según las definiciones dadas.
Intervalos de Confianza
Para un tamaño fijo de la muestra, los conceptos de error y nivel de
confianza van relacionados. Si admitimos un error mayor, esto es,
aumentamos el tamaño del intervalo de confianza, tenemos también una
mayor probabilidad de éxito en nuestra estimación, es decir, un mayor nivel
de confianza.

Por tanto, un aspecto que debe de tenerse en cuenta es el tamaño muestral,


ya que para disminuir el error que se comente habrá que aumentar el
tamaño muestral. Esto se resolverá, para un intervalo de confianza
cualquiera, despejando el tamaño de la muestra en cualquiera de las
formulas de los intervalos de confianza que veremos a continuación, a partir
del error máximo permitido.
Intervalos de Confianza para la Media
Sea X1, . . . , Xn una muestra aleatoria grande (n > 30) de una población con
media µ y desviación estándar σ, por lo que 𝑋ത es aproximadamente
normal. Entonces un intervalo de confianza 100(1 - α)% para µ es
𝑋ത ± 𝑧𝛼/2 𝜎𝑋ത

donde 𝜎𝑋ത = σ/ 𝑛 . Cuando el valor de σ es desconocido, se puede


sustituir por la desviación estándar muestral s.

En particular,
𝑠
• 𝑋ത ± es intervalo de confianza de 68% para µ.
𝑛
𝑠
• 𝑋ത ± 1.645 𝑛
es intervalo de confianza de 90% para µ.
Intervalos de Confianza para la Media
𝑠
• 𝑋ത ± 1.96 es intervalo de confianza de 95% para µ.
𝑛
𝑠
• 𝑋ത ± 2.58 es intervalo de confianza de 99% para µ.
𝑛
𝑠
• 𝑋ത ± 3 es intervalo de confianza de 99.7% para µ.
𝑛

Ejemplo: La media y desviación estándar muestrales para todos los pesos


ത 12.05 y s= 0.1. Encuentre un intervalo de
de llenado de las 100 cajas son 𝑋=
confianza de 85% para la media de los pesos de llenado de las cajas.
Intervalos de Confianza para la Media
Con el propósito de determinar un intervalo de confianza de 85%, haga 1-
α= 0.85 para obtener α = 0.15 y α/2 = 0.075. Cuando se busca en la tabla a
z.075, el puntaje z que corta 7.5% del área en la cola del lado derecho. Se
𝑠
encuentra z.075 = 1.44. Se aproxima 𝜎𝑋ത ≈ 𝑛 = 0.01. Por lo que el intervalo
de confianza de 85% es 12.05 ± (1.44)(0.01). Esto último se
puede escribir como 12.05 ± 0.0144, o como (12.0356, 12.0644).
Intervalos de Confianza para la
Proporción de una Población
Sea X el número de éxitos en n ensayos de Bernoulli independientes con
probabilidad de éxito p, por lo que X ~ Bin(n, p).

𝑋+2
Se define 𝑛෤ = 𝑛 + 4 y 𝑝෤ = . Entonces un nivel 100( 1- α)% de un intervalo de
𝑛෤
confianza para p es
𝑝(1
෤ − 𝑝) ෤
𝑝෤ ± 𝑧𝛼/2
𝑛෤
Si el límite inferior es menor que 0, se reemplaza éste con 0. Si el superior es
mayor que 1, se remplaza éste con 1.
Intervalos de Confianza para la
Proporción de una Población
Ejemplo: Los métodos de interpolación se usan para calcular las alturas sobre
el nivel del mar para ubicaciones donde las mediciones directas no están
disponibles. En el artículo “Transformation of Ellipsoid Heights to Local Leveling
Heights” (M. Yanalak y O. Baykal, en Journal of Surveying Engineering, 2001:90-
103), se evalúa un método de promedio ponderado de interpolación para
calcular las alturas de mediciones GPS. El método se estableció para interpretar
errores “grandes” (errores cuya magnitud están por encima de umbral
comúnmente aceptado) en 26 de 74 ubicaciones de prueba. Determine un
intervalo de confianza de 90% para la proporción de ubicaciones en las que
este método tendrá errores grandes.
Intervalos de Confianza para la
Proporción de una Población
El número de éxitos es X = 26 y el de ensayos n = 74. Por tanto, se calcula 𝑛෤ =
26+2 𝑝෤ 1−𝑝෤ 0.3590 0.6410
74 + 4 = 78, 𝑝෤ = 78
= 0.3590, y 𝑛෤
= 78
= 0.0543. Para un
intervalo de confianza de 90%, el valor de α/2 es 0.05, por lo que 𝑧𝛼/2 = 1.645.
El intervalo de confianza de 90% es, por tanto, 0.3590 ± (1.645)(0.0543), o
(0.270, 0.448).

También podría gustarte