Está en la página 1de 3

Universidad Nacional Agraria La Molina Departamento de Manejo Forestal

FR2010 SEMINARIO EN ESTADISTICA FORESTAL

CONCEPTOS
SOBRE ESTIMACIONES Y ESTIMADORES – Primera Parte1

Los datos de la muestra nos permiten hacer estimaciones de los parámetros de la población.
Parámetros notables para los cuales deseamos proporcionar estimaciones son: la media de la
población, µ; la diferencia entre dos medias poblacionales, µ1-µ2; una determinada proporción
poblacional, p; la diferencia entre dos proporciones poblacionales, p1-p2; la varianza de la población,
σ2 y la razón entre dos varianzas poblacionales, σ21/σ22 .
Un estimador es un procedimiento, expresado a manera de regla o fórmula, por medio del cual se
obtiene un valor numérico denominado estimación. La fórmula representa el estimador, mientras que
el resultado numérico es la estimación. x
Un buen estimador θˆ del parámetro poblacional θ es aquel cuya media obtenida a partir de todas las
muestras aleatorias que sea posible extraer, con un tamaño n dado, de la población que interesa, es
igual al parámetro, lo que significa que se trata de “un estimador insesgado”.
Así, µ x , el valor promedio de x calculado a partir de todas las muestras aleatorias posibles de un
tamaño determinado extraídas de la población, es igual a µ. Cuando el muestreo se hace con
reemplazo, la varianza muestral s2=∑(xi- x )2/(n-1) es un estimador insesgado de la varianza
poblacional σ2==∑(xi-µ)2/N. Cuando el muestreo se hace sin reemplazo, la varianza muestral s2=∑(xi-
x )2/(n-1) es un estimador insesgado de la varianza poblacional S2==∑(xi-µ)2/(N-1).
Cada una de las muestras posibles de obtener de la población de interés arrojarán una estimación.
Unas estimaciones estarán más cerca del parámetro que se está calculando que otras. La construcción
de un intervalo nos permite establecer el grado de confianza que se puede tener de que el intervalo
incluya dentro de sus valores límite el parámetro que se estima. El intervalo se denomina intervalo de
confianza.

Intervalo de confianza (I.C.) para una media poblacional


1. Construcción del I.C. para la media de una población normalmente distribuida, siendo σ2 conocida.
La probabilidad de que una muestra aleatoria simple de tamaño n produzca una media x que se
encuentre entre dos puntos x a y x b puede expresarse como:
P( x a ≤ x ≤ x b) = 1 - ∝
Si ambos puntos están a igual distancia de la media µ x = µ, y expresamos esta distancia en términos
de errores estándar, entonces podemos escribir:
x a = µ - k(σ/√n), x b = µ + k(σ/√n)
donde k indica la cantidad de errores estándar que representa la distancia.
La primera expresión de probabilidad puede ahora escribirse así:
P[µ - k(σ/√n) ≤ x ≤ µ + k(σ/√n)] = 1 - ∝
Observe el siguiente gráfico:

1-∝

∝/2 ∝/2

x
µ - k(σ/√n) µx =µ µ + k(σ/√n)

1
Responsable: Ing.For. Carlos R. Vargas Salas
Fuente principal: Daniel, Wayne 1988. Estadística con aplicaciones a las ciencias sociales y a la educación.
McGraw-Hill. México. 504 p.

Página 1 ConceptosEstimadores Parte-I.doc


Universidad Nacional Agraria La Molina Departamento de Manejo Forestal
FR2010 SEMINARIO EN ESTADISTICA FORESTAL

Dado que el estadístico x sigue una distribución normal, cuando la expresión 1-∝ tiene un valor
definido entonces se puede reemplazar k por un valor z.
Así, cuando 1-∝ = 0.95, k=1.96 y la ecuación anterior se convierte en:
P[µ - 1.96(σ/√n) ≤ x ≤ µ + 1.96(σ/√n)] = 0.95
Por álgebra puede transformarse la fórmula anterior en la que sigue:
P[ x - 1.96(σ/√n) ≤ µ ≤ x + 1.96(σ/√n)] = 0.95
Ella expresa que “la probabilidad de que el parámetro desconocido µ esté entre dos puntos que se
ubican a 1.96 errores estándar de distancia de la media muestral x , es igual a 0.95”.
A diferentes valores de 1-∝ les corresponderán diferentes valores z. Así, a una probabilidad de 0.99
le corresponderá un valor z igual a 2.58.
Volviendo al factor k y a las distancias medidas en errores estándar a partir de la media muestral, si
obtuviéramos una serie numerosa de muestras aleatorias de tamaño n y para cada una construimos un
intervalo, tendremos una serie de intervalos [ x 1 ± k(σ/√n), x 2 ± k(σ/√n), x 3 ± k(σ/√n), . . .], todos
de la misma amplitud. Como el promedio de las muestras fluctúa alrededor de la media poblacional,
los intervalos de confianza también fluctuarán, determinando que una proporción igual a 100(1-∝)%
de ellos contenga a µ.

∝/2 ∝/2

µx = µ x
x1

xn
I.C.

Cuando se desea calcular una media poblacional, no se requiere extraer de la población una serie
numerosa de muestras aleatorias simples, sino solamente una. Si denotamos con x 0 la media de tal
muestra única obtenida en una situación normal, el intervalo que se puede construir para la estimación
de µ será:
x 0 ± k(σ/√n)
Este intervalo es apenas uno de muchos intervalos, de los cuales el 100(1-∝)% de ellos contiene a µ.
La expresión correspondiente a la probabilidad de ocurrencia de la media poblacional en el intervalo
de confianza del 100(1-∝)% es:
C[ x 0 - k(σ/√n) ≤ µ ≤ x 0 + k(σ/√n)] = 1-∝
Donde C indica que se trata de un enunciado de confianza más que de probabilidad. En la expresión,
1 - ∝ se denomina coeficiente de confianza e indica el grado de confianza que tenemos en que nuestro
intervalo único contenga a µ. El coeficiente de confianza expresado en forma de porcentaje recibe el
nombre de nivel de confianza.
Las constantes k de la expresión se cambian en valores z∝/2 cuando se selecciona el valor del
coeficiente de confianza. z∝/2 es llamado factor de confiabilidad y (σ/√n) es el error estándar del
estimador.

Página 2 ConceptosEstimadores Parte-I.doc


Universidad Nacional Agraria La Molina Departamento de Manejo Forestal
FR2010 SEMINARIO EN ESTADISTICA FORESTAL

2. Construcción del I.C. para la media de una población normalmente distribuida, siendo σ2
desconocida.
La desviación estándar de la muestra, s = ∑ (xi − x )2 (n − 1) , se utiliza como estimación de σ ;
entonces, s/√n, estimación de la desviación estándar de la población de medias, reemplaza a σ/√n en
la ecuación.
Pero es la cantidad ( x - µ)/(σ/√n) la que se distribuye como la variable normal estandarizada z y no
el valor ( x - µ)/(s/√n). Cuando la población de la que proviene la muestra se aproxima a la normal,
este último valor sigue una distribución conocida como distribución t de Student, con n-1 grados de
libertad.
Curva de distribución t para n1-1

Curva normal z
Curva de distribución t para n2-1

Curva de distribución t para n3-1

n1 > n2 > n3
∝/2 1-∝ ∝/2

-2 -1 0 1 2 t

Por ello, en lugar de z utilizamos un valor t para el enunciado de confianza:


C[ x 0 – t∝/2,n-1(s0/√n) ≤ µ ≤ x 0 + t∝/2,n-1(s0/√n)] = 1-∝
donde s0 es la desviación estándar de la muestra específica extraída. t∝/2, n-1 señala el valor de t donde
la ordenada define, en cada cola de la curva de la distribución t correspondiente a n-1 grados de
libertad, una probabilidad igual a ∝/2. Los valores t se encuentran en tablas de “percentiles de la
distribución t”, donde figuran organizados en columnas, correspondientes al percentil 1- ∝ de interés,
y filas, correspondientes a los grados de libertad determinados por el tamaño de la muestra de donde
proviene s0.
3. Construcción del I.C. para la media de una población no distribuida normalmente
Cuando se obtiene una muestra de una población que no se distribuye normalmente, el tamaño n
debe ser grande (≥ 30), porque la distribución muestral de x no es normal cuando las muestras son
pequeñas y han sido extraídas de poblaciones no distribuidas normalmente. El teorema del límite
central nos permite resolver los casos de poblaciones no normales infinitas (o cuando el muestreo se
hace con reemplazamiento) con la fórmula indicada en el subtítulo 1, es decir:
C[ x 0 – z∝/2(s0/√n) ≤ µ ≤ x 0 + z∝/2(s0/√n)] = 1-∝
Como se observa, puede utilizarse el valor z aún cuando se desconoce el valor de la desviación
estándar de la población, σ, debido a que el tamaño de la muestra es grande y entonces la distribución
de los valores x – µ/(s0/√n) se aproxima bastante a la distribución normal estandarizada. Aunque es
deseable contar con muestras grandes, sin embargo, es usual emplear el valor t tabular
correspondiente, según los grados de libertad y el nivel de confianza.
Cuando el muestreo se hace en una población finita que no está distribuida normalmente, y el
muestreo es sin reemplazamiento, entonces debe incluirse en la fórmula el factor de corrección para
poblaciones finitas (cpf), como se muestra en la siguiente fórmula:

(
C x − tα / 2 , n −1 ( s 0 / n )
N −n
N −1
≤ µ ≤ x + tα / 2 , n −1 ( s 0 / n )
N −n
N −1
) = 1−α
Normalmente, el factor cpf puede dejarse de lado si la muestra representa sólo una pequeña
proporción de la población (esto es, si n/N es menor o igual a 0.05)

Página 3 ConceptosEstimadores Parte-I.doc

También podría gustarte