Está en la página 1de 17

2. Estimación.

2.1 Introducción. 1

2.2. Características de un estimador. 2

2.3. Estimación puntual. 3

2.4. Estimación de intervalo. 4

2.4.1. Intervalos de confianza para medias. 5

2.4.2. Intervalo de confianza para la diferencia de medias. 6

2.4.3. Intervalos de confianza para la proporción. 7

2.4.4. Intervalos de confianza para la diferencia de 8


proporciones.
2.4.5. Intervalos de confianza para la varianza. 9

2.4.6. Intervalo de confianza para la relación de varianzas. 10

2.5. Determinación del tamaño de muestra. 11

2.5.1. Basado en la media de la población. 12

2.5.2. Basado en la proporción de la población. 13

Conclusión 15

Bibliografía 16
2. Estimación.
2.1. Introducción.
A la inferencia estadística le interesa sacar conclusiones de una gran población,
fundándose en las observaciones de una parte de la muestra.
La estadística nos proporciona herramientas que formalizan y uniforman los
procedimientos para sacar conclusiones siempre que las muestras seleccionadas
sean representativas de la población que han sido extraídas. Esta
representatividad permite extender los valores que describen a las muestras, tales
como la media, la desviación típica, un coeficiente de correlación, a la población
correspondiente, es decir, la media o la desviación típica pueden tomarse como
estimadores de los parámetros μ y σ, valores que caracterizan a la población.

pág. 1
2.2. características de un estimador
1) Sesgo. Se dice que un estimador es insesgado si la Media de la distribución del
estimador es igual al parámetro.
Estimadores insesgados son la Media muestral (estimador de la Media de la
población) y la Varianza (estimador de la Varianza de la población):

Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho
un muestreo aleatorio (número de muestras= 10000, tamaño de las muestras=
100) y hallan que la Media de las Medias muestrales es igual a 5.09, (la media
poblacional y la media de las medias muestrales coinciden). En cambio, la
Mediana de la población es igual a 5 y la Media de las Medianas es igual
a 5.1 esto es, hay diferencia ya que la Mediana es un estimador sesgado.
2) Consistencia. Un estimador es consistente si aproxima el valor del parámetro
cuanto mayor es n (tamaño de la muestra).
Algunos estimadores consistentes son:

Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho
tres muestreos aleatorios (número de muestras= 100) con los siguientes
resultados:

vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el
mismo valor que la Media de la población.
3) Eficiencia. Diremos que un estimador es más eficiente que otro si la Varianza
de la distribución muestral del estimador es menor a la del otro estimador. Cuanto

pág. 2
menor es la eficiencia, menor es la confianza de que el estadístico obtenido en la
muestra aproxime al parámetro poblacional.
Ejemplo
La Varianza de la distribución muestral de la Media en un muestreo aleatorio
(número de muestras: 1000, n=25) ha resultado igual a 0.4. La Varianza de la
distribución de Medianas ha resultado, en el mismo muestreo, igual a 1.12, (este
resultado muestra que la Media es un estimador más eficiente que la Mediana).

2.3. Estimación puntual.

El objetivo de la estimación puntual es aproximar el valor del parámetro


desconocido (tiempo medio de ejecución de un algoritmo, altura media de las
mujeres de una población, diferencia del resultado medio entre dos tratamientos
médicos, proporción de gente que mejora con un tratamiento médico…)

Para ello se utiliza la información de la muestra (x1,x2,…,xn)(x1,x2,…,xn), a


través de un estimador.
Algunos estimadores frecuentes son:

 Media muestral, para estimar la media teórica de una variable XX.

¯ x=x 1+ ⋯+ xnnx ¯ =x 1+ ⋯+ xnn

 Proporción muestral, para estimar una proporción pp:

ˆp=x 1+ ⋯+ xnn , p ¿ x 1+⋯ + xnn , siendo x 1 , … , xnx 1, … , xn una muestra aleatoria


simple de la variable X∈B(1,p)X∈B(1,p), es decir, son unos o ceros.

 Varianza muestral: para estimar la varianza teórica de una población, se


puede usar la varianza de una muestra:

S 2=( x 1−¯ x )2+⋯ +(xn−¯ x) 2 n , S 2=( x 1− x ¯ )2+ ⋯+( xn−x ¯ )2 n,


y también la llamada

 Cuasi-varianza muestral:

S 2 n−1=(x 1−¯ x ) 2+ ⋯+(xn−¯ x)2 n−1 , Sn−12=( x 1−x ¯ )2+ ⋯+(xn−x ¯ ) 2 n−1 ,

que corresponde a la varianza de la muestra, pero dividiendo por n−1n−1, en


lugar de dividir por n.

métodos para obtener estimadores.

pág. 3
El demostrar que un cierto estimador cumple estas propiedades puedes ser
complicado en determinadas ocasiones. Existen varios métodos que nos van a
permitir obtener los estimadores puntuales. Los más importantes son:

 Método de los momentos: se basa en que los momentos poblacionales y


se estiman mediante los momentos muestrales. Suelen dar estimadores
consistentes.
 Método de mínimos cuadrados: consiste en obtener un estimador que
hace mínima una determinada función.
 Método de máxima verosimiltud: consiste en tomar como parámetro
poblacional el valor de la muestra que sea mas probable, es decir, que
tenga mayor probabilidad. Se suelen obtener estimadores consistes y
eficientes. Es el mas utilizado.

La probabilidad de que la media muestral sea igual a la media poblacional es cero,


p [ X̄=μ ] =0, es decir, que será bastante complicado obtener un estimador puntual,
por ello se utiliza mas el intervalo de confianza y el contraste de hipótesis.

2.4. Estimación de intervalo

La estimación por intervalos consiste en establecer el intervalo de valores donde


es más probable se encuentre el parámetro. La obtención del intervalo se basa en
las siguientes consideraciones:
a) Si conocemos la distribución muestral del estimador podemos obtener las
probabilidades de ocurrencia de los estadísticos muestrales.
b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la
probabilidad de que el estimador se halle dentro de los intervalos de la distribución
muestral.
c) El problema es que el parámetro poblacional es desconocido, y por ello el
intervalo se establece alrededor del estimador. Si repetimos el muestreo un gran
número de veces y definimos un intervalo alrededor de cada valor del estadístico
muestral, el parámetro se sitúa dentro de cada intervalo en un porcentaje conocido
de ocasiones. Este intervalo es denominado "intervalo de confianza".

Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la
distribución Normal, y resulta:

pág. 4
La distribución de las Medias muestrales aproxima al modelo Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias


muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución


muestral son los valores cuya función de distribución es igual a 0.975 y 0.025
respectivamente y se pueden obtener en las tablas de la distribución Normal
estandarizada o de funciones en aplicaciones informáticas como Excel).
Seguidamente generamos una muestra de la población y obtenemos su Media,
que es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral, el
parámetro poblacional (5.1) está incluido dentro de sus límites:

2.4.1. Intervalos de confianza para las medias.

Dada una variable aleatoria con distribución normal N ( μ , σ ), el objetivo es la


construcción de un intervalo de confianza para el parámetro μ, basado en una
muestra de tamaño n de la variable.

Se puede presentar 2 tipos:

pág. 5
 Varianza conocida
 Varianza desconocida

Varianza conocida

Para obtener el intervalo de confianza para la media con varianza conocida, se


utiliza la siguiente expresión.

Varianza desconocida

Dad una muestra X1….Xn, el estadístico.

Se distribuye según una t-student de n-1 grados de libertad. Por tanto, el intervalo
de confianza resultante es:

Donde tα /2 es el valor de una distribución t-Student con n-1 grados de libertad que
deja a su derecha una probabilidad de α /2.

2.4.2. Intervalos de confianza para diferencia de medias.

pág. 6
Para construir intervalos de confianza para la diferencia de medias poblacionales
se hace uso de la distribución en el muestreo de la diferencia de medias
muestrales.
Se sabe que si X 1 n ( μ , σ ) ∀ i=1,2 , ….. n son variables aleatorias independientes,
entonces:
σ
X̄ N ( μ , )
√n
Y, por lo tanto, si las distribuciones de las variables Xi son normales, cualesquiera
σ
sean los tamaños muestrales, se verificará que X̄ N ( μ , ),i=1,2.
√n
También se sabe que para muestras independientes se puede asegurar que la
distribución de la diferencia de medias muestrales es
σ 12 σ 22 si las distribuciones de las variables de X1 son
̄
X̄ 1− X 2 N (μ 1−μ 2
normales.
√ +
n1 n2
)

2.4.3. Intervalos de confianza para la proporción.


En la inferencia sobre una proporción el problema se concreta en estimar y
contrastar la proporción p de individuos de una población que presentan una
determinada característica A (proporción de votantes a un partido político,
proporción de parados, ...). El problema se modeliza mediante una variable
dicotómica que toma el valor 1 si se presenta la característica de interés y 0 en
caso contrario, esto es, una variable de Bernoulli, ,de la que se dispone
de una muestra de tamaño n. Entonces, la proporción poblacional p no es otra
cosa que la media poblacional de dicha variable, estimándose con la
correspondiente proporción muestral o media muestral, .

En el caso de dos poblaciones, se trata de comparar la proporción en la que se


presenta una cierta característica A en las mismas (comparar la proporción de
voto a un partido en dos regiones, comparar la proporción de parados entre
hombres y mujeres, ...). El problema se modeliza mediante dos variables de
Bernoulli independientes, de las que se dispone de sendas muestras aleatorias de
tamaño y , respectivamente.

pág. 7
2.4.4. Intervalos de confianza para diferencias de proporciones.
Si dos muestras independientes de tamaño nx y ny se extraen de poblaciones
infinitas con distribuciones binomiales, X representa el numero de observaciones
de la primera muestra que corresponde a la clase en cuestión, entonces la
distribución de muestreo para la diferencia de proporciones esta dada por

Donde Z N (0,1)
De la definición se obtiene el intervalo de confianza de dos lados para la diferencia
de proporciones, con un nivel de confianza de ( 1−∝ ) 100 % , el cual es

Intervalo de confianza para la diferencia de medias, casos especiales.


Existen algunos casos especiales para los intervalos de confianza de diferencia de
medias. El primero de ellos es cuando se tiene datos apareados, o en pares, es
decir, las muestras aleatorias no son independientes y tienen el mismo tamaño. El
segundo de ellos, que queda poco más allá del objetivo del presente curso, se
tiene cuando las muestras son pequeñas, independientes, con distribuciones
aproximadamente normales con varianza desconocidas y diferentes.
Datos en pares
Cuando se observa datos en pares y se espera que exista una fuerte correlación
entre cada pareja de datos, se debe generar una nueva variable aleatoria para
construir el intervalo de confianza.
Sea la variable aleatoria Di=X1i-X2i,…..,n, entonces:

pág. 8
μ D=E ( D ) =μ 1−μ2

Y el intervalo se puede generar mediante:

Donde D y Sd son la media y la desviación estándar muestrales, que se calculan


mediante:

2.4.5. Intervalos de confianza para varianza.


De una población con distribución normal con media y varianza S se obtiene una
muestra aleatoria de tamaño n. Para obtener el intervalo de confianza para la
varianza ( LS 2 ) se tiene la siguiente expresión (1):

nS2 nS2

1-09/2 oc/2

Ejemplo

La varianza de la resistencia a la rotura de 30 cables probados fue de 32.000 lbs 2


. Halle un intervalo de confianza del 90 por ciento, para la varianza de la
resistencia de todos los cables de esta marca.

Solución. Se utiliza la expresión 2.6. Los valores de Z„oy Zl-«n pertenecen a una
distribución chi-cuadrado con 29 grados de libertad. cómo puede observarse en la
figura I el área que hay por debajo de X$2, es 0,05, el valor es: 17,71 y el área
que hay por debajo de X 1_oc/2 2 es 0,95, por lo tanto, el valor de la Ji cuadrado
es de 42,56

pág. 9
17.71 42,56

Figura 1 Percentiles de la distribución chi-cuadrado

(Ver tabla B.3 Valores críticos de ji cuadrada, texto guía)

Reemplazando en la expresión (1) se obtiene:

30(32.000) 30(32.000)
42? 56 17,71

2.4.6. intervalos de confianza para la relación de varianzas.


Para estimar un intervalo de confianza para la varianza, nos ayudaremos de la

siguiente propiedad de la distribución :

Consideremos dos cuantiles de esta distribución que nos dejen una

probabilidad en la ``zona central'' de la distribución

pág. 10
Entonces un intervalo de confianza al nivel para la varianza de una
distribución gaussiana (cuyos pares metros desconocemos) lo obtenemos

teniendo en cuenta que existe una probabilidad de que:

Por tanto, el intervalo que buscamos es

2.5. determinación del tamaño de muestra.


Varios autores coinciden en que una decisión importante en cualquier
investigación es la selección adecuada del tamaño muestral (Montgomery [29],

pág. 11
Gutiérrez y de la Vara [13]). Marrugat et al. [42] sostiene que la estimación del
tamaño muestral puede considerarse un instrumento del que dispone el
investigador para evaluar la factibilidad y la necesidad de recursos de su proyecto.
Sin embargo, la utilización de hipótesis verosímiles deberá prevalecer sobre otros
intereses como las posibilidades económicas, la disponibilidad de recursos u otros.
No es ético realizar un estudio con un tamaño de muestra que no ofrezca un poder
estadístico suficiente, ya que, desde el punto de vista de la metodología científica,
el diseño no es adecuado. Kerlinger y Lee [37] y Camacho-Sandoval [38], afirman
que para aquellos investigadores que llevan a cabo grandes investigaciones
donde el costo de la recolección de datos es alto, la determinación del tamaño de
muestra resulta crítica, ya que el interés radica en conseguir la mejor información
al menor costo:
 Un tamaño de muestra demasiado grande representa un desperdicio de
recursos, tanto materiales como humanos (Fuentelsaz [40]). Además, la
calidad del estudio, dado dicho incremento, puede verse afectada en
sentido negativo (Fernández [39]).
 Un tamaño demasiado pequeño es un desperdicio de esfuerzo, pues no
podrá detectar un efecto significativo o se tendrán menos probabilidades de
hacerlo.
Kerlinger y Lee [37] manifiestan que aunque la mayoría de los investigadores
tratan de simplificar los conceptos y procedimientos implicados, el proceso de
determinación del tamaño muestral para estudios de investigación no resulta
trivial ni sencillo. De hecho, afirman que es uno de los problemas más difíciles
en la estadística aplicada.
Namakforoosh [34], Kerlinger y Lee [37] y otros autores, mencionan el uso de
métodos con reglas intuitivas sin justificación alguna. Uno de ellos es calcular
el tamaño muestral con base en una proporción del tamaño de la población
(2%), otra es asignar arbitrariamente un valor grande (2000). Ninguna de estas
opiniones es válida.

2.5.1. basado en la media de la población.


el error máximo que se puede tolerar en la estimación de una media poblacional,
cuando se conoce la desviación poblacional y la población es infinita depende:
 Del intervalo de confianza fijado para estimar la media poblacional, 1−α
 De la desviación estándar poblacional,σ
 Del tamaño muestral,n0
En la práctica no es fácil determinar estas tres cantidades, y las debe estimar un
experto en la materia; es decir una persona muy familiarizada con las variables

pág. 12
que se van a estudiar. 95% es el nivel de confianza más común, pero si se desea
un nivel de confianza mayor se usa 99%, y si se desea un nivel menor se usa
90%. En cuanto al error de muestreo, no debe pensarse en qué cantidad de error
se desea (en realidad no se quiere tener errores) sino cuánto se puede tolerar
para poder proporcionar conclusiones adecuadas al estudio. También se debe
disponer de una estimación de la desviación poblacional, que en algunos casos se
la realiza a partir de datos históricos o experiencia del experto, o también se puede
llevar a cabo un estudio piloto para estimarla con los datos muestrales.
Despejando de n0 (2), el mínimo tamaño de muestra para no exceder el error
máximo, tomando en cuenta una población infinita viene dado por la expresión:

En todo el artículo la notación n0 designa el tamaño muestral para población


infinita, y n, se refiere al tamaño muestral para población finita. Si la población es
finita, se conoce el tamaño poblacional N, el error máximo viene dado por:

N −n
donde la expresión se conoce como el multiplicador de población finita, que
N−1
es un factor de ajuste, y se utiliza para rebajar la varianza muestral estimada
(Namakforoosh [34]). Despejando n de la ecuación (4):

2.5.2. basado en la proporción de la población.


Según Berenson, Levine y Krehbiel [1], los métodos para la determinación del
tamaño muestral de una proporción son similares a los empleados para estimar la
pág. 13
media poblacional. El error máximo que se desea tolerar al estimar una proporción
poblacional, cuando se conoce la varianza poblacional y para población infinita,
viene dado por:

donde P es una proporción patrón de la población. De esa manera, el tamaño


muestral viene dado por la expresión:

Cuando no se tiene conocimiento de P o no se puede estimar mediante una


muestra piloto, generalmente se usa el valor de 0,5 ya que este valor dará como
resultado el tamaño de muestra más conservador, es decir, el mayor tamaño de
muestra. Si la población es finita, el error máximo viene dado por:

Si se despeja el tamaño muestral, se obtiene:

pág. 14
Conclusión.
Después de leer y analizar esta unidad llegue a la breve conclusión que el objetivo
principal de la estadística inferencial es la estimación, esto es que mediante el
estudio de una muestra de una población se quiere generalizar las conclusiones al
total de la misma. Como vimos en el desarrollo de temas anterior, los estadísticos
varían mucho dentro de sus distribuciones muestrales, y mientras menor sea el
error estándar de un estadístico, más cercanos serán unos de otros sus valores.
Existen dos tipos de estimaciones para parámetros; puntuales y por intervalo. Una
estimación puntual es un único valor estadístico y se usa para estimar un
parámetro. El estadístico usado se denomina estimador. Una estimación por
intervalo es un rango, generalmente de ancho finito, que se espera que contenga
el parámetro.

pág. 15
Bibliografías.
 https://explorable.com/es/distribucion-de-muestreo
 https://bookdown.org/aquintela/EBE/estimacion-puntual.html
 https://www.uv.es/webgid/Inferencial/5_estimacin_por_intervalos.html
 http://www5.uva.es/estadmed/inferen/estima_inter/intervalos3.htm
 https://www.uv.es/webgid/Inferencial/42_caractersticas_estimadores.html
 file:///C:/Users/jesus/Downloads/0311%20(4).pdf

pág. 16

También podría gustarte