Está en la página 1de 24

ESTADÍSTICA INFERENCIAL

Estimación de parámetros
Distribución normal
Distribución t-student
Estadística inferencial

Población

1.- Tamaño de muestra

Muestra 2. Tipos de muestreo

4.- Estimación
de parámetros

5.- Contraste de
hipótesis
Estimación de parámetros

El objetivo de este tema es describir cómo se puede realizar la estimación de las características
de una población a partir del estudio de una muestra aleatoria extraída de la misma.

Al estadístico que sirve para realizar una estimación de un parámetro poblacional se le llama
estimador.

Por ejemplo

Para estimar la media μ de una población normal se define el estimador ẍ, y para estimar la
varianza σ2, se define el estimador S^2
Estimación de parámetros
Insesgado
Diremos que un estimador A de un parámetro poblacional B es insesgado, si su media,
coincide con el parámetro poblacional. Es decir
A=B
Por ejemplo, La media aritmética ( ẍ) es un estimador insesgado de la media de una
población (u); y S^2 es un estimador insesgado de la varianza). Sin embargo, S^2ẍ, ), es
un estimador sesgado.

Eficiente
Si se tienen dos estimadores A1, A2 de un parámetro poblacional, se dice que A1 es más
eficiente que A2 si su varianza es menor. Es decir
Propiedades de
σ2A 1 < σ2A2 .
un estimador Por ejemplo: Para la estimación de la media poblacional, los estimadores media
aritmética ẍ y mediana (Me) son insesgados, pero la media es más eficiente que la
mediana (su varianza es menor).

Consistente
Se dice que un estimador es consistente cuando, al crecer el tamaño muestral, se
aproxima asintóticamente al valor del parámetro poblacional y su varianza se hace nula.
Es decir
Lim A = B ( parámetro)
n--- ∞
Liim σA2 = 0
Estimación de parámetros

Estimación puntual
Cuando se determina un único valor de un estimador que se
aproxime al parámetro poblacional desconocido se dice que
se hace una estimación puntual.

Métodos de
estimación

Existen dos procedimientos


para realizar la estimación de
un parámetro poblacional.

Estimación por intervalo


Cuando, alternativamente, se calculan dos valores entre los
cuales se considera que, con cierta probabilidad, se
encuentra el parámetro poblacional, el procedimiento se
conoce como estimación por intervalos de confianza.
Estimación de parámetros

Métodos de
estimación
Estimación puntual
Cuando se determina un único valor de un estimador que se
Existen dos procedimientos
aproxime al parámetro poblacional desconocido se dice que se
para realizar la estimación
de un parámetro hace una estimación puntual.
poblacional.

Una estimación puntual es el valor concreto que toma el


estimador puntual en una muestra en particular. En general, a
cada parámetro poblacional se le pueden asociar diferentes
estimadores puntuales aunque normalmente se elegirán
aquellos que sean insesgados y más eficientes.

Evidentemente, no se espera que un estimador puntual


proporcione sin error el parámetro poblacional, sino que se
pretende que las estimaciones puntuales no se alejen mucho
del valor desconocido a calcular..
Estimación de parámetros

Estimadores de la distribución Normal


Si tenemos una distribución normal N(μ, σ). Como estimadores
puntuales de los parámetros poblaciones μ y σ2 normalmente se
utilizan la media aritmética Ẍ y la varianza muestra S2
respectivamente.

Estimadores Estimador de la distribución Binomial


puntuales Si tenemos una distribución binomial de parámetro p (probabilidad
de éxito). Como estimador puntual de p se usa la proporción de
según
éxitos P, definida como el número de éxitos dividido por el número de
distribución ensayos (o frecuencia relativa de éxitos).Este estimador es
insesgado. Es decir E(P) = p.

Estimador de la distribución de Poisson


Una distribución de Poisson, donde λ, o número medio de sucesos
por intervalo e el parámetro poblacional a determinar. Sean X1,X2, . .
. ,Xn los números de resultados obtenidos en n experimentos
(muestra de tamaño n). Entonces, un estimador puntual para λ es la
media muestral. Este estimador es insesgado, es decir E(λ) = λ,
Estimación de parámetros

Estimación puntual
Cuando se determina un único valor de un estimador que se
aproxime al parámetro poblacional desconocido se dice que
se hace una estimación puntual.

Métodos de
estimación

Existen dos procedimientos


para realizar la estimación de
un parámetro poblacional.

Estimación por intervalo


Cuando, alternativamente, se calculan dos valores entre los
cuales se considera que, con cierta probabilidad, se
encuentra el parámetro poblacional, el procedimiento se
conoce como estimación por intervalos de confianza.
Estimación de parámetros
Métodos de
estimación Estimación por intervalo
Cuando, alternativamente, se calculan dos valores entre los
Existen dos procedimientos cuales se considera que, con cierta probabilidad, se
para realizar la estimación de
un parámetro poblacional.
encuentra el parámetro poblacional, el procedimiento se
conoce como estimación por intervalos de confianza.

Generalmente, una estimación puntual no proporciona un valor exacto del parámetro poblacional a
determinar. Es más, en la mayoría de los casos, no tendremos información sobre la precisión de tal
estimación,
de forma que su valor único no nos informa sobre la probabilidad de que se encuentre cerca o lejos del valor
verdadero. En la practica, interesa no solamente dar una estimación, sino precisar la incertidumbre de dicha
estimación. Esto se consigue mediante la estimación por intervalos de confianza en la cual se calcula un
intervalo sobre el que podamos establecer que, con cierta probabilidad, esta contenido el parámetro
poblacional desconocido De esta manera, en vez de calcular un único estimador, se determinan dos
estimadores que serán los limites inferior (L1) y superior (L2) (o limites de confianza) de un intervalo de
confianza I = [L1,L2]. A

Al ser el estimador por intervalo una variable aleatoria, podrá decirse que existe una cierta probabilidad de
que el intervalo aleatorio cubra el verdadero valor del parámetro poblacional β.
Es decir P(L1 < β < L2) = 1 − α,
Tamaño de muestra
Por definición, a 1−α se le llama nivel de confianza y al intervalo [L1,L2] se le denomina intervalo de
confianza del (1 − α)100%
En otras palabras, el 100(1 − α)% de los intervalos correspondientes a todas las muestras posibles del mismo
tamaño contienen a (u) y el 100α% no lo contienen.

Si consideramos
u
u un nivel de
confianza (NC) con
sus valores de Z

NC y el error estándar
(1-α)% de la media (eem)
(α/2)% (α/2)%

El intervalo contiene a la media poblacional con un


determinado nivel de confianza
Estimación por intervalos de confianza

Distribución normal
Población desconocida Población conocida

Muestras
grandes
Cuando la muestra ( n > 30) Cuando la muestra (n > 30)
Se remplaza σ por s de la muestra Se remplaza σ por s de la muestra

Muestras
pequeñas

N: población N: población
muestra (n ≤ 30) Muestra (n ≤ 30)
t : es la t -student t : es la t -student

Generalmente en química se suele trabajar con poblaciones


desconocidas
Estimación de parámetros
Distribución t-studente

La distribución t-student, es una distribución aleatoria continua, cuando se tiene un


tamaño de muestra ( n) pequeño ( n≤30)

El campo de variabilidad de la variable t de Student es desde de −∞ a + ∞ y su


función de densidad depende de los grado de libertad, expresados con gl = n-1

La función de densidad es simétrica alrededor de t = 0. Su forma es campaniforme,


siendo más achatada para valores bajos de n, cuando n aumenta se tiende a la curva
normal tipificada(N(0, 1)). En general, la curva normal es una buena aproximación de la
distribución t cuando
n ≥ 30.
Estimación de parámetros
Distribución t-studente
Distribución t-studente
t-student, dos colas

NC %
α/2 α/2

- t (α/2; gl(n-1) t=0 +t (α/2; gl(n-1)

t-student, una cola

Cola Cola derecha


Izquierda

NC % NC %
α α

- t (α; gl(n-1) +t (α; gl(n-1)


α

gl=n-1
Estimación de parámetros
Estimación por intervalos

Para muestras independientes


Las muestras independientes son mediciones
realizadas en dos conjuntos de elementos distintos

Estimación por
intervalos

Para muestras pareadas


Tenemos muestras pareadas cuando a un mismo
individuo se le aplica un mismo tratamiento antes
y después y se mide el efecto producido
Estimación de parámetros
Estimación por intervalos
MUESTRAS INDEPENDIENTES
Muestras grande (n >30)

Ejemplo
Las mediciones de la cantidad de cloroformo (microgramos por litro) de 40 muestras de
agua potable de una ciudad produjeron los siguientes resultados: media (Ẍ ) = 34,8 ug/Ly
varianza (s^2) =24,0 (ug/L)^2. Calcule e interprete un intervalo de confianza de 95%,
para la cantidad promedio de cloroformo del agua potable de esta ciudad.

Datos
n = 40
Media = 34,8 ug/L Como n > 30, remplazamos (σ) por (S) de la muestra
Varianza (s^2) = 24,0 (ug/L)^2
Des. Estándar (S) = √(24,01) = 4,9
NC = 95%
IC = ?
Z(α/2) = 1,96

u
Estimación de parámetros
Estimación por intervalos
MUESTRAS INDEPENDIENTES
Muestras pequeñas (n ≤ 30)
Se sabe que el contenido alcohólico del vino es de 11°, para comprobar esto se toma una
muestra de 6 botellas y se analiza e contenido alcohólico obteniéndose los siguientes
resultados 10,9 …11,1 …11,5 …11,7 … 11,8 … 13,9; se trabajo al 95% de confianza.

Antes de realizar los cálculos vamos a analizar los datos para ver si se tiene datos
dudosos.

10,9 …11,1 …11,5 …11,7 … 11,8 ………………………………………13,9

Vemos que el dato 13,9 esta bastante alejado de los demás; para saber si se acepta o se
elimina este dato, vamos a aplicar el estadístico Q de Dixon.
La Q de Dixon depende del tamaño de muestra (n) y del nivel de confianza que se
trabaje.

Análisis
Si Q (expe) ≤ Q (tabulada) Se acepta el dato
Q (expe) > Q (tabulada) Se elimina el dato
Estimación de parámetros
Estimación por intervalos
Estimación por intervalos

Buscamos el valor de la Q (tabulada) para n = 6, NC 95% ( α = 5% = 0,05)


Se obtiene una Q (tabulada) de 0,57

Q (expe) > Q (tabulada)


0,7 > 0,57 Se elimina el dato

n ° Alcohol
Buscamos el valor de la t en la tabla de t-student,
1 10,9 para t(α/2; gl)
2 11,1
(α/2); 0,05/2 = 0,025
3 11,5 gl =(n-1) 0 5-1 = 4
u= 11
4 11,7 t(0,025;4) = 2,776
5 11,8
Media 11,4
Desv.
Estan 0,39
Estimación por intervalos
Si quisiéramos reducir el intervalo a la mitad (I) = 0,48/2 = 0,24; que tamaño de muestra
(n) se deberá toma
El intervalo esta dado por ecuación

De aquí despejamos n, y tenemos


Usamos el mismo valor de t original

Como queremos disminuir el ancho del intervalo a la mitad; es decir: I = 0,48/2 = 0,24
Remplazamos en la ecuación despejada; el valor de t es el mismo original que calculamos

n=5

n = 20
Estimación de parámetros
Estimación por intervalos
MUESTRAS PAREADAS
Muestras pequeñas (n ≤ 30)
Ejemplo
Se quiere estudiar si la actividad física afecta a los signos vitales, para ello se selecciona a 5 individuos, se
les mide la presión arterial inicial, como se indica en la tabla siguiente, luego se pide que cada individuo
corran 5 kilómetros y se mide la presión arterial final.
Determine la presión arterial con su intervalo de confianza; se trabajó al 95% de confianza
Persona Presión inicial Presión final
1 117 120
2 118 121
3 115 118
4 120 123
5 117 120

Buscamos el valor de la t en la tabla de t-student,


d n para t(α/2; gl)
Presión
Persona Presión final (diferencia (pares de (α/2); 0,05/2 = 0,025
inicial
de medias) medias) gl =(n-1) 0 5-1 = 4
1 117 120 3 1 t(0,025;4) = 2,776
2 117 121 4 2
3 115 118 3 3
4 120 118 -2 4 u
5 115 120 5 5
Promedio (d) 2,6
Des Esta (d) 2,70
Estimación de parámetros
Estimación por intervalos
Análisis

Si el intervalo contiene al cero no existe diferencia en entre la presión inicial y final


------(-------0-------------------------)-----

Si el cero quedo a la izquierda del intervalo significa que la presión final aumento
respecto a la inicial

--0---(--------------------------------)-----

Si el cero quedo a la derecha del intervalo significa que la presión final disminuyó
respecto a la inicial, y los valores del intervalo fueran negativos
--- --(--------------------------------)---0-

También podría gustarte