Está en la página 1de 19

UNIDAD I

ESTIMACION DE PARAMETROS
La estimación de parámetros consiste en asignar un valor concreto al parámetro o
parámetros que caracterizan la distribución de probabilidad de la población. Cuando se
estima un parámetro poblacional, aunque el estimador que se utiliza posea todas las
propiedades deseables, se comete un error de estimación que es la diferencia entre la
estimación y el verdadero valor del parámetro. El error de estimación es desconocido
por lo cual es imposible saber en cada caso cual ha sido la magnitud o el signo del
error; para valorar el grado de precisión asociado con una estimación puntual se parte
de dicha estimación para construir un intervalo de confianza. En síntesis, un intervalo
de confianza está formado por un conjunto de valores numéricos tal que la probabilidad
de que éste contenga al verdadero valor del parámetro puede fijarse tan grande como
se quiera. Esta probabilidad se denomina nivel de confianza del intervalo, y la amplitud
de éste constituye una medida del grado de precisión con el que se estima el parámetro

Importancia de la estimación de parámetros

En muchas situaciones de la vida cotidiana se hace necesario realizar estimaciones, y


que se desconoce el valor de las características de la población, por ejemplo quien
ganara una elección, la aceptabilidad de un producto en el mercado etc. Cuando estas
situaciones tienen trascendencia las estimaciones deben ser realizadas con cierta
grado de confiabilidad, es aquí donde la estadística inferencial interviene para lograr
medir la bondad de las estimaciones.

En la mayoría de las situaciones se desconoce el verdadero valor de los parámetros y


es muy difícil o casi imposible motivado a lo costosos de estudiar a toda la población.
En este sentido, uno de los mayores aportes de la estadística inferencial son las
estimaciones del valor el parámetro a partir de una muestra tomada de esa población.
Estimación

Se define como la inferencia del valor numérico de la de una población a partir de la


información contenida en una muestra extraída de la misma. Dicho de otra manera, es
el cálculo del valor de un parámetro a través de la muestra, por ejemplo si se desea
calcular el valor de la media poblacional µ, se puede calcular la media de la muestra
elegida X y atribuir éste valor a µ

Esta puede ser puntual o por intervalos

Estimación puntual

Es el proceso mediante el cual se determina una cifra única para el parámetro que se
esté estimando. También se define como el valor único que se utiliza para estimar un
parámetro desconocido, La estimación puntual en muchas ocasiones se considera
insuficiente puesto que no permite medir la confiabilidad de la estimación, ya que se
está ignorando la magnitud del error que puede acompañarlo. Consiste en asumir que
el parámetro tiene el mismo valor que el estadístico en la muestra.

Estimación por intervalos

Es el proceso mediante el cual se determina un intervalo dentro del cual, de alguna


forma es probable que el parámetro este contenido. También se define como un rango
de valores que se utilizan para estimar un parámetro desconocido. En la estimación por
intervalos, el error puede ser medido puesto que la estimación permite que el
estadístico asocie una probabilidad con el intervalo.

Se asigna al parámetro un conjunto de posibles valores que están comprendidos en un


intervalo asociado a una cierta probabilidad de ocurrencia. También se llaman
“intervalos de confianza” debido a que la probabilidad asociada a ellos es la confianza
de los mismos. También se define la confianza de la estimación como la probabilidad
de acertar con el intervalo.
El problema que presenta la estimación puntual de un parámetro reside en que no
garantiza ni mide la precisión de la estimación. Solo la bondad de ajuste y el tamaño de
la muestra, pueden proporcionar una mayor o menor confianza en la estimación
obtenida. Por esta razón es necesario dar, junto a la estimación, una medida del grado
de confianza que se merece. Esto se consigue mediante un intervalo de confianza, que
proporciones unos límites (L i- Ls) entre los cuales se encuentre el valor desconocido
del parámetro. Esta confianza de inclusión se mide mediante un porcentaje, de tal
manera que si éste, es el 1-α entonces, de que allí se encuentre el valor exacto o
verdadero del parámetro desconocido. Se resume así: P [L i ≤ µ ≤ Ls] = 1-α

Nivel de confianza
Es la probabilidad de que el intervalo contenga el verdadero valor del parámetro. Al
nivel de confianza se le simboliza 1-α y comúnmente, se utilizan los valores de 90,
95byb 99 % como medidas que se posee en ese intervalo. En consecuencia para

 Para un nivel de confianza del 90% entonces Z = 1,64


 Para un nivel de confianza del 95% entonces Z = 1,96
 Para un nivel de confianza del 99% entonces Z = 2,58
Los valores de Z se les denominan coeficiente de confianza, cuyo valor lo proporciona
la tabla de distribución normal estándar

Error máximo admisible

Conocido comúnmente como error muestral € y está definido como la diferencia entre el
parámetro ( real ) y el estadígrafo ( estimado) de modo tal que: X - µ = Z σ x por tanto e = Z
σx el cual corresponde a la mitad del ancho o longitud del intervalo, de tal forma que::
 Los valores del tamaño de la muestra n y σ, la longitud del intervalo disminuye
cuando el nivel de confianza 1-α disminuye.
 Dado un nivel de confianza 1-α y σ la longitud del intervalo disminuye al
aumentar el tamaño de la muestra, al tener un intervalo más angosto hay mayor
precisión en la estimación

Propiedades de los estimadores

 Insesgado: cuando el valor esperado del estadístico es el mismo valor del


parámetro. E (θ) = θ w}el sesgo de un estimador insesgado es igual a cero
 Eficiente: Cuando posee la menor varianza dentro de un grupo de estimadores
del parámetro
 Consistente: cuando el tamaño de la muestra aumenta el valor de estimado se
aproxima al parámetro
 Suficiente; cuando el estimador aprovecha la mayor cantidad de información
existente en la muestra

Caso 1: Intervalo de confianza para μ con σ conocida.


Sea X N(μ,σ )
σ
Sea X N (μ, )
√n
Luego, el intervalo de confianza es:

Li ≤ µ≤ Ls

Es de gran importancia conocer el tamaño de la muestra, por la condición de que ella


debe ser representativa de la población objeto de estudio, debemos calcularla bajo la
siguiente fórmula
2 2
Z .
n  2
e

Dónde:
Z: valor que buscamos en la tabla según el nivel de confianza.
σ : Desviación típica poblacional (es un dato del ejercicio)
e: error muestral ( dato del ejercicio)

Problema resuelto
El gerente de control de calidad de una fábrica de bombillos de luz necesita
estimar la vida promedio de un gran cargamento de bombillos. En una muestra de
50 bombillos se encontró una vida promedio de 350 horas. Establezca una
estimación por intervalo con una confianza del 95 % para la verdadera vida
promedio del cargamento de bombillos. Suponga que la distribución de la

población es Normal con una desviación típica de 100 horas.

Datos:
μ=? Formula del intervalo de confianza:
n = 50

X
= 350
1 - α = 0,95
σ = 100

Población normal, σ conocida

Lo primero que se debe hacer, es definir las variables:


X: Tiempo de vida N ( μ=? , σ = 100)
σ
X : Tiempo de vida promedio N ( μ=?, = 100/√ 50 = 14,14)
√n
Nota:
Si el nivel de confianza (centro de la curva) es = 0,95, entonces las colas de la curva
valen 0,025, es decir, 0,05 /2 = 0,025.
Si entramos a la tabla negativa con esa probabilidad (centro de la tabla), observarán
que el valor de Z es -1,96. Pero como la distribución es simétrica, del otro lado de la
curva, ese mismo valor es igual a 1,96.

Ahora sólo corresponde sustituir en la fórmula:

Entonces sustituyendo queda:

100 100
(350 – 1,96. ≤ μ ≤ 350 + 1,96. )
√50 √50
322,3 ≤ μ ≤ 377,7)

Interpretación: Se estima que la vida promedio de toda la población de bombillos, está


comprendida entre 322,3 y 377,7 horas, con una confianza del 95%

Realice los siguientes cambios:

 Use un nivel de confianza del 90%


 Use un nivel de confianza del 99%
 Grafique los tres intervalos e interprete

Veamos ahora un ejemplo donde tengamos que calcular primero el tamaño de la


muestra

Una Universidad Privada desea estimar la edad promedio de los estudiantes graduados
en Ingeniería, por experiencia se sabe que la desviación típica de la edad es de 3,5
años. Con una confianza del 95% y admitiendo un error muestral de 1,2 años:
a) ¿De qué tamaño deberá ser la muestra para hacer la estimación?
b) Suponga que la investigación dio como resultado una media de 21,5 años.
Estime la edad promedio poblacional con un 90% de confianza.

Nota: observen que no tenemos el tamaño de la muestra. De hecho, ese es el apartado


a)
Datos :
μ=? Formula del intervalo de confianza:

n=?
X = 21,5
1 - α = 0,95
σ = 3,5
e = 1,2

a)
2 2
Z .
n  2
e
Recuerden que para un nivel de confianza del 95%, el valor de Z ±1,96
2 2
1, 96 . 3 ,5
n= 2 = 33 estudiantes
1 ,2

b) Para éste apartado, es necesario definir las variables:

X: Edad N ( μ= ? , σ = 3,5 )

σ
X : Edad promedio N ( μ= ? , = 3,5/√ 33 = 0,61 )
√n
Nota:
Si el nivel de confianza (centro de la curva) es = 0,90, entonces las colas de la curva

valen 0,05, es decir, 0,10 /2 = 0,05.


Si entramos a la tabla negativa con esa probabilidad (centro de la tabla), observarán
que el valor de Z es -1,64 ó -1,65 Pero como la distribución es simétrica, del otro lado
de la curva, ese mismo valor es igual a 1,64 ó 1,65. Pueden escoger cualquiera de los
dos valores de Z
Ahora sólo corresponde sustituir en la fórmula:

Entonces sustituyendo queda:


3,5 3,5
(21,5 – 1,64. ≤ μ ≤ 21,5 + 1,64. )
√33 √ 33

(20,5 ≤ μ ≤ 22,5)
Interpretación: Se estima que la edad promedio de toda la población de estudiantes de
Ingeniería, está comprendida entre 20,5 y 22,5 años, con una confianza del 90%

CASO 2 INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIÓN NORMAL,


VARIANZA DESCONOCIDA (n≤ 30) muestra pequeña

Sea X N ( μ , σ desconocida )
s
Sea X N (μ, ) y X ~ t (n-1) gl
√n

Cuando no se conoce el valor de la varianza o desviación típica de la población, como


generalmente ocurre, se debe utilizar la estimación insesgada S para sustituir a σ en
este caso la distribución muestra del estadístico media será una distribución T student
con n-1 grado de libertad

La fórmula de intervalo es (𝑥̅− 𝑡 𝑆 √𝑛 < 𝜇 < 𝑥̅+ 𝑡 𝑆 √ )

Igualmente, el tamaño muestral optimo viene dado por

Formula
Problema resuelto

Los beneficios semanales de las empresas del Municipio Naguanagua se distribuyen


normalmente, se seleccionan una muestra de 25 empresas, alas que se les calculó el
beneficio, obteniéndose una media de 20.000 Bs y una desviación típica de 4500 Bs.
Con una confianza del 90% entre que beneficios promedios se encuentran ubicadas las
empresas de Naguanagua.

Sea X N Beneficios ( μ , σ desconocida )

Datos :
μ=¿ n = 25 t (25-1) gl t (24) gl t (24, 0.05 ) = 1,711

X = 20.000
𝑆 = 4500
1 – α = 0, 90

Aplicando la formula

4500 4500
(20.000 – 1,711. ≤ μ ≤ 20.000 + 1,711. )
√ 25 √ 25

(18.461 ≤ μ ≤ 21.539)

Interpretación

Se estima que los beneficios promedios mensuales de todas las empresas ubicadas en
Naguanagua, se encuentran comprendidos ente 18.461 y 21.539 Bs con un nivel de
confianza del 90%
Otro problema

Las piezas en ciertos procesos de fabricación se producen a una tasa de 13,8 unidades
por hora. Existe un equipo alterno que disminuye el tiempo que requiere cada pieza
dentro del proceso productivo. La inversión inicial y el mantenimiento son un poco
costosas, por lo que el nuevo equipo debe garantizar una producción mayor a 15
unidades por hora para lograr cierto retorno de la inversión. Para tomar una decisión al
respecto se hace una prueba con 14 equipos, obteniéndose los siguientes resultados:

15—15.8—14.6—14.9—13.9—14.7—16.0—14.7—15.6—15.6—16.0—14.9—15.8—15.3

Si el número producidas sigue una distribución normal

a) Con base a un intervalo del 99%. Cuál es su recomendación?


b) Suponiendo que el muestreo anterior era una muestra piloto. Cuantos equipos
deben probarse para tener una confianza del 99% de que la media de las
muestras este dentro de0,35 unidades por hora del verdadero parametro?

Sea X N Producción ( μ , σ desconocida )

Datos:
Población normal
μ=¿ n = 14 t (14-1) gl t (13) gl t (24, 0..005 ) = 3,012

X = 15.3 según cálculos


𝑆 = 0.6263 según cálculos
1 – α = 0, 99
Aplicando la formula
0 .6263 0 .6263
(15.3 – 3,012. ≤ μ ≤ 15.3 + 3,012. )
√14 √14

(14.7 ≤ μ ≤ 15.7)

Interpretación
Con un 99% de confianza se estima que la verdadera media del tiempo de producción
por pieza se encuentra entre 14.7 y 15.7 unidades por hora. El criterio para decidir si
cambia o no el equipo debe basarse en el criterio de ≥ 15 puesto quees el limite impuesto
para que la inversión sea rentable. En este caso, no se recomendaría se adquiera el equipo por
cuanto la condición no se cumple.

CASO 3 INTERVALO DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL

Sea X una variable aleatoria que se distribuye Binomialmente, de parámetros n y p se


escribe:
X ~ B ( n, p )
Por lo tanto, Defino la variable p


p ~ N (µ = P, σ = p∗q )
n

Luego, el Intervalo de Confianza para la Proporción Poblacional P es:

( p-Z
√ p∗q ≤
n
P ≤ p+Z
√ p∗q
n
)

Siendo:
p : Proporción muestral

X
p= q=1-p
n

Z: valor en la tabla de la Normal


P: Proporción poblacional
Problema: Con el propósito de estimar la proporción de estudiantes que asisten a
cursos paralelos, se analizó una muestra aleatoria de 200 estudiantes, resultando que
45 de ellos asisten a dichos cursos. Construya e interprete un intervalo de confianza del
90% para la verdadera proporción de estudiantes que asisten a los cursos paralelos.
Datos:
P =? Formula del intervalo de confianza

n = 200 p-Z
√ p∗q ≤
n
P≤ p +Z
√ p∗q
n
)

1 - α = 90%
X= 45
X 45
p= p= = 0,225 ≈ 0,23 q = 1-0,23 = 0,77
n 200
Lo primero que se debe hacer, es definir las variables:

X : Número de estudiantes que asisten a cursos paralelos : B(n=200 , P = ? )

σ
p: Proporción de estudiantes que asisten a cursos paralelos N ( μ= P , =
√n
100/√ 50 = 14,14 )

Aplicando la fórmula: ( p - Z
p∗q ≤
n √
P≤ p +Z
√ p∗q
n
)

p = 0,23 q = 0,77
Para 1 - α = 90%. El valor de Z es ± 1,64 ó 1,65

Entonces el intervalo es:

( 0,23 – 1,64.
√ o , 23∗0,77 ≤
200
P ≤ 0,23 + 1,64.

o , 23∗0,77
200
)

( 0,18 ≤ P ≤ 0,28 ) = ( 18% ≤ P ≤ 28%)

Ahora la interpretación……
Interpretación: Se estima que la proporción de estudiantes que asisten a cursos
paralelos, está comprendida entre 18% y 28%, con una confianza del 90%

Vamos a suponer ahora que no tenemos el tamaño de la muestra! Entonces la


calculamos con la siguiente formula :
Z2
n= 4∗e
2 Cuando se desconoce proporción poblacional
PQ Z 2
n= e
2 Cuando se conoce proporción poblacional

Donde:
Z valor en la tabla de la Normal
e: error muestral (dato del ejercicio)

Vamos a hacer un ejercicio


Una organización de salud se interesa en actualizar su información con respecto a la
proporción de hombres que fuma. Esta piensa que por lo menos el 40% de los
hombres fuman y con la idea de probarlo, la organización selecciona una muestra
utilizando un 95% de confianza y un error máximo del 2,8%.
a) De qué tamaño deberá ser la muestra?
b) Suponga que después de realizar la investigación se obtiene que 429 personas
tiene hábitos de fumar. Con un nivel de confianza del 90%, pruebe si la
información suministrada por la muestra apoya lo indicado por la organización de
salud
Solución:
Lo primero que debemos observar es que hay una premisa (algo que está por
demostrarse):
Por lo menos el 40% de los hombres fuman
Datos:
• Por lo menos el 40% de los hombres fuman
• 1 - α = 95% ( Z± 1,96)
• e = 2,8 % = 0,028
• X = 429 ( número de hombres que fuman)
a) De qué tamaño deberá ser la muestra?
2 2
Z 1,96
n= 4∗e
2 = 2
4 (0,028 )
= 1225 hombres
b) Suponga que después de realizar la investigación se obtiene que 429 personas tiene
hábitos de fumar. Con un nivel de confianza del 90%, pruebe si la información
suministrada por la muestra apoya lo indicado por la organización de salud.

Ahora definimos las variables:

X: Número de hombres que fuman ~ B ( n = 1225, P = ? )

p : Proporción de hombres que fuman ~ N (µ = P, σ = √ p * q /n )


Entonces debemos calcular p= x/n = 429/1225 = 0,35 , luego q = 0,65
Por otra parte, Observen que el nivel de confianza cambia a 90%, entonces Z ± 1,64
Estamos listos para aplicar la fórmula del intervalo de Confianza:

( p-Z
√ p∗q ≤
n
P≤ p +Z
√p∗q
n
)

(0,35 – 1,64 √ 0,35∗0,65/1225 ≤ P ≤ 0,35 + 1,64√ 0,35∗0,65/1225 )

(0,35 – 0,022 ≤ P ≤ 0,35 + 0,022) = (0,328 ≤ P ≤ 0,372) =

(32,8% ≤ P ≤ 37,2% )

Interpretación:
Se estima que la proporción de hombres que fuman, está comprendida entre 32,8% y
37,2%, con una confianza del 90%

Opinión:
La Organización de salud está equivocada en su afirmación: Por lo menos el 40% de
los hombres fuman, debido a que el intervalo completo está por debajo de 40%.

OTRO EJERCICIO
En la Alcaldía de Valencia se desea evaluar la proporción de familias, habitantes del
municipio, que cuentan con ingresos inferiores al sueldo mínimo. Si ese porcentaje
supera el 30% , se le asignará un bono único anual a las familias de bajos ingresos.
Se pide:

a) ¿A cuántas familias se deberá encuestar, si se utiliza un nivel de confianza de 95%


y un error máximo admisible de 8%?
b) Suponga que al observar la muestra, se determina que 58 familias tienen un
ingreso inferior al sueldo mínimo. Con un nivel de confianza del 95% ¿Cuál será
la decisión de la Alcaldía en cuanto a la asignación del nuevo bono de ayuda
familiar?
Solución :
1,96 2
a) n= = 4∗0,08 2 = 150 familias

Solución:

b) Suponga que al observar la muestra, se determina que 58 familias tienen un


ingreso inferior al sueldo mínimo SM. Con un nivel de confianza del 95% ¿Cuál será la
decisión de la Alcaldía en cuanto a la asignación del nuevo bono de ayuda familiar?
Ahora definimos las variables:

X: Número de ~ B ( n = 150, P = ? )


p : Proporción de familias que tienen ingreso inferior al SM ~ N (µ = P, σ = p∗q )
n

Entonces debemos calcular p= x/n = 58/150 = 0,387 0,39, luego q = 0,61

Observen que seguimos con el mismo nivel de confianza del 95%, entonces, Z ± 1,96
Ahora aplicamos la fórmula del intervalo de confianza

( p-Z
n√
p∗q ≤
P≤ p +Z
p∗q
n
)

( 0,39 – 1,96 √ 0,39∗0,61/150 ≤ P ≤ 0,39 + 1,96 √ 0,39∗0,61/150 )

(0,39 – 0,078 ≤ P ≤ 0,39 + 0,078 ) = (0,312 ≤ P ≤ 0,468 )

( 31,2% ≤ P ≤ 46,8%)

Interpretación:
Se estima que la proporción de familias que tienen ingreso inferior al SM, está
comprendida entre 31,2% y 46,8%, con una confianza del 95%

Opinión:
Como el intervalo completo (ambos límites) están por encima del 30%, entonces la Alcaldía
asignará un bono único anual a las familias de bajos ingresos

Ejercicio propuesto
Suponga que la empresa tiene dos formas de ventas: crédito y contado, siendo de su
interés situar las ventas a crédito en menos de un 23% con la idea de incorporar
nuevas formas de ventas. Para tal fin, selecciona una muestra con un nivel de
confianza del 95% y con un error máximo del 8%.
¿Cuántas ventas deberá seleccionar para hacer la investigación?
b) Suponga que una vez hecha la investigación, se obtuvo un resultado de 23 ventas a
crédito. Utilizando un nivel de significación del 5%, ¿Se puede afirmar que la empresa
logrará la incorporación de nuevas formas de ventas?
CASO 4

Si tenemos una muestra de tamaño n tomada de una población normal, podemos


obtener un intervalo de confianza del nivel dado (90%, 95%, 99%, etc) para la varianza
sabiendo que el valor de chi cuadrada es para este caso:

El cual es una variable aleatoria que tiene una distribución Chi cuadrada con n -1
grados de libertad. Por lo tanto, podemos emplear esta definición para estimar un
intervalo de confianza ya que lo que necesitamos es que donde es el valor de Chi
cuadrada para los grados de libertad y nivel de confianza (1 - α) especificado.

Propiedades de la Chi- Cuadrado

 Los valores de X2 son mayores o iguales que 0.


 La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay un
número infinito de distribuciones X2.
 El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
 Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden
a la derecha; esto es, están sesgadas a la derecha

Estos son los límites del intervalo de confianza ( 1- α ) 100% para la varianza de la
población

Problema resuelto

El peso de los sacos de cemento tienen una varianza de 0,5 Kg 2. Se prueba un nuevo
método de llenado con la finalidad de disminuir la varianza en el contenido de los sacos.
Se aplica el nuevo método y s posteriormente se toma una muestra de 21 sacos
resultando una varianza de 0,21 Kg2

a) Estime la varianza de los pesos en los sacos de cemento para el nuevo proceso
con un nivel de confianza del 95%
b) Con base al resultado anterior, cuál sería su recomendación?

Asuma que el contenido de los sacos es una variable aleatoria normal

Sea X peso de los sacos ( μ , σ ? )

Aplicando la fórmula

❑ ❑
( 21−1 ) 0.21 ( 21−1 ) 0.21
≤σ≤
2
34,2 9,59

0,1228 ≤ σ2 ≤ 0,4379

Interpretación

La recomendación de utilización del nuevo método debe basarse en el criterio σ2≤ 0.5
kg2 En este sentido se recomienda que se utilice el nuevo método, ya que reduce la
variabilidad en el contenido de los sacos. Esta recomendación se basa en el intervalo
obtenido, ya que se observa el mismo, el limite superior es menor que la varianza del
procesos anterior, por todo

Valor inferior 0,025; 20 = 34,2

Valor superior 0,975; 20 = 9,59

También podría gustarte