Está en la página 1de 40

Estadística aplicada

Intervalos de confianza para la media


Estimación OJO!!!

Las poblaciones son descriptas mediante sus parámetros


• Para variables cuantitativas, las poblaciones son descriptas
mediante µ y σ
• Para variables cualitativas, las poblaciones son descriptas
mediante p
Si los valores de los parámetros son desconocidos PERO NO SON
ALEATORIOS, podemos estimarlos en base a muestras y
esperamos que sean una buena aproximación al valor exacto
Estimación puntual: se calcula un valor simple a partir de la muestra
a fin de estimar el parámetro

Estimación por intervalo de confianza: se calculan dos números para


crear un rango de valores que se espera contenga al parámetro con
una cierta probabilidad o nivel de confianza

P(LI < ɵ < LS) = 1 - α


Que tan buena es la estimación?
Error muestral
• Es la distancia entre el estimador puntual y el verdadero valor del
parámetro
• Es el error que surge por estudiar a una parte de la población
• Posee las mismas unidades que la variable en estudio
• Su magnitud es desconocida y por la tanto imposible de calcular
con certeza
• Se sabe que disminuye cuando aumenta el tamaño de la muestra
• Si la muestra está diseñada de forma probabilística es posible
controlar su magnitud y dar una estimación del mismo
• Pero para eso es necesario conocer la distribución de
probabilidades (distribución muestral) del estimador
Errores no muestrales?

Otros errores ajenos al muestreo: no respuesta, codificación,


encuestador, encuestado, lógico, de concepción, etc
No disminuye cuando el tamaño de la muestra aumenta
Muy pero muy difíciles de medir
Que tan buena es la estimación?

Nivel de confianza
Es la probabilidad de que el intervalo contenga al parámetro
Se lo simboliza como 1 – α

Lo fija el investigador. Valores típicos de 1 – α = 0,90; 0,95; 0,99

Riesgo
Es la probabilidad de error (no contener al parámetro) y se denomina
también riesgo.
Se lo simboliza α
Es el porcentaje de intervalos que se espera contengan al
parámetro (para ese tamaño de muestra)
Que tan buena es la estimación?
Intervalos de confianza para la media
con desvío poblacional conocido
Distribución muestral de cuando se conoce σ

1. La media poblacional de 𝑋ത 𝜇𝑥ҧ = 𝜇


𝜎
2. El desvío poblacional de 𝑋ത 𝜎𝑥ҧ = 𝑛

3. Si la variable original X es normal o n es lo suficientemente grande


(recordar el TCL) se puede probar que:

𝑋ത − 𝜇
= 𝑍 ∼ 𝑁𝑜𝑟𝑚𝑎𝑙(0,1)
𝜎/ 𝑛
Como calcular el error muestral en la estimación
de µ (siendo σ conocido)?

𝑃 𝑧𝛼Τ2 ≤ 𝑍 ≤ 𝑧1−𝛼Τ2 = 1 − 𝛼
Entre qué valores esperaría que se encuentre
µ?? Intervalo de confianza para µ

𝑃 𝑧𝛼Τ2 ≤ 𝑍 ≤ 𝑧1−𝛼Τ2 = 1 − 𝛼

𝑋ത − 𝜇
𝑃 𝑧𝛼Τ2 ≤ ≤ 𝑧1−𝛼Τ2 = 1 − 𝛼
𝜎/ 𝑛

𝜎 𝜎
𝑃 𝑧𝛼Τ2 ≤ 𝑋ത − 𝜇 ≤ 𝑧1−𝛼Τ2 . =1−𝛼
𝑛 𝑛

𝜎 𝜎
𝑃 𝑋ത − 𝑧1−𝛼Τ2 . ≤ 𝜇 ≤ 𝑋ത + 𝑧1−𝛼Τ2 . =1−𝛼
𝑛 𝑛
Intervalo de confianza para la media cuando el
desvío es desconocido:

𝜎
𝐼𝐶 𝜇 = 𝑋ത ± 𝑧1−𝛼Τ2 . 𝑛
𝜎
𝐸𝑀 = 𝑧1−𝛼Τ2 .
𝑛
Como mejorar la estimación?

Precisión:

Esta dada por el Error Muestral (A menor EM mayor precisión)

Exactitud:

Esta dada por el nivel de confianza 1 − 𝛼


Como mejorar la estimación?

Precisión y Exactitud: Nivel de Zα/2


confianza
0,90 1,645
0,95 1,96

𝑧1−𝛼/2 𝜎 0,99 2,576

𝐸𝑀 = Notar que el desvío es un parámetro


𝑛 poblacional, no puede ser modificado por el
investigador

Si el tamaño de la muestra (n) se mantiene constante, si se quiere mayor


precisión (↓ 𝐸𝑀) hay que ceder en exactitud ↓ (1 − 𝛼).

La única manera de mejorar la precisión sin afectar la exactitud es


aumentando el tamaño de la muestra.

La única manera de mejorar la exactitud sin afectar la precisión es


aumentando el tamaño de la muestra.
De qué depende el tamaño de una muestra?

De los recursos y del presupuesto: $$$


Del tipo de población en estudio

De la variable a estudiar (cuali o cuantitativa)


Del grado de homogeneidad de ésta en la población
Del diseño muestral empleado
Qué se necesita para determinar el tamaño de la
muestra para un promedio?

Los elementos importantes:


Error muestral o margen de error deseado
Nivel de Confianza o de Riesgo, y el valor del fractil de la
distribución asociada a alguno de ellos

Una magnitud de la dispersión o del grado de heterogeneidad de


la variable a estudiar
Supuestos

Para que las estimaciones sean confiables se debe cumplir:

• Muestreo aleatorio probabilístico


• Muestreo de una población supuesta infinita (en la realidad el
tamaño de n es mucho menor que el de la población)
• La variable aleatoria X debe tener distribución normal; en caso
contrario, el tamaño de la muestra debe ser lo suficientemente
grande (n ≥ 30)
• El desvío estándar poblacional σ debe ser conocido
Para realizar un estudio de explotación del un pez de río se
determinó el volumen de 25 ejemplares elegidos al azar y obtuvo
un volumen promedio de 160 ml. Supongamos que la variable
volumen del pez se distribuye en forma aproximadamente normal
con desviación estándar 40 ml.
1.1.- Estimar el volumen medio de la población con una confianza
del 95%.
1.2.- ¿Cuántos ejemplares deberá muestrear el investigador para
estimar el volumen medio ± 14 ml con una probabilidad del 95%?
Holopterus chilensis es un coleóptero barrenador que infesta a
Nothofagus obliqua (roble pellín). Se extrajo una muestra aleatoria
de 30 ejemplares en el lago Lacar, con la que se estimó la longitud
corporal promedio, obteniéndose IC95: 40-45 mm.
Indique si las siguientes afirmaciones son verdaderas o falsas,
justificando su respuesta:

10.1.- El 95% de los ejemplares mide entre 40 y 45 mm.

10.2.- La longitud corporal promedio de los ejemplares del lago Lacar


se encuentra entre 40 y 45 mm.

10.3.- El promedio de la especie se encuentra entre 40 y 45 mm.

10.4.- El 95% de las muestras de 30 ejemplares tienen un promedio


entre 40 y 45 mm.

10.5.- Si se aumenta la confianza el intervalo de confianza se achica


(es más preciso)

10.6.- Si se quiere achicar el intervalo de confianza se debería


aumentar el tamaño de la muestra
Una máquina llenadora de latas de café dosifica cantidades variables
con distribución Normal de desvío estándar 15 gramos. A intervalos
regulares se toman muestras de 10 envases con el fin de estimar la
dosificación media. Una de estas muestras arrojó una media de 246
gramos.

a) Estimar la dosificación media con un 90% de confianza.

b)¿Cuántos envases más habría que pesar para poder obtener una
estimación cuyo error de muestreo fuera 5 gramos?
En una fábrica de materiales eléctricos se desea estimar el peso
promedio del último lote de rollos de alambre de cobre salido de
producción. Para ello se eligió al azar una muestra de 20 que arrojó un
promedio de 38 kg. Se conoce además, de registros históricos, el
desvío poblacional, que vale 4,2 kg.

a) Estimar el peso medio de los rollos con un 95% de confianza.

b)¿Cuántos rollos más habría que pesar para poder obtener una
estimación cuyo error de muestreo fuera 1 kg?.
α/2 μ 1─ α/2
VC ES

EM
Intervalos de confianza para la media
con desvío poblacional desconocido
Distribución muestral de cuando el desvío
estándar poblacional es desconocido
En la práctica es habitual que TODOS los parametros poblacionales
son desconocidos, es decir que ni el promedio µ ni el desvío estándar
σ son conocidos
Como se desconoce σ se utiliza su estimador s mayor
incertidumbre
No es correcto utilizar la distribución normal para

Se demuestra que SIEMPRE Y CUANDO X ES NORMAL la


media muestral en estos casos ajusta a
una distribución conocida como t de Student
Distribución t de Student

Tiene forma acampanada como la normal estándar, pero su


dispersión es mayor (mas aplanada). Esto se debe a que al
desconocer σ hay mas incertidumbre
Es simetrica con respecto al cero.
No se trata de una unica curva, sino de infinitas curvas, cada
una
caracterizada por un parámetro denominado grados de libertad
(GL)
Los GL indican la cantidad de datos independientes.
Los GL dependen del tamaño de la muestra y en este caso
valen n – 1
A medida que aumenta n, mas se asemeja a la normal
estándar.
Distribución muestral de cuando no se conoce σ

1. La media poblacional de 𝑋ത 𝜇𝑥ҧ = 𝜇


𝜎
2. El desvío poblacional de 𝑋ത 𝜎𝑥ҧ = 𝑛 ES DESCONOCIDO!
⇒ Hay que usar el estimador del desvío, el desvío muestral s.

3. Si la variable original X es normal se puede probar que:

𝑋ത − 𝜇
= 𝑇 ∼ 𝑡 𝑑𝑒 𝑠𝑡𝑢𝑑𝑒𝑛𝑡 𝑐𝑜𝑛 𝑛 − 1 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
𝑠/ 𝑛
Intervalo de confianza para µ cuando el desvío
poblacional σ es desconocido

La idea es la misma!

𝑃 𝑡𝑛−1,𝛼Τ2 ≤ 𝑇 ≤ 𝑡𝑛−1,1−𝛼Τ2 = 1 − 𝛼

𝑋ത − 𝜇
𝑃 𝑡𝑛−1,𝛼Τ2 ≤ ≤ 𝑡𝑛−1,1−𝛼Τ2 = 1 − 𝛼
𝑠/ 𝑛

𝑠 𝑠
𝑃 𝑡𝑛−1,𝛼Τ2 . ≤ 𝑋ത − 𝜇 ≤ 𝑡𝑛−1,1−𝛼Τ2 . =1−𝛼
𝑛 𝑛

𝑠 𝑠
𝑃 𝑋ത − 𝑡𝑛−1,1−𝛼Τ2 . ≤ 𝜇 ≤ 𝑋ത + 𝑡𝑛−1,1−𝛼Τ2 . =1−𝛼
𝑛 𝑛
Intervalo de confianza para la media cuando el
desvío es desconocido:

𝑠
𝐼𝐶 𝜇 = 𝑋ത ± 𝑡𝑛−1,1−𝛼Τ2 . 𝑛
𝑠
𝐸𝑀 = 𝑡𝑛−1,1−𝛼Τ2 . 𝑛
Como mejorara la estimación?
Para disminuir el error muestral (mayor precisión):

Tamaño de la muestra
Nivel de confianza
Desvío estándar

𝑠 𝑡𝑛−1,1−𝛼Τ2 .𝑠 2
𝐸𝑀 = 𝑡𝑛−1,1−𝛼Τ2 . ⇒𝑛=
𝑛 𝐸𝑀

Como el n está a ambos lados de la ecuación, se debe utilizar en


método iterativo para calcular el tamaño muestral
Los murciélagos al volar localizan un objeto sólido emitiendo chillidos
agudos y escuchando el eco. Se piensa que el alcance medio máximo
para este sistema de localización por eco es de más de 6 metros. Se
seleccionó una muestra aleatoria de 16 murciélagos. Cada ejemplar fue
soltado en un área grande y cercada, que contenía solo un obstáculo y se
anotó la distancia entre el obstáculo y el murciélago al momento del
viraje. El experimento fue repetido varias veces con cada animal, y para
cada uno de ellos se determinó la distancia media del viraje, con los
siguientes resultados:

6,2 6,8 6,1 5,7 6,1 6,3 5,8 6,3 5,9 6,3 6,4 6,0 6,3 6,2 5,9
6,1
Suponiendo que el alcance máximo sigue una distribución normal
estime con una confianza del 95% la distancia media de viraje de los
murciélagos.

¿Qué conclusión puede extraerse de los datos?


Las ventas de una revista semanal han sido las siguientes (en miles)
en las últimas cuatro semanas: 15,4 - 18,5 - 16,3 - 19,2.
a) Estimar la venta media semanal con un 95% de confianza.
b) ¿Cuántos datos más harían falta para poder dar un intervalo con
un error de muestreo de ± 1 (1.000 ejemplares)?
c) ¿Durante cuántos meses más habría que continuar con la campaña
si se pretende disminuir en un 50% el error muestral de la
estimación anterior?
Las ventas mensuales de un producto son variables con media
700.000 unidades. Durante 5 meses se ha desarrollado una campaña
publicitaria registrándose los siguientes volúmenes de venta en miles
de unidades: 607; 725; 784; 790 y 810.

Estimar el volumen medio de ventas con un 95% de confianza.

También podría gustarte