Está en la página 1de 21

Bloque IV.

- Introducción a
la Probabilidad

Ana Navarro Quiles 1


1 Tema 8. Nociones de inferencia

Ana Navarro Quiles 2


10.1 Estimación puntual.
10.2 Intervalos de confianza.
10.3 Contrastes de hipótesis.

Ana Navarro Quiles 3


Algunos conceptos...

Población: Conjunto de elementos sobre los que se observa un carácter


común.

Muestra: Subconjunto de unidades de una población.

Estimación: A partir de lo observado en una muestra, se extrapola dicho


resultado a la población total.

Ana Navarro Quiles 4


Algunos conceptos...

Existen dos formas de estimar parámetros:


Estimación puntual: se busca un único valor estimado para el parámetro.
Intervalo de confianza: se determina un intervalo dentro del cual se
encuentra el valor del parámetro, con una probabilidad determinada.

Existen diversos métodos para obtener estimaciones puntuales (Momentos,


mínimos cuadrados, máxima verosimilitud...). Pero es muy COMPLICADO
obtener un estimador puntual. Por ello se utiliza más el Intervalo de Confianza
y el Contraste de Hipótesis.

El contraste de hipótesis consiste en determinar si es aceptable, partiendo de


datos muestrales, que la característica o el parámetro poblacional estudiado
tome un determinado valor o esté dentro de unos determinados valores.

Ana Navarro Quiles 5


Intervalos de confianza

El nivel de confianza indica la probabilidad de que el verdadero


valor del parámetro estimado en la población se sitúe en el intervalo
de confianza obtenido. Se denota por 1 − α (aunque usualmente se
expresa como un porcentaje). Es habitual tomar como nivel de
confianza el 95% o 99% (α = 0.05 y α = 0.01, respectivamente).

El nivel de significación es el valor de α. Es la probabilidad de


fallar en nuestra estimación.

El valor crítico se representa por Zα/2 . Es el valor de la abscisa en


una distribución que deja a su derecha un área igual a α/2.

Ana Navarro Quiles 6


Intervalos de confianza para...

La media con varianza conocida. (Varianza de la población!!)


La media con varianza desconocida y n > 30.
La media con varianza desconocida y n < 30.

Intervalo de confianza
Es aquel que cumple que

P −zα/2 < X < zα/2

Ana Navarro Quiles 7


Intervalos de confianza para la media con varianza conocida
 
σ
Sea X ∼ N(µ, σ ), entonces X̄ ∼ N µ, √ .
n
... tipificando .... El intervalo es
 
σ σ
x̄ − zα/2 √ , x̄ + zα/2 √
n n

siendo:
x̄ la media muestral.
σ la desviación típica poblacional.
zα/2 valor de la abscisa de una normal tipificada.
n tamaño de la muestra.

Ana Navarro Quiles 8


Intervalos de confianza para la media con varianza
desconocida y n > 30

Igual que el anterior, pero al no conocer la varianza de la


población, usamos la cuasivarianza definida como
n
s2 = V (x ), V (x ) varianza de la muestra.
n−1
Así, el intervalo es
 
s s
x̄ − zα/2 √ , x̄ + zα/2 √
n n

Ana Navarro Quiles 9


Intervalos de confianza para la media con varianza
desconocida y n < 30

En este caso no podemos aplicar el Teorema central del límite (Al


tener una muestra no representativa), por tanto, en vez de usar la
distribución Normal, usamos la t de student:
 
s s
x̄ − tn−1;α/2 √ , x̄ + tn−1;α/2 √
n n

Ana Navarro Quiles 10


Ejercicio 1
Se ha obtenido una muestra de 15 vendedores de una Editorial para
estimar el valor medio de las ventas por trabajador en la Empresa.
La media y varianza de la muestra son 5 y 2, respectivamente.
Calcular el intervalo de confianza para la venta media por
trabajador en la Editorial al 90%.

Ana Navarro Quiles 11


Ejercicio 1
Se ha obtenido una muestra de 15 vendedores de una Editorial para
estimar el valor medio de las ventas por trabajador en la Empresa.
La media y varianza de la muestra son 5 y 2, respectivamente.
Calcular el intervalo de confianza para la venta media por
trabajador en la Editorial al 90%.
Solución
Se conoce la varianza muestral pero no la poblacional y además n = 15 < 30,
por tanto calculamos el siguiente intervalo
 
s s
x̄ − tn−1;α/2 √ , x̄ + tn−1;α/2 √ = [4.334, 5.666]
n n

x̄ = 5.
r r
n 15
s= V (x ) = 2 = 1.464.
n−1 15 − 1
tn−1;α/2 = t15−1;0.1/2 = t14;0.05 = 1.7613.

Ana Navarro Quiles 11


Ejercicio 2
Se ha obtenido una muestra de 25 alumnos de una Facultad para
estimar la calificación media de los expedientes de los alumnos en
la Facultad. Se sabe por otros cursos que la desviación típica de
las puntuaciones en dicha Facultad es de 2.01 puntos. La media de
la muestra fue de 4.9.
Calcular el intervalo de confianza al 90%.

Ana Navarro Quiles 12


Ejercicio 2
Se ha obtenido una muestra de 25 alumnos de una Facultad para
estimar la calificación media de los expedientes de los alumnos en
la Facultad. Se sabe por otros cursos que la desviación típica de
las puntuaciones en dicha Facultad es de 2.01 puntos. La media de
la muestra fue de 4.9.
Calcular el intervalo de confianza al 90%.
Solución
Conocemos la varianza poblacional, por tanto calculamos el siguiente intervalo
 
σ σ
x̄ − zα/2 √ , x̄ + zα/2 √ = [4.24, 5.56]
n n
x̄ = 4.9.
σ = 2.01.
z0.1/2 = z0.05 = 1.65.

Aproximaciones para el valor zα/2 para los niveles de confianza estándar son
1.64 para 1 − α = 90%(z0.05 = 1.64), 1,96 para 1 − α = 95%(z0.025 = 1.96),
2,56 para 1 − α = 99%(z0.005 = 2.56). Además (z0.1 = 1.28).
Ana Navarro Quiles 12
Contraste de hipótesis
Es una prueba estadística que indica el proceso mediante el cual
decidimos si una proposición respecto de la población, debe ser
aceptada o no.
H0 : Hipótesis nula
H1 : Hipótesis alternativa
H0 es aquella hipótesis que se quiere contrastar y H1 suele ser la
hipótesis experimental.
Tipos de errores:
Error de Tipo I: Rechazar H0 cuando es verdadera.
Error de Tipo II: Aceptar H0 cuando es falsa.
A la probabilidad de cometer un error de Tipo I la denominamos
nivel de significación α.

Ana Navarro Quiles 13


Contraste de hipótesis para la media con varianza conocida

H0 : µ = µ 0
H1 : µ 6= µ0
Región de aceptación:
x̄ − µ0
−zα/2 ≤ √ ≤ zα/2
σ/ n

Si se cumple lo anterior entonces no rechazamos H0 . Lo


"aceptamos" dado que no tenemos suficientes evidencias para
rechazarla.
H0 : µ ≤ µ 0 x̄ − µ0
=⇒ √ ≤ zα
H1 : µ > µ 0 σ/ n
H0 : µ ≥ µ 0 x̄ − µ0
=⇒ √ ≥ −zα
H1 : µ < µ 0 σ/ n

Ana Navarro Quiles 14


Ejemplo
La altura de los estudiantes de la URJC es una VA X ∼ N(µ, 5). Con el
objetivo de estimar µ se toma una muestra de 100 estudiantes y se
obtiene que x̄ = 156.8.
Se quiere contrastar la hipótesis: "La altura media de los estudiantes de
la URJC es de 160 cm" a un nivel de significación α = 0.05.

Ana Navarro Quiles 15


Ejemplo
La altura de los estudiantes de la URJC es una VA X ∼ N(µ, 5). Con el
objetivo de estimar µ se toma una muestra de 100 estudiantes y se
obtiene que x̄ = 156.8.
Se quiere contrastar la hipótesis: "La altura media de los estudiantes de
la URJC es de 160 cm" a un nivel de significación α = 0.05.
Solución
H0 : µ = 1.60 Región de aceptación:
H1 : µ 6= 1.60 −zα/2 ≤ σx̄ −µ
√0 ≤ zα/2
/ n

Con nuestros datos


x̄ − µ0 156.8 − 160
√ = √ = −6.4
σ/ n 5/ 100

Además zα/2 = z0.025 = 1.96.


Conclusión: Como −6.4 no está en la región de aceptación,
rechazamos H0 al nivel de significación 0.05.

Ana Navarro Quiles 15


Ejercicio
Una empresa de neumáticos afirma que una nueva gamma en
promedio dura al menos 28000 km. Las pruebas con 64
neumáticos dan como resultado una duración media de 27800 km,
con una desviación estándar de 1000 km. Comprobar si hay
evidencia suficiente para rechazar la afirmación de la empresa, a un
nivel de significación del 5%.

Ana Navarro Quiles 16


Ejercicio
Un banco quiere analizar si las comisiones que cobra a sus clientes
por operaciones en el mercado bursátil difieren significativamente
de las que cobra la competencia, cuya media es de 12 euros
mensuales con una desviación estándar de 4.3 euros. Este banco
toma una muestra de 64 operaciones bursátiles y observa que la
comisión promedio es de 13.6 euros. Contrastar, al nivel de
significación del 5% que este banco no difiera significativamente en
el cobro de comisiones por operaciones en la Bolsa con respecto a
la competencia.

Ana Navarro Quiles 17


Ejercicio
El propietario de un coche sospecha que su vehículo tiene un
consumo medio de combustible en carretera superior a los 5.6 litros
a los 100, que es lo que el fabricante indica en su publicidad.
Para apoyar empíricamente su sospecha observa el consumo medio
en 11 viajes seleccionados aleatoriamente entre todos los que
realiza en el año, obteniendo

6.1, 6.5, 5.1, 6, 5.9, 5.2, 5.8, 5.3, 6.2, 5.9, 6.3

¿Están fundamentadas las sospechas del propietario a un nivel de


significación del 1%?

Ana Navarro Quiles 18

También podría gustarte