Está en la página 1de 55

INFERENCIA

ESTADÍSTICA
INFERENCIA ESTADISTICA

INFERENCIA ESTADISTICA
METODOS PROPIEDADES POBLACION

1. CONCEPTO DEDUCIR


INFERIR DE
MUESTRA
PROCEDIMIENTOS
CONCLUIR

INFORMACION ESTIMAN
INCOMPLETA PARAMETROS
CIENCIA
GENERA
EXPERIMENTAL MODELOS
MUESTRA
CONJUNTO
OBSERVACIONES CONTRASTAN
HIPOTESIS

HAY DECISION ES APROPIADO

MODELO DETERMINAR
PREVENSION
NO
APROPIADO
Estimaciones puntuales e intervalos de
confianza
 Estimación puntual: Estadístico calculado a
partir de la información obtenida de la muestra y
que se usa para estimar el parámetro
poblacional.
 Intervalo de confianza: Un conjunto de valores
obtenido a partir de los datos muestrales, en el
que hay una determinada probabilidad de que
se encuentre el parámetro. A esta probabilidad
se le conoce como el nivel de confianza.
Estimación puntual y estimación por
intervalos
 Los hechos que determinan la amplitud de un
intervalo de confianza son:
1. El tamaño de la muestra, n
2. La variabilidad de la población.
normalmente estimada por s.
3. El nivel de confianza deseado.
Estimación puntual y estimación por
intervalos
 Si la desviación estándar de la población es
conocida o la muestra es mayor que 30
utilizamos la distribución z.

s
X ±z
n
Punto e intervalo de estimación

 Si la desviación estándar de la población es


desconocida y la muestra es menor que 30
utilizamos la distribución t

s
X ±t
n
Intervalo de estimación

 Un intervalo de estimación establece el rango


en el cual se encuentra el parámetro de
población.
 Un intervalo en el cual se espera que ocurra el
parámetro de población se llama intervalo de
confianza.
 Los dos intervalos de confianza que son más
utilizados son de 95% y 99%.
Intervalo de estimación
 Para un 95% de intervalo de confianza,
aproximadamente 95% de los intervalos construidos
igualmente contendrán el parámetro inicial.
También el 95% de la muestra media para un
tamaño de muestra específico se encontrará dentro
del 1.96 de la desviación estándar de la media de la
población.

 Para el 99% de intervalo de confianza, 99% de la


muestra media para un tamaño de muestra
específico se encontrará dentro del 2.58 de la
desviación estándar de la media de la población.
Error estándar de la media muestral
 El error estándar de la media muestral es la
desviación estándar de la distribución de las medias
muestrales.
 Se calcula como: σ
σx =
n
 σx es el símbolo para el error estándar de la media
muestral.
 σ es la desviación estándar de la población.
 n es la magnitud de la muestra.
Error estándar de la media muestral

 Si σ no es conocido y n >= 30, la desviación


estándar de la muestra, designada s, se
aproxima a la desviación estándar de la
población.
 La fórmula para la desviación estándar es:
s
sx =
n
95% y 99% intervalos de confianza
para µ
 El 95% y 99% intervalos de confianza:
 95% CI para la media de la población es dada:

s
X ± 1.96
n
99% CI para la media de la población es dada
como:
s
X ± 2.58
n
Construyendo intervalos generales de
confianza para µ
 En general, un intervalo de confianza para la
media se calcula como:

s
X ±z
n
Ejemplo 3
 El director de una escuela de negocios quiere
estimar la cantidad media de horas que los
estudiantes trabajan por semana. De una
muestra de 49 estudiantes mostró una media
de 24 horas con una desviación estándar de
4 horas. ¿Cuál es la media de la población?

 El valor de la media de la población no es


conocida. Nuestra mejor estimación de este
valor es la muestra media de 24.0 horas.
Este valor es llamado estimación puntual.
Ejemplo 3 (Continuación)

 Encuentre el intervalo de confianza con el 95%


para la media de la población.
 El rango límite de confianza es de 22.88 a
25.12.
s 4
X ± 1.96 = 24.00 ± 1.96
n 49
= 24.00 ± 1.12
 Aproximadamente el 95% de los intervalos
construidos incluyen el parámetro de población.
Intervalo de confianza para la
proporción de la población
 El intervalo de confianza para la proporción de
la población se estima como:

p (1 − p )
p±z
n
Ejemplo 4
 De una muestra de 500 ejecutivos que tienen
casa propia 175 revelaron planear vender sus
casas y cambiarse a Arizona. Desarrolle un
intervalo de confianza con el 98% para la
proporción de ejecutivos que planean vender sus
casas y cambiarse a Arizona.
(.35)(.65)
.35 ± 2.33 = .35 ± .0497
500
Factor de corrección
de la población-finita
 La población que ha sido establecida en líneas
anteriores se dice que es finita.
 Para una población finita, donde el número total de
objetos es N y la magnitud de la muestra es n, el
siguiente arreglo está hecho para los errores
estándar de la media muestral y la proporción:
 Error estándar de la media muestral:

σ N −n
σx =
n N −1
Factor de corrección
de la población-finita
 Error estándar de las proporciones de la muestra:
p (1 − p ) N −n
σp =
n N −1

 Este arreglo es llamado factor de corrección


de la población-finita.
 Si n/N < .05,el factor de corrección de la
población-finita se ignora.
Ejemplo 5
 Dada la información del Ejemplo 4, construya un
intervalo de confianza del 95% para la cantidad media
de horas que los estudiantes trabajan por semana si
tan sólo son 500 estudiantes en el campus.
 Porque n/N = 49/500 = .098 el cual es mayor que 05,
utilizamos el factor de corrección de la población-finita

4 500 − 49
24 ± 1.96( )( ) = 24.00 ± 1.0648
49 500 − 1
Elección del tamaño de muestra
apropiado
 Existen 3 factores que determinan el tamaño de
la muestra, ninguno de los cuales tiene relación
con el tamaño de la población. Éstos son:
 El nivel de confianza deseado.
 El máximo error permisible.
 La variación en la población.
Variación en la población
 Para encontrar el tamaño de la muestra para
una variable:
2
 z•s
n= 
 E 
 Donde: E es el error permisible, z es el valor-z
correspondiente al nivel de confianza
seleccionado, y s es la desviación de la
muestra del estudio piloto.
Ejemplo 6
 Un grupo de consumidores quiere estimar la
media del cargo mensual de energía de julio de
una casa común dentro de $5 utilizando 99% de
nivel de confianza. Basado en estudios
similares, la desviación estándar se estima debe
ser $20.00. ¿Cuántas muestras son requeridas?
2
 (2.58)(20) 
n=  = 107
 5 
Tamaño de la muestra
para proporciones
 La fórmula para determinar el tamaño de la
muestra en el caso de una proporción es:
2
 Z
n = p(1 − p) 
 E
Donde: p es la proporción estimada, basada en
la experiencia anterior o de un estudio piloto, z
es valor-z asociado con el grado de confianza
seleccionado; E es el máximo error permisible
que el investigador tolerará.
Ejemplo 7
 Un club quiere estimar la proporción de niños
que tiene un perro como mascota. Si el club
quisiera estimarlo dentro del 3% de la
proporción de la población, ¿cuántos niños
necesitarían contactar? Asuma 95% de nivel de
confianza y que el club estima que un 30% de
los niños tienen un perro como mascota.
2
 1.96 
n = (.30)(.70)  = 897
 .03 
Pruebas de hipótesis para
una muestra
¿Qué es una hipótesis?
 Una hipótesis es una declaración sobre el valor
de un parámetro de la población desarrollado
con el fin de poner a prueba.

 Ejemplos de hipótesis que se hicieron sobre un


parámetro de la población:
 Elingreso mensual para los analistas de sistemas es
$3.625
 Veinte por ciento de todos los clientes de La Majada
regresan para otra comida dentro de un mes.
¿Qué es una prueba de hipótesis?

 La prueba de hipótesis es un procedimiento


basado en la evidencia de la muestra y la teoría
de las probabilidades, usadas para determinar si
la hipótesis es una declaración razonable y no
debe ser rechazada, o es irrazonable y debe ser
rechazada.
Prueba de hipótesis
Paso 1: Se plantean las
hipótesis nula y alternativa

Paso 2: Se selecciona el
nivel de significancia

Paso 3: Se identifica el
estadístico de prueba

Paso 4: Se formula la regla


de decisión

Paso 5: Se toma una


muestra y se decide: se
acepta H0 o se rechaza H0
Definiciones

 Hipótesis nula H0: Una declaración sobre el valor


de un parámetro de la población.
 Hipótesis alternativa H1: Una declaración que se
acepta si los datos de la muestra proporcionan
evidencia de que la hipótesis nula es falsa.
 Nivel de significancia: La probabilidad de
rechazar la hipótesis nula cuando es verdadera.
 Error tipo I: Rechazar la hipótesis nula cuando
es verdadera.
Definiciones

 Error tipo II: Aceptar la hipótesis nula cuando es


falsa.
 Estadístico de prueba: Un valor determinado a
partir de la información muestral, usado para
determinar si se rechaza la hipótesis nula.
 Valor crítico: Punto de división entre la región en
la que se rechaza la hipótesis nula y la región
en la que no rechaza la hipótesis nula.
PRUEBAS DE HIPÓTESIS
PARA LA MEDIA Y VARIANZA POBLACIONAL

31
TIPOS DE ERRORES EN PRUEBA
DE HIPÓTESIS

32
Pruebas de significancia de una cola

 Una prueba es de una cola cuando la hipótesis


alternativa, H1 indica una dirección, como por
ejemplo:
 H1: Las comisiones anuales ganadas por corredores
de bienes raíces a tiempo completo son más de
$35.000. (µ>$35.000)
 H1: La velocidad de los autos que viajan en la I-95 en
Georgia es menos de (µ<60) millas por hora.
 H1: Menos del 20% de los clientes pagan en efectivo
su consumo de gasolina. (µ<.20)
Distribuciónmuestral para el estadístico z para la prueba
de una cola, con el .05 de nivel de significancia

0.95 de probabilidad
0.05 región de rechazo

Valor crítico
Z = 1.65

0 1 2 3
Pruebas de significancia de dos colas

 Una prueba es con dos colas cuando no se


especifica ninguna dirección en la hipótesis
alterna H1, por ejemplo:
 H1:
La cantidad pagada por los clientes en el centro
comercial en Georgetown no es igual a $25. (µ  $25).
 H1:El precio para un galón de gasolina no es igual a

$1.54. (µ $1.54).
Distribución
muestral para el estadístico z para la prueba
de dos colas, con el .05 de nivel de significancia

0.95 de probabilidad
0.025 región de rechazo

Valor crítico
Z = 1.96, -1.96

-2 -1 0 1 2
Prueba para la media de la población:
muestra grande, desviación estándar
de la población conocida
 Cuando la prueba de la media poblacional
proviene de una muestra grande y la desviación
estándar poblacional es conocida, el estadístico
de la prueba se obtiene con la siguiente fórmula:

X −µ
z=
σ/ n
Ejemplo1

Los procesadores de la salsa de tomate de los


fritos indican en la etiqueta que la botella
contiene 16 onzas de la salsa de tomate. La
desviación estándar del proceso es 0.5 onza.
Una muestra de 36 botellas de la producción de
la hora anterior reveló un peso de 16.12 onzas
por botella. ¿En un nivel de significancia del .05
el proceso está fuera de control? ¿Es decir,
podemos concluir que la cantidad por botella es
diferente a 16 onzas?
Ejemplo 1 (Continuación)

 Paso 1: Indique las hipótesis nulas y alternativas:

H0: µ = 16; H1: µ = 16

 Paso 2: Seleccione el nivel de significancia. En este


caso seleccionamos el nivel de significancia del
0.05.
 Paso 3: Identifique la estadística de la prueba.
Porque conocemos la desviación estándar de la
población, la estadística de la prueba es z.
Ejemplo 1 (Continuación)

 Paso 4: Indique la regla de decisión:


Rechazo H0 si z > 1.96 o z < -1.96
 Paso 5: Compruebe el valor del estadístico de la
prueba y llegue a una decisión.
X −µ 16.12 − 16.00
z= = = 1.44
σ n 0.5 36

No rechazamos la hipótesis nula. No podemos


concluir que la media sea diferente a 16 onzas.
Valor-p en la prueba de la hipótesis

 Valor-p es la probabilidad de observar un valor


muestral tan extremo, que el valor observado,
dado que la hipótesis nula es verdadera.
 Si el valor-p es más pequeño que el nivel de
significancia, se rechaza H0.
 Si el valor-p es más grande que el nivel de
significancia, H0 no se rechaza.
Cálculo del Valor-p

 Prueba de una cola: valor-p = P{z >= valor


absoluto del estadístico de prueba}
 Prueba de dos colas: valor-p = 2P{z >= valor
absoluto del estadístico de prueba}
 Del Ejemplo 1, z = 1.44, y porque era una
prueba de dos colas, el valor-p = 2P{z >= 1.44}
= 2(.5-.4251) = .1498. Porque .05>= .1498, no
se rechaza H0.
Prueba para la media de la población:
muestra grande, desviación estándar
poblacional desconocida
 Aquí σ es desconocida, así que la estimamos
con la desviación estándar de la muestra s.
 Mientras el tamaño de muestra n > 30, z se
puede aproximar con:

X −µ
z=
s/ n
Ejemplo 2
La cadena de almacenes de descuento de Roder
emite su propia tarjeta de crédito. Lisa, la gerente
de crédito, desea descubrir si el promedio sin pagar
mensual es más de $400. El nivel de significancia
se fija en .05. Una verificación al azar de 172
balances sin pagar reveló que la media de la
muestra fue $407 y la desviación estándar de la
muestra fue $38. ¿Debe Lisa concluir que el medio
de la población es mayor de $400, o es razonable
asumir que la diferencia de $7 ($407-$400) es
debido al azar?
Ejemplo 2 (Continuación)
 Paso 1: H0: µ <= $400, H1: µ > $400
 Paso 2: El nivel de significancia es .05
 Paso 3: Porque la muestra es grande podemos utilizar
la distribución de z como el estadístico de la prueba.
 Paso 4: H0 es rechazada si z>1.65
 Paso 5: Realice los cálculos y tome una decisión.
X − µ $407 − $400
z= = = 2.42
s n $38 172

 H0 es rechazada. Lisa puede concluir que la media sin


pagar es mayor de $400.
Prueba para la media de la población:
muestra pequeña, desviación estándar
poblacional desconocida
 El estadístico de la prueba es la distribución t.

 El estadístico de la prueba para el caso de una


muestra es:
X −µ
t=
s/ n
Ejemplo 3

La tasa de producción de los fusibles de 5 amperios


en Neary Co. eléctrico es 250 por hora. Se ha
comprado e instalado una máquina nueva que,
según el proveedor, aumentará la tarifa de la
producción. Una muestra de 10 horas
seleccionadas al azar a partir del mes pasado
reveló que la producción cada hora en la máquina
nueva era 256 unidades, con una desviación
estándar de 6 por hora. ¿En el nivel de significancia
del .05. Neary puede concluir que la máquina nueva
es más rápida?
Ejemplo 3 (Continuación)

 Paso 1: Establezca la hipótesis nula y la


hipótesis alternativa.
H0: µ <= 250; H1: µ > 250
 Paso 2: Seleccione el nivel de significancia.
Es .05.
 Paso 3: Encuentre un estadístico de prueba.
Es la distribución t porque la desviación
estándar de la población no se conoce y el
tamaño de muestra es menos de 30.
Ejemplo 3 (Continuación)

 Paso 4: Indique la regla de la decisión.


Hay 10 - 1 = 9 grados de libertad. Se rechaza la
hipótesis nula si t > 1.833.
 Paso 5: Tome una decisión e interprete los
resultados.
X −µ 256 − 250
t= = = 3.162
s n 6 10
Se rechaza la hipótesis nula. El número
producido es más de 250 por hora.
Pruebas respecto a proporciones

 Una proporción es la fracción o el porcentaje


que indican la parte de la población o de la
muestra que tiene un rasgo particular de interés.
 La proporción de la muestra es denotada por p y
calculada con:
p = número de éxitos en la muestra / tamaño de
la muestra
Prueba estadística para la proporción
de la población
p −π
z=
π (1 − π )
n

La proporción de la muestra es p y π es la


proporción de la población.
Ejemplo 4

 En el pasado, el 15% de las solicitudes de


pedidos por correo para cierta obra de caridad
dio lugar a una contribución financiera. Un
nuevo formato de solicitud se ha diseñado y se
envía a una muestra de 200 personas y 45
respondieron con una contribución. ¿En el nivel
de significación del .05 se puede concluir que la
nueva solicitud es más eficaz?
Ejemplo 4 (Continuación)

 Paso 1: Establezca la hipótesis nula y la hipótesis


alternativa
H0: π <= .15 H1: π > .15
 Paso 2: Seleccione el nivel de significancia.
Es .05.

 Paso 3: Encuentre un estadístico de prueba.


La distribución de z es el estadístico de prueba.
Ejemplo 4 (Continuación)
 Paso 4: Indique la regla de decisión.
Se rechaza la hipótesis nula si z es mayor que 1.65.
 Paso 5: Tome una decisión e interprete los
resultados. 45
− .15
p −π 200
z= = = 2.97
π (1 − π ) .15(1 − .15)
n 200

Se rechaza la hipótesis nula. Más de 15% de


solicitudes responde con un compromiso. El nuevo
formato es más eficaz.
REFERENCIAS

http://es.slideshare.net/aumcjoe/estadstica-inferencial-2012

http://es.slideshare.net/castilloasmat28/distribuciones-muestrales-diapositivas-6792646?

http://es.slideshare.net/lexoruiz/estimacin-e-intervalos-de-confianza

http://es.slideshare.net/eraperez/estimacion-limiites-o-intervalos-de-confianza-para-la-media-y-p

http://blogs.ua.es/violeta/tag/diapositivas-teoria-estadistica/

55

También podría gustarte