Está en la página 1de 26

ESTADISTICA

INFERENCIAL
UNIDAD III
ESTADISTICA INFERENCIAL

• Distribución Normal
• Distribución t de Student
• Intervalos de confianza para la
media
• Prueba de Hipótesis para la Media
Distribución Normal
• Tiene una única moda, que coincide con su
media y su mediana.
• La curva normal es asintótica al eje de
abscisas. Por ello, cualquier valor entre
y es teóricamente posible. El
área total bajo la curva es, por tanto, igual
a 1.
• Es simétrica con respecto a su media .
• La distancia entre la línea trazada en la
media y el punto de inflexión de la curva es
igual a una desviación típica ( ). Cuanto
mayor sea , más aplanada será la curva de
la densidad.
• El área bajo la curva comprendido entre los
valores situados aproximadamente a dos
desviaciones estándar de la media es igual
a 0.95. La forma de la campana de Gauss
depende de los parámetros.
Distribución Normal Estándar
• Su media es 0 y Desviación
Estándar es 1
• Función de Densidad

• Para estandarizar una


Distribución Normal se usa
la fórmula: z  x  

Distribución t de Student
• Al igual a la distribución Normal es una Distribución
continua
• Tiene Media 0 y Desviación Estándar mayor que 1
• Forma una "familia" de distribuciones t, todas con la
misma media cero, pero con su respectiva
desviación estándar diferente de acuerdo con el
tamaño de la muestra n.
• A la medida que aumenta el tamaño de la muestra,
la distribución t se aproxima a la distribución normal
estándar.
ESTIMACION DE MEDIA
POBLACIONAL.
• Estimación puntual: El valor,
calculado a partir de la
información de muestreo, que se
emplea para estimar el parámetro
de la población
• Intervalo de confianza: Una gama
de valores obtenidos a partir de
datos de muestreo, de modo que
el parámetro ocurre dentro de esa
variedad a una probabilidad
específica a la cual se le
denomina nivel de confianza
Estimación puntual
• Se realiza cuando a la media poblacional
asignamos el valor de la media muestral.
• En este caso se indica el Error Máximo de
estimación, que se mide en unidades de la variable
cuantitativa al estimar.
Si se conoce el tamaño
Error Máximo de la población (N) y

Valor de z se busca en la tabla de distribución Normal Estándar


Con un Nivel de confianza de 90% z= 1.645
Con un Nivel de confianza de 95% z= 1.96
Con un Nivel de confianza de 99% z= 1.99
Estimación por Intervalo Se determina limites (sup. e inf.)
de confianza, sumando a la
de Confianza media muestral el Error Máximo
La de Estimación:
Población

No
Normal
Normal

Desviación
Tamaño de Tamaño de Desviación Estándar
Muestra Muestra Estándar
Poblacional
Pequeño Grande Poblacional
Conocida
(n < 30) n  30 Desconocida

Utilizar
Pruebas NO
Paramétricas
Ejemplo 1: Demos una estimación por intervalo de confianza del 95%
para la longitud media de los lápices de cierta marca, si una muestra de
64 lápices arrojo una longitud promedio de 191 mm., siendo la
distribución de la longitud de tales lápices normal con varianza de 400.

• Solución:
• Fórmula a utilizar:
Datos.
 = 0.05
Z =1.96 • Sustituyendo los datos z
1
 =1.96
2
= 191mm,
n = 64,
= 400,
=20.
Distribución
Normal.

Respuesta: Con 95% de confianza podemos afirmar que


la longitud promedia de los lápices de cierta marca está
entre 186 y 196 milímetros.
Ejemplo 2: Una muestra aleatoria de cinco ejemplares de cierto tipo de helado
tiene un contenido de grasa medio de 11.3% y una desviación estándar de
0.38%. Construya un intervalo de confianza del 95% para el contenido
promedio de la grasa en el helado, siendo la distribución de grasa en el
helado Normal.
• Fórmula a utilizar:
• Solución:
Datos.
 = 0.05, Debemos calcular el valor de
= 11%,
n = 5,
Sustituyendo los datos
S =0.38%,
Distribución
Normal.

Respuesta: El promedio de la grasa en el helado es de


10.8% a 11.8%, afirmamos con 95% de confianza.
Ejemplo 3: Un estudio muestral conducido en una ciudad de 400 familias
de las cuales tomaron 50 los que tenían un ingreso anual promedio de
$27 565 con una desviación estándar de $5000. Construya un intervalo de
confianza del 90% en relación con el ingreso anual promedio real de todas
las familias de esta ciudad.

• Solución: • Fórmula a utilizar: Conocemos el tamaño


Datos. de la población y por lo
tanto usaremos F.C.F.
 = 0.10 z 
=1.645
1
Z =1. 645 2
• Sustituyendo los datos
= 27565
N = 400
n = 50,
S = 5000.

Respuesta: El ingreso anual promedio de las familias de


una ciudad está entre $26475.57 y $28654.43, afirmamos con
90% de confianza.
Resolver el problema II
propuesto en la página 46 del
texto.
• Una tienda de quesos para conocedores
lleva un registro de las compras hechas por
sus clientes. Una muestra tomada al azar de
15 registros arroja compras de 28.3 onzas de
queso en promedio con desviación estándar
de 2.7 onzas. Construya un intervalo de
confianza de 95% de la media de la
población que se muestrea, suponiendo que
la variable se distribuye normalmente.
Prueba de
Hipótesis para
la media
• HIPOTESIS: Enunciado acerca
de un parámetro de la población.

• PRUEBA DE HIPOTESIS:
Procedimiento basado en la
evidencia muestral y en la teoría
de probabilidad que se emplea
para determinar si la hipótesis es
un enunciado razonable
ELEMENTOS DE UNA
PRUEBA DE HIPÓTESIS
• La hipótesis alternativa. Refleja la suposición que se tiene en
base de la muestra. Se denota H1
• La hipótesis nula H0. Se redacta a lo contrario de la
alternativa.
• La Región de Rechazo o Región Crítica es el conjunto de
valores que causan el rechazo de la hipótesis nula.
• La estadística de la prueba o Contraste
es la variable aleatoria utilizada para tomar
la decisión de rechazar o aceptar la hipótesis
nula. Si rechazamos la hipótesis nula, podemos
afirmar la alternativa, si aceptamos la hipótesis
nula, no podemos afirmar la alternativa
•  es el nivel de significación o la probabilidad
de cometer el error tipo I.
Los errores que podrían haberse cometidos al
realizar una prueba de Hipótesis.
Realidad
Decisión Cierta la H0 Falsa H0
H0 se rechaza Error Tipo I Decisión Correcta
H0 se acepta Decisión Correcta Error Tipo II

La probabilidad de cometer el Error tipo I,


P(Error I) = .

La probabilidad de cometer el Error tipo II,


P(Error II) = 
Dos tipos Pruebas de Hipótesis

Unilateral Bilateral

H0:  ≤ 0 H0:   0 H0:  = 0


H1:  > 0 H1:  < 0 H1:   0
I Prueba de hipótesis para la media de una población con
distribución Normal y desviación estándar de la población conocida.
HIPÓTESIS ESTADÍGRAFO REGIÓN CRITICA
COMÚN
III Prueba de hipótesis para la media
H0:  = 0 de una población no normal
H0:   0 Si n  30, usar Tabla I,
Si n < 30, usar Tabla II
H0:   0
H0:  < 0

H0:  ≤ 0
H0:  > 0

II Prueba de hipótesis para la media de una


población con distribución normal y varianza de la
población desconocida.
HIPÓTESIS ESTADÍGRAFO REGIÓN CRITICA
COMÚN

H0:  = 0
H0:   0

H0:   0
H0:  < 0

H0:  ≤ 0
H0:  > 0
Ejemplo1: El tiempo promedio dedicado al estudio individual por los estudiantes de
segundo año de administración en los cursos anteriores fue de 18.75 horas semanales. Una
muestra simple aleatoria de 16 estudiantes del curso actual arrojo que dedicaban al estudio
individual un promedio de 19.23 horas semanales con varianza de 0.25. ¿Podemos afirmar con
un nivel de significación de 0.01 que los estudiantes de este curso estudian más?
Consideremos la distribución del tiempo de estudio semanal en la población Normal.

• Solución: 2) Hipótesis: H0:  ≤ 18.75


1) Datos.  p
H1:  > 18.75
 = 0.01
3) Región Crítica:
= 19.23 h, 3.84

n = 16,
S2 = 0.25, 4) Estadística de la Prueba:
S = 0.05,
0 =18.75
Distribución
Normal. 5) Decisión: H0 se rechaza
6) Conclusión: Al rechazar la hipótesis nula, decimos:
Podemos afirmar que el tiempo promedio de estudio de los
estudiantes de estudiantes de este curso es mayor que de los
cursos anteriores, con un nivel de significación de 0.01.
Resolver el problema 1
propuesto en la página 51 del
texto.
• Una cadena de restaurantes planea construir
un nuevo expendio, si cuando menos 200
autos pasan por el lugar propuesto cada
hora, durante determinadas horas. Para 50
horas muestreadas al azar, se encuentra que
el número promedio de autos que pasan por
ese lugar es 208.5, con s = 30. Los
administradores piensan que el volumen de
tráfico satisface sus requerimientos. Realice
una prueba de hipótesis respecto a este
problema con igual a 5%?
Prueba de Independencia.
EJEMPLO:
A los 300 alumnos de una escuela se les preguntó cual es su
área favorita y el sexo. Los datos están dados en una tabla
de contingencia. Determine si la preferencia por el área
depende de sexo del alumno o no con un nivel de
significación de 0.05.

Sexo Matemáticas Ciencias Humanidades TOTALES


Sociales
Masculino 37 41 44 122
Femenino 35 72 71 178
TOTALES 72 113 115 300
Paso I: Plantear la hipótesis. Siempre la
hipótesis nula tiene que decir que las
variables son independientes.

H0: La preferencia por el área no depende de sexo


del alumno.
H1: La preferencia por el área depende de sexo del
alumno.
Paso II: Región crítica.

Para calcular los grados de libertad de la


distribución chi-cuadrada usaremos la fórmula:
g.l. = (f-1)(c-1), donde f- número de filas, c-número
de columnas, sin tomar en cuenta totales.
g.l.=(2-1)(3-1)=2.
Usando la tabla de 2 calculamos el valor de la chi-
cuadrada (uso de la tabla es similar de T de Student)
2(gl.,)= 2(2g.l. ,0.05)= 5.991

2(gl.,)
5.991
Paso III: Estadística de la prueba.
Antes de calcular la estadística de la prueba hay que
calcular los valores esperados para cada celda de la tabla.
Los valores que aparecen en la tabla son valores
observados. Para calcular los valores esperados se
multiplica los subtotales de la fila y columna
correspondiente al valor observado y se divide entre total
general.

Sexo Matemáticas Ciencias Humanidades TOTALES


Sociales
Masculino 37 (29.29) 41 (45.95) 44 (46.77) 122
Femenino 35 (42.72) 72 (67.05) 71 (68.23) 178
TOTALES 72 113 115 300
Usamos ahora la fórmula para calcular la estadística
de la prueba.
donde O- valor observado de la celda,
E- valor esperado de la celda

2=

=2.035+0.533+0.164+1.395+0.365+0.112 = 4.604
Paso IV: Decisión
H0 no se rechaza.

Paso V: Conclusión
Al nivel de significación de 0.05
no podemos afirmar que la preferencia por área
depende de sexo de alumno.
NOTA: No debe utilizarse la prueba
de Chi-cuadrada
si n<30 o si hay 20% ó
más celdas con la frecuencias
esperadas menores de 5.

También podría gustarte