Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presentación de Modelos Estadisticos Inferenciales - Prueba de Hipotesis 2015 PDF
Presentación de Modelos Estadisticos Inferenciales - Prueba de Hipotesis 2015 PDF
Error Tipo I.
El error de rechazar la hipótesis nula, dado que es verdadera.
Valor critico.
El valor o valores que separan la región critica de los valores de la
estadística de prueba que no nos harían rechazar la hipótesis
nula. Los valores críticos dependen de la naturaleza de la
hipótesis nula, la distribución de muestreo pertinente y el nivel
de significancia .
Las colas de una distribución son las regiones extremas delimitadas por
valores críticos. Rechazamos la hipótesis nula Ho si nuestra estadística
de prueba esta en la región critica o área de rechazo porque eso indica
una discrepancia significativa entre la hipótesis nula y los datos de la
muestra.
Z = (X' - H)/(/n)
Z = (X' - H)/(s/n)
en donde
X' es la media muestral
H es el valor de la media poblacional
bajo hipótesis nula
Ho: = 2,100
n=64 minoristas
X'=US$2,251
s=US$812
Z = (2,251 - 2,100)/(812/8)
Z = (151)/(101.5)
Z = 1.49
Paso 3: Determinar la regla de decisión con base
en los valores críticos de Z.
Interpretación:
Caso III.
Un gerente de una empresa considera que los empleados gastan
un promedio de 50 minutos para llegar al trabajo. Se toma una
muestra de 70 empleados que se toman en promedio 47.2
minutos con una desviación estándar de 18.9 minutos. Fije en
1% y pruebe la hipótesis.
Interpretación:
La hipótesis nula se rechaza ya que en tiempo de escasez no se abren
mas de 10.4 tiendas semanal
Caso II.
Según Wall Street Journal (mayo 12 de 1997)
muchas compañías de ropa deportiva están
tratando de comercializar sus productos entre
los mas jóvenes. El articulo sugirió que la
edad promedio de los consumidores había
caído por debajo de la media de 34.4 años
que caracterizo los comienzo de la década. Si
una muestra de 1000 clientes reporta una
media de 33.2 años y una desviación de 9.4,
¿qué se concluye a un nivel de significancia de
4%?
Caso III
Un distribuidor de bebidas plantea la hipótesis
de que las ventas por mes promedian
US$12,000. Diez meses seleccionados como
muestra reportan una media de US$11,277 y
una desviación estándar de US$3,772. Si se
utiliza un valor del 5%. ¿Que puede concluir
acerca de la impresión que tienen el
distribuidor sobre las condiciones del negocio?
Interpretación:
n = tamaño de muestra
s²= varianza de muestra
²= varianza de población
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Chisq
3.82 21.92
Chi-square distribution
df = 11
P(lower)
P(upper) Chi-square
.9750 .0250 21.92
.0250 .9750 3.82
Solución:
Con base en los datos de muestra, la media de
X'=3.504 parece excelente porque esta muy
cerca del valor deseado. Los puntajes dados
tienen una desviación estándar de s=0.109, que
podría parecer mayor que el valor deseado de
0.06 o menos. Procedamos a obtener el
intervalo de confianza para ².
Con una muestra de 12 puntajes tenemos 11 grados de libertad. Con un
grado de confianza del 95%, dividimos =0.05 equitativamente entre las dos
colas de la distribución ² y nos remitimos a los valores de 0.975 y 0.025 en
la fila superior.
Los valores críticos de ² son ²L=3.816 y ²R=21.920. Utilizando estos
valores críticos junto con la desviación estándar de muestra s=0.109 y el
tamaño de muestra de 12 construimos el intervalo de confianza del 95%
evaluando lo siguiente:
Pruebas no paramétricas.
Son procedimientos estadísticos que pueden
utilizarse para contrastar hipótesis cuando no son
posibles los supuestos respecto a los parámetros o a
las distribuciones poblacionales.
Experimento multinomial.
Es un experimento que satisface las siguientes condiciones.
Distribución Chi-cuadrado
E = np
0 1 2 3 4 5 6 7 8 9 10
Chisq
4.61
I PLANTIAMIENTO DE HIPOTES
Goodness of Fit Test HO: SE MANTUVO EL PATRON DESEADO: 60%
COMERCIAL - 10% PERSONAL - 30%
EXTRANJERO
HA: NO SE MANTUVO EL PATRON DESEADO
observed expected O - E (O - E)² / E % of chisq
II ESTADISTICA DE PRUEBA - CHI CUADRADA
62 51.000 11.000 2.373 27.07 CHI C. = 8.76
10 8.500 1.500 0.265 3.02
13 25.500 -12.500 6.127 69.91 III REGLA DE DECISION.
SE ACEPTA SI CHI ES MENOR QUE
85 85.000 0.000 8.765 100.00 4.61
SE RECHAZA SI CHI ES MAYOR QUE 4.61
chi-
SE RECHAZA LA HO
8.76square
1df IV INTERPRETACION
.0031p-value NO SE ESTA CUMPLIENDO CON LA POLITICA DE
CREDITO DEL BANCO
Caso II. Prueba de normalidad.
observe expecte
d d O - E (O - E)² / E % of chisq
20 22.800 -2.800 0.344 3.98
142 135.900 6.100 0.274 3.17
310 341.300 -31.300 2.870 33.24
370 341.300 28.700 2.413 27.95
128 135.900 -7.900 0.459 5.32
30 22.800 7.200 2.274 26.33
1000 1000.000 0.000 8.634 100.00
chi-
8.63square
5df
Valor Critico. Se desea probar la hipótesis al nivel del 5%.
Debido a que tanto la media poblacional como la desviación
estándar son dadas y no tienen que estimarse, m = 0. Existe k =
6 clases en la tabla de frecuencias, de manera que los grados de
libertad son k-1=5. Se encuentra que el valor critico es ² 0.05,5
=11.070
Regla de decisión: "No rechazar la hipótesis nula si ² es menor
que 11.070. Rechazar la hipótesis nula si ² es mayor que
11.070"
Determine el valor ² = [(Oi-Ei)/Ei]
Interpretación: La hipótesis nula se acepta. Las diferencias entre
lo que se observo y lo que se espera observar si los contenidos
estuvieran distribuidos normalmente con una media de 600 y una
desviación estándar de 10 pueden atribuirse al error de
muestreo.
Si la media poblacional y la desviación estándar no fueran
conocidas, se hubieran tenido que estimar de los datos
muestrales de la tabla. Entonces m=2, y los grados de libertad
serian k-2-1 o 6-2-1=3.
f(Chisq)
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Goodness
Chisq of Fit Test
11.07
I PLANTIAMIENTO DE HIPOTES
HO: LOS NIVELES DE LLENADO ESTAN
observexpecte (O - E)² / % of DISTRIBUIDO NORMALMENTE
ed d O-E E chisq HA: LOS NIVELES DE LLENADO ESTAN
DISTRIBUIDO NORMALMENTE
20 22.800 -2.800 0.344 3.98
142 135.900 6.100 0.274 3.17 II ESTADISTICA DE PRUEBA - CHI CUADRADA
310 341.300 -31.300 2.870 33.24 CHI C. = 8.63
370 341.300 28.700 2.413 27.95
III REGLA DE DECISION.
128 135.900 -7.900 0.459 5.32 SE ACEPTA SI CHI ES MENOR QUE 11.07
30 22.800 7.200 2.274 26.33 SE RECHAZA SI CHI ES MAYOR QUE 11.07
1000.00
1000 0 0.000 8.634 100.00 SE ACEPTA LA HO
IV INTERPRETACION
chi- LOS NIVELES DE LLENADOS ESTAN
8.63square DISTRIBUIDOS NORMALMENTE
Tablas de contingencia. Una prueba de independencia.
Tabla de Contingencia o tabla de frecuencia bidireccional.
Es una tabla en la que las frecuencias corresponden a dos
variables. (Se utiliza una variable para clasificar las filas y otra
para clasificar las columnas).
Las tablas contingencias son aquellas que sirven para
comparar dos variables.
Prueba de independencia.
Una prueba de independencia prueba la hipótesis nula de
que la variable de fila y la variable de columna de una tabla de
contingencia no están relacionadas. (La hipótesis nula es la
declaración de que las variables de fila y de columna son
independientes.)
Es muy importante reconocer que, en este contexto, la
palabra contingencia se refiere a dependencia, pero sólo se trata
de una dependencia estadística y no puede usarse para
establecer un vínculo directo de causa y efecto entre las dos
variables en cuestión.
Supuestos.
Al probar la hipótesis nula de independencia entre las variables
de fila y de columna de una tabla de contingencia, aplican los
supuestos siguientes (Obsérvese que estos supuestos no exigen
que la población padre tenga una distribución normal ni alguna
otra distribución especifica.)
1. Los datos de muestra se escogen aleatoriamente.
2. La hipótesis nula Ho es la declaración de que las variables de
fila y de columna son independientes; la hipotesis alternativa Ha
es la declaracion de que las variables de fila y de columna son
dependientes.
3. Para cada celda de la tabla de contingencia, la frecuencia
esperada E es de por lo menos 5.
Estadística de prueba para prueba de independencia.
² = [(Oi-Ei)^2/Ei]
Valores críticos.
1. Los valores críticos se encuentran en la tabla usando:
grados de libertad = (r-1)(c-1)
2. Las pruebas de independencia con tablas de contingencia solo
implican regiones criticas de cola derecha.
Frecuencia esperada para una tabla de contingencia.
Frecuencia esperada (E)= [(Total de fila)*(Total de columna)]/Gran
Total
15.17chi-square
4df
.0044p-value
Chi-square Contingency Table Test for Independence
15.17 chi-square
4 df
.0044 p-value
El valor ²= [(Oi-Ei)/Ei]
Valores críticos.
1. Los valores críticos se encuentran en la tabla usando: grados de
libertad = (r-1)(c-1)
2. Las pruebas de independencia con tablas de contingencia solo
implican regiones criticas de cola derecha.
Si se determina en 1%, y con (f-1)(c-1) = (3-1)(3-1) = 4 grados de
libertad ²0.01,4 = 13.277.
chi-
15.17square
4df
.0044p-value
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Chisq
13.28
Caso V. En un análisis de segmentación de mercado para
tres cervezas, el grupo de investigación encargado ha
planteado la duda de si las preferencias para las tres
cervezas son diferentes entre los consumidores hombres
y mujeres. Si la preferencia de las cervezas fuera
independiente del sexo del consumidor, se iniciaría una
campaña publicitaria para todas las cervezas. Sin
embargo, si la preferencia depende del sexo del
consumidor, se ajustarán los promociones para tener en
cuenta los distintos mercados metas. Pruebe el supuesto
a un nivel de significancia de un 5%.
Los datos de la tabla constituyen las frecuencias
observadas para las seis clases o categorías.
CERVEZA PREFERIDA
SEXO LIGERA CLARA OSCURA
HOMBRE 20 40 20
MUJER 30 30 10