Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA II
AUTOR: Rogelio Alvarado Martinez
ÍNDICE
Acceso rápido
GENERALIDADES DESARROLLO
GLOSARIO REFERENCIAS
Recordemos que para diferencias de medias se utiliza el siguiente estadístico de prueba:
2.1.1 Prueba para la diferencia de medias. Muestras grandes Ejemplo (Montgomery 2002)
2.1.2 Prueba
para
diferencia
de
medias.
Muestras
pequeñas
Una
obra
de
construcción
requiere
un
gran
número
de
bloques
de
concreto.
Dos
empresas
abastecedoras
A
y
B
licitan
para
su
adjudicación,
y
dentro
del
pliego
de
condiciones
se
estipula
2.1.3 Prueba
para
diferencia de proporciones
que
la
resistencia
mínima
es
de
1.000
unidades
métricas
a
la
resistencia,
y
el
contrato
se
adjudicará
a
la
empresa
que
mayor
resistencia
presente
su
producto.
2.2
Prueba
de
hipótesis
para
la
varianza
de
una
población
2.3 Prueba
de
independencia
Paso
1:
Se
plantea
la
hipótesis
nula
(Ho)
que
no
existe
diferencia
entre
las
resistencias
medias
a
la
compresión
de
los
bloques
de
concreto.
La
hipótesis
alternativa
se
plantea
en
términos
que
hay
alguna
diferencia
significativa
entre
las
dos
resistencias
medias
a
la
compresión.
DESARROLLO
TEMÁTICO
Simbólicamente
se
expresa
así:
H
o
:
µ1
=
µ2
2.
Pruebas
de
hipótesis
H1
:
µ1
≠
µ2
2.1 Pruebas de hipótesis para la comparación de dos grupos
Muchas
veces
en
el
análisis
estadístico
el
interés
se
centra
en
la
comparación
de
las
medias
de
Dado
que
la
hipótesis
alternativa
no
indica
una
dirección
específica,
la
prueba
es
de
dos
colas.
dos
poblaciones,
conocida
también
como
la
prueba
para
diferencia
de
medias
que
analizamos
en
Paso
2:
Se
elige
un
nivel
de
significancia
de
0.01.
Esto
equivale
a
cometer
un
error
de
tipo
I.
Se
diferentes
contextos.
usará
una
distribución
normal
estandarizada
en
Z,
razón
por
la
cual
se
debe
seleccionar
una
muestra
que
al
menos
contenga
como
mínimo
30
unidades
de
bloque,
cada
una
de
las
empresas
2.1.1
Prueba
para
la
diferencia
de
medias.
Muestras
grandes.
licitantes.
Es
muy
común
que
cuando
se
quiere
hacer
comparación
de
dos
grupos
a
través
de
las
medias
no
Paso
3:
El
estadístico
de
prueba
a
aplicar
está
dado
por
la
siguiente
fórmula:
se
conozcan
las
varianzas
poblacionales,
para
estos
casos
es
posible
obtener
las
medias
muestrales
(𝑋𝑋" −
𝑋𝑋% )
las
varianzas
muestrales
(𝑆𝑆"%
𝑦𝑦
𝑆𝑆%% )
.
𝑍𝑍 =
01 203
2
(µ1
2µ3
)
43 3
1 6
43
Si
se
supone
que
las
muestras
se
obtienen
de
manera
aleatoria
e
independiente
a
partir
de
51
53
las
poblaciones
respectivas
que
tiene
una
distribución
normal
con
varianzas
poblacionales
iguales,
es
decir,
𝜎𝜎"% =
𝜎𝜎%%
se
puede
utilizar
una
prueba
de
distribución
normal
de
varianzas
combinadas
para
determinar
si
existe
una
diferencia
significativa
entre
las
dos
poblaciones.
Paso
4.
Recuérdese
que
se
seleccionó
un
nivel
de
significancia
del
0.10
y
se
utilizará
una
prueba
𝜎𝜎 " "
A1 2A3 BCD
6
de
dos
colas.
Los
valores
críticos
y
zonas
de
aceptación
para
las
hipótesis
se
presentan
en
la
E1 E3
siguiente
figura:
Ejemplo:
Cajero
A
5
8
7
6
9
7
Paso
5.
El
valor
Z
calculado
queda
en
el
área
de
rechazo
de
la
hipótesis
nula,
por
lo
tanto,
se
Paso
1.
Planteamiento
de
las
hipótesis:
concluye
que
la
media
poblacional
de
la
resistencia
a
la
compresión
es
diferente
en
las
dos
H
o:
µ1
=
µ2
empresas
y
la
diferencia
no
se
debe
al
azar
del
muestreo,
con
un
nivel
de
significancia
del
10%.
H1:
µ1
≠
µ2
Observamos que n1 = 6 y n2 = 8 entonces los grados de libertad son: Primero calculamos la desviación estándar conjunta en donde:
(6 − 1)(1,4142)% + (8 − 1)(2,2578)%
𝑆𝑆@ =
12
Sp
=
1,9579
Y
el
error
estándar
Figura 2. Valores críticos distribución t
Paso
3:
0,9 − 0,8
−
(0
)
𝑍𝑍 = = 3,12
0,9(1 − 0,9) 0,8(1 − 0,8)
+
Figura 3. Valor calculado y puntos críticos 250
250
2.1.3 Prueba de hipótesis para diferencias entre dos proporciones 2.2 Prueba de hipótesis para la varianza de una población
Se
presenta
a
c o n t i n u a c i ó n
u n
e j e m p l o
d o n d e
s e
e m p l e a
l a
p r u e b a
d e
proporción
En
algunas
ocasiones
es
necesario
hacer
pruebas
con
respecto
a
la
variación,
para
estos
casos
las
para
la
diferencia
entre
dos
poblaciones,
utilizando
el
siguiente
estadístico
de
prueba:
hipótesis
se
plantean
como
en
los
casos
anteriores,
es
decir,
la
prueba
puede
ser
unilateral
o
bilateral,
pero
en
este
caso
es
importante
tener
presente
algunos
supuestos:
𝑃𝑃" − 𝑃𝑃%
−
(π"
− π%
)
𝑍𝑍 =
-‐ La
muestra
es
aleatoria.
𝑃𝑃" (1 − 𝑃𝑃" ) 𝑃𝑃% (1 − 𝑃𝑃% )
+
-‐ La
población
es
normal.
𝑛𝑛"
𝑛𝑛%
E2" C 3
-‐ La
estadística
de
prueba
𝑋𝑋 % =
tiene
una
distribución
Chi-‐cuadrado
con
(n-‐1)
XY3
grados
de
libertad.
En
esta
fórmula
𝜎𝜎Z
es
el
valor
de
hipótesis.
Ejemplo
(Gutiérrez
2005):
Dos
lotes
de
frutas
conformados
cada
uno
por
250
unidades,
son
tratados
y
almacenados
en
iguales
condiciones,
salvo
que
el
lote
No
1
está
a
temperatura
ligeramente
inferior
que
el
lote
No
2.
Pasado
un
tiempo
se
encuentra
que
en
el
lote
No
1
hay
225
frutas
sanas
y
en
el
lote
No
Fuente: Elaboración propia (2016) Como
el
valor
calculado
29,25
es
mayor
al
valor
de
la
tabla,
se
rechaza
la
hipótesis
nula,
entonces
con
un
nivel
de
significancia
del
5%,
se
puede
decir
que
la
variación
si
ha
aumentado
confirmando
Ejemplo:
la
creencia
del
psicólogo.
Se
sabe
que
una
prueba
de
razonamiento
tiene
una
distribución
normal
con
una
media
de
100
y
2.3
Prueba
de
independencia
una
desviación
estándar
de
10.
Un
psicólogo
cree
que
la
variación
de
los
resultados
ha
aumentado
en
las
últimas
pruebas,
para
probar
esto
toma
una
muestra
de
14
personas
y
obtiene
un
puntaje
Hasta
ahora
hemos
calculado
pruebas
de
hipótesis
con
respecto
a
los
parámetros
de
la
población,
con
una
desviación
estándar
de
15.
¿Estos
datos
son
suficiente
evidencia
para
aceptar
la
creencia
pero
esto
no
quiere
decir
que
sea
la
única
forma
de
presentar
la
hipótesis
nula,
veamos
qué
del
psicólogo?
Nivel
de
significancia
5%
ocurre
en
situaciones
como
la
del
siguiente
ejemplo:
Paso
1:
planteamiento
de
la
hipótesis
Una
empresa
saca
al
mercado
tres
tipos
de
cerveza:
negra,
blanca
y
dorada.
En
un
estudio
de
segmentación
de
mercados,
el
grupo
investigador
tiene
la
duda
si
la
preferencia
de
las
tres
Ho:
𝜎𝜎 % ≤
10%
(La
hipótesis
está
planteada
para
la
varianza)
cervezas
es
diferente
para
hombres
y
mujeres,
si
la
preferencia
de
la
cerveza
es
independiente
H1:
𝜎𝜎 % >
10%
del
sexo
de
los
consumidores
se
iniciaría
una
campaña
para
todos
los
consumidores,
sin
embargo,
si
la
preferencia
depende
del
sexo
del
consumidor,
se
haría
una
campaña
publicitaria
para
Paso
2:
hombres
y
una
para
mujeres.
Tenemos
n
=
14
S
=
15
y
𝜎𝜎Z = 10
Aquí
tenemos
entonces
dos
variables
involucradas,
preferencia
de
la
cerveza
y
sexo
de
las
personas.
Nos
preguntamos
entonces
¿existe
alguna
relación
entre
las
dos
variables?
O
que
es
lo
Paso
3:
Estadística
de
prueba
mismo
¿la
preferencia
de
la
cerveza
depende
del
sexo
del
consumidor?
E2" C 3 "]2" "M3 Para
responder
a
estas
preguntas
vamos
a
realizar
una
prueba
de
independencia.
Primero
𝑋𝑋 % =
𝑋𝑋 % =
=
29,25
XY3 "Z3
planteamos
las
hipótesis:
Paso
4:
De
acuerdo
al
nivel
de
significancia
del
5%
ubicamos
el
valor
crítico
en
la
distribución
chi-‐ Paso
1:
cuadrado
con
(n-‐1)
=
13
grados
de
libertad.
X2=
22,362
Ho:
La
preferencia
de
la
cerveza
es
independiente
del
sexo
del
consumidor
H1: La preferencia de la cerveza no es independiente del sexo del consumidor.
Cerveza
preferida
30
(50)
*(70)
/150
=
23,33
Total
Negra
Blanca
Dorada
S
Tabla
2.
Datos
observaos
y
esperados
Total
30
70
50
150
Cerveza
preferida
Tabla
1.
Datos
ejemplo
independencia
Total
Fuente:
elaboración
propia
(2016)
S
Negra
Blanca
Dorada
E
Hombre
16
37,33
26,67
80
X
La
tabla
nos
muestra
las
frecuencias
observadas,
ahora
vamos
a
calcular
las
frecuencias
esperadas
multiplicando
el
total
de
columna
por
el
total
de
fila
y
dividiendo
el
resultado
sobre
el
total
de
la
O
Mujer
14
32,67
23,33
70
siguiente
manera:
Total
30
70
50
150
Tabla
3.
Tabla
frecuencias
esperadas
Valor
observado
Valor
esperado
Fuente:
elaboración
propia
(2016)
10
(30)
*(70)
/150=
14
Paso 4:
% %
Decisión.
Regla
de
decisión
se
rechaza
Ho
si
𝑋𝑋abcadcbef
> 𝑋𝑋gbhcb
1.
Un
gerente
afirma
que
el
tiempo
que
gastan
los
empleados
del
turno
del
día
en
realizar
un
trabajo
específico,
excede
a
los
tiempos
empleados
por
los
del
turno
de
la
noche,
en
al
menos
12
minutos.
Para
probar
dicha
afirmación,
se
prueban
50
empleados
de
cada
turno
bajo
condiciones
similares.
En
el
turno
del
día
el
tiempo
promedio
es
de
86.7
minutos
con
una
desviación
estándar
de
6.28
minutos,
mientras
que
en
el
de
la
noche
el
tiempo
promedio
es
de
77.8
minutos
con
una
desviación
estándar
de
5.61
minutos.
Pruebe
la
afirmación
del
gerente
usando
un
nivel
de
significancia
de
0.01.
Figura 6: Valor calculado y valor crítico distribución chi-cuadrado
Fuente: Elaboración propia (2016) 2.
Un
director
de
manufactura
debe
decidir
cuál
de
las
dos
plantas
debe
responsabilizarse
de
producir
corchos
para
el
vino
utilizados
en
una
famosa
marca.
Esta
decisión
se
fundamentará
por
los
niveles
de
productividad.
Una
muestra
de
67
días
en
la
planta
de
Cali
produjo
una
Proveedor
1
21.38
20.13
19.12
20.54
18.60
18.10
Proveedor
2
21.51
22.22
21.52
22.06
21.29
22.71
Asumiendo
varianzas
de
las
poblaciones
desconocidas
pero
iguales,
pruebe
la
hipótesis
con
un
nivel
de
significancia
del
5%.
1. Una
agencia
que
vende
vehículos
quiere
determinar
si
existe
alguna
relación
entre
la
edad
de
los
clientes
y
el
color
del
vehículo
elegido.
Toma
una
muestra
y
obtiene
la
siguiente
información:
Edad
(años)
Color
elegido
Total
Blanco
Rojo
Gris
Negro
Menor
a
20
25
30
15
10
Error tipo I: probabilidad de rechazar la hipótesis nula cuando es cierta.
Hipótesis
estadística:
supuesto
o
afirmación
de
los
parámetros
de
la
población.
5.1
Textos
04 -----
• GUTIERREZ,
H.
y.
(2005).
Control
estadístico
de
Calidad
y
Seis
Sigma.
McGrawHill.
Hipótesis
nula:
afirmación
sobre
la
que
se
toma
la
decisión.
• FREUND
John
E.,
M.
I.
(2000).
Estadística
Matemática
con
aplicaciones
(6
ed.).
Prentice
Hall.
Hipótesis
alterna:
supuesto
que
se
quiere
probar.
• WALPOLE
Ronal
E.,
M.
R.
(1998).
Probabilidad
y
Estadística
para
Ingenieros
(6
ed.).
Nivel
de
significancia:
Error
tipo
I.
Prentice
Hall.
• KENNET,
R.
S.
(2000).
Estadística
Industrial
Moderna.
Thomsom.
Valor
o
punto
crítico:
valor
de
la
distribución
que
separa
la
zona
de
rechazo
y
la
de
no
rechazo.
• Paul,
N.
(1988).
Estadística
para
los
Negocios
y
la
Economía
(4
ed.).
Prentice
Hall.
• C
MONTGOMERY,
D.
C.
(2002).
Probabilidad
y
Estadística
aplicadas
a
la
Ingeniería
(2
ed.).
Limusa
Wiley.