Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INFERENCIA
Población
INFERENCIA
¿Cuánto vale la media de una población?
µ=?
A partir de los datos
x =30
x =30
29≤µ ≤31
Estimación por intervalo Con una confianza del 95%
dispersión
1 -a sˆ 68 %
Iµ = x ±Za 2
n
tamaño muestra 95 %
Nivel de confianza
sx x sx
x =30
n=100
¿Es verosimil Ho?
?NO
29≤µ ≤31
Estimación por intervalo Con una confianza del 95%
x =30
n=100
¿Es verosimil Ho?
?SI
29≤µ ≤31
Con una confianza del 95%
28.5≤µ ≤31.5
Con una confianza del 99%
INFERENCIA
¿Cuánto vale la media de una población?
H 0 µ=31
σ=5
A partir de los datos
x =30
n=100
¿Es verosimil Ho? SI?
≤2 => Acepto H0 29≤µ ≤31
x −µ Con una confianza del 95%
Z =
σ ≤3 => Acepto H0 28.5≤µ ≤31.5
n Con una confianza del 99%
INFERENCIA
¿Cuánto vale la media de una población?
H 0 µ=31
σ=5
A partir de los datos
≤2 => Acepto H0
x −µ
Z =
σ ≤3 => Acepto H0
n
Contraste de hipótesis: se define
como el procedimiento estadístico
mediante el cual se trata de
averiguar la verosimilitud de una
hipótesis sobre una población o
poblaciones.
Conceptos relacionados 1
Verdadero
H 0 H a
Variable no normal
Medida de tendencia central (mediana).
TIPO DE
DATOS
M. GRANDES
1.1 INDEPEND.
1 NORMALES M. PEQUEÑAS
DEPEND.
TIPO DE
DATOS
1.2 (apareados)
NO
2
NORMALES
INFERENCIA ESTADÍSTICA
INFERENCIA ESTADÍSTICA
H 0 = µ1 = µ 2 ( x1 − x 2 ) − 0
H 1 = µ1 ≠ µ 2 z= 2 2
S1 S2
+
n1 n 2
VARIANZA
M. GRANDES CONOCIDA O Test Z
DESCONOCIDA
(x1 − x 2 ) − 0
z=
σ12 σ 22
VARIANZAS
CONOCIDAS Test Z +
INDEPEND. n1 n2
1.1
M. PEQUEÑAS
Ejemplo:
Con el fin de saber si existen diferencias en el nivel
medio de conocimiento de la asignatura de
Bioestadística en dos facultades diferentes, se
seleccionaron dos grupos de alumnos de primer
curso, y se les propuso un test de 100 preguntas. Los
resultados para el número de aciertos fueron:
Facultad 1 Facultad 2
x 1 = 31 x 2 = 43.4
s1 = 12 s2 = 17
n1 = 32 n2 = 41
( x1 − x 2 ) − 0
H 0 = µ1 = µ 2 z= 2 2
S1 S2
+
H 1 = µ1 ≠ µ 2 n1 n2
( x1 − x 2 ) − 0
t n1 + n2 − 2 =
#1 1&
S2 % +
INDEPEND. Test t $ n1 n 2 '
IGUALES
2 (n1 − 1)S21 + (n 2 − 1)S22
S =
n1 + n 2 − 2
1.2 M. PEQUEÑAS
( x1 − x 2 ) − 0
Gosset VARIANZAS tw =
S12 S22
DESCONOCIDAS +
t Welch
n1 n 2
2
#% S12 S22 &
+
$ n1 n 2 '
f= 2 2
−2
DISTINTAS #S21 # S22
& &
$ n1 ' $ n 2'
+
n1 + 1 n2 + 1
STUDENT
( x1 − x 2 ) − 0
t n1 + n2 − 2 =
No se puede mostrar la imagen.
#
2% 1 1&
S +
$ n1 n 2 '
2 2
2 (n1 − 1) + (n 2 − 1) S1 S2
S =
n1 + n 2 − 2
( x1 − x 2 ) − 0
tw = 2 2
S1 S2
No se puede mostrar la imagen.
+
n1 n2
2
# S1 2 2
% S2 &
+
$ n1 n2'
f = 2 2 −2
2
#S 1 2
#S2
& &
$ n1 ' $ n 2'
+
n1 + 1 n2 + 1
INFERENCIA ESTADÍSTICA
INFERENCIA ESTADÍSTICA
INFERENCIA ESTADÍSTICA
Ejemplo.
Un conjunto de 29 hombres alcohólicos que sufre
hiperglucemia participan en un estudio para determinar
la eficacia de un fármaco. Los individuos son asignados
aleatoriamente a un grupo control y al grupo
tratamiento. Los asignados al grupo control reciben un
placebo y a los del grupo tratamiento se les administra el
fármaco.
Los datos siguientes corresponden al nivel de glucosa medio.
Grupo placebo Grupo tratamiento
n1 = 15 n2 = 14
x1 = 127.1 x2 = 99.0
ˆs12 = 579.8 2
sˆ2 = 377.2
Supondremos homocedasticidad
Ho : µ1 = µ 2 Se trata de un contraste unilateral porque queremos
comprobar que el fármaco disminuye el valor de la
Ha : µ1 > µ 2 glucemia, con respecto al placebo.
tc =
( x 1 − x2 )
= t n1 + n2 − 2 t0.10; 27 = 1.703
' 1 1 $
sˆ %
%n + n ""
& 1 2 #
2
( n1 − 1) sˆ1 + ( n2 − 1) sˆ22
sˆ 2 =
n1 + n2 − 2
t0.02; 27 = 2.473
579.8(14) + 377.2(13) Debemos rechazar la Ho al
2
sˆ = pertenecer el valor del
29 − 2 estadígrafo de contraste a la
sˆ 2 = 482.2 región crítica.
15 − 14
127.1-99.0 Los resultados son
t= = 3.44
altamente significativos.
& 482.20 482.2 #
$ + !
% 15 14 " p-valor < 0.01
Contraste de hipótesis con datos
apareados, muestras grandes y varianzas
conocidas.
Estadígrafo de contraste:
xd
Z a= ≡ N (0,1)
σd
n
Ejemplo.
Para considerar el efecto, en el nivel de
colesterol de un fármaco, se ha tomado
una muestra aleatoria de 100 pacientes
con niveles altos, a los que se ha medido
el nivel antes y después del tratamiento.
Se sabe que la media de las diferencias en
la muestra es de 2.876 y la desviación
típica de las diferencias de la población
estudiada es de 5.312.
Contraste la eficacia del fármaco
Ho : µ d = 0 Estadígrafo de contraste
Ha : µ d > 0 xd
Z a= ≡ N (0,1)
σd
n
Valor experimental Valor crítico al 5%: 1.96
Valor crítico al 1%: 2.57
2.876
Z= = 5.414 P-valor <0.01
5.312
El tratamiento disminuye
100 significativamente los niveles de
colesterol en sangre.
Conclusión:
Los resultados son altamente
significativos y nos llevan a aceptar
la hipótesis alternativa, es decir,
que el tratamiento disminuye
significativamente los niveles de
colesterol en sangre.
Contraste de hipótesis con datos
dependientes, muestras pequeñas y
varianzas desconocidas.
Fórmula:
xd
ta = ≡ t n −1
sˆd
n
Ejemplo.
Para proteger contra quemaduras solares a pacientes
con hipersensibilidad a la radiación solar, se ensayaron
dos tipos de protectores solares hipoalergénicos A y B.
Con el fin de averiguar cuál de los dos ofrece mejor
protección, se efectuó una experiencia aplicando el
protector A en una región cutánea y el B en otra del
mismo paciente, exponiéndolos a continuación a la
radiación solar durante tiempo y condiciones
determinadas.
Posteriormente se midió la superficie eritematosa, en
mm2, en la parte donde se aplicó el protector A y en la
correspondiente del B. Los pares de medidas, cada par
en un mismo paciente, son los siguientes:
1 2 3 4 5 6 7 8 9 10
A 4.5 3.8 6.4 7.1 9.2 4.6 8.2 5.4 6.1 7.2
B 3.9 3.6 6.6 6.8 8.8 4.7 7.8 5.2 6.0 6.8
d 0.6 0.2 -0.2 0.3 0.4 -0.1 0.4 0.2 0.1 0.4
Ho : µ d = 0
Ha :µ d ≠ 0 El estadígrafo de contraste adecuado
es:
xd
ta = ≡ t n −1
sˆd
n
0.23 El estadígrafo de contraste ta
ta = ≡ 3.02 da un resultado de 3.02 buscando
0.24 en la tabla de t de Student el punto
crítico para 9 grados de libertad y
10 un nivel de significación del 5%
nos proporciona un punto crítico
de 1.83, por lo que podemos
deducir
t
a
que el estadígrafo de
t 0.10;9 = 1.833 contraste queda dentro de la región
crítica debido a lo cual rechazamos
la hipótesis nula.
0.23 El estadígrafo de contraste
ta = = 3.02 da un resultado de 3.02.
0.24
10
Buscando en la tabla de t de
Student el punto crítico para 9
grados de libertad y un nivel de
significación del 1% nos
t 0.01; 9 = 2.821 proporciona un punto crítico de
2.821
Conclusión:
Rechazamos H0
CONTRASTE PARA LA IGUALDAD DE MEDIDAS
DE TENDENCIA CENTRAL
INDEPEND. U de
Mann-Withney
TIPO DE
DATOS
2 NO NORMALES
DEPEND.
(apareados)
Wilcoxon
Tests NO PARAMETRICOS
Datos NO NORMALES
•U de Mann- Withney •Wilcoxon
•Comparan MEDIANAS
U = min(U1,U 2 )
n1 (n1 + 1)
U1 = n1 .n 2 + − R1
2
n 2 (n 2 + 1)
U 2 = n1 .n 2 + − R2
2
U de Mann- Withney
U de Mann- Withney
PASOS A DESARROLLAR:
Ø Ordenamos los valores de las dos muestras conjuntamente.
# U = n .n + (n1 +1) n1 − R
% 1 1 2 1
U = Min.( U1 ,U2 ) donde $ 2
( n 2 +1) n 2
%&U 2 = n1.n2 + − R2
2
U de Mann- Withney
Aproximación por la Normal Ho : Me1 = Me2
Ha : Me1 ≠ Me2
Si n1>10 y n2>10
# n .n n .n (n + n + 1) &
U ≡ N% 1 2 , 1 2 1 2
(
$ 2 12 '
U − n1 .n 2 /2
Z= ≡ N(0,1)
n1 .n 2 (n1 + n 2 + 1)
€ 12
Si Z≤Za=> Se acepta la Ho
Si Z>Za=> Se Rechaza la Ho
€
Si los tamaños muestrales son menores la aproximación puede ser errónea
Ejemplo.
Se estudian los hábitos de alimentación de dos muestras de dos
Comunidades Autónomas diferentes (Extremadura y Castilla y
León). Una variable de interés es el aporte calórico de la ingesta
semanal de carne.
7 10 11 11 12 12 12 14 14 16 18 21 22 30 34
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 2 3.5 3.5 6 6 6 8.5 8.5 10 11 12 13 14 15
Rango asignado
CASTELLANO-LEONESES:
16 11 14 21 18 34 22 7 12 12
R1= 86 10 3.5 8.5 12 11 15 13 1 6 6
EXTREMEÑOS
12 14 11 30 10
R2=34 6 8.5 3.5 14 2
Ho : Me1 = Me2
Ha : Me1 ≠ Me2
n1 .n 2
U−
Z= 2 = −0.73 < 1.96
n1.n 2 (n1 + n 2 +1)
12
p-valor > 0.05 =>
Se acepta Ho
Conclusión
Los resultados son no significativos, y
por lo tanto, a partir de estos datos,
no podemos afirmar que exista
diferencia entre el aporte calórico
semanal de los castellano leoneses
adultos y los extremeños jóvenes.
TEST NO PARAMETRICO
Test de Wilcoxon
Ho : Mediferencias = 0
Ha : Mediferencias ≠ 0
€
TEST de WILCOXON
PASOS A DESARROLLAR:
Ø Calculamos las diferencias en cada elemento de la muestra para las dos
variables a estudiar.
Ø Se eliminan los elementos que tengan diferencias nulas.
Ø Ordenamos estas diferencias prescindiendo de los signos.
Ø Asignamos un rango de orden a las mismas.
Ø Se corrigen ligaduras
Ø Sumamos los rangos según los signos que tengan las diferencias y
obtenemos los estimadores:
• T(+) = Suma de rangos correspondientes a diferencias positivas.
• T (-) = Suma de rangos correspondientes a diferencias negativas.
Si n<25 7
8
9
[2 , 26]
[3 , 33]
[5 , 40]
[0 , 36]
[1 , 44]
10 [8 , 47] [3 , 52]
11 [10 , 56] [5 , 61]
Se comprueba si el valor 12 [13 , 65] [7 , 71]
experimental pertenece al 13
14
[17 , 74]
[21 , 84]
[9 , 82]
[12 , 93]
intervalo de confianza 15 [25 , 95] [15 , 105]
16 [29 , 107] [19 , 117]
tabulado 17 [34 , 119] [23 , 130]
18 [40 , 131] [27 , 144]
19 [46 , 144] [33 , 158]
20 [52 , 158] [37 , 173]
21 [58 , 173] [42 , 189]
22 [66 , 187] [48 , 205]
23 [73 , 203] [54 , 222]
24 [81 , 210] [61 , 239]
25 [89 , 276] [68 , 257]
Ejemplo.
Para proteger contra las verrugas se ensayaron 2
tipos de crema A y B, aplicadas en dos zonas
diferentes de cada paciente.
d 1 -1 0 1 4 0 -5 2
Rangos de “d” 2 2 - 2 5 - 6 4
d 1 -1 0 1 4 0 -5 2
Rangos de “d” 2 2 - 2 5 - 6 4
α 0.05 0.01
T+=13
T pertenece al intervalo n
T-=8 de aceptación de la tabla 5
de Wilcoxon 6 [0 , 21]
T=mín(T+,T-)=8 7 [2 , 26]
n =6 8 [3 , 33] [0 , 36]
9
CONCLUSION: [5 , 40] [1 , 44]
10 [8 , 47] [3 , 52]
P - valor >0.05 No se11 detectan[10 diferencias
estadísticamente
, 56] [5 , 61]
12 [13 , 65]significativas
[7 , 71]
entre
13 la crema[17 , A,
74] y la [9B.
, 82]
s1 s2
H0: µ1=µ2
desconocidas
Ha: µ1¹µ2
DATOS
Muestras grandes Muestras pequeñas
(X1 − X 2 )
Z= 2 2
$ σ1 σ 2 '
& + )
Normal % n1 n 2 ( t de STUDENT
H0: e1 = Me2
H a: e1 ¹ Me2
DATOS
NO NORMALES
Independientes Riesgo de
equivocarse
al rechazar Ho
U de
Mann-Wihtney
NORMALES NO NORMALES
DATOS
APAREADOS
T Student
Wilcoxon
datos apareados
Si , se rechaza H0
Y si hay más de dos Grupos…?
ANOVA
Análisis de la varianza