Está en la página 1de 69

Inferencia

Muestra (x1, x2,..., xn)

INFERENCIA
Población
INFERENCIA
¿Cuánto vale la media de una población?
µ=?
A partir de los datos

x =30 Estimación puntual µ=30

Estimación por intervalo 29.5≤µ ≤30.5


x − 1ESM ≤ µ ≤ x + 1ESM Con una confianza del 68%
ESM=0.5
INFERENCIA
¿Cuánto vale la media de una población?
µ=?
A partir de los datos

x =30

Estimación por intervalo 29≤µ ≤31


ESM=0.5 x − 2ESM ≤ µ ≤ x + 2ESM Con una confianza del 95%
INFERENCIA
¿Cuánto vale la media de una población?
µ=?
A partir de los datos

x =30

Estimación por intervalo 28.5≤µ ≤31.5


ESM=0.5 x − 3ESM ≤ µ ≤ x + 3ESM Con una confianza del 99%
INFERENCIA
¿Cuánto vale la media de una población?
µ=?
A partir de los datos

x =30 Estimación puntual µ=30

29≤µ ≤31
Estimación por intervalo Con una confianza del 95%

ESM=0.5 28.5≤µ ≤31.5


Con una confianza del 99%
ESTADÍSTICA INFERENCIAL
INTERVALO DE CONFIANZA

dispersión
1 -a sˆ 68 %
Iµ = x ±Za 2
n
tamaño muestra 95 %
Nivel de confianza
sx x sx

El 95% de los intervalos


µ contiene la verdadera
media de la población.
El 5% no lo contienen
INFERENCIA
¿Cuánto vale la media de una población?
H 0 µ=33
σ=5
A partir de los datos

x =30
n=100
¿Es verosimil Ho?
?NO
29≤µ ≤31
Estimación por intervalo Con una confianza del 95%

ESM=0.5 28.5≤µ ≤31.5


Con una confianza del 99%
INFERENCIA
¿Cuánto vale la media de una población?
H 0 µ=31
σ=5
A partir de los datos

x =30
n=100
¿Es verosimil Ho?
?SI
29≤µ ≤31
Con una confianza del 95%

28.5≤µ ≤31.5
Con una confianza del 99%
INFERENCIA
¿Cuánto vale la media de una población?
H 0 µ=31
σ=5
A partir de los datos

x =30
n=100
¿Es verosimil Ho? SI?
≤2 => Acepto H0 29≤µ ≤31
x −µ Con una confianza del 95%
Z =
σ ≤3 => Acepto H0 28.5≤µ ≤31.5
n Con una confianza del 99%
INFERENCIA
¿Cuánto vale la media de una población?
H 0 µ=31
σ=5
A partir de los datos

x =30 ¿Es verosimil Ho? SI


n=100

≤2 => Acepto H0
x −µ
Z =
σ ≤3 => Acepto H0
n
Contraste de hipótesis: se define
como el procedimiento estadístico
mediante el cual se trata de
averiguar la verosimilitud de una
hipótesis sobre una población o
poblaciones.
Conceptos relacionados 1

Hipótesis nula (Ho): es la hipótesis que se


formula y que se quiere contrastar. Será la que se
acepte o rechace como consecuencia del contraste.

Hipótesis alternativa (Ha): es cualquier otra


hipótesis que difiera de la formulada y nos sitúe
frente a la nula. Si rechazamos Ho aceptamos Ha.
Conceptos relacionados 2
Error tipo I: rechazo indebido de Ho

Error tipo II: aceptación indebida de la Ho

Nivel de significación (a): Probabilidad de


cometer el error tipo I.

Potencia del contraste (1- b): Probabilidad de


rechazar Ho, siendo falsa.
b denota el riesgo tipo II
Sintetizando lo anterior….
Decisión

Verdadero
H 0 H a

No hay error Error tipo I


H 0 1−α α
Nivel de
significación

Error tipo II No hay error


H a β 1− β
Potencia
Conceptos relacionados 3
Estadígrafo de contraste: Una variable aleatoria
con una distribución de probabilidad dada y que
toma un valor para cada muestra.

Región de aceptación: Conjunto de valores del


estadístico de contraste que nos llevan a aceptar
la Ho

Región crítica: Conjunto de valores del


estadístico de contraste que nos llevan a rechazar
Ho, y por tanto a aceptar la hipótesis alternativa
Conceptos relacionados 4
Contraste unilateral: Región crítica formada por
un solo conjunto de puntos

Contraste bilateral: Cuando la región crítica está


formada por dos conjuntos de puntos disjuntos.
Características de los datos
Variable normal
Medida de tendencia central ( media aritmética).

Variable no normal
Medida de tendencia central (mediana).

l Datos independientes: aquellos que se obtienen al realizar


el contraste con dos muestras distintas.

l Datos apareados: Aquellos que se obtienen al realizar dos


contrastes sobre una misma muestra.
Pasos para la realización de un
contraste
Determinar Ho y Ha
Fijar el nivel de significación p-valor
Determinar el estadígrafo de contraste y su distribución
Hallar la región critica y la de aceptación
Calcular el valor del estadígrafo a partir de los datos
Decisión estadística según el valor experimental obtenido
Conclusiones no estadísticas
CONTRASTE DE
COMPARACIÓN DE LA
TENDENCIA CENTRAL
DE DOS POBLACIONES
CONTRASTE PARA LA IGUALDAD DE TENDENCIA CENTRAL

H0: µ1=µ2Û µ1-µ2 = 0


NORMALES µ1¹µ2Û µ1-µ2¹ 0
Ha: µ1>µ2Û µ1-µ2> 0
1 µ1<µ2Û µ1-µ2< 0

TIPO DE
DATOS

H0: Me1= Me2Û Me1- Me2 = 0


2 Me1¹ Me2Û Me1- Me2¹ 0
NO NORMALES
Ha: Me1> Me2Û Me1- Me2> 0
Me1<Me2Û Me1- Me2< 0
CONTRASTE PARA LA IGUALDAD DE MEDIDAS
DE TENDENCIA CENTRAL
H 0 = µ1 = µ 2
H 1 = µ1 ≠ µ 2

M. GRANDES

1.1 INDEPEND.

1 NORMALES M. PEQUEÑAS

DEPEND.
TIPO DE
DATOS
1.2 (apareados)

NO

2
NORMALES
INFERENCIA ESTADÍSTICA
INFERENCIA ESTADÍSTICA
H 0 = µ1 = µ 2 ( x1 − x 2 ) − 0
H 1 = µ1 ≠ µ 2 z= 2 2
S1 S2
+
n1 n 2
VARIANZA
M. GRANDES CONOCIDA O Test Z
DESCONOCIDA
(x1 − x 2 ) − 0
z=
σ12 σ 22
VARIANZAS
CONOCIDAS Test Z +
INDEPEND. n1 n2
1.1

M. PEQUEÑAS
Ejemplo:
Con el fin de saber si existen diferencias en el nivel
medio de conocimiento de la asignatura de
Bioestadística en dos facultades diferentes, se
seleccionaron dos grupos de alumnos de primer
curso, y se les propuso un test de 100 preguntas. Los
resultados para el número de aciertos fueron:

Facultad 1 Facultad 2
x 1 = 31 x 2 = 43.4
s1 = 12 s2 = 17
n1 = 32 n2 = 41
( x1 − x 2 ) − 0
H 0 = µ1 = µ 2 z= 2 2
S1 S2
+
H 1 = µ1 ≠ µ 2 n1 n2

(31 − 43.4) − 12.398


Z= = ≈ −3.649
2
( 12 17 % 2 3.398
&& + ##
' 32 41 $
El punto crítico al 5% según la “tabla de la normal”
Si : α = 0.05 es de 1.96; por lo cual se rechaza la H0
p-valor < 0.05
INFERENCIA ESTADÍSTICA
INFERENCIA ESTADÍSTICA
( x1 − x 2 ) − 0
VARIANZAS z=
CONOCIDAS Test Z σ12 σ 22
+
n1 n2

( x1 − x 2 ) − 0
t n1 + n2 − 2 =
#1 1&
S2 % +
INDEPEND. Test t $ n1 n 2 '
IGUALES
2 (n1 − 1)S21 + (n 2 − 1)S22
S =
n1 + n 2 − 2

1.2 M. PEQUEÑAS

( x1 − x 2 ) − 0
Gosset VARIANZAS tw =
S12 S22
DESCONOCIDAS +
t Welch
n1 n 2
2
#% S12 S22 &
+
$ n1 n 2 '
f= 2 2
−2
DISTINTAS #S21 # S22
& &
$ n1 ' $ n 2'
+
n1 + 1 n2 + 1

STUDENT
( x1 − x 2 ) − 0
t n1 + n2 − 2 =
No se puede mostrar la imagen.

#
2% 1 1&
S +
$ n1 n 2 '
2 2
2 (n1 − 1) + (n 2 − 1) S1 S2
S =
n1 + n 2 − 2
( x1 − x 2 ) − 0
tw = 2 2
S1 S2
No se puede mostrar la imagen.
+
n1 n2
2
# S1 2 2
% S2 &
+
$ n1 n2'
f = 2 2 −2
2
#S 1 2
#S2
& &
$ n1 ' $ n 2'
+
n1 + 1 n2 + 1
INFERENCIA ESTADÍSTICA
INFERENCIA ESTADÍSTICA
INFERENCIA ESTADÍSTICA
Ejemplo.
Un conjunto de 29 hombres alcohólicos que sufre
hiperglucemia participan en un estudio para determinar
la eficacia de un fármaco. Los individuos son asignados
aleatoriamente a un grupo control y al grupo
tratamiento. Los asignados al grupo control reciben un
placebo y a los del grupo tratamiento se les administra el
fármaco.
Los datos siguientes corresponden al nivel de glucosa medio.
Grupo placebo Grupo tratamiento

n1 = 15 n2 = 14
x1 = 127.1 x2 = 99.0
ˆs12 = 579.8 2
sˆ2 = 377.2
Supondremos homocedasticidad
Ho : µ1 = µ 2 Se trata de un contraste unilateral porque queremos
comprobar que el fármaco disminuye el valor de la
Ha : µ1 > µ 2 glucemia, con respecto al placebo.

No se puede mostrar la imagen.

tc =
( x 1 − x2 )
= t n1 + n2 − 2 t0.10; 27 = 1.703
' 1 1 $
sˆ %
%n + n ""
& 1 2 #
2
( n1 − 1) sˆ1 + ( n2 − 1) sˆ22
sˆ 2 =
n1 + n2 − 2
t0.02; 27 = 2.473
579.8(14) + 377.2(13) Debemos rechazar la Ho al
2
sˆ = pertenecer el valor del
29 − 2 estadígrafo de contraste a la
sˆ 2 = 482.2 región crítica.
15 − 14
127.1-99.0 Los resultados son
t= = 3.44
altamente significativos.
& 482.20 482.2 #
$ + !
% 15 14 " p-valor < 0.01
Contraste de hipótesis con datos
apareados, muestras grandes y varianzas
conocidas.
Estadígrafo de contraste:

xd
Z a= ≡ N (0,1)
σd
n
Ejemplo.
Para considerar el efecto, en el nivel de
colesterol de un fármaco, se ha tomado
una muestra aleatoria de 100 pacientes
con niveles altos, a los que se ha medido
el nivel antes y después del tratamiento.
Se sabe que la media de las diferencias en
la muestra es de 2.876 y la desviación
típica de las diferencias de la población
estudiada es de 5.312.
Contraste la eficacia del fármaco
Ho : µ d = 0 Estadígrafo de contraste
Ha : µ d > 0 xd
Z a= ≡ N (0,1)
σd
n
Valor experimental Valor crítico al 5%: 1.96
Valor crítico al 1%: 2.57
2.876
Z= = 5.414 P-valor <0.01
5.312
El tratamiento disminuye
100 significativamente los niveles de
colesterol en sangre.
Conclusión:
Los resultados son altamente
significativos y nos llevan a aceptar
la hipótesis alternativa, es decir,
que el tratamiento disminuye
significativamente los niveles de
colesterol en sangre.
Contraste de hipótesis con datos
dependientes, muestras pequeñas y
varianzas desconocidas.

Fórmula:
xd
ta = ≡ t n −1
sˆd
n
Ejemplo.
Para proteger contra quemaduras solares a pacientes
con hipersensibilidad a la radiación solar, se ensayaron
dos tipos de protectores solares hipoalergénicos A y B.
Con el fin de averiguar cuál de los dos ofrece mejor
protección, se efectuó una experiencia aplicando el
protector A en una región cutánea y el B en otra del
mismo paciente, exponiéndolos a continuación a la
radiación solar durante tiempo y condiciones
determinadas.
Posteriormente se midió la superficie eritematosa, en
mm2, en la parte donde se aplicó el protector A y en la
correspondiente del B. Los pares de medidas, cada par
en un mismo paciente, son los siguientes:
1 2 3 4 5 6 7 8 9 10
A 4.5 3.8 6.4 7.1 9.2 4.6 8.2 5.4 6.1 7.2

B 3.9 3.6 6.6 6.8 8.8 4.7 7.8 5.2 6.0 6.8

d 0.6 0.2 -0.2 0.3 0.4 -0.1 0.4 0.2 0.1 0.4
Ho : µ d = 0
Ha :µ d ≠ 0 El estadígrafo de contraste adecuado
es:

xd
ta = ≡ t n −1
sˆd
n
0.23 El estadígrafo de contraste ta
ta = ≡ 3.02 da un resultado de 3.02 buscando
0.24 en la tabla de t de Student el punto
crítico para 9 grados de libertad y
10 un nivel de significación del 5%
nos proporciona un punto crítico
de 1.83, por lo que podemos
deducir
t
a
que el estadígrafo de
t 0.10;9 = 1.833 contraste queda dentro de la región
crítica debido a lo cual rechazamos
la hipótesis nula.
0.23 El estadígrafo de contraste
ta = = 3.02 da un resultado de 3.02.
0.24
10
Buscando en la tabla de t de
Student el punto crítico para 9
grados de libertad y un nivel de
significación del 1% nos
t 0.01; 9 = 2.821 proporciona un punto crítico de
2.821

Conclusión:
Rechazamos H0
CONTRASTE PARA LA IGUALDAD DE MEDIDAS
DE TENDENCIA CENTRAL

INDEPEND. U de
Mann-Withney
TIPO DE
DATOS

2 NO NORMALES

DEPEND.
(apareados)
Wilcoxon
Tests NO PARAMETRICOS
Datos NO NORMALES
•U de Mann- Withney •Wilcoxon

•Comparan MEDIANAS

•Trabajan sobre rangos de orden

•Son menos potentes


TEST NO PARAMÉTRICO

Contraste de hipótesis con datos


independientes, no normales
Ho : Me1 = Me2
Estadígrafo de contraste: Ha : Me1 ≠ Me2

U = min(U1,U 2 )
n1 (n1 + 1)
U1 = n1 .n 2 + − R1
2
n 2 (n 2 + 1)
U 2 = n1 .n 2 + − R2
2

U de Mann- Withney
U de Mann- Withney
PASOS A DESARROLLAR:
Ø Ordenamos los valores de las dos muestras conjuntamente.

Ø Asignamos un rango de orden a cada valor.

Ø Se corrigen las ligaduras existentes en los datos.

• R1 = Suma de los rangos de la primera muestra


• R2 = Suma de los rangos de la segunda muestra

Ø Se define el estadígrafo de contraste :

# U = n .n + (n1 +1) n1 − R
% 1 1 2 1
U = Min.( U1 ,U2 ) donde $ 2
( n 2 +1) n 2
%&U 2 = n1.n2 + − R2
2
U de Mann- Withney
Aproximación por la Normal Ho : Me1 = Me2
Ha : Me1 ≠ Me2
Si n1>10 y n2>10
# n .n n .n (n + n + 1) &
U ≡ N% 1 2 , 1 2 1 2
(
$ 2 12 '
U − n1 .n 2 /2
Z= ≡ N(0,1)
n1 .n 2 (n1 + n 2 + 1)
€ 12
Si Z≤Za=> Se acepta la Ho
Si Z>Za=> Se Rechaza la Ho

Si los tamaños muestrales son menores la aproximación puede ser errónea
Ejemplo.
Se estudian los hábitos de alimentación de dos muestras de dos
Comunidades Autónomas diferentes (Extremadura y Castilla y
León). Una variable de interés es el aporte calórico de la ingesta
semanal de carne.

En una publicación se lee que “Los castellano-leoneses adultos


tienen aproximadamente el mismo peso que los individuos de
entre 12 y 18 extremeños”.

Contrastar si hay diferencia entre el aporte calórico consumido


por los extremeños más jovenes y los castellano-leoneses adultos
a la vista de las siguientes observaciones del consumo semanal,
en Kcal., de carne:
Castellano-leones: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12.
Extremeños: 12, 14, 11, 30, 10.
Ho : Me1 = Me2
Ha : Me1 ≠ Me2
Datos
Rango orden
Asignación de rangos:

7 10 11 11 12 12 12 14 14 16 18 21 22 30 34

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 2 3.5 3.5 6 6 6 8.5 8.5 10 11 12 13 14 15

Rango asignado
CASTELLANO-LEONESES:

16 11 14 21 18 34 22 7 12 12
R1= 86 10 3.5 8.5 12 11 15 13 1 6 6

EXTREMEÑOS

12 14 11 30 10
R2=34 6 8.5 3.5 14 2
Ho : Me1 = Me2
Ha : Me1 ≠ Me2

R1 y R2 son valores obtenidos al asignar un rango de valores


en cada muestra.
U = min(19, 31)
10(10 +1)
U1 = 10x5 + − 86 = 19
2
5(5 +1)
U 2 = 10x5 + − 34 = 31
2

Valor experimental U = min(19,31) = U = 19


Para obtener el punto crítico en la tabla de la normal, tipificamos

n1 .n 2
U−
Z= 2 = −0.73 < 1.96
n1.n 2 (n1 + n 2 +1)
12
p-valor > 0.05 =>
Se acepta Ho
Conclusión
Los resultados son no significativos, y
por lo tanto, a partir de estos datos,
no podemos afirmar que exista
diferencia entre el aporte calórico
semanal de los castellano leoneses
adultos y los extremeños jóvenes.
TEST NO PARAMETRICO

Contraste de hipótesis con datos


apareados, no normales.

Test de Wilcoxon
Ho : Mediferencias = 0
Ha : Mediferencias ≠ 0


TEST de WILCOXON
PASOS A DESARROLLAR:
Ø Calculamos las diferencias en cada elemento de la muestra para las dos
variables a estudiar.
Ø Se eliminan los elementos que tengan diferencias nulas.
Ø Ordenamos estas diferencias prescindiendo de los signos.
Ø Asignamos un rango de orden a las mismas.
Ø Se corrigen ligaduras

Ø Sumamos los rangos según los signos que tengan las diferencias y
obtenemos los estimadores:
• T(+) = Suma de rangos correspondientes a diferencias positivas.
• T (-) = Suma de rangos correspondientes a diferencias negativas.

Definimos el estadígrafo: T = Min [ T(+) , T(-) ]


TEST de WILCOXON
APROXIMACIÓN POR LA NORMAL

T = Min [ T(+) , T(-) ]

Cuando el número de individuos de la muestra es superior a 25,


el estadígrafo T se ajusta a una distribución NORMAL
T = N(n(n +1) /4; [n(n +1)(2n +1)] /24 )
T - n(n +1)/4
Z= ≡ N(0,1)
n(n +1)(2n +1) /24

Si Z≤Za=> Se acepta la Ho
Si Z>Za=> Se Rechaza la Ho

TEST de WILCOXON
Tabla Intervalos Aceptación H0, Contraste bilateral
T = Min [ T(+) , T(-) ] α 0.05 0.01
n
5
6 [0 , 21]

Si n<25 7
8
9
[2 , 26]
[3 , 33]
[5 , 40]
[0 , 36]
[1 , 44]
10 [8 , 47] [3 , 52]
11 [10 , 56] [5 , 61]
Se comprueba si el valor 12 [13 , 65] [7 , 71]
experimental pertenece al 13
14
[17 , 74]
[21 , 84]
[9 , 82]
[12 , 93]
intervalo de confianza 15 [25 , 95] [15 , 105]
16 [29 , 107] [19 , 117]
tabulado 17 [34 , 119] [23 , 130]
18 [40 , 131] [27 , 144]
19 [46 , 144] [33 , 158]
20 [52 , 158] [37 , 173]
21 [58 , 173] [42 , 189]
22 [66 , 187] [48 , 205]
23 [73 , 203] [54 , 222]
24 [81 , 210] [61 , 239]
25 [89 , 276] [68 , 257]
Ejemplo.
Para proteger contra las verrugas se ensayaron 2
tipos de crema A y B, aplicadas en dos zonas
diferentes de cada paciente.

Posteriormente se midió el diámetro en mm de la


zona afectada por verrugas, en la zona en la que
hemos aplicado la crema A y en la correspondiente
con la crema B. Los pares de medidas de una
muestra de 8 pacientes son los siguientes:
Ho : Med = 0 WILCOXON
Ha : Med ≠ 0
A 4 3 6 7 9 4 2 5
B 3 4 6 6 5 4 7 3

d 1 -1 0 1 4 0 -5 2
Rangos de “d” 2 2 - 2 5 - 6 4

Diferencias Rangos orden Rangos asignados


0 - -
0 - -
1 1 2
1 2 2
1 3 2
2 4 4
4 5 5
5 6 6
Ho : Med = 0 WILCOXON
Ha : Med ≠ 0
A 4 3 6 7 9 4 2 5
B 3 4 6 6 5 4 7 3

d 1 -1 0 1 4 0 -5 2
Rangos de “d” 2 2 - 2 5 - 6 4

α 0.05 0.01
T+=13
T pertenece al intervalo n
T-=8 de aceptación de la tabla 5
de Wilcoxon 6 [0 , 21]
T=mín(T+,T-)=8 7 [2 , 26]
n =6 8 [3 , 33] [0 , 36]
9
CONCLUSION: [5 , 40] [1 , 44]
10 [8 , 47] [3 , 52]
P - valor >0.05 No se11 detectan[10 diferencias
estadísticamente
, 56] [5 , 61]
12 [13 , 65]significativas
[7 , 71]
entre
13 la crema[17 , A,
74] y la [9B.
, 82]
s1 s2
H0: µ1=µ2
desconocidas
Ha: µ1¹µ2

DATOS
Muestras grandes Muestras pequeñas
(X1 − X 2 )
Z= 2 2
$ σ1 σ 2 '
& + )
Normal % n1 n 2 ( t de STUDENT
H0: e1 = Me2
H a: e1 ¹ Me2
DATOS
NO NORMALES
Independientes Riesgo de
equivocarse
al rechazar Ho
U de
Mann-Wihtney
NORMALES NO NORMALES
DATOS
APAREADOS
T Student
Wilcoxon
datos apareados

Si , se rechaza H0
Y si hay más de dos Grupos…?

ANOVA
Análisis de la varianza

También podría gustarte