Documentos de Académico
Documentos de Profesional
Documentos de Cultura
BIOESTADISTICA
Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin
BIOESTADISTICA
Guin:
1.
2.
3.
4.
5.
6.
Introduccin
Objetivos del Tema
Tablas de Distribucin de Frecuencias.
Grficos de Dispersin
Coeficiente de Correlacin.
Coeficiente de Regresin Lineal: Recta de Regresin
BIOESTADISTICA
Introduccin
Enlos
lostemas
temasanteriores
anterioreshemos
hemosestudiado
estudiadolas
lasprincipales
principales
En
caractersticas
dedistribuciones
distribucionesde
devariables
variables
caracter
sticas de
unidimensionales,, es
esdecir,
decir,para
paracada
cadaindividuo
individuose
semed
meda
unidimensionales
a
unanica
variable.
una
nica variable.
Sinembargo,
embargo,puede
puedesuceder
sucederque
quepara
paracada
cadaindividuo
individuose
se
Sin
midam
ms
deuna
unacaracter
caracterstica.
mida
s de
stica.
Eneste
estetema
temaconsideraremos
consideraremosque
quepara
paracada
cadaindividuo
individuose
se
En
hanmedido
medidodos
dosvariables
variables(es
(esdecir,
decir,una
unavariable
variable
han
bidimensional)yyse
seestudiar
estudiar
posiblerelaci
relacin
entre
bidimensional)
lalaposible
n entre
ambas.
ambas.
BIOESTADISTICA
Introduccin
Elestudio
estudiounidimensional
unidimensionalde
decada
cadauna
unade
delas
lasdos
dos
El
variablespuede
puedehacerse
hacerseseg
segn
seha
havisto
vistoen
eneleltema
tema
variables
n se
anterior,por
porlo
loque
queen
eneste
estetema
temanos
noscentraremos
centraremosen
enelel
anterior,
estudiode
delalaposible
posible
estudio
relaci
relacin
existente entre
entre las
las variables
variables..
n existente
BIOESTADISTICA
Introduccin
Nospreguntaremos
preguntaremospor
porejemplo
ejemploque
querelaci
relacin
tieneelelpeso
pesode
delos
los
Nos
n tiene
estudiantescon
consu
suestatura.
estatura.
estudiantes
Estees
esun
unejemplo
ejemplode
deuna
unaamplia
ampliaserie
seriede
depreguntas
preguntasque
quepodr
podran
Este
an
serimportantes:
importantes:
ser
PUEDE PREDECIRSE LA ESPERANZA DE VIDA
MIDIENDO LA TENSIN ARTERIAL?
LAS NOTAS DE LA SELECTIVIDAD PREDICEN EL
COMPORTAMIENTO ACADMICO EN LA
UNIVERSIDAD?
LEER LIBROS DE ESTADSTICA TE CONVIERTE
EN MEJOR PERSONA?
EL FUMAR PRODUCE CANCER?
Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin
BIOESTADISTICA
Guin:
1.
2.
3.
4.
5.
6.
Introduccin
Objetivos del Tema
Tablas de Distribucin de Frecuencias.
Grficos de Dispersin
Coeficiente de Correlacin.
Coeficiente de Regresin Lineal: Recta de Regresin
Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin
BIOESTADISTICA
En este tema consideraremos que para cada individuo se han medido dos
variables (es decir, una variable bidimensional) y se estudiar la posible
relacin entre ambas.
Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin
BIOESTADISTICA
Guin:
1.
2.
3.
4.
5.
6.
Introduccin
Objetivos del Tema
Tablas de Distribucin de Frecuencias.
Grficos de Dispersin
Coeficiente de Correlacin.
Coeficiente de Regresin Lineal: Recta de Regresin
BIOESTADISTICA
formade
deacceder
accederaalalaFacultad
Facultad
yy==forma
VP==Vehculo
VehculoPropio;
Propio;TP
TP==Transporte
TransportePblico;
Pblico;OO==Otros
Otrosmedios
medios
VP
13 Hombres acceden en
Vehculo Propio
10 Mujeres acceden en
Transporte Pblico
x/y
VP
TP
ni
H
M
13
10
10
10
6
1
29
21
nj
23
20
50
En total hay 29
Hombres y 21 Mujeres
En total hay
50 individuos
BIOESTADISTICA
Frecuencias absolutas
marginales para la variable x.
yJ
x1
n 11
n 12
n 1j
n 1J
n 1
x2
n 21
n 22
n 2j
n 2J
n 2
n ij
n iJ
n i
xI
n I 11
n I 22
n Ij
n IJ
nI
n 1
n 2
n j
n J
n j = n1 j + n2 j + L + nIj
ni2
ni1
xi
yj
y2
y1
ni = ni1 + ni 2 + L + niJ
n1 + n2 + L + nI
n=
n + n + L + n
J
1 2
BIOESTADISTICA
Distribuciones marginales
A partir de la distribucin bidimensional podemos estudiar cada una de las dos
variables de forma aislada, es decir, podemos estudiar por separado la
distribucin de la variable X y la de la variable Y.
Distribucin
Distribucin
Marginalde
delala
Marginal
variableXX
variable
y
x1
n 11
n 12
n 1j
n 1J
n 1
x2
n 21
n 22
n 2j
n 2J
n 2
y1
n 1
n 2
y2
n 2
n iJ
n i
x2
xI
nI1
nI2
n Ij
n IJ
nI
xi
n i
yj
n j
n 1
n 2
n j
n J
xI
nI
yJ
n J
n ij
n 1
nj
x1
n i2
Yj
n i1
ni
xi
Xi
yJ
yj
y2
y1
Distribucin
Distribucin
Marginalde
delala
Marginal
variableYY
variable
BIOESTADISTICA
Distribuciones condicionales
Podemos definir la distribucin de una de las variables sometida a una
condicin que afecte a una o a las dos variables:
y
n 11
n 12
n 1j
n 1J
n 1
x2
n 21
n 22
n 2j
n 2J
n 2
n ij
n iJ
n i
ni
Yj
nj
n Ij
n IJ
nI
x1
n 12
y1
n 11
n 1
n 2
n j
n J
x2
n 22
y2
n 12
n 1j
yj
n i2
xi
Esposible
posibleconstruir
construirlos
losgr
grficos
Es
ficos yy
calcularlos
losestad
estadsticos
asociadosaa
calcular
sticos asociados
distribucin
condicional,
laladistribuci
n condicional,
tratndola
comouna
unavariable
variable
trat
ndola como
unidimensional.
unidimensional.
nI2
nI1
xI
Xi
n i2
y | x = x1
n i1
x | y = y2
xi
x1
yJ
yj
y2
Distribucinde
deyy
Distribucin
Condicionadaaa
Condicionada
xx==xx11
y1
Distribucinde
dexx
Distribucin
Condicionadaaa
Condicionada
yy==yy22
xI
nI2
yJ
n 1J
n 2
n 1
BIOESTADISTICA
y
x
5
10
15
n j
4 ni
1
2
3
6
2
1
2
5
1
3
1
5
3
2
2
7
x| y =2
7
8
8
23
y | x = 10
xi
ni
yj nj
5
10
15
2
1
2
5
2
1
3
2
8
1
2
3
4
x| y 2
5
10
15
x | x y < 40
1
2
3
2
1
2
5
10
15
1
2
3
2
1
2
1
3
1
3
2
xi
ni
xi
ni
5
10
15
3
3
5
11
5
10
15
7
6
5
18
BIOESTADISTICA
Lasfrecuencias
frecuenciasrelativas
relativasde
delas
lasdistribuciones
distribucionescondicionadas
condicionadassern:
sern:
Las
Paray|x
y|x==xxi: : f j|i = nij ni
Parax|y
x|y==yyj: : f i| j = nij n j
Para
Para
j
x/y
VP
TP
ni
x/y
VP
TP
f i
H
M
13
10
10
10
6
1
29
21
H
M
0,26
0,20
0,20
0,20
0,12
0,02
0,58
0,42
nj
23
20
50
fj
0,46
0,40
0,14
1,00
Frecuenciasrelativas
relativasconjuntas
conjuntas
Frecuencias
Frecuenciasrelativas
relativasmarginales
marginales
Frecuencias
BIOESTADISTICA
Independencia estadstica
Las variables x e y se dice que son estadsticamente independientes cuando la
frecuencia relativa conjunta es igual al producto de las frecuencias relativas
marginales.
f ij
f j
fi
xi
yj
independientescuando
cuandopara
paratodo
todopar
par(x(x,i,
xxeeyyindependientes
i
y
)
se
verifica:
f
=
f
f
yj)j se verifica: fijij= fiifjj
Esdecir:
decir:
Es
nij
n
ni n j
n n
nij =
ni n j
n
nij
n j
ni
n j
n = ni = f
i
n j
n
f j|i =
nij
ni
ni
n j
n = n j = f
j
ni
n
BIOESTADISTICA
2923/50==13,4
13,4
2923/50
2123/50==9,66
9,66
2123/50
x/y
VP
TP
ni
H
M
13
10
10
10
6
1
29
21
nj
23
20
50
2920/50==11,6
11,6
2920/50
2120/50==8,4
8,4
2120/50
297/50==4,1
4,1
297/50
217/50==2,9
2,9
217/50
Qu significa
significa lo
lo suficientemente
suficientemente
Qu
grande?
grande?
Existeuna
unacierta
ciertadiscrepancia
discrepanciaentre
entreelelvalor
valorde
delas
lasfrecuencias
frecuenciasabsolutas
absolutasobservado
observadoyyelel
Existe
quedeberan
deberantener
tenersisilas
lasdos
dosvariables
variablesfueran
fueranindependientes.
independientes.
que
Si consideramos
consideramos lala discrepancia
discrepancia lolo suficientemente
suficientemente grande,
grande, diremos
diremos que
que no
no son
son
Si
independientes, eses decir,
decir, la
forma de
de acceder
acceder aa lala facultad
facultad se
se distribuye
distribuye de
de forma
forma
independientes,
la forma
diferente entre
entre los
los hombres
hombres yy las
las mujeres
mujeres
sexo sese distribuye
distribuye de
de forma
forma diferente
diferente
diferente
oo el
el sexo
entrelos
losalumnos
alumnosseg
segn
suforma
formade
deacceder
accederaalalafacultad
facultad.
entre
n su
.
BIOESTADISTICA
y
1
ni
15
75
10
30
300
15
60
900
n j
10
105
1.275
y j n j
20
27
y j n j
80
xi n i xi n i
91
X=
X n
2 = X 2 (X )
i i
i =1
Media marginal de x
I
x=
xn
i =1
i i
105
= 10,5
10
Media marginal de y
J
y=
y n
i =1
j j
27
= 2,7
10
Varianza marginal de x
Varianza marginal de y
S y2 = y 2 y 2 =
91
2,7 2 = 1,81
10
S x2 = x 2 x 2 =
1.275
10,52 = 17,25
10
Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin
BIOESTADISTICA
Guin:
1.
2.
3.
4.
5.
6.
Introduccin
Objetivos del Tema
Tablas de Distribucin de Frecuencias.
Grficos de Dispersin
Coeficiente de Correlacin.
Coeficiente de Regresin Lineal: Recta de Regresin
BIOESTADISTICA
yi
xi
los
los
de
BIOESTADISTICA
( x, y )
( x, y )
Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin
BIOESTADISTICA
Guin:
1.
2.
3.
4.
5.
6.
Introduccin
Objetivos del Tema
Tablas de Distribucin de Frecuencias.
Grficos de Dispersin
Coeficiente de Correlacin.
Coeficiente de Regresin Lineal: Recta de Regresin
BIOESTADISTICA
BIOESTADISTICA
BIOESTADISTICA
BIOESTADISTICA
S x2 =
2
(
)
x
x
i =1
n
2
(
)
y
y
S xy =
S y2 =
(x x )( y
i =1
y)
= xy x y
i =1
n
Signo de (xi x )( yi y )
+ + = +
+ =
(x , y )
= +
Cuadrante
1
2
+ =
3
4
Signo de
( xi x )
+
Signo de
(yi y )
+
+
Signo de
( xi x )( yi
+
y)
BIOESTADISTICA
El signo de la covarianza
( x, y )
SSxyxy>>00
( x, y )
SSxyxy==00
SSxyxy<<00
BIOESTADISTICA
x
1,00
1,20
1,40
2,50
2,00
1,80
1,60
0,80
1,00
1,10
14,40
1,44
y
1,85
2,17
2,00
3,17
3,02
2,57
2,24
1,74
1,65
1,67
22,08
2,208
x
1,00
1,44
1,96
6,25
4,00
3,24
2,56
0,64
1,00
1,21
23,30
2,33
y
3,4225
4,7089
4,0000
10,0489
9,1204
6,6049
5,0176
3,0276
2,7225
2,7889
51,4622
5,1462
xy
1,8500
2,6040
2,8000
7,9250
6,0400
4,6260
3,5840
1,3920
1,6500
1,8370
34,3080
3,4308
xy
0,00
0,00
0,50
1,00
1,50
2,00
2,50
3,00
Observandolalanube
nubede
depuntos
puntos
Observando
(Graficode
dedispersin)
dispersin)sese
(Grafico
apreciaque
queexiste
existeuna
unarelacin
relacin
aprecia
linealdirecta
directaentre
entreambas
ambas
lineal
variables(covarianza
(covarianzapositiva).
positiva).
variables
BIOESTADISTICA
ni
xin i
15
10
30
15
60
n j
10
105
y j n j
20
27
105
= 10,5
10
y=
27
= 2,7
10
S xy = xy x y =
1012==20
20
1012
x i y j n ij
5
10
15
5
20
0
25
0
20
30
50
40
0
180
220
Suma
x=
295
=
10,5 2,7 = 1,15
10
295
BIOESTADISTICA
BIOESTADISTICA
r=
n
( xi x ) ( yi y )
i =1
S xy
n
= xy x y
=
r=
2
2
Sx S y
Sx S y
Sx S y
S xy
Sx S y
En el ejemplo anterior : r =
0,25
= 0,95
0,26 0,27
BIOESTADISTICA
BIOESTADISTICA
Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin
BIOESTADISTICA
Guin:
1.
2.
3.
4.
5.
6.
Introduccin
Objetivos del Tema
Tablas de Distribucin de Frecuencias.
Grficos de Dispersin
Coeficiente de Correlacin.
Coeficiente de Regresin Lineal: Recta de Regresin
BIOESTADISTICA
BIOESTADISTICA
BIOESTADISTICA
BIOESTADISTICA
BIOESTADISTICA
Regresin lineal
La existencia de una relacin lineal entre las variables implica la existencia de una recta
que se ajusta a la nube de puntos, siendo mayor el ajuste cuanto ms fuerte es la
relacin lineal (cuanto ms cercano a 1 a 1 est r).
El ajuste se entiende como la proximidad del valor de la y de los puntos al valor de la y
que resulta de aplicar la ecuacin de la recta sustituyendo la x de los puntos.
Errorpara
paraelel
Error
puntoi-simo.
i-simo.
punto
El error puede ser positivo o
negativo, por lo que consideraremos
el error elevado al cuadrado (error
cuadrtico).
ei = yi y i
(xi, yi)
yi
y i
y = a + bx
y i = a + bxi
xi
BIOESTADISTICA
ECM =
40
e
i =1
2
i
(
)
y
y
i i
i =1
35
35
30
30
25
25
20
20
15
15
10
10
0
0
10
12
ECM=128,31
ECM=128,31
14
16
18
40
20
10
12
ECM=20,44
ECM=20,44
14
16
18
20
BIOESTADISTICA
b=
S xy
S x2
a = y bx
Enelelejemplo
ejemplode
delaladiapositiva
diapositiva27:
27:
En
x = 1,44
S x2 = 0,26
y = 2,208
b=
S xy
S
2
x
S y2 = 0,27
S xy = 0,25
0,25
= 0,98
0,26
a = y bx
= 2,208 0,98 1,44 = 0,80
y = 0,80 + 0,98 x
3,5
3,0
y = 0,98x + 0,80
2,5
2,0
1,5
1,0
0,5
1,0
1,5
2,0
2,5
BIOESTADISTICA
3,5
3,0
y = 0,98x + 0,80
2,5
2,0
1,5
1,0
0,5
1,0
1,5
2,0
2,5
BIOESTADISTICA
Ejemplo
En la siguiente tabla se muestra el peso al nacer (X) y el incremento de peso entre
los das 70 y 100 de vida, expresado como porcentaje del peso al nacer (Y) para
12 nios.
1
2
3
4
5
6
7
8
9
10
11
12
X
112
111
107
119
92
80
81
84
118
106
103
94
Y
63
66
72
52
75
118
120
114
42
72
90
91
140
120
100
80
60
40
20
75
85
95
105
115
125
BIOESTADISTICA
Ejemplo (continuacin)
1
2
3
4
5
6
7
8
9
10
11
12
r=
2
2
X
Y
X
Y
XY
12.544
3.969
7.056
112
63
12.321
4.356
7.326
111
66
11.449
5.184
7.704
107
72
14.161
2.704
6.188
119
52
8.464
5.625
6.900
92
75
6.400 13.924
9.440
80 118
6.561 14.400
9.720
81 120
7.056 12.996
9.576
84 114
13.924
1.764
4.956
118
42
11.236
5.184
7.632
106
72
10.609
8.100
9.270
103
90
8.836
8.281
8.554
94
91
1.207 975 123.561 86.487 94.322
100,58 81,25 10.296,75 7.207,25 7.860,17
X
Y
XY
X2
Y2
S XY
= 0,9463
S X SY
R 2 = r 2 = 0,8955
S X2 = X 2 X
SY2 = Y 2
S X = 13,4068
SY = 24,6107
2
S XY
= XY X Y = 7.860,17 100,58 81,25 = 312,2292
m=
Y = mX + b
S XY
= 1,7371
2
SX
b = Y m X = 255,9719
BIOESTADISTICA
Ejemplo (continuacin)
140
y = -1,7371x + 255,97
120
R = 0,8955
100
80
60
40
20
75
85
95
105
115
125
BIOESTADISTICA
Ejercicio 1
Se dispone del valor de dos variables para 30 observaciones, segn la siguiente tabla:
X
1,9
1,5
1,5
1,8
1,4
40,2
1,6080
SUMA
MEDIA
Y
2,5
2,0
2,2
2,3
2,1
53,7
2,1480
XY
4,75
3,00
3,30
4,14
2,94
88,38
3,5352
X
3,61
2,25
2,25
3,24
1,96
67,14
2,6856
Y
6,25
4,00
4,84
5,29
4,41
117,39
4,6956
Modelode
deregresin
regresinlineal
linealy=f(x).
y=f(x).
a.a. Modelo
Valor estimado
estimado para
para yy para
para una
una
b.b. Valor
observacincon
conx=1,5?.
x=1,5?.
observacin
Calculayycomenta
comentalalaRR22. .
c.c. Calcula
b=
S xy
2
x
= 0,8127
S
a = y bx = 0,8412
Modelode
deRegresin
Regresin
Modelo
y = 0,8412 + 0,8127 x
r=
S xy
SxS y
= 0,8988
R 2 = 0,8079
Elmodelo
modeloexplica
explicaelel80,79%
80,79%de
delalavariabilidad
variabilidadde
delalavariable
variableyyaapartir
partirde
de
El
variabilidaden
enlalavariable
variablex.x.
lalavariabilidad
BIOESTADISTICA
Ejercicio 2
Para un grupo de 10 pacientes se ha medido la concentracin en la sangre de dos elementos.
El elemento A (variable x), en ppl (partculas por litro) y el elemento B (variable y), en ppl,
obteniendo la siguiente tabla:
X 15 16 19 15 15 21 19 18 10 18
Y 53 68 66 61 59 82 76 77 42 66
a.-Modelo de regresin lineal.
b.-Concentracin del elemento B esperada para 17 ppl de elemento A. R2.
c.- Representa grficamente la nube de puntos y la recta de regresin obtenida.
Y
53
68
66
61
59
82
76
77
42
66
650
65
XY
795
1.088
1.254
915
885
1.722
1.444
1.386
420
1.188
11.097
1.109,7
X
225
256
361
225
225
441
361
324
100
324
2.842
284,2
Y
2.809
4.624
4.356
3.721
3.481
6.724
5.776
5.929
1.764
4.356
43.540
4.354
90
y = 6,0162 + 3,5532 x
y (17 ) = 66,4213
85
Concentracin de B p( pl )
X
15
16
19
15
15
21
19
18
10
18
166
16,6
80
y = 3,5532x + 6,0162
2
R = 0,8456
75
70
65
60
55
50
45
40
9 10 11 12 13 14 15 16 17 18 19 20 21 22
Concentracin de A (ppl )
BIOESTADISTICA
Ejercicio 3
BIOESTADISTICA
Correlaciones
N de muertes diarias
Humo atmosfrico
(mg/m3)
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
N de
muertes
diarias
1
Humo
atmosfrico
(mg/m3)
,756**
,001
15
15
,756**
1
,001
15
15
r2
BIOESTADISTICA
R
R cuadrado
,756a
,572
R cuadrado
corregida
,539
Error tp. de la
estimacin
88,710
Coeficientesa
Modelo
1
(Constante)
Humo atmosfrico
(mg/m3)
Coeficientes no
estandarizados
B
Error tp.
171,819
31,434
63,761
15,312
Coeficientes
estandarizad
os
Beta
,756
t
5,466
Sig.
,000
4,164
,001
y= 171,819 + 63,761x
BIOESTADISTICA