Está en la página 1de 50

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Universidad Catlica de Valencia San Vicente Mrtir


Facultad de Medicina
ESTADSTICA APLICADA
Odontologa (OD1)
Departamento de
Epidemiologa, Medicina
Preventiva, Anlisis crtico y
Metodologa de la
investigacin

Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin

BIOESTADISTICA

9 Tema 4: Estadstica Descriptiva Bidimensional

Guin:
1.
2.
3.
4.
5.
6.

Introduccin
Objetivos del Tema
Tablas de Distribucin de Frecuencias.
Grficos de Dispersin
Coeficiente de Correlacin.
Coeficiente de Regresin Lineal: Recta de Regresin

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Introduccin
Enlos
lostemas
temasanteriores
anterioreshemos
hemosestudiado
estudiadolas
lasprincipales
principales
En
caractersticas
dedistribuciones
distribucionesde
devariables
variables
caracter
sticas de
unidimensionales,, es
esdecir,
decir,para
paracada
cadaindividuo
individuose
semed
meda
unidimensionales
a
unanica
variable.
una
nica variable.
Sinembargo,
embargo,puede
puedesuceder
sucederque
quepara
paracada
cadaindividuo
individuose
se
Sin
midam
ms
deuna
unacaracter
caracterstica.
mida
s de
stica.
Eneste
estetema
temaconsideraremos
consideraremosque
quepara
paracada
cadaindividuo
individuose
se
En
hanmedido
medidodos
dosvariables
variables(es
(esdecir,
decir,una
unavariable
variable
han
bidimensional)yyse
seestudiar
estudiar
posiblerelaci
relacin
entre
bidimensional)
lalaposible
n entre
ambas.
ambas.

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Introduccin
Elestudio
estudiounidimensional
unidimensionalde
decada
cadauna
unade
delas
lasdos
dos
El
variablespuede
puedehacerse
hacerseseg
segn
seha
havisto
vistoen
eneleltema
tema
variables
n se
anterior,por
porlo
loque
queen
eneste
estetema
temanos
noscentraremos
centraremosen
enelel
anterior,
estudiode
delalaposible
posible

estudio

relaci
relacin
existente entre
entre las
las variables
variables..
n existente

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Introduccin
Nospreguntaremos
preguntaremospor
porejemplo
ejemploque
querelaci
relacin
tieneelelpeso
pesode
delos
los
Nos
n tiene
estudiantescon
consu
suestatura.
estatura.
estudiantes
Estees
esun
unejemplo
ejemplode
deuna
unaamplia
ampliaserie
seriede
depreguntas
preguntasque
quepodr
podran
Este
an
serimportantes:
importantes:
ser
PUEDE PREDECIRSE LA ESPERANZA DE VIDA
MIDIENDO LA TENSIN ARTERIAL?
LAS NOTAS DE LA SELECTIVIDAD PREDICEN EL
COMPORTAMIENTO ACADMICO EN LA
UNIVERSIDAD?
LEER LIBROS DE ESTADSTICA TE CONVIERTE
EN MEJOR PERSONA?
EL FUMAR PRODUCE CANCER?

Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin

BIOESTADISTICA

9 Tema 4: Estadstica Descriptiva Bidimensional

Guin:
1.
2.
3.
4.
5.
6.

Introduccin
Objetivos del Tema
Tablas de Distribucin de Frecuencias.
Grficos de Dispersin
Coeficiente de Correlacin.
Coeficiente de Regresin Lineal: Recta de Regresin

Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin

BIOESTADISTICA

9 Tema 4: Estadstica Descriptiva Bidimensional


OBJETIVOS DEL TEMA:

En este tema consideraremos que para cada individuo se han medido dos
variables (es decir, una variable bidimensional) y se estudiar la posible
relacin entre ambas.

Aprenderemos a construir una tabla de distribucin de frecuencias para


una variable bidimensional

Aprenderemos a conocer la correlacin lineal de Pearson como medida


de asociacin entre dos variables.

Aprenderemos a conocer la regresin lineal, su interpretacin y


aplicacin prctica, para una interpretacin descriptiva.

Aprenderemos a conocer el diagrama de dispersin como grfico de


representacin bsico de las relaciones entre variables numricas.

Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin

BIOESTADISTICA

9 Tema 4: Estadstica Descriptiva Bidimensional

Guin:
1.
2.
3.
4.
5.
6.

Introduccin
Objetivos del Tema
Tablas de Distribucin de Frecuencias.
Grficos de Dispersin
Coeficiente de Correlacin.
Coeficiente de Regresin Lineal: Recta de Regresin

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Tablas de doble entrada (Frecuencias)


Ejemplo
Ejemplo
Sobreun
unconjunto
conjuntode
de50
50alumnos
alumnosde
delalaFacultad
Facultadse
sedefinen
definenlas
lasvariables:
variables:
Sobre
gnero
xx==gnero
Hombre;M
M==Mujer
Mujer
HH==Hombre;

formade
deacceder
accederaalalaFacultad
Facultad
yy==forma

VP==Vehculo
VehculoPropio;
Propio;TP
TP==Transporte
TransportePblico;
Pblico;OO==Otros
Otrosmedios
medios
VP

13 Hombres acceden en
Vehculo Propio
10 Mujeres acceden en
Transporte Pblico

x/y

VP

TP

ni

H
M

13
10

10
10

6
1

29
21

nj

23

20

50

En total hay 29
Hombres y 21 Mujeres
En total hay
50 individuos

23 alumnos acceden con Vehculo Propio, 20 con


Transporte Pblico y 7 por Otros medios

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Tablas de doble entrada (Frecuencias)


En general tenemos dos variables x e y, de manera que sobre x se definen I
categoras (o intervalos) diferentes {x1, , xI} y sobre y se definen J categoras (o
intervalos) diferentes {y1, , yJ} :
ni:

Frecuencias absolutas
marginales para la variable x.
yJ

x1

n 11

n 12

n 1j

n 1J

n 1

x2

n 21

n 22

n 2j

n 2J

n 2

n ij

n iJ

n i

xI

n I 11

n I 22

n Ij

n IJ

nI

n 1

n 2

n j

n J

nj: Frecuencias absolutas


marginales para la variable y.

n j = n1 j + n2 j + L + nIj

ni2

ni1

xi

yj

y2

y1

ni = ni1 + ni 2 + L + niJ

n1 + n2 + L + nI

n=

n + n + L + n
J
1 2

Frecuencias absolutas conjuntas


N de veces que se ha dado x = xi
conjuntamente con y = yj

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Distribuciones marginales
A partir de la distribucin bidimensional podemos estudiar cada una de las dos
variables de forma aislada, es decir, podemos estudiar por separado la
distribucin de la variable X y la de la variable Y.
Distribucin
Distribucin
Marginalde
delala
Marginal
variableXX
variable

y
x1

n 11

n 12

n 1j

n 1J

n 1

x2

n 21

n 22

n 2j

n 2J

n 2

y1

n 1

n 2

y2

n 2

n iJ

n i

x2

xI

nI1

nI2

n Ij

n IJ

nI

xi

n i

yj

n j

n 1

n 2

n j

n J

xI

nI

yJ

n J

n ij

n 1

nj

x1

n i2

Yj

n i1

ni

xi

Xi

yJ

yj

y2

y1

Distribucin
Distribucin
Marginalde
delala
Marginal
variableYY
variable

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Distribuciones condicionales
Podemos definir la distribucin de una de las variables sometida a una
condicin que afecte a una o a las dos variables:
y
n 11

n 12

n 1j

n 1J

n 1

x2

n 21

n 22

n 2j

n 2J

n 2

n ij

n iJ

n i

ni

Yj

nj

n Ij

n IJ

nI

x1

n 12

y1

n 11

n 1

n 2

n j

n J

x2

n 22

y2

n 12
n 1j

yj

n i2

xi

Esposible
posibleconstruir
construirlos
losgr
grficos
Es
ficos yy
calcularlos
losestad
estadsticos
asociadosaa
calcular
sticos asociados
distribucin
condicional,
laladistribuci
n condicional,
tratndola
comouna
unavariable
variable
trat
ndola como
unidimensional.
unidimensional.

nI2

nI1

xI

Xi

n i2

y | x = x1

n i1

x | y = y2

xi

x1

yJ

yj

y2

Distribucinde
deyy
Distribucin
Condicionadaaa
Condicionada
xx==xx11

y1

Distribucinde
dexx
Distribucin
Condicionadaaa
Condicionada
yy==yy22

xI

nI2

yJ

n 1J

n 2

n 1

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Distribuciones condicionales: ejemplo


Dada la tabla de doble entrada, construye la distribucin de las siguientes
variables: x|y = 2; y|x =10; x|y 2; x|xy < 40.

y
x

5
10
15
n j

4 ni

1
2
3
6

2
1
2
5

1
3
1
5

3
2
2
7

x| y =2

7
8
8
23

y | x = 10

xi

ni

yj nj

5
10
15

2
1
2
5

2
1
3
2
8

1
2
3
4

x| y 2
5
10
15

x | x y < 40

1
2
3

2
1
2

5
10
15

1
2
3

2
1
2

1
3
1

3
2

xi

ni

xi

ni

5
10
15

3
3
5
11

5
10
15

7
6
5
18

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Frecuencias absolutas y relativas


es elel nmero
nmero de
de ocurrencias
ocurrencias de
de lala combinacin
combinacin (x(x,i, yy),j), es
es decir,
decir, lala frecuencia
frecuencia
nnijij es
i
j
absoluta.
absoluta.
Por analoga
analoga con
con las
las variables
variables unidimensionales,
unidimensionales, definimos
definimos lala frecuencia
frecuencia relativa
relativa
Por
paralalacombinacin
combinacin(x(x,i,yy)j)cmo:
cmo:
nij
para
i j
f ij =

Lasfrecuencias
frecuenciasrelativas
relativasde
delas
lasdistribuciones
distribucionescondicionadas
condicionadassern:
sern:
Las
Paray|x
y|x==xxi: : f j|i = nij ni
Parax|y
x|y==yyj: : f i| j = nij n j
Para
Para
j

Tabla de Frecuencias Absolutas

Tabla de Frecuencias Relativas

x/y

VP

TP

ni

x/y

VP

TP

f i

H
M

13
10

10
10

6
1

29
21

H
M

0,26
0,20

0,20
0,20

0,12
0,02

0,58
0,42

nj

23

20

50

fj

0,46

0,40

0,14

1,00

Frecuenciasrelativas
relativasconjuntas
conjuntas
Frecuencias

Frecuenciasrelativas
relativasmarginales
marginales
Frecuencias

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Independencia estadstica
Las variables x e y se dice que son estadsticamente independientes cuando la
frecuencia relativa conjunta es igual al producto de las frecuencias relativas
marginales.

f ij

f j

fi

xi

yj

independientescuando
cuandopara
paratodo
todopar
par(x(x,i,
xxeeyyindependientes
i
y
)
se
verifica:
f
=
f
f
yj)j se verifica: fijij= fiifjj
Esdecir:
decir:
Es

nij
n

ni n j
n n

nij =

ni n j
n

Si hay Independencia Estadstica las frecuencias relativas condicionadas


coinciden con sus correspondientes frecuencias relativas marginales:
f i| j =

nij
n j

ni

n j

n = ni = f
i
n j
n

f j|i =

nij
ni

ni

n j

n = n j = f
j
ni
n

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Independencia estadstica: ejemplo

2923/50==13,4
13,4
2923/50
2123/50==9,66
9,66
2123/50

x/y

VP

TP

ni

H
M

13
10

10
10

6
1

29
21

nj

23

20

50

2920/50==11,6
11,6
2920/50
2120/50==8,4
8,4
2120/50

297/50==4,1
4,1
297/50
217/50==2,9
2,9
217/50

Qu significa
significa lo
lo suficientemente
suficientemente
Qu
grande?
grande?

Existeuna
unacierta
ciertadiscrepancia
discrepanciaentre
entreelelvalor
valorde
delas
lasfrecuencias
frecuenciasabsolutas
absolutasobservado
observadoyyelel
Existe
quedeberan
deberantener
tenersisilas
lasdos
dosvariables
variablesfueran
fueranindependientes.
independientes.
que
Si consideramos
consideramos lala discrepancia
discrepancia lolo suficientemente
suficientemente grande,
grande, diremos
diremos que
que no
no son
son
Si
independientes, eses decir,
decir, la
forma de
de acceder
acceder aa lala facultad
facultad se
se distribuye
distribuye de
de forma
forma
independientes,
la forma
diferente entre
entre los
los hombres
hombres yy las
las mujeres
mujeres
sexo sese distribuye
distribuye de
de forma
forma diferente
diferente
diferente
oo el
el sexo
entrelos
losalumnos
alumnosseg
segn
suforma
formade
deacceder
accederaalalafacultad
facultad.
entre
n su
.

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Estadsticos marginales (Media, Varianza y Desviacin Tpica)


I

y
1

ni

15

75

10

30

300

15

60

900

n j

10

105

1.275

y j n j

20

27

y j n j

80

xi n i xi n i

91

X=

X n

2 = X 2 (X )

i i

i =1

Media marginal de x
I

x=

xn
i =1

i i

105
= 10,5
10

Media marginal de y
J

y=

y n
i =1

j j

27
= 2,7
10

Varianza marginal de x

Varianza marginal de y

S y2 = y 2 y 2 =

91
2,7 2 = 1,81
10

S x2 = x 2 x 2 =

1.275
10,52 = 17,25
10

Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin

BIOESTADISTICA

9 Tema 4: Estadstica Descriptiva Bidimensional

Guin:
1.
2.
3.
4.
5.
6.

Introduccin
Objetivos del Tema
Tablas de Distribucin de Frecuencias.
Grficos de Dispersin
Coeficiente de Correlacin.
Coeficiente de Regresin Lineal: Recta de Regresin

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Grficos de Puntos o de Dispersin


Si etiquetamos los datos relativos a una variable como X y
relativos a la otra variable como Y podemos representar
puntos (Xi,Yi) en un diagrama de bidimensional
abscisas/coordenadas que recibe el nombre de:

GRFICO DE DISPERSION DE PUNTOS


(xi, yi)

yi

xi

los
los
de

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Grficos de Puntos o de Dispersin

( x, y )

( x, y )

Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin

BIOESTADISTICA

9 Tema 4: Estadstica Descriptiva Bidimensional

Guin:
1.
2.
3.
4.
5.
6.

Introduccin
Objetivos del Tema
Tablas de Distribucin de Frecuencias.
Grficos de Dispersin
Coeficiente de Correlacin.
Coeficiente de Regresin Lineal: Recta de Regresin

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Correlacin Lineal (I)


Al dibujar el grfico de dispersin hemos visto que en
ocasiones las variables cambian de forma asociada o
relacionada.
El anlisis de correlacin tiene como finalidad examinar la
direccin y la magnitud de la asociacin entre las dos
variables.
Nos permitir conocer la intensidad de esa relacin y si al
aumentar el valor de una variable aumenta o disminuye el
valor de la otra (relacin directa o inversa).
Las variables utilizadas en la correlacin son simtricas,
en este caso no tenemos una variable dependiente y otra
independiente como en la regresin. Son por tanto
intercambiables.

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Correlacin Lineal (II)


Para medir o cuantificar el grado de asociacin entre dos
variables debemos calcular el Coeficiente de correlacin
Hay dos coeficientes de correlacin que se usan
frecuentemente, el de Pearson (el mas frecuente) y el de
Spearman
El Coeficiente de correlacin de Pearson es un mtodo
estadstico paramtrico (requiere que las variables sean
normales y utiliza en sus clculos la media y la varianza).
Es un ndice que mide lo bien que se ajustan los puntos a
una lnea recta ideal.
El de Spearman mide cualquier tipo de asociacin, no
necesariamente lineal.

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Correlacin Lineal (III)


Se llama COVARIANZA a la propiedad de dos
variables de cambiar de forma coordinada y al
unsono
La Covarianza de xy se calcula multiplicando para
cada sujeto u observacin las diferencias con
respecto a la media de cada valor de x por las
diferencias con respecto a la media de cada valor
de y. A continuacin se suman las cantidades
obtenidas y se divide el resultado por el numero
de individuos de la muestra (n)

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Un nuevo Estadstico: La Covarianza


n

S x2 =

2
(
)
x
x

i =1

n
2
(
)
y
y

S xy =

S y2 =

(x x )( y
i =1

y)

= xy x y

i =1

n
Signo de (xi x )( yi y )

+ + = +

+ =
(x , y )

= +

Cuadrante
1
2

+ =

3
4

Signo de

( xi x )
+

Signo de

(yi y )
+
+

Signo de

( xi x )( yi
+

y)

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

El signo de la covarianza

( x, y )

SSxyxy>>00

( x, y )

SSxyxy==00

SSxyxy<<00

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Clculo de la covarianza con tabla simple


Individuo
1
2
3
4
5
6
7
8
9
10
Suma
Media

x
1,00
1,20
1,40
2,50
2,00
1,80
1,60
0,80
1,00
1,10
14,40
1,44

y
1,85
2,17
2,00
3,17
3,02
2,57
2,24
1,74
1,65
1,67
22,08
2,208

x
1,00
1,44
1,96
6,25
4,00
3,24
2,56
0,64
1,00
1,21
23,30
2,33

y
3,4225
4,7089
4,0000
10,0489
9,1204
6,6049
5,0176
3,0276
2,7225
2,7889
51,4622
5,1462

xy
1,8500
2,6040
2,8000
7,9250
6,0400
4,6260
3,5840
1,3920
1,6500
1,8370
34,3080
3,4308

Suma de los productos xy


4,00
3,50
3,00
2,50
2,00
1,50
1,00
0,50

xy

S = x x = 2,33 1,44 = 0,26


2
x

S y2 = y 2 y 2 = 5,15 2,212 = 0,27

S xy = xy x y = 3,43 1,44 2,21 = 0,25

0,00
0,00

0,50

1,00

1,50

2,00

2,50

3,00

Observandolalanube
nubede
depuntos
puntos
Observando
(Graficode
dedispersin)
dispersin)sese
(Grafico
apreciaque
queexiste
existeuna
unarelacin
relacin
aprecia
linealdirecta
directaentre
entreambas
ambas
lineal
variables(covarianza
(covarianzapositiva).
positiva).
variables

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Clculo de la covarianza con tabla de doble entrada


y

ni

xin i

15

10

30

15

60

n j

10

105

y j n j

20

27

105
= 10,5
10

y=

27
= 2,7
10

S xy = xy x y =

1012==20
20
1012
x i y j n ij

5
10
15

5
20
0
25

0
20
30
50

40
0
180
220

Suma

x=

295
=
10,5 2,7 = 1,15
10
295

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

El coeficiente de correlacin lineal de Pearson (r)

La covarianza presenta el handicap de depender de la


escala, por lo que es interesante introducir otra medida
para la relacin lineal entre dos variables que no se vea
afectada por cambios en las unidades de medida
empleadas.

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

El coeficiente de correlacin lineal de Pearson (r)


El coeficiente de correlacin lineal, denotado con la letra r,
es el cociente entre la covarianza y el producto de las
desviaciones tpicas de las dos variables:

r=
n

( xi x ) ( yi y )
i =1

S xy
n

= xy x y
=
r=
2
2

Sx S y
Sx S y
Sx S y

S xy
Sx S y
En el ejemplo anterior : r =

0,25
= 0,95
0,26 0,27

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

El coeficiente de correlacin lineal de Pearson (r)


El coeficiente de correlacin lineal:
Slo toma valores comprendidos entre 1 y +1.
R=0 No existe Correlacin.
R>0 Asociacin directa o correlacin +
R<0 Asociacin indirecta o correlacin
Si |r| 1 existir una relacin lineal muy fuerte entre
las variables.
|r| < 0,30 Asociacin dbil
|r| <= 0,70 Asociacin moderada
|r| > 0,70 Asociacin Fuerte

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

El coeficiente de correlacin lineal de Pearson (r)


El coeficiente de correlacin lineal:
Carece de unidades de medida, es decir, es adimensional.
Es invariante frente a transformaciones lineales (cambio de
origen y escala) de las variables.
El valor de r ser grande cuando los puntos estn muy
concentrados en torno a la recta y pequeos cuando los
puntos del grafico estn dispersos con respecto a la recta.

Departamento
Epidemiologa,
Tema 4: Estadstica
Descriptivade
Bidimensional
Anlisis critico y Metodologa de la investigacin

BIOESTADISTICA

9 Tema 4: Estadstica Descriptiva Bidimensional

Guin:
1.
2.
3.
4.
5.
6.

Introduccin
Objetivos del Tema
Tablas de Distribucin de Frecuencias.
Grficos de Dispersin
Coeficiente de Correlacin.
Coeficiente de Regresin Lineal: Recta de Regresin

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Regresin Lineal (I)


La regresin lineal consiste en obtener una funcin lineal
en la que se relacione una variable que se intenta explicar
(variable dependiente o explicada) con otra/s que
conocemos a priori, y a las que denominamos variables
independientes o explicativas.
Todas las variables deben ser cuantitativas.
La funcin obtenida servir para explicar y predecir el
valor de la variable dependiente o explicada

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Regresin Lineal (II)


Cuando utilizamos una sola variable explicativa estamos
ante una regresin lineal simple. Cuando son dos o mas
variables explicativas o independientes ser una regresin
lineal mltiple.
La correlacin mide la direccin y magnitud de la
asociacin entre las dos variables, pero no nos permite
predecir el valor de una de ellas en funcin de variaciones
de la otra.
En la regresin, el objetivo es obtener una funcin (lineal
en el caso de la regresin simple) que nos permita predecir
el valor de la variable dependiente en funcin del valor de
la/s variables independientes.

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Regresin Lineal (III)

Por ejemplo se desea saber la cantidad de


ingresos hospitalarios de un departamento de
salud (variable dependiente) en funcin de la
poblacin de cobertura a la que asiste y/o la
edad media de la misma y/o su nivel de
comorbilidad

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Regresin Lineal (IV)


Matemticamente deseamos encontrar una funcin lineal
(y=a+bx) que permita explicar la variable dependiente (y)
en funcin del variable independiente (x).
La funcin lineal ser la correspondiente a la recta en la
que las distancias de cada punto a la misma sean
menores.
El problema por tanto se reduce a calcular los coeficientes
a y b de la recta que haga mnimos las diferencias
entre las observaciones reales y las predichas por la
funcin.

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Regresin lineal
La existencia de una relacin lineal entre las variables implica la existencia de una recta
que se ajusta a la nube de puntos, siendo mayor el ajuste cuanto ms fuerte es la
relacin lineal (cuanto ms cercano a 1 a 1 est r).
El ajuste se entiende como la proximidad del valor de la y de los puntos al valor de la y
que resulta de aplicar la ecuacin de la recta sustituyendo la x de los puntos.
Errorpara
paraelel
Error
puntoi-simo.
i-simo.
punto
El error puede ser positivo o
negativo, por lo que consideraremos
el error elevado al cuadrado (error
cuadrtico).

ei = yi y i

(xi, yi)

yi
y i

y = a + bx

y i = a + bxi

Cada punto de la nube tendr un error cuadrtico,


elegiremos, de entre todas las posibles rectas,
aquella para la que el promedio de los errores
cuadrticos sea menor (mnimo error cuadrtico
medio).

xi

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Regresin lineal. El error cuadrtico medio


n

ECM =
40

e
i =1

2
i

(
)

y
y
i i

i =1

35

35

30

30

25

25

20

20

15

15

10

10

0
0

10

12

ECM=128,31
ECM=128,31

14

16

18

40

20

10

12

ECM=20,44
ECM=20,44

14

16

18

20

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Regresin lineal. Clculo de los coeficientes

b=

La recta y = a + bx que proporciona un menor ECM verifica:

S xy
S x2

a = y bx
Enelelejemplo
ejemplode
delaladiapositiva
diapositiva27:
27:
En

x = 1,44

S x2 = 0,26

y = 2,208

b=

S xy
S

2
x

S y2 = 0,27

S xy = 0,25

0,25
= 0,98
0,26

a = y bx
= 2,208 0,98 1,44 = 0,80
y = 0,80 + 0,98 x

3,5
3,0

y = 0,98x + 0,80

2,5
2,0
1,5
1,0
0,5

1,0

1,5

2,0

2,5

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

El coeficiente de determinacin lineal (R2)


Viendo la ecuacin de la recta de regresin
junto a la nube de puntos podemos apreciar que
el ajuste es bastante bueno, es decir, la recta de
regresin es un buen modelo para explicar la
relacin lineal existente entre la variable x y la
variable y.
Necesitamos un estadstico que mida de forma
cuantitativa la calidad del ajuste.

3,5
3,0

y = 0,98x + 0,80

2,5
2,0
1,5
1,0
0,5

1,0

1,5

2,0

2,5

Definimos elel coeficiente


coeficiente de
de determinacin
determinacin lineal
lineal RR22 como
como elel cuadrado
cuadrado del
del
Definimos
coeficientede
decorrelacin
correlacinyylolointerpretaremos
interpretaremoscomo
comolalaproporcin
proporcinde
delalavariabilidad
variabilidad
coeficiente
delalavariable
variableyyexplicada
explicadapor
porelelmodelo
modelode
deregresin
regresinyy==aa++bx.
bx.
de
Enelelejemplo
ejemploanterior,
anterior,alalser
serrr==0,95:
0,95:RR22==0,91.
0,91.
En
Elmodelo
modeloexplica
explicaelel91%
91%de
delalavariabilidad
variabilidadde
deyyaapartir
partirde
delalavariabilidad
variabilidadde
dexx
El

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Ejemplo
En la siguiente tabla se muestra el peso al nacer (X) y el incremento de peso entre
los das 70 y 100 de vida, expresado como porcentaje del peso al nacer (Y) para
12 nios.

1
2
3
4
5
6
7
8
9
10
11
12

X
112
111
107
119
92
80
81
84
118
106
103
94

Y
63
66
72
52
75
118
120
114
42
72
90
91

140
120
100
80
60
40
20
75

85

95

105

115

125

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Ejemplo (continuacin)
1
2
3
4
5
6
7
8
9
10
11
12

r=

2
2
X
Y
X
Y
XY
12.544
3.969
7.056
112
63
12.321
4.356
7.326
111
66
11.449
5.184
7.704
107
72
14.161
2.704
6.188
119
52
8.464
5.625
6.900
92
75
6.400 13.924
9.440
80 118
6.561 14.400
9.720
81 120
7.056 12.996
9.576
84 114
13.924
1.764
4.956
118
42
11.236
5.184
7.632
106
72
10.609
8.100
9.270
103
90
8.836
8.281
8.554
94
91
1.207 975 123.561 86.487 94.322
100,58 81,25 10.296,75 7.207,25 7.860,17
X
Y
XY
X2
Y2

S XY
= 0,9463
S X SY

R 2 = r 2 = 0,8955

( ) = 10.296,75 (100,58) = 179,7431


(Y ) = 7.207,25 (81,25) = 605,6875

S X2 = X 2 X
SY2 = Y 2

S X = 13,4068

SY = 24,6107

2
S XY
= XY X Y = 7.860,17 100,58 81,25 = 312,2292

m=
Y = mX + b

S XY
= 1,7371
2
SX

b = Y m X = 255,9719

El modelo explica el 89,55% de la variabilidad del


incremento de peso entre los das 70 y 100 a partir del
peso del recin nacido, para las 12 observaciones.

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Ejemplo (continuacin)
140
y = -1,7371x + 255,97

120

R = 0,8955

100
80
60
40
20

75

85

95

105

115

125

BIOESTADISTICA

Tema 4: Estadstica Descriptiva Bidimensional

Ejercicio 1
Se dispone del valor de dos variables para 30 observaciones, segn la siguiente tabla:
X
1,9
1,5
1,5

1,8
1,4
40,2
1,6080

SUMA
MEDIA

Y
2,5
2,0
2,2

2,3
2,1
53,7
2,1480

XY
4,75
3,00
3,30

4,14
2,94
88,38
3,5352

X
3,61
2,25
2,25

3,24
1,96
67,14
2,6856

Y
6,25
4,00
4,84

5,29
4,41
117,39
4,6956

Modelode
deregresin
regresinlineal
linealy=f(x).
y=f(x).
a.a. Modelo
Valor estimado
estimado para
para yy para
para una
una
b.b. Valor
observacincon
conx=1,5?.
x=1,5?.
observacin
Calculayycomenta
comentalalaRR22. .
c.c. Calcula

S x2 = 2,6856 1,6082 = 0,0999


S y2 = 4,6956 2,1482 = 0,0817
S y = 0,2858
S x = 0,3161
S xy = 3,5352 1,608 2,148 = 0,0812

b=

S xy
2
x

= 0,8127

S
a = y bx = 0,8412

Modelode
deRegresin
Regresin
Modelo

y = 0,8412 + 0,8127 x

r=

S xy
SxS y

= 0,8988

R 2 = 0,8079

Elmodelo
modeloexplica
explicaelel80,79%
80,79%de
delalavariabilidad
variabilidadde
delalavariable
variableyyaapartir
partirde
de
El
variabilidaden
enlalavariable
variablex.x.
lalavariabilidad

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Ejercicio 2
Para un grupo de 10 pacientes se ha medido la concentracin en la sangre de dos elementos.
El elemento A (variable x), en ppl (partculas por litro) y el elemento B (variable y), en ppl,
obteniendo la siguiente tabla:
X 15 16 19 15 15 21 19 18 10 18
Y 53 68 66 61 59 82 76 77 42 66
a.-Modelo de regresin lineal.
b.-Concentracin del elemento B esperada para 17 ppl de elemento A. R2.
c.- Representa grficamente la nube de puntos y la recta de regresin obtenida.
Y
53
68
66
61
59
82
76
77
42
66
650
65

XY
795
1.088
1.254
915
885
1.722
1.444
1.386
420
1.188
11.097
1.109,7

X
225
256
361
225
225
441
361
324
100
324
2.842
284,2

Y
2.809
4.624
4.356
3.721
3.481
6.724
5.776
5.929
1.764
4.356
43.540
4.354

90

y = 6,0162 + 3,5532 x
y (17 ) = 66,4213

85
Concentracin de B p( pl )

X
15
16
19
15
15
21
19
18
10
18
166
16,6

80

y = 3,5532x + 6,0162
2

R = 0,8456

75
70
65
60
55
50
45
40
9 10 11 12 13 14 15 16 17 18 19 20 21 22
Concentracin de A (ppl )

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Ejercicio 3

Hay veces que en la ciudad de Londres se


experimentan periodos de nubes de polucin densas.
En el archivo de datos de SPSS se muestran los datos
de un perodo severo de 15 das en los que se incluye
las muertes diarias, la media de humo atmosfrico
(mg/m3), y la media de contenido de dixido de azufre
en la atmsfera (ppm).

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Ejercicio 3: Resultados de SPSS (I)


y= a + bx
r

Correlaciones

N de muertes diarias

Humo atmosfrico
(mg/m3)

Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N

N de
muertes
diarias
1

Humo
atmosfrico
(mg/m3)
,756**
,001
15
15
,756**
1
,001
15
15

**. La correlacin es significativa al nivel 0,01 (bilateral).

r2

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Ejercicio 3: Resultados de SPSS (II)


Resumen del modelo
Modelo
1

R
R cuadrado
,756a
,572

R cuadrado
corregida
,539

Error tp. de la
estimacin
88,710

a. Variables predictoras: (Constante), Humo atmosfrico


(mg/m3)

Coeficientesa

Modelo
1

(Constante)
Humo atmosfrico
(mg/m3)

Coeficientes no
estandarizados
B
Error tp.
171,819
31,434
63,761

15,312

Coeficientes
estandarizad
os
Beta
,756

t
5,466

Sig.
,000

4,164

,001

a. Variable dependiente: N de muertes diarias

y= 171,819 + 63,761x

Tema 4: Estadstica Descriptiva Bidimensional

BIOESTADISTICA

Universidad Catlica de Valencia San Vicente Mrtir


Facultad de Medicina
ESTADSTICA APLICADA
Odontologa (OD1)
Departamento de
Epidemiologa, Medicina
Preventiva, Anlisis crtico y
Metodologa de la
investigacin

También podría gustarte

  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Contabilidad Hogar
    Contabilidad Hogar
    Documento1 página
    Contabilidad Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • Hogar
    Hogar
    Documento1 página
    Hogar
    Anonymous PlWPxGir
    Aún no hay calificaciones
  • 2020 - Primer Parcial Trabajo Social - Sociología
    2020 - Primer Parcial Trabajo Social - Sociología
    Documento2 páginas
    2020 - Primer Parcial Trabajo Social - Sociología
    Sofía De Los Ángeles Giménez
    Aún no hay calificaciones
  • SNOEZELEN
    SNOEZELEN
    Documento4 páginas
    SNOEZELEN
    Bianca Ely Lobos Vargas
    Aún no hay calificaciones
  • Ética Mapa Conceptual
    Ética Mapa Conceptual
    Documento1 página
    Ética Mapa Conceptual
    Chanita Sofia
    Aún no hay calificaciones
  • Examen Final Metodologia 2018
    Examen Final Metodologia 2018
    Documento3 páginas
    Examen Final Metodologia 2018
    Olga Katerin Ortega
    Aún no hay calificaciones
  • Pedagogia y Andragogia
    Pedagogia y Andragogia
    Documento3 páginas
    Pedagogia y Andragogia
    Alex Fernando Vasquez Vasquez
    Aún no hay calificaciones
  • Mi Proyecto de Aprendizaje (D.Y.R)
    Mi Proyecto de Aprendizaje (D.Y.R)
    Documento46 páginas
    Mi Proyecto de Aprendizaje (D.Y.R)
    Diorquis Yecelis Romero Chirino
    70% (10)
  • Diccionario Basico de Categorias Marxistas
    Diccionario Basico de Categorias Marxistas
    Documento11 páginas
    Diccionario Basico de Categorias Marxistas
    Luis678
    Aún no hay calificaciones
  • Polinomios
    Polinomios
    Documento71 páginas
    Polinomios
    Lucas Zarza
    Aún no hay calificaciones
  • Casos
    Casos
    Documento4 páginas
    Casos
    Luis Escobar Huamani
    Aún no hay calificaciones
  • Parcial Teoria de La Comunicación
    Parcial Teoria de La Comunicación
    Documento11 páginas
    Parcial Teoria de La Comunicación
    CLAVE
    100% (1)
  • Ensayo. Luis Escalante V-24.612.419
    Ensayo. Luis Escalante V-24.612.419
    Documento6 páginas
    Ensayo. Luis Escalante V-24.612.419
    Luis Escalante
    Aún no hay calificaciones
  • Material Eval 5 Ing Civil
    Material Eval 5 Ing Civil
    Documento10 páginas
    Material Eval 5 Ing Civil
    PabloBernal
    Aún no hay calificaciones
  • Monografia Redes Sociales
    Monografia Redes Sociales
    Documento27 páginas
    Monografia Redes Sociales
    ManuelFernandoMontoya
    Aún no hay calificaciones
  • Ensayo Kari
    Ensayo Kari
    Documento5 páginas
    Ensayo Kari
    Antonietta Vielma
    Aún no hay calificaciones
  • Félix Espinoza
    Félix Espinoza
    Documento2 páginas
    Félix Espinoza
    Yesica Lima Vilca
    Aún no hay calificaciones
  • Gottlob Frege
    Gottlob Frege
    Documento6 páginas
    Gottlob Frege
    LUIS FERNANDO RODRIGUEZ LANCHEROS
    Aún no hay calificaciones
  • Analisis Sobre Arquitectura Latinoamericana
    Analisis Sobre Arquitectura Latinoamericana
    Documento6 páginas
    Analisis Sobre Arquitectura Latinoamericana
    Marquez FG
    Aún no hay calificaciones
  • Carta A Intermediarios
    Carta A Intermediarios
    Documento6 páginas
    Carta A Intermediarios
    Norma Gutierrez
    Aún no hay calificaciones
  • El Si de Las Ninas Moratin
    El Si de Las Ninas Moratin
    Documento178 páginas
    El Si de Las Ninas Moratin
    CarlosMassCanto
    Aún no hay calificaciones
  • Ele Libro 2do. Ene - Myo
    Ele Libro 2do. Ene - Myo
    Documento10 páginas
    Ele Libro 2do. Ene - Myo
    Andy
    Aún no hay calificaciones
  • Pasos para La Planificación Anual
    Pasos para La Planificación Anual
    Documento3 páginas
    Pasos para La Planificación Anual
    fabiobar097188
    Aún no hay calificaciones
  • Plan de Supervisión-2013
    Plan de Supervisión-2013
    Documento12 páginas
    Plan de Supervisión-2013
    hugojaime1001
    Aún no hay calificaciones
  • Conceptos Básicos de Fundamentos de Investigación Como Proceso de Construcción Social (F. Investigacion)
    Conceptos Básicos de Fundamentos de Investigación Como Proceso de Construcción Social (F. Investigacion)
    Documento8 páginas
    Conceptos Básicos de Fundamentos de Investigación Como Proceso de Construcción Social (F. Investigacion)
    Hanck Garcia
    100% (1)
  • PLANIFICACION de Ciencias Sociales Del Tercer Ciclo de La EGBA
    PLANIFICACION de Ciencias Sociales Del Tercer Ciclo de La EGBA
    Documento11 páginas
    PLANIFICACION de Ciencias Sociales Del Tercer Ciclo de La EGBA
    clandreamastino
    82% (11)
  • Preguntas Clave para La Enseñanza Filosófica
    Preguntas Clave para La Enseñanza Filosófica
    Documento11 páginas
    Preguntas Clave para La Enseñanza Filosófica
    Alejandro Godoy
    Aún no hay calificaciones
  • Tema 44 La Construcción de La Inteligencia.
    Tema 44 La Construcción de La Inteligencia.
    Documento22 páginas
    Tema 44 La Construcción de La Inteligencia.
    Jorge Julio Gorostiaga
    Aún no hay calificaciones
  • Algebra Temprana: Ejemplos de Patrones
    Algebra Temprana: Ejemplos de Patrones
    Documento1 página
    Algebra Temprana: Ejemplos de Patrones
    milenka soledad guzman campill
    Aún no hay calificaciones
  • Figuras Retóricas
    Figuras Retóricas
    Documento3 páginas
    Figuras Retóricas
    Gavier Gimenez
    Aún no hay calificaciones
  • Etapas Del Aprendisaje
    Etapas Del Aprendisaje
    Documento3 páginas
    Etapas Del Aprendisaje
    migda01
    Aún no hay calificaciones
  • Solución Caso Nokia
    Solución Caso Nokia
    Documento7 páginas
    Solución Caso Nokia
    Andrea Tinjacá Pérez
    Aún no hay calificaciones