Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Introducción
Descripción conjunta de 2. Distribuciones de frecuencias
Distribución conjunta
dos variables
Distribuciones marginales
Distribuciones condicionadas
Independencia entre variables
Tema 2 3. Representaciones gráficas
Diagrama de dispersión
Otras representaciones
4. Medidas de dependencia lineal
Covarianza
Correlación
Ignacio Cascos Depto. Estadística, Universidad Carlos III 1 Ignacio Cascos Depto. Estadística, Universidad Carlos III 2
Ignacio Cascos Depto. Estadística, Universidad Carlos III 5 Ignacio Cascos Depto. Estadística, Universidad Carlos III 6
Distribuciones marginales
PAU 2005 Distribuciones condicionadas
RES. Aprobados Suspensos Total UNI. Nos interesan sólo los individuos que toman el valor xi en la variable X.
UNI. \
ni fi
· ·
ual 3397 0’11 La variable Y definida en ese conjunto se denomina variable
Alcalá de Henares 2780 617 3397
uam 8867 0’287 condicionada y se representa Y|X=xi
Autónoma de 7203 1664 8867 uc3m 3370 0’109 Frecuencias relativas condicionadas
Madrid
ucm 12294 0’398 la frecuencia relativa de yj condicionada a X=xi representa la
Carlos III 2734 636 3370
urjc 2985 0’096 proporción de individuos que presentan Y=yj de entre los que
Complutense de 9686 2608 12294 tienen X=xi ; f(yj|xi)= nij/ni·= f( xi , yj)/f(xi)
RES. n f
Madrid ·j ·j la frecuencia relativa de xi condicionada a Y=yj representa la
Rey Juan Carlos 2189 796 2985 Aprobado 24592 0’796 proporción de individuos que presentan X=xi de entre los que
Suspensos 6321 0’204 tienen Y=yj ; f(xi|yj)= nij/n·j= f( xi , yj)/f(yj)
Total 24592 6321 30913
Ignacio Cascos Depto. Estadística, Universidad Carlos III 11 Ignacio Cascos Depto. Estadística, Universidad Carlos III 12
Distribuciones condicionadas Distribuciones condicionadas
RESULTADO RESULTADO RESULTADO En la tabla superior se estudia la
n1j f(yj|x1) n2j f(yj|x2) n3j f(yj|x3)
| UNIV=ual | UNIV=uam | UNIV=uc3m variable Resultado condicionada a
Aprobados 2780 0’818 Aprobados 7203 0’812 Aprobados 2734 0’811 que la variable Universidad tome
Ignacio Cascos Depto. Estadística, Universidad Carlos III 13 Ignacio Cascos Depto. Estadística, Universidad Carlos III 14
X e Y independientes si f(xi , yj)=f(yj|xi)f(xi)=f(xi)f(yj) para todo i,j 1 96 64 160 1 12/35 8/35 4/7
n·j 168 112 280 f·j 3/5 2/5 1
Ignacio Cascos Depto. Estadística, Universidad Carlos III 15 Ignacio Cascos Depto. Estadística, Universidad Carlos III 16
Descripción breve del tema Diagrama de dispersión
Plot of 100m vs long jump
1. Introducción En una nube de puntos o 11,6
11,4
2. Distribuciones de frecuencias diagrama de dispersión, cada 11,2
100m
Distribución conjunta dato (xi,yj) de la muestra, se 11
Distribuciones condicionadas
representa por un único punto 10,6
10,4
Independencia entre variables de abscisa xi y ordenada yj 6,6 6,9 7,2 7,5 7,8 8,1
long jump
3. Representaciones gráficas Plot of long jump vs shot put Plot of shot put vs 100m
Diagrama de dispersión 8,1 17
long jump
shot put
4. Medidas de dependencia lineal 7,5
15
7,2
Covarianza 14
6,9
Correlación 6,6 13
13 14 15 16 17 10,4 10,6 10,8 11 11,2 11,4 11,6
shot put 100m
Ignacio Cascos Depto. Estadística, Universidad Carlos III 17 Ignacio Cascos Depto. Estadística, Universidad Carlos III 18
67
o cuantitativas discretas uc3m
urjc
47
3.5
la presencia de
4.0
suspensos
uam
3.0
sepal width
3.5
mezcla de uc3m
2.5
3.0
ucm
poblaciones
2.0
2.5
urjc
4.5 5.0 5.5 6.0 6.5 7.0
0 10 20 30 40
2.0
sepal length
percentage
Ignacio Cascos Depto. Estadística, Universidad Carlos III 4.5 5.0 5.5 6.0 6.5 7.0 19 Ignacio Cascos Depto. Estadística, Universidad Carlos III 20
sepal length
Descripción breve del tema Medidas de dependencia lineal
1. Introducción Covarianza: mide la asociación lineal entre dos
2. Distribuciones de frecuencias variables
Distribución conjunta
f ij ( xi − x )( y j − y )
k r k r
s XY = ∑ ∑ s XY = ∑ ∑f
Distribuciones marginales
Distribuciones condicionadas ; ij ix yj − x ⋅ y
i =1 j =1 i =1 j =1
Independencia entre variables
3. Representaciones gráficas Si X e Y son independientes, entonces sXY = 0, pero
Diagrama de dispersión
Otras representaciones el recíproco no es cierto.
4. Medidas de dependencia lineal
Covarianza La covarianza viene dada en la unidad producto de las
Correlación
de X e Y y su signo resulta muy interesante.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 21 Ignacio Cascos Depto. Estadística, Universidad Carlos III 22
100m
0,8
0,8 de los 29 atletas que puntuaron en 11
10,8
-0,2
-0,2 las tres pruebas en la decatlón de las x:7,26816
sXY=-0’054
y:10,9224
10,6
-1,2
-1,2
Olimpiadas de Atenas 2004. 10,4
-2,2 6,6 6,9 7,2 7,5 7,8 8,1
-2,2
-1,4 -0,4 0,6 1,6 2,6
-2 -1 0 1 2 long jump
Plot of long jump vs shot put Plot of shot put vs 100m
8,1 17
2,8 5,6
7,8
16
long jump
1,8 4,6
shot put
3,6 7,5
0,8
15
2,6 7,2
-0,2
1,6 x:14,5702
14
sXY=-0’09
x:10,9286
-1,2 6,9 sXY=0’059
y:7,26124 y:14,574
0,6
-2,2 -0,4 6,6 13
-2,5 -1,5 -0,5 0,5 1,5 2,5 -2,2 -1,2 -0,2 0,8 1,8 2,8 13 14 15 16 17 10,4 10,6 10,8 11 11,2 11,4 11,6
shot put 100m
Ignacio Cascos Depto. Estadística, Universidad Carlos III 23 Ignacio Cascos Depto. Estadística, Universidad Carlos III 24
Correlación Correlación Plot of 100m vs long jump
11,6
Correlación: mide la asociación lineal entre dos Resultados en los 100m lisos, salto de 11,4
longitud y lanzamiento de peso de los 11,2
variables y es adimensional.
100m
29 atletas que puntuaron en las tres 11
10,8
pruebas en la decatlón de las x:7,26816
rXY=-0’686
Tiene el mismo signo que la covarianza. Olimpiadas de Atenas 2004.
10,6 y:10,9224
10,4
s
rXY = XY
6,6 6,9 7,2 7,5 7,8 8,1
long jump
Plot of long jump vs shot put Plot of shot put vs 100m
s X sY 8,1 17
− 1 ≤ rXY ≤ 1
7,8
16
long jump
shot put
7,5
15
7,2
Si rXY = 0 X e Y se dicen incorreladas. 6,9
x:14,5702
rXY=0’196
y:7,26124 14
rx:10,9286
XY=-0’429
y:14,574
Si rXY = 1 ó rXY = -1, la relación lineal entre X e Y es 6,6 13
13 14 15 16 17
perfecta. shot put
10,4 10,6 10,8
100m
11 11,2 11,4 11,6
Ignacio Cascos Depto. Estadística, Universidad Carlos III 25 Ignacio Cascos Depto. Estadística, Universidad Carlos III 26