Documentos de Académico
Documentos de Profesional
Documentos de Cultura
BIOLÓGICAS
Aplicaciones en Recursos Genéticos
y Fitomejoramiento
Distancias Biológicas
PROPOSITO: Estudiar métodos numéricos que señalen
diferenciación ó similitud entre taxas, razas,etnias,especies.
Cuando se registran numerosas (multivariadas) asociadas ó no
continua ó cualitataivas.
Cercanía: similitud,parecido,afinidad.
d2
b2
(XB1 ,XB2)
a2
Pitágoras: X1
2. d2AB=1/p p
Euclidiana Promedio
∑ j=1 X Aj− X Bj 2
3.D2AB= p
Euclidiana estandarizada
∑ j=1 Z Aj−Z Bj2
CLASES DE DISTANCIAS:
CONTINUAS
p
4.d2AB =
∑ j=1
∣X Aj−X Bj∣
Manhattan-city block
p
∑ X Aj−X Bj2
j=1
p p
5.d2AB= 1 - ∑
j=1
X 2Aj ∑ X2Bj Cuerda
j=1
p
∑ j=1 ∣X Aj−X Bj∣
6. d2AB= ∣X Aj∣∣X Bj∣ Camberra Bray-Curtis
DISTANCIA- EUCLIDEANA
Considere 4 razas de maíz: A B C D
Cinco características:
X1=alt(m) X2=Long mzc(cm) X3=N.hojas
X4=D. tallo(cm) X5=N.Hil
X1 X2 X3 X4 X5
A 2.8 15 15 2.7 13
B 2.5 16 16 2.6 14
C 3.0 21 13 2.4 18
D 3.0 20 12 2.3 19
X
2.83 18 13.5 2.5 16
0
3.10 0
D2= 65.13 42.29 0
70.20 21.61 3.01 0
DISTANCIA-EUCIDEANA
ESTANDARIZADA
LOS DATOS ANTERIORES SE ESTANDARIZAN:
X−X
Z=
S
(2.8-2.83)/0.24 = -0.125
.
.
(19-13)/2.9 = -1.03
Z1 Z2 Z3 Z4 Z5
A -0.125 -1.03 1.15 1.0 -1.03
B -1.375 -0.69 0.38 0.5 -0.68
C 0.708 1.03 -0.38 -0.5 0.68
D 0.708 0.69 -1.15 -1.0 1.03
X
0.0 0.0 0.0 0.0 0.0
S 1 1 1 1 1
0 0
2.64 0 3.10 0
D2= 10.45 10.72 0 D2= 65.13 42.29 0
17.06 11.51 1.08 0 70.20 21.61 3.01 0
DISTANCIAS GENETICAS
Cuando se observan seres vivos a nivel de genoma, se pueden
registrar sus frecuencias de genes: El locus U puede tener alelos
u1, u2, u3, u4, u5. con frecuencias alelicas P1, P2, P3, P4, P5.
P
1
PREVOSTI d 2= ∑ ∣P Aj −PBj∣
AB 2l j=1
Distancia genética
Edwards – Cavalli Sforza
p
P AjPBj
NEI d
AB2 =−Ln
[j=1
∑
p p
∑ P Aj2 ∑ PBj2
j=1
p
j=1
]
CUERDA d
AB
2= 4 [ l− ∑
j=1
P Aj P Bj ]
3
JUKES −CANTOR d 2= Ln q AB−1
AB 4
qAB=Proporción bases común
l = ≠ Loci
CALCULO DISTANCIA “ROGERS”
D2AB=∑(PiA – PiB)2
LOCUS 1 LOCUS 2
Población P1 P2 P1 P2 P3
0
0.27 0
D2= 0.40 0.08 0
0.58 0.58 0.82 0
MATRIZ DE DISTANCIA NEI EN
B.NAPUS.
1 0.00
[ ]
2 0.14 0.00
3 0.57 0.50 0.00
4 0.07 0.08 0.54 0.00
5 0.37 0.43 0.15 0.47 0.00
6 0.38 0.45 0.63 0.49 0.38 0.00
7 0.06 0.14 0.47 0.12 0.29 0.28 0.00
8 0.33 0.20 0.40 0.27 0.33 0.56 0.39 0.00
DENDOGRAMAS
Representación bidimensional de una matriz de distancias;
facilita el análisis por ser una expresión gráfica.
Métodos:
1.Distancia mínima (single linkage)
2.Distancia máxima (complete linkage)
3.Promedio (UPGMA)
4.Mínima varianza.
5.Centroide.
ALGORITMO DEL DENDOGRAMA
• De la matriz encuentre la distancia mínima entre un par
de taxas i.e. d2uv. Agrupe el par mediante (u,v) y grafique
1 0
1. 2 9 0 ⇒
3∣ 3 7 0 ∣
4 6 5 9 0
5 11 10 2 8 0
d(2,4),(351)=Min[d2,351;d4,351]=Min[7,6]=6
2,4 3,5,1
2,4 0
∣ ∣⇒
3,5,1 6 0
EJEMPLO: Método
Promedio(UPGMA)
1 2 3 4 5
10
29 0
3 ∣3 7 0 ∣⇒
46 5 9 0
5 11 10 2 8 0
d(3,5)1=1/2[d31+d51=1/2[3+11]=7.0
d(3,5)2=1/2[d32+d52=1/2[7+10]=8.5
d(3,5)3=1/2[d34+d54=1/2[9+8]=8.5
3,5 1 2 4
3,5 0
1 7.0 0
∣ ∣⇒
2 8.5 9 0
4 8.5 6 5 0
d(2,4)3,5=1/4[d23+d43 +d25+d45]=1/4[7+9+10+8]=8.5
d(2,4)1=1/2[d21+d41]=1/2[9+6]=7.5
2.4 3.5 1
2.4 0
3.5 ∣8.5 0 ∣⇒
1 7.5 7 0
d(351)24=1/6[d32+d52+d12+d34+d54+d14]=1/4[7+10+9
+9+8+6]=8.2
COEFICIENTES
CONCORDANCIA-SIMILITUD
Ampliamente usados en ecología.
Buscan cuantificar variables que solo toman 2
valores: Ausencia ó Presencia del carácter.
Son conocidos (algunos) desde el principio de
siglo.
Han recobrado vigencia: Marcadores
bioquímicos-serológicos-moleculares
biodiversidad.
Expresan “similitud”, “semejanza”, “afinidad”,
entre pares de “taxas” Razas “colectas”
Se pueden traducir a distancias con relaciones
matemáticas.
Suponga 4 “colectas”, “razas”, clones,
especies. A B C D
1=Presencia 1 1 0 0
0=Ausencia 0 0 1 1
1 0 1 0
Media similitud entre A,B; A,C; 0 0 0 1
A,D; etc. sería la proporción de 1 0 0 1
“concordancia”:≠ceros y ≠unos 0 1 0 0
Es afinidad: Señala parecido,
comparten el mismo resultado;
[(0,0) y (1,1)]
El carácter (banda) esta
“presente” ó “ausentes”
simultáneamente
SAB= 3/6: (1,1) , (0,0) , (0,0)
SAC= 3/6: (1,1) , (0,0) , (0,0)
SAD= 2/6: (1,1) , (0,0)
SBC= 2/6: (0,0) , (0,0)
SBD= 1/6: (0,0)
SCD= 3/6: (0,0) , (1,1) , (0,0)
[ ]
A 1
B
C
D
[ 3 /6 1
3 /6 2/6 1
2 /6 1/6 3 /6 1
Concordancia simple
] B
C
D
1/4 1
1/4 0 1
1/5 0 1/4 1
Coeficiente Jaccard
Distancia Euclidiana: DAB=2; DAC=3; DAD=4
DBC=4; DBD=4; DCD=3
A 0
B
C
D
[ ]
2 0
3 4 0
4 4 3 0
: Distancia Euclidiana
5. Q Euclid B+c
RELACIÓN ENTRE DISTANCIAS
Y SIMILITUDES
En general mediante ecuaciones
algebraicas se pueden construir distancias
a partir de similitudes.
La literatura plantea varias similitudes así:
• Dij2= 1-Sij
• D 2= 2(1-S ) Cover(1966):D ij =2(1-Sij)
2
ij ij