Taxonomía Numérica

Taxonomía Numérica
Es la evaluación numérica de la afinidad o similitud

entre unidades taxonómicas operacionales (OTU) y
el agrupamiento de estas en taxones, basándose en
el estado de sus caracteres (Sokal y Sneath, 1963)
Unidad Taxonómica Operacional (OTU):
Son los elementos u objetos a clasificar
Caracter:
Es una propiedad que podría ser o no distinta en cada OTU. A
los distintos valores que puede tener un carácter se lo
denomina “estado”.
Ejemplo. Colonias rizobianas autóctonas (Venezuela)
OTUs Caracteres
Estados del
carácter “aspecto”
Los caracteres como datos científicos:
Tipos de datos Carácter Estados
DOBLE PRESENCIA/AUSENCIA Presencia de Espinas presencia
ESTADO
ausencia
DATOS EXCLUYENTES Posición de la Terminal
Inflorescencia
Axilar
MULTIESTADO CUALITATIVOS Sin secuencia lógica Margen de la hoja Aserrado
Lobulado
Entero
Con secuencia lógica Pubescencia de la Glabra (i.e., nada)
hoja
Poco abundante
Abundante
CUANTITATIVOS Continuos Longitud de la hoja
Discontinuos Número de flores en
la inflorescencia
Ejemplo:
Propiedades fenotípicas de cuatro clones bacterianos hipotéticos
Presencia Diámetro GC en ADN (%) Reproductibili Color

de esporas celular (μm) dad
Clon 1 Si 1.0 57 Alta Marrón
Clon 2 Si 0.7 70 Media Blanco
Clon 3 Si 0.5 30 Baja Amarillo
Clon 4 No 0.7 40 Alta Amarillo
Presencia de esporas: DOBLE ESTADO, PRESENCIA/AUSENCIA

Diámetro celular: MULTIESTADO, CUANTITATIVO (Continuo)
GC en ADN: MULTIESTADO, CUANTITATIVO (Continuo)
Reproductibilidad: MULTIESTADO, CUALITATIVO (Con secuencia lógica)
Color: MULTIESTADO, CUALITATIVO (Sin secuencia lógica)
¿Cuáles de estos clones se parecen más entre sí?

¿Cómo cuantificamos ese parecido?
Codificación de caracteres:
No todos los datos, como hemos visto, miden relaciones cuantitativas en sentido estricto,
y por lo tanto algunos deben ser sometidos a una actividad lógica, la codificación, para
ser transformados en datos cuantitativos.
La codificación depende del tipo de dato que se quiere codificar
1) Datos Doble Estado

Presencia/ausencia: Carácter Estado Codificación
Se expresan numéricamente como 1 Presencia de Si (presencia) 1
(presencia) y 0 (ausencia) esporas No (ausencia) 0
Estados excluyentes: Carácter Estado Codificación

Podemos asignarle a cada estado un Opción 1 Opción 2
numero entero distinto (1 y 2) o Posición de Terminal 1 1
bien, (0 y 1). inflorescencia
Axilar 2 0
En ambos casos, la codificación debe interpretarse como una “etiqueta” y no como una
“cantidad”
2) Multiestado Cualitativo sin secuencia lógica
Son probablemente los datos mas difíciles de codificar, ya que por no presentar una
secuencia lógica es imposible representarlos bien con números. En el ejemplo de los
clones, el carácter “color” es un carácter de este tipo.
Si le asigno el número 1, por ejemplo, al estado “Marrón”, no me queda unívocamente

determinada la codificación para los otros dos estados. ¿Por qué asignarle el valor 2 al
blanco y 3 al amarillo? ¿Por qué no al revés?
Más aún, por qué asignarle el 1 al “Marrón” y no el 2 o el 3?
Carácter Estado ¿Qué codificación elijo?

Color Marrón 1 1 2 2 3 3
Blanco 2 3 1 3 1 2
Amarillo 3 2 3 1 2 1
2) Multiestado Cualitativo sin secuencia lógica
El problema planteado en la diapositiva anterior podría resolverse transformando cada
uno de los estados en datos de presencia/ausencia, por ejemplo:
Carácter Estado Codificación

Marrón Presente 1
Ausente 0
Blanco Presente 1
Ausente 0
Amarillo Presente 1
Ausente 0
Pasamos de tener 1 CARÁCTER CON 3 ESTADOS a 3 CARACTERES CON 2 ESTADOS !!

3) Multiestado Cualitativo con secuencia lógica
Los estados del carácter “reproductibilidad” de nuestros clones bacterianos, es un
ejemplo de este tipo:
Carácter Estado ¿Qué codificación elijo?

Reproductibilidad Baja 1 0 1
Media 2 0.5 1.5
Alta 3 1 2
Si bien existe una secuencia ordenada, y por ende, la asignación “natural” queda
establecida (de menor a mayor al ir del estado “baja” a “alta”), persiste el problema de
asignar un valor concreto a cada estado ¿porqué elegir 1,2 y 3 y no 1, 1.5 y 2?
Es importante recordar que los valores asignados son “etiquetas” que, en este caso,
indican un orden. No pueden, por lo tanto, someterse a operaciones matemáticas
entre sí. Por eso, no es posible afirmar que el estado “Alta” (3) signifique que la
reproductibilidad es tres veces mayor que el estado “Baja” .
3) Multiestado Cualitativo con secuencia lógica
Otra forma de codificar este tipo de caracteres es el “código aditivo” (Sneath y Sokal,
1973), nombre no muy feliz, ya que como hemos dicho antes, los números son
“etiquetas” que no pueden sumarse entre sí.
En esta codificación cada estado se transforma en un carácter de presencia/ausencia,

pero con la siguiente diferencia:
Carácter Estado Baja Media Alta

Reproducti Baja 1 0 0
bilidad Media 1 1 0
Alta 1 1 1
En esta codificación se interpreta que la presencia del carácter “Alta” conlleva a la

presencia del estado “media” y “baja”. Asimismo, la presencia del carácter “Media”
indica la presencia de “baja”, pero no de “Alta”
Las “etiquetas” de cada estado son en este caso “arreglos” de 3 dígitos:
[1 0 0], [1 1 0], [1 1 1]
4) Multiestados Cuantitativos (tanto continuos o discontinuos)
Los caracteres “GC en ADN” y “Diámetro celular” de nuestro ejemplo de los clones
bacterianos, son datos de este tipo. Ambos son del tipo continuo.
Diámetro GC en ADN
celular (μm) (%)
Clon 1 1.0 57
Clon 2 0.7 70
Clon 3 0.5 30
Clon 4 0.7 40
Los datos cuantitativos pueden ser transformados en datos doble estado.
Consideremos primero el carácter “Diámetro celular”. La variabilidad del diámetro

celular es entre 0.5 y 1.0 micrones, es decir, el “universo” de diámetros que podrían
tener las OTUS
4) Multiestados Cuantitativos (tanto continuos o discontinuos)
Consideremos ahora el carácter “Diámetro Celular”. Diámetro
La variabilidad del diámetro celular es entre 0.5 y celular (μm)
1.0 micrón Clon 1 1.0
Podríamos pasar de un carácter multiestado a Clon 2 0.7
varios caracteres de presencia/ausencia
Clon 3 0.5
subdividiendo el rango de valores posibles del
diámetro. Clon 4 0.7
Por ejemplo, podemos considerar

Carácter Estados Cod
dos subintervalos:
Diámetro entre 0.5 y 0.75 Presencia 1
1) Diámetros de 0.5 a 0.75
Ausencia 0
2) Diámetros de 0.75 a 1.0
Carácter Estados
Cada subintervalo es ahora un Diámetro entre 0.75 y 1.0 Presencia 1
carácter de presencia/ausencia Ausencia 0
4) Multiestados Cuantitativos GC en ADN
(%)
Consideremos primero el carácter “GC en ADN”. La
Clon 1 57
variabilidad de estos estados es entre 30 % y 70 %
Clon 2 70
Por ejemplo, podemos considerar Clon 3 30
los siguientes subintervalos: Clon 4 40
1) GC en ADN entre 30% y 45%
Carácter Estados Cod
GC en ADN e/ 30% y 45% Presencia 1
Ausencia 0
Cada subintervalo es ahora un Carácter Estados
carácter de presencia/ausencia GC en ADN e/ 45% y 60% Presencia 1
Ausencia 0
Hemos pasado de tener 1 (un)
Carácter Estados
carácter multiestado a 3 (tres)
caracteres de presencia/ausencia. GC en ADN e/ 60% y 70% Presencia 1
Ausencia 0
Volviendo a nuestro ejemplo:
Propiedades fenotípicas de cuatro clones bacterianos hipotéticos
Presencia de Diámetro GC en ADN (%) Reproductibilid Color
esporas celular (μm) ad
Clon 1 Si 1.0 57 Alta Marrón
Clon 2 Si 0.7 70 Media Blanco
Clon 3 Si 0.5 30 Baja Amarillo
Clon 4 No 0.7 40 Alta Amarillo
La codificación nos quedaría de la siguiente manera:

Presencia Diámetro GC en ADN (%) Reproducti Color
esporas 0.5-0.75 0.75-1.0 30-45 45-60 60-70 bilidad Marrón Blanco Amarillo
1 1 0 1 0 1 0 [ 1 1 1] 1 0 0
2 1 1 0 0 0 1 [ 1 1 0] 0 1 0
3 1 1 0 1 0 0 [ 1 0 0] 0 0 1
4 0 1 0 1 0 0 [ 1 1 1] 0 0 1
A este arreglo se lo llama Matriz Básica de Datos (MBD).
Medida de la Similitud
Coeficientes de asociación
Los coeficientes de asociación miden de manera cuantitativa las coincidencias y
diferencias en los estados de caracteres entre 2 (dos) OTUs.
Estos coeficientes están definidos para comparar caracteres doble estado (1 o 0).
Para caracteres multiestados sin secuencia lógica también pueden aplicarse, puesto
que, como hemos visto éstos son reducibles a caracteres doble estado
Se han propuesto una cantidad innumerable de coeficientes de asociación. Aquí

sólo veremos dos:
• El Coeficiente de Asociación Simple, SMC (Simple Matching Coefficient)
• El Coeficiente de Asociación de Jaccard (JAC) (Jaccard’s Association Coefficient)
Antes de definir estos coeficientes, vamos a establecer cierta simbología

Medida de la Similitud
Supongamos que comparamos sólo 2 (dos) OTUS para un carácter que presenta doble
estado. Se tienen en este caso 4 posibilidades:
1) Que ambas OTUs tengan 1

2) Que ambas OTUS tengan 0
3) Que la primera tenga 1 y la segunda tenga 0
4) Que la primera tenga 0 y la segunda tenga 1
OTU 2
Podrían representarse estas cuatro 1 0
posibilidades en una matriz de 2x2 de
la siguiente manera: 1
OTU1
Matriz de asociación de
0
la OTU 1 con la OTU 2
Medida de la Similitud:
Volviendo a la MBD de nuestro problema de los clones *. Supongamos que queremos
comparar la similitud entre el clon 1 y el clon 2
Presencia Diámetro GC en ADN (%) Color

esporas 0.5-0.75 0.75-1.0 30-45 45-60 60-70 Marrón Blanco Amarillo
Clon1 1 0 1 0 1 0 1 0 0
Clon2 1 1 0 0 0 1 0 1 0
Clon3 1 1 0 1 0 0 0 0 1
Clon4 0 1 0 1 0 0 0 0 1
CLON 2 1) Hay 1 carácter con CLON1 = 1 y CLON2 = 1

1 0 2) Hay 2 caracteres con CLON1 = 0 y CLON2 = 0
3) Hay 3 caracteres con CLON1 = 0 y CLON2 = 1
1 3
1 4) Hay 3 caracteres con CLON1 = 1 y CLON2 = 0
(a) (d)
CLON 1
3 2
0 * Se ha eliminado el carácter “reproductibilidad” (que es multiestado
(c) (c) con sequencia lógica) a fin de simplificar el desarrollo
Volviendo a la MBD de nuestro problema de los clones *. Supongamos que queremos
comparar la similitud entre el clon 1 y el clon 4
Presencia Diámetro GC en ADN (%) Color

esporas 0.5-0.75 0.75-1.0 30-45 45-60 60-70 Marrón Blanco Amarillo
Clon1 1 0 1 0 1 0 1 0 0
Clon2 1 1 0 0 0 1 0 1 0
Clon3 1 1 0 1 0 0 0 0 1
Clon4 0 1 0 1 0 0 0 0 1
CLON 4 1) Hay 0 caracteres con CLON1 = 1 y CLON4 = 1

1 0 2) Hay 2 caracteres con CLON1 = 0 y CLON4 = 0
3) Hay 3 caracteres con CLON1 = 0 y CLON4 = 1
0 3
1 4) Hay 4 caracteres con CLON1 = 1 y CLON4 = 0
(a) (d)
CLON 1
4 2
0
(c) (b)
Coeficiente de Asociación Simple (SMC):
El coeficiente de asociación simple para cada par de OTUS (i y j) CLON 4
se define como:
1 0
𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟𝑒𝑠 𝑞𝑢𝑒 𝑐𝑜𝑖𝑛𝑐𝑖𝑑𝑒𝑛 0 3
𝑆𝑀𝐶𝑖,𝑗 = 1
𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟𝑒𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 𝑐𝑜𝑚𝑝𝑎𝑟𝑎𝑑𝑜𝑠 (a) (d)
CLON 1
Este coeficiente se interpreta como la “probabilidad de que dos 4 2
OTUS coincidan en al menos un carácter” y matemáticamente 0
(c) (b)
se calcula como:
𝑆𝑀𝐶𝑖,𝑗
𝑎+𝑏 CLON 2
= 1 0
𝑎+𝑏+𝑐+𝑑
Para los ejemplos mostrados en las matrices de la derecha, 1 3
tenemos: 1
(a) (d)
CLON 1
0+2
𝑆𝑀𝐶1,4 = 0+3+4+2=0,22
3 2
1+2
0
𝑆𝑀𝐶1,2 = 1+2+3+3=0,33 (c) (b)
Por simplicidad, utilizaremos de aquí en mas el
Dado que queremos calcular la similitud de cada clon con todos los otros, deberíamos armar las
matrices de asociación (tarea) y calcular los Coeficientes SMC para todas las OTUS:
1+2
𝑆𝑀𝐶1,2 = 1+3+3+2=0,33 → El clon 1 y 2 tienen una similitud de 33 %
1+2
0+2 → El clon 1 y 4 tienen una similitud de 22 %

𝑆𝑀𝐶1,4 = 0+4+3+2=0,22
2+3
1+3
3+5 → El clon 3 y 4 tienen una similitud de 89 %

𝑆𝑀𝐶3,4 = =0,89
3+5+0+1
Observaciones:
1) Los coeficientes de asociación simple SMC son simétricos. Esto quiere decir que:
𝑆𝑀𝐶𝑖,𝑗 = 𝑆𝑀𝐶𝑗,𝑖
2) El coeficiente de asociación de una OTU con si misma es 1.
𝑆𝑀𝐶𝑗,𝑗 = 𝑆𝑀𝐶𝑗,𝑗
Matriz de Similitud:
Una vez calculados todos los SMC, los resultados pueden acomodarse en una matriz llamada
“Matriz de Similitud”.
OTU
1 2 3 … N-1 N
1 SMC 1,1
2 SMC 1,2 SMC 2,2
O 3 SMC 1,3 SMC 2,3 SMC 3,3

T
U … …
N-1 SMC 1,N-1 SMC 2, N-1 SMC 3, N-1 SMC N-1,N-1
SMC 3, N
N SMC 1,N SMC 2, N SMC N-1,N SMC N,N
Matriz de Similitud:
Volviendo a nuestro ejemplo de los clones, la matriz de similitud es la siguiente:
1+2
𝑆𝑀𝐶1,2 = 1+3+3+2=0,33 Clon
1 2 3 4
1+2
𝑆𝑀𝐶1,3 = =0,33
1+3+3+2
0+2 1 1
𝑆𝑀𝐶1,4 = =0,22
0+4+3+2
2+3 C
𝑆𝑀𝐶2,3 = =0,56 2 0,33 1
2+2+2+3 l
o
1+3 n 3 0,33 0,56 1
𝑆𝑀𝐶2,4 = =0,44
1+3+2+3
3+5 4 0,22 0,44 0,89 1

𝑆𝑀𝐶3,4 = =0,89
3+5+0+1
Dendograma
Para visualizar fácilmente las similitudes entre diferentes OTUs, puede realizarse una representación
gráfica. A continuación veremos los pasos que se deben seguir para la construcción de un
dendrograma utilizando nuestro ejemplo de los clones:
Clon De la matriz de similitud que hallamos, las OTUS

más relacionadas son el clon 3 y el clon 4, con 89%
1 2 3 4
de similitud.
1 1
Esto puede representarse gráficamente en una
C escala de la siguiente manera:
l 2 0,33 1
o PORCENTAJE DE SIMILITUD
3 0,33 0,56 1
n 0 10 20 30 40 50 60 70 80 89 90 100
4 0,22 0,44 0,89 1

3
4
Dendograma
El próximo paso consiste en construir una nueva matriz en la que las OTUs 3 y 4 forman una sola
OTU o cluster (3-4).
Para calcular esta nueva matriz de similitud, hay que determinar ahora cuál es la similitud entre:
Clon
1 2 3-4 • El Clon 1 y el Clon 1 →1
• El Clon 1 y el Clon 2 → SMC 1,2 = 0,33
C 1 1 • El Clon 1 y el Cluster 3-4 ?
l • El Clon 2 y Clon 2 →1
o 2 0,33 1 • El Clon 2 y el Cluster 3-4 ?
n • El Cluster 3-4 y el Cluster 3-4 →1
3-4 ? ? 1
Dendograma
Para derteminar la similitud entre un cluster (en este caso 3-4) con las otras OTUs simples (clon 2 y
clon 1 en este caso), podemos utilizar el método del ligamiento promedio:
La similitud entre una OTU y un cluster es el promedio entre las similitudes de las OTU involucradas,
es decir:
• Similitud entre el cluster 4-3 y el clon 1 • Similitud entre el cluster 4-3 y el clon 2
𝑆𝑀𝐶3,1 + 𝑆𝑀𝐶4,1 𝑆𝑀𝐶3,2 + 𝑆𝑀𝐶4,2
𝑆𝑀𝐶3−4,1 = 𝑆𝑀𝐶3−4,2 =
2 2
0,56 + 0,44
𝑆𝑀𝐶3−4,2 = = 0,50
0,33 + 0,22 2
𝑆𝑀𝐶3−4,1 = = 0,28
2
Matriz original: Clon Nueva matriz: Clon
1 2 3 4 1 2 3-4
1 1 1 1
C C
l 2 0,33 1 l
o 2 0,33 1
o 3 0,33 0,56 1
n n
4 0,22 0,44 0,89 1 3-4 0,28 0,50 1
Dendograma
Esta nueva matriz nos dice ahora que las OTUs mas relacionadas son el cluster (3-4) con el clon 2,
con una similitud de 50%
Agregamos este resultado a nuestra escala:
Clon
PORCENTAJE DE SIMILITUD
1 2 3-4 0 10 20 30 40 50 60 70 80 89 90 100
C 1 1
3
l
2 0,33 1 4
o
n 2
3-4 0,28 0,50 1
Para finalizar debemos ahora calcular la similitud entre el nuevo cluster [ (3-4) – 2] con la OTU
restante
Clon
𝑆𝑀𝐶(3−4),1 + 𝑆𝑀𝐶2,1
𝑆𝑀𝐶[ 3−4 −2],1 = 1 [(3-4)-2]
2
0,28 + 0,33 C
𝑆𝑀𝐶[ 3−4 −2],1 = = 0,31 1 1
2 l
o
n [(3-4)-2] 0,31 1
Dendograma
Esta nueva matriz nos dice ahora que las OTUs mas relacionadas son el cluster (3-4) con el clon 2,
con una similitud de 50%
Agregamos este resultado a nuestra escala:
Clon
1 2 3-4 0 10 20 30 40 50 60 70 80 89 90 100
C 1 1
3
l
2 0,33 1 4
o
n 2
3-4 0,28 0,50 1
Para finalizar debemos ahora calcular la similitud entre el nuevo Clon

cluster [ (3-4) – 2] con la OTU restante 1 [(3-4)-2]
𝑆𝑀𝐶(3−4),1 + 𝑆𝑀𝐶2,1 C
1 1
𝑆𝑀𝐶[ 3−4 −2],1 = l
2
0,28 + 0,33 o
𝑆𝑀𝐶[ 3−4 −2],1 = = 0,31 n [(3-4)-2] 0,31 1
2
Dendograma
Esta nueva matriz nos dice ahora que las OTUs mas Clon
relacionadas son el cluster[ (3-4) -2] con el clon 1, con 1 [(3-4)-2]
una similitud de 31%
C
1 1
l
o
n [(3-4)-2] 0,31 1
Agregamos este resultado a nuestra escala y así nos queda el dendograma completo:
0 10 20 30 31 40 50 60 70 80 89 90 100
3
4
2
1
Coeficiente de Asociación de Jaccard (JAC):
El coeficiente de asociación de Jaccard entre dos OTUS (i y j) se
define como: CLON 4
1 0
𝑎
𝐽𝐴𝐶𝑖,𝑗 = 0 3
𝑎+𝑏+𝑐
CLON 1
1
(a) (b)
El coeficiente de Jaccard desestima las coincidencias del tipo 0,0. 4 2
Es decir, en datos del tipo presencia/ausencia, este coeficiente 0
(c) (d)
considera que la ausencia de una característica no es
representativa de la similitud.
Por poner un ejemplo, la ausencia de alas observada entre un grupo lejanamente emparentado
(como un camello, un piojo y un nematodo) resultaría un indicador absurdo de afinidad.
Sin embargo, podría objetarse que un carácter positivo, como la presencia de alas, podría inducir a
error también cuando se considera para un conjunto similarmente heterogéneo (por ejemplo,
murciélago, garza y libélula). Tampoco podemos argumentar que la ausencia de carácter puede
deberse a una multitud de causas y que, al fin y al cabo, sabemos poco sobre los orígenes de los
caracteres positivos coincidentes.
En conclusión, la elección de qué coeficiente utilizar dependerá de cada caso y el taxonomista debe
establecer cuál de ellos es el más representativo en dicho caso.
Coeficiente de Asociación de Jaccard
Matriz de Similitud
La matriz de similitud quedaría formada acomodando los índices de Jaccard en filas y columnas, tal
como lo hicimos con los índices SAC
OTU
1 2 3 … N-1 N
1 JAC 1,1
2 JAC 1,2 JAC 2,2
O 3 JAC 1,3 JAC 2,3 JAC 3,3

T
U … …
N-1 JAC 1,N-1 JAC 2, N-1 JAC 3, N-1 JAC N-1,N-1
JAC 1,N
N JAC 2, N JAC 3, N JAC N-1,N JAC N,N
En Conclusión …
Hemos introducido (de manera muy elemental) algunos conceptos, herramientas y
métodos de la taxonomía numérica.
Tales herramientas y métodos nos permitieron establecer relaciones entre distintas

unidades taxonómicas (OTUs) , basadas en la determinación cuantitativa de la similitud
entre las mismas.
El coeficiente de asociación (ya sea el SAC o el JAC) es el “objeto” que nos permite dar
una estimación cuantitativa acerca de qué tan parecidas son dos unidades taxonómicas,
basada en la coincidencia de los estados que toman sus caracteres.
La matriz de similitud es la expresión ordenada en filas y columnas de los coeficientes

de asociación correspondientes a cada par de unidades taxonómicas. Esta matriz
permite ver rápidamente cuál es el grado de relación entre cada par de OTUs
El dendograma es la representación gráfica de los agrupamientos de OTUs (clústers) que

se construyen según el grado de similitud o afinidad
En Conclusión …
Los pasos elementales de la taxonomía numérica son los siguientes:
1) Elección de las unidades taxonómicas operacionales (OTUs)
2) Elección de los caracteres a comparar ¿Qué caracteres son relevantes? ¿Cuántos
son suficientes?. Una vez elegidos los caracteres se determinan los estados para
cada OTU y cada carácter.
3) Codificación de los estados y construcción de la matriz básica de datos (MBD)
4) Obtención de un coeficiente de similitud (SAC, JAC, u otros) para cada par posible
de OTUs.
5) Construcción de la Matriz de Similitud a partir de los coeficientes calculados en el
paso anterior
6) Conformación de grupos (por ejemplo, en Dendogramas). En base a la matriz de
similitud y mediante técnicas del análisis de agrupamientos se obtiene la estructura
taxonómica del grupo en estudio
7) Generalizaciones. Se formulan las generalizaciones acerca de los taxones, tales como
elección de caracteres discriminatorios, relación entre los organismos, inferencias
acerca de los taxones, etc.
Se quiere determinar la afinidad entre 4 cepas. Para eso se efectuaron una serie de
pruebas, cuyos resultados se detallan a continuación
Pruebas cepas (OTUs)

realizadas
1 2 3 4
fermentación de:
glucosa + + + +
sacarosa + + + -
lactosa + - + -
fructosa + + + -
manosa - + + -
arabinosa - + + +
galactosa - - + -
ramnosa + + + -
celobiosa + - + -
VP + + - -
RM + - + -
lecitinasa + + - +
DNasa - + - +
catalasa - + - +
citocromo oxidasa - + - +
reducción de NO3- - - - +
Codificación: Datos tipo presencia/ausencia +=1 -=0
Pruebas cepas (OTUs)

realizadas
1 2 3 4
fermentación de:
glucosa 1 1 1 1
sacarosa 1 1 1 0
lactosa 1 0 1 0
fructosa 1 1 1 0
manosa 0 1 1 0
arabinosa 0 1 1 1
galactosa 0 0 1 0
ramnosa 1 1 1 0
celobiosa 1 0 1 0
VP 1 1 0 0
RM 1 0 1 0
lecitinasa 1 1 0 1
DNasa 0 1 0 1
catalasa 0 1 0 1
citocromo oxidasa 0 1 0 1
reducción de NO3- 0 0 0 1
Ir al Excel
Dendrograma obtenido luego del análisis estadístico (UPGMA) de los perfiles
electroforéticos obtenidos mediante DGGE de los gránulos de kefir CIDCA AGK
1, CIDCA AGK 2, CIDCA AGK 3, CIDCA AGK 5, CIDCA AGK 6, CIDCA AGK 7,
CIDCA AGK 8, CIDCA AGK 10 y CIDCA AGK 11.

Taxonomía Numérica

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Taxonomía Numérica

Cargado por

Copyright:

Formatos disponibles

Taxonomía Numérica

Es la evaluación numérica de la afinidad o similitud

Presencia Diámetro GC en ADN (%) Reproductibili Color

Presencia de esporas: DOBLE ESTADO, PRESENCIA/AUSENCIA

¿Cuáles de estos clones se parecen más entre sí?

1) Datos Doble Estado

Estados excluyentes: Carácter Estado Codificación

Si le asigno el número 1, por ejemplo, al estado “Marrón”, no me queda unívocamente

Carácter Estado ¿Qué codificación elijo?

Carácter Estado Codificación

Pasamos de tener 1 CARÁCTER CON 3 ESTADOS a 3 CARACTERES CON 2 ESTADOS !!

Carácter Estado ¿Qué codificación elijo?

En esta codificación cada estado se transforma en un carácter de presencia/ausencia,

Carácter Estado Baja Media Alta

En esta codificación se interpreta que la presencia del carácter “Alta” conlleva a la

Los datos cuantitativos pueden ser transformados en datos doble estado.

Consideremos primero el carácter “Diámetro celular”. La variabilidad del diámetro

Por ejemplo, podemos considerar

La codificación nos quedaría de la siguiente manera:

Se han propuesto una cantidad innumerable de coeficientes de asociación. Aquí

Antes de definir estos coeficientes, vamos a establecer cierta simbología

1) Que ambas OTUs tengan 1

Presencia Diámetro GC en ADN (%) Color

CLON 2 1) Hay 1 carácter con CLON1 = 1 y CLON2 = 1

Presencia Diámetro GC en ADN (%) Color

CLON 4 1) Hay 0 caracteres con CLON1 = 1 y CLON4 = 1

0+2 → El clon 1 y 4 tienen una similitud de 22 %

3+5 → El clon 3 y 4 tienen una similitud de 89 %

2) El coeficiente de asociación de una OTU con si misma es 1.

2 SMC 1,2 SMC 2,2

O 3 SMC 1,3 SMC 2,3 SMC 3,3

N-1 SMC 1,N-1 SMC 2, N-1 SMC 3, N-1 SMC N-1,N-1

3+5 4 0,22 0,44 0,89 1

Clon De la matriz de similitud que hallamos, las OTUS

4 0,22 0,44 0,89 1

Matriz original: Clon Nueva matriz: Clon

Para finalizar debemos ahora calcular la similitud entre el nuevo Clon

2 JAC 1,2 JAC 2,2

O 3 JAC 1,3 JAC 2,3 JAC 3,3

N-1 JAC 1,N-1 JAC 2, N-1 JAC 3, N-1 JAC N-1,N-1

Tales herramientas y métodos nos permitieron establecer relaciones entre distintas

La matriz de similitud es la expresión ordenada en filas y columnas de los coeficientes

El dendograma es la representación gráfica de los agrupamientos de OTUs (clústers) que

Pruebas cepas (OTUs)

Pruebas cepas (OTUs)

También podría gustarte