P. 1
Indices de Similitud

Indices de Similitud

|Views: 959|Likes:
Publicado porCris Popping Castro

More info:

Published by: Cris Popping Castro on Jul 25, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

11/07/2013

pdf

text

original

INDICE

Programa para calcular índices de similitud a partir de matrices de presencia-ausencia

Miguel Murguía

A.C. Asociación de Biólogos Amigos de la Computación. Col. 10200 Tel. Av.mx www.F.org INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 2 .net.INDICE Programa para calcular índices de similitud a partir de matrices de presencia-ausencia Miguel Murguía Una publicación de: ABACo. San Jerónimo Lídice México. D.C.abacoac. D. y Fax 5668 4660 abaco@att. A. San Jerónimo 507. © 1990-1998.R.

Contenido 1. Bibliografía INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 3 . El programa INDICE Requerimientos para su uso Formatos de las matrices de datos Ejecutando el programa Formato de la matriz de resultados 3. Introducción Indices de similitud como herramienta metodológica en Biología Taxonomía numérica e índices de similitud Biogeografía cuantitativa e índices de similitud 2. Fórmulas de los índices que calcula el programa 4.

en donde se registra la presencia o ausencia de los estados de carácter de cada taxon. es decir. Índices de similitud como herramienta metodológica en Biología Con mucha frecuencia. aplicando métodos de agrupamiento. Introducción El programa INDICE es un programa que calcula una matriz de similitud a partir de una matriz de datos de presencia-ausencia. El programa está diseñado para que opere en computadoras PC compatibles y tiene requerimientos muy básicos de recursos de memoria y disco. Una obra clásica sobre taxonomía numérica es la de Sneath y Sokal (1973). Los índices de similitud obtenidos para cada par de taxa se registran a su vez en otra matriz: la matriz de similitud. por ejemplo. como un paso previo a la generación de fenogramas. Taxonomía numérica e índices de similitud La taxonomía numérica es una metodología para hacer operativos los principios de la fenética. El primer caso cae dentro del ámbito de la taxonomía numérica. El segundo caso cae dentro del ámbito de la biogeografía cuantitativa. La matriz de similitud también es analizada aplicando algoritmos definidos para generar un fenograma. Una de las primeras etapas de la metodología feneticista es el cálculo de los índices de similitud entre cada par de elementos a clasificar. área en la que se han desarrollado métodos numéricos para clasificar áreas geográficas de acuerdo a los organismos que las habitan. INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 4 . Las opciones se seleccionan mediante menús de barras. llamados OTUs (unidades taxonómicas operativas. apoya en la realización de los cálculos necesarios para proponer clasificaciones de los organismos. una descripción general de los objetivos y métodos de la taxonomía numérica se encuentra en Kohlmann (1990). por sus siglas en inglés). los índices de similitud se utilizan en Biología para comparar grupos de organismos (taxa) o para comparar regiones geográficas. Esa comparación se realiza a partir de la información contenida en una matriz de datos.1. navegables con las teclas del cursor.

los taxa desempeñan el papel de los caracteres en la taxonomía numérica. ahora entre las OGUs. que en este caso son las áreas geográficas a comparar. en biogeografía se definen las OGUs (por las iniciales en inglés de “unidades geográficas operativas”). INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 5 . Un ejemplo de este tipo de metodologías se puede consultar en Villarreal et al. (1996) y para una descripción del método puede consultarse a Crovello (1981) o Birks (1987). Biogeografía cuantitativa e índices de similitud Los índices de similitud también son una herramienta muy recurrida para el análisis de la distribución espacial de los organismos. la matriz de similitud puede analizarse para producir un fenograma de áreas. como resultado del análisis se produce una matriz de similitudes. así. La comparación entre las áreas se realiza mediante la matriz de presencia-ausencia de cada taxón en las áreas. De manera análoga a la taxonomía numérica.Un resumen bibliográfico donde se pueden consultar referencias que han producido fenogramas a partir de una matriz de similitud puede obtenerse de Baum et al. Análogamente a las OTUs (por las iniciales en inglés de “unidades taxonómicas operativas”). También. (1984).

Por ejemplo. indicando presencia con 1 y ausencia con 0.2. el archivo EJEMPLO. como los requerimientos para su operación. Requerimientos para su uso El programa puede correr en cualquier computadora PC compatible (XT. En los subsecuentes renglones se escriben los datos presencia-ausencia. El programa INDICE En esta sección se explican algunos aspectos técnicos del programa. Formato de las matrices de datos La matriz debe estar en un archivo ASCII.MAT contiene: 4 1 1 1 1 1 5 1 1 1 1 1 1 0 0 0 0 1 1 0 0 0 INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 6 . la forma de ejecutarlo y los formatos de los datos de entrada y de los resultados. 486 o Pentium) y tiene requerimientos muy básicos: puede ser ejecutado desde el disco compacto o. ejecute el archivo INSTALA desde el “prompt” de MS-DOS: C:\〉e:instala lo cual hará que se copien los archivos de INDICE al directorio INDICE en el disco duro. si se prefiere. Para copiar el programa INDICE del disco compacto desde la unidad E al disco duro. desde el disco duro. En el primer renglón el número de columnas (OTUs o taxa para un análisis taxonómico y OGUs o áreas para análisis biogeográfico) seguido del número de renglones (estados de carácter para análisis taxonómico o taxa para análisis biogeográfico). AT.

Menú principal del programa INDICE. El tamaño máximo permitido de la matriz es 40 columnas por 400 renglones. En la opción Ver matriz despliega en la pantalla la matriz que se encuentra actualmente en memoria. por ejemplo el programa WordPad o Bloc de Notas que vienen incluidos en el sistema operativo Windows. INDICE Formato de la matriz de datos Leer matriz: NO HAY MATRIZ EN MEMEORIA Ver matriz Calcular índices Terminar Figura 1. La opción Calcular índices presenta un submenú (figura 2) en el que el usuario puede elegir el índice a calcular. Después de leer la matriz de datos puede someterse al cálculo de los índice de similitud. INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 7 . Las matrices de datos pueden capturarse en un editor de ASCII.lo cual indica que es una matriz de cuatro OGUs por cinco taxa. La opción Formato de la matriz de datos despliega una breve explicación de la forma en que debe estar capturada la información en el archivo de la matriz a analizar. Ejecutando el programa Cuando se ejecuta el programa mediante el comando: C:\INDICE〉indice se presenta el menú que se ilustra en la Figura 1. o bien capturarla en Word y almacenarla como archivo de tipo texto. La opción Leer matriz se especifica el nombre del archivo que contiene os datos.

40 0. Indice de Jaccard: ---------------------------------------1 2 3 4 ---------------------------------------1.00 1. En esa matriz se indica el índice con el que fue calculada y en el encabezado se numeran las unidades comparadas.00 ---------------------------------------Figura 3.00 1.20 1. es decir las columnas de la matriz de datos analizada. Matriz de similitud calculada por el programa INDICE. y por lo tanto.50 1. la diagonal de la matriz resultado es el índice que resulta de la comparación de las columnas consigo mismas. Cada renglón representa a cada una de las columnas de la matriz analizada.40 0.MAT usando el índice de Jaccard. De esta manera. impresa o almacenada en un archivo. los valores de la diagonal son iguales a la unidad. Menú para elección del índice. INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 8 .Formato de la matriz de resultados El programa reporta una matriz de resultados que puede ser vista en la pantalla. En la figura 3 se muestra el resultado del programa INDICE al comparar cada columna de la matriz EJEMPLO.00 0. INDICE: Calcular índices Calcular Braun-Blanquet Calcular Fager Calcular Jaccard Calcular Kulezynski 1 Calcular Kulezynski 2 Calcular Otsuka Calcular Radio de Correlación Calcular Simpson Calcular Sorensen-Dice Menú principal Figura 2.20 0.00 0.

Elementos del universo que no están en A. las fórmulas hacen referencia a la comparación entre dos conjuntos A y B y se utilizan las siguientes operaciones: A∩B A∪B |A| AC max(A. Una explicación del significado de cada fórmula y comparaciones entre ellas se puede consultar en Crisci y López (1983). Fórmulas de los índices que calcula el programa A continuación se enuncian las fórmulas de los índices que el programa calcula. Fórmulas Baroni-Urbani-Buser sqrt( |A ∩ B| x |(A ∪ B)c| ) x |A ∩ B| ------------------------------------------sqrt( |A ∩ B| x |(A ∪ B)c| ) x |A ∪ B| INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 9 . B) Intersección. Unión. Notación usada Para la descripción de las fórmulas se utiliza notación de conjuntos. Número de elementos en un conjunto.3. Elementos que se encuentran en A o en B. así. Complemento. Hubálek (1982) o Sánchez y López (1988). B) min(A. Cardinalidad. Función: mínimo de dos valores enteros. Elementos en común en A y B. Función: máximo de dos valores enteros.

½ x max( |A|.Braun-Blanquet |A ∩ B| -----------------max( |A|. |B| ) Fager |A ∩ B| ---------------------------------------( |A| x |B| )½ . |B| ) Jaccard |A ∩ B| -------------|A ∪ B| Kulezynski 1 |A ∩ B| ---------------------|A ∪ B| .|A ∩ B| Kulezynski 2 |A ∩ B| x |A ∪ B| ---------------------2 x ( |A| x |B| ) Ochiai |A ∩ B| --------------( |A| x |B| )½ INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 10 .

|B| ) Sorensen-Dice 2 x |A ∩ B| -------------|A| + |B| INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 11 .Radio de correlación |A ∩ B| -------------|A| x |B| Simpson |A ∩ B| -----------------min( |A|.

B.J.B. Birks. Crovello. 1981 Quantitative Biogeography: an overview. Taxon. UNAM-Fondo de Cultura Económica. Duncan y R.V. Luna (compiladores. M. En: Llorente. Gard.C. based on binary (presence-absence) data: an evaluation. 656 p. 1982 Coeficients of association and similarity.F. J. 30: 563-575. Crisci. 1994 Algunos aspectos de la taxonomía numérica y sus usos en México. 87: 669-689. Kohlmann. Taxonomía Biológica.C.Fennici. Phylips. 1984 A bibliography of numerical phenetic studies in systematic botany. Washington. 71: 1044-1060. Rev. Missouri Bot. B. 1987 Recent methodological development in descriptive biogeography.4. un libro de texto universitario.Zool. Hubálek. INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 12 . 24: 165-178. Ann. e I. Biol.).B. 1983 Introducción a la teoría y práctica de la taxonomía numérica.J. D. Bibliografía Baum. Th. T. J. Z. OEA. H. y López.. Ann. 1994.

75: 119-145. The principles and practice of numerical classification. 1988 Theoretical analysis of some indices of similarity as applied to biogeography. O. G. Acta Botánica Mexicana 36: 29-42. Sneath.Sánchez. San Francisco. R.R. Folia Entom. 1996 Corología de las asteráceas de Coahuila. Villarreal. J. México. y Villaseñor.H. INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 13 .A. P. Valdés. 1973 Numerical Taxonomy.A.L. Ca. Freeman. J. J. y Sokal. y López. Mex..

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->