Está en la página 1de 31

Una Breve Gua Didctica sobre MaxEnt

Por Steven Phillips, ATT !esearch



Esta "ua didctica da una introducci#n bsica para el uso del MaxEnt, pro"ra$a para el
$odelado de la distribuci#n "eo"r%ica de las especies en base a la $xi$a entropa,
escrito por Steven Phillips, Miro Dudi& ' !ob Schapire, con el apo'o de los laboratorios
de investi"aci#n de ATT, la Universidad de Princeton ' el (entro para la Biodiversidad
' (onservaci#n del Museo A$ericano de )istoria *atural+ Para $s detalles sobre la
teora del $odelado en base a $xi$a entropa, as co$o sobre la descripci#n de los
datos e$pleados ' los tipos principales de anlisis estadsticos usados a,u, vea-
Steven .+ Phillips, !obert P+ Anderson and !obert E+ Schapire, Maximum entropy
modeling of species geographic distributions+ Ecological Modelling, /ol 0123456 pp
7405781, 7229+
Un se"undo artculo, el cual describe las caractersticas a"re"adas $s reciente$ente al
pro"ra$a MaxEnt es-
Steven .+ Phillips and Miroslav Dudi&, Modeling of species distributions with
Maxent: new extensions and a comprehensive evaluation+ Ecography, to appear+
:os datos a$bientales ,ue usare$os consisten en datos cli$ticos ' de elevaci#n de
Suda$;rica, ade$s de una capa de ve"etaci#n potencial+ *uestra especie de $uestra
ser Bradypus variegatus, la Pere<a de Tres Dedos+ Esta "ua didctica asu$ir ,ue todos
los archivos de datos estarn locali<ados en el $is$o directorio co$o archivos del
pro"ra$a MaxEnt= de otro $odo, Usted deber usar la ruta >i+e+, c-?data?$axent?tutorial@
delante de los no$bres de los archivos e$pleados a,u+
(o$en<ando
Descar"ando
El programa consiste de un archivo jar, maxent.jar, el cual puede ser
usado en cualquier computador que tenga Java versin 1.4 o posterior.
Maxent puede ser descargado, junto con la literatura asociada, desde
www.cs.princeton.edu/schapire/maxent! el am"iente de tiempo de
ejecucin de Java puede o"tenerse desde Aava+sun+co$3Aavase3doBnloads. #i
$sted est% usando &indows 'como asumimos(, $sted de"er)a descargar
tam"i*n el archivo maxent."at + guardarlo en el mismo directorio de
maxent.jar. El sitio we" tiene un archivo llamado ,readme.txt-, el cual
contiene instrucciones para instalar el programa en su computador.
Cniciando
Si Usted est usando Microso%t DindoBs, si$ple$ente ha"a clic sobre el archivo
$axent+bat+ De otro $odo, escriba EAava 5$x807$ 5Aar $axent+AarE en una ventana de
co$andos >donde E807E puede ree$pla<arse por la cantidad de $e"ab'tes de $e$oria
,ue Usted ,uiera poner a disposici#n del pro"ra$a@+ Aparecer la si"uiente pantalla-
Para e%ectuar una corrida, Usted deber proporcionar un archivo ,ue conten"a las
localidades de presencia >F$uestrasG@, un directorio ,ue conten"a las variables
a$bientales ' un directorio de salida+ En nuestro caso, las localidades de presencia estn
en el archivo Fsa$ples?brad'pus+csvG, las capas a$bientales estn en el directorio
Fla'ersG, ' las salidas irn en el directorio FoutputsG+ Usted puede in"resar estas
localidades $anual$ente, o nave"ando para buscarlas+ Mientras est nave"ando para
buscar las variables a$bientales, recuerde ,ue Usted est buscando el directorio ,ue las
contiene, no necesita nave"ar hasta lle"ar a los archivos en dicho directorio+ El pro"ra$a
se ve as una ve< in"resados los archivos para Bradypus-
El archivo Fsa$ples?brad'pus+csvG contiene las localidades de presencia en %or$ato +csv+
:as pri$eras lneas son co$o si"uen-
species,longitude,latitude
"rad+pus.variegatus,/01.4,/12.3433
"rad+pus.variegatus,/01.3433,/12.3433
"rad+pus.variegatus,/01.1333,/10.4
"rad+pus.variegatus,/03.0005,/15.41
"rad+pus.variegatus,/03.41,/15.4
Pueden haber $Hltiples especies en el $is$o archivo de $uestras, en cu'o caso $s
especies aparecern en el panel Aunto con Bradypus+ Se pueden usar siste$as de
coordenadas di%erentes a latitud ' lon"itud, sie$pre ' cuando se considere ,ue los
archivos de $uestras ' las capas a$bientales usen el $is$o siste$a de coordenadas+ :a
coodenada FxG >lon"itud, en nuestro caso@ debe venir antes de la coordenada F'G >latitud@
en el archivo de $uestras+ Si los datos de presencia tienen re"istros duplicados >$Hltiples
re"istros de la $is$a especie en la $is$a cuadrcula@, ;stos pueden ser eli$inados
haciendo clic en el bot#n FSettin"sG >F(on%i"uraci#nG@ ' seleccionando FDelete
duplicatesG >FBorrar duplicadosG@+
El directorio Fla'ersG >FcapasG@ contiene un nH$ero de cuadrculas >raster "rids@ en
AS(CC >en el %or$ato +asc de ES!C@, cada uno de los cuales describe una variable
a$biental+ Todas las cuadrculas deben tener los $is$os l$ites "eo"r%icos ' ta$aIo de
celda >i+e+ todos los encabe<ados de los archivos AS(CC deben coincidir per%ecta$ente
unos con otros@+ Una de nuestras variables, Fecore"G, es una variable cate"#rica ,ue
describe los tipos de ve"etaci#n portenciales+ :as cate"oras deben ser indicadas por
nH$eros, $s ,ue por letras o palabras+ Usted debe decirle al pro"ra$a cuales variables
son cate"#ricas, co$o se ha hecho anterior$ente en el cuadro+
E%ectuando una corrida
Si$ple$ente presione el bot#n F!unG >F(orrerG@+ Un $onitor de pro"reso describe los
pasos ,ue estn siendo to$ados+ Despu;s de ,ue las capas a$bientales estn car"adas '
los pri$eros pasos se han to$ado, el pro"reso hacia el entrena$iento del $odelo de
$axent se $uestra as-
:a "anancia se relaciona estrecha$ente con la desviaci#n, una $edida de precisi#n de
aAuste usada "eneral$ente tanto en $odelos aditivos co$o lineales+ (o$ien<a en cero e
incre$enta hacia una asntota durante la corrida+ Durante este proceso, Maxent "enera
una distribuci#n de probabilidad de los pxeles en la cuadrcula, co$en<ando desde la
distribuci#n uni%or$e $eAorando reiterada$ente el aAuste de los datos+ :a "anancia se
de%ine co$o la probabilidad lo"art$ica pro$edio de la $uestras de presencia, $enos
una constante ,ue hace ,ue la distribuci#n uni%or$e ten"a cero "anancia+ Al %inal de la
corrida, la "anancia indica ,u; tan concentrado est el $odelo alrededor de las $uestras
de presencia= por eAe$plo, si la "anancia es dos, esto si"ni%ica ,ue la verosi$ilitud
pro$edio de las $uestras de presencia es exp>7@ J K,6 veces $s alta ,ue un pxel
aleatorio de %ondo+ *ote ,ue Maxent no est calculando directa$ente la Fprobabilidad de
ocurrenciaG+ :a probabilidad ,ue el pro"ra$a le asi"na a cada pxel es tpica$ente $u'
pe,ueIa, dado ,ue los valores deben su$ar uno entre todos los pxeles en la cuadrcula
>aun,ue nosotros re"resare$os a este punto cuando co$pare$os %or$atos de salida@+
:a corrida produce $Hltiples archivos de salida, de los cuales el $s i$portante para
anali<ar su $odelo es un archivo ht$l lla$ado Fbrad'pus+ht$lG+ Parte de este archivo
proporciona los ndices para las otras salidas, co$o esto-
Mirando una predicci#n
Para ver otras salidas >$s interesantes@ ,ue pueda haber en brad'pus+ht$l, activare$os
un par de opciones ' correre$os nueva$ente el $odelo+ Presione el bot#n FMa&e
pictures o% predictionsG >F)acer una i$a"en de las prediccionesG@, lue"o ha"a clic en
FSettin"sG, ' escriba F78G en la entrada F!ando$ test percenta"eG >FPorcentaAe de prueba
aleatorioG@+ :ue"o, presione nueva$ente el bot#n F!unG+ :ue"o de co$pletada la
corrida, el archivo brad'pus+ht$l contiene una i$a"en co$o esta-
:a i$a"en usa los colores para indicar la probabilidad ,ue las condiciones son adecuadas,
el roAo indica una alta probabilidad de condiciones adecuadas para la especie, verde
indica las condiciones tpicas de a,u;llos lu"ares donde la especie se encuentra, '
so$bras $s tenues de a<ul indican una baAa probabilidad de condiciones adecuadas+
Para el caso de Bradypus, ve$os ,ue las condiciones adecuadas predichas co$o
alta$ente probables abarcan la $a'or parte de las tierras baAas de (entroa$;rica, las
tierras baAas hH$edas del noroeste de Suda$;rica, la cuenca del A$a<onas, islas del
(aribe ' "ran parte de la %oresta Atlntica en el sureste de Brasil+ El indicado es un
archivo de i$a"en >+pn"@ al cual Usted puede si$ple$ente hacerle clic >en DindoBs@ o
abrir en la $a'ora de los pro"ra$as de procesa$iento de i$"enes+ Si Usted ,uiere
copiar estas i$"enes o si ,uiere abrirlas con otro pro"ra$a, encontrar a los archivos
+pn" en el directorio lla$ado FplotsG ,ue ha sido creado co$o una salida durante la
corrida+
:os puntos de prueba son una $uestra aleatoria to$ada de las localidades de presencia de
la especie+ :a $is$a $uestra aleatoria es usada cada ve< ,ue Usted corre Maxent sobre
el $is$o conAunto de datos, a $enos ,ue Usted seleccione la opci#n Frando$ seedG en el
$enH de con%i"uraci#n+ De $odo alterno, datos de prueba alternos para una o $s
especies pueden proveerse en un archivo aparte, dndole el no$bre de FTest sa$ple %ileG
>FArchivo de $uestra de pruebaG@ en el $enH de con%i"uraci#n+
Formatos de salida
Maxent sustenta tres %or$atos de salida para los valores del $odelo- crudo, cu$ulativo '
lo"stico+ Pri$ero, la salida cruda la constitu'e el $odelo exponencial de Maxent per se+
Se"undo, el valor cu$ulativo correspondiente a un valor crudo de r es el porcentaAe de la
distribuci#n de Maxent cu'o valor crudo es al $enos r+ :a salida cu$ulativa se interpreta
$eAor en t;r$inos de la tasa de o$isi#n predicha- Si con%i"ura$os un u$bral cu$ulativo
de c, la predicci#n binaria resultante tendr una tasa de o$isi#n de cL sobre las $uestras
deducidas a partir de la $is$a distribuci#n de Maxtent ' podre$os predecir una tasa de
o$isi#n si$ilar para $uestras deducidas a partir de la distribuci#n de la especie+ Tercero,
si c es el exponencial de la entropa de la distribuci#n de Maxent, entonces el valor
lo"stico correspondiente a un dato crudo de r es cr3>0Mcr@+ Esta es una %unci#n
lo"stica, por,ue los valores crudos son una %unci#n exponencial de las variables
a$bientales+ :os tres %or$atos de salida estn relacionados de $anera $on#tona, pero
estn a escalas di%erentes ' tienen di%erentes interpretaciones+ :a salida por de%ecto es
lo"stica, lo cual es $s %cil de conceptuali<ar- Proporciona un esti$ado entre cero '
uno de probabilidad de presencia+ *ote ,ue la probabilidad de presencia depende de
detalles del diseIo de $uestreo, tales co$o el ta$aIo de la parcela ' >para or"anis$os
alta$ente $#viles@ tie$po de observaci#n= la salida lo"stica esti$a la probabilidad de
presencia asu$iendo ,ue el diseIo de $uestreo es tal ,ue las localidades de presencia
tpicas tienen una probabilidad de presencia de alrededor de 2,8+ :a i$a"en antes
expuesta del $odelo de Bradypus usa el %or$ato lo"stico+ (o$parativa$ente, se obtiene
la si"uiente i$a"en cuando se usa el %or$ato crudo-
*ote ,ue he$os usado una escala lo"art$ica para los colores+ Una escala lineal
proporcionara una i$a"en $a'or$ente a<ul con unos pocos pxeles roAos >Usted puede
veri%icar esto deseleccionando F:o"scale picturesG en el $enH de con%i"uraci#n@ pues el
%or$ato crudo tpica$ente le otor"a valores relativa$ente altos a un pe,ueIo nH$ero de
lu"ares N lo cual puede pensarse co$o un arte%acto de la salida cruda dada por una
distribuci#n exponencial+
Al e$plear el %or$ato cu$ulativo se obtiene la si"uiente i$a"en-
(o$o en el caso de la salida cruda, he$os usado una escala lo"art$ica para colorear la
i$a"en para resaltar las di%erencias entre los valores $s baAos+ :a salida cu$ulativa
puede ser interpretada co$o una predicci#n de las condiciones adecuadas para la especie
por arriba de un u$bral en el ran"o aproxi$ado de 0572 >o del a$arillo al naranAa en ;sta
i$a"en@, dependiendo del nivel de o$isi#n predicho ,ue es aceptable para la aplicaci#n+
Anlisis estadstico
El F78G ,ue introduAi$os en el Frando$ test percenta"eG le indica al pro"ra$a ,ue debe
esco"er de $anera aleatoria ' apartar el 78L de los re"istros de $uestras para usarlos en
la prueba+ Esto per$ite al pro"ra$a e%ectuar al"unos anlisis estadsticos si$ples+ :a
$a'or parte de los anlisis e$pleados usan un u$bral para hacer una predicci#n binaria,
estando las condiciones adecuadas por arriba de dicho u$bral ' las inadecuadas por
debaAo+ :a pri$era "r%ica $uestra co$o la o$isi#n de prueba ' la de entrena$iento as
co$o el rea predicha varan con la esco"encia del u$bral cu$ulativo, co$o se v; en la
si"uiente "r%ica-
A,u ve$os ,ue la o$isi#n sobre las $uestras de prueba se aAusta $u' bien a la tasa de
o$isi#n predicha, la tasa de o$isi#n para los datos de prueba de la distribuci#n de
Maxent por s $is$a+ :a tasa de o$isi#n predicha es una lnea recta, de%inida por el
%or$ato de salida cu$ulativo+ En al"unas situaciones, la lnea de la tasa de o$isi#n se
ubica por debaAo de la lnea de o$isi#n- Una ra<#n co$Hn para ello es ,ue los datos de
prueba ' aprendi<aAe no sean independientes, por eAe$plo si ;stos derivan de los $is$os
datos de presencia autocorrelacionados espacial$ente+
:a si"uiente "r%ica nos $uestra la curva operada por el receptor >!O(, por sus si"las en
in"l;s@ tanto para los datos de entrena$iento co$o para los de prueba, $ostrada abaAo+
Ta$bi;n se proporciona el rea baAo la curva >AU(, por sus si"las en in"l;s@ !O(= si ha'
datos de prueba disponibles, el error estndar del AU( para ;stos se darn posterior$ente
en la p"ina Beb+
:as lneas a<ul ' roAa sern id;nticas si Usted usa los $is$os datos para el entrena$iento
' para la prueba+ Si Usted divide los datos en dos porciones, una para el entrena$iento '
otra para la prueba, es nor$al ,ue la lnea roAa >entrena$iento@ $uestre una $a'or AU(
,ue la lnea a<ul >prueba@+ :a lnea roAa >entrena$iento@ $uestra el FaAusteG del $odelo a
los datos de entrena$iento ' es la aut;ntica prueba de la capacidad ,ue tienen los
$odelos de predecir+ :a lnea tur,uesa $uestra lo ,ue Usted esperara si su $odelo no
%uese $eAor ,ue el a<ar+ Si la lnea a<ul >la lnea de prueba@ se ubicase por debaAo de la
lnea tur,uesa, entonces esto indicara ,ue su $odelo se dese$peIa peor de lo ,ue lo
hara un $odelo aleatorio+ Mientras $s cerca se encuentre la lnea a<ul del tope superior
i<,uierdo, $eAor ser el $odelo para predecir las presencias contenidas en la $uestra de
prueba de los datos+ :a si"uiente es una buena re%erencia de inicio para obtener
in%or$aci#n $s detallada sobre las estadsticas relacionadas con las AU(- Pieldin",
A+)+ Bell, .+P+ >722K@ A revieB o% $ethods %or the assess$ent o% prediction errors in
conservation presence3 absence $odels+ Environ$ental (onservation 76>0@- 4Q561+ Dado
,ue nosostros conta$os sola$ente con datos de presencia ' no con datos de ausencia,
F%ractional predicted areaG >Fel rea %raccionada predichaG o la %racci#n del total del rea
de estudio predicha presentes@ es e$pleada en lu"ar de la tasa $a'or$ente usada >la
%racci#n de ausencias predichas presentes@+ Para pro%undi<ar en la discusi#n sobre esta
alternativa, vea el artculo aparecido en Ecolo"ical Modellin" $encionado en la pri$era
p"ina de esta "ua+ Es i$portante notar ,ue los valores de las AU( tienden a ser
$a'ores para especies con ran"os estrechos en relaci#n al rea estudiada descrita por los
datos a$bientales+ Esto no necesaria$ente indica ,ue los $odelos sean $eAores= por el
contrario, este co$porta$iento es un arte%acto de las estadsticas de las AU(+
Si los datos de prueba estan disponibles, el pro"ra$a auto$tica$ente calcula la
si"ni%icancia estadstica de la predicci#n, usando una prueba bino$ial de o$isi#n+ Para
Bradypus, esta da-
Para in%or$aci#n $s detallada sobre la estadstica bino$ial, vea el artculo aparecido en
Ecolo"ical Modellin" arriba $encionado+
R(ules variables i$portan $sS
Una aplicaci#n natural del $odelado de la distribuci#n de especies es contestar la
pre"unta de Rcules son las variables $s i$portantes para la especie cu'a distribuci#nes
est siendo $odeladaS )a' $s de una $anera para contestar esto= a,u delineare$os las
$aneras posibles en las cuales Maxent puede ser usado para ello+
Mientras se est entrenando al $odelo Maxent, pode$os rastrear cules son las variables
a$bientales ,ue contribu'en en $a'or $edida al $odelo+ (ada paso del al"orit$o de
Maxent incre$enta la "anancia del $odelo $ediante la $odi%icaci#n del coe%iciente para
una Hnica caracterstica= el pro"ra$a asi"na el incre$ento en la "anancia a la>s@
variable>s@ a$biental>es@ de las cuales depende dicha caracterstica+ )aciendo una
conversi#n a porcentaAes al %inal del proceso de entrena$iento, obtene$os la si"uiente
tabla-
Estos valores de contribuci#n porcentual Hnica$ente estn de%inidos de $anera
heurstica- ellos dependen de la ruta particular ,ue usa el c#di"o Maxent para obtener la
soluci#n opti$a ' un al"orit$o di%erente podra obtener la $is$a soluci#n por $edio de
una ruta distinta, lo cual resultara en valores de contribuci#n porcentual di%erentes+ Ms
aun, cuando ha' variables a$bientales alta$ente correlacionadas, las contribuciones
porcentuales deberan ser interpretadas con precauci#n+ En nuestro eAe$plo de Bradypus,
la precipitaci#n anual est alta$ente correlacionada con la precipitaci#n de octubre '
Aulio+ Aun,ue la tabla arriba expuesta $uestra ,ue Maxent us# la variable Fprecipitaci#n
de octubreG $s ,ue cual,uier otra, pero us# $u' poco a la precipitaci#n anual, esto no
necesaria$ente i$plica ,ue la precipitaci#n de octubre sea $ucho $s i$portante para la
especie ,ue la precipitaci#n anual+
A %in de esti$ar cuales son las variables $s i$portantes en el $odelo, pode$os correr
ta$bi;n una prueba de Aac&&ni%e seleccionando FDo Aac&&ni%e to $easure variable
i$portantG >F)acer un Aac&&ni%e para $edir la i$portancia de la variableG@ en la casilla
de veri%icaci#n+ (uando presiona$os nueva$ente el bot#n F!unG, se crea un conAunto de
$odelos+ En cada oportunidad se exclu'e una variable ' se crea un $odelo con las
re$anentes+ Entonces se crea un $odelo usando cada variable de $anera aislada+
Adicional$ente, se crea un $odelo usando todas las variables, tal ' co$o se hi<o
anterior$ente+ :os resultados de la prueba de Aac&&ni%e aparecen co$o tres "r%icos de
barras en los archivos Fbrad'pus+ht$lG ' el pri$ero de ;stos es $ostrado abaAo+
/e$os ,ue si Maxent usa sola$ente pre9012Tl0 >precipitaci#n pro$edio de enero@ casi
no obtiene "anancia, as ,ue la variable no es >por s $is$a@ Htil para esti$ar la
distribuci#n de Bradypus+ Por otra parte, la precipitaci#n de octubre >pre9012Tl02@
per$ite un aAuste ra<onable$ente bueno a los datos de entrena$iento+ :as barras a<ul
claro su"ieren ,ue nin"una variable contiene una cantidad sustancial de in%or$aci#n Htil,
,ue no est; contenida en las otras variables, dado ,ue no decrece de $anera considerable
la "anancia del entrena$iento cuando se o$ite una variable dada+
El archivo brad'pus+ht$l tiene dos "r%icas adicionales de Aac&&ni%e, las cuales prueban
la "anancia o el AU( en lu"ar de la "anancia del entrena$iento, co$o se $uestra abaAo+
:a co$paraci#n de las tres "r%icas de Aac&&ni%e plots puede ser $u' in%or$ativa+ :a
"r%ica correspondiente al AU( $uestra ,ue la precipitaci#n anual >pre9012Tann@ es la
variable ,ue por si sola predice de $anera $s e%ectiva la distribuci#n de los datos de
%recuencia ,ue %ueron puestos de lado para usarlos co$o prueba, cuando el dese$peIo
para la predicci#n es $edido $ediante el AU(, aun cuando apenas %ue usado por el
$odelo construido usando todas las variables+ :a i$portancia relativa de la precipitaci#n
anual ta$bi;n incre$enta en la "r%ica de la "anancia de la prueba+ Adicional$ente, en
las "r%icas de la "anancia de la prueba ' de AU(, al"unas de las barras a<ul claro
>especial$ente a,uellas ,ue representan las variables de precipitaci#n $ensual@ son $s
lar"as ,ue la barra roAa, indicando ,ue el dese$peIo para la predicci#n $eAora cuando las
variables correspondientes no son usadas+
Esto nos dice ,ue las variables de precipitaci#n $ensual a'udan a ,ue Maxent obten"a un
buen aAuste a los datos de entrena$iento, pero la variable precipitaci#n anual "enerali<a
$eAor, dando resultados co$parativa$ente $eAores sobre los datos de prueba puestos
aparte+ Dicho de otra $anera, los $odelos hechos con las variables de precipitaci#n
$ensual parecen ser $enos trans%eribles+ Esto es i$portante si nuestro obAetivo es
trans%erir el $odelo, por eAe$plo aplicndolo a variables cli$ticas %uturas a %in de
esti$ar su distribuci#n %utura baAo el escenario de ca$bio cli$tico+ Tiene sentido ,ue
los valores de precipitaci#n $ensuales sean $enos trans%eribles- las condiciones
potencial$ente adecuadas para Bradypus no dependern de los valores precisos de la
precipitaci#n en deter$inados $eses, sino en la precipitaci#n $edia anual ' ,ui<s en la
consistencia de las precipitaciones o la carencia de periodos prolon"ados de se,ua+
(uando $odela$os a una escala continental, probable$ente ocurrirn ca$bios en los
lapsos precisos de los patrones de estacionalidad de la precipitaci#n, a%ectando la
precipitaci#n $ensual pero no las condiciones adecuadas para Bradypus+
En "eneral, es $eAor usar variables ,ue probable$ente sean $s relevantes para la
especie estudiada+ Por eAe$plo, el sitio Beb de Dorldcli$ >BBB+Borldcli$+or"@ provee
las variables FBCO(:CMG, inclu'endo variables derivadas tales co$o Fprecipitaci#n en el
tri$estre $s hH$edoG, $s ,ue valores $ensuales+
Una Hlti$a nota sobre las salidas de Aac&&ni%e- la "r%ica de la "anancia de la prueba
$uestra ,ue el $odelo hecho sola$ente con la precipitaci#n de enero >pre9012Tl0@
"enera una "anancia ne"ativa de la prueba+ Esto si"ni%ica ,ue el $odelo es li"era$ente
peor ,ue un $odelo nulo >i+e+, una distribuci#n uni%or$e@ para predecir la distribuci#n de
las presencias puestas aparte para la prueba+ Esto puede considerarse co$o una evidencia
$s de ,ue los valores de precipitaci#n $ensuales no son la $eAor opci#n co$o variables
para la predicci#n+
R(#$o depende la predicci#n de las variablesS
Ahora presione F(reate response curvesG >F(rear curvas de respuestaG@, deseleccione la
opci#n Aac&&ni%e ' corra el $odelo nueva$ente+ Esto produce la si"uiente secci#n a ser
aIadida al archivo Fbrad'pus+ht$lG-
(ada una de las i$"enes $iniatura puede ser seccionada >haciendo clic sobre ellas@ para
obtener una "r%ica $s detallada ' si Usted desea copiar o abrir estas "r%icas con otro
pro"ra$a, los archivos +pn" pueden encontrarse en el directorio FplotsG+ Mirando a
vap9012Tann, ve$os ,ue la respuesta es baAa para valores de vap9012Tann en el ran"o de
05722, pero alta para valores en el ran"o de 7225422+ El valor $ostrado en el eAe de las
F'G es la probabilidad predicha de condiciones %avorables, tal ' co$o es dada en el
%or$ato de salida lo"stico, con todas las de$s variables con%i"uradas a su valor
pro$edio calculado en base a las localidades de presencia+
*ote ,ue si las variables a$bientales estn correlacionadas, co$o lo estn a,u, las
curvas de respuesta $ar"inal pueden ser inconducentes+ Por eAe$plo, si dos variables
alta$ente correlacionadas tienen curvas de respuesta aproxi$ada$ente opuestas la una
de la otra, entonces el e%ecto co$binado de a$bas variables ser baAo para $uchos
pxeles+ Otro eAe$plo, ve$os ,ue la disponibilidad predicha esta ne"ativa$ente
correlacionada con la precipitaci#n anual >pre9012Tann@, si $antienen %iAas a las de$s
variables+ En otras palabras, una ve< ,ue el e%ecto de todas las de$s variables ha'a sido
considerado, el e%ecto $ar"inal de au$entar la precipitaci#n anual debe dis$inuir la
disponibilidad predicha+ Sin e$bar"o, la precipitaci#n anual est alta$ente
correlacionada con las variables de precipitaci#n anual, as ,ue en realidad no pode$os
$antener %cil$ente %iAos los valores $ensuales $ientras varan los valores anuales+ En
este caso el pro"ra$a produce un se"undo conAunto de curvas de respuesta, en el cual
cada una de las curvas es hecha $ediante la "eneraci#n de un $odelo usando s#lo la
variable correspondiente, The pro"ra$ there%ore produces a second set o% response
curves, in Bhich each curve is $ade b' "eneratin" a $odel usin" onl' the correspondin"
variable, sin to$ar en cuenta las otras variables-
En contraste con la respuesta $ar"inal a la precipitaci#n anual observada en el pri$er
conAunto de curvas de respuesta, ve$os ahora ,ue la disponibilidad predicha
"eneral$ente au$enta con el incre$ento de la precipitaci#n anual+
Tipos de caractersticas y curvas de respuesta
:as curvas de respuesta nos per$iten ver la di%erencia entre tipos de caractersticas+
Deseleccione Fauto %eaturesG >F(aractersticas auto$ticasG@, seleccione FThreshold
%eaturesG >Fcaractersticas de u$bralG@ ' presione el bot#n F!unG de nuevo+ Observe los
per%iles de las caractersticas resultantes N se dar cuenta ,ue son %unciones en escalera,
co$o esta de pre9012Tl02-
Si se e%ectHa la $is$a corrida usando sola$ente caractersticas claves, el per%il resultante
de la caracterstica se ve as-
:os contornos de a$bos per%iles son si$ilares, pero ellos di%ieren por,ue tipos de
caractersticas distintos per$iten per%iles di%erentes de curvas de respuesta+ El exponente
en un $odelo MaBent es la su$atoria de las caractersticas ' una su$a de las
caractersticas de u$bral es sie$pre una %unci#n en escalera, de tal $odo ,ue la salida
lo"stica es ta$bi;n una %unci#n en escalera >co$o lo son las salidas crudas '
cu$ulativas@+ En co$paraci#n, una su$atoria de caractersticas clave sie$pre es una
%unci#n lineal por tra$os+ Esto explica la secuencia de se"$entos de lnea conectadas en
la se"unda curva de respuesta $ostrada arriba >*ote ,ue las lneas son li"era$ente
curvadas, especial$ente hacia los valores extre$os de la variable= esto es debido a la
salida lo"stica aplica una %unci#n si"$oidea al exponente de Maxent@ Usando todas las
clases Auntas >la opci#n por de%ecto en caso de tener $uestras su%icientes@ per$ite
$uchas respuestas co$pleAas para ser cuidadosa$ente $odeladas+Una explicaci#n $s
pro%unda de los diversos tipos de caractersticas puede encontrarse haciendo clic en el
bot#n de a'uda+
El %or$ato SDD
Otro %or$ato de entrada puede ser $u' Htil, especial$ente cuando sus cuadrculas
a$bientales sean $u' "randes+ A %alta de un no$bre $eAor, es lla$ado Fsa$ples Bith
dataG >$uestras con datosG@ o si$ple$ente SDD+ :a versi#n SDD de nuestro archivo
Bradypus, lla$ada Fbrad'pusTsBd+csvG, co$ien<a del si"uiente $odo-
species,lon"itude,latitude,cld9012Tann,dtr9012Tann,ecore",%rs9012Tann,hTde$,pre9012Tann,pre9012Tl02,pre9012Tl0,
pre9012Tl6,pre9012TlK,t$n9012Tann,t$p9012Tann,t$x9012Tann,vap9012Tann
brad'pusTvarie"atus,598+6,502+4Q44,K9+2,026+2,02+2,7+2,070+2,69+2,60+2,Q6+2,86+2,4+2,017+2,799+2,44K+2,7K1+2
brad'pusTvarie"atus,598+4Q44,502+4Q44,K9+2,026+2,02+2,7+2,070+2,69+2,62+2,Q6+2,86+2,4+2,017+2,799+2,44K+2,7K1+2
brad'pusTvarie"atus,598+0444,509+Q,8K+2,006+2,02+2,0+2,700+2,98+2,89+2,071+2,8Q+2,46+2,062+2,766+2,470+2,770+2
brad'pusTvarie"atus,594+999K,50K+68,8K+2,007+2,02+2,4+2,494+2,49+2,44+2,K0+2,7K+2,04+2,048+2,771+2,42K+2,727+2
brad'pusTvarie"atus,594+Q8,50K+6,8K+2,004+2,02+2,4+2,424+2,41+2,48+2,KK+2,71+2,08+2,046+2,771+2,429+2,727+2
Puede ser usado en lu"ar de un archivo de datos nor$al+ :a di%erencia radica Hnica$ente
en ,ue el pro"ra$a no necesita $irar en las capas de variables a$bientales >los archivos
AS(CC@ para obtener los valores de las variables en los puntos de $uestra, en lu"ar de eso
lee los valores de las variables a$bientales directa$ente de la tabla+ As, las capas
a$bientales son Hnica$ente usadas para leer los datos a$bientales de los pxeles de
%ondo, es decir a,uellos pxeles donde la especie no necesaria$ente ha sido detectada+ De
hecho, los pxeles de %ondo ta$bi;n pueden ser especi%icados en un archivo con %or$ato
SDD+ El archivo Fbac&"round+csvG contiene 02+222 datos de punto de %ondo+ :os
pri$eros de ellos se ven del si"uiente $odo-
bac&"round,590+KK8,9+0K8,92+2,022+2,02+2,2+2,K6K+2,88+2,76+2,8K+2,68+2,Q0+2,0Q7+2,741+2,422+2,747+2
bac&"round,599+2K8,8+478,9K+2,009+2,02+2,4+2,024Q+2,K8+2,09+2,9Q+2,96+2,068+2,0Q0+2,769+2,440+2,746+2
bac&"round,581+QK8,579+478,6K+2,071+2,1+2,0+2,K4+2,40+2,64+2,47+2,64+2,02+2,1K+2,70Q+2,441+2,0Q1+2
bac&"round,59Q+4K8,508+4K8,8Q+2,007+2,02+2,66+2,7241+2,44+2,9K+2,40+2,42+2,9+2,020+2,0Q0+2,780+2,044+2
bac&"round,59Q+878,6+KK8,K7+2,18+2,02+2,2+2,98+2,K7+2,09+2,98+2,91+2,044+2,70Q+2,7K0+2,469+2,7Q1+2
Pode$os correr Maxent con Fbrad'pusTsBd+csvG co$o archivo de $uestras '
Fbac&"round+csvG >a$bos locali<ados en el directorio FsBdG@ co$o archivo de capas
a$bientales+ Trate de correrlo ' se dar cuenta ,ue corre $ucho $s rpido, debido a ,ue
no tiene ,ue car"ar las "randes cuadrculas a$bientales+ Otra ventaAa es ,ue Usted puede
asociar di%erentes re"istros con condiciones a$bientales de di%erentes periodos de
tie$po+ Por eAe$plo, dos re"istros obtenidos a 022 aIos de di%erencia el uno del otro en
una $is$a celda de la cuadrcula probable$ente re%leAan una variaci#n considerable en
las condiciones a$bientales, pero a $enos ,ue Usted use el %or$ato SDD, a$bos
re"istros recibirn los $is$os valores de variables a$bientales+ El inconveniente es ,ue
no puede elaborar i$"enes o cuadrculas co$o salidas, por,ue no tienen todos los datos
a$bientales+ El $odo de sortear este inconveniente es usando una Fpro'ecci#nG, co$o se
describe $s adelante+
(orrida de lotes >FBatch runnin"G@
En ocasiones usted necesita "enerar $Hltiples $odelos, ,ui<s con li"eras variaciones en
los par$etros de $odelado o en las entradas+ :a "eneraci#n de $odelos puede ser
auto$ati<ada con ar"u$entos tipo co$ando, obviando la necesidad de hacer clic '
escribiendo repetida$ente en la inter%ase del pro"ra$a+ :os ar"u$entos de lnea de
co$ando pueden o bien ser dados desde una ventana de co$ando >ta$bi;n conocida
co$o F%icheroG NFshellG N @, o pueden ser de%inidos en un archivo de lotes >FbatchG@+
D;le un vista<o al archivo FbatchExa$ple+batG >por eAe$plo, ha"a clic con el bot#n
derecho en el archivo +bat en DindoBs Explorer ' bralo usando *otepad@+ (ontiene la
si"uiente lnea-
Aava 5$x807$ 5Aar $axent+Aar environ$entalla'ersUla'ers to""lela'ert'peUecore"
sa$ples%ileUsa$ples?brad'pus+csv outputdirector'Uoutputs redoi%exists autorun
El e%ecto es decirle al pro"ra$a donde encontrar capas a$bientales ' archivos de
$uestras ' donde poner las salidas, o indicar ,ue la variable ecore" es cate"#rica+ El
indicador FautorunG >Fcorrida auto$ticaG@ le dice al pro"ra$a de iniciar la corrida
in$ediata$ente, sin esperar a ,ue el bot#n F!unG sea presionado+ Ahora intente darle
doble clic en el archivo para ver ,ue es lo ,ue hace+
Muchos aspectos del pro"ra$a Maxent pueden ser controlados por ar"u$entos de lnes
de co$ando+ Presione el bot#n F)elpG para ver todas las posibilidades+ MHltiples corridas
pueden aparecer en el $is$o archivo ' pueden ser corridos si$ple$ente una despu;s de
la otra+ Usted puede ca$biar el valor por de%ecto de $uchos de los par$etros
a"re"ando ar"u$entos de lnea de co$andos al archivo F$axent+batG+ Muchos de los
ar"u$entos de lneas de co$andos ta$bi;n tienen abreviaciones, as la corrida descrita
en batchExa$ple+bat podra ta$bi;n ser iniciada usando este co$ando-
Aava 5$x807$ 5Aar $axent+Aar Ne la'ers Nt eco Ns sa$ples?brad'pus+csv No outputs Nr 5a
Regularizacin+
El par$etro F$ultiplicador de re"ulari<aci#nG >Fre"ulari<ation $ultiplierG@ ubicado en
el panel de con%i"uraci#n in%lu'e el nivel de en%o,ue o cuan cercana$ente se aAusta la
distribuci#n de salida obtenida+ Un valor $enor ,ue el valor por de%ecto de 0,2 producir
una distribuci#n de salida $s locali<ada la cual se aAusta estrecha$ente a los re"istros de
presencia dados, pudiendo ser un aAuste excesivo >aAustndose tan cercana$ente a los
datos de entrena$iento ,ue el $odelo no "enerali<a bien para identi%icar los datos de
prueba independientes@+ Un $ultiplicador de re"ulari<aci#n $a'or producir una
predicci#n $s extendida, $enos locali<ada+ Cntente ca$biar el $ultiplicador ' exa$ine
las i$"enes producidas ' los ca$bios en las AU(+ (o$o eAe$plo, con%i"urando el
$ultiplicador a tres hace ,ue la si"uiente i$a"en $uestre una distribuci#n $ucho $s
di%usa ,ue la presentada anterior$ente-
El potencial de aAustar en exceso se incre$enta en la $edida ,ue la co$pleAidad del
$odelo se incre$enta+ Pri$ero intente con%i"urar el $ultiplicador con un valor $u' baAo
>i+ e+ 2,20@ con el conAunto de caractersticas por de%ecto para ver un $odelo alta$ente
aAustado en exceso+ :ue"o intente usar el $is$o $ultiplicador de re"ulari<aci#n
Hnica$ente con caractersticas cuadrticas ' lineales+
)aciendo pro'ecciones
Un $odelo entrenado con un conAunto de capas a$bientales >o archivo SDD@ puede ser
Fpro'ectadoG al aplicrsele otro conAunto de capas a$bientales >o archivo SDD@+ :as
situaciones en las cuales se re,uiere de pro'ecciones incl'en el $odelado de la
distribuci#n de las especies baAo las condiciones cli$ticas ca$biantes, la aplicaci#n de
un $odelo de distribuci#n nativa a una especie invasora para explorar el ries"o de
invasi#n en rea "eo"r%icas di%erentes, o si$ple$ente evaluar el $odelo baAo un
conAunto de localidades de prueba con la %inalidad de e%ectuar anlisis estadsticos $s
pro%undos+ A,u va$os a llevar a cabo una pro'ecci#n con un obAetivo $u' si$ple-
Elaborar una cuadrcula en %or$ato AS(CC ' su %i"ura asociada co$o salida cuando las
$uestras ' el %ondo estn en %or$ato SDD+
Escriba, o nave"ue, T'pe in, los archivos de $uestras FsBd?brad'pusTsBd+csvG ' las
capas a$bientales en FsBd?bac&"round+csvG, lue"o in"rese el directorio capas >Fla'ersG@
en el FProAection :a'ers Director'G >FDirectorio de (apas de Pro'ecci#nG@, cpo$o se
$uestra en la si"uiente %i"ura+
El directorio de capas de pro'ecci#n >o archivo SDD@ debe contener variables con los
$is$os no$bres ,ue las variables e$pleadas para el entrena$iento del $odelo, pero
describiendo unas condiciones di%erentes >i+e+, una re"i#n "eo"r%ica di%erente o $odelo
cli$tico di%erente@+ Para a$bos conAuntos de datos, los de entrena$iento ' los de
pro'ecci#n, el no$bre de cada variable es o bien el ttulo de la colu$na >si se est usando
un archivo en %or$ato SDD@ o el no$bre del archivo pero sin la ter$inaci#n +asc >si se
est usando un directorio de cuadrculas@+
(uando usted presiona F!unG, se entrena un $odelo usando los datos SDD el cual es
posterior$ente pro'ectado sobre cuadrculas AS(CC en el directorio Fla'ersG+ :a
cuadrcula de salida en %or$ato AS(CCC se lla$a Fbrad'pusTvarie"atusTla'ers+ascG ' en
lneas "enerales el no$bre del directorio es aIadido al no$bre de la especie, con el %in de
distin"uirlo de la salida estndar >no pro'ectada@+ Si se selecciona F$a&e pictures o%
predictionsG >Fhacer %i"uras de las prediccionesG@, aparecer una %i"ura del $odelo
pro'ectado en el archivo Fbrad'pus+ht$lG+
Anali<ando la salida de Maxent en !
Maxent produce un cierto nH$ero de archivos de salida en cada corrida+ Al"unos de ;stos
archivos pueden ser i$portados por otros pro"ra$as si Usted ,uiere e%ectuar sus propios
anlisis de las predicciones+ A,u de$ostra$os el uso del pa,uete estadstico "ratuito !
con salidas de MaxEnt- Se entiende ,ue esta secci#n est diri"ida a usuarios con
experiencia en el uso de !+ Usare$os el si"uiente par de archivos producidos por
Maxent-
brad'pusTvarie"atus+csv
brad'pusTvarie"atusTsa$plePredictions+csv
El pri$ero de ;stos se produAo cuando los datos de %ondo son dados en %or$ato SDD ' el
se"undo se produce en todos los casos+ Ase"Hrese ,ue Usted dispone de datos de prueba
>por eAe$plo, con%i"urando el porcentaAe aleatorio de prueba en 78@= estare$os evaluando
las salidas de MaxEnt usando los $is$os datos de prueba ,ue us# Maxent+ Pri$ero,
inicia$os ! e instala$os al"unos pa,uetes >asu$iendo ,ue estas es la pri$era ve< ,ue lo
esta$os usando@ ' entonces los car"a$os escribiendo >o pe"ando@-
install+pac&a"es>E!O(!E, dependenciesUT!UE@
install+pac&a"es>EvcdE, dependenciesUT!UE@
librar'>!O(!@
librar'>vcd@
librar'>boot@
A trav;s de ;sta secci#n usare$os texto a<ul para $ostrar los c#di"os ' co$andos de ! '
verde para $ostrar las salidas de !+ Se"uida$ente nos diri"i$os hacia el directorio donde
estn las salidas de MaxEnt, por eAe$plo-
setBd>Fc-3$axent3tutorial3outputsG@
' lue"o lea en las predicciones de Maxent en los puntos de presencia ' de %ondo, '
extrai"a las colu$nas ,ue necesita$os-
presence V5 read+csv>Fbrad'pusTvarie"atusTsa$plePredictions+csvE@
bac&"round V5 read+csv>Fbrad'pusTvarie"atus+csvE@
pp V5 presenceW(u$ulative+prediction X "et the colu$n o% predictions
testpp V5 ppYpresenceWTest+or+trainUUEtestEZ X select onl' test points
trainpp V5 ppYpresenceWTest+or+trainUUEtrainEZ X select onl' test points
bb V5 bac&"roundWMaxent+cu$ulative+values+at+bac&"round+points
Ahora pode$os poner los valores de la predicci#n en el %or$ato re,uerido por !O(!, el
pa,uete ,ue usare$os para hacer al"unos anlisis !O( ' "enere la curva !O(-
co$bined V5 c>testpp, bb@ X co$bine into a sin"le vector
label V5 c>rep>0,len"th>testpp@@,rep>2,len"th>bb@@@ X labels- 0Upresent, 2Urando$
pred V5 prediction>co$bined, label@ X labeled predictions
per% V5 per%or$ance>pred, EtprE, E%prE@ X True 3 %alse positives, %or !O( curve
plot>per%, colori<eUT!UE@ X ShoB the !O( curve
per%or$ance>pred, EaucE@['+valuesYY0ZZ X (alculate the AU(
El co$ando "ra%icar proporciona el si"uiente resultado-
Mientras ,ue el co$ando Fper%or$anceG >Fdese$peIoG@ proporciona un AU( de
2,Q9KKK81, el cual es consistente con el AU( reportada por MaxEnt+ A continuaci#n,
co$o un eAe$plo de las pruebas disponibles en ! pero no as en MaxEnt, llevare$os a
cabo un esti$ado de la desviaci#n estndar del AU( $ediante reiteraciones
>FbootstrapG@+
AU( V5 %unction>p,ind@ \
pres V5 pYindZ
co$bined V5 c>pres, bb@
label V5 c>rep>0,len"th>pres@@,rep>2,len"th>bb@@@
predic V5 prediction>co$bined, label@
return>per%or$ance>predic, EaucE@['+valuesYY0ZZ@
]
b0 V5 boot>testpp, AU(, 022@ X do 022 bootstrap AU( calculations
b0 X "ives esti$ates o% standard error and bias
Esto proporciona la si"uiente salida-
O!DC*A!^ *O*PA!AMET!C( BOOTST!AP
(all-
boot>data U testpp, statistic U AU(, ! U 022@
Bootstrap Statistics -
ori"inal bias std+ error
t0_ 2+Q9KKK81 52+2224K7604Q 2+271K7804
' ve$os ,ue el esti$ado por reiteraciones del error estndar >2,271K7804@ es cercano al
error estndar calculado por MaxEnt >2,27Q@+ :os resultados de las reiteraciones ta$bi;n
pueden ser e$pleadas para deter$inar los intervalos de con%ian<a para las AU(-
boot+ci>b0@
dados los si"uientes cuatro esti$ados N vea la secci#n de recursos al %inal de ;sta "ua
para re%erencias ,ue de%inen ' co$paran estos esti$ados+
Cntervals -
:evel *or$al Basic
18L > 2+Q211, 2+1796 @ > 2+Q026, 2+1710 @
:evel Percentile B(a
18L > 2+Q296, 2+1787 @ > 2+KKQ9, 2+1010 @

A,uellos ,ue est;n %a$iliari<ados con el uso de las reiteraciones notarn ,ue a,u
esta$os reiterando sola$ente los valores de presencia+ Podra$os ta$bi;n reiterar los
valores de %ondo, pero los resultados no ca$biaran $ucho, dado ,ue ha' un "ran nH$ero
de valores de %ondo >02222@+
(o$o un eAe$plo %inal, investi"are$os el clculo de las estadsticas bino$ial ' `appa de
(ohen para al"unas re"las de u$bral de eAe$plo+ Pri$ero, el si"uiente c#di"o ! calcula
el ndice `appa para el u$bral dado se"Hn la predicci#n de presencia $ni$a-
con%usion V5 %unction>thresh@ \
return>cbind>c>len"th>testppYtestppaUthreshZ@, len"th>testppYtestppVthreshZ@@,
c>len"th>bbYbbaUthreshZ@, len"th>bbYbbVthreshZ@@@@
]
$'&appa V5 %unction>thresh@ \
return>`appa>con%usion>thresh@@@
]
$'&appa>$in>trainpp@@
el cual da un resultado de 2,22K7+ Si ,uere$os usar el u$bral ,ue $ini$i<a la su$atoria
de la sensibilidad ' de la especi%icidad en base a los datos de prueba, pode$os hacer lo
si"uiente, usando los valores de la tasa positiva verdadera ' de la tasa positiva %alsa del
obAeto Fdese$peIoG >Fper%or$anceG@ usado arriba para "ra%icar la curva !O(-
%pr U per%[x+valuesYY0ZZ
tpr U per%['+valuesYY0ZZ
$axsu$ U 2
%or >i in 0-len"th>per%[alpha+valuesYY0ZZ@@ \
su$ U tprYYiZZ M >05%prYYiZZ@
i% >su$ a $axsu$@ \
$axsu$ U su$
cuto%% U per%[alpha+valuesYY0ZZYYiZZ
index U i
]
]
$'&appa>cuto%%@
esto da un valor de `appa de 2,2066+ Para deter$inar las probabilidades bino$iales de
estos dos valores de u$bral pode$os hacer lo si"uiente-
$'bino$ial V5 %unction>thresh@ \
con% V5 con%usion>thresh@
trials V5 len"th>testpp@
return>bino$+test>con%YY0ZZYY0ZZ, trials, con%YY0,7ZZ 3 len"th>bb@, E"reaterE@@
]
$'bino$ial>$in>trainpp@@
$'bino$ial>cuto%%@
esto da valores de p de 8,1K1e521 ' 7,41Ke500 respectiva$ente, los cuales son
li"era$ente $a'ores ,ue los valores de p dados por MaxEnt+ :a ra<#n de ;sta di%erencia
radica en el hecho de ,ue el nH$ero de $uestras de prueba es $a'or ,ue 78, el u$bral
por arriba del cual MaxEnt usa una aproxi$aci#n nor$al para calcular valores de p
bino$ios+
!ecursos de !
Al"unos buenos $ateriales introductorios sobre el uso de ! puede encontrarse en-
http6//spider.stat.umn.edu/7/doc/manual/7/intro.html, + otras p%ginas en
el mismo sitio.
http6//www.math.ilstu.edu/dh8im/7stu99/7tutor.html

También podría gustarte