Está en la página 1de 105

TOMOGRAFADEINTERNET

TESISDEGRADODE
INGENIERAINFORMTICA
SEPTIEMBRE2007
ALUMNO:ALEJANDROD.ZYLBERBERG
TUTOR:DR.ING.JOSIGNACIOALVAREZHAMELIN
DEPARTAMENTODECOMPUTACIN
FACULTADDEINGENIERA
UNIVERSIDADDEBUENOSAIRES
ndice general
1.Introduccin 1
1.1.Conceptosbsicos 1
1.2.Motivacin 2
1.3.Elmodelomatemticobsico 3
1.4.Problemasinherentes 8
2.Estadodelarte 13
2.1.Tomografadelared 13
2.2.ProyectosdemapeodeInternet 25
2.3.Problemasabiertos 28
3.Innovaciones 31
3.1.Determinacindelasrutasmedibles 31
3.1.1.Clasificacindenodos 31
3.1.2.Creacindelamatrizderuteo 48
3.2.Minimizacindelsesgo 49
4.Resultadosexperimentales 55
4.1.Simulacionesendiferentestopologas 56
4.2.Procesamientodedatosreales 76
4.3.Conclusiones 83
5.Conclusiones 85
5.1.Contribucionesdeestatesis 85
5.2.Futuraslneasdeinvestigacin 87
iii
AnexoA.Datosexperimentales 89
AnexoB.Herramientadesimulacin 97
Bibliografa 99
iv
1. INTRODUCCIN
Elreadeconocimientoenlacualseenmarcalapresentetesisseconoceconelnombrede
NetworktomographyoTomografadered.EltrminofueutilizadoporprimeravezporVardi
[Vardi96] y a lo largo de los11 aosquehantranscurridodesdeentoncessehanpublicado gran
cantidaddeartculoscientficosproponiendomejorasalasolucinoriginal.
En este captulo se describe la informacin bsica relativa al rea de conocimiento. En la
primeraseccinseexplicaenquconsiste.Enlasegundaseccinsemanifiestaporquesnecesaria.
Enlaterceraseccinsepresentaelmodelomatemticoutilizadohabitualmente.Finalmente,enla
cuartaseccinseenumeranalgunosdelosfactoresqueintervienen.
1.1. Conceptos bsicos

Comenzaremospordefiniraqullamamostomografadeunared:
Latomografadeunaredeselestudiodesus
caractersticasinternasmediantemedicionesexternas.
Qusignificacadaunodelosconceptosqueaparecenenesadefinicin?
Lascaractersticasinternassondeterminadaspropiedadesdeunared,porejemplo:
latopologa
lademoraencadaenlace
elporcentajedepaquetesquesepierdenencadaenlace
anomalaseintrusiones
Lasmedicionesexternas recibenesenombreporquesetomansiempreentredosnodosdela
red,ynuncaseestudiaunpaquetemientraselmismoestviajando.Eninglsseutilizael
trminoendtoend,quepodratraducirsecomodepuntaapuntaoentrepuntas.
Elnombretomografa,enanalogaconelconjuntodetcnicasaplicadasenelcampodela
medicina,seutilizaporquesetratadeunprocesodemedicinnoinvasiva.Estanoinvasividad
delasmedicionespuedeserentendidadedosmaneras:
Comosemencionamsarriba,lasmedicionessonentrenodos,ynoseintroducenadaen
1
Captulo 1 Introduccin
elmedio,para,porejemplo,monitoreardirectamenteunenlaceindividualmente.Poreso
lallamamostomografa,envezde,porejemplo,endoscopia.
Setratadequeelprocesodemedicinafectealaredlomenosposible.Estonosrecuerda
en cierta forma al principio de Heisenberg, que bsicamente enuncia que no se puede
medirsininteractuar.Cuantomayorsealaprecisinquesebusca,mayorescantidadde
medicionesquedebernserdesplegadas,yentonceslosresultadosqueseobtendrnno
sern los correspondientes a la red original, a la cual se quera evaluar, sino los
correspondientesalaredquesehamodificadoacausadelprocesomismodemedicin.
1.2 Motivacin
La administracin de grandes redes requiere informacin sobre parmetros tales como
topologa, conectividad, ruptura de enlaces, comportamiento anmalo, intrusiones, demora de los
enlaces,porcentajedeprdidadelosenlaces,etc.
Amododeejemplo,podradecirsequeobtenerlasdemorasenlosenlacesquecomponenla
redesinteresantepormotivoscomo:
permitetrazarunmapadedemoras,tilenlaadministracindelared.
permitemejorarlosprotocolosderuteo.
Culesentonceslautilidaddelatomografadelared?
Primero es necesario definir agregacin. Por ejemplo, la ruta entre dos nodos A y B
atraviesavariosenlaces.EltiempoquetardaunpaqueteenllegardeAaBeslasumadelostiempos
encadaunodeesosenlaces.Tomarlamedicinagregada(demoraentreAyB)esfcil,perotomar
unamedicinindividualdelosenlacesatravesadosesdifcil,porquerequerirapodercontrolarlos
puntosunidosporcadaenlace.
Larespuestaesentoncesquetodoslosparmetrosmencionadosanteriormentesondifcileso
imposibles de medir en forma directa, pero medianamente fciles de medir en forma indirecta,
medianteelcrucedeinformacinagregada.Deaquderivalautilidaddelatomografadelared,que
justamente consiste en el estudio de las propiedades internas (individuales) mediante mediciones
externas(agregadas).
Porejemplo,larutaentreAyCposiblementetendrunaparteencomnconlarutaentreAy
B.EsdeesperarquelospaquetesquesalendeAsiganundeterminadocaminohastallegaraunpunto
enelquesedividenysiguencaminosdistintoshaciasusdestinos,comoseveenlafigura1.2.1.
2
Captulo 1 Introduccin
Figura1.2.1.Unejemplosimple.
La parte que tienen en comn (el enlace 1) aparecer en dos ecuaciones agregadas
independientes(1.3.1y1.3.2).Estoilustralaposibilidaddecruzarlainformacinagregada.
1.3. El modelo matemtico bsico
Continuandoconelejemplosimpledelaseccinanterior,elobjetivoescalcularlademoraen
losenlaces1,2y3,apartirdelasmedicionesdetiemposdelasrutasentreA,ByC.LlamandoL
1
,L
2
yL
3
alasdemorasenlosenlacesyAB,ACyBCalasdemorasenlasrutas,sepuedeplantear:
{
AB=L
1
L
2
AC=L
1
L
3
BC=L
2
L
3
(1.3.1)
(1.3.2)
(1.3.3)
Empleandonotacinmatricial:

1 1 0
1 0 1
0 1 1

L
1
L
2
L
3

AB
AC
BC

DeesaformasepuedenapreciarelvectorLdelasincgnitas(losvaloresindividualesdelos
enlaces),elvectorMdelosdatos(lasmedicionesagregadasdelasrutas)yunamatrizRderuteo:
RL=M
(1.3.4)
Lamatrizderuteoindicaquenlacesestnincluidosencadaruta.
3
Captulo 1 Introduccin
Enesteejemplo,hay3incgnitasy3ecuacionesindependientes,conlocualelsistemaresulta
compatibledeterminadoylasincgnitassepuedencalcular.
Peroenelcasogeneral,Rtienerangodeficiente,locualesequivalenteadecirquehaymenos
ecuaciones independientes que incgnitas. En ese caso el sistema es indeterminado, y se hace
necesarioadoptarcriteriosparallegaraunasolucin.
Ladeficienciadelrangoescausadapordiversosmotivos.Acontinuacinsedarnalgunos
ejemplos.
Falta de mediciones
Elejemplomssimplesedacuandonosetienentodaslasmedicionesposibles.Enungrafo
nodirigido,comoeldelafigura1.2.1,hay
nn1
2
medicionesposibles.Sinosecontaracon
todasellas,lamatrizpodraresultardeficiente.
Porejemplo,sinosesupieralademoraBC,lamatrizquedara:
R=

1 1 0
1 0 1

Enestecaso,Rtiene3columnasyrango2,presentandounadeficienciade1.
Enlaces que siempre aparecen juntos
Enlafigura1.3.1sepuedeapreciarunejemploenelcualhayunpardeenlaces(1y4)que
siempreaparecenjuntos.Esdecir,paracadafiladeR,elvalordelascolumnas1y4essiempreel
mismo.Enotraspalabras:oaparecenlosdos,onoapareceningunodelosdos.Formalmente:
r
i1
=r
i4
i
4
Captulo 1 Introduccin
Figura1.3.1.Losenlaces1y4siempreaparecenjuntos.
Elsistemaqueda:

1 1 0 1
1 0 1 1
0 1 1 0

L
1
L
2
L
3
L
4

AB
AC
BC

Enestecaso,Rtiene4columnasyrango3,presentandounadeficienciade1.
LasincgnitasL
1
yL
4
nosepuedencalcularporseparado,perossepuedecalcularsusuma:

1 1 0
1 0 1
0 1 1

L
1
L
4
L
2
L
3

=

AB
AC
BC

Los enlaces 1 y 4 se puedenreemplazar por su concatenacin, ala que llamaremos5. El


enlace5esloquesedenominaunenlacevirtual,yseilustraenlafigura1.3.2.Elsistemaqueda:

1 1 0
1 0 1
0 1 1

L
5
L
2
L
3

AB
AC
BC

Ahoralamatrizderuteotiene3columnasyrango3,conlocualnopresentadeficiencia.
5
Captulo 1 Introduccin
Los enlaces virtuales no se utilizan solamente cuando hay enlaces que siempre aparecen
juntos.Ese essolamenteuncasoparticular deunproblemamsgeneral:la identificabilidad.Los
enlacesvirtualesseutilizancuandohayenlacesnocalculablesindividualmente(osea,almargende
todos los dems enlaces de la red). A los enlaces no calculables tambin se los denomina no
identificables.Enotraspalabras,unenlaceesidentificablesiysolosisucorrespondienteincgnitase
puededespejar,esdecir,sepuedeescribirenfuncindelosdatos.
Figura1.3.2.Unenlacevirtual.
Grafos dirigidos
Losejemplosvistoshastaahoracorrespondenagrafosnodirigidos.Esoesequivalenteadecir
quelosenlacessonconsideradossimtricos.Perosilosenlacestuvierandiferentespropiedadesen
cadaunodesussentidos,esnecesariomodelarloscomoasimtricos.Esdecir,porcadaenlacedelos
quesevieronhastaahora,hay2:eldeidayeldevuelta.Enlafigura1.3.3.sepuedeapreciarel
ejemplooriginalmodeladocomoungrafodirigido.
6
Captulo 1 Introduccin
Figura1.3.3.Ungrafodirigido.
Elsistemaqueda:

1 0 0 1 0 0
0 1 1 0 0 0
1 0 0 0 0 1
0 1 0 0 1 0
0 0 1 0 0 1
0 0 0 1 1 0

L
1
L
2
L
3
L
4
L
5
L
6

AB
BA
AC
CA
BC
CB

Enestecaso,Rtiene6columnasyrango5,presentandounadeficienciade1.
En los grafos dirigidos, es un problema bastante comn que un determinado enlace no sea
identificable.Puntualmenteenestecasoningunodelosenlacesescalculable,ylosenlacesvirtuales
quedancomoenlafigura1.3.4.
7
Captulo 1 Introduccin
Figura1.3.4.Enlacesvirtualesenungrafodirigido.
1.4. Problemas inherentes
Algunosdelosproblemasinherentesydecisionesatomaralahoradedisearunmtodopara
llevaracabolatomografadeunaredson:
Escalabilidad
Siunaredesmuygrande,entonceslacantidaddemedicionesquesedebenllevaracaboser
muygrande.Porlotanto,sedebevigilarelordendelacantidaddemedicionesahacer.
Algosimilarocurre,aunquegeneralmenteenmenormedida,conlosclculosnecesariospara
transformarlasmedicionesobtenidaseninformacintil(porejemplo,transformarlosdatosdelas
medicionesexternaseninformacinsobrelosenlacesinternos).Porlotanto,tambinsedebevigilar
elordendeestosalgoritmos.
Precisin
Cuantomayorsealaprecisinquesebusca,mayoreslacantidaddemedicionesquesedeben
hacer.Peroestonoeslineal:avecessacrificandomnimamentealaprecisin,sepuedehacerun
8
Captulo 1 Introduccin
ahorroenormeenlacantidaddemediciones.Einclusoesteconceptosepuedellevarmsall:con
una muy pequea cantidad de mediciones se puede obtener una medida poco precisa, pero muy
rpida.
Distribucin de las mediciones
Entodalared,solamentesepuedencontrolaraunospocosnodos.Esdesdeesospocosnodos
que se pueden hacer las medidas. Dados los nodos controlables, debe investigarse qu medidas
puedenhacersedesdecadaunodeellos,yluego,mirandolaredensuconjunto,debedecidirsequ
medidasefectivamenteseharndesdecadaunodeellos.
Distribucin de los clculos
Los algoritmos son de elevada complejidad, y hacen un uso extensivo de la memoria. Es
necesariodecidirsilosclculosseharnencadanodooenformacentralizada.Esdeseablequelos
algoritmosresponsablesdehacerlosclculosseanporlomenosmedianamenteparalelizables.
Simetra de los enlaces
Alahorademodelizarlared,sedebedecidirsilosenlacesseconsideransimtricos(esdecir,
quetienenidnticaspropiedadesenambossentidos)ono.Estotraeacolacindoscuestiones:
Porunlado,trataralosenlacescomosimtricospuedeparecerevidente,porque,porejemplo,
uncablenormalmentetienelasmismaspropiedadesenunsentidoqueenotro.Sinembargo,enun
determinadomomentopuedeestarfluyendomsinformacinenunsentidoqueenotro,yentoncesla
asimetradelacongestinpuedecausarasimetraenlademora.Consecuentemente,consideraralos
enlacescomoasimtricospermitedesarrollarunmodelomsconsistenteconrespectoalarealidad.
Porotrolado,alconsideraralosenlacescomoasimtricos,sedebenusargrafosdirigidos,y
tanto la matemtica como la diversidad de particularidades que pueden ocurrir y los tiempos de
procesamientosetornannotablementemscomplejos.
Aprovechamiento de mediciones existentes
Avecesnosepuedeelegirqumedidastomar,debidoaquelasmedidasyafuerontomadasy
nosepuedenrealizarnuevasobservaciones.Enestecasoelproblemaconsisteenaprovecharloms
posiblelasmedidasconlasquesecuenta.
9
Captulo 1 Introduccin
Identificacin de los enlaces no medibles
Muchos enlaces no pueden ser medidos individualmente, y deben ser agrupados
correctamenteparaposibilitarsumedicinenconjunto.Juntarenexcesoreducelaprofundidaddel
conocimientoperoaceleralosprocedimientos.
Entonceslascuestionesquedebenatenderseson:
identificarlosenlacesquesepuedenmedirindividualmente.
con respecto al resto, determinar cmo agruparlos para posibilitar su medicin en
conjunto.
determinar en qu grado se van a juntar enlaces que de todas maneras son
identificables individualmente, con el objeto de acelerar los clculos (y a costa de
perderunpocodegranularidad).
Delimitacin de la tomografa
Lainformacinqueseobtieneacercadelared,siempreesunamuypequeapartedelaque
existe realmente. Siempre es posible aprender ms acerca de una red. Pero, como en el caso de
Internet,eltamaodelaredestangrandequesituviramoslapolticadeaprendertodoloposible
entonceselprocesosetornaraenvariossentidos(porejemplo,computacionalmente)inviable.
Esnecesario,entonces,decidirculeslainformacinquesedeseaobtener.Estonoestrivial:
significadecidirqupartesdelaredsedeseainvestigar,yculessonlascaractersticasaobservaren
esaspartes.Enotraspalabras,definirunconjuntodepolticasquepermitanponerleunlmitealos
algoritmos.
Tomografa activa o pasiva
Cuandosellevaacabounatomografaactiva,sehacenpruebasyseanalizanlosresultados.
Estointroducetrficoadicionalenlared,quepuedeafectarlacomoseexplicenlaseccin1.1.
La alternativa es hacer una tomografa pasiva, en la cual simplemente se analiza la
informacingeneradaporelfuncionamientohabitualdelared,sinintroducirtrficoadicional.Esta
modalidadesmenosinvasivaperoseobtienenresultadosmuchomslentamente.
Unicast o Multicast
Cuandolatomografaesactiva,hayquedecidirsiimplementarunmtodounicastomulticast.
10
Captulo 1 Introduccin
Unmtodounicastconsisteenenviarcadapaquetedepruebaaunreceptor.Lamodalidadmulticast
consisteenenviarcopiasdecadapaqueteavariosreceptoressimultneamente.
Duracin
Alolargodeltiempo,lasrutasentrenodosvancambiando.Esnecesarioquelatomografasea
losuficientementerpidacomonosermuyafectadaporlainestabilidaddelasrutas.
Adems,yporlamismarazn,cabeanalizardurantecuntotiemposepuedeesperarqueel
resultadodeunatomografasigasiendovlido.[Zhang00,Zhang01]
11
Captulo 1 Introduccin
12
2. ESTADO DEL ARTE
Enestecaptulosepresentaunadescripcindelasituacinactualdelamateria,basadaenla
revisin de la literatura existente hasta el momento (Mayo 2007) y el anlisis de los principales
proyectosactivosactualmente.
En la seccin 2.1 se incluyen los trabajos que se ocupan del problema de estudiar las
caractersticas internas (ver captulo 1) de una red cualquiera. La mayora de ellos lleva a cabo
experimentosenInternet,perosuprincipalaportenoesconocimientosobreInternetens,sinosobre
lastcnicasdeestudiodelascaractersticasinternasdeunared.
Enlaseccin2.2sepresentanproyectosactualesdemapeodeInternet,esdecir,aquellosque
secentranenestudiarslolatopologa(envezdetodaslascaractersticasinternas),ynodeunared
cualquierasinodeInternetenespecial.
Enresumen:
Seccin Trabajosqueestudian Red
2.1.Tomografadelared lascaractersticasinternas cualquiera
2.2.ProyectosdemapeodeInternet slolatopologa Internet
Enlaseccin2.3sedescribenbrevementealgunosproblemasabiertosquesurgendelanlisis
delestadodelarte.
2.1. Tomografa de la red
En esta seccin se presentan los trabajos ms actuales y representativos de varias lneas de
investigacinactivasdelamateria.
Seleccin de las rutas a monitorear
Comoseindicenelcaptuloanterior,dadosnnodoscontrolables,lacantidadderutasentre
13
Captulo 2 Estado del arte
ellosesn(n1),esdecir,O(n
2
)

,porquesetratadeungrafocompleto(todoscontodos).Elresultado
n(n1)sededucefcilmenteteniendoencuentaquecadaunodelosnnodosseconectaconelresto,
quesonn1.Elgrafocompletode5nodosseilustraenlafigura2.1.1,ytiene 54=20 aristas(en
lafigurasemuestranslo10,peroenrealidadson20porquesonbidireccionales).Enelpeorcaso
posible,lasrutasnocompartenenlaces,conlocualsetienentambinO(n
2
)incgnitas.Inicialmente,
lastcnicasdetomografadelaredsebasabanenestecasogeneral,esdecir,medantodaslasO(n
2
)
rutas.
Figura2.1.1.Grafocompletode5nodos.
Elcasoopuestoaldeungrafocompleto,siempreconsiderandografosconexos,eseldeun
rbol.Unrbolesungrafoconexoyacclico(nocontieneciclos,o,equivalentemente,hayunasola
formaposibledellegardeundeterminadonodoaotro).Silaredden nodoscontrolablesfueraun
rbol,entonceslacantidaddeenlacesseran1,esdecir,O(n).Elresultadon1sededucefcilmente
porinduccindelasiguientemanera:ungrafoconexoyacclicode2nodosconsisteenlos2nodos
unidosporunenlace(lacantidaddeenlaceses1=21);lanicaformadeagregarunnuevonodoy
queelgrafosigasiendoconexoyacclicoesagregandounenlacequeunaelnuevonodoalrbol
(luegolacantidaddeenlaceses2=31);elrazonamientoesanlogoparaagregaruncuartonodo
(quedan3=41enlaces)yassucesivamente.Unrbolcon5nodosseilustraenlafigura2.1.2.
Figura2.1.2.Unrbolde5nodos.
Esta notacin significa que la cantidad de operaciones requeridas para llevar a cabo el
procedimiento es a lo sumo kn
2
, donde k es una constante arbitraria.
14
Captulo 2 Estado del arte
Tpicamente, muchos enlaces se comparten entre las rutas, y entonces la cantidad real de
incgnitas es mucho menor que O(n
2
) como en el caso del grafo completo. Chen, Bindel et al.
[Chen03,Chen04]proponenmedirsolamenteunacantidadderutascoincidenteconelrangodela
matrizderuteo,esdecir,descartarlasrutaslinealmentedependientes.Losautoresconjeturanquede
esemodo,lacantidadderutasamediresO(nlogn),locualesunresultadointermedioentremedir
todaslasrutasposibles,esdecir,O(n
2
),yunrbol,quetieneO(n).Laverosimilituddeesteresultado
seponeapruebamedianteanlisisderegresinlinealenredessimuladasyreales.
Los autores tambin desarrollan el algoritmo 2.1.1. El mismo sirve para elegir las rutas a
medir, y se basa en tcnicas de descomposicin reveladoras del rango

. Puntualmente est
implementado con una variante de la descomposicin QR con pivoteo, donde Q tiene columnas
ortonormalesyRestriangularsuperior.Eneldetalledelalgoritmo,lamatrizRdeladescomposicin
sedenotaconlaletraA,paraevitarambigedadconlanotacindelamatrizderuteo.
Entrada:
R lamatrizderuteo
Salida:
R
S
lamatrizconlasrutasseleccionadas
1 ParacadafilavdeR
2

A
12
=A
T
R
S
v
T
=Q
T
v
T
3

A
22
=v
2

A
12

2
4 Si

A
22
0
5 Seleccionarvcomorutaamedir
6 A=
[
A

A
12
0

A
22
]
7 R
S
=
[
R
S
v
]
Algoritmo2.1.1.Seleccinderutasamonitorear.
Enelalgoritmo,seanalizanlasfilasdelamatrizderuteoapriori(ciclodelalnea1),ysevan
colocandoenlamatrizderuteoaposteriori(lnea7)aquellasquesonlinealmenteindependientesde
lasqueyafueronagregadas(lneas2a4).Luegodelaejecucindelalgoritmo,R
S
esunamatrizcuyas
Es decir, formas de descomponer una matriz (en este caso factorizarla como el producto Q.R)
que permiten inferir en forma directa el rango de la matriz.
15
Captulo 2 Estado del arte
filassonunsubconjuntodelasfilasdeRysonlinealmenteindependientes.LacantidaddefilasdeR
S
coincideconelrangodeR,conlocualelresultadofinalpodraenunciarsesimplementecomo:Se
tomala matrizde ruteo yseseleccionandeellatantasfilaslinealmenteindependientescomosea
posible.
Lacomplejidaddelalgoritmo2.1.1esO(rk
2
),dondereslacantidadtotalderutasykelrango
delamatrizderuteoR.
Posteriormente, Chua et al. [Chua05] muestran que se puede medir una cantidad de rutas
muchomenor,sinsacrificarexcesivamentelaprecisin.Proporcionanunalgoritmoparallevarloa
caboeligiendounacantidadarbitrariaderutasamedir,ycalculanelerrorenlaestimacin.
Elprocedimientosebasaenladescomposicinenvaloressingulares

delamatrizderuteo,
queconsisteenescribirlacomoproductode3matrices:R=UDV
H
,dondeUyVsonunitariasy
tienencolumnasortonormalesyD esunamatrizdiagonalquecontienelosvaloressingularesdeR
(V
H
significaconjugadatranspuesta

deV).
Losvaloressingularesseordenandemayoramenor,conformandoasloquesedenomina
espectro delamatrizderuteo.Lacantidadconvenientederutasamonitorearsepuedeobtenerdel
anlisisdelespectro,enelcualselocalizansaltossignificativos.Porejemplo,enlaredAbilenede
Internet2[Abilene](verfigura2.1.3),losvaloressingularesordenadosquedancomoseveenlafigura
2.1.4,dondesepuedeapreciarelgransaltoluegodelsegundovalorsingular,loquesugierequese
puedeobtenermuchainformacinsobrelaredmonitoreandosolamente2rutas.
Los valores singulares de una matriz M son aquellos nmeros reales no negativos s para los
cuales existen vectores unitarios u y v tales que M v = s u y M
H
u = s v.
Los valores singulares guardan estrecha relacin con los autovalores, ya que los cuadrados de
los valores singulares no nulos de M coinciden con los autovalores no nulos de M
H
M MM
H
.
M
H
significa conjugada transpuesta de M (ver nota al pie sobre conjugada transpuesta).
Conjugada transpuesta de V: esto significa que se transpone la matriz V y sus elementos se
reemplazan por sus conjugados. Es decir:
V
H
=V
T
=V
T
(porque en los espacios de Hilbert
no importa el orden en que se realizan las operaciones).
De todas maneras, en lo que respecta a este trabajo, la matriz V siempre est compuesta por
coeficientes reales.
16
Captulo 2 Estado del arte
Figura2.1.3.LaredAbilene.
Figuratomadade[Abilene].
Figura2.1.4.EspectrodelaredAbilene.
Figuratomadade[Chua05].
LacantidadderutasamonitorearsesiguedenominandokcomoenlostrabajosdeChenetal.
LadiferenciaesqueenlostrabajosdeChenetal.,kcoincidaconelrangodelamatrizderuteoR,
mientrasqueeltrabajodeChuaetal.permiteutilizarvaloresmspequeosdek(esdecir,monitorear
menosrutas).
Elvalordekautilizar,esdecir,lacantidadderutasqueefectivamentesevanamonitorear,se
decidenormalmenteenbasealamatrizD,quecontienelosvaloressingulares,perotambinpuede
tomarsedirectamentecomoparmetrosiexistenotrasrestricciones,porejemploenelcasodequese
decidanomedirmsdeunadeterminadacantidadderutas.
Fijadoelvalordek,hayqueelegirlask rutasamonitorear.Encontrarelconjuntodelask
rutas que minimicen en forma exacta el error en la estimacin implicara probar todos los
subconjuntos posibles de k filas de la matriz R, procedimiento que constituye un problema NP
17
Captulo 2 Estado del arte
completo

.Debidoaesto,losautoresutilizanunaheursticaquesedetallaenelalgoritmo2.1.2,yque
sebasaenintentaraproximarlasprimeraskdimensionessingulares,medianteunamatrizquealavez
estbiencondicionada

.LaskfilasseleccionadassealmacenanenlamatrizR
S
.
La complejidad delalgoritmo 2.1.2 es O(r
2
e),donde r eslacantidadderutas(esdecir,la
cantidad de filas de la matriz de ruteo R) y e es lacantidaddeenlaces(es decir, lacantidadde
columnas de la matriz de ruteo R). La complejidad del algoritmo est dominada por la
descomposicinenvaloressingulares,yaquelacomplejidaddeladescomposicinQRconpivoteoes
O(k
2
r).
Entrada:
R lamatrizderuteo
k lacantidadderutasamonitorear(opcional)
Salida:
R
S
lamatrizconlasrutasseleccionadas
1 (U,D,V) Descomposicinde Renvaloressingulares
2 Siknosediocomoparmetro,decidirloenbaseaD
3 U
k
Tomarlas kprimerascolumnasdeU
4 U
k
T
Transponer U
k
5 P
k
ObtenermatrizdepermutacinQRde U
k
T
6 P
k
T
Transponer P
k
7 P
k
R P
k
R
8 R
S
Tomarlas kprimerasfilasdeP
k
R
Algoritmo2.1.2.Seleccindelasrutasamonitorear.
Elobjetivoes,comosiempre,calcularelvalordeunadeterminadamtrica(porejemplo,la
demora)enlosenlaces,apartirdelosvaloresobservadosdelamtricaenlasrutas.Enelalgoritmo
2.1.3,lasvariablesx ey representanlosvaloresdelamtricamedidaenlosenlacesyenlasrutas
respectivamente.Comosedetallenelcaptulo1,lasrutassonagregacionesdeenlaces(porejemplo,
lademoraenunarutaeslasumadelasdemorasenlosenlacesquelacomponen),yporlotantohay
unarelacinlinealentrexeydadaporloquesedioenllamarmatrizderuteo,esdecir,R.Larelacin
lineales,desdeluego,Rx=y.
Los problemas NP (Nondeterministic Polynomial-time) son aquellos en los que la nica forma
de determinar todas las instancias positivas (es decir aquellas que cumplen alguna propiedad)
es verificar todas las instancias posibles. Contrariamente, en los problemas P (deterministic
Polynomial-time) se pueden encontrar todas las instancias positivas en tiempo polinomial.
Finalmente, un problema NP-completo es aquel que es NP y tal que cualquier problema NP
puede reducirse a l [Aaronson].
Que la matriz est bien condicionada garantiza que el sistema lineal resultante podr
resolverse digitalmente con un error numrico razonable.
18
Captulo 2 Estado del arte
Elalgoritmo2.1.3sirveparaobtenerx
m
,elvectorconlasestimacionesdelosvaloresdela
mtricaenlosenlacesapartirdey
S
,elvectorconlosvaloresobservadosdelamtricaenlasrutas
monitoreadas.Elvectorx
m
seobtieneresolviendoelsistemalinealR
S
x
m
=y
S
.ComolamatrizR
S
noes
cuadrada,noesinversible,yentoncessenecesitautilizarunapseudoinversa

.Losautoresproponen
usarlapseudoinversadeMoorePenrose(quetienecomoefectoasignarleunceroalosenlacesque
noaparecenenningunadelasrutasmonitoreadas)perotambinpodranutilizarseotras.
Una vez obtenidas las estimaciones de los valores de la mtrica en los enlaces, se puede
predecirelvalordelamtricaenlasrutasnomonitoreadascalculandoy
m
=Rx
m
.
Entrada:
R lamatrizderuteo
R
S
lamatrizconlasrutasseleccionadas
y
S
lasmedicionescorrespondientesalasrutas
seleccionadas
Salida:
x
m
lasestimacionesdelosvaloresdelamtricaen
losenlaces
y
m
losvaloresdelamtricaenlasrutas,incluyendo
lasestimacionesdelasnomonitoreadas
1 R
s
+
CalcularlapseudoinversaMoorePenrosede R
2 x
m
R
s
+
y
s
3 y
m
Rx
m
Algoritmo2.1.3.Estimacindelasdemorasenlosenlaces
yprediccinparalasrutasnomonitoreadas.
Lacomplejidaddelalgoritmo2.1.3estdominadaporelclculodelapseudoinversaR
s
+
yes
O(e
2
k). Por lo tanto, si se aplican en serie los algoritmos 2.1.2 y 2.1.3, la complejidad total es
dominadaporelprimeralgoritmoyconsecuentementeesO(r
2
e).
Continuandoconlalneade[Chen03,Chen04],Zhaoetal.[Zhao05,Zhao06]desarrollanun
mtodoparamedirpropiedadesanivelenlaceconelmenorsesgoposible.Definenelconceptode
La inversa de una matriz A es una matriz A
-1
tal que A A
-1
= I. La matriz inversa A
-1
existe
solamente si la matriz A es cuadrada y no tiene deficiencia en el rango (el rango es igual a la
cantidad de filas). Esto es lo que que conoce como matriz inversible o no singular. El sistema
lineal Ax = y se puede resolver mediante la inversa de A calculando x = A
-1
y.
Pero cuando la matriz no cumple con las propiedades mencionadas su inversa no existe. En ese
caso, el vector incgnita x se puede obtener mediante una versin generalizada de la inversa,
llamada pseudo-inversa, calculando x = A
+
y, donde A
+
es la pseudo-inversa. La pseudo-inversa
de Moore-Penrose es la que cumple: A
+
= (A
T
A)
-1
A
T
.
19
Captulo 2 Estado del arte
MILS(minimalidentifiablelinksequence)consistenteenunconjuntoconsecutivodeenlacescondos
propiedadesfundamentales:
Esidentificable:quieredecirquepuedesercalculadoindividualmente.
Esmnimo:siselequitaraalgnenlacedejaradeseridentificable.
PorquutilizarlosMILSesreduceelsesgodelaestimacin?
Normalmentehaymsrutasqueenlaces,conlocuallamatrizderuteotpicamentetienems
filas que columnas, y entonces hay ms ecuaciones que incgnitas. Sin embargo, muchas de las
ecuacionessonlinealmentedependientes,yengenerallamatrizderuteotienerangodeficiente(es
decir, que la cantidad de ecuaciones linealmente independientes es menor que la cantidad de
incgnitas).
Estosignificaqueelsistemaresultaindeterminado,conlocualnotieneunanicasolucin.A
lahoradehacerelclculo,seeligeunasolucinenespecial,yesointroduceunsesgo[Zhao06]enla
estimacin.
Nosepuedehacerunaestimacincompletamenteinsesgada,porquealgunashiptesisquese
utilizan(comolaindependenciaentrelasdemorasenlosenlaces)tambinsesganlaestimacin.Pero
esto,almenosenelmodeloalgebraico,esinevitable.
Sinembargo,elsesgointroducidoporelhechodequeelsistemaesindeterminadopuedeser
eliminadotransformandoelsistemadeformatalquelamatriznopresenterangodeficiente,esdecir,
quelacantidaddeecuacioneslinealmenteindependientesseaigualalacantidaddeincgnitas.Yeso
esloqueselograrepresentandolasrutasentrminosdelosMILSesenvezdelosenlacesfsicos.
El estudio de [Zhao05] y [Zhao06] se centra en grafos no dirigidos, y se proporciona un
algoritmoparaladeterminacindelosMILSes.Elalgoritmo(veralgoritmo2.1.4)sebasaenanalizar
unaporunalasrutasdelamatriz(ciclodelalnea1)yverificarexhaustivamentelaidentificabilidad
decadaconjuntoconsecutivodeenlacesposible(ciclodelalnea5),demscortoamslargo(ciclo
delalnea4),mediantelacomparacindelanorma(lnea8)delconjuntoconlanormadelproducto
entreelconjuntoyunamatrizconteniendounabaseortonormal,quedebesercalculadapreviamente.
ElcostodecalcularlamatrizesO(rk
2
),dondereslacantidadtotalderutasykelrangodela
matriz.LacomplejidaddelalgoritmoesO(rkl
3
),dondel eslacantidadmximadeenlacesenuna
ruta. Indican que medianteprogramacin dinmicalacomplejidaddelalgoritmosepuedebajara
O(rkl
2
).Finalmente,manifiestanquelaprecisinquesepierdebuscandolosMILSesenlaskrutasa
monitorearenvezdeenlasrrutasquehayenlamatrizespequea,ydeesaformalacomplejidades
O(k
2
l
2
).
Comoseaclarmsarriba,elestudiosecentraengrafosnodirigidos.Alaplicarelalgoritmo
alcasodelosgrafosdirigidos,losautoresconcluyenqueenesecasolosMILSescoincidenconlas
rutas entre los nodos controlables. Es decir, que en un grafo dirigido, los enlaces virtuales
identificablesmnimossonlasrutascompletas.
20
Captulo 2 Estado del arte
Entrada:
R lamatrizderuteo
Q lamatrizquecontieneunabaseortonormal
Salida:
M elconjuntodeMILSes
1 Paracadarutar
2 Crearunvectorbooleanomconlongitud(r)posiciones
3 Inicializarenfalsotodaslasposicionesdem
4 Paraidesde1hastalongitud(r)
5 ParacadasubrutaposibleS=r
a
..r
b
talquelongitud(S)=i
6 Sim
a
esfalso
7 veselvectorcorrespondienteaS
8 Si||Q
T
v||=||v||
9 m
a
esverdadero
10 SesunMILS;agregarloaM
11 Sino
12 SnoesunMILS
Algoritmo2.1.4.BsquedadetodoslosMILSesenungrafonodirigido.
Puntualmenteparaelclculodelasprobabilidadesdeprdidasenlosenlaces,proponenun
mtodoquedenominanmtododelasbuenasrutasysebasaenelhechodequesiunarutatiene
muy poca prdida entonces la probabilidad de prdida en los enlaces que la componen es
despreciable.
Tcnicas que utilizan ICMP

Otragran familiade tcnicaseslaquehaceusodelprotocoloICMP.Habitualmente estas


tcnicassebasanenlosmensajesICMPtimestamp.Eltimestampeselmensajenmero13deICMPy
seutilizaparaqueunnodopuedaaveriguarquhoraessegnelrelojdeotronodo.Comoseverms
adelante,estoestilalahoradesincronizaryefectuarmediciones.
ICMP: Internet control message protocol.
Protocolo de Mensajes de Control para Internet.
El mismo se detalla en la RFC 792 [RFC792].
21
Captulo 2 Estado del arte
bits
offset 03 47 815 1618 1931
0 versin longituddel
encabezado
tipodeservicio
(0)
longitudtotal
32 identificacin flags offsetdel
fragmento
64 TTL(verseccin2.2) protocolo
(versinde
ICMP)
checksumdelencabezadoIP
96 direccindeorigen
128 direccindedestino
160 tipo(13) cdigo(0) checksumdelencabezado
192 identificador nmerodesecuencia
224 timestampdeorigen
Figura2.1.5.PaqueteIP(encabezadoengrisclaro)conteniendounpaqueteICMP(encabezadoen
grisintermedio)queasuvezllevaunmensajetimestamp(cuyodatosemuestraengrisoscuro).
ElpaqueteenelcualseenvaunmensajeICMPtimestamptienelaestructuraqueseveenla
figura2.1.5.EnlamismasepuedeapreciarunpaqueteIPdentrodelcualseubicaunpaqueteICMP
queasuvezllevaelmensajetimestampens.
LaparteindicadaengrisclaroeselencabezadoIP.
LaparteindicadaengrisintermedioeselencabezadoICMP.Eltiposedebefijaren13yel
cdigo es0.Elidentificadoryelnmerodesecuenciasirvenparapoderdeterminaraqupedido
correspondecadarespuesta.
Laparteindicadaengrisoscuroeselmensajetimestamp.Enelmensajedepedido,seenva
simplementeeltimestamp correspondientealmomentoenelqueseenvaelmensaje,expresadoen
milisegundostranscurridosdesdelamedianochedel1
ro
deenerode1970.
Enlarespuesta(verfigura2.1.6)sedebefijareltipoen14yrepetirlosmismosidentificadory
nmerodesecuencia.Seenvan3timestamps:
timestampdeorigen:elmismotimestampcontenidoenelpedido.Esdecir,elmomentoen
queelemisorenvaelpedido,segnelrelojdelemisor.
timestampderecepcin:elmomentoenqueelreceptorrecibeelmensaje,segnelreloj
delreceptor.
timestampderespuesta:elmomentoenqueelreceptorenvalarespuesta,segnelreloj
22
Captulo 2 Estado del arte
delreceptor.
bits
offset 03 47 815 1618 1931
160 tipo(14) cdigo(0) checksumdelencabezado
192 identificador nmerodesecuencia
224 timestampdeorigen
256 timestampderecepcin
288 timestampderespuesta
Figura2.1.6.PaqueteICMPconteniendounarespuestatimestamp.
Los trabajos citados hasta ahora en esta seccin desestiman el uso de paquetes ICMP por
considerar que no es confiable depender de que los ruteadores los soporten. Sin embargo,
Anagnostakisetal.[Anagnostakis03]presentanevidenciaquesugierequeel94%delosruteadores
soporta ICMPtimestamp. Deacuerdoasusresultados,el37%delasrutasestconstituido ensu
totalidad por nodos que soportan ICMP timestamp, y el resto tiene nodos intermedios que no lo
soportan.
Sumetodologasebasaenelsiguientehecho:sialtrabajarconlarutaAC(entrelosnodosAy
C)sepuedeencontrarunruteadorintermedioBquesoporteICMPtimestamp,entonceslasubrutaBC
sepuedemedircomoACAB.Eltiempodeesperaencoladelospaquetesnoconstituyeunproblema
porque si se toman varias mediciones entonces el mnimo de esas mediciones tiene una alta
probabilidaddecorresponderaunamedicinquenosufriesperaencola.
Posteriormente,Mahajanetal.[Mahajan03]estudianelproblemadeunusuariosinprivilegios
quenecesitaestudiareldesempeodelaredenunarutadeterminada.SevalendelusodeICMP
timestampydetenerencuentaelIPIDdelosruteadores.Proponenademsunaseriedemejorasa
Internetparahacerlamsfcildediagnosticar.
LaprimeracrticaaestosltimostrabajosesqueelsoportedeICMP nonecesariamentees
alto,ydehechopuedebajaracausadenuevaspolticasdeseguridadyprivacidad.Otracrticaesque
estnorientadosalestudiodeunanicaruta,yconsecuentementenoescalanbiencuandosequiere
medirmuchasrutas,comoenelcasodelatomografadeunared.
23
Captulo 2 Estado del arte
Simplificacin de la topologa y uso de paquetes back-to-back

Rabbatetal.[Rabbat04]proponenenviarpaquetesdesdevariasfuentesavariosdestinos,y
descubrirlatopologaalmismotiempoqueseobtienenlasmediciones.Conrespectoalainferencia
delatopologa,proponenhacerunasimplificacinynoestudiartodoslosnodosintermedios,sino
basarseenaquellosenloscualessejuntanlospaquetesquevanaunmismodestino(joiningpoints)o
seseparanlosquesalendeunmismoorigen(branchingpoints).
Explicanademsquelainformacinsobretodalaredsepuedereconstruirapartirdelestudio
depequeosproblemasconslo2fuentesy2destinos.Enelproblemade2fuentesy2destinos,la
cantidaddenodosintermediosquedareducidaaunmximode4,comoseveenlafigura2.1.7.Enla
misma,losnodos1y2sonorigenylosnodos3y4sondestino.Sepuedenapreciarlosjoiningpoints
(J3,J4)delosnodosdedestinoylosbranchingpoints(B1,B2)delosnodosdeorigen.Lacantidad
denodospuedesermenor,enelcasodequealgunodelosnodosintermedioscumplamsdeunode
losrolesmencionados.
Seutilizanpaquetesbacktoback,ysesacanconclusionesenbasealordenenquelleganlos
paquetesalosdestinos.Setomaporhiptesisqueelordendelospaquetesnosufrealteraciones.Pero
elenfoqueseveafectadoporelhechodequeaveceslosruteadoresalteranelordendelospaquetes
quepasanporellos.Laprobabilidaddereordenamientoesmenorcuantomsseparadoseneltiempo
viajenlospaquetes,peropuedeseraltaenelcasodequelospaquetesviajenbacktoback.
Figura2.1.7.Simplificacindelatopologaintermediaentre2nodosorigeny2nodosdestino.
Estafiguraestbasadaenlafigura1de[Rabbat04].
Los paquetes son back-to-back (traduccin: espalda con espalda) cuando se envan uno a
continuacin del otro (con la mnima demora intermedia posible) de modo tal que haya alta
probabilidad de que ambos experimenten los mismos fenmenos, como por ejemplo esperas
en colas.
24
Captulo 2 Estado del arte
2.2. Proyectos de mapeo de Internet
EnestaseccinsedescribenproyectosquesecentranenelestudiodelatopologadeInternet.
Como comparacin con la seccinanterior,cabedestacarquelaseccinanteriorseocupa de los
trabajosorientadosaestudiarlascaractersticasinternasdeunaredcualquiera.
En relacin al tema del trazado del mapa de Internet, es necesario mencionar al proyecto
NetDimes[Dimes].EsteproyectoestdedicadoalestudiodelaestructuraylatopologadeInternet
mediantemedicionesquesehacenenformadistribuida.
Las herramientas bsicas empleadas en las mediciones son traceroute

y ping

. Ambas
permiten medir las demoras, pero traceroute consume muchos ms recursos en la red porque la
cantidaddemensajesquerequiereescuadrticaconlalongituddelaruta,mientrasquelacantidadde
mensajesrequeridosporpingeslineal.
Poresaraznseutilizaping paramedirlasdemoras,ytraceroute (enbajafrecuencia)para
descubrirlasrutas[Shavitt04].
Los traceroute se hacen en baja frecuencia principalmente por dos motivos. Elprimeroes
evitar la carga excesiva de la red. El segundo es intentar evitar disparar potenciales alarmas de
seguridadquepuedenactivarseantecantidadessignificativasdedeterminadostiposdepedidos.
Los datos son aportados por los clientes instalados en las computadoras de ms de 8000
voluntariosubicadosencasitodoslospasesdelmundo.Actualmente[Carmi06]esosdatosseestn
usandoparaestudiar,entreotrascosas,laestructuradelossistemasautnomos.
Unodelosproblemasalahoradedescubrirlatopologatrazandorutasesquelosruteadores
respondencondiferentesdireccionesIPensusdiferentesinterfaces.Porejemplo,enlafigura2.2.1,se
veelcasodeunruteadorquetieneasignadalaIP2 enlainterfazconectadaalaredquelouneal
nodoA,ylaIP3enlainterfazconectadaalaredquelounealnodoB.
traceroute: aplicacin que sirve para descubrir la ruta que sigue un paquete entre dos nodos
de una red IP. Se basa en un parmetro denominado TTL (time to live, tiempo a vivir) el
cual es decrementado por cada nodo por el que pasa el paquete. El nodo en el cual el TTL se
agota lo elimina y enva un mensaje al origen (ICMP timeexceed). De esta manera, y enviando
paquetes con distintos TTL, el origen puede ir recibiendo respuestas del primer nodo de la
ruta, del segundo, etc. y as descubrir la ruta. Por cada valor del TTL se hacen habitualmente 3
pruebas.
ping: aplicacin que sirve para determinar si existe una ruta hasta un determinado nodo, y en
caso afirmativo obtener el RTT (roundtrip time, tiempo de ida y vuelta) hasta y desde el
nodo en cuestin.
Se implementa en base a los mensajes ICMP tipos 8 (echo request) y 0 (echo reply). Ver
[RFC792].
25
Captulo 2 Estado del arte
Figura2.2.1.RuteadorcondistintasdireccionesIPensusdistintasinterfaces.
CuandosetrazalarutadeAaB,seobtiene124ycuandosetrazalarutadeBaA,se
obtiene431.Estopuedecausarquelaredsemodeleerrneamentecomoseveenlafigura2.2.2.
Figura2.2.2.Unnicoruteadormodeladoerrneamentecomo2nodosdistintos.
Una posible solucin a este problema se plantea en [Govindan00] y consiste en utilizar
paquetes UDP

enviadosaladireccinIP delruteadorparapuertosquenoexistenycompararla
direccin a la que fue enviado el paquete UDP con la direccin de origen de la correspondiente
respuestaICMPdestinationunreachable

.
Enelejemplodelafigura2.2.2,elnodoApuedeenviarelpaqueteUDP alruteadorala
direccinIP2,ycuandoelruteadorconteste,loharponiendocomoorigenladireccinIP3,quees
laquecorrespondealospaquetesqueseenvanhaciaA.Deestemodo,elnodoApuedesaberquelas
direccionesIP2y3correspondenalmismoruteador.
EnestetrabajotambinseemplearndatosdelproyectoCAIDA[Caida],quepromuevela
cooperacin de sectores comerciales, gubernamentales y educativos para el estudio de las
UDP: User datagram protocol
Protocolo de datagrama de usuario.
Su principal diferencia con TCP es que no es orientado a la conexin.
Mensaje ICMP nmero 3, que se usa para indicar que no existe ruta hacia un nodo, o bien,
como en este caso, que el puerto no est abierto. [RFC792]
26
Captulo 2 Estado del arte
caractersticasdeInternetconelobjetivodemejorarsufuncionamientoyescalabilidad.
Los datos se CAIDA que se emplean en este trabajo se obtuvieron mediante una de sus
herramientas,denominadaskitter,quetiene3objetivosfundamentales:
Estudiarsaltoporsaltolasrutasdesdeelorigenhaciaunagrancantidaddedestinos.Esto
seexplicaenmayorniveldedetallemsadelante.
Detectarcambiosenelruteo.EstosehacemidiendoelRTThacialosdestinos,porqueun
cambiomuygrandeenelRTTpuedeindicar,porejemplo,queelcaminodevueltayano
esel mismo.Se intentadescubrirqucambiosenelruteosonhabituales,por ejemplo
investigandolacorrelacinentreloscambiosylosmomentosdelda.
EstudiarlaconectividadaInternetdesdeundeterminadoorigen.Estollevaaltrazadode
mapascomoelqueseveenlafigura2.2.3.
Figura2.2.3.Mapatrazadocondatosobtenidosmedianteskitter.Sepuedevisualizarlaconectividad
desde204.70.1.197.Figuratomadade[Caida].
Laaplicacinskitter determinalasrutasunidireccionalesdesdesulugardeinstalacinhacia
nodos remotos de la red. Muchos de los ruteadores intermedios descartan paquetes sin enviar el
ICMPtimeexceed.Poresoelcriterioqueadoptaskitteresconsiderarcomoelnsimonododelaruta
alruteadorquecontesteacausadelospaquetesenviadoscontimetoliveigualan.
27
Captulo 2 Estado del arte
Otrodelosproblemasalosqueseenfrentaunaherramientacomoskittereselconflictoentre
dosdesusintereses:
Porunlado,eltiempoentotalquesetardaenestudiarporcompletocadarutanopuede
ser excesivamente largo, porque de lo contrario el resultado no sera la fotografa
instantneaquesepretendeobtener.
Porotrolado,paraserverdaderamentetilcomoherramientademapeodeInternet,se
necesitapoderestudiarmuchasrutasenpocotiempo.
Enlafigura2.2.4seveelformatodelospaquetesutilizadosporskitter.
Figura2.2.4.Formatodelospaquetesenviadosporskitter.Figuratomadade[Caida].
2.3. Problemas abiertos
Enlasprimerasdosseccionesdeestecaptulosedescribilasituacinactualdelamateria.
Se describieron las soluciones existentes hasta el momento para problemas como el
descubrimientodelatopologa,laminimizacindelsesgoenlaestimacinyladeterminacindelos
enlacesmedibles.
Seindicasimismolacomplejidaddelosalgoritmosutilizados,debidoaquelastcnicasa
emplear deben ser escalables. Esdecir,debenserrealizablesyrazonablesdesdeelpuntodevista
computacional.
De lo expuesto surge un problema que es sumamente interesante, porque su solucin
implicaraungranavanceenlamateria.Elproblemaencuestinesintentaralcanzarsimultneamente
28
Captulo 2 Estado del arte
lossiguientesobjetivos:
Descubrirlatopologa.Inicialmente,latopologadelaredesdesconocida.Sloseconoce
unconjuntodenodoscontrolables.Lareddebeserexplorada.
Esteproblemaseestudiaenlaseccin3.1.
Calculartodoloposible.Esdecir,aprovecharalmximolosnodoscontrolablesconel
objetivodeaprenderlomsposiblesobrelaredalacualpertenecen.
Esteproblemaseestudiaenlaseccin3.1.
Minimizar el sesgo. Llevaracabolaestimacinintroduciendoelmenor sesgoposible.
Comoseindicmsarriba,esteproblemaestrelacionadoconlaposibilidaddeescribir
las rutas no en trminos de los enlaces fsicos que las componensinoentrminosde
agregacionesmnimaseidentificablesdedichosenlaces.
Esteproblemaseestudiaenlaseccin3.2.
Mantenerlaescalabilidad.Losmtodosdebenseraplicablesaredesgrandes,dadoque
seradegranutilidadpoderaplicarlosaInternet.
Acontinuacindecadaalgoritmopresentadoenelcaptulo3seindicaelanlisisdesu
complejidad.
29
Captulo 2 Estado del arte
30
3. INNOVACIONES
EstetrabajocontienedosaportesenelreadelatomografadeInternet.
Laprimeracontribucinserelacionaconladeterminacindelasrutasmediblesyseexplica
enlaseccin3.1.
La segunda contribucin concierne a la identificabilidad de los enlaces y su aplicacin a
revolucionarelordendelosalgoritmosdeminimizacindelsesgo.Sedesarrollaenlaseccin3.2.
3.1. Determinacin de las rutas medibles
Enestaseccinseexplicalanuevametodologaparadeterminarqurutassepuedenmedir.
Laprimeraetapaconsisteenexplorarlared(porquesepartedeunatopologadesconocida)y
luegoclasificarlosnodossegnelrolquepuedendesempearenlasfuturasmediciones.Estaetapa
seexplicaenlaseccin3.1.1.
La segunda etapa consiste en determinar las rutas medibles, expresarlas en funcin de los
enlacesfsicos,yfinalmentecrearlamatrizderuteo.Estaetapaseexplicaenlaseccin3.1.2.
3.1.1. Clasificacin de nodos
Todo problema de tomografa activa de una red comienza con un conjunto de nodos
controlables.Eltrminocontrolableserefiereaqueadichosnodosselespuedeinstalarsoftware
quelleveacabomediciones.Deahoraenadelante,estosnodosserndenominadosalfa(o).
Paraobtenermayorniveldedetalleyaproximacinalarealidad,seutilizarunmodelode
enlacesyrutasasimtricos,locualpermiteestudiarelcasogeneraldequelosenlacesyrutastengan
distintaspropiedades en cada uno delossentidos.Deestemodo,elmodeloplanteado nosever
afectadoporelvolumentrficoenunmomentodeterminadoniporlasrestriccionesquealsean
impuestas.
31
Captulo 3 Innovaciones
Hecha la aclaracin del prrafo anterior, en este trabajo se dice que un par de rutas son
simtricas cuando tienen los mismos extremos, sentidos opuestos, y atraviesan exactamente los
mismosenlaces.Ntesequeestonoconstituyeunacontradiccinconelprrafoanterior,yaquesi
biendosrutaspuedenserfsicamentesimtricas(atraviesanlosmismosenlaces)nonecesariamente
tienenlasmismaspropiedades(porejemplo,nonecesariamentesetardalomismoenunsentidoque
enelotro).
Comodecadaalfasepuedenenviarpaquetesalosdems,sihaynalfasentonceslacantidad
derutasquesepuedenmediresn(n1).Dichacantidadconstituyeunresultadomuyconocido,yesla
queseempleaenlasmsmodernastcnicasconlasquesecuentahastaelmomento(vercaptulo2,
seccin1).
Silosnodosselaredsepuedensincronizar,sepuedeobtenermuchamsinformacinsobrela
red.Acontinuacinsedescribelasincronizabilidadyluegosemuestranlastcnicasqueaprovechan
lasincronizacinparaobtenerinformacinadicional.
Hay bsicamente 2 formas de sincronizar un par de alfas. Una es mediante el uso de un
soporte externo, como la tecnologa GPS. La misma es costosa y difcil de obtener, instalar y/o
esperarquelosnodoslatengandisponible.Debidoaesosproblemas,dichatcnicanoseempleaen
estetrabajo,sinoqueseutilizaunamuchomsasequible.Detodasmaneras,enelimprobablecasode
quesecontaraconesaventaja,puedeseraprovechada.
Enestetrabajo,lasincronizacinentrelosnodossellevaacabomedianteelusodelatcnica
delasrutassimtricas:sidosalfastienenunarutasimtrica,entoncessonsincronizables.Elmtodo
ensqueseusaparasincronizaralosalfassedescribemsadelante.
Porsimplicidaddelaexplicacin,seasumirenadelanteque,dadoelconjuntodealfasconel
quesecuenta,existeunrbolquelosconectamedianterutassimtricas.Naturalmente,estopuedeno
ocurrir,peroenesecasoelproblemasesolucionafcilmenteseparandoelconjuntoenpartesconexas
y aplicando la metodologa a cada rbol del bosque (aunque eventualmente se pierden algunas
medicionesentrelosrbolesdelbosque).
Luego,todoslosalfassepuedensincronizar.
Existenotrosnodos,ademsdelosalfas,quepuedansersincronizados?Larespuestaess.
Los nodos no controlables se pueden sincronizar cuando cumplen con las siguientes dos
propiedades:
1)soportetimestamp
2)alfasimetra
32
Captulo 3 Innovaciones
Lapropiedad1consisteensoportartimestampsICMP(vercaptulo2,seccin2).Lostrabajos
[Zhao05]y[Zhao06]noaprovechanelsoportedeICMPporpartedelosnodosparanodependerde
caractersticasdelainfraestructurainternadelared.Sinembargoenelcaptulo4semuestraquean
conunnivelbajodesoportedeICMP timestamp losresultadossonmuchosmejoresquesinose
tuvieraencuentaalostimestamps.
Lapropiedad2esnuevaysedefineacontinuacin:
Unnodoesalfasimtricocuandotieneunarutasimtricaconporlomenosunalfa.
En resumen, los nodos que no son controlables pero son sincronizables porque soportan
timestampsysonalfasimtricos,serndenominadosbeta().
Cmosesincronizaunbetaaunalfa?
Para empezar, debe aclararse que sincronizar a un beta no significa que el reloj del beta
coincida con el del alfa (lo cual es imposible porque el beta no es controlable) sino conocer la
diferenciaentreelrelojdelbetayeldelalfa,demodotaldepodercorregirtodoslosdatosqueenel
futuroproporcioneesebeta.
Loprimeroquesehaceesmedirelt
RT
(comnmenteconocidocomoRTT,roundtriptime,ver
captulo2,seccin1)entreelbetaencuestinyalgnalfaconelcualtengarutasimtrica(comoes
beta, tiene que ser alfasimtrico). Esto debe ser hecho en un momento en el cual la red est
desocupada o bien se puede asumir esa condicin tomando el mnimo de un gran nmero de
mediciones.Eltiempoentreelalfayelbetaeslamitaddelt
RT
.
Sele envaalbetaunpedidodetimestamp (vercaptulo2,seccin1)enelinstantet
0
.La
respuestaserecibeenelinstantet
REC
,conlocualelroundtriptimesecalculacomo:
t
RT
=t
REC
t
0
(3.1.1)
Sieltimestamp contenidoenlarespuestaacusaeltiempot
TIM
entoncesladiferenciaentreel
relojdelbetayelrelojdelalfasepuedecalcularcomo:
t
DIF
=t
REC
t
TIM

1
2
t
RT
(3.1.2)
porquet
TIM
eslahoraqueerasegnelbeta,medioroundtripantesderecibirlarespuesta.
Porejemplo,silarespuestaserecibeenelinstante100,eltimestampes80ylaestimacindel
RTTes50,entoncesqueda:
t
DIF
=10080
1
2
50=5
Eseresultadosignificaqueelbetaestadelantadoen5unidadesdetiempoconrespectoal
alfa.
Lafigura3.1.1ilustraelprocedimientodescripto.
33
Captulo 3 Innovaciones
Figura3.1.1.Sincronizacindeunbetaaunalfa.

Cmosesincronizaunpardealfas?
Sepuedeseguirelmismoprocedimientoqueseusaparasincronizarunalfayunbeta.Deesta
manera, unalfa
1
le enva el paquete timestamp alotroalfa
2
ycalcula ladiferenciaentrelos
relojes.
Paraque
2
conozcaladiferenciaentrelosrelojes,sepuedehacerque
1
selainforme,obien
que
1
enveotrotimestampluegodelarespuestade
2
paraque
2
puedacalcularladiferencia.
Cabedestacarqueenlosnodosalfa,comosoncontrolables,sepuedeimplementarelsoporte
paraICMPtimestamp,adiferenciadelosnodosbeta,paraloscualessedependedequeelsoportede
ICMPtimestampexistadeantemano.
Culessonlasrutasmedibles?
Losalfasylosbetassonlosnodostiles,porquetodaslasrutasmedibleslostienenensus
extremos.Lasrutasmediblessiempresonentredosalfasoentreunalfayunbeta.Seutilizarel
trminoalfabetoparareferirseaunnodoquepuedeserextremodeunaruta,independientementede
siesalfaobeta.
Cmosemidenlasdemorasenunarutaentreunalfayunbeta?
Encondicionesnormalesdeoperacin,lasrutasnosonsimtricasencuantoasusretardos,
incluso aunque fsicamente lo sean. Pero utilizando el valor de t
DIF
calculado al momento de la
sincronizacin, se pueden calcular las demoras en ambos sentidos. La forma de proceder es la
34
Captulo 3 Innovaciones
siguiente:
1)Elalfaenvaalbetaunpedidodetimestampenelinstantet
1
2)Elpedidopasaporelbetaenelinstantet
2
3)Elalfarecibelarespuestaenelinstantet
3
.
Luego,lostiemposenambossentidosson:
t
o
=t
2
+t
1
t
o
=t
3
+t
2
(3.1.3)
(3.1.4)
Elproblemaesquet
2
esdesconocidoparaelsistema,quesolamentecontrolaalalfa.Peroesto
noesunproblemagrave,yaquelahoraindicadaeneltimestamp,t
IND
,noesotracosaquet
2
segnel
relojdelbeta.Ycomoseconocet
DIF
(ladiferenciaentrelosrelojes)sepuedecalculart
2
:
t
2
=t
IND
+t
DIF
(3.1.5)
Lafigura3.1.2ilustraesteprocedimiento.
Figura3.1.2.Medicinenambossentidosdelademoraentreunalfayunbeta.
Cmosemidenlasdemorasenunarutaentredosalfas?
Sesigueelmismoprocedimientoqueseempleaparamedirlasdemorasenunarutaentreun
alfayunbeta.
35
Captulo 3 Innovaciones
Volviendoalcomienzodelproblema,enelprincipioseconocennicamentelosalfasdela
red.Cuandosetrazanlasrutasentretodoparposibledealfas,sedescubrenmuchosnodosnuevos.
Naturalmente,esosnuevosnodosnosoncontrolables(nosonalfas)ytodavanosesabesison
alfasimtricos y/o soportan timestamps (con lo cual todava no se sabe si pueden ser betas).
Solamentesetieneideadesuexistenciaapartirdelaobservacindelasalidadelcomandotraceroute.
Se denominar delta (6) a los nodos no controlables cuya alfasimetra y soporte de
timestamps todavanohansidoinvestigados.Todoslosnuevosnodosquesevandescubriendo(es
decir,losquesedescubrencadavezquesetrazaunaruta)soninicialmentedeltas.
Cuandoundeltaesinvestigadoyconsecuentementesedescubrequeesalfasimtrico,separa
aclasificarcomogama().
Los deltasque son adyacentes (osea que estn conectados directamente) aalgnalfa son
obviamentealfasimtricos,porqueunparderutascompuestasdeunnicoenlaceatravesadoensus
dossentidossonsimtricas(nonecesariamenteencuantoasuspropiedades,perosfsicamente).
Losdeltasquenosonadyacentesaningnalfatambinpuedenseralfasimtricossiseles
descubreunarutasimtricaconporlomenosunalfa,yestoavecesrequieretrazarrutasadicionales.
Porejemplo,considreselasiguienterutavadesdeelalfao
1
hastaelalfao
5
:
o
1
-6
2
-6
3
-6
4
-o
5
Losnodos2y4enrealidadgamasporquealestarconectadosdirectamenteaalfassonalfa
simtricos.Larutaqueda:
o
1
-
2
-6
3
-
4
-o
5
Qusucedeconelnodo3?Silarutadel5al1fuerasimtricaconladadaenelejemplo,
entonceselnodo3esalfasimtricoconlosalfas1y5.Sino,entoncesansepuedeobservarquela
rutadelnodo3alnodo5esconocida(porquesedescubrialtrazarlarutadelnodo1alnodo5)yse
puedehaceruntraceroutedesdeelnodo5hastaelnodo3,paradeterminarsiesteltimoesalfa
simtrico.
Altrazarrutasadicionales,potencialmentesedescubrennuevosdeltas.Elalgoritmosepodra
aplicarrecursivamentealosnuevosdeltas,perodadoeltamaodeInternet,esnecesariodarleun
cortealalgoritmo.Poresoenestetrabajoseusaelcriteriodenoaplicarelalgoritmoalosdeltas
descubiertosenestaetapa.Estecriteriopuedecambiarse,tantoenformaesttica(esdecir,crearun
algoritmo con un criterio de corte distinto) como en forma dinmica (aplicar este criterio en la
primerapasadadelalgoritmo,peroluegoenpasadasposterioresseguirexplorandolosnuevosdeltas).
36
Captulo 3 Innovaciones
Cuando un gama esinvestigadoyconsecuentementesedeterminaquesoporta timestamps,
entoncesseloclasificacomobeta,comosedescribiantes.
Cuandosedeterminaqueunnodonoesalfasimtricoy/onosoportatimestamps,entoncesno
selopuedesincronizar,yseloclasificacomopsilon(c).
Enlatabla3.1.1seresumeelcriteriodeclasificacinparalosnodosnocontrolables.
Elnodosoportatimestamps?
s nosesabe no
Elnodotieneruta
simtricaconpor
lomenosunalfa?
s
c
nosesabe
(*)
6 c
no
c c c
Tabla3.1.1.Clasificacindelosnodosnocontrolables.
(*)estecasonoesposible.Nuncaseverificaelsoportedetimestampsdeunnodocuyaalfasimetra
nohasidodeterminadaan.
Enlatabla3.1.2seindicanlaspropiedadesdetodoslostiposdenodos,resumiendolodicho
hastaelmomento.
Alfa
o
Losnodoscontrolables.
Beta

Losnodosquenosepuedencontrolarperoal
menossepuedensincronizar,porquesoportan
timestampsysonalfasimtricos.
Estossonlosalfabetos.Sonlos
tiles,porquetodaslasrutas
mediblessonentredosalfaso
entreunalfayunbeta.
Gamma

Losnodosquesonalfasimtricos.Anno
puedenserconsideradosbetasporquetodavano
serelevsisoportantimestamps.
Delta
6
Losnodosqueannofueronrelevados.
Estosnodosestnalaesperade
quesusincronizabilidadsea
relevada.
psilon
c
Losnodosquenosonsincronizables,porqueno
soportantimestampsy/onosonalfasimtricos.
Estosnodosnoson
sincronizables.
Tabla3.1.2.Clasificacindelosnodos.
37
Captulo 3 Innovaciones
Elciclodevidadelosnodosseilustraenlafigura3.1.3.Enlamismasepuedeapreciarcmo
algunosdeltaspasanaserclasificadoscomogamasyotroscomopsilons,yluegoalgunosdelos
gamaspasanaserbetasyotrospsilons.
Figura3.1.3.Ciclodevidadelosnodos.
Elalgoritmo3.1.1describeelprocesodeclasificacindenodos.Lacomplejidaddelalgoritmo
esO(n
2
D),dondeneslacantidaddealfasyDeseldimetrodelared

.Estacantidadesdominadapor
losciclosanidadosdelaslneas4y8.Elciclodelalnea8constadeniteraciones,mientrasqueelde
lalnea4tienetantasiteracionescomolacantidaddedeltas,ycomolosdeltasexistenteshastaese
momentoson los nodos descubiertosal trazarlasrutasentrelosalfas,lacantidades O(nD).Los
ciclosdelaslneas1y15tienencomplejidadO(n
2
).
Lascomplejidadesenunciadasserefierenaunaprimeraejecucindelalgoritmo.Loscambios
enInternetsonmuylentosencomparacinconeltotaldelared.Porlotanto,posteriorespasadasdel
algoritmo, destinadas a detectar actualizaciones, necesitan realizar una cantidad de operaciones
muchomenor.
El dimetro de la red es la mxima distancia entre dos nodos de la red.
38
Captulo 3 Innovaciones
Entrada:
Lista de alfas
Salida:
Lista de betas
Lista de gamas
Lista de deltas
Lista de psilons
Lista de rutas
1 Para cada par posible de alfas
2 Trazar rutas
3 Recordar los deltas descubiertos
4 Para cada delta d
5 Si es adyacente a un alfa
6 Convertir a d en gama
7 Si no
8 Para cada alfa a
9 Si se conoce la ruta de d a a
10 Trazar la ruta de a a d
11 Si las rutas son simtricas
12 Convertir a d en gama
13 Si no
14 Convertir a d en psilon
15 Para cada gama
16 Enviar paquete timestamp
17 Si soporta timestamps
18 Convertir en beta
19 Si no
20 Convertir en psilon
Algoritmo3.1.1.Clasificacindenodos.
Ejemplo
Apartirdelasiguientepginasepresentaunejemplodeaplicacindelalgoritmodeclasificacinde
nodos.Secomienzacon4nodosalfa(A,B,CyD)ysedescubrenyclasificanlosnodosbeta,gama,
deltaypsilon.
39
Captulo 3 Innovaciones
Alprincipiosloseconocenlosalfas(nodoscontrolables).
40
Captulo 3 Innovaciones
Setrazalarutaentrecadaposiblepardealfas.
Consecuentemente,sedescubrenalgunosdeltas.
Setomancomoejemplolassiguientesrutas,delascualesselistanlosenlacesquelascomponen:
A>DesAW,WV,VO,OP,PD
D>AesDP,PO,ON,NM,MA
41
Captulo 3 Innovaciones
Losdeltasadyacentesaalfassonobviamentealfasimtricos,porlocualselosconvierteengamas.
QusucedeconN?
AltrazarlarutaD>A,tambinseaprendifortuitamentequelarutaN>AesNM,MA.
SisetrazaralarutaA>NyresultaraserAM,MNentonces...
...Nseraalfasimtrico.
Porejemplo,siesoefectivamentesucede:
42
Captulo 3 Innovaciones
EntoncesNesgama.
YqusucedeconO?
AltrazarlarutaD>A,tambinseaprendifortuitamentequelarutaO>AesON,NM,MA.
YaltrazarlarutaA>D,tambinseaprendifortuitamentequelarutaO>DesOP,PD.
Porlotanto,sisetrazaralarutadeAaO,yresultaraserAM,MN,NO
y/o
sisetrazaralarutadeDaO,yresultaraserDP,PO
EntoncesOseraalfasimtrico.
Porejemplo,siseesoefectivamentesucede:
43
Captulo 3 Innovaciones
EntoncesOesgama.
SepuedehacerlomismoconV(desdeD)
yconU(desdeBydesdeD).
Paravariar,siseasumeporejemploqueningunadelas3rutasresultasimtrica...
...entoncesUyVnosonalfasimtricos.
Conlocualnuncapodranserbetas.
44
Captulo 3 Innovaciones
Sinoqueenrealidadsonpsilons:
45
Captulo 3 Innovaciones
Ahoraesnecesariointentarconvertirgamasenbetas.
Seenvanpaquetestimestampatodoslosgamas.
SiporejemploM,O,SyZresultansoportartimestamps,entoncessonbetas:
46
Captulo 3 Innovaciones
Yelrestodelosgamas,esdecir,losquenosoportantimestamps,sondeltas:
47
Captulo 3 Innovaciones
3.1.2. Creacin de la matriz de ruteo
Elalgoritmo3.1.2describelacreacindelamatrizderuteo.Lasrutasmediblessonaquellas
que van entre dos alfas o entre unalfa y un beta.Todaslasrutasentrealfasseconocen,pero la
mayoradelasrutasentreunalfayunbetanofuerondescubiertasenelprocesodeclasificacinde
nodos.Poresolaprimeraetapadeestealgoritmoesaprenderlasrutasentretodoparposiblealfa
beta.
Silarutadelalfaalbetaesdesconocida,simplementesehaceuntraceroute(lneas3y4).
Pero si la ruta del beta al alfa es desconocida, no se puede hacer un traceroute para
solucionarlo,porquelosbetasnosoncontrolables.Entoncessecreaunenlacevirtualdelbetaalalfay
seconsideraquelarutaderegresodelbetaalalfaeslaqueatraviesanicaysimplementeeseenlace
virtual(lneas5y6).
Luegodedeterminadastodaslasrutasdeidaydevueltaentretodoparposiblealfabeta,ya
sonconocidastodaslasrutasmedibles(esdecir,lasrutasalfaalfayalfabeta)ysepuedefinalmente
crearlamatrizderuteo.
El procedimiento consiste en recorrer la lista de rutas medibles e ir agregando las
correspondientesfilasenlamatrizderuteo(lneas7a11).Antesdepoderagregarcadaunadeesas
filas,esnecesarioqueexistantodaslascolumnascorrespondientesalosenlacesatravesadosporla
rutaalaqueserefierelafilaquesedeseaagregar(lneas8a10).Estoquieredecirque,porejemplo,
nosepuededardealtalafilacorrespondientealarutaA>D=AB+BC+CDsiantesnoexistenlas
columnascorrespondientesalosenlacesAB,BCyCD.
Cuandoseagregaalamatrizderuteolafilacorrespondienteaunaruta(lnea11),lafila
agregadacontendr1enlasposicionescorrespondientesalascolumnasquerepresentanalosenlaces
atravesadosporlaruta,y0enelrestodelasposiciones.
La complejidad del algoritmo 3.1.2 es O(n
o
2
l), donden
o
eslacantidaddealfas y l esla
mximacantidaddeenlacesenunaruta.Elanlisisquepermitellegaraeseresultadosepresentaa
continuacin.
Lacomplejidaddelosciclosanidadosdelaslneas1y2esexactamenten
o
n

,donden

esla
cantidaddebetas.Lacomplejidaddelosciclosanidadosdelaslneas7y8esO(rl),donderesla
cantidad derutas medibles, es decir, la cantidaddefilas de lamatrizderuteo, y l eslamxima
cantidaddeenlacesenunaruta.
Lacomplejidadtotalesentonces:
O(n
o
n

+rl )
Peroestaexpresinsepuedesimplificar.Comolacantidaddefilasenlamatrizderuteoes
O(n
o
2
),lacomplejidadtotalsepuedeescribircomo:
O( n
o
(n

+n
o
l ))
ComopocosnodosenlaredsoportanICMPtimestamp,lacantidaddebetasesinferiorala
48
Captulo 3 Innovaciones
cantidaddealfas,yentoncesesfcildeverquelacomplejidadtotalqueda:
O( n
o
2
l )
Entrada:
Lista de nodos
Lista de rutas
Salida:
Matriz de ruteo
Lista de nodos actualizada
Lista de rutas actualizada
1 Para cada alfa a
2 Para cada beta b
3 Si no se conoce la ruta ab
4 Trazarla
5 Si no se conoce la ruta ba
6 Asignarle un enlace virtual ba
7 Para cada ruta medible r
8 Para cada enlace e
9 Si la matriz no tiene la columna e
10 Agregar a la matriz la columna e
11 Agregar a la matriz la fila correspondiente a r
Algoritmo3.1.2.Creacindelamatrizderuteo.
3.2. Minimizacin del sesgo
Como se detall en la seccin1delcaptulo2, lamatrizderuteotpicamente tienerango
deficiente (es decir, que la cantidad de ecuaciones linealmente independientes es menor que la
cantidaddeincgnitas).
Consecuentemente, el sistema no tiene una solucin nica. Esto implica que al hacer el
clculo,seeligeunasolucinenespecial,cualsignificaadoptaralgncriterio.
Porejemplo,[Chua05]eligecomocriterioasignarleceroalosvaloresdelamtricaparalos
enlacesquenosonatravesadosporningunadelasrutasmonitoreadas.
Adoptaruncriteriointroduceinevitablementeunsesgo.Peroladiferenciaentreestesesgoy
losdemsquetambinaparecen(porejemplo,elsesgointroducidoporlahiptesisdeindependencia
49
Captulo 3 Innovaciones
entrelasdemorasenlosenlaces)esqueestesesgopuedesereliminado.
Si se puede transformar el sistema de forma talquela matriz de ruteo no presente rango
deficiente(que la cantidad de ecuaciones linealmente independientes sea igual a la cantidad de
incgnitas)entonceselsistemadejadeserindeterminadoyconsecuentementelasolucinesnica.
Luego,yanoesnecesarioimponeruncriterioparaelegirlasolucin,yporlotantoelsesgo
encuestindesaparece.
Estoesloqueseproponesolucionaren[Zhao05]y[Zhao06].Enestaseccinsepresentauna
maneraenormementemseconmicadellevarloacaboqueendichostrabajos,representantesdel
estadodelarteactual.
Primeramentesedefinendosconceptosfundamentales:
Identificabilidad.Unenlaceesidentificablecuandosuvariableasociadasepuedeescribirenfuncin
delosdatos.
Redabierta.Unaredesabiertacuandopuedecrearseodestruirseflujoencadaunodesusnodos.
Dadalaredabiertadelafigura3.2.1,dondeelnodointermedioZnoesalfabeto(esdecir,no
esnicontrolablenisincronizable,conlocualnopuedeserextremodeningunamedicin),las
medicionesquesepuedentomarson:larutadesdeAhastaB,larutadesdeBhastaA,elroundtrip
entreAyZyelroundtripentreByZ.
Figura3.2.1.Nodointermedioquenosepuedecontrolarnisincronizar.
Lema1.LosenlacesAZ,ZB,BZyZAnosonidentificables.
Demostracin.
ComolosenlacessonAZ,ZB,BZyZA,entonceslasecuacionesquesepuedenplantearson:

AZ+ZB=AB
obs
BZ+ZA=BA
obs
AZ+ZA=AZA
obs
BZ+ZB=BZB
obs
50
Captulo 3 Innovaciones
Escribindoloconlanotacinmatricial RL=M queda:
|
1 1 0 0
0 0 1 1
1 0 0 1
0 1 1 0

(
AZ
ZB
BZ
ZA
)
=
(
AB
obs
BA
obs
AZA
obs
BZB
obs
)
Lamatrizderuteotienerango3,luegolos4enlacesnopuedenseridentificables.
Sepuedeconjeturarquelosenlacesconectadosanoalfabetosnosonidentificables.
Segnellema,losparesdeenlacesAZ,ZByBZ,ZAnosonidentificables,peroslosonsus
concatenaciones,esdecir,losenlacesvirtualesAZByBZA.
Teorema1.Losenlacesidentificablessonlasconcatenacionesdelosenlacesexistentesentrelos
alfabetosdelasrutasmedibles.
Demostracin.
Dadaunarutacualquiera,lamismatienenecesariamentealfabetosensusextremos,ylosnodos
intermediossernalfabetosynoalfabetos.Porejemplo:
a
1
-z
1
-z
2
-a
2
-z
3
-z
4
-z
5
-a
3
-a
4
-z
6
-z
7
-z
8
-a
5
dondelaletraaseusparadenotaralosalfabetosylazparalosnoalfabetos.
Agrupandolosnoalfabetosconsecutivos,sepuedeescribiras:
a
1
-
(
z
1
-z
2
)
-a
2
-
(
z
3
-z
4
-z
5
)
-a
3
-a
4
-
(
z
6
-z
7
-z
8
)
-a
5
Yengeneral,sepuedeescribiras:
a
1
-
(
z
1
-... -z
i
)
-a
2
-
(
z
i +1
-... -z
j
)
-a
3
-... -a
n
Seveclaramentequesepuedeparticionarensegmentosdeterminadosporlosalfabetos.Unsegmento
cualquierasepuedeescribiras:
a
i
-
(
z
k
-z
k+1
-z
k+2
-...
)
-a
j
Siseaislaelnodoz
k
queda:
51
Captulo 3 Innovaciones
a
i
-z
k
-
(
z
k+1
-z
k+2
-...
)
-a
j
Porellema1,losenlacesanterioryposterioralnodoz
k
nosonidentificables.Lomismosucedecon
cualquierotroz
m
intermedio:
a
i
-
(
z
k
-z
k+1
-... -z
m1
)
-z
m
-
(
z
m+1
-z
m+2
-...
)
-a
j
Porlotanto,quedademostradoelteorema.
Elteoremapermitederivarelalgoritmo3.2.1paralabsquedadelosenlacesidentificables.
Entrada:
Lista de nodos
Matriz de ruteo R
Salida:
Lista de enlaces virtuales identificables
1 Para cada ruta p (o sea, para cada fila de R)
2 Crear un enlace virtual e vaco
3 Para cada enlace xy
4 Agregar xy a e
5 Si y es un alfabeto
6 Agregar e a la lista de enlaces virtuales identificables
7 Crear un enlace virtual e vaco
Algoritmo3.2.1.Bsquedadelosenlacesidentificables.
Dadasrlacantidadderutasyllamximacantidaddeenlacesenunaruta,elcicloexternodel
algoritmo (lnea 1) consta de r iteraciones y el ciclo interno (lnea 3) de a lo sumo l. Luego la
complejidaddelalgoritmo3.2.1esevidentementeO(rl).
EstoesmuchomenorquelacomplejidadO(rkl
2
)delalgoritmo2.1.4,propuestoporZhaoetal.
Sepuedeapreciarqueladiferenciaestanabismalcomoladiferenciaentrenyn
2
.
Enelcaptulo4secomparanlosdosmtodos(elalgoritmo2.1.4,propuestoporZhaoetal.y
elalgoritmo3.2.1,presentadoenestetrabajo),obtenindoselamismamatrizderuteo.
Ademselnuevoalgoritmoesclaramenteacoplablealosalgoritmosdedeterminacindelas
rutastambinaportadosporelpresentetrabajo(seccin3.1).Puntualmente,sepuedeintegrarconel
algoritmo3.1.2.Estoquieredecirquenoesnecesarioejecutarprimeroelalgoritmo3.1.2yluegoel
52
Captulo 3 Innovaciones
algoritmo 3.2.1, sino que se pueden combinar en un nico algoritmo, lo cual es positivo porque
significaquelacomplejidadtotalesmenorquelasumadelasrespectivascomplejidades.
Laintegracinesposiblegraciasalaequivalenciadelosciclosanidadosdelaslneas8y9del
algoritmo3.1.2conlosdelalgoritmo3.2.1yelhechodequenoexisteunarelacindeprecedenciaen
losdosparesdeciclos.Elalgoritmo3.2.2consisteenlaintegracindelosalgoritmos3.1.2y3.2.1.
Entrada:
Lista de nodos
Lista de rutas
Salida:
Matriz de ruteo
Lista de nodos actualizada
Lista de rutas actualizada
1 Para cada alfa a
2 Para cada beta b
3 Si no se conoce la ruta ab
4 Trazarla
5 Si no se conoce la ruta ba
6 Asignarle un enlace virtual ba
7 Para cada ruta medible p
8 Crear un enlace virtual e vaco
9 Para cada enlace xy de la ruta p
10 Agregar xy a e
11 Si y es un alfabeto
12 El enlace virtual e es identificable
13 Si la matriz no tiene la columna e
14 Agregar a la matriz la columna e
Crear un enlace virtual e vaco
15 Agregar a la matriz la fila correspondiente a p
Algoritmo3.2.2.Creacindelamatrizderuteoentrminosdeenlacesidentificables.
La complejidad del algoritmo3.2.2esla misma que ladelalgoritmo 3.1.2. Enla seccin
anteriorsedeterminquedichacomplejidades:
O( n
o
2
l )
Comosedetallanteriormente,lacomplejidaddelalgoritmodeZhaoetal.parallevaracabo
lamismatareaqueelalgoritmo3.2.2es:
O( r kl
2
)
53
Captulo 3 Innovaciones
Teniendoencuentaque
r =n
o
(n
o
1)
lacomplejidaddelnuevoalgoritmoesmuchomenor.
Peroadems,cabedestacarqueelnuevoalgoritmopermiteobtenermuchamsinformacin,porque
nosolamenteseocupadelosnodosalfasinotambindelosnodosbeta.
54
4. RESULTADOS EXPERIMENTALES
Con el objeto de evaluar el desempeo de los mtodos propuestos, se llevaron a cabo
simulaciones con datos reales de los proyectos CAIDA y DIMES, as como tambin con redes
aleatorias

.
Paraposibilitarlaverificacinycomparacin,fueronimplementadostodoslosalgoritmosde
los captulos 2 (algoritmos actuales) y 3 (algoritmos nuevos). En ambos algoritmos, se utiliz el
mismomduloparatrazarrutas.Larutaentredosnodoscorrespondeaalgunodeloscaminoscon
longitudmnimaentreellos.
Enlaseccin4.1sepresentanlosresultadosdeaplicarlosalgoritmosendistintastopologas.
LosalgoritmostambinfueronutilizadosconmedicionesrealesderutasenInternettomadas
porelproyectoDIMES.Losresultadossepresentanenlaseccin4.2.
Enlaseccin4.3seanalizanlosresultadosyseextraenconclusiones.
Para llevar a cabo las simulaciones se desarroll una herramienta, que se describe en el
apndiceB.
Objetivos
Laexperimentacinsellevacaboconlossiguientesobjetivos:
VerificarquelosMILSes(enlacesvirtualesidentificablesmnimos)encontradospor
losnuevosalgoritmoscoincidenconlosdelalgoritmo2.1.4presentadoporZhao,Chen
etal.[Zhao05,Zhao06].
Estudiarelbeneficiodeutilizarbetas(nodosnocontrolablesperosincronizables).Es
decir, cuantificar el incremento en la cantidad de enlaces virtuales identificables
mnimos, representantes de la granularidad, contra el incremento en la cantidad de
nodosenlaredquesoportandeICMPtimestamps.
AplicarlametodologaamedicionesenInternetpertenecientesalproyectoDIMES.La
ideaesporunladoutilizardatosrealesyporelotroestudiarelprocesodedeterminar
Una red generada al azar, donde la probabilidad de que un par cualquiera de nodos estn
conectados es idntica para todos los pares posibles de nodos.
55
Captulo 4 Resultados experimentales
losnodosapartirdelasmediciones,inversoalaplicadoenlosexperimentosdetallados
anteriormente.
4.1. Simulaciones en diferentes topologas
Los algoritmos de loscaptulosanterioresfueronaplicadosensimulacionessobrediversas
topologas. En esta seccin se describen primeramente las redes utilizadas y el procedimiento
utilizadoparallevaracabolassimulaciones.Luegosepresentanlosresultadosobtenidosysellevaa
caboelanlisisdelosmismos.
Las redes utilizadas
PrimeramenteseutilizunaredcuyatopologaesrepresentativadelatopologadeInterneta
nivelruteadores.DicharedeslaredderuteadorescorrespondientealproyectoCAIDA
Paralassimulacionessetomlacomponenteconexamsgrandedelared.Enlaseccin3.1.1
seexplicaquelametodologatambinesaplicablearedesdisconexas.Luegodeseleccionarlamayor
componenteconexa,laredtienelassiguientescaractersticas:
Aproximadamente90.000nodos.
Aproximadamente250.000enlacesfsicos.
Ladistribucindegrados

desusnodoscorrespondeaunaleydepotencias.
Setomaron100alfas,loquearrojaunadensidaddenodoscontrolablesdel0,11%.
Lasegundaredutilizadafueunaredaleatoriaconlossiguientesparmetros:
10.000nodos.
probabilidaddeconexinp=0,01.
Elprocedimientomedianteelcualfueconstruidalaredaleatoriaeselsiguiente:
1. Secrearonlos10.000nodos.
2. Seitersobretodoslosparesposiblesdenodos(enestecaso49.995.000)ysecreel
correspondienteenlaceconprobabilidadp.
En un grafo, el grado de un nodo es la cantidad de aristas que lo tienen como extremo.
Anlogamente, en una red, el grado de un nodo es la cantidad de enlaces fsicos a los que
est conectado.
56
Captulo 4 Resultados experimentales
Laredqueddeestamaneraconformadaconlassiguientescaractersticas:
Caracterstica Valor Comentario
Cantidaddenodos 10.000 Fijadoporparmetro
Cantidadde
enlacesfsicos
499.955 Aproximadamenteel1%delacantidad
deenlacesposibles,deacuerdoalo
establecidoenelparmetrop.
Distribucinde
grados
normal
Gradomedio 99.99
Sepuedeexplicarmedianteelteorema
dellmitecentral,porqueparacada
nodo,sugradoeslasumade9.999
variablesaleatoriasindependientese
idnticamentedistribuidas(Bernoulli
conidnticoparmetrop).
Laeleccindeunaredaleatoriadegradomedioaproximadamente100sebasaenelhechode
quesiInternetfueraunaredaleatoria,entoncessusruteadoresdeberantenergradomedio100,como
sedemuestraen[Dallasta06].
ParaobtenerlamismadensidaddealfasqueseutilizenlassimulacionesconlaredCAIDA
(0.11%),enlaredaleatoriasetomaron11alfas.
En la figura 4.1.1 se representan 4 curvas. Por un lado, se puede apreciar la distribucin
empricadelosgradosdelosnodosdelaredaleatoria(crculos)comparadaconunaleygaussianade
media100ydesvoestndar10(lneacompleta),yladistribucinempricadelosgradosdelosnodos
delaredCAIDA(tringulos)comparadaconunaleydepotencias(lneapunteada).
57
Captulo 4 Resultados experimentales
Figura4.1.1.Distribucionesdelosgradosdelosnodosdelasredesutilizadas.
Ladistribucindelaredaleatoriaessimilaraunaleynormalconmedia100ydesvoestndar10,
yladistribucindelaredCAIDAessimilaraunaleydepotencias.
Porqupresentanlasredesdistribucionesdegradostandismiles?
EnlaredCAIDA,representativadeInternetanivelruteadores,muchosnodostienengrados
bajos,porqueseencuentranporasdecirlo,enlaperiferia.Losnodosqueconectanentresalos
racimosdenodosperifricossonrelativamentepocos,perotienengradosaltos.Estosepuedeapreciar
enlafigura4.1.2(a),querepresentaaunaredconlasmencionadascaractersticas.Sepuedeobservar
laorganizacinenracimos.
Por su parte, en la red aleatoria, no existe la nocin de nodos perifricos o centrales
debidoaquetodopardenodostieneidnticaprobabilidaddeconexinp.Deesemodo,todoslos
nodostiendenatenergradosparecidos,motivoporelcualavecesseladenominahomognea.Esto
sepuedeapreciarenlafigura4.1.2(b),querepresentaaunareddeesascaractersticas.Elgradode
cadanodoesunavariablealeatoriabinomial,quecuandolacantidaddenodosesgrandeseaproxima
aunadistribucinnormal.Estadistribucintienemuchamenorvarianzaqueunadistribucincomola
depotencias,quetieneunacolamspesada.
58
Captulo 4 Resultados experimentales
(a)
(b)
Figura4.1.2.Topologasestudiadas.Lared(a)tieneunadistribucindegradosque
sigueunaleydepotencias,comoladeredCAIDA.Lared(b)tieneunadistribucin
degradosquesigueunaleynormal,comoladeunaredaleatoria.
59
Captulo 4 Resultados experimentales
El procedimiento
Acontinuacinsedescribeelmtodoaplicadoacadaunadelasredes.
Para cada red, se estudi su comportamiento para distintos niveles de soporte de ICMP
timestamps.Enparticular,seutilizaronlossiguientesniveles:
0a100%,enintervalosde10%.Elobjetivoesestudiarelcomportamientoparatodoel
rangodevaloresposiblesdelniveldesoporte.
0a10%,enintervalosde1%.Elobjetivoesestudiarelcomportamientoparaniveles
bajos desoporte. Como se detallamsadelante,este rangoresulta particularmente
interesante,debidoaqueeselquemsfrecuentementeapareceenlarealidad.
Porcadaniveldesoporte,sellevaronacabo100iteraciones.Encadaiteracinseeligieronal
azarlosalfas(nodoscontrolables)yluegoseejecutaronlosalgoritmosdeloscaptulos2(Chenet.al)
y3(lospresentadosenestetrabajo).Luegodecadaejecucindelosalgoritmossecompararonlos
resultados para verificar que los resultados son los mismos. Tambin se registr el valor de las
siguientesvariables:
Cantidaddebetas
Cantidaddenodosnoalfabetos
Cantidaddeenlacesfsicos
Cantidaddeenlacesvirtualesidentificablesmnimos(MILSes)
Luegodeefectuadaslas100iteracionesparacadaniveldesoporte,secalculelpromedioy
desvoestndardelasvariablesobservadas.
Elalgoritmo4.1.1resumeelprocesodesimulacin.
60
Captulo 4 Resultados experimentales
Entrada:
Las redes a utilizar (CAIDA y aleatoria).
Salida:
Promedio y desvo estndar de cada variable observada para
cada punto de cada red.
1 Para cada red
2 Para cada nivel de soporte de ICMP timestamps
(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80,
90 y 100%)
3 Iterar 100 veces
4 Elegir alfas al azar
5 Ejecutar algoritmos de los captulos 2 y 3
6 Verificar coincidencia de los resultados
7 Tomar nota de las variables observadas
8 Cantidad de betas
Cantidad de nodos no alfabetos
Cantidad de enlaces fsicos
Cantidad de enlaces virtuales identificables
mnimos (MILSes)
9 Calcular el promedio y el desvo estndar de la muestra
de 100 iteraciones de cada una de las variables
observadas
Algoritmo4.1.1.Procedimientoutilizadoparallevaracabolassimulaciones.
Resultados
A continuacin se presentan los resultados obtenidos y el correspondiente anlisis. Para
facilitar la comprensinde los resultados,enestaseccinlosmismossepresentannicamenteen
formatogrfico.LosvaloresenformatotablaaparecenenelapndiceA.
Entodosloscasos,losenlacesvirtualesdeterminadosporelalgoritmodeZhaoetal.2.1.4yel
nuevoalgoritmo3.2.1propuestoporelpresentetrabajofueronidnticos.
En la figura 4.1.3 se pueden visualizar losvaloresdelas variables observadaspara ambas
redes, para los distintos porcentajes de soporte de ICMP timestamps. En las figuras (a) y (b) se
muestranlascantidadesdenodosbetaynoalfabetosrespectivamente.Enlafigura(c)semuestranlas
cantidadesdeenlacesfsicos.Comolaredaleatoriatieneladcimapartedelacantidaddenodosde
laredCAIDA,lascurvasenlasfiguras(a),(b)y(c)seencuentrancorridasaproximadamenteuna
dcada. Enlafigura (d) se muestranlas cantidadesdeenlaces virtuales, divididaspor el total de
enlacesfsicostotalesdecadared;esopermitetenerunaideadequporcentajedelaredselogra
descubrir.
Enlaspginassubsiguientesdeestamismaseccinsedesarrollaelanlisisdelasvariables
observadas.
61
Captulo 4 Resultados experimentales
Losgrficossetrazaronenbasealosresultadosdelassimulaciones,contenidosenlastablas
A.1(redCAIDA)yA.2(redaleatoria).
(a) (c)
(b) (d)
Figura4.1.3.Variablesobservadas,paraambasredes,
paralosdistintosporcentajesdesoportedeICMPtimestamps.
62
0 10 20 30 40 50 60 70 80 90 100
1
10
100
1000
10000
red CAIDA
red aleatoria
soporte de ICMP timestamps %
n
o
d
o
s

b
e
t
a
0 10 20 30 40 50 60 70 80 90 100
100
1000
10000
100000
1000000
red CAIDA
red aleatoria
soporte de ICMP timestamps %
e
n
l
a
c
e
s

f

s
i
c
o
s
0 10 20 30 40 50 60 70 80 90 100
0.0%
0.1%
1.0%
10.0%
100.0%
red CAIDA
red aleatoria
soporte de ICMP timestamps %
e
n
l
a
c
e
s

v
i
r
t
u
a
l
e
s

/

t
o
t
a
l
e
s

%
0 10 20 30 40 50 60 70 80 90 100
10
100
1000
10000
red CAIDA
red aleatoria
soporte de ICMP timestamps %
n
o
d
o
s

n
o
-
a
l
f
a
b
e
t
o
s
Captulo 4 Resultados experimentales
Cantidad de enlaces virtuales
Laprimeravariableaanalizareslacantidaddeenlacescalculablesindividualmente,esdecir,
losenlacesvirtuales.Dichavariableeslarepresentadaenlafigura4.1.3(d).
El primer punto en cadalneatrazada,tomadodelaprimerafiladecadatabla(A.1,A.2),
correspondealcasoenqueabsolutamenteningnnododelaredsoportaICMPtimestamps.Enese
escenario no existen los nodos beta, y la cantidad de enlaces calculables (es decir, los enlaces
virtuales)esO(n
2
)

,dondeneslacantidaddenodoscontrolables

.Dichasituacineslaestudiadapor
Zhao et al. [Zhao05, Zhao06], quienes, como se detall en los captulos 2 y 3, directamente
desestimanlaposibilidaddequelosnodossoportenICMPtimestamps.
AunqueelporcentajedenodosquesoportanICMPtimestampsseabajo,comoindicanZhaoet
al.,unapequeacantidadalcanzaparaobtenerunvolumenmuchomayordeinformacinacercadela
redquesinoselostieneencuenta:porejemplo,paralaredCAIDA,enlasegundafiladelatablaA.1
sepuedeapreciarquecontansloun10%desoportedeICMPtimestampsentrelosnodosdelared,
sepasade9848a35810enlacesvirtuales,esdecir,seobtienencasi4vecesmsenlacescalculables
individualmentequesinoseaprovechaelsoportedeICMPtimestamps.
En lastablas A.3 y A.4(paralasredesCAIDAyaleatoriarespectivamente)se muestrala
cantidaddeenlacescalculablesdadoelporcentajedenodosquesoportanICMPtimestamps,relativaa
lacantidaddeenlacesvirtualesenelcasoenelquenoseaprovechaelsoporte.Esdecir,lacantidad
deenlacesvirtuales,relativaal0%desoporteICMPtimestamps(terceracolumnadelastablasA.3y
A.4)secalculacomo:
a
i
=
v
i
v
0
(4.1.1)
donde
v
0
eslacantidaddeenlacesvirtualessinsoportedeICMPtimestamps (esdecir,la
primerafiladelastablasA.3yA.4)y
v
i
eslacantidaddeenlacesvirtualesparai%desoportede
ICMPtimestamps.Porejemplo,para10%desoportedetimestamps (esdecir,lasegundafiladela
tablaA.3,correspondientealaredCAIDA)elclculofue:
35810
9848
=3.64
(4.1.2)
Cantidad de informacin que se puede obtener
Otracaractersticainteresanteaobservaresladiferenciaentreelcomportamientodelasredes.
El orden es n
2
, pero el valor no es necesariamente exactamente n
2
, sino que puede ser un
poco menor, debido a los enlaces compartidos entre las distintas rutas.
Es decir, la cantidad de nodos alfa, que para la red CAIDA se fij en 100 y para la red aleatoria
se fij en 11.
63
Captulo 4 Resultados experimentales
Enlafigura4.1.3(d)lascantidadesdeenlacesvirtualesfuerondivididasporeltotaldeenlacesfsicos
decadared,conelpropsitodepermitirapreciarcuntosepuedeaprendersobrecadared.
Seobservafcilmenteque,dadoundeterminadoniveldesoportedetimestamps,enlared
CAIDAsepuededescubrirunporcentajedelosnodostotalesmuchomayorqueenlaredaleatoria.
Estosedebeaqueenlaredaleatoriahaymayorcantidadderutasposiblesentredosnodos
(comoejemplo,verlosnodosA yB delafigura4.1.2).EnunaredcomoladeCAIDAhaypocas
alternativasparalasrutas,yporlotantolosenlacessecompartenms.Estoimplicaqueunmismo
enlaceapareceenmuchasrutas,yporlotantotienemuchamayorprobabilidaddeaparecerenuna
rutacualquieraqueenunenlaceenunaredaleatoriaequivalente.Estopermiteaprendermssobrelos
enlaces,yconsecuentemente,mssobrelared.
Esteresultado coincide con las conclusionesde [Dallasta06],dondese observa que enlas
redes con distribuciones de grados heterogneas, como la red CAIDA, es ms fcil relevar
informacinsobrelaredqueenlasredescondistribucionesdegradoshomogneas,comoeselcaso
enlasredesaleatorias.
Variabilidad
Enlafigura4.1.4setrazanlascurvasdeenlacesvirtualesporseparadoyenescalalinealen
vezdelogartmica,parapoderapreciarsuscaractersticasindividualmente.Lassubfiguras(a)y(b)
correspondenalasredesCAIDAyaleatoriarespectivamente.
Paracadaporcentaje,laalturadelacurvarepresentalamediadelamuestrade100iteraciones,
ylalneaverticalrepresentaeldesvoestndarmuestral.
Enestadstica,elcoeficientedevariabilidad,queesunamedidadedispersin,sedefinecomo
elcocienteentreeldesvoestndarylamedia:
CV=

(4.1.3)
En el grfico, para todos los porcentajes,seobservaqueenelcasodelaredaleatoria,el
desvoesmayorylamediaesmenor,comparadosconlosdelaredCAIDA.Luego,elcoeficientees
mayor,entodoslospuntos,paralaredaleatoria.
Consecuentemente,seobservamayorvariabilidadenlaredhomognea,yesosedebeaquese
puededescubrirmayorcantidaddeinformacinenunaredinhomognea(comolaredderuteadores
obtenida porelproyectoCAIDA)yaque lamayoradelosenlacescoincidenconlasrutasdelos
caminosmscortos.Estosedebealaorganizacinenracimos,talcomoseveenlafigura4.2.1(a).
En la red homognea siempre quedan enlaces sindescubrir que dependen ms fuertemente de la
ubicacindelosnodosalfaqueenelcasodelaredheterognea.Estoquieredecirquelaredaleatoria
esmuchomssensibleaculesseanlosnodoscontrolablesencuantoaloquesepuedeaprender
acercadesuestructura.Comoencadaiteracinlosnodosalfaqueseeligensondistintos,enlared
condistribucindegradosgaussianaseponedemanifiestoesamayorvariabilidad.
64
Captulo 4 Resultados experimentales
(a)
(b)
Figura4.1.4.Cantidaddeenlacesvirtuales,conlneasqueindicaneldesvo
estndarmuestralencadapunto,paralasredesCAIDA(a)yaleatoria(b).
Enlaredaleatoria(b)seobservaqueeldesvoesmayor.
65
Captulo 4 Resultados experimentales
Forma de la curva
Tambinresultainteresanteanalizarlaformadelascurvasdeenlacesvirtuales.Enlafigura
4.1.4(b)seobservaasimplevistaunaaparentelinealidadenelcasodelaredaleatoria.Enelcasode
laredCAIDA,representadoenlafigura4.1.4(a),sibiennoseobservaunalnearecta,lacurvaturano
aparentasermuypronunciada.
Estomotivaelsiguienteanlisisderegresin.
ParaelcasodelaredCAIDA,lafuncinaajustaresladescriptaporlatablaA.3,conelnivel
porcentual de soporte de ICMP timestamps (primera columna de la tabla A.3) como variable
independienteylacantidaddeenlacesobtenidosconeseniveldesoportedetimestamps,relativaala
cantidadconniveldesoportedel0%(terceracolumnadelatablaA.3)comovariabledependiente.
Alllevaracabounajustelineal,seobtienelafuncin:
y=2,5150,16399 x
(4.1.4)
siendoelerrorcuadrticomedio0,6207..
Sinembargo,alllevaracabounajustecuadrtico,seobtienelafuncin:
y=1,20920,25104x0,00087051x
2
(4.1.5)
siendoelerrorcuadrticomedio0,0296.Estevaloresmuchomenorqueparaelcasolineal,y
evidenciaunajustecasiperfecto.
Enlafigura4.1.5(a)segraficanlacurvaysuajustecuadrtico.
Si bien el ajuste cuadrtico arroj mucha mayor precisin que el ajuste lineal, resulta
interesanteobservarlosiguiente:
Losporcentajesaltosdesoportedetimestamps sonirreales.Estosignificaqueelrangode
porcentajesquesepuedenhallarenlarealidadesunapequeapartedelrangosimulado.Comola
curvaturaesrelativamentesuave,elajustelinealnoesdeltodoerrado,locual,sumadoaloanterior,
podrallevaraconjeturarquelaaproximacinmedianteunarectadentrodelrangorealesmuybuena.
Estoseestudiaendetallemsadelante.
Paraelcasodelaredaleatoria,lafuncinaajustaresladescriptaporlatablaA.4(cantidadde
enlacesvirtualesenlaredaleatoriaparalosdistintosnivelesde0%a100%detimestamps,relativaa
lacantidadpara0%detimestamps).
Alllevaracabounajustelineal,seobtienelafuncin:
y=1,15590,15294 x
(4.1.6)
siendoelerrorcuadrticomedio0,0088yelcoeficientedecorrelacinlineal0,9998.Esto
significaqueelajustelinealesexcelente.
Enlafigura4.1.5(b)segraficanlacurvaysuajustelineal.
66
Captulo 4 Resultados experimentales
(a)
(b)
Figura4.1.5.Ajustesdelacurvadecrecimientodelosenlacescalculables.
(a)ajustecuadrticodelacurvaderedCAIDA
(b)ajustelinealdelacurvadelaredaleatoria
67
Captulo 4 Resultados experimentales
Cantidades de cada tipo de nodo
Acontinuacinsepresentaelanlisisdelascantidadesqueselograndescubrirdecadatipode
nodo. Las variables cuantificadas son la cantidad de nodos alfa, la cantidad de nodos beta y la
cantidad de nodos noalfabetos, que en este caso, por analizarse la ejecucin completa, consiste
nicamentedenodosdeltaypsilon,yaquelosgamaseprocesanporcompletoysedesdoblanen
betasypsilons(veralgoritmo3.1.1).
Enlafigura4.1.6serepresentanlascantidadesdecadatipodenodo,paralasredesCAIDA(a)
yaleatoria(b).
Lacantidaddenodosalfasedejfijaparacadared.EnlaredCAIDAsefijen100,yenla
redaleatoriasefijen11.Enambasredesladensidaddealfas(esdecir,lacantidaddenodosalfaque
hayeneltotaldenodosdelared)quedasfijadaen0,11%.
Enambasredes,lacantidaddenodosbetacrecelinealmenteconelporcentajedesoportede
ICMPtimestamps.Estoesnatural,porqueelmencionadosoporteeslacaractersticamsimportante
enlaclasificacindeunnodocomobetaonoalfabeto.Llevandoacabounaregresinlinealparala
variableenlaredCAIDA,seobtienequeelcoeficientedecorrelacines0,9999.Paralaredaleatoria,
seobtieneuncoeficientedecorrelacinmuysimilar:0,99989.
Lacantidaddenodosnoalfabetostienecomportamientosdiferentesenlasdosredes.Enlared
CAIDA,crecerpidamenteamedidaqueseagreganlosprimerosnodosquesoportantimestamps,
peroluegodecrece,amedidaquelosnodosbetavanllenandolosespaciosentrelosnodosalfa.Enla
redaleatoria,crecerpidamenteyluegosedesacelera,peronollegaaretroceder.Elcomportamiento
escompletamentedistintoporque,paralamismaconcentracindealfas,laredaleatoriamantiene
siempreunacantidaddenodosnoanalfabetossignificativa,yaquenosecompartenenlacescomoen
elcasodelaredinhomognea.
Porltimo,esinteresanteobservarque,cuandotodoslosnodosenunaredsoportanICMP
timestamps,lanicaraznporlacualpuedenserclasificadoscomopsilonseslacarenciadealfa
simetra.EnlaredCAIDA,seobservaqueenelescenarioenelqueel100%delosnodossoportan
timestamps,msdel50%delosnodosclasificadossonnoalfabetos.Ensimilarescondiciones,enla
red aleatoria los nodosno alfabetos superan el 80%. La mayor cantidad de nodos noalfabetos
encontradaenlaredaleatoriasedebeaqueesmayorlacantidaddepsilons,yestoltimosedebea
queenunaredaleatoriaresultamsdifcilencontrarunarutasimtrica,yporconsiguientelaalfa
simetra.
68
Captulo 4 Resultados experimentales
(a)
(b)
Figura4.1.6.Cantidadesdelosdistintostiposdenodosqueselograndescubrir,
paralasredesCAIDA(a)yaleatoria(b).
69
0 10 20 30 40 50 60 70 80 90 100
0
250
500
750
1000
1250
1500
1750
2000
2250
2500
2750
alfas
betas
no-alfabetos
soporte de ICMP timestamps %
c
a
n
t
i
d
a
d

d
e

n
o
d
o
s
0 10 20 30 40 50 60 70 80 90 100
0
50
100
150
200
250
300
350
400
450
500
550
alfas
betas
no-alfabetos
soporte de ICMP timestamps %
c
a
n
t
i
d
a
d

d
e

n
o
d
o
s
Captulo 4 Resultados experimentales
Cantidades de enlaces fsicos y virtuales
Resulta interesante comparar el comportamiento de ambas redes en lo que respecta a las
cantidadesquepresentandeenlacesfsicosyvirtualesqueselleganadescubrirparalosdiferentes
nivelesdesoportedeICMPtimestamps.
EnlastablasA.5yA.6seencuentrancalculadosloscocientesentrelascantidadesdeenlaces
fsicosyvirtualesdescubiertosparadistintosnivelesdesoporteICMPenlasredesCAIDAyaleatoria
respectivamente.
Larepresentacingrficaapareceenlafigura4.1.7.
Elmencionadococientepuedeinterpretarsecomoelnmerodeenlacesfsicosquecontiene
cadaenlacevirtual,enpromedio.Porejemplo,enlafigura4.1.7,paralaredaleatoria,para0%de
soportedeICMPtimestamps,elcocienteesaproximadamente2,yestosignificaque,quepromedio,
cadaenlacevirtualconstade2enlacesfsicos.Cuantomayorsealarelacin,menoreslagranularidad
alcanzada.
Enlared CAIDA,elcociente esmenorque1,yesotambinevidencia,aunqueenmenor
medida,prdidaderesolucin.Elresultadosedebeaquemuchosenlacesfsicosaparecenenvarios
enlaces virtuales porque en esta situacin tienden a quedar determinados enlaces virtuales
correspondientesalasrutascompletasentretodopardealfas(esdecir,ungrafocompletoentrelos
alfas),comoconcluye[Zhao05].
Idealmente,enelcasodelconocimientocompletodelared,elcocientesera1,porquetodos
losenlacesfsicossepodrancalcularindividualmente(esdecir,habraexactamente1enlacefsico
porcadaenlacevirtual).
Porltimo,observandolacurvacorrespondientealaredCAIDA,seadviertequeinicialmente
sealejadel1.Estonorepresentamenorcantidaddeinformacin,porquecomosepuedeobservaren
lafigura4.1.3(c),lacantidaddeenlacesfsicosdescubiertoscreceampliamente:segnlatablaA.1,al
pasarde0a10%desoportedeICMPtimestamps, lacantidaddeenlacesfsicospasade8.068a
27.043(esdecir,3,35veces),mientrasquelacantidaddeenlacesvirtualespasade9.848a35.810(es
decir,3,64veces).Estomuestraporqusereducelevementeelcociente,perotambinindicalagran
cantidaddenuevosenlacesfsicosdescubiertos.
70
Captulo 4 Resultados experimentales
Figura4.1.7.Cocienteentrelascantidadesdescubiertasdeenlacesfsicosyvirtuales,paralas
redesCAIDAyaleatoria.SeobservaqueenlaredCAIDAelcocienteesmenora1,
yenlaredaleatoriaelcocienteesmayora1.
Valores pequeos del porcentaje de soporte de ICMP timestamps
Comoseanalizmsarriba,contanslo10%desoportedeICMPtimestamps enlaredla
ganancia en cantidad de informacin es enorme. Adems, en la realidad, el soporte de ICMP
timestamps es relativamente bajo. Resulta entonces de inters estudiar el comportamiento de las
variablesmsminuciosamenteentreel0%yel10%.
Paraestudiaresaregin,sellevaronacabosimulacionesparavaloresdelparmetroentreel
0%yel10%enincrementosde1%.Losvaloresdelasvariablesobservadasseencuentranenlas
tablasA.7(redCAIDA)yA.8(redaleatoria).
La figura 4.1.8 representa las cantidades de enlaces virtuales dividido el total de enlaces
fsicosdecadared(estoltimo,hechoconelpropsitofacilitarlavisualizacindecuntosepuede
aprendersobrecadared),paraporcentajespequeosdesoportedeICMPtimestamps,yesanlogaa
lafigura4.1.3(d),queseocupadelrangocompletodeporcentajes.
Enlafigura4.1.8sepuedeapreciarcmocreceelconocimientosobrecadared,inclusoenel
escenariodondeelniveldesoportedeICMPtimestampsesmuybajo.Seobservaquelacantidadde
informacinquelametodologadescriptaenestetrabajopermiteadquiriressignificativamentemayor
queconlatcnicacorrespondientealestadodelarteactual.
71
0 10 20 30 40 50 60 70 80 90 100
0.7
0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2
2.1
red CAIDA
red aleatoria
soporte de ICMP timestamps %
e
n
l
a
c
e
s

f

s
i
c
o
s

/

e
n
l
a
c
e
s

v
i
r
t
u
a
l
e
s
Captulo 4 Resultados experimentales
Figura4.1.8.CantidaddeenlacesvirtualesparaporcentajespequeosdesoportedeICMP
timestampsenlasredesCAIDAyaleatoria.
Cantidad de enlaces virtuales en el rango reducido
SeobservaqueaunqueelniveldesoportedeICMPtimestampsseatanbajocomoel1%,de
todas maneras el incremento obtenido en la cantidad de enlaces virtuales (es decir, calculables
individualmente)esconsiderable.
Porejemplo,paralaredCAIDA,enlasegundafiladelatablaA.7sepuedeapreciarquecon
tansloun1%desoportedeICMPtimestampsentrelosnodosdelared,sepasade9.848a12.541
enlacesvirtuales,esdecir,seobtieneun27%msdeenlacescalculablesindividualmentequesinose
aprovechaelsoportedeICMPtimestamps.
Las tablas A.9 y A.10, que contienen los valores numricos para la cantidad de enlaces
calculables dado el porcentaje de nodos que soportan ICMP timestamps, en forma relativa a la
cantidaddeenlacesvirtualesenelcasoenelquenoseaprovechaelsoporte,yparaelrangoreducido,
se calculan en base a las tablas A.7 y A.8 en formaanlogaacomo,para elrangocompleto,se
calculanlastablasA.3yA.4enbasealastablasA.1yA.2,comoseexplicmsarribaenestamisma
seccin.
Enlafigura4.1.9setrazanlascurvasdeenlacesvirtualesporseparadoyenescalalinealen
vez de logartmica, para poder apreciar sus caractersticas individualmente. Las lneas verticales
representaneldesvoestndarencadapuntodelamuestrade100iteracionesquesellevaronacabo
paraesepunto.Lassubfiguras(a)y(b)correspondenalasredesCAIDAyaleatoriarespectivamente.
SesigueobservandomenorvariabilidadenlaredCAIDA,productodelamenorsensibilidaddeesa
redalaeleccinaleatoriadelosnodosalfaencadaiteracin,explicadamsarriba.
72
0 1 2 3 4 5 6 7 8 9 10
0.0%
0.1%
1.0%
10.0%
100.0%
red CAIDA
red aleatoria
soporte de ICMP timestamps %
e
n
l
a
c
e
s

v
i
r
t
u
a
l
e
s

/

t
o
t
a
l
e
s

%
Captulo 4 Resultados experimentales
(a)
(b)
Figura4.1.9.Cantidaddeenlacesvirtualesenelrangoreducido,conlneasqueindicaneldesvo
estndarmuestralencadapunto,paralasredesCAIDA(a)yaleatoria(b).
Enlaredaleatoria(b)seobservaqueeldesvoesmayor.
73
Captulo 4 Resultados experimentales
Forma de la curva en el rango reducido
En el rango completo, la curvade enlacesvirtualesparalaredCAIDAresultacuadrtica,
aunqueconunacurvaturanodemasiadopronunciada(coeficientedecorrelacinlineal0,9887).Para
elrangoreducido,aparentasercasiexactamentelineal.
Llevandoacabounajustelineal,seobtienelasiguienterecta:
y=1,02640,26836x
(4.1.7)
siendo el error cuadrticomedio 0,0107yelcoeficientedecorrelacinlineal0,9993.Esto
significaqueelajustelinealescasiperfecto.Enlafigura4.1.10(a)sepuedeapreciarlasuperposicin
delafuncinysuajustelineal.
La observacin interesante es que la curvapresentalinealidadparaelrangoreducido,que
justamenteeselmsimportante(debidoaqueestconstituidopornivelesdesoportedetimestamps
verosmiles).
Porsuparte,laredaleatoriaconservaenelrangoreducidolalinealidadqueyaseobserven
elrangocompleto.
Alllevaracabounajustelineal,seobtienelafuncin:
y=0,984550,16327x
(4.1.8)
siendoelerrorcuadrticomedio0,0004yelcoeficientedecorrelacinlineal0,99923.Esto
significaqueelajustelinealesexcelente.
Enlafigura4.1.10(b)segraficanlacurvaysuajustelineal.
Comparandolasdosrectas,sepuedeobservarquelapendientedelarectacorrespondienteala
redCAIDAesmuchomayorquelacorrespondientealaredaleatoria.Estosignificaque,amedida
queseincrementaelporcentajedesoportedeICMPtimestamps,enlaredCAIDAseincrementams
rpidamentelacantidaddeinformacinquesepuedeobtener.Estosedebeaqueaumentarelnivelde
soportedetimestamps equivaleaagregarbetas,ycomosedetallmsarriba,enlaredCAIDAlos
nodossecompartenmsentrelasrutas,locualpermitequeunnuevobetaarrojeluzsobreunamayor
proporcindelasrutasexistentesqueenlaredaleatoria.
74
Captulo 4 Resultados experimentales
(a)
(b)
Figura4.1.10.Ajustesdelacurvadecrecimientodelosenlacescalculablesenelrangoreducido.
(a)ajustecuadrticodelacurvaderedCAIDA
(b)ajustelinealdelacurvadelaredaleatoria
75
Captulo 4 Resultados experimentales
Cantidades de enlaces fsicos y virtuales en el rango reducido
No se observan nuevos detalles en esta rea, ya que las curvas presentan las mismas
propiedadesqueenelrangocompleto.
Los datos corresponden a las tablas A.11 y A.12 (para las redes CAIDA y aleatoria
respectivamente)ysegraficanenlafigura4.1.11.
El cociente para la red aleatoria se acerca al 1 (caso ideal) y en la red CAIDA se aleja
levemente,locualnoesmalo,considerandoelenormecrecimientoenlacantidaddeenlacesfsicos
descubiertos,quesepuedevisualizarenlafigura4.1.3(c)yleerenlatablasA.7(redCAIDA)yA.8
(redaleatoria).
Figura4.1.11.Cocienteentrelascantidadesdescubiertasdeenlacesfsicosyvirtuales,
paraelrangoreducido,enlasredesCAIDAyaleatoria.
4.2. Procesamiento de datos reales
ExperimentarcondatosdelproyectoDIMESresultainteresanteporvariosmotivos.Elprimer
motivoesquesetratademedicionesrealesenInternet,locualpermiteobservarsilateorafunciona
tambinenestecaso.
76
0 1 2 3 4 5 6 7 8 9 10
0.7
0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2
2.1
red CAIDA
red aleatoria
soporte de ICMP timestamps %
e
n
l
a
c
e
s

f

s
i
c
o
s

/

e
n
l
a
c
e
s

v
i
r
t
u
a
l
e
s
Captulo 4 Resultados experimentales
Elsegundomotivoesquesepartirdelosvaloresdelasmedicionesesbsicamenteelproceso
inverso al efectuado hasta el momento: en esta seccin se determinan los nodos a partir de las
mediciones.
Untercermotivoconsisteenestudiarelefectodeconsideraralfabetos

adicionalesenlared,es
decir,considerarcomoalfabetosanodosquenonecesariamenteloson.
Los datos utilizados
SeutilizarondatosdelproyectoDIMES.SepartideunconjuntodemedicionesenInternet,
conlassiguientescaractersticas:
Semidieron200.000rutas.
Cadarutafuemedida4veces.
Porcadarutasecuentaconunalistadelosnodosquelacomponen,yporcadanodo
secuentaconlasiguienteinformacin:
Nmerodeorden(porejemplo,elprimernododelarutarecibeelnmero1).
DireccinIP
Tiempopromedio(entrelas4mediciones)desdeeliniciohastaelnodo.
Enlatabla4.2.1sepuedeverunejemplodeunarutamedida.
Lademoraobservadaparaunarutafuecalculadacomoeltiempohastaelltimonodo,menos
eltiempohastaelprimernodo.Siseconsideraquelarutaensutotalidadesunamedicindepuntaa
punta,entonceslamedicindelarutadelafigura4.2.1esde119ms.Sinembargo,seexperiment
conlaposibilidaddedesglosarunarutamedidaenrutasmspequeas.Estoseexplicamsadelante.
Nmero
deruta
Nmero
deorden
DireccinIP
Tiempopromedio
(ms)
21685 1 66.185.132.33 0
21685 2 66.185.138.64 27
21685 3 66.185.152.182 38
21685 4 66.185.147.193 73
21685 5 209.58.47.1 81
21685 6 216.6.84.13 99
21685 7 58.71.0.146 78
21685 8 203.111.239.54 108
21685 9 203.111.239.201 119
Tabla4.2.1.EjemploderutamedidaporelproyectoDIMES.
Los alfabetos, segn se explica en la seccin 3.1, son los nodos capaces de ser extremos de
una medicin.
77
Captulo 4 Resultados experimentales
El experimento
El anlisis a partir de las mediciones de rutas es en cierta forma el proceso inverso a la
experimentacindescriptaenlasseccionesanterioresdeestecaptulo.Enestaseccin,nosepartede
losnodosparadeterminarlasrutasyluegomedirlas,sinoquesepartederutasmedidasysellegaa
losnodos.
Comosedetallenelcaptulo3,losalfabetossonextremosdelasmediciones,yalahorade
determinarcules rutasson mediblesesindispensabledesglosarlosenalfasybetas.Sinembargo,
comoenelescenarioplanteadoenestaseccinnoesnecesariodeterminarculesrutassonmedibles,
porque justamentelas rutas ya fueron medidas, los alfasybetas sonconsideradoscolectivamente
alfabetos.
Elprimerpasodelprocedimientoconsistienrecorrerelconjuntodemedicionesymarcar
comoalfabetosatodoslosnodosqueaparecancomoextremodealgunamedicin.
Obtenidalalistadealfabetos,sevolviarecorrerelconjuntodemediciones,ycuandouna
rutamedidapresentabaunnodointermedioalfabeto,setomcomodosmediciones.Esdecir,sienla
ruta:
n
1
n
2
... n
i1
n
i
n
i1
... n
j 1
n
j
elnodo
n
i
habasidomarcadocomoalfabetoenlaprimerapasada,entonceslamedicinse
tomcomolassiguientesdosmedicionesporseparado:
n
1
n
2
... n
i1
n
i
n
i
n
i1
... n
j 1
n
j
Estemtodoseaplicencadarutamedidahastaqueningunamedicinquedconalfabetos
intermedios.
Cuandounarutamedidaesdesglosadaenrutasmspequeas,lademoraobservadasecalcula
como en el siguiente ejemplo: si el nodo 209.58.47.1 fuera considerado alfabeto (extremo de
medicin),entonceslamedicindelatabla4.2.1podratraducirseendosmedicionesporseparado:
Laruta66.185.132.33209.58.47.1,condemoraobservada81ms.
Laruta209.58.47.1203.111.239.201,condemoraobservada38ms.
Sedescartaronlasmedicionesquepresentabaninconsistencias,deacuerdoalossiguientes
criterios:
Seconsideraronnicamenterutasacclicas.Consecuentemente,sedescartaronlas
medicionesenlasqueunamismadireccinIPaparecamsdeunavez.
Sedescartaronlasmedicionesquearrojabanvaloresnegativos.Porejemplo,enlaruta
78
Captulo 4 Resultados experimentales
delatabla4.2.1,silosnodos209.58.47.1y58.71.0.146fueranconsideradosalfabetos,
entonceslademoraobservadasera3ms.Luego,larutaentreesosdosnodoses
descartada.Elprocesodesubdivisindelasrutasseexplicaendetallemsadelante.
Sedescartaronlasmedicionesquearrojabanvaloresexcesivamentegrandesy
apartadosdelarealidad,queevidenciabanerrores.Porejemplo,siunarutaarrojauna
demoraobservadade293284ms,esdescartada.
Acontinuacin,seaplicelalgoritmo3.2.1paradeterminarlosenlacesvirtuales,yseverific
quelosmismoserancorrectos.
Seguidamenteseestudielefectodeconvertirenalfabetosanodosquenoaparecancomo
extremodeningunamedicin.Sehicieron100iteracionesconvirtiendoenalfabetosal10%delos
nodosalosquelescorrespondasernoalfabetos.Luegoserepitipara20%,30%,yashastallegar
al100%enintervalosde10%.
Losresultadossepresentanenlatabla13delanexoA.
Enlafigura4.2.1segraficanlosresultadosdelatablaA.13.Sepuedeapreciarque,amedida
queseagreganalfabetosadicionales,seincrementalacantidaddeenlacescalculables.
Sin embargo, la cantidad de enlaces fsicos decrece. Esto se debe a que, de acuerdo a la
polticaestablecida,cuandohayunalfabetoenelmediodeunamedicin,lamismasetomacomo2
medicionesporseparado.Alanalizarlasmedicionesrealesentrozosmspequeos,sedetectanms
inconsistencias,yesollevaadescartarmediciones.Consecuentemente,lacantidaddeenlacesfsicos
abarcadosenelconjuntodemedicionesdecrece.
79
Captulo 4 Resultados experimentales
Figura4.2.1.Enlacesfsicosyvirtualesalagregaralfabetosadicionales
alconjuntodemedicionesdeDIMES.
Figura4.2.2.CantidaddeenlacesvirtualesenlosdatosdeDIMES,relativaalacantidadtotal
deenlacesfsicosinvolucrados.Estafiguraesanlogaalafigura4.1.3(d).
80
0 10 20 30 40 50 60 70 80 90 100
0
100
200
300
400
500
600
700
800
900
1000
1100
enlaces fsicos
enlaces virtuales
alfabetos adicionales %
c
a
n
t
i
d
a
d

d
e

e
n
l
a
c
e
s
0 10 20 30 40 50 60 70 80 90 100
10%
100%
alfabetos adicionales %
e
n
l
a
c
e
s

v
i
r
t
u
a
l
e
s

/

t
o
t
a
l
e
s

%
Captulo 4 Resultados experimentales
Aladerechadelafigura4.2.1sepuedeobservarquecuandotodoslosnodossonalfabetos,
losenlacesfsicoscuyasmedicionesnoresultaroninconsistentessepuedencalcularindividualmente.
Paracompararelcrecimientodelacantidaddeenlacesvirtualesenestaredconlosdelas
redesdelaseccin4.1,setrazlafigura4.2.2,anlogaala4.1.3(d).
Comparandolasfiguras4.2.2y4.1.3(d)seobservaquelacurvaobtenidaconlosdatosde
DIMESseasemejaalacurvaobtenidaparalaredCAIDA,perocrecemslentamenteporque,debido
alasinconsistencias,muchosenlacesfsicossoneliminados.
Acontinuacinseanalizalaformadelacurva.
Alllevaracabounajustecuadrtico,seobtienelafuncin:
y=1,05670,054404 x0,00012249x
2
(4.2.1)
siendoelerrorcuadrticomedio0,0027.Estevalorindicaqueelajustecuadrticoesexcelente.
Enlafigura4.2.3segraficanlacurvaysuajustecuadrtico.Esanlogaalafigura4.1.5(a)de
laredCAIDA.
Figura4.2.3.Ajustecuadrticodelacurvadecrecimientodelosenlacesvirtuales.
81
Captulo 4 Resultados experimentales
Cabedestacarqueenambasredeslacurvatieneformacuadrtica.
Enlasdosecuaciones(4.1.5y4.2.1)loscoeficientessondelmismoorden,perolosdelared
CAIDAsonunpocomayores.
ElcoeficientelinealdeCAIDAes4.6veceseldelaredaleatoria.Estoesporqueenlared
CAIDAseaprendeunacantidadmayordeinformacinconrespectoaltotal.
Elcoeficientecuadrtico deCAIDAes7.1veceseldelaredaleatoria.Lacurvatrazadaa
partirdelosdatosdeDIMESesmschataquelacurvadelaredCAIDA.
En la figura 4.2.4 se puedeapreciar laevolucindelcocienteentrelacantidaddeenlaces
virtualesylacantidaddeenlacesfsicos.Laproporcinaumentaamedidaqueseagreganalfabetos
adicionales,hastaquellegaal100%cuandoel100%delosnodosseconsideranalfabetos.Esaesla
situacinenlacualtodoslosenlacesfsicossepuedencalcularindividualmenteyentonceslaredse
conoceensutotalidad.
Figura4.2.4.Relacinentrelacantidaddeenlacesvirtualesyfsicos
alagregaralfabetosadicionalesalconjuntodemedicionesdeDIMES.
82
0 10 20 30 40 50 60 70 80 90 100
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
alfabetos adicionales %
e
n
l
a
c
e
s

v
i
r
t
u
a
l
e
s

/

e
n
l
a
c
e
s

f

s
i
c
o
s
Captulo 4 Resultados experimentales
4.3. Conclusiones
Losprimeroscaptulosdeestetrabajosealan,desdelateora,quesepuedeutilizarelsoporte
deICMPtimestampsdelosnodosdeunaredparaincrementarelconocimientoquesepuedeobtener
deella.Asimismo,explicanelprocedimientoparaextraerlamayorcantidadposibledeinformacin.
Las simulaciones presentadas en este captulo permitieron comprobar el beneficio de
aprovecharlosnodosquesoportanICMPtimestamps(aunquestosseanpocos)obtenindosemucha
msinformacinaniveldelosenlacesquesinoselostieneencuenta.
La experimentacin efectuada involucr a topologas tanto homogneas (como la red
aleatoria)comonohomogneas(comolaredCAIDAanivelderuteadores)yadatosreales(comolas
mediciones del proyecto DIMES y la topologa de la red CAIDA) como sintticos (como la red
aleatoria).
LassimulacionesenlasredesCAIDAyaleatoriaarrojaronsimilitudesydiferencias,quese
resumen y comentan en la tabla4.3.1.Lasdiferenciasencontradascoincidenconlo enunciado en
[Dallasta06].
ElexperimentoconlosdatosdelproyectoDIMESpermiticomprobar,porunlado,quela
metodologaesaplicableamedicionesreales,yporelotro,quecuandolatotalidaddelosnodosdela
redsonalfabetos,todoslosenlacesdelaredpuedendescubrirseycalcularseindividualmente.
Losexperimentoscondatosreales(CAIDAyDIMES)coincidieronenlaforma(cuadrtica)y
elordendelacantidaddeenlacesvirtualesqueselograndescubrirrelativaaltotaldeenlacesfsicos
de cada red. En el caso de DIMES se puede ver una pequea desaceleracin, que se debe a las
inconsistenciasinherentesalprocesoderealdetomadedatos.
Tambinseverificenestecaptuloquelosenlacesvirtualescalculablesymnimosobtenidos
conlosalgoritmosactualescoincidenconlosdeterminadosporlosalgoritmosnuevos,quetienenuna
complejidaddeclculomuchomenor.
83
Captulo 4 Resultados experimentales
Red CAIDA aleatoria
Topologa jerrquica,en
racimos,
heterognea
alazar,
homognea
Distribucindelos
gradosdelosnodos
depotencias,
colapesada
normal,
colaliviana
Densidaddealfas
utilizada
0.11% 0.11% enlasdosredesseutilizlamisma
proporcindealfasenrelacinaltotalde
nodosdecadared
Cantidadde
informacinobtenida
alta baja aumentacuandolosnodosyenlacesse
compartenentremuchasrutas
Variabilidadenla
cantidadde
informacin
baja alta aumentacuandolacantidaddeinformacin
quesepuedeobtenerdependefuertementede
laubicacindelosalfas
Curvadecrecimiento
delosenlacesvirtuales
(0a100%deICMP)
cuadrtica
(ec.4.1.5)
lineal
(ec.4.1.6)
lacurvadelaredCAIDAnoesmuy
pronunciada
Curvadecrecimiento
delosenlacesvirtuales
(0a10%deICMP)
lineal,con
pendiente
grande
(ec.4.1.7)
lineal,con
pendiente
chica
(ec.4.1.8)
lapendientegrandeimplicaquelacantidadde
informacinobtenidacrecemsrpidamente,
yesoescaractersticodelasredesconcola
pesada
Cantidaddenodosbeta lineal lineal porqueelsoportedetimestampsesla
caractersticadeterminante
Cantidaddeenlaces
fsicosdescubiertos
lineal lineal porquelacantidaddenodosbetacrece
linealmente
Tabla4.3.1.SimilitudesydiferenciasentrelasredesCAIDAyaleatoria.
84
5. CONCLUSIONES
En este breve captulo se resume el trabajo realizado, se destacan las principales
contribucionesysedescribenlneasposterioresdeinvestigacin.
5.1 Contribuciones de esta tesis
Primeramentesellevacabounestudiodelestadodelarte.Seanalizaronartculosdelas
principaleslneasdeinvestigacindelatomografadeunared,ascomotambinotrosrelacionados.
Adems,seexaminaronproyectosdedicadosalestudiodelatopologadeInternet,comoCAIDAy
DIMES.
Delrelevamientosurgiquelastcnicasmsavanzadasparallevaracabolatomografade
unarednoaprovechanelsoportedeICMPtimestamps.Estonoescasual,sinoquesedebeauna
decisinfundadaenelargumentodequelamayoradelosruteadoresenInternetnoproveensoporte
deICMPtimestamps,yquenoesunabuenaideadependerdealgoquenopuedegarantizarse.
El presente trabajo sostiene que el hecho de que una determinada caracterstica de
infraestructura noestpresenteentodoslosnodosdeunarednoesmotivosuficientecomopara
descartarlaposibilidaddeaprovecharla.Surgieronentoncespreguntascomo:Esposibleutilizarel
soportedeICMPtimestampsdelospocosnodosquelosoportan,yobtenerdeesemodounacantidad
deinformacinmuchomayorquesidirectamentesedesestimaralaposibilidaddetenerlosencuenta?
Y,siesposible,cmoaprovecharlo?
Uno de los aportes de esta tesis fue responder esas preguntas. Se ha creado un nuevo
procedimientoque,efectivamente,posibilitaaprovecharelsoportedeICMPtimestampsdelosnodos
quelotengan,yaunqueestosseanpocos,permiteobtenerunmayorvolumendeinformacinsobrela
red.
Lanuevatcnicacomienzaconlosnodoscontrolablesdelared(esdecir,aquellosnodosalos
que se tiene acceso), y se basa en el conocido hecho de que, cuando un nodo soporta ICMP
timestamps, es posible sincronizarloalosnodoscontrolados.Siesposiblesincronizar dosnodos,
entoncesesposiblemedirlademoradelarutaentreellosenambossentidos.Yesimportantepoder
medirlademora en ambos sentidosporque,porejemplo,enmomentosdecongestin, unpaquete
85
Captulo 5 Conclusiones
puedenotardarelmismotiempoyendodesdeelnodoAhastaelnodoBqueenelsentidocontrario.
Hastaahora,lamedicinenambossentidosslosehabaefectuadoentrenodoscontrolables.
Utilizaralosnodosnocontrolables(perosincronizables)comoextremosdemedicincomplicael
anlisis,porqueademsdelasrutasentrenodoscontrolables,aparecenrutasentreparesdenodosen
loscualesunoescontrolableyelotrono.
Paraatacarel problema, se desarroll unaclasificacindenodos, segnlacuallosnodos
controlables son alfas, y los no controlables se subdividen en betas (sincronizables), psilons (no
sincronizables) y las categoras intermedias (gama y delta) para los nodos cuya sincronizabilidad
todavanofuedeterminadaporelsistema.Lasrutasmediblessonlasquevanentredosalfasoentre
unalfayunbeta.
ElsiguientepasoconsisteendeterminarlosMILSesdelsistemaparaminimizarelsesgodela
estimacin.ElMILSesconceptodelestadodelarteactualqueserefiereaunenlacevirtual(esdecir,
un enlace compuesto por la concatenacin de 1 ms enlaces fsicos) con dos caractersticas
adicionales:esidentificable(lademoraenelenlacesepuedecalcularindividualmente)yesmnimo
(siselequitaracualquieradelosenlacesfsicosquelocomponen,dejaradeseridentificable).
ElmejoralgoritmohastaelmomentoparadeterminarlosMILSesconsistaentomarcadaruta
yporcadasubconjuntoposibledeenlacesfsicosconsecutivosverificarmediantelaproyeccinsobre
elsubespaciogeneradoporlasrutassielenlaceeraidentificable.Lacomplejidaddeesealgoritmoes
O(rkl
2
),dondereslacantidadtotalderutas,keslacantidadderutasamedir,yleslalongitudmedia
deunaruta.
Elnuevoalgoritmopropuestoconsistesimplementeentomarcadarutaypartirladeacuerdoa
losnodosalfabetos.Lacomplejidadresultamuchomenor:O(rl).
Seimplementaronlosalgoritmosdevariaslneasdeinvestigacinactuales,ascomotambin
los propuestosen este trabajo. La lista completa dealgoritmosimplementados seencuentra enel
apndiceB.Losprincipalesson:
AlgoritmosdeseleccinderutasamonitorearyclculodeMILSes,deChen,Zhaoet
al.[Chen04,Zhao06].
Algoritmosdeseleccinderutasamonitorearyprediccinestadstica,deChuaetal.
[Chua05].
Algoritmosdeclasificacindenodos,creacindelamatrizderuteoydeterminacin
delosenlacesidentificables,presentadosenestatesis.
Se llevaron a cabo simulaciones con topologas homogneas (como la red aleatoria),
topologas no homogneas (como la red CAIDA) y con datos reales (como las mediciones del
86
Captulo 5 Conclusiones
proyectoDIMESylatopologadelaredCAIDA)ysintticos(comolaredaleatoria).Altrabajarcon
losdatosdeDIMES,tambinseestudielprocesoinverso,declasificarlosnodosapartirdelasrutas
medidas,envezdedeterminarlasrutasmedidasenbasealosnodosclasificados.
Losexperimentoscomprobaronquelosresultadosarrojadosporlosmtodosactualesynuevos
soniguales.Cabedestacarquelacomplejidaddelosnuevosalgoritmosesmuchomenor.
Losexperimentos tambinpermitieroncomprobarqueefectivamentelainformacin quese
puedeobteneraprovechandoelsoportedeICMPtimestampsessignificativamentemayor,ancuando
muypocosnodosenlaredtenganelsoporte.
Losresultadosexperimentalessobrelacantidaddeinformacinquesepuedeextraerdecada
redsealanquelascantidadesdenodosyenlacesrelevadosenunaredcondistribucindegradosde
colapesada(comoCAIDA)esmayorqueenlatopologaaleatoria,locualcoincideconloobservado
en[Dallasta06].
Se observ que algunas variables crecen linealmente con el nivel de soporte de ICMP
timestampsenlared,comolacantidaddenodosbeta,lacantidaddeenlacesfsicosdescubiertosyla
cantidad de enlaces virtuales (aunque esta ltima slo es completamente lineal para porcentajes
pequeosdesoportedetimestamps).
LapendientedelarectaesmayorenelcasodelaredCAIDA,locualsignificaquelacantidad
deinformacinquesepuedeadquirircrecemsrpidamente,ysedebeaquelaredCAIDAesuna
reddecolapesada.Porotraparte,conocerlaspendientespermitetenerunaideadequesperar.
ElexperimentoconlosdatosdelproyectoDIMESpermiticomprobarque:
lametodologaesaplicableamedicionesreales
cuandolatotalidaddelosnodosdelaredsonalfabetos,todoslosenlacesdelared
puedendescubrirseycalcularseindividualmente.
Cabedestacarquelosexperimentoscondatosreales(CAIDAyDIMES)coincidieronenla
forma(cuadrtica)yelordendelacantidaddeenlacesvirtualesqueselograndescubrirrelativaal
totaldeenlacesfsicosdecadared.EnelcasodeDIMESseobservaunapequeadesaceleracin,que
sedebealasinconsistenciasquepresentanlosdatosenunprocesodemedicinreal.
5.2 Futuras lneas de investigacin
Dadaslasinnovacionespresentadasenestetrabajo,seabreunagrancantidaddecuestionesa
investigarmsdetalladamente.Acontinuacinsedescribenalgunasdelasmsimportantes.
87
Captulo 5 Conclusiones
Elaspectomsimportanteaestudiar,yqueconstituyeelsiguientepasoenlainvestigacin,es
elestadstico.Estoes,encararlametodologadesdeelpuntodevistadelaestimacindelasdemoras
enlosenlacescomovariablesaleatorias,ydeterminarunacotadelerror.
Tambinesnecesarioestudiarlacantidaddemedicionesquesedebenrealizarsobrecadaruta.
Porltimo,esigualmenteinteresanteestudiarlainfluenciadelacantidadyubicacindelos
alfasenlaestimacin,paradeterminarcuntosalfassenecesitanparamejorarunaestimacinyen
qupartesdelared.
Lasegundacuestinaestudiarendetalleeslapolticadeexploracin.Luegodetrazadaslas
rutas y clasificados los nodos, queda un conjunto de nodos delta, que pueden ser investigados
recursivamenteparaabarcarunaporcinmayordelared.DadoeltamaodeInternet,hastaahorala
polticautilizadaconsistiennoaplicarlametodologarecursivamenteenlosdeltassurgidosdurante
el proceso de clasificacin de nodos. Queda para el futuro estudiar otras polticas que permitan
aumentarlaporcinabarcadamanteniendouncrecimientocontrolado.
Unaterceralneasumamenteinteresanteesintegrarlasnuevasmetodologasconelproyecto
DIMES, de modo tal que se comiencen a utilizar como estrategia para determinar las rutas ms
convenientesparamedir.Tambinesimportantedesarrollarmejoresmtodosparalaresolucinde
inconsistenciasenlasmediciones.
88
ANEXO A. DATOS EXPERIMENTALES
%desoportede
ICMPtimestamps
nodos
beta
nodos
noalfabetos
enlaces
fsicos
enlaces
virtuales
0 0 1731 8068 9848
10 163 2196 27043 35810
20 336 2430 45788 60229
30 495 2494 61897 79073
40 664 2537 78963 98038
50 830 2532 95461 114365
60 1000 2514 112142 128858
70 1166 2461 128042 142030
80 1323 2398 142901 152962
90 1483 2333 157801 162833
100 1682 2264 177343 176641
TablaA.1.Variablesobservadas.RedCAIDA.Rangocompleto.
Referenciadaenlaseccin4.1.
%desoportede
ICMPtimestamps
nodos
beta
nodos
noalfabetos
enlaces
fsicos
enlaces
virtuales
0 0 87 229 110
10 9 153 471 288
20 18 217 715 470
30 27 271 943 647
40 35 317 1145 807
50 43 360 1344 966
60 53 405 1574 1153
70 61 437 1749 1299
80 70 475 1962 1475
90 78 508 2159 1640
100 87 537 2344 1796
TablaA.2.Variablesobservadas.Redaleatoria.Rangocompleto.
Referenciadaenlaseccin4.1.
89
Anexo A Datos experimentales
%desoportede
ICMPtimestamps
enlaces
virtuales
enlacesvirtuales,relativoal0%
desoporteICMPtimestamps
0 9848 1
10 35810 3.64
20 60229 6.12
30 79073 8.03
40 98038 9.96
50 114365 11.61
60 128858 13.08
70 142030 14.42
80 152962 15.53
90 162833 16.53
100 176641 17.94
TablaA.3.Relacinentrelacantidaddeenlacescalculablesparadistintosnivelesdesoportede
ICMPtimestampsylacantidadcuandonosecontemplasuuso.RedCAIDA.Rangocompleto.
Referenciadaenlaseccin4.1.
%desoportede
ICMPtimestamps
enlaces
virtuales
enlacesvirtuales,relativoal0%
desoporteICMPtimestamps
0 110 1
10 288 2.62
20 470 4.27
30 647 5.88
40 807 7.34
50 966 8.78
60 1153 10.48
70 1299 11.81
80 1475 13.41
90 1640 14.91
100 1796 16.33
TablaA.4.Relacinentrelacantidaddeenlacescalculablesparadistintosnivelesdesoportede
ICMPtimestampsylacantidadcuandonosecontemplasuuso.Redaleatoria.Rangocompleto.
Referenciadaenlaseccin4.1.
90
Anexo A Datos experimentales
%desoportede
ICMPtimestamps
enlacesfsicos enlacesvirtuales relacin
0 8068 9848 0.82
10 27043 35810 0.76
20 45788 60229 0.76
30 61897 79073 0.78
40 78963 98038 0.81
50 95461 114365 0.83
60 112142 128858 0.87
70 128042 142030 0.90
80 142901 152962 0.93
90 157801 162833 0.97
100 177343 176641 1.00
TablaA.5.Cocienteentrelacantidaddeenlacesfsicosyvirtualesquesedescubrenenlared.
RedCAIDA.Rangocompleto.
Referenciadaenlaseccin4.1.
%desoportede
ICMPtimestamps
enlacesfsicos enlacesvirtuales relacin
0 229 110 2.08
10 471 288 1.64
20 715 470 1.52
30 943 647 1.46
40 1145 807 1.42
50 1344 966 1.39
60 1574 1153 1.37
70 1749 1299 1.35
80 1962 1475 1.33
90 2159 1640 1.32
100 2344 1796 1.31
TablaA.6.Cocienteentrelacantidaddeenlacesfsicosyvirtualesquesedescubrenenlared.
Redaleatoria.Rangocompleto.
Referenciadaenlaseccin4.1.
91
Anexo A Datos experimentales
%desoportede
ICMPtimestamps
nodos
beta
nodos
noalfabetos
enlaces
fsicos
enlaces
virtuales
0 0 1731 8068 9848
1 16 1808 10091 12541
2 33 1879 12184 15391
3 49 1916 14057 18045
4 69 1992 16454 21230
5 82 2026 18031 23435
6 99 2064 19831 25969
7 117 2106 21950 28732
8 135 2148 23878 31344
9 152 2185 25901 34144
10 163 2196 27043 35810
TablaA.7.Variablesobservadas.RedCAIDA.Rangoreducido.
Referenciadaenlaseccin4.1.
%desoportede
ICMPtimestamps
nodos
beta
nodos
noalfabetos
enlaces
fsicos
enlaces
virtuales
0 0 87 229 110
1 1 95 255 128
2 2 100 274 142
3 3 106 301 162
4 3 113 323 178
5 4 119 346 195
6 5 128 379 219
7 6 136 406 238
8 7 140 424 253
9 8 146 445 267
10 9 153 471 288
TablaA.8.Variablesobservadas.Redaleatoria.Rangoreducido.
Referenciadaenlaseccin4.1.
92
Anexo A Datos experimentales
%desoportede
ICMPtimestamps
enlaces
virtuales
enlacesvirtuales,relativoal0%
desoporteICMPtimestamps
0 9848 1
1 12541 1.27
2 15391 1.56
3 18045 1.83
4 21230 2.16
5 23435 2.38
6 25969 2.64
7 28732 2.92
8 31344 3.18
9 34144 3.47
10 35810 3.64
TablaA.9.Relacinentrelacantidaddeenlacescalculablesparadistintosnivelesdesoportede
ICMPtimestampsylacantidadcuandonosecontemplasuuso.RedCAIDA.Rangoreducido.
Referenciadaenlaseccin4.1.
%desoportede
ICMPtimestamps
enlaces
virtuales
enlacesvirtuales,relativoal0%
desoporteICMPtimestamps
0 110 1
1 128 1.16
2 142 1.29
3 162 1.47
4 178 1.62
5 195 1.77
6 219 1.99
7 238 2.16
8 253 2.30
9 267 2.43
10 288 2.62
TablaA.10.Relacinentrelacantidaddeenlacescalculablesparadistintosnivelesdesoportede
ICMPtimestampsylacantidadcuandonosecontemplasuuso.Redaleatoria.Rangoreducido.
Referenciadaenlaseccin4.1.
93
Anexo A Datos experimentales
%desoportede
ICMPtimestamps
enlacesfsicos enlacesvirtuales relacin
0 8068 9848 0.82
1 10091 12541 0.80
2 12184 15391 0.79
3 14057 18045 0.78
4 16454 21230 0.78
5 18031 23435 0.77
6 19831 25969 0.76
7 21950 28732 0.76
8 23878 31344 0.76
9 25901 34144 0.76
10 27043 35810 0.76
TablaA.11.Cocienteentrelacantidaddeenlacesfsicosyvirtualesquesedescubrenenlared.
RedCAIDA.Rangoreducido.
Referenciadaenlaseccin4.1.
%desoportede
ICMPtimestamps
enlacesfsicos enlacesvirtuales relacin
0 229 110 2.08
1 255 128 1.99
2 274 142 1.93
3 301 162 1.86
4 323 178 1.81
5 346 195 1.77
6 379 219 1.73
7 406 238 1.71
8 424 253 1.68
9 445 267 1.67
10 471 288 1.64
TablaA.12.Cocienteentrelacantidaddeenlacesfsicosyvirtualesquesedescubrenenlared.
RedCAIDA.Rangoreducido.
Referenciadaenlaseccin4.1.
94
Anexo A Datos experimentales
alfabetos
adicionales
enlaces
fsicos
enlaces
virtuales
enlacesfsicos
enlacesvirtuales
0% 1063 126 12%
10% 1004 199 20%
20% 949 272 29%
30% 910 328 36%
40% 846 396 47%
50% 799 431 54%
60% 763 484 63%
70% 716 530 74%
80% 691 580 84%
90% 679 624 92%
100% 671 671 100%
TablaA.13.Enlacesfsicosyvirtualesalagregaralfabetosadicionales
alconjuntodemedicionesdeDIMES.
Referenciadaenlaseccin4.2.
95
Anexo A Datos experimentales
96
ANEXO B. HERRAMIENTA DE SIMULACIN
Para llevar a cabo las simulaciones del captulo 4, se desarroll una herramienta. Los
principalesalgoritmosimplementadosseenumeranenlatablaB.1.
Laherramientaseencuentradisponibleenhttp://cnet.fi.uba.ar/azylber/
Nmero Nombre Autores Referencia
2.1.1 Seleccinderutasamonitorear Y.Chenetal. [Chen04]
2.1.2 Seleccinderutasamonitorear D.Chuaetal. [Chua05]
2.1.3 Estimacindelasdemorasenlos
enlacesyprediccinparalas
rutasnomonitoreadas
D.Chuaetal. [Chua05]
2.1.4 BsquedadetodoslosMILSes Zhaoetal. [Zhao06]
3.1.1 Clasificacindenodos presentadoenestatesis
3.1.2 Creacindelamatrizderuteo presentadoenestatesis
3.2.1 Bsquedadelosenlaces
identificables
presentadoenestatesis
TablaB.1.Principalesalgoritmosimplementados.
Se implementaron tambin otros algoritmos especficos, como el procedimiento de la
simulacin(4.1.1)ylosmtodosparafiltrarlosdatosdeDIMES,explicadosenlaseccin4.2.
Lasoperacionesbsicasconmatricesralasfueronimplementadas.
Setomaron3funcionesdelalibreraGSL

:
Descomposicinenvaloressingulares
DescomposicinQRconpivoteo
EliminacindeGauss
GNU Scientific Library - http://www.gnu.org/software/gsl/
97
Anexo B Herramienta de simulacin
98
BIBLIOGRAFA
[Aaronson]ScottAaronson,
"TheComplexityZoo",
http://www.cse.unl.edu/~cbourke/latex/ComplexityZoo.pdf
[Abilene]AbileneAdvancedNetworkingforLeadingedgeResearchandEducation.
http://abilene.internet2.edu/
[Anagnostakis03]KostasG.Anagnostakis,MichaelGreenwald,RaphaelS.Ryger,
"cing:MeasuringNetworkInternalDelaysusingonlyExistingInfrastructure",
IEEEInfocom,April2003.
[Caida]CAIDACooperativeAssociationforInternetDataAnalysis.
http://www.caida.org/
[Carmi06]ShaiCarmi,ShlomoHavlin,ScottKirkpatrick,YuvalShavitt,EranShir,
"MEDUSANewModelofInternetTopologyUsingkshellDecomposition",
http://arxiv.org/abs/condmat/06012402006.
[Chen03]YanChen,DavidBindel,RandyH.Katz,
"Tomographybasedoverlaynetworkmonitoring",
ACMInternetMeasurementConference,p216231,2003.
[Chen04]YanChen,DavidBindel,HanheeSong,RandyH.Katz,
"Analgebraicapproachtopracticalandscalableoverlaynetworkmonitoring",
ACMSIGCOMM,p5566,2004.
[Chua05]DavidB.Chua,EricD.Kolaczyk,MarkCrovella,
"EfficientMonitoringofEndtoEndNetworkProperties",
ProceedingsofInfocom2005,March2005.
[Dallasta06]L.Dall'Asta,I.AlvarezHamelin,A.Barrat,A.VazquezandA.Vespignani
"Exploringnetworkswithtraceroutelikeprobes:theoryandsimulations",
TheoreticalComputerScience355,624,2006.
99
Bibliografa
[Dimes]NetDimesJourneytomaptheInternet.
http://www.netdimes.org/
[Govindan00]R.GovindanandH.Tangmunarunkit,
"HeuristicsforInternetMapDiscovery",
ProceedingsofInfocom2000,March2000.
[Mahajan03]RatulMahajan,NeilSpring,DavidWetherall,ThomasAnderson,
"UserlevelInternetPathDiagnosis",
ACMSosp,October2003.
[Rabbat04]M.Rabbat,R.Nowak,M.Coates,
"MultipleSource,MultipledestinationNetworkTomography",
IEEEInfocom,March2004.
[RFC792]RFC792InternetControlMessageProtocol(ICMP)
http://www.faqs.org/rfcs/rfc792.html
[Shavitt04]YuvalShavitt,XiaodongSun,AvishaiWool,BulentYener,
"ComputingtheUnmeasured:AnAlgebraicApproachtoInternetMapping",
IEEEJ.onSelectedAreasinCommunications,v.22,n.1,p.6778,2004.
[Vardi96]Y.Vardi,
"NetworkTomography:estimatingsourcedestinationtrafficintensitiesfromlinkdata",
J.Am.Statist.Assoc.,vol.91,pp.365377,1996.
[Zhang00]Y.Zhang,V.Paxson,S.Shenker,
"ThestationarityofInternetpathproperties:routing,LossandThroughput",
ACIRITechnicalReport,May2000.
[Zhang01]Y.Zhangetal.,
"OntheconstancyofInternetpathproperties",
ProceedingsofSIGCOMMIMW,2001.
[Zhao05]Y.Zhao,Y.Chen,andD.S.Bindel,
"Scalableanddeterministicoverlaynetworkdiagnosis",
Poster,ACMSIGCOMM2005
100
Bibliografa
[Zhao06]YaoZhao,YanChen,DavidBindel,
"Towardsunbiasedendtoendnetworkdiagnosis",
ACMSIGCOMM,2006
101

También podría gustarte