Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Un sitio web se compone de multitud de páginas que están organizadas en forma de árbol.
hipertexto situado en un menú o en otra página. Cada enlace apunta a una URL o URI que
determina la ubicación del recurso. Además, para cada uno de los archivos de contenido
multimedia que aparecen en las páginas web también existe una URI. A estas alturas ya
podemos distinguir dos tipos de recursos, los que están dentro del mismo dominio que el
sitio visitado y los que están en otro dominio. Si queremos hacer un mapa del sitio, es decir,
inventariar todos los elementos que lo componen, debemos limitarnos al dominio en el que
se encuentra el sitio web, ya que en caso contrario acabaríamos recorriendo toda la red de
Internet, dado el gran número de enlaces que hay entre las páginas web.
A veces es incluso difícil obtener un listado del conjunto de páginas de un mismo dominio.
disponibles y estas no son más que una representación de la información. Por ejemplo, en
un sitio web que presenta información meteorológica, las páginas se construyen buscando la
solicitar una representación por día, mes o año, el número de páginas que se pueden llegar
a generar es sorprendente. Por lo tanto, este no es un buen método para intentar analizar
De hecho, más vale intentar analizar el comportamiento. Hay que encontrar la mayor
cantidad de información posible que el sitio web nos pueda dar en un funcionamiento
normal.
Entonces hablamos más bien de toma de huellas que de mapa. He aquí un pequeño listado
de preguntas que nos podemos plantear para recopilar la máxima información posible:
¿El sitio web es estático o dinámico? En este último caso, ¿en qué lenguaje se ha
desarrollado?
Esta lista, que no está completa, ya permite reunir una gran cantidad de información.
Retomemos cada punto y veamos cómo podemos intentar obtener una respuesta.