Documentos de Académico
Documentos de Profesional
Documentos de Cultura
P
ara buscar bien, es imprescindible tener en cuenta, que adems de los buscadores
convencionales, hay disponibles otras fuentes especficas de informacin.
Los buscadores tradicionales slo ofrecen acceso a una pequea parte de lo que existe online, lo
que se ha comenzado a llamar la Web superficial o visible. Lo que resta, la Web profunda o
invisible, es un amplio banco de informacin ubicado en catlogos, revistas digitales, blogs,
entradas a diccionarios y contenido de sitios que demandan un login (aunque sea gratuito) y otros
tipos de contenido que no aparecen entre los resultados de una bsqueda convencional.
Sherman y Price identifican cuatro tipos de contenidos invisibles en la Web: la Web opaca (the
opaque Web), la Web privada (the private Web), la Web propietaria (the proprietary Web) y la
Web realmente invisible (the truly invisible Web).
Extensin de la indizacin: a veces, por economa, no todas las pginas de un sitio son
indizadas en los buscadores.
Frecuencia de la indizacin: los buscadores no poseen la capacidad de indizar todas las
pginas existentes; a diario se agregan y modifican muchas y la indizacin no se realiza
al ritmo que permita incluirlas a todas.
Nmero mximo de resultados visibles: aunque los motores de bsqueda arrojan a
veces un gran nmero de resultados, generalmente limitan el nmero de documentos
que se muestran (entre 200 y 1000).
URL desconectadas: las generaciones ms recientes de buscadores, presentan los
documentos por relevancia basada en el nmero de veces que aparecen referenciados
en otros. Si un documento no tiene un link a l, desde otro documento, ser imposible
que la pgina sea encontrada, pues no se encuentra indizada.
- La Web privada consiste en las pginas Web que podran estar indizadas en los
buscadores pero son excluidas deliberadamente por alguno de estos motivos:
- La Web propietaria incluye aquellas pginas en las que es necesario registrarse para tener
acceso al contenido, ya sea de forma gratuita o arancelada.
- La Web realmente invisible se compone de pginas que no pueden ser indizadas por
limitaciones tcnicas de los buscadores, programas ejecutables y archivos comprimidos,
pginas generadas dinmicamente, es decir, que se generan a partir de datos que
introduce el usuario, informacin almacenada en bases de datos relacionales, que no
puede ser extrada a menos que se realice una peticin especfica.