Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Origen Deep Web
Origen Deep Web
Tamaño[editar]
La internet profunda es un conjunto de sitios web y bases de datos que buscadores comunes
no pueden encontrar ya que no están indexadas. El contenido que se puede hallar dentro de
la internet profunda es muy amplio.7
El internet se ve dividido en dos ramas, la internet profunda y la superficial. La internet
superficial se compone de páginas indexadas en servidores DNS con una alfabetización y
codificación de página perfectamente entendible por los motores de búsqueda, mientras que la
internet profunda está compuesta de páginas cuyos dominios están registrados con
extensiones .onion y los nombres de los dominios están codificados en una trama hash. Estas
páginas se sirven de forma ad hoc, y no necesitan registrarse, basta con que tu ordenador
tenga funcionando un servicio onion, que hará las veces de un servicio dns, pero especial para
las páginas del internet profundo. Mediante una red P2P, se replican las bases de datos que
contienen la resolución de nombres hash.
Mientras que las páginas normales son identificadas mediante el protocolo UDP/IP, las
páginas .onion son repetidas por el ramal al que se ha conectado el navegador especializado
para tal sistema de navegación segura. El sistema de búsqueda es el mismo que usa
BitTorrent. El contenido se coloca en una base de datos y se proporciona solamente cuando lo
solicite el usuario.8
En 2010 se estimó que la información que se encuentra en la internet profunda es de
7500 terabytes, lo que equivale a aproximadamente 550 billones de documentos individuales.
En comparación, se estima que la internet superficial contiene solo 19 terabytes de contenido
y un billón de documentos individuales.
También en 2010 se estimó que existían más de 200 000 sitios en la internet profunda.9
Estimaciones basadas en la extrapolación de un estudio de la Universidad de California en
Berkeley especula que actualmente la internet profunda debe tener unos 91 000 terabytes.10
La Association for Computing Machinery (ACM) publicó en 2007 que Google y Yahoo
indexaban el 32 % de los objetos de la internet profunda, y MSN tenía la cobertura más
pequeña con el 11 %. Sin embargo, la cobertura de los tres motores era de 37 %, lo que
indicaba que estaban indexando casi los mismos objetos.11
Motivos[editar]
Motivos por los que los motores de búsqueda no pueden indexar algunas páginas:
Denominación[editar]
La Web profunda se refiere a la colección de sitios o bases de datos que un buscador común,
como Google, no puede o no quiere indexar. Es un lugar específico del internet que se
distingue por el anonimato. Nada que se haga en esta zona puede ser asociado con la
identidad de uno, a menos que uno lo desee.12
Bergman, en un artículo semanal sobre la Web profunda publicado en el Journal of Electronic
Publishing, mencionó que Jill Ellsworth utilizó el término «Web invisible» en 1994 para
referirse a los sitios web que no están registrados por ningún motor de búsqueda.13
En su artículo, Bergman citó la entrevista que Frank García hizo a Ellsworth en 1996:14
Sería un sitio que, posiblemente, esté diseñado razonablemente, pero no se molestaron en registrarlo
en alguno de los motores de búsqueda. ¡Por lo tanto, nadie puede encontrarlos! Estás oculto. Yo llamo a
esto la Web invisible.
Otro uso temprano del término Web Invisible o web profunda fue por Bruce Monte y Mateo B.
Koll de Personal Library Software, en una descripción de la herramienta @ 1 de web profunda,
en un comunicado de prensa de diciembre de 1996.15
La importancia potencial de las bases de datos de búsqueda también se reflejó en el primer
sitio de búsqueda dedicado a ellos, el motor AT1 que se anunció a bombo y platillo a principios
de 1997. Sin embargo, PLS, propietario de AT1, fue adquirida por AOL en 1998, y poco
después el servicio AT1 fue abandonado.13
El primer uso del término específico de web profunda, ahora generalmente aceptada, ocurrió
en el estudio de Bergman de 2001 mencionado anteriormente.
Por otra parte, el término web invisible se dice que es inexacto porque: