Organizacion de La Informacion

Computación para la Investigación
ORGANIZACIÓN DE LA INFORMACIÓN EN LA WEB
Una página web la vemos en nuestro navegador y parece una sola entidad, pero
no es así, está compuesta por multitud de diferentes ficheros, como son las
imágenes, los posibles vídeos y lo más importante: el código fuente.
El código de las paginas está escrito en un lenguaje llamado HTML, que indica
básicamente donde colocar cada texto, cada imagen o cada vídeo y la forma que
tendrán estos al ser colocados en la página.
El HTML se creó sin dar respuesta a todos los posibles usos que se le iba a dar y
a todos los colectivos de gente que lo utilizarían en un futuro.
El protocolo de transferencia de hipertexto (HTTP, Hyper Text Transfer Protocol)

es el protocolo usado en cada transacción web (WWW). Un protocolo se puede
entender como el lenguaje utilizado por dos computadoras para comunicarse entre
sí.
Hyper texto se refiere al contenido de las paginas escrito en un lenguaje especial
(html), los browser (navegadores) se comunican con los servidores de internet
mediante este protocolo, se envían las paginas en el lenguaje html y lo interpretan
y nos muestran su contenido.
HTTP es un protocolo sin estado, es decir, que no guarda ninguna información

sobre conexiones anteriores. Al finalizar la transacción todos los datos se pierden.
Por esto se popularizaron las cookies, que son pequeños archivos guardados en
el propio ordenador que puede leer un sitio web al establecer conexión con él, y de
esta forma reconocer a un visitante que ya estuvo en este sitio anteriormente.
Gracias a esta identificación, el sitio web puede almacenar gran número de
información sobre cada visitante, ofreciéndole así un mejor servicio.
Hipertexto en informática, es el nombre que recibe el texto que en la pantalla de

un dispositivo electrónico, permite conducir a otros textos relacionados, pulsando
con el ratón en ciertas zonas sensibles y destacadas. La forma más habitual de
Ing. Edwin Ernesto Colorado López

eeclcolorado@gmail.com
hipertexto en informática es la de hipervínculos o referencias cruzadas

automáticas que van a otros documentos. Si el usuario selecciona un hipervínculo
el programa muestra el documento enlazado. Otra forma de hipertexto es el
strechtext que consiste en dos indicadores o aceleradores y una pantalla. El
primer indicador permite que lo escrito pueda moverse de arriba hacia abajo en la
pantalla. Es importante mencionar que el hipertexto no está limitado a datos
textuales, podemos encontrar dibujos del elemento especificado, sonido o vídeo
referido al tema. El programa que se usa para leer los documentos de hipertexto
se llama “navegador”, el "browser", "visualizador" o "cliente" y cuando seguimos un
enlace decimos que estamos navegando por la Web. El hipertexto es una de las
formas de la hipermedia, enfocada en diseñar, escribir y redactar texto en una
media.
TECNOLOGÍAS WEB
La 'Web 1.0 (1991-2003) es la forma más básica que existe, con navegadores de
sólo texto bastante rápidos. Después surgió el HTML que hizo las páginas web
más agradables a la vista, así como los primeros navegadores visuales tales como
IE, Netscape, etc.
La Web 1.0 es de sólo lectura. El usuario no puede interactuar con el contenido de

la página (nada de comentarios, respuestas, citas, etc), estando totalmente
limitado a lo que el Webmaster sube a ésta.
Web 1.0 se refiere a un estado de la World Wide Web, y cualquier página web
diseñada con un estilo anterior del fenómeno de la Web 2.0. Es un término que ha
sido creado para describir la Web antes del impacto de la fiebre punto com (.com)
en el 2001, que es visto por muchos como el momento en que el internet dio un
giro.
Lenguaje HTML.
El protocolo HTTP

Hipertexto
HIPERMEDIA
Es el término con el que se designa al conjunto de métodos o procedimientos para
escribir, diseñar o componer contenidos que integren soportes tales como: texto,
imagen, video, audio, mapas y otros soportes de información emergentes, de tal
modo que el resultado obtenido, además tenga la posibilidad de interactuar con los
usuarios.
La estructura hipermedia de estos contenidos, califica especialmente al conjunto

de los mismos, como herramienta de comunicación e interacción humanas. En
este sentido, un espacio hipermedia es un ámbito, sin dimensiones físicas, que
alberga, potencia y estructura las actividades de las personas, como puede verse
en casos como, entre otros: Redes sociales, Plataformas de colaboración online,
plataformas de enseñanza online, etc.
En el plano conceptual, Hipermedia designa a medias que puedan bifurcar o

ejecutar presentaciones.
HIPERVÍNCULO.
Un hipervínculo es un enlace, normalmente entre dos páginas web de un mismo
sitio, pero un enlace también puede apuntar a una página de otro sitio web, a un
que apunta el enlace, hemos de hacer clic sobre él. fichero, a una imagen, etc.
Para navegar al destino al También se conocen como hiperenlaces, enlaces o
links. Normalmente el destino se puede saber mirando la barra de estado del
navegador cuando el ratón esté sobre el hipervínculo. Dependiendo de cual sea el
destino, hacer clic en un hipervínculo puede hacer que ocurran varias cosas. Si el
destino es otra página web, el navegador la cargará y la mostrará, pero si el
destino es un documento de Word, el navegador nos dará la posibilidad de abrir
una sesión de Word para visualizarlo o de guardar el archivo.
Por lo tanto, podemos usar los hipervínculos para conducir a los visitantes de
nuestro sitio web por donde queramos. Además, si queremos que se pongan en
contacto con nosotros, nada mejor que ofrecerles un hipervínculo a nuestro correo

electrónico.
TIPOS DE HIPERVÍNCULOS
1. Hipervínculo de texto: Un hipervínculo de texto es un enlace que se
encuentra asociado a un texto, de forma que si hacemos clic sobre ese
texto, navegamos dónde indique el hipervínculo. Por defecto, cuando
creamos un hipervínculo de texto, el texto aparece subrayado y en un color
distinto al del texto normal, de forma que el visitante sepa que existe ese
enlace. Si volvemos a la página después de visitar el enlace, este
aparecerá con otro tono también. Aunque es interesante diferenciar el
hiperenlace, es posible que no queramos que aparezca así.
2. Hipervínculo de imagen: Un hipervínculo de imagen es un enlace que se
encuentra asociado a una imagen, de forma que si hacemos clic sobre esa
imagen, navegamos dónde indique el hipervínculo. Por defecto cuando
creamos un hipervínculo de imagen, la imagen aparece rodeada de un
borde con un color llamativo para que el visitante sepa que existe ese
enlace. Por otra parte, los hipervínculos pueden referirse a páginas del
mismo sitio web o de otros sitios web Hipervínculo local o interno: Un
hipervínculo local o interno es un vínculo a una página que se encuentra en
el mismo sitio web (sitio local). Así, para referirnos a ella tan solo basta con
poner la ruta o dirección en el disco duro. Si se encuentra en la misma
carpeta, basta con poner su nombre. Cuando ponemos un vínculo externo,
escribimos la dirección completa de la página incluido http://www....
3. Hipervínculo a una dirección de correo electrónico: Un hipervínculo a una
dirección de correo electrónico es un vínculo que contiene una dirección de
correo. Al pulsar en él, automáticamente se abre el programa de correo que
tenga el usuario instalado para poder escribir a esa dirección de correo.

BUSCADOR (MOTORES DE BUSQUEDA)
La necesidad de los buscadores: Cuando necesitamos de Internet, normalmente

buscamos información sobre un tema concreto, y es difícil acceder a una página
que la contenga, simplemente pinchando vínculos. Como solución a este problema
surgieron los buscadores. Un buscador es una página web en la que se ofrece
consultar una base de datos en la cual se relacionan direcciones de páginas web
con su contenido. Su uso facilita enormemente la obtención de un listado de
páginas web que contienen información sobre el tema que nos interesa. Existen
varios tipos de buscadores, en función del modo de construcción y acceso a la
base de datos, pero todos ellos tienen en común que permiten una consulta en la
que el buscador nos devuelve una lista de direcciones de páginas web
relacionadas con el tema consultado.
Un motor de búsqueda o buscador es un sistema informático

que busca archivos almacenados en servidores web gracias a su spider (también
llamado araña web). Un ejemplo son los buscadores de Internet (algunos buscan
únicamente en la web, pero otros lo hacen además en noticias, servicios
como Gopher, FTP, etc.) cuando se pide información sobre algún tema. Las
búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el
resultado de la búsqueda «Página de resultados del buscador» es un listado
de direcciones web en los que se mencionan temas relacionados con las palabras
clave buscadas.
Como operan de forma automática, los motores de búsqueda contienen

generalmente más información que los directorios. Sin embargo, estos últimos
también han de construirse a partir de búsquedas (no automatizadas) o bien a
partir de avisos dados por los creadores de páginas (lo cual puede ser muy
limitante). Los buenos directorios combinan ambos sistemas. Hoy en
día Internet se ha convertido en una herramienta rápida y eficiente para la
búsqueda de información, para ello han surgido los buscadores que son un motor
de búsqueda que nos facilita encontrar información rápida de cualquier tema de
interés, en cualquier área de las ciencias, y de cualquier parte del mundo.

Clasificación
Se pueden clasificar en tres tipos:
1. Jerárquicos: interfaces de interrogación textual contra bases de datos de

representaciones de páginas web, creadas según un modelo vectorial.
2. Directorios: directorios de enlaces a páginas (agrupando sus enlaces por
categorías) que ofrecen motores de búsqueda interna.
3. Meta buscadores: interfaces de reenvío de búsqueda a múltiples
buscadores.
4. Buscadores Verticales: buscadores especializados en un sector concreto
Buscadores jerárquicos (arañas o spiders)
 Las arañas (también llamadas "spiders") de los motores de búsqueda, recorren

las páginas recopilando información sobre los contenidos de las páginas.
Cuando se busca una información concreta en los buscadores, ellos consultan
su base de datos y presentan resultados clasificados por su relevancia para
esa búsqueda concreta. Los buscadores pueden almacenar en sus bases de
datos desde la página de entrada de cada web, hasta todas las páginas que
residan en el servidor, una vez que las arañas (spiders) las hayan reconocido e
indexado.
 Si se busca una palabra (por ejemplo: “ordenadores”), en los resultados que
ofrecerá el motor de búsqueda aparecerán páginas que contengan esta
palabra en alguna parte de su texto de contenido.
 Si consideran que un sitio web es importante para el usuario, tienden a
registrar todas sus páginas. Si no la consideran importante, no se almacenan
todas.
 Cada cierto tiempo, los motores revisan los sitios web, para actualizar los
contenidos de su base de datos, por tanto puede que los resultados de la
búsqueda estén desactualizados.

 Los buscadores jerárquicos tienen una colección de programas simples y

potentes con diferentes cometidos. Se suelen dividir en tres partes. Los
programas que exploran la red -arañas (spiders)-, los que construyen la base
de datos y los que utiliza el usuario, el programa que explota la base de datos.
 Si se paga, se puede aparecer en las primeras posiciones de resultados,
aunque los principales buscadores delimitan estos resultados e indican al
usuario que se trata de anuncios (resultados esponsorizados o patrocinados).
Hasta el momento, aparentemente, esta forma de publicidad es indicada
explícitamente. Los buscadores jerárquicos se han visto obligados a
comercializar este tipo de publicidad para poder seguir ofreciendo a los
usuarios el servicio de forma gratuita.
Directorios
Una tecnología muy simple por gran cantidad de scripts disponibles, ya que no se
requieren muchos recursos. En cambio, se requiere más soporte humano y
mantenimiento.
 Los algoritmos son mucho más sencillos, presentando la información sobre los
sitios registrados como una colección de enlaces. No recorren los sitios web ni
almacenan sus contenidos. Solo registran algunos de los datos de la página
web, como el título y la descripción que se introduzcan en el momento de
registrar el sitio en el directorio.
 Los resultados de la búsqueda estarán determinados por la información que se

haya suministrado al directorio cuando se registra el sitio. En cambio, a
diferencia de los motores, son revisadas por operadores humanos, y
clasificadas según categorías, de forma que es más fácil encontrar las páginas
buscadas.
 Más que buscar información sobre contenidos de la página, los resultados

serán presentados haciendo referencia a los contenidos y temática del sitio.

 Su tecnología es muy barata y sencilla.
 Como inconveniente cabe resaltar que los resultados están ordenados por
temática, o por fecha de publicación, pero no por relevancia o concordancia
con una búsqueda concreta del usuario.
Ejemplos de directorios son:
 Open Directory Project
 Yahoo!
 Terra (antes Olé).
Estos directorios utilizaban una organización jerárquica de la información.
Los multi buscadores se limitan a colocar en una página web una lista con los
buscadores más comunes y con una ventana de texto para poder enviar la cadena
de búsqueda introducida por el usuario a cada uno de ellos. También pueden
enviar la cadena de búsqueda a una serie de motores de búsqueda e índices
temáticos previamente definidos. Una vez realizada la consulta a los buscadores
prefijados, el multibuscador devolverá la información de todos los enlaces
encontrados. Con la utilización de multibuscadores, el usuario se evita tener que ir
de buscador en buscador hasta encontrar la información deseada. El usuario elige
los buscadores que quiere utilizar y desde allí realiza su consulta que ofrecerá las
respuestas buscador por buscador. La única ventaja es la posibilidad de consultar
un gran número de buscadores partiendo de una única página. La exhaustividad
primará sobre la precisión, ya que el usuario encontrará un gran número de
enlaces y muchas páginas repetidas.
Metabuscadores
Permite lanzar varias búsquedas en motores seleccionados respetando el formato

original de los buscadores. Lo que hacen es realizar búsquedas en auténticos
buscadores, analizan los resultados de la página y presentan sus propios
resultados, según un orden definido por el sistema estructural del metabuscador.

Los metabuscadores también permiten buscar en varios buscadores al mismo

tiempo. Los metabuscadores no almacenan las descripciones de páginas en sus
bases de datos, sino que contienen los registros de los motores de búsqueda y la
información sobre ellos, adecuando su expresión a los diferentes motores para
remitir la consulta a los motores. Una vez que reciben la respuesta, la remiten al
usuario no directamente, sino tras realizar un filtrado de los resultados. Este
filtrado consiste en eliminar y depurar los enlaces repetidos y en ordenar los
enlaces. Además, sólo aparecerá un número limitado de enlaces, los que se
consideren más importantes. Los más repetidos ocuparán los primeros puestos ya
que el metabuscador considerará que son los más relevantes por estar dados de
alta en mayor número de buscadores. Se trata de herramientas muy útiles, el
único problema es que, por lo general, no permiten realizar búsquedas tan
avanzadas como en un motor de búsqueda, con lo que las consultas tienen que
ser generales y no se puede buscar en profundidad.
"En otras palabras para aludir al concepto más genérico de un buscador, podemos
afirmar que un metabuscador es el buscador que incorpora un conjunto de
buscadores.
Algunos ejemplos de metabuscadores son: Dogpile, Aleyares, Metacrawler, entre

otros. Estos metabuscadores presentan ventajas, como ampliar el espacio de
búsqueda y en algunos casos mostrar la posición de la web.
Buscadores verticales
Los buscadores verticales o motores que no son de búsqueda temáticos son

buscadores especializados en un sector concreto, lo que les permite analizar la
información con mayor profundidad, disponer de resultados más actualizados y
ofrecer al usuario herramientas de búsqueda avanzadas. Es importante resaltar
que utilizan índices especializados, para de este modo, acceder a la información
de una manera más específica y fácil. Algunos ejemplos de estos buscadores
son: Nestoria, Wolfram Alpha. Existen distintos tipos de estos buscadores, algunos
están especializados en una rama de una ciencia, y algunos abarcan todo tipo de

materias. También hay motores de búsqueda que solo ofrecen resultados sobre
música, ropa u otras temáticas.
HISTORIA
El primer buscador fue "Wandex", un índice (ahora desaparecido) realizado por el
World Wide Web Wanderer, un robot desarrollado por Mattew Gray en el MIT, en
1993. Otro de los primeros buscadores, Aliweb, también apareció en 1993 y
todavía está en funcionamiento. El primer motor de búsqueda de texto completo
fue WebCrawler, que apareció en 1994. A diferencia de sus predecesores, éste
permitía a sus usuarios una búsqueda por palabras en cualquier página web, lo
que llegó a ser un estándar para la gran mayoría de los buscadores. WebCrawler
fue asimismo el primero en darse a conocer ampliamente entre el público.
También apareció en 1994 Lycos (que comenzó en la Carnegie Mellon University).
Muy pronto aparecieron muchos más buscadores, como Excite, Infoseek, Inktomi,
Northern Light y Altavista. De algún modo, competían con directorios (o índices
temáticos) populares tales como Yahoo!. Más tarde, los directorios se integraron o
se añadieron a la tecnología de los buscadores para aumentar su funcionalidad.
Antes del advenimiento de la Web, había motores de búsqueda para otros

protocolos o usos, como el buscador Archie, para sitios FTP anónimos y el motor
de búsqueda Verónica, para el protocolo Gopher.
En 1996 Larry Page y Sergey Brin comenzaron un proyecto que llevaría a la

aparición del buscador más utilizado hoy en día: Google. El proyecto inicial se
llamó BackRub, que era el nombre de la tecnología utilizada para su desarrollo.
BackRub basaba la importancia de los sitios web en la cantidad de enlaces que

recibía. Presentaba una interfaz muy sencilla y capaz de mostrar al usuario los
resultados más relevantes para cada una de los búsquedas.
Con la llegada de Google, el modo en que los motores de búsqueda funcionaban

cambió de forma radical, democratizando los resultados que se ofrecen en su

buscador. Google basó el funcionamiento de su motor de búsqueda en la

relevancia de los contenidos de cada sitio web para los propios usuarios, es decir,
priorizando aquellos resultados que los usuarios consideraban más relevantes
para una temática concreta. Para ello patentó su famoso PageRank, un conjunto
de algoritmos que valoraban la relevancia de un sitio web asignándole un valor
numérico del 0 al 10.


Organizacion de La Informacion

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Organizacion de La Informacion

Cargado por

Copyright:

Formatos disponibles

Computación para la Investigación

ORGANIZACIÓN DE LA INFORMACIÓN EN LA WEB

El protocolo de transferencia de hipertexto (HTTP, Hyper Text Transfer Protocol)

HTTP es un protocolo sin estado, es decir, que no guarda ninguna información

Hipertexto en informática, es el nombre que recibe el texto que en la pantalla de

Ing. Edwin Ernesto Colorado López

hipertexto en informática es la de hipervínculos o referencias cruzadas

La Web 1.0 es de sólo lectura. El usuario no puede interactuar con el contenido de

Ing. Edwin Ernesto Colorado López

La estructura hipermedia de estos contenidos, califica especialmente al conjunto

En el plano conceptual, Hipermedia designa a medias que puedan bifurcar o

Ing. Edwin Ernesto Colorado López

Ing. Edwin Ernesto Colorado López

BUSCADOR (MOTORES DE BUSQUEDA)

La necesidad de los buscadores: Cuando necesitamos de Internet, normalmente

Un motor de búsqueda o buscador es un sistema informático

Como operan de forma automática, los motores de búsqueda contienen

Ing. Edwin Ernesto Colorado López

Se pueden clasificar en tres tipos:

1. Jerárquicos: interfaces de interrogación textual contra bases de datos de

Buscadores jerárquicos (arañas o spiders)

 Las arañas (también llamadas "spiders") de los motores de búsqueda, recorren

Ing. Edwin Ernesto Colorado López

 Los buscadores jerárquicos tienen una colección de programas simples y

 Los resultados de la búsqueda estarán determinados por la información que se

 Más que buscar información sobre contenidos de la página, los resultados

Ing. Edwin Ernesto Colorado López

 Su tecnología es muy barata y sencilla.

Ejemplos de directorios son:

 Open Directory Project

 Terra (antes Olé).

Estos directorios utilizaban una organización jerárquica de la información.

Permite lanzar varias búsquedas en motores seleccionados respetando el formato

Ing. Edwin Ernesto Colorado López

Los metabuscadores también permiten buscar en varios buscadores al mismo

Algunos ejemplos de metabuscadores son: Dogpile, Aleyares, Metacrawler, entre

Los buscadores verticales o motores que no son de búsqueda temáticos son

Ing. Edwin Ernesto Colorado López

Antes del advenimiento de la Web, había motores de búsqueda para otros

En 1996 Larry Page y Sergey Brin comenzaron un proyecto que llevaría a la

BackRub basaba la importancia de los sitios web en la cantidad de enlaces que

Con la llegada de Google, el modo en que los motores de búsqueda funcionaban

Ing. Edwin Ernesto Colorado López

buscador. Google basó el funcionamiento de su motor de búsqueda en la

Ing. Edwin Ernesto Colorado López

También podría gustarte