Está en la página 1de 8

Motores de bsqueda y lgebra Booleana

Por: Bernie Dodge y Biblioteca de la Universidad de Albany

Internet es una inmensa base de datos. Como tal, sus contenidos deben
buscarse de acuerdo con las reglas establecidas para realizar bsquedas en
bases de datos. Gran parte de la bsqueda en las bases de datos, se apoya en
los principios de la lgica Booleana. Estos principios hacen referencia a las
relaciones lgicas existentes entre los trminos de bsqueda a las cuales se les
dio el nombre del matemtico britnico George Boole.
En los motores de bsqueda por Internet, las opciones para construir relaciones
lgicas entre los trminos de bsqueda se extienden ms all de la prctica
tradicional de la bsqueda Booleana. Est ltimo se cubrir en este mismo
documento en la seccin llamada "Bsqueda Booleana por Internet".
La lgica Booleana consiste en tres operadores lgicos:
O (or) Y (and) NO (not)
Cada uno de estos operadores se puede describir visualmente usando un diagrama de Venn, como se
muestra a continuacin

PREGUNTA: Deseo Informacin sobre colegios.

En esta bsqueda, vamos a recuperar registros en los cules POR LO MENOS UNO de los trminos
de bsqueda est presente. Estamos buscando los trminos Colegio y tambin Universidad porque
los documentos que contienen una de estas dos palabras pueden ser relevantes.

Esto se ilustra por:

El crculo sombreado con la palabra colegio representa todos los registros que contienen la
palabra "colegio".

El crculo sombreado con la palabra universidad representa todos los registros que tiene la
palabra "universidad".

El rea sombreada en la que se entrelazan los dos crculos representa todos los registros
que contienen las dos palabras "colegio" y "universidad"

El operador lgico O (OR) se usa ms comnmente para buscar trminos sinnimos


o conceptos.
A continuacin presentamos un ejemplo de cmo funciona el operador lgico O (OR)
TERMINO BUSCADO
Colegio
Universidad
Colegio OR Universidad

ALTAVISTA
378.678
1.140.371
1.220.917

GOOGLE
289.000
3.250.000
425.000

El operador lgico O (OR) ayuda a tamizar los resultados para recuperar


todos los registros nicos que contienen uno de los trminos, el otro o
ambos.
En la medida en que se combinen ms trminos o conceptos en una
bsqueda con el operador lgico O, mayor ser la cantidad de registros que
se van a encontrar.
TERMINO BUSCADO
Colegio
Universidad

ALTAVISTA

GOOGLE

378.678

289.000

1.140.371

3.250.000
1

Colegio OR Universidad

1.220.917

425.000

Colegio OR Universidad OR
(Ciudad AND Universitaria)

1.245.846

155.000

PREGUNTA: Qu relacin existe entre Crimen y Pobreza?

En esta bsqueda se recuperan registros en los cules AMBOS trminos estn presentes.

Lo anterior se ilustra por el rea sombreada en la que se entrelazan los dos crculos que representan
a todos los registros que contienen tanto la palabra "Pobreza" como la palabra "Crimen"

Es necesario anotar que no se recuper ningn registro que contuviera nicamente la palabra
"Pobreza" o nicamente la palabra "Crimen"

A continuacin presentamos un ejemplo de cmo funciona el operador lgico Y (AND)


TERMINO BUSCADO
Pobreza
Crimen
Pobreza AND Crimen

ALTAVISTA
178.387
179.369
120

GOOGLE
584.000
73.400
21.100

En la medida en que se combinen una mayor cantidad de trminos y conceptos


con el operador lgico Y (AND), se van a recuperar una menor cantidad de
registros.
Por ejemplo:
TERMINO BUSCADO
Pobreza
Crimen
Pobreza AND Crimen
Pobreza AND Crimen
AND Genero

ALTAVISTA
178.387
179.369
120

GOOGLE
584.000
73.400
21.100

14

4.770

Solamente algunos de los motores de bsqueda hacen uso del operador de Proximidad (cercania) en temas
relacionados CERCA (Near). El operador de proximidad determina la cercana
en la que estn situados los trminos al interior de un documento fuente. Cerca
(Near) es un Y (AND) restrictivo. La proximidad de los trminos de bsqueda se
determina de manera particular para cada uno de los motores de bsqueda. Por
ejemplo Cerca en Alta Vista (Bsqueda Poderosa) es 10 palabras. Google tiene
esta funcin en forma predeterminada.

Perros NOT gatos


PREGUNTA: Se requiere informacin sobre gatos pero se desea evitar cualquier informacin sobre
perros.

En esta bsqueda, se recuperan registros en los cules SOLAMENTE UNA de estas palabras est
presente.

Lo anterior est ilustrado por el rea sombreada con la palabra Gatos que representa todos los
registros que contienen la palabra "gatos"

No se recuperan registros en los que aparece la palabra "perros" an cuando la palabra "gatos"
aparezca en ellos tambin.

A continuacin presentamos un ejemplo del funcionamiento del operador lgico NO (NOT).


TERMINO BUSCADO
Gato
Perro
Gato NOT Perro

ALTAVISTA
132.806
184.674
10.605

GOOGLE
370.000
307.000
1.610
2

El operador lgico NO (NOT) excluye registros o registros de los resultados de bsqueda. Tenga cuidado al
usar NO, ya que el trmino que se quiere buscar puede estar presente de manera importante en documentos
que tambin contienen el trmino que se desea excluir.
N. del T: la mayora de los motores de bsqueda requieren que se ingresen los trminos lgicos en ingles
(AND, OR, NOT), as est buscando con palabras claves en espaol.

BSQUEDA BOOLEANA EN INTERNET


Cuando se utiliza un motor de bsqueda en Internet, el uso de la lgica booleana puede manifestarse de tres
maneras diferentes:
1. Lgica booleana completa con el uso de los operadores lgicos.
2. Lgica booleana implcita con la bsqueda por palabras claves.
3. Lenguaje predeterminado en una plantilla que llena el usuario.
LGICA BOOLEANA COMPLETA CON EL USO DE LOS OPERADORES LGICOS
Muchos de los motores de bsqueda ofrecen la opcin de hacer una bsqueda Booleana completa que
requiere la utilizacin de los operadores Bolanos lgicos.
PREGUNTA
Necesito informacin sobre gatos
Estoy interesado en Dislexia en Adultos
Estoy interesado en radiacin pero no en
radiacin nuclear
Deseo aprender sobre el comportamiento
de los gatos

OPERADOR
O (OR)
Y (AND)
NO (NOT)
O (OR),
Y (AND)

TRMINOS DE BSQUEDA
gatos OR felinos
dislexia AND adultos
radiacin NOT nuclear
(gatos OR felinos) AND comportamiento

Nota: El uso de los parntesis en la bsqueda se conoce como forzar el orden de procesamiento. En este caso
incluimos la palabra OR en el parntesis para que el motor de bsqueda proceda primero a realizar sta parte
de la bsqueda. Seguidamente el motor de bsqueda combinar este resultado con la ltima parte de la
bsqueda. Haciendo uso de ste mtodo nos podemos asegurar de que los trminos que estn con OR se
mantienen unidos como una unidad lgica.
LGICA BOOLEANA IMPLCITA CON LA BSQUEDA POR PALABRAS CLAVES
La bsqueda por palabras claves se refiere al tipo de bsqueda en la cul se ingresan los trminos que
representan el concepto que se quiere recuperar o buscar. En sta no se utilizan operadores Bolanos.
La lgica Booleana implcita se refiere a la bsqueda en la que se utilizan smbolos, que representan los
operadores Bolanos lgicos. En este tipo de bsqueda por Internet , la ausencia de un smbolo tambin es
significativa, por ejemplo el espacio entre las palabras claves predeterminadas (default), tanto para el
operador lgico OR (O) como para el operador lgico AND (Y). Muchos de las motores de bsqueda bien
conocidos tradicionalmente aplican por defecto (default) el operador lgico O (OR), pero como regla general
se estn alejando de sta prctica y utilizando por defecto (default) el operador lgico Y (AND).
La lgica Booleana implcita se ha vuelto tan comn en la bsqueda por la Red que pude considerarse
actualmente como una prctica estndar.
PREGUNTA
Necesito informacin sobre gatos
Estoy interesado en Dislexia en Adultos
Estoy interesado en radiacin pero no en
radiacin nuclear
Deseo aprender sobre el comportamiento
de los gatos

OPERADOR
O (OR)
Y (AND)
NO (NOT)
O(OR),
Y (AND)

TRMINOS DE BSQUEDA
gatos felinos (1)
+dislexia +adultos
radiacin -nuclear
gatos felinos) +comportamiento

(1) Este ejemplo es cierto para los motores de bsqueda que interpretan el espacio entre las palabras claves
como el operador lgico Booleano O. Para poder saber que lgica tiene predeterminada (default) un motor de
bsqueda, consulte los archivos de Ayuda que ofrece el motor.
LENGUAJE PREDETERMINADO EN UNA PLANTILLA QUE LLENA EL USUARIO
Algunos motores ofrecen una plantilla de bsqueda que le permite al usuario escoger el operador Booleano de
un men. Con frecuencia el operador lgico se encuentra expresado en lenguaje sustituto en lugar de estar
presentado como en el operador mismo.
PREGUNTA
Necesito informacin sobre gatos
Estoy interesado en Dislexia en
Adultos
Estoy interesado en radiacin
pero no en radiacin nuclear
Deseo aprender sobre el
comportamiento de los gatos

OPERADOR TRMINOS DE BSQUEDA


Cualquiera de stas palabras.
O(OR)
Puede contener las palabras.
Debe contener las palabras.
Todas estas palabras.
Y (AND)
Debe contener las palabras.
No debe contener las palabras.
NO (NOT)
Sin las palabras.
Combine las opciones como se ha hecho en las
O(OR),
preguntas anteriores, si la plantilla permite la inclusin
Y (AND)
de varias ordenes de bsqueda.
4

Cuadro de Comparacin Rpida


Lgica Booleana completa versus Lgica Booleana Implcita versus Plantillas
Booleana Completa

Booleana Implcita

O (OR)

colegio OR universidad

colegio universidad
(* ver nota abajo)

Y (AND)

pobreza AND crimen

+pobreza +crimen

NO (NOT)

gatos NOT perros

gatos -perros

CERCA, etc
(NEAR)

gatos NEAR perros (*)

N/A

(*)

Terminos en Plantilla
Cualquiera de stos trminos.
Puede contener los trminos.
Debe contener los trminos.
Todas estas palabras.
Debe contener las palabras.
Puede no contener las palabras.
Debe no contener las palabras.
Cerca, Prximo.

* Esta afirmacin de bsqueda se resolver como Y lgico en los motores de bsqueda que utilicen Y por
defecto (default). Ejemplos de estos incluyen AOL.com Search, Google y Lycos. Se debe consultar el archivo
de ayuda en el sitio de cada motor para averiguar que lgica utilizan en forma predeterminada.

Donde Buscar: Un Listado Selectivo


CARACTERSTICA

MOTOR DE BSQUEDA

Operadores Bolanos

AltaVista Advanced Search;Dogpile;HotBot;Ixquick


Metasearch;ProFusion

Bsqueda Booleana Completa con parntesis,


eje:comportamiento y (gatos o felinos)

AltaVista Advanced Search;HotBot;Ixquick


Metasearch;MSN Search Advanced Search

Booleana Implcita + / -

La mayora de los motores ofrecen esta opcin.


AllTheWeb Advanced Search;AOL.COM Search Options
;Google Advanced Search ;HotBot ;Lycos Pro ;MSN
Search Advanced Search ;ProFusion Advanced ;Snoopa
Advanced Search(*)
AltaVista Advanced Search ;Google[by default] ;Ixquick
Metasearch

Lgica Booleana por terminologa en plantilla

Operadores de Proximidad, Cercana

Se puede encontrar una lista ms completa en esta direccin :


Cmo Escoger un Motor de Bsqueda o Directorio (http://library.albany.edu/internet/choose.html)

CUATRO CLAVES PARA UNA MEJOR BSQUEDA


ESTRECHAR - PRECISAR - RECORTAR - ASEMEJAR
La pgina perfecta con seguridad est en alguna parte. Es la pgina que tiene la informacin precisa que
usted est necesitando y para usted es deseable e inalcanzable como una estrella lejana. Si solamente
contar usted con una malla (Red) inmensa que le permitiera capturarla.
La mayora de la gente hace uso de los motores de bsqueda simplemente escribiendo unos pocos trminos
en el campo de palabras claves del motor para dedicarse luego a mirar con detenimiento los resultados
obtenidos. En algunos casos las palabras que se escogen dan por resultado una reduccin indebida de la
bsqueda que impide encontrar lo que se estn buscando. Con mayor frecuencia el resultado es una pila de
pginas web que no tienen mucha relacin con lo que se busca y que deben ser filtradas por el usuario para
encontrar algo. Pero la situacin antes descrita puede mejorar y esa es la razn de ser de este documento.
El motor de bsqueda ms comprehensivo que existe en el momento es Google y en este nos vamos a
enfocar. El primer paso para convertirse en "hbil pescador" de pginas de Internet consiste en dominar la
opcin de Bsqueda Avanzada que ofrece Google, informacin que se encuentra en
http://www.google.com/advanced_search?hl=es
Le sugerimos adicionar esta direccin a sus sitios Favoritos.

Si usted convierte en hbito el uso de las cuatro claves que a continuacin describimos, usted se volver
mejor investigador que el 90% de los usuarios que utilizan Internet. Se trata solamente de recordar cuatro
elementos, cada uno de los cules le suministrar una mejor "Red" para capturar informacin.
PRIMERA CLAVE : Comience a ESTRECHAR
Tal vez el mayor problema que tiene la gente con los motores de bsqueda es que son muy buenos! Usted
puede escribir una palabra y en una fraccin de segundo puede tener 20.000 pginas para revisar. Pero la
mayora de ellas no correspondern exactamente a lo que est buscando y usted tendr que gastar un
montn de tiempo " buceando" entre ellas, para desechar las 19.993 respuestas inadecuadas.
Si usted sabe lo que necesita, por que no empieza por preguntar con la mayor precisin posible?
Piense en todas las palabras que deben aparecer siempre en la pgina "precisa". Pngalas en la casilla que
indica: CON TODAS LAS PALABRAS. (With All the Words).
Piense tambin en todas las pginas distractoras que pueden aparecer porque uno o ms de los trminos
utilizados en la bsqueda, tiene varios significados. En que palabras puede usted pensar que le ayuden a
eliminar esas pginas? Escrbalas en la casilla que indica SIN LAS PALABRAS (Without the words).
Si existen sinnimos del trmino que est buscando y estos pueden aparecer en la pgina que se desea
encontrar, escrbalos en la casilla que indica: CON ALGUNA DE LAS PALABRAS (With Any of the Words).
Imagine que usted est interesado en conocer acerca del legendario continente perdido de
Atlntida. Hay varias pelculas con la palabra Atlntida en el ttulo, pero usted no desea esa
informacin. Adems, usted no est interesado en agencias de viajes que se llamen
Atlntida. Escriba en nmero de aciertos para cada opcin de bsqueda:
PREGUNTA
Esta es una forma inadecuada para buscar:
CON TODAS LAS PALABRAS: Atlntida
Puede afinar la bsqueda intentando esta opcin:
CON TODAS LAS PALABRAS: Atlntida continente perdido
SIN LAS PALABRAS: pelcula cine filmes entretenimiento viajes
Ahora intente lo siguiente:
CON TODAS LAS PALABRAS: Atlntida continente perdido
CON ALGUNA DE LAS PALABRAS: Atlantes
SIN LAS PALABRAS: pelcula cine filmes entretenimiento viajes

RESULTADOS

Cuando ensaye cada una de las formas de bsqueda, anote que clase de registros encuentra. Observe que
mientras ms especficos sean los trminos que usted incluye o excluye, ms enfocada es su bsqueda.

SEGUNDA CLAVE: Encuentre las Frases, PRECISAR


Las palabras se unen en forma predecible. Si usted escribe un frase en la casilla de la opcin de Bsqueda
Avanzada de Google que dice CON LA FRASE EXACTA (with the exact phrase), usted podr encontrar
pginas en las que las palabras escritas aparezcan juntas y en el orden en que se escribieron. Resulta obvio
que esto facilita la bsqueda de cosas que tienen nombre propio compuesto por varias palabras (eje: lugares,
ttulos de libros, personas)
Tambin es til cuando usted puede recordar una frase particular de algo que usted ha ledo y que ahora
debe localizar. Cmo es el resto del cuento que empieza "Simn el Bobito llam al pastelero".
La habilidad de hacer bsquedas por frases puede resultar sorprendentemente til. Sospecha usted que un
trabajo que entreg uno de sus estudiantes puede ser plagiado si no en su totalidad, si en forma parcial, sin
que ste diera los crditos al autor original? Escriba una o dos frases del trabajo y observe que aparece. As
mismo puede usted darse cuenta si su trabajo se est copiando sin su autorizacin.
Otro uso de esta caracterstica: descubrir la veracidad de cierto tipo de informacin. La prxima vez que
reciba notificacin respecto a la aprobacin de una ley muy controversial o sobre un nuevo y peligroso virus
de computador, comprubela antes de trasmitirla a otros. Para esto escriba cualquier frase poco usual o
singular que vea en el correo electrnico y fjese si existen otros comentarios sobre este rumor en particular.
PREGUNTA
Esta es una forma inadecuada para buscar:
CON TODAS LAS PALABRAS: Atlntida
Puede afinar la bsqueda intentando esta opcin:
CON TODAS LAS PALABRAS: Atlntida
CON LA FRASE EXACTA: patria de los atlantes
Ahora intente lo siguiente:
CON TODAS LAS PALABRAS: Pombo
Afine la bsqueda de la siguiente manera:
CON TODAS LAS PALABRAS: Rafael Pombo
CON LA FRASE EXACTA: Simn el Bobito llam al pastelero

RESULTADOS

TERCERA CLAVE: RECORTAR en Forma Gradual la Direccin de un Sitio en Internet (URL)


Esta opcin no es especfica de Google, aunque usted va a utilizarla con frecuencia cuando este usando ms
eficazmente ese buscador. Con frecuencia usted encuentra una pgina excelente incrustada en una carpeta
que est contenida en otra carpeta que a su vez est metida en otra carpeta. Usted sospecha que existen
otras pginas interesantes cerca de ella, pero cmo se pueden encontrar? Una forma sencilla es ir
recortando paso a paso la direccin del sitio.
Al hacer esto, en ocasiones usted encuentra un mensaje que dice PROHIBIDO! Otras veces accede usted a
una lista de archivos y directorios, y algunas veces llega a una pgina que tiene ms enlaces. Es importante
saber que cada paso en retroceso le indica a usted con mayor claridad cul es el origen de la pgina.
Adems es una buena estrategia a utilizar cuando no se puede localizar una pgina (esto es cuando usted
recibe como respuesta de la bsqueda un mensaje 404). En estos casos es posible que el encargado del sitio
haya movido la pgina, la haya llevado a una carpeta nueva o haya cambiado el nombre de la carpeta.
Recorra el camino retrocediendo hasta el inicio de la direccin y vulvalo a recorrer hacia delante a ver si de
sta manera puede encontrar la pgina perdida.
Usted ha encontrado un Web Quest realmente bueno y desea saber que ms hay es ese
sitio Web puede empezar a recortar la direccin.
Empiece aqu:
http://www.richmond.edu/academics/a&s/education/projects/webquests/shakespeare/
Ahora recorte la ltima parte:
http://www.richmond.edu/academics/a&s/education/projects/webquests/
Qu pudo notar?
Continu recortando y observe que sucede:
http://www.richmond.edu/academics/a&s/education/projects/
http://www.richmond.edu/academics/a&s/education/
http://www.richmond.edu/academics/a&s/
http://www.richmond.edu/academics/
http://www.richmond.edu/

CUARTA CLAVE: Busque Pginas que se ASEMEJEN


Una vez que usted haya encontrado algo que le gusta o requiere utilizando a Google, es muy fcil y adems
til encontrar pginas semejantes o similares. Cmo? Debajo del campo destinado a la Bsqueda Avanzada
que usted ha estado utilizando hasta ahora, existen dos campos nuevos. Estos le permiten encontrar pginas
que Google cree son similares a la que usted ya encontr o que tienen enlaces con la direccin que usted
escribi: Encontrar pginas similares a la pgina y Encontrar pginas con enlaces a la pgina.
Cmo sabe Google que dos pginas se asemejan? Los detalles del funcionamiento interno de los motores de
bsqueda son secretos del oficio, pero podemos asumir con cierto grado de certeza, que los motores se basan
en la semejanza de las palabras y los enlaces externos, existentes en las pginas. Lo que si es cierto es que
esta opcin funciona admirablemente bien, especialmente cuando usted no sabe que palabras claves debe
buscar.
Use esta herramienta para encontrar ms informacin sobre algo que para usted es bueno. selo para
encontrar pginas que estn enlazadas a la pgina que usted encontr y le es til. Es muy probable que las
nuevas pginas tambin le sirvan.
Tambin squele brillo a su Ego: si usted ha puesto una pgina hecha por usted en un servidor pblico y en el
ha estado durante un tiempo prudencial, entrese de quin ms ha puesto enlaces en sus paginas a su sitio.
Suponga que usted ha encontrado un sitio como Eduteka que le proporciona contenido para
los docentes que desean integrar la tecnologa a la educacin y desea que otras pginas
similares puede encontrar. Escriba en nmero de aciertos para cada opcin de bsqueda:
PREGUNTA

RESULTADOS

Use la caracterstica que tiene Google para encontrar pginas que se


asemejen a una que a usted le guste mucho:
ENCONTRAR PGINAS SIMILARES A LA PGINA:
www.maseducativa.com
Otra forma de explorar un sitio Web es encontrar quin tiene enlaces a
ese sitio.
ENCONTRAR PGINAS CON ENLACES A LA PGINA:
www.maseducativa.com
Pruebe lo siguiente:
SIMILARES: kids.msfc.nasa.gov
ENLACES: kids.msfc.nasa.gov

Finalmente para recapitular, recuerde las cuatro claves que le permitirn realizar una bsqueda no solo mejor
sino ms efectivamente:
ESTRECHAR, PRECISAR, RECORTAR y ASEMEJAR

También podría gustarte