Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Motores de Búsqueda y Álgebra Booleana
Motores de Búsqueda y Álgebra Booleana
Internet es una inmensa base de datos. Como tal, sus contenidos deben
buscarse de acuerdo con las reglas establecidas para realizar bsquedas en
bases de datos. Gran parte de la bsqueda en las bases de datos, se apoya en
los principios de la lgica Booleana. Estos principios hacen referencia a las
relaciones lgicas existentes entre los trminos de bsqueda a las cuales se les
dio el nombre del matemtico britnico George Boole.
En los motores de bsqueda por Internet, las opciones para construir relaciones
lgicas entre los trminos de bsqueda se extienden ms all de la prctica
tradicional de la bsqueda Booleana. Est ltimo se cubrir en este mismo
documento en la seccin llamada "Bsqueda Booleana por Internet".
La lgica Booleana consiste en tres operadores lgicos:
O (or) Y (and) NO (not)
Cada uno de estos operadores se puede describir visualmente usando un diagrama de Venn, como se
muestra a continuacin
En esta bsqueda, vamos a recuperar registros en los cules POR LO MENOS UNO de los trminos
de bsqueda est presente. Estamos buscando los trminos Colegio y tambin Universidad porque
los documentos que contienen una de estas dos palabras pueden ser relevantes.
El crculo sombreado con la palabra colegio representa todos los registros que contienen la
palabra "colegio".
El crculo sombreado con la palabra universidad representa todos los registros que tiene la
palabra "universidad".
El rea sombreada en la que se entrelazan los dos crculos representa todos los registros
que contienen las dos palabras "colegio" y "universidad"
ALTAVISTA
378.678
1.140.371
1.220.917
GOOGLE
289.000
3.250.000
425.000
ALTAVISTA
378.678
289.000
1.140.371
3.250.000
1
Colegio OR Universidad
1.220.917
425.000
Colegio OR Universidad OR
(Ciudad AND Universitaria)
1.245.846
155.000
En esta bsqueda se recuperan registros en los cules AMBOS trminos estn presentes.
Lo anterior se ilustra por el rea sombreada en la que se entrelazan los dos crculos que representan
a todos los registros que contienen tanto la palabra "Pobreza" como la palabra "Crimen"
Es necesario anotar que no se recuper ningn registro que contuviera nicamente la palabra
"Pobreza" o nicamente la palabra "Crimen"
ALTAVISTA
178.387
179.369
120
GOOGLE
584.000
73.400
21.100
ALTAVISTA
178.387
179.369
120
GOOGLE
584.000
73.400
21.100
14
4.770
Solamente algunos de los motores de bsqueda hacen uso del operador de Proximidad (cercania) en temas
relacionados CERCA (Near). El operador de proximidad determina la cercana
en la que estn situados los trminos al interior de un documento fuente. Cerca
(Near) es un Y (AND) restrictivo. La proximidad de los trminos de bsqueda se
determina de manera particular para cada uno de los motores de bsqueda. Por
ejemplo Cerca en Alta Vista (Bsqueda Poderosa) es 10 palabras. Google tiene
esta funcin en forma predeterminada.
En esta bsqueda, se recuperan registros en los cules SOLAMENTE UNA de estas palabras est
presente.
Lo anterior est ilustrado por el rea sombreada con la palabra Gatos que representa todos los
registros que contienen la palabra "gatos"
No se recuperan registros en los que aparece la palabra "perros" an cuando la palabra "gatos"
aparezca en ellos tambin.
ALTAVISTA
132.806
184.674
10.605
GOOGLE
370.000
307.000
1.610
2
El operador lgico NO (NOT) excluye registros o registros de los resultados de bsqueda. Tenga cuidado al
usar NO, ya que el trmino que se quiere buscar puede estar presente de manera importante en documentos
que tambin contienen el trmino que se desea excluir.
N. del T: la mayora de los motores de bsqueda requieren que se ingresen los trminos lgicos en ingles
(AND, OR, NOT), as est buscando con palabras claves en espaol.
OPERADOR
O (OR)
Y (AND)
NO (NOT)
O (OR),
Y (AND)
TRMINOS DE BSQUEDA
gatos OR felinos
dislexia AND adultos
radiacin NOT nuclear
(gatos OR felinos) AND comportamiento
Nota: El uso de los parntesis en la bsqueda se conoce como forzar el orden de procesamiento. En este caso
incluimos la palabra OR en el parntesis para que el motor de bsqueda proceda primero a realizar sta parte
de la bsqueda. Seguidamente el motor de bsqueda combinar este resultado con la ltima parte de la
bsqueda. Haciendo uso de ste mtodo nos podemos asegurar de que los trminos que estn con OR se
mantienen unidos como una unidad lgica.
LGICA BOOLEANA IMPLCITA CON LA BSQUEDA POR PALABRAS CLAVES
La bsqueda por palabras claves se refiere al tipo de bsqueda en la cul se ingresan los trminos que
representan el concepto que se quiere recuperar o buscar. En sta no se utilizan operadores Bolanos.
La lgica Booleana implcita se refiere a la bsqueda en la que se utilizan smbolos, que representan los
operadores Bolanos lgicos. En este tipo de bsqueda por Internet , la ausencia de un smbolo tambin es
significativa, por ejemplo el espacio entre las palabras claves predeterminadas (default), tanto para el
operador lgico OR (O) como para el operador lgico AND (Y). Muchos de las motores de bsqueda bien
conocidos tradicionalmente aplican por defecto (default) el operador lgico O (OR), pero como regla general
se estn alejando de sta prctica y utilizando por defecto (default) el operador lgico Y (AND).
La lgica Booleana implcita se ha vuelto tan comn en la bsqueda por la Red que pude considerarse
actualmente como una prctica estndar.
PREGUNTA
Necesito informacin sobre gatos
Estoy interesado en Dislexia en Adultos
Estoy interesado en radiacin pero no en
radiacin nuclear
Deseo aprender sobre el comportamiento
de los gatos
OPERADOR
O (OR)
Y (AND)
NO (NOT)
O(OR),
Y (AND)
TRMINOS DE BSQUEDA
gatos felinos (1)
+dislexia +adultos
radiacin -nuclear
gatos felinos) +comportamiento
(1) Este ejemplo es cierto para los motores de bsqueda que interpretan el espacio entre las palabras claves
como el operador lgico Booleano O. Para poder saber que lgica tiene predeterminada (default) un motor de
bsqueda, consulte los archivos de Ayuda que ofrece el motor.
LENGUAJE PREDETERMINADO EN UNA PLANTILLA QUE LLENA EL USUARIO
Algunos motores ofrecen una plantilla de bsqueda que le permite al usuario escoger el operador Booleano de
un men. Con frecuencia el operador lgico se encuentra expresado en lenguaje sustituto en lugar de estar
presentado como en el operador mismo.
PREGUNTA
Necesito informacin sobre gatos
Estoy interesado en Dislexia en
Adultos
Estoy interesado en radiacin
pero no en radiacin nuclear
Deseo aprender sobre el
comportamiento de los gatos
Booleana Implcita
O (OR)
colegio OR universidad
colegio universidad
(* ver nota abajo)
Y (AND)
+pobreza +crimen
NO (NOT)
gatos -perros
CERCA, etc
(NEAR)
N/A
(*)
Terminos en Plantilla
Cualquiera de stos trminos.
Puede contener los trminos.
Debe contener los trminos.
Todas estas palabras.
Debe contener las palabras.
Puede no contener las palabras.
Debe no contener las palabras.
Cerca, Prximo.
* Esta afirmacin de bsqueda se resolver como Y lgico en los motores de bsqueda que utilicen Y por
defecto (default). Ejemplos de estos incluyen AOL.com Search, Google y Lycos. Se debe consultar el archivo
de ayuda en el sitio de cada motor para averiguar que lgica utilizan en forma predeterminada.
MOTOR DE BSQUEDA
Operadores Bolanos
Booleana Implcita + / -
Si usted convierte en hbito el uso de las cuatro claves que a continuacin describimos, usted se volver
mejor investigador que el 90% de los usuarios que utilizan Internet. Se trata solamente de recordar cuatro
elementos, cada uno de los cules le suministrar una mejor "Red" para capturar informacin.
PRIMERA CLAVE : Comience a ESTRECHAR
Tal vez el mayor problema que tiene la gente con los motores de bsqueda es que son muy buenos! Usted
puede escribir una palabra y en una fraccin de segundo puede tener 20.000 pginas para revisar. Pero la
mayora de ellas no correspondern exactamente a lo que est buscando y usted tendr que gastar un
montn de tiempo " buceando" entre ellas, para desechar las 19.993 respuestas inadecuadas.
Si usted sabe lo que necesita, por que no empieza por preguntar con la mayor precisin posible?
Piense en todas las palabras que deben aparecer siempre en la pgina "precisa". Pngalas en la casilla que
indica: CON TODAS LAS PALABRAS. (With All the Words).
Piense tambin en todas las pginas distractoras que pueden aparecer porque uno o ms de los trminos
utilizados en la bsqueda, tiene varios significados. En que palabras puede usted pensar que le ayuden a
eliminar esas pginas? Escrbalas en la casilla que indica SIN LAS PALABRAS (Without the words).
Si existen sinnimos del trmino que est buscando y estos pueden aparecer en la pgina que se desea
encontrar, escrbalos en la casilla que indica: CON ALGUNA DE LAS PALABRAS (With Any of the Words).
Imagine que usted est interesado en conocer acerca del legendario continente perdido de
Atlntida. Hay varias pelculas con la palabra Atlntida en el ttulo, pero usted no desea esa
informacin. Adems, usted no est interesado en agencias de viajes que se llamen
Atlntida. Escriba en nmero de aciertos para cada opcin de bsqueda:
PREGUNTA
Esta es una forma inadecuada para buscar:
CON TODAS LAS PALABRAS: Atlntida
Puede afinar la bsqueda intentando esta opcin:
CON TODAS LAS PALABRAS: Atlntida continente perdido
SIN LAS PALABRAS: pelcula cine filmes entretenimiento viajes
Ahora intente lo siguiente:
CON TODAS LAS PALABRAS: Atlntida continente perdido
CON ALGUNA DE LAS PALABRAS: Atlantes
SIN LAS PALABRAS: pelcula cine filmes entretenimiento viajes
RESULTADOS
Cuando ensaye cada una de las formas de bsqueda, anote que clase de registros encuentra. Observe que
mientras ms especficos sean los trminos que usted incluye o excluye, ms enfocada es su bsqueda.
RESULTADOS
RESULTADOS
Finalmente para recapitular, recuerde las cuatro claves que le permitirn realizar una bsqueda no solo mejor
sino ms efectivamente:
ESTRECHAR, PRECISAR, RECORTAR y ASEMEJAR