Documentos de Académico
Documentos de Profesional
Documentos de Cultura
133
ARTIGO
R E S U M O
Almejando contribuir com uma reflexo sobre a prtica do indexador e tendo em
vista a evoluo do processo de indexao, os autores procuram identificar,
pela reviso da literatura, o desenvolvimento terico e metodolgico de tal
processo, extraindo as principais tendncias e influncias ali presentes. A
reviso da literatura foi sistematizada por duas anlises: a da literatura
fundamental e a dos relatos de experincia. A primeira anlise divide-se em
trs categorias: definio, histria e aspectos tericos e metodolgicos da
indexao, as quais permitiram evidenciar a constante preocupao, por parte
dos estudiosos, com relao abordagem do assunto do documento, tendo
em vista sua recuperao. Com isso, conclui-se que a maior nfase nesse
processo est relacionada indexao acadmica resultante da concepo
de anlise de assunto assumida pelo indexador. Este segundo tipo de anlise
tem suas influncias mais diretamente relacionadas s reas de interface da
Anlise Documentria a Lingstica, a Lgica e a Psicologia Cognitiva, mais
recentemente abordada pelos estudos tericos, ainda no aprofundados.
1
Parte integrante do Projeto integrado Leitura em anlise documentria: uma contribuio formao do indexador, sob
coordenao de M.S.L. FUJITA. Apoio do CNPq.
Mestranda, Curso de Ps-Graduao em Cincia da Informao, Faculdade de Filosofia e Cincias, Universidade Estadual
Paulista, Marlia, SP, Brasil. E-mail: <mariarsilv@yahoo.com.br>.
Livre-Docente, Departamento de Cincia da Informao, Faculdade de Filosofia e Cincias, Universidade Estadual Paulista.
Av. Hygino Muzzi Filho, 737, Campus Universitrio, 17525-900, Marlia, SP, Brasil. Correspondncia para/Correspondence to:
M.S.L. Fujita. E-mail: <goldstar@flash.tv.br>.
Recebido em 8/7/2003 e aceito para publicao em 28/6/2004.
134
ABSTRACT
To contribute with a reflection on the indexers practice, having in mind the evolution
of the indexing process, the authors of this paper sought to assess the theoretical
and methodological development of such process, through a survey of the
literature, extracting from it the main trends and influences. The scrutiny of the
relevant literature was systematized in two types of analyses: one, the analysis of
fundamental literature in the area, and the other, that of experience stories. The
first analysis was divided in three categories: theoretical and methodological
definition, history, and aspects of indexing. These have allowed the authors to
substantiate a constant concern on the part of the scholars, regarding the
approach to the document as a subject and having in mind its recovery. The
authors conclude that the emphasis in this process rests in the academic
indexing-resultant of the outset of subject analysis carried out by the indexer.
This second type of analysis is more directly influenced by the interfacing areas
of Documentation Analysis - Linguistics, Logic and more recently, of sciences
such as the Cognitive Psychology, which was approached in theoretical studies
that did not prove deep enough yet. Once the logical, linguistic and cognitive
aspects affecting document contents be better clarified, they will assist the indexing
professionals in determining the topics actually involved in a document, and will
allow them to accomplish a more effective conceptual analysis of such document.
Key words: indexation, history of the indexation, methodology of indexation,
documentary analysis, documentary reading.
INTRODUO
Temos constatado pela histria da Indexao que o ato de construir ndices define-se como
uma prtica bastante antiga no processo de
tratamento de documentos. A atividade de
indexao, como processo, realizada mais
intensamente desde o aumento das publicaes
peridicas e da literatura tcnico-cientfica,
surgindo a necessidade de criao de mecanismos de controle bibliogrfico em centros de
Transinformao, Campinas, 16(2):133-161, maio/ago., 2004
135
Nas pesquisas sobre leitura documentria, desenvolvidas por Fujita (1999; 2003), para
observao da leitura do indexador, verifica-se
uma constante preocupao com os procedimentos de anlise do documento. Os resultados
revelaram que o leitor indexador apresenta
dificuldades quanto identificao e seleo de
conceitos representativos do assunto do
documento. Tal constatao proporcionou a
elaborao de diretrizes que contm proposta
de um modelo de leitura documentria para
textos cientficos, combinando as estratgias de
explorao da estrutura textual e abordagem
sistemtica de identificao de conceitos, visto
que a compreenso de como se d essa leitura
poder auxiliar o leitor-indexador a obter uma
anlise conceitual efetiva, que represente
adequadamente o assunto tratado no documento.
136
Conceituao de indexao
O conceito de indexao surgiu a partir
da elaborao de ndices e atualmente est mais
vinculada ao conceito de anlise de assunto.
Com a evoluo da prtica, em decorrncia da
necessidade de recuperao cada vez mais
rpida, precisa e especializada por parte de
Instituies informacionais, a construo de
ndices passou a contar com um aparato
metodolgico e instrumental mais diversificado
e muito mais voltado para o contexto de cada
documento. Ressalta-se que, a partir da evidncia da Documentao como rea cientfica na
dcada de 60 e do surgimento dos servios de
informao em reas especializadas, a indexao e a elaborao de resumos utilizados na
elaborao dos servios bibliogrficos para
recuperao de artigos de peridicos cientficos,
Transinformao, Campinas, 16(2):133-161, maio/ago., 2004
representao, fase final da anlise documentria, em que se utilizam as linguagens documentrias para a gerao de produtos documentrios
(ndices e notaes classificatrias, etc.)
(GUIMARES, 2000).
Para Chaumier (1980) a indexao a
parte mais importante da anlise documentria.
Conseqentemente, ela quem condiciona o
valor de um sistema documentrio. O autor nos
adverte que uma indexao inadequada ou uma
indexao insuficiente representa 90% das
causas essenciais para apario de rudos ou
de silncios.
A expresso Anlise Documentria, do
ponto de vista dos tericos espanhis, comporta
dois nveis de diviso: o da forma anlise
descritiva ou bibliogrfica refere-se ao tratamento fsico da informao ligado com o suporte;
e o do contedo, que se refere ao tratamento
temtico da informao e destina-se representao condensada do assunto intrnseco ou
extrnseco tratado em um determinado
documento.
H, portanto, uma diferena da concepo
francesa de Anlise Documentria entre
espanhis e franceses. Para os tericos franceses, a Anlise Documentria refere-se somente
ao tratamento do contedo do documento, no
adotando a diviso em forma e contedo, ou
descrio fsica e temtica do documento.
A corrente inglesa, representada por
autores como Foskett, Lancaster, Campos, Van
Slype, Farrow, entre outros, faz o uso da
expresso indexao, entendendo-a como um
processo.
Segundo Borko e Bernier (1978, p.8) a
indexao definida como o processo de
analisar o contedo informacional dos registros
do conhecimento e sua expresso na linguagem
do sistema de indexao. Para Van Slype (1991)
a operao que consiste em enumerar os
conceitos sobre os quais trata um documento e
represent-los por meio de uma linguagem
137
138
Histria da Indexao
A indexao surgiu com a atividade de
elaborao de ndices. Gomes e Gusmo (1983,
p.12) afirmam que o ndice, como um instrumento de armazenagem e recuperao da
informao, tem sua origem a partir do momento
em que o homem passou a se preocupar em
tornar acessvel a informao registrada em um
documento e para isso resolve orden-la de
alguma forma.
A forma mais antiga de armazenagem de
informao de que se tem conhecimento foi
encontrada nas tbuas de argila produzidas pela
extinta Mesopotmia no sculo II a.C. Nelas foi
grafada uma espcie de resumo dos livros
antigos considerada como forma de representao condensada do contedo informacional que
dava acesso ao assunto dos livros (WITTY, 1973).
No histrico da indexao, Collinson
(1971) indica que o primeiro tipo de indexao
existente era baseado na memria. Textos
clebres, como as grandes epopias, por
exemplo, eram transmitidos oralmente. Depois
disso, os primeiros ndices de que se tm notcia
eram arranjados pela primeira sentena de cada
pargrafo.
Na Biblioteca de Alexandria, organizada
pela classificao de Calmaco, seu catlogo era
arranjado em ordem alfabtica de autores e
subordinados a assuntos mais gerais. Vrias
obras, principalmente as histrias e peas dos
grandes dramaturgos da poca, eram
condensadas.
No sculo II, Cludio Galeno compilou De
Libris Propiis Lber, determinando o aparecimento
dos primeiros guias para obras isoladas:
cabealhos de captulos, tbuas de matria ou
sumrios, cabealhos nas margens dos pargrafos, cabealhos descritos no alto das pginas.
No sculo V, a obra annima Apothegmata,
apresenta-se como o trabalho que mais se
aproximou do ndice alfabtico de assunto porque
consistia de uma listagem de provrbios gregos
139
140
141
142
143
Entendemos que a catalogao de assuntos deve ser considerada como um ramo dentro
do mbito maior que a indexao alfabtica de
assuntos, pois existem cem anos de estudos
realizados em torno da indexao alfabtica de
assunto desde a publicao, em 1876, da obra
bsica de Charles Ammi Cutter Rules for a
dictionary catalog at a idealizao do sistema
de indexao PRECIS por Derek Austin em 1974.
Por uma sntese evolutiva, abaixo demonstrada, possvel observar que, embora a
preocupao principal dos estudos seja o produto
final, ou seja, a gerao do ndice, a anlise que
envolve a transformao do contedo em ndice
est expressa tanto pela proposio de categorias quanto pelos sistemas para indexao,
como se observa na evoluo dos principais
estudos tericos:
144
A escolha dos conceitos pode obedecer a um esquema de categorias reconhecidas como importantes no campo coberto pelo
documento, ex.: o fenmeno, o processo, as propriedades, as operaes, o material, o equipamento, etc. (UNISIST, 1981,
p.87).
Indexao coordenada
Esse tipo de indexao caracteriza-se
pela composio de assunto usada para
representar o contedo informacional de um
documento. A pr-coordenao em cabealhos
de assunto remonta aos princpios de Cutter em
1876 que consiste em recolher de um documento
um ou mais aspectos dominantes tendo em vista
certas subdivises do assunto.
Para Robredo (1986, p.80) a indexao
coordenada baseia-se
[...] na suposio de que o contedo
substancial de um documento e de
uma pergunta podem ser representados com suficiente preciso e de
maneira suficientemente completa
mediante um certo nmero de descritores ou palavras-chave, explcita ou
implicitamente contidos no documento
ou na pergunta.
145
Indexao automtica
A indexao automtica segundo
Robredo (1986, p.96) qualquer procedimento que
permita identificar e selecionar os termos que
representem o contedo dos documentos, sem
a interveno direta do documentalista. Faz-se,
entretanto, necessria uma distino entre
indexao automtica e indexao automatizada.
Comparando o processo de indexao
automtica com a indexao manual, Vieira
(1988, p.48) afirma que aquela refere-se
operao que identifica palavras ou expresses
significativas dos documentos para descrever seu
contedo de forma condensada por meio de
programas de computador.
Guimares (2000, p.1) apresenta o processo de indexao que envolve o uso do
computador em trs concepes - a primeira est
relacionada pelo uso de programas informticos
que do suporte ao armazenamento dos termos
de indexao obtidos pela anlise conceitual; a
segunda pelo uso dos sistemas que analisam
documentos de forma automtica com validao
dos termos por um profissional (indexao semi-automtica) e, a terceira, refere-se a indexao
automtica propriamente dita conforme definio
de Robredo (1986) e Vieira (1988) e classificada
por Guimares (2000) como aquela realizada
pelos programas de computador sem nenhum
tipo de validao por profissionais.
A indexao automatizada seria, portanto, aquela resultante do trabalho intelectual de
um profissional para checagem do valor dos
termos atribudos a um documento por um
programa de computador.
Transinformao, Campinas, 16(2):133-161, maio/ago., 2004
146
Indexador tcnico da PAWERLINK textbase ndice interno da Biblioteca de Recardo Consulting Engineers. Nesse artigo o autor
procura responder a questo a qual seu texto faz e suas consideraes vem da sua participao naquele ndice automtico.
Leitura documentria
A leitura documentria faz-se presente no
momento em que o indexador realiza a anlise
147
148
conhecimento prvio do leitor e o tipo de estratgias que o texto exige. No que diz respeito
qualidade do texto, Cintra (1987) pontua: a
manuteno do tema, a adequao lexical e a
estruturao do texto.
Com relao leitura feita pelo indexador,
de acordo com Cintra (1987, p.31) considera-se
que a cooperao leitor/texto rompida, tendo
em vista que o autor no previu o indexador como
leitor. Desse ponto de vista, o leitor-indexador
nem sempre o especialista da rea de assunto
do texto em anlise, necessitando usar
estratgias diversificadas e fazendo mais uso de
estratgias metacognitivas.
A leitura do indexador, portanto, guiada
pelos seus objetivos, demanda do sistema de
informao e de suas habilidades de leitor,
definidas pelos seus conhecimentos prvios
necessrios atividade de indexao. Esses
conhecimentos prvios da indexao, entendemos que sejam um conjunto formado por
conhecimentos profissionais e conhecimentos
que esto relacionados tematicidade do
documento e aos aspectos: lingsticos; lgicos
e cognitivos.
Tematicidade
Durante a leitura documentria, o indexador tem por objetivo identificar conceitos que
compem o tema do documento. Ao identificar
os conceitos, tambm, poder selecionar
aqueles que considera mais representativo do
contedo do documento. A seleo de
conceitos, ressaltamos aqui, determinada
conforme o grau de interesse que o conceito
apresenta perante as necessidades informacionais dos usurios de um sistema de
informao, tendo em vista que o objetivo da
indexao tratar os documentos para que os
mesmos possam ser recuperados e seus
contedos disseminados.
A determinao do tema ocorre, na leitura
documentria, mediante anlise conceitual para
149
150
por que ele foi adquirido, entre outras, so identificadas como tematicidade extrnseca.
Elucidando a definio acima, acreditamos que a tematicidade sempre ser o contedo
relevante do documento, no entanto, algumas
variveis como os interesses informacionais dos
usurios do sistema iro influenciar na determinao desse contedo, entre outras. Portanto,
a escolha do tema de um documento sempre
estar relacionada com os interesses de tais
usurios, independente da quantidade de
informaes referentes ao tema selecionado.
Nesse sentido, Wilson (1985) citado por
Todd (1992 p.102), afirma que podemos entender
tambm que o grau de relao entre tematicidade
e significado varivel porque depende do
[...] uso que a pessoa pode encontrar
da tematicidade do documento numa
certa poca, e o mesmo documento
pode vir a ter diferentes significados
para o mesmo leitor em diferentes
pocas, entretanto o documento possui
uma tematicidade fundamental.
151
Aspectos Lingsticos
Os aspectos lingsticos na indexao
so evidenciados no momento da leitura, pois a
anlise do contedo um mtodo de apreenso
da informao transmitida por uma lngua
(CHAUMIER, 1986, p.19), sobretudo no momento
da traduo dos termos que representam os
conceitos identificados no documento em linguagem natural para a linguagem de indexao.
Moreiro Gonzlez (1994, p.206) classifica,
da seguinte forma, as fases em que os fatores
lingsticos se fazem presente no fazer documentrio:
1) Leitura-anlise: que consiste em
identificar e compreender o contedo
dos documentos e sua distribuio; 2)
Sntese: mediante la cual se interpreta
y simplifica el discurso a las lneas
macroestruturales para poder manejarlo e 3) Representao: Re- expresin
de la informacin en el uso social de la
informacin manejada.
152
Aspectos lgicos
No momento da leitura do documento para
indexao, o indexador realiza esforos mentais
classificados dentro de uma das divises da
Cincia Normativa Lgica, que por sua vez
pertence a uma cincia maior, a Filosofia.
A diviso da Lgica, conforme Santaella
(1992) citada por Naves (2000, p.74), pode ser
entendida como:
1- Lgica Utens: direcionada para o
raciocnio comum dos seres humanos
visando formar opinies, mas que,
porm, no suficiente por si somente.
2- Lgica Docens: exige do ser
humano uma capacidade invertida,
degeneralizao, de elaborao da
teoria, ou seja, estudos dos processos
de raciocnio e a investigao de
mtodos que dem bases mais
confiveis ao pensar, e apressem o
avano do conhecimento para os
resultados desejados.
Aspectos cognitivos
O indexador, alm dos processos
lingsticos e lgicos, utiliza, tambm, processos
cognitivos que interagem na leitura.
Iniciando a abordagem dos processos
cognitivos salientamos que so objeto de estudo
da Psicologia Cognitiva, constituindo-se de:
[...] processos e estruturas mentais
implicados na aquisio, no processamento e no uso do conhecimento ou
da informao, entre os quais podem
ser diferenciados os processos
mentais bsicos (memria e ateno),
as representaes mentais (imaginao, formulao de proposies e
estabelecimento de categorias) e os
processos mentais complexos (compreenso, raciocnio e soluo de
problemas) (PINTO MOLINA, 1994).
153
154
Procedimentos de indexao
Analisaremos a seguir os procedimentos
de indexao fundamentados na norma ABNT
12676 de 1992 que uma traduo da Norma
ISO 5696 de 1985 International Organization For
Transinformao, Campinas, 16(2):133-161, maio/ago., 2004
155
p.90). Caber, portanto, ao indexador ter familiaridade com os instrumentos para poder manipullos sabendo, de antemo, que estes podem
impor algumas limitaes na prtica de
indexao.
As recomendaes da norma 12676
(ASSOCIAO BRASILEIRA..., 1992) baseadas
nos princpios do UNISIST (1981), estabelecem
que o indexador na anlise de assunto, dever
realizar uma leitura do documento examinando
as partes mais relevantes, visto que a leitura
completa do item documental impraticvel. A
anlise do assunto na norma ABNT 12676 de
1992 dividida em dois estgios: o primeiro o
exame do documento e o segundo a identificao de conceitos.
No exame do documento a norma indica
a verificao das seguintes partes do documento,
tais como: ttulo; resumo; lista de contedos;
introduo (vendo as frases que iniciam captulos
e pargrafos); concluso; ilustraes; diagramas;
tabelas (e suas legendas); palavras em destaque.
Assim como o UNISIST, a norma ABNT,
alerta que a indexao no deve ser guiada
somente pelo exame do ttulo ou resumo do
documento. Isso se justifica, tendo em vista que
os ttulos, muitas vezes no so adequados e
at ambguos e, no caso dos resumos, alerta
que podem ser inadequados. Em suma, esses
dois itens no constituem nicas fontes para
identificao do assunto. A seguir, a norma
recomenda que a anlise siga uma abordagem
sistemtica para a identificao dos conceitos
considerados essenciais na descrio do
assunto.
A abordagem para identificao dos
conceitos dever ser feita com base em um
questionamento sistemtico, proposto pela
norma:
O documento possui em seu contexto
um objeto sob efeito de uma atividade?
O assunto contm um conceito ativo
(por exemplo, uma ao, uma operao, um processo etc.)? O objeto
156
como linguagem de indexao nos seus sistemas de informao. Isso revela, apesar do
processo de indexao ter evoludo, que ainda
persiste a primeira concepo baseada em
Cutter que formulou as primeiras tentativas de
organizao de assuntos representados pelos
cabealhos. Talvez isso possa explicar-se pelo
fato da Biblioteca do Congresso dos Estados
Unidos ter dado continuidade aos cabealhos
de assunto pela sua Lista de Cabealho de
Assunto, atualizando-a e disponibilizando-a
somente pelo preo de uma cpia.
Apesar da indexao existir h muito
tempo, at hoje se desconhece o que lhe
fundamental, ou seja, a determinao do assunto
ou tema do documento. Questo que volta
tona, sempre que se deseja a automao da
indexao. Verificamos que, a partir da dcada
de 1950, quando comearam os estudos de
indexao automtica, apareceram as preocupaes com reas de interface, como a Lingstica.
Evidencia-se a partir de ento, a importncia do
ser humano com relao ao juzo de valor da
tematicidade do documento.
As anlises dos textos que tratam da
prtica de indexao mostram a inexistncia da
descrio do processo de indexao, especialmente no que diz respeito ao momento de como
se processa a anlise de assunto, o que talvez
se explica pelo fato do resultado da indexao
estar sujeita leitura que o indexador realiza
para a determinao do assunto do documento.
E isso, depende muito das aes mentais que
cada indexador realiza no fazer documentrio.
Os textos analisados na reviso de
literatura fundamental evidenciaram a presena
dos aspectos que interferem no processo de
indexao, como os lingsticos, lgicos,
cognitivos e a questo da tematicidade. Os
textos descritos e analisados na reviso da
literatura de relatos de experincia mostraram
uma tendncia para a indexao automtica,
dando destaque aos aspectos lingsticos e
lgicos da indexao.
157
CONSIDERAES FINAIS
Ao realizarmos a pesquisa tnhamos
como pressupostos que o fator mais importante
na atividade de indexao era a concepo de
anlise de assunto assumida pelo indexador; que
uma anlise conceitual no poderia ser feita
unicamente com base na linguagem do sistema
de informao e, que esses fatores esto
diretamente ligados falta de fundamentao
terica na rea de indexao, uma vez que est
muito articulada com o desenvolvimento da
prtica.
Desenvolveu-se, ento, no estudo, a
anlise e discusso das tendncias na literatura
com relao ao desenvolvimento terico de
indexao e sua influncia na prtica do
indexador.
Pudemos verificar pela evoluo da
indexao, sobretudo na evoluo dos cabealhos de assunto, que o fator de maior importncia a determinao do assunto, ainda que
seja agravado pela dificuldade de uma linguagem
que ir represent-lo.
Desde Cutter, a literatura publicada tem
demonstrado a preocupao dos estudiosos com
Transinformao, Campinas, 16(2):133-161, maio/ago., 2004
158
159
REFERNCIAS
ALBRECHTSEN, H. Subject analysis and indexing:
from automated indexing to domain analysis. The
indexer, v.18, n.4, p.219-224, 1993.
ASSOCIAO BRASILEIRA DE NORMAS
TCNICAS. NBR 12676: mtodos para anlise de
documentos: determinao de seus assuntos e
seleo de termos de indexao. Rio de Janeiro,
1992. 4p.
AUSTIN, D. PRECIS: a manual of concept analysis
and subject indexing. London: Council of the British
National Bibliography, 1974. 551p.
BEGHTOL, C. Biblioghaphic classification theory
and text linguistics: aboutness analysis,
intertextuality and the cognitive act of classifying
documents. Journal of Documentation, London,
v.42, n.2, p.84-113, 1986.
BORKO, H.; BERNIER, C. Indexing concepts and
methods. New York: Academic Press, 1978. 261p.
BRADFORD, S.C. Documentao. Rio de Janeiro:
Fundo de Cultura, 1961.
101, 1977.
160
INTERNATIONAL
ORGANIZATION
FOR
STANDARDIZATION. Documentation methods for
examining documents, determining their subjects,
and selecting indexing terms. Geneva: ISO. 5p. (ISO
5963-1985 (E))
KAISER, J.O. Systematic indexing. London: Pitman,
1911.
KATO, M.A. O aprendizado da leitura. So Paulo:
Martins Fontes, 1985. 121p.
KLEIMAN, A. Texto e leitor: aspectos cognitivos da
leitura. 7.ed. Campinas: Pontes, 2000.
161
162