Está en la página 1de 7

Dicionrios que no existem

(Concluses da Conferncia Internacional, realizada na Faculdade de Letras da Universidade


de Lisboa, 7-8 de Outubro de 20131)

Joo Paulo Silvestre (CLUL/FLUL)

1. Um contexto para o debate


A reflexo sobre os tipos de dicionrios existentes para o Portugus justifica-se no momento
em que se experimenta a expanso de recursos lexicais na internet, mas em que tambm
possvel identificar lacunas na publicao de dicionrios de referncia nos domnios da
lexicografia histrica, patrimonial e da informao lingustica especializada.
A possibilidade de aceder na internet a uma informao sinttica, e hipoteticamente mais
atualizada do que no imutvel impresso, d aos utilizadores de recursos eletrnicos a
confortvel sensao de encontrarem resposta para a maior parte das dvidas que um
dicionrio pode resolver. A confiana nestes recursos legitimada pela associao a empresas
e editoras com longas dcadas de trabalho na publicao de dicionrios, por vezes oferecendo
gratuitamente verses abreviadas das mesmas obras que circulam em papel.
Mas a converso lexicografia eletrnica tambm modificou os rituais de consulta. Estes
dicionrios so hoje procurados ora como pronturio ortogrfico para validar a escrita, ora
como descodificador da imensa variedade de termos tcnicos que se insinuam em usos no
especializados. As expectativas dos utilizadores reorientam-se para o desejo de encontrar
informao sucinta sobre todas as palavras e consideram a ocorrncia no dicionrio como
abonao suficiente para legitimar o uso. A documentao das acees e a avaliao
fundamentada sobre os contextos de uso so exigncias de um pblico cada vez mais restrito,
que espera encontrar nos dicionrios uma descrio do funcionamento da lngua, e no apenas
uma prescrio abstrata.
A lexicografia, nos ltimos 30 anos, fundamentou-se em tcnicas normalizadas, apoiadas no
uso geral de aplicaes informticas. Esta especializao deslocou a lexicografia de uma
posio de lexicologia aplicada para um espao disciplinar autnomo, entre as cincias da
linguagem e as cincias informticas. A normalizao de procedimentos hoje geralmente
aplicada na lexicografia do Ingls e dita as prticas que aferem a qualidade dos dicionrios
das restantes lnguas. Os dicionrios do Portugus, especialmente os bilingues, so hoje

1
A conferncia internacional Dicionrios que no existem: tipologias lexicogrficas foi organizada
pelo Centro de Lingustica da Universidade de Lisboa. O programa e o livro de resumos podem ser
consultados em http://lexico.fl.ul.pt/dicionarios2013/

1
avaliados por modelos terico-prticos reconhecidos pela comunidade internacional de
lexicgrafos.
Na conferncia, atravs da anlise de projetos lexicogrficos em curso, ou em planificao,
procuraram-se respostas para problemas de tipologia e fundamentao lingustica:
- Que problemas tipolgicos e metodolgicos impedem o desenvolvimento de projetos
lexicogrficos?
- Comparando a produo lexicogrfica existente para outras lnguas modernas de grande
difuso, como adaptar as tipologias dicionarsticas ao Portugus?
- Como podem ser aproveitados os mtodos e o trabalho documental acumulado por projetos
lexicogrficos anteriores ou inacabados?
As concluses contriburam para uma perceo mais clara das lacunas da lexicografia do
Portugus, com a apresentao de modelos de dicionrios a desenvolver, dos problemas de
descrio lingustica e de constituio de corpora para a documentao lexicogrfica.
Apresentaram-se os resultados preliminares de projetos em curso, mas tambm problemas de
desenvolvimento relacionados com o tratamento de corpora, a seleo e tratamento de dados e
os meios para a disponibilizao dos dicionrios. Nesta sntese, destacam-se trs reas
fundamentais que exigem reflexo metodolgica, investimento e trabalho futuro: a
lexicografia patrimonial, os dicionrios especializados e os dicionrios gerais.

2. A lexicografia patrimonial
Ao mesmo tempo que os dicionrios gerais so mais acessveis, torna-se evidente a carncia
de dicionrios patrimoniais, que apresentem uma descrio documentada do lxico, numa
perspetiva diacrnica e crtica, essencial para esclarecer e validar a acumulao de informao
dos dicionrios do Portugus Contemporneo.
A comunicao de Telmo Verdelho2 recuperou o biblinimo tesouro para a discusso sobre as
prioridades da lexicografia do Portugus. um tipo de dicionrio essencial na fixao da
descrio lexical cannica das lnguas romnicas e ainda em uso na tradio francesa e
italiana (como o Trsor de la Langue Franaise, ou o Tesoro della Lingua Italiana delle
Origini).
O tesouro o arqutipo do dicionrio que interage com a histria da lngua, funcionando
como repositrio da memria das palavras, da arte literria, da plstica gramatical, das
subtilezas semnticas e dos recursos expressivos. Cabe tambm num tesouro a informao
extralingustica das palavras que assinalam referncias histricas e momentos e movimentos
da histria poltica, cultural e religiosa. documentado por um universo textual e lingustico

2
Telmo Verdelho (Academia das Cincias de Lisboa), O Tesouro: conjecturas sobre uma utopia da
lngua portuguesa.

2
de referncia, que representa "tudo e o melhor, em toda a memria escrita". A sua realizao
assenta em pressupostos filolgicos que exigem uma discusso sobre o conceito de memria
literria cannica e sobre a qualidade das fontes textuais disponveis. Sobretudo, um tesouro
necessita de edies crticas fidedignas, que resolvam lacunas tradio filolgica portuguesa.

3. Filologia e corpora
A necessidade de constituir um corpus histrico para apoio da atividade lexicogrfica e da
histria da lngua foi amplamente discutida nas conferncias de Clotilde Murakawa3 e
Filomena Gonalves4, sobre o projeto de um Dicionrio Histrico do Portugus do Brasil,
desenvolvido na Universidade Estadual Paulista. Este dicionrio tem por objetivo reunir o
lxico da lngua portuguesa que, nos sculos XVI, XVII e XVII, fixou um repertrio lexical
que veio a constituir o portugus do Brasil. Documenta-se numa base de dados com
aproximadamente 10 milhes de ocorrncias, a partir de textos que representam trs sculos
da histria colonial brasileira. Alm de fornecer a nomenclatura do dicionrio histrico, a
base de dados permitiu construir definies lexicogrficas, acompanhadas de exemplos
abonados. A equipa assume os problemas filolgicos decorrentes da integrao de edies de
qualidade muito diversa, que incluem leituras realizadas por historiadores a partir do sculo
XIX. O trabalho filolgico de edio uniforme das fontes seria to demorado que
inviabilizaria a concluso desta primeira verso. As imperfeies do conjunto documental so
reconhecidas, mas no impedem o uso do acervo para a datao de palavras e significados.
Foram vrias as comunicaes a referir a importncia da qualidade dos trabalhos de edio
eletrnica para os estudos lexicolgicos5. Nas chamadas humanidades digitais, hoje um
requisito que os textos sirvam tambm como documento lingustico, valorizando no apenas a
preservao e o acesso aos originais, mas tambm a interao com os estudos em cincias da
linguagem. A edio de textos, a lexicologia e a lingustica computacional so disciplinas
colaborantes na obteno de textos coerentemente editados, que preservem a informao
lingustica essencial para a documentao lexical, e com uma seleo criteriosa e
representativa das variaes diacrnicas e de registo.
A possibilidade de aplicar modelos de anlise lexicogrfica aos textos permite a pesquisa de
padres lingusticos abrangentes atravs de expresses regulares simples, fazendo referncia

3
Clotilde Murakawa (Universidade Estadual Paulista), Opes, decises, (im)perfeies e resultados
do Dicionrio Histrico do Portugus do Brasil.
4
Filomena Gonalves (Universidade de vora), O banco de textos do Dicionrio Histrico do
Portugus do Brasil.
5
Joana Serafim e Paula Carvalho (Universidade Europeia), Joo Paulo Silvestre, (CLUL), As
tradues da Regra de S. Bento: um glossrio diacrnico do lxico portugus (secs. XV-XVI).
Joo Paulo Silvestre (CLUL) O corpus de regionalismos e arcasmos de Leite de Vasconcelos: editar
uma fonte lexicogrfica.

3
aos atributos lexicais, morfolgicos e sinttico-semnticos. Mas, sem edies de qualidade, as
vantagens que a lingustica computacional traz ao processamento de dados so
desaproveitadas, pois os resultados sero provavelmente equvocos.
Outro caminho promissor para a constituio de corpora documentais a retrodigitao de
dicionrios e o seu processamento computacional. Um projeto deste tipo decorre na
Universidade do Minho6 e visa aplicar a dicionrios existentes (que podem ser dicionrios
impressos, recuperados por reconhecimento ptico de carateres) processos de anlise e
pesquisa automtica que os transformam em dicionrios de codificao / produo. Pretende-
se que os utilizadores possam procurar unidades lexicais relacionadas (sinnimos, quase-
sinnimos, hipernimos, hipnimos, mernimos, holnimos, coocorrentes, etc.) a partir de
uma ou de vrias palavras. O sistema de pesquisa apoia-se na codificao de uma estrutura
semntica, que explicita relaes lxico-conceptuais com os termos introduzidos. A pesquisa
transforma os dicionrios eletrnicos numa espcie de base de dados conceptual, que funciona
como um dicionrio onomasiolgico. Para a extrao automtica de relaes lxico-
conceptuais usa-se um conjunto de regras ou padres, que so sequncias de palavras que se
pretendem encontrar nas definies e que indicam a grande probabilidade da palavra que
segue o padro estar relacionada com o lema da respetiva definio.

4. Dos dicionrios especializados aos dicionrios gerais


A descrio sistemtica de dados relativos etimologia, informaes pragmtico-discursivas
ou sinttico-combinatrias tem perdido espao na maioria dos dicionrios de Portugus,
apesar de ser importante para o conhecimento das unidades de sentido. O tratamento
atualizado destes domnios encontra-se sobretudo em dicionrios especializados. A
lexicografia Brasileira tem suprido lacunas pela publicao de dicionrios combinatrios e de
colocaes, que indicam para cada palavra que tipos de complemento so sintaticamente
possveis, ou, no caso das colocaes, que palavras coocorrem para formar unidades de
sentido distintas da soma dos significados individuais. A comunicao de Maria Helena de
Moura Neves7 traou a histria da compilao destes recursos no Brasil, pela equipa do
linguista Francisco Borba8. So dicionrios e gramticas de referncia, totalmente elaborados
a partir de usos reais da lngua verificados num corpus de lngua escrita de todos os gneros e

6
lvaro Iriarte (Universidade do Minho) A pesquisa reversa nos dicionrios eletrnicos.
7
Maria Helena de Moura Neves (Universidade Estadual Paulista Universidade Presbiteriana
Mackenzie), A produo de dicionrios e gramticas de usos.
8
Borba, F.S.(ed.) Dicionrio gramatical de verbos do portugus contemporneo do Brasil. So Paulo:
Ed. UNESP, 1990; Borba, F.S. et allii. Dicionrio de usos do portugus. So Paulo: tica, 2002;
Borba, F.S. (org.) Dicionrio UNESP do portugus contemporneo So Paulo: Ed. UNESP, 2004;
Borba, F.S. (ed.) Dicionrio do portugus documentado do Brasil. So Paulo: Ed. UNESP, no prelo;
Neves, M.H.M. Gramtica de usos do portugus. So Paulo: Ed. UNESP, 2000.

4
de todos os tipos (literrio, jornalstico, oratria, tcnico-cientfico, ), hoje com 230 milhes
de ocorrncias. Essa base de dados est disponvel na UNESP (corpus de Araraquara).
Em 2012, foi entregue para publicao o Dicionrio do portugus documentado do Brasil
(Borba, coord., no prelo), definido como um tesouro lexical que, documentando a lngua
escrita com o corpus de Araraquara, enuncia os padres de construo sinttica e a colocao
lexical, e as respetivas informaes semnticas.
Do desenvolvimento da lexicografia especializada resultam dicionrios em que se exige
adequao funcional, rigor documental e qualidade da descrio lingustica. O conhecimento
destes modelos, tecnicamente mais coerentes e cientificamente validados, dever modificar a
perceo que os lexicgrafos e os utilizadores tm sobre os dicionrios gerais.

5. Mtodos e objetivos para os dicionrios gerais


No obstante serem dirigidos para um pblico diversificado, os dicionrios gerais podem
refletir os resultados da investigao em domnios especializados do saber lexical e beneficiar
de todo o investimento que tem sido feito na compilao de corpora literrios e lingusticos.
O uso sistemtico de corpora na lexicografia do Portugus uma prtica recente e, no caso
dos dicionrios que so constitudos a partir de uma base lexical no documentada, a
justificao de todas as acees e entradas poderia significar uma reescrita significativa do
material j compilado.
Numa sesso dedicada a corpora e lexicografia, discutiu-se a utilizao efetiva, por parte das
equipas de lexicgrafos, dos dados oferecidos pelos corpora lingusticos. O Corpus de
Referncia do Portugus Contemporneo9 um dos recursos mais extensos e foi j usado
como fonte documental do Dicionrio da Lngua Portuguesa Contempornea. Contm 311,4
milhes de palavras e abrange diferentes tipos de textos escritos (literrio, jornalstico,
tcnico, etc.) e de registos orais (formal e informal). Permite extrair informao para a
descrio lexical no que respeita a neologismos, colocaes, com informao morfossinttica.
Todavia, os dicionrios gerais parecem fazer uso muito parcial destes recursos, segundo foi
descrito na conferncia por representantes de dois dicionrios de grande difuso, o Dicionrio
Priberam da Lngua Portuguesa (DPLP) e o Dicionrio Houaiss da Lngua Portuguesa.
O Dicionrio Priberam da Lngua Portuguesa (DPLP)10 um recurso de acesso gratuito
online, integrado na plataforma da Priberam. Est em ampliao constante e pretende oferecer
uma descrio o mais extensa possvel do lxico portugus conhecido. A base de dados do
DPLP foi constituda a partir do Novo Dicionrio Lello da Lngua Portuguesa (1996).

9
Apresentado por Amlia Mendes (Universidade de Lisboa).
10
Comunicao de Helena Figueira, Afonso Mendes, Pedro Mendes e Cludia Pinto (Priberam),
Dicionrio Priberam da Lngua Portuguesa.

5
Alterou-se a microestrutura original, refletindo solues encontradas por dicionrios gerais
mais recentes como o Dicionrio da Lngua Portuguesa Contempornea (Casteleiro, 2001) e
o Dicionrio Houaiss da Lngua Portuguesa, incorporando as ferramentas de pesquisa e
relacionamento de dados desenvolvidas pela Priberam.
Para a redao de novos verbetes, os lexicgrafos consideram aspectos como as estatsticas de
consulta (que indiciam formas ainda no dicionarizadas) e os usos em tempo real da palavra
no Twitter, em blogues e em notcias. Apesar de no se tratar de abonaes literrias, so
entendidos como usos efetivos da lngua, contextualizados e autnticos.
A Priberam dispe de outros recursos ou ferramentas cuja articulao com o DPLP ainda est
em desenvolvimento, nomeadamente o aumento da nomenclatura a partir dos lxicos do
FLiP, que incluem unidades lexicais das variedades do Portugus. A Priberam desenvolveu
tambm uma ontologia com cerca de 200 000 vocbulos e locues em Portugus, com os
respetivos equivalentes em ingls, francs e espanhol, e com uma estrutura estabelecida
atravs de relaes de proximidade conceptual que podem possibilitar uma visualizao e
articulao de contedos que se afasta da forma lexicogrfica mais tradicional. A ontologia
poder servir como uma ferramenta essencial na criao, por exemplo, de um dicionrio
analgico ou de um dicionrio com classificao semntica de todas as entradas.
O Dicionrio Houaiss da Lngua Portuguesa11, concebido simultaneamente como dicionrio
eletrnico e impresso, mais restritivo na fixao da nomenclatura, avaliando a frequncia de
uso e perspetivando da relevncia da palavra na lngua a mdio prazo. O levantamento de
entradas e o registo das acees procura basear-se em corpora ou outras bases textuais, e a
descrio semntica abonada em usos atestados. Apesar de no ser um dicionrio histrico,
a datao dos usos o critrio que organiza as acees dentro dos verbetes, a partir da sua
aceo mais antiga, sugerindo um caminho histrico para o aparecimento gradual dos novos
sentidos e tambm esclarecer os fenmenos de derivao semntica.
O registo de novas palavras especialmente ponderado. As informaes sobre possveis
admisses na nomenclatura so armazenadas parte na base de dados e a validao
posteriormente discutida. Alm da passagem de um determinado nmero de anos para avaliar
a permanncia da palavra, considera-se tambm o volume de utilizao e ocorrncia em
fontes de natureza diversa. O dicionrio Houaiss no recebe sugestes dos utilizadores para a
incluso de novas palavras, mas tem um conjunto de colaboradores que apresentam propostas
a partir a leitura de fontes. A incluso de termos cientficos e tecnolgicos em geral depende
da contribuio de especialistas de cada uma dessas reas.

11
Apresentado por Mauro Villar (Instituto Antnio Houaiss).

6
6. Concluses
Os dicionrios gerais, apesar da profuso de ttulos editados e de recursos eletrnicos,
ressentem-se da falta de instrumentos para assinalarem unidades lexicais e acees que esto
em desuso no Portugus Contemporneo. Sem a aferio que s pode ser obtida num
dicionrio patrimonial com organizao diacrnica, todos os dicionrios gerais tendem a ser
acumulativos, construindo uma descrio desproporcional do lxico, que inflaciona o peso da
memria sucessivamente recuperada de dicionrios anteriores e que os torna incomunicantes
no que respeita comparao bilingue. Mesmo quando os lexicgrafos assumem uma
orientao diacrnica, como no caso do dicionrio Houaiss, rapidamente concluem que no
tm nem os dados, nem o tempo necessrio para aplicar os critrios sistematicamente, sem
inviabilizar um produto que obedece aos ritmos das iniciativas comerciais.
Outras reas, que trabalham a partir de corpora contemporneos (terminologia, os dicionrios
combinatrios) parecem ter os instrumentos documentais e tcnicos para continuar a produzir
e a atualizar dicionrios especializados. Tambm a qualidade da lexicografia bilingue ganha
com a melhoria destes dicionrios, pois abordam unidades e categorias de informao
necessrias para acompanhar os padres de descrio j alcanados por outras lnguas
modernas.
A descrio da evoluo semntica e da inovao lexical uma tarefa complexa, que exige
leitura atenta das fontes e o rastreio de corpora, alm da construo de corpora especficos.
Os dicionrios diacrnicos podem, com base na documentao, discriminar o que caracteriza
a lngua contempornea e o que passa a constituir um patrimnio lexical preservado na
memria literria. A lexicografia patrimonial uma referncia essencial para garantir a
qualidade tcnica e documental dos futuros dicionrios do Portugus.
Na histria da lexicografia das lnguas modernas houve espao para um exerccio de reflexo
sobre o patrimnio acumulado e, no caso do Portugus, esse trabalho foi iniciado por
instituies acadmicas, mas de facto nunca concludo, pelo menos de acordo com mtodos
consistentes e reconhecidos internacionalmente. uma tarefa de dcadas, destinada a um
permanente esforo de atualizao, e que, no caso do Portugus, lngua com uma reconhecida
expanso e variedade, pode beneficiar da colaborao pluricntrica entre as vrias instituies
universitrias ou de referncia cultural que esto em condies de garantir a competncia
cientfica e os meios para a continuao do trabalho.

También podría gustarte