Está en la página 1de 18

A Ortografia Padronizada do Tétum

Os Seus 115 anos de Construção
Edição da Direcção do Instituto Nacional de Linguística, República Democrática de Timor-Leste, Agosto de 2004

Determinar a ortografia padronizada de qualquer língua é uma operação difícil e delicada, que requer uma enorme bagagem em termos de sabedoria científica: nenhum sistema ortográfico padrão foi jamais definido por um conjunto de falantes nativos sem qualquer conhecimento profissional de linguística, mesmo sendo este constituído por pessoas de formação aprofundada em outras áreas. O planeamento linguístico é um exercício tanto de engenharia como de arquitectura, algo próximo da construção de uma ponte ou de um arranha-céus. Assim como ninguém gostaria de atravessar uma ponte ou viver num bloco de apartamentos desenhados por, respectivamente, uma comissão de utilizadores da futura ponte ou de residentes do edifício completamente desconhecedores de engenharia ou de arquitectura, nenhum governo responsável entregaria a tarefa de padronizar a sua língua oficial a alguém que não fosse linguista profissional, com uma sabedoria específica, neste caso, na área das línguas timorenses. Se observarmos o resto do mundo, verificaremos que os sistemas ortográficos padronizados das línguas oficiais tomaram forma em uma de duas maneiras possíveis. As mais antigas entre as língua estabelecidas (como o latim, o inglês, o árabe, o sânscrito e o chinês) têm ortografias herdadas de uma longa tradição literária estabelecida em permanência por escritores e/ou investigadores. As línguas que foram promovidas ao uso oficial num momento particular, em situações coloniais ou pós-coloniais (ex: o malaio-indonésio, o tagalo, o vietnamita, o fijiano, o samoano, o maori, etc.), foram codificadas por eruditos, tanto lexicógrafos como linguistas a título individual ou, ainda, comissões de

1

linguistas profissionais nomeados por uma instituição nacional ou pelo próprio governo. Quando a sua soberania foi restabelecida, em 2002, a República Democrática de Timor-Leste não demonstrou intenções de se tornar uma excepção a esta regra geral. O “Instituto Nacional de Linguística” (INL) foi estabelecido em 2001, recebendo a determinação da sua missão a partir do Conselho Nacional da Resistência Timorense (CNRT) em ordem a planificar uma ortografia timorense unitária, de modo a que todas as línguas nacionais pudessem ser escritas de acordo com as mesmas convenções. Esta comissão, confirmada pelo governo restaurado de Timor-Leste no ano seguinte, não implicava que o tétum não tivesse já uma ortografia; antes reconhecia o facto de que os sistemas existentes eram imperfeitos ou incoerentes, devido ao facto de terem sido divisados por escritores que, na sua maioria, não tinham fundamentos ou formação científica em linguística. As razões para tais defeitos nas ortografias populares não são difíceis de encontrar. As pessoas qualificadas para lidar competentemente com as questões ortográficas do tétum e de Timor-Leste precisam de um vasto âmbito de qualificações, em relação às quais não são de excluir: • Formação universitária ou experiência profissional nas disciplinas de: fonologia, linguística histórica, linguística austronésica, linguística papuásica e linguística românica. • Um sólido conhecimento de tétum, português e malaio. • Um bom conhecimento, a nível laboral, das outras 15 línguas nacionais de Timor-Leste. • Familiaridade com todos os trabalhos publicados sobre as questões lexicográficas do tétum. • Familiaridade com a literatura científica sobre tétum publicada em português, inglês, indonésio e outras línguas. • Um claro entendimento da diferença entre sistemas fonéticos e fonémicos de ortografia, essencial para qualquer processo de padronização. • Um claro entendimento das diferenças entre variedades acrolectais, mesolectais e basilectais do tétum e a sua relevância para a ortografia fonémica. A tarefa do INL encontra-se, no entanto, não na abolição ou substituição das actuais ortografias, mas sim na sua correcção, refinamento e unificação, no sentido de um padrão único e coerente, construído com base em princípios científicos rigorosos, apesar de manter uma flexibilidade suficiente de modo a poder, quando isso for apropriado, harmonizar a ortografia racional com convenções tradicionais que sejam compatíveis. Uma vez que a base ortográfica do tétum não é revolucionária mas, sim, evolucionista, o propósito do presente
2

estudo reside na tentativa de traçar um panorama histórico sobre os graduais desenvolvimentos na escrita da língua que acabaram por culminar na reforma actual.

História Ortográfica do Tétum
A ortografia padronizada do tétum, à qual foi dado carácter oficial legislativo por Decreto governamental (1/2004 de 14 de Abril de 2004), não foi o trabalho de um só linguista, mas o culminar de um processo experimental que durou 115 anos desde a publicação do primeiro dicionário de tétum, em 1889. Houve oito contribuições seminais para esta evolução ortográfica, as primeiras quatro individuais (todas elas de portugueses) e as últimas quatro de comissões (duas timorenses e duas timorenses e internacionais): a) Sebastião Maria Aparício da Silva (1889) Diccionario de Portuguêz-Tétum b) Raphael das Dores (1907) Diccionario Teto-Português c) Manuel Patrício Mendes e Manuel Mendes Laranjeira (1935) Dicionário Tétum-Português d) Artur Basílio de Sá (1952) Notas sobre linguística timorense: Sistema de representação fonética e) Comité da FRETILIN para a Literacia (1975) Como vamos alfabetizar o nosso povo Mau Bere de Timor Leste f) Comissão Litúrgica da Diocese de Díli (1980)1 Ordinário da Missa: Texto Oficial Tétum; leccionários g) Comissão Internacional para o Desenvolvimento de Timor-Leste; Línguas (IACDETL) (1996) Princípios de Ortografia Tétum: Sistema Fonémico; Standard TetumEnglish Dictionary h) Instituto Nacional de Linguística (INL) (2002) Matadalan Ortográfiku ba Tetun Nasionál; Hakerek Tetun Tuir Banati Todos os escritores de tétum, durante este período, usaram a língua de acordo com as convenções ortográficas de uma ou mais destas contribuições e não
1

Os membros eram os seguintes: Monsenhor Martinho da Costa Lopes (Administrador Apostólico) e os Padres António Maia, Agostinho da Costa, Francisco Tavares dos Reis, Mariano Soares, Alberto Ricardo da Silva (actual Bispo de Díli), Domingos Morato da Cunha, Luís Sarmento da Costa e Leão da Costa.

3

introduziram nenhuma inovação que fosse depois encontrar um lugar permanente na ortografia oficial de 20042. A divisão entre os dois tipos de contribuições antes mencionadas é historicamente significativa, uma vez que as quatro contribuições individuais pertencem à época do colonialismo português, na qual o único meio de instrução que era autorizado nas escolas timorenses era o português e o objectivo dos ortografistas residia em divisar um sistema ortográfico fonético, de modo a ajudar os estrangeiros a aprender tétum, e não residia em tentar munir os timorenses de um meio literário indígena. Nesse sentido, o colonialismo português (que era de tipo assimilacionista) era radicalmente diverso do colonialismo holandês, que era integracionista e encorajava a estandardização do malaio como língua veicular de toda a Indonésia. Consequentemente, tentativas de superação em relação às ortografias existentes, dentro de uma base inclusivista e fonémica e para tornar o tétum numa língua oficial e nacional, apenas chegaram com a época da descolonização, começando com a campanha de alfabetização, que foi desenvolvida pelo curto governo da Fretilin em 1975; continuaram depois, corajosamente, com a Igreja Católica, resistiram através de um grupo de linguistas internacionais e timorenses baseados na Austrália durante a Ocupação indonésia (1975-1999) e foram completadas entre 2001 e 2002 pela autoridade linguística nacional do recémlibertado país.

Os Fonemas do Tétum
Uma vez que uma ortografia cientificamente válida, em relação a qualquer língua, requer símbolos adequados para os fonemas dessa mesma língua, a apresentação do inventário dos fonemas do tétum é um pré-requisito em relação a qualquer discussão sobre a sua representação escrita. Os símbolos fonémicos dados abaixo entre barras estão em conformidade (exceptuando as vogais nasais) com os grafemas agora adoptados na ortografia oficial. Mesmo após a descoberta do fonema pelo linguista inglês Daniel Jones no princípio do século vinte, não se fez nenhuma tentativa em Timor no sentido de
2

Nesse sentido, Lencastre (1929) e Martinho (1942) seguiram, em geral, a ortografia de Silva (1887); Fernandes (1962) aderiu à ortografia de Mendes e Laranjeira (1936); a maioria dos escritores que emigraram para Portugal durante a ocupação indonésia (1975-1999) conformou-se à ortografia da Fretilin; por outro lado, o Tetun English Dictionary, publicado por Cliff Morris na Austrália em 1983 (uma tradução inglesa do dicionário de Mendes e Laranjeira, de 1936, cuja edição não reconhece o original), difere do trabalho original através da omissão de acentos e pela introdução de grafemas fonémicos <k> e <s>. Os escritores católicos de Timor, durante a Ocupação, seguiram, muitas vezes com pouca consistência, o modelo que a Comissão Litúrgica da Diocese de Díli lançou em 1980. O Dicionário de Tétum-Português de Luís Costa (2000), uma revisão e amplificação do dicionário de Mendes de Laranjeira de 1936, que devidamente reconhece o original, favoreceu as normas ortográficas da Fretilin.

4

divisar uma ortografia fonémica para o tétum. A ênfase sempre esteve mais centrada na representação coerente e precisa dos sons da língua, sem ter havido nenhuma tentativa para analisar as suas relações mútuas. O tétum tem cinco vogais orais:
/i/ /e/ /a/ /o/ /u/

Tem cinco contrapartidas nasais:

/Ê / /e)/ /ã/ /õ/ /u) /
Ambas as séries de vogais podem ser longas ou curtas quando tónicas, ou ocorrer em sequências (sendo que a primeira vogal em cada sequência é acentuada):
/aa/ /ae/ /ai/ /au/ /ea/ /ee/ /ei/ /eo/ /eu/ /ia/ /ie/ /ii/ /io/ /iu/ /oa/ /oe/ /oi/ /oo/ /ou/ /ua/ /ue/ /ui/ /uo/ /uu/

Existem 21 consoantes:
/p/ /b/ /v/ /m/ /w/ /t/ /d/ /s/ /z/ /n/ /r/ /rr/ /l/ /ll/ /ñ/ /x/ /j/ /k/ /g/ /’/ /h/.

Entre estas consoantes, /w/ ocorre nos dialectos rurais mas é substituído por /b/ na lingua franca (tétum-praça). Alguns falantes de tétum-praça apagam a oclusiva glotal /’/. Alguns dos símbolos fonémicos mencionados acima diferem das suas contrapartidas no Alfabeto Fonético Internacional, nomeadamente as seguintes:
/r/ /rr /ll/ /ñ/ [|] [r] [¥] [≠] /x/ /j/ /’/ [S] [Z] [/]

Os Princípios Evolutivos da Ortografia Tétum
A ortografia do tétum reflecte o seu contexto histórico e cultural: a tradição literária portuguesa do século XIX. Portugal transmitiu ao tétum o alfabeto romano das actuais 26 letras e uma série de diacríticos próprios da língua portuguesa: a cedilha, (“pequeno z”, originalmente um z subscrito), o til (originalmente um n sobrescrito) e, também, os acentos agudo, grave e circunflexo.
5

Na seguinte exposição a palavra em itálico (becic) representa a ortografia de apenas um escritor; o equivalente em negrito (besik) representa a moderna grafia padrão e o exemplo em itálico e negrito (besik) representa uma grafia particular que coincide com o padrão moderno.

A Fundação Portuguesa
O primeiro português a elaborar convenções ortográficas para o tétum foi o Padre Sebastião Aparício da Silva, um missionário católico cujo dicionário de tétum-português foi publicado em Macau, em 1889. Ao reduzir o tétum a letras latinas, o Pe. Silva estabeleceu um padrão para o uso das sete consoantes b, d, f, l, m, r, t, que permaneceria imutável até ao presente. Consequentemente, durante o resto deste estudo não apresentaremos nenhuma discussão da representação ortográfica dos fonemas correspondentes /b/ /d/ /f/ /l/ /m/ /r/ /t/3. Em outros aspectos, a ortografia de Silva (que não era completamente coerente) aderiu de modo próximo às convenções portuguesas. Em geral (mas com importantes excepções) as palavras de proveniência portuguesa eram escritas exactamente como na língua de origem, sem qualquer adaptação à fonética do tétum. Vejamos alguns exemplos:
lenço lensu licença lisensa machado maxadu gentio jentiu general jenerál marinheiro mariñeiru junho Juñu julho Jullu coelho koellu chá xá chouriço xourisu martello martelu

Por outro lado, em palavras nativas, o fonema consonântico /k/ (excepto antes de e e de i) e /s/ intervocálico) era escrito de acordo com regras portuguesas:
camútis kamutis crécas krekas cúac kuak hameríc hamriik húcic husik fácè fase táci tasi bóçòc bosok haçára hasara

Tomando como modelo o dialecto tétum do reino de Samoro, ao sul, tanto Silva como Dores registaram numerosas formas com–l final, que tem sido geralmente substituído por –r no dialecto tétum de Díli. Os exemplos seguintes têm, portanto, um aspecto distintamente arcaico nos dias de hoje: (Silva) mâmal mamar, cabúal kabuar, hadél hadeer, nacfácal nakfakar, bocal bokar, fítel fitar, dúcul dukur, dícul dikur; (Dores) mámal mamar, midal midar, dádul dadur, kabuál kabuar, dácal dakar.

3

6

A Evolução de Convenções com Base Tétum
A ortografia de Sebastião Aparício da Silva era incoerente por ser ao mesmo tempo conservadora (imitando convenções portuguesas) e inovadora: o missionário improvisou novas convenções, sugeridas pela estrutura intrínseca do tétum, sempre que as convenções portuguesas pareceram inapropriadas ou incómodas. O Pe. Silva e os seus sucessores contribuíram para o gradual desenvolvimento e tetumização da ortografia de base portuguesa, ao introduzirem 21 inovações individuais que acabaram por ganhar raiz nos hábitos locais de escrita e foram posteriormente integradas na ortografia oficial. Estes pilares do padrão ortográfico moderno podem ser alistados de modo cronológico, começando com as inovações de Sebastião da Silva. A. INOVAÇÕES DE S.A. da SILVA 1 – O uso do <h> para representar a consoante aspirada [h] (fricativa glotal), contradizendo a convenção portuguesa do <h> mudo como em haver, houve, homólogo, hesitar:
hêmo hemu hamútuco hamutuk hétan hetan cakéhè kakehe hahí hahii óhim ohin haníhã hanihan (hanehan) hadômi hadomi húrum hurun róhan rohan déhan dehan haháloc hahalok

2 – Uso do apóstrofo para representar a oclusiva glotal [/], o que não se encontra em português:4
ná’an na’an dí’ac di’ak sadí’a sadi’a fó’er fo’er né’e bé ne’ebé lá’en la’en há’u ha’u uá’in wa’in tó’o to’o

3 – Notação das duplas vogais nativas (isto é, dissilábicas) etimologicamente determinadas.5 Isto tornou-se consistente nos casos de:
4

O apóstrofo manteve-se em todos os futuros escritores excepto Dores, que o substituiu (embora não de modo coerente) por um acento agudo na vogal seguinte (ex: toó to’o, nuú nu’u ‘modo’, laú la’o, lalian lali’an, hakruúko hakru’uk), e os tradutores católicos de textos bíblicos durante os anos de 1990 (em contradição com a convenção estabelecida pela Comissão Litúrgica de Díli de 1980 que marcou regularmente a oclusiva glotal com um apóstrofo). 5 Como exemplos de etimologias, vejamos cf. boot < *boat < timorense antigo (TA) *beRat, foos < *foas < TA beRas, bee < wee < TA *wahir, teen < *ta’in < TA *taqi-ne. As vogais duplas ainda são pronunciadas como tal nas variedades orientais do tétum-térique, assim como no tétumpraça. Os estudiosos holandeses do tétum ocidental anotaram vogais simples nestes casos (ex: as, hat, let, tos, haré, hamrók) uma vez que as longas vogais duplas originais tinham sofrido uma simplificação nos dialectos beluneses (incluindo os de Timor-Leste). O facto de os falantes nativos de tétum intuírem a natureza dissilábica destas vogais duplas, torna-se claro a partir dos

7

kée kee faac faak bóoc book bóote boot clóote kloot íis iis fúuc fuuk míi mii môon moon húur huur bíite biit cúus kuus tíi tii síin siin léete leet clóoc klook hakée hakee

As duplas vogais eram escritas como vogais simples nos casos de6:
ás aas hás haas fós foos háte haat bé bee fén feen cmán kmaan tém teen tur tuur dadél dadeer haré haree

Existiam hesitações nos casos de:
dóoc ~ dóc dook rii ~ rím riin

4 – Utilização de <n> posposto no sentido de indicar nasalidade em palavras indígenas. Isto era coerente nos casos de:
áten aten láran laran déhan dehan ícin isin lólon lolon fúrin furin lúbun lubun balíun baliun máun maun

Em outros casos, o til de origem portuguesa ou o -m final eram utilizados para marcar a nasalidade da palavra:
haníhã hanehan saiã saián aihã ai-han

calém kaleen tém teen óhim ohin lílim lilin kídum kidun úcum ukun íbum ibun dadáum daudaun7

erros hiper-correctivos cometidos por pessoas cujo idiolecto não inclui a oclusiva glotal, por exemplo: bo’ot boot, a’as aas, le’et leet, hare’e haree, hamro’ok hamrook. 6 A notação incoerente das vogais duplas seria uma falha constante das ortografias construídas por pessoas sem formação rigorosa em linguística: Exemplos de tais incoerências nos trabalhos de escritores de tétum subsequentes, incluem, por exemplo: Dores (1907): aáte aat, biite biit, huúr huur, huú huu, iis, leéte leet, loók look, luúto luut, mii, úuto uut ~ hás haas, hate haat, bote boot, bé bee, den deen, dil diir, fen feen, lan laan, lir liir, lós loos, tós toos, nu nuu, tós toos; Mendes e Laranjeira (1935): áas, áat, háas, háat, cmâan, cnaar, féen, béen, têen, néen, léet, síin, líin, bóoc, dóoc, bóot, clóot, núu, túu, úut, natóon, hamróoc, nonóoc, tatíis ~ bé bee, lés lees, fós foos, tós toos, bí bii, clór kloor, lós loos, túr tuur, dadér dadeer; ainda, hesitações nos casos de: táa ~ tá taa, íis ~ ís iis, kée ~ ké kee, lóoc ~ lóc look, moo ~ mós moo-s, ríin ~ rin riin, sóor ~ sór soor; Martinho (1943) haat, têen, neen, boot, dóoc, fúuc, nuu ~ lés lees, dadél dadeer, bé bee, hatós hatoos, tur tuur; Sá (1952): têen teen, luun luun ~ namrés namrees, haré haree; Commissão Litútgica da Diocese de Díli (1980): leet, boot, aat, knaar, kbiit ~ los loos, ás aas, lolós loloos, hamós hamoos, hahí hahii, haré haree; Costa (2000) deer, deet, dook, faak, faat, fuuk, haat, neen, saar, taan ~ bé bee, bar baar, fen feen, has haas, haré haree, harís hariis, kes kees, let leet, los loos, nu nuu, ran raan, rin riin, sin siin, ten teen, tos toos.

8

5 – Uso do <k> para representar a oclusiva velar não vozeada [k], antes de e e i, em vez do português qu:
kiláte kilat hakérèc hakerek kíkite kikit kélen kelen cakéhè kakehe múkite mukit lókè loke makíli makili

B. INOVAÇÕES DE R. das DORES 6 – Uso geral do <k> para representar a oclusiva velar não vozeada [k], substituindo o c português:8
kánek kanek kakórok kakorok késsar kesar kbíite kbiit kiak kiak klétak kletak klóssan klosan knóruko knoruk kontra kontra kótuko kotuk kúkun kukun kúlite kulit9

7 – Introdução do hífen para indicar palavras compostas mas semanticamente unitárias:
ita-nia ‘o nosso’ ida-neé ida-ne’e ‘este’ máno-ôan manu-oan ‘pintainho’ mátan-délek matan-delek ‘cego’ mássin-midal masin-midar ‘açúcar’ máun-álin maun-alin ‘irmãos’ tauko-laék ta’uk-laek ‘intrépido’ sala-máluko sala-maluk ‘cúmplice’ hanôin-hikas hanoin-hikas ‘desgosto’

C. INOVAÇÃO DE M.P. MENDES E M. LARANJEIRA 8 – Uso geral do <u> para representar o –u final, em substituição do <o> português: 10
A partir de Dores (1907) o -n foi usado por todos os escritores excepto Lencastre o qual, seguindo o Pe. Silva, vacilou entre -n e -m: néen, tahan, tulun, léten, daun, tinan ~ cabum, mutim, lorum, tanam, ulum, balum, naram, muçam. 8 O uso geral do k foi mantido por Sá, pelo Comité de Alfabetização da Fretilin, pela Comissão Litúrgica de Díli e pela IACDETL; por outro lado, Mendes e Laranjeira, Martinho e Fernandes voltaram ao uso, de base portuguesa, do c (usando, no entanto, k em vez de qu + e, i). 9 As estranhas grafias kúlite, kbíite, kótuko, knóruko, com vogais finais mudas, foram herdadas de Silva e reflectem as dificuldades lusófonas em lidar com palavras cuja letra final é -t e -k (só -r, -s, -l e –z podendo normalmente ocorrer em posição final no português). Esta idiossincrasia desapareceu depois de Dores. 10 Embora o Pe. Silva tivesse usado sobretudo o –o em 1889, substituiu-o de vez em quando por <u>, como por exemplo lakéru, táhu, hafúhu, hócu, tétu, nacônu, málu ~ môno monu, bôço bosu, hêmo hemu, mâno manu, hôto hotu, sélo selu, canuro kanuru, rua nulo ruanulu.
7

9

fáru faru hôtu hotu látu latu malu fútu futu táru taru têcu teku útu utu hôpu hopu

natútu natutu

D. INOVAÇÃO DE A.B. de SÁ 9 – Uso do <s> para representar o /s/ intervocálico indígena, substituindo os <ss>, <c> (antes de e, i) e <ç> (antes de a,o,u) portugueses: tesi besi mesak bosok fisur tasak kadesi

E. INOVAÇÕES DO COMITÉ DE ALFABETIZAÇÃO DA FRETILIN 10 – Abolição dos acentos agudo e circunflexo colocados sobre as vogais e, o, a (é, ê; ó, ô, á, â) que indicavam a qualidade alofónica aberta ou fechada. Esta reforma privilegiou grafias fonémicas não alofónicas:11 leten hesuk tesi kota kotu tasi manu12

11 – Abolição do ditongo ou que indicava o alofone fechado [o] do fonema /o/. Esta reforma privilegiou grafias fonémicas não alofónicas: moris hahoris horisehik lori foti sorin sorun hotu13 12 – Substituição do português –ão por –aun:14 nasaun (< nação), sabaun (< sabão), patraun (< patrão), misaun (< missão), kapitaun (< capitão), edukasaun (< educação), investigasaun (< investigação)
Os escritores anteriores empregaram os acentos — agudo e circunflexo — sobre as vogais tónicas numa tentativa de indicar a qualidade vocálica. O Comité de Alfabetização da Fretilin utilizou, nesse sentido, um critério fonémico coerente para substituir o critério fonético dos seus antecessores. 12 Em vez das grafias fonéticas lusóides léten, hêsuk, têsi, kóta, kôtu, tási, mânu. 13 Em vez das grafias alofónicas (e fonéticas) mouris, hahouris, hourisehik, louri, fouti, sourin, hasouru, houtu. 14 Isto era uma marca do tétum acrolectal. A tradição mais antiga (basilectal) assimilava –ão à sequência nativa –án, como em Silva: obrigaçã, adoraçã, oraçã; ou Mendes/Laranjeira: sabân, perdân, galân, coraçân.
11

10

13 – Notação de /j/, do português g (+ e, i) como <j>: jestaun (< gestão), jeometria (< geometria), jigante (< gigante), jinástika (< ginástica), ajente (< agente), imajen (< imagem) 14 – Introdução de sete grafemas distintos para representar as sete fonemas consonantais polivalentes (de origem portuguesa ou malaia): /g/, /j/, /p/, /rr/, /v/, /x/, /z/15 gaveta gargón Bagia janela Jaku tijolu papa pombu borraxa terrenu vidru Vikeke livru xinelu xikra lixu zona kazaku ezami ezame16

F. INOVAÇÕES DA COMISSÃO LITÚRGICA DA DIOCESE DE DÍLI 15 – Uso do acento agudo para indicar apenas casos de acentuação irregular (isto é, não paroxítona):

15

Os escritores mais antigos não conseguiram reconhecer estes fonemas, sobretudo porque, até ao período entre as guerras, a grande maioria dos falantes de tétum assimilou consoantes estrangeiras às nativas. Daí que Raphael das Dores tenha reflectido na sua ortografia a (na altura dominante) assimilação das consoantes portuguesas (ou malaias) às nativas, como por exemplo: /g/ > /k/ ou /d/: koiaba goiabas, doka, duka joga, fokado fogadu, dulka julga, dunilha gonilla, dardón gargón /j/ > /d/ or /i/: dulka julga, dindún jejún, duis juis, dura jura, duramento juramentu, aiduda ajuda, iara jarra /p/ > /b/: barassa prasa, bateka pateka, sebila sepilla, saba xapa, kombare kompadre /rr/ > /r/: iara jarra, bura borra, kataro katarru, fora forra, sikôro sokorru /v/ > /b/, /w/: biba viva, baretan vareta, uale (= wale) vale /x/ > /s/: saba xapa, saruto xarutu, sinela xinela, sita xita, surisso xourisu, mansila maxila /z/ > /s/: dussi dúzia, fussil fusil /ll/ > /l/: sebila sepilla, (Silva) consêlo konsellu /ñ/ > /n/: lina liña, korlina korliña

O aparecimento de uma classe burguesa lusófona timorense deu origem a uma variedade ‘acrolectal’ de tétum na qual as consoantes portuguesas nos empréstimos continuaram a ser pronunciadas como em português. Tais fonemas eram ‘polivalentes’ no sentido em que possuíam alofones populares (assimilados) e doutos (isto é, não assimilados). 16 Já em 1889, o Pe. Silva tinha por vezes reconhecido a índole fonémica do /z/ em tétum, como em dezejo dezeju, roza, meza, ezemplo ezemplu, ezame, diviza, cazo kazu.

11

(acentuação paroxítona sem acento) laran klamar Ita-Boot rohan liafuan fiar dame hamutuk lalehan nafatin agradece agradese nu’udar Maromak (acentuação oxítona ou proparoxítona marcada com acento agudo) Páskua manán glória nebé ne’ebé hahí hahii maibé apóstolu família Espíritu mistériu hahú katólika

16 – Notação do <e> final fonémico, em palavras herdadas do português, em vez da grafia fonética <i> baseada em alofones mesolectais e basilectais: agradece agradese pontífise karidade padre17

Pelo contrário, algumas incoerências como eskolanti eskolante 17 – Uso do <w> para representar o /w/ indígena em empréstimos do tétumtérique (tendo este fonema sido assimilado a /b/ no tétum-praça)18: we wee wainhira wa’in hewai hawelok hawain hawa’in

Persistiu, no entanto, a incoerência da alternação destas formas com as formas populares em /b/, por exemplo labarik lawarik, aban bainrua awan wainrua. O uso incorrecto da forma térique wainhira em tétum-praça, em vez da forma padrão bainhira, deriva desta incoerência que caracteriza sobretudo os escritores eclesiáticos.

G. INOVAÇÕES DA COMISSÃO ACADÉMICA INTERNACIONAL PARA O DESENVOLVIMENTO DAS LÍNGUAS DE TIMOR-LESTE (IACDETL) 18 – Introdução dos grafemas <ll> e <ñ> (substitutos para <L|> e <n|> compatíveis com os teclados informáticos modernos) para substituir <lh> e <nh> que representam fonemas palatais derivados do português:
17

Estes substituíram as grafias fonéticas baseadas em alofones como: agradesi, pontífisi, karidadi, padri. 18 O Pe. Silva e os seus sucessores tinham todos usado u- (e raramente -o), como por exemplo (Silva) ué wee, heuuái hewai, ua’in wa’in, uéc week, haouén haween, oáni wani.

12

faL|a> falla konseL|u > konsellu JuL|u > Jullu toaL|a > toalla kartiL|a > kartilla sepiL|a > sepilla erviL|a > ervilla man|a > maña Jun|u > Juñu dezen|u > dezeñu pen|ór > peñór 19 akompan|a > akompaña kon|ese > koñese lin|a > liña
19

Os dígrafos portugueses <lh> e <nh> (convenções medievais de origem occitânica, isto é, provençal) representam as consoantes palatais [¥] e [≠] respectivamente. Uma das maiores fraquezas dos sistemas ortográficos do tétum, antes da IACDETL iniciar o seu trabalho nos anos 90, era o uso destes dígrafos em tétum. Eles não servem para escrever em tétum devido ao facto de o tétum, ao contrário do português, ter um h aspirado (a fricativa glotal [h]); também porque o grafema <h> tinha já sido atribuído a este som por Sebastião da Silva em 1887, uma convenção observada por todos os seus sucessores. Consequentemente, as grafias tradicionais hahú, bainhira, manha, nas quais <h> representava [h] nas primeiras duas palavras mas [j] na terceira, deram sinais contraditórios. Este problema agravava-se com o facto de muitas línguas de TimorLeste terem as autênticas sequências consonantais /lh/ e /nh/, em muitos casos como fonemas vulgares, por exemplo em uaimoa lhire ‘leve’, lheo ‘chegar’, lha’a ‘alma’, nhasu ‘ferver’, nhese ‘igual’, nhii ‘erguer’; em baiqueno anha ‘criança’; em galóli sinherin ‘aqueles’ etc. Dado o desiderato de uma ortografia pan-timorense (já planeada pelo Pe. Artur Basílio de Sá em 1954 e confirmada em comissão ao INL pelo CNRT em 2001), era imperativo encontrar novos símbolos para substituir lh e nh de origem portuguesa. Alguns timorenses influenciados pela cultura indonésia sugeriram a introdução de ly e ny; esqueceram-se porém do facto de que a maioria dos tetumófonos (falantes das variedades mesolectais e basilectais) não pronuncia estas consoantes como em português (casos nos quais a ortografia <ly> e <ny> se tornaria aceitável) despalatalizando-as em [l] e [n] depois do i e em [il] [in] depois de outras vogais. Assim, a maioria dos timorenses pronuncia as palavras portuguesas falha, cartilha, manha e linha, não como /falya/ /kartilya/ /manya/ /linya/ mas, isso sim, como /fayla/ /kartila/ /mayna/ /lina/. Portanto resulta que as grafias indonésias, para além de politicamente contenciosas, são inadequadas, uma vez que o elemento /y/ é, ou absorvido pela vogal precedente, ou transposto para a frente do l ou do n. A única solução para este problema foi a introdução de um diacrítico para distinguir l e n como fonemas independentes e polivalentes. A proposta inicial da IACDETL (um mácron sobre o l e o n indicando serem consoantes longas) era lógica e tornou-se um bom símbolo de trabalho. Nas grafias faL|a, kartiL|a, man|a, lin|a o referido mácron deixava as seguintes mensagens: (1) “depois de a, e, o, u, leiam-me como /y/ antes ou depois da consoante, de acordo com a vossa pronúncia normal; (2) “depois de i ignorem-me ou leiam-me como /y/ depois da consoante, de acordo com a vossa pronúncia normal”. No entanto, tais símbolos não facilitavam o uso informático, uma vez que os teclados dos computadores modernos apenas autorizam a alteração do n através do til sobrescrito, enquanto o l não poderia sequer ser modificado. A solução adoptada pela IACDETL, e aprovada pelo INL em 2002, residiu em converter o mácron num til no caso < n| >, e num <l> suplementar no caso de < L|>. Os substitutos resultantes, <ñ> e <ll>, tinham o mérito de se associarem com a mais vasta tradição linguística portuguesa e românica. O til é empregue em português (colocado, no entanto, sobre vogais e não sobre o n) e a grafia <ñ> é a contrapartida de <nh> no galego, um dos dialectos da língua galaico-portuguesa original a partir da qual o português moderno evoluiu. Por seu lado, o <ll> era empregue no português medieval para representar o palatal moderno antes da introdução de <lh> (estando este dígrafo posteriormente restringido a representar /l/ em palavras que tinham LL em latim: esta convenção, abolida com a reforma ortográfica de 1911 – por exemplo cavallo > cavalo, janella > janela, collegio > colégio – sobrevive em alguns apelidos portugueses – por exemplo Mello,

13

19 – Eliminação das consoantes mudas em palavras herdadas do português: istória (< história), eransa (< herança), otél (< hotel), ospitál (< hospital), batizmu (< baptismo), asaun (< acção), exesaun (< excepção), elétriku (< eléctrico), projetu (< projecto) 20 – Colocação do acento agudo sobre as vogais orais tónicas e alongadas, no caso de oxítonos de origem portuguesa, mas não sobre as vogais nasais não alongadas, também de origem portuguesa: xá (< chá) sul)20 lan (< lã) pás (< paz) jís (< giz) krús (< cruz) pár (< par) súl (<

sin (< sim) son (< som) bon (< bom)21

21 – Diferenciação ortográfica, de base tradicional, em relação aos homónimos tendo em conta interesses relacionados com a alfabetização. Onde tais palavras apresentassem uma dupla vogal, ou uma vogal longa, etimologicamente determinadas, um dos homónimos seria reescrito com uma vogal simples coberta

Perestrello, Chrystello). O símbolo <ll> também é usado em espanhol, catalão e francês e o <ñ> é partilhado pelo espanhol (parceiro do português na iberofonia actual) e utilizado no alfabeto fonético americano, sendo também um dos símbolos do alfabeto reconstruído para as línguas proto-austronésicas e proto-malaio-polinésias, das quais o tétum é descendente. Em 1996, Armindo Tilman (anteriormente associado ao movimento da Fretilin para a alfabetização) sugeriu a convenção nn (em vez de ñ) para completar ll (por exemplo padrinnu padriñu, madrinna madriña, Espanna España, kompannia kompañia). A proposta tinha lógica, mas não foi imitada muito provavelmente porque <nn> (ao contrário de <ñ>) não tinha precedentes na escrita das línguas românicas ou em qualquer dos conhecidos sistemas de notação fonética. 20 Estas vogais eram longas e não duplas (pár ‘paz’ [do português] ~ kabaas “ombro” [palavra nativa, do timorense antigo *qabaRa], kór ‘cor’ [do português] ~ door “sujo” [vocábulo indígena]. Excepções aparentes a esta regra de diferenciação entre lusismos e formas nativas são as grafias lee (igual ao português lê), revee (= revê), prevee (= prevê). Estes vocábulos são escritos com vogais duplas porque as grafias do português moderno representam reduções recentes das antigas formas dissilábicas (isto é, anteriores a 1911) como lêe (do latim LE-GIT), revêe (do latim RE-VI-DET), prevêe ( PRÆ-VI-DET), assim como têm < têem (grafia antiga) < TE-NENT. Em contrapartida, nas outras formas houve uma vogal tónica na formação da palavra, por exemplo par < PAR-E, cruz < CRUC-E. 21 As vogais nasais oxítonas não foram alongadas no tétum como as vogais orais oxítonas; daí que grafias como *lán, *sín, *bón sejam desnecessárias e, portanto, incorrectas.

14

por um acento agudo (a não ser que se tratasse de uma vogal nasal ou cronicamente átona).22
Grafia com vogais duplas tuun ‘espeto’ aan ‘corpo’ bee ‘água’ foo ‘feder’ haan (= ahan) ‘feijão bravo’ haree ‘ver’ huun ‘alento; espírito’ laan ‘vela’ maas ‘bocejar’ moos ‘limpo’ roo ‘folha’ saa ‘cobra’; ‘família’ see ‘virar; apresentar’ siin ‘azedo’ taan ‘camada; dobra’ tee ‘defecar’ Grafia com vogal simples tun ‘descer’ an ‘… si próprio’ bé ‘letra B’ 23 be ‘o qual’ fó ‘dar’ han ‘comer’ hare ‘planta do arroz’ hun ‘base; árvore’ lan ‘lã’ mas ‘mas’ mós ‘também’ ró ‘barco’ sá ‘o quê’ sé ‘quem’ sin ‘sim’ tan ‘porque’ té ‘letra T’

Também se distinguiram ortograficamente:
bá ‘ir’ (verbo) ‘daqui (advérbio) sé ‘quem’ ba ‘a’ ‘para’ (prep.) se ‘se’ (conjunção)

H. REVISÕES CONCLUSIVAS APRESENTADAS PELO INSTITUTO NACIONAL DE LINGUÍSTICA (INL) Dado este processo cumulativo de evolução, em 2002, ano da restauração da nossa independência, já todas as marcas essenciais inerentes à ortografia nacional de Timor-Leste estavam no seu devido lugar. O grande desafio residia em coordenar estas convenções e eliminar as incoerências que ainda permaneciam. As principais falhas dos escritores populares eram as seguintes:
As escolhas seguem, em larga medida, as dos ortografistas anteriores como, por exemplo, (Mendes e Laranjeira) môon ‘claro’ ~ mós ‘também’, sée ‘apresentar’ ~ sé ‘quem’, túun ‘espeto’ ~ tun ‘descer’; an ‘si mesmo’, bá ‘ir’, fó ‘dar’, hân han ‘comida’, ró ‘barco’, tan ‘porque’. 23 Não é escrito com acento porque é sempre átono.
22

15

1 – Não se ter ainda feito a distinção entre vogais simples e vogais duplas. 2 – Não se ter ainda feito a distinção entre vogais duplas de origem indígena (historicamente e na realidade dissilábicas) e vogais tónicas alongadas de origem portuguesa (historicamente e na realidade monossilábicas), como, por exemplo, kuus ~ krús, liis ~ jís, haree ~ kafé, maliboo ~ avó, hadoor ~ hemudór, harii ~ kolibrí; ai-naa ~ papá. 3 – Não se ter ainda marcado com apóstrofo a oclusiva glotal (pronunciada em muitas variedades de tétum-praça assim como nos dialectos do tétum-térique). 4 – Existir ainda uma confusão entre /w/ e /b/. 5 – Existir ainda confusão entre os grupos consonânticos nativos /lh/ /nh/ e os derivados do português <lh> e <nh>. 6 – Não se usar, ou usar-se incorrectamente, o acento agudo (como marcador de acentuação não paroxítona ou irregular)24. 7 – A tendência para escrever palavras de modo fonético e não fonémico. 8 – A continuidade de ortografias macarrónicas, isto é, escrever palavras derivadas do português à maneira portuguesa em vez de se adaptar essas mesmas palavras às regras da ortografia do tétum (ou seja, a coexistência de dois sistemas de ortografia dentro de uma mesma língua). Todas estas questões foram resolvidas de modo satisfatório na ortografia padronizada do tétum apresentada em duas publicações do INL em 2002, mais concretamente Matadalan Ortográfiku ba Tetun Nasionál e Hakerek Tetun Tuir Banati, que concluíram o processo evolutivo inerente à ortografia do tétum. © Instituto Nacional de Linguística, 2004 Tradução, a partir do inglês, de Francisco Nazareth, do Instituto Camões.

Bibliografia
Costa, Luís (2000). Dicionário de Tétum-Português. Lisboa: Colibri. Comissão Litúrgica da Diocese de Díli (1980). Ordinário da Missa: Texto Oficial Tétum. Díli.
A aplicação lógica desta regra produziu algumas diferenças no uso do acento no tétum, em relação a português, tais como nos seguintes lusismos: nasionál (< nacional), alugér (< aluguer), altár (< altar), otél (< hotel), funíl (< funil), kapatás (< capataz) ~ konsul (< cônsul), rekomendavel (< recomendável), posivel (< possível. Grafias indigenizadas deste tipo já tinham sido empregues pelos ortografistas portugueses, p.ex. (Silva) kintál < quintal.
24

16

Dores, Raphael das (1907). Diccionario Teto-Português. Lisboa: Imprensa Nacional. Fernandes, Abílio (1937). Método Prático para Aprender o Tétum. Macau; Díli: Comando Territorial Independente de Timor, 1964. Comité de Alfabetização da Fretilin (1975). “Como vamos alfabetizar o nosso povo Mau Bere de Timor Leste”. Timor Leste, No. 6, Suplementos 1,2,3. Hull, Geoffrey (1999). Standard Tetum-English Dictionary. Sydney: Allen & Unwin em associação com a University of Western Sydney - Macarthur. Hull, Geoffrey and Eccles, Lance (2001). Tetum Reference Grammar. Sydney: Projecto Sebastião Aparício da Silva e Instituto Nacional de Linguística. ———— (2004). Gramática da Língua Tétum. Lisboa: LIDEL. Instituto Nacional de Linguística (INL) (2002). Matadalan Ortográfiku ba Tetun Nasionál. INL: Díli. Instituto Nacional de Linguística (INL) (2002). Hakerek Tetun Tuir Banati. INL: Díli. International Academic Committee for the Development of East Timorese Languages (IACDETL) (1996). Princípios de Ortografia Tétum: Sistema Fonémico. Sydney: University of Western Sydney. Laranjeira, Manuel Mendes (1916). Cartilha Tétum. Díli: Imprensa Nacional; (1932) Macau. Lencastre, J. Garcêz de (1929). “Algumas regras gramaticais da língua tétum e vocabulário”. Boletim da Agência Geral das Colónias, 5/54 (Dec.), pp. 82-92. Martinho, José S. (1943). Quatro Séculos de Colonização Portuguesa. Porto: Livraria Progredior. Mendes, Manuel Patrício e Laranjeira, Manuel Mendes (1935). Dicionário Tétum-Português. Macau: N.T. Fernandes & Filhos. Sá, Artur Basílio de (1952). “Notas sobre linguística timorense: Sistema
17

de representação fonética.” Estudos Coloniais. Lisboa, 3 (1-2), pp. 39-60. Silva, Sebastião Aparício da (1887). Diccionario de Portuguêz-Tétum. Macau: Typographia do Seminário. Tilman, Armindo (1996). “Matadalan nosi tetun — Timór lian. Lisboa (edição privada).

18