Computador decifra idioma extinto que desafiava linguistas
No livro 'Lost Languages', de 2002, o então editor do suplemento de educação superior do jornal inglês The Times, Andrew Robinson, afirmou que o trabalho arqueológico de decifrar línguas extintas exige uma mistura de lógica e intuição que os computadores são incapazes de possuir.

Reprodução
Ugarítico era uma língua semítica em alfabeto cuneiforme
Pesquisadores do Instituto de Tecnologia de Massachusetts (MIT) e da Universidade do Sul da Califórnia, nos Estados Unidos, tentam mostrar que Robinson estava errado.
Em estudo que será apresentado esta semana na reunião anual da Associação para Linguística Computacional, em Uppsala, na Suécia, o grupo mostrará um novo programa de computador que foi capaz de decifrar grande parte do extinto idioma ugarítico, descoberto a partir de escritos encontrados na cidade perdida de Ugarit, na Síria, cujas ruínas foram achadas em 1928.
O ugarítico era uma língua semítica escrita em alfabeto cuneiforme com 27 consoantes e três vogais. Os escritos encontrados foram importantes para estudiosos do Velho Testamento, por auxiliar a esclarecer textos hebraicos e revelar como o judaísmo utilizava frases comuns, expressões literárias e frases empregadas pelas culturas gentis que o cercavam.
O sistema, além de ajudar a decifrar línguas antigas que continuam resistindo aos esforços de especialistas, poderá expandir o número de idiomas que sistemas automatizados de tradução, como o Google Tradutor, são capazes de manejar.
Para simular a intuição que falta aos computadores, Regina Barzilay, do Laboratório de Inteligência Artificial e Ciência da Computação do MIT, e colegas fizeram várias proposições. A primeira é que a língua a ser decifrada pelo computador estaria próxima de outra. Para isso, foi escolhido o hebraico.
Outra afirmativa é que haveria um modo sistemático de mapear o alfabeto de uma língua com relação ao alfabeto de outra, e que os símbolos relacionados deveriam ocorrer com frequências semelhantes nos dois idiomas.
O sistema também fez asserções no nível semântico, no sentido de que as línguas relacionadas teriam pelo menos alguns cognatos, isto é, palavras com raízes comuns.
Por meio de um modelo probabilístico usado em pesquisas em inteligência artificial, os pesquisadores determinaram nos mapeamentos os radicais semelhantes e conjuntos de sufixos e prefixos consistentes, entre outras relações entre palavras das duas línguas.
O ugarítico já havia sido decifrado. Se não tivesse sido, os autores do estudo não teriam como avaliar a performance do sistema que desenvolveram.
“O sistema repetiu as análises dos dados resultantes centenas de vezes. E, a cada vez, os acertos eram mais frequentes, pois estávamos chegando mais perto de uma solução consistente. Finalmente, chegamos a um ponto no qual a alteração do mapeamento das similaridades não aumentava mais a consistência dos resultados”, disse outro autor do estudo, Ben Snyder, também do MIT.
Das 30 letras do alfabeto extinto, o sistema foi capaz de mapear corretamente 29 com seus correspondentes em hebraico. Cerca de um terço das palavras em ugarítico tem cognato em hebraico e, desse total, o sistema identificou corretamente 60%.
“Das palavras identificadas incorretamente, na maior parte das vezes o erro foi por apenas uma palavra. Ou seja, o sistema deu palpites bem razoáveis”, disse Snyder.
Apesar dos índices de acerto, os pesquisadores destacam que o sistema não é suficientemente bem resolvido para substituir os tradutores humanos. Mas, segundo eles, é uma ferramenta poderosa cujo desenvolvimento poderá ajudar no processo de decifração de línguas desconhecidas e de tradução mais eficiente dos idiomas conhecidos.
Idiomas em extinção
Lendo uma edição especial da revista National Geographic (edición española), descobri que há cada duas semanas um idioma de extingue, ou seja, imagine que dentro de um período de 15 dias, o último falante de um determinado idioma ou dialeto morre, muitas vezes sem deixar um registro geral das palavras ou fonemas utilizados, e mais difícil ainda de uma gramática ou um dicionário completo deste idioma. E em 2100, 7.000 idiomas já falados na terra, terão desaparecido definitivamente, junto com uma raça e uma cultura, com sua história e sua sabedoria.
Idiomas como o Taushiro e Uru na América Central, Pazeh nas Filipinas, por exemplo, possuem apenas um falante, quem sabe neste momento, um desses indivíduos já tenha falecido e esse idioma, tenha passado ao céu dos idiomas, onde muitos outros farão companhia a este, que nunca voltará a ser falado e ouvido neste planeta.
O projeto Enduring Voices da National Geographic Society, tenta catalogar e salvar esses idiomas.
No Brasil, os idiomas indígenas também sofrem sua ameaça, o Anambé, Arikapú, Jabutí, Juma, Katawixí, Oro Win, Siriano, Wayampi, Oiapoque e Xetá, possuem menos de 10 falantes. O Katukina possuía 1 indivíduo, registrado em 1976. E a lista de já extintas chega a ser desoladora.
De acordo com o website Ethnologue, cujo livro é a maior publicação sobre linguística do mundo, existem 6.909 idiomas falados no mundo. No Brasil fala-se 181 línguas, existem outros 55 idiomas considerados extintos, pois não há conhecimento de falantes. Este mapa mostra o lugar onde estas línguas são faladas. Clique no mapa para ampliar.
Lewis, M. Paul (ed.), 2009. Ethnologue: Languages of the World, Sixteenth edition. Dallas, Tex.: SIL International. Online version: http://www.ethnologue.com/
Idioma internacional, o Esperanto
O Esperanto é a mais falada língua auxiliar planejada da Terra. Ao contrário da maioria das outras línguas planejadas, o esperanto saiu dos níveis de projeto (publicação de instruções) e semilíngua (uso em algumas poucas esferas da vida social)[1]. Suas regras fundamentais estabelecem critérios de expansão lógicos e naturais, de modo que a língua se enriquece continuamente, seja através dos usos que se faz dela, seja agregando conteúdos novos, que não existiam nos primóridos de sua existência. Seu iniciador, Ludwik Lejzer Zamenhof, oftalmologista efilólogo, publicou a versão inicial do idioma em 1887 com a intenção de criar uma língua de muito fácil aprendizagem, que servisse como língua franca internacional, para toda a população mundial (e não, como muitos supõem, para substituir todas as línguas existentes).
Embora nenhum Estado-nação tenha adotado a língua, segundo estimativas, ela tem fruído uso contínuo por umacomunidade esperantófona de de 1,5 milhão a 2 milhões falantes no nível 3 da escala ILR (competência lingüística para trabalho profissional).[2].
Hoje em dia, o esperanto é empregado em viagens, correspondência, intercâmbio cultural, convenções, literatura, ensino de línguas, televisão e transmissões de rádio. Alguns sistemas estatais de educação oferecem cursos opcionais de esperanto, e há evidências de que aprender a língua ajuda no aprendizado de outras línguas.
Outras curiosidades
- Cerca de de 94% dos idiomas do planeta são falados por apenas 6% da população mundial.
- Na Coréia do Norte, em Santa Helena, no Estado do Vaticano e nas ilhas Falkland fala-se apenas uma língua.
- O país onde se fala mais línguas é a Papua Nova Guiné, são documentadas 830 línguas.
- O idiomas mais falado do mundo é o mandarim, em segundo lugar fica o hindi. O português é a sétima língua mais falada no mundo.
