MUNDOTECNOLOGIA

Novo algoritmo do MIT decifra automaticamente as línguas perdidas

Um novo sistema de IA pode decifrar, automaticamente, uma linguagem perdida que não é mais entendida – sem saber sua relação com outras línguas.

Pesquisadores do MIT CSAIL desenvolveram o algoritmo em resposta ao rápido desaparecimento das línguas humanas. A maioria das línguas que existiram não é mais falada, e pelo menos metade das restantes deverá desaparecer nos próximos 100 anos .

O novo sistema pode ajudar a recuperá-los. Mais importante ainda, poderia preservar nossa compreensão das culturas e sabedoria de seus falantes.

O algoritmo funciona aproveitando princípios-chave da linguística histórica, como as formas previsíveis em que as línguas usam substituições de som. Os pesquisadores dão o exemplo de uma palavra com um “p” em uma língua mãe, possivelmente mudando para um “b” em seu descendente, mas provavelmente não para um “k” devido à diferença na pronúncia.

Esses tipos de padrões são então transformados em restrições computacionais. Isso permite que o modelo segmente palavras de um idioma antigo e as mapeie para um idioma relacionado.

O algoritmo também pode identificar diferentes famílias de idiomas. Por exemplo, seu método sugeria que o ibérico não estava relacionado ao basco, apoiando estudos recentes.

O projeto foi liderado pelo MIT comandado pela professora Regina Barzilay, que no mês passado ganhou um prêmio de US $ 1 milhões da  maior AI (Association for the Advancement of Artificial Intelligence Squirrel) do mundo,  por seu trabalho pioneiro no desenvolvimento de drogas e de detecção de câncer de mama.

Ela agora quer expandir o trabalho para identificar o significado semântico das palavras – mesmo que não saibamos como lê-las.

“Por exemplo, podemos identificar todas as referências a pessoas ou locais no documento, que podem então ser investigadas à luz das evidências históricas conhecidas”, disse Barzilay em um comunicado.

“Esses métodos de ‘reconhecimento de entidade’ são comumente usados ​​em vários aplicativos de processamento de texto hoje e são altamente precisos, mas a questão chave da pesquisa é se a tarefa é viável sem quaisquer dados de treinamento na língua antiga.”

Fonte: Thenextweb

Deixe uma resposta

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.