Novo algoritmo do MIT decifra automaticamente as línguas perdidas
Um novo sistema de IA pode decifrar, automaticamente, uma linguagem perdida que não é mais entendida – sem saber sua relação com outras línguas.
Pesquisadores do MIT CSAIL desenvolveram o algoritmo em resposta ao rápido desaparecimento das línguas humanas. A maioria das línguas que existiram não é mais falada, e pelo menos metade das restantes deverá desaparecer nos próximos 100 anos .
O novo sistema pode ajudar a recuperá-los. Mais importante ainda, poderia preservar nossa compreensão das culturas e sabedoria de seus falantes.
O algoritmo funciona aproveitando princípios-chave da linguística histórica, como as formas previsíveis em que as línguas usam substituições de som. Os pesquisadores dão o exemplo de uma palavra com um “p” em uma língua mãe, possivelmente mudando para um “b” em seu descendente, mas provavelmente não para um “k” devido à diferença na pronúncia.
Esses tipos de padrões são então transformados em restrições computacionais. Isso permite que o modelo segmente palavras de um idioma antigo e as mapeie para um idioma relacionado.
O algoritmo também pode identificar diferentes famílias de idiomas. Por exemplo, seu método sugeria que o ibérico não estava relacionado ao basco, apoiando estudos recentes.
O projeto foi liderado pelo MIT comandado pela professora Regina Barzilay, que no mês passado ganhou um prêmio de US $ 1 milhões da maior AI (Association for the Advancement of Artificial Intelligence Squirrel) do mundo, por seu trabalho pioneiro no desenvolvimento de drogas e de detecção de câncer de mama.
Ela agora quer expandir o trabalho para identificar o significado semântico das palavras – mesmo que não saibamos como lê-las.
“Por exemplo, podemos identificar todas as referências a pessoas ou locais no documento, que podem então ser investigadas à luz das evidências históricas conhecidas”, disse Barzilay em um comunicado.
“Esses métodos de ‘reconhecimento de entidade’ são comumente usados em vários aplicativos de processamento de texto hoje e são altamente precisos, mas a questão chave da pesquisa é se a tarefa é viável sem quaisquer dados de treinamento na língua antiga.”
Fonte: Thenextweb