Os pesquisadores Thea Sommerschield e Professor Jonathan Prag (Oxford), ao lado de Yannis Assael (Google DeepMind) explicam como eles tem trabalhado para restaurar inscria§aµes gregas antigas danificadas usando o DeepMind AI.

Os historiadores contam com diferentes fontes para reconstruir o pensamento, a sociedade e a história das civilizações passadas. Muitas dessas fontes são baseadas em texto - escritas em pergaminhos ou esculpidas em pedra, os registros preservados do passado ajudam a esclarecer as sociedades antigas. Tais fontes incluem inscrições, textos inscritos em umasuperfÍcie dura¡vel (como pedra, cera¢mica ou metal). As inscrições são uma das principais fontes diretas de novas evidaªncias do mundo antigo, mas a maioria sofreu danos ao longo dos séculos e partes do texto são ilegaveis ou perdidas (Figura 1). Restaurar o texto ausente ou danificado éum dos principais empreendimentos da disciplina de Epigrafia. a‰ uma tarefa complexa e demorada, mas os historiadores antigos podem estimar a probabilidade de diferentes soluções possaveis com base em dicas de contexto na inscrição - como considerações gramaticais e linguasticas, layout e forma, paralelos textuais e contexto hista³rico. Embora complexa, a restauração desses documentos énecessa¡ria para uma compreensão mais profunda do passado das civilizações.

Figura 1: Inscrição danificada: um decreto da Assemblanãia de Atenas relativo a administração da Acra³pole (datado de 485/4 aC). IG I3 4B. (CC BY-SA 3.0, WikiMedia)
Temos usado o aprendizado de ma¡quina treinado nesses textos antigos inscritos para construir um sistema que pode fornecer uma lista mais completa e sistematicamente classificada de possaveis soluções de restauração, que esperamos aumentar a compreensão dos historiadores sobre um texto.
Pythia
Pythia, que leva o nome da mulher que deu as respostas oraculares do deus Apolo no santua¡rio grego de Delfos - éo primeiro modelo antigo de restauração de texto que recupera caracteres ausentes de uma entrada de texto danificada usando redes neurais profundas. Reunindo as disciplinas da história antiga e do aprendizado profundo, este trabalho oferece uma ajuda totalmente automatizada a tarefa de restauração de texto, fornecendo aos historiadores antigos várias restaurações textuais, bem como onívelde confianção de cada hipa³tese.
Pythia usa uma sequaªncia de texto danificado como entrada e étreinado para prever sequaªncias de caracteres que incluem restaurações hipotanãticas de inscrições gregas antigas (textos escritos no alfabeto grego que datam entre o século VII aC e o século V dC). A arquitetura funciona noníveldo caractere e da palavra, manipulando efetivamente informações de contexto de longo prazo e lidando eficientemente com representações incompletas de palavras (Figura 2). Isso o torna aplica¡vel a todas as disciplinas que lidam com textos antigos (filologia, papirologia, codicologia) e se aplica a qualquer idioma (antigo ou moderno). Para treinar Pythia, o maior corpus digital das inscrições em grego antigo ( PHI Greek Inscriptions) foi convertido em texto aciona¡vel por ma¡quina (chamado PHI-ML). No PHI-ML, as previsaµes do PYTHIA atingem uma taxa de erro de 30,1%, em comparação com os 57,3% dos epigrafistas humanos avaliados. Além disso, em 73,5% dos casos, a sequaªncia da verdade do solo estava entre as 20 principais hipa³teses de restauração de Pythia, o que demonstra efetivamente o impacto desse manãtodo assistencial no campo da epigrafia digital e define o estado da arte em restauração de texto antigo.
A combinação de aprendizado de ma¡quina e epigrafia tem o potencial de transformar o estudo de textos antigos e ampliar o escopo do trabalho do historiador. Por esse motivo, as equipes de Oxford e DeepMind colaboraram para criar um notebook Python on-line de ca³digo aberto, Pythia, e o pipeline de processamento da PHI-ML no GitHub . Ao fazer isso, esperamos ajudar futuras pesquisas e inspirar mais trabalhos interdisciplinares.
Leia mais sobre este trabalho na postagem original do blog DeepMind ou no artigo de pré-impressão ' Restaurando texto antigo usando o aprendizado profundo: um estudo de caso sobre epigrafia grega ' no arXiv.