Команда Google DeepMind представила новую генеративную ИИ-модель для распознавания и расшифровки древних надписей – Aeneas. Обученная на сотнях тысяч латинских текстов нейросеть способна не только восстанавливать утраченные части древних надписей, но и прояснять их происхождение, исторический контекст и приблизительное время создания. Это делает ее важным инструментом для археологов и историков.
Нейросеть создана в сотрудничестве с университетами Ноттингема, Уорика, Оксфорда и Афин. Результаты работы опубликованы в престижном научном журнале Nature.
В древнеримском мире письменность была повсюду – от императорских монументов до бытовых предметов. Надписи политического характера, любовные поэмы, эпитафии, деловые сделки, приглашения на день рождения и магические заклинания – все эти тексты дают историкам ценную информацию о многообразии повседневной жизни римского мира.
Однако большинство найденных текстов фрагментарны или повреждены. Их восстановление, датировка и определение происхождения были крайне сложны без контекстной информации. До появления Aeneas историки полагались на собственную экспертизу и специализированные ресурсы для поиска текстов со схожими формулировками и происхождением.
Модель, названная в честь странствующего героя греко-римской мифологии Энея, значительно ускоряет сложную и трудоемкую работу историков. Aeneas анализирует тысячи латинских надписей и находит текстуальные и контекстуальные параллели за считанные секунды, позволяя исследователям интерпретировать находки и основываться на выводах модели.
ИИ превращает каждый текст в уникальный исторический «отпечаток», выявляя глубокие связи между надписями и помогая историкам поместить их в более широкий исторический контекст. Более того, впервые ИИ может восстанавливать пробелы в текстах, а также определять географическое происхождение текста, анализируя текст и его изображение.
Модель восстанавливает поврежденные надписи с точностью 73% для пропусков до десяти символов. Даже при неизвестной длине восстановления – крайне сложной задаче – точность составляет 58%. Система определяет провинцию происхождения надписи с точностью 72% и датирует тексты с погрешностью 13 лет.
Читайте по теме: Главные тренды ИИ в 2025 году: какие еще сюрпризы нас ждут.