Ученые из Чикагского университета разработали систему машинного обучения, которая может автоматически переводить тексты на древних глиняных табличках.
Как сообщает издание The University of Chicago News, система DeepScribe первоначально будет задействована для расшифровки клинописи, которая использовалась в древней иранской империи Ахеменидов (550-330 до н.э.).
Существующие компьютерные системы испытывают определенные трудности перевода подобных текстов из-за сложности символов и трехмерной формы табличек, на которых они написаны. По мнению исследователей из Чикагского университета, их система в состоянии справиться с поставленной задачей.
Для создания модели в качестве «тренажера» используются более чем 6000 аннотированных изображений текстов того времени. Их полная расшифровка позволит получить информацию об истории, обществе и языке Ахеменидов. Обучение основано на словаре ахеменидского языка, в котором содержится более 100 000 отдельных знаков.
Профессор компьютерных наук Чикагского университета Санджай Кришнан использовал этот аннотированный набор для обучения ИИ чтению других, еще неизвестных ему табличек. В результате система сумела расшифровать содержащиеся в них знаки с 80 % точностью.