Искусственный интеллект раскроет тайну древних языков
В ходе мировой истории человечество создало тысячи разнообразных языков. Многие из них были утрачены или забыты еще в древности. Поэтому нередко археологам попадаются надписи, которые не удается дешифровать. До сих пор это остается проблемой, к решению которой исследователи начали привлекать искусственный интеллект.
MIT и Google Brain взялись за дешифровку
Со времени изобретения письма, которое произошло, по разным версиям 5-6
тыс. лет назад, люди придумали множество систем, которые позволяют
превращать фонетические звуки языков в визуальные символы. Однако
большинство древних языков сегодня являются мертвыми, и ученым
приходится прикладывать немалые усилия для их дешифровки. Иногда это
удается, как в случае с египетскими символами, надписями майя,
древнекитайской письменностью. Но, существенная часть древних языков –
ольмекский, прото-эламский, кипро-минойский, харрапский (письменность
долины Инда) и множество других, все еще хранят свои тайны, к раскрытию
которых пока не удалось подойти даже в общих чертах. Поэтому для решения
столь сложной задачи, ученые решили привлечь искусственный интеллект. В
этом направлении развивается несколько академических проектов, но самый
новый из них был инициирован исследователями одной из лабораторий
Массачусетского технологического института (MIT) и сотрудниками проекта
Google Brain, работающими над созданием искусственного интеллекта.
Результатом совместных усилий стала разработка алгоритма, который способен сопоставлять однокоренные слова неизвестных языков с понятиями, которые уже известны благодаря дешифровке из родственных языков. Алгоритм опубликован на ресурсе arXiv, но еще далек от совершенства и позволяет решить лишь очень ограниченный круг задач. Но, перспективы у данного метода, по мнению ученых, есть. «На данный момент в мире используется до 7 тыс. языков, а количество исчезнувших языков насчитывает десятки тысяч, – говорит Татьяна Бочарникова, глава представительства NetApp в России и странах СНГ. – Дешифровка такого объема требует значительных мощностей для хранения и управления огромными массивами данных. Однако основную работу по дешифровке все равно придется делать людям, которым предстоит искать взаимосвязи между родственными языками».
Эффект будет от универсальной системы дешифровки
Эффективность алгоритма проверили в частности на примере критского
линейного письма Б, частично дешифрованного в 50-е годы прошлого века, и
угаритского языка. Результат показал рост эффективности процесса на 5%
по сравнению с ранее используемыми методами. В то же время,
исследователи подчеркивают, что для эффективной дешифровки неизвестных
языков все равно необходимы те или иные опорные системы, например,
родственные языки, правила и семантические значения символов, которые
уже разгаданы. Без этого с вопросом дешифровки не справится даже
искусственный интеллект, поскольку предложенный алгоритм работает по
принципу поиска и сравнения однокоренных слов.
Вместе с тем, исследователи воодушевлены полученным результатом и заявили о намерениях продолжать изыскания, а также разрабатывать другие более совершенные алгоритмы дешифровки. Идеальным вариантом, по мнению ученых является создание некой универсальной системы, которая бы позволила применять ее ко многим языкам, а не к строго определенным, как это происходит сейчас.