Ученые разработали алгоритм, который позволяет на основе лексических
данных автоматически реконструировать слова из протоязыков. Работа опубликована в журнале Proceedings of the National Academy of Sciences, а ее краткое содержание приводит NatureNews.
На первом этапе программа автоматически распознает однокоренные
слова, а затем пытается восстановить их в той форме, в какой они
присутствовали в протоязыке. При этом она основывается на некоторых
правилах, управляющих сохранением и изменением отдельных звуков в
словах. Модель эволюции, создаваемая программой, имеет вероятностный
характер и разные ее элементы могут иметь большую или меньшую
статистическую значимость.
В качестве теста нового алгоритма ученые построили древо
происхождения австронезийских языков. Эти языки преимущественно
распространены на территории Тихого океана, но к западу встречаются
вплоть до Мадагаскара. Около 300 миллионов человек говорят на этих
языках
Программа проанализировала более 140 тысяч слов в 637 языках этой
семьи, построило дерево их происхождения и восстановило лексику
нескольких протоязыков в основании этого дерева. По словам авторов, при
сравнении полученных результатов с данными лингвистов их точность
составила около 85 процентов.
Специалисты, опрошенные NatureNews, считают такую точность хорошей
для облегчения работы лингвистов, однако все равно рассматривают модели,
составляемые программой, только в качестве приблизительных.