Спецтемы

Профессиональные лингвисты не слишком полагаются на компьютерные технологии

Лингвистика
Автор: Сергей Кузнецов

Сравнение разных языков является одной из основных задач исторического языкознания, позволяя языковедам отслеживать развитие языка на протяжении тысяч лет. Такие слова обозначающие «зуб», как «tooth» по-английски, «Zahn» по-немецки, «dente» по-итальянски, и «dent» по-французски имеют одного и того же языкового предка. Поэтому языковые данные играют решающую роль в раскрытии человеческой предыстории.

Только малая часть из 7000 с лишним языков, на которых говорят сегодня, была тщательно проанализирована. И это не удивительно, учитывая, что классические сравнительные исследования в лингвистике до сих пор опираются на ручную работу экспертов-лингвистов, представляя огромные проблемы для компьютерного анализа.

Использование вычислительных методов для анализа больших объемов лингвистических данных является привлекательным и сложным. В отличие от тщательного лингвистического анализа, проведенного опытными учеными, с глубоким знанием конкретных языков, компьютерные алгоритмы не видят языковые особенности и делают выводы из имеющихся данных. Этот недостаток создает риск получить ложные результаты.

В своем исследовании группа лингвистов проверила работоспособность различных автоматизированных подходов различной сложности. Результаты были удивительно хороши. Но хотя некоторые алгоритмы действительно отлично работали при определенных условиях, они могли привести к плачевным результатам при других обстоятельствах. Лучший из проверенных методов обнаружил однокоренные слова правильно и в соответствии с экспертными заключениями в 89,5% всех случаев.

Означает ли это, что машины скоро заменят экспертов в поисках этимологически родственных слов на всех языках мира? Ученые Университета Макса Планка не думают, что это будет успешной стратегией. Вместо исключительно компьютерных подходов, лучше извлекать пользу из компьютерных стратегий, в которых алгоритмические методологии используются для проведения предварительного анализа и затем могут быть исправлены с помощью специалиста.

Профессор Рассел Грей, руководитель исследования, считает, что это только начало. «Мы еще не исчерпали весь потенциал вычислительных методов в исторической лингвистике, и я почти уверен, что в будущем алгоритмы еще больше приблизят нас к суждениям экспертов», - сообщает он. Но компьютеры никогда не смогут заменить обученных экспертов-лингвистов. Грей говорит: «Вычислительные методы могут заботиться о повторяющихся и схематических работах. Таким образом, они позволяют специалистам сосредоточиться на ответах на интересные вопросы».


Обсуждение закрыто



Выбор читателей



Это интересно