Skype начинает демонтаж языкового барьера, создав Skype-переводчик

Москва, 15:42, 03 Янв 2015, редакция FTimes.ru, автор Сергей Кузнецов.

Microsoft на днях объявил о первом этапе предварительного тестирования его программы – Skype-переводчика, изначально предназначенной для облегчения общения между носителями английского языка и испано-говорящими людьми.

Переводчик будет преобразовывать устную речь в обоих направлениях. Он также будет переводить чат на 40 языках практически в реальном времени.

Программа должна работать под управлением Windows 8.1 или Windows 10.

Skype-переводчик использует очень сложный алгоритм: автоматически распознает речь, затем проводит анализ того, что было сказано в разговоре, сравнивает сказанные слова с фрагментами миллионов ранее записанных сэмплов. Образуется аудиопоток из цепочек слов, который, скорее всего,  соответствует смыслу сказанного.

Затем система корректирует речь, удаляя междометия, такие как «ох» или «ах» и повторения. после этого выбирается наиболее вероятное слово из списка слов, которые звучат так же, как то, что было сказано. Выбранные слова, переведенные на другой язык, затем преобразуются в звук.

Технические основы системы

В 2011 году исследователи из Microsoft придумали новую, контекстно-зависимую модель для большого словарного запаса распознавания речи, которую они опубликовали в 2012 году.

Архитектура модели — это гибрид глубоких нейронных сетей (DNN) и модели Маркова для выбора принятия решения. Это позволяет сократить количество ошибок на 16 процентов. Затем применяются универсальные процессоры для декодирования речи.

Исследователи построили несколько гигантских искусственных нейронных сетей для обучения системы распознаванию речи. Одна из сетей содержит более 66 миллионов межнейронных соединений, являясь крупнейшим из устройств распознавания речи, созданных когда-либо.

Обучение заняло около 20 дней и состояло в создании новых моделей каждые несколько часов.

При тестировании система достигла количества ошибок в словах в 18,5%, что на 33% лучше, чем любая ныне существующая система перевода. Точность Skype-переводчика является серьезной проблемой, поскольку грубые ошибки могут иметь нежелательные последствия. Разговор так же состоит из языка тела и выражения лица, поэтому невербальная коммуникация однозначно не будет переведена с помощью механического перевода.

Из-за вышеперечисленных проблем профессионалы не желают полагаться на подобные системы, пусть даже и супер-технологичные. Искусственный интеллект становится лучше, но присутствие профессионального человека-переводчика позволяет понять, насколько механический перевод еще далек от совершенства.

Перспективы применения

Переводчик для Skype, несмотря на все его недостатки, найдет себе применение в общении на технические темы, где в разговоре присутствует много однозначно переводимых слов и терминов.