В 2006 году компания Google объявила о запуске службы онлайн-переводов Google Translate. Изначально этот сервис в качестве ключевого алгоритма использовал компьютерный перевод, основанный на фразах.

За последнее время были сделаны значительные успехи в области искусственного интеллекта. Это позволило улучшить алгоритмы распознавания речи и изображений. Однако повышение качества компьютерного перевода всё ещё остается сложной задачей.

С 2016 года компания Google использует собственную систему нейронного компьютерного перевода (НПГ), в которой используются новейшие методики изучения иностранного языка для максимально возможного повышения качества автоматического перевода.

Подробные исследовательские результаты описаны в техническом отчете, который был опубликован в сентябре 2016 года: "Система компании Google для нейронного компьютерного перевода: устранение различий между пользовательским и компьютерным переводом".

Несколько лет назад компания Google начала использовать рекуррентные нейронные сети для активного обучения созданию смысловых соответствий между введенным текстовым фрагментом (например, предложением на одном языке) и итоговым текстом (этим же предложением на другом языке).

В то время как фразовый компьютерный перевод (ФП) делит входное предложение на слова и фразы, которые переводятся в основном без учета взаимосвязи, то нейронный компьютерный перевод (НП) рассматривает все входное предложение для перевода как одно целое.

Преимущество этого метода заключается в том, что здесь выполняется меньше технических расчетов по сравнению с предшествующей системой перевода на основе фраз.

Когда НП впервые стал использоваться, то при проведении первых тестов на небольших стандартных массивах данных он сразу продемонстрировал точность, аналогичную существующим системам перевода на основе фраз.

С тех пор ученые представили множество методов улучшения НП. Так, например, редкие слова предлагается переводить путем имитации внешней модели выравнивания, посредством выравнивания вводимых и получаемых слов. Перевод редких слов также упрощается, если слова делить на более мелкие части.

Несмотря на эти улучшения, скорость и точность НП были недостаточными для использования в программном комплексе Google Translate.

В вышеуказанном техническом отчете показывается, как были преодолены проблемы, связанные с обработкой гигантских массивов информации, как была создана система НП с нужными характеристиками по скорости и точности, чтобы получать более качественный перевод для пользователей и служб Google.

Сравнение качества нейронного, компьютерного и пользовательского перевода
Сравнение качества нейронного, компьютерного и пользовательского переводов
Сравнение качества нейронного, компьютерного и пользовательского перевода
Параметры параллельных оценок, поставленных пользователями, при сравнении качества переводов для определенного исходного предложения. Оценки варьируются от 0 до 6, при этом 0 означает "абсолютно бессмысленный перевод", 6 — "точный перевод".

Следующая картинка демонстрирует последовательный прогресс НПГ при трансформации предложения с китайского языка на английский язык.

Процесс нейронного перевода текста

Точные переводы.

Пример перевода, созданного системой НП Google.

Пример перевода текста - фразовый, нейронный, пользовательский
Пример перевода текста - фразовый
Пример перевода текста - нейронный, ручной

Источник: Перевод с английского