Бюро переводов ooo-perevod.ru
Нижний Новгород
+7 (831) 414 96 83

Заполните форму для заказа перевода






В 2006 году компания Гугл (Google) заявила о запуске сервиса онлайн переводов (Google Translate), который в качестве ключевого алгоритма использует машинный перевод фраз.

В сентябре 2016 года компания Гугл провела презентацию системы нейронного машинного перевода (НМПГ – англ. «GNMT»), которая использует новейшие учебные методики изучения иностранного языка для достижения самого оптимального качества автоматического перевода.

В полном объеме результаты исследований описаны в техническом отчете, который был опубликован в сентябре 2016 года: «Система компании Гугл для нейронного машинного перевода: устранение различий между пользовательским и машинным переводом».

Несколько лет назад компания Гугл начала использовать рекуррентные нейронные сети (РНС) для непосредственного изучения преобразований между входной последовательностью (например, предложением на одном языке) с итоговой последовательностью (это же предложение на другом языке).

В то время как фразовый машинный перевод (ФМП – англ. «PBMT») делит входное предложение на слова и фразы, как правило, для раздельного перевода, нейронный машинный перевод (НМП – англ. «NMT») рассматривает все входное предложение для перевода как одно целое. Преимущество данной технологии в том, что здесь выполняется меньше технических расчетов по сравнению с обычной системой перевода на основе фраз.

Уже при проведении первых тестов на небольших стандартных массивах данных НМП продемонстрировал точность, аналогичную существующим системам перевода на основе фраз. После этого ученые предложили множество методов улучшения НМП, например, обработку редких слов при помощи имитации внешней модели выравнивания параллельного текста на уровне предложений, учитывая выравнивание на уровне входных и итоговых слов, а также разбиение слов на меньшие части для перевода редких слов.

Несмотря на эти улучшения, НМП не имел достаточной скорости и точности для использования в программном комплексе, подобном сервису Гугл онлайн переводов. В вышеуказанном техническом отчете представлено, как были преодолены многие проблемы, чтобы НМП мог обрабатывать очень большие совокупности данных, как была создана система с нужными характеристиками по скорости и точности для получения более качественного перевода для пользователей и служб Гугл.

Сравнение качества нейронного, машинного и пользовательского переводаСравнение качества нейронного, машинного и пользовательского переводаСравнение качества нейронного, машинного и пользовательского перевода
Параметры параллельных оценок, поставленных пользователями, при сравнении качества переводов для определенного исходного предложения. Оценки варьируются от 0 до 6, при этом 0 означает «абсолютно бессмысленный перевод», 6 — «точный перевод».

Следующая визуализация демонстрирует последовательный прогресс НМПГ при трансформации предложения с китайского языка на английский язык.

Процесс нейронного перевода текста

Сначала сеть кодирует китайские слова как список векторов, в котором каждый вектор представляет собой значение всех отсканированных слов («Шифратор»). После сканирования всего предложения декодер начинает сразу составлять английское предложение по одному слову («Декодер»). На каждом этапе для получения переведенного слова декодер обращает внимание на взвешенное распределение закодированных векторов на китайском языке по степени соответствия к рассматриваемой теме. Таким образом, выбирается английское слово («Внимание»; прозрачность синей ссылки показывает степень важности закодированного слова для декодера).

По сравнению с предыдущим программным комплексом, основанном на фразах, система НМПГ, используя параллельное сравнение оценок, поставленных пользователями, как метрику, дает более точные переводы.

При использовании НМПГ количество ошибок перевода, измеренное с помощью двуязычных экспертов по выборочным предложениям из Википедии и новостных веб-сайтов, сокращается более чем на 55-85% для нескольких основных языковых пар.

Пример перевода, созданного системой НМПГ, для входного предложения, выбранного с новостного сайта.

Пример перевода текста - фразовый, нейронный, пользовательскийПример перевода текста - фразовыйПример перевода текста - нейронный, ручной

Кроме того, одновременно с публикацией вышеуказанной исследовательской работы было заявлено о начале промышленной эксплуатации НМПГ для языковой пары, известной своей сложностью: с китайского на английский.

Благодаря 100%-ому машинному переводу при помощи НМПГ, который используется в мобильных и веб-приложениях сервиса Гугл онлайн переводов, в настоящее время с китайского на английский язык осуществляется около 18 миллионов переводов ежедневно.

Развертывание НМПГ в среде эксплуатации стало возможным благодаря использованию технологий Гугл – общедоступной программной библиотеки для машинного обучения ТензорФлоу (TensorFlow) и тензорных процессоров (TPU), которые обеспечивают достаточную вычислительную мощность для развертывания мощных моделей НМПГ, соответствуя строгим требованиям сервиса Гугл онлайн переводов к уровню задержки.

Перевод с китайского языка на английский является одной из более чем 10 000 языковых пар, поддерживаемых сервисом Гугл онлайн переводов. На данный момент компания Гугл работает над развертыванием НМПГ для многих других направлений перевода.

В настоящее время продолжаются исследования в области повышения качества машинного перевода. НМПГ по-прежнему может совершать существенные ошибки, которые профессиональный переводчик никогда не сделал бы, например, такие, как пропуск слов и неверный перевод имен собственных или редких понятий, а также обособленный перевод предложений без учета контекста абзаца или страницы.

Источник: Google