Что творится с яндексом переводчиком

«Яндекс» показал прототип закадрового переводчика видео

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

«Яндекс» работает над сервисом машинного перевода видео с одного языка на другой, который позволит пользователям смотреть ролики в браузере с закадровым переводом.

Компания представила прототип сервиса, он переводит видео только с английского языка.

Новая технология объединяет разработки «Яндекс.Переводчика», биометрии, распознавания и синтеза речи, сообщили в компании. Она определяет пол выступающего на видео и подбирает соответствующий голос. За темпом речи говорящего следит алгоритм, за счет чего переводчик делает паузы, замедляет или ускоряет речь, чтобы закадровый голос совпадал с картинкой.

Работа над сервисом продолжается, и вскоре пользователи смогут выбирать, какие ролики переводить с его помощью, пообещали в «Яндексе».

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

«В интернете очень много полезного контента, который недоступен людям из-за языкового барьера. И мы близки к тому, чтобы окончательно стереть все границы. Мы тоже в начале пути, но у нас уже есть прототип и понимание, куда двигаться дальше», — заявил руководитель направления обработки естественного языка в «Яндексе» Дэвид Талбот.

В 2017 году «Яндекс» стал использовать искусственный интеллект при переводе текстов и начал работать по гибридной системе: к статистической модели, которая была в «Переводчике» с момента запуска, добавили технологию перевода с помощью нейросети. Как сообщили в компании, искусственный интеллект не разбивает текст на отдельные слова, а рассматривает целиком, что позволяет лучше передать смысл.

В конце июня сервис видеозвонков Zoom купил немецкий стартап Kites, который создает субтитры на других языках в режиме реального времени. Как заявили в Kites, технология, основанная на искусственном интеллекте, позволяет отображать стенограмму до того, как говорящий завершит предложение

Источник

Перевод страниц, картинок и видео

Встроенный переводчик показывает слова и фразы на том языке, который используется в интерфейсе браузера. Также он распознаёт надписи на картинках и даёт перевод поверх оригинального текста. Кроме того, в браузере доступен перевод видео с английского языка на русский. Смотрите обучающие лекции и любимые видеоролики сразу на русском языке с помощью функции закадровой озвучки.

Перевод страниц, слов и фраз

Яндекс.Браузер автоматически определяет язык загруженной страницы и, если он отличается от языка интерфейса, предлагает перевести ее. Окно перевода можно также вызвать, нажав значок в Умной строке.

Если вы перевели страницу на один язык, а затем изменили язык перевода, то картинки автоматически переведутся на новый язык.

Чтобы увидеть текст переведенной страницы на языке оригинала, наведите курсор мыши на предложение. Оригинальный текст появится во всплывающем окне.

Если всплывающее окно с текстом не появилось:

Яндекс.Браузер может переводить на русский язык отдельные слова или предложения на странице. Чтобы увидеть перевод слова или словосочетания, выделите их и нажмите значок в контекстном меню.

Проверка правописания на иностранном языке

Браузер проверяет правописание в формах ввода (например, при работе с почтой).

Вы можете редактировать пользовательский словарь:

Перевод картинок

Чтобы перевести остальные картинки:

Чтобы посмотреть оригинал картинки, используйте один из способов:

Перевод и озвучка видео

Иногда перевод видео занимает некоторое время. Вам придет всплывающее уведомление, когда всё будет готово.

Настройки перевода

Чтобы браузер переводил страницы на конкретном языке, не запрашивая разрешения:

Отключение переводчика

Если вы не хотите, чтобы браузер предлагал перевод иноязычных страниц:

Проблемы с переводом

Переводчик в браузере включён по умолчанию. Убедитесь, что ранее вы не отключили переводчик вручную:

Также страница может не переводиться, если когда-то при ее просмотре вы отказались от перевода. В этом случае:

Если картинка маленькая (например, кнопка с текстом), перевод может быть скрыт. Наведите указатель мыши на картинку, чтобы его увидеть.

Технология находится в разработке, поэтому перевод доступен не для всех видео.

Перевод страниц, картинок и видео

Встроенный переводчик показывает слова и фразы на том языке, который используется в интерфейсе браузера. Также он распознаёт надписи на картинках и даёт перевод поверх оригинального текста. Кроме того, в браузере доступен перевод видео с английского языка на русский. Смотрите обучающие лекции и любимые видеоролики сразу на русском языке с помощью функции закадровой озвучки.

Перевод страниц, слов и фраз

Яндекс.Браузер автоматически определяет язык загруженной страницы и, если он отличается от языка интерфейса, предлагает перевести ее. Окно перевода можно также вызвать, нажав значок Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчикомв Умной строке.

Если вы перевели страницу на один язык, а затем изменили язык перевода, то картинки автоматически переведутся на новый язык.

Чтобы увидеть текст переведенной страницы на языке оригинала, наведите курсор мыши на предложение. Оригинальный текст появится во всплывающем окне.

Если всплывающее окно с текстом не появилось:

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Яндекс.Браузер может переводить на русский язык отдельные слова или предложения на странице. Чтобы увидеть перевод слова или словосочетания, выделите их и нажмите значок Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчикомв контекстном меню.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Проверка правописания на иностранном языке

Браузер проверяет правописание в формах ввода (например, при работе с почтой).

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Вы можете редактировать пользовательский словарь:

Перевод картинок

Чтобы перевести остальные картинки:

Чтобы посмотреть оригинал картинки, используйте один из способов:

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Перевод и озвучка видео

Чтобы посмотреть видео на русском языке, наведите указатель мыши на ролик, а затем нажмите появившийся значок Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком. Видео продолжит озвучиваться на русском языке. Мужчин озвучивает мужской голос, а женщин — женский.

Иногда перевод видео занимает некоторое время. Вам придет всплывающее уведомление, когда всё будет готово.

Если вы хотите вернуться к оригиналу, ещё раз нажмите значок Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком.

Настройки перевода

Чтобы браузер переводил страницы на конкретном языке, не запрашивая разрешения:

Источник

История и опыт использования машинного перевода. Лекция Яндекса

В сентябре прошёл шестой Гипербатон — конференция Яндекса обо всём, что связано с технической документацией. Мы опубликуем несколько лекций с Гипербатона, которые, на наш взгляд, могут быть наиболее интересны читателям Хабра.

Светлана Каюшина, руководитель отдела документирования и локализации:
— Кажется, в мире уже не осталось людей, которые переводят вручную. Сегодня мы хотим поговорить об инструментах и подходах, которые помогают компаниям организовывать эффективный процесс локализации, а переводчикам облегчают решение их повседневных задач. Сегодня мы поговорим о машинном переводе, об оценке эффективности машинных движков и о системах автоматизированного перевода для переводчиков.

Начнем с доклада наших коллег. Приглашаю Ирину Рыбникову и Анастасию Пономарёву — они расскажут об опыте Яндекса по внедрению машинного перевода в наши процессы локализации.

Ирина Рыбникова:
— Спасибо. Мы расскажем про историю машинного перевода и про то, как мы используем его в Яндексе.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Еще в XVII веке ученые размышляли о существовании какого-то языка, который связывает между собой другие языки, и наверное, это слишком давно. Давайте поближе вернемся. Все мы хотим понимать людей вокруг — неважно, куда мы приехали, — мы хотим видеть, что написано на вывесках, мы хотим читать объявления, информацию о концертах. Идея вавилонской рыбки бороздит умы ученых, встречается в литературе, кинематографе — везде. Мы хотим сократить то время, за которое мы получаем доступ к информации. Мы хотим читать статьи о китайских технологиях, понимать любые сайты, которые мы видим, и хотим это получать здесь и сейчас.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

В разрезе этого невозможно не говорить про машинный перевод. Это то, что помогает решать указанную задачу.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Отправной точкой считается 1954 год, когда в США на машине IBM 701 было переведено 60 предложений по общей тематике органической химии с русского на английский, и в основе всего этого лежало 250 терминов глоссария и шесть грамматических правил. Это называлось Джорджтаунским экспериментом, и это настолько потрясло реальность, что газеты пестрили заголовками, что еще три-пять лет, и проблема будет полностью решена, все будут счастливы. Но как вы знаете, все пошло немного по-другому.

В 70-е годы появился машинный перевод на основе правил. В его основе тоже лежали двуязычные словари, но и те самые наборы правил, которые помогали описывать любой язык. Любой, но с ограничениями.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Требовались серьезные эксперты-лингвисты, которые прописывали правила. Это достаточно сложная работа, она все равно не могла учесть контекст, полностью покрыть какой бы то ни было язык, но они были экспертам, и высокие вычислительные мощности тогда не требовались.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Если говорить про качество, классический пример — цитата из Библии, которая переводилась тогда так. Пока недостаточно. Поэтому люди продолжали дальше работать над качеством. В 90-е годы возникла статистическая модель перевода, SMT, которая говорила о вероятностном распределении слов, предложений, и эта система принципиально отличалась тем, что она вообще ничего не знала про правила и про лингвистику. Она получала на вход огромное количество идентичных текстов, парных на одном языке и другом, и дальше сама принимала решения. Это было легко поддерживать, не нужны были кучи экспертов, не требовалось ждать. Можно было загружать и получать результат.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Требования к входящим данным были достаточно средние, от 1 до 10 млн сегментов. Сегменты — предложения, небольшие фразы. Но оставались свои трудности и не учитывался контекст, все было не очень легко. И в России, например, появились такие случаи.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Мне еще нравится пример переводов игр GTA, великолепный был результат. Все не стояло на месте. Достаточно важным майлстоуном был 2016 год, когда запустился нейронный машинный перевод. Это было достаточно эпохальное событие, которое сильно перевернуло жизнь. Моя коллега, посмотрев переводы и то, как мы их используем, сказала: «Круто, он говорит моими словами». И это было реально здорово.

Какие особенности? Высокие требования на входе, обучающий материал. Внутри компании это сложно поддерживать, но существенный рост качества — это то, ради чего это затевалось. Только качественный перевод позволит решить поставленные задачи и облегчит жизнь всем участникам процесса, тем же переводчикам, которые не хотят исправлять плохой перевод, они хотят делать новые творческие задачи, а рутинные шаблонные фразы давать машине.

В рамках машинного перевода есть два подхода. Экспертная оценка / лингвистический анализ текстов, то есть проверка реальными лингвистами, экспертами на соответствие смыслу, грамотности языка. В некоторых случаях еще сажали экспертов, давали вычитать переведенный текст и оценивали, насколько это эффективно с этой точки зрения.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Какие особенности этого метода? Не требуется образец перевода, мы смотрим на готовый переведенный текст сейчас и оцениваем объективно по любому разрезу. Но это дорого и долго.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Есть второй подход — автоматические референсные метрики. Их много, у каждой есть плюсы и минусы. Не буду углубляться, про эти ключевые слова потом можно почитать детальнее.

Какая особенность? По факту это сравнение переведенных машинных текстов с каким-то образцовым переводом. Это количественные метрики, которые показывают расхождение между образцовым переводом и тем, что получилось. Это быстро, дешево и можно сделать достаточно удобно. Но есть особенности.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

По факту чаще всего сейчас используют гибридные методы. Это когда изначально оценивается что-то автоматически, потом анализируется матрица ошибок, потом на более мелком корпусе текстов проводится экспертный лингвистический анализ.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Последнее время еще распространена практика, когда мы туда не лингвистов зовем, а просто пользователей. Делается интерфейс — покажите, какой вам перевод больше нравится. Или когда вы ходите в онлайн-переводчики, вы вводите текст, и можете часто проголосовать, что вам больше нравится, подходит этот подход или нет. По сути, все мы сейчас обучаем эти движки, и все, что мы им даем на перевод, они используют для обучения и работают над своим качеством.

Хотелось бы рассказать, как мы в работе используем машинный перевод. Передаю слово Анастасии.

Анастасия Пономарёва:
— Мы в Яндексе в отделе локализации поняли достаточно быстро, что возможности у технологии машинного перевода большие, и решили попробовать использовать его в наших ежедневных задачах. С чего мы начали? Мы решили провести небольшой эксперимент. Мы решили перевести одни и те же тексты через обычный нейросетевой переводчик, а также собрать обученный машинный переводчик. Для этого мы подготовили корпуса текстов в паре русский-английский за те годы, что мы в Яндексе занимались локализацией текстов на эти языки. Далее мы пришли с этим корпусом текстов к нашим коллегам из Яндекс.Переводчика и попросили обучить движок.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Когда движок был обучен, мы перевели очередную порцию текстов, и как сказала Ирина, с помощью экспертов оценили полученные результаты. Переводчиков мы просили посмотреть на грамотность, стиль, правописание, передачу смысла. Но самый поворотный момент был, когда один из переводчиков сказал, что «я узнаю свой стиль, узнаю свои переводы».

Чтобы подкрепить эти ощущения, мы решили посчитать уже статистические показатели. Сначала мы посчитали коэффициент BLEU для переводов, сделанных через обычный нейросетевой движок, и получили такую цифру (0,34). Казалось бы, ее надо с чем-то сравнить. Мы снова пошли к коллегам из Яндекс.Переводчика и попросили объяснить, какой коэффициент BLEU считается пороговым для переводов, сделанных реальным человеком. Это от 0,6.

Потом мы решили проверить, какие результаты на обученных переводах. Получили 0,5. Результаты действительно обнадеживающие.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Привожу пример. Это реальная русская фраза из документации Директа. Потом она была переведена через обычный нейросетевой движок, а потом через обученный нейросетевой движок на наших текстах. Уже в первой же строчке мы замечаем, что традиционный для Директа, вид рекламы, не распознан. А уже в обученном нейросетевом движке появляется наш перевод, и даже аббревиатура практически верная.

Мы были очень воодушевлены полученными результатами, и решили, что наверное, стоит использовать машинный движок в других парах, на других текстах, не только на том базовом наборе технической документации. Дальше проводили несколько месяцев ряд экспериментов. Столкнулись с большим количеством особенностей и проблем, это самые частые проблемы, что нам приходилось решать.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Про каждую расскажу подробнее.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Если вы так же, как и мы, соберетесь сделать кастомизированный движок, вам понадобится достаточно большое количество качественных параллельных данных. Большой движок можно обучить на количестве от 10 тыс. предложений, в нашем случае мы подготовили 135 тыс. параллельных предложений.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Не на всех типах текста ваш движок покажет одинаково хорошие результаты. В технической документации, где есть длинные предложения, структура, пользовательская документация и даже в интерфейсе, где есть короткие, но однозначные кнопки, скорее всего, у вас все будет хорошо. Но возможно, как и у нас, вы столкнетесь с проблемами в маркетинге.

Мы проводили эксперимент, переводя плейлисты музыки, и получили такой пример.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Вот что думает машинный переводчик про звездных фабриканток. Что это ударники труда.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

При переводе через машинный движок контекст не учитывается. Тут уже не такой смешной пример, а вполне реальный, из технической документации Директа. Казалось бы, тех — понятно, когда ты читаешь техническую документацию, тех — это техническое. Но нет, машинный движок не попал.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Еще придется учитывать, что качество и смысл перевода будет сильно зависеть от языка-оригинала. Переводим фразу на французский с русского, получаем один результат. Получаем похожую фразу с таким же смыслом, но с английского, и получаем другой результат.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Если у вас, как и в нашем тексте, большое количество тегов, разметки, каких-то технических особенностей, скорее всего вам придется их отслеживать, править и писать какие-то скрипты.

Вот примеры реальной фразы из браузера. В круглых скобках техническая информация, которая не должна переводиться, в частности множественные формы. В английском они на английском, и в немецком тоже должны остаться на английском, но они переведены. Вам придется отслеживать эти моменты.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Машинный движок ничего не знает про ваши особенности именования. Например, у нас есть договоренность, что Яндекс.Диск мы везде называем на латинице во всех языках. Но на французском он превращается в диск на французском.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Аббревиатуры иногда распознаются корректно, иногда нет. В данном примере BY, обозначая принадлежность к белорусским техническим требованиям по размещению рекламы, превращается в предлог в английском.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Один из моих любимых примеров — новые и заимствованные слова. Тут классный пример, слово дисклеймер, «исконно русский». Терминологию придется выверять для каждой части текста.

И еще одна, уже не такая значительная проблема — устаревшее написание.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Раньше интернет был новинкой, во всех текстах писался с большой буквы, и когда мы обучали наш движок, везде интернет был с большой буквы. Сейчас новая эра, интернет уже пишем с маленькой буквы. Если вы хотите, чтобы ваш движок продолжал писать интернет с маленькой буквы, вам придется его переобучать.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Мы не отчаивались, решали эти проблемы. Во-первых, меняли корпусы текстов, пробовали на других тематиках переводить. Мы передавали наши замечания коллегам из Яндекс.Переводчика, повторно обучали нейросеть и смотрели на результаты, оценивали, и просили доработать. Например, распознавание тегов, обработку HTML разметки.

Я покажу реальные варианты использования. У нас хорошо идет машинный перевод для технической документации. Это реальный кейс.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Вот фраза на английском и на русском. Переводчик, который занимался этой документацией, был очень воодушевлен адекватным выбором терминологии. Еще пример.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Переводчик оценил выбор is вместо тире, что тут поменялась структура фразы на английскую, адекватный выбор термина, которая является верным, и слово you, которого нет в оригинале, но он делает этот перевод именно английским, естественным.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Еще один кейс — переводы интерфейсов на лету. Один из сервисов решил не заморачиваться с локализацией и переводить тексты прямо во время загрузки. Но после изменения движка примерно раз в месяц слово «доставка» менялось по кругу. Мы предложили команде подключить не обычный нейросетевой движок, а наш, обученный на технической документации, чтобы использовался всегда один и тот же термин, согласованный с командой, который уже есть в документации.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Как это все действует на денежный момент? Исконно так сложилось, что в паре русский-украинский требуется минимальная редактура украинского перевода. Поэтому мы пару месяцев назад решили перейти на систему постэдитинга. Вот как растет наша экономия. Сентябрь еще не закончился, но мы прикинули, что мы сократили наши затраты на постэдитинг приблизительно на треть на украинском, и дальше собираемся редактировать практически все, кроме маркетинговых текстов. Слово Ирине для подведения итогов.

Ирина:
— Для всех становится очевидным, что пользоваться этим надо, это уже является нашей реальностью, и исключать это из своих процессов и интересов нельзя. Но нужно подумать о нескольких вещах.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Определитесь с тем типов документов, контекста, с которым вы работаете. Подходит ли эта технология конкретно для вас?

Второй момент. Мы разговаривали про Яндекс.Переводчик, потому что мы в хороших отношениях, у нас прямой доступ к разработчикам и так далее, но по факту вам нужно определиться — какой из движков будет наиболее оптимальным для вас конкретно, для вашего языка, вашей тематики. Этой теме будет посвящен следующий доклад. Будьте готовы, что пока еще есть трудности, разработчики движков все вместе работают над решением трудностей, но пока они еще встречаются.

Что творится с яндексом переводчиком. Смотреть фото Что творится с яндексом переводчиком. Смотреть картинку Что творится с яндексом переводчиком. Картинка про Что творится с яндексом переводчиком. Фото Что творится с яндексом переводчиком

Хотелось бы понять, что нас ждет в дальнейшем. Но по факту, это уже не дальнейшее, а наше нынешнее время, то, что происходит здесь и сейчас. Нам всем скорее нужна кастомизация под нашу терминологию, под наши тексты, и это то, что сейчас становится публичным. Теперь все работают над тем, чтобы вы не ходили внутрь компании, не договаривались с разработчиками конкретного движка, как бы это оптимизировать под вас. Вы сможете это получать в публичных открытых движках по API.

Кастомизация идет не только по текстам, но и по терминологии, по настройке терминологии под ваши собственные нужны. Это достаточно важный момент. Вторая тема — интерактивный перевод. Когда переводчик переводит текст, технология позволяет ему предсказывать следующие слова с учетом исходного языка, исходного текста. Это оже существенно может облегчать работу.

О том, что сейчас действительно дорого. Все думают, как меньшими объемами текста обучить какие-то движки гораздо более эффективно. Это то, что происходит везде и запускается повсеместно. Думаю, тема очень интересная, а дальше будет еще интереснее.

Мы собрали несколько статей, которые могут заинтересовать вас. Спасибо!

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *