Содержание
«Яндекс» внедрил искусственный интеллект в перевод текстов — РБК
adv.rbc.ru
adv.rbc.ru
adv.rbc.ru
Скрыть баннеры
Ваше местоположение ?
ДаВыбрать другое
Рубрики
Курс евро на 31 декабря 2022
EUR ЦБ: 75,66
(-0,42)
Инвестиции, 30 дек 2022, 20:41
Курс доллара на 31 декабря 2022
USD ЦБ: 70,34
(-1,64)
Инвестиции, 30 дек 2022, 20:41
Andretti и Cadillac объявили о планах создать команду «Формулы-1»
Спорт, 20:33
Как бизнесу возить грузы в городе: 5 фактов, которые вас удивят
РБК и Газ, 20:29
«Роскосмос» отчитался о сотрудничестве с Зимбабве по итогам 2022 года
Технологии и медиа, 20:14
adv. rbc.ru
adv.rbc.ru
Перенесший остановку сердца во время матча игрок NFL пришел в сознание
Спорт, 19:56
Киев ответил на предложение Владимира Путина о перемирии на Рождество
Политика, 19:53
Минобороны заявило о прекращении огня на Украине на 36 часов
Политика, 19:50
Шеф-редактора «Sputnik Литва» задержали по обвинению в шпионаже
Политика, 19:33
Подарок, который хочется оставить себе
Подарочный сертификат на подписку РБК Pro со скидкой до 35%
Подарить подписку
Попробуйте ответить на вопросы ЕГЭ и набрать высший балл. Тест
Специальный проект, 19:25
ЦСКА четвертый раз в сезоне обыграл «Сочи» в КХЛ
Спорт, 19:14
Путин обратился к Киеву с призывом о перемирии на Рождество
Политика, 19:14
«Американская IKEA» допустила банкротство на фоне сильного падения продаж
Инвестиции, 19:02
Никиту Михалкова госпитализировали с гриппом
Общество, 18:56
Блогер Джейк Пол дебютирует в ММА в 2023 году
Спорт, 18:34
Как перейти на российское программное обеспечение и оборудование
РБК и Tegrus, 18:30
adv. rbc.ru
adv.rbc.ru
adv.rbc.ru
«Яндекс» создал гибридную систему перевода с технологией на нейронной сети. Искусственный интеллект, как уточнили в компании, не разбивает текст на отдельные слова, а рассматривает его целиком, что позволяет лучше передать смысл
Фото: Сергей Савостьянов / ТАСС
Компания «Яндекс» создала новую, «гибридную», систему онлайн-перевода. Об этом говорится в пресс-релизе компании (есть у РБК).
«К статистической модели, которая работает в «Яндекс.Переводчик» с момента запуска, добавилась технология перевода на нейронной сети», — уточнили в пресс-службе. Теперь текст в этой системе, по ее данным, «переводят обе модели, а затем алгоритм на основе метода машинного обучения CatBoost сравнивает результаты и предлагает лучший».
Однако, в отличие от статистического переводчика, как пояснили в «Яндексе», «нейронная сеть не разбивает тексты на отдельные слова и фразы», а, напротив, рассматривает все предложение целиком. Такой подход «позволит учесть контекст и лучше передать смысл», уверены в компании.
«Кроме того, результат получается «гладким»: предложение хорошо читается, и иногда даже можно подумать, что его перевел человек», — заметили в пресс-службе, подчеркнув также, что обычная, статистическая, система перевода, в отличие от «гибридной», «в свою очередь, лучше справляется с редкими словами и фразами и не фантазирует, если смысл предложения непонятен». Так, предложение «Good morning kids» («С добрым утром, дети») нейронная сеть без кооперации со статистической системой, по данным «Яндекса», в отдельных случаях может перевести как «Хорошие морнинги».
adv.rbc.ru
В настоящий момент искусственный интеллект, как рассказали в компании, работает только для переводов с английского на русский. Это направление перевода, по данным пресс-службы, является самым популярным — на него приходится около 80% запросов.
Однако «Яндекс» не единственная компания, использующая в своих системах перевода нейросети. Американская корпорация Google представила такой метод машинного перевода еще в марте 2017 года. Согласно ему, Google Translate также перестал разбивать предложения на отдельные слова и стал воспринимать предложения целиком, в том числе в контексте всего текста.
Video
Авторы
Теги
Евгения Маляренко,
Анна Балашова
Магазин исследований
Аналитика по теме
«Интернет-торговля»
Искусственный интеллект в DOOM / Хабр
DOOM — прародитель шутеров от первого лица, определивший целое поколение игр 90-х. Хоть это и не первая игра такого рода, и даже не первая игра id Software, но именно она изменила индустрию. Проект до сих пор изучают не только из-за его известности, но и потому, что он достиг высот в условиях сильных технических ограничений, задолго до появления большинства современных инструментов и стандартов. Под катом перевод статьи о работе искусственного интеллекта в Doom и трюках которые использовали разработчики для создания интересных боевых ситуаций.
DOOM, по своей сути, данжен-кроулер с оружием, в котором игроку предстоит ориентироваться в сложных нелинейных пространствах, находить ключи и активировать переключатели, чтобы найти выход с локации. По пути игроку придется сразиться с несметным количеством демонических созданий: от Зомби-солдат с оружием до Импов с фаерболами, летающих врагов вроде Какодемонов и Потерянных душ, а также здоровяков по типу Пинки и Барона Ада. DOOM II в 1994 году добавил еще больше разнообразия: Рыцари Ада, Ревенанты, Арахнотроны, Манкубусы, Элементали боли и Архивили. Все эти персонажи перемещаются по миру, реагируют на действия игрока и атакуют по собственной внутренней логике. Самое впечатляющее — это то, как игра одновременно обрабатывает пути, проверяет область видимости, столкновения и другие взаимодействия для огромного количества врагов.
Игра использовала все нововведения рынка домашних PC в тот период. Процессоры Intel становились доступнее, оперативная память — дешевле, а переход к Windows 3.1 подтолкнул к широкому распространениею графических ускорителей. Из-за подобных изменений id Software пришлось выбросить большинство наработок своей предыдущей игры (Wolfenstein 3D в 1992 году) и заняться серьезной переработкой кода для достижения высот, о которых игры той эпохи могли только мечтать.
Основная логика
Искусственный интеллект врагов в DOOM — это один из объектов игровой логики известный как thinker. Он отвечает за поведение всех игровых объектов, которым необходимо принимать решения. Оригинальная сборка игры для DOS работает со скоростью 35 кадров в секунду, где каждый кадр обрабатывается логика для всех четырех основных классов thinker’а:
Обработка всех действующих лиц (игрок, неигровые персонажи и сам уровень).
Обновление строки состояния в нижней части экрана.
Отображение на внутриигровой карте.
Рендеринг HUD.
Логика врагов основана на конечном автомате (Finite State Machine) — это простой и эффективный механизм, чтобы определить, выполняет ли персонаж определенное поведение в определенном состоянии, и при каких условиях состояние может смениться. Позже Half-Life популяризировала FSM в шутерах благодаря удобной реализации кодовой базы на C++, а также механизмам, с помощью которых персонажи могут иметь цель и возможность ее выполнить. DOOM работает похожим образом, но ему не хватает некоторых возможностей и бесшовной интеграции — в движке просто нет скриптового языка для гибкой настройки NPC. При этом вся логика написана на C, и в ней реализовано множество хитрых твиков для создания разнообразного дизайна врагов.
Полная диаграмма состояний противников показана ниже. Сначала обсудим высокоуровневое поведение, а затем углубимся в детали.
1. Враги всегда начинают в состоянии SPAWN: бездействуют и ждут события, которое заставит их перейти к активному поведению. Наиболее наглядный пример такого поведения — уровень Entryway в самом начале DOOM II, где при старте уровня враги стоят спиной к игроку, пока тот не привлечет их внимания.
2. Получив сигнал о том, что игрок близко, они переходят в состояние SEE: перемещаются по карте и двигаются к своей цели.
3. Если ситуация позволяет, враг переходит в состояние MELEE/RANGE и атакует игрока. Затем возвращается к SEE.
4. В состояние PAIN противник переходит только извне, что логично — это должно происходить при получении урона. Затем воспроизводит нужные кадры для рендеринга, звуковые эффекты и возвращается к основной логике. NPC не переходят в состояние PAIN при каждом получении урона, вместо этого смена состояния завязана на шансах, заложенных в дизайне врага.
5. Наконец, противник может умереть двумя способами:
Есть состояние DIE, когда демон получает общее количество урона, превышающее его начальное здоровье.
Есть XDIE, когда демон получает урон и его разрывает на части. Это произойдет, если урон превысит оставшееся здоровье противника плюс его начальное здоровье.
Например, Имп начинает с 60 HP. Если у него осталось 10 здоровья, то при следующей атаке нужно нанести 71 урона, чтобы его разорвало. С Зомби или Зомби-сержантом (20 и 30 HP) это будет легко, а с Какодемоном или Рыцарем Ада (400 и 500 HP) практически невозможно. Но способ тоже есть — с помощью телефрага (то есть телепортироваться во врага и нанести 10 000 урона). Например, в Perfect Hatred, второй миссии эпизода Thy Flesh Consumed DOOM, телефрагом можно убить Кибердемона с 4000 HP.
6. Последнее состояние RAISE. Оно появилось в DOOM II из-за демона Архивиля, который умеет воскрешать других демонов.
Каждый противник придерживается этих общих состояний, но их индивидуальное поведение отличается. Как же оно определяется и работает?
Определение действий
Для выполнения логики любой агент спавнится с прикрепленным объектом thinker. Каждый thinker — это структура на C с указателем на функцию игровой логики, которую враг должен выполнить, а также дополнительные переменные, которые помогают ей обрести форму. Эта функция помогает каждому демону определить нужное поведение по его текущему состоянию.
Определение каждого врага в DOOM происходит вне кодовой базы. Текстовый файл из проекта импортируется и компилируется в файл ‘info’ с характеристиками врага и определениями для всех состояний. Затем информация компилируется в struct, который содержит следующие элементы:
Внутренний ID в игре.
Количество здоровья, с которым демон спавнится.
Скорость передвижения.
Вероятность прерывания состояния PAIN.
Радиус и высота.
Специфические свойства NPC.
Например, Импы — это твердые объекты, через них нельзя пройти (MF_SOLID), но можно стрелять (MF_SHOOTABLE) и наносить урон, а их смерть засчитывается в общее количество врагов на уровне (MF_COUNTKILL).
Кроме того, демоны не всегда впадают в состояние PAIN при получении урона. Вместо этого на них влияет вероятность прерывания этого состояния, которое в кодовой базе называется PAIN chance. Когда враг получает ранение, происходит проверка вероятности: перейдет он в PAIN или нет. Число варьируется от 0 до 256 (1 байт) и настраивается для каждого врага. В случае с Импом и Зомби-сержантом оно равно 200 и 170 соответственно, то есть у первого 79,3% шанс перейти в PAIN, а у второго — 67,6%.
Хитрость в том, что засчитывается каждое отдельное попадание из оружия. Если ракета считается за одно попадание, то дробовик технически имеет семь отдельных атак из-за своего разброса. Вот почему миниган полезен против Какодемона и Арахнотрона — у обоих PAIN chance 128 (или 50%), поэтому каждая вторая пуля может вызвать состояние PAIN. Это сильно влияет на выбор оружия, ту же систему реализовали в перезапуске серии в 2016 году.
Некоторые враги имеют низкий PAIN chance. У Кибердемона и Архивиля он однозначный (5,5% и 3,1%), а у Потерянных душ, наоборот, 100%. Технически даже у бочек есть PAIN chance, но он равен 0.
Помимо информации о поведении врага, есть индивидуальные определения действий для каждого состояния FSM. Например, Имп использует действие атаки для обоих состояний ближнего и дальнего боя, а у Зомби-сержанта есть только дальний бой.
Что касается самих действий, то здесь все гораздо сложнее. Для каждого состояния задано описание каждого кадра и действия выполняемого в этом кадре. Если рассмотрим атаку Импа, то увидим следующую информацию:
Семейство спрайтов, которое нужно загрузить для рендеринга поведения, и номера конкретных спрайтов в этом семействе.
Длину кадра во внутриигровых тиках.
Внутриигровое действие в исходном коде, которое он должен выполнить на этом кадре действия.
Следующий кадр действия, который он должен выполнить.
В случае с атакой Импа получится:
Отрисовать первые два спрайта по 8 кадров каждый и запустить код, который обеспечивает поворот Импа лицом к игроку.
Затем отрисовать третий кадр на 6 кадров и запустит функцию TroopAttack, которая разработана специально для импа.
После завершения третьего кадра переход обратно в основное состояние SEE.
Если посмотреть на код функции TroopAttack, то станет ясно, почему нет отдельного состояния для ближних и дальних атак. Имп проверит, находится ли он в зоне ближнего боя, и произведет либо ближнюю атаку, либо же просто запустит снаряд в игрока.
Эти правила описания поведения действуют для противников, которые атакуют, умирают или взрываются после получения урона и даже для анимированных спрайтов окружения.
Самое интересное — переход к состоянию RAISE. Любой противник, которого может воскресить Архивиль, имеет набор действий с теми же кадрами спрайтов что и для смерти, но воспроизводятся они в обратном порядке.
И последнее: для каждого из этих определений действия нужен отдельный кадр анимации, но это скрывает еще одну сложность. Враги в DOOM могут изображаться под 8 различными углами относительно позиции игрока. Поэтому когда используется одно из этих семейств спрайтов, оно всегда извлекает нужный набор спрайтов для этого персонажа, основываясь на его угле относительно игрока.
У Импа 21 уникальных индекс спрайта, а значит — 168 отдельных спрайтов, чтобы покрыть все 8 углов. Оптимизация здесь в том, что некоторые персонажи симметричны. Поэтому вместо 8 наборов спрайтов есть только 5, и если набор спрайтов для данной ориентации отсутствует, он просто берет зеркальный эквивалент.
Обзор и движение
С общей логикой работы врагов в DOOM разобрались, теперь поговорим про состояние SEE. Враг находит цель, фиксируется на ней, преследует по всей карте и по возможности атакует.
В состоянии SPAWN противник ждет триггера для перехода в следующий стейт. Этих триггеров всего два: когда NPC увидит или услышит врага. Увидев цель, монстр поворачивается к ней. Здесь есть несколько дополнительных проверок, например, является ли цель возможным объектом для атаки. Другими словами, NPC не преследуют все, что издает шум.
Как только цель установлена, противник переходит в состояние SEE. Это соответствует функции преследования в кодовой базе, при которой враг начинает охотиться и, если он находится в пределах досягаемости для атаки ближнего или дальнего боя, нападать.
Но вернемся назад: как враги видят или слышат игрока? Это огромный кусок логики в DOOM, связанный с левел-дизайном. А также один из самых интересных аспектов оптимизации игры. В предыдущих разборах про The Last of Us, Splinter Cell и Alien: Isolation, мы рассказывали о том, как конусы зрения используются для обзора врагов. DOOM появился еще до этого, но он выходил на PC в 90-х, и в нем довольно часто одновременно осматриваются десятки противников. Даже если все они находятся в состоянии SPAWN, каждый вызывает функцию Look() в кодовой базе 35 раз в секунду. Поэтому она должна не только эффективно работать, но и быть оптимизированной.
Враги технически имеют 180 градусов обзора и не имеют урезанного зрения на дистанции. Если обзор между вами и врагом не закрыт, он вас увидит. При этом разница в высоте не имеет значения, потому что трехмерный рендеринг движка, основан на двухмерном плане локации. Линия зрения параллельна полу, так что вам всегда понятно, находитесь ли вы выше или ниже врага. Но если враг повернут к вам лицом, он всегда увидит вас, вне зависимости от того видели вы его или нет.
Как сделать, чтобы враг видел игрока и перемещался к нему с наименьшими затратами на просчет пути? Дело в том, что DOOM разбит на фрагменты-секторы с помощью алгоритма двоичного разбиения пространства (BSP, binary space partitioning algorithm). Он позволяет организовать объекты, чтобы те сохраняли пространственную информацию. Так рендерер всегда знает, какие части игровой карты ему нужно отрисовать, отрисовывая только нужный сектор и все примыкающие. Эту оптимизацию добавил Джон Кармак, чтобы повысить производительность рендеринга и не пытаться отрисовать весь уровень.
С ИИ примерно та же история. Карта разбита на секторы, поэтому вы можете записать информацию о том, видит ли один персонаж другого, основываясь на их местоположении. Видимость между секторами в DOOM вычисляется заранее с помощью таблицы REJECT. При помощи нее мы можем сказать, видит ли персонаж из одного сектора персонажа в другом секторе.
Пример на картинке ниже. Персонаж в секторе A не увидит никого в секторах C и D, но теоретически может заметить в секторе B. Когда они ищут игрока, происходит проверка по таблице REJECT, чтобы понять, а нужно ли вообще проводить проверку видимости.
Когда демон находит игрока, то начинает двигаться к нему. Технически в DOOM нет никакого поиска пути. Если есть прямой путь к игроку, то монстр двигается напрямик. Если нет, то он направится в нужную сторону и будет отскакивать от стен, меняя направление движения. В остальных ситуациях — будет двигаться рандомно.
Все данные о столкновениях предварительно вычисляются, чтобы управлять врагами (и игроком), которые врезаются в препятствия на уровне. BLOCKMAP разбивает карту уровня на сетку, что позволяет быстро проверять проходимость участков.
Звук
Если враг увидит игрока, он атакует. А что если игрок забегает в комнату и просто стреляет из дробовика? Демоны должны среагировать на шум.
Вот в чем забавная штука. Да, враги в DOOM слышат вас, но не так, как вы думаете. Можно сказать, что они ВИДЯТ звук, так как в функции Look() буквально задается «звуковая цель».
Когда игрок стреляет, то становится звуковой целью в секторе карты, а враг в том же секторе начинает ее искать. Но работает это только в одном секторе, если звук не может распространяться дальше. В DOOM очень простой алгоритм распространения звука — работает везде, если нет заданных преград.
Хороший пример: Deimos Lab (E2M4), где вход примыкает к длинному коридору сбоку. Когда игрок убьет всех Импов и Зомби-сержантов у входа, на него вскоре нападут Импы, которые слышали бой за сотни метров.
Двери между частями уровня не дают звуку распространяться, но также левел-дизайнеры могут разместить звуковые преграды в любом нужном месте. Например, чтобы создать засаду.
Вражда между противниками
В DOOM демоны могут сражаться друг с другом. Для этого в коде есть такая логика: если NPC атакован и ранен другим персонажем, то он может назначить этого персонажа своей целью (даже если это не игрок). То есть демоны не будут нападать друг на друга без причины, нужно заманить одного врага на линию огня другого и надеяться на френдлифаер.
Есть и исключения: Бароны и Рыцари Ада не могут ранить друг друга, Элементали боли технически не могут быть втянуты в такие бои, потому что извергают Потерянные души (которые затем становятся целью), а Архивиля не могут атаковать в принципе.
Дизайн энкаунтеров
В DOOM полно ловушек, тупиков и многого другого, что создает интересные столкновения с противниками (энкаунтеры). Их хитрость в двух приемах дизайна.
Первый прием. В игре есть различные пользовательские действия, которые можно синхронизировать с картой. Если вы когда-нибудь открывали карту, то заметили множество линий: некоторые из них это реальная геометрия, другие — триггеры (игра может определить, когда игрок пересекает нужную часть). Редактор уровней DOOM позволяет выполнять фрагменты кода при входе в нужную часть уровня и добавлять тег, указывающий, какие части карты должны быть затронуты. Так можно устроить засаду — поставить потайную дверь и спрятать несколько врагов, которые находятся в состоянии SPAWN и не слышат никаких звуков.
Однако каждый триггер может иметь только одну функцию, указывающую на один объект. Что делать, чтобы одновременно произошло два события? Отличный пример — ловушка с синим ключом на Toxin Refinery (E1M3). Вы входите в помещение, чтобы взять ключ, но тут же гаснет свет и открывается потайная дверь с Импами внутри. Здесь размещаются два триггера рядом друг с другом, нацеленные на разные объекты.
В игре более 130 таких функций: открытие и закрытие дверей, поднятие или опускание пола, запирание двери, изменение уровня освещения, телепортация игрока и так далее.
Другой пример — Military Base, секретный уровень в первом эпизоде DOOM. Там можно стриггерить ловушку, схватив ракетную установку на вершине пентаграммы. Когда игрок переходит через пентаграмму, это не меняет комнату, а убирает небольшую стену, которая защищала телепортатор в маленькой комнате.
Враги внутри уже активны, им остается зайти в телепорт и оказаться около игрока. Хитрость в том, что есть небольшой незаметный коридор, который соединяет основную комнату с потайной. Именно по нему проходит звук и триггерит демонов, которые затем идут к телепортатору. Такая «звуковая труба» часто встречается в WAD-файлах DOOM и DOOM II.
Второй прием. Существует флаг засады MF_AMBUSH, который устанавливает дополнительную логику к состоянию SEE. Как упоминалось ранее, если демон видит игрока или слышит выстрел, то он принимает это за цель и движется к ней. MF_AMBUSH изменяет логику, чтобы демон игнорировал шум и ждал визуального подтверждения. То есть противник активен, но неподвижен.
Поэтому некоторые противники могут устроить засаду и застать игрока врасплох. Такой простой и эффективный способ в сочетании с метками уровня и звуковыми коридорами создает интересные игровые ситуации.
Отличный пример — Containment Area, вторая миссия игры The Shores of Hell. Многие Импы на этом уровне используют флаг засады, то есть даже когда вы убиваете кого-то рядом с ними, они все равно ждут прямой видимости с игроком.
Вместо заключения
DOOM исполнилось почти 30 лет, а он все еще влияет на индустрию. Игру продолжают портировать практически на все устройства — исходный код находится в открытом доступе уже более 20 лет.
Исходный код движка DOOM на GitHub
Книга Фабиана Сангларда Game Engine Black Book DOOM
Искусственный интеллект и перевод — новый подход к языкам
В мире, который становится все более цифровым, мы не можем отрицать, что искусственный интеллект (ИИ) берет верх. В этом сообщении блога мы рассмотрим связь между искусственным интеллектом и переводом.
Лидером в области ИИ являются США, изобретатели Интернета, но их место быстро занимает Китай. В этой гонке между США и Китаем Россия также изо всех сил старается не отставать. Действительно, на AI Journey 2019На конференции в Москве Путин сказал:
«Искусственный интеллект — это ресурс колоссальной силы. Те, кто будет владеть им, возьмут на себя инициативу и получат огромное конкурентное преимущество».
Но что такое ИИ? И каково его влияние на нашу повседневную жизнь? Искусственный интеллект — это способность компьютеров имитировать мысли и поведение человека в реальных условиях. Он работает с глубоким обучением, которое имитирует функциональность нашего мозга и позволяет компьютерам анализировать ситуации на основе данных. Новаторской силой в области ИИ была Logic Theorist, программа, разработанная для имитации навыков решения проблем человека. Аллен Ньюэлл, Герберт А. Саймон и Клифф Шоу изобрели его в 1956, а Джон Маккарти ввел термин ИИ. Функция Logic Theorist заключалась в доказательстве математических теорем, подобных тем, что были в книге Рассела и Уайтхеда « Principia Mathematica». Решил 38 задач из 52 в книге, показав лучшие результаты, чем авторы.
Искусственный интеллект и перевод. Что такое машинное обучение?
Термин «искусственный интеллект» часто используется как взаимозаменяемый с термином «машинное обучение», но на самом деле они относятся к разным реальностям. В то время как ИИ — это область разработки человекоподобных компьютеров и роботов, машинное обучение — это подкатегория ИИ. Машинное обучение — это тип информатики, который заключается в программировании машины для обучения на опыте.
Используя машинное обучение, программисты могут проверить пределы того, насколько они могут улучшить восприятие, познание и работу компьютерной системы. Вместо этого ИИ основан на глубоком обучении. Это более мощный метод, в котором используются большие нейронные сети для изучения сложных закономерностей и прогнозирования без участия человека. Пример машинного обучения — когда клавиатура нашего смартфона начинает давать нам все более и более точные подсказки. Это происходит потому, что машинное обучение программирует клавиатуру, чтобы учиться на нашем опыте.
Мы можем разделить искусственный интеллект на две категории. Одним из них является слабый ИИ, который использует систему, предназначенную для выполнения определенной работы (например, Amazon, Alexa, Siri). Другой — сильный ИИ, который использует систему, предназначенную для выполнения сложных задач без вмешательства человека (например, беспилотные автомобили).
ИИ используется во многих областях, таких как маркетинг, банковское дело, здравоохранение и так далее. В последние годы в переводе также все чаще используется ИИ.
Искусственный интеллект и перевод. Какова роль Google в переводе?
Как и многие другие области, ИИ не пощадил перевод. Многие люди задаются вопросом, превосходят ли переводчики с искусственным интеллектом переводчиков-людей по своим способностям и скорости перевода с иностранных языков. С развитием технологий легко понять причину этого вопроса. ИИ-переводчики — это цифровые инструменты, которые мы можем использовать для перевода слов и значения не только слов, но и целых предложений. Эти инструменты используют искусственный интеллект, что обеспечивает большую точность и меньше недоразумений, чем при использовании простого машинного перевода. Первопроходцем в искусственном переводе является Google, который становится все более эффективным. Google также создал приложение, которое позволяет вам сканировать текст на иностранном языке и сразу же получать перевод на свой язык.
ИИ-переводчики, несомненно, полезны, но они не так хороши, как думают люди. Люди создали такие переводчики для перевода слов и предложений без контекста. Они могут быть полезны в экстренных ситуациях во время путешествий, например, при запросе информации, но они не работают в построении человеческих отношений. Отсутствие контекста означает, что они не способны понять юмор и иронию ситуации. Иногда это приводит к неточным, а иногда и оскорбительным переводам.
Куда пропали все переводчики?
На этом этапе мы должны задаться вопросом, в чем разница между использованием машинного и человеческого перевода и почему все больше и больше агентств используют ИИ-перевод, особенно в области субтитров. Прежде всего, разница заключается в культурных барьерах и передаче контекстуальных значений. Остается вопрос: почему агентства часто выбирают переводчиков с искусственным интеллектом вместо переводчиков-людей? Ответ прост: ИИ-переводчики стоят меньше денег, чем человеческие. Аудиовизуальным переводчикам часто платят за минуту менее 1 доллара. Однако все мы знаем, что одна минута сценария (в случае с субтитрами) не означает, что вам потребуется одна минута на перевод. Следовательно, профессиональные переводчики сдаются и ищут другую более высокооплачиваемую работу. Остальные часто являются студентами или непрофессиональными переводчиками, которые, к сожалению, могут предоставить переводы, которые не всегда являются лучшими.
Squid Game и ее переводы
Недавно Netflix выпустил телесериал, который вызвал большие споры по поводу его переводов на множество языков, на которых он был доступен. Мы, конечно же, имеем в виду корейский сериал Squid Game , и даже если вы его еще не видели, вы наверняка о нем слышали. Как всемирная платформа, Netflix должен передавать свои сериалы более чем на одном языке, и если не в дубляже, то хотя бы с субтитрами. Однако зрители не всегда довольны субтитрами. Это случилось с Money Heist (испанский La Casa de Papel ) и это происходит с Squid Game .
Дискуссия началась, когда комик Ёнми Майер, свободно владеющий корейским языком, сказал, что просмотр шоу с английскими субтитрами для людей, не знающих корейский, означает просмотр другого шоу. Она также привела несколько примеров в Twitter и TikTok. Она указала, что перевод не только неверен, но и не передает корейскую культуру. Например, когда Ми-Нейо пытается убедить других игроков поиграть с ней, а она говорит: «Я не гений, но у меня все же получилось». По словам Майер, персонаж на самом деле сказал: «Я очень умный, у меня просто никогда не было возможности учиться», что часто случается в Корее.
Почему переводчики не виноваты
Однако переводчики не виноваты, когда дело касается субтитров и дубляжа. При переводе выбор стоит между сохранением первоначального значения при дословном переводе и соблюдением правил субтитров и дублирования. Ведь у каждого агентства свои правила. Например, для Netflix субтитры не должны быть длиннее двух строк и 42 символов и не должны длиться более семи секунд на экране. Вместо этого при дубляже синхронизация губ является проблемой. Более того, не передавать исходную культуру не значит не уважать ее. Скорее это означает выбор использования культуры целевого языка, чтобы избежать дополнительных объяснений.
Узнайте больше об искусственном интеллекте и переводе — мире субтитров!
В LingoStar мы предоставляем услуги перевода на любой язык, который вам может понадобиться. Мы можем перевести ваш сценарий для субтитров или для дубляжа на любой иностранный язык. Пожалуйста, запросите бесплатную смету перевода или напишите нам по адресу [email protected]. Мы будем рады помочь вам с вашими субтитрами и переводом. Как минимум, но не в последнюю очередь, не забудьте подписаться на нашу рассылку в нижней части нашего веб-сайта, чтобы получать новости и информацию о том, что происходит в мире переводов!
Читайте о субтитрах в нашем информационном бюллетене, посвященном практике многоязычных субтитров >>.
Читайте, как добавлять субтитры на иностранных языках, в нашем блоге >>.
Краткое руководство по переводу с использованием искусственного интеллекта
Искусственный интеллект (ИИ) обеспечил некоторые из наиболее значительных достижений в области технологий перевода за последнее десятилетие. Благодаря прорывам в технологиях машинного обучения, таких как нейронные сети, обработка естественного языка и глубокое обучение, ИИ-переводчик может многое порадовать.
Однако вокруг технологии ходит много слухов и спекуляций.
В этом кратком руководстве мы рассмотрим основы перевода с использованием искусственного интеллекта, развеем несколько распространенных мифов, а также объясним, как лингвисты используют эту технологию для более быстрого получения результатов без потери качества перевода.
Что такое перевод ИИ и как он работает?
ИИ-перевод — это самый передовой подход к машинному переводу, использующий ряд технологий машинного обучения для более глубокого понимания языка. Искусственный интеллект значительно продвинулся за последние пару десятилетий, в основном благодаря достижениям в двух ключевых областях: вычислительной мощности компьютера и технологии машинного обучения.
Машинное обучение использует интеллектуальные алгоритмы для анализа огромных объемов данных и выявления закономерностей, что позволяет «обучаться» и воспроизводить автоматизированные задачи, включая перевод.
В рамках машинного обучения развитие технологии, называемой нейронными сетями, и методологий, называемых глубоким обучением, привело к созданию самой передовой на сегодняшний день версии перевода ИИ: нейронного машинного перевода (NMT).
Для более подробного ознакомления с нейронным машинным переводом ознакомьтесь со следующей статьей в нашем блоге: Что такое нейронный машинный перевод?
В этой статье мы цитируем следующее определение с DeepAI.org:
«Нейронный машинный перевод — это подход к машинному переводу, который применяет большую искусственную нейронную сеть для прогнозирования вероятности последовательности слов, часто в форме целых предложений. Системы [нейронного машинного перевода] быстро выходят на передний план машинного перевода, недавно вытеснив традиционные формы систем перевода».
Нейронный машинный перевод — это технология, на которой в настоящее время работают самые передовые в отрасли инструменты перевода с искусственным интеллектом, включая Google Translate, Microsoft Translator, Unbabel и наши собственные решения для машинного перевода.
По сути, нейронная сеть — это особый тип алгоритма машинного обучения, который воспроизводит нейронное поведение человеческого мозга. В частности, он имитирует человеческое обучение, повторяя одну и ту же задачу и изучая последовательности событий, которые наиболее эффективно достигают желаемого результата.
В больших масштабах эти алгоритмы обучаются переводу между языками, учатся на собственных ошибках (и успехах) и продолжают совершенствоваться, анализируя огромные объемы данных. Google Translate, например, анализирует миллиарды переводов на тысячи языков, чтобы улучшить качество своего вывода.
Насколько хорош последний перевод искусственного интеллекта?
Технологии, лежащие в основе современных систем перевода с искусственным интеллектом, впечатляют, но задача, которую они решают, огромна. Та же технология предназначена для выявления заболеваний еще до того, как появятся симптомы; управлять беспилотными транспортными средствами и «видеть» содержимое изображений.
Между тем, результаты лучших доступных инструментов перевода ИИ остаются сравнительно неутешительными. Это не делает технологию менее впечатляющей; это просто подтверждает реальность того, как много делает человеческий мозг, когда он слушает или читает и понимает язык со всем контекстом и нюансами, которые мы используем ежедневно.
Еще до того, как мы подумаем о переводе, перспектива алгоритмов, соответствующих способности людей выполнять и понимать один язык, все еще остается научной фантастикой.
Как предприятия используют ИИ-перевод?
Чтобы лучше понять роль ИИ-перевода в языковой индустрии, полезно посмотреть, как компании в настоящее время используют эту технологию. Вот несколько полезных примеров:
Машинный перевод плюс постредактирование (MTPE):
Профессиональные переводчики проверяют и редактируют контент, созданный ИИ-переводчиком, чтобы довести его до требуемого качества.
Мгновенные переводы:
Для сценариев, в которых нет времени на полный процесс перевода, а искусственный интеллект предпочтительнее, чем полное отсутствие решения.
Анализ:
Международным компаниям может потребоваться доступ к информации на иностранных языках, а технология ИИ может обеспечить мгновенный перевод (проверьте точность, прежде чем делать какие-либо выводы или принимать решения).
Внутреннее использование:
Для контента, который не просматривается публично, например исследований, цитат, статистики, новостей и т. д. для внутреннего использования.
Стратегическое планирование:
Мгновенные переводы могут помочь командам разрабатывать стратегические планы и быстрее реагировать на возможности — опять же, точность перевода требует проверки, прежде чем предпринимать какие-либо действия.
Чат-боты:
Многоязычные компании используют технологию искусственного интеллекта для обеспечения автоматизированного (хотя и менее совершенного и более механического) взаимодействия с пользователями.
Пользовательский контент:
Такие компании, как Twitter и Airbnb, используют эту технологию для автоматического перевода пользовательского контента, такого как обзоры, сообщения и посты.
Служба поддержки клиентов:
Международные компании могут мгновенно реагировать на проблемы клиентов до тех пор, пока сотрудники службы поддержки не будут готовы вмешаться.
По сути, перевод с использованием искусственного интеллекта вступает в действие, когда времени мало и вам нужен мгновенный ответ, то есть когда скорость важнее точности.
Одним из лучших примеров может быть многоязычный чат-бот, встроенный в веб-сайт и предоставляющий мгновенные ответы на вопросы пользователей.