Искусственный интеллект перевод: Artificial%20intelligence – перевод с английского на русский – Яндекс.Переводчик

Содержание

Искусственный интеллект и сложность человеческого мозга / Хабр

Доброго времени суток, Хабр. Представляю Вашему вниманию перевод статьи: «Artificial intelligence X human brain complexity» автора Andre Lisboa.

  • Будут ли технологические достижения в области машинного обучения и искусственного интеллекта представлять серьезную угрозу для работы переводчиков?
  • Будут ли лингвисты-переводчики заменены компьютерами?
  • Как переводчики могут адаптироваться к этим изменениям?
  • Достигнет ли компьютерный перевод 100% точности в течение следующего десятилетия?


Это вопросы, которые, наверное, сегодня приходят в головы миллионам переводчикам. На самом деле, не только им, но и сотням других экспертов, которые скоро потеряют работу, если не найдут способы адаптироваться к этой новой жизни. Примером того, как технология захватывает человеческие рабочие места, представляют беспилотные автомобили, которые тайно тестировались компанией Google в течение года, выпущенные на улицы в 2019 году, на обозрение удивленной публике, словно как если бы это было в научно-фантастическом Голливудском фильме.

«Искусство подражает жизни или жизнь подражает искусству?»


Оскар Уайльд в эссе 1889 года «Упадок искусства лжи» пишет, что «жизнь подражает искусству гораздо больше, чем искусство — жизни». В фильме «Я, робот» в 2035 году высокоинтеллектуальные машины занимают государственные должности по всему миру, следуя трем законам робототехники. Несмотря на трудную историю с робототехникой, детектив Дель Спунер (Уилл Смит) расследует предполагаемое самоубийство основателя «U.S. Robotics» Альфреда Лэннинга (Джеймс Кромвель) и считает, что человекоподобный робот (Алан Тудык) убил его. С помощью робота-эксперта (Бриджит Мойнахан) Спунер обнаруживает заговор, который может поработить человеческую расу. Звучит удивительно, даже скорее невозможно, но это не так. Помните фильм «Звездный путь»? Вероятно, вещи из «Звездного пути» скоро появятся и нашем мире. И хотя люди все еще ждут сверхсветовые двигатели и телепорты, некоторые технологии, показанные в шоу как дико футуристические, теперь доступны. Вот некоторые примеры идей, которые на момент выхода фильма казались фантастическими.

Сотовые телефоны: в то время, когда стационарные телефоны закреплялись на стенах, это казалось классной футуристической идеей.

Планшеты: их версиями были PADD, которые представляли собой планшетные устройства, прибор использовался для чтения отчетов, книг и другой информации, включая планы этажей и диагностику.

Виртуальные помощники: экипаж «Энтерпрайза» умел разговаривать «с воздухом», команда могла задавать вопросы компьютеру и тут же получать ответ. Сегодня большинство людей пользуются такой функцией на телефонах с помощью Google Assistant и Siri от Apple.

Видеозвонки: «Звездный путь» строился на технологиях, намного опережающих то время. Skype и Facetime с функцией видеозвонка кажутся чем-то обыденным, но на момент выхода фильма о таком могли только мечтать.

Удивительно, не так ли?

Теперь давайте вернемся к проблеме переводчиков.

Будут ли технологические достижения в области машинного обучения и искусственного интеллекта представлять серьезную угрозу для работы переводчиков?


Не сказать, что это угроза, но это уже изменило то, как профессиональные переводчики работают. Многие компании требуют использования CAT-программ (Computer-Aided Translation), таких, как Trados, например, и большинство переводчиков в наше время используют эти программы для обеспечения быстрых, последовательных и точных переводов, включая проверку качества для получения наивысшего показателя. Недостатком является то, что контекстные соответствия, PerfectMatch и другие аспекты могут сократить количество слов, которые переводятся без CAT-программ, что подразумевает более низкие ставки для переводчика, учитывая, что «компьютер» сделал некоторую часть работы самостоятельно. Но нельзя отрицать, что эти инструменты чрезвычайно полезны как для переводчиков, так и для подобных агентств.

Будут ли лингвисты-переводчики заменены компьютерами?


Давайте начнем с того, что компьютеры «пытаются» имитировать человеческий мозг!

Человеческий мозг — сложнейшая структура во Вселенной. Не будет преувеличением сказать, что мозг — это впечатляющий орган. Ни один другой мозг в животном царстве не способен породить такое «Высшее Сознание», которое ассоциируется с человеческой изобретательностью, с способностью планировать и писать стихи. Однако, в человеческом мозге больше тайн, чем в наименее исследованных областях океана. Генеральный директор One Hour Translation Офер Шошан сказал, что в течение одного-трех лет переводчики Neural Machine Technology (NMT) будут выполнять больше 50% работы, обрабатываемой рынком в размере 40 миллиардов долларов. Слова директора резко контрастируют с часто повторяемым изречением о том, что в ближайшем будущем искусственный интеллект будет в первую очередь усиливать, а не заменять человеческий фактор. Дело в том, что языки чрезвычайно сложны. Даже профессиональный опытный переводчик будет бороться, чтобы на самом деле знать, как перевести те или иные слова. Почему? Потому что контекст важен. Вместо того чтобы быть замененными компьютерами, переводчики будут больше похожи на копирайтеров, так как завершают работу, выполняемую машинами, используя суждение для придания тексту души посредством подбора правильных слов.

Как переводчики могут адаптироваться к этим изменениям?


В первую очередь, посмотрите правде в глаза! Переводчики, которые не согласны с тем, что эти изменения останутся позади и станут вымирающими видами динозавров, и никто не хочет быть динозавром, верно? Некоторые эксперты считают, что полмиллиона людей-переводчиков и 21 тысяча агентств скоро могут потерять работу. Тогда, что делать, чтобы сохранить работу в безопасности?

Не сопротивляйтесь! Технология создана для нашей собственной выгоды, чтобы облегчить жизнь. Если Вы не знаете, как использовать CAT-программы, создавать базы терминов, запускать QA (Quality Assurance) и другие технологии, поторопитесь! Никогда не поздно учиться. Эти невероятные машины созданы для помощи. Они всегда будут нуждаться в опытном переводчике. На Youtube есть много видеороликов, в которых рассказывается, как их использовать, некоторые из них бесплатны. Не будьте «олдами»! Продолжайте искать новые технологии, инструменты, программное обеспечение… читайте статьи об инновациях, постоянно продвигайте собственный бренд, проходите онлайн-курсы на любые темы, которые могут подойти. Если Вы хотите специализироваться на маркетинговых переводах, например, возьмите курс Google Adwords (ныне Ads). Помните, что новый перевод — это новый опыт. Некоторые опытные переводчики верят, что знают все, и это неверная и самонадеянная мысль.

Достигнет ли компьютерный перевод 100% точности в течение следующего десятилетия?


Учитывая сложность человеческого мозга, вы верите, что компьютеры смогут достичь того же уровня? В этом нет сомнений. Помните «Звездный Путь»? «Я, Робот»? «Джетсоны»? Предположим, Вы живете в эпоху средневековья, Вы бы поверили, если бы Вам сказали, что в будущем люди смогут путешествовать на Луну? Подумайте об этом!

Ну что, каким будет наше новое десятилетие?

Глава «Яндекс.Переводчика» — о том, как искусственный интеллект меняет мир

  • Анастасия Зырянова
  • Русская служба Би-Би-Си

Подпишитесь на нашу рассылку ”Контекст”: она поможет вам разобраться в событиях.

Автор фото, MANJUNATH KIRAN/AFP/Getty Images

Сервис «Яндекс.Переводчик» начинает использовать в своей работе гибридную систему, в которую входят нейросети и статистический метод перевода. Пока что новая модель машинного обучения будет применяться лишь при переводе с английского языка на русский, но компания планирует внедрять этот алгоритм и в другие языковые пары.

Обрабатывая данные, нейросеть не просто следует некоему алгоритму, а ищет пути решения задачи, фактически учится её решать. И чем больше задач она выполняет, тем лучше с ними справляется. Именно за это сходство с принципом работы человеческого мозга нейросети стали называть искусственным интеллектом.

Последнее время всё больше и больше IT-компаний применяют нейросети: так, в сервисах поиска и перевода их уже используют Google и Facebook.

  • Кто переводит лучше — «Яндекс» или Google?
  • Боты изобрели свой язык: почему Facebook испугался искусственного интеллекта?

Технология, разработанная командой «Яндекса», объединяет два подхода в переводе: статистический и нейросетевой. У статистического переводчика «хорошая память»: он запоминает перевод красивых и сложных оборотов и «не фантазирует», но при этом разбивает предложения на куски и плохо связывает их между собой.

Нейросеть же, в свою очередь, переводит не кусками, а целыми предложениями, поэтому перевод получается куда более похожим на речь человека, говорят в компании.

«Текст переводят обе модели, а затем алгоритм на основе метода машинного обучения CatBoost сравнивает результаты и предлагает лучший. Преимущество гибридной системы в том, что она позволяет взять лучшее от каждого метода и повысить качество перевода», — говорится в заявлении компании.

Русская служба Би-би-си поговорила о будущем искусственного интеллекта с Дэвидом Талботом, недавно возглавившем «Яндекс.Переводчик».

Пропустить Подкаст и продолжить чтение.

Подкаст

Что это было?

Мы быстро, просто и понятно объясняем, что случилось, почему это важно и что будет дальше.

эпизоды

Конец истории Подкаст

До этого Талбот работал в Google, где руководил группой специалистов, чьей задачей было «объяснить» машинам принципы функционирования естественных языков (тех языков общения людей, которые не были созданы искусственно, как, например, эсперанто).

Би-би-си: Может показаться, что с таким бурным развитием технологий, которое мы наблюдаем последние годы, гуманитарная наука и специалисты этой области будут всё менее и менее востребованы. Вы работаете долгое время в сфере IT, но также имеете диплом Оксфорда по лингвистике и литературе. Что скажете: гуманитарии и правда скоро будут никому не нужны?

Дэвид Талбот: Нет никакой угрозы для человека из гуманитарной среды со стороны сферы IT. Она и, в особенности, сфера искусственного интеллекта определенно сделает революцию в гуманитарных науках. Она станет для них инструментом, дополнением к человеческим возможностям. Приведу такой пример. У меня есть друг, который работает в сфере социальных наук. Он занимается историческими исследованиями. Как-то ему нужно было изучить археологические раскопки. Он должен был просмотреть тысячи статей и в итоге попросил своих несчастных аспирантов прочитать их за него. То есть он мог бы заменить аспирантов… И позволить им заняться чем-то более интересным.

Он мог бы [вместо них] использовать автоматические системы, построенные на искусственном интеллекте, чтобы вникнуть в суть текстов и вычленить из них информацию, которая была ему необходима. И по-прежнему он будет влиять на науку, это он будет делать гипотезы, это он будет привносить в рабочий процесс дух креативности и новые идеи. Я не говорю, что ИИ не может быть креативным в некоторой степени. Но в большинстве случаев он не станет заменой людям, которые работают в сферах, требующих квалификации. Этого не стоит ожидать хотя бы в ближайшее время.

Автор фото, Пресс-служба Яндекса

Подпись к фото,

Этим летом Дэвид Талбот возглавил «Яндекс.Переводчик»

Би-би-си: А будут ли IT-компании нуждаться в гуманитариях в будущем?

Д.Т.: В нашей области, а мы работаем над переводом и обработкой естественного языка, действительно есть нужда в лингвистах. Нам правда важно их умение понимать языки. Компьютеры очень хорошо определяют принципы [устройства языка], но увидеть расклад возможностей… Другими словами, если мы запускаем эксперимент и у нас нет определенных границ, которыми мы могли бы руководствоваться, даже пускай они были бы очень примитивными (а эти границы идут именно из области лингвистики), если у нас нет этих границ, то мы просто потеряемся в нашем исследовании. И поэтому в области машинного перевода, обработке естественного языка, лингвисты действительно нужны.

Однако, я думаю, мы увидим это [взаимодействие] скорее в обратном направлении: увидим, как ученые-гуманитарии используют ИИ. У меня есть друг, который, кажется, профессор философии в Англии, он изучал историю идей. Он взял где-то с десяток разных концепций и хотел проследить их развитие во времени. Он сделал простой анализ на основе искусственного интеллекта и корпусной лингвистики.

То есть он проанализировал то, как определенные слова использовались в разное время. И увидел, как менялось их значение, насколько разные точки зрения об одной и той же концепции были в текстах разных эпох. Он никогда бы не провел это исследование без даже простейшего ИИ.

Мы лишь в начале пути! В таких компаниях, как «Яндекс» или Google, люди много работают над передовыми нюансами ИИ, учат его выполнять очень узкие задачи: например, [осуществлять] машинный перевод, поиск, исправление опечаток. Но все эти «навыки» ИИ в итоге будут использоваться в совершенно разных областях. То есть, возможно, студенты… Я не знаю, как давно вы учились в университете. Вы писали свои доклады от руки или на компьютере?

Би-би-си: На компьютере.

Д.Т.: Ага, на компьютере. А когда я учился, их писали от руки. Видите, кое-что уже изменилось. Возможно, последующие поколения будут писать как-то совершенно по-другому. Вы, может быть, видели в «Яндекс.Переводчике», что пока вы набираете слово, он предлагает вам продолжение фразы. То есть если вы напишете «how», он может предложить «are» и далее — «you» [«How are you?» — в переводе с англ. «Как вы поживаете?»]

И вам в итоге даже не нужно ничего писать. Вот такая функция — не в ее нынешней форме, а в будущем — могла бы сослужить хорошую службу гуманитариям, помочь им строить свои тексты. Это не конфликт.

Би-би-си: То есть вы считаете, что гуманитарии и технари будут нуждаться друг в друге?

Д.Т.: Да, я думаю, это будет работать в обе стороны.

Би-би-си: А что же будет с переводчиками-синхронистами? Станут ли сервисы вроде «Яндекс. Переводчика« им заменой?

Д.Т.: Если честно, я на это надеюсь. Потому что синхронный перевод — это очень нервная работа. Посмотрите на синхронистов высшего уровня, тех, кто работает в ООН, — они не переводят дольше двадцати минут подряд. Но всегда существует вероятность того, что ситуация потребует от человека дополнительных навыков, которые делают его незаменимым.

Например, можно легко представить ситуацию, когда переводчик на деловой встрече не просто переводит речь, а помогает преодолевать культурный барьер. То есть понимает и может предложить что-то обеим сторонам, понимает разницу между манерой их общения и культурой. И вот это, конечно, никуда не уйдет. Но, возможно, самая стрессовая и требующая максимальной аккуратности часть этой работы просто перейдет в руки компьютерам.

Автор фото, Getty Images

Подпись к фото,

Переводчики помогают преодолевать не только языковой барьер, но и культурный

Би-би-си: Не получится ли так в будущем, что технологии с использованием нейросетей станут доступными даже для небольших сайтов и они будут справляться с переводом своими силами, а в «Яндекс. Переводчике« не будет нужды?

Д.Т.: Прямо сейчас в мире около пяти, я бы сказал, компаний, которые развили серьезную мощность в машинном переводе. Это Google, Facebook, Baidu, Yandex… Пятая вылетела из головы, но тем не менее. Мы сейчас проходим через период значительных изменений в машинном переводе. Я работал над ним в Google, а изначально занимался этим еще в аспирантуре в 2003 году или даже раньше. В Google, где я работал пять лет, проект был очень вдохновляющим, особенно в тот момент, когда я к нему присоединился в 2007-2008 годах.

Но постепенно он стал входить в плато: качество перестало расти, и это очень расстраивало. Стало очень сложно делать какие-то принципиально новые вещи. То есть мы проводили эксперименты, но они давали только совсем небольшое улучшение, и это было не то, что стоило бы внедрять в производство. Это, кстати, была одна из причин, по которой я покинул проект.

  • Искусственный интеллект — угроза или помощник для человечества?
  • Может ли искусственный интеллект защитить нас от хакеров?

Оказалось, что примерно в то же время, но в другом месте люди работали над совершенно иным подходом к машинному переводу — так называемым нейронным переводом. И это был прорыв. У него был ошеломительный эффект. Кардинально новое качество. И это давало огромную мотивацию там работать. Нейронный перевод гораздо свободнее «чувствует» язык. Он анализирует целое предложение или даже, потенциально, большие отрывки. Таким образом, мы можем успешнее согласовывать слова между собой. Особенно это важно в русском языке, в котором столько правил морфологии, я сам в них постоянно путаюсь. Я не говорю, что такой перевод совершенен, но нейронные сети делают его в целом значительно качественнее.

И с одной стороны, нейросети демократизировали область перевода. Ведь сейчас небольшой команде — в университете или стартапе — гораздо проще создать довольно хорошую систему. Но у больших компаний — таких, как «Яндекс» — все равно остаются преимущества. И я думаю, что именно поэтому мы здесь пока не очень нервничаем, хотя и продолжаем фокусироваться на качестве.

Небольшая команда действительно может построить хорошую систему, на уровне тех, что делал «Яндекс» несколькими годами ранее, легко и с минимальными затратами. И если бы наша компания не развивалась с того времени, то нам пришлось бы трудно.

Вот сейчас мы внедряем нейронный перевод. Мы на самом деле презентуем инновационный подход: нейронный перевод более гладкий, он больше заточен на грамматику, и он рассматривает контекст. Есть и другой подход, статистический, его называют фразовым машинным переводом. В этом случае предложения разбиваются на куски. И тут недостаток в том, что, бывает, эти куски друг с другом не сходятся. Но обычно они сами по себе очень хорошо переведены. Это как огромный словарь, в котором не просто слова, а целые фразы.

Мы заметили очень хороший результат у гибридного подхода: когда мы используем технологию, разработанную в «Яндексе», CatBoost. Это классификатор машинного обучения, который просто выбирает то, каким методом лучше в данный момент перевести текст — нейронным или фразовым.

Автор фото, FABRICE COFFRINI/AFP/Getty Images

Подпись к фото,

С каждым годом машины все лучше понимают естественные языки общения людей

Би-би-си: Учитывая то, как сейчас быстро развивается разговорный язык, во многом благодаря интернету, хочется задать вопрос: как программы-переводчики справляются с наплывом новых слов?

Д. Т.: Это хороший вопрос. И это то, с чем «Яндексу», как поисковику, уже приходилось сталкиваться. Самая главная здесь проблема в том, что, когда возникает новое слово, имя или название продукта, новое сленговое словечко, и люди ищут его в «Яндексе», а мы его не знаем, то мы рассматриваем его как опечатку. И делаем нечто ужасное — мы пытаемся его исправить! Но пользователь-то знает, что он прав. И поэтому в «Яндексе» у нас есть такой механизм — он называется «свежий подход» — и им, кстати, занимается как раз наша команда: разработчики сервиса машинного перевода и служба исправления опечаток.

Например, есть запрос, которого мы раньше не встречали, который при этом часто используется в потоке запросов. Мы включаем его в нашу модель, мы можем вычислить его и уже не станем исправлять. Так происходит в системе нейронного перевода. Мы замечаем слова, которые не имеют логичного перевода или вообще никак не переводятся. Особенно отмечаем те, которые не занесены в словари.

  • Детские роботы с искусственным интеллектом: друзья или враги?
  • Эксперт отвечает Илону Маску: искусственный интеллект не угроза
  • Боты изобрели свой язык: почему Facebook испугался искусственного интеллекта?

Хотя мы и используем фидбек от наших пользователей, чтобы улучшить перевод, мы также и обращаемся к нашим лингвистам, которые проверяют определенные статьи. Мы также можем, вполне естественным образом сканируя информацию в интернете и изучая данные, с большой вероятностью понять, что незнакомые слова значат.

И это одна из тех причин, почему кажется, что нейронный и статистический переводы превосходят тот, что основывается на правилах языка. Потому что в случае перевода, который основывается на правилах, нужно было бы постоянно вручную добавлять новые слова.

Би-би-си: Расскажите о своем переходе в «Яндекс«. Вы пришли сюда прямиком из Google?

Д.Т.: В мои планы совсем не входило предавать Google и уходить в «Яндекс», что вы! Я уже давно был связан с «Яндексом» — через Школу анализа данных (ШАД). Это замечательная программа, на которую отбираются самые талантливые студенты факультетов информатики и математики в московских вузах и других городах.

В ее рамках проходят такие курсы, которые не всегда доступны даже в самых лучших вузах страны: машинное обучение, обработка естественного языка, машинный перевод. Я работал в московском офисе Google почти два года, в 2013-2014 годах, и примерно в это время попал в ШАД, где встретился с потрясающими студентами. Стандартный математический базис, который вы получаете в старшей школе и на первых курсах университета, просто выдающийся.

Би-би-си: В России, вы имеете в виду?

Д.Т.: Да, в России. Я был крайне впечатлен. И мне было очень приятно стать частью этого проекта. Потом я вернулся в Лондон, инженеры московского офиса Google должны были вернуться(Google закрыла свой инженерный отдел в России в 2014 году — Би-би-си). В итоге мы оказались в Лондоне, но я все равно возвращался в Москву по нескольку раз за год, чтобы преподавать в ШАДе. А после ухода из Google я вообще собирался основать стартап.

Таков был мой план. Однажды я в очередной раз приехал в Москву, чтобы провести курс. И как-то разговаривал с Мишей Биленко, который незадолго до этого возглавил в «Яндексе» управление машинного интеллекта и исследований. Он меня заразил, увлекательно рассказывая про все это. Благодаря ШАДу я имел представление о том, какая сильная команда инженеров-разработчиков в «Яндексе». Ну, и я пришел. И это восторг. Я в «Яндексе» уже около трех месяцев.

Автор фото, NATALIA KOLESNIKOVA/AFP/Getty Images

Подпись к фото,

Яндекс внедряет нейросетевые технологии в свой переводчик вслед за Google и Facebook

Би-би-си: Вы ощущаете какую-то разницу в работе компаний?

Д.Т.: Есть пара моментов. «Яндекс», как и Google, обладает эдаким инженерным мышлением. То есть решения принимаются, основываясь на данных, а не на чьих-то субъективных решениях. Действия должны быть чем-то оправданы. И это очень демократично. Люди должны все подкреплять фактами. То же самое вы увидите и в Google. Большое отличие же в том, что «Яндекс» сильно меньше. И у каждого отдельного разработчика здесь огромное количество ответственности. А в Google у меня иногда возникало ощущение, что там большое количество людей делают одно и то же. У вас есть множество инженеров и очень интересная задача — и они как бы делят этот пирог между собой.

В «Яндексе», я думаю, такой проблемы нет. Здесь каждый сотрудник занят чем-то увлекательным. И мне это очень нравится. А учитывая, что это российская компания… Ну, понятно, что все говорят на русском [смеется]. И мой русский тоже стал лучше! Я изучал его много лет назад и не использовал лет 15. Я надеялся, что теперь мне удастся восстановить эти знания, и они действительно ко мне возвращаются. Я, конечно, вам свои успехи демонстрировать не буду [смеется].

Что еще? Ну, конечно, есть какие-то административные моменты. Нужно подписывать гораздо больше бумаг, например. Но это не выбор «Яндекса» [смеется]. Вот это ощущается, да.

Би-би-си: Насчет вашего перехода в «Яндекс»: со стороны может показаться подозрительной история, когда Google внедряет технологии с использованием нейросетей в свой переводчик, а потом один из разработчиков Google Translate приходит в «Яндекс», после чего уже и «Яндекс» объявляет, что тоже начинает использовать нейросетевые алгоритмы в сервисе перевода…

Д. Т.: Ой, что вы, нет-нет-нет! Начнем с того, что мы не используем ничего подобного тому, что использует Google. Я не знаю, что они на самом деле там у себя сделали, но по результатам они опубликовали статью, в которой описали свою технологию. Я им доверяю, я знаю этих людей.

Мы тоже экспериментировали с подобной архитектурой сети, получили хорошие результаты в некоторых языках, но мы хотели сфокусироваться пока именно на переводе с английского на русский. И для этой пары языков мы вдруг нашли совсем другую архитектуру, организация нейронов в ней совершенно другая. Вообще, что меня действительно радует в мире технологий глубокого обучения, нейронных сетей и машинного перевода, так это то, что большинство людей открыто публикуют свои разработки в этой сфере.

Конечно, нет открытого источника, из которого можно было бы узнать, как именно Google внедрял нейросети, но есть множество инструментов, открытых и доступных, и некоторые из них разработаны как раз людьми из Google. И с ними можно свободно экспериментировать. Это, вероятно, новая такая — терпеть это слово не могу — парадигма!

Люди уже заметили, что обнародование разработок несет лишь преимущества. И это развивает всё сообщество: ведь, чем больше людей экспериментирует с вашей технологией, тем больше они найдут в ней ошибок или изобретут для нее обновления. Так что, я помогал «Яндексу» в последние месяцы, но я не могу заявлять, что… В общем, они еще до меня уже много чего сделали для создания такой гибридной модели. Они уже над этим давно работали.

Би-би-си: «Яндекс» заявляет, что теперь качество его перевода — лучшее в мире

Д.Т.: В данный момент мы оцениваем его с помощью стандартной внутренней метрики, автоматизированной. И согласно ей, мы действительно лучше наших конкурентов. Но это только в переводе с английского на русский, и это пока только начало. У русского языка настолько сложная конструкция, что нейросети могут значительно повысить эффективность его перевода.

Автор фото, Getty Images

Подпись к фото,

Искусственный интеллект также может разнообразить процесс изучения языков, считает Талбот

Би-би-си: А нужно ли вообще будет учить языки в мире, где есть совершенные онлайн-переводчики?

Д.Т.: Понимаете, довольно большая часть наших пользователей — это школьники, которые учат языки. Возможно, есть разница между тем, сколько они нас используют для изучения языка, и тем, сколько они используют наш сервис, выполняя домашнее задание. Они, таким образом, вовлекаются, и я думаю, что в итоге это оказывает на них позитивное влияние. Учить язык — это далеко не только заучивать слова и уметь переводить тексты. Учить язык — это про то, что ты начинаешь понимать некоторые идеи, которые в твоем языке не отражены, но отражены в чужом. Ты также начинаешь вникать в иную культуру.

Я думаю, что мы конечно достигнем того уровня, когда будем сидеть рядом, говорить на разных языках и параллельно переводить речь через сервис перевода. Но я думаю, что даже в таком случае люди будут продолжать учить языки. Ведь так много людей в мире это делает, это очень популярно. Даже когда на то нет явной причины. Просто это увлекательно и развивает мозги. Поводов может быть море и помимо расширения границ общения.

Би-би-си: Вы упомянули синхронный перевод. В онлайнпереводчиках сейчас есть функции распознавания текста на загруженном изображении, то есть перевод текста с картинок. Получается, однажды мы сможем сделать что-то типа перевода в дополненной реальности: например, сможем наводить на уличные вывески камеру смартфона и «в прямом эфире« видеть их перевод. Вы не планируете ничего подобного в «Яндексе«?

Д. Т.: О, конечно, это очевидный вариант развития событий. Просто это такая функция, которая требует некоторого улучшения существующих технологий. Сейчас можно снять фотографию, потом можно будет снять видео. Это лишь вопрос времени и качества видеопотока, а последнее — довольно сложная задача в вычислительном отношении. Сейчас, возможно, сложно себе это представить, но это проблема, которую мы сможем решить, просто, очень-очень медленно. Я даже не знаю… Может быть, года через два? Обычно, очень сложно предугадать такие вещи, но выглядит так, будто это вполне в наших силах.

И у нас, кстати, уже кое-что есть по теме дополненной реальности. Так как мы хотим, чтобы все больше людей стремилось использовать «Яндекс.Переводчик» для изучения языков, мы думали, может быть, сделать что-то в духе дополненной реальности, где… Ну, вы, наверное, знаете, это традиционное упражнение, когда вы учите новый язык, вы прилепляете стикеры на окружающие вас предметы — на стулья, столы и тому подобное. А что, если вы просто будете направлять камеру своего телефона на предметы, а он будет вам показывать, что это? И мы на это способны — мы умеем распознавать изображения и можем переводить названия на них. Да, это немного сложно сейчас, с точки зрения вычислительных мощностей, но это абсолютно реально.

Би-би-си: Хотите ли вы, возглавляя «Яндекс.Переводчик«, вывести его на международный уровень, сделать конкурентом тому же Google Translator вне России?

Д.Т.: Пока не очень понятно, но что мы с уверенностью можем утверждать — это то, что мы больше всего сейчас сфокусированы на том, чтобы улучшать наш сервис для пользователей «Яндекса». А они в большинстве своем русскоговорящие. Это для нас первоочередная цель. С другой стороны, у нас уже есть API, с помощью которого компьютер может соединяться с нашим сервисом напрямую, не через веб-интерфейс. И пользователей API (набор функций, доступных для использования другими разработчиками — Би-би-си) за пределами России у нас достаточно. Цена разумная, и они видят, что качество на высоком уровне. Таких клиентов у нас полно из абсолютно разных областей: даже, например, из сферы медиа, где необходимо обрабатывать огромное количество информации на разных языках.

Автор фото, SEBASTIEN BOZON/AFP/Getty Images

Подпись к фото,

Совершенствование технологий обработки естественного языка поможет расширить границы нашего общения, считает Талбот

Би-би-си: А каким вы видите следующий шаг? Какие у «Яндекс.Переводчика« сейчас главные приоритеты?

Д.Т.: Мы просто обязаны сделать так, чтобы процесс перевода стал совершенно незаметным и гораздо более простым.

Би-би-си: А разве им сейчас сложно пользоваться?

Д.Т.: Им сложно пользоваться в том смысле, что вам надо пойти и начать им пользоваться. Перевод должен происходить просто и автоматически. Когда вы читаете что-то в интернете, это должно автоматически переводиться. Хочется, конечно, чтобы перевод стал супербыстрым. Люди не переводят для того, чтобы перевести слова. Они переводят потому, что хотят с кем-то общаться, стремятся что-то понять.

И мы должны сделать так, чтобы у них была эта возможность. Перевод должен происходить по дефолту. Тогда коммуникация станет абсолютно безграничной, а нам не нужно будет думать об использовании какого-то приложения.

Программное обеспечение для перевода искусственного интеллекта | Smartling

Когда мы думаем об искусственном интеллекте (ИИ), легко сразу же перейти к ИИ, известному нам из поп-культуры.

Кто бы не хотел что-то вроде Джарвиса из «Железного человека»: реалистичного, но цифрового дворецкого, встроенного в наши гаджеты, который всегда готов помочь нам принять правильное решение? Хотя технология еще не достигла такого уровня сложности, ИИ уже проник в некоторые инструменты и сервисы, которыми мы пользуемся каждый день.

Являясь пионером облачного программного обеспечения для перевода, Smartling уже использует искусственный интеллект для упрощения и оптимизации всего процесса перевода.

Давайте подробнее рассмотрим, что это значит.

Что такое ИИ и как он связан с переводом?

Мы можем рассеять некоторую путаницу вокруг ИИ, продвигаясь вперед с последовательным пониманием. Хотя семантика может отличаться от определения к определению, общая идея ясна:

Искусственный интеллект — это аспект информатики, который фокусируется на разработке инструментов и решений, способных выполнять задачи самостоятельно.

Различные формы ИИ извлекают из разных наборов данных и анализируют эти данные, чтобы выявить закономерности и определить, какая стратегия или действие будет иметь наибольшую вероятность успеха.

Например, сначала мы часто думаем о машинном переводе. Самые современные модели машинного перевода известны как нейронный машинный перевод.

Эти механизмы напрямую используют нейронные сети глубокого машинного обучения, чтобы определить, как правильно перевести ваш контент, интерпретируя намерение этого исходного контента. В результате перевод ИИ действует в большей степени в соответствии с тем, как работает переводчик-человек, а не просто двуязычный словарь.

Искусственный интеллект живет в вашей системе управления переводами

Хотя машинный перевод Nueral, безусловно, впечатляет, ИИ в облачном программном обеспечении для перевода фокусируется именно на управлении переводами. Это означает, что ИИ напрямую связан с концепцией автоматического перевода и используется в конкретных случаях для повышения как эффективности, так и качества перевода.

Искусственный перевод не устраняет потребность в переводчиках-людях, а скорее поддерживает их и упрощает процесс от А до Я.

В частности, ИИ помогает вам работать эффективнее, а не усерднее, при этом улучшая качество перевода на протяжении всего процесса. Это означает, что контент может быть выведен на рынок гораздо более быстрыми темпами без ущерба для качества.

1. Машинный перевод
NMT представляет собой наиболее широко известное использование ИИ в переводе. Мы уже видим мощные механизмы от поставщиков машинных технологий, таких как Google, Microsoft и Amazon, особенно последнее приложение Google.

2. Обработка естественного языка
Как правило, технология обработки естественного языка, которая работает вместе с механизмом NMT, предназначена для преобразования человеческой речи в двоичный язык компьютера. Здесь важно то, что NLP можно использовать для сканирования и анализа документов, чтобы выявить любые потенциальные ошибки, улучшения или даже классификацию документов в массовом масштабе.

3. Автоматизация процессов
Когда дело доходит до реального, пригодного для использования ИИ, автоматизация процессов будет там, где мы найдем наиболее очевидные варианты использования. Более традиционный процесс перевода и связанные с ним рабочие процессы медленны и подвержены ошибкам. Вместо этого автоматический перевод полагается на ИИ для выполнения более простых и повторяющихся задач по назначению заданий, просмотру и редактированию контента, отправке контента или полному отклонению контента.

Перевод с использованием искусственного интеллекта в Smartling

Самое приятное в переводе с использованием искусственного интеллекта, помимо того, что он является частью футуристического мира, в котором мы живем, — это явная возможность снизить затраты и сэкономить драгоценное время — главное преимущество облачного программного обеспечения для перевода.

Например, благодаря возможности предварительно настроить правила автоматизации заданий, пользователи могут поддерживать свободный поток контента, полагаясь на автоматические проверки качества для выявления любых проблем в переводе.

Согласно последнему отчету CSA MarketFlex для ориентированных на язык TMS, Smartling постоянно использует «лингвистические и проектные данные», чтобы научить наши услуги и инструменты работать еще лучше.

Благодаря постоянному участию ИИ пользователи могут оптимизировать эффективность своего процесса перевода, одновременно учась совершенствовать его еще больше. Вот шесть реальных функций, иллюстрирующих, как Smartling использует искусственный интеллект для перевода, чтобы постоянно улучшать как время выхода на рынок, так и качество перевода:

1. Автоматизированное управление проектами

Smartling выявляет важные данные и автоматически принимает решения о том, как лучше перевести контент с одного языка на любой целевой язык.

Управление проектом может быть автоматизировано на основе набора предварительно запрограммированных параметров, включая бюджет, время выхода на рынок и ожидаемое качество.

  • Создание задания — запланируйте автоматическую упаковку содержимого в задание на основе набора правил, включая тип файла, тип проекта, языки и многое другое.
  • Маршрутизация контента — автоматическая маршрутизация и доставка контента выбранному вами поставщику переводов после того, как контент был назначен в качестве задания.
  • Уведомления — Smartling уведомляет следующего пользователя, когда работа готова к переводу, редактированию или просмотру, поэтому ничего не ускользает.

2. Проверки качества

Пользователи могут настроить свои собственные уникальные автоматизированные процессы и управление задачами с помощью настраиваемых проверок качества.

Вместо того, чтобы всегда требовать проверки человеком, пользователи могут определять приоритет ошибок и требовать выполнения действий для устранения этих ошибок, прежде чем содержимое сможет перейти к следующему шагу.

Отсюда и термин «автоматический перевод». Вместо того, чтобы требовать постоянного процесса редактирования человеком, ИИ может вмешаться, чтобы помочь очистить контент и напомнить переводчикам о любых ошибках во время самого процесса перевода.

3. Динамические рабочие процессы

С помощью динамических рабочих процессов пользователи могут создавать свои собственные рабочие процессы в соответствии с уникальными потребностями в зависимости от их роли в процессе перевода и управления контентом. Пользователи могут даже связать несколько действий с одним триггером.

Например, расширенный динамический рабочий процесс может определить, когда переводчик-человек лучше подходит для определенного контента.

Одним из доступных методов является использование существующей памяти переводов (TM) для определения сложности содержимого. Когда Smartling сравнивает исходный контент с ТМ вашего бренда, он часто находит совпадения слов, которые не идентичны на 100%. Они известны как нечеткое совпадение и представлены в процентах в зависимости от того, насколько близко слова совпадают по смыслу.

Контент с большим количеством нечетких совпадений, который оценивается ниже 90%, может автоматически направляться переводчику вместо рабочего процесса машинного перевода. Идея заключается в том, что Smartling может помочь определить наилучший путь к успеху на основе вашего контента и истории переводов.

Цель – добиться точного и качественного перевода; Динамические рабочие процессы позволяют вам делать это без ручного управления каждой строкой.

4. Данные и аналитика

Наш алгоритм машинного обучения составляет автоматический показатель качества для каждого перевода, когда он проходит через Smartling.

Результат: представление о качестве перевода в режиме реального времени для всех ваших проектов, языков и поставщиков переводов.

Отчеты о рабочих процессах Dynamic и Velocity наглядно представляют потенциальные преимущества, которые эти рабочие процессы добавляют к процессу перевода или требуют большей оптимизации.

5. Smartling Draft

Одним из наших любимых дополнений ИИ к Smartling должен быть Draft. Выпущенный совсем недавно проект Draft представляет собой значительный шаг вперед в использовании ИИ.

Draft предназначен для унификации всего глобального процесса создания контента. Draft, автоматизированный инструмент для совместной работы над текстом, будет активно сканировать ваш контент по мере его написания и предлагать варианты улучшения исходного контента для максимально возможного качества перевода.

Самое приятное то, что все это происходит в режиме реального времени, из доступных данных в вашей памяти переводов, чтобы предложить фразы или слова, которые лучше всего подходят к содержанию.

6. Оценка достоверности качества

Оценка достоверности качества Smartling (QCS) позволяет прогнозировать результаты качества перевода. Основываясь на балле от 1 до 100, QCS помогает пользователям определить, насколько качество их материала близко или далеко от «профессионального качества», что означает, что человек должен вручную оценивать контент.

Эта оценка отслеживает несколько показателей с подробным представлением каждого, включая использование памяти переводов, термины глоссария, этапы рабочего процесса, ошибки проверки качества, длину строки, визуальный контекст и любые другие проблемы в самом контенте.

Преимущество Smartling

Искусственный интеллект в переводе сейчас является горячей темой, после такого бума в реальном использовании технологии. Всегда важно управлять ожиданиями в отношении новых технологий.

Это верно, когда мы обсуждаем, как ИИ влияет как на процесс перевода, так и на индустрию локализации в целом.

Когда дело доходит до Smartling, перевод с помощью ИИ является частью почти всего, что делает сервис. Smartling постоянно работает над улучшением вашего рабочего процесса перевода, в то же время изучая, как улучшить сам сервис.

Если вы хотите узнать больше, позвоните нам, мы будем более чем рады помочь вам изменить мир с помощью слов.


Теги:Облачный переводВозможностиМашинный переводОптимизация

Что такое ИИ-перевод: определение и передовой опыт

Искусственный интеллект использует машинное обучение, позволяющее устройствам или программному обеспечению выполнять задачи без участия человека. Типы ИИ различаются, но большинство из них работают, используя вычислительную мощность для обнаружения шаблонов в наборах данных и сравнивая различные варианты использования этих шаблонов для поиска решений, подходящих для конкретных задач.

Легко понять, почему ИИ применим к переводу. Языки — это, по сути, большие наборы данных, заполненные словами и значениями, и они регулируются правилами, определяющими, как эти слова используются.

ИИ-переводчик просто применяет машинное обучение к языкам. Это выходит далеко за рамки стандартного машинного перевода, который напрямую переводит каждое слово, что часто приводит к серьезным недоразумениям. Вместо этого инструменты ИИ могут понимать фразы, оттенки голоса, сложные структуры предложений и даже шутки или сленг.

Результатом обычно является гораздо более высокий стандарт перевода и содержание, которое более эффективно адаптировано к целевым рынкам.

ИИ-перевод использует технологию нейронного машинного перевода (NMT), которая была впервые представлена ​​Google с 2016 года. Программное обеспечение NMT впервые отражает подход людей к изучению языков.

Эти инструменты анализируют языковые шаблоны на основе огромного количества документов как на исходном, так и на целевом языках. Системы NMT используют эти данные для создания кодов, которые отображают практически любые слова и фразы на целевой язык.

Системы нейронного обучения предназначены для повышения точности по мере выполнения этой работы вплоть до того момента, когда они почти достигают естественной беглости речи. Веб-сайт перевода AI Google Translate является тому примером. Со временем он развил сложные способности, особенно для более распространенных языков и простых текстов.

Каковы преимущества и недостатки использования ИИ-перевода?

Является ли ИИ уже технологией перевода, на которую можно положиться при проведении кампаний по локализации? Потенциально, но все же есть некоторые ключевые плюсы и минусы, о которых пользователи должны помнить.

Нет никаких сомнений в том, что переводчики с искусственным интеллектом обладают некоторыми важными преимуществами, в том числе:

  • Скорость — Инструменты перевода на основе искусственного интеллекта могут предоставлять путешественникам мгновенные переводы, когда они больше всего нужны. Например, они хорошо подходят для понимания меню, написанного на иностранных языках, или для расшифровки уличных знаков.
  • Поддержка — ИИ-переводчиков могут выступать в качестве бесценных помощников для реальных переводчиков. Они могут обеспечить мгновенную обратную связь, когда авторы трансформируют рекламный текст, или анализировать большие объемы контента, чтобы предоставить отзыв о пакетном переводе. Они также могут отмечать проблемы, связанные с тоном голоса, которые могут пропустить старые цифровые переводчики.
  • Стоимость — Лучшие языковые инструменты ИИ способны преобразовывать большие объемы текстов с высокой точностью без финансовых накладных расходов, связанных с переводчиками-людьми. В некоторых случаях переводчики-люди могут выполнять задачи по контролю качества цифровых пакетов, радикально снижая стоимость локализации.

Однако есть и потенциальные минусы:

  • Культурное непонимание — ИИ-переводчики могут быть более точными, чем когда-либо, но они не люди с глубоким знанием местных культур. Точные переводы по-прежнему могут вводить в заблуждение или оскорблять местных жителей, а юмор — это то, что компьютеры не способны анализировать.
  • Сложность — Хорошее содержание понятно для начала, но некоторые тексты имеют должны быть сложными, такими как технические руководства. Инструменты перевода AI могут работать с неясными или двусмысленными исходными текстами. Они могут быть не идеальными для точного перевода, где используется технический жаргон.
  • Вялость – Компьютеры исключительно хорошо справляются с повторяющимися задачами с четкими выводами, но они не умеют делать тексты увлекательными и увлекательными для чтения. Тексты, сделанные с помощью ИИ-перевода, часто могут быть пресными и нейтральными. Иногда это хорошо, но брендинг требует индивидуальности, а ее должны обеспечивать люди.

Учитывая все эти плюсы и минусы, для чего на самом деле должен использоваться ИИ-перевод?

ИИ подходит для нескольких ролей в процессе локализации, но не в качестве единственного переводчика. Вместо этого большинство транскреационных сервисов используют возможности машинного обучения, чтобы дополнить работу людей.

ИИ может действовать как механизм контроля качества, автоматически проверяя человеческие тексты на наличие ошибок.

ИИ может решить, когда тексты могут быть заполнены машинами, а какие должны быть назначены людям. Анализ количества двусмысленных или «нечетких» фраз дает хорошее представление о том, насколько легко переводить текст.

Люди-переводчики могут получать постоянную помощь ИИ, а инструменты перевода вносят предложения в режиме реального времени. Они также могут предоставить показатели завершенных текстов, которые анализируют аспекты качества перевода.

Компании могут использовать ИИ для помощи в управлении проектами локализации. Они могут автоматизировать создание и перевод контента, когда это возможно, и контролировать рабочие процессы, чтобы гарантировать, что качество остается высоким при соблюдении вех затрат и времени.

Думайте об искусственном переводе как о способе сделать переводчиков умнее и упростить управление проектами. Оба являются отличными новостями для компаний, стремящихся локализовать свой контент.

Не все задачи перевода подходят для инструментов перевода ИИ. Как мы отмечали ранее, меньше подходят проекты, характеризующиеся высоким уровнем сложности и техническим языком. Юридические и научные термины могут создавать уникальные проблемы для систем машинного обучения, и опытные люди, как правило, работают более надежно.

ИИ действительно проявляет себя, когда проекты включают большое количество относительно простых текстов. Руководитель проекта может запрограммировать системы искусственного интеллекта для выполнения базовой локализации с учетом тона голоса, беглости речи и даже некоторых культурных аспектов. Они также могут применять рекомендации по брендингу для пакетов контента.

ИИ часто используется компаниями в их операциях по обслуживанию клиентов. Например, компании регулярно используют инструменты Microsoft LUIS для локализации поддержки клиентов без привлечения большого количества людей-операторов.

ИИ играет роль во многих операциях по редактированию и контролю качества. Это не обязательно инструмент для перевода документов. Он лучше подходит для проверки переводов и контроля качества кампаний по локализации.

Помощь в переводе ИИ, несомненно, будет быстро развиваться вместе с более широкими технологиями ИИ, а ИИ развивается невероятно быстро. Глобальные инвестиции в ИИ выросли с 12,75 млрд долларов в 2015 году до 67,8 млрд долларов в 2020 году, а рынок машинного перевода растет примерно на 19% каждый год.

Однако это не означает, что инструменты искусственного интеллекта заменят человека за одну ночь. Хотя ИИ очень мощен, системы перевода все еще не могут воспроизвести когнитивные процессы писателей и читателей. ИИ не может шутить или использовать разговорные выражения, как люди. У него нет чувства стиля и беглости, которыми обладают писатели реального мира.

Могут ли компьютеры развивать эти навыки?

Абсолютно, и они в конечном итоге будут. Но тем временем ИИ процветает как помощник переводчикам и способ сделать их работу более эффективной.

BLEND использует перевод ИИ в сочетании с человеческой локализацией и глубоким знанием платформы для достижения наилучших результатов для компаний с многоязычными трансграничными целями. Мы применяем новейшие технологии искусственного интеллекта для обслуживания наших клиентов, а наши команды используют передовые инструменты постредактирования и перевода везде, где это возможно.

Помощь в переводе с помощью ИИ может сократить затраты и сроки проектов локализации при сохранении высокого уровня качества. И это еще более эффективно в сочетании с нашими экспертами по переводу из реального мира.

Свяжитесь с нами сегодня, чтобы изучить огромный потенциал искусственного интеллекта.