Содержание
Искусственный перевод / Аналитика
Perhaps the
history of the errors of mankind, all things considered, is more
valuable and
interesting than that of their discoveries. Truth is uniform and
narrow; it constantly exists,
and does not seem to require so much an active energy, as a passive
aptitude of the soul in
order to encounter it. But error is endlessly diversified; it has no
reality, but is the pure and
simple creation of the mind that invents it. In this field the soul has
room enough to expand herself,
to display all her boundless faculties, and all her beautiful and
interesting extravagancies and absurdities.
(с) Benjamin Franklin
Взгляд на системы машинного перевода изнутри
Знание иностранных языков — это не только полезный навык в повседневной
жизни, но также одно из основных требований при приеме на работу.
Однако сегодня одного только знания иностранных языков бывает
недостаточно, поскольку объем информации, которую необходимо ежедневно
переводить, существенно возрос. Вместе с тем, эта задача успешно
решается, и ни для кого не составляет труда всего за несколько секунд
перевести контракт или контент иностранного сайта. А все потому, что
переводом в этом случае занимается программа-переводчик: человек не
успевает и глазом моргнуть, а перевод уже готов.
Машинный (или автоматизированный) перевод – именно так
называется технология, с помощью которой компьютерная программа
осуществляет связный перевод текста с одного языка на другой.
Технология машинного перевода (МП) как научное направление имеет уже
почти вековую историю, а первые идеи автоматизации переводческого
процесса появились еще в XVII столетии. В 1954 году в США состоялся так
называемый Джорджтаунский эксперимент, на котором была представлена
первая версия электронного переводчика: программа имела словарный запас
всего в 250 слов и действовала на основе шести правил.
Сегодняшние программы-переводчики имеют гораздо более широкий
«кругозор» и действуют на основе более совершенных
переводческих технологий. Системы перевода активно используются во всем
мире в случаях, когда требуется быстро понять смысл текста или часто
переводить большие объемы информации. Некоторым разработчикам на
сегодняшний день удалось достичь весьма приемлемого качества перевода
по отдельным языковым направлениям. В этом материале мы предлагаем
посмотреть, как выглядит процесс перевода изнутри, каким образом
программе удается «понять» иностранный текст и
перевести его на другой язык.
Две стороны МП
В рамках технологии машинного перевода существует два подхода:
традиционный (основанный на правилах, rule-based machine translation) и
статистический (основанный на статистической обработке словарных баз,
statistical based machine translation). Традиционный метод МП
используется большинством разработчиков систем перевода. Работа такой
программы включает в себя несколько этапов и, по сути, заключается в
использовании лингвистических правил (алгоритмов). Соответственно,
создание такого электронного переводчика включает в себя разработку
правил и пополнение словарных баз системы. От разработки необходимых
алгоритмов зависит качество перевода на выходе. Богатый словарь системы
также позволяет справиться с переводом самых разнообразных по тематике
текстов.
Статистический метод МП действует совсем по иному принципу. В его
основе лежат математические методы для получения перевода. Точнее
сказать, весь принцип работы подобной системы основан на статистическом
вычислении вероятности совпадений фраз из исходного текста с фразами,
которые хранятся в базе системы перевода.
Правила перевода изнутри
Как уже было сказано выше, метод машинного перевода, основанный на
правилах, называется традиционным, поскольку на его основе работает
большинство систем автоматизированного перевода. В России с помощью
традиционного способа МП разрабатываются программные продукты компании
ПРОМТ — единственного в нашей стране производителя
программ-переводчиков. Самое время рассказать об этом методе МП
поподробнее.
Работа системы машинного перевода, основанной на правилах, состоит из
нескольких этапов. Сначала система осуществляет морфологический анализ
слов (указывает род, число, лицо и другие морфологические
характеристики для каждого слова). Кроме того, программа фиксирует
полную информацию по многозначным словам (тем словам, которые могут
относиться к разным частям речи или иметь разные значения).
Затем происходит объединение отдельных слов в группы: именные (где
главным словом является существительное, а зависимые от него слова
определяются по идентичным морфологическим характеристикам), глагольные
(главное слово – глагол) и др. Кроме того, в этот момент
система может решить вопрос многозначности для некоторых слов в
зависимости от их контекста.
На следующем этапе программа приступает к определению членов
предложения и их роли в предложении, границ и типа связи между простыми
предложениями. Сначала она ищет границы простых предложений, которые
определены знаками препинания. Затем определяет главные члены, причем
сначала система ищет сказуемое и только потом подлежащее перед ним
(если перед сказуемым подлежащего нет, программа ищет его за сказуемым
или делает вывод, что подлежащее отсутствует (например, в безличных
предложениях)). Завершив поиск главных членов предложения, система
определяет сферы их влияния (слова и группы слов, зависимые от
подлежащего и от сказуемого). Все группы, которые система не смогла
отнести ни к сфере влияния подлежащего, ни к группе сказуемого,
считаются обстоятельствами.
И, наконец, на заключительной стадии работы происходит окончательное
согласование всех членов предложения и построение предложений с учетом
требований грамматики выходного языка. Элементы согласуются внутри
групп, а также уточняется их зависимость от подлежащего или сказуемого
и подтверждается порядок слов в предложении.
Таким образом, процесс перевода системы логически понятен: происходит
поиск языковых эквивалентов, их объединение по морфологическим
признакам, синтаксический анализ членов предложения и окончательный
синтез предложения на выходном языке.
Статистический метод МП работает совсем иначе. Здесь главным является
наличие как можно большего количества парных фрагментов текста и
вычисление наибольшей вероятности их употребления. Программа вычисляет
наиболее вероятную последовательность слов выходного языка, которую она
считает наиболее соответствующей переводу исходного текста.
На данный момент очевидным является то, что системы традиционного
метода МП справляются с переводом текстов лучше, чем статистические
системы. Примеры сравнения качества перевода двух методов МП
представлены в Таблице 1.
Таблица
1. Сравнение
традиционного и статистического методов МП.
Пример | Традиционный метод МП | Статистический метод
МП |
Your iDisk Public
folder makes exchanging files with friends a no-brainer. | Ваша iDisk
Общественная папка делает файлы обмена с друзьями легкой задачей. | Ваш iDisk
общественной папке позволяет обмениваться файлами с друзьями один не элементарно. |
Статистика на подходе
Однако, несмотря на явное, на сегодняшний день, преимущество
традиционного метода, статистический машинный перевод в последнее время
более явно заявляет о себе. Самыми продуктивными разработками в этой
области занимается компания Google, которая предлагает онлайновый
сервис перевода на своем портале. Google заявляет о преимуществе именно
статистического метода перевода и видит причину успеха в максимально
обширных словарных базах, имеющих необходимое количество сегментов
текста для их правильного перевода. Однако пока успехи в этой области
незначительные. Перевод, выполняемый сервисом, постоянно меняется, но
далеко не всегда в лучшую сторону (см. примеры в Таблице 2). Как видно
из примера, одно и то же выражение (attorney’s fees) было переведено
совершенно по-разному (и спустя месяц перевод не выглядит корректным).
Кроме того, система часто неправильно распознает артикли и не всегда
согласует слова между собой по морфологическим признакам.
Таблица
2. Перевод статистическим методом МП.
Пример | Первый перевод Google
(декабрь 2007 г.) | Перевод Google
(январь 2008 г. ) |
Attorney’s
Fees A clause for attorney’s fees is normally included in the note in the event the borrower defaults in repayment of the loan. | Прокурора
Тарифы Положение на адвоката гонорар, как правило, включены в записку в случае невыполнения заемщиком в погашение кредита. | Прокурора
сборы А положение на гонорар адвоката, как правило, включена в записку, в случае, если заемщик по умолчанию в качестве погашения кредита. |
Возможность быстрого пополнения словарных баз, безусловно, является
преимуществом статистического метода МП. Однако у этого обстоятельства
есть и обратная сторона: большое количество информации требует немалого
объема памяти для хранения. Возможно, в будущем, эту проблему удастся
успешно решить, но на данный момент она существует.
Нюансы технологии машинного перевода, основанной на правилах
(традиционного метода МП), не позволяют разработчикам так же быстро
публиковать изменения, как это делает Google. Работа в рамках
традиционного метода МП заключается, главным образом, в
совершенствовании самого механизма перевода, разработке новых
алгоритмов. Однако эти усилия, пусть и не столь быстрые, оправдывают
себя. Например, последняя версия уже упоминавшейся системы PROMT
представляет качество перевода на порядок выше, чем ее предшественница.
Повод улыбнуться
Однако пока качество перевода, предлагаемое традиционной системой МП и
статистической системой, нельзя назвать идеальным. Особенно сложным для
программы-переводчика является перевод художественных текстов, где
велика вероятность нестандартного порядка слов в предложении, и от
переводчика требуется понимание иносказательного смысла выражения.
Поскольку программа-переводчик пока не обладает образным мышлением,
перевод таких предложений выглядит забавно. Некоторые примеры забавных
переводов системами МП приведены в Таблице 3.
Таблица
3. Примеры забавных переводов пословиц.
Пример (пословицы) | Правильный перевод | Перевод, сделанный системой
перевода |
Even a wise man stumbles. | На всякого мудреца довольно простоты. | Даже мудрый человек натыкается. |
Sure as eggs are eggs. | Ясно, как божий день. | Уверенный, поскольку яйца — яйца. |
No news is good news. | Отсутствие новостей — уже хорошая новость. | Никакие новости не хорошие новости. |
Однако существует немало примеров электронных переводов, которые
невозможно отличить от работы, выполненной человеком-переводчиком.
Например:
Таблица
4. Примеры удачных переводов, сделанных системой МП.
Пример | Перевод системой МП |
Fair words butter no parsnips. |
Соловья баснями не кормят. |
One will reap what he’ll sow. |
Каждый будет пожинать то, что он посеет. |
Information that defines a GPRS connection between a mobile phone and the network. PDP context activation also means that other subscriber-related parameters are activated. |
Информация, которая определяет связь GPRS между мобильным телефоном и сетью. Активация контекста PDP также означает, что активизированы другие связанные с подписчиком параметры. |
Что дальше?
В процессе тестирования систем МП стало ясно, что возможность быстрого
пополнения словарных хранилищ статистической системы на данный момент
не дает нужного результата. Однако, вполне возможно, это вопрос
времени. В то же время разработчики традиционных систем МП сегодня
могут гарантировать перевод высокого, но не идеального качества.
В настоящее время существует идея объединить оба метода машинного
перевода, в результате чего, возможно, удастся создать систему нового
поколения, которая совместит преимущества каждого метода и сможет
выполнять перевод, максимально близкий к идеальному. Некоторые
производители уже приступили к разработкам в этой области. А нам
остается ждать от них качественно новых результатов.
Автор выражает благодарность компании ПРОМТ
за консультации при создании материала.
— Обсудить материал в конференции
%d0%b8%d1%81%d0%ba%d1%83%d1%81%d1%81%d1%82%d0%b2%d0%b5%d0%bd%d0%bd%d1%8b%d0%b9 — перевод на греческий
Пример переведенного предложения: Расчет 81, скорая всё ещё на переезде. ↔ Βοηθητικό 81, οι υπόλοιποι κόλλησαν στην κίνηση.
Glosbe Translate
Google Translate
+
Добавить перевод
Добавить
В настоящее время у нас нет переводов для %d0%b8%d1%81%d0%ba%d1%83%d1%81%d1%81%d1%82%d0%b2%d0%b5%d0%bd%d0%bd%d1%8b%d0%b9 в словаре, может быть, вы можете добавить его? Обязательно проверьте автоматический перевод, память переводов или косвенные переводы.
интервал искусственной задержки ответов
διάστημα παγίδευσης ασφαλείας
искусственный спутник земли
τεχνητός δορυφόρος
Искусственная нейронная сеть
τεχνητό νευρωνικό δίκτυο
искусственные источники света
φωτεινότητα
искусственное озеро
τεχνητή λίμνη
искусственный объект
τεχνητό αντικείμενο
Искусственная трава
Τεχνητός χλοοτάπητας
искусственная вагина
Τεχνητό αιδοίο
Добавить пример
Добавить
Склонение
Основа
Расчет 81, скорая всё ещё на переезде.
Βοηθητικό 81, οι υπόλοιποι κόλλησαν στην κίνηση.
OpenSubtitles2018.v3
Сейчас мне 83 года, и 63 из них я провела в полновременном служении.
Σήμερα, σε ηλικία 83 ετών, αναπολώ 63 και πλέον χρόνια ολοχρόνιας υπηρεσίας.
jw2019
В их записях указано, что в феврале 83-го был звонок с сообщением о теле.
Το αρχείο τους δείχνει ότι έλαβαν μια κλήση, τον Φεβρουάριο του’83, που αφορούσε πτώμα.
OpenSubtitles2018.v3
В настоящий 83-й год правления Царства, возглавляемого Иисусом, некоторые, возможно, думают, что сейчас как раз период замедления.
Σε αυτό το έτος, το 83ο της διακυβέρνησης της Βασιλείας του Ιησού, μερικοί μπορεί να πιστεύουν ότι ακριβώς τώρα βρισκόμαστε σε περίοδο αργοπορίας.
jw2019
Похоже, мы можем поехать по шоссе 81 и дальше через Даллас.
Θα πάρουμε τον αυτοκινητόδρομο 81 και θα κατευθυνθούμε προς το Ντάλας.
OpenSubtitles2018.v3
Она распространяет миллионы [19 миллионов каждого выпуска] экземпляров своего материала примерно на 60 [в настоящее время на 81] языках, в том числе на языках пиджин, хилигайнон и зулу.
Διανέμει εκατομμύρια αντίτυπα [19 εκατομμύρια από κάθε τεύχος] της έντυπης ύλης της σε περίπου 60 [στην πραγματικότητα 81] γλώσσες, περιλαμβανομένης της πίτζιν, της χιλιγκαϊνής και της ζουλού.
jw2019
Этот отчисленный ученик умер в 82 года, в здравом уме, будучи основателем и первым директором Еврейского университета в Иерусалиме и основателем издательства Шокен Букс. Это популярное издательство в дальнейшем было поглощено издательским домом Рандом Хаус.
Δεν τελείωσε το Λύκειο, και πέθανε, σε ηλικία 82 ετών. Ήταν ένας αξιόλογος διανοούμενος, συνιδρυτής και πρώτος Διευθύνων Σύμβουλος του Ευρωπαϊκού Πανεπιστημίου της Ιερουσαλήμ και ιδρυτής της εταιρείας Schocken, ενός αναγνωρισμένου εκδοτικού οίκου που αργότερα εξαγοράστηκε από την Random House.
ted2019
▪ Ежедневно в ЮАР осуждаются 82 ребенка за «изнасилование или словесное оскорбление других детей».
▪ Κάθε μέρα στα δικαστήρια σε όλη τη Νότια Αφρική, 82 παιδιά κατηγορούνται για «βιασμό ή επιθέσεις με ανήθικους σκοπούς σε άλλα παιδιά».
jw2019
Насыщение упало до 82.
Οι ενδείξεις πέφτουν στο 82.
OpenSubtitles2018.v3
Приблизительно 83 процента убитых во время войны были майя, а многие другие представители этого народа стали жертвами нарушений прав человека, совершенных преимущественно правительством Гватемалы и военными.
Περίπου το 83% των ανθρώπων που σκοτώθηκαν κατά τη διάρκεια του πολέμου ήταν Μάγια και πολλοί άλλοι βρέθηκαν θύματα παραβίασης των ανθρώπινων δικαιωμάτων που διαπράχθηκαν κατά κύριο λόγο από την κυβέρνηση της Γουατεμάλα και τον στρατό.
gv2019
В газете «Репубблика» утверждалось, что в неделю опроса 82 процента итальянцев смотрели телевизор, «и они просиживали у экранов в среднем чуть меньше пяти часов» в день.
Στη διάρκεια μιας αντιπροσωπευτικής εβδομάδας, το 82 τοις εκατό των Ιταλών παρακολούθησαν τηλεόραση, «και εκείνοι που παρακολούθησαν ήταν μπροστά στην οθόνη, κατά μέσο όρο, κάτι λιγότερο από πέντε ώρες» την ημέρα, βεβαιώνει η εφημερίδα Λα Ρεπούμπλικα (La Repubblica).
jw2019
83:надписание
83:επιγραφή
jw2019
Как же удивлялись эти люди, читая такие библейские стихи, как Псалом 83:18, где сказано: «Ты, чье имя Иегова, ты один Всевышний над всей землей».
Φανταστείτε, λοιπόν, πόση έκπληξη ένιωθαν όταν διάβαζαν εδάφια όπως το Ψαλμός 83:18, το οποίο λέει: «Εσύ, του οποίου το όνομα είναι Ιεχωβά, είσαι ο μόνος Ύψιστος όλης της γης»!
jw2019
Если вы желаете получить новый выпуск «Пробудитесь!», который издается сейчас на 81 языке, обратитесь к Свидетелям Иеговы, живущим с вами по соседству, или напишите по одному из адресов, указанных на странице 5.
Αν θα θέλατε να λάβετε ένα πρόσφατο αντίτυπο του Ξύπνα!, το οποίο τώρα εκδίδεται σε 81 γλώσσες, παρακαλούμε να έρθετε σε επαφή με τους Μάρτυρες του Ιεχωβά στη γειτονιά σας ή να γράψετε στην πλησιέστερη διεύθυνση από αυτές που υπάρχουν στη σελίδα 5.
jw2019
Нет, на 83 подуровне, в морозилке.
Όχι, στο υπόγειο 83, στο χώρο ψύξης.
OpenSubtitles2018.v3
Господь сказал нам: «Каждому предупрежденному человеку надлежит предупредить ближнего своего» (У. и З. 88:81).
Ο Κύριος μάς έχει πει: «Αρμόζει κάθε άνθρωπος που έχει προειδοποιηθεί να προειδοποιήσει τον πλησίον του» (Δ&Δ 88:81).
81-й, проверьте грузовик.
Βοηθητικό, εσείς το φορτηγό.
OpenSubtitles2018.v3
Аналогичная отметка отсчёта отмечает нулевой километр «Дороги свободы» в городе Сент-Мер Эглиз в Нормандии, рядом с которым была произведена высадка 82-й воздушно-десантной дивизии США во время Второй мировой войны.
Ανάλογο ορόσημο που σηματοδοτεί το χιλιόμετρο μηδέν του «δρόμου της ελευθερίας» υπάρχει στην κωμόπολη Σαιντ Μερ Εγκλίζ της Νορμανδίας, κοντά στην οποία πραγματοποιήθηκε η Απόβαση της Νορμανδίας από τις αερομεταφερόμενες δυνάμεις της 82ης Αερομεταφερόμενης Μεραρχίας των ΗΠΑ στον Β ́ Παγκόσμιο Πόλεμο.
WikiMatrix
По словам Клаудью Умиша, архиепископа города Сан-Паулу, процент католиков среди бразильцев за последние 14 лет уменьшился с 83 до 67.
Σύμφωνα με τον Κλαούντιου Ούμες, αρχιεπίσκοπο του Σάο Πάολο, η αναλογία των Βραζιλιάνων που είναι Καθολικοί μειώθηκε από 83 τοις εκατό σε 67 τοις εκατό τα περασμένα 14 χρόνια.
jw2019
82 7 Иметь детей — ответственность и награда
81 7 Απόκτηση Παιδιών—Ευθύνη Καθώς και Ανταμοιβή
jw2019
В результате любезного интереса со стороны зрелых христианских взрослых людей многие «сироты» превратились в уравновешенные семейные главы (Псалом 81:3).
(Ησαΐας 32:1) Πολλά ‘ορφανά’ έχουν εξελιχθεί σε ισορροπημένες κεφαλές οικογενειών ως αποτέλεσμα του στοργικού ενδιαφέροντος που έδειξε κάποιος ώριμος Χριστιανός ενήλικος.—Ψαλμός 82:3.
jw2019
После этого Создатель, имя которого Иегова, восстановит землю, очистив ее и превратив в рай, где все живое будет процветать (Псалом 82:19, ПАМ; Исаия 35:1, 2).
(Αποκάλυψη 11:18· 2 Τιμόθεο 3:1-5) Στη συνέχεια, ο Δημιουργός, του οποίου το όνομα είναι Ιεχωβά, θα εγκαινιάσει ένα πρόγραμμα αποκατάστασης που θα καθαρίσει ολοκληρωτικά τη γη και θα τη μετατρέψει σε μια παραδεισιακή πηγή ζωής. —Ψαλμός 83:18· Ησαΐας 35:1, 2.
jw2019
На встречу пришло 82 человека, в том числе и губернатор Баия-душ-Тигриш.
Παρευρέθηκαν συνολικά 82 άτομα, περιλαμβανομένου και του ανώτατου διοικητή της χερσονήσου της Τίγρης.
jw2019
Какое же счастливое освобождение настанет для людей, жаждущих мирного, справедливого правления! (Псалом 36:9–11; 82:18, 19).
Τι ευχάριστη ανακούφιση θα φέρει αυτό στους ανθρώπους που ποθούν ειρηνική, δίκαιη διακυβέρνηση!—Ψαλμός 37:9-11· 83:17, 18.
jw2019
Среди всех сотрудников гомосексуалов, лесбиянок и бисексуалов, 83% признаются в том, что каким-то образом изменили себя, чтобы не выглядеть на работе слишком нетрадиционно.
Απ’ όλες τις λεσβίες, τους ομοφυλόφιλους και αμφιφυλόφιλους εργαζόμενους, το 83% παραδέχθηκαν ότι άλλαξαν κάποιες πλευρές του εαυτού τους ώστε να μην φαίνονται «υπερβολικά ομοφιλόφιλοι» στη δουλειά.
ted2019
Список самых популярных запросов:
1K,
~2K,
~3K,
~4K,
~5K,
~5-10K,
~10-20K,
~20-50K,
~50-100K,
~100k-200K,
~200-500K,
~1M
Важное использование ИИ в переводе — AI Time Journal
Из-за глобализации потребность в переводе быстро возросла, например:
- Сферы деятельности: сотрудникам компании требуется перевод для подписания международных контрактов.
- Академические области: студентам, которые учатся за границей, нужен перевод, чтобы понимать сложные статьи.
- Зона развлечений: зрители нуждаются в переводах, чтобы наслаждаться иностранными книгами, видеоиграми и фильмами.
До того, как ИИ стал использоваться, перевод был работой, которая была требует много времени, хорошо оплачивается и требует высокого уровня образования . Благодаря искусственному интеллекту программное обеспечение для перевода превращает перевод в обычную услугу, мгновенную, бесплатную и удобную .
В этой статье мы рассмотрим, что такое машинный перевод, как ИИ улучшает отрасль и почему программное обеспечение на основе ИИ не может заменить людей-переводчиков.
Что такое машинный перевод
Машинный перевод использует программное обеспечение на основе искусственного интеллекта для автоматического перевода языка исходного материала на другой язык без какого-либо вмешательства со стороны человека.
В 1970 году было разработано первое программное обеспечение для машинного перевода. Вначале программное обеспечение было разработано как машинный перевод на основе правил (RBMT), что означает, что результаты перевода были прямыми дословными переводами на основе набора соответствующих языковых словарей и грамматических правил.
Затем программное обеспечение для машинного перевода было преобразовано в Статистический машинный перевод (SMT). К этому времени программное обеспечение стало более интеллектуальным, поскольку оно могло анализировать существующие переводы, сделанные переводчиками-людьми, а затем приступать к предсказанию 9.0013 алгоритмы для создания релевантных для контекста переводов.
В настоящее время программное обеспечение для машинного перевода вступило в новую эру: нейронный машинный перевод (NMT). Ядром Neural Machine Translation является его нейронная сеть, которая наделяет программное обеспечение способностью к самообучению . Таким образом, результаты программного обеспечения NMT более логически соответствуют человеческому языку. В настоящее время NMT является более продвинутой версией программного обеспечения для перевода и активно используется в разговорных переводах 9.0014 .
3 Лучшее программное обеспечение для перевода
Программное обеспечение для перевода становится все более популярным в современном обществе, поскольку оно:
- простое в использовании
- быстрое получение результатов
- приемлемо для различных материалов
- экономично
Google
6 Translate — одна из самых известных на сегодняшний день программ для перевода. Он имеет множество различных версий, которые подходят для разных устройств. Программное обеспечение, работающее на NMT, способно обеспечить высококачественный перевод и принимать все виды материалов, таких как тексты, аудио, изображения или мгновенные изображения с камеры. На данный момент Google Translation может поддерживать 133 языка.
Smartling — еще одна популярная программа для перевода, которая активно используется в бизнесе. Программное обеспечение, основанное на искусственном интеллекте, предоставляет услуги не только для простого перевода текста, но и для перевода контента между устройствами и платформами. В результате программное обеспечение направлено на создание многоканальной культуры бренда и предоставление согласованной информации без ограничения языков . Таким образом, целевыми пользователями Smartling являются не частные лица, а компании и организации, которые ведут переписку с международным бизнесом.
DeepL Translator — это также программа для перевода на базе NMT. Сейчас у него более 1 млн пользователей. Программное обеспечение обещает предоставлять высококачественные переводы, точно понимая тонкий смысл слов и предложений и затем беспрецедентным образом переводя их на целевые языки. Таким образом, DeepL Translator известен как «самый точный и детальный машинный перевод в мире».
Почему ИИ-переводчики не могут заменить людей?
Благодаря приложениям ИИ во многих отраслях начался переход к автоматизации. Эта статья AITJ: 5 рабочих мест, которые ИИ, вероятно, автоматизирует в ближайшие годы, дает четкое представление о будущей тенденции применения технологий на рабочем месте.
В связи с тем, что программное обеспечение на основе ИИ активно используется в переводах, многие люди, особенно сотрудники, которые работают или планируют искать работу в качестве письменных и устных переводчиков, начинают беспокоиться о своем будущем: не займет ли ИИ их работу? Заменят ли их технологии?
Ну, ответ нет . Текущий интеллект ИИ и его способность к переводу не могут полностью справиться с работой по переводу без вмешательства человека.
В настоящее время точность машинного перевода не на идеальном уровне. Результаты, предлагаемые программным обеспечением для перевода, часто содержат много грамматических ошибок, а иногда даже не имеют смысла. На самом деле, версия с автоматическим переводом не должна использоваться ни в каких официальных случаях.
Кроме того, перевод не ограничивается только языками. Культура также влияет на это . По сравнению с машинами, человеческие переводы более уникальны и культурно значимы, поскольку переводы также отражают способ понимания и интерпретации агентами. Другими словами, человеческий интеллект наполнит их перевод живым человеческим опытом и будет способствовать лучшему пониманию целевой аудиторией.
Если вас интересует, какие другие профессии не могут быть заменены ИИ, эта статья AITJ: 4 Карьеры, которые ИИ не может заменить, будет хорошим справочником.
Ифэй Чжао
Автор
Ифэй Чжао окончила Нью-Йоркский университет со степенью магистра в области СМИ, культуры и коммуникации. Она увлечена написанием контента и помогает наладить партнерские отношения для продвижения того, как ИИ приносит пользу и взаимодействует с человеческим обществом.
Наступила эра искусственного перевода речи? | Технология
Шум, по словам Алекса Вайбела, является одной из основных проблем, с которыми приходится сталкиваться искусственному переводу речи. Устройство может распознавать речь в лаборатории или конференц-зале, но ему будет сложно справиться с фоновым шумом, который я слышу вокруг профессора Вайбеля, когда он говорит со мной со станции Киото. Я изо всех сил пытаюсь следовать за ним по-английски, по колючей линии, которая напоминает мне, что нас разделяет почти 10 000 км, и это расстояние по-прежнему является препятствием для общения, даже если вы говорите на одном языке. Мы еще не добрались до будущего.
Если бы мы это сделали, Вайбель мог бы говорить на своем родном немецком, а я мог бы слышать его слова на английском. Он также сможет беспрепятственно и без помощи рук разговаривать с окружающими его японцами, причем все стороны будут говорить на своем родном языке.
В Технологическом институте Карлсруэ, где он является профессором компьютерных наук, Вайбель и его коллеги уже читают лекции на немецком языке, которые их студенты могут читать на английском с помощью электронного переводчика. Система генерирует текст, который учащиеся могут читать на своих ноутбуках или телефонах, поэтому этот процесс чем-то схож с созданием субтитров. Помогает то, что лекторы говорят четко, им не приходится конкурировать с фоновой болтовней, и они говорят одно и то же каждый год.
Идея искусственного перевода речи существует уже давно. Вайбель, который также является профессором компьютерных наук в Университете Карнеги-Меллона в Питтсбурге, «вроде изобрел это. Я предложил его в MIT [Массачусетский технологический институт] в 1978 году». Дуглас Адамс изобрел его примерно в то же время. В «Путеводителе автостопом по Галактике» фигурирует форма жизни, называемая вавилонской рыбой, которая, будучи помещенной в ухо, позволяет слушателю понимать любой язык во Вселенной. Он стал представлять собой одно из тех устройств, о которых мечтают энтузиасты технологий задолго до того, как они станут практически осуществимыми, как портативные голосовые коммуникаторы и телевизоры, достаточно плоские, чтобы их можно было повесить на стены: вещь, которая должна существовать, и однажды обязательно будет.
Первая система речевого перевода Вайбеля, собранная в 1991 году, имела словарь из 500 слов, работала на больших рабочих станциях и требовала несколько минут для обработки услышанного. «Он не был готов к прайм-тайму», — признает он. Теперь начали появляться устройства, которые выглядят как прототипы вавилонских рыб, оседлав волну достижений в области искусственного перевода и распознавания голоса. Google включил функцию перевода в свои наушники Pixel с помощью Google Translate, который также может выполнять голосовой перевод через приложение для смартфона. В Skype есть функция переводчика, которая обрабатывает речь на 10 языках. Ряд небольших компаний, таких как бруклинский стартап Waverly Labs, разработали трансляторы для наушников. Обзоры в технических СМИ можно с полным основанием охарактеризовать как «на самом деле неплохо».
Доступные в настоящее время системы предлагают доказательство концепции, но на данном этапе они кажутся привлекательными новинками, а не шагами к тому, что Вайбель называет «созданием общества, прозрачного для языка».
Одной из главных движущих сил искусственного перевода речи является мода на поощрение людей говорить с их технологиями.
«Мы, как правило, находимся очень рано в парадигме голосовых устройств, — говорит Барак Туровский, директор по продукту Google Translate, — но она очень быстро растет, и перевод будет одной из ключевых частей этого пути».
В прошлом месяце Google представил режим переводчика для своих домашних устройств. Сказав: «Эй, Google, будь моим переводчиком французского», вы активируете разговорный, а на умных дисплеях — текстовый перевод. Google предлагает регистрацию в отеле в качестве возможного приложения — возможно, очевидный пример практической альтернативы разговору на английском языке путешественников, будь то родной или дополнительный язык.
Вы уже можете сделать это, если у вас есть приложение «Переводчик» на вашем телефоне, хотя и с неудобно маленьким экраном и динамиком. Такого рода простое публичное взаимодействие объясняет широкое использование функции бесед приложения. Но еще одно популярное приложение — это то, что Туровский называет «романтика». Журналы данных показывают популярность таких утверждений, как «Я люблю тебя» и «У тебя красивые глаза». Многое из этого может не представлять ничего нового. В конце концов, фразы для чата десятилетиями были стандартным содержанием разговорника.
Waverly Labs использовала функцию чата в качестве приманки для своей кампании по финансированию Indiegogo, с видео, в котором основатель и генеральный директор компании Эндрю Очоа рассказывает, как ему пришла в голову идея переводчика, когда он встретил француженку на отдыхе. но не мог нормально с ней общаться. Попытка использовать приложение для перевода была «ужасной». Телефоны мешают, но наушники не мешают. На видео видно, что могло бы быть: он дарит француженке наушник, и они идут пить кофе и осматривать достопримечательности. Подача была впечатляюще успешной, собрав 4,4 миллиона долларов (3,4 миллиона фунтов стерлингов) — в 30 раз больше запланированного.
Наушник Pilot от Waverly Labs (красный и белый) и наушники Pixel от Google (черные). Фотография: Observer Design desk
Один клиент сказал, что наушник Pilot позволил ему впервые поговорить с матерью своей девушки. Некоторые даже сообщают, что это позволило им поговорить со своими супругами. «Время от времени мы получаем электронное письмо от кого-то, кто говорит, что использует это, чтобы поговорить со своей испаноязычной женой», — говорит Очоа. «Меня сбивает с толку, как они вообще вообще собрались вместе!» Мы можем предположить, что это было через Интернет и агентство. Очоа признает, что «технология должна немного улучшиться, прежде чем вы действительно сможете найти любовь через наушник, но это не так уж и далеко».
Многие из первых пользователей используют наушники Pilot в совершенно неромантических целях, приобретая их для использования в организациях. В настоящее время Waverly готовит новую модель для профессиональных приложений, которая влечет за собой повышение производительности распознавания речи, точности перевода и времени, необходимого для произнесения переведенной речи. «Профессионалы менее склонны быть терпеливыми в разговоре», — замечает Очоа.
Новая версия также будет иметь улучшенный гигиенический дизайн, чтобы устранить наименее привлекательную особенность Pilot. Для разговора у обоих динамиков должны быть в ушах Пилоты. «Мы обнаружили, что использование одного из наушников с незнакомцем создает барьер», — говорит Очоа. Это не могло быть совершенно неожиданным. Проблема была бы решена, если бы наушники-переводчики стали настолько распространены, что у незнакомцев, вероятно, уже были бы свои собственные в ушах. Произойдет ли это и как быстро, вероятно, будет зависеть не столько от самих наушников, сколько от распространенности устройств с голосовым управлением и искусственного перевода в целом.
Здесь основной движущей силой является доступ к развивающимся азиатским рынкам. Google подсчитал, что 50% контента в Интернете написано на английском языке, но только 20% населения мира говорит на этом языке.
«Если вы посмотрите на регионы, где наблюдается значительный рост использования Интернета, например, в азиатских странах, то вы увидите, что большинство из них вообще не знают английского языка, — говорит Туровский. «Поэтому в этом отношении преодоление языковых барьеров является важной целью для всех — и, очевидно, для Google. Вот почему Google вкладывает так много ресурсов в системы перевода».
Вайбель также подчеркивает важность Азии, отмечая, что голосовой перевод действительно популярен в Японии и Китае. Однако впереди еще долгий путь. Перевод должен быть синхронным, как голос переводчика, говорящего по телевизору за иностранным политиком, а не пакетами, которые заставляют говорящих делать паузу после каждых нескольких замечаний и ждать, пока перевод будет доставлен. Он должен работать в автономном режиме в ситуациях, когда доступ в Интернет невозможен, а также для решения проблем, связанных с объемом личных речевых данных, которые накапливаются в облаке и отправляются на серверы для обработки.
Системы должны не только справляться с физическими проблемами, такими как шум, предполагает Вайбел, им также необходимо быть социально осведомленными — знать свои манеры и обращаться с людьми соответствующим образом. Когда я впервые написал ему по электронной почте, зная, что он немецкий профессор и что континентальные традиции требуют торжественного уважения к академическому статусу, я ошибся в сторону формальности и обратился к нему «Уважаемый профессор Вайбель». Как я и ожидал, он ответил на международном английском языке: «Привет, Марек». Чувствительные к этикету искусственные переводчики могли бы избавить людей от необходимости знать о различных культурных нормах. Они будут способствовать взаимодействию, уменьшая понимание. В то же время они могут помочь сохранить местные обычаи, замедлив распространение привычек, связанных с международным английским языком, таких как его готовность идти на контакт.
Тем не менее, профессора и другие специалисты не будут передавать знание языка программному обеспечению. Если технология превратится в бесшовный, вездесущий искусственный перевод речи — короче говоря, вавилонская рыба, — она действительно повысит ценность языковых навыков. Автоматический перевод предоставит товарный продукт: базовую, практическую, не престижную информацию, которая поможет людям покупать вещи или ориентироваться. Поможет ли это людям вести семейную жизнь или романтические отношения, остается под вопросом, хотя одна заслуживающая внимания возможность заключается в том, что это может преодолеть языковые барьеры, которые часто возникают между поколениями после миграции, оставляя детей, их бабушек и дедушек без общего языка.
Для чего бы он ни использовался, он никогда не будет так же хорош, как настоящий. Даже если технология преобразования голоса имитирует голос говорящего, движения его губ не будут совпадать, и они будут выглядеть так, как будто они в дублированном фильме.
Контраст подчеркнет ценность общих языков и ценность их изучения. Попытка выучить чей-то язык является признаком приверженности и, следовательно, доверия. Общий язык также может способствовать чувству принадлежности и общности, как в случае с международными учеными, которые используют английский язык в качестве лингва-франка, тогда как их предшественники использовали латынь. Владельцы магазинов-иммигрантов, изучающие язык своих покупателей, не только облегчают продажи; они показывают, что хотят стать ближе к сообществу своих клиентов, и вежливо отстаивают свое место в нем.
Когда машинный перевод станет повсеместным товаром, знание человеческого языка будет цениться выше. Человек, у которого в голове есть язык, всегда будет иметь преимущество перед тем, кто полагается на устройство, точно так же, как человек, умеющий считать, имеет преимущество перед тем, кому приходится тянуться к калькулятору. Хотя практическая потребность в lingua franca уменьшится, социальная ценность совместного использования одного языка сохранится. И программное обеспечение никогда не заменит тонкое, но жизненно важное понимание, которое приходит со знанием языка.