Сможет ли машинный перевод заменить переводчиков?
Сегодня, когда искусственный интеллект с каждым днём совершенствуется, а разработчики каждые несколько месяцев представляют очередную программу машинного перевода, результаты которой «почти неотличимы от переводов, выполненных человеком», у специалистов в сфере перевода невольно возникает вопрос – исчезнет ли профессия переводчика или у нас всё же есть будущее?
- Основные этапы развития машинного перевода
- Перевод на основе правил
- Статистический перевод
- Машинный перевод с использованием нейронных сетей
- Недостатки машинного перевода
- Машина не умеет распознавать и исправлять ошибки
- Машины переводят слова, а люди передают смыслы
- Алгоритмы не справляются с переводом эмоционально окрашенных текстов
- Машины почти не видят различий между омонимами
- Алгоритмы не могут осознать контекстуальную связь между словами в больших лингвистических единицах
- Будущее машинного перевода
Машинный перевод, несмотря на постоянное развитие, до сих пор несовершенен. Программисты пытаются устранить языковые барьеры уже более 60 лет, с тех пор, как изобрели первые прототипы машинного перевода.
Основные этапы развития машинного перевода
Об истории развития машинного перевода прекрасно пишет IT-блогер Вастрик. Его исследование читается на одном дыхании, как детектив. Для целей же нашей статьи будет достаточно упомянуть основные этапы развития машинного перевода.
Перевод на основе правил
По такому принципу работали первые системы МП. Их главный недостаток – машина переводит слишком дословно, не отклоняясь от заданных параметров и использует синонимы, из-за чего перевод оказывается неверным.
Помните подборки нелепых переводов в меню ресторанов? «Человек идти трясти» (mango shake в оригинале), «некрасивый соевый творог» (перевод в меню китайского ресторана) и т.д – результат работы МП на основе правил.
Статистический перевод
В настоящее время на серверы загружено огромное количество параллельных текстов (на разных языках), оформленных в параллельный корпус – оригинальный текст и его перевод на другой язык выровнены так, чтобы фрагменты оригинала совпадали с фрагментами перевода.
Система находит уже переведённое ранее часто встречающееся соответствие, и выдаёт эквивалент. Проблема здесь в том, что наиболее частый вариант перевода не всегда подходит по смыслу исходника.
Пример: машинный перевод фразы Big Smoke! It’s me, Carl, chill! Chill!
Алгоритм подобрал неверное значение слова chill (в данном случае «остынь», «успокойся»), выбрав более часто встречающееся значение «холод».
Машинный перевод с использованием нейронных сетей
Внедрение искусственного интеллекта и нейросетей в системы машинного перевода заметно повысило его качество.
Нейросеть повторяет принципы работы нейросистемы человека – в ней есть связи и нейроузлы, система способна анализировать полученные ранее результаты и обучаться. В последние несколько лет алгоритмы Google и Яндекс научились согласовывать падежи, отчасти угадывать контекст и даже придумывать слова.
Недостатки машинного перевода
С распространением нейронных сетей мы всё чаще слышим, что у переводческой профессии нет будущего. Но есть несколько недостатков машинного перевода, из-за которых он не может заменить «живого» переводчика.
Машина не умеет распознавать и исправлять ошибки
Если в исходнике есть ошибки в терминах, противоречивые утверждения и ошибки в числах, машинный переводчик просто скопирует ошибку в переводе, тогда как человек способен уточнить спорные моменты с заказчиком и исправить неточность.
Машины переводят слова, а люди передают смыслы
Машинные переводчики действуют по принципам, заложенным разработчиками, и переводят слова с одного языка на другой согласно грамматическим правилам. Но перевод – это передача смыслов, а не слов, и в этом плане машина сильно уступает мозгу переводчика.
Алгоритмы не справляются с переводом эмоционально окрашенных текстов
При работе с маркетинговыми, рекламными материалами речь идёт скорее не о переводе, а о «транскреации» – переводчику нужно найти эквивалент в языке перевода, а порой использовать другие слова и конструкции, которые вызовут те же эмоции, что и оригинал.
Системам машинного перевода это пока не под силу, и вряд ли это станет возможным в ближайшей перспективе.
Пример: слоган Coca-Cola – The Coke side of life — «Всё будет Кока-кола».
Смысл оригинального слогана в отсылке к поговорке sunny side of the road | sunny side of life. В русском языке есть похожее выражение – «светлая сторона» жизни. И более распространённая фраза «всё будет хорошо». Кола здесь ассоциируется с чем-то хорошим, в итоге получаем слоган – «Всё будет Кока-кола».
Сложно представить, чтобы даже современная нейронная сеть могла провести такие аналогии и выдать похожий результат.
Машины почти не видят различий между омонимами
Мы определяем значения омонимов по контексту: ласка (пушистый зверёк) – ласка (проявление нежности); ручка (ребёнка) – ручка (шариковая, перьевая) – ручка (дверная). Машины иногда определяют значение верно, но часто ошибаются.
Пример: перевод стихотворения с омонимами в Google переводчике.
Переводить поэзию с помощью машины – не самая удачная идея, но мы делаем это, чтобы доказать, что алгоритм не различает контекст и передаёт разные смыслы в исходном языке с помощью одного смысла в языке перевода.
К слову, Яндекс.Переводчик справился чуть лучше – «стих» в случае с лопнувшим мячиком он перевёл поэтически will die, а вот разные смыслы слова «камерный” различать пока не научился.
Алгоритмы не могут осознать контекстуальную связь между словами в больших лингвистических единицах
Объяснение термина может содержаться на следующей странице, в нескольких фразах из разных частей текста, а иногда даже в другом документе, на который ведёт ссылка. Машины пока не могут видеть связь между такими терминами и всем текстом.
Будущее машинного перевода
В целом, машинный перевод сейчас и в обозримом будущем остаётся лишь вспомогательным средством для переводчика. Несмотря на заверения Google, Яндекс, PROMT и других разработчиков «умных» систем перевода, машинный перевод – не готовый к использованию полноценный продукт, а только инструмент.
Причём инструмент скорее для «базового пользователя» иностранного языка, а не для профессионального переводчика. Мы уже говорили о том, что переводчику проще перевести технический, медицинский или юридический текст с нуля, чем редактировать «суррогат», переведенный алгоритмом.
Иными словами, машина может заменить вас только в том случае, если вы сами переводите, как машина.
Комментарии
Добавить комментарий
Для того, чтобы оставить комментарий, Вам необходимо зарегистрироваться на сайте