Особенности локализации сайтов
Начнем с занимательной статистики: каждую секунду на планете появляется 15 новых сайтов. Пока вы читали предыдущее предложение, появилось уже 30 сайтов, и часть из них надо перевести как минимум на один язык.
- С чего начать?
- Лингвистические вопросы
- На какие языки переводим и на какую страну ориентируемся?
- Какой контент нужно локализовать?
- Есть ли глоссарии и руководство по стилю?
- Технические вопросы
- Проведение аудита сайта и оценка возможности CMS
- Выяснить, кто будет внедрять перевод и проводить тестирование
- Обсуждение вопросов SEO для иноязычных версий
- Начинаем локализацию
- СAT-система
- Руководство по стилю
- Глоссарии
- Примеры неудачных локализаций
- Локализация только одной страницы
- Проблема шрифтов
- Неоднородность терминологии
- Важность тестирования
- Перевод непереводчиком
Рынок локализации сайтов огромен даже с учетом того, что некоторые владельцы сайтов предпочтут гугл-переводчик добротной локализации. Любой переводчик может стать частью этого рынка – статистика на вашей стороне.
Локализация сайта – комплексный и трудоемкий процесс. Фундамент хорошей локализации закладывается на этапе подготовки. Именно этой теме и посвящена статья: мы расскажем том, какие моменты стоит предусмотреть перед началом работы.
С чего начать?
Локализация сайта начинается с подготовительного этапа, во время которого локализатор и заказчик обсуждают принципиально важные для качественной локализации моменты. Вопросы, которые стоит прояснить перед началом работы, условно можно разделить на лингвистические и технические.
Лингвистические вопросы
Для начала рассмотрим лингвистические вопросы.
На какие языки переводим и на какую страну ориентируемся?
Вопрос актуален, если сайт локализуется не для глобальной аудитории, а для отдельной страны/конкретного региона. Редкий заказчик заранее знает, что английских языков в мире больше, чем один: есть британский, американский, индийский, южноафриканский варианты английского.
Немецкий язык тоже не один – в Австрии у него свои особенности, в Швейцарии свои. Французских языков тоже много, особенно в африканских странах. Диалектов арабского и китайского языков также немало.
Какой контент нужно локализовать?
Не весь сайт нуждается в переводе. Есть контент, который не локализуется, потому что он недоступен для иностранного клиента или неинтересен ему.
Допустим, нужно перевести сайт российской компании на китайский язык. В ходе разговора с клиентом выясняется, что часть своей продукции компания не экспортирует в Китай. Очевидно, информацию об этой продукции переносить в китайскую версию сайта не нужно.
Другой пример. К вам обратился клиент, который производит дачную мебель. На сайте компании клиент ведет блог, где каждые два дня публикует новость в стиле “нашей мебелью пользуется губернатор” или “наша продукция заняла первое место на выставке в тульской области”. Переводить эти новости для иноязычного сайта нет смысла: они несут ценную информацию только для российского покупателя, в то время как потенциальный клиент из Германии не сможет по заслугам оценить эти достижения.
Есть ли глоссарии и руководство по стилю?
К локализации сайта можно приступать только после того, как разработаны глоссарий и руководство по стилю.
Подробно про глоссарий и руководство по стилю расскажем во второй половине статьи.
Технические вопросы
Локализация предполагает работу не только с переводом, но и с технической стороной сайта. Итак, рассмотрим, что предстоит сделать локализатору с технической точки зрения.
Проведение аудита сайта и оценка возможности CMS
Перед локализацией нужно проверить, корректно ли работает сайт. Если сайт находится в разрушенном состоянии, – есть вирусы, ссылки ведут не туда или выдают ошибку 404, – то он не готов к локализации.
Аудит нужен и для того, чтобы оценить объем работы. Иногда хозяин сайта сам не знает, что лежит у него на сайте: контента может оказаться больше, чем он себе представляет. На сайте могут быть скрытые файлы для скачивания, видео, контент, доступный только по ссылкам. Если вы нашли подобные материалы, и они не указаны в техническом задании, об этом нужно уведомить заказчика.
В случае с CMS (система управления контентом) нужно проверить, может ли она выгрузить контент для перевода и загрузить уже переведенные части так, чтобы переведенный контент размещался в местах, соответствующих местам размещения оригинального контента.
Выяснить, кто будет внедрять перевод и проводить тестирование
Посмотреть, как CMS выгружает контент, можно на этапе внедрения и тестирования перевода. Выше мы упомянули, что контент может выгружаться не на свои места: так может получиться из-за того, что содержимое сайта переводится в СAT-программах. Блоки, которые на сайте идут друг за другом, в “кошке” часто разносятся по отдаленным сегментам. Это не мешает переводу, но при выгрузке на сайт может получиться так, что блоки перемешаются и встанут не на свои места.
Нужно также выяснить, будет ли у вас доступ к админке сайта для тестирования внедренного перевода или этим будет заниматься отдельный человек. Если доступа к тестированию не дадут, с ответственным за тестирование человеком вы будете работать в тесном контакте.
Обсуждение вопросов SEO для иноязычных версий
Семантическое ядро для каждой языковой версии сайта не переводится, а делается с нуля – об этом нужно заранее предупредить заказчика. Просто перевести сниппеты, ключевые слова, семантическое ядро не получится. Цена ошибки с SEO высока – сайт не будет выходить в поисковой выдаче.
Например, семантическое ядро для сайта по продаже памперсов будет сильно отличаться для британского и американского вариантов английского языка. Американцы будут искать памперсы по слову diaper, а британцы по слову nappy.
Начинаем локализацию
В этом разделе расскажем об инструментах и ресурсах, которые нужно иметь для локализации сайта.
СAT-система
Локализатору обязательно нужна CAT-программа – без этого инструмента работа над локализацией невозможна.
CAT локализатора должна иметь:
- Плагины для CMS
Редкий заказчик будет выгружать контент с сайта в файл Word. Контент выгружает сам локализатор с помощью CAT-системы, которая должна иметь специальные плагины или возможность интеграции с CMS сайта – это позволит “подцепиться” к сайту, вытянуть оттуда контент для перевода и после загрузить его на сайт.
Часто контент на сайте появляется очень быстро, и перевести его нужно буквально в течение часа. Это возможно, если CAT умеет автоматически подтягивать новые задачи.
- Возможность расширенной настройки QA (контроля качества)
Для того чтобы свести ошибки к нулю, стоит позаботиться о расширенной настройке QA в “кошке.” CAT умеют вылавливать специфические именно для локализации ошибки: длину переводов в целевом сегменте, огрехи пунктуации, неправильно расставленные теги.
- Поддержку глоссариев сложной структуры.
Глоссарий локализационного проекта сложнее переводческого глоссария, который обычно состоит из таблицы “оригинал-перевод”. Панель выдачи результатов из глоссария должна предоставлять вам доступ к максимально подробной информации по термину, а не только к его переводу. Чем более развернутая информация вам доступна, тем меньше возможности ошибиться.
- Корректную поддержку файлов разных форматов (xml, json, po и т.д.)
Проблема может возникнуть при работе с языками со специфической графикой (с языками юго-восточной Азии, арабским, ивритом и т.д.). Файлы с такими языками могут поддерживаться некорректно из-за специфики кодировок: в итоге на сайт вместо переведенного текста может выгрузиться набор непонятных символов.
- Возможность проверки орфографии с учетом локали ТМ
По умолчанию в редакторах стоит американская проверка правописания. Но как проверить орфографию, пунктуацию и словоупотребление для сайта, который ориентирован, например, на Индию? Ведь как мы уже выяснили в начале статьи, английских языков больше, чем один.
Для того чтобы проверить правописание и словоупотребление для любой локали, система CAT должна поддерживать разные системы проверки грамматики.
- Автоматизация требований руководств по стилю
Стайлгайд состоит из сотен страниц рекомендаций. Однако когда сроки ограничены, а работы много, у локализаторов не остается времени на то, чтобы искать информацию в них. Поэтому, чтобы избежать критических расхождений с руководством по стилю, ключевые рекомендации из него должны быть внесены в CAT.
Руководство по стилю
Стайлгайд облегчает работу локализаторов. Вот что в нем должно содержаться:
- Справочные материалы
Это могут быть ранее переведенные материалы или материалы на исходном языке. Иногда качество ранее переведенных материалов оставляет желать лучшего: в таком случае от их использования лучше отказаться.
- Краткое описание аудитории сайта
Важно понимать, для кого переводится сайт, ведь от этого зависит то, какая лексика будет использоваться при переводе. Например, детский сайт будет значительно отличаться по лексике и стилю от сайта, нацеленного на взрослую аудиторию.
- Особенности правописания как дополнение к глоссарию
Некоторые слова имеют два варианта правописания, например ice-cream и ice cream. Оба варианта правильные, но нужно решить, какой вариант будет употребляться в локализации.
- Нормы словоупотребления, грамматики, пунктуации
Нормы словоупотребления, грамматики и пунктуации будут зависеть от локали. Мы уже выяснили, что британское и американское словоупотребление не всегда совпадают. Грамматика и пунктуация также могут “плавать” в зависимости от региона.
- Тональность текста
От тональности текста зависит то, какие эмоции он вызывает у читателя. Задача локализатора в том, чтобы перевести текст в нужной заказчику тональности.
Глоссарии
Без глоссария не начинается ни один локализационный проект.
- Глоссарий создается под конкретный локализационный проект.
Не существует универсального локализационного глоссария. Это правило работает и для проектов из одной сферы: при локализации, например, двух интернет-магазинов, для каждого потребуется отдельный глоссарий.
- Термины, содержащиеся в глоссарии.
Глоссарий состоит из трех терминологических слоев: корпоративные термины, отраслевые термины и термины, специфические для аудитории сайта.
Корпоративные термины специфичны только для этой компании. Может быть так, что одно и то же устройство в разных компаниях называется по-разному. Например, одно и то же устройство, контроллер, в xbox и Playstation называется по-разному: у xbox – геймпад, у Playstation – контроллер.
Примеры неудачных локализаций
Предлагаем посмотреть на примеры сайтов, в локализации были допущены ошибки той или иной степени тяжести.
Локализация только одной страницы
Часто владельцы сайтов подходят к локализации формально. Яркий пример подобного подхода – перевод только главной страницы сайта. Остальные страницы остаются на основном языке, и при переходе с английской версии страницы открываются страницы на русском языке.
Проблема шрифтов
При локализации могут страдать шрифты. Шрифт может не иметь кириллического варианта, поэтому надписи на русском будут стилистически выбиваться среди латиницы. Пример подобного рода недоработки можно увидеть на странице выбора местонахождения финской авиакомпании Finnair. Кириллический шрифт слова “Россия” выбивается из общего стиля шрифтов, локализация выглядит небрежно.
Проблема решается подбором шрифта, доступного и для кириллицы, и для латиницы.
Неоднородность терминологии
Выше мы писали о важности глоссария и предыдущих переводов. Но бывает, что в разных источниках приводятся разные варианты перевода.
В глоссарии может быть сказано, что backup надо переводить как резервное копирование. В предыдущих переводах может использоваться слово “бэкап”, а в translation memory могут приводиться оба варианта. На картинке ниже мы видим, что переводчик решил использовать все варианты перевода. Так делать не стоит: возникает ощущение, что бэкап и копирование – это разные вещи.
Важность тестирования
На картинке мы видим, что левая кнопка осталась непереведенной. Так получилось из-за того, что платформа сайта не позволяет извлечь все данные для перевода. Эта недоработка еще раз подтверждает важность тестирования перевода после внедрения: если бы оно проводилось полноценно, то ошибку бы заметили и исправили.
Перевод непереводчиком
Некоторые владельцы сайтов предпочитают не тратиться на локализаторов и переводят сайты с помощью онлайн-переводчиков. Вот пример подобного подхода.
Текст “зарезервировать сейчас” вышел за рамки кнопки. Это произошло из-за дословного перевода. В англоязычной версии сайта на кнопке значится короткая надпись "book now".
Слово reservations переведено как “резервация”, что неверно и ассоциируется с местами содержания индейцев в Америке.
“Зарезервировать Сейчас” – ошибка написания.
Локализация и перевод сайтов – интереснейший процесс, в котором множество нюансов. При должной подготовке к нему вы избежите многих ошибок, которые допускают неопытные локализаторы. Надеемся, эта статья поможет вам в этом.
Узнать больше о локализации сайтов вы можете на нашем курсе "Практический курс: введение в IT-перевод".
Комментарии
Добавить комментарий
Для того, чтобы оставить комментарий, Вам необходимо зарегистрироваться на сайте