Интернационализация и локализация - Википедия - Internationalization and localization

Скриншот TDE программное обеспечение, в основном локализованное на Китайский традиционный).

В вычисление, интернационализация и локализация (Американец ) или же интернационализация и локализация (BrE ), часто сокращенно i18n и L10n,[нужна цитата ] являются средством адаптации компьютерное программное обеспечение к разным языкам, региональным особенностям и техническим требованиям целевого региона.[1] Интернационализация - это процесс разработки программного приложения, позволяющего адаптировать его к различным языкам и регионам без технических изменений. Локализация - это процесс адаптации интернационализированного программного обеспечения для определенного региона или языка путем перевода текста и добавления регион -специфические компоненты. Локализация (которая потенциально выполняется несколько раз для разных языков) использует инфраструктуру или гибкость, обеспечиваемую интернационализацией (которая в идеале выполняется только один раз перед локализацией или как неотъемлемая часть текущей разработки).[2]

Именование

Термины часто сокращаются до нумеронимы i18n (куда 18 обозначает количество букв между первыми я и последнее п в слове интернационализация, использование придумано в Корпорация цифрового оборудования в 1970-х или 1980-х)[3][4] и L10n за локализация, из-за длины слов.[5][6] Некоторые авторы пишут последнюю аббревиатуру с заглавной буквы, чтобы помочь различить их.[7]

Некоторые компании, например IBM и Oracle, используйте термин глобализация, g11n, для сочетания интернационализации и локализации.[8]

Microsoft определяет интернационализацию как сочетание готовности к миру и локализации. Мировая готовность - это задача разработчика, которая позволяет использовать продукт с несколькими скриптами и культурами (глобализация) и разделять ресурсы пользовательского интерфейса в локализуемом формате (локализуемость, сокращенно L12y).[9][10]

Hewlett Packard и HP-UX создал систему под названием «Поддержка национальных языков» или «Поддержка родных языков» (NLS) для производства локализуемого программного обеспечения.[1]

Объем

Процесс интернационализации и локализации
(на основе графика из ЛИЗА интернет сайт)

В соответствии с Программное обеспечение без границ, аспекты дизайна, которые следует учитывать при интернационализации продукта, включают «кодирование данных, данные и документацию, построение программного обеспечения, поддержку аппаратных устройств, взаимодействие с пользователем»; в то время как ключевые области проектирования, которые следует учитывать при создании полностью интернационализированного продукта с нуля, - это «взаимодействие с пользователем, разработка алгоритмов и форматы данных, программные услуги, документация».[1]

Перевод, как правило, является наиболее трудоемким компонентом языковая локализация.[1] Это может включать:

  • Для фильмов, видео и аудио - перевод произнесенных слов или музыкальных текстов, часто с использованием дубляж или же субтитры
  • Перевод текста для печатных материалов, цифровых носителей (возможно, включая сообщения об ошибках и документацию)
  • Возможное изменение изображений и логотипов, содержащих текст, с целью включения переводов или общих значков[1]
  • Различная длина перевода и различия в размерах символов (например, между Латинский алфавит буквы и китайские иероглифы ) может привести к тому, что макеты, которые хорошо работают на одном языке, плохо работают на других[1]
  • Учет различий в диалект, регистр или же разнообразие[1]
  • Правила написания, такие как:

Стандартные данные локали

Компьютерное программное обеспечение могут столкнуться с различиями, выходящими за рамки простого перевода слов и фраз, поскольку компьютерные программы могут динамически генерировать контент. Эти различия, возможно, необходимо будет учесть в процессе интернационализации при подготовке к переводу. Многие из этих различий настолько регулярны, что преобразование между языками можно легко автоматизировать. В Общий репозиторий данных локали к Unicode предоставляет набор таких различий. Его данные используются крупными операционные системы, включая Майкрософт Виндоус, macOS и Debian, а также крупными интернет-компаниями или проектами, такими как Google и Фонд Викимедиа. Примеры таких различий включают:

  • Разные «сценарии» в разных системы письма использовать разные символы - другой набор букв, силлограмм, логограмм или символов. Современные системы используют Unicode стандарт для представления множества разных языков с помощью одного кодировка символов.
  • Направление письма слева направо в большинстве европейских языков, справа налево на иврите и арабском языке или и то и другое в бустрофедон скрипты и, возможно, вертикальные на некоторых азиатских языках.[1]
  • Сложный текстовый макет, для языков, где символы меняют форму в зависимости от контекста
  • Использование заглавных букв присутствует в некоторых скриптах, но не в других.
  • У разных языков и систем письма разные сортировка текста правила
  • У разных языков разные системы счисления, который может потребоваться поддержка, если Западные арабские цифры не используются
  • В разных языках действуют разные правила множественного числа, что может усложнять программы, динамически отображающие числовое содержимое.[11] Другие правила грамматики также могут отличаться, например родительный падеж.
  • В разных языках используются разные знаки препинания (например, текст цитируется в двойные кавычки (""), как на английском языке, или гильеметы («») Как по-французски)
  • Горячие клавиши можно использовать только кнопки на самом деле раскладка клавиатуры который локализуется для. Если ярлык соответствует слову на определенном языке (например, Ctrl-s означает «сохранить» на английском языке), возможно, его необходимо изменить.[12]

Национальные съезды

В разных странах существуют разные экономические соглашения, включая различия в:

В частности, США и Европа различаются по большинству этих случаев. За одним из них часто следуют и другие области.

Конкретные сторонние сервисы, такие как онлайн-карты, прогнозы погоды или поставщики платежных услуг, могут быть недоступны по всему миру у одних и тех же операторов связи или вообще.

Часовые пояса варьируются в зависимости от мира, и это необходимо учитывать, если изначально продукт взаимодействовал с людьми только в одном часовом поясе. Для интернационализации универсальное глобальное время часто используется для внутреннего использования, а затем преобразуется в местный часовой пояс для отображения.

В разных странах действуют разные юридические требования, например:

При локализации также могут учитываться культурные различия, например:

Бизнес-процесс интернационализации программного обеспечения

Чтобы интернационализировать продукт, важно посмотреть на множество рынков, на которые продукт может выйти.[1] Подробности, такие как длина поля для почтовых адресов, уникальный формат адреса, возможность сделать поле почтового индекса необязательным для адресации стран, у которых нет почтовых индексов, или поле штата для стран, у которых нет штатов, а также введение новой регистрации потоки, соблюдающие местные законы, - это лишь некоторые из примеров, которые делают интернационализацию сложным проектом.[7][16] Более широкий подход учитывает культурные факторы, касающиеся, например, адаптации логики бизнес-процесса или включения индивидуальных культурных (поведенческих) аспектов.[1][17]

Уже в 1990-х годах такие компании, как Бык использовал машинный перевод (Систран ) в больших масштабах, для всей своей переводческой деятельности: переводчики-люди занимались предварительным редактированием (делая ввод машиночитаемым) и постредактирование.[1]

Инженерное дело

Как при реинжиниринге существующего программного обеспечения, так и при разработке нового интернационализированного программного обеспечения, первым шагом интернационализации является разделение каждой потенциально зависящей от локали части (будь то код, текст или данные) в отдельный модуль.[1] Затем каждый модуль может полагаться на стандартную библиотеку / зависимость или независимо заменяться по мере необходимости для каждой локали.

В настоящее время преобладает практика, когда приложения помещают текст в строки ресурсов, которые загружаются во время выполнения программы по мере необходимости.[1] Эти строки, хранящиеся в файлах ресурсов, относительно легко перевести. Программы часто создаются для ссылки на библиотеки ресурсов в зависимости от выбранных данных локали.

Хранилище для переводимых и переводимых строк иногда называют каталогом сообщений.[1] поскольку строки называются сообщениями. Каталог обычно содержит набор файлов в определенном формате локализации и стандартную библиотеку для обработки указанного формата. Один библиотека программного обеспечения и формат, который помогает этому gettext.

Таким образом, чтобы приложение поддерживало несколько языков, нужно спроектировать приложение так, чтобы оно выбирало соответствующий файл языковых ресурсов во время выполнения. Код, необходимый для управления проверкой ввода данных и многих других типов данных, зависящих от языкового стандарта, также должен поддерживать различные требования к языку. Современные системы разработки и операционные системы включают сложные библиотеки для международной поддержки этих типов, см. Также Стандартные данные локали над.

Многие проблемы локализации (например, направление письма, сортировка текста) требуют более серьезных изменений в программном обеспечении, чем перевод текста. Например, OpenOffice.org это достигается с помощью переключателей компиляции.

Процесс

После планирования метод глобализации включает три этапа реализации: интернационализацию, локализацию и обеспечение качества.[1]

В некоторой степени (например, для гарантия качества ), в команды разработчиков входит тот, кто занимается основными / центральными этапами процесса, который затем включает все остальные.[1] Такие люди обычно понимают иностранные языки и культуры и имеют некоторый технический опыт. Специализированные технические писатели должны создать синтаксис, приемлемый для потенциально сложных концепций, в сочетании с инженерными ресурсами для развертывания и тестирования элементов локализации.

После правильной интернационализации программное обеспечение может полагаться на более децентрализованные модели для локализации: бесплатное программное обеспечение с открытым исходным кодом обычно полагаются на самостоятельную локализацию конечными пользователями и волонтерами, иногда организованную в группы.[18] В KDE3 проект, например, переведен более чем на 100 языков;[19] MediaWiki на 270 языках, из которых 100 в основном завершены по состоянию на 2016 год.[20]

При переводе существующего текста на другие языки сложно поддерживать параллельные версии текстов на протяжении всего срока службы продукта.[21] Например, если сообщение, отображаемое пользователю, изменено, необходимо изменить все переведенные версии.

Коммерческие соображения

В коммерческих условиях выгода от локализации - доступ к большему количеству рынков. В начале 1980-х гг. Лотос 1-2-3 потребовалось два года, чтобы разделить программный код и текст, и он потерял лидерство на рынке Европы более Microsoft Multiplan.[1] MicroPro обнаружила, что использование австрийского переводчика для рынка Западной Германии привело к WordStar документация, по словам одного из руководителей, не «должна иметь тот тон, который должен был быть».[22]

Однако это связано со значительными затратами, которые выходят далеко за рамки инженерии. Кроме того, бизнес-операции должны адаптироваться для управления производством, хранением и распространением нескольких дискретных локализованных продуктов, которые часто продаются в совершенно разных валютах, нормативных условиях и налоговых режимах.

Наконец, отдел продаж, маркетинга и техническая поддержка также должны облегчить свою работу с новыми языками, чтобы поддерживать клиентов в отношении локализованных продуктов. Предложение локализованного продукта никогда не может быть экономически выгодным, особенно для относительно небольшой языковой группы. Даже там, где большое количество языков может оправдать локализацию данного продукта, а внутренняя структура продукта уже допускает локализацию, конкретному разработчику или издателю программного обеспечения может не хватать размера и сложности для управления вспомогательными функциями, связанными с работой в нескольких регионах.

Смотрите также

Рекомендации

  1. ^ а б c d е ж грамм час я j k л м п о п q Патрик А.В. Зал; Мартин А. Ульд, ред. (1996). Программное обеспечение без границ: многоплатформенный, многокультурный и многонациональный подход. При участии и под руководством Рэя Хадсона, Костаса Спиропулоса, Тимо Хонкелы и др. Вайли. ISBN  978-0-471-96974-7.
  2. ^ Берт Эсселинк (2003). Эволюция локализации (PDF). Руководство по локализации. Многоязычные вычисления и технологии. Архивировано из оригинал (PDF) на 2012-09-07. Короче говоря, локализация основана на сочетании языка и технологий для создания продукта, способного преодолевать культурные и языковые барьеры. Не больше, не меньше.
  3. ^ «Глоссарий жаргона W3C». Консорциум World Wide Web. Получено 2008-10-13.
  4. ^ "Происхождение аббревиатуры I18n".
  5. ^ «Локализация против интернационализации». Консорциум World Wide Web.
  6. ^ «Утилиты GNU gettext: концепции». Проект GNU. Архивировано из оригинал 18 сентября 2019 г.. Получено 29 октября 2019. Когда мы обсуждаем поддержку родного языка в программах, постоянно появляются два длинных слова, и эти слова имеют точное значение, которое стоит объяснить здесь, раз и навсегда, в этом документе. Слова интернационализации и локализации. Многие люди, уставшие писать эти длинные слова снова и снова, взяли за привычку писать вместо этого i18n и l10n, цитируя первую и последнюю букву каждого слова и заменяя ряд промежуточных букв числом, просто указывающим, сколько таких букв Существуют.
  7. ^ а б Алан (29 марта 2011 г.). «Что такое интернационализация (i18n), локализация (L10n) и глобализация (g11n)». Архивировано из оригинал 2015-04-02. Заглавная L в L10n помогает отличить его от строчной i в i18n.
  8. ^ «IBM Globalization». 17 марта 2016 г. Архивировано с оригинал 31 марта 2016 г.
  9. ^ «Пошаговая глобализация». Архивировано из оригинал на 2015-04-12.
  10. ^ «Шаг за шагом к глобализации: понимание интернационализации». Архивировано из оригинал на 2015-05-26.
  11. ^ "Утилиты GNU gettext: формы множественного числа".
  12. ^ Languagetranslationsservices.wordpress.com В архиве 3 апреля 2015 г. Wayback Machine
  13. ^ Хайдер, М. (17 мая 2016 г.). "Пакистан выражает обеспокоенность по поводу вызывающего споры законопроекта о картах Индии.'". Рассвет. Пакистан Геральд Пабликейшн (Пвт.) Лтд.. Получено 9 мая 2018.
  14. ^ Хамдани, Я. (18 мая 2016 г.). «Смена карты не означает, что Кашмир - часть вас, Индия». Блоги Express Tribune. Сеть новостей Express Tribune. Получено 9 мая 2018.
  15. ^ Madrad Courier (24 июля 2017 г.). «Обзор законопроекта о регулировании геопространственной информации». Мадрас Курьер. Vipra Holdings Ltd. Получено 9 мая 2018.
  16. ^ "Международные форматы адресов". Сеть разработчиков Microsoft. Microsoft. Получено 10 декабря 2013.
  17. ^ Павловски, Дж. М. (2008): Профили культуры: содействие глобальному обучению и обмену знаниями. Proc.of ICCE 2008, Тайвань, ноябрь 2008 г. Черновая версия
  18. ^ Рейна, Лаура Арджона; Роблес, Грегорио; Гонсалес-Бараона, Хесус М. (25 июня 2013 г.). Петринья, Этиэль; Суччи, Джанкарло; Иоини, Набиль Эль; Силлитти, Альберто (ред.). Предварительный анализ локализации в свободных программах: как выполняются переводы. Достижения ИФИП в области информационных и коммуникационных технологий. Springer Berlin Heidelberg. С. 153–167. Дои:10.1007/978-3-642-38928-3_11. ISBN  978-3-642-38927-6.
  19. ^ Текущий список см. KDE.org
  20. ^ «Перевод: групповая статистика - translatewiki.net».
  21. ^ «Как перевести игру на 20 языков и не попасть в ад».
  22. ^ Шраге, Майкл (17 февраля 1985). «IBM побеждает на европейском компьютерном рынке». Вашингтон Пост. ISSN  0190-8286. Получено 2018-08-29.

дальнейшее чтение

  • .NET Internationalization: Руководство разработчика по созданию глобальных Windows и веб-приложений, Гай Смит-Феррье, Addison-Wesley Professional, 7 августа 2006 г. ISBN  0-321-34138-4
  • Практическое руководство по локализации, Берт Эсселинк, Издательство Джона Бенджамина, [2000]. ISBN  1-58811-006-0
  • Лидия Эш: Помощник по веб-тестированию: Руководство для инсайдеров по эффективным и действенным тестам, Wiley, 2 мая 2003 г. ISBN  0-471-43021-8
  • Бизнес без границ: стратегическое руководство по глобальному маркетингу, Дональд А. ДеПальма, Globa Vista Press [2004]. ISBN  978-0-9765169-0-3

внешняя ссылка