Форматированный текст - Википедия - Formatted text

Форматированный текст, стилизованный текст, или же богатый текст, в отличие от простой текст, содержит информацию о стилях, выходящую за рамки минимума семантических элементов: цвета, стили (полужирный, курсив), размеры и специальные функции в HTML (например, гиперссылки ).

Терминология

Форматированный текст нельзя правильно идентифицировать с двоичными файлами или отличать от текста ASCII. Это связано с тем, что форматированный текст не обязательно является двоичным, он может быть только текстом, например HTML, RTF или же обогащенный текст файлы, и это может быть только ASCII. И наоборот, a простой текст файл может быть не-ASCII (в такой кодировке, как Unicode UTF-8 ).[требуется дальнейшее объяснение ] Текст с форматированием только текста достигается разметка который тоже является текстовым, в то время как некоторые редакторы форматированного текста, такие как Microsoft Word сохранить в двоичном формате.

Начало форматированного текста

Форматированный текст берет свое начало в докомпьютерном использовании подчеркивания для придания смелости пассажам в машинописном тексте. рукописи. В первых интерактивных системах ранних компьютерных технологий подчеркивание было невозможно, и пользователи восполняли этот недостаток (и отсутствие форматирования в ASCII), используя определенные символы в качестве замены. Акцент, например, можно достичь в ASCII несколькими способами:

  • Заглавные буквы: Я НЕ придумываю это.
  • Окружение подчеркиванием: Я _не_ выдумываю.
  • Обводка звездочками: Я * не * выдумываю.
  • Интервал: Я не выдумываю.

Знаки подчеркивания также использовались для названий книг: Посмотрите это в _The_C_Programming_Language_.

Языки разметки

Форматирование может быть отмечено тегами, отличными от основного текста специальными символами, такими как угловые скобки в HTML. Например, такой текст:

Собака классифицируется как Canis lupus familis в таксономии.

размечен в HTML таким образом:

<п>Собака классифицируется как <я>Canis lupus familis</я> в таксономии.</п>

Текст, выделенный курсивом, заключен в открывающий и закрывающий теги курсива. В Латекс, текст будет размечен следующим образом:

Собака классифицируется как  textit{Canis lupus familis} в таксономии.

Большинство языков разметки можно редактировать с помощью любых Текстовый редактор, не нуждаясь в особом программного обеспечения. Многие языки разметки также можно редактировать с помощью специального программного обеспечения, предназначенного для автоматизации некоторых функций или представления вывода в виде WYSIWYG.

Файлы отформатированных документов

С момента изобретения MacWrite, первый WYSIWYG текстовый процессор, в котором машинист кодирует форматирование визуально, а не вставляя текстовую разметку, текстовые процессоры, как правило, сохраняют в двоичные файлы. Открытие таких файлов с помощью Текстовый редактор показывает их встроенными с различными двоичными символами либо вокруг форматированного текста (например, в WordPerfect ) или отдельно от него, в начале или конце файла (например, в Microsoft Word ).

Однако отформатированные текстовые документы в двоичных файлах имеют недостатки, связанные с объемом форматирования и секретностью. Поскольку степень форматирования точно обозначена на языках разметки, WYSIWYG форматирование основано на памяти, то есть, например, удерживая нажатой жирную кнопку до отмены. Это может привести к ошибкам форматирования и проблемам с обслуживанием. Что касается секретности, форматы файлов с форматированными текстовыми документами, как правило, являются собственностью и недокументированы, что приводит к трудностям с совместимостью кодирования третьими сторонами, а также к ненужным обновлениям из-за изменений версии.

WordStar был популярным текстовым процессором, который не использовал двоичные файлы со скрытыми символами.

OpenOffice.org Writer сохраняет файлы в XML формат. Однако результирующий файл является двоичным, поскольку он сжат ( tarball эквивалент).

PDF - это еще один формат форматированного текстового файла, который обычно является двоичным (с использованием сжатия текста и хранения графики и шрифтов в двоичном формате). Обычно это формат конечного пользователя, написанный из приложения, такого как Microsoft Word или же OpenOffice.org Writer, и пользователь не может редактировать его после того, как закончил.

Смотрите также

внешняя ссылка