Обработка текста - Text processing

P.Oxy.6.993 text transcribed.svg

В вычислительной технике термин обработка текста относится к теории и практике автоматизации создания или обработки электронного текста.Текст обычно относится ко всем буквенно-цифровым символам, указанным на клавиатуре человека, занимающегося практикой, но в целом текст означает слой абстракции сразу выше стандарта кодировка символов целевого текста. обработка относится к автоматизированной (или механизированной) обработке, в отличие от тех же манипуляций, выполняемых вручную.

Обработка текста включает в себя компьютерные команды, которые вызывают содержимое, изменения содержимого и перемещение курсора, например, для

  • поиск и замена
  • формат
  • сформировать обработанный отчет о содержании, или
  • фильтровать файл или отчет текстового файла.

Обработка текста регулярное выражение представляет собой виртуальную машину для редактирования, имеющую примитивный язык программирования, имеющий именованные регистры (идентификаторы) и именованные позиции в последовательности символов, составляющих текст. Используя их, «текстовый процессор» может, например, пометить область текста, а затем переместить ее. Обработка текста полезность это программа фильтрации, или же фильтр. Эти два механизма включают обработку текста.

Определение

Поскольку стандартизированная разметка, такая как Коды выхода ANSI обычно невидимы для редактора, они содержат набор временных свойств, которые иногда становятся неотличимы от обработка текста. Но определенные отличия от обработки текста заключаются в том, что обработка текста правильный:

  • представляет собой «утилиты обработки текста», а не только приложения «редактирования текста».
  • это гораздо больше «путь с клавиатуры», чем «способ мыши» (например, перетаскивание, вырезание и вставка) при запуске редактирования.
  • - это последовательный доступ, а не произвольный доступ.
  • работает непосредственно в уровень представления а не косвенно прикладной уровень.
  • работает с необработанными данными, которые стандартизированы и работают более открыто, а не прибегают к каким-либо частным методам.

Таким образом, разметка, такая как шрифт и цвет, на самом деле не является отличительным фактором, потому что последовательности символов, которые влияют на шрифт и цвет, являются просто стандартными символами, автоматически вставленными фоновая обработка текста режим, сделанный для прозрачной работы послушный текстовые редакторы, но в остальном становятся видимыми как команды обработки текста когда этот режим не действует. Таким образом, обработка текста в основном (но не полностью) определяется визуальными символами (или графемы ), а не стандартные, но невидимые символы.

История

Развитие компьютерной обработки текстов всерьез началось с того, что Клини формализовала то, что обычный язык. Такой обычные выражения could затем превратился в мини-программу с завершенным процессом компиляции, доступную для любого редактирования после расширения этого языка. По аналогии, фильтры расширяются за счет развития конкретных опции.

Базовые концепты

Редактор по сути вызывает входной поток и направляет его в среду обработки текста, которая либо командная оболочка или Текстовый редактор. Полученный результат применим для дальнейшей обработки текста, конечный результат сравним с однократным применением применяемого алгоритма. однажды с помощью более сложной и структурированной компьютерной программы.

Обработка текста, в отличие от алгоритма, представляет собой управляемую вручную последовательность более простых макросов, которые представляют собой выражения действия шаблона и механизмы фильтрации. В любом случае намерение программиста косвенно отражается на заданном наборе текстовых символов в процессе обработки текста. Результаты этапа обработки текста иногда обнадеживают, а попытка механизма часто подвергается многократным проектам через визуальную обратную связь, пока регулярное выражение или сведения о языке разметки, или пока не будут полностью освоены параметры утилиты.

Обработка текста в основном связана с созданием текстовых символов на самом высоком уровне вычислений, где ее деятельность чуть ниже практического использования вычислений - руководство передача информации.

В конечном итоге все вычисления - это обработка текста, от самокомпилируемых текстовых символов ассемблера до автоматизированного языка программирования, созданного для обработки большого количества графических данных, и, наконец, до метасимволов регулярных выражений, которые обрабатывают существующие текстовые документы.

Обработка текста - это собственная автоматизация.

Символы

Текстовые символы поступают в виде стандартизованных наборов символов, содержащих также управляющие символы, такие как символ новой строки, которые упорядочивают текст. Другие типы управляющих символов организуют передачу, определяют наборы символов и выполняют другие служебные задачи.

Смотрите также

внешняя ссылка