Напечатать - Writeprint

Напечатать это метод в судебная лингвистика установления личности автора через Интернет по сравнению с цифровым отпечатком пальца. Идентичность устанавливается путем сравнения различения стилометрический характеристики неизвестного письменного текста с известными образцами предполагаемого автора (писатель инвариант ). Даже без подозрения, оттиск дает потенциальные базовые характеристики автора, такие как национальность и образование.[1]

Существует пять основных аспектов идентификации автора в оттиске:

  • Лексические особенности - анализ лексикон лексика, выбранная автором, с использованием символов и слов для выявления предпочтений личности;
    • использование прописных и строчных букв, частота некоторых букв, средняя длина слова, средняя длина самого высказывания[2]
  • Синтаксические особенности - анализ авторского стиля письма и структуры предложений, таких как знаки препинания и переносы, использование пассивный залог, и сложность предложения;
  • Конструктивные особенности - анализ авторской организации и структурного построения произведения, включая длину абзаца, интервалы и отступы.
    • включая расположение предложений внутри абзацев, например, использование прощаний, приветствий и подписей в настройках электронной почты;
  • Особенности контента - анализ языка, контекстно значимого для предмета письменной работы, включая использование сленга или сокращений. Чтобы быть более конкретным, эти функции определяют интересы объекта, точно определяя ключевые слова, которые они используют;
  • Идиосинкразические особенности - анализ ошибок и других неграмматических элементов, которые могут быть уникальными для автора, таких как неправильное написание, неправильное употребление слов и неточные формы глаголов. Поскольку это сложно контролировать, в сочетании с другими функциями он обеспечивает высокую точность идентификации автора.[3]

Хотя перечисленные выше пять функций являются традиционными методами идентификации автора, существуют функции, уникальные для онлайн-текста. Такие функции, как выбор шрифта, использование смайликов и ссылки на другие веб-сайты, обеспечивают путь к идентификации, который отсутствует в традиционном анализе текста.[4]

Смотрите также

Рекомендации

  1. ^ Ли, Цзексунь; Чжэн, Ронг; Чен, Синьчунь (апрель 2006 г.). «От отпечатка пальца к отпечатку записи». Коммуникации ACM. 49 (4): 76–82. Дои:10.1145/1121949.1121951.
  2. ^ Икбал, Франция; Binsalleeh, H; Fung, B; Деббаби, М. (октябрь 2010 г.). «Извлечение отпечатков анонимных писем для судебно-медицинской экспертизы». Цифровое расследование. 7 (1–2): 56–64. Дои:10.1016 / j.diin.2010.03.003.
  3. ^ Аббаси, Ахмед; Чен, Синьчунь; Нунамакер-младший, Джей Ф. (лето 2008 г.). «Стилометрическая идентификация на электронных рынках: масштабируемость и надежность». Журнал информационных систем управления. 25 (1): 49–78. Дои:10.2753 / MIS0742-1222250103. JSTOR  40398926.
  4. ^ Рехмейер, Джули (13 января 2007 г.). «Цифровые отпечатки пальцев». Новости науки. 171 (2): 26–28. Дои:10.1002 / scin.2007.5591710210. JSTOR  3982506.