Диакритический - Diacritic

á
Буква а с диакритическим ударением
Диакритики на латыни и греческом
акцент
острый´
двойной острый˝
могила`
двойная могила ̏
циркумфлексˆ
карон, гачекˇ
бреве˘
перевернутый бреве  ̑  
седиль¸
диэрезис, умляут¨
точка·
небный крючок  ̡
ретрофлексный крюк  ̢
крючок выше, ду хи ̉
Рог ̛
индекс йоты ͅ 
макронˉ
ogonek, nosinė˛
периспомен ͂ 
исключение˚
нижняя часть˳
грубое дыхание
ровное дыхание᾿
Знаки, которые иногда используются как диакритические знаки
апостроф
бар◌̸
двоеточие:
запятая,
полная остановка / период.
дефис˗
основной
тильда~
Диакритические знаки в других шрифтах
Арабские диакритические знаки
Ранние кириллические диакритики
Камора ҄
покрытие ҇
titlo ҃
Гурмухи диакритические знаки
Иврит диакритические знаки
Индийский диакритические знаки
анусвара
чандрабинду
Nuqta
вирама
висарга
Диакритические знаки IPA
Японские диакритические знаки
дакутэн
Handakuten
Кхмерские диакритические знаки
Сирийские диакритические знаки
Тайские диакритические знаки
Связанный
Пунктирный круг
Знаки препинания
Логические символы

А диакритический (также диакритический знак, диакритическая точка, диакритический знак, или же акцент) это глиф добавлен в письмо или основной глиф. Термин происходит от Древнегреческий διακριτικός (diakritikós, "различение"), от διακρίνω (Diakrī́nō, "отличить"). Диакритический в первую очередь прилагательное, хотя иногда используется как имя существительное, в то время как диакритический только всегда прилагательное. Некоторые диакритические знаки, такие как острый ( и могила (`), часто называют акценты. Диакритические знаки могут появляться над или под буквой или в другом месте, например, внутри буквы или между двумя буквами.

Основное использование диакритических знаков в Латинский шрифт состоит в том, чтобы изменить звуковые значения букв, к которым они добавлены. Примерами являются диареи в заимствованных французских словах наивный и Ноэль, которые показывают, что гласная с тремой произносится отдельно от предыдущей гласный; острые и серьезные ударения, которые могут указывать на то, что должна быть произнесена последняя гласная, как в ради и поэтический вздохнул; и седиль под буквой «с» в заимствованном французском слове фасад, что показывает, что это произносится /s / скорее, чем /k /. В другом Латинские алфавиты, они могут различать омонимы, такой как Французский ("там") против ля ("the"), которые оба произносятся / la /. В Гэльский тип, точка над согласным означает смягчение рассматриваемого согласного.

В другом алфавитные системы, диакритические знаки могут выполнять другие функции. Гласный указывающий системы, а именно арабский характер ( ـِ, ـُ, ـَ, и т. д.) и иврит niqqud ( ַ◌, ֶ◌, ִ◌, ֹ◌, ֻ◌, и т. д.) системы указывают гласные, которые не передаются основным алфавитом. В Индийский вирама (् и т. Д.) И арабский сукун ( ـْـ) Отмечают отсутствие гласных. Знаки кантилляции указывать просодия. Другие варианты использования включают Ранняя кириллица titlo штрих (◌҃) и иврит Гершайим ( ״), Которые соответственно маркируют сокращения или же акронимы, и греческие диакритические знаки, которые показали, что буквы алфавита использовались как цифры. в Ханю Пиньинь официальная система латинизации китайского языка, диакритические знаки используются для обозначения тона слогов, в которых встречаются отмеченные гласные.

В орфография и сопоставление, буква, измененная диакритическим знаком, может рассматриваться либо как новая отдельная буква, либо как комбинация букв и диакритических знаков. Это зависит от языка к языку и может варьироваться от случая к случаю в пределах языка. Английский - единственный крупный современный Европейский язык не требует диакритических знаков для родных слов (хотя диэрезис может использоваться в таких словах, как «сотрудничество»).[1][2]

В некоторых случаях буквы используются как «встроенные диакритические знаки» с той же функцией, что и вспомогательные глифы, поскольку они изменяют звучание предшествующей им буквы, как в случае «h» в английском произношении « ш "и" й ".[3]

Типы

Среди типов диакритических знаков, используемых в алфавитах на основе Латинский шрифт находятся:

Тильда, точка, запятая, titlo, апостроф, черта и двоеточие иногда являются диакритическими знаками, но имеют и другое применение.

Не все диакритические знаки встречаются рядом с изменяемой буквой. в Язык вали в Гане, например, апостроф указывает на изменение качества гласной, но встречается в начале слова, как и в диалектах 'Bulengee и 'Долими. Потому что гармония гласных, затрагиваются все гласные в слове, поэтому диакритическим знаком является все слово. В Abugida скрипты, подобные тем, которые используются для написания хинди и Тайский, диакритические знаки обозначают гласные и могут встречаться выше, ниже, до, после или вокруг согласной буквы, которую они изменяют.

Точка (точка) на письме я или письмо j, латинского алфавита возникла как диакритический знак, чтобы четко различать я от минимумы (штрихами вниз) соседних букв. Впервые он появился в XI веке в последовательности ii (как в ingeníí), затем распространить на я рядом с м, н, вы, и, наконец, все строчные яс. В j, первоначально вариант я, унаследовал титул. Форма диакритического знака развивалась от первоначального сходства с сегодняшним острым акцентом до длительного расцвета к 15 веку. С появлением Римский шрифт он превратился в круглую точку, которую мы имеем сегодня.[4]

В языках Восточной Европы диакритические знаки используются как для согласных, так и для гласных звуков, тогда как в Западной Европе диграфы чаще используются для изменения согласных звуков. Большинство языков Западной Европы используют диакритические знаки на гласных, за исключением английского, где их обычно нет (с некоторые исключения ).

Диакритические знаки, характерные для нелатинских алфавитов

арабский

  • (ئ ؤ إ أ и отдельно) хамза: указывает на гортанная смычка.
  • (ــًــٍــٌـ) Танвин (تنوين) символы: выполняют грамматическую роль в арабский. Знак ـً чаще всего пишется в сочетании с алиф, например ـًا.
  • (ــّـ) шадда: Двоение (удвоение) согласных.
  • (ٱ) Wala: Чаще всего стоит в начале слова. Указывает тип хамза это произносится только тогда, когда письмо читается в начале разговора.
  • (آ) Мадда: Письменная замена хамза за которым следует алиф, т. е. (ءا). Читается как глоттальная остановка с последующим длинным / aː /, например ءاداب ، ءاية ، قرءان ، مرءاة записываются соответственно как آداب ، آية ، قرآن ، مرآة. Это правило записи не применяется, если алиф, следующий за хамза не является частью основы слова, например نتوءات не записывается как نتوآت в качестве основы نتوء не имеет алифа, который следует за его хамза.
  • (ــٰـ) надстрочный индекс алиф (также «короткий» или «кинжал алиф»: замена оригинального алифа, который выпадает при написании некоторых редких слов, например لاكن не записывается с оригинальным алифом, найденным в произношении слова, вместо этого он записывается как لٰكن.
  • arakāt (По-арабски: حركات также называемый تشكيل ташкил):
    • (ــَـ) фатя (а)
    • (ــِـ) касра (я)
    • (ــُـ) Шамма (u)
    • (ــْـ) сукун (без гласных)
  • В arakāt или гласные служат двум целям:
    • Они служат фонетическим ориентиром. Они указывают на наличие кратких гласных (фатя, касра, или же Шамма) или их отсутствие (сукун).
    • В последней букве слова точка гласной отражает перегиб падеж или настроение спряжения.
      • Для существительных The Шамма для именительного падежа, фатя для винительного падежа и касра для родительного падежа.
      • Для глаголов Шамма для несовершенных, фатя для совершенного, и сукун для глаголов в повелительном наклонении или юссив настроения.
  • Гласные или ташкил не следует путать с согласными точками или ijam (إعجام) - одна, две или три точки, написанные над или под согласным, чтобы различать буквы одного и того же или похожих форма.

Греческий

Эти диакритические знаки используются в дополнение к острым, серьезным и циркумфлексным акцентам и диэрезису:

иврит

Бытие 1: 9 «И сказал Бог: да соберется вода».
Буквы в черном, niqqud в красном, кантилляция в синем

Корейский

Хангыль, корейский алфавит

Диакритические знаки >〮 и , известный как Bangjeom (방점;傍 點), использовались для обозначения высотных акцентов в Хангыль за Среднекорейский. Они писались слева от слога при вертикальном письме и над слогом при горизонтальном письме.

Правительство Южной Кореи официально пересмотрело латинизация корейского языка в июле 2000 г. убрать диакритические знаки.

Санскрит и индийская

Сложные буквы сценария деванагари (из семьи браминов), которые представляют собой гласные в сочетании с согласными, имеют диакритические знаки. Здесь क (Ka) отображается с диакритическими знаками гласных. То есть: ◌T, T ᷇◌, ◌ T᷆, ◌͜, ◌̯, ◌̜̜, ◌̙ и т. Д.

Сирийский

  • Точка над буквой и точка под буквой обозначают [а], транслитерируется как а или же ă,
  • Две точки по диагонали над буквой обозначают [ɑ], транслитерируется как ā или же â или же å,
  • Две горизонтально расположенные точки под буквой представляют [ɛ], транслитерируется как е или же ĕ; часто произносится [ɪ] и транслитерируется как я в Восточно-сирийский диалект,
  • Две диагональные точки под буквой обозначают [e], транслитерируется как ē,
  • Точка под Бет представляют собой мягкий [v] звук, транслитерируемый как v
  • Тильда (~) под Gamel представляют собой [dʒ] звук, транслитерируемый как j
  • Письмо Вау с точкой под ним представляет [u], транслитерируется как ū или же ты,
  • Письмо Вау с точкой над ним представляет [o], транслитерируется как ō или же о,
  • Письмо Йод с точкой под ним представляет [я], транслитерируется как я или же я,
  • А тильда (~) под Каф представляют собой [t͡ʃ] звук, транслитерируемый как ch или же č,
  • Полукруг под Пэ представляет собой [f] звук, транслитерируемый как ж или же ph.

В дополнение к указанным выше знакам гласных, транслитерация сирийского языка иногда включает ə, или надстрочный е (или часто вообще ничего), чтобы представить оригинальный арамейский Schwa это было потеряно позже, на каком-то этапе развития сирийского языка.[5] В некоторых схемах транслитерации его включение необходимо для демонстрации спирализации или по историческим причинам.[6][7]

Неалфавитные сценарии

В некоторых неалфавитных шрифтах также используются символы, которые, по сути, действуют как диакритические знаки.

  • Не чистый Abjads (Такие как иврит и арабский сценарий) и Abugidas использовать диакритические знаки для обозначения гласные. Иврит и арабский также указывают на удвоение согласных и изменение с диакритическими знаками; Иврит и Деванагари используйте их для иностранных звуков. Деванагари и родственные им абугида также используют диакритический знак, называемый вирама чтобы отметить отсутствие гласной. Кроме того, Деванагари использует лунную точку. чандрабинду ().
  • Единая слоговая речь канадских аборигенов используйте несколько типов диакритических знаков, в том числе диакритические знаки с буквенными свойствами, известные как средние и финальные. Хотя долгие гласные изначально обозначались отрицательной линией через слоговые символы, из-за чего глиф казался сломанным, в современных формах используется точка выше используется для обозначения длины гласной. В некоторых стилях кольцо выше указывает на долгую гласную с [j] вне скольжения. Другой диакритический знак, «внутреннее кольцо» помещается в голову глифа, чтобы изменить [p] на [f] и [t] на [θ]. Медиалы, такие как «w-точка», помещенные рядом с глифом Syllabics, указывают на то, что [w] помещается между согласной в начале слога и гласной ядра. В финале указывается слоговая кодовая согласная; некоторые из согласных слоговых кодов в срединных позициях слова, например, с «h-галочкой», указывают на усиление согласного в слоге, следующем за ним.
  • Японский хирагана и катакана слоговые словари использовать дакутэн (◌ ゛) и Handakuten (◌゜) (на японском: 濁 点 и 半 濁 点) символы, также известные как нигори (濁 "мутный") или десять десять (点 々 "точка точка") и Мару (丸 "круг"), чтобы указать звонкие согласные или другие фонетические изменения.
  • Смайлики обычно создаются с диакритическими символами, особенно Японский смайлики на популярные имиджборды.

Алфавитный указатель или сопоставление

В разных языках используются разные правила для размещения диакритических знаков. алфавитный порядок. Во французском и португальском языках буквы с диакритическими знаками обрабатываются так же, как и основная буква в целях упорядочивания и использования словарей.

В Скандинавские языки и Финский язык, напротив, относитесь к персонажам с диакритическими знаками å, ä, и ö как отдельные буквы алфавита, и отсортируйте их после z. Обычно ä (а-умляут) и ö (o-umlaut) [используется в шведском и финском языках] отсортированы как эквивалентные æ (ясень) и ø (о-слэш) [используется в датском и норвежском языках]. Также, аа, при использовании в качестве альтернативы написанию å, отсортировано как таковое. Другие буквы, измененные диакритическими знаками, рассматриваются как варианты основной буквы, за исключением того, что ü часто сортируется как у.

Языки, которые рассматривают акцентированные буквы как варианты основной буквы, обычно помещают слова в алфавитном порядке с такими символами сразу после похожих немаркированных слов. Например, в немецком языке, где два слова отличаются только умляутом, слово без него сортируется первым в немецких словарях (например, Schon а потом Schön, или же упал а потом Fällen). Однако, когда речь идет об именах (например, в телефонных справочниках или в каталогах авторов в библиотеках), умляуты часто рассматриваются как комбинации гласной с суффиксом. е; Австрийские телефонные книги теперь обрабатывают символы с умляутами как отдельные буквы (сразу после нижележащей гласной).

На испанском языке графема ñ считается новой буквой, отличной от п и сопоставлены между п и о, так как он обозначает звук, отличный от обычного п. Но гласные с ударением á, é, я, ó, ú не отделяются от гласных без ударения а, е, я, о, ты, поскольку острый акцент в испанском только изменяет стресс внутри слова или обозначает различие между омонимы, и не изменяет звучание буквы.

Полный список заказов на сопоставление на разных языках см. Последовательность сортировки.

Поколение с компьютерами

Современные компьютерные технологии были разработаны в основном в англоязычных странах, поэтому форматы данных, раскладки клавиатуры и т. Д. Были разработаны с упором в пользу английского языка, языка с алфавитом без диакритических знаков. Были предприняты усилия для создания интернационализированные доменные имена которые еще больше расширяют английский алфавит (например, «pokémon.com»).

В зависимости от раскладка клавиатуры, который отличается в зависимости от страны, более или менее легко вводить буквы с диакритическими знаками на компьютерах и пишущих машинках. У некоторых есть свои ключи; некоторые из них создаются при первом нажатии клавиши с диакритический знак за которым следует буква, на которой его нужно разместить. Такой ключ иногда называют мертвый ключ, поскольку он не производит собственного вывода, но изменяет вывод нажатой после него клавиши.

В современных операционных системах Microsoft Windows и Linux раскладки клавиатуры США Международный и UK International особенность мертвые ключи которые позволяют набирать латинские буквы с острым ударением, серьезным ударением, циркумфлексом, диэрезисом, тильдой и седилем, встречающиеся в западноевропейских языках (в частности, те комбинации, ISO Latin-1 набор символов) напрямую: ¨ + е дает ë, ~ + о дает хи т. д. на Apple Macintosh компьютеры, есть сочетания клавиш для наиболее распространенных диакритических знаков; Вариант-е после гласной ставится острый ударение, Option-u за которым следует гласная, дает умляут, Option-c дает седиль и т. д. Диакритические знаки могут быть составлен в большинстве X Window System раскладки клавиатуры, а также других операционных систем, например Microsoft Windows, с использованием дополнительного программного обеспечения.

На компьютерах наличие кодовые страницы определяет, можно ли использовать определенные диакритические знаки. Unicode решает эту проблему, присваивая каждому известному символу собственный код; если этот код известен, большинство современных компьютерных систем обеспечивают метод его ввода. С Unicode также можно комбинировать диакритические знаки с большинством персонажей. Однако по состоянию на 2019 год очень немногие шрифты включают необходимую поддержку для правильного отображения символов и диакритических знаков для латинского, кириллического и некоторых других алфавитов (исключения включают Андика ).

Языки, в которых буквы содержат диакритические знаки

В следующих языках есть буквы, содержащие диакритические знаки, которые считаются независимыми буквами, отличными от букв без диакритических знаков.

Балтийский
  • Латышский имеет следующие буквы: ā, ē, я, ū, č, грамм, ķ, ļ, ņ, š, ž
  • Литовский. В общем случае, когда буквы появляются с кароном (č, š и ž), они считаются отдельными буквами от с, с или же z и сопоставлены отдельно; письма с огонек (ą, ę, я и ų ), макрон (ū ) и супердот (ė ) также рассматриваются как отдельные буквы, но не имеют уникального порядка сортировки.
кельтская
  • валлийский использует циркумфлекс, диэрезис, острый, и могила на его семи гласных а, е, я, о, ю, ш, у (отсюда композиты â, ê, î, ô,, ŵ, ŷ, ä, ë, ï, ö, ü, ẅ, ÿ, á, é, í, ó, ú, ẃ, ý, à, è, ì, ò, ù, ẁ, ỳ).
  • После реформы орфографии с 1970-х гг. Шотландский гэльский использует только могилы, которые можно использовать на любой гласной (à, è, я, ò, ù ). Раньше острые акценты можно было использовать на á, ó и é, которые использовались для обозначения определенного качества гласных. С устранением этих акцентов новая орфография полагается на читателя, имеющего предварительные знания о произношении данного слова.
  • Манкс использует диакритический знак ç в сочетании с h, чтобы дать орграф ⟨çh⟩ (произносится / tʃ /), чтобы отметить различие между ним и орграфом ⟨ch⟩ (произносится /час/ или же /Икс/). Другие диакритические знаки, используемые в Мэнском языке, включали â, ê, ï и т. Д., Чтобы обозначить различие между двумя словами с одинаковым написанием, но с немного различающимся произношением.
  • Ирландский после реформы орфографии 1948 года использует только острые ударения для обозначения долгих гласных.
  • Бретонский не имеет единой орфографии (орфографической системы), но использует диакритические знаки для ряда целей. Диарезис используется для обозначения того, что две гласные произносятся отдельно, а не как дифтонг / орграф. Циркумфлекс используется для обозначения долгих гласных, но обычно только тогда, когда длина гласного не может быть предсказана фонологией. Назализация гласных может быть отмечена тильдой или следующей за гласной буквой <ñ>. Суффикс множественного числа -où используется как единое написание для обозначения суффикса с множеством произношений на разных диалектах и ​​для отличия этого суффикса от орграфа , который произносится как / u: /. Апостроф используется для различения c'h, произносится /Икс/ поскольку орграф используется в других кельтских языках, от французского орграфа ch, произносимого / ʃ /.
Кириллица
  • Белорусский и Узбекская кириллица есть письмо ў.
  • Белорусский, болгарский, Русский и украинский буквы й.
  • Белорусский и русский получить письмо ё. В русском языке эту букву обычно заменяют на е, хотя у него другое произношение. Использование е вместо ё не влияет на произношение. Ё всегда используется в детских книгах и словарях. А минимальная пара все (vs'e, "все" пл.) и всё (vs'o, "все" п. SG.). В белорусском языке замена на е это ошибка; в русском языке можно использовать либо е или же ё за ё но первое более распространено в повседневном письме (в отличие от учебного письма или письма для подростков).
  • В Кириллица Украинский алфавит есть буквы ґ, й и ї. украинец Латынка есть еще много чего.
  • македонский есть буквы ќ и ѓ.
  • На болгарском и македонский притяжательное местоимение ѝ (я, "ее") пишется с серьезным ударением, чтобы отличить его от союза и (я, "и").
  • Острый ударение «́» над любой гласной в кириллических алфавитах используется в словарях, книгах для детей и учащихся-иностранцев для обозначения ударения слова, а также может использоваться для устранения неоднозначности слов с одинаковым написанием с разными лексическими ударениями.
Финно-угорский
  • эстонский имеет отличную букву х, который содержит тильду. Эстонские "гласные с точкой" ä, ö, ü похожи на немецкий, но это также разные буквы, в отличие от немецких умлаутированных букв. У всех четырех есть свое место в алфавите, между ш и Икс. Carons в š или же ž появляются только в иностранных именах собственных и заимствования. Также это разные буквы, расположенные в алфавите между s и т.
  • Финский использует пунктирные (umlauted) гласные (ä и ö). Как и в шведском и эстонском языках, они рассматриваются как отдельные буквы, а не как комбинации гласный + умляут (как в немецком языке). Он также использует символы å, š и ž в иностранных именах и заимствованиях. В финском и шведском алфавитах å, ä и ö сопоставить как отдельные буквы после z, остальные как варианты основной буквы.
  • Венгерский использует умляут, острый и двойной острый акцент (уникальный для венгерского): (ОУ), (á, é, í, ó, ú) и (ОУ). Острый ударение указывает на долгую форму гласного (в случае я / я, о / о, u / ú), а двойное острие выполняет ту же функцию для ö и ü. Острый акцент также может указывать на другой звук (более открытый, как в случае а / б, э / э). И длинные, и краткие формы гласных указаны отдельно в Венгерский алфавит, но члены пар а / а, э / э, и / и, о / ó, ö /ő, u / ú и ü /ű сопоставлены в словарях как одна буква.
  • Ливонский имеет следующие буквы: а, а, ǟ, , ē, ī, ļ, ņ, ō, ȯ, ȱ, х, ȭ, ŗ, š, ț, ū, ž.
Германский
  • Фарерские острова использует острый и другие специальные буквы. Все они считаются отдельными буквами и имеют свое место в алфавите: á, я, ó, ú, ý и ø.
  • исландский использует острые и другие специальные буквы. Все они считаются отдельными буквами и имеют свое место в алфавите: á, é, я, ó, ú, ý, и ö.
  • Датский и норвежский язык используйте дополнительные символы, такие как косая черта ø и оверринг å. Эти письма приходят после z и æ в порядке ø, å. Исторически сложилось так, что å развился из лигатуры путем написания небольшого надстрочного индекса а над строчной буквой а; если å недоступен, некоторые скандинавские языки допускают замену удвоенного а. Скандинавские языки сопоставляют эти буквы после z, но имеют разные сопоставление стандарты.
  • Шведский использует а-диэрезис (ä ) и о-диэрезис (ö ) на месте ясеня (æ) и косой чертой o (ø ) в дополнение к a-оверлингу (å). Исторически сложилось так, что диэрезис для шведских букв ä и ö, словно Немецкий умлаут, возникший из небольшого готического е написано над буквами. Эти буквы сопоставляются после z, в порядке å, ä, ö.
Романтика
Славянский
  • В Боснийский, хорватский, и сербский Латинские алфавиты имеют символы č, ć, đ, š и ž, которые считаются отдельными буквами и указываются как таковые в словарях и других контекстах, в которых слова перечислены в алфавитном порядке. У них также есть один диграф включая диакритический знак, , который также находится в алфавитном порядке независимо и следует d и предшествует đ в алфавитном порядке. В сербской кириллице нет диакритических знаков, вместо нее есть графема (глиф ) для каждой буквы своего латинского аналога (включая латинские буквы с диакритическими знаками и орграфы dž, lj и Нью-Джерси ).
  • В Чешский алфавит использует ударение (á é í ó ú ý), caron (č ď ě ň р š ť ž ), и для одной буквы (ů ) кольцо. (Обратите внимание, что в ď и ť caron видоизменяется[требуется разъяснение ] как апостроф.)
  • Польский имеет следующие буквы: ą ć ę ł ń ó ś ź ż. Они считаются отдельными буквами: каждая из них помещается в алфавит сразу после латинского аналога (например, ą между а и б), ź и ż помещаются после z в этой последовательности.
  • В Словацкий алфавит использует острый (á é í ó ú ý ĺ р ), карон (č ď ľ ň š ť ž), умлаут (ä) и акцент с циркумфлексом (ô).[9]
  • Базовый Словенский алфавит имеет символы č, š, и ž, которые считаются отдельными буквами и указываются как таковые в словарях и других контекстах, в которых слова перечислены в алфавитном порядке. Письма с Caron ставятся сразу после написанных букв без диакритики. Письмо đ может использоваться в нетранслитерированных иностранных словах, особенно в именах, и ставится после č и раньше d.
Тюркский
  • Азербайджанский включает отдельные буквы турецкого алфавита Ç, ГРАММ, Я, Я, Ö, Ş и Ü.
  • Крымскотатарский включает отдельные буквы турецкого алфавита Ç, ГРАММ, Я, я, Ö, Ş и Ü. В отличие от стандартного турецкого (но нравится Кипрско-турецкий ), У крымскотатарского тоже есть буква Ñ.
  • Гагаузский включает отдельные буквы турецкого алфавита Ç, ГРАММ, Я, Я, Ö и Ü. В отличие от турецкого, в гагаузском тоже есть буквы Ä, Ê Ș и Ț. Ș и Ț получены из Румынский алфавит для тех же звуков. Когда-нибудь турецкий Ş может использоваться вместо Ș.
  • турецкий использует грамм с бреве (ГРАММ ), две буквы с умляутом (Ö и Ü, представляющие две закругленные гласные переднего ряда), две буквы с седилем (Ç и Ş, представляющий аффрикат / tʃ / и фрикативный / ʃ /), а также имеет заглавную букву Я (и строчные буквы без точки я представляет собой высокий неокругленный гласный заднего ряда). В турецком языке каждая из них представляет собой отдельные буквы, а не версии других букв, где заглавная буква разделена точками. Я и нижний регистр я такие же буквы, как и заглавные буквы без точки я и строчные я. Типографически, Ç и Ş иногда отображаются с дополнительной точкой, как в ; когда используется крючок, он, как правило, имеет форму запятой, чем обычная седиль[нужна цитата ]. Новые азербайджанский, крымскотатарский и гагаузский алфавиты основаны на турецком алфавите и его тех же диакритических буквах с некоторыми дополнениями.
  • туркменский включает отдельные буквы турецкого алфавита Ç, Ö, Ş и Ü. Кроме того, в туркменском языке А с тремой (Ä ) представлять / æ /, N с кароном (Ň ) для представления велярный носовой / ŋ /, Y с острым ударением (Ý ) для представления небный аппроксимант / j /, а Z с кароном (Ž ) представлять / ʒ /.
Другой
  • албанский имеет две специальные буквы Ç и Ë верхний и нижний регистр. Они располагаются рядом с наиболее похожими буквами в алфавите, соответственно c и e.
  • эсперанто имеет символы ŭ, ĉ, грамм, час, ĵ и ŝ, которые входят в алфавит, и считаются отдельными буквами.
  • Филиппинский также имеет характер ñ как буква и сравнивается между n и o.
  • Гавайский использует kahak (макрон ) над гласными, хотя есть некоторые разногласия по поводу того, чтобы рассматривать их как отдельные буквы. Кахако над гласной может полностью изменить значение слова, которое пишется так же, но без кахаку.
  • Курдский использует символы Ç, Ê, Я, Ş и Û с другими 26 стандартными символами латинского алфавита.
  • Лакота алфавит использует Caron для писем č, ȟ, ǧ, š, и ž. Он также использует острый акцент для ударных гласных á, é, í, ó, ú, áŋ, íŋ, úŋ.
  • малайский использует диакритические знаки, такие как â, ā, ç, î, ñ, ô, š, û. Использование диакритических знаков продолжалось до конца 19 века, за исключением ā и ē.
  • Мальтийский использует C, G и Z с точкой над ними (Ċ, Ġ, Ż), а также имеет H с дополнительной горизонтальной полосой. Для прописной буквы H дополнительная полоса пишется немного выше обычной. Для строчной буквы H дополнительная полоса пишется через вертикаль, как т, и не касаясь нижней части (ЧАС, ħ). Вышеуказанные символы считаются отдельными буквами. Буква «c» без точки вышла из употребления из-за избыточности. «Ċ» произносится так же, как английское «ch», а «k» используется как твердое c, например, в «cat». «Ż» произносится так же, как английская «Z», как в «Zebra», в то время как «Z» используется для создания звука «ts» в английском языке (например, «цунами» или «математика»). 'Ġ' используется как мягкая 'G', как в 'geometry', в то время как 'G' звучит как жесткая 'G', как в 'log'. Орграф għ (называемый Gajn после арабский название письма ʻAyn для غ) считается отдельным и иногда размещается после 'g', в то время как в других томах он помещается между 'n' и 'o' (латинская буква 'o' первоначально возникла из формы Финикийский ʻAyin, который традиционно составлялся после финикийских нун).
  • В романизация сирийского языка использует измененные буквы. Ā, Č, , Ē, Ë, ГРАММ, ЧАС, Ō, Š, , , Ū, Ž наряду с 26 стандартными символами латинского алфавита.[10]
  • вьетнамский использует рог диакритический для писем ơ и ư; то циркумфлекс для писем â, ê, и ô; то бреве для письма ă; и полоса через письмо đ.

Диакритические знаки, не производящие новых букв

Доска используется в классе в Гарвард показывает усилия студентов по размещению ü и острый акцент диакритический знак, используемый в Испанская орфография.

английский

английский - один из немногих европейских языков, в котором не так много слов, содержащих диакритические знаки. Напротив, диграфы - это основной способ адаптации латыни к своим фонемам в современном английском алфавите. Исключение составляют неассимилированные иностранные заимствования, включая заимствования из Французский и все чаще испанский как халапеньо; однако диакритический знак в таких словах также иногда опускается. Заимствованные слова, которые часто появляются с диакритическим знаком в английском языке, включают кафе, продолжить или же продолжить (использование, которое помогает отличить его от глагола продолжить), суфле, и наивность (видеть Английские термины с диакритическими знаками ). В более древней практике (и даже среди некоторых современных ортографически консервативных авторов) можно встретить такие примеры, как элита, mêlée и роль.

Англоговорящие и писатели когда-то использовали диэрезис чаще, чем сейчас, в таких словах, как сотрудничество (от о. сотрудничество), зоология (от гр. зоология), и видящий (теперь чаще видящий или просто провидец) как способ указать, что соседние гласные принадлежат к отдельным слогам, но эта практика стала гораздо менее распространенной. Житель Нью-Йорка Журнал - крупное издание, которое продолжает использовать диарезу вместо дефиса для ясности и экономии места.[11]

Некоторые английские слова вне контекста можно отличить от других только диакритическим знаком или модифицированной буквой, включая Exposé, lamé, maté, öre, øre, pâté и rosé '. То же самое и с продолжить, попеременно продолжить, но, тем не менее, он регулярно пишется продолжить. Вкратце, диакритические знаки, которых не было в оригинале, были добавлены для устранения неоднозначности, например, в maté (от Sp. And Port. приятель), saké (стандартная латинизация японского языка без ударения) и Malé (от Dhivehi މާލެ), чтобы четко отличить их от английских слов «mate», «sake» и «male».

Острые и серьезные акценты иногда используются в поэзии и лирике: острый, чтобы явно указать на стресс, где он может быть двусмысленным (мятежник против. мятежник) или нестандартные по метрическим причинам (календарь), могила, чтобы указать, что обычно произносится беззвучный или пропущенный слог (предупрежден, парламент).

В некоторых личных именах, таких как Рене и Зои, часто существует два варианта написания, и предпочтение будет известно только близким людям. Даже когда имя человека пишется с диакритическим знаком, например, Шарлотта Бронте, это может быть опущено в англоязычных статьях и даже в официальных документах, таких как паспорта либо по неосторожности, машинистка не умеет вводить буквы с диакритическими знаками, либо по техническим причинам -Калифорния, например, не допускает имен с диакритическими знаками, поскольку компьютерная система не может обрабатывать такие символы. Они также появляются в названиях и / или товарных знаках некоторых всемирно известных компаний, таких как Nestlé или же Citroën.

Другие языки

В следующих языках есть буквенно-диакритические комбинации, которые не считаются независимыми буквами.

  • африкаанс использует диэрезис для обозначения гласных, которые произносятся отдельно, а не так, как можно было бы ожидать, где они встречаются вместе, например вуаль (чувствовать) в отличие от voël (птица). Циркумфлекс используется в ê, î, ô и û обычно для обозначения длинных близко к середине, в отличие от открытый мид гласные, например в словах Wêreld (мир) и более (утро, завтра). Острый акцент используется для добавления акцента так же, как подчеркивание или написание жирным шрифтом или курсивом в английском языке, например Dit is jóú boek (Это ваш книга). Серьезный ударение используется для различения слов, которые различаются только ударением, например апеллировать (яблоко) и аппель (апелляция) и в некоторых случаях, когда это не влияет на произношение, но различает омофоны. Два наиболее обычных случая последнего находятся в поговорках из из (либо ... либо) и нет ... нет (ни ... ни), чтобы отличить их от из (или) и ног (опять же по-прежнему).
  • аймара использует диакритический рог над р, д, т, к, ч.
  • Каталонский имеет следующие составные символы: à, ç, é, è, í, ï, ó, ò, ú, ü, l·l. Острый и могильный указывают стресс и высота гласного, седилья знаменует собой результат исторического палатализация, диэрезис указывает на перерыв, или что письмо ты произносится, когда графемы gü, qü следуют е или же я, то вставлять (·) Отличает разные значения л / л · л.
  • Некоторые орфографии Корнуолл Такие как Kernowek Standard и Унифицированный корнуолл используйте диакритические знаки, в то время как другие, такие как Kernewek Kemmyn и Стандартная письменная форма не использовать (или использовать их только по желанию в учебных материалах).
  • нидерландский язык использует диэрезис. Например, в руин это означает, что ты и я произносятся по отдельности обычным способом, а не так, как сочетание ui обычно произносится. Таким образом, он работает как знак разделения, а не как указание на альтернативную версию я. Для выделения можно использовать диакритические знаки (érg koud за очень холодный) или для устранения неоднозначности между несколькими словами, которые пишутся одинаково, когда контекст не указывает правильное значение (één appel = одно яблоко, een appel = яблоко; vóórkomen = происходить, voorkómen = предотвратить). Серьезные и острые акценты используются в очень небольшом количестве слов, в основном заимствованных. Ç также появляется в некоторых заимствованных словах.[12]
  • Фарерские острова. Буквы с нефарерским акцентом не добавляются к фарерскому алфавиту. К ним относятся é, ö, ü, å а в последнее время также письма вроде š, ł, и ć.
  • Филиппинский имеет следующие составные символы: á, à, â, é, è, ê, í, ì, î, ó, ò, ô, ú, ù, û. Однако реальное использование диакритических знаков для филиппинского встречается редко и предназначено только для различения между омонимы с различными ударениями и значениями, которые либо встречаются в тексте рядом друг с другом, либо помогают читателю понять его неоднозначное значение. Буква eñe возникла из-за испанского алфавита и тоже считается отдельной буквой. Диакритические знаки появляются в испанский заимствования и имена если соблюдается испанская орфография.
  • Финский. Кароны в š и ž появляются только в иностранных именах собственных и заимствования, но может быть заменен на ш или же ж тогда и только тогда, когда технически невозможно создать акцентированные буквы на носителе. В отличие от эстонского, š и ž не считаются отдельными буквами в финском языке.
  • Французский использует пять диакритических знаков. Могила (акцент могила) отмечает звук / ɛ / когда над е, как в отец ("отец") или используется для обозначения слов, которые в противном случае являются омографами, например а/à ("имеет" / "к") или ОУ/ОУ ("или где"). В острый (акцент айгу) используется только в «é», изменяя «е», чтобы звук / e /, как в этуаль («звезда»). В циркумфлекс (акцент цирконфлекс) обычно означает, что буква S когда-то следовала за гласной в старофранцузском или латинском языке, как в праздник ("вечеринка"), старофранцузское существо праздник и латинское существо фестум. Изменяет ли циркумфлекс произношение гласной, зависит от диалекта и гласной. В седиль (cédille) указывает на то, что произносится обычно жесткая буква «с» (перед гласными «а», «о» и «и»). / с /, как в ça ("который"). В диэрезис (Tréma) означает, что две соседние гласные, которые обычно произносятся как один, должны произноситься отдельно, как в Ноэль («Рождество»).
  • Галицкий гласные могут иметь ударение (á, é, í, ó, ú) для обозначения ударения или различия между двумя одинаковыми написанными словами (é, 'is' vs. е, 'и'), но диэрезис (Trema) используется только с я и ü для отображения двух отдельных гласных звуков в произношении. Только в иностранных словах галисийский язык может использовать другие диакритические знаки, такие как ç (распространено в средние века), ê, или же à.
  • Немецкий использует три символа umlauted ä, ö и ü. Эти диакритические знаки указывают на смену гласных. Например, слово Ofen [ˈOːfən] «печь» имеет множественное число Öfen [ˈØːfən]. Знак возник в виде надстрочного индекса е; рукописный буклет е напоминает две параллельные вертикальные линии, как диэрезис. Из-за этой истории, «ä», «ö» и «ü» могут быть записаны как «ae», «oe» и «ue» соответственно, если буквы умляута недоступны.
  • иврит has many various diacritic marks known as niqqud that are used above and below script to represent vowels. These must be distinguished from кантилляция, which are keys to pronunciation and syntax.
  • В Международный фонетический алфавит uses diacritic symbols and characters to indicate phonetic features or secondary articulations.
  • Ирландский uses the acute to indicate that a vowel is длинный: á, é, я, ó, ú. Он известен как síneadh fada "long sign" or simply fada "long" in Irish. В старом Гэльский тип, overdots are used to indicate смягчение of a consonant: , ċ, , , грамм, , п, , .
  • Итальянский mainly has the острый и могила (à, è/é, я, ò/ó, ù), typically to indicate a stressed syllable that would not be stressed under the normal rules of pronunciation but sometimes also to distinguish between words that are otherwise spelled the same way (e.g. "e", and; "è", is). Despite its rare use, Italian orthography allows the circumflex (î) too, in two cases: it can be found in old literary context (roughly up to 19th century) to signal a обморок (fêro→fecero, they did), or in modern Italian to signal the contraction of ″-ii″ due to the plural ending -i whereas the root ends with another -i; например., с. demonio, п. demonii→demonî; in this case the circumflex also signals that the word intended is not demoni, plural of "demone" by shifting the accent (demònî, "devils"; dèmoni, "demons").
  • Литовский использует острый, могила и тильда in dictionaries to indicate stress types in the language's основной акцент система.
  • Мальтийский also uses the grave on its vowels to indicate stress at the end of a word with two syllables or more:– lowercase letters: à, è, ì, ò, ù ; capital letters: À, È, Ì, Ò, Ù
  • Маори makes use of macrons to mark long vowels.
  • Окситанский has the following composite characters: á, à, ç, é, è, í, ï, ó, ò, ú, ü, n·h, s·h. The acute and the grave indicate стресс и высота гласного, the cedilla marks the result of a historical палатализация, the diaeresis indicates either a перерыв, or that the letter ты is pronounced when the graphemes gü, qü следуют е или же я, а вставлять (·) distinguishes the different values of nh/n·h и sh/s·h (i.e., that the letters are supposed to be pronounced separately, not combined into "ny" and "sh").
  • португальский has the following composite characters: à, á, â, ã, ç, é, ê, í, ó, ô, õ, ú. The acute and the circumflex indicate stress and vowel height, the grave indicates crasis, the tilde represents nasalization, and the cedilla marks the result of a historical lenition.
  • Acutes are also used in Славянский язык dictionaries and textbooks to indicate лексическое ударение, placed over the vowel of the stressed syllable. This can also serve to disambiguate meaning (e.g., in Russian писа́ть (pisáť) means "to write", but пи́сать (písať) means "to piss"), or "бо́льшая часть" (the biggest part) vs "больша́я часть" (the big part).
  • испанский uses the acute and the diaeresis. The acute is used on a vowel in a stressed syllable in words with irregular stress patterns. It can also be used to "break up" a дифтонг как в tío (произносится [ˈti.o], скорее, чем [ˈtjo] as it would be without the accent). Moreover, the acute can be used to distinguish words that otherwise are spelled alike, such as си ("if") and да ("yes"), and also to distinguish interrogative and exclamatory pronouns from homophones with a different grammatical function, such as donde/¿dónde? ("where"/"where?") or como/¿cómo? ("as"/"how?"). The acute may also be used to avoid typographical ambiguity, as in 1 ó 2 ("1 or 2"; without the acute this might be interpreted as "1 0 2". The diaeresis is used only over ты (ü) for it to be pronounced [w] in the combinations gue и gui, куда ты is normally silent, for example ambigüedad. In poetry, the diaeresis may be used on я и ты as a way to force a hiatus. As foreshadowed above, in nasal ñ то тильда (squiggle) is not considered a diacritic sign at all, but a composite part of a distinct glyph, with its own chapter in the dictionary: a glyph that denotes the 15th letter of the Spanish alphabet.
  • Шведский использует острый to show non-standard stress, for example in kafé (café) and resumé (résumé). This occasionally helps resolve ambiguities, such as язь (hibernation) versus idé (идея). In these words, the acute is not optional. Some proper names use non-standard diacritics, such as Каролина Клюфт и Шталь фон Гольштейн. For foreign loanwords the original accents are strongly recommended, unless the word has been infused into the language, in which case they are optional. Следовательно сметана но ампер. Swedish also has the letters å, ä, и ö, but these are considered distinct letters, not а и о with diacritics.
  • Тамильский does not have any diacritics in itself, but uses the арабские цифры 2, 3 and 4 as diacritics to represent aspirated, voiced, and voiced-aspirated consonants when Tamil script is used to write long passages in санскрит.
  • Тайский имеет свой own system of diacritics происходит от Индийские цифры, which denote different тона.
  • вьетнамский uses the acute (dấu sắc), the grave (dấu huyền), the tilde (dấu ngã), the underdot (dấu nặng) and the hoi (ду хи) on vowels as тон indicators.
  • валлийский uses the circumflex, diaeresis, acute, and grave on its seven vowels a, e, i, o, u, w, y. The most common is the circumflex (which it calls to bach, meaning "little roof", or acen grom "crooked accent", or hirnod "long sign") to denote a long vowel, usually to disambiguate it from a similar word with a short vowel. The rarer grave accent has the opposite effect, shortening vowel sounds that would usually be pronounced long. The acute accent and diaeresis are also occasionally used, to denote stress and vowel separation respectively. В ш-circumflex and the у-circumflex are among the most commonly accented characters in Welsh, but unusual in languages generally, and were until recently very hard to obtain in word-processed and HTML documents.

Транслитерация

Several languages that are not written with the Roman alphabet are транслитерированный, or romanized, using diacritics. Примеры:

Пределы

Практичный

Possibly the greatest number of combining diacritics требуется to compose a valid character in any Unicode language is 8, for the "well-known grapheme cluster in Tibetan and Ranjana scripts",ཧྐྵྨླྺྼྻྂ, or HAKṢHMALAWARAYAṀ.[13]

It is U+0F67 U+0F90 U+0FB5 U+0FA8 U+0FB3 U+0FBA U+0FBC U+0FBB U+0F82, or:
TIBETAN LETTER HA + TIBETAN SUBJOINED LETTER KA + TIBETAN SUBJOINED LETTER SSA + TIBETAN SUBJOINED LETTER MA + TIBETAN SUBJOINED LETTER LA + TIBETAN SUBJOINED LETTER FIXED-FORM WA + TIBETAN SUBJOINED LETTER FIXED-FORM RA + TIBETAN SUBJOINED LETTER FIXED-FORM YA + TIBETAN SIGN NYI ZLA NAA DA.

Impractical

Some users have explored the limits of rendering in web browsers and other software by "decorating" words with multiple nonsensical diacritics per character. The result is called "Zalgo text ". The composed bogus characters and words can be copied and pasted normally via the system clipboard.




Example: c̳̻͚̻̩̻͉̯̄̏͑̋͆̎͐ͬ͑͌́͢h̵͔͈͍͇̪̯͇̞͖͇̜͉̪̪̤̙ͧͣ̓̐̓ͤ͋͒ͥ͑̆͒̓͋̑́͞ǎ̡̮̤̤̬͚̝͙̞͎̇ͧ͆͊ͅo̴̲̺͓̖͖͉̜̟̗̮̳͉̻͉̫̯̫̍̋̿̒͌̃̂͊̏̈̏̿ͧ́ͬ̌ͥ̇̓̀͢͜s̵̵̘̹̜̝̘̺̙̻̠̱͚̤͓͚̠͙̝͕͆̿̽ͥ̃͠͡

Смотрите также

Рекомендации

  1. ^ As an example, an article containing a диэрезис in "coöperate" and a седиль in "façades" as well as a циркумфлекс in the word "crêpe" (Grafton, Anthony (2006-10-23). "Books: The Nutty Professors, The history of academic charisma". Житель Нью-Йорка.)
  2. ^ "The New Yorker's odd mark — the diaeresis". 16 декабря 2010. Архивировано с оригинал 16 декабря 2010 г.
  3. ^ Henry Sweet (1877) Справочник по фонетике, p 174–175: "Even letters with accents and diacritics [...] being only cast for a few founts, act practically as new letters. [...] We may consider the h in sh and th simply as a diacritic written for convenience on a line with the letter it modifies."
  4. ^ Оксфордский словарь английского языка
  5. ^ Nestle, Eberhard (1888). Syrische Grammatik mit Litteratur, Chrestomathie und Glossar. Berlin: H. Reuther's Verlagsbuchhandlung. [translated to English as Syriac grammar with bibliography, chrestomathy and glossary, by R. S. Kennedy. London: Williams & Norgate 1889].
  6. ^ Coakley, J. F. (2002). Robinson's Paradigms and Exercises in Syriac Grammar (5-е изд.). Издательство Оксфордского университета. ISBN  978-0-19-926129-1.
  7. ^ Michaelis, Ioannis Davidis (1784). Grammatica Syriaca.
  8. ^ Gramática de la Llingua Asturiana (PDF) (3-е изд.). Academia de la Llingua Asturiana. 2001. section 1.2. ISBN  84-8168-310-8. Архивировано из оригинал (PDF) на 2011-05-25. Получено 2011-06-07.
  9. ^ http://www.juls.savba.sk/ediela/psp2000/psp.pdf page 12, section I.2
  10. ^ S.P. Brock, "An Introduction to Syriac Studies", in J.H. Eaton (Ed.,), Horizons in Semitic Studies (1980)
  11. ^ Norris, Mary. "The Curse of the Diaeresis". Житель Нью-Йорка. Получено 18 апреля 2014.
  12. ^ van Geloven, Sander (2012). Diakritische tekens in het Nederlands (на голландском). Utrecht: Hellebaard. Архивировано из оригинал на 2013-10-29.
  13. ^ Steele, Shawn (2010-01-25). "Most combining characters in a Unicode glyph/character/whatever". Microsoft. В архиве from the original on 2019-05-16. Получено 2019-11-25.

внешняя ссылка