Метод вуби - Wubi method

Метод вуби
Традиционный китайский五筆 字型 輸入 法
Упрощенный китайский五笔 字型 输入 法
Буквальное значениеметод ввода пятистрочной символьной модели
Альтернативное китайское имя
Традиционный китайский王 碼
Упрощенный китайский王 码
Буквальное значениеКод Ванга
Раскладка клавиатуры Wubi 98
Раскладка клавиатуры Wubi 86 (более распространенная)
QWERTY-клавиатура с компонентами Wubi 86

В Метод ввода Wubizixing (упрощенный китайский : 五笔 字型 输入 法; традиционный китайский : 五筆 字型 輸入 法; пиньинь : wǔb zìxíng shūrùfǎ; горит 'метод ввода пятистрочной символьной модели'), часто сокращенно Вуби или же Вуби Син,[1] это Метод ввода китайских иероглифов в первую очередь для ввода упрощенный китайский и традиционный китайский текст на компьютере. Wubi не следует путать с Метод Уубихуа (五 笔画), который представляет собой другой метод ввода, разделяющий категории на пять типов штрихов.

Метод также известен как Ван Ма (упрощенный китайский : 王 码; традиционный китайский : 王 碼; пиньинь : Wáng M; горит 'Код Ванга'), названный в честь изобретателя Ван Юнминь (王永民). Существует четыре версии Wubi, которые считаются стандартными: Wubi 86, Wubi 98, Wubi 18030 и Wubi New-Century (версия 3-го поколения). Последние три могут также использоваться для ввода традиционный китайский текст, хотя и в более ограниченном виде. Wubi 86 - наиболее широко известный и используемый метод ввода на основе формы для полноразмерных клавиатур в Материковый Китай. Если часто необходимо вводить и традиционные китайские символы, используйте другие методы ввода, например CangJie или же ZhengMa могут лучше подходить для этой задачи, и гораздо больше шансов найти их на компьютере, который вам нужен.

Метод Wubi основан на структуре символов, а не на их произношении, что позволяет вводить символы, даже когда пользователь не знает произношения, а также не слишком тесно связан с каким-либо конкретным разговорный китайский. Кроме того, он чрезвычайно эффективен: почти каждый символ может быть написан максимум 4 нажатиями клавиш. На практике большинство символов можно написать меньшим числом. Есть сведения, что опытные машинистки достигли 160 символов в минуту с Вуби.[2] То, что это означает в контексте китайского языка, не совсем то же самое, что и для английского языка, но это правда, что Wubi очень быстр, когда его использует опытный машинист. Основная причина этого заключается в том, что, в отличие от традиционных фонетических методов ввода, не нужно тратить время на выбор нужного символа из списка гомофонических возможностей: практически все символы имеют уникальное представление.

Как следует из названия, клавиатура разделена на пять регионов. Китайский иероглиф (bǐ), когда используется в контексте написания китайских иероглифов, относится к мазкам кисти, используемым в китайской каллиграфии. Каждой области присвоен определенный тип штриха.

  • Область 1: горизонтальная (一)
  • Область 2: вертикальная (丨)
  • Область 3: вниз справа налево (丿)
  • Область 4: точечные штрихи или штрихи слева направо вниз (丶)
  • Область 5: крючок

Основным недостатком изучения Wubi является более крутая кривая обучения, поскольку в качестве более сложной системы требуется больше времени для приобретения навыка. Запоминание и практика - ключевые факторы для умелого использования.

В этой статье будет использоваться следующее соглашение: персонаж всегда будет означать китайский иероглиф, тогда как письмо, ключ и нажатие клавиши всегда будет относиться к клавишам на клавиатуре.

Как это устроено

По сути, персонаж разбивается на компоненты, которые обычно (но не всегда) такие же, как радикалы. Это набираются в том порядке, в котором они будут написаны от руки. Чтобы гарантировать, что чрезвычайно сложные символы не требуют чрезмерного количества нажатий клавиш, любой символ, содержащий более 4 компонентов, вводится путем ввода первых 3 записанных компонентов, а затем последнего. Таким образом, данные каждого персонажа могут быть введены не более чем 4 нажатиями клавиш.

Wubi распределяет свои символы очень равномерно, и поэтому подавляющее большинство символов однозначно определяется четырьмя нажатиями клавиш, описанными выше. Затем нужно ввести пробел, чтобы переместить символ из входного буфера на экран. В случае, если четырехбуквенное представление символа нет уникальный, можно ввести цифру, чтобы выбрать соответствующий символ (например, если два символа имеют одинаковое представление, при вводе 1 будет выбран первый, а 2 - второй). В большинстве реализаций пробел всегда можно ввести, что означает просто 1 в неоднозначной настройке. Интеллектуальное программное обеспечение будет пытаться убедиться, что персонаж в позиции по умолчанию является желаемым.

Многие персонажи имеют более одного представления. Иногда это делается для простоты использования, если есть более чем один очевидный способ разбить персонажа. Однако чаще это происходит потому, что некоторые символы имеют короткое представление, состоящее менее чем из 4 букв, а также «полное» представление.

Для символов с менее чем 4 компонентами, которые не имеют краткого представления формы, каждый компонент вводит, а затем "заполняет" представление (то есть набирает достаточно дополнительных нажатий клавиш, чтобы сделать представление 4 нажатиями клавиш), вручную вводя штрихи символа последний компонент в том порядке, в котором они будут написаны. Если штрихов слишком много, следует написать как можно больше, но последний штрих ставить последним (это отражает правило компонентов для символов с более чем 4 компонентами, описанными выше).

Как только алгоритм будет понят, можно ввести практически любой символ, немного потренировавшись, даже если он не набирал его раньше. Мышечная память позаботится о том, чтобы часто набирающим машинки, использующим этот метод, не приходилось думать о том, как на самом деле построены символы, точно так же, как подавляющее большинство английских машинисток не очень заботятся о написании слов, когда пишут.

Детали реализации

Многие реализации используют дальнейшую оптимизацию с использованием нескольких слов. Обычно обычно используемый орграф (двухсимвольное слово), в котором оба символа имеют краткую форму представления с двумя нажатиями клавиш, можно объединить в одно представление с четырьмя нажатиями клавиш, которое генерирует два символа, а не один. Также есть несколько 3-символьных ярлыки, и даже один, более длинный, политически мотивированный. Некоторые из них приведены в разделе примеров ниже.

Другой распространенной особенностью является использование клавиши «z» в качестве подстановочного знака. Метод Wubi был разработан с учетом этой особенности; вот почему клавише z не назначены никакие компоненты. По сути, можно ввести z, когда не уверены, каким должен быть компонент, и метод ввода поможет завершить его. Если бы кто-нибудь знал, например, что символ должен начинаться с «kt», но не был уверен, каким должен быть следующий компонент, то при вводе «ktz» был бы получен список всех символов, начинающихся с «kt». Однако на практике многие механизмы ввода используют метод табличного поиска для всех систем ввода на основе таблиц, включая Wubi. Это означает, что у них просто есть большая таблица в памяти, связывающая разные символы с их соответствующими представлениями. Тогда метод ввода просто превращается в поиск по таблице. В такой реализации клавиша z нарушает парадигму и, как таковая, не встречается в большинстве универсальных программ (хотя метод ввода Wubi, обычно используемый в китайской Windows, реализует эту функцию). По этой же причине оптимизация нескольких символов, описанная в предыдущем абзаце, также относительно редка.

Некоторые методы ввода, например xcin (можно найти во многих UNIX-подобных системах), предоставляют общую функциональность с подстановочными знаками, которая может использоваться во всех системах ввода на основе таблиц, включая пиньинь и практически все остальное. Xcin использует "*" для автозаполнения и "?" всего на одну букву, следуя соглашениям, введенным в области подстановки файлов UNIX. Другие реализации, вероятно, имеют свои собственные соглашения.

Подразделение клавиатуры

Клавиатура Wubi предполагает QWERTY -подобная раскладка, поэтому пользователи клавиатур, реализующие национальную или альтернативную раскладку (например, Дворжак или французы АЗЕРТИЯ ), вероятно, придется сделать некоторое переназначение, чтобы система работала нормально. Wubi не позиционирует свои компоненты произвольно: их слишком много, и только с введением логической методологии систему становится легко изучить.

По сути, клавиатура разделена на 5 зон, каждая из которых представляет собой штрих. Эти пять штрихов: падение влево, вправо, горизонтальное, вертикальное и крючковое, а зоны, которые их представляют, - это QWERT, YUIOP, ASDFG, HJKLM и XCVBN соответственно. Все эти зоны расположены горизонтально, за исключением буквы M, которая не совпадает с остальными буквами в этой зоне.

В общем, клавиатуру можно представить как разделенную по центру между T и Y, G и H, а также N и M. Нумерация клавиш в каждой зоне идет от этой разделительной линии: поэтому мы должны фактически сказать что в зоне QWERT, T - первая буква, R - вторая, а E - третья; в зоне YUIOP Y - первое, U - второе, I - третье и т. д. Для XCVBN N - первое и так далее. В HJKLM считайте M последним в серии, даже если он не лежит на линии.

Это важно, потому что компоненты в первой позиции будут иметь одно повторение рассматриваемого штриха (штриха, назначенного зоне, к которой они принадлежат), компоненты во втором - два, третьи - три. Те компоненты, которые нелегко классифицировать с использованием этой парадигмы, будут помещены на последнюю букву.

Следовательно, можно было бы ожидать, что будет расположено на G, 二 - на F, а 三 - на D, и это действительно так. Точно так же можно было бы ожидать, что 丨 будет находиться на H, 刂 - на J, а 川 - на K. Этот образец справедлив для всех зон. Более того, это распространяется на большинство радикалов, которые выглядят так, как будто они состоят из трех таких штрихов, даже если на самом деле их может и не быть. Примером этого является 中 на K: хотя у него нет трех нисходящих штрихов (только два), кажется, что у него есть три. Кроме того, он пишется от руки, сначала пишется корень рта, 口, а затем делится пополам вертикальным штрихом вниз. Радикальный рот лежит на «К», так что это делает задание вдвойне логичным. И латинизация пиньинь, kou3, начинается с k, еще одного вспомогательного средства памяти, закодированного в клавиатуре Wubi.

Кроме того, каждая буква каждой зоны имеет один связанный с ней компонент, его «главный компонент». Обычно это полный символ (за исключением X) сам по себе. Этот основной компонент всегда можно набрать, набрав букву, на которой он расположен, четыре раза. Так, например, основным компонентом H является 目, поэтому его можно было бы ввести, набрав «hhhh».

С каждой буквой также связан ярлык. В некоторых случаях этот символ совпадает с компонентом, связанным с рассматриваемым ключом, а иногда и нет. Этот ярлык - это символ, который создается, когда вводится только буква и ничего больше; все это чрезвычайно распространенные символы, используемые при наборе текста на китайском языке.

Вполне возможно, что существует ряд компонентов, не перечисленных ниже, либо из-за недосмотра, потому что они редко используются, либо из-за того, что не существует простого представления Unicode для компонента.

Зона QWERT (падающая влево)

Главный компонент клавиши Q - 金, а его ярлык - 我. С ним связаны следующие компоненты: 金, 钅, 勹, 儿, 夕, а также крючок в верхней части 饣 и 角, радикал 犭 без нижнего падающего штриха влево (поэтому символы с этим радикалом начинаются с «qt», а не только с «q»), крестик (например, в центре), верхняя часть (т. е. без горизонтальной черты внизу) и три (почти вертикальные) "ноги" в правом нижнем углу 流.

Главный компонент клавиши W и символ быстрого доступа - 人. Он связан со следующими компонентами: 人, 亻, 八 и вершиной. В то время как 人 означает человек, Вуби часто использует его для создания радикальной крыши, например, в 会, «wfc».入 не управляется W, несмотря на то, что выглядит похожим, и хотя 餐 имеет вершину, которая отдаленно похожа на верхнюю часть 癸, они не совпадают (действительно, чтобы ввести 餐, нужно физически напечатать каждый компонент наверху) .

Главный компонент клавиши E - 月, а его ярлык - 有. Он связан со следующими компонентами: 月, 用, 彡, 乃, низ 衣 (т. Е. Без 亠), верх (т. Е. Без 子), ((pig), низ (т. Е., без) и нижней части 舟 (т. е. без маленькой точки наверху). В этом случае ярлык E даже не начинается с нисходящей черты влево, а просто выделяется на видном месте компонента, принадлежащего E. 彡 присутствует на этом персонаже, так как это третий символ в зоне (считая от T, см. над). Особое искажение, которое часто возникает, - это использование E в 且 и в символах, содержащих его: Wubi думает об этом компоненте как 月 + 一.

Главный компонент клавиши R - 白, а его ярлык - 的. Он связан со следующими компонентами: 白, 手, 扌, 斤 (как с T, так и без него), 牛 (без вертикальный нисходящий штрих) и, конечно, два нисходящих влево штриха (я не могу найти символ Unicode, который их представляет), который можно было бы ожидать от второго ключа в зоне (см. выше для объяснения). Обратите внимание на разновидности 手, в которых центральный нисходящий крючок заменяется нисходящим штрихом влево, например, в 看.

Основной компонент клавиши T - 禾, а ее символ быстрого доступа - 和. Он связан со следующими компонентами: 禾, 竹, 夂, 攵, 彳 и вершиной 乞 (т. Е. Без).竹 также можно найти в его меньшей форме (⺮).丿 также находится на этой клавише, потому что T - первая клавиша в зоне (см. Выше). Это означает, что если кто-то набирает компонент или символ штрих за штрихом, они (обычно) используют T для представления нисходящего штриха. См. Раздел о мазки устранения неоднозначности для получения дополнительной информации об исключениях из этого правила.

Зона YUIOP (падающая вправо)

Эту зону можно также назвать точечной зоной, потому что ее узор Y: 讠 U: 冫 I: 氵 и O: 灬 на самом деле не обязательно состоит из падающих вправо штрихов. Фактически, можно утверждать, что первый удар в 灬 действительно падает оставили. Это называется спадающей правой зоной, потому что все клавиши в этой зоне, когда они используются для создания символа штрихом (а не компонентом), представляют собой правые падающие штрихи для некоторой конфигурации символа (см. Раздел о мазки устранения неоднозначности для дополнительной информации).

Главный компонент клавиши Y - 言, а ее ярлык - 主. Он связан со следующими компонентами: 言, 讠, 亠, 亠 с 口 под ним, 广, 文, 方 и 丶. Все эти компоненты начинаются с движения вправо. Как правило, точки в китайских иероглифах на самом деле оставили падающие штрихи, и поэтому в большинстве случаев использование T более уместно, чем Y. Конечно, если кто-то может писать китайские иероглифы от руки, они должны быть в состоянии сказать, какие выбрать, вспомнив, как они написаны.

Главный компонент клавиши U - 立, а ее ярлык - 产. Он связан со следующими компонентами: 立, 六, 辛, 门, 疒, 丬, 冫, «усиками» наверху 单 (всего два штриха: 丷) и усиками плюс горизонтальный штрих, как показано на верхняя часть. Большинство из них имеют два коротких диагональных штриха (门 - очевидное исключение). Это согласуется с местом R как второй буквы в зоне (объяснение см. Выше).

Главный компонент клавиши I - 水, а его ярлык - 不. Он связан со следующими компонентами: 水, 氵, 小, тремя штрихами в верхней части 学 и тремя штрихами в верхней части. Кроме того, с этим символом связан компонент, который можно описать как две 冫, расположенные вплотную друг к другу.

Главный компонент клавиши O - 火, а его ярлык - 为. Он связан со следующими компонентами: 火, 米, 灬 и 业 без нижняя горизонтальная черта - позволяет создавать символы, такие как 严. Это 4-я клавиша в падающей правой зоне: отсюда и включение.

Главный компонент клавиши P - 之, а его ярлык - 这. Он связан со следующими компонентами: 之, 辶, 廴, 冖, 宀 и 礻. Поскольку компоненты Wubi набираются в том порядке, в котором они должны были быть написаны вручную, компоненты 辶 и 廴 обычно набираются последний.

Зона ASDFG (горизонтальная)

  • Символ быстрого доступа для клавиши A - 工.
  • Главный компонент клавиши S - 木, а его ярлык - 要.
  • Главный компонент клавиши D - 大, а его ярлык - 在.
  • Главный компонент клавиши F - 土, а ее ярлык - 地. Название основного компонента (земля) соответствует ярлыку, который означает земля.
  • Основной компонент клавиши G - 王, а ее символ быстрого доступа - 一.

Зона HJKLM (вертикальная)

  • Главный компонент клавиши H - 目, а ее ярлык - 上.
  • Основной компонент клавиши J - 日, а ее ярлык - 是.
  • Главный компонент клавиши K - 口, а его ярлык - 中.
  • Основной компонент клавиши L - 田, а ее ярлык - 国.
  • Главный компонент клавиши M - 山, а ее ярлык - 同.

Зона XCVBN (крючок)

  • Главный компонент клавиши X - 纟, а его ярлык - 经.
  • Основной компонент клавиши C - 又, а ее ярлык - 以.
  • Главный компонент клавиши V - 女, а его ярлык - 发.
  • Главный компонент клавиши B - 子, а ее ярлык - 了.
  • Главный компонент клавиши N - 已, а ее ярлык - 民.

Штрихи устранения неоднозначности

Штрихи клавиатуры разделены на 5 зон

ЗоныПисьмо
1GFDSA
2HJKLM
3TREWQ
4ЮИОП
5NBVCX


ЗоныГладитьФорма
1Влево-вправо (по горизонтали)
2Сверху-снизу (по вертикали)
3丿Падение влево
4Падение вправо
5Крюк


ЧислоПисьмоПервый ударВторой ударПримеры
11грамм
12F
13D丿
14S
15А
    
21ЧАС
22J
23K丿
24L
25M
    
31Т丿
32р丿
33E丿丿
34W丿
35Q丿
    
41Y
42U
43я丿
44О
45п
    
51N
52B
53V丿
54C
55Икс

Примеры

Персонажи с 4 или менее компонентами (но без штрихов)

Пример 1: 请 Состоит из трех компонентов: y (讠, радикал # 10), g (王 *, радикал 89), e (月, радикал 118) -> 请

Персонажи с более чем 4 компонентами

Пример 2: 遗

Состоит из пяти компонентов: k (口), h (丨), g (一), m (贝), p (辶) -> khgp -> 遗 (ввод m не нужен)

Символы, состоящие менее чем из 4 компонентов (требуются штрихи)

Пример 3a: 文 : Сначала вы вводите ключ с символом на нем, который оказывается «Y». Затем вы вводите первый компонент, который также является «Y» для штриха, затем «G» для штриха ,, и, поскольку у вас уже есть три штриха, вы вводите последний штрих, который также оказывается 捺, достигнув ключевого кода "YYGY" для всего символа.

Пример 3b: 一 : Код этого символа - «GGLL». Как и раньше, вы сначала набираете клавишу для символа, которая представляет собой «G», а затем первый штрих этого символа, который также является «G». Поскольку это вся необходимая информация, L используется в качестве заполнителя, пока вы не дойдете до 4 букв.[2] Обратите внимание, что «一» также является сокращенным символом для «G» (на практике это делается только одним штрихом).

Пример 3c: 广 : Код этого символа - «YYGT». Сначала вы набираете клавишу, на которой расположен этот символ, то есть «Y». Затем вы вводите штрих, который также находится на «Y». Следующим будет штрих на «G», а последним будет 横 на «T».

Персонажи, требующие штрихов для устранения неоднозначности

Пример 4: 等

Состоит из трех компонентов: t (竹), f (土), f (寸),

Штрихи устранения неоднозначности: последний штрих - 丶, и символ имеет структуру сверху-снизу (42, u) -> 等

Стих

Стихотворение было создано как мнемоника для клавиатуры Wubi, в которой с каждой клавишей было связано несколько символов. Первый символ - это соответствующий ключевой главный компонент, а следующие - компоненты или связанные символы.

Версия 1986 года

G11 王 旁 青 头 戋 五一

F12 土 士 二 干 十 寸 雨

D13 大 犬 三 羊 古 石 厂

S14 木 丁西

A15 工 戈 草 头 右 框 七

H21 目 具 上 止 卜 虎皮

J22日早两竖与虫依

K23 口 与 川 , 字根 稀

L24 田 甲方 框 四 车 力

M25 山 由 贝 , 下 框 几

T31 禾 竹 一 撇 双人 立 , 反 文 条 头 共 三 一

R32 白手 看头 三 二斤

E33月彡 (衫) 乃 用 家 衣 底

W34 人和 八 , 登 祭 头

Q35 金 勺 缺点 无 尾 鱼 , 犬 旁 留 一点 夕 , 氏 无 七

Y41 言 文 方 广 在 四 一 , 高 头 一 捺 谁人 去

U42 立 辛 两点 六 门 疒 (病)

I43 水 旁 兴头 小 倒立

O44 火 业 头 , 四 点 米

P45 之 宝盖 , 摘 示 衣

N51 已 半 巳 满 不出 己 , 左 框 折 尸 心 和 羽

B52 子 耳 了 也 框 向上

V53 女 刀 九 臼 山 朝西

C54 又 巴马 , 丢 矢 矣

X55 慈母 无心 弓 和 匕 , 幼 无力

Версия 1998 года

G11 王 旁 青 头 五 夫 一

F12 土 干 十 寸 未 甘雨 , 不要 忘 了 革 字 底

D13 大 犬 戊 其 古 石 厂

S14 木 丁西 甫一 四 里

A15 工 戈 草 头 右 框 七

H21 目 上 卜 止 虎 具 头

J22 日 早 两 竖 与 虫 依

K23 口 流川 , 码 元 稀

L24 田 甲方 框 四 车里

M25 山 由 贝 骨 下 框 集

T31 禾 竹 反 文 双人 立

R32 白 斤 气 丘 叉 手提

E33 月 用力 豸 毛衣 臼

W34 人 八 登 头 单 人 几

Q35 金 夕 鸟儿 犭 边 鱼

Y41 言 文 方 点 谁人 去

U42 立 辛 六 羊 病 门 里

I43 水族 三点 鳖 头 小

O44 火 业 广 鹿 四 点 米

P45 之 字 宝盖 补 示 衣

N51 已 类 左 框 心 尸 羽

B52 子 耳 了 也 乃 框 皮

V53 女 刀 九 良 山西 倒

C54 又 巴 牛 入 马 失蹄

X55 幺 母 贯 头 弓 和 匕

Версия нового века (3-го поколения)

G11 王 旁 青 头 五一 提

F12 土 士 二 干 十 寸 雨

D13 大三 肆 头 古 石 厂

S14 木 丁西 边 要 无 女

A15 工 戈 草 头 右 框 七

H21 目 止 具 头 卜 虎皮

J22 日 曰 两 竖 与 虫 依

K23 口中 两 川 三个 竖

L24 田 框 四 车 甲 单 底

M25 山 由 贝 骨 下 框里

T31 禾 竹 牛 旁 卧 人 立

R32 白 斤 气 头 叉 手提

E33 月 舟 衣 力 豕 豸 臼

W34 人 八 登 祭 风头 几

Q35 金 夕 犭 儿 包头 鱼

Y41 言 文 方 点 在 四 一

U42 立 带 两点 病 门 里

I43 水边 一族 三点 小

O44 火 变 三 态 广 二 米

P45 之 字 宝盖 补 示 衣

N51 已 类 左 框 心 尸 羽

B52 子 耳 了 也 乃 齿 底

V53 女 刀 九 巡 录 无水

C54 又 巴 甬 矣 马 失蹄

X55 幺 母 绞 丝 弓 三 匕

Примечания и ссылки

  1. ^ Это имя используется в Mac OS X
  2. ^ а б Викентовски, Джо (1996), Wubizixing для носителей английского языка, заархивировано из оригинал 10 июля 2015 г.

внешняя ссылка