8.2.5
Ссылки
на символы для управления направлением и объединением
Поскольку иногда возникает двусмысленность относительно некоторых символов
(например, символов пунктуации), спецификация [UNICODE] включает символы для
правильного определения назначения. Спецификация Unicode также включает
некоторые символы для управления объединением при необходимости (например, в
некоторых ситуациях с арабскими символами). HTML 4.0 включает для этих символов
ссылки на символы.
Следующее DTD определяет представление некоторых объектов направления:
<!ENTITY zwnj CDATA "‌"--=нулевая ширина без объединения -->
<!ENTITY zwj CDATA "‍"--=объединитель нулевой ширины-->
<!ENTITY lrm CDATA "‎"--=метка слева направо-->
<!ENTITY rlm CDATA "‏"--=метка справа налево-->
Объект zwnj используется для блокировки объединения в тех
контекстах, где объединение произойдет, но оно происходить не должно. Объект
zwj имеет обратное действие; он производит объединение в случае,
когда оно не предполагается, но должно произойти. Например, арабская буква "HEH"
используется для сокращения "Hijri", названия исламской системы летоисчисления.
Поскольку отдельный иероглиф "HEH" в арабской письменности выглядит как цифра
пять, для того, чтобы не путать букву "HEH" с последней цифрой пять в годе,
используется исходная форма буквы "HEH". Однако, нет последующего контекста
(например, буквы для объединения), с которым можно объединить "HEH". Символ
zwj предоставляет такой контекст.
Точно так же в персидских текстах буква может иногда объединяться с
последующей буквой, в то время как в рукописном тексте этого быть не должно.
Символ zwnj используется для блокировки объединения в таких
случаях.
Символы порядка, lrm и rlm, используются для
определения направления нейтральных по отношению к направлению символов.
Например, если двойные кавычки ставятся между арабской (справа налево) и
латинской (слева направо) буквами, направление кавычек неясно (относятся ли они
к арабскому или к латинскому тексту?). Символы lrm и rlm
имеют свойство направления, но не имеют свойств ширины и разделения слов/строк.
Подробнее см. [UNICODE].
Отражение глифов символов. Вообще двунаправленный
алгоритм не отражает глифы символов и не влияет на них. Исключением являются
такие символы как скобки (см. [UNICODE], таблица 4-7). Если отражение
желательно, например, для египетских иероглифов, греческих знаков или
специальных эффектов дизайна, можно сделать это с помощью стилей.
|