6.2 Основные типы SGML
В определении типа документа определяется синтаксис содержимого элемента HTML
и значений атрибутов с использованием меток SGML (например, PCDATA, CDATA, NAME,
ID и т.д.). Полные определения см. в [ISO8879]. Вот обобщенная информация о
ключах:
- CDATA
- это последовательность символов из набора символов документа, она может
включать character entities. Агенты пользователей должны интерпретировать
значения атрибутов следующим образом:
- Заменять character entities на символы,
- Игнорировать перевод строки,
- Заменять каждый возврат каретки или табуляцию на один пробел.
Агенты пользователей могут игнорировать пробелы в начале и в конце
значений атрибута CDATA (например, " myval " интерпретируется как
"myval"). Авторы не должны объявлять значения атрибутов с пробелами в начала
или в конце.
На некоторые атрибутов HTML 4.0 со значениями атрибутов CDATA
спецификация налагает дополнительные ограничения на множество допустимых
значений атрибутов, не выраженные в DTD.
Хотя элементы STYLE и
SCRIPT используют CDATA для своей модели данных, для этих элементов
агенты пользователей должны обрабатывать CDATA
по-другому. Разметка и entities должны считаться текстом и
передаваться в приложение как есть. Первое вхождение последовательности
символов "</" (открывающий разделитель конечного тэга) считается концом
содержимого элемента. В допустимых документах это будет конечный тэг
элемента.
- Метки ID
и NAME
должны начинаться с буквы ([A-Za-z]), за которой может следовать любое число
букв, цифр ([0-9]), символов переноса ("-"), символов подчеркивания ("_"),
двоеточий (":") и точек (".").
- IDREF
и IDREFS
- это ссылки на метки ID, определенные другими атрибутами. IDREF - одиночная
метка, а IDREFS -разделенный пробелами список меток.
- Метки
NUMBER должны содержать по крайней мере одну цифру ([0-9]).
|