На главную

HTML 4.0

5.2.1 Выбор кодировки

Средства разработки (например, текстовые редакторы) могут кодировать документы HTML в кодировках по своему выбору, и этот выбор существенно зависит от соглашений, используемых системным программным обеспечением. Эти средства могут использовать любую удобную кодировку, включающую большинство символов в документе, при условии, что кодировка корректно помечена. Некоторые символы, не включенные в эту кодировку, можно представить с помощью ссылок на символы. Это всегда относится к набору символов документа, а не к кодировке символов.

Серверы и прокси могут изменять кодировку символов (что называется транскодированием) на лету для выполнения запросов агентов пользователей (см. раздел 14.2 [RFC2068], заголовок запроса HTTP "Accept-Charset"). Серверы и прокси не должны обслуживать документ в кодировке, включающей весь набор символов документа.

Широко используемые в Web кодировки - ISO-8859-1 (также называется "Latin-1"; используется для большинства западноевропейских языков), ISO-8859-5 (с поддержкой кириллицы), SHIFT_JIS (японская кодировка), EUC-JP (еще одна японская кодировка) и UTF-8 (вариант кодировки ISO 10646, использующий разное число байт для разных символов). Названия кодировок символов не учитывают регистр, так что, например, "SHIFT_JIS", "Shift_JIS" и "shift_jis" эквивалентны.

Эта спецификация не определяет, какие кодировки символов должен поддерживать агент пользователя.

Соответствующие агенты пользователей должны корректно отображать в Unicode все символы в любых кодировках, которые они могут распознавать.

Замечания об определенных кодировках 

Когда текст HTML передается в UTF-16 (charset=UTF-16), текстовые данные должны передаваться в сетевом порядке байт ("big-endian", байт высшего порядка - первый) в соответствии с [ISO10646], раздел 6.3 и [UNICODE], положение C3, страница 3-1.

Более того, чтобы повысить вероятность правильной интерпретации, рекомендуется передавать документы UTF-16, всегда начиная с символа НЕРАЗДЕЛЯЮЩИЙ ПРОБЕЛ НУЛЕВОЙ ШИРИНЫ (шестнадцатеричный код FEFF, также называется Меткой порядка байтов (Byte Order Mark - BOM)), который при обращении байт становится шестнадцатеричным FFFE, никогда не назначаемым символом. Таким образом, агент пользователя, получивший шестнадцатеричный код FFFE в качестве первых байтов текста будет знать, что в остальном тексте байты нужно обратить.

Не следует использовать формат трансформации UTF-1[ISO10646] (зарегистрированный IANA как ISO-10646-UTF-1). Информацию об ISO 8859-8 и двунаправленном алгоритме см. в разделе двунаправленности и кодировки символов.

 

 

 

 

МЕНЮ


О спецификации HTML 4.0
        Организация спецификации
        Соглашения, принятые в документе
        Элементы и атрибуты
        Замечания и примеры
        Благодарности
        Информация об авторском праве

Введение в HTML 4.0
        Что такое World Wide Web?
        Введение в URI
        Идентификаторы фрагментов
        Относительные URI
        Что такое HTML?
        Краткая история HTML
        HTML 4.0
        Интернационализация
        Доступность
        Таблицы
        Составные документы
        Таблицы стилей
        Скрипты
        Печать
        Создание документов в формате HTML 4.0
        Разделение структуры и представления
        Универсальность доступа к Web
        Помощь агентам пользователей в последовательном создании изображений

Об SGML и HTML
        Введение в SGML
        Конструкции SGML, используемые в HTML
        Элементы
        Атрибуты
        Ссылки на символы
        Комментарии
        Как читать HTML DTD
        Комментарии DTD
        Определение комбинаций параметров
        Объявления элементов
        Объявления атрибутов

Соответствие: требования и рекомендации
        Определения
        SGML
        Тип содержимого text/html

Представление документа в формате HTML - Наборы символов, кодировки символов и entities
        Набор символов документа
        Кодировки символов
        Выбор кодировки
        Указание кодировки
        Ссылки на символы
        Числовые ссылки на символы
        Комбинации ссылок на символы
        Неотображаемые символы

Основные типы данных HTML - Информация о символах, цветах, длинах, URI, типах содержимого и т.д.
        Информация о регистре
        Основные типы SGML
        Текстовые строки
        URI
        Цвета
        Замечания об использовании цветов
        Длины
        Типы содержимого (типы MIME)
        Коды языков
        Кодировки
        Отдельные символы
        Дата и время
        Типы ссылок
        Дескрипторы устройств
        Данные сценариев
        Данные таблиц стилей
        Целевые имена кадров

Глобальная структура документа в формате HTML - Разделы HEAD и BODY документа
        Введение в структуру документа HTML
        Информация о версии HTML
        The HTML element
        Заголовок документа
        Элемент HEAD
        Элемент TITLE
        Атрибут title
        Метаданные
        Тело документа
        Элемент BODY
        Идентификаторы элементов: атрибуты id и class
        Элементы фровня блока и встроенные элементы
        Группировка элементов: элементы DIV и SPAN
        Заголовки: элементы H1, H2, H3, H4, H5, H6
        Элемент ADDRESS

Информация о языке и направление текста - Тексты на различных языках
        Указание языка содержимого: атрибут lang
        Коды языков
        Наследование кодов языков
        Интерпретация кодов языков
        Указание направления текста и таблиц: атрибут dir
        Введение в двунаправленный алгоритм
        Наследование инфомрации о направлении текста
        Устанока направления внедренного текста
        Приоритет над двунаправленным алгоритмом: элемент BDO
        Ссылки на символы для управления направлением и объединением
        Таблицы стилей и двунаправленность

Текст - Абзацы, строки и фразы
        Неоображаемые символы
        Структурированный текст
        Элементы фраз: EM, STRONG, DFN, CODE, SAMP, KBD, VAR, CITE, ABBR и ACRONYM
        Кавычки: элементы BLOCKQUOTE и Q
        Верхние и нижние индексы: элементы SUB и SUP
        Строки и абзацы
        Абзацы: элементы P
        Управление переходом на следующую строку
        Переносы
        Форматированный текст: элемент PRE
        Визуальное представление абзацев
        Разметка изменений в документе: элементы INS и DEL

Списки - Неупорядоченные, упорядоченные списки и списки определений
        Введение в списки
        Неупорядоченные списки (UL), упорядоченные списки (OL) и элементы списков (LI)
        Списки определений: элементы DL, DT и DD
        Визуальное представление списков
        Элементы DIR и MENU

Таблицы
        Введение в таблицы
        Элементы построения таблиц
        Элемент TABLE
        Captions таблиц: элемент CAPTION
        Грцппы строк: элементы THEAD, TFOOT и TBODY
        Группы столбцов: элементы COLGROUP и COL
        Строки таблицы: элемент TR
        Ячейки таблицы: элементы TH и TD
        Форматирвоание таблиц визуальными агентами пользователей
        Границы и rules
        Горизонтальне и вертикальное выравнивание
        Поля ячейки
        Представление таблиц невизуальными агентами пользователей
        Связь информации заголовка с ячейками данных
        Категоризация ячеек
        Алгоритм поиска заголовочной информации
        Пример таблицы



Рекомендуем


Выбрать мобильный и сотовый телефон
немеханическое оборудование магазинов торговое оборудование магазинов одежды
  Веб-студия "W-studio.com.ua" © 2008
(032) 34-64-17