На главную

HTML 4.0

5.2.2 Указание кодировки символов

Как сервер определяет, какая кодировка символов применяется в документе? Некоторые серверы проверяют первые несколько байт документа или сверяются с базой данных известных файлов и кодировок. Многие современные серверы Web предоставляют администраторам больше возможностей управления конфигурацией набора символов, чем старые серверы. Администраторы серверов Web должны при возможности использовать следующие механизмы для отправки параметра "charset", но должны позаботиться о том, чтобы не установить для документов ошибочное значение параметра "charset".

Как агент пользователя узнает, какая использовалась кодировка символов? Эту информацию предоставляет сервер. Лучшим способом проинформировать агента пользователя о кодировке символов документа - использовать параметр "charset" в поле заголовка "Content-Type" протокола HTTP ([RFC2068], разделы 3.4 и 14.18) Например, следующий заголовок HTTP объявляет, что используется кодировка EUC-JP:

Content-Type: text/html; charset=EUC-JP

Определение text/html см. в разделе соответствие.

Протокол HTTP ([RFC2068], раздел 3.7.1) считает ISO-8859-1 кодировкой символов по умолчанию, если параметр "charset" в поле заголовка "Content-Type" отсутствует. На практике эта рекомендация бесполезна, поскольку некоторые серверы не позволяют отправлять параметр "charset", а некоторые могут не быть сконфигурированы для отправки этого параметр. Поэтому агенты пользователей не должны предполагать никакого значения параметра "charset".

Для указания ограничений сервера или конфигурации документы HTML могут включать явную информацию о кодировке символов документа; для предоставления такой информации агентам пользователя может использоваться элемент META.

Например, чтобы указать, что кодировкой символов в текущем документе является "EUC-JP", включите следующее объявление META:

<META http-equiv="Content-Type" content="text/html; charset=EUC-JP">

Объявление META должно использоваться, только если кодировка символов упорядочена так, что символы ASCII стоят на своем месте (по крайней мере, при разборе элемента META). Объявления META должны быть в тексте как можно раньше в элементе HEAD.

В случаях, когда ни протокол HTTP, ни элемент META не предоставляют информации о кодировке документа, HTML предоставляет атрибут charset для некоторых элементов. Объединив все эти механизмы, автор может существенно повысить шансы на то, что, когда пользователь загружает ресурс, агент пользователя распознает кодировку символов.

Подводя итоги, соответствующие агенты пользователей при определении кодировки символов документа (от высшего приоритета к низшему) должны руководствоваться следующими источниками в соответствии с приоритетом:

  1. Параметр "charset" протокола HTTP в поле "Content-Type".
  2. Объявление META, в котором для "http-equiv" установлено "Content-Type" и установлено значение для "charset".
  3. Атрибут charset устанавливается на элемент, обозначающий внешний ресурс.

Кроме этого списка приоритетов, агент пользователя может использовать эвристические установки и установки пользователя. Например, многие агенты пользователей используют эвристику для распознавания различных кодировок, используемых для японского языка. Агенты пользователей обычно имеют определяемую пользователем локальную кодировку по умолчанию, которую они используют, если нет указаний кодировки.

Агенты пользователей могут обеспечивать механизм, позволяющий пользователям изменять некорректную информацию о наборе символов. Однако если агент пользователя предлагает такой механизм, он должен предлагать его только для просмотра, а не для изменения, во избежание создания Web-страниц с некорректным параметром "charset".

Примечание. Если в каком-то приложении нужно использовать символы, не входящие в кодировку [ISO10646], этим символам должна быть назначена персональная зона во избежание конфликтов с настоящей или будущими версиями стандарта. Однако это не рекомендуется из соображений переносимости.
 

 

 

 

МЕНЮ


О спецификации HTML 4.0
        Организация спецификации
        Соглашения, принятые в документе
        Элементы и атрибуты
        Замечания и примеры
        Благодарности
        Информация об авторском праве

Введение в HTML 4.0
        Что такое World Wide Web?
        Введение в URI
        Идентификаторы фрагментов
        Относительные URI
        Что такое HTML?
        Краткая история HTML
        HTML 4.0
        Интернационализация
        Доступность
        Таблицы
        Составные документы
        Таблицы стилей
        Скрипты
        Печать
        Создание документов в формате HTML 4.0
        Разделение структуры и представления
        Универсальность доступа к Web
        Помощь агентам пользователей в последовательном создании изображений

Об SGML и HTML
        Введение в SGML
        Конструкции SGML, используемые в HTML
        Элементы
        Атрибуты
        Ссылки на символы
        Комментарии
        Как читать HTML DTD
        Комментарии DTD
        Определение комбинаций параметров
        Объявления элементов
        Объявления атрибутов

Соответствие: требования и рекомендации
        Определения
        SGML
        Тип содержимого text/html

Представление документа в формате HTML - Наборы символов, кодировки символов и entities
        Набор символов документа
        Кодировки символов
        Выбор кодировки
        Указание кодировки
        Ссылки на символы
        Числовые ссылки на символы
        Комбинации ссылок на символы
        Неотображаемые символы

Основные типы данных HTML - Информация о символах, цветах, длинах, URI, типах содержимого и т.д.
        Информация о регистре
        Основные типы SGML
        Текстовые строки
        URI
        Цвета
        Замечания об использовании цветов
        Длины
        Типы содержимого (типы MIME)
        Коды языков
        Кодировки
        Отдельные символы
        Дата и время
        Типы ссылок
        Дескрипторы устройств
        Данные сценариев
        Данные таблиц стилей
        Целевые имена кадров

Глобальная структура документа в формате HTML - Разделы HEAD и BODY документа
        Введение в структуру документа HTML
        Информация о версии HTML
        The HTML element
        Заголовок документа
        Элемент HEAD
        Элемент TITLE
        Атрибут title
        Метаданные
        Тело документа
        Элемент BODY
        Идентификаторы элементов: атрибуты id и class
        Элементы фровня блока и встроенные элементы
        Группировка элементов: элементы DIV и SPAN
        Заголовки: элементы H1, H2, H3, H4, H5, H6
        Элемент ADDRESS

Информация о языке и направление текста - Тексты на различных языках
        Указание языка содержимого: атрибут lang
        Коды языков
        Наследование кодов языков
        Интерпретация кодов языков
        Указание направления текста и таблиц: атрибут dir
        Введение в двунаправленный алгоритм
        Наследование инфомрации о направлении текста
        Устанока направления внедренного текста
        Приоритет над двунаправленным алгоритмом: элемент BDO
        Ссылки на символы для управления направлением и объединением
        Таблицы стилей и двунаправленность

Текст - Абзацы, строки и фразы
        Неоображаемые символы
        Структурированный текст
        Элементы фраз: EM, STRONG, DFN, CODE, SAMP, KBD, VAR, CITE, ABBR и ACRONYM
        Кавычки: элементы BLOCKQUOTE и Q
        Верхние и нижние индексы: элементы SUB и SUP
        Строки и абзацы
        Абзацы: элементы P
        Управление переходом на следующую строку
        Переносы
        Форматированный текст: элемент PRE
        Визуальное представление абзацев
        Разметка изменений в документе: элементы INS и DEL

Списки - Неупорядоченные, упорядоченные списки и списки определений
        Введение в списки
        Неупорядоченные списки (UL), упорядоченные списки (OL) и элементы списков (LI)
        Списки определений: элементы DL, DT и DD
        Визуальное представление списков
        Элементы DIR и MENU

Таблицы
        Введение в таблицы
        Элементы построения таблиц
        Элемент TABLE
        Captions таблиц: элемент CAPTION
        Грцппы строк: элементы THEAD, TFOOT и TBODY
        Группы столбцов: элементы COLGROUP и COL
        Строки таблицы: элемент TR
        Ячейки таблицы: элементы TH и TD
        Форматирвоание таблиц визуальными агентами пользователей
        Границы и rules
        Горизонтальне и вертикальное выравнивание
        Поля ячейки
        Представление таблиц невизуальными агентами пользователей
        Связь информации заголовка с ячейками данных
        Категоризация ячеек
        Алгоритм поиска заголовочной информации
        Пример таблицы



Рекомендуем


Выбрать мобильный и сотовый телефон
все недорогие гостиницы в Москве Аннино - цены
порно ролики бесплатно
Читайте наш ресурс, настоящий ресурс о любви. Знакомьтесь на форуме!
скачать класическую музыку mp3 лесбиянки видео
дизайн интерьера и основные факторы уюта
Часы g-shock секундомер.
  Веб-студия "W-studio.com.ua" © 2008
(032) 34-64-17