ГОСТ и ISO 8859-5
Основная кодировка согласно ГОСТ 19768-87 была принята в 1987 г. взамен КОИ-8, однако использовалась мало. Основную кодировку поддерживало только оборудование и программное обеспечение, производившееся в СССР (ЕС ПЭВМ, Лексикон, ...), а также некоторые принтеры Epson.
Гораздо более популярной оказалась описанная в том же ГОСТе альтернативная кодировка (с тем же набором символов, но в другом порядке).
На базе основной кодировки была создана ISO 8859-5, но и она не нашла широкого применения. ISO 8859-5 — не очень удобная кодировка, поскольку в ней отсутствуют многие нужные символы, такие как тире (—), кавычки-ёлочки («»), градус (°) и др.
ISO 8859-5 - единственная "узаконенная" международной организацией стандартизации (ISO) кодировка русского языка. Используется на больших UNIX машинах (в основном фирм DEC и Sun Microsystems). (RFC1345, RFC1700).
Стандарт ISO 8859-5 является международным и поэтому в нем представлены не только символы алфавита русского языка, но и других языков, использующих кириллицу:
Белорусский
Украинский
Болгарский
Сербский
Македонский
Это обстоятельство является особенно важным при разработке систем предачи, обработки и хранения информации. Именно поэтому кодировка ISO 8859-5 получила широкое распространение в программных продуктах, устройствах ввода и отображения информации крупных производителей программного обеспечения и вычислительной техники. Кроме этого, кодировка ISO 8859-5 широко используется в основных международных и индустриальных стандартах средств обработки, и передачи информации.
Русские буквы в кодировке ISO 8859-5 расположены в алфавитном порядке. Коды с 176 по 207 - заглавные буквы, коды с 208 по 239 - строчные буквы. Остальные cимволы кириллицы, включая русскую букву "Ё", располагаются на местах 161 - 175 (заглавные буквы) и 241 - 255 (строчные буквы). Коды символов кириллицы имеют смещение 864 (0x0360) отосительно универсальной шестнадцатибитной кодировки ISO 10646.
Управляющие, латинские и специальные символы с кодами от 0 до 160 эквивалентны соответствующим символам в кодировке ISO 8859-1 (Latin Alphabet No. 1).
В таблице указано расположение русских букв в второй половине расширенной кодовой таблицы. Нижняя часть таблицы кодировки (латиница) полностью соответствует кодировке ASCII.
Указатель MIME этой кодовой таблицы для HTML документов имеет вид: "Content Type: text/html; charset=ISO-8859-5"
|