Простой текстовый формат. Кодирование текста

ТЕХНОЛОГИЯ ПОДГОТОВКИ ТЕКСТОВОЙ ИНФОРМАЦИИ

Простой текстовый формат. Кодирование текста

Простейший и наиболее давно применяемый формат текстового документа – простой текст (plain text). В этом формате возможно хранение только текстовой информации. Любая дополнительная информация – графические изображения, информация о шрифтах в тексте и т.п. – требует другого формата .

В формате plain text каждый символ текста – буква, цифра, пробел и т.п. – кодируется в виде определённого количества байт цифровой информации по таблице кодировки.

Наиболее распространён восьмибитный вариант простого текста (8-bit plain text). Восьмибитная таблица кодировки устанавливает для каждого символа соответствующее 8-битное значение. Каждый символ кодируется в один байт. Последовательность символов превращается в такое же количество байтов; первый байт соответствует первому символу, второй байт – второму символу и т.д.

Чтобы раскодировать такой текст, компьютер последовательно подставляет каждый байт в таблицу кодировки и выводит соответствующий символ.

Hosted by uCoz