Простейший и наиболее давно применяемый формат текстового документа – простой текст (plain text). В этом формате возможно хранение только текстовой информации. Любая дополнительная информация – графические изображения, информация о шрифтах в тексте и т.п. – требует другого формата .
В формате plain text каждый символ текста – буква, цифра, пробел и т.п. – кодируется в виде определённого количества байт цифровой информации по таблице кодировки.
Наиболее распространён восьмибитный вариант простого текста (8-bit plain text). Восьмибитная таблица кодировки устанавливает для каждого символа соответствующее 8-битное значение. Каждый символ кодируется в один байт. Последовательность символов превращается в такое же количество байтов; первый байт соответствует первому символу, второй байт – второму символу и т.д.
Чтобы раскодировать такой текст, компьютер последовательно подставляет каждый байт в таблицу кодировки и выводит соответствующий символ.