Объём файла и объём текста

ТЕХНОЛОГИЯ ПОДГОТОВКИ ТЕКСТОВОЙ ИНФОРМАЦИИ

Объём файла и объём текста

При использовании формата plain text (простой текст) и 8-битной кодировки размер файла (в байтах) почти точно соответствует объёму текста (в символах).

Однако если используется многобайтовая кодировка, а также для файлов других форматов (не plain text) соотношение объёма файла и объёма текста может быть самым разнообразным.

Следует понимать, что реальный информационный объём текста не определяется размером файла. Вычисление его – весьма сложная задача, но можно с уверенностью сказать, что он меньше размера файла формата plain text.

Специальные программы – архиваторы, такие как Zip и RAR – сжимают файлы, чтобы они занимали меньше места; это обычно используется для облегчения передачи файлов или их переноса с одного компьютера на другой. Сжатый файл успешно разжимается тем же архиватором без какой-либо потери информации.

Архиваторы могут работать именно потому, что реальный информационный объём данных меньше объёма файла. При помощи специальных алгоритмов они “отбрасывают” ненужный объем, сохраняя только полезную информацию. Затем они восстанавливают по этой информации полное содержимое файлов. 

Hosted by uCoz