Автоматическое преобразование кодировок и форматов

ТЕХНОЛОГИЯ ПОДГОТОВКИ ТЕКСТОВОЙ ИНФОРМАЦИИ

Автоматическое преобразование кодировок и форматов

Существует великое множество программных инструментов, позволяющих автоматически преобразовывать данные из одного формата в другой.

Простейший пример – перевод файла формата plain text из одной кодировки в другую, например, из CP1251 в КОИ-8R. Существует целый ряд программ для этой цели. Некоторые из них даже могут автоматически определить кодировку, в которой кириллический текст записан в файл.

Существует достаточно развитый набор инструментов для автоматического преобразования файлов в форматах, основанных на XML. Это – одна из сильных сторон формата XML. Такие инструменты позволяют, например, автоматически преобразовать подготовленный текст в Web-страницу и, одновременно, создать его версию для распечатки.

Иногда работа с автоматической обработкой текста вплотную подходит к полноценному программированию. Так, система автоматической вёрстки TeX преобразует документ, подготовленный в специальном текстовом формате, в готовую свёрстанную статью или книгу (в частности, со сложными формулами). Формат TeX достаточно сложен; он представляет из себя практически язык программирования. TeX позволяет создавать формулы, размещать рисунки и т.п.; он предназначен для подготовки научных текстов и достаточно популярен в научной среде.

Подробное описание возможностей XML, TeX и других инструментов для автоматической работы с текстом, к сожалению, выходило бы далеко за рамки данного курса.

Hosted by uCoz