Текстовый файл
Материал из Википедии — свободной энциклопедии
Те́кстовый файл (см. текст) является формой представления последовательности символов в компьютере. Каждый символ из используемого набора символов кодируется в виде одного байта, а иногда в виде последовательности подряд идущих двух, трёх и т.д. байтов.
Текстовые файлы разбиваются на строки. На современных платформах разбиение на строки кодируется управляющим символом перевода строки, а иногда последовательностью двух управляющих символов (на некоторых старых платформах разбиение на строки делалось иначе). Вообще, текстовые файлы могут содержать печатные символы, такие как буквы, цифры и знаки препинания и некоторое количество управляющих символов, таких как знаки табуляции и перевода строки.
Текстовым файлам противопоставляются двоичные (бинарные) файлы, в которых информация организована по иным принципам.
Бо́льшая часть компьютерного оборудования и программ не различают текстовые и двоичные файлы. Существует, однако, большое количество программ, предназначенных специально для обработки текстовых файлов или таких программ, которые по–разному обрабатывают текстовые и двоичные файлы. Многие сетевые протоколы, рассчитаны на работу только с текстовыми данными и не могут обрабатывать произвольную последовательность байтов. Программы для ручного набора текстовых файлов называются текстовыми редакторами.
[править] Простой текст как основа для других форматов
Текстовые файлы часто используются для представления данных, которые сами не являются чисто текстовыми. В этом случае другие форматы файлов «надстраиваются» над простым текстом. Это обеспечивает удобство работы с данными на двух уровнях: например, файлы HTML и XML можно просматривать и редактировать с показом всего форматирования в режиме WYSIWYG, а можно их открыть в обычном текстовом редакторе и иметь доступ ко всем тонкостям языка разметки. При хранении данных в бинарном виде (как в Microsoft Word ранних версий) можно работать только в режиме WYSIWYG.
Языки программирования почти исключительно используют простой текст в качестве основы. В частности, это позволяет использовать для обработки текстов программ разнообразные стандартные утилиты. Ранние интерпретаторы Бейсика сохраняли исходный код в своём собственном бинарном формате, но потом от этого отказались из-за очевидных неудобств.
Файлы конфигурации многих программ используют текстовый формат, даже если там хранятся числа и двоичные переключатели (да/нет). Хотя это вводит небольшое усложнение в программы из-за необходимости преобразования бинарных данных в текст и обратно, но зато намного упрощается отладка; кроме того, при необходимости можно подправить конфигурацию «вручную», без использования собственных средств настройки данной программы.
[править] Расширения имён файлов
В Windows для текстовых файлов используется расширение «txt», тем не менее, многие файлы с другими расширениями могут оказаться текстовыми. Например, исходные коды, обычно, хранятся в файлах с расширениями, соответствующими языку программирования, на котором они написаны.