Обработка текстовых файлов на языке Паскаль

Автор: Пользователь скрыл имя, 02 Ноября 2011 в 19:32, курсовая работа

Описание работы

Прежде чем перейти к обработке текстовых файлов на языке Pascal следует разобраться с понятием файл. На языке Pascal файл представляет собой упорядоченную последовательность элементов. И в отличие от общепринятого понятия файлом на языке Pascal может быть не только информация хранящиеся на дисках но и внешние устройства (такие как: дисплей, клавиатура, принтер , любой порт ЭВМ и т.д.).

Работа содержит 1 файл

kursovik.doc

— 137.00 Кб (Скачать)

Министерство  образования Азербайджанской  Республики 

Бакинский Государственный  Университет 

Факультет: Прикладная Математика и Кибернетика 
 

Специальность: Экономическая кибернетика 

Курс: I курс 

Группа: ЭК-24 

КУРСОВАЯ  РАБОТА НА ТЕМУ 

«ОБРАБОТКА  ТЕКСТОВЫХ ФАЙЛОВ НА ЯЗЫКЕ ПАСКАЛЬ» 

Кафедра: Экономическая информатика 

Студент: Шарифов Р. Э. 

Руководитель: Зав. кафедрой проф. Пашаев Р.Т. 
 
 
 
 
 
 

  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Баку - 2005

ОБРАБОТКА ТЕКСТОВЫХ ФАЙЛОВ 

       Прежде чем перейти к обработке  текстовых файлов на языке Pascal следует разобраться с понятием файл. На языке Pascal файл представляет собой упорядоченную  последовательность элементов. И в отличие от общепринятого понятия файлом на языке Pascal может быть не только информация хранящиеся на дисках но и внешние устройства (такие как: дисплей, клавиатура, принтер , любой порт ЭВМ и т.д.).

       Теперь рассмотрим причину использования файлового типа данных при разработке программ. Введение файлового типа в язык Pascal вызвано необходимостью обеспечить возможность работы с периферийными (внешними) устройствами ЭВМ, предназначенными для ввода, вывода и хранения данных. Общее свойство массива, множества и записи заключается в том, что количество их компонентов определено на этапе написания программы (то есть в исходном тексте программы), тогда как количество компонентов файла в исходном тексте программы не определяется и может быть произвольным. Это обстоятельство позволяет оперативно изменять, к примеру, входные данные независимо от программы.

      Принцип работы с файлами заключается в вводе и выводе данных. Операция ввода означает перепись данных из входного файла в основную память ЭВМ, а операция вывода это пересылка данных из основной памяти ЭВМ на выходной файл.

      Файлы расположенные на внешних устройствах часто называют физическими файлами. Их имена определяются операционной системой. В программах на языке Pascal имена файлов задаются с помощью строк. Например, имя файла на диске может иметь вид:

     ‘[имя диска]:\[каталог]\[подкаталог]\...\[подкаталог]\[имя файла с расширением]’

    Операционная система MS-DOS ограничивает эту строку до 79 символов. Даже в одноименном модуле DOS языка Pascal имеется тип данных PathSTR = String[79], то есть строка, максимальная длина которой 79 символов. Если же файл находится в том же каталоге, что и программа то имя файла можно указать короче : ‘[имя файла с расширением]’. Также именами файлов могут быть и имена внешних устройств:

     ‘CON’,   'LPT1',   ‘LPT2’,   ‘LPT3’,   'PRN',  'COM1',  'AUX',  'NUL'.

     Отмечу что, здесь CON – совокупность устройств ввода-вывода, где устройство ввода клавиатура, а устройство вывода дисплей; 'LPT1',   ‘LPT2’,   ‘LPT3’ – последовательность устройств для печати и ‘LPT1’ синонимичен с 'PRN' и является обыкновенным принтером; 'COM1' – это последовательный порт ЭВМ и т.д.

     С файловой системой в Turbo Pascal связано понятие буфера ввода - вывода. Ввод и вывод данных осуществляется через буфер. Буфер - это область в памяти, которая выделяется для каждого файла. При записи в файл вся информация сначала направляется в буфер и там накапливается до тех пор, пока весь объем буфера не будет заполнен. Только после этого или после специальной команды сброса происходит передача данных на внешнее устройство. При чтении из файла данные вначале считываются в буфер, причем данных считывается не столько, сколько запрашивается, а сколько поместится в буфер. Механизм буферизации позволяет более быстро и эффективно обмениваться информацией с внешними устройствами.

     Теперь перейдем к переменным файлового типа. Язык Pascal поддерживает 3 файловых типа:

      -1-ый – текстовые файлы.

     -2-ой – типизированные файлы.

     -3-ий – нетипизированные файлы.

     Описание переменных к этим трем файловым типам данных выглядит следующим образом:

     -для текстовых файлов : Var T:Text; {T-файловая переменная текстового типа}

     -для типизированных файлов : Var F:File of тип_данных; {F-типизированная файловая  переменная; тип_данных – любой  тип данных языка Pascal кроме  файлового типа}

     -для нетипизированных файлов : Var F:File; {F-нетипизированная файловая переменная}

      Файловые переменные, которые описаны  в программе, называют логическими  файлами. Все основные процедуры  и функции, обеспечивающие ввод - вывод данных, работают только  с логическими файлами. Физический файл должен быть связан с логическим для выполнения определённых действий над ним. В последствие будут изложены стандартные функции и процедуры для работы с файлами и в особенности для обработки текстовых файлов.

    Особое место на языке Pascal занимают текстовые файлы, которые являются темой настоящей курсовой работы. Текстовый файл представляет собой линейную последовательность символов, организованных в строки переменной длины.

     В конце строк стоит признак конца строки EOln (в операционной системе MS-DOS, а как следствие и в её оболочке MS-Windows End Of Line состоит из двух символов: LF- перевод строки , имеющий порядковый номер в ASCII таблице #10 и CR - возврат каретки c порядковым номером в ASCII таблице #13). В самом конце текстового файля стоит признак конца файла EOF (End Of File имеющий порядковый номер в ASCII таблице -#26). Признак конца строки вводится при помощи нажатия клавиши Enter, а признак конца файла при помощи нажатия клавиш Ctrl+Z. Обычно эти специальные символы или признаки не отображаются в текстовых редакторах.

     В текстовом файле всегда имеется так называемый курсор или указатель который стоит на определенном символе. Если файл пустой то первым и единственным считанным символом будет EOF (#26).

     Помимо текстовых переменных вводимых программистом но языке Pascal имеются также стандартные файловые переменные текстового типа: Input и Output. Стандартная текстовая переменная Input представляет собой доступный только для чтения файл, связанный со стандартным файлом ввода операционной системы. Стандартная текстовая переменная Output – это доступный только для записи файл, связанный со стандартным файлом вывода. Обычно стандартным файлом ввода-вывода является внешнее устройство – Консоль (‘CON’) о котором уже говорилось выше.

      В чем же суть обработки  текстовых файлов? Учитывая специфику  слова “обработка”, под обработкой текстовых файлов можно понять считывание информации со входного файла, изменение информации и записи этой информации на выходной файл. Запись не читанных со входного файла текстовых данных на выходной файл является видоизменением текстового файла, но не подпадает под понятие обработка текстового файла.

     Теперь самое время перейти к стандартным функциям и процедурам, которые Pascal предоставляет нам для работы с текстовыми файлами и в некоторых случаях с файлами вообще.

      Процедура Assign([файловая переменная],[имя файла]);

      Для работы с файлами вторым важным действием после объявления файловой переменной является “связывание” этой переменной с физическим файлом. Это действие и выполняет процедура Assign.То есть выполняя действия над файловой переменной программа, ассоциирующая файловую переменную с конкретным физическим файлом, производит операции именно над этим физическим файлом. Как было отмечено процедура Assign является обязательной для работы с файлами. С одним и тем же физическим файлом можно связать несколько файловых переменных. Также с одной файловой переменной можно последовательно связать различные физические файлы. Причём при последовательном связывании с одной и той же переменной различных физических файлов операции произведённые над переменной до связывания становятся недействительными. Например следует дважды открыть одну и ту же переменную дважды связанную с различными файлами для чтения: Assign(T,’file1.txt); Reset(T); Assign(T,’file2.txt’); Reset(T);. О процедурах открытия файлов будет говориться ниже.

     Что касается стандартных входных и выходных текстовых файлов Input и Output то они автоматически связываются со стандартным устройством ввода-вывода (обычно это совокупность устройств – дисплей и клавиатура). То есть два оператора Assign(Input,’CON’); Assign(Output,’CON’); выполняются по умолчанию и их не следует писать.

    Приведём пример программы использующей процедуру Assign:

Program Assign_my_file;

 Var T:Text; {Описание текстовой переменной}

 Begin

 Assign(T,’my_file.txt’); {Сопоставление внешнему текстовому файлу my_file.txt текстовой переменной T}

End.

Процедура Assign работает со всеми типами файлов.

   

    Процедура Reset ([файловая переменная]);

   Открывает  логический файл (то есть файловая переменная связанная с физическим файлом) для чтения. Естественно, что для чтения следует открывать входной файл. После выполнения процедуры Reset курсор ставится на первый элемент файла (в случае текстового файла на первый символ) и с файла уже можно считывать информацию. Если текстовый файл пустой, то первым символом будет EOF - #26.

    Приведём пример программы использующей  процедуру Reset:

Program Reset_my_file;

Var T:Text;

Begin

Assign(T,’my_file.txt’);

Reset(T); {Открытие файла для чтения}

End.

  Что касается стандартного входного текстового файла Input то он открывается для чтения автоматически. То есть не следует писать Reset(Input); в программе.

    Процедура Rewrite([файловая переменная]);

    Создает и открывает внешний физический файл связанный с файловой переменной для последующей записи в него. Новый созданный файл бывает пустой и курсор становится в самое начало файла. Если описанный в процедуре Assign внешний файл уже существует, то он стирается и создаётся заново. Разумеется после выполнения процедуры Rewrite созданный для записи файл является выходным файлом. Процедура Rewrite используется со всеми файловыми типами данных.  

      Приведём пример программы использующей процедуру Rewrite:

Program Rewrite_my_file;

Var T:Text;

Begin

Assign(T,’my_file.txt’);

Rewrite(T); {создаёт новый файл my_file.txt для последующей записи в него}

End.

  Что  касается стандартного выходного  текстового файла Output то он открывается для записи автоматически. То есть не следует писать Rewrite(Output); в программе.

     Процедура Append([файловая переменная]);

     Открывает внешний физический текстовый файл связанный с файловой переменной для последующей записи в него. Однако в отличии от процедуры Rewrite этот файл существует запись производится в самый конец файла. Разумеется процедура Append используется для открытия выходных текстовых файлов. После открытия файла курсор становится в самый конец файла. Процедура Append используется только для текстовых файлов.

     Приведём пример программы использующей  процедуру Append:

Program Append_my_file;

Var T:Text;

Begin

Assign(T,’my_file.txt’);

Append(T); {Открывает логический файл для последующей записи информации в самый конец}

End.

Информация о работе Обработка текстовых файлов на языке Паскаль