Главная Учебники - Разные Лекции (разные) - часть 33
Міністерство освіти і науки України Житомирський державний технологічний університет Лабораторна робота №1 з курсу «Системне програмування» на тему: «Програми копіювання файлів»
м. Зміст
1. Навчитися користуватись програмами copy1.exe та copy2.exe. 2. Розібрати роботу програм 2.1 Робота програми «COPY1.EXE» 2.2 Робота програми «COPY1.EXE» 3. Експерименти з «copy1.c» 4. Експерименти з «copy2.c» Контрольні запитання Висновок Список використаної літератури Програми «COPY1.С» та «COPY2.С» призначені для копіювання файлів. Програма «COPY1.С» використовує функції роботи з file handles, а «COPY2.С» - функції потокового вводу-виводу. Для користування програмами: · їх необхідно скомпілювати та отримати виконавчі файли «COPY1.EXE» та «COPY2.EXE»; · запустити необхідну програму за допомогою командного рядка, ввівши відповідно "ім’я_прогрми" "файл_з_якого_копіювати" "файл_в_який_копіювати"; програма копіювання файл 2.1 Робота програми «COPY1.EXE»
Підключаємо заголовочні файли для використання функцій та змінних: #include <io.h> //open(), eof(), read(), write(), close()
#include <conio.h> //getch()
#include <stdio.h> //printf()
#include <stdlib.h> //exit()
#include <fcntl.h> //O_BINARY, O_RDONLY, O_WRONLY, O_CREAT, O_EXCL, O_TRUNC
#include <sys\types.h> //
#include <sys\stat.h> //S_IREAD, S_IWRITE
#include <alloc.h> //
#include <errno.h> //EEXIST
Макрос, що визначає розміру масиву #define BUFSIZE 10000
Функція main() має два аргументи: цілочисельний аргумент argc який містить кількість аргументів у командному рядку та покажчик на масив покажчиків на рядки, де кожен вказує на певний аргумент командного рядка. void main( int argc, char **argv ) {
Оголошуємо змінні: int source, target;
int i;
char *buffer;
int count;
Перевіряємо чи правильна кількість аргументів у командному рядку. Якщо аргументів не три (програма, файл для копіювання, файл-копія), виводиться повідомлення про правильність заповнення командного рядка і виконання програми завершується. if( argc != 3 ){
printf( "\n"
"Usage: COPY1 [d:][\\path]source_file [d:][\\path]target_file\n" );
getch();
exit( 1 );
}
Відкриваємо файл, який будемо копіювати за допомогою функції open(). Для цього передаємо в якості параметрів покажчик на імя файлу (argv[ 1 ]) та вказуємо типи доступу до файлу. O_BINARY - прапор доступу у бінарному режимі. O_RDONLY - прапор доступу до файлу "лише для читання". Функція open() у випадку успішного виконання повертає file handle і встановлює курсор на початок файлу, а у випадку помилки повертає -1 та встановлює errno в один із наступних станів: ENOENT, EMFILE, EACCES, EINVACC. Даним if-ом перевіряємо успішність відкриття файлу, який варто копіювати. if( ( source = open( argv[ 1 ], O_BINARY | O_RDONLY ) ) == -1 ) {
printf( "\nOpen source file error: %d", errno );
getch();
exit( 2 );
}
Відкриваємо файл, в який будемо копіювати за допомогою тієї ж функції open(). Прапор доступу до файлу встановлюємо в один із положень: · O_BINARY - бінарний; · O_WRONLY - для запису; · O_CREAT - створюється; · O_EXCL - перезаписується. Прапор способу відкриття встановлюємо в один із положень: · S_IREAD - може бути прочитаний; · S_IWRITE - може бути записаний. target = open( argv[ 2 ], O_BINARY | O_WRONLY | O_CREAT | O_EXCL,
S_IREAD | S_IWRITE );
Якщо при відкритті(створенні) файлу до якого буде відбуватися копіювання, errno дорівнює EEXIST (тобто файл з таким ім’ям вже існує), повідомити про існування файлу та запитати про необхідність його перезапису. if( errno == EEXIST ) {
printf( "\nFile already exists. Overwrite? (Y/N)\n" );
i = getch();
if( ( i == 'y' ) || ( i == 'Y' ) )
target = open( argv[ 2 ], O_BINARY | O_WRONLY | O_CREAT | O_TRUNC,
S_IREAD | S_IWRITE );
}
Перевірити чи вдалося створити файл . if( target == -1 ) {
printf( "\nOpen target file error: %d", errno );
getch();
exit( 2 );
}
Цілочисельній змінній count присвоїти значення макросу BUFSIZE. count = BUFSIZE;
Виділити пам’ять на масив buffer розміром count, та перевірити чи пам’ять дійсно виділена. if( ( buffer = ( char* )malloc( count ) ) == NULL ) {
printf( "\nNot enough memory" );
getch();
exit( 3 );
}
За допомогою оператора while, який буде виконуватися доти, доки функція eof() не знайде закінчення файлу, який копіюється, будемо виконувати читання та запис з вихідного файлу у вхідний. while( !eof( source ) ) {
За допомогою функції read() зчитаємо із файлу source до масиву buffer count байтів. if( ( count = read( source, buffer, count ) ) == -1 ) {
printf( "\nRead file error: %d", errno );
getch();
exit( 4 );
}
За допомогою функції write() запишемо до файлу target із масиву buffer count байтів. if( ( count = write( target, buffer, count ) ) == -1 ) {
printf( "\nWrite file error: %d", errno );
getch();
exit( 5 );
}
}
Закриємо відкриті файли та звільнимо пам’ять із буферу. close( source );
close( target );
free( buffer );
Проінформуємо про успішне копіювання. printf("File copy...");
getch();
}
2.2 Робота програми «COPY1.EXE»
Підключаємо заголовочні файли для використання функцій та змінних: #include <stdio.h>
#include <stdlib.h>
#include <time.h>
Оголошуємо прототип функції void filecpy( FILE *stream_from, FILE *stream_to );
Оголошуємо два символьних масиви розміром BUFSIZ*10; char buf1[ BUFSIZ * 10 ];
char buf2[ BUFSIZ * 10 ];
Функція main() має два аргументи: цілочисельний аргумент argc який містить кількість аргументів у командному рядку та покажчик на масив покажчиків на рядки, де кожен вказує на певний аргумент командного рядка. void main( int argc, char *argv[] ) {
Оголосимо змінні: time_t start, end;
FILE *stream_from, *stream_to;
Перевіряємо чи правильна кількість аргументів у командному рядку. Якщо аргументів не три (програма, файл для копіювання, файл-копія), виводиться повідомлення про правильність заповнення командного рядка і виконання програми завершується. if( argc < 3 ) {
printf( "\nUsage:"
" COPY2 [d:][\\path]source_file [d:][\\path]target_file\n" );
exit( 1 );
}
Відкриваємо файл, який варто копіювати, для читання. if( ( stream_from = fopen( argv[ 1 ], "rt" ) ) == NULL ) {
printf( "\nOpen source file error: %d", errno );
exit( 1 );
}
Відкриваємо файл, в який варто копіювати, для запису(якщо файлу не існує, він створюється, якщо існує - перезаписується). stream_to = fopen( argv[ 2 ], "wt+" );
Вмикаємо тактовий лічильник, і його стартове значення присвоюємо змінній start. start = clock();
Викликаємо функцію для копіювання і передаємо їй покажчик на файл який варто копіювати і на файл до якого необхідно копіювати. filecpy( stream_from, stream_to );
Вимикаємо тактовий лічильник, і його фінальне значення присвоюємо змінній end. end = clock();
Друкуємо інформацію про затрачений час на виконання функції і про розмір буферу який довелося використати. printf( "Copying time is %5.1f. Buffer size is %d bytes\n",
( ( float )end - start ) / CLK_TCK, BUFSIZ );
Відкриваємо файл, який варто копіювати, та файл до якого варто копіювати. if( ( stream_from = fopen( argv[ 1 ], "rt") ) == NULL )
exit( 1 );
stream_to = fopen( argv[ 2 ], "wt+" );
Задаємо буфери за допомогою функції setvbuf(), які будуть використовуватися у якості буферів потоків для операцій вводу/виводу. Причому для буферизації будемо використовувати повний об’єм буфера, оскільки використовується режим _IOFBF. setvbuf( stream_from, buf1, _IOFBF, sizeof( buf1 ) );
setvbuf( stream_to, buf2, _IOFBF, sizeof( buf2 ) );
Викликаємо функцію для копіювання, при цьому підраховуємо затрачений на її виклик час та використану пам'ять. start = clock();
filecpy( stream_from, stream_to );
end = clock();
printf( "Copying time is %5.1f. Buffer size is %d bytes\n",
( ( float )end - start ) / CLK_TCK, BUFSIZ * 10 );
Відкриваємо файл, який варто копіювати, та файл до якого варто копіювати. if( ( stream_from = fopen( argv[ 1 ], "rt") ) == NULL )
exit( 1 );
stream_to = fopen( argv[ 2 ], "wt+" );
Задаємо буфери. Але потіки не буферизується, оскільки використовується режим _IONBF
. setvbuf( stream_from, NULL, _IONBF, 0 );
setvbuf( stream_to, NULL, _IONBF, 0 );
Викликаємо функцію для копіювання, при цьому підраховуємо затрачений на її виклик час та використану пам'ять. start = clock();
filecpy( stream_from, stream_to );
end = clock();
printf( "Copying time is %5.1f. Buffers is not used\n",
( ( float )end - start ) / CLK_TCK );
exit( 0 );
}
Функція копіювання файлів з використанням потоку вводу/виводу. Аргументи: FILE *stream_from - покажчик на потік звідки копіювати; FILE *stream_to - покажчик на потік в який копіювати; Функція нічого не повертає і не використовує глобальних змінних. void filecpy( FILE *stream_from, FILE *stream_to ) {
Оголошуємо символьний масив на 256 знаків char linebuf[ 256 ];
За допомогою оператора while та функції feof() шукаємо кінець потоку з якого копіюємо. while( !feof( stream_from ) ) {
Використовуючи функцію fgets(), до масиву linebuf заносимо значенням із вихідного потоку stream_from. if( fgets( linebuf, 255, stream_from ) == NULL ) break;
Використовуючи функцію fputs(), із масив linebuf виштовхуємо значенням до вхідного потоку stream_to. if( fputs( linebuf, stream_to ) == EOF ) break;
}
Закриваємо файли. fclose( stream_from );
fclose( stream_to );
}
В програмі copy1.c замінити бінарний режим доступу до обох файлів на текстовий і запустити програму для копіювання досить великого бінарного файлу. Результати експерименту зафіксувати в зошиті. Пояснити причину ефекту
При зміні з бінарного режиму доступу до обох файлів на текстовий відбувається не повне копіювання (створений файл менший), а лише до символу Ctrl-Z (ASCII 1Ah), адже вважається, що досягнуто кінець файлу (умова EOF). В програмі copy1.c замінити бінарний режим доступу до файлу, який записується, на текстовий і запустити програму. Результати експерименту зафіксувати в зошиті. Пояснити причину ефекту.
При зміні з бінарного режиму доступу до файлу, який записується, на текстовий створюється не достовірна копія (створений файл більший), оскільки відбувається відображення кожного символу який був зчитаний у бінарному режимі. Таким чином пара, наприклад, символів CR LF не перетворюється в один символ нового рядка “\n”, а виводиться окремо як два символи. В програмі copy2.c знайти оптимальний розмір буферу. Обґрунтувати вибір.
На мою думку, оптимальним розміром буферу буде розмір кратний числу 512. Це можна поясноит тим, що функція дає виграш в продуктивності при перенесенні відразу цілої групи байтів (блоку) за одне звернення до функції. Максимальний виграш досягається тоді, коли розмір блоку який переноситься з програми в файл кратний розміру сектора диску, а саме 512 байт. В програмі copy2.c модифікувати програму так, щоб вона виводила на екран вміст файлу за допомогою функцій puts(), fputs(), printf(), fwrite(). Результати експерименту зафіксувати в зошиті. Пояснити причину ефекту.
При використанні функцій виведення на екран, відбувається виведення не екран інформації з вихідного файлу у тому вигляді, який передбачений відповідною функцією. При цьому затрачається більше часу на виконання програми. 1.
Чим відрізняється текстовий режим доступу до файлу від бінарного?
Як для потокових так і для префіксних функцій файлового введення-виведення можливі два різних режими доступу до файлу: текстовий та бінарний. В текстовому режимі виконується трансляція символів CR LF (0Dh 0Ah). При читанні інформації з файлу в цьому режимі пара символів CR LF перетворюється в один символ нового рядка “\n” а при записі ‑ символ нового рядка перетворюється в пару символів CR LF. Крім того, як тільки з файлу зчитується символ Ctrl-Z (ASCII 1Ah), вважається, що досягнуто кінець файлу (умова EOF). Таким чином, в текстовому режимі не вдається прочитати інформацію, розташовану після символу Ctrl-Z. При виконанні файлового введення-виведення в бінарному режимі жодного перетворення символів не відбувається, а всі вони розглядаються як такі що не мають якогось особливого сенсу. Режим доступу до файлу задається під час відкриття файлу через бібліотечну функцію відкриття або спеціальною зовнішньою змінною _fmode. 2. Що таке дескриптор(handle) файлу?
Відкриття файлів виконує функція АН = 3Dh MS-DOS. Пара регістрів DS:DX вказує на ASCIIZ-рядок, що містить специфікацію файлу, що відкривається як регулярний, або ім’я драйверу символьного пристрою. В регістрі AL задається режим відкриття файлу. Значення яке повертається функцією в регістр АХ є ціле число, це префікс (handle) або дескриптор файлу. При всіх наступних операціях доступу до відкритого файлу в MS-DOS для ідентифікації файлу повідомляється тільки префікс. 2.
Чим відрізняється префіксний доступ до файлу від потокового?
Бібліотечні функції Turbo C для роботи з файлами можна поділити на дві групи: потокові та префіксні. Як потокові, так і префіксні функції звертаються, в принципі, до тих самих викликам функцій MS-DOS. Однак, потокові функції виконують додаткову буферизацію інформації. Це призводить до подвійної буферизації інформації: на рівні бібліотечної функції і на рівні MS-DOS. Префіксні функції не виконують додаткову буферизацію, а відразу звертаються до префіксних функцій MS-DOS. 3.
В яких випадках більше доцільний потоковий доступ? Чому?
Префіксні функції дають виграш в продуктивності при перенесенні відразу цілої групи байтів (блоку) за одне звернення до функції. Максимальний виграш досягається тоді, коли розмір блоку який переноситься з програми в файл кратний розміру сектора диску (512 байт). Перенесення інформації між файлом і Сі-програмою по символам або по рядкам виявляється більш ефективним при використанні функцій потокового файлового введення-виведення. Отже, при виконанні даної лабораторної роботи було використано дві програми копіювання файлів «COPY1.С» та «COPY2.С». Програма «COPY1.С» використовує функції роботи з file handles, а «COPY2.С» - функції потокового вводу-виводу. Було проведено повний розбір роботи обох кодів програм, їх тестування, модифікацію та оптимізацію. Загалом у ході виконання лабораторної роботи були отримані всі необхідні знання та практичні навички для роботи з файлами. Список використаної літератури
1. Касаткін А.І. Управление ресурсами. - Минск: Вышейшая школа, 1992. 2. Касаткін А.І. Системное программирование. - Минск: Вышейшая школа, 1991.
|