Главная      Учебники - Разные     Лекции (разные) - часть 24

 

Поиск            

 

: доклада. В. Н. Баталин. «Из опыта оцифровки кинофотодокументов в ргакфд»

 

             

: доклада. В. Н. Баталин. «Из опыта оцифровки кинофотодокументов в ргакфд»

ТЕЗИСЫ ДОКЛАДА.

В.Н.Баталин.

«Из опыта оцифровки кинофотодокументов в РГАКФД»

В настоящее время, в РГАКФД научно-справочный аппарат к кинофотовидеодокументам, созданный в целях учета и оперативного поиска необходимой информации, представляет собой единую систему архивных справочников, взаимодополняющих и взаимосвязанных друг с другом. К ним относятся описи (книги учета и описания), внутренние описи, (т.е. режиссерские и операторские монтажные листы, монтажные листы киновидеодокументов, описи киновидеосюжетов, внутренние описи фотоальбомов), каталоги, указатели к ним, тематические обзоры.

Специфика кинофотовидеодокументов как исторических источников обусловила тот факт, что основным инструментом для оперативного поиска информации являются каталоги.

Основными каталогами, раскрывающими состав и содержание кинодокументов являются систематический и именной каталоги, в должной мере раскрывающие содержание кинодокументов в конкретной и полной форме, обеспечивающие многоаспектный поиск информации на уровне сюжета по всему комплексу кинодокументов, хранящемуся в архиве (речь идет о более чем 40.000 ед.учета или наименований за период с 1896г. до наших дней),

Для фотодокументов основными каталогами, раскрывающими их состав и содержание, также являются систематический и именной каталоги. Помимо них есть также авторский каталог, каталог фотоальбомов и географический каталог.

В целом все каталоги фотодокументов на сегодняшний день насчитывают около 1.000.000 карточек.

Наши каталоги пока еще удовлетворяют потребности пользователей в архивной информации, но, тем не менее, возникла насущная необходимость внедрения в практику архива компьютерного описания кино- и фотодокументов.

Чем же обусловлена эта необходимость?

Прежде всего тем, что существующая "Схема единой классификации документной информации в систематических каталогах государственных архивов СССР" (М.,1978) прежде всего ориентирована на традиционную "бумажную" документацию и не всегда может помочь архивисту в правильной организации кинофотодокументов в каталогах (разработка в РГАКФД своей, усовершенствованной Схемы единой классификации полностью не решает этой проблемы). Это приводит к большим сложностям в индексации каталожных карточек, наличию при этом определенного субъективизма, и, в следствии этого, даже "потере" каталожных карточек среди разных отделов и подотделов каталогов (дублирование карточек для различных отделов и подотделов каталога не всегда приводит к желаемым результатам, а также существенно "раздувает" каталоги).

Применение компьютерного описания фотодокументов, например, значительно ускоряет процесс их описания, т.к. на 1 ед.хранения фотодокумента порой составляется 10 и более карточек для именного и систематического каталогов, то скорость описания массива фотодокументов, соответственно, также увеличивается в 10 и более раз. Появляется возможность оперативного внесения дополнительной информации в описания в процессе источниковедческих исследований и расшифровки, повышается уровень сохранности справочного аппарата (архив имеет печальный опыт кражи каталожных карточек из фотокаталогов, и нельзя полностью гарантировать отсутствия подобной возможности и в дальнейшем). Значительно снижается, в конечном итоге, также стоимость описания одного фотодокумента, т.к. отпадает необходимость типографского печатания бланков каталожных карточек, а также снабжения каждой каталожной карточки контрольным фотоотпечатком (заменой их будет единожды отсканированная компьютерная копия фотодокумента). Повышается привлекательность архивного труда.

Оцифровывание фотографий фотоальбомов также (помимо оперативного поиска информации) будет способствовать обеспечению сохранности альбомов, т.к отпадает необходимость выдачи оригиналов фотоальбомов исследователям в читальный зал.

Следует также отметить, что ежегодные пополнения кино- и фотокаталогов в архиве составляют более 18.000 карточек и все большей проблемой становится их включение в и без того переполненные каталоги. Очевидно, что традиционные архивные каталоги исчерпали, в нашем случае, запас наращивания информативности, и следующим, качественно другим научно-информационным инструментом, должны быть компьютерные технологии.

Именно поэтому, начиная с 1991г., в РГАКФД начала создаваться АИПС по составу и содержанию фотодокументов (работа велась параллельно с ведением традиционных каталогов).

В качестве основы базы данных фотодокументов была принята программа 4 th Dimension Runtime 2.1., предназначенная для работы на персональных компьютерах класса Apple Macintoch. Выбор компьютеров Apple Macintoch был обусловлен тем, что они, на тот период, лучше были приспособлены для работы с изображениями, чем IBM-совместимые компьютеры.

Программа с самого начала предполагала включать в себя и изображения, но так как в то время не было удобных и дешевых емких накопителей информации (существовавшие тогда стримеры не решали этой проблемы), первоначально база данных пополнялась описаниями фотодокументов без их изображений. Только в 1995г., с приобретением магнитно-оптических дисков емкостью по 120 мб, началась работа и по сканированию фотоизображений (с разрешением 75 точек на дюйм) и привязке их с описанием фотодокументов в базе данных.

По техническому заданию РГАКФД база данных разрабатывалась, тогда еще, советско-американским предприятием "Иитерсигнал". Я не буду вдаваться в технические детали этой программы (хотя ее возможности выглядят вполне достойно и сейчас), т.к. архив ведет в настоящее время работу по внедрению другой программы, и я остановлюсь только на некоторых проблемах, которые, на мой взгляд, были актуальны тогда и таковыми остаются и сегодня при организации баз данных с использованием изображений (в данном случае - фотоизображений). Но об этом несколько ниже.

Эта база данных к началу 2004г. насчитывала порядка 55.000 ед.хр. описаний и более 12.000 изображений (общим объемом 2.020 мегабайт).

Но так как архив, помимо фотодокументов, хранит и кино- видеодокументы, то в 1997 году, при финансовой поддержке Института "Открытое общество" (фонд Сороса), РГАКФД и американская компания "Абамедиа" приступили к созданию электронной версии кинокаталога.

Оригинальное программное обеспечение было разработано российской компанией "Киком".

Описание каждой единицы хранения кинодокумента для этой базы данных осуществляется на основе монтажного листа. При этом, почти в самом начале проекта, пришлось отказаться от идеи снабжения каждой аннотации кинодокументов 3-4 "стоп-кадрами". Это произошло из-за технической сложности в организации осуществления этой работы (такими "стоп-кадрами" была снабжена только "пилотная" версия Базы данных, объединяющая кинодокументы выпуска 1937 года), т.к. слишком велики оказались затраты машинного времени при переводе кинодокументов на видеопленку, да и такого количества стоп-кадров явно недостаточно для того, чтобы иметь представление о содержании даже 10-ти минутной кинопленки.

Составляемая аннотация на кинодокументы, пока, носит обобщенный характер, и уступает, в целом, информативности традиционных каталожных каталогов, но этот временный недостаток компенсируется удобством поиска необходимой информации и оперативностью этого поиска, т.к. в настоящее время эта База данных, составленная на более, чем 40.000 единиц учета кинодокументов, доступна пользователям архивной информации как в читальном зале архива, так и в Интернете. Эта же программа применяется и для описания хранящихся в архиве видеодокументов.

Следующим этапом будет включение, помимо аннотации, в описание каждой ед.учета и монтажного листа целиком, с возможностью также осуществлять по нему контекстный поиск. А в перспективе, с использованием мультимедийных средств, дающих возможность просмотра на мониторе компьютера кинодокументов в совокупности с поисковыми возможностями базы данных, уже можно будет говорить о качественно иных, более высоких, возможностях использования архивных кинодокументов, и о базе данных как полноценной замене традиционных кинокаталогов. С учетом особенностей носителя, подобная перспектива реальна, в первую очередь, для видеодокументов. Но, прежде, чем приступить к реализации этой программы, необходимо определиться с выбором формата, в котором изображения кинодокументов должны быть записаны и быть доступными с помощью Интернета.

Но вернемся к фотодокументам. Как уже отмечалось выше, база данных фотодокументов, работа по созданию которой началась в 1991г. и на соответствующих тому времени компьютерах, конечно, физически и морально устарела к настоящему времени, и уже не отвечала сегодняшним требованиям. Поэтому, когда была внедрена база данных кинодокументов, перед архивом встала дилемма: или обновить парк купленных в начале 90-х годов компьютеров Apple Macintoch, купить новую, современную версию программы 4 th Dimension Runtime (она существует и сейчас), и продолжить ведение этой базы данных, или же, с учетом того, что в настоящее время подавляющее большинство в архиве компьютеров были уже IBM-совместимые, на них разместить новую программу, при этом попытаться сконвертировать "макинтошевскую" базу данных под нее. Нами был выбран второй путь, хотя более рискованный, но более оправданный в смысле унификации компьютерного парка в рамках всего архива.

В 2003 году при финансовой поддержке фонда Форда РГАКФД и С.-Петербургская фирма "Альт-Информ" заключили договор о разработке и внедрении новой базы данных фотодокументов. Помимо разработки программно-информационного комплекса ИКАР (на основе СУБД Oracle), "Альт-Информ" бралась осуществить конвертацию текстовых описаний и изображений каталога фотодокументов из существующей базы данных Macintosh в ИКАР, при этом должна была осуществиться привязка к тематическому рубрикатору, справочнику персоналий, другим информационно-справочным ресурсам. ИКАР является сетевой программой, поэтому был осуществлен монтаж локальной вычислительной сети, приобретен WEB-сервер, и архивом было куплено право использования ИКАР'а на 12 рабочих местах. Было также оборудовано рабочее место с цифровой фотокамерой для оцифровывания фотоснимков в альбомах.

В этом году началась работа по описанию фотодокументов для базы данных ИКАР с одновременным снабжением этих описаний отсканированными изображениями фотодокументов. Параллельно, компанией "Альт-Информ" была проведена успешная конвертация "макинтошевской" базы данных фотодокументов под программу ИКАР. В настоящее время база данных фотодокументов состоит из конвертированных 55.000 описаний и 12.000 изображений, и новых 22000 (июнь-проект) описаний с изображениями.

Уже сейчас можно сказать, что достаточно рискованное решение о конвертации "макинтошевской" базы данных фотодокументов себя оправдало и архив располагает теперь современной, удобной в эксплуатации, базой данных.

В свете уже имеющегося, более чем десятилетнего опыта создания в РГАКФД автоматизированных архивных технологий, я хотел бы остановиться, но лишь конспективно, из-за ограниченности времени, на некоторых вопросах.

Прежде всего это проблема осуществления тематической выборки документов. В РГАКФД это осуществляется, применительно к фотодокументам, с помощью цифровых индексов, которые разработаны в РГАКФД на основе "Схемы единой классификации документной информации в систематических каталогах государственных архивов СССР", но умещаются на 4 страницах. В Базе данных на кинодокументы также используется этот четырехстраничный классификатор, но темы расписываются в поле для ключевых слов и не в цифровом, а в расшифрованном понятийном виде. Но и в том и другом случае грамотно сформулировать необходимый тематический запрос может только архивист, или исследователь, имеющий перед собой этот классификатор - так было в старой "макинтошевской" базе данных фотодокументов, так и в существующей базе кинодокументов. В то же время, архивы должны будут разместить, рано или поздно, эти базы данных в Интернете - пользу от этого мы уже ощутили, разместив в Интернете базу данных по кинодокументам, в том числе, частично, и на английском языке. Поэтому пользователь Интернета должен, желательно, иметь возможность получить подсказку в виде перечня имеющихся в Базе тем. Другое дело, в каком виде - цифровом или буквенном, и как велик будет этот перечень, но в любом случае, он не должен быть так велик как СЕК, тем более, что Схемы единой классификации дореволюционного и советского периода имеют одинаковые индексы для совершенно различных понятий и, поэтому, не могут использоваться в Базах данных, например у нас в РГАКФД, хранящем документы с XIX-го века до наших дней. Необходимость возможности тематической выборки обусловлена и тем, что терминология имеет свойство устаревать, и понятия, всем широко известные в одну эпоху, забываются в другую (уже не все помнят, например, кто такие "двадцатипятитысячники"), поэтому нельзя ориентироваться в целом на возможность контекстного поиска информации. В новой базе данных фотодокументов эта проблема решена путем предлагаемого списка используемых в базе данных тем в соответствующей графе редактора поиска. Кстати, возможность подобной "подсказки" применена в редакторе поиска и для других, помимо тем, понятий. При разработке программного обеспечения баз данных следует также предусматривать возможность редактирования организованного в алфавитном порядке списка ключевых слов с целью исключения из него "информационного мусора" в виде слов с опечатками, лишних пробелов и т.п.

Упомянув Интернет, следует при этом отметить, что размещение документов в Интернете считается публикацией и подпадает под закон "Об авторском и других смежных правах", что, в первую очередь, касается фотодокументов. Поэтому следует предусмотреть или возможность программными средствами ограничить доступ к определенным документам, или же не размещать их в Интернете до истечения ограничительного срока. Естественно, речь идет об изображении фотодокументов, при этом качество изображений в размещенной в Интернете Базе данных не должно быть высоким, чтобы исключить несанкционированное использование изображений фотодокументов в полиграфических целях. В то же время, представляется желательным иметь в архиве цифровые копии фотодокументов с высоким разрешением, которые несли бы функцию страховых копий фотодокументов, а также позволяли бы, например, изготавливать по заказу на специализированных принтерах фотоотпечатки на фотобумаге, или же предоставлять заказчикам копии на цифровых носителях для полиграфических нужд. Это может быть особенно удобно при предоставлении копий цветных фотодокументов, так как процесс изготовления их традиционным фотохимическим способом трудоемок и дорог, и, например, в РГАКФД не осуществляется.

Само понятие страховой цифровой копии документа, в данном случае фотодокумента, обусловлено появлением аудиовизуальных документов изначально изготовленных на цифровых носителях и все большее количество издательств газет и журналов работают с фотографиями, снятыми цифровыми камерами. Соответственно и архивы уже ими комплектуются. При наличии у архива денег (и, к сожалению, немалых) можно, конечно, приобрести соответствующую технику и осуществлять вывод цифровых документов на 35-ти мм пленку и хранить эти пленки как страховые копии, но мне представляется это лишь данью традиции материальности, в физическом смысле, документов. Правда, в РГАКФД подобная технология применяется, но для осуществления компьютерной реставрации изображений фотодокументов.

Думается, что настала необходимость узаконить понятие "страховой цифровой копии документов", тем более, что все большее распространение получают электронные документы и электронные подписи.

Теоретически, цифровую информацию можно сколько угодно раз копировать без потери информации, другое дело, что долговременное хранение оцифрованных документов (любых, в том числе и баз данных) ставит проблему выбора носителя цифровой информации. Конечно, "только пирамиды вечны", но уже и сейчас существуют достаточно долговечные и недорогие носители (типа СD и DVD-дисков), будут появляться новые, поэтому необходимо будет лишь своевременно и в необходимом количестве осуществлять копирование информации.

При разработке программного обеспечения баз данных также желательно предусматривать возможность и пути их адаптации, в будущем, к новому программному обеспечению и новому компьютерному "железу" - с подобной проблемой мы впервые столкнулись после того, как был ликвидирован бывший кинофотофоноархив Российской федерации в г.Владимире и нам были переданы как кинофотодокументы, так и научно-справочный аппарат к ним, который включал и базы данных на кинофотодокументы, предназначенные для эксплуатации на 286-х моделях компьютеров - ни на чем ином эти базы данных работать не желали.

Еще большей проблемой была конвертация "макинтошевской" базы данных фотодокументов под программу ИКАР, о которой уже говорилось выше, и которую успешно осуществила С.-Петербургская фирма "Альт-Информ" (насколько мне известно, в мире еще никому не удавалось сделать подобное).

Следует также отметить, что взгляд на компьютерную информацию как нечто нематериальное и, следовательно, малонадежное, во многом тормозит внедрение компьютерных технологий, приводит к ненужному дублированию при проведении некоторых архивных работ (например, продолжение параллельного ведения компьютерных баз данных и традиционных каталогов).

Конечно, подобная ситуация на определенном этапе естественна, но рано или поздно от подобного дублирования придется отказываться, т.к оно приводит к нерациональному расходованию и так небольших трудовых и финансовых ресурсов архивов.