Оцифровка архивных документов целевая программа. Оцифровка архивов - самый современный способ хранения документов! Оцифровка бумажных архивов: этапы

И.Е. Хворова

Процесс оцифровки документов для создания электронного архива

Статья посвящена процессу оцифровки - наиболее удобному механизму сохранения и использования информации в современных условиях. Автор рассматривает основные моменты процесса оцифровки архивных материалов, включая анализ возможных способов переведения документов в электронный вид, категории документов для оцифровки, форматы хранения электронных документов и исследование современных стандартов оцифровки. Также в статье анализируются необходимые условия для создания виртуального архива исторической персоналии или события в современном контексте. Особое внимание автор уделяет особенностям организации электронного ресурса, исследует существующие современные проекты по данной тематике и анализирует возможные трудности, с которыми может столкнуться исследователь при создании электронного архива.

Ключевые слова: оцифровка, архивный документ, электронный фонд пользования, виртуальный архив.

Реалии современной жизни все чаще требуют от нас активного использования новых информационных технологий. Информационная эпоха вносит свои коррективы также и в мир диалога архивных источников и исследователя. Современные цифровые технологии позволяют осуществлять самые глобальные идеи по созданию альтернативного поля хранения - хранения документов в виртуальной плоскости.

Оцифровка архивных документов на сегодняшний день является наиболее удобным инструментом для сохранения и использования информации. Она дает возможность для безопасного и более экономичного хранения, удобного поиска и использования

© Хворова И.Е., 2017

информации, а также для оперативного доступа к материалам архива. Процесс оцифровки документов основывается на идее формирования единого электронного фонда пользования (далее -ЭФП). ЭФП представляет собой совокупность электронных копий архивных документов, которые записаны на цифровые носители и предназначены для использования вместо подлинников документов1. Важным моментом при создании ЭФП является необходимость регламентации процесса его создания.

По мнению заместителя руководителя Федерального архивного агентства О.В. Наумова, основные цели оцифровки документов заключаются в расширении и упрощении доступа к документам архивного фонда, обеспечении сохранности подлинников путем постепенного вывода их из оборота использования, предоставлении доступа к электронному фонду, а также в ускорении процесса предоставления государственных услуг2.

Рассмотрим основные моменты процесса оцифровки. Прежде всего, необходимо учитывать, что архивный фонд Российской Федерации хранит обширный документальный массив. Таким образом, прежде чем начать сканирование самих документов, целесообразно провести оцифровку научно-справочного аппарата архива, создать электронные описи для поиска данных. Первоначальная оцифровка описей архива дает возможность пользователю не выходя из дома познакомиться с перечнем хранящихся документов и заказать интересующие документы по Интернету. При этом необходимо также учитывать факт научно-технической редакции заголовков дел - только если опись усовершенствована, можно начинать оцифровку фонда.

Категории документов для оцифровки включают в себя не только документы, для которых существует угроза утраты информации, но также наиболее ценные, уникальные материалы и востребованные документы. Критерии документов об уникальности и ценности документов несколько размыты, а востребованность не является постоянной величиной, поэтому при выборе материалов оцифровки часто возникает вопрос: какие документы необходимо переводить в цифровой вид в первую очередь? Возможно, добиться более результативной выборки будет проще, если в процессе отбора примут участие не только члены экспертной комиссии архива, но также и привлеченные профессионалы - историки, политологи, социологи, общественные деятели и др. Процесс создания такой рабочей группы требует четкой регламентации. Следует отметить, что, несмотря на сформулированные критерии отбора3, они не являются обязательными и региональные архивы

вправе сами выбирать те документы, которые нужно оцифровать в первую очередь.

Выбор способа оцифровки важен, так как носитель и формат представления материала также несет полезную для работы исследователя информацию, поэтому очень важно передать ее в наиболее точной, сопоставимой с подлинником форме.

В непосредственной оцифровке документов важно соблюдать все меры безопасности при работе с подлинником, особенное внимание необходимо уделить при сканировании книг и древних актов (свет, принтер, поведение специалиста при оцифровке должны соответствовать принятым нормам). В данном этапе ключевую роль играют финансовые возможности проекта по оцифровке - выбор оборудования для сканирования определяет степень безопасности этого процесса для подлинника. Выбор более экономичного аппаратного устройства неизбежно влечет за собой риск нанести непоправимый вред документам, а также сокращает шансы на создание сопоставимой, полноцветно заменяющей подлинник копии4.

При оцифровке документа делается минимум две копии подлинника - рабочая копия и мастер-копия. Оба материала должны быть замаркированы и зарегистрированы в специальном реестре. Благодаря такой системе регистрации поиск отсканированного документа будет более быстрым и комфортным для пользователя, а учетные данные позволят легко отслеживать документ в общей информационной системе архива.

Среди форматов хранения изображений наибольшее распространение у архивистов получили форматы TIFF и JPEG. Формат TIFF своей популярностью обязан возможности сохранения качества изображения благодаря алгоритмам сжатия данных без потерь. Формат JPEG обладает возможностью высокой степени сжатия, но при этом происходит потеря качества изображения. Изменения могут быть незаметны невооруженным взглядом, но сжатое изображение будет отличаться резкими контрастами или пикселями. Поэтому JPEG нельзя использовать как промежуточный формат при обработке изображений. В JPEG допустимо сохранять лишь окончательный вариант. Что касается других разновидностей электронных документов и наиболее предпочтительных форматов их хранения, то существуют текстовые документы (ms-word, txt, pdf, html, xml, rtf), видео (mov, avi, mpeg, mp4) и аудио (wav, aiff, mp3), чертежи (autocad), графики и схемы (tiff, pcx), БД в виде электронных таблиц и реляционных баз данных (xls, xml, html, mdb). Для фотодокументов также приемлем формат pdf. Полученный массив данных может использоваться для передачи по цифровым каналам,

сохраняться на цифровом оптическом носителе (однократно записываемые CD-R, DVD-R, многократно записываемые CD-RW, DVD-RW, DVD-RAW диски), магнитном (жесткие диски, гибкие магнитные диски, магнитные ленты), Flash-накопителях и т. д.

Требования к качеству получаемых цифровых копий четко не сформулированы. Отсутствуют критерии оценки качества электронных копий бумажных документов: параметры изображения, тоновое воспроизведение (контрастность), яркость, шум, точность цветопередачи, резкость, разрешение, геометрические искажения и др. За рубежом уже используется ряд документов, опыт которых в области оценки качества оцифрованных документов был бы полезен для России. Национальный стандарт США ANSI/AIIM MS44 «Руководящие указания для контроля качества сканеров изображений» устанавливает и раскрывает базовую терминологию, основные параметры и критерии оценки качества сканирования, а также подходы к их практическому измерению. На его основе с учетом современных требований в 2000 г. были разработаны международные стандарты ISO для оценки качества сканирования черно-белых документов.

После оцифровки подлинник возвращается обратно на хранение в архив, а сделанные копии пополняют электронный фонд пользователя и становятся доступными для исследователей.

Поиск решения проблемы хранения и оперативного использования архивных документов начался еще в середине 1990-х гг., когда Библиотека Конгресса США приступила к тотальной оцифровке имеющегося собрания микрофильмов (как самостоятельной коллекции и как основного носителя страхового и пользовательского фондов). В процессе оцифровки американские специалисты столкнулись с необходимостью выработки единых подходов к реализации процессов перевода информации с материальных носителей в электронный вид, т. е. возникла необходимость в регламентации процессов оцифровки.

Современные стандарты оцифровки по уровню их регламентации можно разделить на 3 категории стандартов: международный, национальный и стандарт организации. Международный стандарт ISo5 разрабатывается группой ученых, его использование дает технологическое, экономическое и социальное преимущества, но не является обязательным ни для одной страны - участницы организации ISO. Национальный стандарт является обязательным для использования органами государственной власти различных уровней, он разрабатывается для улучшения процедуры оцифровки с учетом особенностей законодательства, стандартов документа-

ции в определенной стране. Стандарт организации подчеркивает специфику конкретной компании в процессе перевода документа в электронный вид и его последующее хранение и использование. Наиболее известным национальным стандартом, регламентирующим процессы оцифровки, является «Стандарт оцифровки S6» (S6: Digitisation Standard)6, введенный в действие национальным комитетом по стандартизации Австралии и Новой Зеландии в 2006 г.7 К сожалению, в России нет аналогичного документа, регламентирующего процессы оцифровки и создания ЭФП.

В 2012 г. сотрудниками Всероссийского научно-исследовательского института документоведения и архивного дела (ВНИИДАД) и Федерального архивного агентства (Росархив) были разработаны «Методические рекомендации по электронному копированию архивных документов и управлению полученным информационным массивом». Моделью для этих рекомендаций стали «Стандарт оцифровки S6» и «Технические рекомендации» FADGI. В целях продолжения работ в данном направлении представляется целесообразным выработать Стратегию разработки и обновления отраслевых нормативно-методических актов, регламентирующих различные направления деятельности в области информатизации архивного дела, а также создать регламент и перспективный план по ее реализации. Разработчиками были выделены ключевые моменты, которые необходимо учитывать при подготовке регламентирующего документа.

1. Структура и содержание разработанных и введенных в действие документов международных и национальных систем стандартизации обусловлены спецификой правовой базы той страны, где они возникли. Поэтому их прямой перевод и использование в Российской Федерации требуют взвешенного подхода.

2. Необходимо создание не одного нормативного документа, регламентирующего вопросы оцифровки, а комплекса нормативно-правовых актов, описывающих требования ко всем этапам и аспектам этого процесса.

3. Структура и общее содержание этой нормативно-методической документации могут быть построены на зарубежных аналогах, выбранных экспертами отрасли в качестве примеров, наиболее близких и адекватных российским условиям. При этом отечественные разработки должны в полном объеме отражать специфику всех процессов и аспектов оцифровки (включая требование к оборудованию, персоналу, процедурам и менеджменту качества), присущую России8.

Оцифровка документов - необходимая мера для организации оперативного доступа к документам архива. Наличие определенно-

го массива документов позволяет создать новый, комфортный для пользователя, научно полезный информационный ресурс - виртуальный архив. Примеры таких виртуальных хранилищ можно увидеть на сайте Российского государственного архива литературы и искусства.

Виртуальный архив И.А. Бунина представляет собой ресурс с удобной классификацией представляемых документов и комфортным для пользователя интерфейсом. Документы разделены на три группы: «Рукописи», «Вырезки из газет и журналов», «Изобразительные материалы» и представляют собой сканированные копии подлинников фондов Российского государственного архива литературы и искусства и Архива русского зарубежья в г. Лидсе9. Разработчики проекта обозначают ключевые моменты по реализации подобных проектов: финансовые вопросы, проблема разобщенности архивных документов и необходимость переговоров с хранилищами разных учреждений и даже стран для сбора необходимого материала и, наконец, решение вопросов юридического характера - так как на электронную публикацию материалов также распространяется авторское право. Ресурс представляет собой положительный пример реализации проекта по созданию виртуального архива. Сайт Российского государственного архива литературы и искусства также предлагает ознакомиться с такими прекрасными примерами электронных хранилищ, как ресурс, посвященный документам Отечественной войны 1812 г. и Первой мировой войны.

Создателями электронного хранилища под названием «Воссоединенный виртуальный архив Осипа Мандельштама» стали Оксфордский университет и Мандельштамовское общество. Разработчики проекта ставили целью выявить, описать и разместить в Интернете все или максимально большое количество сохранившихся творческих и биографических материалов Осипа Мандельштама независимо от места их физического расположения10. При этом в проекте объединяются рукописи, транскрипты текстов, а также комментарии к ним.

Поиски документов - важнейший этап при создании такого рода проектов. Этот процесс осложняется тем, что некоторых из ранее известных и введенных в научный оборот коллекций, возможно, более не существует. Попав в продажу в 1990-е гг., они поменяли владельцев, даже имена которых не всегда возможно установить. В иных случаях владельцы оказываются не в состоянии обнаружить те или иные автографы или документы. Это вполне объясняется тем, что комплектование архивно-рукописных фондов документами

деятелей русского зарубежья осуществлялось в основном путем дарения и не носило систематического характера11. Разработчики отмечают, что то же самое случается и с государственными архивами. Так, в Национальном архиве Франции на протяжении ряда лет не могли найти матрикуляционные документы О.Э. Мандельштама (они были заново обнаружены в апреле 2008 г.)12.

Важно отметить, что виртуальный архив О.Э. Мандельштама не только являет собой удачный пример реализации подобного проекта, но также, благодаря подробному описанию процесса создания такого архива на сайте, представляет своеобразное учебное пособие для продолжателей и исследователей процесса оцифровки.

Анализ реализованных российских проектов по созданию виртуальных хранилищ исторических материалов подчеркивает проблему разобщенности документов и сложность их поиска. Таким образом, при подготовке проекта важно акцентировать внимание на возможном сотрудничестве с зарубежными архивами.

Таким образом, возрастает роль совместных работ, совместных проектов по созданию единого виртуального поля хранения материалов одной тематики.

При оцифровке необходимо уделять внимание процессу выборки документов для перевода их в цифровой вид, а также подбору качественного сканирующего оборудования для обеспечения безопасного для подлинников процесса оцифровки. Однако на данный момент одним из самых серьезных вопросов в этой тематике остается необходимость регламентации процесса оцифровки (включая подробное описание процесса выборки материалов и закрепление терминологической базы). Без соответствующего, утвержденного законом стандарта процесс создания виртуального архива остается трудоемким и недостижимым для большинства исследователей.

Примечания

Методические рекомендации по электронному копированию архивных документов и управлению полученным информационным массивом. [Электронный ресурс] URL: http://archives.ru/documents/rekomend_el-copy-archival-documents/razdel-2.shtml (дата обращения: 13.05.2016). Особенности оцифровки документов в современных архивах. [Электронный ресурс] URL: https://www.pcweek.ru/ecm/article/detail.php7ID-154329 (дата обращения: 13.05.2016).

Юмашева Ю.Ю. Архивы и «цифровая гонка вооружений» // Историческая информатика. 2013. № 3. С. 93.

ИСО - Международная организация по стандартизации. Разработчик и издатель международных стандартов. [Электронный ресурс] URL: http://www.iso. org/iso/ru/ (дата обращения: 13.05.2016).

Отчет о научно-исследовательской работе по теме 2.2.4 «Разработка проекта отраслевого стандарта создания электронных копий архивных документов», Плана научно-исследовательской и опытно-конструкторской работы, выполняемой на основе государственного задания Федерального архивного агентства на 2014 г. № 89 от 26.12.2013 (первый этап) «Исследование и анализ зарубежной нормативно-методической документации, регулирующей вопросы оцифровки архивных документов» / Ю.Ю. Юмашева. М.: ВНИИДАД, 2012. С. 84-163. Там же. С. 20.

Объединенный электронный архив Ивана Бунина. [Электронный ресурс] URL: http://www.bunin-rgali.ru/ (дата обращения: 13.05.2016). Воссоединенный виртуальный архив Осипа Мандельштама. [Электронный ресурс] URL: http://mandelstam-world.info/intro.php (дата обращения: 13.05.2016).

Попов А.В. Русское зарубежье и архивы: Документы российской эмиграции в архивах Москвы: проблемы выявления, комплектования, описания и использования (Материалы к истории русской политической эмиграции. Вып. 4). М.: РГГУ, 1998. С. 150-151.

Воссоединенный виртуальный архив Осипа Мандельштама.

SCAN: Технологии

Что такое оцифровка?

02.10.2015, Пт, 14:05, Мск 2707

Сканирование, ретроконверсия и сопутствующие услуги. Обзор технологий перевода документов в электронный вид.

Существует несколько вариантов организации процессов оцифровки. Они могут производиться самостоятельно или с аутсорсингом услуг, с вывозом документов или выполнением работ на своей территории. При оцифровке могут применяться офисные, профессиональные документные или планетарные сканеры. Данные могут извлекаться в ручном, полуавтоматическом или автоматическом режимах, с проведением предварительной архивной обработки бумажных документов или классификацией информации уже в электронном виде и т.д.

Какой путь выбрать?

Решение зависит от конкретной задачи, потому что каждое из вышеупомянутых «или» определяет качество получаемого результата и стоимость работ. Например, извечен вопрос сшитых документов: выгодней медленно отсканировать в сшитом состоянии или потратиться на расшивку, зато быстро оцифровать на документных сканерах?

Самый простой способ выбрать наиболее подходящий для вас путь – обратиться за экспертизой к специализирующейся на оцифровке организации. Заинтересованные в работах, крупные компании проведут обследование бесплатно, и за вас определят оптимальный подход. Не пренебрегайте этой возможностью и не ждите склонения к заказу услуг: большинство этих компаний также заинтересованы в поставке оборудования и ПО для самостоятельной оцифровки.

Сколько документов нужно сканировать?

Определяющий параметр – объем документов.

Определяющий параметр – объем документов. Для ежедневного сканирования небольших пачек расшитых документов (например, первичной бухгалтерии) подойдет обычный офисный сканер, выдерживающий нагрузку в несколько тысяч страниц в день. Нужно лишь дополнить его удобной программой для индексирования.

Для регулярного сканирования больших объемов необходимо профессиональное оборудование. Это – промышленные сканеры, которые стоят немалых денег (подобное оборудование используют ФНС, ФТС, крупные банки). Поэтому менее дорогой альтернативой может стать рамочное соглашение на оказание периодических услуг оцифровки.

Перевод в электронный вид больших ретроспективных массивов своими силами экономически не обоснован: помимо закупки оборудования и обучения сотрудников, потребуются значительные трудовые и временные затраты. Однозначно эффективнее заказывать услугу, так как крупная компания может выделить большой штат и решить задачу оперативно.

Где сканировать документы?

Определяющий параметр – востребованность сканируемых документов. Влияет ли на деятельность организации изъятие документов на время сканирования? Особенно это критично при оцифровке документов, к которым регулярно обращаются сотрудники, либо которые могут быть внезапно запрошены контролирующим органом, а также для устранения связанных с документами ЧП. Примеры: финансовые и кадровые документы, техническая и эксплуатационная документация, книги ЗАГС и другие отраслевые фонды.

Участок сканирования, организованный в помещениях компании-заказчика услуг.

Если необходимо оцифровать их достаточно быстро, то традиционным подходом является заказ услуг с выездом бригады сканирования на вашу территорию. Зачастую это оказывается дешевле, чем доставлять документы на производство исполнителя и обратно, но все определяет территориальная удаленность. Регламент выездных работ подразумевает сканирование выданного дела в течение одного-двух рабочих дней, без длительного изъятия из рабочего процесса.

Расшивать ли документы?

Определяющие параметры: состояние документов и возможность расшивки. Если есть такая возможность, и бумага пригодна для протяжки документным сканером, то следует расшивать. Дело в том, что сканирование сшитых документов на планетарном (книжном) сканере в несколько десятков раз медленнее потоковой оцифровки. Пропорционально увеличиваются время работ и стоимость труда. Сканирование на документных сканерах, даже с учетом расшивки, оперативнее и дешевле.

Расшивать можно самостоятельно, а можно доверить это исполнителю.

Расшивать можно самостоятельно, а можно доверить это исполнителю: если выбрана авторитетная компания, опасаться утраты документов не стоит. Наоборот, жесткая регламентация всех процессов и качественные материалы позволяют компаниям застраховаться от дополнительных финансовых потерь и ущерба имиджу. Этому подходу доверяют даже российские суды: при организации сканирования обычно внутренним приказом разрешается расшивка и последующая сшивка судебных дел.

К слову, крупные компании параллельно могут провести профессиональную архивную обработку: во-первых, часть работ итак выполняется при подготовке к сканированию, во-вторых, архивная обработка помогает выявить невостребованные документы и сократить объемы сканируемых массивов, что может снизить стоимость работ.

Какое качество выбрать?

Сегодня высококачественно можно отсканировать любой объект: от маленькой библиотечной карточки до карт формата 8А0 и театральных декораций.

Определяющие параметры: вид документа и объем получаемого ресурса в электронной форме. Сегодня сканирующее оборудование позволяет получать образы с разрешением от 200 до 1200 точек на дюйм (dpi). Для художественных произведений обычно применяется разрешение 400–600 dpi, позволяющее создавать высококачественные репродукции. Более высокое качество используется только при необходимости увеличения изображения и детализации мелких предметов, например, монет.

Детализированные и неконтрастные чертежи, часто выполненные на кальке и синьке, нуждаются в сканировании с разрешением 300-400 точек на дюйм и дополнительной обработке изображений в графических редакторах. Остальные документы обычно сканируются с разрешением 300 dpi, достаточным для распечатки копий без потери качества. Необходимая обрезка изображений, геометрическое исправление, цветокоррекция, конвертация в форматы pdf, tiff, jpegи др. может проводиться в полностью автоматическом режиме программами, встроенными в сканирующее оборудование или поставляемыми вместе с ним.

В большинстве случаев используется цветной режим съемки. Это нужно для всех документов, в которые вносились исправления или ставились печати поверх текста, для удостоверения того, что электронная копия снималась с оригинала документа с печатью и подписью, а также для читаемости угасающих текстов и передачи уникальных особенностей оригинала. Необходимость цветного сканирования художественных произведений не обсуждается. Режим «градации серого» применяется лишь в некоторых случаях: когда документы не содержат цветных атрибутов, либо когда необходимо сократить объем получаемого электронного ресурса.

Сканирование может осуществляться самостоятельно. Главной задачей становится обучение сотрудников правильной работе со сложной техникой, так как качество получаемых изображений важно для последующего индексирования: плохо отсканированный документ, тени, засветка и другие дефекты на электронном образе могут сделать нечитаемой важную информацию. Это не позволит применить технологии автоматического извлечения данных и может привести к ошибкам в индексировании. Загрузка ошибочных данных в некоторые системы (государственные реестры, бухгалтерские учетные системы) не позволительна.

Индексирование

Простое сканирование применяется редко, поскольку при последующей работе искать информацию в наборе графических файлов будет лишь немногим проще перелистывания бумаги. Для возможности поиска необходимо выделить в документе несколько атрибутов (индексных полей).

Сотрудники, задействованные в массовом индексировании документов методом ручного ввода.

Выделенные атрибуты можно внести в имя файла. Такая практика сложилась в российских судах: для того чтобы оператор сканирования не имел доступа к внутренним системам суда, при оцифровке все необходимые реквизиты вносятся в имя файла. В последующем эти реквизиты распознаются системой судопроизводства при загрузке каждого документа по отдельности.

Но обычно оцифрованные документы загружаются в информационную систему группой, что требует создания базы данных. Так, если необходимо прикрепить документ к уже существующей карточке в учетной системе, бывает достаточно извлечь пару однозначно определяющих его реквизитов – обычно номер и дату.

Если же нужно сформировать поисковую базу на основании самих документов, то объем извлекаемых данных определяется задачей: от пары реквизитов для поиска файла в электронном архиве до переноса всей значимой информации в аналитическую БД (ФИО, адресов, ИНН, КПП, дат, номеров документов-приложений и т.д.).

Свои правила индексирования применяются в музеях, библиотеках и архивах при оцифровке единиц хранения и учетных документов. Отдельным направлением услуг также является векторизация, которая применяется, в частности, при оцифровке каротажных лент (автоматическая) и чертежей (ручная отрисовка в CAD-системах).

Сколько данных извлекать?Ответ на этот вопрос также лучше получить, воспользовавшись экспертизой, так как количество извлекаемых реквизитов зависит от функциональной задачи и в значительной мере определяет стоимость оцифровки. В некоторых случаях можно ограничиться подборками документов, когда электронные образы объединяются под эгидой основного документа (например, договора или реестра счетов). В других необходимо извлечение всех содержащихся в документе данных для заполнения карточки информационной системы.

Примеры извлекаемых данных

Анализ размещенных на портале zakupki.gov.ru заказов компаний с государственным участием и госучреждений (44-ФЗ, 223-ФЗ), показывает, что:

– Для привязки электронных копий ОРД к системе электронного документооборота достаточно номера, даты и типа документа.

– Сканирование финансовой документации часто сопровождается извлечением номера, даты, наименований и реквизитов плательщиков, сумм.

– Оцифровка архивных документов муниципалитетов (постановления администраций, горисполкомов, сельсоветов и т.д.) в целях оказания услуг и инвентаризации объектов земельно-имущественных отношений требует извлечения номера и даты документа, всех встречаемых ФИО и адресов. Причем адреса необходимо сопоставлять с текущими справочниками КЛАДР/ФИАС.

– Оцифровка документов Архивного фонда РФ сопровождается строгим заполнением НСА и описанием фондов в соответствии с архивным законодательством.

– Индексирование описей и реестров подразумевает распознаванием всех порядковых записей.

– Для работы с чертежами в электронном виде необходимо извлечь практически все поля штампа.

– Сканирование составных дел требует не только извлечения реквизита каждого документа, но и установления взаимосвязей. Наиболее сложен случай конструкторской документации, где формируемая база данных обладает многоуровневой иерархией и связями документов.

В последние годы услуга по оцифровке документов становится очень востребованной для подавляющего большинства компаний. Практически все современные организации в той или иной степени освоили информационные технологии и не представляют свою работу без использования персональных компьютеров. Сегодня шаблоны для документов сначала создаются на компьютере, а уже после этого распечатываются. Однако юридическую силу имеют документы с подписями и печатями, и их опять приходится переводить в цифровой вид помощью работ по оцифровке документов.

Для этого и требуется оцифровка документов

Часто приходится обращаться и к архивной документации, поэтому многие компании предпочитают иметь электронные копии всех бумажных документов своей фирмы. Оцифровка бумажных документов может облегчить жизнь не только руководителям, бухгалтерам, экономистам и секретарям, но и представителям технических и творческих профессий: конструкторам и модельерам, строителям и архитекторам, инженерам и дизайнерам, а также многим другим профессионалам. Процесс оцифровки архивных документов, содержащих разнообразные схемы, чертежи, формулы, рисунки и фотографии более трудоёмок и требует участия квалифицированных специалистов, имеющих большой опыт оцифровки документов.

На что нужно обратить внимание при оцифровке документов:

Профессиональное оборудование

Для оцифровки сложных документов требуется профессиональное оборудование с большим количеством технических возможностей. После проведения оцифровки специалист делает сверку документов и электронной копии, проводится работа по распознаванию компьютером текста документа, исправляются возможные ошибки.

Возможна ручная работа

При оцифровке документов, без ручного труда не обойтись, он необходим при:

  • подготовке документов к сканированию: изъятие скрепок, файлов и других крепежей;
  • сканирование документов в ручном режиме;
  • обратной комплектации документов в папки;
  • при вводе информации в систему;
  • проверке введенной информации.

Программное обеспечение

Правильно подобранное ПО позволяет упростить и ускорить решение задач по оцифровке документов в разы.

Опыт и скорость работ

Компания "Столичный Архивист" имеет многолетний опыт услуг по оцифровке бумажных документов и полностью гарантирует. Что все будет выполнено в срок и по оптимальной цене.

У вас начались серьезные проблемы с хранением бумажных документов? Полки ломятся от нелепо раздувшихся папок, и вы по три часа ищите нужную бумажку? Тогда пришло время заняться оцифровкой документов, которая сделает ваш кабинет или квартиру более чистой, а способ поиска более простым и удобным. Создайте собственную электронную библиотеку, редактируйте, копируйте и перемещайте цифровые файлы по своему желанию. Возможность создания цифровых документов - одно из благ цивилизации. Так воспользуйтесь им!

Прежде, чем отважиться на оцифровку своих документов, вам следует знать, что хранить их можно двумя способами - в виде изображений и в виде текстовых файлов. Хранение изображений потребует гораздо больше места на жестком диске, но при этом вы сможете сохранить стиль исходного документа. Преобразование отсканированных изображений в текстовый файл потребует дополнительных затрат времени, так как необходимо осуществить процесс оптического распознавания символов OCR (правда, если быть точным, то это название не совсем верно, так как здесь речь идет о работе с цифровой информацией, однако, как это нередко бывает, термин прижился).

Как же выбрать формат хранения документов? Очень просто: если оригинал документа написан от руки, и вам важно сохранить его «характерность» (письмо от любимого человека) или если документ является, к примеру, произведением искусства, то сохраните его в виде изображения (иногда узнаваемый почерк столь же важен, как и написанные слова). Другой более прозаической причиной для сохранения рукописных документов в виде изображений является отсутствие коммерчески доступного программного решения, пригодного для интерпретации рукописных символов. Пока эта технология застряла в КПК и планшетах, в которых она реализована несколько в ином виде, чем нам требуется. Работая с планшетом, вы пишите символы «от руки», вводя их по порядку, а программа в режиме реального времени преобразует их в печатный текст. Распознавание почерка отдельно взятого человека с отсканированного документа - дело будущего.

Сканеры

Независимо от того, в каком виде выбудете хранить ваши документы - в виде изображений или в виде текстовых файлов, вам понадобится сканер для их оцифровки. Если вы хотите оцифровать сравнительно небольшое количество документов, то многофункционального принтера или планшетного сканера вам будет вполне достаточно. Единственный их недостаток - относительно медленная скорость работы. Имейте в виду, что только более дорогие модели имеют функцию автоматической подачи листов для обработки многостраничных документов.


Среди самых лучших моделей назовем ScanSnap S1500 от Fujitsu и ScanJet Professional 3000 от HP. Скорость сканирования документов этих устройств составляет в среднем 20 страниц в минуту и выше. При этом ScanJet Professional 3000 отличается более надежным механизмом подачи бумаги, в то время как ScanSnap S1500 имеет более совершенное программное обеспечение. Оба сканера находятся примерно в одной ценовой категории, так что выбирать вам.

OCR - софт

Большинство сканеров поставляются с программным обеспечением для осуществления OCR, которое устанавливается на вашем компьютере. Если вы недовольны сопутствующим ПО или его нет, то подобные программы вещь довольно распространенная и их можно приобрести отдельно. Существуют следующие рыночные предложения:

FineReader 9 Express от ABBYY, $ 100 за обычную и $ 400 за профессиональную версию программы Pro 10;
. OmniPage 17 Standard от Nuance, $ 150 за обычную версию программы и $ 500 за профессиональную;
. Acrobat X Standard от Adobe, $ 299 за обычную версию и $ 449 за профессиональную;
. PaperPort 12 Standard от Nuance стоит $ 100 за обычную и $ 200 за профессиональную версию ПО, правда здесь нет функции OCR, только вариант управления отсканированными документами.

Разрешение

Для документов, хранящихся в виде изображений, как правило, достаточно выставить разрешение от 150 до 200 точек на дюйм, однако OCR - софт работает гораздо лучше, если изображения сохранены в более высоком разрешении - 300 пикселей на дюйм. Все зависит от того, что вам нужно. Если вы просто хотите сохранить хотя бы минимальную читабельность отсканированного документа, можете снизить требования к разрешению. Если для вас важно высокое качество, то, соответственно, увеличьте его.

OCR в веб

Существует несколько онлайн-сервисов, которые предоставляют услугу распознавания отсканированных документов. Среди наиболее известных назовем бесплатные ресурсы Free OCR , NewOCR и OCR Online . Они прекрасно подходят для небольших проектов, то есть работают только с небольшими по объему документами. Сначала вы должны отсканировать оригинал в память компьютера, а затем загрузить изображение документа на веб-сайт. Естественно, на каждом из ресурсов существуют свои ограничения как по объему, так и по содержанию документа. Так, веб-приложения распознают исключительно текст, без линий или дополнительных символов, которые присутствуют на странице.

Сервис Free OCR является бесплатным, однако размер загружаемого файла не может превышать 2 Мб и не содержать не более чем 5000 пикселей, а это примерно 50 точек на дюйм для документа обычного стандарта. Причем, вы сможете обработать не более 10 подобных документов в час. Услугами сайта NewOCR вы также можете воспользоваться бесплатно, но его интерфейс крайне примитивен, зато объем обрабатываемых документов в 2,5 раза больше - до 5 Мб. И, наконец, ресурс OCR Online требует создания бесплатного аккаунта, но позволяет загружать до 15 файлов в час объемом до 4 Мб в разрешении около 200 точек на дюйм на странице. Если вас такие объемы не устраивают, то можно купить платный доступ за $ 3.95 (8 центов за страницу) и получить возможность обработать до 50 документов за раз или заплатить $ 49.95 за обработку до 5000 (1 цент за страницу). Данное веб-приложение работает как с текстом, так и с графическими элементами, однако ему, естественно, далеко до стандартов Acrobat X или FineReader 10.

E-книги

Наверное, вы, как и я, любите запах настоящей книги, любите ощущение плотной бумаги и вид красивой графики. Однако сегодня все больше и больше людей предпочитают иметь дело с электронными книгами, для чтения которых используются так называемые специальные читалки, планшеты, смартфоны, плееры и прочие портативные устройства. Огромное количество интернет-магазинов предлагает просто гигантские объемы контента. Но что, если вы захотите иметь вашу собственную коллекцию е-книг, которые не доступны в цифровом формате?

Чтобы преобразовать ваши любимые «физические» книги в электронные, требуется их сначала отсканировать, а затем перевести в текстовый формат при помощи программы OCR. Это утомительно даже если вы будете использовать очень быстрый FLATBED-сканер. Такие сканеры напоминают «ксероксы», имея прижимную крышку, поэтому они могут сканировать не только отдельные листы, но и книги целиком. Если же вы готовы «распотрошить» любимую книгу, то можете использовать SHEETFED-сканер, которая работает по принципу факса, то есть с отдельными страницами (как ScanSnap S1500 от Fujitsu и ScanJet Professional 3000 от HP).

После того, как вы переведете свои документы, учебники или книги в форматы PDF, Word или fb2, вы можете воспользоваться специальными программами для организации, редактирования или чтения электронных документов. Например, Calibre или Stanza. - бесплатный органайзер и редактор для вашей коллекции электронных книг. Программа помогает работать с каталогом - организовывать, классифицировать, комментировать, искать, сохранять новые и старые книги на жестком диске вашего компьютера или в памяти е-ридера.

2. Организация работ по оцифровке архивных документов

2.1. Цели оцифровки архивных документов

Оцифровка архивных документов производится с целью формирования электронного фонда пользования (ЭФП).

Электронный фонд пользования представляет собой совокупность электронных копий документов Архивного фонда, записанную на цифровые носители, и предназначенную для использования вместо подлинников документов, что должно обеспечить:

    сохранность документа,

    возможность формирования электронных ресурсов, обеспечивающих оперативность доступа к документу, в т.ч. с использованием Интернет-технологий.

Позиционирование электронных копий архивных документов и электронного фонда пользования в качестве страхового фонда архивной документации недопустимо .

Порядок создания электронного фонда пользования (электронных копий архивных документов) является одной из важных задач деятельности архива и должен быть регламентирован специально разработанным Регламентом создания электронного фонда пользования (электронных копий архивных документов), утвержденным в установленном порядке после его рассмотрения и одобрения на методической комиссии и обсуждения на дирекции архива.

2.2. Электронный фонд пользования

В ЭФП включаются копии оцифрованных в полном объеме (полностью) единиц хранения.

ЭФП состоит из трех массивов электронных копий:

2.3. Методы создания ЭФП

Электронный фонд пользования создается:

    целевым порядком в рамках государственных, ведомственных, региональных программ и ежегодных (перспективных) планов работы архива;

    целевым порядком на все документы, определенные для страхового копирования;

    целевым порядком на наиболее часто запрашиваемые документы;

    в процессе выполнения заказов;

    в процессе других работ.

Основные технологические операции создания электронных копий архивных документов:

    отбор документов для оцифровки;

    подготовка документов для оцифровки;

    передача документов на сканирование/ прием документов/ регистрация в учетной документации;

    выбор способа оцифровки документов на различных носителях (так, для фотодокументов определяющими факторами являются: тип и вид носителя документа (фотобумага, фотопленка, стекло), рулон или отдельный кадр, размер (формат) носителя (бумаги и фотокадра), характеристика документа (отдельный лист документа, фотография, или комплекс документов (фотографии, вклеенные в фотоальбом); для фонодокументов - носитель информации, наличие специализированного оборудования для воспроизведения подлинника и т.п.);

    оцифровка документа - создание электронной копии - мастер-копии;

    двукратная (минимум) запись на носители: мастер-копия и рабочая копия;

    маркировка носителей / регистрация носителей и их содержимого (мастер-копия и рабочая копия) в учетной документации;

    передача носителей копий на хранение;

    возврат подлинников документов в хранение.

2.4. Критерии отбора архивных фондов для создания электронных копий

В плановом порядке электронные копии архивных документов создаются в первую очередь для:

    наиболее используемых документов, независимо от времени их создания, материала и техники изготовления;

    особо ценных и уникальных документов,

    документов, находящихся в неудовлетворительном физическом состоянии с высокой степенью разрушения основы, что может повлечь утрату подлинника;

    документов, для которых существует угроза утраты информации (например: для документов на бумажной основе - угасание текста; для фонозаписей на магнитной ленте - размагничивание; для цветных фотонегативов - утрата цветности и т.п.) при удовлетворительном физическом состоянии носителя;

    выполнения запросов и заказов, подготовка изданий и выставочных проектов.

Оцифровке подлежат только те фонды, по которым уже прошла или не предполагается в будущем научно-техническая переработка или усовершенствование описей (в части редактирования заголовков).

Из фондов, равноценных по значению, первоочередному копированию подлежат фонды, документы которых находятся в неудовлетворительном физическом (техническом) состоянии и наиболее интенсивно используются, а также цветные фотодокументы.

2.5. Планирование работы по созданию электронного фонда пользования

С целью организации и контроля за проведением работ по оцифровке фондов в каждом архиве должен быть создан Перспективный план оцифровки, включающий в себя названия фондов, предназначенных для создания электронных копий в рамках всего собрания архива (Приложение № 2).

Ежегодно должны проводиться мониторинг и редакция Перспективного плана, осуществляемая по результатам выполнения годового плана оцифровки, закрепленного в Перечне фондов, подлежащих оцифровке.

Перспективное планирование должно осуществляться структурными подразделениями, на которые возложены функциональные обязанности по созданию электронных копий, с учетом предложений от отделов использования документов, отделов обеспечения сохранности документов и других структурных подразделений.

При планировании работ по оцифровке в показатели планирования включаются следующие графы:

    наименования и номера фондов, коллекций, единиц хранения и наименования документов, планируемых к оцифровке;

    предполагаемые сроки осуществления оцифровки;

    отметка о выполнении.

На основе Перспективного плана ежегодно создается (создаются) Перечень (Перечни) фондов, подлежащих оцифровке, в котором(ых) определяется последовательность оцифровки фондов в рамках данного года (Приложение № 3).

Очередность оцифровки определяется ценностью и информационной значимостью документов, их физическим состоянием, интенсивностью обращения к ним, а также наличием технических и кадровых возможностей.

Перечни согласовываются с задействованными в работе по созданию ЭФП структурными подразделениями архива (в первую очередь с отделом обеспечения сохранности и архивохранилищами, в которых находятся на хранении дела подлежащие сканированию) и утверждаются директором архива (архивного учреждения).

При годовом планировании работ по оцифровке в показатели включаются следующие графы:

    наименования и номера фондов, коллекций, номера описей, единиц хранения, наименования документов;

    количество документов, подлежащих оцифровке, в соответствующих единицах хранения;

    объем единиц хранения для фотодокументов - в листах/кадрах/ед.хр., для фоно-, кино- и видео-документов - в часах/минутах/секундах;

    формат документов;

    отметка о выполнении - дата оцифровки, № и дата акта о передаче на хранение внешнего носителя, маркировка внешнего носителя;

    шифры хранения электронных мастер-копий;

    шифры хранения электронных рабочих копий.

    (Прим.: последние три пункта заполняются по факту выполнения работ).

Оцифровка проводится по фондам с соблюдением систематизации единиц хранения в описи.

Допустимо ведение Перспективного плана и ежегодных Перечней фондов, подлежащих оцифровке, в форме компьютерной базы данных с созданием обязательной ежегодной распечатки обоих документов.

2.6. Структурные подразделения для создания ЭФП

Работы по созданию электронного фонда пользования должны осуществляться специализированным подразделением архива.

Создание ЭФП планируется и организуется как самостоятельный вид работы.

Создание ЭФП не может рассматриваться в качестве дополнительного функционала сотрудников других подразделений.

2.7.-2.8. Примерный состав специалистов структурного подразделения по созданию ЭФП.
Требования к квалификации сотрудников

Состав и функции специалистов в структурном подразделении архива, на которое возложен функционал по созданию ЭФП:

Методист

Функционал: прием архивных документов на сканирование, ведение учета ЭФП (ЭФП-1, ЭФП-2, ЭФП-3), контроль качества выполнения работ при передаче электронных копий на хранение, мониторинг вопросов повторного сканирования, сдача архивных документов в архивохранилища после сканирования, передача на хранение маркированных носителей с ЭФП.

Оператор сканирования

Функционал: проведение операций сканирования, шифровка электронных копий;

Оператор записи внешний носителей

Функционал: запись электронных копий на носители, маркировка носителей.

Инженер

Учет использования рабочих копий, техническое обслуживание компьютерной техники, периодическое тестирование носителей информации с ЭФП (ЭФП-1, ЭФП-2, ЭФП-3).

Специалист по графической обработке цифровых копий и подготовке копий второго и последующих поколений (при необходимости).

Основными критериями выбора моделей сканеров для созданий электронных копий архивных документов являются:

    безопасность и сохранность подлинника в процессе сканирования;

    качество электронной копии;

    размер стола сканирующего устройства, соответствующий максимальному размеру подлинников, предназначенных для оцифровки, и исключающий необходимость фрагментарного сканирования документов с последующей компьютерной «склейкой» («стикингом») изображений;

    другие технические характеристики оборудования.

Проблеме оптимального подбора сканирующего оборудования для осуществления оцифровки архивных документов (по критериям «цена - качество») посвящена научно-исследовательская работа, выполненная в 2011 г. по заказу Федерального архивного агентства Научно-исследовательским институтом репрографии (г. Тула). Отчет по теме «Разработка методических рекомендаций по выбору сканирующего оборудования, способного удовлетворить потребности российских архивов» в январе 2012 г. размещен на портале «Архивы России» . На портале «Архивы России» размещен дистрибутив разработанной на основе многофакторного анализа компьютерной программы по подбору оборудования - MregForm и пошаговая инструкцию по ее применению.

В 2012 г. Научно-исследовательским институтом репрографии (г. Тула) по заказу Росархива разработаны «Методические рекомендации, программное обеспечение оценки и контроля качества функционирования сканирующего оборудования при выполнении работ по оцифровке архивных документов в российских государственных архивах» , размещенное на портале «Архивы России».

Наиболее оптимальным решением в вопросе выбора сканирующего оборудования представляются:

Профессиональные книжные планетарные (бесконтактные) сканеры формата не менее А2, оснащенные лампами холодного света, либо LED светодиодными осветителями и книжной колыбелью для сканирования не расшиваемых цветных, черно-белых и полутоновых подлинников (книги, рисунки, ветхие материалы, атласы) архивных документов, поставляющееся в следующей комплектации:

Выбор цифровых фотокамер (фотоаппаратов) определяется размером матрицы и финансовыми возможностями архива.

На сегодняшний день цифровые фотокамеры представляют собой самый безопасный для подлинников архивных документов способ создания электронных копий документов. Однако их использование также имеет свои ограничения и недостатки, главным из которых является проблемы соблюдения светового режима.

Допустимо комбинирование различного оборудования для решения задач оцифровки документов разного формата.

Технические характеристики компьютерного оборудования:

    Системный блок:

      Минимальные требования:

        CPU с количеством ядер не менее 2 и тактовой частотой не менее 2,8 ГГЦ;

        Память тип DDR3, объем не менее 2 Гб, HDD не менее 500 Гб SATA;

        Видеокарта не менее 512 МБ, частота GPU Мгц не менее 700, тип GDDR5, Gigabit Ethernet, Multi-DVD.

      Оптимальные требования (при поточном режиме оцифровки):

        Чипсет - Intel, CPU с количеством ядер не менее 2, объем не менее 6Мб и частотой работы не менее 3,2 ГГц;

        Память тип DDR3, объем не менее 8 Гб, с возможностью расширения до 32 Гб, HDD не менее 1000 Гб SATA;

        Дискретная видеокарта с объемом памяти не ниже 1 Гб и пропускной способностью памяти не ниже 25,6 Гб/сек;

        Возможность защиты информации с помощью встроенного аппаратного модуля;

        Предустановленное производителем ПО для защиты и безопасного удаления информации.

    Монитор:

      диагональ не менее 19 дюймов,

      тип подсветки - LED,

      яркость монитора не менее 250 кд/см 2 , контрастность не менее 1000: 1, динамическая контрастность не менее 3 000 000: 1,

      углы обзора не менее 170 градусов по горизонтали и 160 по вертикали.

Технические требования к серверному оборудованию, системам хранения электронного контента и печатающим устройствам определяются, исходя из реальных объемов имеющегося цифрового контента, перспектив его наращивания и нужд в осуществлении распечатки электронных копий.

2.12. Основные требования к технологическим помещениям подразделения
по созданию электронных копий архивных документов и рабочим местам сотрудников

Помещения, где производятся работы по оцифровке архивных документов и созданию электронных копий, должны иметь естественное и искусственное освещение. Желательна ориентация оконных проемов на север или северо-восток. Оконные проемы должны быть оборудованы регулируемыми жалюзи или занавесками, позволяющими полностью закрывать (при необходимости) оконные проемы.

Рабочие места для создания электронных копий оборудуют специальными столами, приставками, подъемно-поворотными креслами (стульями), регулируемыми по высоте и углам наклона сиденья и спинки.

Освещенность на поверхности стола в зоне размещения документа должна быть 300-500 лк, освещенность поверхности экрана - не более 300 лк.Освещение не должно создавать бликов на поверхности экрана и стола сканирования. Допустимо при использовании профессионального сканирующего оборудования, оснащенного собственными лампами, полное выключение освещения в процессе оцифровки.

Минимальная площадь на одно рабочее место должна составлять не менее 6 кв.м, расстояние между рабочими столами с видеомониторами должно быть не менее 1,2 м .

Экран монитора должен находиться от глаз пользователя не ближе 500 мм с учетом размеров алфавитно-цифровых знаков и символов.

Помещение должно быть хорошо вентилируемым. Вентиляционные отверстия на оборудовании не должны быть перекрыты.

Не допускается размещение вблизи оборудования комнатных растений.

Помещение должно быть оборудовано сейфом или закрывающимся шкафом для хранения архивных документов, принятых на оцифровку.

Помещения, где производятся работы по оцифровке архивных документов и созданию электронных копий, должны сдаваться под охрану.

2.13. Подготовка и передача документов на оцифровку

Подготовка документов для проведения работ по созданию электронных копий фонда пользования осуществляется в соответствии с порядком выдачи архивных документов из архивохранилищ .

Подготовка документов для проведения работ по созданию электронных копий включает в себя:

    выемку дел,

    проверку поисковых данных,

    сверку с описью заголовков дел,

    проверку нумерации листов,

    уточнение в листах заверителях.

При подготовке дел проверяется физическое состояние документов: выявляются документы с малоконтрастными и угасающими текстами, а также документы, требующие реставрации и укрепления основы. В случае необходимости привлекаются специалисты по обеспечению сохранности архивных документов и специалисты по оцифровке документов для проведения консультаций с целью недопущения возможности повреждения дел при сканировании.

Дела, предназначенные к оцифровке, как правило, расшивке не подлежат и могут быть расшиты только в исключительных случаях по согласованию с руководством архива при полной невозможности копировать переплетенное дело.

Принятие решения о расшивке дела может быть мотивировано:

    А) обеспечением сохранности документов (дело туго сшито и при его раскрытии на 180 градусов и использовании прижимного стекла может произойти повреждение (деформация) документов);

    Б) невозможностью представить на электронной копии всю информацию документа, т.к. часть информации «уходит» в корешок.

Решение о расшивке документов принимается только в случае наличия в архиве условий по переплету после сканирования расшитых для оцифровки дел.

По окончании работы дело в обязательном порядке переплетается заново.

Передача документов на оцифровку в специализированное подразделение осуществляется сотрудниками архива, ответственными за создание электронного фонда пользования, и оформляется Заказом (требованием) на изготовление электронных копий (Примерная форма Заказа (требования) - Приложение № 4), оформленным в соответствии с последовательностью сканирования фондов, зафиксированной в Перечне фондов, предназначенных для оцифровки.

В Заказе (требовании) на изготовление копий отмечается:

    Основание для оцифровки (в случае выполнения плановых работ - ссылка на позицию в Ежегодном Перечне фондов, предназначенных для оцифровки; в случае выполнения заказа в иных целях - указание №, даты и названия документа, на основании которого производятся работы, целей выполнения работ, реквизитов заказчика).

    Учетные шифры (номер фонда, номер описи, номер ед.хр., номера листов (оборотов - если необходимо).

    Количество листов/оборотов листов, предназначенных для оцифровки.

    Разрешение, формат, носитель (для заказов, выполняющихся не в рамках программы оцифровки архива).

    Примечание (указание на особые требования по сохранности, необходимость применения специализированных методов оцифровки, возможность использования прижимного стекла и/или графической обработки (для заказов, выполняющихся не в рамках программы оцифровки архива)).

    Дата передачи на оцифровку,

    Дата выполнения заказа;

    Дата получения заказа (для заказов, выполняющихся не в рамках программы оцифровки архива);

    Дата возвращения подлинников в хранилище;

    Шифр и место хранения электронной мастер-копии (на встроенном носителе и внешних носителя);

    Шифр и место хранения электронной рабочей копии (на внешнем носителе);

    Шифр и место хранения копии второго поколения (при необходимости - для заказов, выполняющихся не в рамках программы оцифровки архива).

    Заказ (требование) на изготовление электронных копий ФП архивных документов подписывается директором или заместителем директора (главным хранителем фондов).

Бланк заказа составляется в необходимом количестве, но не менее чем в 2-х экземплярах. Один экземпляр хранится в централизованном учёте в делах фондов, другой - в отделе обеспечения сохранности документов или в структурном подразделении, в котором осуществляется централизованное хранение электронного фонда пользования архива. Бланк заказа регистрируется в Журнале учета заказов на создание электронных копий документов (Приложение № 5). Журнал ведется в структурном подразделении, на которое возложен функционал по созданию электронных копий.

Журнал оформляется по правилам оформления учетной документации архива, т.е. его листы прошиваются, пронумеровываются; их количество указывается в листе-заверителе . Графы в журнале и записи ведутся в разворот. Допустимо ведение Журнала учета заказов в электронном виде.

Исполнители несут персональную ответственность за сохранность подлинников архивных документов в течение всего времени работы с ними.

Во избежание повторного сканирования одних и тех же документов (рескана) сотрудники, заполняющие заказы и ведущие журнал, обязаны перед передачей-приемом документов на сканирование убедиться в том, что документы прежде не проходили процедуру оцифровки.

В случае если документ уже оцифрован, все работы по выполнению заказа производятся с его рабочей электронной копией.

Повторное сканирование (оцифровка) (рескан) документов недопустимо!

2.14. Оцифровка (сканирование) документов.
Общие подходы и требования

Решение о способе цифровой обработки (сканирование или цифровая съемка) принимает зав. структурным подразделением, на которое возложен функционал по созданию электронных копий.

Независимо от целей, задач, требований заказов и т.п. архивный документ оцифровывается однократно .

В результате процесса оцифровки создается электронная мастер-копия документа .

Требования по созданию мастер-копии:

Требования общего характера:

Технические требования к созданию мастер-копии с помощью сканирующего оборудования:

Ежедневно работа по созданию электронных копий должна начинаться с:

    проведения регламентной настройки сканирующего оборудования с помощью набора для калибровки сканера (калибровочных таблиц);

    проведения калибровки монитора компьютера.

    проведения процедур настройки оборудования в соответствии с «Методическими рекомендациями, программным обеспечением оценки и контроля качества функционирования сканирующего оборудования при выполнении работ по оцифровке архивных документов в российских государственных архивах».

Все три вида настройки должны проводиться после каждого (любого) отключения оборудования.

Результаты настройки оборудования ежедневно должны фиксироваться в Журнале создания электронных копий или Протоколе проведения регламентной настройки. (Приложение № 6).

Проведение процедуры настройки сканера не исключает использования в процессе оцифровки (создания мастер-копии архивных документов на бумажной основе) специальных тест-объектов (цветной и серой шкал, технических мир ), предназначенных для осуществления последующего контроля цветности, контрастности и четкости электронного изображения в процессе его хранения. Шкалы размещаются рядом с подлинником и обязательно должны попасть в область сканирования. В этом случае электронная мастер-копия обязательно должна содержать в себе изображения подлинника архивного документа и тест- объектов.

Однако, учитывая то, что стоимость тест-объектов и технических мир достаточно высока, при проведении оцифровки архивных документов можно ограничиться проведением трех видов настройки оборудования, описанных выше.

В целях исключения повторной оцифровки документов создание мастер-копии производится с максимально возможными техническими параметрами:

Разрешение не менее 300 dpi - для оцифровки документов формата А4 и более;

Разрешение не менее 600 dpi - для оцифровка документов формата менее А4;

Цветной режим True color.

Подробнее см. Таблицу № 1.

При сканировании документов, имеющих тонкие линии, мелкие детали, фотодокументов, для гарантии воспроизведения чертежей, карт, а также документов в плохом физическом состоянии разрешение должно быть не менее 600 dpi.

Таблица № 1

Основные параметры процесса создания электронных копий архивных документов

Носитель/формат

Режим сканирования

Форматы сжатия

Мастер-копия

оттенки серого

Бумага (пергамен)
до середины XIX в.

Не менее 600

Не менее 600

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Бумага стандартная

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Бумага тонкая/
калька

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Фотобумага

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Обязательно

При необходимости

Обязательно

По возможности

Если документ содержит угасший, или плохо читаемый текст, создаются два варианта электронной мастер-копии: в цветном режиме и в режиме «оттенки серого».

При этом в зависимости от возможностей сканирующего оборудования, возможны следующие способы решения проблемы:

Каждое отдельное изображение (обложка, разворот, страница, оборотная сторона и т.п.) оцифрованного документа является отдельным файлом, который автоматически нумеруется по порядку во встроенной в сканирующее оборудование программе оцифровки (в проекте).

Эти файлы, созданные в результате сканирования и представленные в программе оцифровки (в проекте), являются исходными мастер-копиями, максимально качественными в силу отсутствия внешних воздействий (копирования, обновления, репликации, эмуляции, миграции, графической обработки, преобразования в иной формат и т.п.). Однако хранение исходных мастер-копий в проекте возможно только ограниченный период времени, поэтому созданные файлы транслируются из программы сканирования в графический редактор, после чего БЕЗ проведения каких-либо процедур обработки (кроме переименования файлов ) записываются на встроенные носители информации (сервер, систему хранения данных, электронную библиотеку). Эти первично сохраненные и записанные файлы являются мастер-копиями.

Графическая обработка электронных мастер-копий недопустима!

Мастер-копии должны сохраняться:

Во избежание утраты цифровой информации на встроенных носителях информации допустима однократная репликация полученных файлов на внешние носители информации - компакт или оптические диски (CD-R, DVD-R) .

Электронные копии на компакт или оптические диски реплицируется, исключая возможность последующей дозаписи информации на данный носитель.

Обязательным является хранение каждого компакт или оптического диска в индивидуальной первичной упаковке (желательно в виде жесткой коробки).

Удаление созданных в результате сканирования и представленных в программе оцифровки (в проекте) файлов из памяти сканирующего устройства и рабочего компьютера до записи

Технические требования к созданию электронных мастер-копий с помощью цифрового фотоаппарата принципиально не отличаются от требований к созданию мастер-копий с помощью сканеров.

Тем не менее, стоит особо подчеркнуть, что цифровая фотосъемка должна производиться с максимально возможным разрешением фотокамеры (не менее 150 DPI), в цветном режиме (исключения описаны выше) и с использованием тест-объектов.

Для представления реальных физических размеров подлинника документа рядом с ним в обязательном порядке необходимо размещать линейки.

При оцифровке документов с использованием цифрового фотоаппарата заголовки изображениям даются автоматически. После переноса кадров с карты памяти на жесткий диск компьютера необходимо в графическом редакторе привести заголовки оцифрованных документов в соответствие с номерами листов подлинника. При этом недопустима какая-либо иная графическая обработка изображений.

Удаление созданных в результате цифровой фотофиксации и представленных на карте памяти фотоаппарата изображений до записи полученных файлов на встроенные носители информации и последующей репликации на внешние носители информации категорически не допустимо!

2.15. Контроль качества электронных копий

В настоящее время не существует разработанных и апробированных методик автоматизированного контроля качества создаваемых электронных копий, поэтому целесообразно применять комбинацию методов визуального контроля, перечисленных ниже:

    полистный просмотр и сравнение подлинников документов с электронными копиями;

    сверка соответствия количества электронных файлов количеству листов, проверка последовательности листов;

    проверка наличия электронных копий оборотов листов документов;

    анализ качества изображения на экране монитора с разрешением 1280х1024 точек, в том числе - цветопередача, резкость, контрастность;

    проверка читаемости документа при 200% масштабировании;

    оценка плотности изображения;

    анализ качества распечатки выбранных графических образов, созданной на принтере с разрешением 600 dpi.

Контроль качества электронных копий должен производиться неоднократно на разных этапах создания ЭФП-1:

Результаты каждого этапа контроля качества электронных копий должны документироваться и отражаться в протоколе (акте) контроля (Приложение № 7, 8, 9 10). В случае выявления брака электронной копии на любом из этапов, информация о нем вносится в протокол (акт) соответствующего этапа, который сверяется с протоколом (актом) контроля предыдущего этапа и является основанием для осуществления повторной процедуры работы с электронной мастер-копией.

Возможно осуществлять контроль качества электронных копий с помощью:

В этом случае в Протоколах (актах проверки) делается специальная отметка о том, какое программное средство использовалось и каковы результаты оценки качества электронной копии, осуществленной с помощью данного программного продукта.

Контроль качества электронных копий должен проводиться по каждому файлу. Выборочная методика контроля допустима в исключительных случаях на однотипных (массовых) источниках.

2.16. Маркировка электронных мастер-копий

Каждый файл электронной мастер-копии должен иметь уникальное имя шифр-маркировку. Разработка и внедрение унифицированной маркировки электронных копий имеет целью:

    однозначную идентификацию электронной копии;

    возможность соотнесения мастер-копии с подлинником архивного документа;

    возможность расположения электронных копий листов каждого оцифрованного дела в структуре каталога в порядке возрастания номеров листов с целью облегчения их полистного просмотра.

Основной принцип, который должен соблюдаться при маркировании электронных копий, - включение в структуру имени файла всех элементов архивного шифра документа . Ниже приводится пример маркирования электронной копии архивного документа (система архивных шифров XX-XXI вв.).

Если архивные шифры документов построены по иной схеме (что характерно для учетной документации XIX - начала XX вв.), для маркирования электронных копий должна быть разработана и внедрена система, полностью воспроизводящая данную схему.

Традиционно имена файлов должны содержать основные поисковые данные архивного документа, разделяемые знаком «_» (подчеркивания), которые включают в себя аббревиатуру названия архива (или индекс архива в автоматизированной системе), номер фонда, номер описи, номер единицы хранения (дела), номер листа, шифр лицевой стороны или оборота (1 - лицевая сторона; 2 - оборотная сторона), режим сканирования (цв - для цветного; с - для оттенков серого), расширение (формат) хранения.

В качестве дополнений к этой схеме в маркировке также могут присутствовать:

    Р - буквенный индекс фонда

    272 - номер фонда

    3 - номер описи

    а - литера к номеру описи

    8 - номер листа

    1 - шифр лицевой стороны или оборота

    цв - режим сканирования

    tiff - формат.

В случае если файл представляет собой изображение листов единицы хранения, оцифрованных в разворот, имя файла будет выглядеть следующим образом:

Пример: 01_Р272_3а_964_8_2_9_1_цв.TIFF

    Р - буквенный индекс фонда

    272 - номер фонда

    3 - номер описи

    а - литера к номеру описи

    964 - номер единицы хранения (дела)

    8 - номер листа

    2 - шифр оборота

    9 - номер листа

    1 - шифр лицевой стороны

    цв - режим сканирования

    tiff - формат.

Для маркировки электронных копий документов коллекций (нефондовая организация хранения) предлагается следующая схема маркирования:

Пример: 01_фото_3а_964_8_1_цв.TIFF, где

    Фото - название коллекции;

    3 - номер описи

    а - литера к номеру описи

    964 - номер единицы хранения (дела)

    8 - номер документа

    1 (2) - шифр лицевой стороны (оборота)

    цв - режим сканирования

    tiff - формат.

Принцип маркирования должен быть унифицирован для всего массива оцифрованных документов.

Процедура маркирования файлов электронных копий с указанием всех сигнатур осуществляется в ручном режиме, что тормозит процесс создания электронных копий, но позволяет в случае необходимости организовать отдельное от электронных систем учета хранение электронных массивов графических образов.

Файлы гистрограмм (при необходимости) маркируются также, но в позиции «режим сканирования» ставится обозначение «гр».

2.17. Структура каталогов на встроенных носителях информации
(хранение электронных мастер-копий)

Организация хранения электронных мастер-копий на встроенных носителях информации (сервер, система хранения данных, электронная библиотека, RAID-массив) должна соответствовать принципам иерархического учета и описания архивных документов и состоять из набора вложенных папок:

    Папка: № фонда

      Папка: № описи

        Папка: № единицы хранения

          Папка: № листа (диапазон № листов) документа

            Папка: Цвет (цветная электронная копия)

            Папка: Оттенки серого (электронная копия, выполненная в режиме «оттенки серого» - если необходимо)

              Файлы в порядке возрастания номеров листов

            Папка: (при необходимости) файлы гистограмм для отдельных электронных копий

              Файлы в порядке возрастания номеров листов.

2.18. Хранение электронных мастер-копий на встроенных носителях

Электронные мастер-копии необходимо хранить на сервере/ системе хранения данных/ в электронной библиотеке с обязательной формированием RAID-массивов, применяемых с целью предотвращения утраты информации и повышения надёжности хранения данных.

Структура хранения цифровой информации на RAID-массиве должна полностью совпадать с основным хранением на сервере/ в системе хранения / в электронной библиотеке.

В этом случае обе электронные мастер-копии (на сервере в системе хранения / в электронной библиотеке и на RAID-массиве) носят статус неприкосновенных, доступ к которым максимально ограничен.

Репликация мастер-копий на сервер и RAID-массив оформляется Актом (Приложение № 11).

2.19. Запись электронных мастер-копий на внешние носители информации

По окончании создания электронных мастер-копий и размещении их в соответствующем разделе каталога на встроенном носителе и в RAID-массиве, необходимо произвести репликацию электронных мастер копий на внешние носители информации, которые будут являться контрольным экземпляром мастер-копии и должны храниться в другом подразделении архива (отделе обеспечения сохранности документов).

Процесс репликации актируется (Приложение № 11-а).

Одновременно на основе актов ведется Журнал репликации электронных копий (мастер-копий) (Приложении № 12).

2.20. Создание и маркировка рабочих электронных копий

Для обеспечения возможности активного пользования созданными электронными копиями необходимо изготовить рабочий экземпляр электронных копий для создания копий второго и последующего поколений.

Для этого производится повторная репликация электронных копий на другой комплект внешних носителей информации, подтвержденная составлением акта (Приложение № 11-а. Форма совпадает с формой Акта репликации электронных мастер-копий на внешний носитель).

Одновременно на основе актов ведется Журнал репликации электронных рабочих копий (Форма журнала совпадает с формой Журнала репликации электронных мастер-копий (Приложении № 12)).

Рабочие экземпляры электронных копий делаются с мастер-копий, выполненных с максимальным разрешением и сохраненных в формате *tiff.

Электронные копии на компакт или оптические диски реплицируется, исключая возможность последующей дозаписи информации на эти электронные носители.

Таблица № 2

Основные параметры процесса создания рабочих электронных копий архивных документов

Носитель/формат

Разрешение (DPI)

Режим представления

Форматы сжатия

Рабочая копия

оттенки серого

Бумага (пергамен)
до середины XIX в.

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Бумага стандартная

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Бумага тонкая/
калька

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Фотобумага

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Обязательно

При необходимости

Обязательно

Если в дальнейшем в процессе активного использования рабочей копии потребуется ее замена, то создание новой рабочей копии (повторная репликация) возможно только:

При этом создаются новый Акт на репликацию, делается новая отметка в Журнале регистрации репликаций электронных рабочих копий. В старой записи делается отметка об уничтожении (проставляется ссылка на № и дату Акта об уничтожении внешнего носителя информации).

Созданной новой рабочей копии присваивается маркировка уничтоженной копии (см. п. 2.22. Поле «дата создания копии» заполняется актуализированной информацией).

В Журнале регистрации дисков рабочих копии (ЭФП-2) (См. п. 2.24, Приложение № 17) в поле «Примечание» записи о первой рабочей копии делается отметка об Акте технического состояния копии и Акте ее уничтожения. Вновь созданная вторая рабочая копия проходит повторную регистрацию (п. 2.24) .

Копирование рабочих копий или создание с них копий второго и последующего поколений в других подразделениях архива и без соблюдения описанной процедуры недопустимо.

Внешний носитель с записанными на него рабочими копиями остается в структурном подразделении, на которое возложен функционал создания электронных копий архивных документов для использования и создания производных копий.

2.21. Обеспечение аутентичности, достоверности и целостности электронной копии

Согласно ГОСТ 15489-1-2007, чтобы обеспечить аутентичность, достоверность и целостность документов (в том числе и электронных копий любого порядка), необходимо внедрить и документально зафиксировать процедуры контроля над созданием, полнотой и неизменностью, получением, передачей, сохранением и отбором документов и тем самым гарантировать, что создатели документов уполномочены на это и идентифицированы, а документы защищены от несанкционированного дополнения, удаления, изменения, использования и сокрытия (засекречивания). Из данного определения следует, что обеспечение данных характеристик электронных копий возможно только в результате разработки, внедрения и использования системы учета и управления цифровым контентом, в которой электронные копии документов должны быть учтены, сопровождены и связаны «с метаданными, отражающими операции, совершаемые с ними в процессе деловой деятельности», и неукоснительного соблюдения соответствующих регламентов управления цифровыми ресурсами.

2.22. Маркировка внешних носителей информации

Для каждого внешнего носителя информации создается свой информационный вкладыш. На вкладышах к внешним носителям информации (CD-R, DVD-R) , на которые произведена репликация электронных мастер-копий и рабочих копий, должны быть указаны:

    Пример:

      ГА РФ, диск №1; 22.07.2012. 523 ф-ла, 3,83 Гб, ЭФП-1 - подлинник; Ф.Р-499, оп.1, д.1-8

      имя файла

      имя файла

Маркировка внешних носителей рабочих копий производится тем же способом, а в позиции «тип диска» пишется «тип диска (электронные копии - рабочая копия (дубликат))».

Форма вкладыша - Приложение № 15.

2.23. Контроль качества внешних носителей информации

После записи оптических дисков необходимо произвести их тестирование и контроль качества (читабельности):

    визуальный контроль ведется одновременно с записью диска и фиксируется в Журнале технического состояния и диагностики внешних носителей (Приложение № 16);

    проверка на сбои при считывании с помощью утилиты «Scan Disc»

    проверка читабельности информации, записанной на носителе с помощью программных и технических средств; оценка физического состояния сохранности носителя.

Результат контроля оформляется актом. (Приложение № 13, п.&nnbsp;1.1.)

Подобный контроль необходимо проводить в режиме осуществления регламентных работ не реже 1 раза в год для всех имеющихся внешний (дисковых) носителей информации.

2.24. Регистрация носителей

Каждый внешний носитель информации должен быть зарегистрирован в Журналах регистрации внешних носителей информации:

    Журнал регистрации внешних носителей (дисков) с электронными мастер-копиями (ЭФП-1);

    Журнал регистрации внешних носителей (дисков) рабочих копии (ЭФП-2).

    Журнал регистрации внешних носителей (дисков) с копиями второго и последующих поколений (ЭФП-3).

    (Формы всех трех журналов незначительно отличаются друг от друга. Приложение № 17)

Регистрация производится сотрудником структурного подразделения, на которое возложен функционал создания электронных копий по завершении записи каждого нового диска.

Журналы должны быть прошиты, листы пронумерованы, их (листов) количество отражено в листе-заверителе или заверительной записи в конце журнала. Журналы ведутся в разворот.

2.25. Передача внешних носителей информации на хранение

Записанные внешние носители с электронными мастер-копиями архивных документов передаются в отдел обеспечения сохранности документов или подразделение архива, на которое возложен функционал по хранению фонда пользования архива, по акту приема-передачи мастер-копий на хранение (Приложение № 18), составленному в структурном подразделении, на которое возложен функционал создания электронных копий.

Прием внешних носителей осуществляется в одном экземпляре единиц хранения - контрольном , на котором записаны электронные мастер-копии.

При приеме электронных копий сотрудником отдела обеспечения сохранности документов или подразделения архива, на которое возложен функционал по хранению фонда пользования архива, составляется научно-справочный аппарат (опись (Приложение № 19), удостоверяющий лист к описи, карточкам электронных носителей) и другая сопроводительная информация, проверяется комплектность изготовления электронных копий, визуально-техническое состояние.

Внешние носители с электронными рабочими копиями хранятся в структурном подразделении, на которое возложен функционал создания электронных копий, и используются для изготовления копий различного назначения.