Qu'est-ce que la numérisation ? Numérisation d'archives : comment les documents d'archives sont numérisés Équipement spécial pour la numérisation.

La numérisation des archives papier comprend la numérisation et le catalogage des documents. Plus l'organisation, l'entreprise est grande, plus son flux de documents est complexe, plus les documents sont stockés dans ses archives et, par conséquent, les services de numérisation des archives semblent plus attrayants.

Économies sur la recherche

  1. Souvent pour l'archivage Document requis cela prend beaucoup de temps et d'efforts. Ou une situation peut survenir lorsque le même document est requis par plusieurs employés à la fois - dans ce cas, vous devez en faire une copie.
  2. De plus, il convient de noter que l'accès fréquent aux documents papier entraîne tôt ou tard leur détérioration, et parfois leur «perte», si des fichiers sont placés par erreur dans les archives.
  3. Mais pour résoudre tous ces problèmes, c'est assez simple - il vous suffit d'assurer la numérisation des archives papier, d'utiliser des systèmes d'information automatisés dans votre travail qui permettront une recherche rapide, ainsi que l'accès aux copies électroniques des documents.
  4. La numérisation des archives papier présente de nombreux avantages. Et nous parlons non seulement sur les opportunités qualitativement nouvelles pour la mise à disposition et l'utilisation de la documentation de l'entreprise, mais aussi sur la garantie de la sécurité de ces informations.

Avantages des documents numérisés :

  • réduire la charge sur les archives papier et la zone de photocopie ;
  • la possibilité de libérer de l'espace d'archives ;
  • réduire le coût de la maintenance des archives papier.

Numérisation des archives papier : étapes

Première étape. Tout travail de numérisation des archives commence par l'examen des documents. À la suite de l'analyse des documents, la structure de la matrice de papier est déterminée, ainsi que les informations quantitatives et caractéristiques de qualité documents. Sur la base des résultats de l'examen, du choix de la technologie et de la numérisation des documents, des critères d'évaluation de la qualité, le choix de la composition de l'équipement est effectué, les délais d'exécution et le budget sont convenus.

Seconde phase est un balayage direct. La numérisation des archives est le processus de création d'images graphiques d'un document à l'aide de scanners. Avant de convertir le document sous forme électronique, l'opérateur sélectionnera le mode de numérisation optimal, effectuera, en fait, la numérisation, tout en contrôlant la qualité des images résultantes sur le moniteur.

L'effet de l'introduction de l'archivage électronique

Le résultat de la numérisation des archives papier sont des copies électroniques des documents. L'équipement professionnel que notre société utilise vous permet de numériser documents diversà des vitesses allant jusqu'à plusieurs milliers de pages par jour - en mode batch. Les fichiers résultants sont écrits sur des lecteurs flash, des CD, des DVD et d'autres supports.

Archiver les résultats de la numérisation

Immédiatement après la numérisation des archives, les images graphiques subissent un traitement automatisé - fractionnement en pages de planches, recadrage le long des bords, alignement par lignes, suppression du bruit, amélioration de la qualité de l'image, etc. Vous pouvez définir les paramètres de catalogage des documents numérisés à votre discrétion, garantissant ainsi l'optimisation des processus métier du côté de la gestion des documents.

21/01/2016, jeu, 17h51, heure de Moscou, texte : Pavel Prytula 3068

La conversion de documents historiques sous forme électronique et la constitution de bases de données basées sur des inventaires d'archives est l'un des types de numérisation les plus difficiles, nécessitant des équipements spéciaux, des technologies et une attention particulière aux documents originaux.

Comme dans toutes les autres branches de l'activité étatique et commerciale, la numérisation des fonds dans les archives étatiques et municipales permet de résoudre plusieurs problèmes à la fois : mettre de l'ordre dans la comptabilité des stocks, simplifier la recherche de documents, réduire la charge des employés et le temps traitement des demandes des utilisateurs, conservation des originaux vétustes, à la fourniture de services d'archivage dans au format électronique, y compris les services payants.

Les travaux sur le transfert des fonds d'archives sous forme électronique ont commencé au tournant du millénaire. Depuis, les archives russes ont numérisé des centaines de milliers de documents historiques et d'inventaires. Mais encore, ce n'est qu'une petite partie du Fonds d'archives de la Fédération de Russie.

Deux approches

1. Si nous imaginons conditionnellement les fonds d'une institution d'archives sous la forme d'une pyramide, alors son volume principal sera les documents eux-mêmes, et seule une petite partie au sommet est l'appareil de référence scientifique (inventaire), qui permet de naviguer à travers les fonds et la recherche des dossiers et documents requis.


De nombreuses institutions utilisent la numérisation pour résoudre des tâches ponctuelles et étroites. Par analogie avec l'introduction d'un ensemble produits logiciels pour chaque petite tâche, une telle numérisation est appelée "patchwork". Par exemple, dans le cadre de l'anniversaire d'une personne importante pour le sujet de la Fédération de Russie, on s'attend à une augmentation de l'intérêt des chercheurs pour les documents d'archives. L'archive reçoit des fonds, scanne ces fonds et convertit les inventaires correspondants en un format de base de données 2-3.

Par exemple, dans le cadre de l'anniversaire d'une personne importante pour le sujet de la Fédération de Russie, on s'attend à une augmentation de l'intérêt des chercheurs pour les documents d'archives. L'archive reçoit des fonds, scanne ces fonds et convertit les inventaires correspondants en un format de base de données 2-3.

Ce chemin est une approche non systématique qui vous permet de rendre compte du travail effectué dans un court laps de temps, mais n'affecte pas l'efficacité globale de l'archive, puisque le volume total de documents transférés sous forme électronique est une fraction d'un pour cent des fonds des institutions. De nombreuses archives empruntent cette voie uniquement en raison d'un manque de financement. Mais la majorité comprend toujours qu'un travail planifié à long terme est nécessaire.

2. Par conséquent, beaucoup poursuivent des budgets programmatiques à long terme et poursuivent une stratégie différente beaucoup plus prometteuse en termes de développement de services d'archives et de services en ligne. Cette stratégie est également soutenue par l'Agence fédérale des archives (Rosarchiv).


La priorité est donnée à la numérisation de tous appareil de référence scientifique. Cette voie permet de passer à une comptabilité entièrement automatisée des fonds, y compris la création de systèmes d'information unifiés pour les archives régionales.

De plus, il existe la possibilité d'une recherche de fonds simple et pratique, ce qui facilite activités internes et vous permet de passer à la fourniture de services d'archivage sous forme électronique.

Les documents sont numérisés dans le mode courant dès réception des demandes des utilisateurs. Pour ce faire, il suffit que l'archive dispose d'au moins un scanner professionnel. Mais pour numériser de grands tableaux, des inventaires, ainsi que surtout documents précieux des experts d'organismes spécialisés dans la numérisation et la rétroconversion sont toujours impliqués.

Les spécificités de la numérisation des documents d'archives

Examinons maintenant de plus près certaines des fonctionnalités de numérisation et d'indexation des documents d'archives et des inventaires. Contrairement, par exemple, aux livres répliqués, presque tous les documents d'archives sont uniques. Une énorme responsabilité incombe à l'opérateur de numérisation, qui doit constater l'état particulier du document (délabrement, endommagement, laisser le texte dans le dos, coutures spéciales, etc.) et installer rapidement l'équipement, ou transférer le document pour restauration.

L'arpentage est l'un des types de fonds d'archives fréquemment scannés. Il s'agit d'un document d'archives standard avec un dos épais. Cependant, parmi ses feuilles, il y a des pièces jointes de format jusqu'à A0. Vous ne pouvez pas broder des choses, vous ne pouvez pas utiliser la technique du brochage. L'interprète doit avoir une autre classe d'équipement - des scanners de type planétaire grand format (exemple).

L'expérience impliquée dans le travail dans l'institution acquiert une valeur très élevée. Comme l'ont montré de nombreuses années de pratique, la reconfiguration fréquente des équipements, la nécessité de contrôler en temps réel la qualité des originaux et des images électroniques reçues dépasse les capacités des débutants en numérisation. Si une telle entreprise remporte l'appel d'offres, les risques d'augmenter considérablement la durée du projet ou d'obtenir une ressource de mauvaise qualité sont élevés (il est donc nécessaire de vérifier soigneusement les images électroniques préparées lors de la remise du travail).

Équipement

Les particularités des documents imposent également des exigences symétriques élevées à l'équipement. Pour les documents d'archives, vous ne pouvez utiliser que la technologie de numérisation sans contact - les scanners planétaires.

De plus, le scanner doit avoir les caractéristiques les plus élevées de résolution, de reproduction des couleurs et de contraste, car il y a une grande présence de textes et d'images à faible contraste et décolorés. Quel équipement est populaire sur le marché des scanners planétaires peut être trouvé dans notre revue 2014.

Le premier scanner de ce type a été développé par ELAR dans le cadre du projet de numérisation pour le fonds 350 "Contes de révision et feuilles de confession" des Archives d'État russes des actes anciens. Afin de numériser des originaux délabrés jusqu'à 50 cm de haut et pesant jusqu'à 50 kg, le scanner est équipé d'un berceau motorisé. Un niveau sûr de force de pression contre le verre est contrôlé par plusieurs capteurs.

La structure particulière, l'épaisseur, le poids des documents d'archives conduisent parfois à la nécessité de développer des équipements spécifiques. Ainsi, dans la plupart des archives d'État, parmi les fonds généalogiques recherchés, on trouve des caisses de plus de 30 cm d'épaisseur et pesant jusqu'à 60 kg : par exemple, des documents de recensement de la population (livres de recensement), des documents de paroisses ecclésiastiques sur la naissance, etc. Pendant longtemps, malgré la demande, ces fonds n'ont pas été scannés faute de matériel. Les scanners appropriés ne sont apparus sur le marché qu'à la fin de 2013, mais aujourd'hui, ils ont déjà gagné en popularité.

Indexage

Pour conserver des enregistrements et pouvoir rechercher des documents, ils doivent être indexés - remplissez des cartes dans l'AIS. La plupart des documents d'archives et des inventaires sont réalisés manuellement ou à l'aide d'une machine à écrire, c'est-à-dire qu'ils ne se prêtent pas à une reconnaissance logicielle de haute qualité. Nécessite une rétroconversion manuelle.

Encore une fois, il y a des exigences supplémentaires pour l'interprète. Premièrement, il doit disposer d'un personnel suffisant pour terminer le travail à temps. Jusqu'à 700 opérateurs d'indexation ont participé aux projets les plus importants de numérisation des fonds d'archives aujourd'hui. Il n'est pas rentable de garder un tel personnel permanent, c'est pourquoi les grandes entreprises expérimentées attirent souvent des spécialistes pour de grands projets d'archives régionaux. population locale. Pour la première fois, cette technologie a été utilisée dans la numérisation des registres des naissances pour le projet "Générations Territoire de Perm". Plusieurs centaines de personnes ont été embauchées temporairement par l'intermédiaire du Pôle emploi. Et ils ont travaillé à la maison, grâce à une application spéciale.

Un exemple classique est la date du 37 mai qui est indiquée dans un ancien document. Un opérateur formé et sain d'esprit, bien sûr, n'a pas saisi de données incorrectes, mais a clarifié la date en fonction des pages voisines du registre des naissances.

La principale question est de savoir comment atteindre 100% de qualité ? Après tout, dans le nom, les dates, les chiffres, vous ne pouvez pas vous tromper. Un système et des technologies rigides viennent à la rescousse. Par exemple, la méthode de la double saisie, lorsque les informations n'entrent dans la Base qu'après la même saisie par 2 opérateurs.

Mais le problème des langues mortes et de l'écriture demeure. Lors de la rétroconversion de tels documents, l'expérience des chefs de groupe d'indexation, qui doivent souvent résoudre des tâches complexes non standard, vient au premier plan.

Inventaire

Et maintenant sur l'essentiel. Comme indiqué au début de l'article, une stratégie prometteuse pour la numérisation des fonds d'archives est la conversion d'une NSA complète sous forme électronique. C'est le travail le plus difficile. recommandations méthodologiques Le Rosarchive a établi les règles de maintenance des bases de données sur les inventaires d'archives. Par conséquent, les inventaires doivent être indexés par un large éventail de domaines.

La complexité de la numérisation des inventaires d'archives est prise en compte, entre autres, dans 44-FZ "Sur le système contractuel". Selon la partie 2 de l'art. 56 de la loi, "la fourniture de services liés à la nécessité d'admettre des entrepreneurs, des artistes interprètes dans les bases de données d'enregistrement des musées, des archives, des bibliothèques" est à la base de la tenue d'un concours à participation limitée (la participation est limitée aux résultats des pré- sélection des qualifications). C'est-à-dire seulement après que le candidat a confirmé ses compétences et son expérience dans la réalisation de projets similaires.

Les inventaires, comme les documents, peuvent être vétustes et rédigés dans l'une des langues mortes. Les inventaires peuvent avoir une structure très complexe et contenir . Le format des inventaires pour la documentation ordinaire et scientifique et technique, ainsi que les objets de la comptabilité hors stock, diffère. La base de données générée doit être saisie dans progiciel"Fonds d'archives", etc.

Sans une compréhension approfondie des processus de l'activité archivistique, une connaissance du cadre réglementaire et méthodologique, il ne sera pas possible de réaliser une traduction de haute qualité de la NSA sous forme électronique. Par conséquent, il est nécessaire de confier la numérisation uniquement à des entreprises de confiance qui ont prouvé dans la pratique leur capacité à gérer des fonds d'archives. Et vous pouvez estimer le budget en passant commande.

Au bureau, il est souvent nécessaire d'envoyer des copies par e-mail - versions électroniques de documents imprimés. Il peut s'agir d'actes divers, factures, courriers, contrats, chartes, notes de bureau et tout autre document éventuel.

Chez nous, nous avons de vieilles photographies devenues décrépites au fil des ans, et nous aimerions les conserver.

On nous a donné le temps livre intéressant et souhaite en être propriétaire. Comment tout faire ? Nos documents papier éphémères doivent être convertis sous forme électronique, c'est-à-dire numérisés et stockés.

La numérisation est la conversion d'une image ou d'un signal audio/vidéo analogique en un format numérique adapté à l'enregistrement sur support électronique.

Pour numériser les images d'un objet, il existe des dispositifs spéciaux - les scanners. Il existe des scanners de codes-barres, des scanners de films. Les scanners biométriques lisent le motif de la rétine de l'œil ou le motif papillaire de la peau des doigts. La forme d'un objet tridimensionnel est lue par un scanner 3D tridimensionnel.

Dans les scanners pour le traitement support papier- dessins, photographies, documents textuels, l'image est éclairée ligne par ligne avec une lampe spéciale et le flux lumineux réfléchi est focalisé sur une matrice photosensible. Le convertisseur analogique-numérique convertit les signaux électriques reçus en un système de données binaires, qui forme une copie numérique de l'image.

Le choix d'un scanner dépend des tâches et des spécificités de son application. Un scanner dans un bureau est presque toujours utilisé pour numériser des documents. Même si les photographies sont numérisées, elles ne sont pas soumises à des exigences de qualité élevées au bureau. Une résolution de 300 dpi est suffisante pour assurer un fonctionnement précis des programmes de reconnaissance et pour obtenir un texte bien lu. Tout scanner produit aujourd'hui offre une résolution acceptable pour le travail de bureau.

Ceci s'applique également à la profondeur de couleur. Presque tous les scanners modernes reproduisent le niveau de gris requis pour les documents imprimés.

C'est important au bureau, où la tâche principale est de numériser rapidement des documents texte page par page, c'est l'automatisation du processus de numérisation. Des scanners à feuilles peuvent être utilisés. Ici, une feuille de document est insérée dans la fente de la machine et tirée, comme dans un télécopieur, le long des rouleaux de guidage. Un tel scanner est pratique avec un chargeur automatique de feuilles intégré. Nous chargeons plusieurs feuilles d'un document de plusieurs pages dans le bac, et pendant que le scanner numérise, nous faisons simultanément autre chose. Tout est simple ici. Si le logiciel OCR approprié est installé, une simple pression sur un bouton suffit pour numériser et enregistrer un document au format souhaité sur un tel scanner.

Une solution de bureau moderne pour un département d'une société d'ingénierie, par exemple, pourrait être un scanner A3 inclus dans un appareil multifonctionnel avec une imprimante A3/A4. Sur un tel MFP, il est pratique de numériser et de faire des copies de dessins.

Il est clair que la numérisation d'un magazine relié ou l'étalement d'un livre sur un scanner feuille à feuille ne fonctionnera pas.

Pour numériser des documents recto verso, il existe des scanners recto verso, où deux éléments de numérisation traitent les deux côtés de la feuille en un seul passage.

Une bonne solution pour la maison est un MFP à jet d'encre couleur. Le MFP est un appareil multifonctionnel qui comprend un scanner et une imprimante. Un tel appareil est également un copieur. Autrement dit, le MFP peut numériser automatiquement un document et en imprimer une copie - créer une photocopie du document.

L'appareil compact aux fonctions combinées prend moins de place sur la table. Son coût sera nettement inférieur au coût total des appareils inclus, si vous les achetez séparément. Sur une imprimante à jet d'encre couleur, nous réalisons des photographies et des cartes de visite couleur de haute qualité, et avec un scanner à plat, nous numérisons des documents, des albums photo ou des livres nécessaires.

Dans les leçons suivantes, nous apprendrons à numériser, convertir et enregistrer manuellement des documents texte sur un scanner à plat, page par page.

Dans ces exemples, j'ai utilisé un MFP de bureau A4 populaire pour la numérisation. Un tel appareil peu coûteux est la meilleure solution pour la maison et peut être un deuxième MFP supplémentaire au bureau.

Supposons que nous ayons logiquement une multipage document connexe, qui doit être numérisé et envoyé par e-mail à notre contrepartie. Appelons-le "Contrat".

Dans notre bien-aimé Windows XP, il existe un "assistant standard pour travailler avec un scanner ou appareil photo numérique". Pour que l'assistant fonctionne, le scanner doit être installé sur l'ordinateur et doit être activé. Travailler dans l'assistant est très simple et il y a un petit guide dans la leçon Numérisation de documents dans Windows XP.

Outil de création Windows 7 copies électroniques l'impression de documents et d'images est un composant standard de Windows Fax and Scan.

Nous avons donc lu les leçons et, à l'aide de l'un de ces programmes, nous avons reçu des fichiers numérisés de nos pages de contrat dans l'un des formats graphiques, les avons enregistrés et veuillez les joindre à e-mail, nous envoyons à l'adresse.

La mauvaise chose ici est que lors de la numérisation d'un document de plusieurs pages avec ces programmes, nous ne pourrons pas combiner les numérisations de pages en un seul fichier. Bien sûr, vous pouvez numéroter les fichiers de page dans l'ordre et les compresser afin de pouvoir les envoyer de manière compacte. Mais notre destinataire ne pourra que visualiser tour à tour les pages dans un éditeur graphique, sans pouvoir naviguer dans le document. C'est inconfortable et ça fait perdre du temps. Et généralement inacceptable.

En fait, à l'aide de ces outils, nous obtenons des photographies numériques individuelles des pages d'un document.

Pour convertir nos numérisations disparates en un seul document consultable en texte intégral, nous avons besoin d'un logiciel OCR. Le meilleur pour aujourd'hui est FineReader.

FineReader est un programme Entreprise russe ABBYY. La dernière version 12 d'ABBYY FineReader est sortie en février 2014. Ce programme extrait les données textuelles des images numériques - reconnaît les caractères du texte. La version d'évaluation d'ABBYY FineReader 12 Professional peut être téléchargée à partir de la ressource officielle : http://www.abbyy.ru/finereader et s'entraîner pendant 30 jours.

C'est mieux quand l'une des dernières versions pro est installée sur l'ordinateur. Ici et ci-dessous, le travail dans ABBYY FineReader 10 Professional Edition est décrit.

Ainsi, dans les leçons précédentes, nous avons scanné les pages avec les outils Windows standard, les avons numérotées, les avons enregistrées avec l'extension "jpg" et les avons placées dans un dossier séparé, que nous avons appelé "Accord".

Ainsi, en utilisant les merveilleuses fonctionnalités du programme de reconnaissance, nous pouvons facilement convertir diverses images en formats modifiables.

Plus d'informations à ce sujet, s'il vous plaît, dans la leçon suivante : Numérisation dans ABBYY FineReader.

Et donc, nous lisons ces leçons et voyons quels avantages le programme de reconnaissance nous donne. Au lieu d'une saisie fastidieuse et fastidieuse à partir d'un livre ou d'une brochure, nous numérisons simplement pages souhaitées FineReader "ohm, modifiez-les, si nécessaire, et enregistrez-les dans le format sélectionné. Ainsi, vous pourrez composer rapidement, par exemple, un article ou un résumé.

Et comment numériser les pages des livres et numériser les livres que nous avons lus dans le sujet : Numérisation d'un livre.

En conclusion, résumons le sujet : un scanner associé à un programme de reconnaissance est un remplacement rationnel de la saisie au clavier. Avoir une version papier - un texte imprimé sur une imprimante ou dans une imprimerie, au lieu de le saisir à partir du clavier, nous le scannons simplement. Un autre domaine d'application populaire du scanner est la numérisation d'une variété de produits imprimés - étiquettes, cartes postales, photographies, magazines, livres.

Actuellement, on accorde de plus en plus d'attention aux questions de bien culturel. A cet égard, il est approuvé programmes gouvernementaux, au sein duquel, selon l'intention de leurs créateurs, l'utilisation de nouvelles technologies, d'approches innovantes, ainsi que l'expérience mondiale assureront la sécurité héritage culturel, documents historiquement significatifs. Par conséquent, aujourd'hui, les archives de la Russie convertissent les documents papier en format électronique. A propos de ce qui a été le début de ce travail à grande échelle, des difficultés rencontrées par les archivistes et de la manière dont ils résolvent les problèmes de conservation des documents numérisés, directeur adjoint de l'Agence fédérale des archives (Rosarchiv) Oleg Naumov dit un correspondant de PC Week/RE Olga Zvonareva.

PC Week : Pouvez-vous nous dire comment le processus de numérisation des documents d'archives a commencé, quelles sont les caractéristiques de ce travail ?

Oleg Naumov : La tâche de conversion massive de documents d'archives en format électronique a été définie dans le programme Société de l'information (2011-2020). Ce n'est pas du tout une tâche facile. Par ailleurs, une chose est la numérisation des documents, et une autre est la numérisation du référentiel scientifique (RSA), sans laquelle on ne peut trouver Document requis. Ainsi, alors qu'il y a deux ans la possibilité d'un financement normal des travaux dans le cadre de la programme cible«Culture de la Russie 2012-2018», tout d'abord, ils ont commencé à créer une NSA sous forme électronique, ce qui vous permet de rechercher efficacement des documents.

Semaine PC : quoi ? Logiciel utilisé pour cela?

IL.: Bien avant l'adoption du programme «Société de l'information», les Archives fédérales ont commencé à développer le logiciel standardisé panrusse pour l'organisation de la comptabilité des documents - le progiciel «Fonds d'archives». système propriétaire Fédération Russe, introduit au niveau des archives fédérales, régionales et communales. Grâce à son utilisation, un catalogue central des stocks a été créé, hébergé sur le portail des Archives de Russie. Initialement, le Fonds d'archives a été créé en tant qu'appareil comptable, mais il a ensuite commencé à être utilisé comme appareil de recherche. Désormais, un certain nombre d'archives utilisent des moteurs de recherche spécialisés.

PC Week : Quelle expérience d'archivage a été fondamentale dans la numérisation des inventaires ?

IL.: Les archives historiques de l'État russe à Saint-Pétersbourg ont été les premières à numériser tous les inventaires, uniquement en raison des circonstances. Lorsque la question s'est posée de son déménagement, les inventaires ont été scannés et leurs images électroniques ont été utilisées à toutes les étapes du déménagement, c'est-à-dire que chaque boîte, chaque caisse a été suivie.

C'était une bonne expérience, mais en termes de développement technologies de l'information il n'a pas eu beaucoup de succès. Bien qu'il soit devenu possible d'en prendre connaissance en salle de lecture et en ligne, la collection d'images graphiques ne permet pas recherche automatisée. Là où une plus grande commodité est offerte aux utilisateurs par des inventaires traduits dans un format de base de données, avec la possibilité d'une recherche simple et avancée. Rosarchiv a commencé à financer activement ces travaux. A ce jour, environ 20 à 30% des inventaires des archives fédérales ont été réalisés.

PC Week : À quels défis les archives sont-elles confrontées lors de la numérisation de documents ?

IL. Le premier problème est le volume. Volume global Fonds d'archives La Fédération de Russie compte 494 millions de dossiers, dont 9 % se trouvent dans les archives fédérales.

Mais le plus difficile est de déterminer quels documents doivent être numérisés. La réponse la plus simple est la plus recherchée. Et comment déterminer cette demande ? Aujourd'hui nous avons besoin d'une chose, demain d'une autre. Et à l'époque soviétique, le concept de fonds et de documents d'archives particulièrement précieux a été introduit. Ils ont créé un fonds d'assurance sur microfilm, ainsi qu'un fonds d'utilisation. Cependant, aujourd'hui, ces documents ne sont pratiquement pas demandés. Autrement dit, les critères de valeur et de demande de documents de l'ère soviétique ne fonctionnent plus du tout maintenant. La demande est en constante évolution. Il est presque impossible de déterminer avec certitude quels documents seront les plus demandés.

L'aspect technique de la question est également important. Par exemple, il y avait une énorme demande pour compiler leurs propres pedigrees. C'est bien et nécessaire. Ils ont commencé à commander activement ces cas: livres métriques, contes de révision. Mais ils ne sont absolument pas adaptés à une telle utilisation de masse. Les scanner comme les plus populaires est un non-sens. D'un livre de 80 cm d'épaisseur, une personne n'a besoin que d'une page. Et pour répondre à cette demande, vous devez numériser les mille pages entières. Oui, même avec le chiffre d'affaires. Mais, en revanche, si ces documents sont scannés, les originaux sont retirés de la circulation et leur sécurité physique est garantie. Ils sont tous uniques. Et surtout, les malheureux gardiens (dont de nombreuses femmes) ne porteront pas toutes ces tonnes de papiers dans leurs bras.

Cependant, nous rencontrons ici la forme de fournir des informations. Après tout, il était beaucoup plus intéressant pour l'utilisateur d'obtenir non pas une image, mais un décryptage et une base de données. Et l'éventail de ces documents est immense. Seulement dans le RGADA dans le fonds 350 "Livres et livres de révision de Landratsky" - plus de cinq mille cas, environ 3 millions de pages Combien de personnes doivent être impliquées? À Perm, ils ont trouvé une bonne porte de sortie : ils ont attiré des financements qui ont été affectés à la création d'emplois. Le travail a été fait par des gens à la maison. Résolu avec succès le problème du chômage. Et à la fin, ils ont réussi à faire ce que personne d'autre en Russie, dans ma mémoire, ne pouvait faire.

L'expérience de la numérisation dans les archives fédérales nous permet de tirer deux conclusions. Premièrement, créer un fonds d'utilisation électronique sans créer de NSA est une occupation improductive. Il s'avère une énorme pile de scans, où il est impossible de trouver le bon. Deuxièmement, la numérisation, en particulier la numérisation de masse, est opportune pour exposer les complexes achevés - fonds ou inventaires. Parallèlement, les dossiers doivent être scannés dans leur intégralité afin d'éviter les conflits en cas d'erreurs de numérotation. Dans certains cas, en raison du caractère unique et de l'importance des documents, qu'il y ait ou non du texte au verso de la feuille, il est nécessaire de numériser la feuille, y compris le verso. Alors la question que nous avons peut-être caché quelque chose disparaît.

Il y a un problème avec le choix de l'équipement. Quelque part vous avez besoin d'un simple scanner, quelque part cela devrait être plus compliqué. Par exemple, pour la numérisation des livres Landrat, un « berceau profond » a été spécialement commandé. Sinon, ne copiez pas, car l'épaisseur du dos de certains livres atteint 80 cm.

PC Week : Quel est l'objectif principal de la numérisation à l'heure actuelle ?

IL. Il y en a trois. Le premier est l'élargissement et la simplification de l'accès aux documents du Fonds d'archives. Le second est d'assurer la sécurité des originaux en les retirant de la circulation et en donnant accès aux fonds électronique utilisation. Le troisième est la simplification de la fourniture des services publics. Il y a maintenant de nombreuses demandes individuelles de citoyens pour des documents sur personnel. Les archives commencent également à les numériser et à utiliser des copies électroniques pour préparer les réponses, ce qui accélère grandement le travail.

PC Week : Comment les archives numérisent-elles les documents ?

IL. Le processus se déroule différemment: quelque part, ils le font eux-mêmes, en utilisant des moyens improvisés ou en acquérant une variété d'équipements. La deuxième façon est d'impliquer des organisations extérieures. Mais encore, il n'y a pas encore de réponse sans équivoque à la question la plus importante : à quoi s'efforce-t-on de numériser les documents ?

PC Week : Et personne ne leur demande ?

IL. Pourquoi, tout le monde demande. Mais comment trouver la seule bonne réponse ? Bien sûr, l'avantage d'utiliser des documents numérisés est évident. Ceci et la sécurité, l'accès à distance, la facilité de fournir des informations et la facilité de faire des copies - une gamme complète d'avantages. Une autre chose est de savoir comment y parvenir? Ici, vous êtes un utilisateur, vous êtes entré sur le site et avez déterminé que les documents dont vous avez besoin sont stockés. Disons à Perm. Nous sommes allés sur le site en utilisant le lien, avons trouvé des descriptions de cas. Il y a un sujet intéressant. Et comment l'obtenir ? Eh bien, s'il est déjà numérisé. Et sinon? Aller vous-même aux archives et commander les originaux ? Ou les archives doivent-elles numériser tous les cas ? Mais c'est impossible. Donc, en fait, il ne reste qu'une seule option. Création dans chaque archive de la possibilité de production rapide de copies électroniques à la demande de l'utilisateur. De plus, il ne s'agit pas nécessairement de sa propre unité. Il peut aussi s'agir d'externalisation. Mais un tel service doit être fourni rapidement. Mais pour faire ces copies, comme le montre l'expérience, cela n'a de sens que lorsqu'il y a déjà système électronique, ce qui permettra un placement de haute qualité et structuré de ces matériaux. C'est alors que ça marchera. Quand nous le ferons et si nous serons capables de le faire, pour être honnête, je ne sais pas.

PC Week : Probablement, avant même l'approbation du programme de la société de l'information en 2010, des travaux sur la numérisation avaient-ils déjà été menés ?

IL. Oui. Il y avait des projets distincts. Par exemple, les archives électroniques du Komintern ou une collection de documents du SVAG. En règle générale, ils ont été mis en œuvre conjointement avec des partenaires étrangers. Les fonds propres pour leur mise en œuvre n'étaient pas suffisants. L'affaire n'était pas facile. Il y avait des difficultés techniques, méthodologiques, organisationnelles et technologiques. Mais l'expérience s'est accumulée. Et maintenant c'est très utile.

PC Week : C'est-à-dire qu'après l'approbation du programme, ils ont commencé à déterminer quels devraient être les principaux critères de numérisation des documents ?

IL. Ce programme, disons, a permis aux archivistes d'attirer l'attention des autorités sur le fait qu'il y a un problème et qu'il faut le régler. Préparer et approuver les programmes de numérisation. Et attirer des financements pour cela. Mais aujourd'hui, il n'y a pas de critère universel. Il est difficile de définir une approche unique pour tout le monde, car les archives stockent une documentation complètement différente.

PC Week : Chaque archive a donc défini elle-même les critères ?

IL. En fait, oui. En principe, ce sont quatre critères, ils sont généralement acceptés, mais je ne dirai pas que ce sont les plus corrects. C'est la demande de documents, assurer la sécurité, faciliter le travail des employés des archives, améliorer les conditions de service aux utilisateurs. De plus, cela accélère le travail. Si j'ai une NSA électronique sur mon site, l'utilisateur accède à l'archive préparée en consultant l'inventaire sur Internet. Si les documents requis ont déjà été numérisés, il a la possibilité de les consulter sur son ordinateur sans passer par les archives, ou de les recevoir en salle de lecture sans délai.

PC Week : Il s'avère que chaque archive doit décider par elle-même quoi numériser en premier lieu ?

IL. Très bien. Cela devrait être un programme exclusivement individuel pour chaque archive. Vous ne pouvez pas en faire un. Ça dépend de nombreux facteurs: opportunités financières, sur le degré de développement et de mise en œuvre des technologies informatiques, sur demande spécifique. Ainsi, quelqu'un est en grande demande de documents sur le personnel, et il est nécessaire de satisfaire les besoins des citoyens. Bien que d'un point de vue archivistique, ces documents ne sont pas permanents, mais ont une durée de conservation temporaire de 75 ans. Mais cela facilite le travail et aide les gens, car une personne n'attend pas une réponse à une demande pendant un mois, mais reçoit les informations requises en deux jours. Il est donc nécessaire d'investir dans cet effort et ces ressources.

PC Week : Lors de la détermination des priorités des documents à numériser, les archives les coordonnent-elles avec les archives russes ?

IL. Si on parle d'archives régionales, alors non. C'est l'affaire de toutes les archives. Ils nous transmettent leurs programmes d'informatisation et de numérisation. Nous apprenons à les connaître et donnons nos conseils. Nous les aidons au mieux de nos capacités, nous allouons des fonds du FTP. Une autre chose est les archives fédérales. Ici, la position des archives russes est d'une importance décisive. Mais même ici, il n'y a pas de critère universel. Pour répondre à la demande toujours croissante d'informations généalogiques, les archives russes ont alloué plus de 40 millions de roubles. pour le transfert des livres de landrat stockés dans le RGADA sous forme électronique. Répondant à l'intérêt constant de la société pour l'histoire de notre patrie dans un passé récent, en juin de cette année, le site «Documents de l'ère soviétique» a été lancé, où des images de documents du fonds personnel de I.V. Staline et du Politburo de le Comité central sont affichés. Des projets Internet ont été préparés pour le 1150e anniversaire de l'État russe, le 400e anniversaire de la fin des troubles, le 200e anniversaire de Guerre patriotique 1812. Naturellement, des images des documents les plus importants et les plus populaires y ont été affichées.

PC Week : Désormais, seules des copies électroniques seront délivrées dans la salle de lecture des archives, et non des documents originaux ?

IL. Idéalement, vous avez besoin d'une personne pour trouver le document qu'elle recherche sur le site, commander un étui, et elle recevra des documents numérisés. Et l'original reste intact. Cependant, il y a des cas où vous avez besoin de voir l'original. Par exemple, quelle que soit la qualité de la technique, elle ne transmettra pas de filigranes. Et sur eux, vous pouvez définir la date du document. Mais ces cas sont un sur mille.

PC Week : Il s'avère que l'archive a été fournie à l'utilisateur service publique, mais après que la copie numérisée du document doit être enregistrée?

IL. Bien sûr, c'est l'avantage de la numérisation. Auparavant, il y avait des microfilms, des xerox, des tapuscrits. Et l'archiviste, ayant fait des copies, les a remises à l'utilisateur. C'est-à-dire qu'il n'avait pas de copie du document. En cas de numérisation, il reste une copie. Mais pour cela, le lieu de stockage doit être clairement défini. Et s'il y a une deuxième demande plus tard, il ne sera pas nécessaire de soulever le dossier. Vous devez acquérir de l'expérience dans ce type de travail.

PC Week : Comment sont déterminés les délais de numérisation des tableaux de documents ?

IL. Les délais dépendent de trois raisons : des capacités techniques et financières et de l'état des documents. Certains documents sont reliés de telle manière que même la technologie la plus moderne ne peut obtenir entièrement le texte. C'est-à-dire qu'ils devront être brodés, ce que ni les documents ni les archivistes n'aiment vraiment. Analyse. Puis recoudre. Ça prend du temps. De plus, les délais dépendent du volume des caisses, du nombre de feuilles qu'elles contiennent. Il n'est pas si difficile de numériser une pile de papiers dans un format standard, mais une carte de 3x8 m est déjà plus difficile. Selon les documents comptables, il s'agit d'une seule feuille. Mais il n'est scanné que par parties. Et puis dans le logiciel, vous devez tout "assembler", l'ajuster et voir à quoi ressemblera ce document.

PC Week: Comment se déroule le travail sur la mise en œuvre du 89e point du programme cible fédéral "Culture de la Russie (2012-2018): formation d'archives ressources électroniques et leur mise à disposition sur Internet » ?

IL. Dans le cadre de la mise en place de cet article, l'inventaire est en cours de numérisation. Des documents sont également numérisés, y compris des livres de landrat. De plus, nous essayons également d'aider les régions: nous incluons environ cinq ou six régions par an dans ce programme et allouons de 10 à 15 millions de roubles. Nous créons des expositions en ligne, etc. Au total, 67 millions de roubles sont alloués par an pour la mise en œuvre des travaux dans le cadre de ce programme.

PC Week : La répartition des fonds dépend-elle du degré d'importance et de signification des documents ?

IL. Oui. Les archives soumettent des candidatures sous une certaine forme pour la participation, nous considérons ces candidatures. De plus, les entreprises qui pensent offrir des choses intéressantes postulent. Nous les examinons, choisissons des solutions prometteuses intéressantes, élaborons un plan général et procédons à l'approvisionnement sur une base compétitive. L'année dernière, il y avait 52 contrats d'État pour cet événement. Autrement dit, chaque semaine, nous avons signé un contrat.

PC Week : Vous avez abordé le sujet des documents déjà stockés dans les archives, à partir du XIe siècle, mais de nouveaux documents papier arrivent également dans les archives et c'est un vaste éventail. Comment se passe le travail avec eux ? Comment la question de leur numérisation est-elle résolue ?

IL. Pour nous, une seule chose importe : que ces documents appartiennent ou non à la composition du fonds d'archives. Autrement dit, ils sont soumis à une durée de conservation permanente ou non. Et puis, du point de vue de l'usage, peu importe qu'il s'agisse de documents du XIe ou du XXIe siècle. À cet égard, ils sont égaux. Une autre chose est que nous avons naturellement un fonds d'assurance et un fonds à utiliser pour les documents du XIe siècle. Et ces documents uniques sont extrêmement rarement distribués. Il existe un registre d'état spécial documents uniques RF, qui est publié sur le site Web des Archives fédérales et contient leurs descriptions et images électroniques.

PC Week : À cet égard, il est probablement plus facile d'accepter des documents traduits en format électronique? Par exemple, les changements apportés à la législation concernant documentation du personnel, et les archives, probablement, peuvent-elles l'accepter sous forme électronique ?

IL. Je suppose oui. Mais sens particulier archives d'état J'accepte documents contemporains actuellement pas de personnel. Pourquoi? Calculer votre retraite ? Il y a Fonds de pension, qui a établi un enregistrement spécialisé des citoyens, depuis 2000.

PC Week : Donc, les archives n'acceptent pas les documents datant de 75 ans ?

IL. Non, nous l'avons gardé longtemps. Et maintenant, nous négocions activement avec le même fonds de pension, afin que nous puissions réduire cette période pour les documents papier de 75 à 15 ans. Mais la Caisse des pensions craint que son système électronique ne s'effondre.

Et ces documents qui finiront par nous parvenir sous forme électronique constituent un problème très important et complètement distinct. Ce sont des questions sur gestion électronique des documents, documents électroniques. Comment les prendre, comment les stocker, est une question distincte.

PC Week : Vous n'avez pas encore reçu ces documents ?

IL. Non, ils font. Les matériels du recensement de la population et du recensement agricole ont été acceptés par le GARF sous forme électronique. Une autre chose est que ces recensements n'existent que sous forme électronique. Mais il n'y a pas encore d'acceptation massive de la documentation commerciale. Il y a pas mal de problèmes non résolus ici.

PC Week : Et qu'en est-il des documents des organisations liquidées ? Sont-ils acceptés pour le stockage ?

IL. Nous acceptons. Certes, en cas de faillite et de liquidation d'une entreprise, les syndics de faillite sont obligés de trouver de l'argent pour décrire les documents des organismes liquidés, mais ils ne le trouvent pas toujours.

PC Week : Les Archives fédérales gèrent 15 archives fédérales. Les archives régionales sont-elles actuellement hors du contrôle de votre département ?

IL. Oui, il n'y a pas de contrôle direct sur eux. Ils obéissent organes exécutifs sujets de la fédération. Quelque part, ce sont des services d'archives indépendants. Quelque part, comme nous, ils sont inclus dans les ministères de la culture. Quelque part - au ministère de la Justice ou directement au bureau du gouverneur. Mais la verticale du pouvoir qui existait en Union soviétique et a duré jusqu'en 2004 n'existe malheureusement plus. Tant que nous maintenons l'unité méthodologique. Comment pouvons-nous aider les archives régionales. Des représentants des Archives fédérales participent aux événements annuels organisés dans chaque district fédéral conseils scientifiques et méthodologiques. Une fois par an, le Conseil de les archives où se rassemblent des archivistes de tout le pays. Autrement dit, les connexions restent. Nous plaisantons en disant qu'un archiviste est une profession dans laquelle, dans n'importe quelle ville, vous pouvez vous retrouver sans argent et sans rien, venir voir d'autres archivistes, et ils vous accepteront, vous nourriront et vous renverront chez vous. Il y a une fraternité qui, en fait, n'est caractéristique d'aucune autre profession.

PC Week : Merci pour le chat.

BALAYAGE : Technologies

Qu'est-ce que la numérisation ?

02.10.2015, Ven, 14:05, Msk 2707

Numérisation, rétroconversion et services associés. Examen des technologies de conversion des documents sous forme électronique.

Il existe plusieurs options pour organiser les processus de numérisation. Ils peuvent être réalisés de manière autonome ou avec externalisation de prestations, avec exportation de documents ou réalisation de travaux sur leur territoire. Lors de la numérisation, des scanners de bureau, de documents professionnels ou planétaires peuvent être utilisés. Les données peuvent être extraites en mode manuel, semi-automatique ou automatique, avec archivage préalable des documents papier ou classement des informations déjà sous forme électronique, etc.

Quelle voie choisir ?

La solution dépend de la tâche spécifique, car chacun des "ou" ci-dessus détermine la qualité du résultat et le coût du travail. Par exemple, la question des documents reliés est éternelle : est-il plus rentable de numériser lentement à l'état relié ou de dépenser de l'argent en assemblage, mais de numériser rapidement sur des scanners de documents ?

Le moyen le plus simple de choisir la voie qui vous convient le mieux est de faire appel à l'expertise d'une organisation de numérisation. Intéressées par le travail, les grandes entreprises mèneront une enquête gratuitement et la meilleure approche sera déterminée pour vous. Ne manquez pas cette opportunité et ne vous attendez pas à être tenté de commander des services : la plupart de ces entreprises sont également intéressées par la fourniture de matériel et de logiciels pour la numérisation à faire soi-même.

Combien de documents avez-vous besoin de numériser ?

Le paramètre déterminant est le volume de documents.

Le paramètre déterminant est le volume de documents. Pour la numérisation quotidienne de petits lots de documents brodés (par exemple, comptabilité primaire) un scanner de bureau ordinaire pouvant supporter une charge de plusieurs milliers de pages par jour fera l'affaire. Il vous suffit de le compléter avec un programme pratique d'indexation.

Pour une numérisation régulière grands volumes un équipement professionnel est nécessaire. Ce sont des scanners industriels qui coûtent très cher (ce type d'équipement est utilisé par le Service fédéral des impôts, le Service fédéral des douanes et les grandes banques). Par conséquent, un accord-cadre pour la fourniture de services de numérisation périodiques peut être une alternative moins coûteuse.

La conversion de grands tableaux rétrospectifs sous forme électronique par vous-même n'est pas économiquement justifiée : en plus de l'achat d'équipement et de la formation des employés, des coûts de main-d'œuvre et de temps importants seront nécessaires. Il est nettement plus efficace de commander un service, car une grande entreprise peut affecter un personnel important et résoudre le problème rapidement.

Où scanner des documents ?

Le paramètre déterminant est la demande de documents numérisés. La saisie de documents affecte-t-elle l'activité de l'organisation au moment de la numérisation ? Ceci est particulièrement critique lors de la numérisation de documents auxquels les employés accèdent régulièrement, ou qui peuvent être soudainement demandés par l'autorité de régulation, ainsi que pour éliminer les urgences associées aux documents. Exemples : documents financiers et personnels, documents techniques et documentation opérationnelle, livres du bureau d'enregistrement et autres fonds de l'industrie.

Zone de numérisation, organisée dans les locaux de l'entreprise cliente des services.

Si vous avez besoin de les numériser assez rapidement, alors l'approche traditionnelle consiste à commander des services avec le départ de l'équipe de numérisation sur votre territoire. Souvent, cela s'avère moins cher que de livrer des documents à la production de l'entrepreneur et vice-versa, mais tout est déterminé par l'éloignement territorial. Les règles de travail sur le terrain impliquent de numériser le dossier émis en un ou deux jours ouvrables, sans se retirer longtemps du flux de travail.

Dois-je broder des documents ?

Paramètres déterminants : l'état des documents et la possibilité d'assemblage. S'il existe une telle opportunité et que le papier peut être tiré avec un scanner de documents, il doit être brodé. Le fait est que la numérisation de documents reliés sur un scanner planétaire (livre) est plusieurs dizaines de fois plus lente que la numérisation en continu. Augmenter proportionnellement le temps de travail et le coût de la main-d'œuvre. La numérisation sur des scanners de documents, même en tenant compte de l'assemblage, est plus rapide et moins chère.

Vous pouvez broder vous-même, ou vous pouvez le confier à l'artiste.

Vous pouvez broder vous-même ou vous pouvez le confier à l'entrepreneur : si une entreprise réputée est choisie, vous ne devez pas avoir peur de perdre des documents. Au contraire, une réglementation stricte de tous les processus et des matériaux de haute qualité permettent aux entreprises de s'assurer contre les pertes financières supplémentaires et les atteintes à leur image. Cette approche est même fiable Tribunaux russes: lors de l'organisation de la numérisation, généralement par une ordonnance interne, la jonction et la couture ultérieure des affaires judiciaires sont autorisées.

Soit dit en passant, les grandes entreprises peuvent simultanément effectuer un traitement d'archivage professionnel : d'une part, une partie du travail est déjà effectuée en vue de la numérisation, et d'autre part, le traitement d'archivage permet d'identifier les documents non réclamés et de réduire le volume des tableaux numérisés, ce qui peut réduire le coût des travaux.

Quelle qualité choisir ?

Aujourd'hui, n'importe quel objet peut être numérisé en haute qualité : d'une petite carte de bibliothèque à des cartes 8A0 et des décors de théâtre.

Paramètres déterminants : type de document et quantité de ressource reçue en formulaire électronique. Aujourd'hui, les équipements de numérisation peuvent produire des images avec des résolutions allant de 200 à 1200 points par pouce (ppp). Pour œuvres d'art une résolution de 400 à 600 dpi est généralement utilisée pour produire des reproductions de haute qualité. Une qualité supérieure est utilisée uniquement lorsqu'il est nécessaire d'agrandir l'image et de détailler de petits objets, tels que des pièces de monnaie.

Les dessins détaillés et à faible contraste, souvent réalisés sur du papier calque et du bleu, doivent être numérisés à une résolution de 300 à 400 dpi et un traitement d'image supplémentaire dans les éditeurs graphiques. Le reste des documents est généralement numérisé à 300 dpi, ce qui est suffisant pour imprimer des copies sans perte de qualité. Recadrage d'image nécessaire, correction géométrique, correction des couleurs, conversion en formats pdf, tiff, jpeg, etc. peuvent être effectués en mode entièrement automatique par des programmes intégrés à l'équipement de numérisation ou fournis avec celui-ci.

Dans la plupart des cas, le mode de prise de vue couleur est utilisé. Ceci est nécessaire pour tous les documents qui ont été corrigés ou tamponnés sur du texte, pour vérifier qu'une copie électronique a été prise du document original avec un sceau et une signature, ainsi que pour la lisibilité des textes qui s'estompent et pour transmettre les caractéristiques uniques du original. La nécessité d'une numérisation couleur des œuvres artistiques n'est pas discutée. Le mode "niveaux de gris" n'est utilisé que dans certains cas : lorsque les documents ne contiennent pas d'attributs de couleur, ou lorsqu'il est nécessaire de réduire le volume de la ressource électronique reçue.

La numérisation peut être effectuée indépendamment. La tâche principale est de former les employés à travailler correctement avec des équipements complexes, car la qualité des images obtenues est importante pour l'indexation ultérieure : un document mal numérisé, des ombres, des reflets et d'autres défauts sur une image électronique peuvent la rendre illisible. une information important. Cela empêchera l'application des technologies d'extraction automatique des données et pourrait entraîner des erreurs d'indexation. Téléchargement de données erronées sur certains systèmes ( registres d'état, systèmes comptables) n'est pas autorisé.

Indexage

La numérisation simple est rarement utilisée, car dans les travaux ultérieurs, il ne sera que légèrement plus facile de rechercher des informations dans un ensemble de fichiers graphiques en retournant le papier. Pour pouvoir effectuer une recherche, il est nécessaire de sélectionner plusieurs attributs (champs d'index) dans le document.

Employés impliqués dans l'indexation massive de documents par saisie manuelle.

Les attributs sélectionnés peuvent être ajoutés au nom du fichier. Cette pratique s'est développée dans les tribunaux russes : pour que l'opérateur de numérisation n'ait pas accès aux systèmes internes du tribunal, lors de la numérisation, toutes les informations nécessaires sont saisies dans le nom du fichier. Par la suite, ces détails sont reconnus par le système judiciaire lors du chargement de chaque document séparément.

Mais généralement, les documents numérisés sont téléchargés sur Système d'Information groupe, ce qui nécessite la création d'une base de données. Ainsi, si vous avez besoin de joindre un document à une carte existante dans Système de comptabilité, il peut suffire d'extraire quelques attributs qui le définissent de manière unique - généralement un nombre et une date.

S'il est nécessaire de constituer une base de recherche sur la base des documents eux-mêmes, la quantité de données à extraire est déterminée par la tâche : de quelques détails pour rechercher un fichier dans une archive électronique au transfert de toutes les informations importantes vers une base de données analytique (nom, adresses, TIN, KPP, dates, numéros de documents de candidature, etc.).

Les musées, les bibliothèques et les archives appliquent leurs propres règles d'indexation lors de la numérisation des unités de stockage et des documents comptables. Une ligne de services distincte est également la vectorisation, qui est utilisée, en particulier, dans la numérisation des bandes de journalisation (automatique) et des dessins (rendu manuel dans les systèmes CAO).

La quantité de données à extraire La réponse à cette question s'obtient également au mieux en faisant appel à l'expertise, car le nombre de détails à extraire dépend de la tâche fonctionnelle et détermine en grande partie le coût de la numérisation. Dans certains cas, vous pouvez vous limiter à des collections de documents, lorsque des images électroniques sont combinées sous les auspices du document principal (par exemple, un contrat ou un registre de comptes). Dans d'autres, il faut extraire toutes les données contenues dans le document pour remplir la fiche du système d'information.

Exemples de récupération de données

Analyse des commandes passées sur le portail zakupki.gov.ru par des entreprises avec participation de l'État et les institutions étatiques (44-FZ, 223-FZ), montre que :

- Pour relier les copies électroniques de l'ORD au système de gestion électronique des documents, le nombre, la date et le type de document sont suffisants.

– La numérisation de la documentation financière s'accompagne souvent de l'extraction du numéro, de la date, des noms et coordonnées des payeurs, des montants.

- La numérisation des documents d'archives des municipalités (décrets d'administrations, comités exécutifs municipaux, conseils de village, etc.) afin de fournir des services et des objets d'inventaire des relations foncières et immobilières nécessite d'extraire le numéro et la date du document, tous les noms, prénoms et adresses . De plus, les adresses doivent être comparées avec les répertoires KLADR/FIAS actuels.

– La numérisation des documents du Fonds d'archives de la Fédération de Russie s'accompagne du remplissage strict de la NSA et de la description des fonds conformément à la législation sur les archives.

– L'indexation des inventaires et des registres implique la reconnaissance de tous les enregistrements ordinaux.

– Pour travailler avec des dessins sous forme électronique, il est nécessaire d'extraire presque tous les champs de timbre.

– La numérisation de fichiers composites nécessite non seulement d'extraire les détails de chaque document, mais également d'établir des relations. Le cas le plus difficile est la documentation de conception, où la base de données générée a une hiérarchie à plusieurs niveaux et des liens de documents.