2. Traitement commencé
en 2018, première
expérience de traitement
d’un vrac numérique
Objectif : rendre
exploitable cet ensemble
d’arborescences pour la
recherche et rentrer les
dossiers dans le futur
SAE
Ressource de dossiers
de travail qui sera
complémentaire aux
dossiers mieux
organisés dans le
papier.
Les arborescences
étaient déjà cotées en W
Des archives vierges de
tout traitement. Par
manque de temps lors
de la collecte, il n’y a
pas eu de pré-tri.
Arborescences mêlant le
travail et le privé
(permis de conduire,
diplôme, fiche de paie
etc…).
Grande variété de
formats
Volumétrie initiale :
115Go
42091 fichiers
4249 dossiers
10 sous-niveaux de dossiers
dans les cas extrêmes
Volumétrie après traitement
automatisé :
85,3Go
16344 fichiers
1735 dossiers
1. Présentation du vrac numérique
4. Outils testés Outils utilisés Outils non retenus
Outils d’exploration
d’arborescence
Archifiltre Windirstat
Adapté aux très gros volumes,
mais fonctionnalités réduites et
processus d’analyse très lent
Outils de renommage Bulk Rename Vrenamer
L’appli a du mal à renommer en
masse, elle bugge beaucoup
Outils de détection des
dossiers vides
Remove Empty Directories X
Outils de
dédoublonnage
Duplicate Cleaner
Attention, appli payante avec une
version test gratuite de 15 jours
Dupfinder
Ce dernier propose une sélection
manuelle des doublons à
supprimer…
Outil de listing des
formats de
fichiers/Dates extrêmes
Archifiltre - Bulk Rename -
Windirstat
Suppressions AxCrypt = outil non utilisé à l’époque
En 2018, les outils
à notre disposition
étaient déjà divers
et variés.
+ Depuis, le
SIAF a mis à
disposition
« Octave » qui
condense
plusieurs de ces
solutions.
+ Amélioration
notable des
fonctionnalités
d’Archifiltre.
2 Un tri virtuel…bien réel!
5. Titre
Comment acter et suivre toutes les décisions liées au
traitement ?
Un dossier de traitement par versement :
1. Fichier de suivi (tableur) pour gérer un traitement au long
cours :
Volume avant et après copie – volume après dédoublonnage,
volume après suppression des dossiers vides, volume après
suppressions manuelles en cas de formats inouvrables, etc.
2. Fichier de prises de notes
3. Rapports de dédoublonnage, extractions archifiltre
Documenter la période de pré-tri est essentielle pour ne pas
perdre le fil.
Permet également de documenter le bordereau d’élimination.
2 Un tri virtuel…bien réel!
Une série de problèmes liés à
l’environnement numérique :
1. Problèmes d’ouverture des fichiers et
problèmes de copie = perte d’information
(trop de sous-niveaux, noms de fichiers
trop longs, fichiers inouvrables…)
2. Renommage en masse = perte
d’informations possibles
3. Allègement des niveaux de dossiers afin
de réduire l’abondance des niveaux =
risques de perte d’information, mais
amélioration de la lisibilité des archives
Ce traitement nous a conduit à instaurer une politique de record management au sein de l’institution via le projet « Production de
référence » (charte de nommage, formations, mise en œuvre d’arborescences de pré archivage numérique, création de plans de
classement pour toutes les directions, etc.)
6.
7.
8. 3 Mise en valeur du fonds
La communicabilité du fonds numérique en question
- Attribution d’une « contrainte » dans la règle de communicabilité au sein de notre SIA
- Examen minutieux du contenu des dossiers d’archives demandées avant la communication à un
lecteur.
Situation des archives numériques et physiques dans les bases de données
- Bordereaux de versement en W. Description du premier niveau de dossiers seulement pour le
numérique en raison d’un nombre élevé de sous-dossiers. Ajout d’un commentaire sur le pré-
traitement opéré.
- Intégration prochaine des versements numériques dans le SAE
Comment mettre en valeur ce fonds hybride?
- Future double cotation « W » et « EW » à résoudre (mention de la cote EW dans la fiche
descriptive du SIA)
- Réalisation d’un instrument de recherche organique dans notre SIA Ligéo : le bordereau des
archives physiques dans le SIA est plus présentable que le bordereau SEDA qui sera issu du
SAE (description au fichier dans le bordereau SEDA). Comment entremêler les descriptions de
manière intelligible à l’avenir et établir un connecteur entre les deux bases?
9. 3 Mise en valeur du fonds
2021_EW_70 Coordination générale 2012, suivi : notes, rapports, comptes-rendus, conventions, correspondance, photographies
L’instrument de recherche organique mixant les sources papier et numérique attendu :
Récupération de la description de l’objet
d’archives?
Formalisation de
l’instrument de recherche
dans le SIA
Cote SAE
11. 4 Conclusion
Retour d’expérience de ce traitement d’un vrac numérique :
- Des solutions sont à imaginer pour la valorisation du fonds hybride ce qui est très stimulant
(description, forme de l’instrument de recherche, etc.)
- Le rapport à l’archive n’est pas le même dans le numérique que dans le papier :
Connaissance imparfaite du vrac numérique au cours de ce pré-traitement contrairement au cas
d’un tri d’un vrac papier que l’on fini par connaitre à peu près par cœur au bout de quelques jours.
En cause, l’impossibilité de compulser les documents, de les survoler d’un regard. Le vrac
numérique n’est pas un volume physique, un ensemble « matériel » que l’on visualise, que l’on
feuillette. La série de clics que constitue le pré-traitement d’un vrac numérique n’est qu’une étape
qui ne peut pas se substituer au tri et qui reste assez en surface du contenu.