L’ECPAD a rejoint depuis le mois de mai FranceArchives, le portail national des archives. Françoise Banat-Berger, cheffe du service interministériel des Archives de France, revient sur ce partenariat.

1 – Pour quelles raisons les Archives de France se sont-elles associées à l’ECPAD dans le cadre du portail francearchives.fr ? Quels sont les objectifs de la politique d’ouverture et de partage des données publiques dans laquelle s’inscrit FranceArchives ? 

L’ambition du portail FranceArchives est de proposer un point d’accès fédéré à l’ensemble des fonds d’archives français, quel que soit leur support et leur type, afin de les rendre plus visibles sur le web et de renforcer ainsi l’audience des partenaires du portail, vers lesquels nous renvoyons systématiquement pour la consultation des documents que nous signalons. Les archives photographiques et audiovisuelles constituent un axe fort de développement pour FranceArchives, et ce partenariat avec l’ECPAD, l’un des principaux acteurs français dans ce domaine, nous permettra d’atteindre rapidement une masse critique de données et de structurer cet axe thématique. Une des autres missions confiées à FranceArchives consiste à favoriser la diffusion et l’utilisation les plus larges possible des données archivistiques françaises. Cela passe par leur diffusion sous le régime de la licence ouverte de l’État et sous la forme de jeux de données en open data, mais également par leur signalement sur le portail européen des archives (dont FranceArchives est l’agrégateur pour les données françaises) ainsi que sur Europeana.  

2 – Le portail francearchives.fr favorise le développement d’outils de recherche innovants : pourriez-vous nous présenter ces avancées et les apports éventuels pour l’ECPAD ? 

FranceArchives s’investit particulièrement dans l’intégration des archives françaises au sein du web de données. Nous procédons à d’importants enrichissements sémantiques des données fournies par nos partenaires, en les alignant vers des référentiels tels que Wikidata, data.bnf ou Geonames, afin de les lier aux données structurées déjà référencées sur le web. Nous convertissons actuellement ces données en RDF selon l’ontologie RIC-O, qui est le modèle de référence pour la publication de métadonnées archivistiques dans le web de données et qui permettra la formulation de requêtes sur ces jeux de données à l’aide du langage SPARQL. Ces enrichissements et ces conversions peuvent être récupérés par nos partenaires et réutilisés dans leurs propres outils de diffusion. FranceArchives accompagne également ses partenaires dans la montée en qualité de leurs données, qu’il s’agisse de les décrire, de les indexer ou de les échanger (par l’intermédiaire du protocole OAI-PMH). 

3 – Quels sont les évolutions prévues et les futurs projets concernant le portail francearchives.fr ?  

L’année 2022 s’annonce particulièrement riche pour FranceArchives puisque nous ouvrirons cet été notre espace de données nominatives, qui donnera accès à plusieurs dizaines de millions de noms de personnes issus de l’état civil, des matricules militaires, des recensements, etc. En fin d’année, ce sera le tour de notre entrepôt RDF, qui permettra de requêter en profondeur les données et les inventaires présents sur le portail. À moyen terme, nous nous préparons également à intégrer les métadonnées des archives nativement numériques, en commençant par celles des Archives nationales (outil ADAMANT). Et d’ici 2025, nous diffuserons sur FranceArchives les résultats du projet SOCFACE porté par l’INED et la société Teklia, qui travaillent actuellement avec les services d’archives départementales pour passer les recensements de la population de 1836 à 1936 à la reconnaissance optique de caractères manuscrits (HTR) et en tirer plus de 500 millions de noms de personnes, qui seront accessibles sur le portail et dans chaque service d’archives départementales.