Portail BAnQ Nétiquette

Les sites Web : un patrimoine documentaire à conserver

4 avril 2018 par Carnet de la Bn | Catégorie(s) : Acquisition

par Carole Gagné,
Bibliothécaire – dépôt des publications numériques et collectes des sites web,
Direction du dépôt légal et de la conservation des collections patrimoniales.

Le Web est désormais une source d’information incontournable avec des contenus souvent exclusifs : blogues, vidéos, etc. Pour nous, il s’agit d’une source primordiale pour l’étude de notre société par les chercheurs d’aujourd’hui et de demain. Les sites Web font partie du patrimoine documentaire québécois et à ce titre ils doivent être conservés et diffusés.

Depuis le début des années 2000, nous menons des travaux de réflexions sur le numérique et les questions relatives au Web.

Carole Gagné
Photo: Martine Renaud

Un programme de dépôt de publications numériques gouvernementales a été mis en place en 2001. Ces publications sont disponibles sur les sites web gouvernementaux en version PDF le plus souvent, mais aussi parfois en HTML. Ces cas nous ont amenés à rechercher une méthode pour conserver et diffuser ces publications dans leur contexte original, afin d’en préserver toute la signification.

La Bibliothèque nationale n’est bien sûr pas la seule institution de mémoire à réfléchir sur ce nouvel aspect du patrimoine documentaire. Nous avons découvert une communauté d’experts en joignant l’IIPC en 2009. L’International Internet Preservation Consortium est un regroupement de 50 institutions, notamment des bibliothèques nationales, des universités et des organisations s’intéressant à la sauvegarde des contenus Web, par exemple Internet Archive.

La mission de l’IIPC est de développer des outils, des normes et des pratiques en matière de collecte de sites web et de faire la promotion de l’accès et de l’utilisation de ce type de contenu. Le regroupement fonctionne selon un mode collaboratif, c’est-à-dire grâce à une mise en commun d’expertise et un développement partagé des outils. Heritrix, le robot qui nous permet de collecter les sites, est né de cette collaboration entre plusieurs membres fondateurs de l’IIPC.

En 2009 ont eu lieu les premières collectes de la Bibliothèque dans le cadre d’un projet pilote, puis en 2012, le programme a officiellement été instauré.

À ce jour, 4 vagues de collectes ont été effectuées :

  • Sites gouvernementaux depuis 2009 jusqu’à présent ;
  • Élections provinciales en 2012 et 2014 ;
  • Élections municipales de 2013 et 2017 ;
  • Collectes thématiques depuis 2015 jusqu’à présent. Il s’agit de 800 sites dans plusieurs secteurs : organismes communautaires, associations, organismes culturels (musées, théâtres, bibliothèques, etc.), individus (artistes, comédiens, musiciens, humoristes, etc.), entreprises privées, organismes parapublics (écoles, hôpitaux, etc.) et sites événements (festivals, conférences, etc.)

Vous pouvez consulter cette collection dans l’interface Archivage web. Dans un prochain billet, nous vous expliquerons quels outils sont utilisés pour rassembler ce patrimoine bien particulier.

 

À titre d’exemple, nous avons collecté le premier site du gouvernement du Québec.  Ce site a été mis en ligne en 1995, alors qu’il n’y avait que 23 000 sites diffusés.

 

 

Un commentaire pour “Les sites Web : un patrimoine documentaire à conserver”

  1. Excellent article

Laissez un commentaire

%d blogueurs aiment cette page :



© Bibliothèque et Archives nationales du Québec