Numérisation de qualité de textes et d'images
La numérisation de textes et d'images analogiques peut offrir de nombreux avantages, notamment en termes d'accessibilité. Cependant, la numérisation est un processus intensif qui nécessite beaucoup de temps et de ressources. Une bonne planification et une bonne approche sont donc cruciales.
Grâce à cet outil, vous apprendrez :
- Où stocker vos images numérisées ;
- Comment décrire les images numérisées ;
- Comment assurer une bonne qualité d'image des images numérisées ;
- Quels formats de fichiers utiliser pour vos images numérisée.
La numérisation est la conversion d'un matériel analogique, tel que du papier ou des photographies, en une forme numérique. Cela peut être aussi simple que de passer une photographie au scanner, mais lorsque vous souhaitez numériser une grande collection sur le plan structurel, il est recommandé d'accorder suffisamment d'attention à la qualité de la numérisation. En effet, la numérisation de collections est un processus qui nécessite beaucoup de temps et de ressources. Il faut donc veiller à ce que le résultat soit durable et puisse être (ré)utilisé à des fins aussi nombreuses que possible à l'avenir. Dans cet outil, nous détaillons les éléments à prendre en compte pour numériser des parties de vos archives et collections de manière qualitative.
La qualité de votre collection numérisée est déterminée par quatre éléments, que nous expliquons plus en détail dans la suite de cet outil :
- l'endroit où vous stockez les éléments de collection numérisés ;
- les données (métadonnées) que vous enregistrez sur le fichier ;
- la qualité visuelle de l'enregistrement ;
- la qualité du format de fichier dans lequel vous stockez les informations de l'image.
Bon à savoir avant la lecture
Dans cette section, vous en apprendrez davantage sur la numérisation de textes et d'images, tels que des photos, des affiches et des dessins. Si vous possédez d'autres documents, tels que des bandes audio ou des bobines de film, consultez l'outil Numérisation d'audios et de vidéos.
Pour vos archives d'origine numérique (c'est-à-dire les fichiers créés sur ordinateur), veuillez vous référer aux outils de Conservation digitale.
Vous pouvez également confier la numérisation à une entreprise professionnelle. Celle-ci dispose souvent d'une plus grande expertise pour réaliser une numérisation de qualité. Mais jugez de leur expertise et de la qualité de cette dernière en vous basant également sur les points mentionnés ci-dessus. Vous trouverez plus d'informations dans l'outil Externaliser un travail de numérisation.
Si vous décidez de vous numériser, réfléchissez bien à la répartition des tâches. Que pouvez-vous faire avec le temps et les compétences de vos employés ? Pour quelles tâches ferez-vous éventuellement appel à des consultants externes ? Travaillerez-vous avec des étudiants ou des bénévoles ? Il est parfois utile de donner aux gens la possibilité de développer certaines compétences. Si vous envisagez de faire appel à des bénévoles ou à des étudiants, veillez lire l'outil Travail (bénévole) dans le domaine des archives.
Le lieu de stockage
Imaginez que vous passiez des mois à numériser toute votre collection de photos et à les stocker sur votre ordinateur. Puis on vous vole votre ordinateur ! Ou vous renversez du café dessus. Ou après une mise à jour du système, toutes vos images sont effacées.
Tout peut arriver à vos archives numérisées. Veillez donc à ce que vos fichiers numériques soient stockés correctement. Cela inclut au moins une bonne stratégie de sauvegarde. Pour ce faire, consultez l'outil Comment faire un back-up ?

La description
Une reproduction numérique dont vous ne savez pas quel est l'original et quand ou par qui la copie a été faite perd beaucoup de valeur. Il convient donc de bien documenter ce qui a été numérisé et de savoir où se trouve l'original.
Il est préférable d'enregistrer ou de décrire la collection que vous allez numériser avant de la numériser. Une autre option consiste à le faire pendant la numérisation, mais assurez-vous d'avoir bien réfléchi à l'avance à la manière dont vous le ferez. Vous pouvez faire la description dans un tableur comme Excel ou dans une base de données. Il est préférable de ne pas utiliser Word ou d'autres formats de texte non structurés.
Idéalement, il existe déjà une liste d'emplacements ou un inventaire de la collection que vous pouvez utiliser comme base pour enregistrer votre travail de numérisation. Si cette liste n'est pas disponible, mais que vous souhaitez tout de même numériser une sélection de documents, notez toujours la nature de chaque fichier et l'endroit où se trouve la source analogique dans votre collection. Vous saurez ainsi toujours où se trouve l'original.
Un fichier tableur pour la numérisation
Un fichier tableur permet d'obtenir un aperçu de votre travail de numérisation et de maintenir le lien entre la reproduction numérique et l'original. Pour ce faire, enregistrez au moins les éléments suivants :
| Colonne | Contenu de la colonne |
|---|---|
| Numéro unique | Un numéro unique identifie la reproduction et l'original. Il est très important de noter ce numéro dans le nom de fichier de la reproduction. Il est souvent apposé sur l'original (ex. au crayon). Le numéro unique peut être une combinaison de votre numéro d'inventaire et d'un numéro incrémentiel (ex. pour les albums photos). |
| Type de document | Si votre collection se compose de différents types de matériel, vous pouvez l'indiquer ici, ex. "photo", "document texte", "poster", etc. |
| Description courte | Une brève description du contenu de l'original, ex. "Photo prise lors d'un voyage d'études à Prague", "Affiche d'un spectacle au Beursschouwburg", etc. |
| Code d'emplacement | Si le numéro d'inventaire seul ne vous donne pas suffisamment d'informations sur l'endroit où se trouve l'original, vous pouvez les trouver dans ce champ, ex. le numéro de la boîte dans laquelle se trouve l'original. |
Ces colonnes sont un minimum et sont suffisantes pour commencer une numérisation de qualité. En fonction du matériel ou de vos besoins, vous pouvez bien sûr ajouter les colonnes de votre choix. Les colonnes les plus courantes sont :
- pour les dates de début et de fin ;
- pour le projet auquel la photo est liée (ex. des expositions pour des maisons d'art, des productions pour des organisations scéniques) ;
- pour les personnes figurant sur la photo.
En règle générale, plus l'enregistrement est simple, plus le processus de numérisation en soi sera fluide. N'oubliez pas que vous pouvez également ajouter une description du contenu après la numérisation, sur base des reproductions.
Réfléchissez bien à la question de savoir si vous allez enregistrer des métadonnées descriptives supplémentaires dans votre fichier tableur ou dans votre inventaire et votre liste d'emplacements.
Le nom de fichier et la structure de dossiers pour vos reproductions
Outre une description dans un fichier tableur ou une base de données, il est également important de penser au nom de fichier de votre reproduction numérique. Comme indiqué plus haut, il doit toujours y avoir un lien entre le nom de votre fichier et le numéro unique de votre fichier tableur. Le numéro unique doit de préférence figurer en tête (précédé ou non d'un code unique faisant référence à votre organisation). Après un underscore, vous pouvez ajouter du texte si vous le souhaitez.
Consultez également l'outil Nommer des dossiers et des fichiers.
Lorsque vous numérisez des documents qui nécessitent des reproductions multiples (tels que des albums photos, des livres ou des magazines), vous devez accorder une attention particulière au nom du fichier. Assurez-vous que le nom du fichier reflète l'ordre de pagination correct.
Pour un original nécessitant une numérisation recto et verso, les codes "-r" (recto) et "-v" (verso) sont souvent utilisés dans les noms de fichiers.
Les magazines sont encore plus complexes. Ils ont des années, des éditions et parfois des suppléments, etc. Vous devrez donc réfléchir à la manière dont vous stockez cette logique par le biais de votre nom de fichier ou de votre structure de dossiers. En fait, vous pouvez ne pas commander du tout et vous fier entièrement à votre fichier tableur pour construire la structure du journal.
Tout cela n'est pas difficile, mais il faut s'assurer qu'il existe une méthode unique d'organisation des dossiers.
La qualité visuelle de l'enregistrement
La qualité de l'image commence par la qualité de l'équipement d'enregistrement. Plus votre appareil photo ou votre caméra est performant, plus vos images seront de qualité. Mais plus votre équipement est performant, plus vous avez besoin de connaissances en tant qu'utilisateur pour le régler correctement.
Of je scanner of fototoestel voldoende scherpte haalt en de kleuren exact reproduceert, hangt af van de mate waarin deze zijn gekalibreerd (zie verder). Veel hangt ook af van je reproductieomgeving, zeker wanneer je gaat fotograferen. De lichtinval moet steeds goed kunnen worden gecontroleerd. Tot slot zullen veel opnames nadien nog bewerkingen moeten ondergaan zoals rechttrekken en croppen.
Een goede basishandleiding over het afstellen van de apparatuur vind je terug op de website van FARO.

Vuistregels
Neem altijd volgende vuistregels in acht:
- Scan het volledige document met een rand van ongeveer een halve cm rond het document. Zo heb je het bewijs dat je het volledige document hebt gedigitaliseerd. De rand kan je later altijd nog weghalen, bv. bij een publicatie.
- Het beeld moet op ware grootte een resolutie hebben van minimum 300 ppi. Ppi staat voor pixels per inch. Dat wil zeggen dat er voor iedere inch (een Engelse afstandsmaat) van je document 300 beeldpunten worden opgenomen. Hoe meer beeldpunten, hoe hoger de scherpte en hoe meer je het beeld kan inzoomen zonder kwaliteitsverlies voor het oog. Digitaliseer je documenten waarvan je weet dat je moet kunnen inzoomen (bv. pasfoto’s of dia’s), dan is de standaardwaarde van 300 PPI niet voldoende. Wil je het document standaard 2x kunnen inzoomen, ga dan voor 600 ppi. Voor 4x uitzoomen reken je 1200 ppi, enzovoort.
- Scan of fotografeer je in kleur, ga dan voor een bitdiepte van 24 bit. Dat is het aantal bits (de nulletjes en eentjes) dat wordt gebruikt om de kleur per pixel te registreren. Hoe groter de bitdiepte, hoe groter het gamma aan kleuren dat kan worden opgeslagen.
- Scan of fotografeer je in grijswaarden, ga dan voor een bitdiepte van 8 of 16 bit.
- Zorg dat de kleur van de opnames wordt opgeslagen in een voldoende rijk kleurprofiel. Bij digitaliseringsprojecten is een RGB-kleurenprofiel gebruikelijk. In de erfgoedwereld wordt meestal geopteerd voor de kleurprofielen ECI RGB v2 of Adobe RGB. Een veel voorkomend kleurprofiel is sRGB. Gebruik dit niet voor je archiverings- of moederbestanden (zie onder). Het gamma van kleuren dat sRGB kan opslaan is niet rijk genoeg. Voor meer informatie over kleurenprofielen, zie Wat zijn kleurprofielen?.
De opnameapparatuur kalibreren
Indien je bovenstaande vuistregels volgt, dan ben je al goed bezig, maar alleen zijn ze niet voldoende. Om hoogwaardige reproducties te creëren is een goede kalibratie van je opnameapparatuur en beeldscherm vereist. Bovendien moeten omgevingsfactoren zoals belichting optimaal zijn.
Om dit goed uit te werken, moet je bereid zijn om je in de materie te verdiepen, tenzij je het uitbesteedt aan een professional. (Zie hiervoor de tool Een digitaliseringsopdracht uitbesteden) Wil je het toch zelf doen, neem dan de handleidingen door en experimenteer. Volg eventueel een cursus. Hou alleszins rekening met de vuistregels zoals hoger vermeld.
Opnameapparatuur kalibreren en de standaarden van hoogwaardig digitaliseren behalen is een vrij technische aangelegenheid. Heb je geen tijd om je hierin te verdiepen en wil je gewoon reproducties maken die standaard van een behoorlijk niveau zijn (zonder dat je veel belang hecht aan exacte kleurenreproductie), dan kan dat natuurlijk. Beter een digitale opname dan helemaal geen opname. Probeer je wel altijd te houden aan de vuistregels.
Apparatuur
Wat voor apparatuur moet ik aankopen? Een scanner of een fototoestel? Koop je apparatuur van goede kwaliteit, dan kun je in principe in beide scenario's de normen voor een kwaliteitsvolle scan halen.
Voor beginners is een scanner vaak eenvoudiger in gebruik. Met een goed fototoestel heb je meestal meer mogelijkheden om goede opnames te maken, omdat je meer parameters kan instellen. Hou er wel rekening mee dat dit een steile leercurve met zich meebrengt en dat een goede omgeving nodig is waarin je het licht kan controleren. Foto's die je maakt zonder kennis van fotograferen of in slechte omstandigheden, leveren minder goede beelden op dan scanners.
Als je een scanner koopt, zorg dan dat de software toelaat dat je minstens de resolutie, bitdiepte en kleurprofiel kan instellen. Let er ook op dat de scanner de bestanden kan aanleveren in ongecomprimeerde TIFF-bestanden (zie verder). Tip! Lees de user reviews over het toestel, vraag advies aan verkopers of ga te raden bij de TRACKS-partners.
Software
Goede beeldbewerkingssoftware om bestanden te bewerken en in het juiste bestandsformaat op te slaan (zie verder) is een aanrader. Zeer bekend en heel geschikt is Adobe Photoshop. In combinatie met Lightroom, een tool waarmee je Photoshopacties over meerdere afbeeldingen tegelijkertijd kan uitvoeren, kan je veel bereiken. Een andere software die vaak wordt gebruikt door professionals, is Capture One.
Er zijn ook gratis alternatieven. Voor Photoshop is dat Gimp. Voorbeelden van gratis software om beelden in batch te bewerken (zonder dat we deze in het bijzonder willen aanraden), zijn onder andere XnView en Faststone Image Viewer.
De kwaliteit van het bestandsformaat
Welk bestandsformaat kies je: JPEG, TIFF of PNG? Het antwoord is dat je je bestand in meer dan één kopie opslaat. Creëer minstens een archiveringsbestand en een raadplegingsbestand. Indien je dat wenst kan je ook nog het moederbestand opslaan.
Het archiveringsbestand
Het archiveringsbestand is de kopie waarin je al je informatie zo hoogwaardig mogelijk opslaat, zonder risico op informatieverlies. De archiefkopie dient als je backup waar je altijd weer naar terug kan grijpen wanneer je de hoogste kwaliteit nodig hebt.
Kies als archiefkopie voor ongecomprimeerde TIFF van het type Uncompressed Baseline TIFF v 6.0. Dit bestandsformaat neemt meer opslagruimte in dan de andere, maar het is wel het formaat dat wereldwijd gebruikt wordt voor de opslag van hoogwaardige beelddata. Zorg ervoor dat je géén compressie kiest in je archiefbestanden. Compressie wordt vaak gerealiseerd door bepaalde informatie weg te knippen die niet meteen zichtbaar is voor het oog, maar die wel zichtbaar wordt wanneer je het bestand gaat bewerken in Photoshop (bv. bewerking voor boekpublicatie).
Zorg ervoor dat de kleuren in het archiveringsbestand gecodeerd worden in de kleurruimte ECI RGB v2 of Adobe RGB. Je kan dit instellen met Photoshop.
Controleer de TIFF. Niet iedere TIFF is een goedgemaakte TIFF. De TIFF wordt gemaakt door de software van je scanner en die software is mensenwerk. Er kan dus iets fout lopen. Om te controleren of je TIFF goed gecodeerd is kun je de gratis tool DPF Manager gebruiken.
Het raadplegingsbestand
De niet-gecomprimeerde TIFF is meestal te zwaar voor dagelijks gebruik en publicatie op het web. Hiervoor gebruik je een kopie in JPEG. Deze kopie noemen we het raadplegingsbestand. Zo’n bestand maak je het makkelijkst aan met software als Adobe Lightroom of alternatieven, waarbij je TIFFs in batch kan converteren naar JPEG.
Het moederbestand
Als je dat wenst kan je ook nog een onderscheid maken tussen moederbestand (of master) en archiefbestand. Beiden zijn TIFF en van hoge kwaliteit, maar je moederbestand bevat de info onbewerkt, zoals ze uit de scanner of het fototoestel komt. Je archiefbestand is dan een bewerkt beeld, mooi rechtgezet, bijgesneden tot op de rand enz.
Wanneer je een moederbestand, archiefbestand en raadpleegbestand bewaart, ben je zeker dat je de opname voor alle mogelijke functies kan gebruiken. Het betekent wel dat je tweemaal een zware tiff moet opslaan.
Meer lezen
Auteurs : cet article est initialement basé sur un texte de Wim Lowet (Vlaams Architectuurinstituut), en collaboration avec Nastasia Vanderperren et Bart Magnus (meemoo).
