Numérisation de qualité de textes et d'images

Uit Tracks
Versie door Juliette Wanlin (overleg | bijdragen) op 23 jul 2024 om 09:18 (Nieuwe pagina aangemaakt met 'Tout cela n'est pas difficile, mais il faut s'assurer qu'il existe une méthode unique d'organisation des dossiers.')
Naar navigatie springen Naar zoeken springen

La numérisation de textes et d'images analogiques peut offrir de nombreux avantages, notamment en termes d'accessibilité. Cependant, la numérisation est un processus intensif qui nécessite beaucoup de temps et de ressources. Une bonne planification et une bonne approche sont donc cruciales.
Grâce à cet outil, vous apprendrez :

  • Où stocker vos images numérisées ;
  • Comment décrire les images numérisées ;
  • Comment assurer une bonne qualité d'image des images numérisées ;
  • Quels formats de fichiers utiliser pour vos images numérisée.

La numérisation est la conversion d'un matériel analogique, tel que du papier ou des photographies, en une forme numérique. Cela peut être aussi simple que de passer une photographie au scanner, mais lorsque vous souhaitez numériser une grande collection sur le plan structurel, il est recommandé d'accorder suffisamment d'attention à la qualité de la numérisation. En effet, la numérisation de collections est un processus qui nécessite beaucoup de temps et de ressources. Il faut donc veiller à ce que le résultat soit durable et puisse être (ré)utilisé à des fins aussi nombreuses que possible à l'avenir. Dans cet outil, nous détaillons les éléments à prendre en compte pour numériser des parties de vos archives et collections de manière qualitative.

La qualité de votre collection numérisée est déterminée par quatre éléments, que nous expliquons plus en détail dans la suite de cet outil :

  • l'endroit où vous stockez les éléments de collection numérisés ;
  • les données (métadonnées) que vous enregistrez sur le fichier ;
  • la qualité visuelle de l'enregistrement ;
  • la qualité du format de fichier dans lequel vous stockez les informations de l'image.
Un scanner de livres en action. Les scanners de livres sont conçus de manière optimale pour numériser des livres.

Bon à savoir avant la lecture

Dans cette section, vous en apprendrez davantage sur la numérisation de textes et d'images, tels que des photos, des affiches et des dessins. Si vous possédez d'autres documents, tels que des bandes audio ou des bobines de film, consultez l'outil Numérisation d'audios et de vidéos.

Pour vos archives d'origine numérique (c'est-à-dire les fichiers créés sur ordinateur), veuillez vous référer aux outils de Conservation digitale.

Vous pouvez également confier la numérisation à une entreprise professionnelle. Celle-ci dispose souvent d'une plus grande expertise pour réaliser une numérisation de qualité. Mais jugez de leur expertise et de la qualité de cette dernière en vous basant également sur les points mentionnés ci-dessus. Vous trouverez plus d'informations dans l'outil Externaliser un travail de numérisation.

Si vous décidez de vous numériser, réfléchissez bien à la répartition des tâches. Que pouvez-vous faire avec le temps et les compétences de vos employés ? Pour quelles tâches ferez-vous éventuellement appel à des consultants externes ? Travaillerez-vous avec des étudiants ou des bénévoles ? Il est parfois utile de donner aux gens la possibilité de développer certaines compétences. Si vous envisagez de faire appel à des bénévoles ou à des étudiants, veillez lire l'outil Travail (bénévole) dans le domaine des archives.

Le lieu de stockage

Imaginez que vous passiez des mois à numériser toute votre collection de photos et à les stocker sur votre ordinateur. Puis on vous vole votre ordinateur ! Ou vous renversez du café dessus. Ou après une mise à jour du système, toutes vos images sont effacées.

Tout peut arriver à vos archives numérisées. Veillez donc à ce que vos fichiers numériques soient stockés correctement. Cela inclut au moins une bonne stratégie de sauvegarde. Pour ce faire, consultez l'outil Comment faire un back-up ?

Le scanner à plat, avec son couvercle typique, est peut-être la forme de scanner la plus familière. Il peut convenir à la numérisation d'objets bidimensionnels tels que des documents, des photos et des dessins, mais il peut également numériser des supports transparents tels que des diapositives. Les formats vont de A4 à A0 et plus.

La description

Une reproduction numérique dont vous ne savez pas quel est l'original et quand ou par qui la copie a été faite perd beaucoup de valeur. Il convient donc de bien documenter ce qui a été numérisé et de savoir où se trouve l'original.

Il est préférable d'enregistrer ou de décrire la collection que vous allez numériser avant de la numériser. Une autre option consiste à le faire pendant la numérisation, mais assurez-vous d'avoir bien réfléchi à l'avance à la manière dont vous le ferez. Vous pouvez faire la description dans un tableur comme Excel ou dans une base de données. Il est préférable de ne pas utiliser Word ou d'autres formats de texte non structurés.

Idéalement, il existe déjà une liste d'emplacements ou un inventaire de la collection que vous pouvez utiliser comme base pour enregistrer votre travail de numérisation. Si cette liste n'est pas disponible, mais que vous souhaitez tout de même numériser une sélection de documents, notez toujours la nature de chaque fichier et l'endroit où se trouve la source analogique dans votre collection. Vous saurez ainsi toujours où se trouve l'original.

Un fichier tableur pour la numérisation

Un fichier tableur permet d'obtenir un aperçu de votre travail de numérisation et de maintenir le lien entre la reproduction numérique et l'original. Pour ce faire, enregistrez au moins les éléments suivants :

Colonne Contenu de la colonne
Numéro unique Un numéro unique identifie la reproduction et l'original. Il est très important de noter ce numéro dans le nom de fichier de la reproduction. Il est souvent apposé sur l'original (ex. au crayon). Le numéro unique peut être une combinaison de votre numéro d'inventaire et d'un numéro incrémentiel (ex. pour les albums photos).
Type de document Si votre collection se compose de différents types de matériel, vous pouvez l'indiquer ici, ex. "photo", "document texte", "poster", etc.
Description courte Une brève description du contenu de l'original, ex. "Photo prise lors d'un voyage d'études à Prague", "Affiche d'un spectacle au Beursschouwburg", etc.
Code d'emplacement Si le numéro d'inventaire seul ne vous donne pas suffisamment d'informations sur l'endroit où se trouve l'original, vous pouvez les trouver dans ce champ, ex. le numéro de la boîte dans laquelle se trouve l'original.

Ces colonnes sont un minimum et sont suffisantes pour commencer une numérisation de qualité. En fonction du matériel ou de vos besoins, vous pouvez bien sûr ajouter les colonnes de votre choix. Les colonnes les plus courantes sont :

  • pour les dates de début et de fin ;
  • pour le projet auquel la photo est liée (ex. des expositions pour des maisons d'art, des productions pour des organisations scéniques) ;
  • pour les personnes figurant sur la photo.

En règle générale, plus l'enregistrement est simple, plus le processus de numérisation en soi sera fluide. N'oubliez pas que vous pouvez également ajouter une description du contenu après la numérisation, sur base des reproductions.

Réfléchissez bien à la question de savoir si vous allez enregistrer des métadonnées descriptives supplémentaires dans votre fichier tableur ou dans votre inventaire et votre liste d'emplacements.

Le nom de fichier et la structure de dossiers pour vos reproductions

Outre une description dans un fichier tableur ou une base de données, il est également important de penser au nom de fichier de votre reproduction numérique. Comme indiqué plus haut, il doit toujours y avoir un lien entre le nom de votre fichier et le numéro unique de votre fichier tableur. Le numéro unique doit de préférence figurer en tête (précédé ou non d'un code unique faisant référence à votre organisation). Après un underscore, vous pouvez ajouter du texte si vous le souhaitez.

Consultez également l'outil Nommer des dossiers et des fichiers.

Lorsque vous numérisez des documents qui nécessitent des reproductions multiples (tels que des albums photos, des livres ou des magazines), vous devez accorder une attention particulière au nom du fichier. Assurez-vous que le nom du fichier reflète l'ordre de pagination correct.

Pour un original nécessitant une numérisation recto et verso, les codes "-r" (recto) et "-v" (verso) sont souvent utilisés dans les noms de fichiers.

Les magazines sont encore plus complexes. Ils ont des années, des éditions et parfois des suppléments, etc. Vous devrez donc réfléchir à la manière dont vous stockez cette logique par le biais de votre nom de fichier ou de votre structure de dossiers. En fait, vous pouvez ne pas commander du tout et vous fier entièrement à votre fichier tableur pour construire la structure du journal.

Tout cela n'est pas difficile, mais il faut s'assurer qu'il existe une méthode unique d'organisation des dossiers.

La qualité visuelle de l'enregistrement

De beeldende kwaliteit van de opname start met de kwaliteit van de opnameapparatuur. Hoe beter je fototoestel of camera, hoe beter je afbeeldingen zijn. Maar hoe beter je apparatuur, hoe meer kennis je als gebruiker nodig hebt om de apparatuur goed af te stellen.

Of je scanner of fototoestel voldoende scherpte haalt en de kleuren exact reproduceert, hangt af van de mate waarin deze zijn gekalibreerd (zie verder). Veel hangt ook af van je reproductieomgeving, zeker wanneer je gaat fotograferen. De lichtinval moet steeds goed kunnen worden gecontroleerd. Tot slot zullen veel opnames nadien nog bewerkingen moeten ondergaan zoals rechttrekken en croppen.

Een goede basishandleiding over het afstellen van de apparatuur vind je terug op de website van FARO.

Een documentscanner, waarbij grote hoeveelheden documenten automatisch kunnen worden gescand m.b.v. een document feeder. Voor kwaliteitsvolle scans worden dit soort doorvoeroplossingen met document feeders meestal afgeraden. Oude, fragiele en waardevolle stukken lopen bovendien risico om te worden beschadigd.

Vuistregels

Neem altijd volgende vuistregels in acht:

  • Scan het volledige document met een rand van ongeveer een halve cm rond het document. Zo heb je het bewijs dat je het volledige document hebt gedigitaliseerd. De rand kan je later altijd nog weghalen, bv. bij een publicatie.
  • Het beeld moet op ware grootte een resolutie hebben van minimum 300 ppi. Ppi staat voor pixels per inch. Dat wil zeggen dat er voor iedere inch (een Engelse afstandsmaat) van je document 300 beeldpunten worden opgenomen. Hoe meer beeldpunten, hoe hoger de scherpte en hoe meer je het beeld kan inzoomen zonder kwaliteitsverlies voor het oog. Digitaliseer je documenten waarvan je weet dat je moet kunnen inzoomen (bv. pasfoto’s of dia’s), dan is de standaardwaarde van 300 PPI niet voldoende. Wil je het document standaard 2x kunnen inzoomen, ga dan voor 600 ppi. Voor 4x uitzoomen reken je 1200 ppi, enzovoort.
  • Scan of fotografeer je in kleur, ga dan voor een bitdiepte van 24 bit. Dat is het aantal bits (de nulletjes en eentjes) dat wordt gebruikt om de kleur per pixel te registreren. Hoe groter de bitdiepte, hoe groter het gamma aan kleuren dat kan worden opgeslagen.
  • Scan of fotografeer je in grijswaarden, ga dan voor een bitdiepte van 8 of 16 bit.
  • Zorg dat de kleur van de opnames wordt opgeslagen in een voldoende rijk kleurprofiel. Bij digitaliseringsprojecten is een RGB-kleurenprofiel gebruikelijk. In de erfgoedwereld wordt meestal geopteerd voor de kleurprofielen ECI RGB v2 of Adobe RGB. Een veel voorkomend kleurprofiel is sRGB. Gebruik dit niet voor je archiverings- of moederbestanden (zie onder). Het gamma van kleuren dat sRGB kan opslaan is niet rijk genoeg. Voor meer informatie over kleurenprofielen, zie Wat zijn kleurprofielen?.

De opnameapparatuur kalibreren

Indien je bovenstaande vuistregels volgt, dan ben je al goed bezig, maar alleen zijn ze niet voldoende. Om hoogwaardige reproducties te creëren is een goede kalibratie van je opnameapparatuur en beeldscherm vereist. Bovendien moeten omgevingsfactoren zoals belichting optimaal zijn.

Om dit goed uit te werken, moet je bereid zijn om je in de materie te verdiepen, tenzij je het uitbesteedt aan een professional. (Zie hiervoor de tool Een digitaliseringsopdracht uitbesteden) Wil je het toch zelf doen, neem dan de handleidingen door en experimenteer. Volg eventueel een cursus. Hou alleszins rekening met de vuistregels zoals hoger vermeld.

Opnameapparatuur kalibreren en de standaarden van hoogwaardig digitaliseren behalen is een vrij technische aangelegenheid. Heb je geen tijd om je hierin te verdiepen en wil je gewoon reproducties maken die standaard van een behoorlijk niveau zijn (zonder dat je veel belang hecht aan exacte kleurenreproductie), dan kan dat natuurlijk. Beter een digitale opname dan helemaal geen opname. Probeer je wel altijd te houden aan de vuistregels.

Apparatuur

Wat voor apparatuur moet ik aankopen? Een scanner of een fototoestel? Koop je apparatuur van goede kwaliteit, dan kun je in principe in beide scenario's de normen voor een kwaliteitsvolle scan halen.

Voor beginners is een scanner vaak eenvoudiger in gebruik. Met een goed fototoestel heb je meestal meer mogelijkheden om goede opnames te maken, omdat je meer parameters kan instellen. Hou er wel rekening mee dat dit een steile leercurve met zich meebrengt en dat een goede omgeving nodig is waarin je het licht kan controleren. Foto's die je maakt zonder kennis van fotograferen of in slechte omstandigheden, leveren minder goede beelden op dan scanners.

Als je een scanner koopt, zorg dan dat de software toelaat dat je minstens de resolutie, bitdiepte en kleurprofiel kan instellen. Let er ook op dat de scanner de bestanden kan aanleveren in ongecomprimeerde TIFF-bestanden (zie verder). Tip! Lees de user reviews over het toestel, vraag advies aan verkopers of ga te raden bij de TRACKS-partners.

Een fotografische opstelling. Voor kwaliteitsvolle foto's is er controle van belichting nodig.

Software

Goede beeldbewerkingssoftware om bestanden te bewerken en in het juiste bestandsformaat op te slaan (zie verder) is een aanrader. Zeer bekend en heel geschikt is Adobe Photoshop. In combinatie met Lightroom, een tool waarmee je Photoshopacties over meerdere afbeeldingen tegelijkertijd kan uitvoeren, kan je veel bereiken. Een andere software die vaak wordt gebruikt door professionals, is Capture One.

Er zijn ook gratis alternatieven. Voor Photoshop is dat Gimp. Voorbeelden van gratis software om beelden in batch te bewerken (zonder dat we deze in het bijzonder willen aanraden), zijn onder andere XnView en Faststone Image Viewer.

De kwaliteit van het bestandsformaat

Welk bestandsformaat kies je: JPEG, TIFF of PNG? Het antwoord is dat je je bestand in meer dan één kopie opslaat. Creëer minstens een archiveringsbestand en een raadplegingsbestand. Indien je dat wenst kan je ook nog het moederbestand opslaan.

Het archiveringsbestand

Het archiveringsbestand is de kopie waarin je al je informatie zo hoogwaardig mogelijk opslaat, zonder risico op informatieverlies. De archiefkopie dient als je backup waar je altijd weer naar terug kan grijpen wanneer je de hoogste kwaliteit nodig hebt.

Kies als archiefkopie voor ongecomprimeerde TIFF van het type Uncompressed Baseline TIFF v 6.0. Dit bestandsformaat neemt meer opslagruimte in dan de andere, maar het is wel het formaat dat wereldwijd gebruikt wordt voor de opslag van hoogwaardige beelddata. Zorg ervoor dat je géén compressie kiest in je archiefbestanden. Compressie wordt vaak gerealiseerd door bepaalde informatie weg te knippen die niet meteen zichtbaar is voor het oog, maar die wel zichtbaar wordt wanneer je het bestand gaat bewerken in Photoshop (bv. bewerking voor boekpublicatie).

Zorg ervoor dat de kleuren in het archiveringsbestand gecodeerd worden in de kleurruimte ECI RGB v2 of Adobe RGB. Je kan dit instellen met Photoshop.

Controleer de TIFF. Niet iedere TIFF is een goedgemaakte TIFF. De TIFF wordt gemaakt door de software van je scanner en die software is mensenwerk. Er kan dus iets fout lopen. Om te controleren of je TIFF goed gecodeerd is kun je de gratis tool DPF Manager gebruiken.

Het raadplegingsbestand

De niet-gecomprimeerde TIFF is meestal te zwaar voor dagelijks gebruik en publicatie op het web. Hiervoor gebruik je een kopie in JPEG. Deze kopie noemen we het raadplegingsbestand. Zo’n bestand maak je het makkelijkst aan met software als Adobe Lightroom of alternatieven, waarbij je TIFFs in batch kan converteren naar JPEG.

Het moederbestand

Als je dat wenst kan je ook nog een onderscheid maken tussen moederbestand (of master) en archiefbestand. Beiden zijn TIFF en van hoge kwaliteit, maar je moederbestand bevat de info onbewerkt, zoals ze uit de scanner of het fototoestel komt. Je archiefbestand is dan een bewerkt beeld, mooi rechtgezet, bijgesneden tot op de rand enz.

Wanneer je een moederbestand, archiefbestand en raadpleegbestand bewaart, ben je zeker dat je de opname voor alle mogelijke functies kan gebruiken. Het betekent wel dat je tweemaal een zware tiff moet opslaan.

Meer lezen

Auteurs : cet article est initialement basé sur un texte de Wim Lowet (Vlaams Architectuurinstituut), en collaboration avec Nastasia Vanderperren et Bart Magnus (meemoo).