Een digitaliseringsopdracht uitbesteden/fr: verschil tussen versies

Uit Tracks
Naar navigatie springen Naar zoeken springen
Juliette Wanlin (overleg | bijdragen)
Nieuwe pagina aangemaakt met 'Veillez à ce que la logistique, la collecte, la date de livraison, les contacts, la manière dont les fichiers numériques sont livrés, etc. soient clairement org...'
Juliette Wanlin (overleg | bijdragen)
Nieuwe pagina aangemaakt met '=== Après le processus ==='
Regel 62: Regel 62:
Mettez-vous d'accord sur les finitions et sur la manière dont elles doivent être effectuées (ex. redressement, recadrage, amélioration de la netteté). Souhaitez-vous qu'un certain processus ne soit absolument pas appliqué ? Si c'est le cas, indiquez-le explicitement.
Mettez-vous d'accord sur les finitions et sur la manière dont elles doivent être effectuées (ex. redressement, recadrage, amélioration de la netteté). Souhaitez-vous qu'un certain processus ne soit absolument pas appliqué ? Si c'est le cas, indiquez-le explicitement.


<div lang="nl" dir="ltr" class="mw-content-ltr">
Vous traitez des documents textuels ? Dans ce cas, il est judicieux de les soumettre à une OCR. L'OCR (Optical Character Recognition, pu reconnaissance optique de caractères en français) convertit le texte de votre document en texte lisible par une machine, ce qui vous permet de rechercher des mots dans vos reproductions. Cette opération peut souvent être réalisée sans trop de frais supplémentaires. Convenez de la manière dont les données OCR seront livrées. Un fichier texte par numérisation est le minimum et doit toujours être demandé, mais vous pouvez également intégrer l'OCR dans un PDF pour optimiser les possibilités de recherche.
Gaat het om tekstdocumenten? Dan is het een goed idee om de documenten ook meteen te laten OCR'en. OCR staat voor Optical Character Recognition en zet de tekst in je document om naar machineleesbare tekst, zodat je binnen je reproducties op woorden kunt zoeken. Dat kan vaak zonder een al te grote meerkost. Spreek goed af hoe de OCR-data worden aangeleverd. Een tekstbestand per scan is het minimum en moet je altijd opvragen, maar je kan additioneel de OCR bv. ook laten inbedden in een PDF voor optimale doorzoekbaarheid.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
=== Fichiers à fournir ===
=== De aan te leveren bestanden ===
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
<div lang="nl" dir="ltr" class="mw-content-ltr">
Regel 82: Regel 78:
</div>
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
=== Les métadonnées ===
=== De metadata ===
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
<div lang="nl" dir="ltr" class="mw-content-ltr">
Regel 98: Regel 92:
</div>
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
=== Une phase de test ===
=== Een testfase ===
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
<div lang="nl" dir="ltr" class="mw-content-ltr">
Regel 106: Regel 98:
</div>
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
=== Prévoir un temps de contrôle ===
=== Voorzie controletijd ===
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
<div lang="nl" dir="ltr" class="mw-content-ltr">
Regel 118: Regel 108:
</div>
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
== Pendant la numérisation ==
== Tijdens het digitaliseren ==
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
<div lang="nl" dir="ltr" class="mw-content-ltr">
Regel 132: Regel 120:
</div>
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
== Après la numérisation : contrôle de la qualité ==
== Na het digitaliseren: Kwaliteitscontrole ==
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
<div lang="nl" dir="ltr" class="mw-content-ltr">
Regel 145: Regel 131:
</div>
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
=== L'exhaustivité du matériel ===
=== De volledigheid van het materiaal ===
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
<div lang="nl" dir="ltr" class="mw-content-ltr">

Versie van 22 jul 2024 08:27

Lorsque vous souhaitez numériser vos archives ou collections, il est souvent conseillé de confier cette tâche à un partenaire externe. Ce dernier possède l'expertise nécessaire pour fournir des fichiers numérisés de haute qualité. Cependant, de nombreux éléments doivent être pris en compte.
Grâce à cet outil, vous apprendrez :

  • Quel est l'avantage de l'externalisation d'un travail de numérisation ;
  • Quels accords conclure avec le fournisseur ;
  • Comment contrôler le processus de numérisation ;
  • Comment effectuer le contrôle de qualité après la numérisation.

Lorsque vous externalisez, vous vous associez à une société externe pour numériser vos archives ou collections.

Lorsque vous externalisez, vous avez plus de chances d'obtenir des reproductions de qualité, parce que des spécialistes le font pour vous. Cette solution est particulièrement conseillée lorsque vous possédez énormément de matériel de valeur, ou lorsqu'il s'agit simplement de documents que vous ne pouvez pas numériser vous-même, par exemple parce qu'ils sont trop volumineux ou qu'ils se présentent sous des formats difficiles, comme les bandes vidéo.

Mais attention : l'externalisation d'une numérisation ne consiste pas simplement à appeler une entreprise. De nombreux éléments doivent être pris en compte. Essayez de les établir le mieux possible à l'avance, de demander des prix aux fournisseurs et de les faire figurer dans l'accord que vous concluez avec eux.

Lors de l'externalisation d'une numérisation, il faut tenir compte de trois phases : Avant, pendant et après la numérisation.

  • Avant la numérisation : Vous préparez votre matériel, trouvez un fournisseur, prenez des dispositions et effectuez les premiers tests.
  • Pendant la numérisation : Vous assurez le suivi des demandes des fournisseurs et effectuez des contrôles intermédiaires.
  • Après la numérisation : Vous vérifiez que tout votre matériel a été renvoyé correctement + contrôle final de la qualité des reproductions.


Avant-propos

Avant de poursuivre, prenez le temps de revoir les principes généraux d'une numérisation de qualité. Nous les expliquons dans l'outil Numérisation de qualité de textes et d'images. Les exigences générales d'une bonne numérisation (espace de stockage suffisant, description, qualité de reproduction et qualité du format de fichier) s'appliquent également ici.

Avant la numérisation : Accords avec le fournisseur

Accords pratiques

Veillez à ce que la logistique, la collecte, la date de livraison, les contacts, la manière dont les fichiers numériques sont livrés, etc. soient clairement organisés.

Droits

Acceptez que le fournisseur ne puisse pas revendiquer de droits de propriété intellectuelle ou de droits d'utilisation sur les reproductions. Si votre collection contient du matériel sensible à la vie privée, demandez une clause de confidentialité.

Dispositions relatives à la logistique et à la conservation

Assurez-vous que le fournisseur décrit clairement où les originaux seront conservés et comment il les transportera. Préparez de préférence un rapport sur l'état de la collection, afin de pouvoir vérifier par la suite que rien n'a été endommagé.

Dispositions relatives à l'exhaustivité

Demandez des garanties que le fournisseur numérise bien l'entièreté des documents. Pour vérifier cela, il est préférable d'avoir décrit et enregistré votre collection de la manière la plus détaillée possible (voir également l'outil Numérisation de qualité de textes et d'images). De cette manière, vous pouvez vérifier non seulement si tout a été numérisé, mais aussi si le fournisseur a renvoyé tous les originaux.

Exemple de feuille de calcul pour la numérisation de supports de diapositives. Chaque support reçoit un numéro unique (colonne de gauche) et une indication du nombre de diapositives par support (quatrième colonne). De cette manière, il est possible de vérifier si toutes les diapositives sont numérisées et renvoyées. Le registre fournit également au fournisseur des instructions claires sur le nom de fichier à donner aux reproductions (troisième colonne).

Dispositions relatives à la qualité de la reproduction et au processus de reproduction

  • Mettez-vous d'accord sur la résolution et la profondeur de bits à laquelle la numérisation aura lieu, ainsi que sur le profil de couleur qui sera utilisé.
  • Assurez-vous que le fournisseur décrit clairement l'équipement d'enregistrement qu'il utilisera.
  • Assurez-vous que le fournisseur indique que l'équipement sera calibré quotidiennement : au début du processus, lorsque l'équipement est redémarré et lorsque les paramètres sont ajustés.
  • Demandez au fournisseur comment il contrôlera la qualité des enregistrements et de l'étalonnage, et qu'il vous fournisse des preuves de son processus de contrôle.

Normes de qualité d'images

Le cahier des charges prévoit que le souscripteur respecte les normes internationales en vigueur, telles que Metamorfoze, FADGI ou Guidelines Digitalisation of photographic materials. Par exemple, le fournisseur doit se conformer à une norme internationale et doit également effectuer les contrôles de qualité requis par la norme.

Après le processus

Mettez-vous d'accord sur les finitions et sur la manière dont elles doivent être effectuées (ex. redressement, recadrage, amélioration de la netteté). Souhaitez-vous qu'un certain processus ne soit absolument pas appliqué ? Si c'est le cas, indiquez-le explicitement.

Vous traitez des documents textuels ? Dans ce cas, il est judicieux de les soumettre à une OCR. L'OCR (Optical Character Recognition, pu reconnaissance optique de caractères en français) convertit le texte de votre document en texte lisible par une machine, ce qui vous permet de rechercher des mots dans vos reproductions. Cette opération peut souvent être réalisée sans trop de frais supplémentaires. Convenez de la manière dont les données OCR seront livrées. Un fichier texte par numérisation est le minimum et doit toujours être demandé, mais vous pouvez également intégrer l'OCR dans un PDF pour optimiser les possibilités de recherche.

Fichiers à fournir

Spreek goed af of de leverancier een masterbestand, archiveringsbestand en raadplegingsbestand moet leveren. (Zie voor meer info de tool Kwaliteitsvol digitaliseren van tekst- en beeldmateriaal) Spreek af welke bestandsformaten daarvoor zullen worden gebruikt. Uncompressed baseline TIFF v6 voor moederbestanden en archiveringsbestanden, JPEG voor raadplegingsbestanden als het beeldmateriaal betreft, PDF voor raadplegingsbestanden als het tekstmateriaal betreft.

Zorg ervoor dat de leverancier ook de checksums van ieder bestand aanlevert, zodat je kan controleren of er geen fouten zijn gebeurd bij bv. het doorkopiëren van de bestanden. Het eenvoudigst is dat de leverancier je een tekstdocument of spreadsheet bezorgt van alle bestanden met hun checksums.

Een voorbeeld van een tekstbestand met checksums per file. Aan de hand van deze checksums kun je fouten in het doorkopiëren opsporen. Het is ook altijd interessant om nadien te controleren of er geen wijzigingen aan je bestanden zijn gebeurd.

Les métadonnées

Spreek af hoe de leverancier de bestanden moet benoemen en wat de mappenstructuur moet zijn. Idealiter maak je in een spreadsheetsoftware al een lijst op van al het materiaal dat de leverancier moet digitaliseren, waarbij je in een andere kolom duidelijk aangeeft wat de bestandsnamen zijn. Een voorbeeld van een dergelijk spreadsheet voor tijdschriftdigitalisering vind je op de website van het VAi.

Wil je dat de leverancier ook andere metadata toevoegt tijdens het scanproces? Spreek dan goed af hoe hij deze invult en levert, en hoe hij de kwaliteit controleert.

Je kan de leverancier ook vragen om bepaalde technische en inhoudelijke metadata in te bedden in de bestanden. Zie voor meer info de tool Ingebedde metadata bij foto's.

Une phase de test

Het is aan te raden dat je een testfase afspreekt met de leverancier, waarbij je ook zelf ter plekke kan gaan kijken naar het digitaliseringsproces. Zorg dat hij eerst een beperkt aantal stukken als proef digitaliseert. Ben je niet tevreden, dan kan je nog aanpassingen laten maken tot er een 'referentiescan' ontstaat, waarover je tevreden bent. Deze vormt dan de graadmeter voor de kwaliteit van de volgende digitaliseringen.

Prévoir un temps de contrôle

Idealiter controleer je of de leverancier wel alles doet zoals je het hem vraagt. Zie verder voor meer info over hoe je de kwaliteitscontrole kunt aanpakken.

Spreek met je leverancier een termijn af waarin je tijd hebt om het geleverde materiaal te controleren. Bij voorkeur levert de leverancier je via internet al tussentijdse resultaten zodat je meteen kan controleren en ingrijpen als er iets misloopt. Bepaal op voorhand met de leverancier welke methode en software je zult gebruiken om het materiaal te controleren.

Pendant la numérisation

Tijdens het digitaliseren volg je vragen van de leverancier op en doe je idealiter tussentijdse kwaliteitscontroles. Deze tips kunnen je hiermee helpen:

  • Besteed genoeg tijd aan het bepalen van de referentiescan.
  • Hoe sneller een fout wordt opgemerkt, hoe beter. Vraag aan je leverancier om je tussentijdse resultaten te bezorgen, zodat je meteen kan reageren bij een fout. Targetscans, waarmee de correctheid van de kalibratie wordt getest, kunnen bijvoorbeeld meteen na kalibratie en controle via het internet worden verstuurd. Ook gegenereerde raadplegingsbestanden kunnen meegestuurd worden over het internet, zodat je meteen ook de beeldende kwaliteit kan beoordelen.
  • Als je naast het digitaliseren van het materiaal ook specifieke vragen hebt gesteld m.b.t. postprocessing (bv. OCR en metadata toevoegen), las dan een tussenstap in waarbij eerst de kwaliteit van de digitalisering wordt gecontroleerd. Pas wanneer je zeker bent dat de digitalisering zelf goed is gebeurd, geef je toelating om over te gaan tot verdere post-processing van de bestanden. Anders loop je het risico dat de leverancier tijd gaat steken in het verwerken van foute bestanden, wat kan leiden tot discussies achteraf.

Après la numérisation : contrôle de la qualité

Door een digitalisering uit te besteden win je veel tijd, omdat je zelf niet de reproducties hoeft te maken, maar als je het goed wil doen moet je wel veel tijd uittrekken voor de kwaliteitscontrole. Onderschat dit niet, er kan vanalles fout gaan. Grosso modo controleer je het materiaal op:

  • de volledigheid
  • de beeldkwaliteit
  • de correctheid van het bestandsformaat
  • de kwaliteit van de post-processing (bv. OCR)
  • de kwaliteit van de metadata

L'exhaustivité du matériel

Als je op voorhand een goede lijst hebt gemaakt van al het materiaal, is dit erg snel gebeurd. Controleer of er per folder evenveel bestanden zijn als er opgelijste items (pagina’s, foto’s enz.) zijn.

Controleer ook of er geen fouten zijn geslopen in de bestanden door bv. kopieeracties over het web. Indien je met de leverancier een goed checksumbestand hebt afgesproken, kan dit automatisch. (Naar de tool over checksums)

Tot slot is het altijd een goed idee om te controleren of ook het originele materiaal in zijn volledigheid is teruggebracht.

De beeldkwaliteit

Probeer deze controle al zoveel mogelijk tijdens het digitaliseringsproces te doen. De enige vorm van herstel is immers opnieuw digitaliseren.

Hierboven bespraken we al dat het een goed idee is om je leverancier te vragen om een internationale norm voor digitaliseren te volgen (Metamorfoze), FADGI of Guidelines Digitalisation of photographic materials). Op die manier verbindt de leverancier zich er contractueel toe om bepaalde stappen te ondernemen die de kwaliteit van de digitalisering garanderen.

Maar het is niet zo dat omdat een leverancier zegt dat hij een norm zal respecteren, dat hij dat ook daadwerkelijk zal doen. De normen bieden je een kader waarin je zelf kan nameten of dit gebeurt of niet aan de hand van “targetscans” (zie voor meer info de desbetreffende norm).

Weet wel dat deze normen voer zijn voor specialisten en dat de controles specifieke software vereisen. Lukt dit je niet, kijk dan in ieder geval zelf altijd goed de beelden na. Zijn ze scherp genoeg? Zijn ze leesbaar? Tonen de beelden geen vreemde verkleuring of artefacten (bv. moiré)? Is het beeld bruikbaar voor publicaties in boeken en op het web?

Wens je ondersteuning om intensief te controleren of een reproductie correct volgens de normen is gemaakt, contacteer dan een TRACKS-partner.

De correctheid van het bestandsformaat

Probeer deze controle zoveel mogelijk tijdens het digitaliseringsproces te doen.

Concentreer je voor de kwaliteitscontroles vooral op de moederbestanden en archiveringsbestanden. De raadplegingsbestanden zijn minder kritiek. Nieuwe raadplegingsbestanden kunnen altijd nog worden gegenereerd op basis van de archiveringsbestanden.

Let op! Het is niet omdat een bestand de extensie “.tif” heeft, dat het ook gaat om een TIFF. Om te testen of je TIFF daadwerkelijk een TIFF is, kan je een tool als Droid gebruiken. Zie de tool Bestanden uit je digitaal archief identificeren met DROID.

Om te testen of je TIFF daadwerkelijk een Uncompressed Baseline TIFF v6.0 is (dus de meest duurzame soort TIFF) kan je de tool DPF-manager gebruiken. Naar onze ervaring komt het best nog wel vaak voor dat een TIFF niet overeenstemt met een gevraagde norm, dus doe zeker de test. Aarzel niet om een TRACKS-partner te contacteren voor hulp bij het controleren.

De kwaliteit van de post-processing (OCR)

OCR is zelden tot nooit volledig foutloos. De kwaliteit van de OCR is afhankelijk van de gebruikte software maar vooral ook van de aard van het bronmateriaal. Om de kwaliteit te controleren vraag je steeds de OCR-gegevens op in afzonderlijke tekstbestanden en niet enkel in PDF-bestanden. Je kunt dan steekproefsgewijs een aantal tekstbestanden met OCR-tekst openen en nagaan of de kwaliteit goed is.

Contacteer eventueel een TRACKS-partner voor meer informatie.

De kwaliteit van de metadata

Vraag je aan de leverancier om ook metadata aan de gedigitaliseerde bestanden toe te voegen (zoals titels), dan is er geen andere mogelijkheid om dit te controleren dan door het na te kijken, eventueel via steekproef. Ongeacht de wijze waarop de leverancier de metadata aanlevert, vraag je best ook een uitdraai van de metadata in een spreadsheet op. Dat vereenvoudigt de handmatige controle.

Een digitaal bestand heeft ook ingebedde, technische metadata. Indien je wil kan je ook hiervan de kwaliteit beoordelen. Zie hiervoor de tool (ingebedde metadata).

Pour en savoir plus

Auteurs : cet article est initialement basé sur un texte de Wim Lowet (VAi), en collaboration avec Nastasia Vanderperren et Bart Magnus (meemoo).