Valideren van TIFF-bestanden met DPF-Manager: verschil tussen versies

Uit Tracks
Naar navigatie springen Naar zoeken springen
Nastasia (overleg | bijdragen)
k typfout verbeterd
 
(20 tussenliggende versies door 3 gebruikers niet weergegeven)
Regel 1: Regel 1:
<languages /><translate>
<!--T:62-->
<blockquote>
Door digitale bestanden te valideren kan je nagaan of ze voldoen aan de kwaliteitseisen van hun bestandsformaat. Voor TIFF-bestanden kan je hiervoor een DPF-manager gebruiken.<br>
In deze tool leer je het volgende:
* Waarom moet je digitale bestanden valideren en wanneer doe je dit?
* Waarom moet je TIFF-bestanden valideren?
* Hoe installeer en gebruik je DPF Manager?
* Hoe kan je ingebedde metadata in TIFF-bestanden corrigeren?
</blockquote>
<!--T:1-->
Het valideren van [[Bestandsformaat|bestandsformaten]] is het proces waarbij je controleert of de inhoud en structuur van een digitaal bestand beantwoordt aan de eisen gesteld in de specificatie van het bestandsformaat.
Het valideren van [[Bestandsformaat|bestandsformaten]] is het proces waarbij je controleert of de inhoud en structuur van een digitaal bestand beantwoordt aan de eisen gesteld in de specificatie van het bestandsformaat.


DPF Manager is een open source tool voor de controle van TIFF-bestanden. Hij is bijzonder gebruiksvriendelijk. Via een eenvoudige interface toont DPF Manager of je TIFF-bestand voldoet aan de juiste TIFF-specificatie. Voldoet je bestand niet, dan geeft de tool ook aan waarom niet.
<!--T:2-->
DPF Manager is een open source tool voor de controle van TIFF-bestanden die bijzonder gebruiksvriendelijk is. Via een eenvoudige interface toont DPF Manager of je TIFF-bestand voldoet aan de juiste TIFF-specificatie. Voldoet je bestand niet, dan geeft de tool ook aan waarom niet.


== Waarom valideer je? ==
== Waarom valideren? == <!--T:3-->


De validatie van bestandsformaten is zeer belangrijk in functie van langetermijnbewaring. Een belangrijk struikelblok bij de uitbouw van een digitale bewaarstrategie is dat we vaak geen goed beeld hebben uit welke bestandsformaten ons digitaal archief bestaat.. Toch is het belangrijk om dit te weten om regelmatig te kunnen controleren of de bestandsformaten waaruit je archief bestaat nog geopend kunnen worden met de software die voorhanden is. Het is immers mogelijk dat in de toekomst geen software meer beschikbaar is om deze bestanden te openen. Via bestandsidentificatie en -validatie kan je op tijd detecteren of een formaat mogelijk obsoleet kan worden, en tijdig ingrijpen door die bestanden over te zetten naar een ander formaat.  
<!--T:4-->
De validatie van bestandsformaten is zeer belangrijk in functie van langetermijnbewaring. Een belangrijk struikelblok bij de uitbouw van een digitale bewaarstrategie is dat we vaak geen goed beeld hebben uit welke bestandsformaten ons digitaal archief bestaat. Toch is het belangrijk om dit te weten om regelmatig te kunnen controleren of de bestandsformaten waaruit je archief bestaat nog geopend kunnen worden met de software die voorhanden is. Het is immers mogelijk dat die in de toekomst niet meer bestaat. Via [[Bestanden identificeren|bestandsidentificatie en -validatie]] kan je op tijd detecteren of een formaat [[Obsoletie|obsoleet]] gaat worden, en tijdig ingrijpen door die bestanden over te zetten naar een ander formaat.  


<!--T:5-->
Ook wanneer je een [[Een digitaliseringsopdracht uitbesteden|een digitaliseringsopdracht hebt uitbesteed]], is het belangrijk om te controleren of de aangeleverde bestanden voldoen aan de opgestelde kwaliteitseisen.
Ook wanneer je een [[Een digitaliseringsopdracht uitbesteden|een digitaliseringsopdracht hebt uitbesteed]], is het belangrijk om te controleren of de aangeleverde bestanden voldoen aan de opgestelde kwaliteitseisen.


== Wanneer valideer je? ==
== Wanneer valideer je? == <!--T:6-->
Voorafgaande aan de opstart van een digitaliseringsproject leg je kwaliteitseisen vast, o.a. over het te gebruiken bestandsformaat. De richtlijnen, zoals in de tool [[Kwaliteitsvol digitaliseren van tekst- en beeldmateriaal]] bevelen hiervoor het gebruik van uncompressed baseline TIFF 6.0 aan. Zodra de digitaliseringsresultaten opgeleverd worden, controleer je dan ook best of de ontvangen TIFF-bestanden beantwoorden aan die specificatie. Indien bij de bestandsvalidatie fouten worden ontdekt, is het alsnog mogelijk om de bestanden door de digitaliseringsfirma om te laten zetten in het juiste formaat.
Voorafgaande aan de opstart van een digitaliseringsproject leg je kwaliteitseisen vast, o.a. over het te gebruiken bestandsformaat. De richtlijnen, zoals in de tool [[Kwaliteitsvol digitaliseren van tekst- en beeldmateriaal]] bevelen hiervoor het gebruik van Uncompressed baseline TIFF v6.0 aan. Zodra de digitaliseringsresultaten opgeleverd worden, controleer je dan ook best of de ontvangen TIFF-bestanden beantwoorden aan die specificatie. Indien bij de bestandsvalidatie fouten worden ontdekt, is het alsnog mogelijk om de bestanden door de digitaliseringsfirma om te laten zetten in het juiste formaat.


Je controleert dus niet louter of de bestanden met de extensie .tif wel degelijk TIFF-bestanden zijn, maar ook of ze beantwoorden aan de formele en semantische eisen die opgelegd zijn door de specificatie van Uncompressed baseline TIFF v6.0. De structuur van het bestand wordt geanalyseerd, en er wordt nagegaan of er geen fouten gemaakt zijn bij het maken van het bestand. Zulke fouten kunnen immers betekenen dat het bestand mogelijk niet door alle software gelezen wordt.
<!--T:7-->
Je controleert dus niet louter of de bestanden met de extensie .tif wel degelijk TIFF-bestanden zijn, maar ook of ze beantwoorden aan de eisen die opgelegd zijn door de specificatie van Uncompressed baseline TIFF v6.0. De structuur van het bestand wordt geanalyseerd en er wordt nagegaan of er geen fouten gemaakt zijn bij het maken van het bestand. Zulke fouten kunnen immers betekenen dat het bestand niet door alle software gelezen kan worden.


== DPF Manager voor bestandsvalidatie van TIFF-bestanden ==
== DPF Manager voor bestandsvalidatie van TIFF-bestanden == <!--T:8-->


Een tutorial over het gebruik van DPF Manager is ook beschikbaar op [https://www.youtube.com/watch?v=4rPFfjxKTO4 YouTube].
<!--T:9-->
Een tutorial over het gebruik van DPF Manager is ook beschikbaar op [https://www.youtube.com/watch?v=4rPFfjxKTO4 YouTube].{{#ev:youtube|https://www.youtube.com/watch?v=4rPFfjxKTO4}}


=== Installeer DPF Manager ===
=== Installeer DPF Manager === <!--T:10-->


[http://dpfmanager.org/ Download DPF Manager] en installeer het programma. DPF Manager is beschikbaar voor Windows, macOS en Linux.
<!--T:11-->
[https://github.com/viaacode/DPFManager/releases/tag/3.5.1-update Download DPF Manager] en installeer het programma. DPF Manager is beschikbaar voor Windows en macOS. Let op! MacOS-gebruikers moeten een extra stap doen vooraleer ze het installatiebestand kunnen openen. Lees hiervoor de instructies die zich bevinden in de map met het installatiebestand.


[[Bestand:DPFManager 1 rv.jpg|800px]]
=== Kies bestanden om te laten valideren === <!--T:13-->
 
=== Kies bestanden om te laten valideren ===


<!--T:14-->
Open het programma DPF Manager op je computer.
Open het programma DPF Manager op je computer.


[[Bestand:DPFManager 2 rv.jpg|600px]]
<!--T:15-->
[[Bestand:DPFManager 2 rv.jpg|600px|class=preview-image]]


Sleep de map met te valideren TIFF-bestanden naar het venster Files/Folders.
<!--T:16-->
Sleep de map met te valideren TIFF-bestanden naar het venster ''Files/Folders''.


<!--T:17-->
[[Bestand:DPFManager 3 rv.jpg|600px]]
[[Bestand:DPFManager 3 rv.jpg|600px]]


... Of klik op knop ‘Select’ en selecteer de map met te valideren TIFF-bestanden.
<!--T:18-->
... Of klik op knop ''Select'' en selecteer de map met te valideren TIFF-bestanden.


<!--T:19-->
[[Bestand:DPFManager 5en6 rv.jpg|800px]]
[[Bestand:DPFManager 5en6 rv.jpg|800px]]


Vink de optie ‘Default’ aan, en klik op de knop ‘Full check.
<!--T:20-->
Vink de optie ''Default'' aan, en klik op de knop ''Full check''.


<!--T:21-->
[[Bestand:DPFManager 7 rv.jpg|600px]]
[[Bestand:DPFManager 7 rv.jpg|600px]]


Onderaan opent zich het venster ‘Tasks’. Daar kan je de voortgang van de lopende validatie volgen. Wanneer de balk volledig groen is, is de validatie afgelopen. Je kan het venster ‘Tasks’ terug sluiten door onderaan links op ‘Tasks’ te klikken.
<!--T:22-->
Onderaan opent zich het venster ''Tasks''. Daar kan je de voortgang van de lopende validatie volgen. Wanneer de balk volledig groen is, is de validatie afgelopen. Je kan het venster sluiten door onderaan links op ''Tasks'' te klikken.


<!--T:23-->
[[Bestand:DPFManager 8en9 rv.jpg|800px]]
[[Bestand:DPFManager 8en9 rv.jpg|800px]]


Wanneer je onderaan links op ‘Console’ klikt, krijg je een overzicht van de taken die DPF Manager heeft uitgevoerd, en hoelang de uitvoering heeft geduurd.
=== Analyseer de resultaten === <!--T:24-->


[[Bestand:DPFManager 10en11 rv.jpg|800px]]
<!--T:25-->
 
Wanneer de validatie is afgelopen, kan je het rapport met de validatieresultaten raadplegen door in de bovenbalk op ''Reports'' te klikken.
Je kan het venster ‘Console’ terug sluiten door onderaan links op ‘Console’ te klikken.
 
[[Bestand:DPFManager 12 rv.jpg|600px]]
 
=== Analyseer de resultaten ===
 
Wanneer de validatie is afgelopen, kan je het rapport met de validatieresultaten raadplegen door in de bovenbalk op 'Reports' te klikken.


<!--T:26-->
[[Bestand:DPFManager 13 rv.jpg|600px]]
[[Bestand:DPFManager 13 rv.jpg|600px]]


<!--T:27-->
Je krijgt dan een algemeen overzicht dat aangeeft
Je krijgt dan een algemeen overzicht dat aangeeft


<!--T:28-->
* wanneer de validatie werd verricht;
* wanneer de validatie werd verricht;
* hoeveel TIFF-bestanden werden gevalideerd;
* hoeveel TIFF-bestanden werden gevalideerd;
Regel 70: Regel 92:
* de score.
* de score.


<!--T:29-->
[[Bestand:DPFManager 14 rv.jpg|600px]]
[[Bestand:DPFManager 14 rv.jpg|600px]]


Als je op het folder-icoontje klikt, ga je rechtstreeks naar de rapporten. Je kan de validatieresultaten per bestand raadplegen door op de lijn te klikken.  
<!--T:30-->
Als je op het folder-icoontje klikt, ga je rechtstreeks naar de rapporten. Je kan de resultaten raadplegen door op de lijn te klikken.  


<!--T:31-->
[[Bestand:DPFManager 15en16 rv.jpg|800px]]
[[Bestand:DPFManager 15en16 rv.jpg|800px]]


<!--T:32-->
Je krijgt dan een overzicht te zien van de resultaten per bestand. Daarin zie je eerst bovenaan een samenvatting van het algemene rapport voor de hele folder, en vervolgens samenvattingen van de rapporten voor de individuele TIFF-bestanden. In het overzicht zie je per TIFF-bestand:
Je krijgt dan een overzicht te zien van de resultaten per bestand. Daarin zie je eerst bovenaan een samenvatting van het algemene rapport voor de hele folder, en vervolgens samenvattingen van de rapporten voor de individuele TIFF-bestanden. In het overzicht zie je per TIFF-bestand:
* met een kleurcode aangegeven of de validatie geslaagd is;
* met een kleurcode aangegeven of de validatie geslaagd is;
Regel 82: Regel 108:
* hoeveel waarschuwingen er zijn.
* hoeveel waarschuwingen er zijn.


<!--T:33-->
[[Bestand:DPFManager 18 rv.jpg|600px]]
[[Bestand:DPFManager 18 rv.jpg|600px]]


<!--T:34-->
Als je op het HTML-icoontje klikt, krijg een bondige visuele samenvatting van de validatieresultaten voor de hele folder.  
Als je op het HTML-icoontje klikt, krijg een bondige visuele samenvatting van de validatieresultaten voor de hele folder.  


<!--T:35-->
Alle rapporten, zowel voor de hele folder als voor de individuele TIFF-bestanden, kan je opvragen in vier bestandsformaten: in HTML, PDF, XML en JSON. Dat doe je door op de iconen ‘HTML’, ‘PDF’, ‘XML’ en/of ‘JSON’ te klikken. Voor het validatierapport van een individueel TIFF-bestand klik je op de iconen ‘HTML’, ‘PDF’, ‘XML’ en/of ‘JSON’ achter het bestand.
Alle rapporten, zowel voor de hele folder als voor de individuele TIFF-bestanden, kan je opvragen in vier bestandsformaten: in HTML, PDF, XML en JSON. Dat doe je door op de iconen ‘HTML’, ‘PDF’, ‘XML’ en/of ‘JSON’ te klikken. Voor het validatierapport van een individueel TIFF-bestand klik je op de iconen ‘HTML’, ‘PDF’, ‘XML’ en/of ‘JSON’ achter het bestand.


<!--T:36-->
[[Bestand:DPFManager 20 rv.jpg|600px]]
[[Bestand:DPFManager 20 rv.jpg|600px]]


1. Het HTML-validatierapport voor de volledige map met TIFF-bestanden:
==== Het HTML-validatierapport voor de volledige map ==== <!--T:37-->


<!--T:38-->
[[Bestand:DPFManager 19 5 assemblage sm.jpg|600px]]
[[Bestand:DPFManager 19 5 assemblage sm.jpg|600px]]


<!--T:39-->
Een voorbeeld van een validatierapport voor een map TIFF-bestanden zonder fouten kan je als PDF-bestand downloaden door [[:Bestand:report_folder.pdf|HIER]] te klikken.
Een voorbeeld van een validatierapport voor een map TIFF-bestanden zonder fouten kan je als PDF-bestand downloaden door [[:Bestand:report_folder.pdf|HIER]] te klikken.


2. Het HTML-validatierapport van een individueel TIFF-bestand:
==== Het HTML-validatierapport van een individueel bestand ==== <!--T:40-->


<!--T:41-->
[[Bestand:DPFManager 21c rv assemblage.jpg|600px]]
[[Bestand:DPFManager 21c rv assemblage.jpg|600px]]


De hoeveeldheid ingebedde metadata die door DPF Manager worden weergeven kan je uitbreiden door onder IDF tages 'Expert mode' aan te vinken. Als je het vakje 'Show infos' aanklikt rechts onder 'Conformance Checker', krijg je ook enkele aanbevelingen aangeboden om je TIFF-bestanden verder te verbeteren.
<!--T:42-->
 
[[Bestand:DPFManager 24 rv.jpg|600px]]
 
Een voorbeeld van een validatierapport voor een individueel TIFF-bestand zonder fouten kan je als PDF-bestand downloaden door [[:Bestand:10-GVH-19710101-0001.tif.pdf|HIER]] te klikken.
Een voorbeeld van een validatierapport voor een individueel TIFF-bestand zonder fouten kan je als PDF-bestand downloaden door [[:Bestand:10-GVH-19710101-0001.tif.pdf|HIER]] te klikken.


== Voorbeelden van foutmeldingen ==
== Voorbeelden van foutmeldingen == <!--T:43-->


<!--T:44-->
Niet iedere bestandsvalidatie levert een rapport op zonder foutmeldingen. Hieronder geven we een aantal voorbeelden van foutmeldingen en oplossingen om de fouten te corrigeren.
Niet iedere bestandsvalidatie levert een rapport op zonder foutmeldingen. Hieronder geven we een aantal voorbeelden van foutmeldingen en oplossingen om de fouten te corrigeren.


=== Voorbeeld 1: gebruik van vreemde tekens ===
=== Voorbeeld 1: gebruik van vreemde tekens === <!--T:45-->


<!--T:46-->
[[Bestand:DPFManager copyright overzicht.jpg|600px]]
[[Bestand:DPFManager copyright overzicht.jpg|600px]]


Het volgende validatierapport geeft aan dat het gecontroleerde TIFF-bestand niet conform is aan de specificaties van baseline TIFF v6.0. De foutmelding is 'Alleen 7-bits ASCII-codes worden geaccepteerd'. Als je met je cursor over de foutmelding gaat, krijg je een toelichting te zien.
<!--T:47-->
Het validatierapport geeft aan dat het TIFF-bestand niet conform is aan de specificaties van baseline TIFF v6.0. De foutmelding is ''Only 7-bits ASCII-codes are accepted''. Je krijgt een toelichting te zien als je met je cursor over de foutmelding gaat.


<!--T:48-->
[[Bestand:DPFManager copright.jpg|600px]]
[[Bestand:DPFManager copright.jpg|600px]]


<!--T:49-->
[[Bestand:DPFManager copyright toelichting.jpg|600px]]
[[Bestand:DPFManager copyright toelichting.jpg|600px]]


ASCII is een standaard 7-bits-tekencodering om Latijnse letters, cijfers, leestekens en enkele andere tekens en stuurcodes te representeren en aan ieder teken in die reeks een geheel getal te koppelen, waarmee dat teken kan worden aangeduid. Een overzicht van de 128 ASCII-codes die tot deze reeks behoren, vind je o.a. op [https://nl.wikipedia.org/wiki/ASCII_(tekenset) Wikipedia]. De foutmelding geeft aan dat er een probleem is met de tag 33432 Copyright. De inhoud van deze tag in het gecontroleerde bestand zie je hoger, in het lijstje met IFD tags: © Rony Vissers. Het copright-teken is geen 7-bits ASCII-code, en dat is de reden van de foutmelding.
<!--T:50-->
ASCII is een codering om letters, cijfers en leestekens op een computerscherm weer te geven. In totaal bestaat het uit 128 tekens. Een overzicht van de 128 tekens die tot deze reeks behoren, vind je o.a. op [https://nl.wikipedia.org/wiki/ASCII_(tekenset) Wikipedia]. De foutmelding geeft aan dat er een probleem is met de [[Ingebedde metadata bij foto's|ingebedde metadata]] van ''tag 33432 Copyright''. De inhoud van deze tag vind je hoger in het rapport, in het lijstje met IFD tags: ''© Rony Vissers''. Het copyright-teken is geen 7-bits ASCII-code, en dat is de reden van de foutmelding.


Deze fout kan je makkelijk corrigeren. Als je het bestand opent met een beeldbewerkingsprogramma (bv. Adobe Photoshop of GIMP) en vervolgens de ingebedde metadata bekijkt, kan je makkelijk © Rony Vissers wijzigen in copyright: Rony Vissers. In Adobe Photoshop krijg je toegang tot de ingebedde metadata door in het menu onder 'File' op 'File info' te klikken. In GIMP krijg je toegang tot de ingebedde metadata door in het menu onder 'Afbeelding' eerst op 'Metadata' en vervolgens op 'Metadata bewerken' te klikken. Vergeet na de aanpassing het gewijzigde TIFF-bestand niet op te slaan.
<!--T:51-->
Deze fout kan je makkelijk corrigeren. Als je het bestand opent met een beeldbewerkingsprogramma (bv. Adobe Photoshop of GIMP) en vervolgens de ingebedde metadata bekijkt, kan je makkelijk ''© Rony Vissers'' wijzigen in ''copyright: Rony Vissers''. In Adobe Photoshop krijg je toegang tot de ingebedde metadata door in het menu onder 'File' op 'File info' te klikken. In GIMP krijg je toegang tot de ingebedde metadata door in het menu onder 'Afbeelding' eerst op 'Metadata' en vervolgens op 'Metadata bewerken' te klikken. Vergeet na de aanpassing het gewijzigde TIFF-bestand niet op te slaan. Bekijk voor het aanpassen van ingebedde metadata ook de tool [[Ingebedde metadata bij foto's]].


<!--T:52-->
[[Bestand:DPFManager correctie 2.jpg|800px]]
[[Bestand:DPFManager correctie 2.jpg|800px]]


<!--T:53-->
Wanneer je het gewijzigde TIFF-bestand opnieuw controleert met DPF Manager, zal je merken dat de eerder gemelde fout verdwenen is en dat het bestand nu valide is.
Wanneer je het gewijzigde TIFF-bestand opnieuw controleert met DPF Manager, zal je merken dat de eerder gemelde fout verdwenen is en dat het bestand nu valide is.


<!--T:54-->
[[Bestand:DPFManager correctie.jpg|600px]]
[[Bestand:DPFManager correctie.jpg|600px]]


Bij grote hoeveelheden TIFF-bestanden herstel je dergelijke fouten niet manueel en bestand-per-bestand, maar doe je dat in batch. Je kan dat doen met behulp van een beeldbewerkingsprogramma zoals Adobe Photoshop of GIMP. Een andere manier is om met behulp van ExifTool de ingebedde metadata uit de TIFF-bestanden te exporteren als een CVS-bestand, in het CSV-bestand de aanpassing te doen en vervolgens de aangepaste metadata met behulp van ExifTool opnieuw te importeren in de TIFF-bestanden.
<!--T:55-->
Als de TIFF-bestanden het resultaat zijn van een digitaliseringsproject dat wordt uitgevoerd door een gespecialiseerd digitaliseringsbedrijf, vraag dan aan dat digitaliseringsbedrijf om hun fouten te herstellen in plaats van het zelf te doen.


Als de TIFF-bestanden het resultaat zijn van een digitaliseringsproject dat wordt uitgevoerd door een gespecialiseerd digitaliseringsbedrijf, ligt het natuurlijk eerder voor de hand om aan dat digitaliseringsbedrijf te vragen om hun fouten te herstellen in plaats van dat zelf te doen.
=== Voorbeeld  2: gebruik van compressie === <!--T:56-->


=== Voorbeeld  2: Gebruik van compressie ===
<!--T:57-->
Hoewel het TIFF-bestandsformaat vooral gekend is als een bestandsformaat zonder [[Datacompressie|compressie]], biedt het TIFF-bestandformaat toch de mogelijkheid om compressie te gebruiken. Bij digitalisering wordt aangeraden om geen compressie te gebruiken. DPF Manager maakt het mogelijk om te detecteren of in een TIFF-bestand compressie gebruikt is, en welke.


Alhoewel het TIFF-bestandsformaat vooral gekend is als een bestandsformaat zonder compressie, biedt het TIFF-bestandformaat toch de mogelijkheid om compressie te gebruiken: zowel JPEG-, LZW- als ZIP-compressie. De CEST-richtlijnen schrijven het gebruik van Baseline TIFF v6.0 zonder compressie (uncompressed) voor. DPF Manager maakt het mogelijk om te detecteren of in een TIFF-bestand al dan compressie is gebruikt, en welke.
<!--T:58-->
 
Hieronder zie je de validatierapporten van eenzelfde beeld: links opgeslagen zonder compressie, rechts opgeslagen met JPEG-compressie. Het TIFF-bestand waarin JPEG-compressie is gebruikt, geeft een foutmelding.
Hieronder zie je de validatierapport van eenzelfde beeld: links opgeslagen zonder compressie, rechts opgeslagen met JPG-compressie. Het TIFF-bestand waarin JPEG-compressie is gebruikt, geeft een foutmelding.


<!--T:59-->
[[Bestand:Validatierapport vergelijking compressie rv2.jpg|800px]]
[[Bestand:Validatierapport vergelijking compressie rv2.jpg|800px]]


Natuurlijk is de aanduiding dat het tweede TIFF-bestand maar 53 MB groot is al een aanduiding dat er mogelijk iets niet klopt met het bestand. Maar dat weet je enkel met zekerheid als je reeds weet hoe groot het bestand zou moeten zijn of als je het kan vergelijken met valide TIFF-bestanden. Maar zelfs dan weet je nog niet wat de oorzaak van de onverwacht kleine bestandsgrootte. Dat weet je pas wanneer het DPF Manager-validatierapport je zwart-op-wit aantoont dat er JPEG-compresie is gebruikt in het TIFF-bestand.
<!--T:60-->
De enige manier om deze fout te herstellen is de opname of scan opnieuw te (laten) maken en vervolgens op te slaan als Baseline TIFF v6.0 zonder compressie. Als het RAW-bestand is bewaard waarvan het TIFF-bestand is gemaakt, kan je dat RAW-bestand gebruiken om een Baseline TIFF v6.0 zonder compressie te maken.
De enige manier om deze fout te herstellen is de opname of scan opnieuw te maken en vervolgens op te slaan als Baseline TIFF v6.0 zonder compressie. Als het RAW-bestand is bewaard waarvan het TIFF-bestand is gemaakt, kan je ook terugkeren naar dat RAW-bestand en daarvan vervolgens een bestand in Baseline TIFF v6.0 zonder compressie te maken.
 
=== Voorbeeld 3: ontbreken van technische metadata ===
 
Nog een validatierapport met foutmeldingen:
 
[[Bestand:Foutmelding 1.jpg|600px]]
 
De gecontroleerde map bevat 45 TIFF-bestanden, en geen enkele van deze bestanden blijkt valide te zijn.
 
[[Bestand:Foutmelding 2.jpg|600px]]
 
De validatierapporten van de individuele TIFF-bestanden tonen wat er mis is. De foutmeldingen zegt dat de Image File Directory (IFD) van het gecontroleerde TIFF-bestand zowel een X Resolution als een Y Resolution moet bevatten. Er ontbreekt dus bepaalde technische metadata.
 
[[Bestand:Foutmelding 3.jpg|600px]]
 
[[Bestand:foutmelding met toelichting.jpg|800px]]


Deze fout kan je herstellen door zelf de ontbrekende metadata in te bedden in het TIFF-bestand. Als het bestand het resultaat is van een digitaliseringsproject dat wordt uitgevoerd door een gespecialiseerd digitaliseringsbedrijf, vraag je bij voorkeur aan dat bedrijf om de fout te herstellen.
<!--T:61-->
[[Categorie:5. Digitaal bewaren]]
</translate>

Huidige versie van 4 nov 2024 om 08:47

Door digitale bestanden te valideren kan je nagaan of ze voldoen aan de kwaliteitseisen van hun bestandsformaat. Voor TIFF-bestanden kan je hiervoor een DPF-manager gebruiken.
In deze tool leer je het volgende:

  • Waarom moet je digitale bestanden valideren en wanneer doe je dit?
  • Waarom moet je TIFF-bestanden valideren?
  • Hoe installeer en gebruik je DPF Manager?
  • Hoe kan je ingebedde metadata in TIFF-bestanden corrigeren?

Het valideren van bestandsformaten is het proces waarbij je controleert of de inhoud en structuur van een digitaal bestand beantwoordt aan de eisen gesteld in de specificatie van het bestandsformaat.

DPF Manager is een open source tool voor de controle van TIFF-bestanden die bijzonder gebruiksvriendelijk is. Via een eenvoudige interface toont DPF Manager of je TIFF-bestand voldoet aan de juiste TIFF-specificatie. Voldoet je bestand niet, dan geeft de tool ook aan waarom niet.

Waarom valideren?

De validatie van bestandsformaten is zeer belangrijk in functie van langetermijnbewaring. Een belangrijk struikelblok bij de uitbouw van een digitale bewaarstrategie is dat we vaak geen goed beeld hebben uit welke bestandsformaten ons digitaal archief bestaat. Toch is het belangrijk om dit te weten om regelmatig te kunnen controleren of de bestandsformaten waaruit je archief bestaat nog geopend kunnen worden met de software die voorhanden is. Het is immers mogelijk dat die in de toekomst niet meer bestaat. Via bestandsidentificatie en -validatie kan je op tijd detecteren of een formaat obsoleet gaat worden, en tijdig ingrijpen door die bestanden over te zetten naar een ander formaat.

Ook wanneer je een een digitaliseringsopdracht hebt uitbesteed, is het belangrijk om te controleren of de aangeleverde bestanden voldoen aan de opgestelde kwaliteitseisen.

Wanneer valideer je?

Voorafgaande aan de opstart van een digitaliseringsproject leg je kwaliteitseisen vast, o.a. over het te gebruiken bestandsformaat. De richtlijnen, zoals in de tool Kwaliteitsvol digitaliseren van tekst- en beeldmateriaal bevelen hiervoor het gebruik van Uncompressed baseline TIFF v6.0 aan. Zodra de digitaliseringsresultaten opgeleverd worden, controleer je dan ook best of de ontvangen TIFF-bestanden beantwoorden aan die specificatie. Indien bij de bestandsvalidatie fouten worden ontdekt, is het alsnog mogelijk om de bestanden door de digitaliseringsfirma om te laten zetten in het juiste formaat.

Je controleert dus niet louter of de bestanden met de extensie .tif wel degelijk TIFF-bestanden zijn, maar ook of ze beantwoorden aan de eisen die opgelegd zijn door de specificatie van Uncompressed baseline TIFF v6.0. De structuur van het bestand wordt geanalyseerd en er wordt nagegaan of er geen fouten gemaakt zijn bij het maken van het bestand. Zulke fouten kunnen immers betekenen dat het bestand niet door alle software gelezen kan worden.

DPF Manager voor bestandsvalidatie van TIFF-bestanden

Een tutorial over het gebruik van DPF Manager is ook beschikbaar op YouTube.

Installeer DPF Manager

Download DPF Manager en installeer het programma. DPF Manager is beschikbaar voor Windows en macOS. Let op! MacOS-gebruikers moeten een extra stap doen vooraleer ze het installatiebestand kunnen openen. Lees hiervoor de instructies die zich bevinden in de map met het installatiebestand.

Kies bestanden om te laten valideren

Open het programma DPF Manager op je computer.

Sleep de map met te valideren TIFF-bestanden naar het venster Files/Folders.

... Of klik op knop Select en selecteer de map met te valideren TIFF-bestanden.

Vink de optie Default aan, en klik op de knop Full check.

Onderaan opent zich het venster Tasks. Daar kan je de voortgang van de lopende validatie volgen. Wanneer de balk volledig groen is, is de validatie afgelopen. Je kan het venster sluiten door onderaan links op Tasks te klikken.

Analyseer de resultaten

Wanneer de validatie is afgelopen, kan je het rapport met de validatieresultaten raadplegen door in de bovenbalk op Reports te klikken.

Je krijgt dan een algemeen overzicht dat aangeeft

  • wanneer de validatie werd verricht;
  • hoeveel TIFF-bestanden werden gevalideerd;
  • welke map werd gevalideerd;
  • hoeveel fouten er werden vastgesteld;
  • hoeveel waarschuwingen er zijn;
  • hoeveel TIFF-bestanden de validatie hebben doorstaan;
  • de score.

Als je op het folder-icoontje klikt, ga je rechtstreeks naar de rapporten. Je kan de resultaten raadplegen door op de lijn te klikken.

Je krijgt dan een overzicht te zien van de resultaten per bestand. Daarin zie je eerst bovenaan een samenvatting van het algemene rapport voor de hele folder, en vervolgens samenvattingen van de rapporten voor de individuele TIFF-bestanden. In het overzicht zie je per TIFF-bestand:

  • met een kleurcode aangegeven of de validatie geslaagd is;
  • welke bestanden gevalideerd zijn;
  • hoeveel fouten er zijn vastgesteld;
  • hoeveel waarschuwingen er zijn.

Als je op het HTML-icoontje klikt, krijg een bondige visuele samenvatting van de validatieresultaten voor de hele folder.

Alle rapporten, zowel voor de hele folder als voor de individuele TIFF-bestanden, kan je opvragen in vier bestandsformaten: in HTML, PDF, XML en JSON. Dat doe je door op de iconen ‘HTML’, ‘PDF’, ‘XML’ en/of ‘JSON’ te klikken. Voor het validatierapport van een individueel TIFF-bestand klik je op de iconen ‘HTML’, ‘PDF’, ‘XML’ en/of ‘JSON’ achter het bestand.

Het HTML-validatierapport voor de volledige map

Een voorbeeld van een validatierapport voor een map TIFF-bestanden zonder fouten kan je als PDF-bestand downloaden door HIER te klikken.

Het HTML-validatierapport van een individueel bestand

Een voorbeeld van een validatierapport voor een individueel TIFF-bestand zonder fouten kan je als PDF-bestand downloaden door HIER te klikken.

Voorbeelden van foutmeldingen

Niet iedere bestandsvalidatie levert een rapport op zonder foutmeldingen. Hieronder geven we een aantal voorbeelden van foutmeldingen en oplossingen om de fouten te corrigeren.

Voorbeeld 1: gebruik van vreemde tekens

Het validatierapport geeft aan dat het TIFF-bestand niet conform is aan de specificaties van baseline TIFF v6.0. De foutmelding is Only 7-bits ASCII-codes are accepted. Je krijgt een toelichting te zien als je met je cursor over de foutmelding gaat.

ASCII is een codering om letters, cijfers en leestekens op een computerscherm weer te geven. In totaal bestaat het uit 128 tekens. Een overzicht van de 128 tekens die tot deze reeks behoren, vind je o.a. op Wikipedia. De foutmelding geeft aan dat er een probleem is met de ingebedde metadata van tag 33432 Copyright. De inhoud van deze tag vind je hoger in het rapport, in het lijstje met IFD tags: © Rony Vissers. Het copyright-teken is geen 7-bits ASCII-code, en dat is de reden van de foutmelding.

Deze fout kan je makkelijk corrigeren. Als je het bestand opent met een beeldbewerkingsprogramma (bv. Adobe Photoshop of GIMP) en vervolgens de ingebedde metadata bekijkt, kan je makkelijk © Rony Vissers wijzigen in copyright: Rony Vissers. In Adobe Photoshop krijg je toegang tot de ingebedde metadata door in het menu onder 'File' op 'File info' te klikken. In GIMP krijg je toegang tot de ingebedde metadata door in het menu onder 'Afbeelding' eerst op 'Metadata' en vervolgens op 'Metadata bewerken' te klikken. Vergeet na de aanpassing het gewijzigde TIFF-bestand niet op te slaan. Bekijk voor het aanpassen van ingebedde metadata ook de tool Ingebedde metadata bij foto's.

Wanneer je het gewijzigde TIFF-bestand opnieuw controleert met DPF Manager, zal je merken dat de eerder gemelde fout verdwenen is en dat het bestand nu valide is.

Als de TIFF-bestanden het resultaat zijn van een digitaliseringsproject dat wordt uitgevoerd door een gespecialiseerd digitaliseringsbedrijf, vraag dan aan dat digitaliseringsbedrijf om hun fouten te herstellen in plaats van het zelf te doen.

Voorbeeld 2: gebruik van compressie

Hoewel het TIFF-bestandsformaat vooral gekend is als een bestandsformaat zonder compressie, biedt het TIFF-bestandformaat toch de mogelijkheid om compressie te gebruiken. Bij digitalisering wordt aangeraden om geen compressie te gebruiken. DPF Manager maakt het mogelijk om te detecteren of in een TIFF-bestand compressie gebruikt is, en welke.

Hieronder zie je de validatierapporten van eenzelfde beeld: links opgeslagen zonder compressie, rechts opgeslagen met JPEG-compressie. Het TIFF-bestand waarin JPEG-compressie is gebruikt, geeft een foutmelding.

De enige manier om deze fout te herstellen is de opname of scan opnieuw te (laten) maken en vervolgens op te slaan als Baseline TIFF v6.0 zonder compressie. Als het RAW-bestand is bewaard waarvan het TIFF-bestand is gemaakt, kan je dat RAW-bestand gebruiken om een Baseline TIFF v6.0 zonder compressie te maken.