Valideren van TIFF-bestanden met DPF-Manager/en: verschil tussen versies

Uit Tracks
Naar navigatie springen Naar zoeken springen
Nieuwe pagina aangemaakt met 'Validating TIFF files with DPF Manager'
 
Nieuwe pagina aangemaakt met 'DPF Manager is a particularly user-friendly open source tool for checking TIFF files, with a simple interface to show whether your TIFF file satisfies the right TIF...'
Regel 5: Regel 5:
== Why validate?
== Why validate?


<div lang="nl" dir="ltr" class="mw-content-ltr">
It's very important to validate file formats for their long-term preservation. One major stumbling block when developing a digital preservation strategy is that we often don't have a clear overview of the file formats in our digital archive, even though this is important for regularly checking whether they can still be opened with available software. After all, it's possible that this software might cease to exist in the future. [[Bestanden identificeren|File identification and validation]] can help you to detect in good time whether a format is going to become [[Obsoletie|obsolete]], so you can take action by converting any relevant and affected files into a different format.  
De validatie van bestandsformaten is zeer belangrijk in functie van langetermijnbewaring. Een belangrijk struikelblok bij de uitbouw van een digitale bewaarstrategie is dat we vaak geen goed beeld hebben uit welke bestandsformaten ons digitaal archief bestaat. Toch is het belangrijk om dit te weten om regelmatig te kunnen controleren of de bestandsformaten waaruit je archief bestaat nog geopend kunnen worden met de software die voorhanden is. Het is immers mogelijk dat die in de toekomst niet meer bestaat. Via [[Bestanden identificeren|bestandsidentificatie en -validatie]] kan je op tijd detecteren of een formaat [[Obsoletie|obsoleet]] gaat worden, en tijdig ingrijpen door die bestanden over te zetten naar een ander formaat.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
It's also important to check that files delivered in [[Een digitaliseringsopdracht uitbesteden|an outsourced digitisation assignment]] satisfy the set quality requirements.
Ook wanneer je een [[Een digitaliseringsopdracht uitbesteden|een digitaliseringsopdracht hebt uitbesteed]], is het belangrijk om te controleren of de aangeleverde bestanden voldoen aan de opgestelde kwaliteitseisen.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
== When to validate? ==
== Wanneer valideer je? ==
Quality requirements are set in advance of a digitisation project, for example with regard to which file format to use. Guidelines in the [[Kwaliteitsvol digitaliseren van tekst- en beeldmateriaal/en|High-quality text and image content digitisation]] article recommend using Uncompressed baseline TIFF v6.0. When the digitisation is complete, you should therefore check that the TIFF files received satisfy this specification. Even if errors are discovered in the file validation process, the digitisation company can still convert the files into the correct format.
Voorafgaande aan de opstart van een digitaliseringsproject leg je kwaliteitseisen vast, o.a. over het te gebruiken bestandsformaat. De richtlijnen, zoals in de tool [[Kwaliteitsvol digitaliseren van tekst- en beeldmateriaal]] bevelen hiervoor het gebruik van Uncompressed baseline TIFF v6.0 aan. Zodra de digitaliseringsresultaten opgeleverd worden, controleer je dan ook best of de ontvangen TIFF-bestanden beantwoorden aan die specificatie. Indien bij de bestandsvalidatie fouten worden ontdekt, is het alsnog mogelijk om de bestanden door de digitaliseringsfirma om te laten zetten in het juiste formaat.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
So you're not just checking that files with a .tif extension are actually TIFF files, but also that they satisfy the set requirements in the Uncompressed baseline TIFF v6.0 specification. The file's structure is analysed to check for any errors when the file was created, which could result in not all software being able to read it.
Je controleert dus niet louter of de bestanden met de extensie .tif wel degelijk TIFF-bestanden zijn, maar ook of ze beantwoorden aan de eisen die opgelegd zijn door de specificatie van Uncompressed baseline TIFF v6.0. De structuur van het bestand wordt geanalyseerd en er wordt nagegaan of er geen fouten gemaakt zijn bij het maken van het bestand. Zulke fouten kunnen immers betekenen dat het bestand niet door alle software gelezen kan worden.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
== DPF Manager for TIFF file validation ==
== DPF Manager voor bestandsvalidatie van TIFF-bestanden ==
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
<div lang="nl" dir="ltr" class="mw-content-ltr">

Versie van 24 nov 2022 13:07

The process for validating file formats verifies whether a digital file's contents and structure satisfy the requirements set for that file format's specification.

DPF Manager is a particularly user-friendly open source tool for checking TIFF files, with a simple interface to show whether your TIFF file satisfies the right TIFF specification. And if your file does not satisfy these requirements, the tool also explains why not.

== Why validate?

It's very important to validate file formats for their long-term preservation. One major stumbling block when developing a digital preservation strategy is that we often don't have a clear overview of the file formats in our digital archive, even though this is important for regularly checking whether they can still be opened with available software. After all, it's possible that this software might cease to exist in the future. File identification and validation can help you to detect in good time whether a format is going to become obsolete, so you can take action by converting any relevant and affected files into a different format.

It's also important to check that files delivered in an outsourced digitisation assignment satisfy the set quality requirements.

When to validate?

Quality requirements are set in advance of a digitisation project, for example with regard to which file format to use. Guidelines in the High-quality text and image content digitisation article recommend using Uncompressed baseline TIFF v6.0. When the digitisation is complete, you should therefore check that the TIFF files received satisfy this specification. Even if errors are discovered in the file validation process, the digitisation company can still convert the files into the correct format.

So you're not just checking that files with a .tif extension are actually TIFF files, but also that they satisfy the set requirements in the Uncompressed baseline TIFF v6.0 specification. The file's structure is analysed to check for any errors when the file was created, which could result in not all software being able to read it.

DPF Manager for TIFF file validation

Een tutorial over het gebruik van DPF Manager is ook beschikbaar op YouTube.

Installeer DPF Manager

Download DPF Manager en installeer het programma. DPF Manager is beschikbaar voor Windows, macOS en Linux.

Kies bestanden om te laten valideren

Open het programma DPF Manager op je computer.

Sleep de map met te valideren TIFF-bestanden naar het venster Files/Folders.

... Of klik op knop Select en selecteer de map met te valideren TIFF-bestanden.

Vink de optie Default aan, en klik op de knop Full check.

Onderaan opent zich het venster Tasks. Daar kan je de voortgang van de lopende validatie volgen. Wanneer de balk volledig groen is, is de validatie afgelopen. Je kan het venster sluiten door onderaan links op Tasks te klikken.

Analyseer de resultaten

Wanneer de validatie is afgelopen, kan je het rapport met de validatieresultaten raadplegen door in de bovenbalk op Reports te klikken.

Je krijgt dan een algemeen overzicht dat aangeeft

  • wanneer de validatie werd verricht;
  • hoeveel TIFF-bestanden werden gevalideerd;
  • welke map werd gevalideerd;
  • hoeveel fouten er werden vastgesteld;
  • hoeveel waarschuwingen er zijn;
  • hoeveel TIFF-bestanden de validatie hebben doorstaan;
  • de score.

Als je op het folder-icoontje klikt, ga je rechtstreeks naar de rapporten. Je kan de resultaten raadplegen door op de lijn te klikken.

Je krijgt dan een overzicht te zien van de resultaten per bestand. Daarin zie je eerst bovenaan een samenvatting van het algemene rapport voor de hele folder, en vervolgens samenvattingen van de rapporten voor de individuele TIFF-bestanden. In het overzicht zie je per TIFF-bestand:

  • met een kleurcode aangegeven of de validatie geslaagd is;
  • welke bestanden gevalideerd zijn;
  • hoeveel fouten er zijn vastgesteld;
  • hoeveel waarschuwingen er zijn.

Als je op het HTML-icoontje klikt, krijg een bondige visuele samenvatting van de validatieresultaten voor de hele folder.

Alle rapporten, zowel voor de hele folder als voor de individuele TIFF-bestanden, kan je opvragen in vier bestandsformaten: in HTML, PDF, XML en JSON. Dat doe je door op de iconen ‘HTML’, ‘PDF’, ‘XML’ en/of ‘JSON’ te klikken. Voor het validatierapport van een individueel TIFF-bestand klik je op de iconen ‘HTML’, ‘PDF’, ‘XML’ en/of ‘JSON’ achter het bestand.

Het HTML-validatierapport voor de volledige map

Een voorbeeld van een validatierapport voor een map TIFF-bestanden zonder fouten kan je als PDF-bestand downloaden door HIER te klikken.

Het HTML-validatierapport van een individueel bestand

Een voorbeeld van een validatierapport voor een individueel TIFF-bestand zonder fouten kan je als PDF-bestand downloaden door HIER te klikken.

Voorbeelden van foutmeldingen

Niet iedere bestandsvalidatie levert een rapport op zonder foutmeldingen. Hieronder geven we een aantal voorbeelden van foutmeldingen en oplossingen om de fouten te corrigeren.

Voorbeeld 1: gebruik van vreemde tekens

Het validatierapport geeft aan dat het TIFF-bestand niet conform is aan de specificaties van baseline TIFF v6.0. De foutmelding is Only 7-bits ASCII-codes are accepted. Je krijgt een toelichting te zien als je met je cursor over de foutmelding gaat.

ASCII is een codering om letters, cijfers en leestekens op een computerscherm weer te geven. In totaal bestaat het uit 128 tekens. Een overzicht van de 128 tekens die tot deze reeks behoren, vind je o.a. op Wikipedia. De foutmelding geeft aan dat er een probleem is met de ingebedde metadata van tag 33432 Copyright. De inhoud van deze tag vind je hoger in het rapport, in het lijstje met IFD tags: © Rony Vissers. Het copyright-teken is geen 7-bits ASCII-code, en dat is de reden van de foutmelding.

Deze fout kan je makkelijk corrigeren. Als je het bestand opent met een beeldbewerkingsprogramma (bv. Adobe Photoshop of GIMP) en vervolgens de ingebedde metadata bekijkt, kan je makkelijk © Rony Vissers wijzigen in copyright: Rony Vissers. In Adobe Photoshop krijg je toegang tot de ingebedde metadata door in het menu onder 'File' op 'File info' te klikken. In GIMP krijg je toegang tot de ingebedde metadata door in het menu onder 'Afbeelding' eerst op 'Metadata' en vervolgens op 'Metadata bewerken' te klikken. Vergeet na de aanpassing het gewijzigde TIFF-bestand niet op te slaan. Bekijk voor het aanpassen van ingebedde metadata ook de tool Ingebedde metadata bij foto's.

Wanneer je het gewijzigde TIFF-bestand opnieuw controleert met DPF Manager, zal je merken dat de eerder gemelde fout verdwenen is en dat het bestand nu valide is.

Als de TIFF-bestanden het resultaat zijn van een digitaliseringsproject dat wordt uitgevoerd door een gespecialiseerd digitaliseringsbedrijf, vraag dan aan dat digitaliseringsbedrijf om hun fouten te herstellen in plaats van het zelf te doen.

Voorbeeld 2: gebruik van compressie

Hoewel het TIFF-bestandsformaat vooral gekend is als een bestandsformaat zonder compressie, biedt het TIFF-bestandformaat toch de mogelijkheid om compressie te gebruiken. Bij digitalisering wordt aangeraden om geen compressie te gebruiken. DPF Manager maakt het mogelijk om te detecteren of in een TIFF-bestand compressie gebruikt is, en welke.

Hieronder zie je de validatierapport van eenzelfde beeld: links opgeslagen zonder compressie, rechts opgeslagen met JPEG-compressie. Het TIFF-bestand waarin JPEG-compressie is gebruikt, geeft een foutmelding.

De enige manier om deze fout te herstellen is de opname of scan opnieuw te (laten) maken en vervolgens op te slaan als Baseline TIFF v6.0 zonder compressie. Als het RAW-bestand is bewaard waarvan het TIFF-bestand is gemaakt, kan je dat RAW-bestand gebruiken om een Baseline TIFF v6.0 zonder compressie te maken.