Valideren van TIFF-bestanden met DPF-Manager/en: verschil tussen versies

Uit Tracks
Naar navigatie springen Naar zoeken springen
Nieuwe pagina aangemaakt met 'DPF Manager is a particularly user-friendly open source tool for checking TIFF files, with a simple interface to show whether your TIFF file satisfies the right TIF...'
Nieuwe pagina aangemaakt met 'Select the 'Default' option, and click the 'Full check' button.'
Regel 16: Regel 16:
== DPF Manager for TIFF file validation ==
== DPF Manager for TIFF file validation ==


<div lang="nl" dir="ltr" class="mw-content-ltr">
There is a DPF Manager tutorial on [https://www.youtube.com/watch?v=4rPFfjxKTO4 YouTube].
Een tutorial over het gebruik van DPF Manager is ook beschikbaar op [https://www.youtube.com/watch?v=4rPFfjxKTO4 YouTube].
{{#ev:youtube|https://www.youtube.com/watch?v=4rPFfjxKTO4}}
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
=== Install DPF Manager ===
=== Installeer DPF Manager ===
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[http://dpfmanager.org/ Download] and install DPF Manager. It is available for Windows, macOS and Linux.
[http://dpfmanager.org/ Download DPF Manager] en installeer het programma. DPF Manager is beschikbaar voor Windows, macOS en Linux.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 1 rv.jpg|800px]]
[[Bestand:DPFManager 1 rv.jpg|800px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
=== Select files to validate ===
=== Kies bestanden om te laten valideren ===
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
Open the DPF Manager program on your computer.
Open het programma DPF Manager op je computer.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 2 rv.jpg|600px|class=preview-image]]
[[Bestand:DPFManager 2 rv.jpg|600px|class=preview-image]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
Drag the folder containing the TIFF files that you want to validate to the 'Files/Folders' window.
Sleep de map met te valideren TIFF-bestanden naar het venster ''Files/Folders''.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 3 rv.jpg|600px]]
[[Bestand:DPFManager 3 rv.jpg|600px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
...or click 'Select' to choose the folder containing the TIFF files for validation.
... Of klik op knop ''Select'' en selecteer de map met te valideren TIFF-bestanden.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 5en6 rv.jpg|800px]]
[[Bestand:DPFManager 5en6 rv.jpg|800px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
Select the 'Default' option, and click the 'Full check' button.
Vink de optie ''Default'' aan, en klik op de knop ''Full check''.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 7 rv.jpg|600px]]
[[Bestand:DPFManager 7 rv.jpg|600px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
The 'Tasks' window opens below, where you can follow the progress of the validation process. The validation is finished when the bar is fully green. Close the window by clicking on 'Tasks' at the bottom left.
Onderaan opent zich het venster ''Tasks''. Daar kan je de voortgang van de lopende validatie volgen. Wanneer de balk volledig groen is, is de validatie afgelopen. Je kan het venster sluiten door onderaan links op ''Tasks'' te klikken.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 8en9 rv.jpg|800px]]
[[Bestand:DPFManager 8en9 rv.jpg|800px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
=== Analyse the results ===
=== Analyseer de resultaten ===
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
When the validation is complete, you can view the report with validation results by clicking on 'Reports' in the menu bar at the top.
Wanneer de validatie is afgelopen, kan je het rapport met de validatieresultaten raadplegen door in de bovenbalk op ''Reports'' te klikken.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 13 rv.jpg|600px]]
[[Bestand:DPFManager 13 rv.jpg|600px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
You will then see a general overview showing:
Je krijgt dan een algemeen overzicht dat aangeeft
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
* when the validation was performed;
* wanneer de validatie werd verricht;
* how many TIFF files were validated;
* hoeveel TIFF-bestanden werden gevalideerd;
* which folder was validated;
* welke map werd gevalideerd;
* how many errors were detected;
* hoeveel fouten er werden vastgesteld;
* how many warnings there are;
* hoeveel waarschuwingen er zijn;
* how many TIFF files passed the validation;
* hoeveel TIFF-bestanden de validatie hebben doorstaan;
* the score.
* de score.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 14 rv.jpg|600px]]
[[Bestand:DPFManager 14 rv.jpg|600px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
Click the folder symbol to go straight to the reports. You can check the results by clicking on the line.  
Als je op het folder-icoontje klikt, ga je rechtstreeks naar de rapporten. Je kan de resultaten raadplegen door op de lijn te klikken.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 15en16 rv.jpg|800px]]
[[Bestand:DPFManager 15en16 rv.jpg|800px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
You will then see an overview of the results per file. This shows a summary of the general report for the entire folder at the top, followed by summaries of the reports for the individual TIFF files. The overview shows you, for each TIFF file:
Je krijgt dan een overzicht te zien van de resultaten per bestand. Daarin zie je eerst bovenaan een samenvatting van het algemene rapport voor de hele folder, en vervolgens samenvattingen van de rapporten voor de individuele TIFF-bestanden. In het overzicht zie je per TIFF-bestand:
* a colour code indicating whether the validation was successful;
* met een kleurcode aangegeven of de validatie geslaagd is;
* which files have been validated;
* welke bestanden gevalideerd zijn;
* how many errors were detected;
* hoeveel fouten er zijn vastgesteld;
* how many warnings there are.
* hoeveel waarschuwingen er zijn.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 18 rv.jpg|600px]]
[[Bestand:DPFManager 18 rv.jpg|600px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
Click on the HTML symbol to see a brief visual summary of the validation results for the entire folder.  
Als je op het HTML-icoontje klikt, krijg een bondige visuele samenvatting van de validatieresultaten voor de hele folder.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
All reports, both for the entire folder and for individual TIFF files, are available in four file formats: HTML, PDF, XML and JSON. Simply click on the 'HTML', 'PDF', 'XML' and/or 'JSON' symbol. For the validation report for an individual TIFF file, click on the 'HTML', 'PDF', 'XML' and/or 'JSON' symbol next to that file.
Alle rapporten, zowel voor de hele folder als voor de individuele TIFF-bestanden, kan je opvragen in vier bestandsformaten: in HTML, PDF, XML en JSON. Dat doe je door op de iconen ‘HTML’, ‘PDF’, ‘XML’ en/of ‘JSON’ te klikken. Voor het validatierapport van een individueel TIFF-bestand klik je op de iconen ‘HTML’, ‘PDF’, ‘XML’ en/of ‘JSON’ achter het bestand.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 20 rv.jpg|600px]]
[[Bestand:DPFManager 20 rv.jpg|600px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
==== The HTML validation report for the entire folder ====
==== Het HTML-validatierapport voor de volledige map ====
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 19 5 assemblage sm.jpg|600px]]
[[Bestand:DPFManager 19 5 assemblage sm.jpg|600px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
Click [[:Bestand:report_folder.pdf|HERE]] to download a PDF of an example validation report for a folder of TIFF files without any errors.
Een voorbeeld van een validatierapport voor een map TIFF-bestanden zonder fouten kan je als PDF-bestand downloaden door [[:Bestand:report_folder.pdf|HIER]] te klikken.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
==== The HTML validation report for an individual file ====
==== Het HTML-validatierapport van een individueel bestand ====
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager 21c rv assemblage.jpg|600px]]
[[Bestand:DPFManager 21c rv assemblage.jpg|600px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
Click [[:Bestand:10-GVH-19710101-0001.tif.pdf|HERE]] to download a PDF of an example validation report for an individual TIFF file without any errors.
Een voorbeeld van een validatierapport voor een individueel TIFF-bestand zonder fouten kan je als PDF-bestand downloaden door [[:Bestand:10-GVH-19710101-0001.tif.pdf|HIER]] te klikken.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
== Example error messages ==
== Voorbeelden van foutmeldingen ==
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
Not all file validations result in a report without any error messages. You will find a number of example error messages, with solutions for correcting them, below.
Niet iedere bestandsvalidatie levert een rapport op zonder foutmeldingen. Hieronder geven we een aantal voorbeelden van foutmeldingen en oplossingen om de fouten te corrigeren.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
=== Example 1: use of special characters ===
=== Voorbeeld 1: gebruik van vreemde tekens ===
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager copyright overzicht.jpg|600px]]
[[Bestand:DPFManager copyright overzicht.jpg|600px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
The validation report indicates that the TIFF file does not comply with baseline TIFF v6.0 specifications. The error message is 'Only 7-bits ASCII-codes are accepted'. Hover your cursor over the error message to see more details.
Het validatierapport geeft aan dat het TIFF-bestand niet conform is aan de specificaties van baseline TIFF v6.0. De foutmelding is ''Only 7-bits ASCII-codes are accepted''. Je krijgt een toelichting te zien als je met je cursor over de foutmelding gaat.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager copright.jpg|600px]]
[[Bestand:DPFManager copright.jpg|600px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager copyright toelichting.jpg|600px]]
[[Bestand:DPFManager copyright toelichting.jpg|600px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
ASCII is a code for displaying letters, numbers and punctuation marks on a computer screen. It consists of 128 characters in total, and you can find an overview on [https://en.wikipedia.org/wiki/ASCII Wikipedia]. The error message indicates a problem with the [[Ingebedde metadata bij foto's|embedded metadata]] from 'tag 33432 Copyright'. You can find the details for this tag higher up in the report, in the list of IFD tags: '© Rony Vissers'. The copyright symbol in not 7-bits ASCII-code, and that's the reason for the error message.
ASCII is een codering om letters, cijfers en leestekens op een computerscherm weer te geven. In totaal bestaat het uit 128 tekens. Een overzicht van de 128 tekens die tot deze reeks behoren, vind je o.a. op [https://nl.wikipedia.org/wiki/ASCII_(tekenset) Wikipedia]. De foutmelding geeft aan dat er een probleem is met de [[Ingebedde metadata bij foto's|ingebedde metadata]] van ''tag 33432 Copyright''. De inhoud van deze tag vind je hoger in het rapport, in het lijstje met IFD tags: ''© Rony Vissers''. Het copyright-teken is geen 7-bits ASCII-code, en dat is de reden van de foutmelding.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
Fortunately, it's easy to rectify. If you open the file with image editing software (e.g. Adobe Photoshop or GIMP) and view the embedded metadata, you can simply change '© Rony Vissers' to 'copyright: Rony Vissers'. You can access the embedded metadata in Adobe Photoshop by clicking on 'File info' in the 'File' menu. In GIMP, access the embedded metadata by clicking on 'Metadata' in the 'Image' menu, and then 'Edit Metadata'. Don't forget to save the updated TIFF file once you have modified it. See also the [[Ingebedde metadata bij foto's/en|embedded metadata]] article for information about modifying embedded metadata.
Deze fout kan je makkelijk corrigeren. Als je het bestand opent met een beeldbewerkingsprogramma (bv. Adobe Photoshop of GIMP) en vervolgens de ingebedde metadata bekijkt, kan je makkelijk ''© Rony Vissers'' wijzigen in ''copyright: Rony Vissers''. In Adobe Photoshop krijg je toegang tot de ingebedde metadata door in het menu onder 'File' op 'File info' te klikken. In GIMP krijg je toegang tot de ingebedde metadata door in het menu onder 'Afbeelding' eerst op 'Metadata' en vervolgens op 'Metadata bewerken' te klikken. Vergeet na de aanpassing het gewijzigde TIFF-bestand niet op te slaan. Bekijk voor het aanpassen van ingebedde metadata ook de tool [[Ingebedde metadata bij foto's]].
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager correctie 2.jpg|800px]]
[[Bestand:DPFManager correctie 2.jpg|800px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
When you check the updated TIFF file with DPF Manager, you will see that the previously reported error has disappeared and the file is now valid.
Wanneer je het gewijzigde TIFF-bestand opnieuw controleert met DPF Manager, zal je merken dat de eerder gemelde fout verdwenen is en dat het bestand nu valide is.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:DPFManager correctie.jpg|600px]]
[[Bestand:DPFManager correctie.jpg|600px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
If the TIFF files are the result of a digitisation project carried out by a specialist digitisation company, ask them to fix the errors rather than doing it yourself.
Als de TIFF-bestanden het resultaat zijn van een digitaliseringsproject dat wordt uitgevoerd door een gespecialiseerd digitaliseringsbedrijf, vraag dan aan dat digitaliseringsbedrijf om hun fouten te herstellen in plaats van het zelf te doen.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
=== Example 2: use of compression ===
=== Voorbeeld  2: gebruik van compressie ===
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
Even though the TIFF file format is mainly known as a file format without [[Datacompressie|compression]], it does offer this possibility. Compression is not recommended for digitisation, however. DPF Manager can detect TIFF files that have been compressed.
Hoewel het TIFF-bestandsformaat vooral gekend is als een bestandsformaat zonder [[Datacompressie|compressie]], biedt het TIFF-bestandformaat toch de mogelijkheid om compressie te gebruiken. Bij digitalisering wordt aangeraden om geen compressie te gebruiken. DPF Manager maakt het mogelijk om te detecteren of in een TIFF-bestand compressie gebruikt is, en welke.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
Here is a validation report from the same image: saved without compression on the left, and saved with JPEG compression on the right. The TIFF file with JPEG compression gives an error message.
Hieronder zie je de validatierapport van eenzelfde beeld: links opgeslagen zonder compressie, rechts opgeslagen met JPEG-compressie. Het TIFF-bestand waarin JPEG-compressie is gebruikt, geeft een foutmelding.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Bestand:Validatierapport vergelijking compressie rv2.jpg|800px]]
[[Bestand:Validatierapport vergelijking compressie rv2.jpg|800px]]
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
The only way to fix this error is to perform the capture or scan again and save it as Baseline TIFF v6.0 without compression. If the RAW file used to create the TIFF file is available, you can use that to create a Baseline TIFF v6.0 without compression.
De enige manier om deze fout te herstellen is de opname of scan opnieuw te (laten) maken en vervolgens op te slaan als Baseline TIFF v6.0 zonder compressie. Als het RAW-bestand is bewaard waarvan het TIFF-bestand is gemaakt, kan je dat RAW-bestand gebruiken om een Baseline TIFF v6.0 zonder compressie te maken.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Categorie:5. Digitaal bewaren/en]]
[[Categorie:5. Digitaal bewaren]]
</div>

Versie van 24 nov 2022 13:16

The process for validating file formats verifies whether a digital file's contents and structure satisfy the requirements set for that file format's specification.

DPF Manager is a particularly user-friendly open source tool for checking TIFF files, with a simple interface to show whether your TIFF file satisfies the right TIFF specification. And if your file does not satisfy these requirements, the tool also explains why not.

== Why validate?

It's very important to validate file formats for their long-term preservation. One major stumbling block when developing a digital preservation strategy is that we often don't have a clear overview of the file formats in our digital archive, even though this is important for regularly checking whether they can still be opened with available software. After all, it's possible that this software might cease to exist in the future. File identification and validation can help you to detect in good time whether a format is going to become obsolete, so you can take action by converting any relevant and affected files into a different format.

It's also important to check that files delivered in an outsourced digitisation assignment satisfy the set quality requirements.

When to validate?

Quality requirements are set in advance of a digitisation project, for example with regard to which file format to use. Guidelines in the High-quality text and image content digitisation article recommend using Uncompressed baseline TIFF v6.0. When the digitisation is complete, you should therefore check that the TIFF files received satisfy this specification. Even if errors are discovered in the file validation process, the digitisation company can still convert the files into the correct format.

So you're not just checking that files with a .tif extension are actually TIFF files, but also that they satisfy the set requirements in the Uncompressed baseline TIFF v6.0 specification. The file's structure is analysed to check for any errors when the file was created, which could result in not all software being able to read it.

DPF Manager for TIFF file validation

There is a DPF Manager tutorial on YouTube.

Install DPF Manager

Download and install DPF Manager. It is available for Windows, macOS and Linux.

Select files to validate

Open the DPF Manager program on your computer.

Drag the folder containing the TIFF files that you want to validate to the 'Files/Folders' window.

...or click 'Select' to choose the folder containing the TIFF files for validation.

Select the 'Default' option, and click the 'Full check' button.

The 'Tasks' window opens below, where you can follow the progress of the validation process. The validation is finished when the bar is fully green. Close the window by clicking on 'Tasks' at the bottom left.

Analyse the results

When the validation is complete, you can view the report with validation results by clicking on 'Reports' in the menu bar at the top.

You will then see a general overview showing:

  • when the validation was performed;
  • how many TIFF files were validated;
  • which folder was validated;
  • how many errors were detected;
  • how many warnings there are;
  • how many TIFF files passed the validation;
  • the score.

Click the folder symbol to go straight to the reports. You can check the results by clicking on the line.

You will then see an overview of the results per file. This shows a summary of the general report for the entire folder at the top, followed by summaries of the reports for the individual TIFF files. The overview shows you, for each TIFF file:

  • a colour code indicating whether the validation was successful;
  • which files have been validated;
  • how many errors were detected;
  • how many warnings there are.

Click on the HTML symbol to see a brief visual summary of the validation results for the entire folder.

All reports, both for the entire folder and for individual TIFF files, are available in four file formats: HTML, PDF, XML and JSON. Simply click on the 'HTML', 'PDF', 'XML' and/or 'JSON' symbol. For the validation report for an individual TIFF file, click on the 'HTML', 'PDF', 'XML' and/or 'JSON' symbol next to that file.

The HTML validation report for the entire folder

Click HERE to download a PDF of an example validation report for a folder of TIFF files without any errors.

The HTML validation report for an individual file

Click HERE to download a PDF of an example validation report for an individual TIFF file without any errors.

Example error messages

Not all file validations result in a report without any error messages. You will find a number of example error messages, with solutions for correcting them, below.

Example 1: use of special characters

The validation report indicates that the TIFF file does not comply with baseline TIFF v6.0 specifications. The error message is 'Only 7-bits ASCII-codes are accepted'. Hover your cursor over the error message to see more details.

ASCII is a code for displaying letters, numbers and punctuation marks on a computer screen. It consists of 128 characters in total, and you can find an overview on Wikipedia. The error message indicates a problem with the embedded metadata from 'tag 33432 Copyright'. You can find the details for this tag higher up in the report, in the list of IFD tags: '© Rony Vissers'. The copyright symbol in not 7-bits ASCII-code, and that's the reason for the error message.

Fortunately, it's easy to rectify. If you open the file with image editing software (e.g. Adobe Photoshop or GIMP) and view the embedded metadata, you can simply change '© Rony Vissers' to 'copyright: Rony Vissers'. You can access the embedded metadata in Adobe Photoshop by clicking on 'File info' in the 'File' menu. In GIMP, access the embedded metadata by clicking on 'Metadata' in the 'Image' menu, and then 'Edit Metadata'. Don't forget to save the updated TIFF file once you have modified it. See also the embedded metadata article for information about modifying embedded metadata.

When you check the updated TIFF file with DPF Manager, you will see that the previously reported error has disappeared and the file is now valid.

If the TIFF files are the result of a digitisation project carried out by a specialist digitisation company, ask them to fix the errors rather than doing it yourself.

Example 2: use of compression

Even though the TIFF file format is mainly known as a file format without compression, it does offer this possibility. Compression is not recommended for digitisation, however. DPF Manager can detect TIFF files that have been compressed.

Here is a validation report from the same image: saved without compression on the left, and saved with JPEG compression on the right. The TIFF file with JPEG compression gives an error message.

The only way to fix this error is to perform the capture or scan again and save it as Baseline TIFF v6.0 without compression. If the RAW file used to create the TIFF file is available, you can use that to create a Baseline TIFF v6.0 without compression.