Bestanden identificeren/en: verschil tussen versies

Uit Tracks
Naar navigatie springen Naar zoeken springen
Nieuwe pagina aangemaakt met 'File identification'
(geen verschil)

Versie van 19 apr 2024 12:25

The first step in keeping your digital archive readable in the long term is to determine the file formats in which your digital documents are stored. You can then take further actions based on this information.
In this article, you’ll learn:

  • What is file identification?
  • Why is it important to know in which format your files are stored?
  • How can you identify file formats in your digital archive and when should you do this?


File identification is the precise determination of the type and version of the file format of a digital file. It allows you to detect outdated file formats in time and, if necessary, convert them to a sustainable format. Using checksums to regularly monitor the integrity of your files assures you that the files themselves have not been altered; the ones and zeros that make up the file remain the same.

Je hebt echter geen garantie dat je de bestanden binnen een aantal jaar nog kan openen omdat de juiste software mogelijk niet meer beschikbaar zal zijn. Een voorbeeld hiervan zijn WordPerfect-bestanden die niet meer geopend kunnen worden door de huidige kantoorsoftware. Daarom is het belangrijk in kaart te brengen welke formaten in je digitale collectie zitten en na te gaan of er nog software bestaat die deze bestanden kan openen.

Hoe weet je over welke bestandsformaten je beschikt?

Een eerste stap is de extensie bekijken. De extensie van een bestand is de tekenreeks die na het punt komt in de bestandsnaam. Een bestand met de bestandsnaam document.doc, heeft als extensie '.doc' en geeft aan dat het bestand waarschijnlijk geopend kan worden met een tekstverwerker. De extensie is slechts een deel van de informatie. Dat '.doc-bestand' kan een bestand zijn in het Microsoft Word formaat, maar het kan evengoed om een heel ander formaat gaan.[1]

Bovendien kan iemand het bestand handmatig hernoemd hebben en het een andere extensie gegeven hebben. De extensie geeft dus geen absolute zekerheid over het bestandsformaat. Vaak is het belangrijk te weten om welke versie van een bestandsformaat het gaat, zodat je het bestand met de overeenkomstige softwareversie opent. Ook daarover geeft een extensie geen duidelijk antwoord.

Het formaat en de gebruikte versie worden aangegeven via onzichtbare meta-informatie in de broncode van het bestand. Door die meta-informatie weet het besturingssysteem hoe het het bestandsformaat moet openen. DROID is software die gespecialiseerd is in het lezen van deze informatie. Met dit programma kan je het bestandsformaat en de juiste versie identificeren.

Wanneer identificeer je bestanden?

Er zijn een aantal momenten in de levensloop van je digitale objecten waarop het nuttig kan zijn bestandsidentificatie uit te voeren. Bijvoorbeeld wanneer je foto’s laat digitaliseren bij een extern bedrijf. Na de digitalisering krijg je de bestanden terug met de extensie .tif. Je wil echter weten of deze bestanden werkelijk TIFF-bestanden zijn. Hiervoor kan je dan DROID gebruiken.

Ook wanneer je geen idee hebt uit welke soorten bestanden je digitaal archief bestaat, kan het interessant zijn om DROID je archief te laten analyseren. Zo krijg je een lijst van alle bestanden en bestandsformaten waaruit je digitaal archief bestaat en kan je de risico’s beter inschatten.


Auteur: Nastasia Vanderperren (meemoo) m.m.v. Joris Janssens

  1. Zie voor een lijst van alle software die .doc als extensie gebruikt, maar een ander bestandsformaat hanteert: http://filext.com/file-extension/DOC