Bestanden identificeren/en: verschil tussen versies

Uit Tracks
Naar navigatie springen Naar zoeken springen
Nieuwe pagina aangemaakt met 'File identification'
 
Nieuwe pagina aangemaakt met 'However, you have no guarantee that you will still be able to open the files in a few years because the right software may no longer be available. One example of th...'
Regel 13: Regel 13:
File identification is the precise determination of the type and version of the file format of a digital file. It allows you to detect outdated file formats in time and, if necessary, convert them to a sustainable format. [[Checksums als middel om de integriteit van bestanden te bewaken/en|Using checksums to regularly monitor the integrity of your files]] assures you that the files themselves have not been altered; the ones and zeros that make up the file remain the same.
File identification is the precise determination of the type and version of the file format of a digital file. It allows you to detect outdated file formats in time and, if necessary, convert them to a sustainable format. [[Checksums als middel om de integriteit van bestanden te bewaken/en|Using checksums to regularly monitor the integrity of your files]] assures you that the files themselves have not been altered; the ones and zeros that make up the file remain the same.


<div lang="nl" dir="ltr" class="mw-content-ltr">
However, you have no guarantee that you will still be able to open the files in a few years because the right software may no longer be available. One example of this is WordPerfect files that can no longer be opened by current office software. That’s why it’s important to map out which formats you have in your digital collection, and to check whether there is still software available to open these files.  
Je hebt echter geen garantie dat je de bestanden binnen een aantal jaar nog kan openen omdat de juiste software mogelijk niet meer beschikbaar zal zijn. Een voorbeeld hiervan zijn WordPerfect-bestanden die niet meer geopend kunnen worden door de huidige kantoorsoftware. Daarom is het belangrijk in kaart te brengen welke formaten in je digitale collectie zitten en na te gaan of er nog software bestaat die deze bestanden kan openen.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
== How do you know which file formats you have? ==
== Hoe weet je over welke bestandsformaten je beschikt? ==
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
<div lang="nl" dir="ltr" class="mw-content-ltr">
Regel 25: Regel 21:
</div>  
</div>  


<div lang="nl" dir="ltr" class="mw-content-ltr">
Moreover, someone could have manually renamed the file and given it a different extension, so the extension alone does not provide absolute certainty about the file format. Often, it is important to also know which version a file format is in to be able to open the file with the corresponding software version – and an extension does not provide a clear answer to this either.
Bovendien kan iemand het bestand handmatig hernoemd hebben en het een andere extensie gegeven hebben. De extensie geeft dus geen absolute zekerheid over het bestandsformaat. Vaak is het belangrijk te weten om welke versie van een bestandsformaat het gaat, zodat je het bestand met de overeenkomstige softwareversie opent. Ook daarover geeft een extensie geen duidelijk antwoord.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
<div lang="nl" dir="ltr" class="mw-content-ltr">
Regel 33: Regel 27:
</div>
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
== When should you identify files? ==
== Wanneer identificeer je bestanden? ==
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
There are several moments in a digital object’s life cycle when it might be useful to identify files, e.g. when you have photos [[Kwaliteitsvol digitaliseren van tekst- en beeldmateriaal/en|digitised]] by an external company. After digitisation, you receive the files back with the .tif extension, but you want to check whether these files are indeed TIFF files. You can use DROID for this.  
Er zijn een aantal momenten in de levensloop van je digitale objecten waarop het nuttig kan zijn bestandsidentificatie uit te voeren. Bijvoorbeeld wanneer je foto’s laat [[Kwaliteitsvol digitaliseren van tekst- en beeldmateriaal|digitaliseren]] bij een extern bedrijf. Na de digitalisering krijg je de bestanden terug met de extensie .tif. Je wil echter weten of deze bestanden werkelijk TIFF-bestanden zijn. Hiervoor kan je dan DROID gebruiken.
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
Also, when you have no idea what types of files your digital archive consists of, it might be useful to have [[Bestanden uit je digitaal archief identificeren met DROID/en|DROID analyse your archive]]. This will give you a list of all the files and file formats that your digital archive consists of, so you can better assess the risks.
Ook wanneer je geen idee hebt uit welke soorten bestanden je digitaal archief bestaat, kan het interessant zijn om [[Bestanden uit je digitaal archief identificeren met DROID|DROID je archief te laten analyseren]]. Zo krijg je een lijst van alle bestanden en bestandsformaten waaruit je digitaal archief bestaat en kan je de risico’s beter inschatten.
</div>




<div lang="nl" dir="ltr" class="mw-content-ltr">
''Author: Nastasia Vanderperren (meemoo) with help from Joris Janssens''
''Auteur: Nastasia Vanderperren (meemoo) m.m.v. Joris Janssens''
</div>


<div lang="nl" dir="ltr" class="mw-content-ltr">
[[Categorie:5. Digitaal bewaren/en]]
[[Categorie:5. Digitaal bewaren]]
</div>

Versie van 19 apr 2024 12:29

The first step in keeping your digital archive readable in the long term is to determine the file formats in which your digital documents are stored. You can then take further actions based on this information.
In this article, you’ll learn:

  • What is file identification?
  • Why is it important to know in which format your files are stored?
  • How can you identify file formats in your digital archive and when should you do this?


File identification is the precise determination of the type and version of the file format of a digital file. It allows you to detect outdated file formats in time and, if necessary, convert them to a sustainable format. Using checksums to regularly monitor the integrity of your files assures you that the files themselves have not been altered; the ones and zeros that make up the file remain the same.

However, you have no guarantee that you will still be able to open the files in a few years because the right software may no longer be available. One example of this is WordPerfect files that can no longer be opened by current office software. That’s why it’s important to map out which formats you have in your digital collection, and to check whether there is still software available to open these files.

How do you know which file formats you have?

Een eerste stap is de extensie bekijken. De extensie van een bestand is de tekenreeks die na het punt komt in de bestandsnaam. Een bestand met de bestandsnaam document.doc, heeft als extensie '.doc' en geeft aan dat het bestand waarschijnlijk geopend kan worden met een tekstverwerker. De extensie is slechts een deel van de informatie. Dat '.doc-bestand' kan een bestand zijn in het Microsoft Word formaat, maar het kan evengoed om een heel ander formaat gaan.[1]

Moreover, someone could have manually renamed the file and given it a different extension, so the extension alone does not provide absolute certainty about the file format. Often, it is important to also know which version a file format is in to be able to open the file with the corresponding software version – and an extension does not provide a clear answer to this either.

Het formaat en de gebruikte versie worden aangegeven via onzichtbare meta-informatie in de broncode van het bestand. Door die meta-informatie weet het besturingssysteem hoe het het bestandsformaat moet openen. DROID is software die gespecialiseerd is in het lezen van deze informatie. Met dit programma kan je het bestandsformaat en de juiste versie identificeren.

When should you identify files?

There are several moments in a digital object’s life cycle when it might be useful to identify files, e.g. when you have photos digitised by an external company. After digitisation, you receive the files back with the .tif extension, but you want to check whether these files are indeed TIFF files. You can use DROID for this.

Also, when you have no idea what types of files your digital archive consists of, it might be useful to have DROID analyse your archive. This will give you a list of all the files and file formats that your digital archive consists of, so you can better assess the risks.


Author: Nastasia Vanderperren (meemoo) with help from Joris Janssens

  1. Zie voor een lijst van alle software die .doc als extensie gebruikt, maar een ander bestandsformaat hanteert: http://filext.com/file-extension/DOC