Translations:Archiveren van de website en sociale media van Studio ORKA/4/nl
Website
Aangezien de website uitgebreide beschrijvingen van de voorstellingen bevatte, besloot de archivaris om met dit materiaal te beginnen. Aanvankelijk werd een poging ondernomen om het proces te automatiseren met behulp van een webcrawler-applicatie, om de gehele website te scannen en op te slaan. Dit gebeurde met Heritrix, een veelzijdige webcrawler die vaak wordt gebruikt voor dergelijke taken. Voor deze specifieke toepassing, waarbij het cruciaal was dat elke link correct werd vastgelegd, bleek deze optie problematisch: sommige links werden opgeslagen, terwijl andere ontbraken of niet correct werkten. Dit maakte de resultaten onbetrouwbaar en onvolledig. Daarom werd afgestapt van Heritrix en geopteerd voor Archive WebPage, waarbij handmatig alle links op de website van Studio ORKA werden doorlopen om de volledige website op te slaan in zowel het WARC- als WACZ-formaat (Web ARChive).