Handgeschreven tekst transcriberen met behulp van AI: verschil tussen versies

Uit Tracks
Naar navigatie springen Naar zoeken springen
Nieuwe pagina aangemaakt met '<!--T:1--> Transcriberen is een ideale manier om handgeschreven teksten in je archief of collectie beter te ontsluiten. Door een transcriptie kan je handgeschreven...'
(geen verschil)

Versie van 28 mrt 2025 14:34

Transcriberen is een ideale manier om handgeschreven teksten in je archief of collectie beter te ontsluiten. Door een transcriptie kan je handgeschreven documenten namelijk doorzoekbaar maken, wat de zichtbaarheid van het document stimuleert en nieuwe verbanden kan uitlichten. Manueel transcriberen is bijzonder tijdsintensief: daardoor kan het gebruik van AI het proces drastisch versnellen. In deze tool wordt beschreven hoe je kan transcriberen via het platform Transkribus.

Transkribus is een platform voor automatische tekstherkenning bij historische teksten dat wordt gerund door een coöperatie van meer dan honderdvijftig mede-eigenaren, waaronder het Algemeen Rijksarchief België en de Universiteit Antwerpen. Transkribus transcribeert je tekst automatisch, waarna je manueel correcties kan aanbrengen. Als je een grote hoeveelheid gelijkaardige documenten wil transcriberen kan je een aangepaste AI trainen op basis van de specifieke kenmerken van je collectie. Op de website www.transkribus.org is een gratis versie ter beschikking.

Registreer je eerst als gratis gebruiker van Transkribus via de knop 'Probeer gratis', rechts bovenaan op de website. Na het inloggen kan je op de homepagina gebruik maken van snelle tekstherkenning om de scan van een bepaald document meteen te transcriberen. Als je gestructureerder te werk wil gaan kan je in de balk bovenaan via 'collecties' een collectie aanmaken waarin je bij elkaar horende documenten bundelt. In de aangemaakte collectie kan je bestanden importeren. Wanneer je de collectie opent vind je een overzicht van alle documenten die tot de collectie behoren. Wanneer je een document selecteert krijg je een overzicht van de pagina's. Als je de geselecteerde pagina wil transcriberen klik je bovenaan op 'herkennen', waarna een balk rechts opent. In de balk kan je aangeven wat voor materiaal je wil laten herkennen (tekst, layout,...), in welke taal het bronmateriaal is en welk AI-model je wil gebruiken. NB: de zogenaamde 'Super models' kan je enkel gebruiken bij een betalende account. Na selectie van de gewenste parameters druk je onderaan op 'Start herkenning'.

Nu werd je document al door een AI-model getranscribeerd, maar moet het nog nagekeken en eventueel verbeterd worden. Wanneer je een document open klikt, zie je links in beeld een scan en rechts in beeld de automatisch getranscribeerde tekst. De tekst kan je rechtstreeks bewerken. Je hoeft een document niet in één keer te transcriberen: je kan de wijzigingen tussentijds bewaren door bovenaan op save te drukken. Daar krijg je bovendien ook te zien hoeveel niet-bewaarde wijzigingen je al hebt aangebracht. Transkribus biedt de mogelijkheid aan om via een kleurcode de transcriptiestatus van een pagina en/of document aan te geven. Bewaar je een transcriptie tussentijds? Dan pas je in het overzicht van de pagina’s de status van deze brief aan naar done (geel). Je kan een volgende keer aan deze transcriptie verder werken. Heb je een transcriptie afgerond? Vergeet de aangebrachte wijzigingen niet te bewaren en pas de status in het overzicht aan naar final (lichtgroen).