Translations:Tools voor het geautomatiseerd transcriberen van audio- en videofragmenten/8/nl
Je kan met een aantal factoren rekening houden om tot betere resultaten te komen:
- De sterkte van de spraakherkenningstools zijn afhankelijk van het gebruikte model: bv. welke talen ondersteunt het model en hoe goed kan het model omgaan met dialecten of spreektaal? De keuze voor het model is afhankelijk van de noden en use cases, zoals de afweging tussen snelheid en nauwkeurigheid, en de taal die getranscribeerd moet worden. In het overzicht hebben we gekozen voor nauwkeurigheid (het is belangrijk dat de tekst correct is dan dat de tool snel is) en voor het Nederlands als spreektaal. Ze werden ook allemaal getest op interviews waarin licht dialect of tussentaal gesproken werd. Daarop scoorden de meest accurate tools goed, maar algemeen werd wel vastgesteld dat interviews met uitgesproken dialecten voor minder goede transcripties zorgen.
- Een ander belangrijk aandachtspunt is de kwaliteit van de opname. Opnames met een helder geluid en zonder achtergrondgeluid geven betere resultaten dan opnames met een slechte geluidskwaliteit (bv. ruis) en achtergrondgeluid. Sprekers die duidelijk spreken worden ook beter getranscribeerd dan sprekers die mompelen.
- Desktopapplicaties maken gebruik van de rekenkracht van de computer bij het transcriberen van de tekst. Als je computer over een dedicated GPU beschikt, dan zal de transcriptie veel sneller verlopen. Een dedicated GPU is een speciale GPU met een eigen kaart die verbonden is met het moederbord, terwijl een geïntegreerde GPU ingebed is in dezelfde chip als de CPU. Dit artikel legt meer uit over de verschillende GPU's. Als je computer die GPU niet heeft, dan wordt de CPU of processor gebruikt. Dat gaat langzamer. Je kan ook een online service gebruiken zodat je niet beperkt bent door de limieten van je computer.