La synthèse vocale grâce à noScribe

Uit Tracks
Versie door Juliette Wanlin (overleg | bijdragen) op 19 mrt 2025 om 14:23 (Nieuwe pagina aangemaakt met '* Sur le site web, cliquez sur les deux liens "noScribe_Setup_0_5_cuda.exe" et "noScribe_setup_0_5_cuda.nsisbin" pour les télécharger.')
Naar navigatie springen Naar zoeken springen

Ceci est un tutoriel pour noScribe. NoScribe est un outil open source gratuit développé par Kai Dröge, qui permet de transcrire ou de sous-titrer du matériel audio et vidéo. L'outil combine plusieurs technologies open source dans une interface utilisateur graphique, afin de créer des transcriptions de qualité. Il utilise notamment Whisper (développé par OpenAI).

Les possibilités offertes par noScribe :

  • Il est possible d'identifier différents locuteurs avec S00, S01, S02, etc.
  • Les codes temporels sont ajoutés à la transcription.
  • Les mots vides, les rires et les "euh" sont ignorés, et les pauses sont marquées par "(...)".

Certains éléments d'un enregistrement peuvent donc être perdus. Cependant, ces éléments peuvent être importants pour les chercheurs. Il est donc important de vérifier les transcriptions et de corriger les éventuelles erreurs. Aucun outil de transcription automatique n'est exempt d'erreurs. La vérification et l'édition du texte peuvent se faire grâce à un traitement de texte intégré, avec la possibilité d'écouter l'audio en arrière-plan. De cette manière, vous pouvez facilement comparer la transcription avec l'enregistrement.

La transcription automatique se fait hors ligne. Aucune connexion internet n'est donc nécessaire après l'installation. L'inconvénient potentiel est que la transcription peut être lente sur des ordinateurs anciens ou peu performants. Plus l'ordinateur est puissant, plus la transcription est rapide. Sur un ordinateur portable relativement puissant, il a été possible de transcrire un enregistrement audio de 10 minutes en néerlandais avec plusieurs locuteurs en 6 minutes.

Autres inconvénients potentiels :

  • NoScribe est encore en développement au moment de la rédaction du présent document ; des bugs peuvent donc persister. Sous Windows, par exemple, le bouton Démarrer peut ne pas être visible lors de l'ouverture du programme. Heureusement, il suffit d'agrandir la fenêtre vers le bas pour rendre le bouton visible/utilisable.
  • Whisper, le système de transcription automatique en arrière-plan, peut avoir tendance à halluciner pendant les silences, parce qu'il interprète ces derniers comme du texte. Nous n'avons cependant pas encore réussi à fixer ce problème.
  • La fonction d'identification du locuteur n'est pas précise à 100 % et peut parfois noter plus de locuteurs qu'il n'y en a réellement.

Installation

NoScribe fonctionne sur Windows, macOs et Linux.

Windows

Sur Windows, vous avez deux possibilités :

  1. Si votre ordinateur est équipé d'une carte graphique dédiée (GPU) de NVIDIA avec plus de 6 Go de mémoire graphique, noScribe peut utiliser une technologie spéciale qui accélère sensiblement la transcription. Cela nécessite une procédure d'installation différente.
  2. Sinon, la transcription se fait via le processeur interne (CPU), ce qui la rend légèrement plus lente.

Pour vérifier si votre ordinateur est équipé d'une carte graphique NVIDIA distincte, ouvrez le gestionnaire des tâches en appuyant sur les touches ctrl+shift+esc et accédez au menu "Performances" (prestations).

capture d'écran pour illustrer comment vérifier si votre ordinateur dispose d'une carte graphique séparée

Recherchez un GPU de la marque NVIDIA et vérifiez si la mémoire vidéo ou VRAM est de 6 Go ou plus. Vous l'avez trouvé ? Continuez avec les instructions d'installation ici.

Votre ordinateur ne dispose pas d'une carte graphique adaptée ? Alors suivez les instructions d'installation ci-dessous.

Pour les ordinateurs sans carte NVIDIA avec plus de 6 Go de VRAM

  • Allez sur la page de téléchargement et cliquez sur le lien après The general purpose version for normal PCs without a NVIDIA graphics card. Normalement, il s'agit d'un lien "drive.switch" vers un dossier en ligne.
  • Cliquez ensuite sur le lien "noScribe_setup_0_5_1.exe". Le téléchargement devrait se lancer.

Capture d'écran de l'emplacement en ligne de noScribe pour les ordinateurs sans GPU dédié

Après le téléchargement (qui peut prendre un certain temps), vous pouvez installer noScribe comme n'importe quel autre logiciel.

  • Le démarrage de l'installation peut prendre un certain temps.
  • Lorsque vous recevez le message "Windows protected your PC", cliquez sur "Run anyway". Windows a en effet tendance à trouver les logiciels libres suspects. Dans ce cas, il s'agit d'un false positive et noScribe peut être utilisé en toute sécurité.

Pour les ordinateurs avec un GPU dédié et une VRAM d'au moins 6 Go

Suivez ce lien et cliquez sur lien après A special version using CUDA acceleration on NVIDIA graphics cards with at least 6 GB of VRAM.

  • Sur le site web, cliquez sur les deux liens "noScribe_Setup_0_5_cuda.exe" et "noScribe_setup_0_5_cuda.nsisbin" pour les télécharger.

De locatie van het installatiebestand van de CUDA ondersteunde versie van noScribe

Dit kan lang duren. Vooral het het nsisbin bestand is groot.

  • Om succesvol gebruik te maken van de aparte grafische kaart bij het transcriberen moet ook een correcte installatie van NVIDIA CUDA toolkit aanwezig zijn. Dit zorgt ervoor dat noScribe de kracht van de GPU kan benutten om het transcriptieproces te versnellen.
  • Om de juiste CUDA-versie te installeren moeten we de GPU Driver versie vinden.
  • Zoek naar Nvidia control panel, open het programma en druk op enter om het programma te openen.

Nvidia Control Panel openen

  • Klik vervolgens op Help en dan op System Information

System information menu terug vinden in Nvidia Control Panel

  • In het menu "System information" staat er onder Details een lijn Driver version:

Driver versie identificeren voor CUDA te installeren

  • Vergelijk nu het Driver nummer met deze tabel om te weten te komen welke CUDA-versie compatibel is met jouw grafische kaart.

Wanneer alle noscribe bestanden en de CUDA toolkit bestanden gedownload zijn:

  1. Installeer eerst de Nvidia CUDA toolkit.
  2. Herstart je computer
  3. Zorg dat het noScribe_setup_0_5_1.exe-bestand en de nsisbin-bestand in dezelfde map zitten.
  4. Dubbelklik het noScribe_setup_0_5_1.exe-bestand. Het kan even duren eer de setup start. Geduld.

Wanneer de installatie van noScribe is afgerond, open dan noScribe.

Résoudre les potentiels bugs

Er is een aparte bug bij deze versie van noScribe waar je potentieel tegenaan kan lopen. Gelukkig is het gemakkelijk op te lossen. Dit probleem is gemeld op de noScribe github, de ontwikkelaars zijn op de hoogte van het probleem).

  • Het startscherm van noScribe wordt soms verkeerd geschaald waardoor het scherm er zo uit ziet:

Startknop van noScribe is verstopt door de schaal van het scherm

In plaats van zo:

NoScribe zoals het er uit moet zien

  • Klik en sleep het onderste gedeelte van het noscribe venster om de startknop zichtbaar te maken.

NoScribe is nu succesvol geïnstalleerd.

Mac

Afhankelijk van het soort processor en de versie van je besturingssysteem (macOs) dien je een specifiek installatiebestand te downloaden en installatieprocedure te volgen.

  • Identificeer de processor van je computer. Klik hiervoor op het Appel-icoontje linksboven en selecteer About This Mac.

  • In het volgende menu naast "Chip" of "Processor" zou er een model moeten staan. Dat is Apple M1 of M2 of een intelprocessor.

  • Als je computer een Apple MX chip heeft, start hier met de installatieprocedure
  • Als je mac wat ouder is (ouder dan 2020) is de kans groot dat je een "Intel Processor" vermelding zal vinden.

Voor nieuwe macs met een M1, M2, M3 of M4 processer (CPU)

  • Ga naar deze map en download het installatiebestand noScribe_0.5.0b_arm64.dmg.
  • Dubbelklik op het gedownloade dmg-bestand en sleep noScribe en noScribeEdit naar de je Applicaties (met het label drag both here to install).
  • Je hebt een Apple Rosetta2 Intel Emulator nodig omdat FFmpeg, een onderdeel van noScribe om video- en audiobestanden te converteren, niet compatibel is je CPU.
  • Installeer Rosetta2 manueel:
    • Open de terminal met cmd + spatie, zoek vervolgens naar Terminal en druk op enter. Of navigeer naar de map /Applications/Utilities/ en open de Terminal.app.
    • Met de terminal open, kopieer het volgende commando softwareupdate --install-rosetta or softwareupdate --install-rosetta --agree-to-license en druk op enter om het commando uit te voeren.
    • Volg vervolgens de instructies op het scherm om de rosetta2 software van apple te installeren.
  • Open vervolgens noScribe.

Voor macs met een intel processor

  • Afhankelijk van je besturingssysteem:
    • voor macOS 14 (Sonoma) of 15 (Sequoia): Ga naar deze pagina om de correcte installer (noScribe_0.5.0b_x86_64_unsigned.dmg) te downloaden.
    • voor macOS 11 (Big Sur), 12 (Monterey) and 13 (Ventura): Open deze link en download het installatiebestand (noScribe_0.5.0_x86_64_unsigned_legacy.dmg).

Bericht van de ontwikkelaars: Helaas kunnen we het x86_64-pakket momenteel niet correct ondertekenen, dus u krijgt een waarschuwing dat noScribe en noScribeEdit van niet-geregistreerde ontwikkelaars zijn. U moet handmatig toestaan ​​dat noScribe en noScribeEdit worden uitgevoerd als uw Gatekeeper actief is.

Dit betekent dat je je computer moet geruststellen dat de software veilig genoeg is om te openen en te gebruiken.

  • Dubbelklik op het gedownloade dmg-bestand
  • Sleep noScribe en noScribeEdit naar je Applicatiesmap.
  • Dubbelklik nu op noScribe alsof je het programma zou starten.
  • Er verschijnt een error met de melding dat noScribe van een niet-geregistreerde ontwikkelaar komt
  • Ga naar Systeeminstellingen > Privacy en Beveiliging > Privacy and Security. Scroll naar beneden tot je een bericht ziet dat het starten van noScribe werd vermeden en klik op Open toch of Open anyway.
  • Doe hetzelfde voor de noScribe Editor.

Vanaf nu zouden beide programma's gewoon moeten openen als je ze opstart.

Utilisation

Open noScribe. Het kan even duren eer je een interface ziet, even geduld. Als noScribe start, check of je de blauwe Start-knop kan zien , zo niet, maak het venster wat groter naar onder toe.

De onderdelen van de noScribe interface

  1. Audio file: Klik op het blauwe mapje om je audio of video bestand te selecteren dat je wil transcriberen.Video bestanden worden automatisch geconverteerd naar .wav (zonder het originele bestand te overschrijven).
  2. Save Transcript as: Klik op het blauwe mapje om de doelmap van je transcriptie te selecteren en selecteer het formaat:
    • HTML om je transcriptie te bewerken in de ingebouwde editor;
    • TXT om je transcriptie op te slaan als een standaard tekstbestand
    • VTT om een ondertitel bestand te maken.
      Mogelijkheden als bestandsformaat
  3. Start (hh:mm:ss): Geef hier aan vanaf wanneer in het bronbestand de transcriptie moet starten, hh= uur, mm= minuten, ss= seconden.
  4. Stop (hh:mm:ss): Geef aan tot wanneer in het bronbestand de transcriptie moet uitgevoerd worden. Een transcriptie maken van enkel de eerst 5 minuten, kan in dit veld met bijvoorbeeld: "00:05:00".
  5. Language: Selecteer de gesproken taal van het bronbestand, gebruik de optie "Auto" om Whisper te laten analyseren welke taal er gesproken wordt. Er worden 100 talen ondersteund door Whisper. Niet elke taal zal een even accurate transcriptie opleveren. Voor Nederlands werkt Whisper goed.
  6. Quality: Geef aan hoe accuraat de transcriptie moet gebeuren. Precise duurt langer maar is meer accuraat. Fas gaat sneller, maar het transcript gaat meer fouten bevatten.
    Screenshot voor de kwaliteitsetting
  7. Mark pause: markeer pauzes langer dan x aantal seconden. Pauzes worden getranscribeerd als ronde haakjes met één punt per seconde ertussen, bijvoorbeeld '(..)' voor een pauze van twee seconden. Pauzes langer dan 10 seconden worden uitgeschreven als '(XX seconden pauze)' of '(XX minuten pauze)'.
    Pauzes markeren
    De opties zijn:
    • None: geen pauzes markeren;
    • 1sec+: markeert pauzes langer dan 1 seconde;
    • 2sec+: markeert pauzes langer dan 2 seconden;
    • 3sec+: markeert pauzes langer dan 3 seconden.
  8. Speaker detection: Opties om op voorhand een paar dingen in te stellen over het aantal sprekers in het bronbestand. Het op voorhand aangeven van het aantal sprekers kan het eenvoudiger maken om de sprekers te identificeren. De Auto-optie probeert het aantal sprekers te identificeren, maar is hierin niet feilloos. Je kan het aantal sprekers ook op None zetten als het identificeren van sprekers niet nodig is. Dit versnelt de transcriptietijd aanzienlijk, maar de transcriptie wordt dan één doorlopende blok tekst.
    Aantal sprekers selecteren
  9. Overlapping Speech: Geef aan of er sprekers in het bronbestand door elkaar spreken of niet. Als deze optie aan staat, probeert noScribe momenten te markeren waarin twee mensen tegelijkertijd spreken met //dubbele slashes//. Dit is een experimentele functie.
  10. "Timestamps:" Wanneer ingeschakeld, verwerkt noScribe tijdstempels in het formaat [hh:mm:ss] in de transcriptie. Hetzij bij elke wisseling van spreker of elke 60 seconden.
  11. Start: De Start- of Cance-knop wanneer er een transcriptie wordt gemaakt. Deze knop heeft de neiging om niet zichtbaar te zijn bij het starten van noScribe.
  12. Editor: De knop om de ingebouwde tekstverwerker te openen en zo nodig de transcriptie aan de hand van de audio aan te passen.
  13. Logvenster: Een venster dat informatie geeft over de versie van de software en je verwijst naar de documentatie. Hier zal ook de voortgang te zien zijn van de transcriptie.

Commencer la transcription

  • Navigeer naar een audio- of videobestand dat je wilt transcriberen. Via het Audio file:-tekstveld.

Selecteer een bestand om te transcriberen.

  • Selecteer daarna het formaat waarin je de transcriptie wil opslaan en druk op "Save" of "Opslaan".

Selecteer .html als je de transcriptie wilt bewerken in de ingebouwde tekstverwerker.

Screenshot van de opties voor het opslaan van het transcriptiebestand

  • Geef via de Start- en/of Stop-optie aan welk deel van het bronbestand je wilt transcriberen. Laat de opties voor wat ze zijn als je heel het bestand wil transcriberen.
  • Selecteer de taal als je de taal weet.
  • Kies de kwaliteit waarin je de transcriptie wil.
  • Beslis of pauzes langer dan x aantal seconden moeten worden genoteerd
  • Als je weet hoeveel sprekers er zijn in het bronbestand, geef dan het aantal aan.
  • Wanneer je denkt dat er overlappende sprekers zijn in het bronbestand en je wil dat dit genoteerd wordt, kan je dit aangeven in de Overlapping Speech:-optie.
  • Geef aan of je tijdscodes wilt zien in de transcriptie.
  • Klik vervolgens op Start.
  • De transcriptie zal nu starten. Dit kan even duren afhankelijk van hoe krachtig je computer is, hoe lang het audio- of videobestand is, hoeveel sprekers er zijn en hoe precies de transcriptie moet zijn. De vooruitgang zou zichtbaar moeten zijn in het logvenster met een progressiebar in het rood onderaan

noScribe is bezig met de transcriptie.

Transcriptie aanpassen

  • Als het automatische transcriptieproces klaar is, zie je het volgende scherm.

Het transcriptieproces is voltooid.

  • Normaalgezien gaat de editor automatisch open. Als dat niet gebeurt, klik op de grijze Editor-knop rechtsonder in het logvenster.

noscribe editor

  • In de editor kan je de transcriptie aanpassen. Het is mogelijk om ergens in de tekst te klikken en het relevante stuk audio af te spelen door op de Play/Pause Audio-knop te klikken.

Tekst aanpassen in de noScribe Editor.

  • De tekst zal worden gemarkeerd tijdens het afspelen van de audio.
  • Sla de tekst op na het bewerken.

Tekst opslaan in de noScribe Editor

Eerder gemaakte transcriptie aanpassen in de editor

Dit werkt enkel als je de eerdere transcriptie hebt opgeslagen als HTML.

  • Open de noScribe Editor. Dit is een apart stukje software. Op Mac zit dit in de Applications-folder. Op Windows zoek je naar "noScribe Editor" via het startmenu.

Open de editor.

  • In de editor: Gebruik het mapicoontje linksboven, en selecteer een eerder gemaakte transcriptie.

Een eerder gemaakt transcriptie aanpassen.

  • Het kan even duren voor een transcriptie geladen is. Dit is afhankelijk van de grootte.
  • Als het originele bronbestand niet meer op de originele plek staat, ga je de audio niet tegelijkertijd met de transcriptie kunnen afspelen. Als het bronbestand niet verplaatst is geweest zal er audio afspelen in de achtergrond als je op de Play/Pause Audio knop klikt.

Auteurs : Lode Scheers (meemoo), en collaboration avec Laurens van Hamme et Nastasia Vanderperren (meemoo)