Handytool
Guide vidéo5 min de lectureMis à jour 11 févr. 2026

Transcription IA, navigateur uniquement

Transformez n'importe quelle vidéo en texte et sous-titres sans l'envoyer nulle part.

Handytool exécute le modèle Whisper d'OpenAI directement dans votre navigateur pour transcrire les fichiers MP4, MOV, WebM et MKV en texte brut, fichiers SRT et fichiers de sous-titres VTT. Votre vidéo ne quitte jamais votre appareil.

Points clés

  • 01Whisper AI s'exécute dans votre navigateur — votre vidéo n'est jamais envoyée à un serveur.
  • 02Supporte 99 langues avec détection automatique de la langue.
  • 03Exporte en texte brut, fichiers de sous-titres SRT et WebVTT pour utilisation directe dans les éditeurs et YouTube.
  • 04Après la première exécution, le modèle est mis en cache et la transcription fonctionne hors ligne.

Pourquoi transcrire une vidéo dans votre navigateur ?

Transcrire une interview, un cours, un enregistrement Zoom ou une vidéo YouTube signifiait autrefois soit la taper manuellement, soit envoyer le fichier à un service cloud. Les services cloud sont rapides mais présentent un véritable compromis en matière de confidentialité — vous envoyez de l'audio potentiellement sensible à un serveur tiers. Handytool adopte une approche différente : il télécharge une seule fois le modèle de reconnaissance vocale open-source Whisper d'OpenAI, puis l'exécute entièrement sur votre appareil en utilisant WebGPU ou WebAssembly.

Le résultat est la même transcription de qualité IA que vous obtiendriez d'un service cloud, mais votre fichier vidéo et audio restent complètement privés. Le premier lancement télécharge le modèle (environ 150 Mo), mais après cela, l'outil fonctionne entièrement hors ligne.

Comment transcrire une vidéo

Déposez un fichier vidéo et obtenez une transcription en quelques minutes.

  1. 01

    Ouvrez l'outil de transcription

    Accédez à l'outil Transcrire une vidéo sur Handytool. Aucun compte n'est nécessaire.

  2. 02

    Ajoutez votre fichier vidéo

    Déposez un fichier MP4, MOV, WebM, MKV, M4V ou AVI jusqu'à 500 Mo. L'audio est extrait localement avec FFmpeg.wasm — rien n'est envoyé.

  3. 03

    Sélectionnez une langue (facultatif)

    Whisper détecte automatiquement la langue parlée pour la plupart des enregistrements. Si votre vidéo a un accent prononcé ou est dans une langue moins courante, le choix manuel de la langue améliore la précision.

  4. 04

    Cliquez sur Transcrire

    À la première utilisation, le modèle Whisper (~150 Mo) se télécharge dans le cache de votre navigateur. Les exécutions suivantes utilisent le modèle mis en cache et fonctionnent hors ligne. La transcription traite les chunks de 30 secondes avec chevauchement pour maintenir le contexte cohérent.

  5. 05

    Téléchargez votre résultat

    Quand la transcription apparaît, téléchargez-la en texte brut, fichier de sous-titres SRT ou fichier WebVTT. Les trois sont générés à partir de la même exécution de transcription.

Ce que vous pouvez faire avec une transcription vidéo

Les transcriptions et les sous-titres déverrouillent de nombreux flux de travail en aval.

  • 01Ajoutez des sous-titres codés à vos vidéos YouTube ou Vimeo pour améliorer l'accessibilité.
  • 02Créez des notes consultables à partir de cours, webinaires ou enregistrements de formation.
  • 03Réutilisez le contenu d'une interview dans un article de blog ou un article.
  • 04Ajoutez des sous-titres brûlés dans un éditeur vidéo en utilisant le fichier SRT.
  • 05Générez un résumé ou des points d'action à partir d'un enregistrement de réunion.
  • 06Traduisez la transcription dans une autre langue après avoir téléchargé le texte.

Whisper s'exécute sur votre appareil — rien n'est transmis

Handytool utilise FFmpeg.wasm pour extraire la piste audio localement, puis la transmet à Whisper s'exécutant dans votre navigateur via WebGPU (si disponible) ou WebAssembly pur. À aucun moment, les données audio ou vidéo ne sont envoyées sur le réseau.

Cela rend l'outil adapté aux enregistrements confidentiels — interviews médicales, dépositions juridiques, réunions commerciales internes, séances de thérapie — où l'envoi à un service de transcription cloud n'est pas acceptable.

FAQ sur la transcription vidéo

Quels formats vidéo sont pris en charge ?

Conteneurs MP4, MOV, WebM, MKV, M4V et AVI jusqu'à 500 Mo. Les codecs audio courants à l'intérieur de ces conteneurs (AAC, MP3, Opus, Vorbis) fonctionnent tous.

Quelles langues peut-il transcrire ?

Les 99 langues que Whisper supporte, notamment l'anglais, l'espagnol, le mandarin, le français, l'arabe, l'hindi, l'allemand, le russe, le portugais et le japonais. La transcription reste dans la langue parlée.

Puis-je générer des sous-titres pour YouTube ?

Oui. Après la transcription, téléchargez le fichier SRT ou VTT et téléchargez-le directement dans l'éditeur de sous-titres de YouTube Studio.

Quelle est la durée maximale de la vidéo ?

Les fichiers jusqu'à 500 Mo sont acceptés. Les enregistrements longs sont divisés en chunks de 30 secondes avec chevauchement de 5 secondes, de sorte que la transcription reste cohérente sur toute la vidéo.

La vidéo est-elle envoyée à un serveur ?

Non. FFmpeg.wasm et le modèle Whisper s'exécutent localement dans votre navigateur. Rien n'est envoyé à aucun stade.

Fonctionne-t-il hors ligne ?

Après la première exécution, le modèle Whisper est mis en cache dans votre navigateur. Les transcriptions suivantes fonctionnent entièrement hors ligne — vous n'avez besoin d'une connexion Internet que la première fois.

Outils connexes

Continuer avec les outils Vidéo

outils Vidéo