Pontos-chave
- 01Whisper AI executa dentro do seu navegador — seu vídeo nunca é enviado para nenhum servidor.
- 02Suporta 99 idiomas com detecção automática de idioma.
- 03Exporta texto simples, arquivos de legenda SRT e WebVTT para uso direto em editores e YouTube.
- 04Após a primeira execução, o modelo fica em cache e a transcrição funciona offline.
Por Que Transcrever Vídeo no Seu Navegador?
Transcrever uma entrevista, palestra, gravação do Zoom ou vídeo do YouTube costumava significar digitá-lo manualmente ou enviar o arquivo para um serviço em nuvem. Os serviços em nuvem são rápidos, mas têm um custo real de privacidade — você está enviando áudio potencialmente sensível para um servidor de terceiros. Handytool adota uma abordagem diferente: baixa o modelo de fala Whisper de código aberto da OpenAI uma vez e depois o executa inteiramente no seu dispositivo usando WebGPU ou WebAssembly.
O resultado é a mesma transcrição de qualidade de IA que você obteria de um serviço em nuvem, mas seu arquivo de vídeo e áudio permanecem completamente privados. A primeira execução baixa o modelo (cerca de 150 MB), mas depois disso, a ferramenta funciona inteiramente offline.
Como Transcrever um Vídeo
Solte um arquivo de vídeo e obtenha uma transcrição em minutos.
- 01
Abra a ferramenta de transcrição
Acesse a ferramenta Transcrever Vídeo no Handytool. Nenhuma conta é necessária.
- 02
Adicione seu arquivo de vídeo
Solte um arquivo MP4, MOV, WebM, MKV, M4V ou AVI de até 500 MB. O áudio é extraído localmente com FFmpeg.wasm — nada é enviado.
- 03
Selecione um idioma (opcional)
Whisper detecta automaticamente o idioma falado na maioria das gravações. Se seu vídeo tiver sotaque forte ou estiver em um idioma menos comum, escolher manualmente o idioma melhora a precisão.
- 04
Clique em Transcrever
Na primeira utilização, o modelo Whisper (~150 MB) é baixado para o cache do seu navegador. As execuções subsequentes usam o modelo em cache e funcionam offline. A transcrição processa em trechos de 30 segundos com sobreposição para manter o contexto coerente.
- 05
Baixe seu resultado
Quando a transcrição aparecer, baixe-a como texto simples, arquivo de legenda SRT ou arquivo WebVTT. Os três são gerados a partir da mesma execução de transcrição.
O Que Você Pode Fazer Com uma Transcrição de Vídeo
Transcrições e legendas desbloqueiam muitos fluxos de trabalho subsequentes.
- 01Adicione legendas ocultas a vídeos do YouTube ou Vimeo para melhorar a acessibilidade.
- 02Crie notas pesquisáveis a partir de palestras, webinários ou gravações de treinamento.
- 03Reutilize material de entrevista em um post de blog ou artigo.
- 04Adicione legendas queimadas em um editor de vídeo usando o arquivo SRT.
- 05Gere um resumo ou itens de ação a partir de uma gravação de reunião.
- 06Traduza a transcrição para outro idioma após baixar o arquivo de texto.
Whisper Executa no Seu Dispositivo — Nada É Transmitido
Handytool usa FFmpeg.wasm para extrair a faixa de áudio localmente, depois a passa para Whisper em execução no seu navegador via WebGPU (quando disponível) ou WebAssembly puro. Em nenhum momento dados de áudio ou vídeo são enviados pela rede.
Isso torna a ferramenta adequada para gravações confidenciais — entrevistas médicas, deposições legais, reuniões comerciais internas, sessões de terapia — onde o upload para um serviço de transcrição em nuvem não é aceitável.
Perguntas Frequentes Sobre Transcrição de Vídeo
Quais formatos de vídeo são suportados?
Contêineres MP4, MOV, WebM, MKV, M4V e AVI de até 500 MB. Codecs de áudio comuns dentro desses contêineres (AAC, MP3, Opus, Vorbis) funcionam todos.
Quais idiomas ele pode transcrever?
Todos os 99 idiomas que o Whisper suporta, incluindo português, inglês, espanhol, mandarim, francês, árabe, hindi, alemão, russo e japonês. A transcrição permanece no idioma falado.
Posso gerar legendas para o YouTube?
Sim. Após transcrever, baixe o arquivo SRT ou VTT e envie-o diretamente no editor de legendas do YouTube Studio.
Qual é o comprimento máximo do vídeo?
Arquivos de até 500 MB são aceitos. Gravações longas são divididas em trechos de 30 segundos com sobreposição de 5 segundos, para que a transcrição permaneça coerente em todo o vídeo.
O vídeo é enviado para um servidor?
Não. Tanto FFmpeg.wasm quanto o modelo Whisper executam localmente no seu navegador. Nada é enviado em nenhum estágio.
Funciona offline?
Após a primeira execução, o modelo Whisper fica em cache no seu navegador. Transcrições subsequentes funcionam totalmente offline — você só precisa de conexão com a internet na primeira vez.