Handytool
ÁudioGrátisRoda localmente

Transcrever áudio em texto

Converta áudio falado em qualquer idioma para texto no seu navegador.

.mp3.wav.ogg.m4a.aac.flac.webm.opus
Idioma
Carregando modelo…

Executado inteiramente no seu navegador.

ou

Sobre Transcrever áudio em texto

Envie um arquivo de áudio ou grave direto do seu microfone, e obtenha uma transcrição escrita no mesmo idioma que o falante usou — sem envio, sem conta, sem aplicativo para instalar. O Handytool executa o modelo Whisper de código aberto da OpenAI diretamente no seu navegador usando WebGPU quando disponível, para que seus podcasts, entrevistas, notas de voz, palestras e gravações de reuniões permaneçam totalmente privados. Baixe o resultado como texto plano, um arquivo de legenda SRT ou um arquivo WebVTT pronto para reprodutores de vídeo.

Recursos de Transcrever áudio em texto

  • 01

    99 idiomas, detecção automática

    O Whisper detecta o idioma falado e escreve a transcrição nesse mesmo idioma — espanhol continua espanhol, japonês continua japonês, alemão continua alemão. Sem seletor de idioma, sem configurações extras.

  • 02

    Envie um arquivo ou grave ao vivo

    Traga um arquivo MP3, WAV, M4A, OGG, FLAC ou WebM, ou clique em Gravar voz para capturar áudio diretamente do seu microfone. Pare quando terminar e a gravação segue direto para transcrição.

  • 03

    Processamento privado no navegador

    O modelo Whisper é baixado uma única vez no cache do seu navegador e executado inteiramente no seu dispositivo com aceleração WebGPU onde suportado. Nada é enviado — seu áudio nunca sai do seu computador.

Perguntas frequentes sobre Transcrever áudio em texto

Como transcrevo um arquivo de áudio?
Envie seu arquivo de áudio (MP3, WAV, M4A, OGG, FLAC ou WebM) para a ferramenta e clique em Transcrever. A primeira execução baixa o modelo de fala (~150 MB); depois, a transcrição é executada localmente sem conexão com a internet.
Posso gravar áudio com meu microfone?
Sim. Clique em Gravar voz, permita acesso ao microfone no seu navegador, fale e clique em Parar gravação. O áudio capturado é tratado como um arquivo enviado e você pode transcrevê-lo imediatamente.
Quais idiomas são suportados?
Todos os 99 idiomas que o Whisper suporta — incluindo inglês, espanhol, mandarim, francês, árabe, hindi, alemão, russo, português, japonês e muitos mais. A transcrição permanece no idioma que foi falado.
Quanto tempo o áudio pode ter?
Arquivos de até 200 MB são aceitos. Gravações longas são processadas em blocos de 30 segundos com sobreposição de 5 segundos, para que um podcast de uma hora produza uma transcrição coerente. O tempo de processamento depende se seu navegador suporta WebGPU.
O áudio é enviado para um servidor?
Não. Tanto o modelo quanto seu áudio permanecem no seu navegador. O modelo Whisper é buscado uma única vez de um CDN e armazenado em cache, depois a transcrição acontece inteiramente no dispositivo usando WebGPU ou WebAssembly.
Posso obter legendas para um vídeo?
Sim. Baixe o arquivo .srt ou .vtt e solte-o no seu editor de vídeo, ou envie-o como faixa de legenda no YouTube e em outras plataformas. Cada linha de legenda inclui o intervalo de tempo que o Whisper detectou.

Ferramentas relacionadas

Áudio

Explore outras ferramentas

Todas as ferramentas