Como transcrevo um arquivo de áudio?

Envie seu arquivo de áudio (MP3, WAV, M4A, OGG, FLAC ou WebM) para a ferramenta e clique em Transcrever. A primeira execução baixa o modelo de fala (~150 MB); depois, a transcrição é executada localmente sem conexão com a internet.

Posso gravar áudio com meu microfone?

Sim. Clique em Gravar voz, permita acesso ao microfone no seu navegador, fale e clique em Parar gravação. O áudio capturado é tratado como um arquivo enviado e você pode transcrevê-lo imediatamente.

Quais idiomas são suportados?

Todos os 99 idiomas que o Whisper suporta — incluindo inglês, espanhol, mandarim, francês, árabe, hindi, alemão, russo, português, japonês e muitos mais. A transcrição permanece no idioma que foi falado.

Quanto tempo o áudio pode ter?

Arquivos de até 200 MB são aceitos. Gravações longas são processadas em blocos de 30 segundos com sobreposição de 5 segundos, para que um podcast de uma hora produza uma transcrição coerente. O tempo de processamento depende se seu navegador suporta WebGPU.

O áudio é enviado para um servidor?

Não. Tanto o modelo quanto seu áudio permanecem no seu navegador. O modelo Whisper é buscado uma única vez de um CDN e armazenado em cache, depois a transcrição acontece inteiramente no dispositivo usando WebGPU ou WebAssembly.

Posso obter legendas para um vídeo?

Sim. Baixe o arquivo .srt ou .vtt e solte-o no seu editor de vídeo, ou envie-o como faixa de legenda no YouTube e em outras plataformas. Cada linha de legenda inclui o intervalo de tempo que o Whisper detectou.

ÁudioGrátisRoda localmente

Transcrever áudio em texto

Converta áudio falado em qualquer idioma para texto no seu navegador.

.mp3.wav.ogg.m4a.aac.flac.webm.opus

Idioma

Carregando modelo…

Executado inteiramente no seu navegador.

Solte um arquivo de áudio aqui

MP3 · WAV · OGG · M4A · FLAC · WebM · máx 200 MB

Primeira execução baixa ~150 MB; armazenado em cache depois.

Escolher arquivo

Sobre Transcrever áudio em texto

Envie um arquivo de áudio ou grave direto do seu microfone, e obtenha uma transcrição escrita no mesmo idioma que o falante usou — sem envio, sem conta, sem aplicativo para instalar. O Handytool executa o modelo Whisper de código aberto da OpenAI diretamente no seu navegador usando WebGPU quando disponível, para que seus podcasts, entrevistas, notas de voz, palestras e gravações de reuniões permaneçam totalmente privados. Baixe o resultado como texto plano, um arquivo de legenda SRT ou um arquivo WebVTT pronto para reprodutores de vídeo.

Recursos de Transcrever áudio em texto

01
99 idiomas, detecção automática
O Whisper detecta o idioma falado e escreve a transcrição nesse mesmo idioma — espanhol continua espanhol, japonês continua japonês, alemão continua alemão. Sem seletor de idioma, sem configurações extras.
02
Envie um arquivo ou grave ao vivo
Traga um arquivo MP3, WAV, M4A, OGG, FLAC ou WebM, ou clique em Gravar voz para capturar áudio diretamente do seu microfone. Pare quando terminar e a gravação segue direto para transcrição.
03
Processamento privado no navegador
O modelo Whisper é baixado uma única vez no cache do seu navegador e executado inteiramente no seu dispositivo com aceleração WebGPU onde suportado. Nada é enviado — seu áudio nunca sai do seu computador.

Perguntas frequentes sobre Transcrever áudio em texto

Como transcrevo um arquivo de áudio?: Envie seu arquivo de áudio (MP3, WAV, M4A, OGG, FLAC ou WebM) para a ferramenta e clique em Transcrever. A primeira execução baixa o modelo de fala (~150 MB); depois, a transcrição é executada localmente sem conexão com a internet.
Posso gravar áudio com meu microfone?: Sim. Clique em Gravar voz, permita acesso ao microfone no seu navegador, fale e clique em Parar gravação. O áudio capturado é tratado como um arquivo enviado e você pode transcrevê-lo imediatamente.
Quais idiomas são suportados?: Todos os 99 idiomas que o Whisper suporta — incluindo inglês, espanhol, mandarim, francês, árabe, hindi, alemão, russo, português, japonês e muitos mais. A transcrição permanece no idioma que foi falado.
Quanto tempo o áudio pode ter?: Arquivos de até 200 MB são aceitos. Gravações longas são processadas em blocos de 30 segundos com sobreposição de 5 segundos, para que um podcast de uma hora produza uma transcrição coerente. O tempo de processamento depende se seu navegador suporta WebGPU.
O áudio é enviado para um servidor?: Não. Tanto o modelo quanto seu áudio permanecem no seu navegador. O modelo Whisper é buscado uma única vez de um CDN e armazenado em cache, depois a transcrição acontece inteiramente no dispositivo usando WebGPU ou WebAssembly.
Posso obter legendas para um vídeo?: Sim. Baixe o arquivo .srt ou .vtt e solte-o no seu editor de vídeo, ou envie-o como faixa de legenda no YouTube e em outras plataformas. Cada linha de legenda inclui o intervalo de tempo que o Whisper detectou.

Guias

Artigos →

5 min
Guia de áudio
Como transcrever áudio para texto online
Converta notas de voz, entrevistas e gravações em texto pesquisável no seu navegador, com reconhecimento de fala no dispositivo.
Atualizado 1 de mai. de 2026Ler

Ferramentas relacionadas

Áudio →

Explore outras ferramentas

Todas as ferramentas →

Transcrever áudio em texto

Sobre Transcrever áudio em texto

Recursos de Transcrever áudio em texto

99 idiomas, detecção automática

Envie um arquivo ou grave ao vivo

Processamento privado no navegador

Perguntas frequentes sobre Transcrever áudio em texto

Guias

Como transcrever áudio para texto online

Ferramentas relacionadas

Aprimorador de voz

Isolador de voz

Cortar áudio

Explore outras ferramentas

PDF para PNG

Gerador de Foto para Visto Japão

Subtitle Burner

Visualizador JSON

Verificador de gramática