Transcrever áudio em texto
Converta áudio falado em qualquer idioma para texto no seu navegador.
Executado inteiramente no seu navegador.
Sobre Transcrever áudio em texto
Envie um arquivo de áudio ou grave direto do seu microfone, e obtenha uma transcrição escrita no mesmo idioma que o falante usou — sem envio, sem conta, sem aplicativo para instalar. O Handytool executa o modelo Whisper de código aberto da OpenAI diretamente no seu navegador usando WebGPU quando disponível, para que seus podcasts, entrevistas, notas de voz, palestras e gravações de reuniões permaneçam totalmente privados. Baixe o resultado como texto plano, um arquivo de legenda SRT ou um arquivo WebVTT pronto para reprodutores de vídeo.
Recursos de Transcrever áudio em texto
- 01
99 idiomas, detecção automática
O Whisper detecta o idioma falado e escreve a transcrição nesse mesmo idioma — espanhol continua espanhol, japonês continua japonês, alemão continua alemão. Sem seletor de idioma, sem configurações extras.
- 02
Envie um arquivo ou grave ao vivo
Traga um arquivo MP3, WAV, M4A, OGG, FLAC ou WebM, ou clique em Gravar voz para capturar áudio diretamente do seu microfone. Pare quando terminar e a gravação segue direto para transcrição.
- 03
Processamento privado no navegador
O modelo Whisper é baixado uma única vez no cache do seu navegador e executado inteiramente no seu dispositivo com aceleração WebGPU onde suportado. Nada é enviado — seu áudio nunca sai do seu computador.
Perguntas frequentes sobre Transcrever áudio em texto
- Como transcrevo um arquivo de áudio?
- Envie seu arquivo de áudio (MP3, WAV, M4A, OGG, FLAC ou WebM) para a ferramenta e clique em Transcrever. A primeira execução baixa o modelo de fala (~150 MB); depois, a transcrição é executada localmente sem conexão com a internet.
- Posso gravar áudio com meu microfone?
- Sim. Clique em Gravar voz, permita acesso ao microfone no seu navegador, fale e clique em Parar gravação. O áudio capturado é tratado como um arquivo enviado e você pode transcrevê-lo imediatamente.
- Quais idiomas são suportados?
- Todos os 99 idiomas que o Whisper suporta — incluindo inglês, espanhol, mandarim, francês, árabe, hindi, alemão, russo, português, japonês e muitos mais. A transcrição permanece no idioma que foi falado.
- Quanto tempo o áudio pode ter?
- Arquivos de até 200 MB são aceitos. Gravações longas são processadas em blocos de 30 segundos com sobreposição de 5 segundos, para que um podcast de uma hora produza uma transcrição coerente. O tempo de processamento depende se seu navegador suporta WebGPU.
- O áudio é enviado para um servidor?
- Não. Tanto o modelo quanto seu áudio permanecem no seu navegador. O modelo Whisper é buscado uma única vez de um CDN e armazenado em cache, depois a transcrição acontece inteiramente no dispositivo usando WebGPU ou WebAssembly.
- Posso obter legendas para um vídeo?
- Sim. Baixe o arquivo .srt ou .vtt e solte-o no seu editor de vídeo, ou envie-o como faixa de legenda no YouTube e em outras plataformas. Cada linha de legenda inclui o intervalo de tempo que o Whisper detectou.
Ferramentas relacionadas
Áudio →Explore outras ferramentas
Todas as ferramentas →- Ativo
PDF para JPG
Converta cada página de um PDF em uma imagem JPG, PNG ou WebP nítida diretamente no seu navegador — sem upload, sem perda de qualidade.
PDFGrátisRoda localmenteAbrir - Ativo
Remover fundo
Apague o fundo de uma foto usando um modelo que roda no navegador.
ImagemGrátisRoda localmenteAbrir - Ativo
Cortar vídeo
Corte o início ou o fim de um vídeo com precisão de quadro.
VídeoGrátisAbrir - Ativo
Markdown para HTML
Converta Markdown em HTML limpo diretamente no seu navegador.
DocumentoGrátisRoda localmenteAbrir - Ativo
Verificador de gramática
Corrija ortografia, gramática e pontuação em qualquer bloco de texto com um verificador de gramática gratuito com IA — sem inscrição, nada armazenado.
IAGrátisAbrir