Handytool
АудиоБесплатноРаботает локально

Транскрибация аудио в текст

Преобразуйте речь на любом языке в текст прямо в браузере.

.mp3.wav.ogg.m4a.aac.flac.webm.opus
Язык
Загрузка модели…

Работает полностью в браузере.

или

О Транскрибация аудио в текст

Загрузите аудиофайл или запишите прямо с микрофона — и получите текстовую транскрибацию на том же языке, на котором говорит оратор. Без загрузки на сервер, без аккаунта, без приложения. Handytool запускает открытую модель Whisper от OpenAI прямо в вашем браузере с использованием WebGPU, поэтому ваши подкасты, интервью, голосовые заметки, лекции и записи совещаний остаются полностью приватными. Скачайте результат как обычный текст, SRT-файл субтитров или WebVTT-файл для видеоплееров.

Транскрибация аудио в текст — возможности

  • 01

    99 языков с автоматическим определением

    Whisper определяет язык речи и создаёт транскрибацию на этом же языке — испанский остаётся испанским, японский остаётся японским, немецкий остаётся немецким. Без выбора языка, без лишних настроек.

  • 02

    Загрузите файл или запишитесь со своего микрофона

    Загрузите MP3, WAV, M4A, OGG, FLAC или WebM файл либо нажмите «Запись» для захвата звука прямо с микрофона. Остановитесь когда закончите — запись сразу же перейдёт в транскрибацию.

  • 03

    Обработка в браузере, полная приватность

    Модель Whisper загружается один раз в кэш браузера и работает полностью на вашем устройстве с ускорением WebGPU. Ничего не загружается на сервер — ваше аудио никогда не покидает компьютер.

Транскрибация аудио в текст — частые вопросы

Как транскрибировать аудиофайл?
Загрузите свой аудиофайл (MP3, WAV, M4A, OGG, FLAC или WebM) и нажмите «Транскрибировать». При первом запуске загружается модель (~150 МБ); после этого транскрибация работает локально без интернета.
Можно ли записывать аудио с микрофона?
Да. Нажмите «Запись», разрешите доступ к микрофону в браузере, говорите и нажмите «Остановить». Записанное аудио обрабатывается как загруженный файл и готово для транскрибации.
Какие языки поддерживаются?
Все 99 языков, поддерживаемые Whisper — включая английский, испанский, мандаринский, французский, арабский, хинди, немецкий, русский, португальский, японский и многие другие. Транскрибация остаётся на языке, на котором говорилось.
Какая максимальная длина аудио?
Приняты файлы до 200 МБ. Длинные записи обрабатываются частями по 30 секунд с перекрытием в 5 секунд, поэтому часовой подкаст всё равно создаст связную транскрибацию. Время обработки зависит от наличия WebGPU.
Загружается ли аудио на сервер?
Нет. Модель и ваше аудио остаются в браузере. Модель Whisper загружается один раз с CDN и кэшируется, а затем транскрибация происходит полностью на устройстве с WebGPU или WebAssembly.
Можно ли получить субтитры для видео?
Да. Скачайте файл .srt или .vtt и загрузите в видеоредактор или как трек субтитров на YouTube и других платформах. Каждая строка содержит временной диапазон, определённый Whisper.

Похожие инструменты

Аудио

Откройте другие инструменты

Все инструменты