Как транскрибировать аудиофайл?

Загрузите свой аудиофайл (MP3, WAV, M4A, OGG, FLAC или WebM) и нажмите «Транскрибировать». При первом запуске загружается модель (~150 МБ); после этого транскрибация работает локально без интернета.

Можно ли записывать аудио с микрофона?

Да. Нажмите «Запись», разрешите доступ к микрофону в браузере, говорите и нажмите «Остановить». Записанное аудио обрабатывается как загруженный файл и готово для транскрибации.

Какие языки поддерживаются?

Все 99 языков, поддерживаемые Whisper — включая английский, испанский, мандаринский, французский, арабский, хинди, немецкий, русский, португальский, японский и многие другие. Транскрибация остаётся на языке, на котором говорилось.

Какая максимальная длина аудио?

Приняты файлы до 200 МБ. Длинные записи обрабатываются частями по 30 секунд с перекрытием в 5 секунд, поэтому часовой подкаст всё равно создаст связную транскрибацию. Время обработки зависит от наличия WebGPU.

Загружается ли аудио на сервер?

Нет. Модель и ваше аудио остаются в браузере. Модель Whisper загружается один раз с CDN и кэшируется, а затем транскрибация происходит полностью на устройстве с WebGPU или WebAssembly.

Можно ли получить субтитры для видео?

Да. Скачайте файл .srt или .vtt и загрузите в видеоредактор или как трек субтитров на YouTube и других платформах. Каждая строка содержит временной диапазон, определённый Whisper.

АудиоБесплатноРаботает локально

Транскрибация аудио в текст

Преобразуйте речь на любом языке в текст прямо в браузере.

.mp3.wav.ogg.m4a.aac.flac.webm.opus

Язык

Загрузка модели…

Работает полностью в браузере.

Перетащите аудиофайл сюда

MP3 · WAV · OGG · M4A · FLAC · WebM · максимум 200 МБ

При первом запуске загружается ~150 МБ; затем кэшируется.

Выбрать файл

или

О Транскрибация аудио в текст

Загрузите аудиофайл или запишите прямо с микрофона — и получите текстовую транскрибацию на том же языке, на котором говорит оратор. Без загрузки на сервер, без аккаунта, без приложения. Handytool запускает открытую модель Whisper от OpenAI прямо в вашем браузере с использованием WebGPU, поэтому ваши подкасты, интервью, голосовые заметки, лекции и записи совещаний остаются полностью приватными. Скачайте результат как обычный текст, SRT-файл субтитров или WebVTT-файл для видеоплееров.

Транскрибация аудио в текст — возможности

01
99 языков с автоматическим определением
Whisper определяет язык речи и создаёт транскрибацию на этом же языке — испанский остаётся испанским, японский остаётся японским, немецкий остаётся немецким. Без выбора языка, без лишних настроек.
02
Загрузите файл или запишитесь со своего микрофона
Загрузите MP3, WAV, M4A, OGG, FLAC или WebM файл либо нажмите «Запись» для захвата звука прямо с микрофона. Остановитесь когда закончите — запись сразу же перейдёт в транскрибацию.
03
Обработка в браузере, полная приватность
Модель Whisper загружается один раз в кэш браузера и работает полностью на вашем устройстве с ускорением WebGPU. Ничего не загружается на сервер — ваше аудио никогда не покидает компьютер.

Транскрибация аудио в текст — частые вопросы

Как транскрибировать аудиофайл?: Загрузите свой аудиофайл (MP3, WAV, M4A, OGG, FLAC или WebM) и нажмите «Транскрибировать». При первом запуске загружается модель (~150 МБ); после этого транскрибация работает локально без интернета.
Можно ли записывать аудио с микрофона?: Да. Нажмите «Запись», разрешите доступ к микрофону в браузере, говорите и нажмите «Остановить». Записанное аудио обрабатывается как загруженный файл и готово для транскрибации.
Какие языки поддерживаются?: Все 99 языков, поддерживаемые Whisper — включая английский, испанский, мандаринский, французский, арабский, хинди, немецкий, русский, португальский, японский и многие другие. Транскрибация остаётся на языке, на котором говорилось.
Какая максимальная длина аудио?: Приняты файлы до 200 МБ. Длинные записи обрабатываются частями по 30 секунд с перекрытием в 5 секунд, поэтому часовой подкаст всё равно создаст связную транскрибацию. Время обработки зависит от наличия WebGPU.
Загружается ли аудио на сервер?: Нет. Модель и ваше аудио остаются в браузере. Модель Whisper загружается один раз с CDN и кэшируется, а затем транскрибация происходит полностью на устройстве с WebGPU или WebAssembly.
Можно ли получить субтитры для видео?: Да. Скачайте файл .srt или .vtt и загрузите в видеоредактор или как трек субтитров на YouTube и других платформах. Каждая строка содержит временной диапазон, определённый Whisper.

Руководства

Статьи →

5 мин
Справочник по аудио
Как транскрибировать аудио в текст онлайн
Превратите голосовые заметки, интервью и записи в доступный для поиска текст в браузере с локальным распознаванием речи.
Обновлено 1 мая 2026 г.Читать

Откройте другие инструменты

Все инструменты →

Транскрибация аудио в текст

О Транскрибация аудио в текст

Транскрибация аудио в текст — возможности

99 языков с автоматическим определением

Загрузите файл или запишитесь со своего микрофона

Обработка в браузере, полная приватность

Транскрибация аудио в текст — частые вопросы

Руководства

Как транскрибировать аудио в текст онлайн

Похожие инструменты

Улучшитель голоса

Изолятор голоса

Обрезать аудио

Откройте другие инструменты

PDF to PNG

Генератор фото для визы в Японию

Вшить субтитры в видео

Просмотр JSON

Проверка грамматики