Транскрибация аудио в текст
Преобразуйте речь на любом языке в текст прямо в браузере.
Работает полностью в браузере.
О Транскрибация аудио в текст
Загрузите аудиофайл или запишите прямо с микрофона — и получите текстовую транскрибацию на том же языке, на котором говорит оратор. Без загрузки на сервер, без аккаунта, без приложения. Handytool запускает открытую модель Whisper от OpenAI прямо в вашем браузере с использованием WebGPU, поэтому ваши подкасты, интервью, голосовые заметки, лекции и записи совещаний остаются полностью приватными. Скачайте результат как обычный текст, SRT-файл субтитров или WebVTT-файл для видеоплееров.
Транскрибация аудио в текст — возможности
- 01
99 языков с автоматическим определением
Whisper определяет язык речи и создаёт транскрибацию на этом же языке — испанский остаётся испанским, японский остаётся японским, немецкий остаётся немецким. Без выбора языка, без лишних настроек.
- 02
Загрузите файл или запишитесь со своего микрофона
Загрузите MP3, WAV, M4A, OGG, FLAC или WebM файл либо нажмите «Запись» для захвата звука прямо с микрофона. Остановитесь когда закончите — запись сразу же перейдёт в транскрибацию.
- 03
Обработка в браузере, полная приватность
Модель Whisper загружается один раз в кэш браузера и работает полностью на вашем устройстве с ускорением WebGPU. Ничего не загружается на сервер — ваше аудио никогда не покидает компьютер.
Транскрибация аудио в текст — частые вопросы
- Как транскрибировать аудиофайл?
- Загрузите свой аудиофайл (MP3, WAV, M4A, OGG, FLAC или WebM) и нажмите «Транскрибировать». При первом запуске загружается модель (~150 МБ); после этого транскрибация работает локально без интернета.
- Можно ли записывать аудио с микрофона?
- Да. Нажмите «Запись», разрешите доступ к микрофону в браузере, говорите и нажмите «Остановить». Записанное аудио обрабатывается как загруженный файл и готово для транскрибации.
- Какие языки поддерживаются?
- Все 99 языков, поддерживаемые Whisper — включая английский, испанский, мандаринский, французский, арабский, хинди, немецкий, русский, португальский, японский и многие другие. Транскрибация остаётся на языке, на котором говорилось.
- Какая максимальная длина аудио?
- Приняты файлы до 200 МБ. Длинные записи обрабатываются частями по 30 секунд с перекрытием в 5 секунд, поэтому часовой подкаст всё равно создаст связную транскрибацию. Время обработки зависит от наличия WebGPU.
- Загружается ли аудио на сервер?
- Нет. Модель и ваше аудио остаются в браузере. Модель Whisper загружается один раз с CDN и кэшируется, а затем транскрибация происходит полностью на устройстве с WebGPU или WebAssembly.
- Можно ли получить субтитры для видео?
- Да. Скачайте файл .srt или .vtt и загрузите в видеоредактор или как трек субтитров на YouTube и других платформах. Каждая строка содержит временной диапазон, определённый Whisper.
Похожие инструменты
Аудио →Откройте другие инструменты
Все инструменты →- Доступно
PDF в JPG
Конвертируйте каждую страницу PDF в острое изображение JPG, PNG или WebP прямо в браузере — без загрузки, без потерь качества.
PDFБесплатноРаботает локальноОткрыть - Доступно
Удалить фон
Сотрите фон фотографии с помощью модели ИИ, работающей в браузере — без загрузки, изображения остаются на устройстве.
ИзображениеБесплатноРаботает локальноОткрыть - Доступно
Обрезать видео
Обрежьте начало или конец видео с покадровой точностью.
ВидеоБесплатноОткрыть - Доступно
Markdown в HTML
Преобразуйте Markdown в чистый HTML.
ДокументБесплатноРаботает локальноОткрыть - Доступно
Проверка грамматики
Исправляйте орфографию, грамматику и пунктуацию в любом тексте с помощью бесплатной проверки грамматики на базе ИИ — без регистрации, ничего не сохраняется.
ИИБесплатноОткрыть