Handytool
АудіоБезкоштовноПрацює локально

Транскрибація аудіо в текст

Перетворіть мовлення будь-якою мовою в текст прямо у браузері.

.mp3.wav.ogg.m4a.aac.flac.webm.opus
Мова
Завантаження моделі…

Працює повністю в браузері.

або

Про Транскрибація аудіо в текст

Завантажте аудіофайл або запишіть прямо з мікрофона — й отримайте текстову транскрибацію тією самою мовою, якою говорить оратор. Без завантаження на сервер, без облікового запису, без додатків. Handytool запускає відкриту модель Whisper від OpenAI прямо у вашому браузері з використанням WebGPU, тому ваші подкасти, інтерв'ю, голосові нотатки, лекції та записи зустрічей залишаються повністю приватними. Завантажте результат як простий текст, SRT-файл субтитрів або WebVTT-файл для відеоплеєрів.

Транскрибація аудіо в текст — можливості

  • 01

    99 мов з автоматичним розпізнаванням

    Whisper розпізнає мову мовлення та створює транскрибацію цією ж мовою — іспанська залишається іспанською, японська залишається японською, німецька залишається німецькою. Без вибору мови, без зайвих налаштувань.

  • 02

    Завантажте файл або запишіться з мікрофона

    Завантажте MP3, WAV, M4A, OGG, FLAC або WebM файл або натисніть «Запис голосу» для захоплення звуку прямо з мікрофона. Зупиніться коли закінчите — запис одразу перейде до транскрибації.

  • 03

    Обробка в браузері, повна приватність

    Модель Whisper завантажується один раз у кеш браузера й працює повністю на вашому пристрої з прискоренням WebGPU. Нічого не завантажується на сервер — ваше аудіо ніколи не покидає комп'ютер.

Транскрибація аудіо в текст — часті запитання

Як транскрибувати аудіофайл?
Завантажте свій аудіофайл (MP3, WAV, M4A, OGG, FLAC або WebM) і натисніть «Транскрибувати». При першому запуску завантажується модель (~150 МБ); потім транскрибація працює локально без інтернету.
Чи можна записувати аудіо з мікрофона?
Так. Натисніть «Запис голосу», дозвольте доступ до мікрофона в браузері, говоріть і натисніть «Зупинити запис». Записане аудіо обробляється як завантажений файл і готово для транскрибації.
Які мови підтримуються?
Усі 99 мов, які підтримує Whisper — включаючи англійську, іспанську, мандаринську, французьку, арабську, гінді, німецьку, російську, португальську, японську й багато інших. Транскрибація залишається мовою, якою говорилося.
Яка максимальна тривалість аудіо?
Приймаються файли розміром до 200 МБ. Довгі записи обробляються частинами по 30 секунд із перекриттям 5 секунд, тому годинний подкаст все одно створить зв'язну транскрибацію. Час обробки залежить від наявності WebGPU.
Чи завантажується аудіо на сервер?
Ні. Модель і ваше аудіо залишаються в браузері. Модель Whisper завантажується один раз з CDN й кешується, а потім транскрибація відбувається повністю на пристрої з WebGPU або WebAssembly.
Чи можна отримати субтитри для відео?
Так. Завантажте файл .srt або .vtt і загрузіть у відеоредактор або як дорівку субтитрів на YouTube й інших платформах. Кожна строка містить часовий діапазон, визначений Whisper.

Пов'язані інструменти

Аудіо

Інші інструменти

Усі інструменти