Як транскрибувати аудіофайл?

Завантажте свій аудіофайл (MP3, WAV, M4A, OGG, FLAC або WebM) і натисніть «Транскрибувати». При першому запуску завантажується модель (~150 МБ); потім транскрибація працює локально без інтернету.

Чи можна записувати аудіо з мікрофона?

Так. Натисніть «Запис голосу», дозвольте доступ до мікрофона в браузері, говоріть і натисніть «Зупинити запис». Записане аудіо обробляється як завантажений файл і готово для транскрибації.

Які мови підтримуються?

Усі 99 мов, які підтримує Whisper — включаючи англійську, іспанську, мандаринську, французьку, арабську, гінді, німецьку, російську, португальську, японську й багато інших. Транскрибація залишається мовою, якою говорилося.

Яка максимальна тривалість аудіо?

Приймаються файли розміром до 200 МБ. Довгі записи обробляються частинами по 30 секунд із перекриттям 5 секунд, тому годинний подкаст все одно створить зв'язну транскрибацію. Час обробки залежить від наявності WebGPU.

Чи завантажується аудіо на сервер?

Ні. Модель і ваше аудіо залишаються в браузері. Модель Whisper завантажується один раз з CDN й кешується, а потім транскрибація відбувається повністю на пристрої з WebGPU або WebAssembly.

Чи можна отримати субтитри для відео?

Так. Завантажте файл .srt або .vtt і загрузіть у відеоредактор або як дорівку субтитрів на YouTube й інших платформах. Кожна строка містить часовий діапазон, визначений Whisper.

АудіоБезкоштовноПрацює локально

Транскрибація аудіо в текст

Перетворіть мовлення будь-якою мовою в текст прямо у браузері.

.mp3.wav.ogg.m4a.aac.flac.webm.opus

Мова

Завантаження моделі…

Працює повністю в браузері.

Перетягніть аудіофайл сюди

MP3 · WAV · OGG · M4A · FLAC · WebM · максимум 200 МБ

При першому запуску завантажується ~150 МБ; потім кешується.

Вибрати файл

або

Про Транскрибація аудіо в текст

Завантажте аудіофайл або запишіть прямо з мікрофона — й отримайте текстову транскрибацію тією самою мовою, якою говорить оратор. Без завантаження на сервер, без облікового запису, без додатків. Handytool запускає відкриту модель Whisper від OpenAI прямо у вашому браузері з використанням WebGPU, тому ваші подкасти, інтерв'ю, голосові нотатки, лекції та записи зустрічей залишаються повністю приватними. Завантажте результат як простий текст, SRT-файл субтитрів або WebVTT-файл для відеоплеєрів.

Транскрибація аудіо в текст — можливості

01
99 мов з автоматичним розпізнаванням
Whisper розпізнає мову мовлення та створює транскрибацію цією ж мовою — іспанська залишається іспанською, японська залишається японською, німецька залишається німецькою. Без вибору мови, без зайвих налаштувань.
02
Завантажте файл або запишіться з мікрофона
Завантажте MP3, WAV, M4A, OGG, FLAC або WebM файл або натисніть «Запис голосу» для захоплення звуку прямо з мікрофона. Зупиніться коли закінчите — запис одразу перейде до транскрибації.
03
Обробка в браузері, повна приватність
Модель Whisper завантажується один раз у кеш браузера й працює повністю на вашому пристрої з прискоренням WebGPU. Нічого не завантажується на сервер — ваше аудіо ніколи не покидає комп'ютер.

Транскрибація аудіо в текст — часті запитання

Як транскрибувати аудіофайл?: Завантажте свій аудіофайл (MP3, WAV, M4A, OGG, FLAC або WebM) і натисніть «Транскрибувати». При першому запуску завантажується модель (~150 МБ); потім транскрибація працює локально без інтернету.
Чи можна записувати аудіо з мікрофона?: Так. Натисніть «Запис голосу», дозвольте доступ до мікрофона в браузері, говоріть і натисніть «Зупинити запис». Записане аудіо обробляється як завантажений файл і готово для транскрибації.
Які мови підтримуються?: Усі 99 мов, які підтримує Whisper — включаючи англійську, іспанську, мандаринську, французьку, арабську, гінді, німецьку, російську, португальську, японську й багато інших. Транскрибація залишається мовою, якою говорилося.
Яка максимальна тривалість аудіо?: Приймаються файли розміром до 200 МБ. Довгі записи обробляються частинами по 30 секунд із перекриттям 5 секунд, тому годинний подкаст все одно створить зв'язну транскрибацію. Час обробки залежить від наявності WebGPU.
Чи завантажується аудіо на сервер?: Ні. Модель і ваше аудіо залишаються в браузері. Модель Whisper завантажується один раз з CDN й кешується, а потім транскрибація відбувається повністю на пристрої з WebGPU або WebAssembly.
Чи можна отримати субтитри для відео?: Так. Завантажте файл .srt або .vtt і загрузіть у відеоредактор або як дорівку субтитрів на YouTube й інших платформах. Кожна строка містить часовий діапазон, визначений Whisper.

Керівництва

Статті →

5 хв
Посібник з аудіо
Як транскрибувати аудіо в текст онлайн
Перетворіть голосові заметки, інтерв'ю та записи в доступний для пошуку текст у браузері з локальним розпізнаванням мовлення.
Оновлено 1 трав. 2026 р.Читати

Пов'язані інструменти

Аудіо →

Інші інструменти

Усі інструменти →

Транскрибація аудіо в текст

Про Транскрибація аудіо в текст

Транскрибація аудіо в текст — можливості

99 мов з автоматичним розпізнаванням

Завантажте файл або запишіться з мікрофона

Обробка в браузері, повна приватність

Транскрибація аудіо в текст — часті запитання

Керівництва

Як транскрибувати аудіо в текст онлайн

Пов'язані інструменти

Поліпшувач голосу

Ізолятор голосу

Обрізати аудіо

Інші інструменти

PDF to PNG

Генератор фото для візи в Японію

Вшити субтитри у відео

Переглядач JSON

Перевірка граматики