Транскрибація аудіо в текст
Перетворіть мовлення будь-якою мовою в текст прямо у браузері.
Працює повністю в браузері.
Про Транскрибація аудіо в текст
Завантажте аудіофайл або запишіть прямо з мікрофона — й отримайте текстову транскрибацію тією самою мовою, якою говорить оратор. Без завантаження на сервер, без облікового запису, без додатків. Handytool запускає відкриту модель Whisper від OpenAI прямо у вашому браузері з використанням WebGPU, тому ваші подкасти, інтерв'ю, голосові нотатки, лекції та записи зустрічей залишаються повністю приватними. Завантажте результат як простий текст, SRT-файл субтитрів або WebVTT-файл для відеоплеєрів.
Транскрибація аудіо в текст — можливості
- 01
99 мов з автоматичним розпізнаванням
Whisper розпізнає мову мовлення та створює транскрибацію цією ж мовою — іспанська залишається іспанською, японська залишається японською, німецька залишається німецькою. Без вибору мови, без зайвих налаштувань.
- 02
Завантажте файл або запишіться з мікрофона
Завантажте MP3, WAV, M4A, OGG, FLAC або WebM файл або натисніть «Запис голосу» для захоплення звуку прямо з мікрофона. Зупиніться коли закінчите — запис одразу перейде до транскрибації.
- 03
Обробка в браузері, повна приватність
Модель Whisper завантажується один раз у кеш браузера й працює повністю на вашому пристрої з прискоренням WebGPU. Нічого не завантажується на сервер — ваше аудіо ніколи не покидає комп'ютер.
Транскрибація аудіо в текст — часті запитання
- Як транскрибувати аудіофайл?
- Завантажте свій аудіофайл (MP3, WAV, M4A, OGG, FLAC або WebM) і натисніть «Транскрибувати». При першому запуску завантажується модель (~150 МБ); потім транскрибація працює локально без інтернету.
- Чи можна записувати аудіо з мікрофона?
- Так. Натисніть «Запис голосу», дозвольте доступ до мікрофона в браузері, говоріть і натисніть «Зупинити запис». Записане аудіо обробляється як завантажений файл і готово для транскрибації.
- Які мови підтримуються?
- Усі 99 мов, які підтримує Whisper — включаючи англійську, іспанську, мандаринську, французьку, арабську, гінді, німецьку, російську, португальську, японську й багато інших. Транскрибація залишається мовою, якою говорилося.
- Яка максимальна тривалість аудіо?
- Приймаються файли розміром до 200 МБ. Довгі записи обробляються частинами по 30 секунд із перекриттям 5 секунд, тому годинний подкаст все одно створить зв'язну транскрибацію. Час обробки залежить від наявності WebGPU.
- Чи завантажується аудіо на сервер?
- Ні. Модель і ваше аудіо залишаються в браузері. Модель Whisper завантажується один раз з CDN й кешується, а потім транскрибація відбувається повністю на пристрої з WebGPU або WebAssembly.
- Чи можна отримати субтитри для відео?
- Так. Завантажте файл .srt або .vtt і загрузіть у відеоредактор або як дорівку субтитрів на YouTube й інших платформах. Кожна строка містить часовий діапазон, визначений Whisper.
Пов'язані інструменти
Аудіо →Інші інструменти
Усі інструменти →- Доступно
PDF у JPG
Конвертуйте кожну сторінку PDF на чітке JPG, PNG або WebP зображення прямо у браузері — без завантаження, без втрати якості.
PDFБезкоштовноПрацює локальноВідкрити - Доступно
Видалити тло
Зітрете тло фотографії, використовуючи модель ШІ, що працює в браузері — без завантаження, зображення залишаються на пристрої.
ЗображенняБезкоштовноПрацює локальноВідкрити - Доступно
Обрізати відео
Обріжте початок або кінець відео з покадровою точністю.
ВідеоБезкоштовноВідкрити - Доступно
Markdown у HTML
Перетворіть Markdown на чистий HTML.
ДокументБезкоштовноПрацює локальноВідкрити - Доступно
Перевірка граматики
Виправляйте орфографію, граматику та пунктуацію в будь-якому тексті за допомогою безплатної перевірки граматики на базі ШІ — без реєстрації, нічого не зберігається.
ШІБезкоштовноВідкрити