Ключові моменти
- 01Whisper AI запускається всередину вашого браузера — ваше відео ніколи не завантажується на жоден сервер.
- 02Підтримує 99 мов з автоматичним виявленням мови.
- 03Виводить звичайний текст, файли субтитрів SRT та WebVTT для прямого використання в редакторах та YouTube.
- 04Після першого запуску модель кешується і транскрибування працює в режимі офлайн.
Чому транскрибувати відео у вашому браузері?
Транскрибування інтерв'ю, лекції, запису Zoom або відео YouTube раніше означало або набирання його вручну, або надсилання файлу до хмарного сервісу. Хмарні сервіси швидкі, але мають реальний компроміс конфіденційності — ви завантажуєте потенційно чутливе аудіо на сервер третьої сторони. Handytool бере інший підхід: він завантажує модель відкритого коду Whisper компанії OpenAI один раз, а потім запускає її повністю на вашому пристрої за допомогою WebGPU або WebAssembly.
Результат — така ж AI-якісна транскрипція, яку ви отримали б від хмарного сервісу, але ваш файл відео та аудіо залишаються повністю приватними. Перший запуск завантажує модель (близько 150 МБ), але після цього інструмент працює повністю в режимі офлайн.
Як транскрибувати відео
Кидьте файл відео і отримайте транскрипцію за кілька хвилин.
- 01
Відкрийте інструмент транскрибування
Перейдіть до інструменту Transcribe Video на Handytool. Акаунт не потрібен.
- 02
Додайте ваш файл відео
Кидьте файл MP4, MOV, WebM, MKV, M4V або AVI розміром до 500 МБ. Аудіо вилучається локально за допомогою FFmpeg.wasm — ніщо не завантажується.
- 03
Виберіть мову (опціонально)
Whisper автоматично виявляє говірну мову для більшості записів. Якщо ваше відео має важкий акцент або записано малополаголою мовою, ручний вибір мови покращує точність.
- 04
Натисніть Транскрибувати
При першому використанні модель Whisper (~150 МБ) завантажується в кеш вашого браузера. Подальші запуски використовують кешовану модель та працюють в режимі офлайн. Транскрибування обробляється в блоків по 30 секунд з перекриттям для збереження узгодженості контексту.
- 05
Завантажте ваш результат
Коли з'являється транскрипція, завантажте її як звичайний текст, файл субтитрів SRT або файл WebVTT. Усі три створюються з одного запуску транскрибування.
Що ви можете зробити з транскрипцією відео
Транскрипції та субтитри розблоковують багато подальших робочих процесів.
- 01Додайте закриті субтитри до YouTube або Vimeo відео для підвищення доступності.
- 02Створіть можливість пошуку нотатки з лекцій, вебінарів або навчальних записів.
- 03Переробіть матеріал інтерв'ю в статтю або статтю блогу.
- 04Додайте прожпалені субтитри у редакторі відео за допомогою файлу SRT.
- 05Генеруйте резюме або елементи дій з запису зустрічі.
- 06Перекладіть транскрипцію іншою мовою після завантаження тексту.
Whisper запускається на вашому пристрої — ніщо не передається
Handytool використовує FFmpeg.wasm для локального вилучення аудіо доріжки, потім передає його Whisper, запущеному у вашому браузері через WebGPU (де доступно) або чистий WebAssembly. Жодні дані аудіо або відео не надсилаються мережею в жоден момент.
Це робить інструмент придатним для конфіденційних записів — медичні інтерв'ю, юридичні показання, внутрішні ділові зустрічі, сеанси терапії — де завантаження до хмарного сервісу транскрибування неприпустимо.
FAQ транскрибування відео
Які формати відео підтримуються?
Контейнери MP4, MOV, WebM, MKV, M4V та AVI розміром до 500 МБ. Поширені аудіокодеки всередину цих контейнерів (AAC, MP3, Opus, Vorbis) всі працюють.
Які мови він може транскрибувати?
Усі 99 мов, які підтримує Whisper, включаючи англійську, іспанську, мандарин, французьку, арабську, гінді, німецьку, російську, португальську та японську. Транскрипція залишається в говірній мові.
Чи можу я генерувати субтитри для YouTube?
Так. Після транскрибування завантажте файл SRT або VTT та завантажте його прямо в редактор підписів YouTube Studio.
Як довгим може бути відео?
Приймаються файли розміром до 500 МБ. Довгі записи розділяються на блоки по 30 секунд з перекриттям 5 секунд, тому транскрипція залишається узгодженою у всьому відео.
Чи видео завантажується на сервер?
Ні. Як FFmpeg.wasm, так і модель Whisper запускаються локально у вашому браузері. Ніщо не завантажується на жодному етапі.
Чи це працює в режимі офлайн?
Після першого запуску модель Whisper кешується у вашому браузері. Подальші транскрибування працюють повністю в режимі офлайн — вам потрібне підключення до Інтернету тільки при першому запуску.