Handytool
Видеоинструкция5 мин чтенияОбновлено 11 февр. 2026 г.

AI транскрипция, только браузер

Превратите любое видео в текст и субтитры без загрузки куда-либо.

Handytool запускает модель OpenAI Whisper прямо в браузере для транскрипции файлов MP4, MOV, WebM и MKV в простой текст, SRT и файлы субтитров VTT. Ваше видео никогда не покидает устройство.

Основные выводы

  • 01Whisper AI работает в браузере — видео никогда не загружается на сервер.
  • 02Поддерживает 99 языков с автоматическим определением языка.
  • 03Выводит простой текст, файлы субтитров SRT и WebVTT для прямого использования в редакторах и YouTube.
  • 04После первого запуска модель кэшируется и транскрипция работает в автономном режиме.

Зачем транскрибировать видео в браузере?

Транскрипция интервью, лекции, записи Zoom или видео YouTube раньше означала либо ручное печатание, либо отправку файла в облачный сервис. Облачные сервисы быстры, но приходят с реальным компромиссом приватности — вы загружаете потенциально конфиденциальный звук на сервер третьей стороны. Handytool берёт другой подход: он загружает открытую модель речи Whisper от OpenAI один раз, затем запускает её полностью на устройстве с использованием WebGPU или WebAssembly.

Результат — та же AI-качественная транскрипция, которую вы получили бы из облачного сервиса, но файл видео и звук остаются полностью приватными. Первый запуск загружает модель (около 150 МБ), но после этого инструмент работает полностью в автономном режиме.

Как транскрибировать видео

Перетащите видеофайл и получите транскрипцию за несколько минут.

  1. 01

    Откройте инструмент транскрипции

    Перейдите на инструмент Transcribe Video на Handytool. Учётная запись не требуется.

  2. 02

    Добавьте видеофайл

    Перетащите файл MP4, MOV, WebM, MKV, M4V или AVI размером до 500 МБ. Звук извлекается локально с помощью FFmpeg.wasm — ничего не загружается.

  3. 03

    Выберите язык (необязательно)

    Whisper автоматически определяет разговорный язык для большинства записей. Если видео имеет сильный акцент или находится на менее распространённом языке, ручной выбор языка улучшает точность.

  4. 04

    Нажмите кнопку «Транскрибировать»

    При первом использовании модель Whisper (~150 МБ) загружается в кэш браузера. Последующие запуски используют кэшированную модель и работают в автономном режиме. Транскрипция обрабатывается в 30-секундных блоках с перекрытием, чтобы сохранить контекст связанным.

  5. 05

    Скачайте результат

    Когда появится транскрипт, скачайте его как простой текст, файл субтитров SRT или файл WebVTT. Все три создаются из одного запуска транскрипции.

Что вы можете сделать с транскрипцией видео

Транскрипты и субтитры разблокируют множество нижеследующих рабочих процессов.

  • 01Добавьте закрытые субтитры к видеороликам YouTube или Vimeo для улучшения доступности.
  • 02Создайте поддающиеся поиску заметки из лекций, вебинаров или обучающих записей.
  • 03Переиспользуйте материал интервью в запись в блоге или статью.
  • 04Добавьте сожжённые субтитры в видеоредактор с использованием файла SRT.
  • 05Создайте резюме или элементы действия из записи встречи.
  • 06Переведите транскрипт на другой язык после загрузки текста.

Whisper работает на устройстве — ничего не передаётся

Handytool использует FFmpeg.wasm для локального извлечения аудиодорожки, затем передаёт её Whisper, работающему в браузере через WebGPU (где доступна) или чистый WebAssembly. Никакие аудио или видеоданные не отправляются по сети в любой момент.

Это делает инструмент подходящим для конфиденциальных записей — медицинские интервью, судебные показания, внутренние деловые встречи, сеансы терапии — где загрузка на облачный сервис транскрипции неприемлема.

Часто задаваемые вопросы — транскрипция видео

Какие видеоформаты поддерживаются?

Контейнеры MP4, MOV, WebM, MKV, M4V и AVI размером до 500 МБ. Общие аудиокодеки внутри этих контейнеров (AAC, MP3, Opus, Vorbis) работают.

Какие языки он может транскрибировать?

Все 99 языков, которые поддерживает Whisper, включая английский, испанский, мандарин, французский, арабский, хинди, немецкий, русский, португальский и японский. Транскрипт остаётся на разговорном языке.

Могу ли я генерировать субтитры для YouTube?

Да. После транскрипции скачайте файл SRT или VTT и загрузите его прямо в редактор подписей YouTube Studio.

Насколько длинным может быть видео?

Принимаются файлы до 500 МБ. Длинные записи разбиваются на 30-секундные блоки с 5-секундным перекрытием, поэтому транскрипт остаётся связным по всему видео.

Видео загружается на сервер?

Нет. FFmpeg.wasm и модель Whisper работают локально в браузере. Ничего не загружается на любом этапе.

Это работает в автономном режиме?

После первого запуска модель Whisper кэшируется в браузере. Последующие транскрипции работают полностью в автономном режиме — вам нужна интернет-соединение только в первый раз.

Связанные инструменты

Продолжайте работать с инструментами Видео

Инструменты Видео