Handytool
视频指南5 分钟阅读更新于 2026年2月11日

AI转录,仅浏览器

将任何视频转换为文本和字幕,无需将其上传到任何地方。

Handytool在您的浏览器中直接运行OpenAI的Whisper模型,将MP4、MOV、WebM和MKV文件转录为纯文本、SRT和VTT字幕文件。您的视频永远不会离开您的设备。

要点

  • 01Whisper AI在您的浏览器中运行--您的视频永远不会上传到任何服务器。
  • 02支持99种语言,具有自动语言检测。
  • 03输出纯文本、SRT字幕文件和WebVTT,可直接在编辑器和YouTube中使用。
  • 04首次运行后,模型被缓存,转录可以离线工作。

为什么在浏览器中转录视频?

转录采访、讲座、Zoom录音或YouTube视频过去意味着要么手动输入,要么将文件发送到云服务。云服务速度快,但带来真正的隐私权衡--您正在将可能敏感的音频上传到第三方服务器。Handytool采取不同的方法:它下载OpenAI的开源Whisper语音模型一次,然后使用WebGPU或WebAssembly完全在您的设备上运行它。

结果是您从云服务获得的相同AI质量转录,但您的视频文件和音频保持完全私密。首次运行下载模型(约150MB),但之后,工具完全离线工作。

如何转录视频

拖放视频文件并在几分钟内获得转录。

  1. 01

    打开转录工具

    在Handytool上转到"转录视频"工具。不需要账户。

  2. 02

    添加您的视频文件

    放入最大500MB的MP4、MOV、WebM、MKV、M4V或AVI文件。音频使用FFmpeg.wasm本地提取--没有任何内容被上传。

  3. 03

    选择语言(可选)

    Whisper对大多数录音自动检测讲话语言。如果您的视频有沉重的口音或是一种不常见的语言,手动选择语言会提高准确性。

  4. 04

    点击转录

    首次使用时,Whisper模型(~150MB)下载到您的浏览器缓存。后续运行使用缓存模型并离线工作。转录以30秒的块处理,有重叠以保持上下文连贯。

  5. 05

    下载您的输出

    当转录出现时,将其下载为纯文本、SRT字幕文件或WebVTT文件。所有三个都从同一转录运行生成。

您可以对视频转录做什么

转录和字幕解锁许多下游工作流。

  • 01向YouTube或Vimeo视频添加隐藏式字幕以改进可访问性。
  • 02从讲座、网络研讨会或培训录音创建可搜索的笔记。
  • 03将采访素材改用到博客文章或文章中。
  • 04在视频编辑器中使用SRT文件添加刻录字幕。
  • 05从会议录音生成摘要或行动项目。
  • 06下载文本后将转录翻译成另一种语言。

Whisper在您的设备上运行--没有传输任何内容

Handytool使用FFmpeg.wasm本地提取音频轨道,然后通过WebGPU(如果可用)或纯WebAssembly将其传递给浏览器中运行的Whisper。在任何点,都不会通过网络发送任何音频或视频数据。

这使该工具适合机密录音--医疗采访、法律证词、内部商务会议、治疗会议--上传到云转录服务是不可接受的地方。

视频转录常见问题

支持哪些视频格式?

MP4、MOV、WebM、MKV、M4V和AVI容器最大500MB。这些容器内的常见音频编解码器(AAC、MP3、Opus、Vorbis)都可以工作。

它可以转录哪些语言?

Whisper支持的所有99种语言,包括英语、西班牙语、普通话、法语、阿拉伯语、印地语、德语、俄语、葡萄牙语和日语。转录保持讲话语言。

我可以为YouTube生成字幕吗?

可以。转录后,下载SRT或VTT文件并直接在YouTube Studio的字幕编辑器中上传。

视频可以有多长?

接受最多500MB的文件。长录音被分成30秒的块,重叠5秒,因此转录在整个视频中保持连贯。

视频会被上传到服务器吗?

不会。FFmpeg.wasm和Whisper模型都在您的浏览器中本地运行。在任何阶段都没有上传任何内容。

它可以离线工作吗?

首次运行后,Whisper模型被缓存在您的浏览器中。后续转录完全离线工作--您只需在首次时需要互联网连接。

相关工具

继续使用 视频 工具

视频 工具