如何在浏览器中免费将视频转录为文本

要点

01Whisper AI在您的浏览器中运行--您的视频永远不会上传到任何服务器。
02支持99种语言，具有自动语言检测。
03输出纯文本、SRT字幕文件和WebVTT，可直接在编辑器和YouTube中使用。
04首次运行后，模型被缓存，转录可以离线工作。

为什么在浏览器中转录视频？

转录采访、讲座、Zoom录音或YouTube视频过去意味着要么手动输入，要么将文件发送到云服务。云服务速度快，但带来真正的隐私权衡--您正在将可能敏感的音频上传到第三方服务器。Handytool采取不同的方法：它下载OpenAI的开源Whisper语音模型一次，然后使用WebGPU或WebAssembly完全在您的设备上运行它。

结果是您从云服务获得的相同AI质量转录，但您的视频文件和音频保持完全私密。首次运行下载模型（约150MB），但之后，工具完全离线工作。

如何转录视频

拖放视频文件并在几分钟内获得转录。

01
打开转录工具
在Handytool上转到"转录视频"工具。不需要账户。
02
添加您的视频文件
放入最大500MB的MP4、MOV、WebM、MKV、M4V或AVI文件。音频使用FFmpeg.wasm本地提取--没有任何内容被上传。
03
选择语言（可选）
Whisper对大多数录音自动检测讲话语言。如果您的视频有沉重的口音或是一种不常见的语言，手动选择语言会提高准确性。
04
点击转录
首次使用时，Whisper模型(~150MB)下载到您的浏览器缓存。后续运行使用缓存模型并离线工作。转录以30秒的块处理，有重叠以保持上下文连贯。
05
下载您的输出
当转录出现时，将其下载为纯文本、SRT字幕文件或WebVTT文件。所有三个都从同一转录运行生成。

您可以对视频转录做什么

转录和字幕解锁许多下游工作流。

01向YouTube或Vimeo视频添加隐藏式字幕以改进可访问性。
02从讲座、网络研讨会或培训录音创建可搜索的笔记。
03将采访素材改用到博客文章或文章中。
04在视频编辑器中使用SRT文件添加刻录字幕。
05从会议录音生成摘要或行动项目。
06下载文本后将转录翻译成另一种语言。

Whisper在您的设备上运行--没有传输任何内容

Handytool使用FFmpeg.wasm本地提取音频轨道，然后通过WebGPU（如果可用）或纯WebAssembly将其传递给浏览器中运行的Whisper。在任何点，都不会通过网络发送任何音频或视频数据。

这使该工具适合机密录音--医疗采访、法律证词、内部商务会议、治疗会议--上传到云转录服务是不可接受的地方。

视频转录常见问题

支持哪些视频格式？

MP4、MOV、WebM、MKV、M4V和AVI容器最大500MB。这些容器内的常见音频编解码器（AAC、MP3、Opus、Vorbis）都可以工作。

它可以转录哪些语言？

Whisper支持的所有99种语言，包括英语、西班牙语、普通话、法语、阿拉伯语、印地语、德语、俄语、葡萄牙语和日语。转录保持讲话语言。

我可以为YouTube生成字幕吗？

可以。转录后，下载SRT或VTT文件并直接在YouTube Studio的字幕编辑器中上传。

视频可以有多长？

接受最多500MB的文件。长录音被分成30秒的块，重叠5秒，因此转录在整个视频中保持连贯。

视频会被上传到服务器吗？

不会。FFmpeg.wasm和Whisper模型都在您的浏览器中本地运行。在任何阶段都没有上传任何内容。

它可以离线工作吗？

首次运行后，Whisper模型被缓存在您的浏览器中。后续转录完全离线工作--您只需在首次时需要互联网连接。

将任何视频转换为文本和字幕，无需将其上传到任何地方。

为什么在浏览器中转录视频？

如何转录视频

打开转录工具

添加您的视频文件

选择语言（可选）

点击转录

下载您的输出

您可以对视频转录做什么

Whisper在您的设备上运行--没有传输任何内容

视频转录常见问题

继续使用视频工具

视频转文字

剪辑视频

剪切 & 编辑视频

转换视频

为什么在浏览器中转录视频？

如何转录视频

打开转录工具

添加您的视频文件

选择语言（可选）

点击转录

下载您的输出

您可以对视频转录做什么

Whisper在您的设备上运行--没有传输任何内容

视频转录常见问题

继续使用 视频 工具

视频转文字

剪辑视频

剪切 & 编辑视频

转换视频

继续使用视频工具