要点
- 01Whisper AI在您的浏览器中运行--您的视频永远不会上传到任何服务器。
- 02支持99种语言,具有自动语言检测。
- 03输出纯文本、SRT字幕文件和WebVTT,可直接在编辑器和YouTube中使用。
- 04首次运行后,模型被缓存,转录可以离线工作。
为什么在浏览器中转录视频?
转录采访、讲座、Zoom录音或YouTube视频过去意味着要么手动输入,要么将文件发送到云服务。云服务速度快,但带来真正的隐私权衡--您正在将可能敏感的音频上传到第三方服务器。Handytool采取不同的方法:它下载OpenAI的开源Whisper语音模型一次,然后使用WebGPU或WebAssembly完全在您的设备上运行它。
结果是您从云服务获得的相同AI质量转录,但您的视频文件和音频保持完全私密。首次运行下载模型(约150MB),但之后,工具完全离线工作。
如何转录视频
拖放视频文件并在几分钟内获得转录。
- 01
打开转录工具
在Handytool上转到"转录视频"工具。不需要账户。
- 02
添加您的视频文件
放入最大500MB的MP4、MOV、WebM、MKV、M4V或AVI文件。音频使用FFmpeg.wasm本地提取--没有任何内容被上传。
- 03
选择语言(可选)
Whisper对大多数录音自动检测讲话语言。如果您的视频有沉重的口音或是一种不常见的语言,手动选择语言会提高准确性。
- 04
点击转录
首次使用时,Whisper模型(~150MB)下载到您的浏览器缓存。后续运行使用缓存模型并离线工作。转录以30秒的块处理,有重叠以保持上下文连贯。
- 05
下载您的输出
当转录出现时,将其下载为纯文本、SRT字幕文件或WebVTT文件。所有三个都从同一转录运行生成。
您可以对视频转录做什么
转录和字幕解锁许多下游工作流。
- 01向YouTube或Vimeo视频添加隐藏式字幕以改进可访问性。
- 02从讲座、网络研讨会或培训录音创建可搜索的笔记。
- 03将采访素材改用到博客文章或文章中。
- 04在视频编辑器中使用SRT文件添加刻录字幕。
- 05从会议录音生成摘要或行动项目。
- 06下载文本后将转录翻译成另一种语言。
Whisper在您的设备上运行--没有传输任何内容
Handytool使用FFmpeg.wasm本地提取音频轨道,然后通过WebGPU(如果可用)或纯WebAssembly将其传递给浏览器中运行的Whisper。在任何点,都不会通过网络发送任何音频或视频数据。
这使该工具适合机密录音--医疗采访、法律证词、内部商务会议、治疗会议--上传到云转录服务是不可接受的地方。
视频转录常见问题
支持哪些视频格式?
MP4、MOV、WebM、MKV、M4V和AVI容器最大500MB。这些容器内的常见音频编解码器(AAC、MP3、Opus、Vorbis)都可以工作。
它可以转录哪些语言?
Whisper支持的所有99种语言,包括英语、西班牙语、普通话、法语、阿拉伯语、印地语、德语、俄语、葡萄牙语和日语。转录保持讲话语言。
我可以为YouTube生成字幕吗?
可以。转录后,下载SRT或VTT文件并直接在YouTube Studio的字幕编辑器中上传。
视频可以有多长?
接受最多500MB的文件。长录音被分成30秒的块,重叠5秒,因此转录在整个视频中保持连贯。
视频会被上传到服务器吗?
不会。FFmpeg.wasm和Whisper模型都在您的浏览器中本地运行。在任何阶段都没有上传任何内容。
它可以离线工作吗?
首次运行后,Whisper模型被缓存在您的浏览器中。后续转录完全离线工作--您只需在首次时需要互联网连接。