视频免费本地运行
视频转文字
在浏览器内直接把视频里的语音转成文字和字幕。
.mp4.mov.webm.mkv.m4v.avi
语言
正在加载模型…
完全在你的浏览器中运行。
关于视频转文字
把视频拖进来,即可在不上传、不注册、不安装任何 App 的情况下,获得与原视频同一语言的文字稿和现成字幕。Handytool 用 FFmpeg 在本地提取音频,并直接在你的浏览器里运行 OpenAI 的 Whisper 模型,在支持时启用 WebGPU 加速,因此采访、课程、Zoom 录像和 YouTube 视频都保持完全私密。可下载为纯文本、SRT 或 WebVTT 文件,直接用于播放器和 YouTube 上传。
视频转文字功能
- 01
99 种语言自动识别
Whisper 会自动识别说话的语言并以相同语言输出文字 — 中文仍是中文,日语仍是日语,德语仍是德语。如果视频使用的是冷门方言或带浓重口音,也可以手动指定语言。
- 02
字幕兼容任意播放器
每段转写都附带带时间戳的片段,可导出为 .srt 或 .vtt — 直接拖进 Premiere、Final Cut、DaVinci Resolve,或作为字幕轨上传到 YouTube、Vimeo 和 LinkedIn。
- 03
全程在浏览器内私密处理
音频由 FFmpeg.wasm 提取,Whisper 在本地完成转写,支持 WebGPU 时使用 GPU 加速。视频从不上传,所有数据都留在浏览器缓存中。
视频转文字常见问题
- 如何把视频文件转成文字?
- 把视频(MP4、MOV、WebM、MKV、M4V 或 AVI)拖进工具并点击转写。音频会用 FFmpeg 在本地提取并交给 Whisper。首次运行需要下载约 150 MB 的模型,之后即可离线使用。
- 可以为 YouTube 生成字幕吗?
- 可以。转写完成后点击下载 .srt 或下载 .vtt — 这两种格式都能被 YouTube Studio 的字幕上传工具识别,Vimeo、LinkedIn 以及大多数视频剪辑软件也都支持。
- 支持哪些视频格式?
- MP4、MOV、WebM、MKV、M4V 和 AVI 等容器,最大 500 MB。关键是视频内的音轨 — AAC、MP3、Opus、Vorbis 等常见编码都能正常处理。
- 可以转写哪些语言?
- Whisper 支持的全部 99 种语言 — 包括中文、英语、普通话、法语、阿拉伯语、印地语、德语、俄语、葡萄牙语、西班牙语、日语等。转写结果会保持视频中实际使用的语言。
- 视频最长可以多长?
- 支持最大 500 MB 的文件,通常相当于一小时 HD 视频或更长时间的压缩素材。长录音会以 30 秒为一段、5 秒为重叠区进行处理,使转写保持连贯。
- 视频会上传到服务器吗?
- 不会。模型和视频都留在浏览器内。FFmpeg.wasm 在本地提取音频,Whisper 通过 WebGPU 或 WebAssembly 在你的设备上完成转写,没有任何数据离开你的电脑。