Handytool
视频免费本地运行

视频转文字

在浏览器内直接把视频里的语音转成文字和字幕。

.mp4.mov.webm.mkv.m4v.avi
语言
正在加载模型…

完全在你的浏览器中运行。

关于视频转文字

把视频拖进来,即可在不上传、不注册、不安装任何 App 的情况下,获得与原视频同一语言的文字稿和现成字幕。Handytool 用 FFmpeg 在本地提取音频,并直接在你的浏览器里运行 OpenAI 的 Whisper 模型,在支持时启用 WebGPU 加速,因此采访、课程、Zoom 录像和 YouTube 视频都保持完全私密。可下载为纯文本、SRT 或 WebVTT 文件,直接用于播放器和 YouTube 上传。

视频转文字功能

  • 01

    99 种语言自动识别

    Whisper 会自动识别说话的语言并以相同语言输出文字 — 中文仍是中文,日语仍是日语,德语仍是德语。如果视频使用的是冷门方言或带浓重口音,也可以手动指定语言。

  • 02

    字幕兼容任意播放器

    每段转写都附带带时间戳的片段,可导出为 .srt 或 .vtt — 直接拖进 Premiere、Final Cut、DaVinci Resolve,或作为字幕轨上传到 YouTube、Vimeo 和 LinkedIn。

  • 03

    全程在浏览器内私密处理

    音频由 FFmpeg.wasm 提取,Whisper 在本地完成转写,支持 WebGPU 时使用 GPU 加速。视频从不上传,所有数据都留在浏览器缓存中。

视频转文字常见问题

如何把视频文件转成文字?
把视频(MP4、MOV、WebM、MKV、M4V 或 AVI)拖进工具并点击转写。音频会用 FFmpeg 在本地提取并交给 Whisper。首次运行需要下载约 150 MB 的模型,之后即可离线使用。
可以为 YouTube 生成字幕吗?
可以。转写完成后点击下载 .srt 或下载 .vtt — 这两种格式都能被 YouTube Studio 的字幕上传工具识别,Vimeo、LinkedIn 以及大多数视频剪辑软件也都支持。
支持哪些视频格式?
MP4、MOV、WebM、MKV、M4V 和 AVI 等容器,最大 500 MB。关键是视频内的音轨 — AAC、MP3、Opus、Vorbis 等常见编码都能正常处理。
可以转写哪些语言?
Whisper 支持的全部 99 种语言 — 包括中文、英语、普通话、法语、阿拉伯语、印地语、德语、俄语、葡萄牙语、西班牙语、日语等。转写结果会保持视频中实际使用的语言。
视频最长可以多长?
支持最大 500 MB 的文件,通常相当于一小时 HD 视频或更长时间的压缩素材。长录音会以 30 秒为一段、5 秒为重叠区进行处理,使转写保持连贯。
视频会上传到服务器吗?
不会。模型和视频都留在浏览器内。FFmpeg.wasm 在本地提取音频,Whisper 通过 WebGPU 或 WebAssembly 在你的设备上完成转写,没有任何数据离开你的电脑。

相关工具

视频

探索更多工具

全部工具