Handytool
影片教學5 分鐘閱讀更新於 2026年2月11日

AI 轉錄、僅限瀏覽器

將任何影片轉換為文字和字幕,無須將其上傳到任何地方。

Handytool 在您的瀏覽器中直接運行 OpenAI 的 Whisper 模型,將 MP4、MOV、WebM 和 MKV 檔案轉錄為純文字、SRT 和 VTT 字幕檔案。您的影片永遠不會離開您的裝置。

重點摘要

  • 01Whisper AI 在您的瀏覽器中運行 — 您的影片永遠不會上傳到任何伺服器。
  • 02支援 99 種語言,具有自動語言檢測功能。
  • 03輸出純文字、SRT 字幕檔案和 WebVTT,可直接在編輯器和 YouTube 中使用。
  • 04在第一次運行後,模型被快取,轉錄可離線運作。

為什麼在您的瀏覽器中轉錄影片?

轉錄訪談、講座、Zoom 錄製或 YouTube 影片過去意味著要麼手動輸入,要麼將檔案傳送到雲端服務。雲端服務很快,但存在真實的隱私權衡 — 您正在將可能敏感的音訊上傳到第三方伺服器。Handytool 採取不同的方法:它下載 OpenAI 的開源 Whisper 語音模型一次,然後使用 WebGPU 或 WebAssembly 完全在您的裝置上運行它。

結果是您從雲端服務獲得的相同的 AI 品質轉錄,但您的影片檔案和音訊保持完全私密。第一次運行會下載模型(約 150 MB),但在那之後,工具完全離線運作。

如何轉錄影片

拖入影片檔案,幾分鐘內取得轉錄。

  1. 01

    開啟轉錄工具

    在 Handytool 上前往「轉錄影片」工具。無須帳戶。

  2. 02

    添加您的影片檔案

    拖入 MP4、MOV、WebM、MKV、M4V 或 AVI 檔案,大小最多 500 MB。音訊用 FFmpeg.wasm 本地提取 — 無須上傳任何內容。

  3. 03

    選擇語言(選擇性)

    Whisper 對大多數錄製自動檢測口語。如果您的影片有重口音或使用較不常見的語言,手動選擇語言可提高準確性。

  4. 04

    按一下「轉錄」

    首次使用時,Whisper 模型 (~150 MB) 會下載到您的瀏覽器快取。後續運行使用快取模型,可離線運作。轉錄以 30 秒的塊進行處理,重疊以保持上下文一致。

  5. 05

    下載您的輸出

    當轉錄出現時,將其下載為純文字、SRT 字幕檔案或 WebVTT 檔案。所有三者都從同一轉錄運行生成。

您可以使用影片轉錄做什麼

轉錄和字幕開啟許多下游工作流程。

  • 01為 YouTube 或 Vimeo 影片添加隱藏式字幕以改進無障礙性。
  • 02從講座、網路研討會或培訓錄製建立可搜尋的筆記。
  • 03將訪談素材重新用於部落格文章或文章。
  • 04在影片編輯器中使用 SRT 檔案添加燒製字幕。
  • 05從會議錄製產生摘要或行動項目。
  • 06在下載文字後將轉錄翻譯成另一種語言。

Whisper 在您的裝置上運行 — 無須傳輸任何內容

Handytool 使用 FFmpeg.wasm 本地提取音軌,然後通過 WebGPU(可用時)或純 WebAssembly 將其傳遞給在您的瀏覽器中運行的 Whisper。在任何時刻,任何音訊或影片資料都不會通過網路傳送。

這使工具適合機密錄製 — 醫學訪談、法律證詞、內部業務會議、治療會議 — 將其上傳到雲端轉錄服務是不可接受的。

影片轉錄常見問題

支援哪些影片格式?

MP4、MOV、WebM、MKV、M4V 和 AVI 容器,大小最多 500 MB。這些容器內的常見音訊編碼器 (AAC、MP3、Opus、Vorbis) 都可以運作。

它可以轉錄哪些語言?

Whisper 支援的所有 99 種語言,包括英文、西班牙文、普通話、法文、阿拉伯文、印地文、德文、俄文、葡萄牙文和日文。轉錄保持在口語語言。

我可以為 YouTube 產生字幕嗎?

可以。轉錄後,下載 SRT 或 VTT 檔案,並直接在 YouTube Studio 的標題編輯器中上傳。

影片可以有多長?

接受大小最多 500 MB 的檔案。長錄製會分割成 30 秒的塊,重疊 5 秒,因此轉錄在整個影片中保持連貫。

影片會上傳到伺服器嗎?

不會。FFmpeg.wasm 和 Whisper 模型都在您的瀏覽器中本地運行。沒有任何階段上傳任何內容。

它可以離線運作嗎?

在第一次運行後,Whisper 模型被快取在您的瀏覽器中。後續轉錄完全離線運作 — 您只需在第一次時連接到網際網路。

相關工具

繼續使用 影片 工具

影片 工具