音訊指南5 分鐘閱讀更新於 2026年5月1日

本機語音轉文字

在瀏覽器中轉錄語音錄音。

使用 Handytool 的音訊轉錄器將語音備忘錄、採訪和會議轉換為可編輯的文字 - 具有裝置端語音識別，保持錄音私密。

開啟音訊轉文字全部文章

重點摘要

01轉錄使用裝置端語音識別在本機執行，因此錄音保留在您的裝置上。
02常見格式 - MP3、WAV、M4A、OGG、FLAC - 開箱即用。
03輸出是您可以複製、作為 TXT 下載或貼上到筆記中的可編輯文字。

為什麼在本機轉錄？

語音備忘錄和採訪錄音通常是私人的。將音訊檔案寄送到轉錄軟體意味著交出清晰的、有名字的語音 - 這在倫理上和許多地方的隱私法下都很敏感。

裝置端轉錄避免了這種權衡：音訊永遠不會離開瀏覽器，但您仍然得到可搜尋的、可複製的文字。

如何轉錄音訊

放入錄音，在本機執行模型，複製或下載文字。

01
開啟音訊轉錄器
前往 Handytool 的轉錄音訊工具，將您的錄音拖放到頁面上。
02
選擇語言
選擇音訊中使用的語言。當您不確定時，自動偵測處理大多數情況。
03
執行轉錄
瀏覽器第一次載入語音識別模型，並在音訊上本機執行。
04
複製或下載
如果需要，在線編輯文字，然後複製或作為 TXT 檔案下載。

轉錄前

幾分鐘的準備通常會使轉錄精度翻倍。

01選擇最清晰的錄音副本 - 更少的背景噪音，更少的回聲。
02確認使用的語言與語言設定相符。
03對於長錄音，如果您的裝置記憶體不足，請分成塊。
04修剪前導靜音，使模型從真實語音開始。
05計劃檢查結果中的專有名詞 - 那些往往需要手動修正。

音訊轉錄常見問題

錄音會上傳到伺服器嗎？

不會。語音模型在您的瀏覽器中執行，因此音訊保留在您的裝置上。

支援哪些語言？

裝置端模型支援主要世界語言。準確性對清晰的語言和資源豐富的語言最高。

轉錄有多準確？

安靜房間中的清晰語音可以達到 90%+ 字準確率。背景噪音、重疊或強口音會降低準確性，需要手動修正。

我可以轉錄長錄音嗎？

可以，儘管長錄音使用更多記憶體。如果您的瀏覽器變慢，先將檔案分成 10-15 分鐘的塊。

相關工具

繼續使用音訊工具