重點摘要
- 01轉錄使用裝置端語音識別在本機執行,因此錄音保留在您的裝置上。
- 02常見格式 - MP3、WAV、M4A、OGG、FLAC - 開箱即用。
- 03輸出是您可以複製、作為 TXT 下載或貼上到筆記中的可編輯文字。
為什麼在本機轉錄?
語音備忘錄和採訪錄音通常是私人的。將音訊檔案寄送到轉錄軟體意味著交出清晰的、有名字的語音 - 這在倫理上和許多地方的隱私法下都很敏感。
裝置端轉錄避免了這種權衡:音訊永遠不會離開瀏覽器,但您仍然得到可搜尋的、可複製的文字。
如何轉錄音訊
放入錄音,在本機執行模型,複製或下載文字。
- 01
開啟音訊轉錄器
前往 Handytool 的轉錄音訊工具,將您的錄音拖放到頁面上。
- 02
選擇語言
選擇音訊中使用的語言。當您不確定時,自動偵測處理大多數情況。
- 03
執行轉錄
瀏覽器第一次載入語音識別模型,並在音訊上本機執行。
- 04
複製或下載
如果需要,在線編輯文字,然後複製或作為 TXT 檔案下載。
轉錄前
幾分鐘的準備通常會使轉錄精度翻倍。
- 01選擇最清晰的錄音副本 - 更少的背景噪音,更少的回聲。
- 02確認使用的語言與語言設定相符。
- 03對於長錄音,如果您的裝置記憶體不足,請分成塊。
- 04修剪前導靜音,使模型從真實語音開始。
- 05計劃檢查結果中的專有名詞 - 那些往往需要手動修正。
音訊轉錄常見問題
錄音會上傳到伺服器嗎?
不會。語音模型在您的瀏覽器中執行,因此音訊保留在您的裝置上。
支援哪些語言?
裝置端模型支援主要世界語言。準確性對清晰的語言和資源豐富的語言最高。
轉錄有多準確?
安靜房間中的清晰語音可以達到 90%+ 字準確率。背景噪音、重疊或強口音會降低準確性,需要手動修正。
我可以轉錄長錄音嗎?
可以,儘管長錄音使用更多記憶體。如果您的瀏覽器變慢,先將檔案分成 10-15 分鐘的塊。