Handytool
Âm thanhMiễn phíChạy cục bộ

Chuyển audio thành văn bản

Chuyển đổi âm thanh nói bất kỳ ngôn ngữ nào thành văn bản trong trình duyệt của bạn.

.mp3.wav.ogg.m4a.aac.flac.webm.opus
Ngôn ngữ
Đang tải mô hình…

Chạy hoàn toàn trong trình duyệt của bạn.

hoặc

Giới thiệu về Chuyển audio thành văn bản

Thả tệp âm thanh hoặc ghi âm trực tiếp từ micrô của bạn, và nhận bản ghi viết bằng cùng ngôn ngữ mà người nói sử dụng — không cần tải lên, không cần tài khoản, không cần cài đặt ứng dụng. Handytool chạy mô hình Whisper mã nguồn mở của OpenAI trực tiếp trong trình duyệt của bạn, vì vậy podcast, phỏng vấn, ghi âm giọng nói, bài giảng và ghi âm cuộc họp của bạn vẫn hoàn toàn riêng tư. Tải xuống kết quả dưới dạng văn bản thuần, tệp phụ đề SRT hoặc tệp WebVTT.

Tính năng của Chuyển audio thành văn bản

  • 01

    99 ngôn ngữ, tự động phát hiện

    Whisper phát hiện ngôn ngữ được nói và viết bản ghi bằng cùng ngôn ngữ đó — Tiếng Việt vẫn là Tiếng Việt, Tiếng Trung vẫn là Tiếng Trung. Không cần chọn ngôn ngữ, không cần thiết lập thêm.

  • 02

    Tải lên tệp hoặc ghi âm trực tiếp

    Mang tệp MP3, WAV, M4A, OGG, FLAC hoặc WebM của bạn, hoặc nhấp vào Ghi âm giọng nói để nắm bắt âm thanh trực tiếp từ micrô của bạn. Dừng lại khi bạn xong và bản ghi sẽ chuyển thẳng vào quá trình ghi âm.

  • 03

    Xử lý riêng tư, trong trình duyệt

    Mô hình Whisper được tải xuống một lần vào bộ nhớ đệm trình duyệt của bạn và chạy hoàn toàn trên thiết bị của bạn. Không có gì được tải lên — âm thanh của bạn không bao giờ rời khỏi máy tính của bạn.

Câu hỏi thường gặp về Chuyển audio thành văn bản

Làm cách nào để trích âm thanh?
Thả tệp âm thanh của bạn (MP3, WAV, M4A, OGG, FLAC hoặc WebM) vào công cụ và nhấp vào Chuyển đổi. Lần chạy đầu tiên tải xuống mô hình giọng nói (~150 MB); sau đó, trích âm thanh chạy cục bộ mà không cần kết nối Internet.
Tôi có thể ghi âm bằng micrô của mình không?
Có. Nhấp vào Ghi âm giọng nói, cho phép truy cập micrô trong trình duyệt của bạn, nói và nhấp vào Dừng ghi âm. Âm thanh được nắm bắt được coi như một tệp được tải lên.
Những ngôn ngữ nào được hỗ trợ?
Tất cả 99 ngôn ngữ mà Whisper hỗ trợ — bao gồm Tiếng Việt, Tiếng Anh, Tiếng Trung, Tiếng Pháp, Tiếng Ả Rập, Tiếng Tây Ban Nha, Tiếng Nhật, Tiếng Nga, Tiếng Bồ Đào Nha và nhiều ngôn ngữ khác. Bản ghi vẫn ở ngôn ngữ được nói.
Âm thanh có thể dài bao nhiêu?
Các tệp lên tới 200 MB được chấp nhận. Các bản ghi dài được xử lý thành các đoạn 30 giây với độ chồng chéo 5 giây, vì vậy podcast một giờ vẫn tạo ra bản ghi nhất quán.
Có phải âm thanh được tải lên máy chủ không?
Không. Cả mô hình và âm thanh của bạn đều nằm trong trình duyệt của bạn. Mô hình Whisper được tải xuống một lần từ CDN và được lưu vào bộ nhớ đệm, sau đó trích âm thanh xảy ra hoàn toàn trên thiết bị.
Tôi có thể lấy phụ đề cho video không?
Có. Tải xuống tệp .srt hoặc .vtt và thả nó vào trình chỉnh sửa video của bạn, hoặc tải nó lên như một bản theo dõi phụ đề trên YouTube. Mỗi dòng phụ đề bao gồm phạm vi dấu thời gian mà Whisper phát hiện.

Công cụ liên quan

Âm thanh

Khám phá các công cụ khác

Tất cả công cụ