Chuyển audio thành văn bản
Chuyển đổi âm thanh nói bất kỳ ngôn ngữ nào thành văn bản trong trình duyệt của bạn.
Chạy hoàn toàn trong trình duyệt của bạn.
Giới thiệu về Chuyển audio thành văn bản
Thả tệp âm thanh hoặc ghi âm trực tiếp từ micrô của bạn, và nhận bản ghi viết bằng cùng ngôn ngữ mà người nói sử dụng — không cần tải lên, không cần tài khoản, không cần cài đặt ứng dụng. Handytool chạy mô hình Whisper mã nguồn mở của OpenAI trực tiếp trong trình duyệt của bạn, vì vậy podcast, phỏng vấn, ghi âm giọng nói, bài giảng và ghi âm cuộc họp của bạn vẫn hoàn toàn riêng tư. Tải xuống kết quả dưới dạng văn bản thuần, tệp phụ đề SRT hoặc tệp WebVTT.
Tính năng của Chuyển audio thành văn bản
- 01
99 ngôn ngữ, tự động phát hiện
Whisper phát hiện ngôn ngữ được nói và viết bản ghi bằng cùng ngôn ngữ đó — Tiếng Việt vẫn là Tiếng Việt, Tiếng Trung vẫn là Tiếng Trung. Không cần chọn ngôn ngữ, không cần thiết lập thêm.
- 02
Tải lên tệp hoặc ghi âm trực tiếp
Mang tệp MP3, WAV, M4A, OGG, FLAC hoặc WebM của bạn, hoặc nhấp vào Ghi âm giọng nói để nắm bắt âm thanh trực tiếp từ micrô của bạn. Dừng lại khi bạn xong và bản ghi sẽ chuyển thẳng vào quá trình ghi âm.
- 03
Xử lý riêng tư, trong trình duyệt
Mô hình Whisper được tải xuống một lần vào bộ nhớ đệm trình duyệt của bạn và chạy hoàn toàn trên thiết bị của bạn. Không có gì được tải lên — âm thanh của bạn không bao giờ rời khỏi máy tính của bạn.
Câu hỏi thường gặp về Chuyển audio thành văn bản
- Làm cách nào để trích âm thanh?
- Thả tệp âm thanh của bạn (MP3, WAV, M4A, OGG, FLAC hoặc WebM) vào công cụ và nhấp vào Chuyển đổi. Lần chạy đầu tiên tải xuống mô hình giọng nói (~150 MB); sau đó, trích âm thanh chạy cục bộ mà không cần kết nối Internet.
- Tôi có thể ghi âm bằng micrô của mình không?
- Có. Nhấp vào Ghi âm giọng nói, cho phép truy cập micrô trong trình duyệt của bạn, nói và nhấp vào Dừng ghi âm. Âm thanh được nắm bắt được coi như một tệp được tải lên.
- Những ngôn ngữ nào được hỗ trợ?
- Tất cả 99 ngôn ngữ mà Whisper hỗ trợ — bao gồm Tiếng Việt, Tiếng Anh, Tiếng Trung, Tiếng Pháp, Tiếng Ả Rập, Tiếng Tây Ban Nha, Tiếng Nhật, Tiếng Nga, Tiếng Bồ Đào Nha và nhiều ngôn ngữ khác. Bản ghi vẫn ở ngôn ngữ được nói.
- Âm thanh có thể dài bao nhiêu?
- Các tệp lên tới 200 MB được chấp nhận. Các bản ghi dài được xử lý thành các đoạn 30 giây với độ chồng chéo 5 giây, vì vậy podcast một giờ vẫn tạo ra bản ghi nhất quán.
- Có phải âm thanh được tải lên máy chủ không?
- Không. Cả mô hình và âm thanh của bạn đều nằm trong trình duyệt của bạn. Mô hình Whisper được tải xuống một lần từ CDN và được lưu vào bộ nhớ đệm, sau đó trích âm thanh xảy ra hoàn toàn trên thiết bị.
- Tôi có thể lấy phụ đề cho video không?
- Có. Tải xuống tệp .srt hoặc .vtt và thả nó vào trình chỉnh sửa video của bạn, hoặc tải nó lên như một bản theo dõi phụ đề trên YouTube. Mỗi dòng phụ đề bao gồm phạm vi dấu thời gian mà Whisper phát hiện.
Công cụ liên quan
Âm thanh →Khám phá các công cụ khác
Tất cả công cụ →- Sẵn sàng
PDF sang JPG
Chuyển mỗi trang PDF thành ảnh JPG, PNG hoặc WebP sắc nét ngay trong trình duyệt — không upload, không mất chất lượng.
PDFMiễn phíChạy cục bộMở - Sẵn sàng
Xoá nền
Xoá nền ảnh bằng mô hình AI chạy trên trình duyệt — không cần tải lên, ảnh của bạn ở lại trên thiết bị.
Hình ảnhMiễn phíChạy cục bộMở - Sẵn sàng
Cắt video
Cắt đầu hoặc cuối video với độ chính xác từng khung hình.
VideoMiễn phíMở - Sẵn sàng
Markdown sang HTML
Chuyển đổi Markdown thành HTML sạch sẽ ngay trong trình duyệt của bạn.
Tài liệuMiễn phíChạy cục bộMở - Sẵn sàng
Kiểm tra ngữ pháp
Sửa lỗi chính tả, ngữ pháp và dấu câu trong bất kỳ khối văn bản nào bằng trình kiểm tra ngữ pháp miễn phí do AI cung cấp — không cần đăng ký, không lưu trữ.
AIMiễn phíMở