Làm cách nào để trích âm thanh?

Thả tệp âm thanh của bạn (MP3, WAV, M4A, OGG, FLAC hoặc WebM) vào công cụ và nhấp vào Chuyển đổi. Lần chạy đầu tiên tải xuống mô hình giọng nói (~150 MB); sau đó, trích âm thanh chạy cục bộ mà không cần kết nối Internet.

Tôi có thể ghi âm bằng micrô của mình không?

Có. Nhấp vào Ghi âm giọng nói, cho phép truy cập micrô trong trình duyệt của bạn, nói và nhấp vào Dừng ghi âm. Âm thanh được nắm bắt được coi như một tệp được tải lên.

Những ngôn ngữ nào được hỗ trợ?

Tất cả 99 ngôn ngữ mà Whisper hỗ trợ — bao gồm Tiếng Việt, Tiếng Anh, Tiếng Trung, Tiếng Pháp, Tiếng Ả Rập, Tiếng Tây Ban Nha, Tiếng Nhật, Tiếng Nga, Tiếng Bồ Đào Nha và nhiều ngôn ngữ khác. Bản ghi vẫn ở ngôn ngữ được nói.

Âm thanh có thể dài bao nhiêu?

Các tệp lên tới 200 MB được chấp nhận. Các bản ghi dài được xử lý thành các đoạn 30 giây với độ chồng chéo 5 giây, vì vậy podcast một giờ vẫn tạo ra bản ghi nhất quán.

Có phải âm thanh được tải lên máy chủ không?

Không. Cả mô hình và âm thanh của bạn đều nằm trong trình duyệt của bạn. Mô hình Whisper được tải xuống một lần từ CDN và được lưu vào bộ nhớ đệm, sau đó trích âm thanh xảy ra hoàn toàn trên thiết bị.

Tôi có thể lấy phụ đề cho video không?

Có. Tải xuống tệp .srt hoặc .vtt và thả nó vào trình chỉnh sửa video của bạn, hoặc tải nó lên như một bản theo dõi phụ đề trên YouTube. Mỗi dòng phụ đề bao gồm phạm vi dấu thời gian mà Whisper phát hiện.

Âm thanhMiễn phíChạy cục bộ

Chuyển audio thành văn bản

Chuyển đổi âm thanh nói bất kỳ ngôn ngữ nào thành văn bản trong trình duyệt của bạn.

.mp3.wav.ogg.m4a.aac.flac.webm.opus

Ngôn ngữ

Đang tải mô hình…

Chạy hoàn toàn trong trình duyệt của bạn.

Thả tệp âm thanh ở đây

MP3 · WAV · OGG · M4A · FLAC · WebM · tối đa 200 MB

Lần chạy đầu tiên tải ~150 MB; lưu vào bộ nhớ đệm sau đó.

Chọn tệp

hoặc

Giới thiệu về Chuyển audio thành văn bản

Thả tệp âm thanh hoặc ghi âm trực tiếp từ micrô của bạn, và nhận bản ghi viết bằng cùng ngôn ngữ mà người nói sử dụng — không cần tải lên, không cần tài khoản, không cần cài đặt ứng dụng. Handytool chạy mô hình Whisper mã nguồn mở của OpenAI trực tiếp trong trình duyệt của bạn, vì vậy podcast, phỏng vấn, ghi âm giọng nói, bài giảng và ghi âm cuộc họp của bạn vẫn hoàn toàn riêng tư. Tải xuống kết quả dưới dạng văn bản thuần, tệp phụ đề SRT hoặc tệp WebVTT.

Tính năng của Chuyển audio thành văn bản

01
99 ngôn ngữ, tự động phát hiện
Whisper phát hiện ngôn ngữ được nói và viết bản ghi bằng cùng ngôn ngữ đó — Tiếng Việt vẫn là Tiếng Việt, Tiếng Trung vẫn là Tiếng Trung. Không cần chọn ngôn ngữ, không cần thiết lập thêm.
02
Tải lên tệp hoặc ghi âm trực tiếp
Mang tệp MP3, WAV, M4A, OGG, FLAC hoặc WebM của bạn, hoặc nhấp vào Ghi âm giọng nói để nắm bắt âm thanh trực tiếp từ micrô của bạn. Dừng lại khi bạn xong và bản ghi sẽ chuyển thẳng vào quá trình ghi âm.
03
Xử lý riêng tư, trong trình duyệt
Mô hình Whisper được tải xuống một lần vào bộ nhớ đệm trình duyệt của bạn và chạy hoàn toàn trên thiết bị của bạn. Không có gì được tải lên — âm thanh của bạn không bao giờ rời khỏi máy tính của bạn.

Câu hỏi thường gặp về Chuyển audio thành văn bản

Làm cách nào để trích âm thanh?: Thả tệp âm thanh của bạn (MP3, WAV, M4A, OGG, FLAC hoặc WebM) vào công cụ và nhấp vào Chuyển đổi. Lần chạy đầu tiên tải xuống mô hình giọng nói (~150 MB); sau đó, trích âm thanh chạy cục bộ mà không cần kết nối Internet.
Tôi có thể ghi âm bằng micrô của mình không?: Có. Nhấp vào Ghi âm giọng nói, cho phép truy cập micrô trong trình duyệt của bạn, nói và nhấp vào Dừng ghi âm. Âm thanh được nắm bắt được coi như một tệp được tải lên.
Những ngôn ngữ nào được hỗ trợ?: Tất cả 99 ngôn ngữ mà Whisper hỗ trợ — bao gồm Tiếng Việt, Tiếng Anh, Tiếng Trung, Tiếng Pháp, Tiếng Ả Rập, Tiếng Tây Ban Nha, Tiếng Nhật, Tiếng Nga, Tiếng Bồ Đào Nha và nhiều ngôn ngữ khác. Bản ghi vẫn ở ngôn ngữ được nói.
Âm thanh có thể dài bao nhiêu?: Các tệp lên tới 200 MB được chấp nhận. Các bản ghi dài được xử lý thành các đoạn 30 giây với độ chồng chéo 5 giây, vì vậy podcast một giờ vẫn tạo ra bản ghi nhất quán.
Có phải âm thanh được tải lên máy chủ không?: Không. Cả mô hình và âm thanh của bạn đều nằm trong trình duyệt của bạn. Mô hình Whisper được tải xuống một lần từ CDN và được lưu vào bộ nhớ đệm, sau đó trích âm thanh xảy ra hoàn toàn trên thiết bị.
Tôi có thể lấy phụ đề cho video không?: Có. Tải xuống tệp .srt hoặc .vtt và thả nó vào trình chỉnh sửa video của bạn, hoặc tải nó lên như một bản theo dõi phụ đề trên YouTube. Mỗi dòng phụ đề bao gồm phạm vi dấu thời gian mà Whisper phát hiện.

Hướng dẫn

Bài viết →

5 phút
Hướng dẫn Âm thanh
Cách Chuyển Đổi Âm Thanh Sang Văn Bản Trực Tuyến
Chuyển đổi ghi âm thoại, cuộc phỏng vấn và bản ghi âm thành văn bản có thể tìm kiếm trong trình duyệt của bạn, với nhận dạng giọng nói trên thiết bị.
Cập nhật 1 thg 5, 2026Đọc

Công cụ liên quan

Âm thanh →

Khám phá các công cụ khác

Tất cả công cụ →

Chuyển audio thành văn bản

Giới thiệu về Chuyển audio thành văn bản

Tính năng của Chuyển audio thành văn bản

99 ngôn ngữ, tự động phát hiện

Tải lên tệp hoặc ghi âm trực tiếp

Xử lý riêng tư, trong trình duyệt

Câu hỏi thường gặp về Chuyển audio thành văn bản

Hướng dẫn

Cách Chuyển Đổi Âm Thanh Sang Văn Bản Trực Tuyến

Công cụ liên quan

Tăng cường giọng nói

Cô lập giọng nói

Cắt âm thanh

Khám phá các công cụ khác

PDF to PNG

Trình Tạo Ảnh Visa Nhật Bản

Subtitle Burner

Trình xem JSON

Kiểm tra ngữ pháp