Handytool
VideoMiễn phíChạy cục bộ

Chuyển video thành văn bản

Chuyển lời nói trong video thành văn bản và phụ đề ngay trên trình duyệt của bạn.

.mp4.mov.webm.mkv.m4v.avi
Ngôn ngữ
Đang tải mô hình…

Chạy hoàn toàn trong trình duyệt của bạn.

Giới thiệu về Chuyển video thành văn bản

Thả một file video và nhận bản chép văn bản cùng phụ đề sẵn dùng theo đúng ngôn ngữ người nói — không tải lên, không tài khoản, không cài app. Handytool tách âm thanh bằng FFmpeg và chạy mô hình Whisper của OpenAI ngay trong trình duyệt với tăng tốc WebGPU khi có sẵn, nên các cuộc phỏng vấn, bài giảng, bản ghi Zoom và video YouTube luôn riêng tư tuyệt đối. Tải kết quả ở dạng văn bản thuần, file SRT hoặc WebVTT — sẵn sàng dùng cho trình phát và đăng lên YouTube.

Tính năng của Chuyển video thành văn bản

  • 01

    99 ngôn ngữ tự nhận diện

    Whisper tự nhận biết ngôn ngữ và viết bản chép bằng đúng ngôn ngữ đó — tiếng Việt vẫn là tiếng Việt, tiếng Nhật vẫn là tiếng Nhật, tiếng Đức vẫn là tiếng Đức. Bạn có thể chọn thủ công nếu video dùng giọng vùng hiếm hoặc trọng âm nặng.

  • 02

    Phụ đề sẵn cho mọi trình phát

    Mỗi bản chép có các đoạn gắn dấu thời gian xuất ra .srt hoặc .vtt — kéo thả vào Premiere, Final Cut, DaVinci Resolve hoặc tải lên YouTube, Vimeo, LinkedIn dưới dạng phụ đề.

  • 03

    Xử lý riêng tư trong trình duyệt

    Âm thanh được FFmpeg.wasm tách ra và Whisper chuyển thành văn bản, tất cả trên thiết bị của bạn với tăng tốc WebGPU khi hỗ trợ. Video không bao giờ bị tải lên — mọi thứ nằm trong bộ nhớ đệm của trình duyệt.

Câu hỏi thường gặp về Chuyển video thành văn bản

Làm sao để chuyển một file video thành văn bản?
Thả video (MP4, MOV, WebM, MKV, M4V hoặc AVI) vào công cụ và bấm Chuyển thành văn bản. Âm thanh được tách cục bộ qua FFmpeg rồi đưa vào Whisper. Lần đầu sẽ tải mô hình (~150 MB); sau đó vẫn dùng được khi không có mạng.
Có thể tạo phụ đề cho YouTube không?
Có. Sau khi chuyển xong, bấm Tải .srt hoặc Tải .vtt — cả hai định dạng đều được trình tải phụ đề của YouTube Studio chấp nhận, cũng như Vimeo, LinkedIn và hầu hết phần mềm dựng video.
Hỗ trợ những định dạng video nào?
Các container MP4, MOV, WebM, MKV, M4V và AVI tới 500 MB. Quan trọng là track âm thanh bên trong — các codec phổ biến như AAC, MP3, Opus và Vorbis đều hoạt động.
Có thể chuyển những ngôn ngữ nào?
Toàn bộ 99 ngôn ngữ Whisper hỗ trợ — gồm tiếng Việt, tiếng Anh, tiếng Hoa phổ thông, tiếng Pháp, tiếng Ả Rập, Hindi, tiếng Đức, tiếng Nga, Bồ Đào Nha, Tây Ban Nha, Nhật và nhiều thứ tiếng khác. Bản chép luôn ở đúng ngôn ngữ được nói trong video.
Video có thể dài bao nhiêu?
Chấp nhận file tới 500 MB, thường tương đương một giờ video HD hoặc vài giờ video nén. Bản ghi dài được xử lý theo từng khối 30 giây với 5 giây chồng lấp để bản chép luôn liền mạch.
Video có được tải lên máy chủ nào không?
Không. Cả mô hình và video của bạn đều ở lại trong trình duyệt. FFmpeg.wasm tách âm thanh tại chỗ và Whisper chuyển thành văn bản trên thiết bị của bạn qua WebGPU hoặc WebAssembly. Không gì rời khỏi máy bạn.

Công cụ liên quan

Video

Khám phá các công cụ khác

Tất cả công cụ