Handytool
วิดีโอฟรีทำงานในเครื่อง

ถอดเสียงวิดีโอเป็นข้อความ

เปลี่ยนเสียงพูดในวิดีโอให้เป็นข้อความและซับไตเติลโดยตรงในเบราว์เซอร์

.mp4.mov.webm.mkv.m4v.avi
ภาษา
กำลังโหลดโมเดล…

ทำงานทั้งหมดในเบราว์เซอร์ของคุณ

เกี่ยวกับ ถอดเสียงวิดีโอเป็นข้อความ

วางไฟล์วิดีโอแล้วรับคำถอดเสียงพร้อมซับไตเติลในภาษาเดียวกับที่ผู้พูดใช้ — โดยไม่ต้องอัปโหลด ไม่ต้องสมัครสมาชิก และไม่ต้องติดตั้งแอป Handytool ใช้ FFmpeg ดึงเสียงและรันโมเดล Whisper ของ OpenAI ตรงในเบราว์เซอร์ของคุณ พร้อมการเร่งด้วย WebGPU เมื่อรองรับ จึงทำให้สัมภาษณ์ คำบรรยาย บันทึก Zoom และวิดีโอ YouTube ของคุณยังเป็นส่วนตัวเต็มที่ ดาวน์โหลดผลลัพธ์เป็นข้อความล้วน ไฟล์ SRT หรือ WebVTT ที่พร้อมใช้กับเครื่องเล่นและ YouTube

คุณสมบัติของ ถอดเสียงวิดีโอเป็นข้อความ

  • 01

    99 ภาษา ตรวจจับอัตโนมัติ

    Whisper จะตรวจจับภาษาที่พูดและเขียนคำถอดเสียงในภาษานั้นเอง — ไทยก็ยังเป็นไทย ญี่ปุ่นก็ยังเป็นญี่ปุ่น เยอรมันก็ยังเป็นเยอรมัน เลือกภาษาเองได้ถ้าวิดีโอใช้สำเนียงเฉพาะถิ่นหรือสำเนียงหนัก

  • 02

    ซับไตเติลพร้อมใช้กับทุกเครื่องเล่น

    ทุกคำถอดเสียงมีท่อนที่มี timestamp ส่งออกเป็น .srt หรือ .vtt ได้ — ลากเข้า Premiere, Final Cut, DaVinci Resolve โดยตรง หรืออัปโหลดเป็นแทร็คซับไตเติลใน YouTube, Vimeo และ LinkedIn ได้เลย

  • 03

    ประมวลผลแบบส่วนตัวในเบราว์เซอร์

    เสียงถูกดึงด้วย FFmpeg.wasm และ Whisper ถอดเสียงทั้งหมดบนเครื่องคุณ พร้อมการเร่งด้วย WebGPU เมื่อรองรับ วิดีโอไม่เคยถูกอัปโหลด ทุกอย่างเก็บในแคชของเบราว์เซอร์

คำถามที่พบบ่อยของ ถอดเสียงวิดีโอเป็นข้อความ

ถอดเสียงไฟล์วิดีโออย่างไร?
วางไฟล์วิดีโอ (MP4, MOV, WebM, MKV, M4V หรือ AVI) ลงในเครื่องมือแล้วกดถอดเสียง เสียงจะถูกดึงในเครื่องด้วย FFmpeg แล้วส่งให้ Whisper รันครั้งแรกจะดาวน์โหลดโมเดล (~150 MB) หลังจากนั้นใช้งานได้แม้ไม่มีอินเทอร์เน็ต
ทำซับไตเติลให้ YouTube ได้ไหม?
ได้ หลังถอดเสียงให้กดดาวน์โหลด .srt หรือดาวน์โหลด .vtt — ทั้งสองรูปแบบใช้กับตัวอัปโหลดซับไตเติลของ YouTube Studio รวมถึง Vimeo, LinkedIn และโปรแกรมตัดต่อวิดีโอส่วนใหญ่
รองรับวิดีโอรูปแบบใดบ้าง?
คอนเทนเนอร์ MP4, MOV, WebM, MKV, M4V และ AVI ได้ถึง 500 MB สิ่งสำคัญคือแทร็คเสียงในไฟล์ — โคเด็กยอดนิยมอย่าง AAC, MP3, Opus และ Vorbis ใช้ได้ทุกตัว
ถอดเป็นภาษาอะไรได้บ้าง?
ทั้ง 99 ภาษาที่ Whisper รองรับ — ไทย อังกฤษ จีนกลาง ฝรั่งเศส อาหรับ ฮินดี เยอรมัน รัสเซีย โปรตุเกส สเปน ญี่ปุ่น และอีกมาก คำถอดจะอยู่ในภาษาเดียวกับที่ในวิดีโอพูด
วิดีโอยาวได้แค่ไหน?
รับไฟล์ได้ถึง 500 MB ซึ่งโดยทั่วไปครอบคลุมวิดีโอ HD ความยาวประมาณหนึ่งชั่วโมงหรือคลิปที่บีบอัดหลายชั่วโมง การบันทึกยาวจะถูกประมวลผลเป็นบล็อกละ 30 วินาที โดยมีช่วงทับซ้อน 5 วินาที เพื่อให้คำถอดเสียงต่อเนื่อง
วิดีโอจะถูกอัปโหลดไปเซิร์ฟเวอร์ไหม?
ไม่ ทั้งโมเดลและวิดีโอของคุณยังอยู่ในเบราว์เซอร์ FFmpeg.wasm ดึงเสียงในเครื่อง และ Whisper ถอดเสียงบนเครื่องคุณผ่าน WebGPU หรือ WebAssembly ไม่มีอะไรออกจากคอมพิวเตอร์ของคุณ

เครื่องมือที่เกี่ยวข้อง

วิดีโอ

สำรวจเครื่องมืออื่น ๆ

เครื่องมือทั้งหมด