Handytool
AudioGratisBerjalan secara lokal

Ubah Audio ke Teks

Ubah audio yang diucapkan dalam bahasa apa pun menjadi teks di peramban Anda.

.mp3.wav.ogg.m4a.aac.flac.webm.opus
Bahasa
Memuat model…

Berjalan sepenuhnya di peramban Anda.

atau

Tentang Ubah Audio ke Teks

Serahkan file audio atau rekam langsung dari mikrofon Anda, dan dapatkan transkrip tertulis dalam bahasa yang sama yang digunakan pembicara — tanpa mengunggah, tanpa akun, tanpa aplikasi. Handytool menjalankan model Whisper sumber terbuka OpenAI langsung di peramban Anda, jadi podcast, wawancara, catatan suara, kuliah, dan rekaman rapat Anda tetap sepenuhnya pribadi. Unduh hasilnya sebagai teks biasa, file subtitle SRT, atau file WebVTT.

Fitur Ubah Audio ke Teks

  • 01

    99 bahasa, deteksi otomatis

    Whisper mendeteksi bahasa yang diucapkan dan menulis transkrip dalam bahasa yang sama — Indonesia tetap Indonesia, Inggris tetap Inggris. Tanpa pemilih bahasa, tanpa pengaturan tambahan.

  • 02

    Unggah file atau rekam langsung

    Bawa file MP3, WAV, M4A, OGG, FLAC, atau WebM, atau klik Rekam suara untuk menangkap audio langsung dari mikrofon Anda. Berhenti saat selesai dan rekaman akan langsung masuk ke transkripsi.

  • 03

    Pemrosesan pribadi, di peramban

    Model Whisper diunduh sekali ke cache peramban Anda dan berjalan sepenuhnya di perangkat Anda. Tidak ada yang diunggah — audio Anda tidak pernah meninggalkan komputer Anda.

FAQ Ubah Audio ke Teks

Bagaimana cara mentranskripsi file audio?
Serahkan file audio Anda (MP3, WAV, M4A, OGG, FLAC, atau WebM) ke alat dan klik Ubah. Jalankan pertama kali mengunduh model ucapan (~150 MB); setelah itu, transkripsi berjalan lokal tanpa koneksi internet.
Dapatkah saya merekam audio dengan mikrofon saya?
Ya. Klik Rekam suara, izinkan akses mikrofon di peramban Anda, bicara, dan klik Hentikan rekaman. Audio yang ditangkap diperlakukan seperti file yang diunggah dan Anda dapat langsung mentranskripnya.
Bahasa apa yang didukung?
Semua 99 bahasa yang Whisper dukung — termasuk Inggris, Indonesia, Mandarin, Perancis, Arab, Hindi, Jerman, Rusia, Portugis, Jepang, dan banyak lagi. Transkrip tetap dalam bahasa apa pun yang diucapkan.
Seberapa lama audio bisa?
File hingga 200 MB diterima. Rekaman panjang diproses dalam potongan 30 detik dengan tumpang tindih 5 detik, jadi podcast satu jam tetap menghasilkan transkrip yang koheren.
Apakah audio diunggah ke server?
Tidak. Baik model maupun audio Anda tetap di peramban Anda. Model Whisper diambil sekali dari CDN dan disimpan dalam cache, kemudian transkripsi terjadi sepenuhnya di perangkat.
Dapatkah saya mendapatkan subtitle untuk video?
Ya. Unduh file .srt atau .vtt dan serahkan ke editor video Anda, atau unggah sebagai trek subtitle di YouTube dan platform lainnya. Setiap baris subtitle mencakup rentang stempel waktu yang Whisper deteksi.

Alat terkait

Audio

Jelajahi alat lain

Semua alat