Handytool
ÄäniIlmainenSuoritetaan paikallisesti

Äänen litterointi tekstiksi

Muunna puhe millä tahansa kielellä tekstiksi selaimessasi.

.mp3.wav.ogg.m4a.aac.flac.webm.opus
Kieli
Mallin lataaminen…

Toimii kokonaan selaimessa.

tai

Äänen litterointi tekstiksi – tietoa

Lisää äänitiedosto tai nauhoita suoraan mikrofonista ja saat litteroinnin samalla kielellä kuin puhuja puhui — ilman lataamista, ilman tiliä, ilman sovellusta asennettavaksi. Handytool ajaa OpenAI:n avoimen lähdekoodin Whisper-mallia suoraan selaimessasi WebGPU:n kanssa, kun se on saatavilla, joten podcastit, haastattelut, äänimuistiot, luennot ja kokouksien nauhoitukset säilyvät täysin yksityisinä. Lataa tulos pelkkänä tekstinä, SRT-tekstitystiedostona tai WebVTT-tiedostona, joka on valmis videosoittimille.

Äänen litterointi tekstiksi – ominaisuudet

  • 01

    99 kieltä, automaattinen tunnistus

    Whisper tunnistaa puhutun kielen ja kirjoittaa litteroinnin samalla kielellä — espanja pysyy espanjana, japani pysyy japanina, saksa pysyy saksana. Ei kielenvalitsinta, ei lisäasetuksia.

  • 02

    Lataa tiedosto tai nauhoita reaaliajassa

    Tuo MP3-, WAV-, M4A-, OGG-, FLAC- tai WebM-tiedosto, tai napsauta Nauhoita äänilläsi sieppamaan ääntä suoraan mikrofonista. Pysähdä, kun olet valmis, ja nauhoitus menee suoraan litteroinnille.

  • 03

    Yksityinen käsittely selaimessa

    Whisper-malli ladataan kerran selaimen välimuistiin ja toimii kokonaan laitteellasi WebGPU-kiihdytyksellä, jos tuettu. Mitään ei ladata — ääntäsi ei koskaan jätä tietokoneesi.

Äänen litterointi tekstiksi – UKK

Kuinka litteroida äänitiedosto?
Lataa äänitiedosto (MP3, WAV, M4A, OGG, FLAC tai WebM) työkaluun ja napsauta Litterointi. Ensimmäinen suoritus lataa puhemallin (~150 MB); sen jälkeen litterointi toimii paikallisesti ilman Internet-yhteyttä.
Voinko nauhoittaa ääntä mikrofonilla?
Kyllä. Napsauta Nauhoita äänilläsi, salli mikrofoni-oikeus selaimessa, puhu ja napsauta Pysäytä nauhoitus. Sieppattu ääni käsitellään kuten ladattu tiedosto ja voit litteroida sen heti.
Mitä kieliä tuetaan?
Kaikki 99 kieltä, joita Whisper tukee — mukaan lukien englanti, espanja, mandariini, ranska, arabia, hindi, saksa, venäjä, portugali, japani ja monet muut. Litterointi pysyy kielellä, jolla puhuja puhui.
Kuinka pitkä ääni voi olla?
Tiedostot, joiden koko on enintään 200 MB, hyväksytään. Pitkät nauhoitukset käsitellään 30 sekunnin lohkoissa 5 sekunnin päällekkäisyydellä, joten yhden tunnin podcast tuottaa silti johdonmukaisen litteroinnin. Käsittelyaika riippuu siitä, tukeeko selaimesi WebGPU:ta.
Lataako ääni palvelimelle?
Ei. Sekä malli että ääntäsi pysyvät selaimessasi. Whisper-malli ladataan kerran CDN:stä ja välimuistiin, sitten litterointi tapahtuu kokonaan laitteella WebGPU:n tai WebAssemblyn avulla.
Voinko saada tekstitykset videolle?
Kyllä. Lataa .srt- tai .vtt-tiedosto ja pudota se videoeditoriisi, tai lataa se tekstitysraidaksi YouTube-ja muihin alustoihin. Jokainen tekstitysrivi sisältää aikaväliin, jonka Whisper havaitsi.

Liittyvät työkalut

Ääni

Tutustu muihin työkaluihin

Kaikki työkalut