Äänen litterointi tekstiksi
Muunna puhe millä tahansa kielellä tekstiksi selaimessasi.
Toimii kokonaan selaimessa.
Äänen litterointi tekstiksi – tietoa
Lisää äänitiedosto tai nauhoita suoraan mikrofonista ja saat litteroinnin samalla kielellä kuin puhuja puhui — ilman lataamista, ilman tiliä, ilman sovellusta asennettavaksi. Handytool ajaa OpenAI:n avoimen lähdekoodin Whisper-mallia suoraan selaimessasi WebGPU:n kanssa, kun se on saatavilla, joten podcastit, haastattelut, äänimuistiot, luennot ja kokouksien nauhoitukset säilyvät täysin yksityisinä. Lataa tulos pelkkänä tekstinä, SRT-tekstitystiedostona tai WebVTT-tiedostona, joka on valmis videosoittimille.
Äänen litterointi tekstiksi – ominaisuudet
- 01
99 kieltä, automaattinen tunnistus
Whisper tunnistaa puhutun kielen ja kirjoittaa litteroinnin samalla kielellä — espanja pysyy espanjana, japani pysyy japanina, saksa pysyy saksana. Ei kielenvalitsinta, ei lisäasetuksia.
- 02
Lataa tiedosto tai nauhoita reaaliajassa
Tuo MP3-, WAV-, M4A-, OGG-, FLAC- tai WebM-tiedosto, tai napsauta Nauhoita äänilläsi sieppamaan ääntä suoraan mikrofonista. Pysähdä, kun olet valmis, ja nauhoitus menee suoraan litteroinnille.
- 03
Yksityinen käsittely selaimessa
Whisper-malli ladataan kerran selaimen välimuistiin ja toimii kokonaan laitteellasi WebGPU-kiihdytyksellä, jos tuettu. Mitään ei ladata — ääntäsi ei koskaan jätä tietokoneesi.
Äänen litterointi tekstiksi – UKK
- Kuinka litteroida äänitiedosto?
- Lataa äänitiedosto (MP3, WAV, M4A, OGG, FLAC tai WebM) työkaluun ja napsauta Litterointi. Ensimmäinen suoritus lataa puhemallin (~150 MB); sen jälkeen litterointi toimii paikallisesti ilman Internet-yhteyttä.
- Voinko nauhoittaa ääntä mikrofonilla?
- Kyllä. Napsauta Nauhoita äänilläsi, salli mikrofoni-oikeus selaimessa, puhu ja napsauta Pysäytä nauhoitus. Sieppattu ääni käsitellään kuten ladattu tiedosto ja voit litteroida sen heti.
- Mitä kieliä tuetaan?
- Kaikki 99 kieltä, joita Whisper tukee — mukaan lukien englanti, espanja, mandariini, ranska, arabia, hindi, saksa, venäjä, portugali, japani ja monet muut. Litterointi pysyy kielellä, jolla puhuja puhui.
- Kuinka pitkä ääni voi olla?
- Tiedostot, joiden koko on enintään 200 MB, hyväksytään. Pitkät nauhoitukset käsitellään 30 sekunnin lohkoissa 5 sekunnin päällekkäisyydellä, joten yhden tunnin podcast tuottaa silti johdonmukaisen litteroinnin. Käsittelyaika riippuu siitä, tukeeko selaimesi WebGPU:ta.
- Lataako ääni palvelimelle?
- Ei. Sekä malli että ääntäsi pysyvät selaimessasi. Whisper-malli ladataan kerran CDN:stä ja välimuistiin, sitten litterointi tapahtuu kokonaan laitteella WebGPU:n tai WebAssemblyn avulla.
- Voinko saada tekstitykset videolle?
- Kyllä. Lataa .srt- tai .vtt-tiedosto ja pudota se videoeditoriisi, tai lataa se tekstitysraidaksi YouTube-ja muihin alustoihin. Jokainen tekstitysrivi sisältää aikaväliin, jonka Whisper havaitsi.
Liittyvät työkalut
Ääni →Tutustu muihin työkaluihin
Kaikki työkalut →- Käytössä
PDF JPG:ksi
Muunna PDF:n jokainen sivu teräviksi JPG-, PNG- tai WebP-kuviksi suoraan selaimessasi — ilman lataamista, ilman laadun menetystä.
PDFIlmainenSuoritetaan paikallisestiAvaa - Käytössä
Poista tausta
Pyyhi valokuvan tausta selaimessa toimivalla mallilla — ilman lataamista, kuvasi pysyvät laitteellasi.
KuvaIlmainenSuoritetaan paikallisestiAvaa - Käytössä
Leikkaa video
Leikkaa videon alkua tai loppua kehyksen tarkkuudella.
VideoIlmainenAvaa - Käytössä
Markdown HTML:ksi
Muunna Markdown puhtaaksi HTML:ksi suoraan selaimessasi.
AsiakirjaIlmainenSuoritetaan paikallisestiAvaa - Käytössä
Kieliopin tarkistus
Korjaa oikeinkirjoitus-, kielioppi- ja välimerkkivirheet millä tahansa tekstillä ilmaisella tekoäly-pohjaisella kieliopin tarkistuksella — ei rekisteröintiä, mitään ei säilötetä.
TekoälyIlmainenAvaa