Handytool
音声無料ローカルで実行

音声を文字起こし

任意の言語の音声をテキストに変換します。ブラウザで完全に処理。

.mp3.wav.ogg.m4a.aac.flac.webm.opus
言語
モデル読み込み中…

ブラウザで完全に処理。

または

音声を文字起こしについて

音声ファイルをアップロードするか、マイクから直接録音すれば、話者が使用した言語と同じ言語のテキストが得られます。アップロード不要、アカウント不要、アプリ不要。Handytool は OpenAI のオープンソース Whisper モデルをブラウザで直接実行し、WebGPU で加速させるため、ポッドキャスト、インタビュー、音声メモ、講演、会議録音は完全にプライベート。結果をプレーンテキスト、SRT サブタイトルファイル、または WebVTT ファイルとしてダウンロードできます。

音声を文字起こしの機能

  • 01

    99言語に対応、自動検出

    Whisper は話者の言語を自動認識し、その言語でテキスト化します。スペイン語はスペイン語、日本語は日本語、ドイツ語はドイツ語で。言語選択不要、設定不要。

  • 02

    ファイルアップロードまたはライブ録音

    MP3、WAV、M4A、OGG、FLAC、WebM ファイルをアップロードするか、「音声を録音」をクリックしてマイクから直接キャプチャ。停止すると自動的に文字起こしが始まります。

  • 03

    プライベート、ブラウザで処理

    Whisper モデルはブラウザキャッシュに一度ダウンロードされた後、デバイス上で完全に実行されます。WebGPU 対応時は加速。アップロードなし——音声はあなたのコンピュータから出ません。

音声を文字起こしのよくある質問

音声ファイルを文字起こしするには?
音声ファイル(MP3、WAV、M4A、OGG、FLAC、WebM)をツールにドラッグし、「文字起こし」をクリック。初回実行時は音声モデル(約 150 MB)がダウンロードされ、その後は完全にローカルでオフライン処理します。
マイクで録音できますか?
はい。「音声を録音」をクリック、ブラウザのマイクアクセスを許可、話す、「停止」をクリック。キャプチャした音声はアップロードしたファイルと同じように処理され、すぐに文字起こしできます。
対応言語は?
Whisper が対応する全 99 言語——英語、スペイン語、中国語、フランス語、アラビア語、ヒンディー語、ドイツ語、ロシア語、ポルトガル語、日本語など。テキストは元の話者言語で保存されます。
音声の長さに制限はありますか?
最大 200 MB のファイルに対応。長い録音は 30 秒チャンク(5 秒オーバーラップ)で処理されるため、1 時間のポッドキャストでも一貫性のあるテキストが生成されます。処理時間はブラウザが WebGPU に対応しているかで変わります。
音声がサーバーにアップロードされますか?
いいえ。モデルと音声はブラウザに残ります。Whisper モデルは CDN から一度取得しキャッシュされ、文字起こしは WebGPU または WebAssembly を使用してデバイス上で完全に実行されます。
動画の字幕を生成できますか?
はい。.srt または .vtt ファイルをダウンロードして動画編集ソフトに入れるか、YouTube などのプラットフォームに字幕トラックとしてアップロード。各字幕行には Whisper が検出したタイムスタンプ範囲が含まれます。

関連ツール

音声

他のツールを見る

すべてのツール