音声ファイルを文字起こしするには？

音声ファイル（MP3、WAV、M4A、OGG、FLAC、WebM）をツールにドラッグし、「文字起こし」をクリック。初回実行時は音声モデル（約 150 MB）がダウンロードされ、その後は完全にローカルでオフライン処理します。

マイクで録音できますか？

はい。「音声を録音」をクリック、ブラウザのマイクアクセスを許可、話す、「停止」をクリック。キャプチャした音声はアップロードしたファイルと同じように処理され、すぐに文字起こしできます。

Whisper が対応する全 99 言語——英語、スペイン語、中国語、フランス語、アラビア語、ヒンディー語、ドイツ語、ロシア語、ポルトガル語、日本語など。テキストは元の話者言語で保存されます。

音声の長さに制限はありますか？

最大 200 MB のファイルに対応。長い録音は 30 秒チャンク（5 秒オーバーラップ）で処理されるため、1 時間のポッドキャストでも一貫性のあるテキストが生成されます。処理時間はブラウザが WebGPU に対応しているかで変わります。

音声がサーバーにアップロードされますか？

いいえ。モデルと音声はブラウザに残ります。Whisper モデルは CDN から一度取得しキャッシュされ、文字起こしは WebGPU または WebAssembly を使用してデバイス上で完全に実行されます。

動画の字幕を生成できますか？

はい。.srt または .vtt ファイルをダウンロードして動画編集ソフトに入れるか、YouTube などのプラットフォームに字幕トラックとしてアップロード。各字幕行には Whisper が検出したタイムスタンプ範囲が含まれます。

音声無料ローカルで実行

音声を文字起こし

任意の言語の音声をテキストに変換します。ブラウザで完全に処理。

.mp3.wav.ogg.m4a.aac.flac.webm.opus

言語

モデル読み込み中…

ブラウザで完全に処理。

ここに音声ファイルをドラッグ

MP3 · WAV · OGG · M4A · FLAC · WebM · 最大 200 MB

初回実行時に約 150 MB ダウンロード。その後はキャッシュ。

ファイルを選択

または

音声を文字起こしについて

音声ファイルをアップロードするか、マイクから直接録音すれば、話者が使用した言語と同じ言語のテキストが得られます。アップロード不要、アカウント不要、アプリ不要。Handytool は OpenAI のオープンソース Whisper モデルをブラウザで直接実行し、WebGPU で加速させるため、ポッドキャスト、インタビュー、音声メモ、講演、会議録音は完全にプライベート。結果をプレーンテキスト、SRT サブタイトルファイル、または WebVTT ファイルとしてダウンロードできます。

音声を文字起こしの機能

01
99言語に対応、自動検出
Whisper は話者の言語を自動認識し、その言語でテキスト化します。スペイン語はスペイン語、日本語は日本語、ドイツ語はドイツ語で。言語選択不要、設定不要。
02
ファイルアップロードまたはライブ録音
MP3、WAV、M4A、OGG、FLAC、WebM ファイルをアップロードするか、「音声を録音」をクリックしてマイクから直接キャプチャ。停止すると自動的に文字起こしが始まります。
03
プライベート、ブラウザで処理
Whisper モデルはブラウザキャッシュに一度ダウンロードされた後、デバイス上で完全に実行されます。WebGPU 対応時は加速。アップロードなし——音声はあなたのコンピュータから出ません。

音声を文字起こしのよくある質問

音声ファイルを文字起こしするには？: 音声ファイル（MP3、WAV、M4A、OGG、FLAC、WebM）をツールにドラッグし、「文字起こし」をクリック。初回実行時は音声モデル（約 150 MB）がダウンロードされ、その後は完全にローカルでオフライン処理します。
マイクで録音できますか？: はい。「音声を録音」をクリック、ブラウザのマイクアクセスを許可、話す、「停止」をクリック。キャプチャした音声はアップロードしたファイルと同じように処理され、すぐに文字起こしできます。
対応言語は？: Whisper が対応する全 99 言語——英語、スペイン語、中国語、フランス語、アラビア語、ヒンディー語、ドイツ語、ロシア語、ポルトガル語、日本語など。テキストは元の話者言語で保存されます。
音声の長さに制限はありますか？: 最大 200 MB のファイルに対応。長い録音は 30 秒チャンク（5 秒オーバーラップ）で処理されるため、1 時間のポッドキャストでも一貫性のあるテキストが生成されます。処理時間はブラウザが WebGPU に対応しているかで変わります。
音声がサーバーにアップロードされますか？: いいえ。モデルと音声はブラウザに残ります。Whisper モデルは CDN から一度取得しキャッシュされ、文字起こしは WebGPU または WebAssembly を使用してデバイス上で完全に実行されます。
動画の字幕を生成できますか？: はい。.srt または .vtt ファイルをダウンロードして動画編集ソフトに入れるか、YouTube などのプラットフォームに字幕トラックとしてアップロード。各字幕行には Whisper が検出したタイムスタンプ範囲が含まれます。

ガイド

記事 →

5 分
音声ガイド
オンラインで音声をテキストに転録する方法
ブラウザで音声メモ、インタビュー、録音をテキストに変換します。オンデバイス音声認識付き。
2026年5月1日に更新読む

他のツールを見る

すべてのツール →

音声を文字起こし

音声を文字起こしについて

音声を文字起こしの機能

99言語に対応、自動検出

ファイルアップロードまたはライブ録音

プライベート、ブラウザで処理

音声を文字起こしのよくある質問

ガイド

オンラインで音声をテキストに転録する方法

関連ツール

ボイスエンハンサー

音声分離

音声をトリム

他のツールを見る

PDF to PNG

日本査証写真メーカー

字幕焼き込みツール

JSON ビューアー

文法チェッカー