音声を文字起こし
任意の言語の音声をテキストに変換します。ブラウザで完全に処理。
ブラウザで完全に処理。
音声を文字起こしについて
音声ファイルをアップロードするか、マイクから直接録音すれば、話者が使用した言語と同じ言語のテキストが得られます。アップロード不要、アカウント不要、アプリ不要。Handytool は OpenAI のオープンソース Whisper モデルをブラウザで直接実行し、WebGPU で加速させるため、ポッドキャスト、インタビュー、音声メモ、講演、会議録音は完全にプライベート。結果をプレーンテキスト、SRT サブタイトルファイル、または WebVTT ファイルとしてダウンロードできます。
音声を文字起こしの機能
- 01
99言語に対応、自動検出
Whisper は話者の言語を自動認識し、その言語でテキスト化します。スペイン語はスペイン語、日本語は日本語、ドイツ語はドイツ語で。言語選択不要、設定不要。
- 02
ファイルアップロードまたはライブ録音
MP3、WAV、M4A、OGG、FLAC、WebM ファイルをアップロードするか、「音声を録音」をクリックしてマイクから直接キャプチャ。停止すると自動的に文字起こしが始まります。
- 03
プライベート、ブラウザで処理
Whisper モデルはブラウザキャッシュに一度ダウンロードされた後、デバイス上で完全に実行されます。WebGPU 対応時は加速。アップロードなし——音声はあなたのコンピュータから出ません。
音声を文字起こしのよくある質問
- 音声ファイルを文字起こしするには?
- 音声ファイル(MP3、WAV、M4A、OGG、FLAC、WebM)をツールにドラッグし、「文字起こし」をクリック。初回実行時は音声モデル(約 150 MB)がダウンロードされ、その後は完全にローカルでオフライン処理します。
- マイクで録音できますか?
- はい。「音声を録音」をクリック、ブラウザのマイクアクセスを許可、話す、「停止」をクリック。キャプチャした音声はアップロードしたファイルと同じように処理され、すぐに文字起こしできます。
- 対応言語は?
- Whisper が対応する全 99 言語——英語、スペイン語、中国語、フランス語、アラビア語、ヒンディー語、ドイツ語、ロシア語、ポルトガル語、日本語など。テキストは元の話者言語で保存されます。
- 音声の長さに制限はありますか?
- 最大 200 MB のファイルに対応。長い録音は 30 秒チャンク(5 秒オーバーラップ)で処理されるため、1 時間のポッドキャストでも一貫性のあるテキストが生成されます。処理時間はブラウザが WebGPU に対応しているかで変わります。
- 音声がサーバーにアップロードされますか?
- いいえ。モデルと音声はブラウザに残ります。Whisper モデルは CDN から一度取得しキャッシュされ、文字起こしは WebGPU または WebAssembly を使用してデバイス上で完全に実行されます。
- 動画の字幕を生成できますか?
- はい。.srt または .vtt ファイルをダウンロードして動画編集ソフトに入れるか、YouTube などのプラットフォームに字幕トラックとしてアップロード。各字幕行には Whisper が検出したタイムスタンプ範囲が含まれます。
関連ツール
音声 →他のツールを見る
すべてのツール →- 利用可能
PDF を JPG に
PDF の各ページを、ブラウザで直接、鮮明な JPG、PNG、または WebP 画像に変換します。アップロード不要、品質低下なし。
PDF無料ローカルで実行開く - 利用可能
背景を削除
ブラウザ内のAIモデルを使って写真の背景を消去し、透明なPNGを取得 — アップロード不要、画像はデバイスに保存。
画像無料ローカルで実行開く - 利用可能
動画をトリム
動画の先頭や末尾をフレーム単位でカットします。
動画無料開く - 利用可能
Markdown を HTML に
Markdown を HTML に、ブラウザで直接変換します。
ドキュメント無料ローカルで実行開く - 利用可能
文法チェッカー
無料のAI搭載文法チェッカーで、テキストブロック内のスペル、文法、句読点を修正します。サインアップなし、保存なし。
AI無料開く