Handytool
영상 가이드5분 읽기2026년 2월 11일에 업데이트됨

AI 필사, 브라우저 전용

모든 영상을 아무데도 업로드하지 않고 텍스트와 자막으로 변환하세요.

Handytool은 OpenAI의 Whisper 모델을 브라우저에서 직접 실행하여 MP4, MOV, WebM, MKV 파일을 순수 텍스트, SRT, VTT 자막 파일로 필사합니다. 영상은 기기에서 절대 나가지 않습니다.

핵심 요점

  • 01Whisper AI는 브라우저 내에서 실행됩니다. 영상은 어떤 서버에도 업로드되지 않습니다.
  • 02자동 언어 감지로 99개 언어를 지원합니다.
  • 03순수 텍스트, SRT 자막 파일, 편집기와 YouTube에 직접 사용할 WebVTT를 출력합니다.
  • 04첫 실행 후 모델이 캐시되고 필사는 오프라인으로 작동합니다.

브라우저에서 영상을 필사하는 이유는?

인터뷰, 강의, Zoom 녹화 또는 YouTube 영상을 필사하는 것은 수동으로 입력하거나 클라우드 서비스로 파일을 보내는 것을 의미했습니다. 클라우드 서비스는 빠르지만 실제 개인정보 보호 상충이 있습니다. 잠재적으로 민감한 오디오를 제3자 서버에 업로드하고 있습니다. Handytool은 다른 접근 방식을 취합니다. OpenAI의 오픈 소스 Whisper 음성 모델을 한 번 다운로드한 후 WebGPU 또는 WebAssembly를 사용하여 기기에서 완전히 실행합니다.

결과는 클라우드 서비스에서 얻을 수 있는 동일한 AI 품질의 필사입니다. 그러나 영상 파일과 오디오는 완전히 비공개입니다. 첫 실행은 모델을 다운로드하며(약 150MB), 그 이후로는 도구가 완전히 오프라인으로 작동합니다.

영상을 필사하는 방법

영상 파일을 드롭하고 몇 분 내에 필사를 얻으세요.

  1. 01

    필사 도구 열기

    Handytool의 영상 필사 도구로 이동하세요. 계정이 필요하지 않습니다.

  2. 02

    영상 파일 추가

    MP4, MOV, WebM, MKV, M4V 또는 AVI 파일을 500MB까지 드롭하세요. 오디오는 FFmpeg.wasm으로 로컬로 추출됩니다. 아무것도 업로드되지 않습니다.

  3. 03

    언어 선택(선택 사항)

    Whisper는 대부분의 기록에 대해 음성 언어를 자동으로 감지합니다. 영상에 강한 억양이 있거나 덜 일반적인 언어로 되어 있으면 수동으로 언어를 선택하면 정확도가 향상됩니다.

  4. 04

    필사 클릭

    처음 사용할 때 Whisper 모델(약 150MB)이 브라우저 캐시로 다운로드됩니다. 후속 실행은 캐시된 모델을 사용하고 오프라인으로 작동합니다. 필사는 30초 청크로 처리되며 컨텍스트를 일관되게 유지하기 위해 겹칩니다.

  5. 05

    출력 다운로드

    필사가 나타나면 순수 텍스트, SRT 자막 파일 또는 WebVTT 파일로 다운로드하세요. 세 개 모두 동일한 필사 실행에서 생성됩니다.

영상 필사로 할 수 있는 것

필사와 자막은 많은 다운스트림 워크플로우를 열어줍니다.

  • 01YouTube 또는 Vimeo 영상에 폐쇄 캡션을 추가하여 접근성을 개선하세요.
  • 02강의, 웨비나 또는 교육 녹화에서 검색 가능한 노트 만들기.
  • 03인터뷰 영상을 블로그 게시물이나 기사로 변환하기.
  • 04SRT 파일을 사용하여 영상 편집기에 번인 자막 추가.
  • 05회의 녹화에서 요약 또는 작업 항목 생성.
  • 06다운로드한 텍스트를 다른 언어로 번역하기.

Whisper는 기기에서 실행됩니다. 아무것도 전송되지 않습니다

Handytool은 FFmpeg.wasm을 사용하여 오디오 트랙을 로컬로 추출한 다음 WebGPU를 통해 또는 순수 WebAssembly를 통해 브라우저에서 실행되는 Whisper로 전달합니다. 어떤 시점에서도 오디오 또는 영상 데이터가 네트워크로 전송되지 않습니다.

이는 도구를 기밀 기록에 적합하게 만듭니다. 의료 인터뷰, 법적 증언, 내부 비즈니스 회의, 치료 세션 — 클라우드 필사 서비스로 업로드하는 것이 허용되지 않는 경우.

영상 필사 FAQ

어떤 영상 형식이 지원되나요?

MP4, MOV, WebM, MKV, M4V, AVI 컨테이너는 최대 500MB입니다. 이러한 컨테이너 내의 일반적인 오디오 코덱(AAC, MP3, Opus, Vorbis)은 모두 작동합니다.

어떤 언어를 필사할 수 있나요?

Whisper가 지원하는 모든 99개 언어, 영어, 스페인어, 만다린, 프랑스어, 아랍어, 힌디어, 독일어, 러시아어, 포르투갈어, 일본어를 포함합니다. 필사는 음성 언어로 유지됩니다.

YouTube용 자막을 생성할 수 있나요?

네. 필사 후 SRT 또는 VTT 파일을 다운로드하여 YouTube Studio의 캡션 편집기에 직접 업로드하세요.

영상이 얼마나 길 수 있나요?

최대 500MB 파일이 수용됩니다. 긴 기록은 30초 청크로 나뉘며 5초 겹침이 있으므로 필사가 전체 영상에서 일관됩니다.

영상이 서버에 업로드되나요?

아니오. FFmpeg.wasm과 Whisper 모델은 모두 브라우저에서 로컬로 실행됩니다. 어떤 단계에서도 아무것도 업로드되지 않습니다.

오프라인으로 작동하나요?

첫 실행 후 Whisper 모델이 브라우저에 캐시됩니다. 후속 필사는 완전히 오프라인으로 작동합니다. 처음에만 인터넷 연결이 필요합니다.

관련 도구

동영상 도구로 계속 작업하기

동영상 도구