AI 캡션 생성기

상업적 사용 OK 380+ 모델 워터마크 없음 가입이 필요하지 않습니다
모델:
+ GPT-5, Claude, Gemini
큰 굵은 텍스트와 단어별 하이라이트 애니메이션(ASS 가라오케 타이밍)을 사용하여 동영상에 트위터 스타일의 캡션을 레코딩하십시오. 간단한 SRT/VTT 사이드카 파일을 선호하십니까? 자막 도구대신에 — 이것은 스타일 우선이며 항상 타오르고 있습니다.

여기로 동영상을 드래그하거나 업로드하려면 클릭하십시오.

MP4, MOV, WebM 최대 200MB — Whisper를 통해 99개 언어 지원

단어별 하이라이트 색상(가라오케 효과).
동영상을 업로드하여 클립의 정확한 비용을 확인하세요.

바이러스 성 캡션이 돈을 벌어들이는 곳

티크톡 / 릴 / 짧은

단어별 캡션을 사용하여 단축 형식 완료율이 30-40% 증가합니다. TikTok Neon 사전 설정은 최고의 크리에이터가 모두 사용하는 것입니다.

유튜브 바이러스 클립

반응/평가 영상에 MrBeast 스타일의 굵은 텍스트 오버레이. 반투명 상자가 있는 YouTube Lowerthird 사전 설정.

소셜을 위한 팟캐스트 클립

IG Reels / TikTok을 위해 다시 클리핑 된 오디오 프리미엄 쇼. Podcast 사전 설정은 헤드 프레임에서 자막을 읽을 수 있도록 유지합니다.

4 단계 팁

  1. 비디오를 업로드합니다. Whisper STT를 실행하고 각 발음 세그먼트의 타이밍을 읽습니다.
  2. 스타일 사전 설정을 선택하십시오. TikTok Neon은 안전한 바이러스 선택입니다. 글꼴 / 하이라이트 색상 / 위치는 사전 설정 기본값을 재정의합니다.
  3. 우리는 단어별 가라오케 타이밍(말하는 동안 단어가 색상을 변경하는 효과)을 사용하여 ASS 자막 파일을 만들었습니다.
  4. ffmpeg가 비디오에 자막을 굽습니다. 처리하는 데 30-90초가 걸립니다. 탭을 닫으십시오.

vs. 캡컷, Submagic, 오푸스 클립, 캡션.AI

CapCut의 자동 자막은 무료이며 좋은 편이지만, CapCut 편집기가 설치되어 있어야 하며, 일괄 처리할 수 없습니다. Submagic은 무제한으로 $20/mo입니다. Opus Clip은 자동 자막이 번들로 제공되는 긴 형식 → 짧은 형식으로 $30/mo입니다. Captions.AI (앱 스토어)는 $10/mo입니다. 이 도구는 Whisper large-v3 + ffmpeg ASS 가라오케 버닝 인을 실행합니다. — 모든 유료 도구가 사용하는 두 가지 원시 형식 — 토큰 풀 내에서. 일회용 및 일괄 소셜 내보내기를 위해, 이것은 가장 빠른 경로입니다.

자막 대 자막 — 차이점은 무엇입니까?

자막 (/video/subtitle/ 참조)은 유틸리티입니다: 시청자가 플레이어를 켜거나 끄는 SRT / VTT 사이드카 파일, 접근성을 위해 설계되고 YouTube Studio에 업로드됩니다. 자막 (이 도구)은 스타일입니다: 가라오케 애니메이션과 함께 모든 프레임에 큰 굵은 텍스트가 녹여지며 시청자의 85%가 사운드를 끄는 TikTok / Reels / Shorts에서 완료율을 얻도록 설계되었습니다. YouTube CC에 자막을 사용하십시오. 바이러스성 단축 형식에 자막을 사용하십시오.

캡션을 쓰지 않을 때

  • 이미 레코딩된 자막이 있는 비디오 — 텍스트가 두 배로 커지고 깨진 것처럼 보입니다.
  • YouTube 업로드의 긴 형식 — 시청자가 CC를 전환할 수 있도록 /video/subtitle/에서 사이드카 SRT를 사용합니다.
  • 대화가 없는 비디오 — 자막이 없습니다. 음악만 있는 클립은 텍스트 오버레이를 수동으로 추가해야 합니다.
고급 옵션
결과
토큰이 부족해요 더 많은 토큰을 얻으십시오
더 나은 결과를 원하십니까? 프리미엄 모델 (GPT-5, Claude, Gemini) 보다 높은 품질을 제공합니다. 계획 보기

❤️ Love this tool? Share it!

가입 추천 링크를 얻을 수 있으며 친구 당 25,000 토큰을 적립합니다.

더 먹고 싶어? 하루 30K 토큰 + 10K 보너스를 무료로 가입하세요
무료로 가입하세요

귀하의 요청을 처리 중...

AI로 동영상에 자동으로 자막을 추가하세요.

사용 방법 AI 캡션 생성기

1
입력을 입력하십시오

텍스트를 입력하거나 파일을 업로드하거나 원하는 내용을 설명하세요. 계정이 필요하지 않습니다.

2
생성하기를 클릭하십시오

당사의 AI는 최고의 오픈 소스 모델을 사용하여 몇 초 만에 요청을 처리합니다.

3
다운로드 및 공유

다운로드, 복사 또는 결과를 공유. 개인 및 상업용 무료.

API를 통해 이 도구를 사용

이 도구를 자신의 코드로 자동화하세요. OpenAI 호환 REST 엔드포인트, 베어러 토큰 인증, 추가 SDK 필요 없음. 토큰 비용은 웹 인터페이스와 일치합니다.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

AI 캡션 생성기 — FAQ

/video/subtitle/와 다르다: 자막은 플레이어가 켜거나 끄는 SRT/VTT 사이드카 파일을 출력합니다. 자막은 항상 버닝되며 스타일 우선이며 자막이 모든 프레임에 하드 코드되어야하는 TikTok / Reels / Shorts에 맞게 조정됩니다.

네 단계: (1) 비디오에서 모노 16kHz 오디오를 추출, (2) Whisper large-v3로 99개 언어 단어 타이밍을 녹음, (3) 단어 수준 \kf 가라오케 타이밍 태그가 있는 ASS 자막 파일을 만들고, (4) ffmpeg는 깨끗한 얼음 처리된 텍스트를 위해 libass를 사용하여 ASS를 모든 프레임에 굽습니다.

초당 50 토큰(최소 2,000 토큰). 30초 클립은 약 2,000 토큰(플로어가 시작됨), 60초 클립은 약 3,000 토큰, 3분 클립은 약 9,000 토큰입니다. STT는 대부분의 비용을 운영하며, 버닝은 최대 25%를 추가합니다.

7: 틱톡 네온(노란색 몬세라트, 단어별 하이라이트), 유튜브 로워더드(백색 상자에 흰색 로봇), 밈(검은색 윤곽선이 있는 흰색 임팩트), 팟캐스트(검은색 둥근 상자에 팝핀스), 키노트(상단에 아리알 블랙), 시네마틱(하단에 이탈리아어 오스왈드), TED(왼쪽에 정렬된 로봇).

글꼴 드롭다운은 Impact, Montserrat, Bebas Neue, Arial Black, Oswald, Poppins, Anton, Roboto로 사전 설정을 재정의합니다. 하이라이트 색상 선택기는 단어별 하이라이트를 제어합니다. 위치는 사전 설정에 관계없이 상단 / 중앙 / 하단을 재정의할 수 있습니다.

Whisper를 통해 99개 언어를 지원합니다. 자동 감지는 클립의 99%에서 작동합니다. Whisper가 잘못 감지하면 언어를 강제로 지정할 수 있습니다(5초 미만의 짧은 클립 또는 혼합 언어 오디오에서 일반적입니다).

아니요. 말하는 대화가 없으면 Whisper는 세그먼트를 반환하지 않으며 "어휘 감지되지 않음" 오류가 나타나므로 불가능한 작업에 토큰을 버리지 않습니다.

CapCut는 무료이며, 설치 후 오프라인으로 작동하며, 훌륭한 자동 자막을 가지고 있습니다. CapCut가 이미 편집기라면, 거기서 사용할 수 있습니다. AI 캡션 생성기는 설치를 건너뛰고 일괄 처리 친화적인 브라우저 액세스를 제공합니다. 기본 Whisper + libass 체인은 동일한 원시 코드입니다.

Submagic은 수십 개의 스타일 팩과 무제한 자막을위한 $ 20 / mo입니다. 오푸스 클립은 $ 30 / mo와 바이러스 긴 형태로 짧은 AI 클리핑 번들. Captions.AI는 모바일에서 $ 10 / mo입니다. 세 가지 모두 아래에 Whisper를 사용; 그들의 진정한 가치는 스타일 라이브러리와 클립 감지입니다.

Whisper는 단어당 타이밍을 추출하기 위해 세그먼트의 길이를 단어에 균등하게 분배합니다. 빠르게 말하는 세그먼트에서는 추정치가 ~0.1초 정도 변동될 수 있습니다. 프레임 정확도의 타이밍을 위해 다운로드 가능한.ass 파일을 사용하고 Aegisub에서 편집하십시오.

내보내기 후, 자막이 있는 MP4와 원시.ass 파일을 모두 다운로드할 수 있습니다. 픽셀 완벽한 워드 타이밍을 원한다면 Aegisub에서.ass 파일을 편집한 다음 ffmpeg -vf subtitles=file.ass 를 사용하여 로컬에서 다시 레코딩하십시오.

예. /v1/video/caption/에 `file`, `style` (tiktok-neon / youtube-lower / meme / podcast / keynote / cinematic / ted), 선택적 `font`, `highlight_color` (hex), `position`, `language`를 포함한 멀티파트를 POST합니다. 사전: GET /v1/video/caption-quote/?duration=SECS. /api/에 있는 스니펫.

30,000 토큰을 무료로 등록하세요

무료 계정 만들기

신용카드 필요 없음

이 도구를 어떻게 평가하시겠습니까?

Love this tool? Share it!