Penjana Caption AI

Penggunaan komersial OK 380+ model Tiada tanda air Tiada pendaftaran diperlukan
Model:
+ GPT-5, Claude, Gemini
Bakar caption gaya TikTok ke dalam video anda — teks tebal besar dengan animasi penonjolan perkataan-perkataan (pemasa karaoke ASS). Adakah anda lebih suka fail sidecar SRT/VTT biasa? Guna subtitle toolsebaliknya — ini adalah gaya pertama dan selalu terbakar.

Seret video ke sini atau klik untuk muat naik

MP4, MOV, WebM sehingga 200MB — 99 bahasa disokong melalui Whisper

Warna sorotan perkataan-perkataan (efek karaoke).
Kiraan token untuk klip anda
Muat naik video untuk melihat kos tepat untuk klip anda.

Di mana caption viral mendapat mereka kekal

TikTok / Gulungan / Sling

Kadar penyelesaian bentuk pendek melonjak 30-40% dengan penutup perkataan-perkataan. Praset TikTok Neon adalah yang digunakan oleh pencipta teratas.

Klip viral YouTube

Teks tebal gaya MrBeast meliputi rakaman reaksi/ komen. Praset YouTube Lowerthird dengan kotak lutsinar.

Klip podcast untuk sosial

Pertunjukan audio-pertama diklip semula untuk IG Reels / TikTok. Praset podcast menyimpan caption boleh dibaca di atas bingkai kepala bercakap.

4-langkah bagaimana-untuk

  1. Unggah video anda. kami menarik audio, menjalankan Whisper STT, dan membaca masa untuk setiap segmen yang diucapkan.
  2. Pilih praset gaya — TikTok Neon adalah pilihan virus yang selamat. Font / warna sorotan / kedudukan menggantikan piawaian praset.
  3. Kami bina fail subtajuk ASS dengan waktu karaoke perkataan-perkataan (efek di mana perkataan berubah warna ketika mereka diucapkan).
  4. ffmpeg membakar caption ke dalam video. Pemprosesan mengambil masa 30-90 saat — tutup tab; kami emelkan anda bila ia selesai.

vs. CapCut, Submagic, Opus Clip, Captions.AI

Auto-caption CapCut adalah percuma dan baik, tetapi anda perlukan editor CapCut dipasang dan anda tidak boleh membantingnya. Submagic adalah $20/mo untuk tidak terhad. Opus Clip adalah $30/mo untuk bentuk panjang → bentuk pendek dengan auto-caption dibundel. Captions.AI (App Store) adalah $10/mo. Alat ini menjalankan Whisper large-v3 + ffmpeg ASS karaoke burn-in — dua primitif yang sama semua alat berbayar gunakan — dalam kolam token anda. Untuk eksport sosial satu-offs dan membanting, ia adalah laluan terpantas.

Caption vs subtitle — apa bezanya?

Subtitles (lihat /video/subtitle/) adalah utiliti: fail sidecar SRT/VTT pemain pelihat boleh togol on/off, direka untuk kebolehcapaian dan muat naik ke YouTube Studio. Captions (alat ini) adalah gaya: teks tebal besar dibakar ke dalam setiap bingkai dengan animasi karaoke, direka untuk memperoleh kadar penyelesaian pada TikTok / Reels / Shorts di mana 85% pelihat menyimpan bunyi dimatikan. Gunakan subtitle untuk YouTube CCs; gunakan caption untuk viral short-form.

Bila TIDAK untuk penutup

  • Video yang sudah mempunyai caption yang dibakar — teks akan berganda dan kelihatan rosak.
  • Muat naik YouTube bentuk panjang — gunakan SRT sidecar dari /video/subtitle/ sebagai gantinya supaya pelawat boleh togol CC.
  • Video dengan dialog sifar — tiada apa untuk titli. Klip muzik sahaja patut menambah lapisan teks secara manual.
Opsyen Lanjutan
Hasil
Token semakin habis. Dapatkan Lebih Token
Nak hasil yang lebih baik? Model premium (GPT-5, Claude, Gemini) memberikan kualiti yang lebih tinggi. Lihat Reka Bentuk

❤️ Love this tool? Share it!

Mendaftar untuk mendapatkan pautan rujukan dan memperoleh 25,000 token per rakan.

Nak lagi? Daftar percuma untuk 30K token/hari + 10K bonus
Daftar Masuk

Memproses permintaan anda...

Bakar caption gaya TikTok ke dalam mana-mana video — penanda karaoke perkataan-perkataan, 7 praset gaya, 8 font, 99-bahasa Whisper STT. Sentiasa bakar-dalam.

Bagaimana untuk Guna Penjana Caption AI

1
Masukkan input anda

Taip teks, muat naik fail, atau jelaskan apa yang anda mahu. Tiada akaun diperlukan.

2
Klik cipta

AI kami memproses permintaan anda dalam beberapa saat menggunakan model sumber terbuka terbaik.

3
Muat turun & kongsi

Muat turun, salin, atau kongsi hasil anda. Muat turun percuma untuk kegunaan peribadi dan komersial.

Guna alat ini melalui API

Automatikkan alat ini dari kod anda sendiri. Titik akhir REST serasi OpenAI, pengesahan token-pemegang, tiada SDK tambahan diperlukan. Kos token sepadan dengan antaramuka web.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

Penjana Caption AI — FAQ

Bakar caption gaya viral ke dalam mana-mana video dengan animasi waktu karaoke perkataan-perkataan. Berbeza dari /video/subtitle/: subtitle output fail sidecar SRT/VTT yang pemain togol pada/off. Caption sentiasa dibakar, gaya-pertama, dan diset untuk TikTok / Reels / Shorts di mana caption mesti dikodkan keras ke dalam setiap bingkai.

Empat langkah: (1) ekstrak audio mono 16kHz dari video anda, (2) transkripsi dengan Whisper large-v3 untuk waktu perkataan 99-bahasa, (3) bina fail subtajuk ASS dengan tag waktu karaoke \kf tahap perkataan, (4) ffmpeg membakar ASS ke dalam setiap bingkai menggunakan libass untuk teks anti-alias bersih.

50 token per saat (minimum 2,000-token). Klip 30 saat adalah ~2,000 token (lantai masuk); klip 60 saat adalah ~3,000; klip 3 minit adalah ~9,000. STT memandu kebanyakan kos; pembakaran-dalam menambah sekitar 25% di atas.

Tujuh: TikTok Neon (Montserrat kuning, perkataan demi perkataan), YouTube Lowerthird (Roboto putih dalam kotak bercahaya), Meme (Impact putih dengan garisan hitam), Podcast (Poppins dalam kotak bulat gelap), Keynote (Arial Black di atas), Cinematic (Italic Oswald di bawah), dan TED (Roboto disusun kiri).

Ya. Papan kekunci Font menetapkan preset dengan Impact, Montserrat, Bebas Neue, Arial Black, Oswald, Poppins, Anton, atau Roboto. Pemilih Warna Penonjolan mengawal penonjolan perkataan- perkataan (apa- apa heks). Posisi membolehkan anda menetapkan atas / tengah / bawah tanpa mengira preset.

Ya — 99 bahasa melalui Whisper. Autokesan berfungsi pada 99% klip. Anda boleh paksa bahasa jika Whisper salah-kesan (biasa pada klip pendek di bawah 5 saat atau audio bahasa-campuran).

Tidak. Jika tiada dialog yang diucapkan, Whisper tidak mengembalikan segmen dan kami akan menunjukkan ralat "Tiada ucapan dikesan" yang jelas supaya anda tidak membakar token pada kerja yang mustahil.

CapCut adalah percuma, berfungsi luar talian selepas pemasangan, dan mempunyai auto-caption yang hebat - jika CapCut sudah menjadi editor anda, gunakannya di sana. Penjana Caption AI melepasi pemasangan dan memberikan anda akses pelayar mesra-batch. Rantaian Whisper + libass yang mendasari adalah primitif yang sama.

Submagic adalah $20/mo untuk captioning tanpa had dengan puluhan pakej gaya. Opus Clip adalah $30/mo dengan viral long-form-to-short AI clipping bundle. Captions.AI adalah $10/mo pada peranti mudah alih. Semua tiga menggunakan Whisper di bawah; nilai sebenar mereka adalah pustaka gaya dan pengesanan klip. Untuk satu-offs dan volum yang lebih kecil Penjana Caption AI adalah percuma di dalam kolam token anda.

Whisper memberikan setem masa tahap-segmen — kami seragam membagi tempoh segmen di sepanjang perkataan untuk memperolehi waktu per-perkataan. Pada segmen yang diucapkan dengan pantas, perkiraan boleh dialihkan oleh ~0.1 saat. Untuk waktu tepat-bingkai, gunakan fail.ass yang boleh dimuat turun dan sunting dalam Aegisub.

Ya. Selepas eksport, kedua-dua fail MP4 dengan subtitel dan fail.ass mentah boleh dimuat turun — sunting.ass dalam Aegisub jika anda mahu waktu perkataan piksel-sempurna, kemudian bakar semula secara setempat dengan ffmpeg -vf subtitles=file.ass.

Ya. POST bahagian berbilang ke /v1/video/caption/ dengan `file`, `style` (tiktok-neon / youtube-lower / meme / podcast / keynote / cinematic / ted), `font` opsyenal, `highlight_color` (hex), `position`, `language`. Pra-perjalanan: GET /v1/video/caption-quote/?duration=SECS. Snippets di /api/.

Daftar percuma untuk 30,000 token

Cipta Akaun Bebas

Tiada kad kredit diperlukan

Bagaimana anda menilai alat ini?

Love this tool? Share it!