Maaari ko bang makakuha ng SRT subtitles para sa aking video podcast?

Oo - pumili SRT o WebVTT bilang ang output format. Speaker label ay kasama sa inline (SRT) o bilang tags (VTT) na karamihan sa mga modernong manlalaro i-render nang tama.

Ang AI Transcription Live na Pagsalin YouTube transcription Transcript ng pulong Zoom Pagsalin Audio sa Teksto Video sa Teksto Transcript ng Telepono Higit pa →

Podcast transcription

Komersyal na paggamit OK 380+ modelo Walang watermark Walang pag-sign-up na kinakailangan

I-upload ang isang podcast episode at makakuha ng isang malinis, speaker-labeled transcript na may auto-detect kabanata markers mula sa katahimikan gaps. Long-form file hanggang sa 2GB, 99 wika, Whisper-large-v3 katumpakan. Eksport bilang SRT / VTT para sa iyong video podcast, simpleng TXT para sa mga tala ng palabas, o JSON para sa pag-edit sa Descript-style workflows.

I-drag at i-drop ang iyong podcast episode, o mag-click upang mag-browse

MP3, WAV, M4A, OGG, MP4 — mahabang-form na episode hanggang sa 2GB

Wika

Engine

Output format

Label speaker (host / bisita) — label na nagsasalita kapag (+50% token)

Bilang ng mga speaker:

Auto kabanata markers — katahimikan gaps > 2s

Chapter marker ay kinakalkula client-side mula sa segment gaps at nakalakip sa transcript. I-paste ang mga ito sa YouTube o Spotify paglalarawan bilang-ay.

Built para sa podcasters + ipakita editor

Ipakita ang mga tala sa isang paste

I-upload ang episode, i-download ang TXT. Speaker label inline, kabanata timestamps handa para sa iyong Spotify / YouTube paglalarawan, blog post na nakasulat sa 10 minuto sa halip ng4oras.

Video podcast subtitles

Export SRT o WebVTT na may mga label ng speaker. Drop direkta sa Premiere, Final Cut, o DaVinci Resolve — o mag-upload kasama ang iyong YouTube video para sa malinis na mga caption.

Text-based episode pag-edit

JSON export ay nagbibigay sa iyo ng bawat salita na may simulan / katapusan timestamps. Pipe sa Descript, Reaper, o isang pasadyang workflow - i-edit sa pamamagitan ng pag-highlight ng teksto sa halip ng scrubbing.

Paano gumagana ang transcription ng podcast

I-drag ang iyong episode sa drop zone - MP3, WAV, M4A, MP4, hanggang sa 2GB.
Mag-iwan ng mga label ng speaker at mga marker ng kabanata sa (sila ang mga default). Piliin ang iyong output format.
Tingnan namin ang tagal + presyo ito up bago mo gastusin ang anumang mga token. I-click ang I-transcribe.
I-download ang speaker-labeled TXT, SRT, VTT, o JSON. Chapter markers barko kasama, handa na upang i-paste.

Free.ai podcast transcription vs Descript, Riverside, Otter

Katangian	Free.ai	Descript	Riverside	Otter.ai
Presyo	Pay-per-use ($0.003/min)	$15-30/mo	$19/mo	$16.99/mo
Max laki ng file	2 GB	5 GB	Tied to record session	500 MB (varies)
Speaker diarization
Auto kabanata markers	(na batay sa katahimikan)	Manual	—	Paid tier
SRT / VTT pag-export				Paid
Wika	99	22	100+	English-focused
Pamahalaang Panlalawigan ng API		—	—	Limited

Ang pagpepresyo ng kakumpitensya ay sumasalamin sa mga pampublikong nakalistang antas sa 2026. Tingnan ang bawat provider para sa kasalukuyang mga plano.

I-translate ang podcast sa teksto na may AI para sa libreng. Speaker label, kabanata marker, SRT pag-export.

Paano Gumamit Podcast transcription

Ipasok ang iyong input

Mag-type ng teksto, mag-upload ng isang file, o ilarawan kung ano ang gusto mo. Walang account na kinakailangan.

Mag-click upang makabuo

Ang aming AI proseso ng iyong kahilingan sa ilang segundo gamit ang pinakamahusay na mga modelo ng open-source.

I-download at ibahagi

I-download, kopyahin, o ibahagi ang iyong resulta. Libre para sa personal at komersyal na paggamit.

Gamitin ang tool na ito sa pamamagitan ng API

Automate ang tool na ito mula sa iyong sariling code. OpenAI-compatible REST endpoint, Bearer-token auth, walang karagdagang SDK na kinakailangan. Token gastos tugma sa web interface.

API Dokumentasyon Kumuha ng API Key

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Kaakibat na Libreng AI Mga Tool

Ang AI Transcription

Live na Pagsalin

YouTube transcription

Transcript ng pulong

Zoom Pagsalin

Audio sa Teksto

Video sa Teksto

Transcript ng Telepono

Podcast transcription — FAQ

Ang mga format ng output ay kinabibilangan ng SRT + VTT para sa mga video clip na nagpapakita ng mga tala, karaniwang TXT para sa mga post sa blog, at naka-istrakturang JSON na may mga timestamp sa bawat pag-ikot + mga label ng tagapagsalita para sa pag-edit sa mga workflow na estilo ng Descript.

Hanggang sa 2GB bawat file — humigit-kumulang sa isang 14-oras na audio podcast sa 128 kbps MP3. Mahabang mga file ay chunked server-side para sa paglaban; makakuha ka ng isang solong pinagsama transcript pabalik.

Oo. Speaker diarization ay ON sa pamamagitan ng default. Natuklasan namin 2-10 natatanging boses sa pamamagitan ng ECAPA boses embeddings, label ang mga ito Speaker 1 / 2 /... at ilapat ang mga label sa bawat segment. Maaari mong palitan ang pangalan ng mga ito sa resulta ng view.

Silence gaps mas mahaba kaysa sa2segundo - ang natural na breaks podcasters gamitin sa pagitan ng mga segment. Ang bawat kabanata ay makuha ng isang timestamp maaari mong i-paste nang direkta sa iyong mga palabas-notes na may isang "Chapters:" block para sa YouTube + Spotify.

Ang Descript ay may bayad na $15-$30 kada buwan para sa 10 oras ng transcription, na nakatali sa kanilang editor. Ang aming bayad ay bawat paggamit sa ~500 tokens/min sa Whisper ($5 = 200K tokens = ~400 minuto), walang subscription, simpleng pag-export na maaari mong i-paste saanman.

Ang Riverside ay isang recording studio na nag-transscribe ng iyong sariling mga session para sa libreng sa loob ng kanilang app, ngunit pagkatapos lamang ng pag-record sa kanila. Nag-transscribe kami ng anumang MP3 / WAV / MP4 anuman ang lugar kung saan ito ay naitala.

Otter caps sa 300 minuto / buwan sa libreng antas at ay Ingles-focused. Suportahan namin 99 wika sa parehong Whisper-large-v3 katumpakan na walang buwanang cap - magbayad ka sa bawat minuto transcribed.

Oo - pumili SRT o WebVTT bilang ang output format. Speaker label ay kasama sa inline (SRT) o bilang <v Speaker N> tags (VTT) na karamihan sa mga modernong manlalaro i-render nang tama.

Whisper-large-v3 humahawak musika kama at liwanag reverb mabuti (karaniwang salita-error rate 3-7%). Napaka-matinding musika o mabigat na pagkakalat degrades katumpakan - isaalang-alang ang pagpapatakbo / musika / boses-remover / unang sa isang kopya, o paghihiwalay ng iyong malamig na bubukas.

Ang isang ~30-minutong episode ay karaniwang may5hanggang 10 brand/name corrections na dapat i-apply nang manu-mano.

I-upload ang mga ito ng isa sa isang oras dito, o gamitin ang aming / batch / tampok sa sandaling naka-sign in upang queue up ng isang panahon. Ang API sa / api / din tinatanggap POST / v1 / stt / para sa programatic batching.

Hindi. Ang mga na-upload na file ay tinanggal pagkatapos makumpleto ang transcription. Ang iyong transcript ay nakaupo sa iyong /account/ history para sa pag-download kung naka-sign in; ang mga anonymous na gumagamit ay makuha ng isang 24-oras na link sa pagbabahagi.

Mag-sign up para sa libreng 30,000 token

Mag-sign up para sa isang libreng account

Walang credit card kinakailangan

Paano mo i-rate ang tool na ito?

Podcast transcription

Built para sa podcasters + ipakita editor

Ipakita ang mga tala sa isang paste

Video podcast subtitles

Text-based episode pag-edit

Paano gumagana ang transcription ng podcast

Free.ai podcast transcription vs Descript, Riverside, Otter

Resulta

Paano Gumamit Podcast transcription

Ipasok ang iyong input

Mag-click upang makabuo

I-download at ibahagi

Gamitin ang tool na ito sa pamamagitan ng API

Kaakibat na Libreng AI Mga Tool

Podcast transcription — FAQ

Paano ang transcription ng podcast ay naiiba mula sa generic na tool?

Ano ang pinakamahabang podcast na maaari mong isalin?

Awtomatikong i-label mo ba ang mga speaker?

Ano ang mga marka ng kabanata batay sa?

Paano ito ihahambing sa Descript?

Paano ito maihahambing sa Riverside?

Paano ito maihahambing sa Otter.ai?

Maaari ko bang makakuha ng SRT subtitles para sa aking video podcast?

Ano ang katumpakan dapat kong asahan sa mga podcast na may musika kama?

Nakilala ba nito ang mga branded na termino at mga pangalan ng bisita?

Maaari ko bang iproseso ang maraming mga episode nang sabay-sabay?

Iimbak ba ang aking audio pagkatapos ng transcription?

Kumuha ng 10,000 libreng token

Maghintay — Kumuha ng 10K Libreng Token!

Gusto mo ng higit pa?