Podcast transcription

Komersyal na paggamit OK 380+ modelo Walang watermark Walang pag-sign-up na kinakailangan
Modelo:
+ GPT-5, Claude, Gemini
I-upload ang isang podcast episode at makakuha ng isang malinis, speaker-labeled transcript na may auto-detect kabanata markers mula sa katahimikan gaps. Long-form file hanggang sa 2GB, 99 wika, Whisper-large-v3 katumpakan. Eksport bilang SRT / VTT para sa iyong video podcast, simpleng TXT para sa mga tala ng palabas, o JSON para sa pag-edit sa Descript-style workflows.

I-drag at i-drop ang iyong podcast episode, o mag-click upang mag-browse

MP3, WAV, M4A, OGG, MP4 — mahabang-form na episode hanggang sa 2GB

Chapter marker ay kinakalkula client-side mula sa segment gaps at nakalakip sa transcript. I-paste ang mga ito sa YouTube o Spotify paglalarawan bilang-ay.
Token pagtatantya para sa clip na ito
Podcast transcript
Auto-natuklasan kabanata

Pag-translate ng iyong podcast...

Mahabang episodes tumagal ng ilang minuto. Maaari mong isara ang tab na ito kung email-kapag-tapos ay na-check.

Built para sa podcasters + ipakita editor

Ipakita ang mga tala sa isang paste

I-upload ang episode, i-download ang TXT. Speaker label inline, kabanata timestamps handa para sa iyong Spotify / YouTube paglalarawan, blog post na nakasulat sa 10 minuto sa halip ng4oras.

Video podcast subtitles

Export SRT o WebVTT na may mga label ng speaker. Drop direkta sa Premiere, Final Cut, o DaVinci Resolve — o mag-upload kasama ang iyong YouTube video para sa malinis na mga caption.

Text-based episode pag-edit

JSON export ay nagbibigay sa iyo ng bawat salita na may simulan / katapusan timestamps. Pipe sa Descript, Reaper, o isang pasadyang workflow - i-edit sa pamamagitan ng pag-highlight ng teksto sa halip ng scrubbing.

Paano gumagana ang transcription ng podcast

  1. I-drag ang iyong episode sa drop zone - MP3, WAV, M4A, MP4, hanggang sa 2GB.
  2. Mag-iwan ng mga label ng speaker at mga marker ng kabanata sa (sila ang mga default). Piliin ang iyong output format.
  3. Tingnan namin ang tagal + presyo ito up bago mo gastusin ang anumang mga token. I-click ang I-transcribe.
  4. I-download ang speaker-labeled TXT, SRT, VTT, o JSON. Chapter markers barko kasama, handa na upang i-paste.

Free.ai podcast transcription vs Descript, Riverside, Otter

Katangian Free.ai Descript Riverside Otter.ai
PresyoPay-per-use ($0.003/min)$15-30/mo$19/mo$16.99/mo
Max laki ng file2 GB5 GBTied to record session500 MB (varies)
Speaker diarization
Auto kabanata markers (na batay sa katahimikan)ManualPaid tier
SRT / VTT pag-exportPaid
Wika9922100+English-focused
Pamahalaang Panlalawigan ng APILimited
Ang pagpepresyo ng kakumpitensya ay sumasalamin sa mga pampublikong nakalistang antas sa 2026. Tingnan ang bawat provider para sa kasalukuyang mga plano.
Advanced na mga pagpipilian
Resulta
Ang mga token ay tumatakbo sa low. Kumuha ng Higit pang mga Tokens
Gusto mo ng mas mahusay na mga resulta? Premium modelo Ang 8 (walo) ay isang likas na bilang at bilang rasyonal na pagkatapos ng 7. Tingnan ang mga Plano

❤️ Ibig Free.ai? Sabihin sa iyong mga kaibigan!

Ang Sign up ay makuha ng isang referral link at kumita ng 25,000 tokens bawat kaibigan.

Gusto mo ng higit pa? Mag-sign up para sa libreng 30K tokens / araw + 10K bonus
Mag-sign up para sa libreng

Pagpoproseso ng iyong kahilingan...

I-translate ang podcast sa teksto na may AI para sa libreng. Speaker label, kabanata marker, SRT pag-export.

Paano Gumamit Podcast transcription

1
Ipasok ang iyong input

Mag-type ng teksto, mag-upload ng isang file, o ilarawan kung ano ang gusto mo. Walang account na kinakailangan.

2
Mag-click upang makabuo

Ang aming AI proseso ng iyong kahilingan sa ilang segundo gamit ang pinakamahusay na mga modelo ng open-source.

3
I-download at ibahagi

I-download, kopyahin, o ibahagi ang iyong resulta. Libre para sa personal at komersyal na paggamit.

Gamitin ang tool na ito sa pamamagitan ng API

Automate ang tool na ito mula sa iyong sariling code. OpenAI-compatible REST endpoint, Bearer-token auth, walang karagdagang SDK na kinakailangan. Token gastos tugma sa web interface.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Podcast transcription — FAQ

Ang mga format ng output ay kinabibilangan ng SRT + VTT para sa mga video clip na nagpapakita ng mga tala, karaniwang TXT para sa mga post sa blog, at naka-istrakturang JSON na may mga timestamp sa bawat pag-ikot + mga label ng tagapagsalita para sa pag-edit sa mga workflow na estilo ng Descript.

Hanggang sa 2GB bawat file — humigit-kumulang sa isang 14-oras na audio podcast sa 128 kbps MP3. Mahabang mga file ay chunked server-side para sa paglaban; makakuha ka ng isang solong pinagsama transcript pabalik.

Oo. Speaker diarization ay ON sa pamamagitan ng default. Natuklasan namin 2-10 natatanging boses sa pamamagitan ng ECAPA boses embeddings, label ang mga ito Speaker 1 / 2 /... at ilapat ang mga label sa bawat segment. Maaari mong palitan ang pangalan ng mga ito sa resulta ng view.

Silence gaps mas mahaba kaysa sa2segundo - ang natural na breaks podcasters gamitin sa pagitan ng mga segment. Ang bawat kabanata ay makuha ng isang timestamp maaari mong i-paste nang direkta sa iyong mga palabas-notes na may isang "Chapters:" block para sa YouTube + Spotify.

Ang Descript ay may bayad na $15-$30 kada buwan para sa 10 oras ng transcription, na nakatali sa kanilang editor. Ang aming bayad ay bawat paggamit sa ~500 tokens/min sa Whisper ($5 = 200K tokens = ~400 minuto), walang subscription, simpleng pag-export na maaari mong i-paste saanman.

Ang Riverside ay isang recording studio na nag-transscribe ng iyong sariling mga session para sa libreng sa loob ng kanilang app, ngunit pagkatapos lamang ng pag-record sa kanila. Nag-transscribe kami ng anumang MP3 / WAV / MP4 anuman ang lugar kung saan ito ay naitala.

Otter caps sa 300 minuto / buwan sa libreng antas at ay Ingles-focused. Suportahan namin 99 wika sa parehong Whisper-large-v3 katumpakan na walang buwanang cap - magbayad ka sa bawat minuto transcribed.

Oo - pumili SRT o WebVTT bilang ang output format. Speaker label ay kasama sa inline (SRT) o bilang <v Speaker N> tags (VTT) na karamihan sa mga modernong manlalaro i-render nang tama.

Whisper-large-v3 humahawak musika kama at liwanag reverb mabuti (karaniwang salita-error rate 3-7%). Napaka-matinding musika o mabigat na pagkakalat degrades katumpakan - isaalang-alang ang pagpapatakbo / musika / boses-remover / unang sa isang kopya, o paghihiwalay ng iyong malamig na bubukas.

Ang isang ~30-minutong episode ay karaniwang may5hanggang 10 brand/name corrections na dapat i-apply nang manu-mano.

I-upload ang mga ito ng isa sa isang oras dito, o gamitin ang aming / batch / tampok sa sandaling naka-sign in upang queue up ng isang panahon. Ang API sa / api / din tinatanggap POST / v1 / stt / para sa programatic batching.

Hindi. Ang mga na-upload na file ay tinanggal pagkatapos makumpleto ang transcription. Ang iyong transcript ay nakaupo sa iyong /account/ history para sa pag-download kung naka-sign in; ang mga anonymous na gumagamit ay makuha ng isang 24-oras na link sa pagbabahagi.

Mag-sign up para sa libreng 30,000 token

Mag-sign up para sa isang libreng account

Walang credit card kinakailangan

Paano mo i-rate ang tool na ito?

Ibig Free.ai? Sabihin sa iyong mga kaibigan!