Transkripsi Podcast

Penggunaan komersial OK 380+ model Tiada tanda air Tiada pendaftaran diperlukan
Model:
+ GPT-5, Claude, Gemini
Muat naik episod podcast dan dapatkan transkripsi yang bersih, dilabelkan oleh pembicara dengan penanda bab yang dikesan secara automatik dari celah-celah kesunyian. Fail bentuk panjang sehingga 2GB, 99 bahasa, ketepatan Whisper-large-v3. Eksport sebagai SRT/VTT untuk podcast video anda, TXT biasa untuk catatan pameran, atau JSON untuk penyuntingan dalam aliran kerja gaya Descript.

Seret dan lepaskan episod podcast anda, atau klik untuk melayari

MP3, WAV, M4A, OGG, MP4 — episod bentuk panjang sehingga 2GB

Penanda bab dikira di sisi klien dari jurang segmen dan dilampirkan ke transkripsi. Tampal mereka ke dalam huraian YouTube atau Spotify seperti-ada.
Kiraan token untuk klip ini
Transkripsi Podcast
Bab yang dikesan secara automatik

Mentranskripsikan podcast anda...

Episod panjang mengambil beberapa minit. Anda boleh tutup tab ini jika emel-bila- selesai ditanda.

Dibina untuk podcaster + penyunting tayangan

Papar nota dalam satu tepek

Muat naik episod, muat turun TXT. Label Speaker dalam baris, bab timestamps sedia untuk Spotify/YouTube keterangan anda, blog post ditulis dalam 10 minit bukannya 4 jam.

Subtajuk podcast video

Eksport SRT atau WebVTT dengan label pembicara. Drop terus ke Premiere, Final Cut, atau DaVinci Resolve — atau muat naik bersama video YouTube anda untuk caption bersih.

Edit episod berbasis teks

Eksport JSON memberikan anda setiap perkataan dengan setem masa mula/akhir. Salurkan ke Descript, Reaper, atau aliran kerja tersendiri — sunting dengan menonjolkan teks bukannya mencuci.

Bagaimana transkripsi podcast berfungsi

  1. Seret episod anda ke zon jatuh — MP3, WAV, M4A, MP4, sehingga 2GB.
  2. Tinggalkan label pembicara dan penanda bab pada (ia adalah piawai). Pilih format output anda.
  3. Kami memeriksa tempoh + harga sebelum anda menghabiskan sebarang token. Klik Transkrip.
  4. Muat turun TXT, SRT, VTT, atau JSON berlabel-penyemak. Penanda bab dihantar bersama, sedia untuk dilekatkan.

Free.ai transkripsi podcast vs Descript, Riverside, Otter

Ciri Free.ai Descript Riverside Otter.ai
HargaPay-per-use ($0.003/min)$15-30/mo$19/mo$16.99/mo
Saiz fail maksimum2 GB5 GBTied to record session500 MB (varies)
Diarisasi Speaker
Auto tanda bab (berdasarkan-kesedihan)ManualPaid tier
Eksport SRT/VTTPaid
Bahasa9922100+English-focused
API AwamLimited
Harga pesaing mencerminkan peringkat yang tersenarai secara awam pada 2026. Semak setiap pembekal untuk rancangan semasa.
Opsyen Lanjutan
Hasil
Token semakin habis. Dapatkan Lebih Token
Nak hasil yang lebih baik? Model premium (GPT-5, Claude, Gemini) memberikan kualiti yang lebih tinggi. Lihat Reka Bentuk

❤️ Love this tool? Share it!

Mendaftar untuk mendapatkan pautan rujukan dan memperoleh 25,000 token per rakan.

Nak lagi? Daftar percuma untuk 30K token/hari + 10K bonus
Daftar Masuk

Memproses permintaan anda...

Tulis semula podcast ke teks dengan AI secara percuma. Label pembicara, penanda bab, eksport SRT.

Bagaimana untuk Guna Transkripsi Podcast

1
Masukkan input anda

Taip teks, muat naik fail, atau jelaskan apa yang anda mahu. Tiada akaun diperlukan.

2
Klik cipta

AI kami memproses permintaan anda dalam beberapa saat menggunakan model sumber terbuka terbaik.

3
Muat turun & kongsi

Muat turun, salin, atau kongsi hasil anda. Muat turun percuma untuk kegunaan peribadi dan komersial.

Guna alat ini melalui API

Automatikkan alat ini dari kod anda sendiri. Titik akhir REST serasi OpenAI, pengesahan token-pemegang, tiada SDK tambahan diperlukan. Kos token sepadan dengan antaramuka web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Transkripsi Podcast — FAQ

Alat podcast piawai untuk diarisi pembicara dan penanda bab (pengesanan kesempitan-kesempitan >2s), dan menyokong fail bentuk panjang sehingga 2GB. Format output termasuk SRT + VTT untuk klip video tunjuk-notis, TXT biasa untuk posting blog, dan JSON terstruktur dengan setem masa per-putaran + label pembicara untuk penyuntingan dalam aliran kerja gaya Deskriptif.

Sehingga 2GB setiap fail — kira-kira podcast audio 14 jam pada 128 kbps MP3. Fail panjang dipotong-potong di sisi pelayan untuk ketahanan; anda akan dapat satu transkripsi digabungkan semula.

Ya. Diarisian pembicara adalah ON secara lalai. Kami mengesan 2-10 suara yang berbeza melalui penyembelihan suara ECAPA, melabelkannya sebagai Pembicara 1 / 2 /... dan menerapkan label ke setiap segmen. Anda boleh menamakan semula mereka dalam paparan hasil.

Ketepikan sekatan lebih daripada 2 saat — pemotongan semulajadi yang digunakan oleh podcaster antara segmen. Setiap bab mendapat setem masa yang anda boleh tampal terus ke dalam catatan-pameran anda dengan blok "Bab:" untuk YouTube + Spotify.

Descript dikenakan $15-$30 sebulan untuk 10 jam transkripsi, terikat dengan editor mereka. Kami dikenakan per-kegunaan pada ~500 token/minit pada Whisper ($5 = 200K token = ~400 minit), tiada langganan, eksport biasa anda boleh tampal di mana-mana.

Riverside adalah studio rakaman yang mentranskripsikan sesi anda secara percuma di dalam aplikasi mereka, tetapi hanya selepas merekam dengan mereka. Kami mentranskripsikan sebarang MP3/WAV/MP4 tanpa mengira di mana ia direkodkan.

Otter had pada 300 minit/bulan pada aras percuma dan berfokuskan bahasa Inggeris. Kami menyokong 99 bahasa pada ketepatan Whisper-large-v3 yang sama tanpa had bulanan — anda membayar per minit yang ditranskripsikan.

Ya — pilih SRT atau WebVTT sebagai format output. Label pembicara dimasukkan dalam baris (SRT) atau sebagai tag <v Speaker N> (VTT) yang kebanyakan pemain moden renderkan dengan betul.

Whisper-large-v3 mengendalikan muzik dan reverb cahaya dengan baik (kadar ralat perkataan biasa 3-7%). Musik yang sangat kuat atau tumpang tindih berat menurunkan ketepatan — pertimbangkan jalankan /music/vocal-remover/ pertama pada salinan, atau pecahkan cold opens anda.

Whisper mengendalikan nama yang paling biasa, tetapi jargon yang sangat spesifik kepada jenama mungkin memerlukan laluan pasca-edit. Episod ~30 minit biasanya mempunyai 5-10 pembetulan jenama/nama untuk dilaksanakan secara manual.

Muat naik mereka satu demi satu di sini, atau gunakan ciri /batch/ kami apabila anda log masuk untuk mengira baris demi baris musim. API di /api/ juga menerima POST /v1/stt/ untuk mengira baris demi baris secara program.

Tidak. Fail yang dimuat naik dipadam selepas transkripsi selesai. Transkripsi anda berada dalam /account/ sejarah anda untuk muat turun jika anda log masuk; pengguna anonim mendapat pautan berkongsi 24 jam.

Daftar percuma untuk 30,000 token

Cipta Akaun Bebas

Tiada kad kredit diperlukan

Bagaimana anda menilai alat ini?

Love this tool? Share it!