Podcast transkripsiyonu

Ticari kullanım için uygun 380+ model Su işareti yok Kayıt gerekmiyor
Model:
+ GPT-5, Claude, Gemini
Bir podcast bölümü yükleyin ve sessizlik boşluklarından otomatik olarak tespit edilen bölüm işaretleriyle temiz, konuşmacı etiketli bir transkrip alın. 2GB'ye kadar uzun form dosyaları, 99 dil, Whisper-large-v3 doğruluğu. Video podcastiniz için SRT/VTT olarak ihraç edin, gösteri notları için sıradan TXT, veya Descript-stilinde iş akışlarında düzenleme için JSON.

Podcast bölümünü çek ve bırak, ya da taramak için tıkla

MP3, WAV, M4A, OGG, MP4 — uzun bölümler 2GB'ye kadar

Bölüm işaretçileri istemci tarafında segment boşluklarından hesaplanır ve transkripe bağlanır. Onları YouTube veya Spotify tanımlarına olduğu gibi yapıştırın.
Bu klip için token tahmini
Podcast transkripti
Otomatik olarak tespit edilen bölümler

Podcast'inizin kopyalanması...

Uzun bölümler birkaç dakika sürer. Eğer bittikten sonra e-posta ayarları işaretlenmişse bu sekmeyi kapatabilirsiniz.

Podcasterler + program editörü için inşa edilmiştir

Notları tek bir yapıştırmada göster

Bölümü yükle, TXT'yi indir, konuşmacı etiketleri, bölüm zaman damgaları Spotify/YouTube tanımınız için hazır, blog yazısı 4 saat yerine 10 dakikada yazılmıştır.

Video podcast altyazıları

SRT veya WebVTT'yi hoparlör etiketleriyle ihraç edin. Doğrudan Premiere, Final Cut veya DaVinci Resolve'a bırakın — veya YouTube videonuzun yanında temiz altyazılar için yükleyin.

Metin tabanlı bölüm düzenlemesi

JSON ihracat her kelimeyi başlangıç/son zaman damgalarıyla verir. Descript, Reaper veya özel bir çalışma akışına aktarır — temizlemek yerine metni işaretleyerek düzenler.

Podcast transkripsiyonu nasıl çalışır

  1. Bölümünüzü bırakma bölgesine çekin — MP3, WAV, M4A, MP4, 2GB'ye kadar.
  2. Seslendirici etiketleri ve bölüm işaretçilerini açık bırakın (varsayılanlardır). Çıkış biçiminizi seçin.
  3. Herhangi bir token harcamadan önce süreyi kontrol ediyoruz ve fiyatını yükseltiyoruz.
  4. Konuşmacı etiketli TXT, SRT, VTT veya JSON'u indirin. Bölüm işaretçileri yan yana gönderilir, yapıştırmaya hazır.

Free.ai podcast transkripsiyonu vs Descript, Riverside, Otter

Özellik Free.ai Descript Riverside Otter.ai
FiyatıPay-per-use ($0.003/min)$15-30/mo$19/mo$16.99/mo
Dosya boyutu2 GB5 GBTied to record session500 MB (varies)
Konuşmacı diyaliz
Otomatik bölüm işaretleyicileri (Sessizlik-tabanlı)ManualPaid tier
SRT/VTT ihraçPaid
Dilleri9922100+English-focused
Kamu APILimited
Rakip fiyatlandırma 2026'da halka açık seviyeleri yansıtıyor. her sağlayıcı için mevcut planları kontrol edin.
Gelişmiş seçenekler
Sonuç
Jetonlar tükeniyor. Daha Fazla Token Al
Daha iyi sonuçlar mı istiyorsun? Premium modelleri (GPT-5, Claude, Gemini) daha yüksek kalite sağlar. Planları Göster
Daha fazlasını ister misin? Günde 30K token + 10K bonus için ücretsiz kayıt olun
Ücretsiz kayıt ol

İstekiniz işleme alınıyor...

Podcast'leri yapay zeka ile ücretsiz olarak metin haline çevirin. Konuşmacı etiketleri, bölüm işaretçileri, SRT ihracat.

Nasıl Kullanılır Podcast transkripsiyonu

1
Girişinizi girin

Metin yazın, bir dosya yükleyin veya istediğinizi açıklayın. Hesap gerekmez.

2
Üretme için tıkla

Yapay zekamız en iyi açık kaynak modellerini kullanarak talebinizi saniyeler içinde işleme alacaktır.

3
İndir & Paylaş

Sonuçlarınızı indirin, kopyalayın veya paylaşın. Kişisel ve ticari kullanım için ücretsiz.

Bu aracı API üzerinden kullan

Bu aracı kendi kodunuzdan otomatikleştirin. OpenAI uyumlu REST son noktası, taşıyıcı-token kimlik doğrulama, ekstra SDK gerekmiyor. Token maliyeti web arayüzü ile aynıdır.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Podcast transkripsiyonu — FAQ

Podcast aracı varsayılan olarak konuşmacı diarizasyonu ve bölüm işaretçilerine (sessizlik-aralık tespiti > 2s) ve 2GB'ye kadar uzun form dosyalarını destekler. Çıkış biçimleri gösteri-not video klipleri için SRT + VTT, blog yazıları için basit TXT ve Descript-stilinde düzenleme için döngü başına zaman damgaları + konuşmacı etiketleriyle yapılmış JSON'u içerir.

Dosya başına 2 GB'a kadar — yaklaşık 14 saatlik bir ses podcasti 128 kbps MP3'te. Uzun dosyalar dayanıklılık için sunucu tarafında parçalara ayrılır; tek birleştirilmiş bir kopya geri alırsınız.

Evet. Hoparlör diyarizasyonu varsayılan olarak OFF' tur. ECAPA ses entegreleri aracılığıyla 2- 10 farklı ses tespit ediyoruz, onları Hoparlör 1 / 2 /... etiketleri ile etiketliyoruz ve etiketleri her segmente uyguluyoruz. Sonuç görüntüsünde onları yeniden adlandırabilirsiniz.

Sessizlik araları 2 saniyeden uzundur — podcasterlerin segmentler arasında kullandığı doğal aralar. Her bölüm, YouTube + Spotify için "Chapters:" bloğu ile doğrudan gösteri notlarınıza yapıştırabileceğiniz bir zaman damgası alır.

Descript, 10 saatlik bir transkrip için ayda 15-30 dolar ödüyorlar, editörlerine bağlı olarak. Whisper'da kullanım başına 500 token/minute (5 dolar = 200 bin token = 400 dakika) ödüyoruz, abonelik yok, herhangi bir yere yapıştırabileceğiniz basit bir ihracat.

Riverside, uygulamaları içinde kendi ses kayıtlarınızı ücretsiz olarak kopyalayan bir kayıt stüdyosudur, ancak sadece onlarla kaydettikten sonra. Nerede kaydedildiyse, herhangi bir MP3/WAV/MP4'ü kopyalıyoruz.

Otter ücretsiz seviyede ayda 300 dakika sınırı koymuş ve İngilizceye odaklanmıştır. Aylık sınır olmadan aynı Whisper-large-v3 doğruluğuyla 99 dilde destek veriyoruz - transkripsiyon için dakika başına ödeme yapıyorsun.

Evet — çıkış biçimi olarak SRT veya WebVTT'yi seçin. Seslendirici etiketleri çoğu modern çalgıların doğru şekilde gösterdiği inline (SRT) veya <v Speaker N> etiketleri (VTT) olarak dahil edilir.

Whisper-large-v3 müzik yatakları ve ışık yankılarını iyi yönetir (tipik sözcük hata oranı 3-7%). Çok yüksek sesli müzik veya ağır örtüşme doğruluğu düşürür - bir kopya üzerinde önce /music/vocal-remover/'ı çalıştırmayı düşünün, ya da soğuk açılışlarınızı bölmeyi düşünün.

Whisper en yaygın isimlerle başa çıkar, ancak çok markaya özgü jargon bir post-edit geçişine ihtiyaç duyabilir. ~ 30 dakikalık bir bölüm genellikle elle uygulanacak 5-10 marka / isim düzeltmesine sahiptir.

Burada birer birer yükleyin, ya da bir sezon için kuyruğa girdiğinizde /batch/ özelliğimizi kullanın. /api/'deki API, programlı paketleme için POST /v1/stt/'yi de kabul eder.

Hayır. Yüklenen dosyalar, metin çevirisi tamamlandıktan sonra silinir. Yazılıma giriş yaptıysanız metin çevirisini /account/ geçmişinizde indirebilirsiniz; anonim kullanıcılar 24 saatlik paylaşım bağlantısı alır.

30.000 token için ücretsiz kayıt olun

Ücretsiz Hesap Yarat

Kredi kartı gerekmiyor

Bu aracı nasıl değerlendirirsin?

Love this tool? Share it!