Transcrición de podcasts

Uso comercial aceptado Máis de 380 modelos Sen marca de auga Non é preciso rexistrarse
Modelo:
+ GPT-5, Claude, Gemini
Envíe un episodio de podcast e obteña unha transcrición limpa e etiquetada polo orador con marcadores de capítulos detectados automaticamente a partir de espazos de silencio. Ficheiros de formato longo de ata 2 GB, 99 linguas, precisión Whisper-large-v3. Exporte como SRT/VTT para o seu podcast de vídeo, TXT simple para as notas do programa ou JSON para editar en fluxos de traballo ao estilo Descript.

Arrastre e solte o episodio do podcast ou prema para examinar

MP3, WAV, M4A, OGG, MP4 — episodios longos de ata 2 GB

Os marcadores de capítulos son calculados polo cliente a partir dos espazos entre segmentos e unidos á transcrición. Apegue os marcadores nas descricións de YouTube ou Spotify tal e como están.
Estimación de token para este clip
Transcrición do podcast
Capítulos detectados automaticamente

A transcreber o podcast...

Os episodios longos tardan varios minutos. Pode pechar esta lingüeta se sinala enviar un correo electrónico cando remate.

Desenvolvido para podcasters e editores de programas

Mostrar as notas nunha única vez

Envíe o episodio, descargue o TXT. Etiquetas do orador en liña, marcas de tempo de capítulos listas para a súa descrición de Spotify/ YouTube, entrada de blogue escrita en 10 minutos en vez de 4 horas.

Subtítulos de podcast de vídeo

Exporte SRT ou WebVTT con etiquetas de locutor. Deixe directamente en Premiere, Final Cut ou DaVinci Resolve — ou envíe xunto co seu vídeo de YouTube para obter subtítulos limpos.

Edición de episodios baseada en texto

A exportación a JSON dálle cada palabra con marcas de tempo de inicio/ fin. Conduza a Descript, Reaper ou un fluxo de traballo personalizado — edite realzando o texto no canto de limpalo.

Como funciona a transcrición de podcasts

  1. Arrastre o seu episodio á zona de soltar — MP3, WAV, M4A, MP4, ata 2 GB.
  2. Deixar activadas as etiquetas do orador e os marcadores de capítulo (son os predeterminados). Escolla o formato de saída.
  3. Comprobaremos a duración e subiremos o prezo antes de que gastes ningún token. Prema en Transcribir.
  4. Obter TXT, SRT, VTT ou JSON etiquetados polo orador. Os marcadores de capítulo envíanse xuntos, listos para apegar.

Free.ai transcripción de podcast vs Descript, Riverside, Otter

Característica Free.ai Descript Riverside Otter.ai
PrezoPay-per-use ($0.003/min)$15-30/mo$19/mo$16.99/mo
Tamaño máximo do ficheiro2 GB5 GBTied to record session500 MB (varies)
Diarización do falante
Marcadores automáticos de capítulo (baseado no silencio)ManualPaid tier
Exportación SRT/ VTTPaid
Linguas9922100+English-focused
API públicaLimited
Os prezos dos competidores reflicten os niveis listados publicamente en 2026. Comprobe cada provedor para os plans actuais.
Opcións avanzadas
Resultado
A faltar fichas. Obter máis fichas
Queres mellores resultados? Modelos Premium (GPT-5, Claude, Gemini) ofrecen unha calidade superior. Ver os planos

❤️ Amas Free.ai?

Regístrese para obter unha ligazón de referencia e gañar 25.000 tokens por amigo.

Queres máis? Inscríbete gratis para 30K tokens/día + 10K de bonificación
Inscríbete gratis

A procesar o seu pedido...

Transcreba podcasts a texto con IA de balde. Etiquetas de orador, marcadores de capítulo, exportación SRT.

Como usar Transcrición de podcasts

1
Introduza a súa entrada

Escriba texto, envíe un ficheiro ou describa o que queira. Non se precisa conta.

2
Prema para xerar

A nosa IA procesa a túa solicitude en segundos empregando os mellores modelos de código aberto.

3
Obter e compartir

Obteña, copie ou comparta o seu resultado. Gratuito para uso persoal e comercial.

Empregar esta ferramenta mediante API

Automatice esta ferramenta a partir do seu propio código. Punto final REST compatíbel con OpenAI, autenticación por token de portador, non se require SDK adicional. Os custos dos tokens son iguais aos da interface web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Transcrición de podcasts — FAQ

A ferramenta de podcasts emprega por omisión a diarización do orador e marcadores de capítulo (detección de silencio > 2s) e admite ficheiros de formato longo de ata 2 GB. Os formatos de saída inclúen SRT + VTT para clips de vídeo de notas de presentación, TXT simple para entradas de blogue e JSON estruturado con marcas de tempo por turno + etiquetas do orador para editar en fluxos de traballo ao estilo de Descript.

Ata 2 GB por ficheiro — aproximadamente un podcast de son de 14 horas a 128 kbps MP3. Os ficheiros longos son fragmentados no servidor para a súa resiliencia; obtén unha única transcrición fusionada.

Si. A diarización do falante está activada por omisión. Detectamos 2- 10 voces distintas mediante a incorporación de voces ECAPA, rótulas Falante 1 / 2 /... e aplicamos as etiquetas a cada segmento. Pode mudarlles o nome na vista de resultados.

Os intervalos de silencio son máis longos que 2 segundos, as pausas naturais que os podcasters usan entre segmentos. Cada capítulo obtén un selo de data/ hora que pode apegar directamente nas súas notas de emisión cun bloque « Capítulos: » para YouTube + Spotify.

Descript cobra entre 15 e 30 dólares por mes por 10 horas de transcrición, vinculadas ao seu editor. Cobramos por uso ~500 tokens/ min en Whisper ($5 = 200K tokens = ~400 minutos), sen subscrición, exportación simple que pode apegar en calquera lugar.

Riverside é un estudio de gravación que transcribe as súas propias sesións de balde dentro da súa aplicación, pero só despois de gravar con eles. Transcribimos calquera MP3/WAV/MP4 independentemente de onde se gravase.

Otter ten un límite de 300 minutos/ mes no nivel gratuíto e está centrado no inglés. Apoiamos 99 linguas coa mesma precisión de Whisper- large- v3 sen límite mensual — paga por minuto transcrito.

Si, escolla SRT ou WebVTT como formato de saída. As etiquetas dos oradores inclúense en liña (SRT) ou como etiquetas < v Speaker N > (VTT) que a maioría dos reprodutores modernos renderizan correctamente.

Whisper- large- v3 xestiona ben as camas musicais e a reverberación lixeiramente (típica taxa de erro de palabras de 3- 7%). A música moi alta ou a sobreposición pesada degrada a precisión; considere executar / music/ vocal- remover / primeiro nunha copia, ou dividir as súas aberturas frías.

Whisper xestiona a maioría dos nomes comúns, pero a xerga moi específica da marca pode precisar unha pasada de post- edición. Un episodio de ~30 minutos normalmente ten 5- 10 correccións de marca/ nome para aplicar manualmente.

Envíeos aquí un por un, ou empregue a función / batch/ unha vez que inicie sesión para poñer en fila unha tempada. A API en / api / tamén acepta POST / v1/ stt / para o envío por lotes por programa.

Non. Os ficheiros enviados son eliminados despois de que a transcrición remate. A transcrición está no seu historial de / account / para descarga se está conectado; os usuarios anónimos reciben unha ligazón de compartición de 24 horas.

Inscríbete gratis para obter 30.000 tokens

Crear unha conta libre

Non se require tarxeta de crédito

Como valora esta ferramenta?

Amas Free.ai?