Podo obter subtítulos SRT para o meu podcast de vídeo?

Si, escolla SRT ou WebVTT como formato de saída. As etiquetas dos oradores inclúense en liña (SRT) ou como etiquetas (VTT) que a maioría dos reprodutores modernos renderizan correctamente.

Transcrición IA Transcrición en directo Transcrición de YouTube Transcrición da reunión Transcrición de zoom Audio para texto Vídeo a texto Transcrición de chamadas telefónicas Máis →

Transcrición de podcasts

Uso comercial aceptado Máis de 380 modelos Sen marca de auga Non é preciso rexistrarse

Envíe un episodio de podcast e obteña unha transcrición limpa e etiquetada polo orador con marcadores de capítulos detectados automaticamente a partir de espazos de silencio. Ficheiros de formato longo de ata 2 GB, 99 linguas, precisión Whisper-large-v3. Exporte como SRT/VTT para o seu podcast de vídeo, TXT simple para as notas do programa ou JSON para editar en fluxos de traballo ao estilo Descript.

Arrastre e solte o episodio do podcast ou prema para examinar

MP3, WAV, M4A, OGG, MP4 — episodios longos de ata 2 GB

Lingua

Motor

Formato de saída

Altofalantes de etiqueta (servidor / convidado) — etiqueta quen está a falar cando (+50% de fichas)

Número de altofalantes:

Marcadores automáticos de capítulo — intervalos de silencio > 2s

Os marcadores de capítulos son calculados polo cliente a partir dos espazos entre segmentos e unidos á transcrición. Apegue os marcadores nas descricións de YouTube ou Spotify tal e como están.

Desenvolvido para podcasters e editores de programas

Mostrar as notas nunha única vez

Envíe o episodio, descargue o TXT. Etiquetas do orador en liña, marcas de tempo de capítulos listas para a súa descrición de Spotify/ YouTube, entrada de blogue escrita en 10 minutos en vez de 4 horas.

Subtítulos de podcast de vídeo

Exporte SRT ou WebVTT con etiquetas de locutor. Deixe directamente en Premiere, Final Cut ou DaVinci Resolve — ou envíe xunto co seu vídeo de YouTube para obter subtítulos limpos.

Edición de episodios baseada en texto

A exportación a JSON dálle cada palabra con marcas de tempo de inicio/ fin. Conduza a Descript, Reaper ou un fluxo de traballo personalizado — edite realzando o texto no canto de limpalo.

Como funciona a transcrición de podcasts

Arrastre o seu episodio á zona de soltar — MP3, WAV, M4A, MP4, ata 2 GB.
Deixar activadas as etiquetas do orador e os marcadores de capítulo (son os predeterminados). Escolla o formato de saída.
Comprobaremos a duración e subiremos o prezo antes de que gastes ningún token. Prema en Transcribir.
Obter TXT, SRT, VTT ou JSON etiquetados polo orador. Os marcadores de capítulo envíanse xuntos, listos para apegar.

Free.ai transcripción de podcast vs Descript, Riverside, Otter

Característica	Free.ai	Descript	Riverside	Otter.ai
Prezo	Pay-per-use ($0.003/min)	$15-30/mo	$19/mo	$16.99/mo
Tamaño máximo do ficheiro	2 GB	5 GB	Tied to record session	500 MB (varies)
Diarización do falante
Marcadores automáticos de capítulo	(baseado no silencio)	Manual	—	Paid tier
Exportación SRT/ VTT				Paid
Linguas	99	22	100+	English-focused
API pública		—	—	Limited

Os prezos dos competidores reflicten os niveis listados publicamente en 2026. Comprobe cada provedor para os plans actuais.

Transcreba podcasts a texto con IA de balde. Etiquetas de orador, marcadores de capítulo, exportación SRT.

Como usar Transcrición de podcasts

Introduza a súa entrada

Escriba texto, envíe un ficheiro ou describa o que queira. Non se precisa conta.

Prema para xerar

A nosa IA procesa a túa solicitude en segundos empregando os mellores modelos de código aberto.

Obter e compartir

Obteña, copie ou comparta o seu resultado. Gratuito para uso persoal e comercial.

Empregar esta ferramenta mediante API

Automatice esta ferramenta a partir do seu propio código. Punto final REST compatíbel con OpenAI, autenticación por token de portador, non se require SDK adicional. Os custos dos tokens son iguais aos da interface web.

Documentación da API Obter a chave da API

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Ferramentas libres de IA relacionadas

Transcrición IA

Transcrición en directo

Transcrición de YouTube

Transcrición da reunión

Transcrición de zoom

Audio para texto

Vídeo a texto

Transcrición de chamadas telefónicas

Transcrición de podcasts — FAQ

A ferramenta de podcasts emprega por omisión a diarización do orador e marcadores de capítulo (detección de silencio > 2s) e admite ficheiros de formato longo de ata 2 GB. Os formatos de saída inclúen SRT + VTT para clips de vídeo de notas de presentación, TXT simple para entradas de blogue e JSON estruturado con marcas de tempo por turno + etiquetas do orador para editar en fluxos de traballo ao estilo de Descript.

Ata 2 GB por ficheiro — aproximadamente un podcast de son de 14 horas a 128 kbps MP3. Os ficheiros longos son fragmentados no servidor para a súa resiliencia; obtén unha única transcrición fusionada.

Si. A diarización do falante está activada por omisión. Detectamos 2- 10 voces distintas mediante a incorporación de voces ECAPA, rótulas Falante 1 / 2 /... e aplicamos as etiquetas a cada segmento. Pode mudarlles o nome na vista de resultados.

Os intervalos de silencio son máis longos que 2 segundos, as pausas naturais que os podcasters usan entre segmentos. Cada capítulo obtén un selo de data/ hora que pode apegar directamente nas súas notas de emisión cun bloque « Capítulos: » para YouTube + Spotify.

Descript cobra entre 15 e 30 dólares por mes por 10 horas de transcrición, vinculadas ao seu editor. Cobramos por uso ~500 tokens/ min en Whisper ($5 = 200K tokens = ~400 minutos), sen subscrición, exportación simple que pode apegar en calquera lugar.

Riverside é un estudio de gravación que transcribe as súas propias sesións de balde dentro da súa aplicación, pero só despois de gravar con eles. Transcribimos calquera MP3/WAV/MP4 independentemente de onde se gravase.

Otter ten un límite de 300 minutos/ mes no nivel gratuíto e está centrado no inglés. Apoiamos 99 linguas coa mesma precisión de Whisper- large- v3 sen límite mensual — paga por minuto transcrito.

Si, escolla SRT ou WebVTT como formato de saída. As etiquetas dos oradores inclúense en liña (SRT) ou como etiquetas < v Speaker N > (VTT) que a maioría dos reprodutores modernos renderizan correctamente.

Whisper- large- v3 xestiona ben as camas musicais e a reverberación lixeiramente (típica taxa de erro de palabras de 3- 7%). A música moi alta ou a sobreposición pesada degrada a precisión; considere executar / music/ vocal- remover / primeiro nunha copia, ou dividir as súas aberturas frías.

Whisper xestiona a maioría dos nomes comúns, pero a xerga moi específica da marca pode precisar unha pasada de post- edición. Un episodio de ~30 minutos normalmente ten 5- 10 correccións de marca/ nome para aplicar manualmente.

Envíeos aquí un por un, ou empregue a función / batch/ unha vez que inicie sesión para poñer en fila unha tempada. A API en / api / tamén acepta POST / v1/ stt / para o envío por lotes por programa.

Non. Os ficheiros enviados son eliminados despois de que a transcrición remate. A transcrición está no seu historial de / account / para descarga se está conectado; os usuarios anónimos reciben unha ligazón de compartición de 24 horas.

Inscríbete gratis para obter 30.000 tokens

Crear unha conta libre

Non se require tarxeta de crédito

Como valora esta ferramenta?

Transcrición de podcasts

Desenvolvido para podcasters e editores de programas

Mostrar as notas nunha única vez

Subtítulos de podcast de vídeo

Edición de episodios baseada en texto

Como funciona a transcrición de podcasts

Free.ai transcripción de podcast vs Descript, Riverside, Otter

Resultado

Como usar Transcrición de podcasts

Introduza a súa entrada

Prema para xerar

Obter e compartir

Empregar esta ferramenta mediante API

Ferramentas libres de IA relacionadas

Transcrición de podcasts — FAQ

En que difire a transcrición de podcasts da ferramenta xenérica?

Cal é o podcast máis longo que pode transcreber?

Etiquetar automaticamente os altofalantes?

En que se basean os marcadores de capítulo?

Como se compara isto con Descript?

Como se compara isto con Riverside?

Como se compara isto con Otter.ai?

Podo obter subtítulos SRT para o meu podcast de vídeo?

Que precisión debo esperar nos podcasts con camas de música?

Recoñece os termos de marca e os nomes dos convidados?

Podo procesar varios episodios á vez?

O meu son gardarase despois da transcrición?

Obteña 10. 000 fichas gratuítas

Agarde — Obteña 10K tokens gratuítos!

Queres máis?