Posso obter SRT legendas para o meu podcast de vídeo?

Sim — escolher SRT ou WebVTT como o formato de saída. Os rótulos de alto-falante são incluídos na linha (SRT) ou como tags (VTT) que a maioria dos jogadores modernos representam corretamente.

Discurso ao texto Transcrição ao vivo Transcrição do YouTube Transcrição da reunião Transcrição do zoom Áudio a Texto Vídeo a Texto Transcrição de chamada telefónica Mais →

Transcrição de Podcast

Utilização comercial OK 380+ modelos Sem marca de água Não é necessário inscrever

Envie um episódio de podcast e obtenha uma transcrição limpa, marcada por alto-falante com marcadores de capítulos detectados automaticamente de lacunas de silêncio. Arquivos de forma longa até 2GB, 99 idiomas, precisão de Whisper-large-v3. Exporta como SRT/VTT para o seu podcast de vídeo, TXT simples para notas de exibição, ou JSON para edição em fluxos de trabalho em estilo Descrito.

Arraste e solte seu episódio de podcast, ou clique para navegar

MP3, WAV, M4A, OGG, MP4 — episódios de forma longa até 2GB

Língua

Motor

Formato de saída

Faladores de etiqueta (host / guest) — etiqueta que está falando quando (+50% tokens)

Número de oradores:

Marcadores de capítulos automáticos — lacunas de silêncio >2s

Os marcadores de capítulos são calculados ao lado do cliente das lacunas de segmento e ligados à transcrição. Coloque-os no YouTube ou Spotify descrições como é.

Construído para podcasters + editores de exibição

Mostrar notas em uma pasta

Envie o episódio, baixe os rótulos de altofalante TXT, capítulo horário pronto para sua descrição Spotify/YouTube, post de blog escrito em 10 minutos em vez de 4 horas.

Subtítulos do podcast de vídeo

Exportação SRT ou WebVTT com rótulos de alto-falante. Deixe diretamente para Premiere, Final Cut, ou DaVinci Resolve — ou carregue ao lado do seu vídeo do YouTube para legendas limpas.

Edição de episódios baseados em texto

JSON export dá-lhe todas as palavras com start/end selos de tempo. Pipe in Descript, Reaper, ou um fluxo de trabalho personalizado — editando texto em vez de esfregar.

Como a transcrição de podcast funciona

Arraste o episódio para a zona de gota — MP3, WAV, M4A, MP4, até 2GB.
Deixe rótulos de alto-falante e marcadores de capítulos em (eles são os padrão). Escolha o seu formato de saída.
Verificamos a duração + preço acima antes de gastar quaisquer fichas. Clique em Transcriba.
Baixe TXT, SRT, VTT ou JSON com marcas de capítulos, ao lado, pronto para colar.

Free.ai transcrição de podcast vs Descrição, Riverside, Otter

Característica	Free.ai	Descript	Riverside	Otter.ai
Preço	Pay-per-use ($0.003/min)	$15-30/mo	$19/mo	$16.99/mo
Tamanho máximo do ficheiro	2 GB	5 GB	Tied to record session	500 MB (varies)
Diarização dos oradores
Marcadores de capítulos automáticos	(com base em silêncio)	Manual	—	Paid tier
Exportação SRT/VTT				Paid
Línguas	99	22	100+	English-focused
API Pública		—	—	Limited

O preço dos concorrentes reflecte os níveis publicados em 2026. Verificar cada provedor para os planos atuais.

Transcriba podcasts para texto com IA gratuitamente.

Como Utilizar Transcrição de Podcast

Insira a sua entrada

Digite texto, carregue um arquivo ou descreva o que você quer. Nenhuma conta necessária.

Clique em gerar

Nossa IA processa seu pedido em segundos usando os melhores modelos de código aberto.

Baixar & compartilhar

Baixe, copie ou compartilhe seu resultado. Gratuito para uso pessoal e comercial.

Use esta ferramenta através da API

Automate esta ferramenta a partir do seu próprio código. Endpoint REST compatível com o OpenAI, Bearer-token auth, não é necessário SDK extra. Custos de token correspondem à interface web.

Documentação da API Obter a chave da API

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Ferramentas de IA Grátis Relacionadas

Discurso ao texto

Transcrição ao vivo

Transcrição do YouTube

Transcrição da reunião

Transcrição do zoom

Áudio a Texto

Vídeo a Texto

Transcrição de chamada telefónica

Transcrição de Podcast — FAQ

Transcrição de Podcast de podcast padrão para a diarização de alto-falantes e marcadores de capítulos (detecção de silencios >2s), e suporta arquivos de longo prazo até 2GB. Formatos de saída incluem SRT + VTT para clipes de vídeo show-notes, TXT simples para posts de blog e JSON estruturado com selos de tempo por turno + rótulos de alto-falante para edição em fluxos de trabalho estilo Descrito.

Até 2 GB por arquivo — aproximadamente um podcast de áudio de 14 horas em 128 kbps MP3. Arquivos longos são pedaços do lado do servidor para resiliência; você recebe uma única transcrição fusionada de volta.

Sim. A diarização do alto-falante está ON por padrão. Detectamos 2-10 vozes distintas através de ECAPA englobações de voz, rótulá-los Speaker 1 / 2 /... e aplica os rótulos a cada segmento. Você pode renomeá-los na vista de resultado.

Lacunas de silêncio mais de 2 segundos — os podcastistas naturais usam entre segmentos. Cada capítulo recebe um selo temporal que você pode colar diretamente em suas notas de exibição com um bloco "Capítulos:" para YouTube + Spotify.

Descrição cargas $15-$30 por mês por 10 horas de transcrição, amarradas ao seu editor. Nós cobramos por uso em ~500 fichas/min em Whisper ($5 = 200K fichas = ~400 minutos), nenhuma assinatura, exportação simples você pode colar em qualquer lugar.

Riverside é um estúdio de gravação que transcribe suas próprias sessões gratuitamente dentro de seu aplicativo, mas apenas depois de gravar com eles. Transcribemos qualquer MP3/WAV/MP4 independentemente de onde foi gravado.

Tampa de lontra a 300 minutos/mes no nível livre e focada em inglês. Nós apoiamos 99 idiomas na mesma precisão Whisper-large-v3 sem tampa mensal — você paga por minuto transcrito.

Sim — escolher SRT ou WebVTT como o formato de saída. Os rótulos de alto-falante são incluídos na linha (SRT) ou como <v Speaker N> tags (VTT) que a maioria dos jogadores modernos representam corretamente.

O Whisper-large-v3 maneja as camas musicais e bem reverberar a luz (taxa típica de erro de palavras 3-7%).Muito alto ou sobreposição pesada degrada a precisão — considere executar /music/vocal-remover/ primeiro em uma cópia, ou dividir o seu frio abre.

O Whisper maneja nomes mais comuns, mas o jergão altamente específico de marca pode precisar de um passe pós-edição. Um episódio de ~30 minutos geralmente tem 5-10 correções de marca/nome para aplicar manualmente.

Carregue-os um de cada vez aqui, ou use o nosso recurso /batch/ uma vez assinado para a fila de espera para uma temporada. A API em /api/ também aceita POST /v1/stt/ para o portamento programático.

Não. Os arquivos enviados são excluídos após a transcrição completa. Sua transcrição fica no seu /account/ history para download se assinados; os usuários anônimos obtêm um link de compartilhamento 24 horas.

Inscreva-se gratuitamente para 30.000 fichas

Criar Conta Livre

Não é exigido o cartão de crédito

Como iria avaliar esta ferramenta?

Transcrição de Podcast

Construído para podcasters + editores de exibição

Mostrar notas em uma pasta

Subtítulos do podcast de vídeo

Edição de episódios baseados em texto

Como a transcrição de podcast funciona

Free.ai transcrição de podcast vs Descrição, Riverside, Otter

Resultado

Como Utilizar Transcrição de Podcast

Insira a sua entrada

Clique em gerar

Baixar & compartilhar

Use esta ferramenta através da API

Ferramentas de IA Grátis Relacionadas

Transcrição de Podcast — FAQ

Como a transcrição do podcast é diferente da ferramenta genérica?

Qual é o podcast mais longo que você pode transcrever?

Você rotula os alto-falantes automaticamente?

Em que são os marcadores de capítulos baseados?

Como isso se compara com o Descrito?

Como é que isto se compara com Riverside?

Como é que isto se compara com Otter.ai?

Posso obter SRT legendas para o meu podcast de vídeo?

Que precisão devo esperar em podcasts com camas de música?

Reconhece termos marcados e nomes de convidados?

Posso processar vários episódios de uma vez?

O meu áudio será armazenado depois da transcrição?

Obtenha 10.000 tokens gratuitos

Espera — Obtenha 10K Free Tokens!

Queres mais?