Transcrição de Podcast

Utilização comercial OK 380+ modelos Sem marca de água Não é necessário inscrever
Modelo:
+ GPT-5, Claude, Gemini
Envie um episódio de podcast e obtenha uma transcrição limpa, marcada por alto-falante com marcadores de capítulos detectados automaticamente de lacunas de silêncio. Arquivos de forma longa até 2GB, 99 idiomas, precisão de Whisper-large-v3. Exporta como SRT/VTT para o seu podcast de vídeo, TXT simples para notas de exibição, ou JSON para edição em fluxos de trabalho em estilo Descrito.

Arraste e solte seu episódio de podcast, ou clique para navegar

MP3, WAV, M4A, OGG, MP4 — episódios de forma longa até 2GB

Os marcadores de capítulos são calculados ao lado do cliente das lacunas de segmento e ligados à transcrição. Coloque-os no YouTube ou Spotify descrições como é.
Estimativa de token para este clipe
Transcrição de Podcast
Capítulos detectados automaticamente

Transcrição do seu podcast...

Os episódios longos demoram vários minutos. Você pode fechar esta guia se o email-quando-cometado estiver verificado.

Construído para podcasters + editores de exibição

Mostrar notas em uma pasta

Envie o episódio, baixe os rótulos de altofalante TXT, capítulo horário pronto para sua descrição Spotify/YouTube, post de blog escrito em 10 minutos em vez de 4 horas.

Subtítulos do podcast de vídeo

Exportação SRT ou WebVTT com rótulos de alto-falante. Deixe diretamente para Premiere, Final Cut, ou DaVinci Resolve — ou carregue ao lado do seu vídeo do YouTube para legendas limpas.

Edição de episódios baseados em texto

JSON export dá-lhe todas as palavras com start/end selos de tempo. Pipe in Descript, Reaper, ou um fluxo de trabalho personalizado — editando texto em vez de esfregar.

Como a transcrição de podcast funciona

  1. Arraste o episódio para a zona de gota — MP3, WAV, M4A, MP4, até 2GB.
  2. Deixe rótulos de alto-falante e marcadores de capítulos em (eles são os padrão). Escolha o seu formato de saída.
  3. Verificamos a duração + preço acima antes de gastar quaisquer fichas. Clique em Transcriba.
  4. Baixe TXT, SRT, VTT ou JSON com marcas de capítulos, ao lado, pronto para colar.

Free.ai transcrição de podcast vs Descrição, Riverside, Otter

Característica Free.ai Descript Riverside Otter.ai
PreçoPay-per-use ($0.003/min)$15-30/mo$19/mo$16.99/mo
Tamanho máximo do ficheiro2 GB5 GBTied to record session500 MB (varies)
Diarização dos oradores
Marcadores de capítulos automáticos (com base em silêncio)ManualPaid tier
Exportação SRT/VTTPaid
Línguas9922100+English-focused
API PúblicaLimited
O preço dos concorrentes reflecte os níveis publicados em 2026. Verificar cada provedor para os planos atuais.
Opções avançadas
Resultado
Os tokens estão a ficar baixos. Obter mais tokens
Queres melhores resultados? Modelos premium (GPT-5 Ver Planos

❤️ Love this tool? Share it!

Inscreva-se para obter um link de referência e ganhar 25 mil fichas por amigo.

Queres mais? Inscreva-se gratuitamente para 30K tokens/dia + 10K bônus
Inscreva-se gratuitamente

Processando o seu pedido...

Transcriba podcasts para texto com IA gratuitamente.

Como Utilizar Transcrição de Podcast

1
Insira a sua entrada

Digite texto, carregue um arquivo ou descreva o que você quer. Nenhuma conta necessária.

2
Clique em gerar

Nossa IA processa seu pedido em segundos usando os melhores modelos de código aberto.

3
Baixar & compartilhar

Baixe, copie ou compartilhe seu resultado. Gratuito para uso pessoal e comercial.

Use esta ferramenta através da API

Automate esta ferramenta a partir do seu próprio código. Endpoint REST compatível com o OpenAI, Bearer-token auth, não é necessário SDK extra. Custos de token correspondem à interface web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Transcrição de Podcast — FAQ

Transcrição de Podcast de podcast padrão para a diarização de alto-falantes e marcadores de capítulos (detecção de silencios >2s), e suporta arquivos de longo prazo até 2GB. Formatos de saída incluem SRT + VTT para clipes de vídeo show-notes, TXT simples para posts de blog e JSON estruturado com selos de tempo por turno + rótulos de alto-falante para edição em fluxos de trabalho estilo Descrito.

Até 2 GB por arquivo — aproximadamente um podcast de áudio de 14 horas em 128 kbps MP3. Arquivos longos são pedaços do lado do servidor para resiliência; você recebe uma única transcrição fusionada de volta.

Sim. A diarização do alto-falante está ON por padrão. Detectamos 2-10 vozes distintas através de ECAPA englobações de voz, rótulá-los Speaker 1 / 2 /... e aplica os rótulos a cada segmento. Você pode renomeá-los na vista de resultado.

Lacunas de silêncio mais de 2 segundos — os podcastistas naturais usam entre segmentos. Cada capítulo recebe um selo temporal que você pode colar diretamente em suas notas de exibição com um bloco "Capítulos:" para YouTube + Spotify.

Descrição cargas $15-$30 por mês por 10 horas de transcrição, amarradas ao seu editor. Nós cobramos por uso em ~500 fichas/min em Whisper ($5 = 200K fichas = ~400 minutos), nenhuma assinatura, exportação simples você pode colar em qualquer lugar.

Riverside é um estúdio de gravação que transcribe suas próprias sessões gratuitamente dentro de seu aplicativo, mas apenas depois de gravar com eles. Transcribemos qualquer MP3/WAV/MP4 independentemente de onde foi gravado.

Tampa de lontra a 300 minutos/mes no nível livre e focada em inglês. Nós apoiamos 99 idiomas na mesma precisão Whisper-large-v3 sem tampa mensal — você paga por minuto transcrito.

Sim — escolher SRT ou WebVTT como o formato de saída. Os rótulos de alto-falante são incluídos na linha (SRT) ou como <v Speaker N> tags (VTT) que a maioria dos jogadores modernos representam corretamente.

O Whisper-large-v3 maneja as camas musicais e bem reverberar a luz (taxa típica de erro de palavras 3-7%).Muito alto ou sobreposição pesada degrada a precisão — considere executar /music/vocal-remover/ primeiro em uma cópia, ou dividir o seu frio abre.

O Whisper maneja nomes mais comuns, mas o jergão altamente específico de marca pode precisar de um passe pós-edição. Um episódio de ~30 minutos geralmente tem 5-10 correções de marca/nome para aplicar manualmente.

Carregue-os um de cada vez aqui, ou use o nosso recurso /batch/ uma vez assinado para a fila de espera para uma temporada. A API em /api/ também aceita POST /v1/stt/ para o portamento programático.

Não. Os arquivos enviados são excluídos após a transcrição completa. Sua transcrição fica no seu /account/ history para download se assinados; os usuários anônimos obtêm um link de compartilhamento 24 horas.

Inscreva-se gratuitamente para 30.000 fichas

Criar Conta Livre

Não é exigido o cartão de crédito

Como iria avaliar esta ferramenta?

Love this tool? Share it!