Discurso ao texto

Utilização comercial OK 380+ modelos Sem marca de água Não é necessário inscrever
Modelo:
+ GPT-5, Claude, Gemini
Carregue um arquivo de áudio ou vídeo — ou cole uma URL — e obtenha uma transcrição limpa com selos horários. Diarização do altofalante, SRT/VTT exportação de subtítulos, 100 mais idiomas com autodetecção. Escalas de custos exatamente com comprimento de clipe. Powered por Whisper grande-v3 e Parakeet (auto-hosted), mais premium Wizper e OnzeLabs STT.

Arraste e solte áudio/vídeo, ou clique para navegar

MP3, WAV, MP4, WebM, M4A — até 500MB

Whisper grande-v3 — 99 línguas, precisão da melhor classe.
Estimativa de token para este clipe
YouTube, Instagram, TikTok, Spotify e 1.300+ plataformas
O custo da transcrição de URL é baseado na duração real do clipe — citamos após o download. Aguarde ~500 tokens/minuto no Whisper.
Gravação: 0:00

Transcrição em tempo real usando o seu microfone

Transcrição

Transcrição do áudio...

Isto pode levar um momento para arquivos mais longos.

O que as pessoas transcriam com Free.ai

Interviews + podcasts

A diarização etiqueta todos os alto-falantes. Exportação de SRT direta para o seu editor de vídeo, ou texto simples para uma redação de artigo.

Auto captions + subtitles

Envie um upload do YouTube ou TikTok, escolha SRT ou WebVTT, e queimar as legendas com /video/subtitle /. Fluxo de trabalho de legendas de um só paragem.

Notas de reunião

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Transcriba uma palestra de 90 minutos, então use /estudo/flashcards/ ou /write/summarize/ para transformá-lo em material de estudo.

Áudio em língua estrangeira

Whisper auto-detecta 99 idiomas. Transcriva-se no original, depois envie o texto através /translate/ para saltar idiomas.

Legal + medical

Marcas de tempo, rótulos de alto-falante, JSON exporta com o tempo de partida/fim de cada palavra — prep preciso-reporter do tribunal ou nota clínica.

Como se compara a transcrição de Free.ai

O que você obtém Free.ai Otter.ai Descript Rev.com
Utilização diária gratuita5K+ tokens/day300 minutes/mo1 hr/month
MotorWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Línguas99English-focused2230+
Diarização dos oradores
Exportação de SRT / VTTPaidPaid
API PúblicaLimitedLimited
streaming ao vivo STT (gratuito) Paid
Inscrição necessáriaNãoYesYesYes
Os números dos concorrentes reflectem os níveis livres listados publicamente a partir de 2026. Verificar cada provedor para os planos atuais.
Opções avançadas
Resultado
Os tokens estão a ficar baixos. Get More Tokens
Want better results? Modelos premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

Inscreva-se para obter um link de referência e ganhar 25 mil fichas por amigo.

Queres mais? Inscreva-se gratuitamente para 5K tokens/dia + 10K bônus
Inscreva-se gratuitamente

Processando o seu pedido...

Transcriba áudio e vídeo para texto com IA. Carregue arquivos, paste URLs ou use o seu micrófono.

Como Utilizar Discurso ao texto

1
Insira a sua entrada

Digite texto, carregue um arquivo ou descreva o que você quer. Nenhuma conta necessária.

2
Clique em gerar

Nossa IA processa seu pedido em segundos usando os melhores modelos de código aberto.

3
Baixar & compartilhar

Baixe, copie ou compartilhe seu resultado. Gratuito para uso pessoal e comercial.

Use esta ferramenta através da API

Automate esta ferramenta a partir do seu próprio código. Endpoint REST compatível com o OpenAI, Bearer-token auth, não é necessário SDK extra. Custos de token correspondem à interface web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Discurso ao texto — FAQ

Free AI Transcrição converte arquivos de áudio e vídeo em texto usando o Whisper, o modelo de reconhecimento de voz de última geração. Envie um arquivo e obtenha texto preciso em segundos.

Sim! Transcrição custa ~4 tokens por segundo de áudio. Um arquivo de 5 minutos custa ~1,200 tokens. Você tem 10.000/dia grátis.

O Whisper suporta 99+ idiomas com detecção automática de linguagem. Basta carregar seu áudio e ele detecta o idioma automaticamente.

MP3, WAV, M4A, FLAC, OGG, MP4, WEBM, e formatos mais comuns de áudio/vídeo.

O Whisper é um dos modelos STT mais precisos disponíveis, comparáveis aos serviços comerciais. A precisão varia por qualidade de áudio e linguagem.

Sim! Escolha entre texto simples ou saída com marca temporal (formato de subtítulo SRT).

Até 25MB para usuários anônimos, 100MB para usuários assinados. Para arquivos maiores, dividi-los primeiro.

Não! Transcriba arquivos imediatamente sem uma conta.

Não diretamente, mas você pode baixar o áudio de um vídeo do YouTube e upload-lo aqui.

Nossa transcrição usa o mesmo modelo de Whisper e é totalmente gratuito. Cargos de lontra $ 8-24/mes, Rev tarifas por minuto.

O texto transcrito é totalmente editável — copiar, modificar e baixar conforme necessário.

Sim! Acesse a nossa API de transcrição em /api/ para processamento de lotes.

Inscreva-se gratuitamente para 10.000 fichas

Criar Conta Livre

Não é exigido o cartão de crédito

Como iria avaliar esta ferramenta?

Love this tool? Share it!