Speech to Text

Utilização comercial OK 380+ modelos Sem marca de água Não é necessário inscrever
Modelo:
+ GPT-5, Claude, Gemini
Carregue um arquivo de áudio ou vídeo — ou cole uma URL — e obtenha uma transcrição limpa com selos horários. Diarização do altofalante, SRT/VTT exportação de subtítulos, 100 mais idiomas com autodetecção. Escalas de custos exatamente com comprimento de clipe. Powered por Whisper grande-v3 e Parakeet (auto-hosted), mais premium Wizper e OnzeLabs STT.

Arraste e solte áudio/vídeo, ou clique para navegar

MP3, WAV, MP4, WebM, M4A — até 500MB

Whisper grande-v3 — 99 línguas, precisão da melhor classe.
Estimativa de token para este clipe
YouTube, Instagram, TikTok, Spotify e 1.300+ plataformas
O custo da transcrição de URL é baseado na duração real do clipe — citamos após o download. Aguarde ~500 tokens/minuto no Whisper.
Gravação: 0:00

Transcrição em tempo real usando o seu microfone

Transcrição

Transcrição do áudio...

Isto pode levar um momento para arquivos mais longos.

O que as pessoas transcriam com Free.ai

Interviews + podcasts

A diarização etiqueta todos os alto-falantes. Exportação de SRT direta para o seu editor de vídeo, ou texto simples para uma redação de artigo.

Auto captions + subtitles

Envie um upload do YouTube ou TikTok, escolha SRT ou WebVTT, e queimar as legendas com /video/subtitle /. Fluxo de trabalho de legendas de um só paragem.

Notas de reunião

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Transcriba uma palestra de 90 minutos, então use /estudo/flashcards/ ou /write/summarize/ para transformá-lo em material de estudo.

Áudio em língua estrangeira

Whisper auto-detecta 99 idiomas. Transcriva-se no original, depois envie o texto através /translate/ para saltar idiomas.

Legal + medical

Marcas de tempo, rótulos de alto-falante, JSON exporta com o tempo de partida/fim de cada palavra — prep preciso-reporter do tribunal ou nota clínica.

Como se compara a transcrição de Free.ai

O que você obtém Free.ai Otter.ai Descript Rev.com
Utilização diária gratuita5K+ tokens/day300 minutes/mo1 hr/month
MotorWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Línguas99English-focused2230+
Diarização dos oradores
Exportação de SRT / VTTPaidPaid
API PúblicaLimitedLimited
streaming ao vivo STT (gratuito) Paid
Inscrição necessáriaNãoYesYesYes
Os números dos concorrentes reflectem os níveis livres listados publicamente a partir de 2026. Verificar cada provedor para os planos atuais.
Opções avançadas
Resultado
Os tokens estão a ficar baixos. Get More Tokens
Want better results? Modelos premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

Inscreva-se para obter um link de referência e ganhar 25 mil fichas por amigo.

Queres mais? Inscreva-se gratuitamente para 5K tokens/dia + 10K bônus
Inscreva-se gratuitamente

Processando o seu pedido...

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Como Utilizar Speech to Text

1
Insira a sua entrada

Digite texto, carregue um arquivo ou descreva o que você quer. Nenhuma conta necessária.

2
Clique em gerar

Nossa IA processa seu pedido em segundos usando os melhores modelos de código aberto.

3
Baixar & compartilhar

Baixe, copie ou compartilhe seu resultado. Gratuito para uso pessoal e comercial.

Use esta ferramenta através da API

Automate esta ferramenta a partir do seu próprio código. Endpoint REST compatível com o OpenAI, Bearer-token auth, não é necessário SDK extra. Custos de token correspondem à interface web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai oferece fala a texto com excelente precisão, 99 línguas, exportação de subtítulos, detecção de alto-falantes e captura de micrófono ao vivo — completamente grátis.

Carregue um arquivo de áudio ou vídeo (MP3, WAV, MP4, M4A), clique em Transcriba e obtenha a palavra precisa para texto em segundos. Ou gravar ao vivo a partir do seu microfone.

Sim. Pega qualquer URL do YouTube na aba URL e a fala em ferramenta de texto extrai o áudio e converte-o. Funciona com Instagram, TikTok, Spotify e 1.300+ plataformas.

Sim. Auto-detectar ou selecionar de 99 idiomas. Nosso discurso a texto manipula acentuações, ruído de fundo e áudio de língua mista bem.

Sim. Selecione múltiplos arquivos de áudio de uma vez — cada um é enviado através da fala para texto com rastreamento do progresso e os resultados são downloadáveis separadamente ou combinados.

Sim. O discurso para texto API at /api/ é compatível com o OpenAI. Envie áudio programáticamente e receba JSON com a transcrição, linguagem e selos de tempo.

Sim. Alternar a detecção de alto-falante antes de carregar e o discurso para o texto saída é rotulado por alto-falante 1, alto-falante 2...). Adiciona 50% ao custo de token.

A fala ao texto aceita arquivos até 500MB por upload. Para conteúdo de várias horas, divide o áudio em pedaços primeiro.

Muito preciso para áudio claro — tipicamente 95%+ de precisão de palavras em Inglês com o nosso motor Wisper grande-v3. Qualidade depende da clareza, acento e ruído de fundo.

Sim. A transcrição é totalmente editável no local. Corrigir erros, reformatar e copiar/descarregar como TXT, SRT ou VTT.

Sim. O áudio é processado em nosso próprio GPUs e excluído após a fala para texto completa. Nada é armazenado a longo prazo, compartilhado ou usado para treinamento.

Sim. Envie um arquivo de áudio ou vídeo em /chat/ e peça à IA para transcrivê-lo — combine a fala em texto com perguntas de seguimento e summarização em um fluxo de trabalho.

Inscreva-se gratuitamente para 10.000 fichas

Criar Conta Livre

Não é exigido o cartão de crédito

Como iria avaliar esta ferramenta?

Love this tool? Share it!