STT Online

Utilização comercial OK 380+ modelos Sem marca de água Não é necessário inscrever
Modelo:
+ GPT-5, Claude, Gemini
Carregue um arquivo de áudio ou vídeo — ou cole uma URL — e obtenha uma transcrição limpa com selos horários. Diarização do altofalante, SRT/VTT exportação de subtítulos, 100 mais idiomas com autodetecção. Escalas de custos exatamente com comprimento de clipe. Powered por Whisper grande-v3 e Parakeet (auto-hosted), mais premium Wizper e OnzeLabs STT.

Arraste e solte áudio/vídeo, ou clique para navegar

MP3, WAV, MP4, WebM, M4A — até 500MB

Whisper grande-v3 — 99 línguas, precisão da melhor classe.
Estimativa de token para este clipe
YouTube, Instagram, TikTok, Spotify e 1.300+ plataformas
O custo da transcrição de URL é baseado na duração real do clipe — citamos após o download. Aguarde ~500 tokens/minuto no Whisper.
Gravação: 0:00

Transcrição em tempo real usando o seu microfone

Transcrição

Transcrição do áudio...

Isto pode levar um momento para arquivos mais longos.

O que as pessoas transcriam com Free.ai

Interviews + podcasts

A diarização etiqueta todos os alto-falantes. Exportação de SRT direta para o seu editor de vídeo, ou texto simples para uma redação de artigo.

Auto captions + subtitles

Envie um upload do YouTube ou TikTok, escolha SRT ou WebVTT, e queimar as legendas com /video/subtitle /. Fluxo de trabalho de legendas de um só paragem.

Notas de reunião

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Transcriba uma palestra de 90 minutos, então use /estudo/flashcards/ ou /write/summarize/ para transformá-lo em material de estudo.

Áudio em língua estrangeira

Whisper auto-detecta 99 idiomas. Transcriva-se no original, depois envie o texto através /translate/ para saltar idiomas.

Legal + medical

Marcas de tempo, rótulos de alto-falante, JSON exporta com o tempo de partida/fim de cada palavra — prep preciso-reporter do tribunal ou nota clínica.

Como se compara a transcrição de Free.ai

O que você obtém Free.ai Otter.ai Descript Rev.com
Utilização diária gratuita5K+ tokens/day300 minutes/mo1 hr/month
MotorWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Línguas99English-focused2230+
Diarização dos oradores
Exportação de SRT / VTTPaidPaid
API PúblicaLimitedLimited
streaming ao vivo STT (gratuito) Paid
Inscrição necessáriaNãoYesYesYes
Os números dos concorrentes reflectem os níveis livres listados publicamente a partir de 2026. Verificar cada provedor para os planos atuais.
Opções avançadas
Resultado
Os tokens estão a ficar baixos. Get More Tokens
Want better results? Modelos premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

Inscreva-se para obter um link de referência e ganhar 25 mil fichas por amigo.

Queres mais? Inscreva-se gratuitamente para 5K tokens/dia + 10K bônus
Inscreva-se gratuitamente

Processando o seu pedido...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

Como Utilizar STT Online

1
Insira a sua entrada

Digite texto, carregue um arquivo ou descreva o que você quer. Nenhuma conta necessária.

2
Clique em gerar

Nossa IA processa seu pedido em segundos usando os melhores modelos de código aberto.

3
Baixar & compartilhar

Baixe, copie ou compartilhe seu resultado. Gratuito para uso pessoal e comercial.

Use esta ferramenta através da API

Automate esta ferramenta a partir do seu próprio código. Endpoint REST compatível com o OpenAI, Bearer-token auth, não é necessário SDK extra. Custos de token correspondem à interface web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT (Speech-to-Text) converte áudio falado em texto escrito usando AI. Free.ai executa Whisper grande-v3 — o mais preciso modelo de reconhecimento de fala de código aberto — em nossos próprios GPUs.

Sim. Carregue arquivos de áudio até 500MB. STT custa ~500 fichas por minuto de áudio. Você recebe 2.500–5.000 fichas gratuitas por dia — vários arquivos por dia gratuitamente.

O STT aceita MP3, WAV, MP4, WebM, M4A, OGG, FLAC — praticamente qualquer formato de áudio ou vídeo — até 500MB por upload.

Sim. Os resultados do STT exportam como TXT, SRT (subtítulos), ou VTT ( legendas da web). Perfeito para legendas do YouTube e legendas de vídeo.

Nosso STT usa Whisper grande-v3 — tipicamente 95%+ de precisão de palavras para inglês claro e excelente qualidade em 99 idiomas. Ruído de fundo e acentuações pesadas menor precisão.

Sim. Ativar a diarização de alto-falantes nas opções STT e os segmentos de etiquetas de IA como alto-falante 1, alto-falante 2, etc. Custa 50% mais tokens.

Sim. A API STT é compatível com OpenAI — áudio POST para /v1/audio/transcriptions e receber JSON. Funciona de qualquer idioma que possa enviar pedidos HTTP.

Sim. A aba ao vivo captura o seu microfone e o recorre através do STT em tempo real com mínima latência.

Sim. Pegue um YouTube, TikTok, Instagram, Spotify ou Vimeo URL e STT extraem o áudio e transcribe-o. 1.300+ plataformas suportadas.

Rápido — um clipe de 1 minuto termina em segundos, uma gravação de 30 minutos em cerca de um minuto, um arquivo de 1 hora em aproximadamente 2 minutos.

Sim. O áudio é processado em nosso próprio GPUs e excluído após o STT completar. Nunca é armazenado a longo prazo, nunca compartilhado, e nunca usado para o treinamento de modelos.

Whisper grande-v3 — o maior e mais preciso modelo de Whisper (1.55B parametros). Nós auto-hostá-lo em A100 GPUs para velocidade e privacidade.

Inscreva-se gratuitamente para 10.000 fichas

Criar Conta Livre

Não é exigido o cartão de crédito

Como iria avaliar esta ferramenta?

Love this tool? Share it!