Speech to Text

Utilização comercial OK 380+ modelos Sem marca de água Não é necessário inscrever

Carregue um arquivo de áudio ou vídeo — ou cole uma URL — e obtenha uma transcrição limpa com selos horários. Diarização do altofalante, SRT/VTT exportação de subtítulos, 100 mais idiomas com autodetecção. Escalas de custos exatamente com comprimento de clipe. Powered por Whisper grande-v3 e Parakeet (auto-hosted), mais premium Wizper e OnzeLabs STT.

Arraste e solte áudio/vídeo, ou clique para navegar

MP3, WAV, MP4, WebM, M4A — até 500MB

Língua

Motor Whisper grande-v3 — 99 línguas, precisão da melhor classe.

Formato de saída

Detecção de alto-falante — etiqueta que está falando quando (+50% tokens)

Número de oradores

YouTube, Instagram, TikTok, Spotify e 1.300+ plataformas

Motor

Formato de saída

Detecção de alto-falante — +50%

O custo da transcrição de URL é baseado na duração real do clipe — citamos após o download. Aguarde ~500 tokens/minuto no Whisper.

Transcrição em tempo real usando o seu microfone

O que as pessoas transcriam com Free.ai

Entrevistas + podcasts

A diarização etiqueta todos os alto-falantes. Exportação de SRT direta para o seu editor de vídeo, ou texto simples para uma redação de artigo.

Auto legendas + legendas

Envie um upload do YouTube ou TikTok, escolha SRT ou WebVTT, e queimar as legendas com /video/subtitle /. Fluxo de trabalho de legendas de um só paragem.

Notas de reunião

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Conferências + lições

Transcriba uma palestra de 90 minutos, então use /estudo/flashcards/ ou /write/summarize/ para transformá-lo em material de estudo.

Áudio em língua estrangeira

Whisper auto-detecta 99 idiomas. Transcriva-se no original, depois envie o texto através /translate/ para saltar idiomas.

Legal + médico

Marcas de tempo, rótulos de alto-falante, JSON exporta com o tempo de partida/fim de cada palavra — prep preciso-reporter do tribunal ou nota clínica.

Como se compara a transcrição de Free.ai

O que você obtém	Free.ai	Otter.ai	Descript	Rev.com
Utilização diária gratuita	5K+ tokens/day	300 minutes/mo	1 hr/month	—
Motor	Whisper large-v3, Parakeet	Proprietary	Proprietary	Human + AI
Línguas	99	English-focused	22	30+
Diarização dos oradores
Exportação de SRT / VTT		Paid	Paid
API Pública		Limited	Limited
streaming ao vivo STT	(gratuito)	Paid	—	—
Inscrição necessária	Não	Yes	Yes	Yes

Os números dos concorrentes reflectem os níveis livres listados publicamente a partir de 2026. Verificar cada provedor para os planos atuais.

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Como Utilizar Speech to Text

Insira a sua entrada

Digite texto, carregue um arquivo ou descreva o que você quer. Nenhuma conta necessária.

Clique em gerar

Nossa IA processa seu pedido em segundos usando os melhores modelos de código aberto.

Baixar & compartilhar

Baixe, copie ou compartilhe seu resultado. Gratuito para uso pessoal e comercial.

Use esta ferramenta através da API

Automate esta ferramenta a partir do seu próprio código. Endpoint REST compatível com o OpenAI, Bearer-token auth, não é necessário SDK extra. Custos de token correspondem à interface web.

Documentação da API Obter a chave da API

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai oferece fala a texto com excelente precisão, 99 línguas, exportação de subtítulos, detecção de alto-falantes e captura de micrófono ao vivo — completamente grátis.

Carregue um arquivo de áudio ou vídeo (MP3, WAV, MP4, M4A), clique em Transcriba e obtenha a palavra precisa para texto em segundos. Ou gravar ao vivo a partir do seu microfone.

Sim. Pega qualquer URL do YouTube na aba URL e a fala em ferramenta de texto extrai o áudio e converte-o. Funciona com Instagram, TikTok, Spotify e 1.300+ plataformas.

Sim. Auto-detectar ou selecionar de 99 idiomas. Nosso discurso a texto manipula acentuações, ruído de fundo e áudio de língua mista bem.

Sim. Selecione múltiplos arquivos de áudio de uma vez — cada um é enviado através da fala para texto com rastreamento do progresso e os resultados são downloadáveis separadamente ou combinados.

Sim. O discurso para texto API at /api/ é compatível com o OpenAI. Envie áudio programáticamente e receba JSON com a transcrição, linguagem e selos de tempo.

Sim. Alternar a detecção de alto-falante antes de carregar e o discurso para o texto saída é rotulado por alto-falante 1, alto-falante 2...). Adiciona 50% ao custo de token.

A fala ao texto aceita arquivos até 500MB por upload. Para conteúdo de várias horas, divide o áudio em pedaços primeiro.

Muito preciso para áudio claro — tipicamente 95%+ de precisão de palavras em Inglês com o nosso motor Wisper grande-v3. Qualidade depende da clareza, acento e ruído de fundo.

Sim. A transcrição é totalmente editável no local. Corrigir erros, reformatar e copiar/descarregar como TXT, SRT ou VTT.

Sim. O áudio é processado em nosso próprio GPUs e excluído após a fala para texto completa. Nada é armazenado a longo prazo, compartilhado ou usado para treinamento.

Sim. Envie um arquivo de áudio ou vídeo em /chat/ e peça à IA para transcrivê-lo — combine a fala em texto com perguntas de seguimento e summarização em um fluxo de trabalho.

Inscreva-se gratuitamente para 30.000 fichas

Criar Conta Livre

Não é exigido o cartão de crédito

Como iria avaliar esta ferramenta?

Speech to Text

O que as pessoas transcriam com Free.ai

Entrevistas + podcasts

Auto legendas + legendas

Notas de reunião

Conferências + lições

Áudio em língua estrangeira

Legal + médico

Como se compara a transcrição de Free.ai

Resultado

Como Utilizar Speech to Text

Insira a sua entrada

Clique em gerar

Baixar & compartilhar

Use esta ferramenta através da API

Speech to Text — FAQ

Qual é a melhor ferramenta de livre expressão para texto?

Como converto a fala para texto online?

Pode a fala para texto lidar com vídeos do YouTube?

A fala ao texto funciona noutras línguas?

Posso upload vários arquivos para a fala para texto?

Existe um discurso para a API de texto?

Será que a fala ao texto suporta rótulos de alto-falante?

Que tamanho do arquivo de áudio a fala para texto aceita?

Quão precisa é a fala para a saída de texto?

Posso editar a fala para transcrição de texto?

A fala ao texto é privada e segura?

Posso usar a fala para texto em IA Chat?

Obtenha 10.000 tokens gratuitos

Espera — Obtenha 10K Free Tokens!

Queres mais?