Texto ao Discurso

Utilização comercial OK 380+ modelos Sem marca de água Não é necessário inscrever
Modelo:
+ GPT-5, Claude, Gemini
174 vozes de IA natural em 37 idiomas. Digite ou cole texto, escolha uma voz e baixe um arquivo WAV em segundos. Escalas de custos exatamente com contagem de caracteres e a voz que você escolhe — nós citamos o custo do token ao vivo como você escreve, antes de você atingir gerar.
0 / 5000 caracteres · 0 frases Cadastre-se gratuitamente para 6× mais → Atualizações de custo ao vivo com base na voz + comprimento
Kokoro é o nosso padrão — lido rápido, natural. Vozes auto-mapa para o melhor motor.
Custo de token ao vivo
Comece a digitar para ver o seu custo para a voz selecionada.
Torneiras de compra
1.0x
0
Mostrar as etiquetas SSML
SSML tag tricksheet: <break time="500ms"/> — Silêncio / pausa <prosody rate="slow" pitch="high">text</prosody> — velocidade de controlo/pitch por secção <emphasis level="strong">text</emphasis> — estresse uma palavra <say-as interpret-as="date">01/15/2026</say-as> — pronunciar como data / número / telefone <sub alias="World Wide Web">WWW</sub> — ler abreviaturas corretamente
Baixar

O que você pode fazer com vozes de IA

Narração do YouTube

Narrar shorts, documentários, explicadores. Kokoro lidas longas sem costuras; pares com as ferramentas de vídeo para dub + legenda.

Audiobooks e podcasts

Torne um post do blog, transcrição ou PDF em um MP3 escutável. Alternar costura de forma longa para saída em escala de capítulos.

Publicidade e vozover

Escolha Chatterbox para leituras expressivas. Os scripts publicitários de 30 segundos custam ~150 fichas — uma fração de preço de OnzeLabs-grade.

Aprendizagem linguística

Ouça qualquer passagem em fala nativa em 37 idiomas. Ajuste velocidade 0.5×-2× para perfurar a pronúncia.

Diálogo de jogo

Prototype NPC dialogue with character voices. Dia handles multi-speaker scenes; pair emotion + pitch for villains and heroes.

Acessibilidade

Read-aloud para artigos longos, campos de formulário, cópia de produto. WAV exporta terras em qualquer tela-reader conduto.

Como se compara Free.ai TTS

O que você obtém Free.ai ElevenLabs Play.ht Murf.ai
Utilização diária gratuita5K+ chars/day10K chars / month2.5K words10 minutes
Vozes incluídas17432~900 (premium paywall)120+
Línguas373214220+
Suporte SSML
Clonagem de voz incluídaGrátis$22+/mo$39+/moEnterprise
API Pública
Motores de código aberto Kokoro, Piper, Dia…
Inscrição necessáriaNãoYesYesYes
Os números dos concorrentes reflectem os níveis livres listados publicamente a partir de 2026. Verificar cada provedor as condições do plano atuais.
Opções avançadas
Resultado
Os tokens estão a ficar baixos. Obter mais tokens
Queres melhores resultados? Modelos premium (GPT-5 Ver Planos

❤️ Love this tool? Share it!

Inscreva-se para obter um link de referência e ganhar 25 mil fichas por amigo.

Queres mais? Inscreva-se gratuitamente para 30K tokens/dia + 10K bônus
Inscreva-se gratuitamente

Processando o seu pedido...

Converta qualquer texto para fala natural com IA gratuita. 50+ vozes em mais de 100 idiomas.

Como Utilizar Texto ao Discurso

1
Insira a sua entrada

Digite texto, carregue um arquivo ou descreva o que você quer. Nenhuma conta necessária.

2
Clique em gerar

Nossa IA processa seu pedido em segundos usando os melhores modelos de código aberto.

3
Baixar & compartilhar

Baixe, copie ou compartilhe seu resultado. Gratuito para uso pessoal e comercial.

Use esta ferramenta através da API

Automate esta ferramenta a partir do seu próprio código. Endpoint REST compatível com o OpenAI, Bearer-token auth, não é necessário SDK extra. Custos de token correspondem à interface web.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"text": "Hello from Free.ai", "voice": "af_heart", "model": "kokoro"}'

Texto ao Discurso — FAQ

Pegue texto, escolha uma das 174 vozes da IA e clique em Generar. Os downloads de arquivo de voz instantaneamente como WAV — não se inscreva.

Seu escolhido mapas de voz para o motor melhor-fit automaticamente: Kokoro para leituras naturais, Chatterbox para entrega expressiva, F5-TTS para clonagem, Dia para diálogo.

Sim — ajustar velocidade (0,5x-2,0x), lançamento (-10 a +10), e emoção (feliz, triste, zangado, sussurro, excitado) em qualquer voz antes de gerar.

Sim. O áudio de voz é seu para usar comercialmente — YouTube, podcasts, aplicativos, anúncios. Todos os modelos de voz subjacentes são permissivamente licenciados.

Cada voz tem um clipe de visualização. Clique no ícone do alto-falante ao lado de uma voz para ouvir seu tom antes de entregar fichas para uma geração completa.

Até 5.000 caracteres por geração de voz para usuários assinados (500 para os hóspedes). Para peças mais longas, use o Criador de Audiobook em /voice/audiobook /.

Kokoro é o conjunto mais natural — entonação suave, pronúncia precisa, artefatos mínimos. Chatterbox é melhor quando você precisa de expressividade ou emoção.

Sim. 37 idiomas estão disponíveis. Escolha a língua no dropdown da Língua de Voz, em seguida, escolha uma voz nativa para essa língua.

Sim. Alternar o interruptor SSML e usar tags como <break>, <prosody> e <enfasi> para controlar pausas, velocidade, lançamento e ênfase para cada parte da saída de voz.

A maioria das vozes retorna em 1-3 segundos. passagens longas (mais de 1.000 caracteres) podem demorar 5-10 segundos dependendo do motor.

Os downloads de voz como WAV para a máxima qualidade. Converter para MP3 com qualquer ferramenta de áudio ou mudar de formato para MP3 para um arquivo mais pequeno direto da ferramenta.

~100 fichas por frase. Uma geração de voz completa (2.000 caracteres) custa ~500 fichas. Sua piscina gratuita diária cobre dezenas de clipes de voz por dia.

Inscreva-se gratuitamente para 10.000 fichas

Criar Conta Livre

Não é exigido o cartão de crédito

Como iria avaliar esta ferramenta?

Love this tool? Share it!