Cartesia Sonic 3 (real-time)
Free.ai
·
tts
·
~500 Torneiras por clip
·
4.3
a partir de 3 utilizadores desta categoria
Cartesia Sonic 3 (real-time) is a Voz de texto a voz. Encaminhado através de modelos externos — ~500 tokens por clipe (50% de marcagem sobre o custo a montante).
Utilizar através da API
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/cartesia/sonic-3","text":"hello world"}'
Documentação da API
Obter a chave da API
Perguntas Frequentes
Cartesia Sonic 3 (real-time) suporta uma ampla gama de idiomas. A lista exacta depende do motor; o formulário nesta página aceita qualquer texto e o motor irá renderizar em suas línguas suportadas. Veja /voice / para o selector multimotor completo se você precisar de um idioma específico.
A maioria dos motores tornam o inglês neutra-americano por padrão e um accento regional adequado para idiomas não-inglês. Os motores premium podem expor variantes de accento — colar uma amostra para comparar.
O suporte SSML varia segundo o motor. Pausa, prosódia e ênfase as etiquetas são honradas na maioria dos motores premium e em alguns auto-hosted. Texto simples sempre funciona — sem marcação necessária.
O Streaming TTS está disponível em motores premium através do endpoint /v1/tts/ API com stream=true. A UI web nesta página devolve o clipe completo uma vez que termina a renderização.
Cartesia Sonic 3 (real-time) é um motor de TTS premium. Escalas de custos com contagem de caracteres — tipicamente ~30 fichas por personagem. $1 compra 750.000 fichas, por isso um pacote de $5 cobre dezenas de milhares de caracteres.
Até 5.000 caracteres por pedido na UI web. Para peças mais longas (audiobooks, capítulos completos), use /voice/audiobook/ que pedaços e pontos automaticamente, ou chame a API em um loop.
Sim — POST uma lista de cordas para /v1/tts/batch /, ou usar a interface de trabalho em /workspace/ para encadenar TTS em um pipeline mais longo (por exemplo, traduzir → falar → ponto).
Sim — Texto POST para /v1/tts/ com modelo="Cartesia Sonic 3 (real-time)" (ou o lixo nesta página). Devolve WAV ou MP3. Veja /api/ para referência completa + SDK snippets.
Esta página é text-to-speech, não clonagem de voz — a voz é o padrão do motor. Para clonagem de voz (uploading a reference audio), veja /voice/clone/, que requer que você seja proprietário dos direitos de voz ou tenha consentimento escrito explícito.
Motores auto-hostados funcionam em Free.ai GPU de propriedade; nada deixa nossos servidores. Os motores premium passam texto para fornecedores de modelos a montante sob nosso DPA. Não treinamos em seus insumos e não vendemos dados.
Sim — Free.ai concede o uso comercial do áudio gerado. A licença subjacente do motor (Apache 2.0, MIT, ou termos do vendedor) é mostrada acima e na página de referência do modelo; na prática isso significa vozovers, anúncios, podcasts e aplicativos são todos in-scope.
Sim — trabalhos sem resposta automática à fonte (pool diário ou fichas pagas). Se um reembolso não aparecer no mesmo dia, e-mail contact@free.ai.