Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 Torneiras por clip · 4.3 a partir de 3 utilizadores desta categoria
~500 Torneiras por clip

Sesame CSM-1B is a Voz de texto a voz built by Sesame. Mais forte em Real-time voice agents, conversational AI, streaming TTS where time-to-first-audio matters more than studio-perfect reads.. Self-hosted on Free.ai GPUs — corre livre contra a sua piscina cotidiana de tokens (500 tokens por clipe). Libertado em Apache 2.0 — utilização comercial permitida em Free.ai.

Utilizar através da API
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
Documentação da API Obter a chave da API

Perguntas Frequentes

Sesame CSM-1B suporta uma ampla gama de idiomas. A lista exacta depende do motor; o formulário nesta página aceita qualquer texto e o motor irá renderizar em suas línguas suportadas. Veja /voice / para o selector multimotor completo se você precisar de um idioma específico.

A maioria dos motores tornam o inglês neutra-americano por padrão e um accento regional adequado para idiomas não-inglês. Os motores premium podem expor variantes de accento — colar uma amostra para comparar.

O suporte SSML varia segundo o motor. Pausa, prosódia e ênfase as etiquetas são honradas na maioria dos motores premium e em alguns auto-hosted. Texto simples sempre funciona — sem marcação necessária.

O Streaming TTS está disponível em motores premium através do endpoint /v1/tts/ API com stream=true. A UI web nesta página devolve o clipe completo uma vez que termina a renderização.

Sesame CSM-1B funciona em nosso próprio GPUs. Geração tira de sua piscina gratuita diária primeiro. Uma vez esgotado, fichas pagas começam com $5 → 200.000 fichas. Aproximadamente ~5 fichas por personagem, mínimo 100 por clipe.

Até 5.000 caracteres por pedido na UI web. Para peças mais longas (audiobooks, capítulos completos), use /voice/audiobook/ que pedaços e pontos automaticamente, ou chame a API em um loop.

Sim — POST uma lista de cordas para /v1/tts/batch /, ou usar a interface de trabalho em /workspace/ para encadenar TTS em um pipeline mais longo (por exemplo, traduzir → falar → ponto).

Sim — Texto POST para /v1/tts/ com modelo="Sesame CSM-1B" (ou o lixo nesta página). Devolve WAV ou MP3. Veja /api/ para referência completa + SDK snippets.

Esta página é text-to-speech, não clonagem de voz — a voz é o padrão do motor. Para clonagem de voz (uploading a reference audio), veja /voice/clone/, que requer que você seja proprietário dos direitos de voz ou tenha consentimento escrito explícito.

Motores auto-hostados funcionam em Free.ai GPU de propriedade; nada deixa nossos servidores. Os motores premium passam texto para fornecedores de modelos a montante sob nosso DPA. Não treinamos em seus insumos e não vendemos dados.

Sim — Free.ai concede o uso comercial do áudio gerado. A licença subjacente do motor (Apache 2.0, MIT, ou termos do vendedor) é mostrada acima e na página de referência do modelo; na prática isso significa vozovers, anúncios, podcasts e aplicativos são todos in-scope.

Sim — trabalhos sem resposta automática à fonte (pool diário ou fichas pagas). Se um reembolso não aparecer no mesmo dia, e-mail contact@free.ai.

Love this tool? Share it!

Avaliar esta página