Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 tokens per clip · 4.3 desde 3 usuarios de esta categoría
~500 tokens per clip

Sesame CSM-1B es a voz de texto a voz construido por Sesame. Más fuerte en Real-time voice agents, conversational AI, streaming TTS where time-to-first-audio matters more than studio-perfect reads.. Auto-alojado en Free.ai GPUs — funciona gratis contra su piscina diaria de tokens (500 tokens por clip). Liberado bajo Apache 2.0 — uso comercial permitido el Free.ai.

Uso a través de API
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
Documentación API Obtener clave de API

Preguntas frecuentes

Sesame CSM-1B soporta una amplia gama de idiomas. La lista exacta depende del motor; el formulario de esta página acepta cualquier texto y el motor se renderizará en sus idiomas soportados. Vea /voice/ para el selector multimotor completo si necesita un idioma específico.

La mayoría de los motores representan neutro-estadounidense Inglés por defecto y un acento apropiado para la región para los idiomas no-inglés. Los motores premium pueden exponer variantes de acento - pegar una muestra para comparar.

El soporte SSML varía según el motor. Las etiquetas de pausa, prosodia y énfasis se honran en la mayoría de los motores premium y en algunos auto-anfitriones. El texto plano siempre funciona, no se requiere marcado.

Streaming TTS está disponible en motores premium a través del /v1/tts/ API endpoint con streaming=true. La interfaz de usuario web en esta página devuelve el clip completo una vez terminado el renderizado.

Sesame CSM-1B se ejecuta en nuestras propias GPUs. Generación se extrae de su piscina gratuita diaria primero. Una vez agotados, los tokens pagados comienzan en $5 → 200.000 tokens. Aproximadamente ~5 tokens por carácter, mínimo 100 por clip.

Hasta 5.000 caracteres por petición en la interfaz de usuario web. Para piezas más largas (audiolibros, capítulos completos), use /voice/audiobook/ que trozos y puntos automáticamente, o llame a la API en un bucle.

Sí — Enviar una lista de cadenas a /v1/tts/batch/, o utilizar la interfaz de usuario del espacio de trabajo en /workspace/ para encadenar TTS en una tubería más larga (por ejemplo, traducir → hablar → punto).

Sí — POST text to /v1/tts/ with model="Sesame CSM-1B" (o la bala en esta página). Devuelve WAV o MP3. Vea /api/ para una referencia completa + fragmentos SDK.

Esta página es texto a voz, no clonación de voz — la voz es el valor predeterminado del motor. Para la clonación de voz (cargando un audio de referencia), véase /voice/clone/, que requiere que usted sea propietario de los derechos de voz o tenga consentimiento explícito por escrito.

Los motores auto hospedados funcionan en GPUs de Free.ai; nada sale de nuestros servidores. Los motores premium pasan texto a proveedores de modelos ascendentes bajo nuestro DPA. No entrenamos en sus entradas y no vendemos datos.

Sí — Free.ai concede el uso comercial de audio generado. La licencia subyacente del motor (Apache 2.0, MIT, o términos del vendedor) se muestra arriba y en la página de referencia del modelo; en la práctica esto significa que las voces en offs, anuncios, podcasts y aplicaciones están en el alcance.

Sí — trabajos fallidos auto-reembolso a la fuente (al día pool o tokens pagados). Si un reembolso no aparece el mismo día, envíe un correo electrónico a contact@free.ai.

Love this tool? Share it!

Calificar esta página