Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 jetons par clip · 4.3 à partir de 3 utilisateurs de cette catégorie
~500 jetons par clip

Sesame CSM-1B est a Voix texte-à-parler construit par Sesame. Plus fort à {meilleur_pour}. Self-hosted sur Free.ai GPUs — fonctionne gratuitement contre votre pool de jetons journaliers (500 jetons par clip). Libéré sous Apache 2.0 — utilisation commerciale autorisée sur Free.ai.

Utiliser via l'API
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
Documentation de l'API Obtenir la clé API

Foire aux questions

Sesame CSM-1B prend en charge un large éventail de langues. La liste exacte dépend du moteur; le formulaire de cette page accepte tout texte et le moteur rendra dans ses langues prises en charge. Voir /voice/ pour le sélectionneur multimoteur complet si vous avez besoin d'une langue spécifique.

La plupart des moteurs rendent l'anglais neutre-américain par défaut et un accent adapté à la région pour les langues non anglaises. Les moteurs Premium peuvent exposer des variantes d'accent — coller un échantillon à comparer.

Le support SSML varie selon le moteur. Pause, prosody, et tags de mise en valeur sont honorés sur la plupart des moteurs premium et sur quelques auto-hôtes.

Streaming TTS est disponible sur les moteurs premium via le paramètre /v1/tts/ API avec stream=true. L'interface utilisateur web de cette page retourne le clip complet une fois le rendu terminé.

Sesame CSM-1B fonctionne sur nos propres GPUs. Generation tire d'abord de votre piscine gratuite quotidienne. Une fois épuisé, jetons payés commencent à $5 → 200 000 jetons. Environ ~5 jetons par caractère, minimum 100 par clip.

Jusqu'à 5 000 caractères par demande sur l'interface utilisateur web. Pour les pièces plus longues (audiobooks, chapitres complets), utilisez /voice/audiobook/ qui découpe et suture automatiquement, ou appelez l'API en boucle.

Oui — POST une liste de chaînes à /v1/tts/batch/, ou utiliser l'interface utilisateur de l'espace de travail à /workspace/ pour chaîner TTS dans un pipeline plus long (par exemple, traduire → parler → point).

Oui — Texte POST à /v1/tts/ avec model=Sesame CSM-1B" (ou la limace sur cette page). Retourne WAV ou MP3. Voir /api/ pour la référence complète + extraits SDK.

Cette page est text-to-speech, pas le clonage vocal — la voix est la valeur par défaut du moteur. Pour le clonage vocal (uploading a reference audio), voir /voice/clone/, qui exige que vous possédiez les droits vocals ou ayez un consentement écrit explicite.

Les moteurs autonomes fonctionnent sur des GPU appartenant à Free.ai ; rien ne laisse nos serveurs. Les moteurs Premium transmettent du texte aux fournisseurs de modèles en amont sous notre DPA. Nous ne formons pas sur vos entrées et ne vendons pas de données.

Oui — Free.ai accorde l'utilisation commerciale de l'audio généré. La licence sous-jacente du moteur (Apache 2.0, MIT, ou termes de fournisseur) est montrée ci-dessus et sur la page de référence du modèle; dans la pratique, cela signifie que les voix offs, annonces, podcasts, et applications sont tous dans le champ.

Oui — les emplois échoués sont automatiquement remboursés à la source (pool quotidien ou jetons payés). Si un remboursement n'apparaît pas le même jour, envoyez un courriel à contact@free.ai.

Love this tool? Share it!

Noter cette page