Kokoro TTS (premium endpoint)
Free.ai
·
tts
·
~500 jetons par clip
·
4.3
à partir de 3 utilisateurs de cette catégorie
Kokoro TTS (premium endpoint) est {article_____freeai_ph_category}. Tracé à travers des modèles externes — ~500 jetons par clip (portée de 50 % sur le coût en amont).
Utiliser via l'API
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/kokoro-tts","text":"hello world"}'
Documentation de l'API
Obtenir la clé API
Foire aux questions
Kokoro TTS (premium endpoint) prend en charge un large éventail de langues. La liste exacte dépend du moteur; le formulaire de cette page accepte tout texte et le moteur rendra dans ses langues prises en charge. Voir /voice/ pour le sélectionneur multimoteur complet si vous avez besoin d'une langue spécifique.
La plupart des moteurs rendent l'anglais neutre-américain par défaut et un accent adapté à la région pour les langues non anglaises. Les moteurs Premium peuvent exposer des variantes d'accent — coller un échantillon à comparer.
Le support SSML varie selon le moteur. Pause, prosody, et tags de mise en valeur sont honorés sur la plupart des moteurs premium et sur quelques auto-hôtes.
Streaming TTS est disponible sur les moteurs premium via le paramètre /v1/tts/ API avec stream=true. L'interface utilisateur web de cette page retourne le clip complet une fois le rendu terminé.
Kokoro TTS (premium endpoint) est un moteur TTS premium. Balances de coûts avec le nombre de caractères — typiquement ~30 jetons par caractère. $1 achète 750 000 jetons, donc un pack de $5 couvre des dizaines de milliers de caractères.
Jusqu'à 5 000 caractères par demande sur l'interface utilisateur web. Pour les pièces plus longues (audiobooks, chapitres complets), utilisez /voice/audiobook/ qui découpe et suture automatiquement, ou appelez l'API en boucle.
Oui — POST une liste de chaînes à /v1/tts/batch/, ou utiliser l'interface utilisateur de l'espace de travail à /workspace/ pour chaîner TTS dans un pipeline plus long (par exemple, traduire → parler → point).
Oui — Texte POST à /v1/tts/ avec model=Kokoro TTS (premium endpoint)" (ou la limace sur cette page). Retourne WAV ou MP3. Voir /api/ pour la référence complète + extraits SDK.
Cette page est text-to-speech, pas le clonage vocal — la voix est la valeur par défaut du moteur. Pour le clonage vocal (uploading a reference audio), voir /voice/clone/, qui exige que vous possédiez les droits vocals ou ayez un consentement écrit explicite.
Les moteurs autonomes fonctionnent sur des GPU appartenant à Free.ai ; rien ne laisse nos serveurs. Les moteurs Premium transmettent du texte aux fournisseurs de modèles en amont sous notre DPA. Nous ne formons pas sur vos entrées et ne vendons pas de données.
Oui — Free.ai accorde l'utilisation commerciale de l'audio généré. La licence sous-jacente du moteur (Apache 2.0, MIT, ou termes de fournisseur) est montrée ci-dessus et sur la page de référence du modèle; dans la pratique, cela signifie que les voix offs, annonces, podcasts, et applications sont tous dans le champ.
Oui — les emplois échoués sont automatiquement remboursés à la source (pool quotidien ou jetons payés). Si un remboursement n'apparaît pas le même jour, envoyez un courriel à contact@free.ai.