Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 tokens per clip
~500 tokens per clip

Sesame CSM-1B — Apache 2.0. Düşük gecikməli, real vaxt səsi üçün hazırlanmış söhbət model. 24 kHz çıxış, qısa istinad-audio konteksti ilə ən yaxşı səslənir. /voice/realtime/ aləti üçün Free.ai-də öz-özünə host edilmişdir.

API vasitəsilə istifadə et
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
API sənədləşdirilməsi API Açarı

Tez-tez Sorulan Sual

Sesame CSM-1B bir çox dilləri dəstəkləyir. Tam siyahı motora bağlıdır; bu səhifədəki form hər hansı bir mətni qəbul edir və motor dəstəklənən dillərdə render edəcək. Əgər xüsusi bir dil lazımsa, tam çox motorlu seçici üçün /voice/-ə baxın.

Çoxlu motorlar ön qurğulu olaraq neutral-American English və ingilis dili olmayan dillər üçün region-a uyğun aksent göstərər. Premium motorlar aksent variantlarını göstərə bilər - müqayisə etmək üçün nümunəni yapışdır.

SSML dəstəkləməsi motora görə dəyişir. Pause, prosody və emphasis təqvimləri bir çox premium motorlarda və bir neçə öz-özünə host edən motorlarda qəbul edilir. Sadə mətn hər zaman işləyir - məzmun qeydi tələb olunmur.

TTS axını premium motorlarda /v1/tts/ API son nöqtəsi vasitəsilə stream=true ilə mövcuddur. Bu səhifədəki veb UI renderləmə bitdikdən sonra tam klipi geri qaytarır.

Sesame CSM-1B öz GPU-larımızda işləyir. Yaratma əvvəlcə günlük pulsuz ehtiyatınızdan başlayır. Bu ehtiyat tükəndikdən sonra, ödənişli tokenlər $5 → 200,000 tokenlərlə başlayır. Hər xarakter üçün təxminən ~5 token, klip üçün minimum 100.

Veb interfeysində istənilən 5000 xarakterə qədər. Daha uzun parçalar (audio kitablar, tam fəsilə) üçün, avtomatik olaraq parçalanan və birləşən /voice/audiobook/ istifadə edin, ya da API-ni döngə ilə çağırın.

Bəli — /v1/tts/batch/-ə string siyahısını POST et, ya da /workspace/-də iş sahəsi UI-ni istifadə et ki, TTS-i daha uzun boru kəmərinə bağlayasan (məsələn, translate → speak → stitch).

Bəli — /v1/tts/-ə model="Sesame CSM-1B" ilə (və ya bu səhifədəki slug) POST mətni göndər. WAV və ya MP3 qaytarır. Tam istinad + SDK parçaları üçün /api/-ni bax.

Bu səhifə səs klonlama deyil, mətndən-söhbətə çevirmədir - səs motorun ön qurğusudur. Səs klonlama (referans audio yükləmə) üçün /voice/clone/-ə baxın, bu səs hüquqlarının sizin olması və ya açıq yazılı razılığınızı tələb edir.

Öz-özünə host edilən motorlar Free.ai-ə məxsus GPU-larda işləyir; heç nə bizim serverlərimizi tərk etmir. Premium motorlar mətni DPA-mızın altında olan model təminatçılarına verir. Biz sizin daxilotlarınız üzərində təlim etmirik və məlumat satmırıq.

Bəli — Free.ai yaradılan səsin kommersiya istifadəsinə icazə verir. Motorun əsas lisenziyası (Apache 2.0, MIT, ya da satıcı şərtləri) yuxarıda və model istinad səhifəsində göstərilir; praktiki olaraq bu səsləndirmələr, reklamlar, podcastlar və tətbiqlərin hamısı əhatə olunduğunu göstərir.

Bəli — bacarılmayan işlərə avtomatik olaraq qaynaq (günlük pul yığımı və ya ödənilmiş tokenlər) tərəfindən geri qaytarılacaq. Əgər eyni gündə geri qaytarılmasa, contact@free.ai ünvanına e-poçt göndərin.

Free.ai-i sevirsiniz? Dostlarınıza deyin!

Bu səhifəni qiymətləndir