VibeVoice
Free.ai (self-hosted)
·
tts
·
~500 จำนวนของชิ้นส่วนต่อหน่วย clip
·
4.3
จาก 3 ผู้ใช้ในหมวดหมู่นี้
VibeVoice เป็น a เสียงแปลงข้อความเป็นเสียงComment สร้างโดย Microsoft แข็งแกร่งที่สุดที่ Long-form audiobooks and multi-speaker podcasts with up to four distinct voices. จัดเก็บข้อมูลด้วยตนเองบน Free.ai GPUs — ทำงานฟรีกับสระของโต๊ะประจำวันของคุณ (500 โต๊ะ ต่อคลิป) ปล่อยออกมาภายใต้ MIT — อนุญาตให้ใช้ในเชิงพาณิชย์บน Free.ai
ใช้ผ่าน API
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"vibevoice","text":"hello world"}'
เอกสาร API
เอากุญแจ API มา
คำถามที่ถามบ่อย
VibeVoice __ รองรับภาษามากมาย รายการที่ถูกต้องขึ้นอยู่กับกลไก; แบบฟอร์มบนหน้านี้จะยอมรับข้อความใดๆ และกลไกจะแสดงผลในภาษาที่มันรองรับ ลองดู / voice / สำหรับตัวเลือกกลไกหลายภาษาเต็มรูปแบบ หากคุณต้องการภาษาที่เฉพาะเจาะจง
กลไกส่วนใหญ่จะแสดงภาษาอังกฤษอเมริกันโดยปริยาย และใช้สำเนียงที่เหมาะสมกับภูมิภาคสำหรับภาษาที่ไม่ใช่ภาษาอังกฤษ กลไก Premium อาจจะแสดงสำเนียงที่แตกต่างกันออกไป - ปักหมุดตัวอย่างเพื่อเปรียบเทียบ
การรองรับ SSML นั้นแตกต่างกันไปตามกลไกต่าง ๆ แท็กการหยุดชะงัก, คำอธิบายและการเน้น จะถูกใช้กับกลไกพิเศษส่วนใหญ่ และบางกลไกที่ใช้ตัวมันเอง ข้อความธรรมดาจะทำงานได้เสมอ — ไม่จำเป็นต้องมีการทำเครื่องหมาย
การสตรีม TTS สามารถใช้ได้บนเครื่องมือระดับพรีเมี่ยมผ่านทางจุดสิ้นสุดของ API / v1/ tts/ ด้วย stream=true ส่วนติดต่อผู้ใช้บนหน้านี้จะแสดงคลิปเต็มเมื่อการแสดงผลเสร็จสมบูรณ์
VibeVoice ทำงานบน GPU ของพวกเราเอง สร้างจากสระฟรีของคุณเป็นครั้งแรก เมื่อหมดแล้ว โต๊ะที่จ่ายเริ่มที่ $5 → 200,000 โต๊ะ ประมาณ ~5โต๊ะต่อตัวอักษร อย่างน้อย 100 โต๊ะต่อคลิป
สูงสุด 5,000 ตัวอักษรต่อคำร้องขอบนเว็บ UI สำหรับส่วนที่ยาวกว่า (หนังสือเสียง, บทเต็ม) ใช้ /voice/audiobook/ ซึ่งจะแยกและต่อกันโดยอัตโนมัติ หรือเรียก API ในลูป
ใช่ — POST รายการข้อความไปยัง / v1/ tts/ batch / หรือใช้ UI ของพื้นที่ทำงานที่ / workspace / เพื่อเชื่อมต่อ TTS เข้ากับท่อที่ยาวกว่า (เช่น translate → speak → stitch)
ใช่ — POST ข้อความไปยัง / v1/ tts / ด้วย model="VibeVoice" (หรือ slug ที่หน้านี้) จะคืนค่าเป็น WAV หรือ MP3 โปรดดูที่ / api / สำหรับข้อมูลเพิ่มเติม + สแนป SDK
หน้านี้เป็นหน้าที่แปลงข้อความเป็นเสียง ไม่ใช่หน้าที่คล้ายเสียง - เสียงเป็นตัวกำหนดอัตโนมัติของกลไก สำหรับคล้ายเสียง (อัปโหลดเสียงที่อ้างอิง) โปรดดูที่ /voice/clone/ ซึ่งจะต้องมีสิทธิ์ในการใช้เสียงหรือมีใบอนุญาตเป็นลายลักษณ์อักษรชัดเจน
กลไกที่ใช้เองทำงานบน GPU ที่ Free.ai ถือครอง ไม่มีอะไรออกจากเซิร์ฟเวอร์ของเรา กลไกพิเศษส่งข้อความไปยังผู้ให้บริการแบบจำลองด้านบนภายใต้ DPA ของเรา เราจะไม่ฝึกการเข้ารหัสของคุณและจะไม่ขายข้อมูล
ใช่ — Free.ai อนุญาตให้ใช้เสียงที่สร้างขึ้นเพื่อการค้า ใบอนุญาตพื้นฐานของเครื่องยนต์ (Apache 2.0, MIT, หรือเงื่อนไขของผู้ผลิต) จะแสดงไว้ด้านบนและบนหน้าอ้างอิงแบบอย่าง ในทางปฏิบัติ หมายความว่า เสียงอ้างอิง โฆษณา พอดคาสต์ และแอพพลิเคชัน ทั้งหมดอยู่ในขอบเขต
ใช่ — งานที่ล้มเหลวจะถูกคืนเงินอัตโนมัติไปยังแหล่งที่มา (กองประจำวัน หรือ โต๊ะที่จ่ายค่าบริการ) หากการคืนเงินไม่ปรากฏในวันเดียวกัน โปรดส่งอีเมลไปที่ contact@free.ai