OpenAI: GPT Audio Mini
OpenAI
·
tts
·
~1147 توکنها در هر clip
·
4.3
از 3 کاربران در این دسته
OpenAI: GPT Audio Mini is a متن به گفتار built by OpenAI. مسیریابی از طریق مدلهای خارجی — ~1,147 tokens برحسب نوار (۵۰٪ مارکاپ بر روی هزینههای بالادستی).
استفاده از طریق API
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"openai/gpt-audio-mini","text":"hello world"}'
مستندات API
دریافت کلید API
پرسشهای متداول
نام_PH_FREEAI از طیف گستردهای از زبانها پشتیبانی میکند. فهرست دقیق به موتور بستگی دارد؛ فرم در این صفحه هر متنی را میپذیرد و موتور به زبانهای پشتیبانی شده آن نمایش میدهد. اگر به یک زبان خاص نیاز دارید ، برای انتخابکننده چند موتور کامل ، /voice / را ببینید.
بیشتر موتورها به صورت پیشفرض انگلیسی آمریکایی خنثی را نمایش میدهند و لهجههای مناسب برای زبانهای غیر انگلیسی. موتورهای پریمیوم ممکن است انواع لهجهها را نشان دهند - یک نمونه را برای مقایسه چسباندن.
پشتیبانی SSML با موتور متفاوت است. برچسبهای توقف ، قافیه و تأکید در بیشتر موتورهای پرمیوم و در چند موتور خود میزبانی شده مورد احترام قرار میگیرند. متن ساده همیشه کار میکند — هیچ علامتگذاری نیازی نیست.
پخش TTS در موتورهای پریمیوم از طریق نقطه پایانی /v1/tts/ API با stream=true در دسترس است.
هزینه با تعداد کاراکترها اندازهگیری میشود - معمولاً ~۳۰ توکن برای هر کاراکتر. ۱ دلار ۷۵۰۰۰۰ توکن را خریداری میکند، بنابراین یک بسته ۵ دلاری دهها هزار کاراکتر را پوشش میدهد.
برای قطعات طولانیتر (کتابهای صوتی، فصلهای کامل)، از /voice/audiobook/ استفاده کنید که به صورت خودکار تکه تکه میشود و دوخت میشود، یا API را در یک حلقه فراخوانی کنید.
بله — یک لیست از رشتهها را به /v1/tts/batch/ ارسال کنید، یا از رابط کاربری فضای کاری در /workspace/ استفاده کنید تا TTS را به یک خط لوله طولانیتر زنجیر کنید (مثلاً، ترجمه → صحبت کردن → ست کردن).
بله — متن POST به /v1/tts/ با model="OpenAI: GPT Audio Mini" (یا slug در این صفحه). WAV یا MP3 را برمیگرداند. برای مرجع کامل + قطعههای SDK /api/ را ببینید.
این صفحه متن به گفتار است، نه شبیهسازی صدا — صدا پیشفرض موتور است. برای شبیهسازی صدا (بارگذاری یک صدای مرجع)، به /voice/clone/ مراجعه کنید، که نیازمند این است که شما یا مالک حقوق صدا باشید یا اجازهٔ کتبی صریح داشته باشید.
Self-hosted engines run on Free.ai-owned GPUs; nothing leaves our servers. Premium engines pass text to upstream model providers under our DPA. We do not train on your inputs and do not sell data.
Yes — Free.ai grants commercial use of generated audio. The engine's underlying license (Apache 2.0, MIT, or vendor terms) is shown above and on the model reference page; in practice this means voiceovers, ads, podcasts, and apps are all in-scope.
بله — کارهای شکست خورده به صورت خودکار به منبع بازگردانده میشوند (گزارش روزانه یا توکنهای پرداختی). اگر بازگرداندن در همان روز رخ ندهد، ایمیل به contact@free.ai بفرستید.