OpenAI: GPT Audio Mini

Q: آیا OpenAI: GPT Audio Mini لهجهای قابل تشخیص دارد؟

بیشتر موتورها به صورت پیشفرض انگلیسی آمریکایی خنثی را نمایش میدهند و لهجههای مناسب برای زبانهای غیر انگلیسی. موتورهای پریمیوم ممکن است انواع لهجهها را نشان دهند - یک نمونه را برای مقایسه چسباندن.

Q: هر کليپ OpenAI: GPT Audio Mini چقدر مي خره؟

هزینه با تعداد کاراکترها اندازهگیری میشود - معمولاً ~۳۰ توکن برای هر کاراکتر. ۱ دلار ۷۵۰۰۰۰ توکن را خریداری میکند، بنابراین یک بسته ۵ دلاری دهها هزار کاراکتر را پوشش میدهد.

Q: طول متن حداکثری برای OpenAI: GPT Audio Mini چیست؟

برای قطعات طولانیتر (کتابهای صوتی، فصلهای کامل)، از /voice/audiobook/ استفاده کنید که به صورت خودکار تکه تکه میشود و دوخت میشود، یا API را در یک حلقه فراخوانی کنید.

Q: می توانم OpenAI: GPT Audio Mini را در بسته اجرا کنم؟

بله — یک لیست از رشتهها را به /v1/tts/batch/ ارسال کنید، یا از رابط کاربری فضای کاری در /workspace/ استفاده کنید تا TTS را به یک خط لوله طولانیتر زنجیر کنید (مثلاً، ترجمه → صحبت کردن → ست کردن).

Q: آیا برای شبیهسازی صدایی با نام OpenAI: GPT Audio Mini نیاز به اجازه دارم؟

این صفحه متن به گفتار است، نه شبیهسازی صدا — صدا پیشفرض موتور است. برای شبیهسازی صدا (بارگذاری یک صدای مرجع)، به /voice/clone/ مراجعه کنید، که نیازمند این است که شما یا مالک حقوق صدا باشید یا اجازهٔ کتبی صریح داشته باشید.

OpenAI · tts · ~1147 توکنها در هر clip · 4.3 از 3 کاربران در این دسته

متن برای گفتن

صدا

سرعت

~1147 توکنها در هر clip

در پردازنده‌های گرافیکی ما آزادانه اجرا می‌شود. ارتقا برای OpenAI: GPT Audio Mini →

OpenAI: GPT Audio Mini is a متن به گفتار built by OpenAI. مسیریابی از طریق مدل‌های خارجی — ~1,147 tokens برحسب نوار (۵۰٪ مارکاپ بر روی هزینه‌های بالادستی).

استفاده از طریق API

API REST سازگار با OpenAI. یک کلید تولید کنید و این مدل را در چند ثانیه فراخوانی کنید.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"openai/gpt-audio-mini","text":"hello world"}'

مستندات API دریافت کلید API

مدل‌های مشابه

Bark TTS

Cartesia Sonic 3 (real-time)

ElevenLabs Multilingual v2

ElevenLabs Turbo v2.5

Inworld TTS

Orpheus TTS

Parler TTS Large

PlayAI v3 TTS

مرور همۀ مدلها →

پرسشهای متداول

OpenAI: GPT Audio Mini supports a wide range of languages. The exact list depends on the engine; the form on this page accepts any text and the engine will render in its supported languages. See /voice/ for the full multi-engine picker if you need a specific language.

بیشتر موتورها به صورت پیش‌فرض انگلیسی آمریکایی خنثی را نمایش می‌دهند و لهجه‌های مناسب برای زبان‌های غیر انگلیسی. موتورهای پریمیوم ممکن است انواع لهجه‌ها را نشان دهند - یک نمونه را برای مقایسه چسباندن.

پشتیبانی SSML با موتور متفاوت است. برچسبهای توقف ، قافیه و تأکید در بیشتر موتورهای پرمیوم و در چند موتور خود میزبانی شده مورد احترام قرار می‌گیرند. متن ساده همیشه کار می‌کند — هیچ علامتگذاری نیازی نیست.

پخش TTS در موتورهای پریمیوم از طریق نقطه پایانی /v1/tts/ API با stream=true در دسترس است.

هزینه با تعداد کاراکترها اندازه‌گیری می‌شود - معمولاً ~۳۰ توکن برای هر کاراکتر. ۱ دلار ۷۵۰۰۰۰ توکن را خریداری می‌کند، بنابراین یک بسته ۵ دلاری دهها هزار کاراکتر را پوشش می‌دهد.

برای قطعات طولانی‌تر (کتاب‌های صوتی، فصل‌های کامل)، از /voice/audiobook/ استفاده کنید که به صورت خودکار تکه تکه می‌شود و دوخت می‌شود، یا API را در یک حلقه فراخوانی کنید.

بله — یک لیست از رشته‌ها را به /v1/tts/batch/ ارسال کنید، یا از رابط کاربری فضای کاری در /workspace/ استفاده کنید تا TTS را به یک خط لوله طولانی‌تر زنجیر کنید (مثلاً، ترجمه → صحبت کردن → ست کردن).

بله — متن POST به /v1/tts/ با model="OpenAI: GPT Audio Mini" (یا slug در این صفحه). WAV یا MP3 را برمی‌گرداند. برای مرجع کامل + قطعه‌های SDK /api/ را ببینید.

این صفحه متن به گفتار است، نه شبیه‌سازی صدا — صدا پیش‌فرض موتور است. برای شبیه‌سازی صدا (بارگذاری یک صدای مرجع)، به /voice/clone/ مراجعه کنید، که نیازمند این است که شما یا مالک حقوق صدا باشید یا اجازهٔ کتبی صریح داشته باشید.

Self-hosted engines run on Free.ai-owned GPUs; nothing leaves our servers. Premium engines pass text to upstream model providers under our DPA. We do not train on your inputs and do not sell data.

Yes — Free.ai grants commercial use of generated audio. The engine's underlying license (Apache 2.0, MIT, or vendor terms) is shown above and on the model reference page; in practice this means voiceovers, ads, podcasts, and apps are all in-scope.

بله — کارهای شکست خورده به صورت خودکار به منبع بازگردانده می‌شوند (گزارش روزانه یا توکن‌های پرداختی). اگر بازگرداندن در همان روز رخ ندهد، ایمیل به contact@free.ai بفرستید.

OpenAI: GPT Audio Mini

استفاده از طریق API

مدل‌های مشابه

پرسشهای متداول

چه زبانهايي رو OpenAI: GPT Audio Mini پوشش ميده؟

آیا OpenAI: GPT Audio Mini لهجه‌ای قابل تشخیص دارد؟

آیا می‌توانم از SSML با OpenAI: GPT Audio Mini استفاده کنم؟

آیا OpenAI: GPT Audio Mini از جریان پشتیبانی می‌کند؟

هر کليپ OpenAI: GPT Audio Mini چقدر مي خره؟

طول متن حداکثری برای OpenAI: GPT Audio Mini چیست؟

می توانم OpenAI: GPT Audio Mini را در بسته اجرا کنم؟

آیا یک API برای OpenAI: GPT Audio Mini وجود دارد؟

آیا برای شبیه‌سازی صدایی با نام OpenAI: GPT Audio Mini نیاز به اجازه دارم؟

در مورد حریم خصوصی با OpenAI: GPT Audio Mini چی؟

آیا خروجی OpenAI: GPT Audio Mini برای استفاده تجاری امن است؟

اگه OpenAI: GPT Audio Mini شکست بخوره، ميتونم پولمو پس بگيرم؟

10000 توکن رایگان دریافت کنید

صبر کن - 10K توکن رایگان دریافت کن!

بيشتر ميخواي؟