OpenAI: GPT Audio
OpenAI
·
tts
·
~4781 រូបិយប័ណ្ណក្នុងមួយ clip
·
4.3
ពី 3 ប្រភេទនេះមានអ្នកប្រើចំនួនតិចបំផុតដែលអាចប្រើបាន & # 160; ។
OpenAI: GPT Audio គឺជា a អត្ថបទទៅជាសំឡេងនិយាយ ដែលបានសាងសង់ដោយ OpenAI ។ ផ្លូវតាមរយៈម៉ូដែលខាងក្រៅ - ~ 4,781 រូបិយប័ណ្ណ មួយចន្លោះ (50% តម្លៃលើតម្លៃឡើង).
ប្រើតាមរយៈ API
សំណួរដែលសួរញឹកញាប់
OpenAI: GPT Audio គាំទ្រជួរធំនៃភាសា & # 160; ។ បញ្ជីជាក់លាក់អាស្រ័យលើម៉ាស៊ីន សំណុំបែបបទនៅលើទំព័រនេះទទួលយកអត្ថបទណាមួយ ហើយម៉ាស៊ីននឹងបង្ហាញក្នុងភាសាដែលបានគាំទ្រ & # 160; ។ សូមមើល / voice / សម្រាប់កម្មវិធីជ្រើសម៉ាស៊ីនច្រើនពេញលេញ ប្រសិនបើអ្នកត្រូវការភាសាជាក់លាក់ & # 160; ។
ម៉ាស៊ីនភាគច្រើនបង្ហាញភាសាអង់គ្លេសអាមេរិកអព្យាក្រឹតតាមលំនាំដើម និងសំឡេងសមរម្យសម្រាប់តំបន់សម្រាប់ភាសាដែលមិនមែនជាភាសាអង់គ្លេស & # 160; ។ ម៉ាស៊ីនដែលមានតម្លៃខ្ពស់អាចបង្ហាញពីការផ្លាស់ប្ដូរសំឡេង - បិទភ្ជាប់គំរូដើម្បីប្រៀបធៀប & # 160; ។
ការគាំទ្រ SSML ប្រែប្រួលដោយម៉ាស៊ីន & # 160; ។ ផ្អាក, prosody និងស្លាកសង្កត់ធ្ងន់ត្រូវបានគោរពលើម៉ាស៊ីនដែលមានតម្លៃខ្ពស់បំផុត និងលើម៉ាស៊ីនដែលបានរៀបចំដោយខ្លួនឯងមួយចំនួន & # 160; ។ អត្ថបទធម្មតាតែងតែធ្វើការ - មិនចាំបាច់សម្គាល់ & # 160; ។
ការស្ទ្រីម TTS មាននៅលើម៉ាស៊ីនដែលមានតម្លៃខ្ពស់តាមរយៈចំណុចបញ្ចប់ / v1/ tts/ API ជាមួយ stream=true & # 160; ។ ចំណុចប្រទាក់អ្នកប្រើបណ្ដាញនៅលើទំព័រនេះត្រឡប់ចន្លោះពេញលេញនៅពេលដែលការបង្ហាញបញ្ចប់ & # 160; ។
OpenAI: GPT Audio គឺជាម៉ាស៊ីន TTS ដ៏ល្អបំផុតមួយ។ តម្លៃត្រូវបានគណនាដោយរាប់តួអក្សរ - ជាធម្មតា ~30 សញ្ញាក្នុងមួយតួអក្សរ។ $1 ទិញ 750,000 សញ្ញាដូច្នេះកញ្ចប់ $5 គ្របដណ្តប់លើតួអក្សររាប់ពាន់។
រហូតដល់ទៅ 5,000 តួអក្សរក្នុងមួយសំណើនៅលើ UI បណ្ដាញ. សម្រាប់ផ្នែកវែង (សៀវភៅអូឌីយ៉ូ, ជំពូកពេញលេញ), ប្រើ / សំឡេង / សៀវភៅអូឌីយ៉ូ / ដែល chunks និង stitches ដោយស្វ័យប្រវត្តិ, ឬហៅ API នៅក្នុងរង្វិលជុំ.
បាទ — POST បញ្ជីនៃខ្សែអក្សរទៅ / v1 / tts / batch /, ឬប្រើផ្ទៃការងារ UI នៅ / workspace / ដើម្បីខ្សែ TTS ទៅជាបំពង់វែង (ឧទាហរណ៍, បកប្រែ → និយាយ → stitch).
បាទ — អត្ថបទ POST ទៅ /v1/tts/ ជាមួយ model="OpenAI: GPT Audio" (ឬ slug នៅលើទំព័រនេះ) ។ ត្រឡប់ WAV ឬ MP3 ។ មើល /api/ សម្រាប់សេចក្ដីយោងពេញលេញ + ស្ទីគែ SDK ។
ទំព័រនេះគឺជាអត្ថបទទៅការនិយាយ មិនមែនការក្លូនសំឡេងទេ — សំឡេងគឺជាលំនាំដើមរបស់ម៉ាស៊ីន ។ សម្រាប់ក្លូនសំឡេង (ផ្ទុកអូឌីយ៉ូយោងឡើង) សូមមើល / voice/ clone / ដែលទាមទារឲ្យអ្នកមានសិទ្ធិសំឡេង ឬមានការយល់ព្រមដោយសរសេរច្បាស់លាស់ ។
ម៉ាស៊ីនដែលគ្រប់គ្រងដោយខ្លួនឯងរត់នៅលើ Free.ai GPUs ផ្ទាល់ខ្លួន; គ្មានអ្វីចាកចេញពីម៉ាស៊ីនបម្រើរបស់យើងទេ។ ម៉ាស៊ីន Premium ឆ្លងកាត់អត្ថបទទៅអ្នកផ្តល់ម៉ូដែលឡើងក្រោម DPA របស់យើង។ យើងមិនបណ្តុះបណ្តាលលើការបញ្ចូលរបស់អ្នកហើយមិនលក់ទិន្នន័យទេ។
បាទ — Free.ai អនុញ្ញាតឲ្យប្រើពាណិជ្ជកម្មនៃអូឌីយ៉ូដែលបានបង្កើត ។ អាជ្ញាប័ណ្ណដែលមានមូលដ្ឋានរបស់ម៉ាស៊ីន (Apache 2.0, MIT, ឬលក្ខខណ្ឌរបស់អ្នកលក់) ត្រូវបានបង្ហាញនៅលើទំព័រយោងម៉ូដែលនៅលើទំព័រយោងម៉ូដែលក្នុងការអនុវត្តនេះមានន័យថាការនិយាយផ្សាយពាណិជ្ជកម្ម ផតខាស់ និងកម្មវិធីទាំងអស់គឺនៅក្នុងវិសាលភាព ។
បាទ - បរាជ័យការងារស្វ័យប្រវត្តិ-ការសងទៅប្រភព (ហែលទឹកប្រចាំថ្ងៃឬបានបង់ប្រាក់តូចតាច) ។ ប្រសិនបើការសងមិនបង្ហាញឡើងថ្ងៃដូចគ្នា, អ៊ីម៉ែល contact@free.ai ។