Fal Speech-to-Text

Free.ai · stt · ~500 រូបិយប័ណ្ណ​ក្នុង​មួយ minute

ទម្លាក់​ឯកសារ​អូឌីយ៉ូ ឬ​វីដេអូ ឬ​បិទភ្ជាប់ URL ខាងក្រោម

~500 រូបិយប័ណ្ណ​ក្នុង​មួយ minute
រត់​ដោយ​ឥត​គិត​ថ្លៃ​លើ GPUs របស់​យើង ។ ធ្វើ​ឲ្យ​ប្រសើរ​សម្រាប់ Fal Speech-to-Text →

Fal Speech-to-Text គឺជា a ម៉ូដែល​និយាយ​ទៅ​អត្ថបទ ។ ផ្លូវតាមរយៈម៉ូដែលខាងក្រៅ - ~ 500 រូបិយប័ណ្ណ នាទី (50% តម្លៃលើតម្លៃឡើង).

ប្រើ​តាម​រយៈ API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'
ឯកសារ API យក​សោ API

សំណួរ​ដែល​សួរ​ញឹកញាប់

Fal Speech-to-Text បកប្រែអូឌីយ៉ូនិយាយទៅជាអត្ថបទ។ ផ្ទុកឡើង MP3, WAV, M4A, ឬឯកសារវីដេអូនិង Fal Speech-to-Text ត្រឡប់ការបកប្រែពេញលេញបន្ថែមពីលើចំណងជើង SRT / VTT ជម្រើសជាមួយ timestamps ។

Fal Speech-to-Text គ្រប់គ្រងភាសារាប់សិប - Whisper-គ្រួសារគំរូគ្របដណ្តប់ 90+, Parakeet គ្របដណ្តប់ ~25, ផ្សេងទៀតប្រែប្រួល។ ជ្រើស "រកមើលដោយស្វ័យប្រវត្តិ" ឬបញ្ជាក់ភាសាសម្រាប់ភាពត្រឹមត្រូវខ្ពស់បំផុត។

អត្រាកំហុសពាក្យគឺ 5-10% លើអូឌីយ៉ូអង់គ្លេសស្អាត 10-20% លើអូឌីយ៉ូមានសំឡេងរំខានឬ accented ។ កំណែធំនៃស្ថាបត្យកម្មដូចគ្នាធ្វើបានល្អប្រសើរជាងមុនលើករណីធ្ងន់ធ្ងរ - ជ្រើសធំជាងពេលអូឌីយ៉ូគឺក្រាស់ ។

បាទ - គ្រប់ផ្នែករួមបញ្ចូលចាប់ផ្ដើម / បញ្ចប់ timestamps. នាំចេញជា SRT ឬ VTT និងផែនទីពេលវេលាដោយផ្ទាល់ទៅលើវីដេអូរបស់អ្នក.

Fal Speech-to-Text គឺជាម៉ាស៊ីនបកប្រែប្រាក់រង្វាន់។ អំពី ~500–1,500 សញ្ញាក្នុងមួយនាទីនៃអូឌីយ៉ូ។ $1 = 750,000 សញ្ញា។

MP3, WAV, M4A, FLAC, OGG, បន្ថែមពីលើវីដេអូ (MP4, MOV, WebM) — យើងបានស្រង់ចេញអូឌីយ៉ូ. អតិបរមា 500 មេកាបៃក្នុងមួយការផ្ទុកឡើង. ឯកសារយូរ? ចែកចេញជា / អូឌីយ៉ូ / កាត់ / ឬប្រើ / v1 / stt / batch /.

កម្មវិធី​សរសេរ​សំបុត្រ​របស់​អ្នក​និយាយ​គឺ​ជា​ការ​ឆ្លងកាត់​ដាច់​ដោយ​ឡែក — បិទបើក "diarize" នៅ​លើ / transcribe / ។ Fal Speech-to-Text គ្រប់គ្រង​ការ​សរសេរ​សំបុត្រ​ឡើងវិញ​; កម្មវិធី​សរសេរ​សំបុត្រ​ដាក់​ស្លាក​ផ្នែក​នីមួយៗ​ជាមួយ​អ្នក​និយាយ 1 / អ្នក​និយាយ2/ ល ។

បាទ — / batch / ទទួលយក​ថត​ឯកសារ​អូឌីយ៉ូ ។ អត្ថបទ​សរសេរ​រៀងៗ​ខ្លួន​ចុះចត​ក្នុង / account /? tab=history ជាមួយ​នឹង​ឈ្មោះ​ឯកសារ​ដើម ។ សម្រាប់​ការ​រក្សា​ទុក​ថត​មែកធាង​ប្រើ​ API ។

បាទ — POST អូឌីយ៉ូរបស់អ្នកទៅ /v1/stt/transcribe/ ជាមួយ model="Fal Speech-to-Text" ។ ត្រឡប់ JSON ជាមួយអត្ថបទ + ផ្នែក + សញ្ញាពេលវេលាកម្រិតពាក្យ ។ /api/ មានសេចក្ដីយោងពេញលេញ ។

ម៉ូដែលដែលរៀបចំដោយខ្លួនឯងរក្សាអូឌីយ៉ូនៅលើ GPUs របស់យើង; ប្រាក់រង្វាន់ឆ្លងកាត់តាមរយៈជាមួយ DPA ។ អូឌីយ៉ូត្រូវបានលុបបន្ទាប់ពីបង្អួចចែករំលែក (24h anon, 7d ចុះឈ្មោះចូល) ។ យើងមិនបណ្តុះបណ្តាលលើការបញ្ចូលរបស់អ្នកទេ។

បាទ — Free.ai ផ្តល់ការប្រើពាណិជ្ជកម្មនៃអត្ថបទ. អ្នកត្រូវការសិទ្ធិទៅអូឌីយ៉ូដែលអ្នកបានផ្ទុកឡើង (ការថតផ្ទាល់ខ្លួនរបស់អ្នក, វត្ថុធាតុដើមអាជ្ញាប័ណ្ណឬមាតិកាជាមួយការយល់ព្រម) ។

កត្តាពេលវេលាពិតគឺប្រហែល 0.05-0.2 × - ផតខាស់ 60 នាទី សរសេរឡើងវិញក្នុង 3-12 នាទី។ ម៉ូដែលប្រាក់រង្វាន់ជាធម្មតាបញ្ចប់លឿនជាង។ ប្រើប៊ូតុងជួរដើម្បីបិទផ្ទាំង។

ស្រឡាញ់ Free.ai? ប្រាប់មិត្តភក្តិរបស់អ្នក!

វាយតម្លៃ​ទំព័រ​នេះ