faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 រូបិយប័ណ្ណ​ក្នុង​មួយ minute

ទម្លាក់​ឯកសារ​អូឌីយ៉ូ ឬ​វីដេអូ ឬ​បិទភ្ជាប់ URL ខាងក្រោម

~500 រូបិយប័ណ្ណ​ក្នុង​មួយ minute

faster-whisper large-v3 គឺជា a ម៉ូដែល​និយាយ​ទៅ​អត្ថបទ ដែលបានសាងសង់ដោយ OpenAI / SYSTRAN ។ ខ្លាំងបំផុតនៅ Accurate transcription ។ ខ្លួនឯងបានរៀបចំនៅលើ Free.ai GPUs - រត់ដោយឥតគិតថ្លៃប្រឆាំងនឹងទឹកកាក់ប្រចាំថ្ងៃរបស់អ្នក (500 រូបិយប័ណ្ណ នាទី) ។ ចេញផ្សាយក្រោម MIT — ការប្រើពាណិជ្ជកម្មត្រូវបានអនុញ្ញាតនៅលើ Free.ai ។

ប្រើ​តាម​រយៈ API

OpenAI- ឆបគ្នា REST API ។ បង្កើតសោ និងហៅម៉ូដែលនេះក្នុងមួយវិនាទី ។

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
ឯកសារ API យក​សោ API

សំណួរ​ដែល​សួរ​ញឹកញាប់

faster-whisper large-v3 បកប្រែអូឌីយ៉ូនិយាយទៅជាអត្ថបទ។ ផ្ទុកឡើង MP3, WAV, M4A, ឬឯកសារវីដេអូនិង faster-whisper large-v3 ត្រឡប់ការបកប្រែពេញលេញបន្ថែមពីលើចំណងជើង SRT / VTT ជម្រើសជាមួយ timestamps ។

faster-whisper large-v3 គ្រប់គ្រងភាសារាប់សិប - Whisper-គ្រួសារគំរូគ្របដណ្តប់ 90+, Parakeet គ្របដណ្តប់ ~25, ផ្សេងទៀតប្រែប្រួល។ ជ្រើស "រកមើលដោយស្វ័យប្រវត្តិ" ឬបញ្ជាក់ភាសាសម្រាប់ភាពត្រឹមត្រូវខ្ពស់បំផុត។

អត្រាកំហុសពាក្យគឺ 5-10% លើអូឌីយ៉ូអង់គ្លេសស្អាត 10-20% លើអូឌីយ៉ូមានសំឡេងរំខានឬ accented ។ កំណែធំនៃស្ថាបត្យកម្មដូចគ្នាធ្វើបានល្អប្រសើរជាងមុនលើករណីធ្ងន់ធ្ងរ - ជ្រើសធំជាងពេលអូឌីយ៉ូគឺក្រាស់ ។

បាទ - គ្រប់ផ្នែករួមបញ្ចូលចាប់ផ្ដើម / បញ្ចប់ timestamps. នាំចេញជា SRT ឬ VTT និងផែនទីពេលវេលាដោយផ្ទាល់ទៅលើវីដេអូរបស់អ្នក.

faster-whisper large-v3 រត់នៅលើ GPUs ផ្ទាល់ខ្លួនរបស់យើងប្រឆាំងនឹងទឹកកកឥតគិតថ្លៃប្រចាំថ្ងៃរបស់អ្នកដំបូង; $5 → 200,000 រូបិយប័ណ្ណដែលបានបង់ប្រាក់បន្ទាប់ពីនោះ. អំពី ~ 500 រូបិយប័ណ្ណក្នុងមួយនាទី.

MP3, WAV, M4A, FLAC, OGG, បន្ថែមពីលើវីដេអូ (MP4, MOV, WebM) — យើងបានស្រង់ចេញអូឌីយ៉ូ. អតិបរមា 500 មេកាបៃក្នុងមួយការផ្ទុកឡើង. ឯកសារយូរ? ចែកចេញជា / អូឌីយ៉ូ / កាត់ / ឬប្រើ / v1 / stt / batch /.

កម្មវិធី​សរសេរ​សំបុត្រ​របស់​អ្នក​និយាយ​គឺ​ជា​ការ​ឆ្លងកាត់​ដាច់​ដោយ​ឡែក — បិទបើក "diarize" នៅ​លើ / transcribe / ។ faster-whisper large-v3 គ្រប់គ្រង​ការ​សរសេរ​សំបុត្រ​ឡើងវិញ​; កម្មវិធី​សរសេរ​សំបុត្រ​ដាក់​ស្លាក​ផ្នែក​នីមួយៗ​ជាមួយ​អ្នក​និយាយ 1 / អ្នក​និយាយ2/ ល ។

បាទ — / batch / ទទួលយក​ថត​ឯកសារ​អូឌីយ៉ូ ។ អត្ថបទ​សរសេរ​រៀងៗ​ខ្លួន​ចុះចត​ក្នុង / account /? tab=history ជាមួយ​នឹង​ឈ្មោះ​ឯកសារ​ដើម ។ សម្រាប់​ការ​រក្សា​ទុក​ថត​មែកធាង​ប្រើ​ API ។

បាទ — POST អូឌីយ៉ូរបស់អ្នកទៅ /v1/stt/transcribe/ ជាមួយ model="faster-whisper large-v3" ។ ត្រឡប់ JSON ជាមួយអត្ថបទ + ផ្នែក + សញ្ញាពេលវេលាកម្រិតពាក្យ ។ /api/ មានសេចក្ដីយោងពេញលេញ ។

ម៉ូដែលដែលរៀបចំដោយខ្លួនឯងរក្សាអូឌីយ៉ូនៅលើ GPUs របស់យើង; ប្រាក់រង្វាន់ឆ្លងកាត់តាមរយៈជាមួយ DPA ។ អូឌីយ៉ូត្រូវបានលុបបន្ទាប់ពីបង្អួចចែករំលែក (24h anon, 7d ចុះឈ្មោះចូល) ។ យើងមិនបណ្តុះបណ្តាលលើការបញ្ចូលរបស់អ្នកទេ។

បាទ — Free.ai ផ្តល់ការប្រើពាណិជ្ជកម្មនៃអត្ថបទ. អ្នកត្រូវការសិទ្ធិទៅអូឌីយ៉ូដែលអ្នកបានផ្ទុកឡើង (ការថតផ្ទាល់ខ្លួនរបស់អ្នក, វត្ថុធាតុដើមអាជ្ញាប័ណ្ណឬមាតិកាជាមួយការយល់ព្រម) ។

កត្តាពេលវេលាពិតគឺប្រហែល 0.05-0.2 × - ផតខាស់ 60 នាទី សរសេរឡើងវិញក្នុង 3-12 នាទី។ ម៉ូដែលប្រាក់រង្វាន់ជាធម្មតាបញ្ចប់លឿនជាង។ ប្រើប៊ូតុងជួរដើម្បីបិទផ្ទាំង។

ស្រឡាញ់ Free.ai? ប្រាប់មិត្តភក្តិរបស់អ្នក!

វាយតម្លៃ​ទំព័រ​នេះ