Fal Speech-to-Text
Free.ai
·
stt
·
~500 រូបិយប័ណ្ណក្នុងមួយ minute
Fal Speech-to-Text គឺជា a ម៉ូដែលនិយាយទៅអត្ថបទ ។ ផ្លូវតាមរយៈម៉ូដែលខាងក្រៅ - ~ 500 រូបិយប័ណ្ណ នាទី (50% តម្លៃលើតម្លៃឡើង).
សំណួរដែលសួរញឹកញាប់
Fal Speech-to-Text បកប្រែអូឌីយ៉ូនិយាយទៅជាអត្ថបទ។ ផ្ទុកឡើង MP3, WAV, M4A, ឬឯកសារវីដេអូនិង Fal Speech-to-Text ត្រឡប់ការបកប្រែពេញលេញបន្ថែមពីលើចំណងជើង SRT / VTT ជម្រើសជាមួយ timestamps ។
Fal Speech-to-Text គ្រប់គ្រងភាសារាប់សិប - Whisper-គ្រួសារគំរូគ្របដណ្តប់ 90+, Parakeet គ្របដណ្តប់ ~25, ផ្សេងទៀតប្រែប្រួល។ ជ្រើស "រកមើលដោយស្វ័យប្រវត្តិ" ឬបញ្ជាក់ភាសាសម្រាប់ភាពត្រឹមត្រូវខ្ពស់បំផុត។
អត្រាកំហុសពាក្យគឺ 5-10% លើអូឌីយ៉ូអង់គ្លេសស្អាត 10-20% លើអូឌីយ៉ូមានសំឡេងរំខានឬ accented ។ កំណែធំនៃស្ថាបត្យកម្មដូចគ្នាធ្វើបានល្អប្រសើរជាងមុនលើករណីធ្ងន់ធ្ងរ - ជ្រើសធំជាងពេលអូឌីយ៉ូគឺក្រាស់ ។
បាទ - គ្រប់ផ្នែករួមបញ្ចូលចាប់ផ្ដើម / បញ្ចប់ timestamps. នាំចេញជា SRT ឬ VTT និងផែនទីពេលវេលាដោយផ្ទាល់ទៅលើវីដេអូរបស់អ្នក.
Fal Speech-to-Text គឺជាម៉ាស៊ីនបកប្រែប្រាក់រង្វាន់។ អំពី ~500–1,500 សញ្ញាក្នុងមួយនាទីនៃអូឌីយ៉ូ។ $1 = 750,000 សញ្ញា។
MP3, WAV, M4A, FLAC, OGG, បន្ថែមពីលើវីដេអូ (MP4, MOV, WebM) — យើងបានស្រង់ចេញអូឌីយ៉ូ. អតិបរមា 500 មេកាបៃក្នុងមួយការផ្ទុកឡើង. ឯកសារយូរ? ចែកចេញជា / អូឌីយ៉ូ / កាត់ / ឬប្រើ / v1 / stt / batch /.
កម្មវិធីសរសេរសំបុត្ររបស់អ្នកនិយាយគឺជាការឆ្លងកាត់ដាច់ដោយឡែក — បិទបើក "diarize" នៅលើ / transcribe / ។ Fal Speech-to-Text គ្រប់គ្រងការសរសេរសំបុត្រឡើងវិញ; កម្មវិធីសរសេរសំបុត្រដាក់ស្លាកផ្នែកនីមួយៗជាមួយអ្នកនិយាយ 1 / អ្នកនិយាយ2/ ល ។
បាទ — / batch / ទទួលយកថតឯកសារអូឌីយ៉ូ ។ អត្ថបទសរសេររៀងៗខ្លួនចុះចតក្នុង / account /? tab=history ជាមួយនឹងឈ្មោះឯកសារដើម ។ សម្រាប់ការរក្សាទុកថតមែកធាងប្រើ API ។
បាទ — POST អូឌីយ៉ូរបស់អ្នកទៅ /v1/stt/transcribe/ ជាមួយ model="Fal Speech-to-Text" ។ ត្រឡប់ JSON ជាមួយអត្ថបទ + ផ្នែក + សញ្ញាពេលវេលាកម្រិតពាក្យ ។ /api/ មានសេចក្ដីយោងពេញលេញ ។
ម៉ូដែលដែលរៀបចំដោយខ្លួនឯងរក្សាអូឌីយ៉ូនៅលើ GPUs របស់យើង; ប្រាក់រង្វាន់ឆ្លងកាត់តាមរយៈជាមួយ DPA ។ អូឌីយ៉ូត្រូវបានលុបបន្ទាប់ពីបង្អួចចែករំលែក (24h anon, 7d ចុះឈ្មោះចូល) ។ យើងមិនបណ្តុះបណ្តាលលើការបញ្ចូលរបស់អ្នកទេ។
បាទ — Free.ai ផ្តល់ការប្រើពាណិជ្ជកម្មនៃអត្ថបទ. អ្នកត្រូវការសិទ្ធិទៅអូឌីយ៉ូដែលអ្នកបានផ្ទុកឡើង (ការថតផ្ទាល់ខ្លួនរបស់អ្នក, វត្ថុធាតុដើមអាជ្ញាប័ណ្ណឬមាតិកាជាមួយការយល់ព្រម) ។
កត្តាពេលវេលាពិតគឺប្រហែល 0.05-0.2 × - ផតខាស់ 60 នាទី សរសេរឡើងវិញក្នុង 3-12 នាទី។ ម៉ូដែលប្រាក់រង្វាន់ជាធម្មតាបញ្ចប់លឿនជាង។ ប្រើប៊ូតុងជួរដើម្បីបិទផ្ទាំង។