Fal Speech-to-Text
Free.ai
·
stt
·
~500 پەڕەی _پێشەوەی minute
Fal Speech-to-Text ی a مۆدێلی قسەکردن بۆ نوسراو ە. لەڕێگەی مۆدێلی دەرەوەوە ڕەوانەکراوە - ~500 تیکەکان لە چرکەدا (% 50 ی ماركەپ لەسەر نرخی سەرەوە).
بەکارھێنان لە ڕێگەی ئەپی پی
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/speech-to-text","audio_url":"https://..."}'
بەڵگەنامە
کلیلی API بەدەست بهێنە
پرسیاری زۆر کراوە
Fal Speech-to-Text ی گوێگر گوێی لێبووردووە بۆ ناو نوسین. دابەزاندنی MP3, WAV, M4A, یان فایلی ڤیدیۆ و Fal Speech-to-Text ی گوێگر گوێی لێبووردووە تەواوەکە دەگەڕێنێتەوە لەگەڵ هەڵبژاردەی SRT/VTT بە ناوی ژێرەوە لەگەڵ کاتی دیاریکراو.
Fal Speech-to-Text زۆر زمان بەڕێوەدەبات - Whisper- خێزانی مۆدێلەکان ٩٠+ دەگرێتە خۆ، Parakeet ~٢٥ دەگرێتە خۆ، ئەوانی تر جیاوازن. "بەخۆوە دۆزینەوەی" هەڵبژێرە یان زمانەکە دیاری بکە بۆ بەرزترین ڕاستی.
ڕێژەی هەڵەی وشەکان لە %٥-١٠ لە دەنگێکی ئینگلیزی پاکدایە، لە %١٠-٢٠ لە دەنگێکی بێدەنگی یان دەنگێکی بە دەنگ. جۆرەکانی گەورە لە هەمان شێوەی بونیادنانی بە شێوەیەکی گرنگ باشترە لە حاڵەتی قورس - کاتێک دەنگەکە زۆرە گەورەتر هەڵبژێرە.
بەڵێ - هەموو پارچەیەک کاتی دەستپێکردن/کۆتایی بوونی هەیە. بە شێوەیەکی SRT یان VTT دەربهێنرێت و کاتەکان ڕاستەوخۆ بۆ ڤیدیۆکەت دەنێرێت
Fal Speech-to-Text یەکە لە باشترین ماشێنەکانی وەرگێڕان. نزیکەی ~٥٠٠-١،٥٠٠ تیکۆن لە هەر خولەکێکی دەنگدا. $١ = ٧٥٠،٠٠٠ تیکۆن.
MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — ئێمە دەنگەکە دەردەهێنین. ٥٠٠ مێگابایت بۆ هەر بارکردنێک. فایلە درێژەکان؟ دابەش بکە بە /audio/cut/ یان بەکاربهێنه /v1/stt/batch/.
Fal Speech-to-Text بەشی وەرگێڕان بەڕێوە دەبات؛ بەشی وەرگێڕان هەموو بەشەکان بە ناوەکانی بەشداربووی ١ / بەشداربووی ٢ / هتد.
بەڵێ - /batch/ پەڕەگای فایلە دەنگییەکان قبوڵ دەکات. هەموو نوسراوێک لە /account/؟tab=history دا بە ناوی فایلی سەرەکیەوە دێتە ناو. بۆ پاراستنی درەختی پەڕەگاکە بەکاری بهێنە.
بەڵێ - پۆستکردنی دەنگەکەت بۆ /v1/stt/transcribe/ لەگەڵ مۆدێل="Fal Speech-to-Text". جی ئێس ۆن دەگەڕێنێتەوە لەگەڵ نوسراو + بەشەکان + کاتی ئاستی وشەکان. /api/ گەڕانێکی تەواوە.
مۆدێلی خۆ-هەژمارکراو دەنگ لەسەر GPU ی خۆمان دەهێڵێتەوە؛ پڕۆمیۆم بە ڕێگەی DPA یەوە تێدەپەڕێت. دەنگ دوای پەردەکەی هاوبەشکردن دەگۆڕێت (٢٤ کاتژمێر بێ دەنگ، ٧ ڕۆژ تۆمارکردن). ئێمە فێربوون لەسەر داخڵکردنەکانت ناکەین.
Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).
.کاتی ڕاستەقینە نزیکەی ٠.٠٥-٠.٢×ە - ٦٠ خولەک پۆدکاستی لە ٣-١٢ خولەکدا دەنووسێتەوە. مۆدێلی پێشکەشکراو زۆرجار خێراتر تەواو دەبێت. بۆ داخستنی پەڕەکە، دکتۆرەی ڕیز بەکاربهێنە.