Fal Speech-to-Text

Free.ai · stt · ~500 پەڕەی _پێشەوەی minute

فێرکاری:

~500 پەڕەی _پێشەوەی minute
بەبێ پارە لەسەر GPU کانی ئێمە کاردەکات. بەرزکردنەوەی بۆ Fal Speech-to-Text →

Fal Speech-to-Text ی a مۆدێلی قسەکردن بۆ نوسراو ە. لەڕێگەی مۆدێلی دەرەوەوە ڕەوانەکراوە - ~500 تیکەکان لە چرکەدا (% 50 ی ماركەپ لەسەر نرخی سەرەوە).

بەکارھێنان لە ڕێگەی ئەپی پی

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'
بەڵگەنامە کلیلی API بەدەست بهێنە

پرسیاری زۆر کراوە

Fal Speech-to-Text ی گوێگر گوێی لێبووردووە بۆ ناو نوسین. دابەزاندنی MP3, WAV, M4A, یان فایلی ڤیدیۆ و Fal Speech-to-Text ی گوێگر گوێی لێبووردووە تەواوەکە دەگەڕێنێتەوە لەگەڵ هەڵبژاردەی SRT/VTT بە ناوی ژێرەوە لەگەڵ کاتی دیاریکراو.

Fal Speech-to-Text زۆر زمان بەڕێوەدەبات - Whisper- خێزانی مۆدێلەکان ٩٠+ دەگرێتە خۆ، Parakeet ~٢٥ دەگرێتە خۆ، ئەوانی تر جیاوازن. "بەخۆوە دۆزینەوەی" هەڵبژێرە یان زمانەکە دیاری بکە بۆ بەرزترین ڕاستی.

ڕێژەی هەڵەی وشەکان لە %٥-١٠ لە دەنگێکی ئینگلیزی پاکدایە، لە %١٠-٢٠ لە دەنگێکی بێدەنگی یان دەنگێکی بە دەنگ. جۆرەکانی گەورە لە هەمان شێوەی بونیادنانی بە شێوەیەکی گرنگ باشترە لە حاڵەتی قورس - کاتێک دەنگەکە زۆرە گەورەتر هەڵبژێرە.

بەڵێ - هەموو پارچەیەک کاتی دەستپێکردن/کۆتایی بوونی هەیە. بە شێوەیەکی SRT یان VTT دەربهێنرێت و کاتەکان ڕاستەوخۆ بۆ ڤیدیۆکەت دەنێرێت

Fal Speech-to-Text یەکە لە باشترین ماشێنەکانی وەرگێڕان. نزیکەی ~٥٠٠-١،٥٠٠ تیکۆن لە هەر خولەکێکی دەنگدا. $١ = ٧٥٠،٠٠٠ تیکۆن.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — ئێمە دەنگەکە دەردەهێنین. ٥٠٠ مێگابایت بۆ هەر بارکردنێک. فایلە درێژەکان؟ دابەش بکە بە /audio/cut/ یان بەکاربهێنه /v1/stt/batch/.

Fal Speech-to-Text بەشی وەرگێڕان بەڕێوە دەبات؛ بەشی وەرگێڕان هەموو بەشەکان بە ناوەکانی بەشداربووی ١ / بەشداربووی ٢ / هتد.

بەڵێ - /batch/ پەڕەگای فایلە دەنگییەکان قبوڵ دەکات. هەموو نوسراوێک لە /account/؟tab=history دا بە ناوی فایلی سەرەکیەوە دێتە ناو. بۆ پاراستنی درەختی پەڕەگاکە بەکاری بهێنە.

بەڵێ - پۆستکردنی دەنگەکەت بۆ /v1/stt/transcribe/ لەگەڵ مۆدێل="Fal Speech-to-Text". جی ئێس ۆن دەگەڕێنێتەوە لەگەڵ نوسراو + بەشەکان + کاتی ئاستی وشەکان. /api/ گەڕانێکی تەواوە.

مۆدێلی خۆ-هەژمارکراو دەنگ لەسەر GPU ی خۆمان دەهێڵێتەوە؛ پڕۆمیۆم بە ڕێگەی DPA یەوە تێدەپەڕێت. دەنگ دوای پەردەکەی هاوبەشکردن دەگۆڕێت (٢٤ کاتژمێر بێ دەنگ، ٧ ڕۆژ تۆمارکردن). ئێمە فێربوون لەسەر داخڵکردنەکانت ناکەین.

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

.کاتی ڕاستەقینە نزیکەی ٠.٠٥-٠.٢×ە - ٦٠ خولەک پۆدکاستی لە ٣-١٢ خولەکدا دەنووسێتەوە. مۆدێلی پێشکەشکراو زۆرجار خێراتر تەواو دەبێت. بۆ داخستنی پەڕەکە، دکتۆرەی ڕیز بەکاربهێنە.

Like this tool? Share it!

ئەم لاپەڕەیە بایەخی بدە