Fal Speech-to-Text

Free.ai · stt · ~500 ටොකන minute

ශ්‍රව්‍ය හෝ වීඩියෝ ගොනුවක් පහතට දමන්න, හෝ URL ලිපිනයක් ඇලවීම

~500 ටොකන minute
අපේ GPUs මත නිදහස් ධාවනය වේ. සඳහා උසස් කරන්න Fal Speech-to-Text →

ෆ්‍රෙඩී බාහිර ආකෘති හරහා මාර්ගය - ~ 500 ටොකන් මිනිත්තුවට (50% උඩුගත පිරිවැය මත මාකප්).

API හරහා භාවිත කරන්න

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'
API ලේඛන API යතුර ලබාගන්න

නිතර අසන ප්රශ්න

Fal Speech-to-Text පෙළ බවට කතා ශ්රව්ය පරිවර්තනය. MP3 එකක් උඩුගත, WAV, M4A, හෝ වීඩියෝ ගොනුවක් සහ Fal Speech-to-Text කාලය මුද්රා සමග විකල්ප SRT / VTT උපසිරැසි පූර්ණ පරිවර්තනය ප්ලස් ආපසු.

Fal Speech-to-Text භාෂා දස දහස් ගණනක් හැසිරවීම - Whisper-පවුලේ ආකෘති ආවරණය 90+, Parakeet ආවරණය ~25, අනෙක් අය වෙනස්. "ස්වයංක්රීයව හඳුනා" තෝරන්න හෝ ඉහළම නිරවද් යතාව සඳහා භාෂාව සඳහන් කරන්න.

වචන-දෝෂ අනුපාතය පිරිසිදු ඉංග්රීසි ශ්රව්ය මත 5-10% වේ, 10-20% ශබ්ද හෝ accented ශ්රව්ය මත. එම ගෘහ නිර්මාණ ශිල්පය විශාල විකල්ප අසීරු නඩු මත අර්ථවත් වඩා හොඳ කරන්නේ - ශ්රව්ය දෘඩ විට විශාල තෝරන්න.

ඔව් - සෑම කොටසක් ආරම්භ / අවසන් timestamps ඇතුළත් වේ. SRT හෝ VTT ලෙස අපනයනය සහ ඔබේ වීඩියෝව මත කෙලින්ම කාලය සිතියම.

Fal Speech-to-Text වාරික පරිවර්තනය එන්ජිමක් වේ. ~ 500-1,500 ශ්රව්ය විනාඩියකට ටොකන් ගැන. $ 1 = 750,000 ටොකන්.

MP3, WAV, M4A, FLAC, OGG, ප්ලස් වීඩියෝ (MP4, MOV, WebM) — අපි ශ්රව්ය උපුටා. මැක්ස් 500 MB එකකට. දිගු ගොනු? /audio/cut/ සමග බෙදා හෝ /v1/stt/batch/ භාවිතා කරන්න.

කථානායක diarization වෙනම අවසර - /transcribe/ මත "diarize" මාරු කරන්න. Fal Speech-to-Text පරිවර්තනය හැසිරවීම; diarization කථානායක 1 / කථානායක 2/ ආදිය සමග එක් එක් කොටස ලේබල්.

ඔව් — / කණ්ඩායම / ශ්රව්ය ගොනු බහාලුමක් පිළිගනී. එක් එක් පරිවර්තනය මුල් ගොනු නාමය සමග / ගිණුම /?tab = ඉතිහාසය ගොඩබිම්. බහාලුම්-ගස සංරක්ෂණය සඳහා API භාවිතා කරන්න.

ඔව් — ඔබේ ශ්රව්ය ප්රකාශනය /v1/stt/transcribe/ සමග ආකෘතිය සමග POST="Fal Speech-to-Text". පෙළ සමග JSON ආපසු + කොටස් + වචන මට්ටමේ timestamps. /api/ සම්පූර්ණ උපුටා දැක්වීම ඇත.

ස්වයං-සත්කාරක ආකෘති අපගේ GPUs මත ශ්රව්ය තබා; වට්ටම් DPA සමග හරහා ගමන්. ශ්රව්ය කොටස්-කවුළුව පසු මකා දමයි (24h anon, 7d සභාපති-in). අපි ඔබේ ආදාන පුහුණු නැහැ.

ඔව් - Free.ai පරිවර්තන වාණිජ භාවිතය ලබා දෙයි. ඔබ ඔබ උඩුගත ශ්රව්ය අයිතිවාසිකම් අවශ්ය (ඔබේම පටිගත, බලපත්ර ද්රව්ය, හෝ අනුමැතිය සමග අන්තර්ගතය).

තත්ත්ව සාධකය දළ වශයෙන් 0.05-0.2 × වේ - මිනිත්තු 60 ක පොඩ්කාස්ට් මිනිත්තු 3-12 ක් තුළ පරිවර්තනය කරයි. ප් රතිලාභ ආකෘති බොහෝ විට වේගයෙන් අවසන් වේ. ටැබය වසා දැමීමට පෝලිම් බොත්තම භාවිතා කරන්න.

Free.ai ආදරය? ඔබේ මිතුරන්ට කියන්න!

මෙම පිටුව අගය කරන්න