Fal Speech-to-Text
Free.ai
·
stt
·
~500 _Göçür minute
Fal Speech-to-Text is a sözden-metine model. minutda (50% markup over upstream cost)
API arkaly ullan
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/speech-to-text","audio_url":"https://..."}'
Senedler
API Adyny Al
Gynançly Soraglar
Fal Speech-to-Text sözlenen sesleri metinlere geçirýär. Bir MP3, WAV, M4A ýa-da wideo faýly ýükläň we Fal Speech-to-Text doly geçirmäni we opsion SRT/VTT subtitleleri wagt möhürleri bilen gaýtarýar.
Fal Speech-to-Text onlaýn dilleri dolandyrýar — Whisper-family modelleri 90+, Parakeet ~25, beýlekiler üýtgeýär. "otomatik tap" saýla ýa-da iň ýokary dogrylyk üçin dili bellik et.
Söz-hata derejesi 5-10% arassa ingliz sesde, 10-20% gürleşikli ýa-da aksentli sesde. Aynı binagärligiň uly görnüşleri has gowy iş görýär - ses çylşyrymly bolsa ulysyny saýla.
Eý — her bir bölek başlan/son wagt möhürlerini içer. SRT ýa VTT olarak eksport et we wagtlar mapyny wideoňa dogrydan ýaz.
Fal Speech-to-Text bir premium transkripsiýa enjamy. Bir minutda ~500-1,500 audio tokeni. $1 = 750,000 tokeni.
MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — biz sesleri çykarýarys. Bir ýükleme üçin iň köp 500 MB. Uly faýllar? /audio/cut/ bilen böle ýa-da /v1/stt/batch/ ullan.
Sesçi diaryzasiýasy bir tapawutlanan geçişdir — /transcribe/-de "diarize"-i çalşyň. Fal Speech-to-Text transkripsiýany dolandyrýar; diaryzasiýa her bir segmenti Sesçi 1 / Sesçi 2 / we ş.m. bilen etiketleýär
Eý — /batch/ ses faýllarynyň haltany kabul edýär. Her bir transkript /account/?tab=history'da orjinal faýl ad bilen galýar. Haltany-bakja saklamak üçin API'den ullan.
Eý — POST audiony /v1/stt/transcribe/ bilen model="Fal Speech-to-Text". Metin + segmentler + söz derejeli wagt möhürleri bilen JSON'y gaýtarýar. /api/ doly salgy bar.
Öz-özüne hosturlanan modeller sesleri GPU-larda saklaýar; premium DPA bilen geçýär. Ses paýlaşma äpişgesinden soň pozylýar (24 sag anonim, 7 gün giren). Biz siziň girişleriňizi öwrenmänis.
Eý — Free.ai transkripleriň söwdaly ulanmak hukugyny berýär. Siz ýüklän ses haklarynyň (öz ýazgyňyz, lisenziyaly material ýa-da ygtyýar bilen mazmun) zerurlygyny duýýarsyňyz.
Raýat wagtyň faktory takmynan 0.05-0.2× — 60 minutlyk podkast 3-12 minutda transkribe bolýar. Premium modeller köplenç çalt tamamlanýar. Täbi ýapmak üçin nobat batlygyny ullan.