Fal Speech-to-Text

Free.ai · stt · ~500 žetoni po minute

Bacite zvučnu ili video datoteku, ili zalijepite URL ispod

~500 žetoni po minute
Besplatno radi na našim GPU-ovima. Nadogradnja za Fal Speech-to-Text →

Fal Speech-to-Text is a model govor-u-tekst. Putovanje kroz vanjske modele — ~500 tokeni po minuti (50% označavanje iznad troškova prijevoda).

Koristi preko API-ja

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'
API dokumentacija Dobavi API ključ

Česta pitanja

Fal Speech-to-Text transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and Fal Speech-to-Text returns the full transcript plus optional SRT/VTT subtitles with timestamps.

Fal Speech-to-Text rukovodi desetinama jezika — Whisper- obiteljski modeli pokrivaju 90+, Parakeet pokriva ~25, drugi variraju. Odaberite "autodetekciju" ili navedite jezik za najveću preciznost.

Brzina riječi-grebotina je 5-10% na čistom engleskom audio, 10-20% na bučnom ili naglaskom audio. Velike varijante iste arhitekture smisleno bolje na tvrde slučajeve — odaberite veći kada je zvuk grub.

Da — svaki segment uključuje start/kraj vremenskih oznaka. Izvezi kao SRT ili VTT i vremensku mapu ravno na vaš video.

Fal Speech-to-Text je premium transkription motor. Oko ~500–1,500 žetona po minuti zvuka. $1 = 750.000 žetona.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — izvlačimo zvuk. Max 500 MB po slanju. Duže datoteke? Split s /audio/cut/ ili koristiti /v1/stt/batch /.

Dijarizacija zvučnika je odvojena propusnica — uključi "diarise" na /transcribec /. Fal Speech-to-Text rukovodi transkripcijom; dijarizacijska oznaka svaki segment sa zvučnikom 1 / Zvučnik 2 / itd.

Da — /batch / prihvaća mapu zvučnih datoteka. Svaki transkripti sleti u /account /?tab=history s originalnim imenom datoteke. Za očuvanje mape-tree koristite API.

Da — POST svoj zvuk na /v1/st/transcribe/ s modelom="Fal Speech-to-Text". Vraća JSON s tekstom + segmenti + vremenske oznake na razini riječi. /api/ ima punu referencu.

Samostalni modeli čuvaju zvuk na našim GPU-ovima; premium prolazi s DPA-om. Audio se briše nakon dio-prozora (24h anon, 7d potpisivanje). Ne treniramo na Vašim ulazima.

Da — Free.ai dodjeljuje komercijalnu upotrebu transkripta. Potrebna su vam prava na zvuk koji ste upisali (vas vlastiti snimanje, licencirani materijal, ili sadržaj s pristankom).

Faktor u realnom vremenu je približno 0,05–0,2× — 60-minutni transkripti podcasta u 3–12 minuta. Premium modeli često završavaju brže. Koristite gumb reda da zatvorite karticu.

Like this tool? Share it!

Ocijeni ovu stranicu