Fal Speech-to-Text

Free.ai · stt · ~500 žetoni po minute

Pošalji zvuk

Bacite zvučnu ili video datoteku, ili zalijepite URL ispod

~500 žetoni po minute

Besplatno radi na našim GPU-ovima. Nadogradnja za Fal Speech-to-Text →

Fal Speech-to-Text is a model govor-u-tekst. Putovanje kroz vanjske modele — ~500 tokeni po minuti (50% označavanje iznad troškova prijevoda).

Koristi preko API-ja

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'

API dokumentacija Dobavi API ključ

Similar models

ElevenLabs STT

Wizper (Whisper v3)

Browse all models →

Česta pitanja

Fal Speech-to-Text transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and Fal Speech-to-Text returns the full transcript plus optional SRT/VTT subtitles with timestamps.

Fal Speech-to-Text rukovodi desetinama jezika — Whisper- obiteljski modeli pokrivaju 90+, Parakeet pokriva ~25, drugi variraju. Odaberite "autodetekciju" ili navedite jezik za najveću preciznost.

Brzina riječi-grebotina je 5-10% na čistom engleskom audio, 10-20% na bučnom ili naglaskom audio. Velike varijante iste arhitekture smisleno bolje na tvrde slučajeve — odaberite veći kada je zvuk grub.

Da — svaki segment uključuje start/kraj vremenskih oznaka. Izvezi kao SRT ili VTT i vremensku mapu ravno na vaš video.

Fal Speech-to-Text je premium transkription motor. Oko ~500–1,500 žetona po minuti zvuka. $1 = 750.000 žetona.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — izvlačimo zvuk. Max 500 MB po slanju. Duže datoteke? Split s /audio/cut/ ili koristiti /v1/stt/batch /.

Dijarizacija zvučnika je odvojena propusnica — uključi "diarise" na /transcribec /. Fal Speech-to-Text rukovodi transkripcijom; dijarizacijska oznaka svaki segment sa zvučnikom 1 / Zvučnik 2 / itd.

Da — /batch / prihvaća mapu zvučnih datoteka. Svaki transkripti sleti u /account /?tab=history s originalnim imenom datoteke. Za očuvanje mape-tree koristite API.

Da — POST svoj zvuk na /v1/st/transcribe/ s modelom="Fal Speech-to-Text". Vraća JSON s tekstom + segmenti + vremenske oznake na razini riječi. /api/ ima punu referencu.

Samostalni modeli čuvaju zvuk na našim GPU-ovima; premium prolazi s DPA-om. Audio se briše nakon dio-prozora (24h anon, 7d potpisivanje). Ne treniramo na Vašim ulazima.

Da — Free.ai dodjeljuje komercijalnu upotrebu transkripta. Potrebna su vam prava na zvuk koji ste upisali (vas vlastiti snimanje, licencirani materijal, ili sadržaj s pristankom).

Faktor u realnom vremenu je približno 0,05–0,2× — 60-minutni transkripti podcasta u 3–12 minuta. Premium modeli često završavaju brže. Koristite gumb reda da zatvorite karticu.

Fal Speech-to-Text

Koristi preko API-ja

Similar models

Česta pitanja

What does Fal Speech-to-Text do?

How many languages does Fal Speech-to-Text support?

Koliko je Fal Speech-to-Text?

Does Fal Speech-to-Text include timestamps?

Koliko Fal Speech-to-Text košta po minuti?

Koje zvučne formate mogu poslati na Fal Speech-to-Text?

Can Fal Speech-to-Text identify different speakers?

Mogu li se složiti s Fal Speech-to-Text?

Is there an API for Fal Speech-to-Text?

Što je sa privatnošću kada se upišem s Fal Speech-to-Text?

Is Fal Speech-to-Text output safe for commercial use?

How long does Fal Speech-to-Text take?

Nabavite 10.000 besplatnih tokena

Čekajte, dobiti 10K besplatnih tokena!

Hoćeš još?