Fal Speech-to-Text

Free.ai · stt · ~500 tokens per minute

Muat munggah audio

Gunakake file audio utawa video, utawa tempel URL ing ngisor iki

~500 tokens per minute

Ing ngisor iki kalebu jinis-jinis GPU. Ngoptimalake kanggo Fal Speech-to-Text →

Fal Speech-to-Text iku a model-to-text. Diwangun ku 100% bahan baku lokal, 50% bahan baku lokal (kajaba bahan baku olahan) diproduksi di pabrik.

Nggunakake liwat API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'

Dokumen Muat Turun Kunci API

Similar models

ElevenLabs STT

Wizper (Whisper v3)

Browse all models →

Takon-takon sing asring diajukake

Fal Speech-to-Text ngatranskripsikeun audio anu diucapkeun jadi teks. Unggahkeun file MP3, WAV, M4A, atawa video sarta Fal Speech-to-Text bakal ngabalikeun transkripsi pinuh plus subtitle SRT/VTT pilihan kalawan timestamp.

Fal Speech-to-Text ngawengku loba basa — Whisper-keluarga model ngawengku 90+, Parakeet ngawengku ~25, anu séjénna béda. Pilih "auto-detect" atawa nyatet basa pikeun akurasi pangluhurna.

Tingkat kasalahan kecap nyaéta 5-10% dina audio Inggris anu bersih, 10-20% dina audio anu bising atanapi diaksés. Varian ageung tina arsitektur anu sami langkung saé dina kasus anu hadé - pilih anu langkung ageung nalika audiona kasar.

Ya — saben segmen ngandung tanda wektu wiwitan/akhiran. Eksport minangka SRT utawa VTT lan peta wektu langsung menyang video.

Fal Speech-to-Text nyaéta mesin transkripsi premium. Kira-kira ~500–1,500 token per menit audio. $1 = 750,000 token.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — kita extract audio. Max 500 MB per upload. Files luwih dawa? Split karo /audio/cut/ utawa nggunakake /v1/stt/batch/.

Diarisasi pangucapan nyaéta hiji pasagi terpisah — toggle "diarize" on /transcribe/. Fal Speech-to-Text ngarawat transkripsi; diarisasi label saben segmen kalawan pangucap 1 / pangucap 2 / jsb.

Ya — /batch/ nampi folder berkas audio. Satiap transcript disimpen dina /account/?tab=history kalayan nami berkas aslina. Pikeun ngalestarikeun pohon folder, anggo API.

Ya — POST audio sampeyan menyang /v1/stt/transcribe/ karo model="Fal Speech-to-Text". Ngabaliake JSON kanthi teks + segmen + timestamp tingkat tembung. /api/ duwe referensi lengkap.

Model self-hosted nyimpen audio dina GPU urang; premium ngaliwatan ku DPA. Audio dipaling saatos jendela babagi (24 jam anonim, 7 dinten ngadaptar). Kami henteu ngalatih kana input anjeun.

Ya — Free.ai ngawenangkeun panggunaan komersial tina transkripsi. Anjeun peryogi hak kana audio anu anjeun unggah (rekaman anjeun sorangan, bahan anu dilisensikan, atanapi isi anu disetujui).

Faktor waktu nyata kira-kira 0.05–0.2× — podcast 60 menit ditranskripsikeun dina 3–12 menit. Model Premium seringna réngsé langkung gancang. Gunakeun tombol baris pikeun nutup tab.

Fal Speech-to-Text

Nggunakake liwat API

Similar models

Takon-takon sing asring diajukake

Apa sing Fal Speech-to-Text nindakake?

Apa ana basa sing didhukung Fal Speech-to-Text?

Apa bener Fal Speech-to-Text?

Apa Fal Speech-to-Text kalebu timestamps?

Apa biaya Fal Speech-to-Text saben menit?

Format audio apa sing bisa dakunggah menyang Fal Speech-to-Text?

Bisa Fal Speech-to-Text ngenali para penutur sing beda?

Apa aku bisa nulis kanthi Fal Speech-to-Text?

Apa ana API kanggo Fal Speech-to-Text?

Apa sing bakal kedadeyan nalika aku nulis nganggo Fal Speech-to-Text?

Apa output Fal Speech-to-Text aman kanggo panggunaan komersial?

Apa Fal Speech-to-Text njupuk wektu?

10,000 Free Token

Itxaron — Get 10K Tokens Free!

Ingin luwih?