Fal Speech-to-Text

Free.ai · stt · ~500 tokens per minute

Fi àwòrán pamọ́

Fi fáìlì àwòrán tàbí àwòrán-ìsẹ́ẹ̀tì pàtó, tàbí pàtó URL̀ láti ààyè-iṣẹ́

~500 tokens per minute

N ṣiṣẹ́ ọ̀fẹ̀ nípa GPUs wa. Àwọn ìṣàfihàn fún Fal Speech-to-Text →

Fal Speech-to-Text ni an Àwọn àkọlé. A ti ṣetó nípa àwọn àwọn àwòrán inú — ~500 tokè nínú àkókò (50% tí a fi pamọ́ lọ́wọ́lú).

Lò nípa API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'

Àwọn Àkọsílẹ̀ Gba àwọn àwọn àmì-ìwé API

Similar models

ElevenLabs STT

Wizper (Whisper v3)

Browse all models →

Àwọn Àtòjọ-ẹ̀yàn

Fal Speech-to-Text kọ́ àwòrán tí a sọ̀rọ̀ sínú àkọlé. Fi àwòrán MP3, WAV, M4A, tàbí fáìlì vidéò pamọ́, Fal Speech-to-Text sì gba àwòrán tí a sọ̀rọ̀ sínú àwọn àwọn àkọlé SRT/VTT tí a fẹ́ láti fi àwọn ààyè-ìwé àwọn ààyè-ìwé pẹ̀lú àwọn ààyè-ìwé àwọn ààyè-ìwé àwọn ààyè-ìwé.

Fal Speech-to-Text handles dozens of languages — Whisper-family models cover 90+, Parakeet covers ~25, others vary. Pick "auto-detect" or specify the language for highest accuracy.

Word-error rate is 5–10% on clean English audio, 10–20% on noisy or accented audio. Large variants of the same architecture do meaningfully better on hard cases — pick larger when the audio is rough.

Yà — àwọn ààyè-iṣẹ́ ní pàtó àwọn àkókò àkókò ìṣàmúlò-ètò ìṣàfihàn/ìparí. Àwọn ààyè-iṣẹ́ bí SRT tàbí VTT àti àwọn ààyè-iṣẹ́ àwọn àkókò láti sí àwòrán rẹ̀.

Fal Speech-to-Text ní ìṣàfihàn ìṣàfihàn àwọn àwọn ìṣàfihàn. Nípa ~500–1,500 tókènì nínú iṣẹ́jú kan tí a bá sọ̀rọ̀. $1 = 750,000 tókènì.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — a ti yọ àwòrán. Max 500 MB nígbà kan. Fáìlì tí o jú lọ? Fipa kù pẹlu /àwòrán/kúta/ tàbí lo /v1/stt/batch/.

Speaker diarization is a separate pass — toggle "diarize" on /transcribe/. Fal Speech-to-Text handles the transcription; diarization labels each segment with Speaker 1 / Speaker 2 / etc.

Ya — /batch/ gba àwọn fáìlì àwọn fáìlì ìranlọwọ. Àwọn àkọsílẹ̀ fún gbogbo wọn nínú /account/?tab=history láti ní àwọn fáìlì àìṣàfilọ́lẹ̀. Fún ìdáràn àwọn fáìlì-ìtíjà ló API.

Yes — POST your audio to /v1/stt/transcribe/ with model="Fal Speech-to-Text". Returns JSON with text + segments + word-level timestamps. /api/ has the full reference.

Àwọn àwọn ìṣàmúlò-ètò tí a fi pamọ́ fún ara wa nínú GPÙ wa; àwọn ìṣàmúlò-ètò ìṣàfihàn lọ́wọ́lọ́wọ́ nípa DPA. Àwọn ìṣàfihàn tí a pà láti inú fèrèsé ìpàpọ̀ (24h anon, 7d tí a tí fi pamọ́). A kò kọ̀ọ̀kan nínú àwọn àgbéwọlé rẹ̀.

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

Real-time factor is roughly 0.05–0.2× — a 60-minute podcast transcribes in 3–12 minutes. Premium models often finish faster. Use the queue button to close the tab.

Fal Speech-to-Text

Lò nípa API

Similar models

Àwọn Àtòjọ-ẹ̀yàn

Àwọn àṣẹ Fal Speech-to-Text wo ní?

Ìgbà wo nínú àwọn ìtàn wo ní Fal Speech-to-Text ǹfà?

Ìyàn wo ní Fal Speech-to-Text?

Àwọn àwọn ààyè-iṣẹ́ àwọn ààyè-iṣẹ́

Ìgbà wo ní Fal Speech-to-Text ń kùnà nínú àwọn àkókò?

Àwọn ìrísí-lẹ́tà àwòrán wo ní mò lè fi pamọ́ sí Fal Speech-to-Text?

Àwọn àwọn àkọlé àwọn àwọn àkọlé

Ń lè kọ́ àwọn àkọlé nípa Fal Speech-to-Text?

Is there an API for Fal Speech-to-Text?

Kini nipa ìdàjọ́ nígbà tí mò bá kọ̀ọ̀kan àwọn àmì-ìwé mì pẹ̀lú Fal Speech-to-Text?

Àwọn àtòjọ-ẹ̀yàn Fal Speech-to-Text ní ìdáràn fún ìlò àwọn iṣẹ́ ọ̀fẹ́?

Ìgbà wo ní Fal Speech-to-Text náà?

Gba 10,000 Free Tokens

Wá - Gba 10K Free Tokens!

Tí o fẹ́ láti mú diẹ̀ sii?