Fal Speech-to-Text

Free.ai · stt · ~500 tl> token bawat minute

Mag-upload ng audio

> I-drop ang isang audio o video file, o i-paste ang isang URL sa ibaba

~500 tl> token bawat minute

Ang mga ito ay tinatawag na mga GPU. > I-upgrade para sa Fal Speech-to-Text →

Ang Fal Speech-to-Text ay isang a at Modelong pagsasalita-sa-teksto. Ang mga ito ay: 1.

> Gamitin sa pamamagitan ng API

> OpenAI-compatible REST API. Bumuo ng isang susi at tawagan ang modelong ito sa ilang segundo.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'

API Dokumentasyon > Kumuha ng API Key

Katulad na mga modelo

ElevenLabs STT

Wizper (Whisper v3)

Mag-browse ng lahat ng mga modelo →

Mga Madalas Itanong

Ang Fal Speech-to-Text ay nagpapalit ng mga salitang narinig sa mga teksto. I-upload ang isang MP3, WAV, M4A, o video file at ang Fal Speech-to-Text ay magpapalit ng buong transcript at mga opsyonal na SRT/VTT na mga subtitle na may mga timestamp.

Fal Speech-to-Text ay may kakayahang mag-handle ng dose-dosenang mga wika — ang Whisper-family models ay sumasaklaw sa 90%, ang Parakeet ay sumasaklaw sa ~25, ang iba ay iba-iba. Pumili ng "auto-detect" o tukuyin ang wika para sa pinakamataas na katumpakan.

> Word-error rate ay 5-10% sa malinis na Ingles audio, 10-20% sa noisy o accented audio. Malalaking mga variant ng parehong architecture gawin makabuluhang mas mahusay sa mahirap na kaso - pumili ng mas malaki kapag ang audio ay magaspang.

> Oo - bawat segment ay kasama ang simula / katapusan ng timestamps. Export bilang SRT o VTT at ang mga oras ng mapa tuwid sa iyong video.

Ang Fal Speech-to-Text ay isang premium na makina ng transkripsiyon. Tungkol sa ~500-1,500 token bawat minuto ng audio. $1 = 750,000 token.

Ang mga file na ito ay maaaring i-convert sa MP3, WAV, M4A, FLAC, OGG, pati na rin ang video (MP4, MOV, WebM) — kami ay mag-extract ng audio. Max 500 MB bawat pag-upload.

Ang mga salitang "diary" at "diary" ay may dalawang kahulugan: Ang diary ay isang talaan ng mga bagay na naganap sa isang partikular na panahon.

> Oo — / batch / tumatanggap ng isang folder ng mga file ng audio. Ang bawat transcript lupain sa / account /? tab = kasaysayan na may orihinal na pangalan ng file. Para sa folder-tree preservation gamitin ang API.

Ang mga ito ay: 1. ang mga salitang "Ito ay" at "Ito ay" ay may mga titik na "I" at "O" na nakalagay sa mga dulo ng mga salita.

> Self-hosted modelo panatilihin ang audio sa aming GPUs; premium pumasa sa pamamagitan ng isang DPA. Audio ay tinanggal pagkatapos ng share-window (24h anon, 7d naka-sign-in). Hindi namin tren sa iyong mga input.

> Oo — Ang Free.ai ay nagbibigay ng komersyal na paggamit ng mga transcript. Kailangan mo ng mga karapatan sa audio na iyong nai-upload (ang iyong sariling pag-record, lisensyadong materyal, o nilalaman na may pahintulot).

> Real-time na kadahilanan ay humigit-kumulang 0.05-0.2 × — isang 60-minuto podcast transcribes sa3–12 minuto. Premium modelo madalas na matapos mas mabilis. Gamitin ang pindutan ng queue upang isara ang tab.

Fal Speech-to-Text

> Gamitin sa pamamagitan ng API

Katulad na mga modelo

Mga Madalas Itanong

Ano ang ibig sabihin ng Fal Speech-to-Text?

> Ilang wika ang sinusuportahan ng Fal Speech-to-Text?

Paano ang eksaktong Fal Speech-to-Text?

Ang Fal Speech-to-Text ay may kasamang mga timestamp?

> Gaano karaming gastos sa isang minuto ang Fal Speech-to-Text?

> Ano ang mga format ng audio na maaari kong i-upload sa Fal Speech-to-Text?

Maaari bang makilala ng Fal Speech-to-Text ang iba't ibang mga nagsasalita?

> Maaari ba akong mag-translate ng maraming beses gamit ang Fal Speech-to-Text?

Mayroon bang isang API para sa Fal Speech-to-Text?

> Ano ang tungkol sa privacy kapag ako transcribe sa Fal Speech-to-Text?

Ang Fal Speech-to-Text ay ligtas para sa komersyal na paggamit?

> Gaano katagal ang Fal Speech-to-Text tumagal?

> Kumuha ng 10,000 libreng token

Maghintay — Kumuha ng 10K Libreng Token!

Gusto mo ng higit pa?