Fal Speech-to-Text

Free.ai · stt · ~500 žetoni uz vienu minute

Augšupielādēt audio

Nometiet audio vai video failu vai ielīmējiet URL zemāk

~500 žetoni uz vienu minute

Skrien bez maksas pie mūsu GPU. Atjaunināt priekš Fal Speech-to-Text →

Fal Speech-to-Text ir {da}ļiņu__ {kategorija}. Maršruts, izmantojot ārējos modeļus — ~{tpm_markes} minūtē(50 % atzīme virs iepriekšējā posma izmaksām).

Izmantošana caur API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'

API dokumentācija Iegūst API atslēgu

Similar models

ElevenLabs STT

Wizper (Whisper v3)

Browse all models →

Bieži uzdoti jautājumi

Fal Speech-to-Text tranraksti skaļi audio tekstā. Ielādējiet MP3, WAV, M4A vai video failu un Fal Speech-to-Text atgriež pilnu transkriptu plus izvēles SRT/VTT subtitrus ar laika zīmogiem.

Fal Speech-to-Text hands desmiti valodu — Whisper-ģimenes modeļi aptver 90+, Parakeet cover ~25, citi atšķiras. Izvēlieties "auto-detektēšana" vai norādiet valodu, lai panāktu augstāko precizitāti.

Word-error ātrums ir 5-10% uz tīra angļu audio, 10-20% uz trokšņains vai izcelts audio. Lieli varianti tās pašas arhitektūras dara jēgpilni labāk par grūtiem gadījumiem — izvēlieties lielāku, kad audio ir raupja.

Jā — katrs segments ietver sākuma/gala laika zīmjus. Eksportēt kā SRT vai VTT un laika karti tieši uz jūsu video.

Fal Speech-to-Text ir premium transkripcijas dzinējs. Par ~500-1 500 žetoni minūtē audio. $1 = 750,000 žetoni.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — mēs iegūstam audio. Maksimāli 500 MB uz augšupielādi. Ilgāki faili? Split with /audio/cut/ or use /v1/stt/partch/.

Skaļruņa diarizācija ir atsevišķa caurlaide — pārslēdziet "dializējiet" par / transkripciju/. Fal Speech-to-Text roku transkripciju; Diarizēšanas etiķetes katram segmentam ar Skaļruņu 1 / Skaļrunis 2 / uc

Jā — /partch/ pieņem audio failu mapi. Katra transkripcijas laukuma / konts /? tab=vēsture ar oriģinālo faila nosaukumu. Mapju koku saglabāšanai izmantojiet API.

Yes — POST your audio to /v1/stt/transcribe/ with model="Fal Speech-to-Text". Returns JSON with text + segments + word-level timestamps. /api/ has the full reference.

Pašuzturēti modeļi saglabāt audio uz mūsu GPUs; premium iet cauri ar DPA. Audio tiek dzēsts pēc Share-window (24h anon, 7d pierakstīšanās). Mēs nemācāmies uz jūsu ievades.

Jā — Free.ai dod tiesības komerciāli izmantot transkriptus. Jums ir vajadzīgas tiesības uz jūsu augšupielādēto audio (savu ierakstu, licencēto materiālu vai saturu ar piekrišanu).

Reālā laika faktors ir aptuveni 0,05-0,2× — 60 minūšu podcast transkripcija 3–12 minūšu laikā. Premium modeļi bieži vien beidzas ātrāk. Izmantojiet rindas pogu, lai aizvērtu cilni.

Fal Speech-to-Text

Izmantošana caur API

Similar models

Bieži uzdoti jautājumi

Ko Fal Speech-to-Text darāt?

How many languages does Fal Speech-to-Text support?

Cik precīzi ir Fal Speech-to-Text?

Vai Fal Speech-to-Text ietver laika zīmjus?

How much does Fal Speech-to-Text cost per minute?

Kādus audio formātus es varu augšupielādēt Fal Speech-to-Text?

Can Fal Speech-to-Text identify different speakers?

Vai es varu pārrakstīties ar Fal Speech-to-Text?

Vai ir API priekš Fal Speech-to-Text?

Kā ar privātumu, kad es translatoru ar Fal Speech-to-Text?

Is Fal Speech-to-Text output safe for commercial use?

How long does Fal Speech-to-Text take?

Iegūstiet 10 000 bezmaksas žetonus

Paga — dabūjiet 10K bezmaksas žetonus!

Gribi vēl?