Fal Speech-to-Text

Free.ai · stt · ~500 märgid per minute

Viska audio- või videofail või aseta URL alla

~500 märgid per minute
Jookseb tasuta meie GPUs. Uuendamine Fal Speech-to-Text →

Fal Speech-to-Text on a kõne-teksti mudel. Marsruudil läbivad välised mudelid ~500 märgid minuti kohtaunit synonyms for matching user input (50% allahindlus võrreldes eelneva kuluga).

Kasutamine API kaudu

OpenAI ühilduv REST API. Genereeri võti ja kutsu seda mudelit sekundites.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'
API dokumentatsioon API võtme hankimine

Korduma kippuvad küsimused

Fal Speech-to-Text transcribes voed audio into text. Lae MP3, WAV, M4A või videofail ja Fal Speech-to-Text tagastab täieliku ärakirja pluss valikulised SRT/VTT subtiitrid ajatemplitega.

Fal Speech-to-Text tegeleb kümnete keeltega Whisper-peremudelid hõlmavad 90+, Parakeet katavad ~25, teised erinevad. Vali "automaatne tuvastamine" või määra keel kõrgeima täpsuse jaoks.

Word-error määr on 57-10% puhas inglise heli, 10-20% müra või aktsent heli. Suured variandid sama arhitektuuri teha tähendusrikkalt parem rasketel juhtudel ~ valida suurem, kui heli on töötlemata.

Jah, igas segmendis on stardi/lõpu ajatemplid. Ekspordi kui SRT või VTT ja ajad kaardi otse oma videole.

Fal Speech-to-Text on premium transkriptsiooni mootor. Umbes ~500- 1,500 märgid minutis heli. $1 = 750,000 märgid.

MP3, WAV, M4A, FLAC, OGG, pluss video (MP4, MOV, WebM) ~ me eraldada audio. Max 500 MB kohta üles laadida. Pikemad failid? Split with /audio/cut / või kasutada /v1/stt/batch /.

Speaker diarization on eraldi pass ~ toggle "diarize" on / trancribe /. Fal Speech-to-Text hands the transcription; diarization sildid iga segmendiga Speaker 1 / Speaker 2 / jne.

Jah / batch/ a kaust / audio failid Iga transkript asukohas konto /? tab=ajalugu koos originaal failinimi. Kaustapuu säilitamine kasutamine API.

Jah ~ POSTI audio /v1/stt/transcribe/ with model="Fal Speech-to-Text". Tagastab JSON- i teksti + segmentidega + sõnataseme ajatemplitega. /api/ on täielik viide.

Isehostitud mudelid hoida audio meie GPUs; premium läbida DPA. Audio kustutatakse pärast share-aken (24h anon, 7d signed-in). Me ei treeni oma sisendeid.

Jah Free.ai annab transkriptide kaubandusliku kasutamise. Vajad õigusi üleslaaditud audiole (oma salvestusele, litsentsitud materjalile või sisule koos nõusolekuga).

Reaalajas tegur on umbes 0.05-0.2× ~ 60-minutiline podcast trancribes 3~12 minutit. Premium mudelid sageli lõpetada kiiremini. Kasutage järjekorda nuppu sulgeda kaart.

Armastus Free.ai?

Hinda seda lehekülge