ElevenLabs STT

Free.ai · stt · ~500 märgid per minute

Audio üleslaadimine

Viska audio- või videofail või aseta URL alla

~500 märgid per minute

Jookseb tasuta meie GPUs. Uuendamine ElevenLabs STT →

ElevenLabs STT on a kõne-teksti mudel. Marsruudil läbivad välised mudelid ~500 märgid minuti kohtaunit synonyms for matching user input (50% allahindlus võrreldes eelneva kuluga).

Kasutamine API kaudu

OpenAI ühilduv REST API. Genereeri võti ja kutsu seda mudelit sekundites.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'

API dokumentatsioon API võtme hankimine

Sarnased mudelid

Fal Speech-to-Text

Wizper (Whisper v3)

Kõigi mudelite sirvimine →

Korduma kippuvad küsimused

ElevenLabs STT transcribes voed audio into text. Lae MP3, WAV, M4A või videofail ja ElevenLabs STT tagastab täieliku ärakirja pluss valikulised SRT/VTT subtiitrid ajatemplitega.

ElevenLabs STT tegeleb kümnete keeltega Whisper-peremudelid hõlmavad 90+, Parakeet katavad ~25, teised erinevad. Vali "automaatne tuvastamine" või määra keel kõrgeima täpsuse jaoks.

Word-error määr on 57-10% puhas inglise heli, 10-20% müra või aktsent heli. Suured variandid sama arhitektuuri teha tähendusrikkalt parem rasketel juhtudel ~ valida suurem, kui heli on töötlemata.

Jah, igas segmendis on stardi/lõpu ajatemplid. Ekspordi kui SRT või VTT ja ajad kaardi otse oma videole.

ElevenLabs STT on premium transkriptsiooni mootor. Umbes ~500- 1,500 märgid minutis heli. $1 = 750,000 märgid.

MP3, WAV, M4A, FLAC, OGG, pluss video (MP4, MOV, WebM) ~ me eraldada audio. Max 500 MB kohta üles laadida. Pikemad failid? Split with /audio/cut / või kasutada /v1/stt/batch /.

Speaker diarization on eraldi pass ~ toggle "diarize" on / trancribe /. ElevenLabs STT hands the transcription; diarization sildid iga segmendiga Speaker 1 / Speaker 2 / jne.

Jah / batch/ a kaust / audio failid Iga transkript asukohas konto /? tab=ajalugu koos originaal failinimi. Kaustapuu säilitamine kasutamine API.

Jah ~ POSTI audio /v1/stt/transcribe/ with model="ElevenLabs STT". Tagastab JSON- i teksti + segmentidega + sõnataseme ajatemplitega. /api/ on täielik viide.

Isehostitud mudelid hoida audio meie GPUs; premium läbida DPA. Audio kustutatakse pärast share-aken (24h anon, 7d signed-in). Me ei treeni oma sisendeid.

Jah Free.ai annab transkriptide kaubandusliku kasutamise. Vajad õigusi üleslaaditud audiole (oma salvestusele, litsentsitud materjalile või sisule koos nõusolekuga).

Reaalajas tegur on umbes 0.05-0.2× ~ 60-minutiline podcast trancribes 3~12 minutit. Premium mudelid sageli lõpetada kiiremini. Kasutage järjekorda nuppu sulgeda kaart.

ElevenLabs STT

Kasutamine API kaudu

Sarnased mudelid

Korduma kippuvad küsimused

Mida teeb ElevenLabs STT?

Kui palju keeli ElevenLabs STT support?

Kui täpne on ElevenLabs STT?

Kas ElevenLabs STT sisaldab ajatemplit?

Kui palju maksab ElevenLabs STT minut?

Millisesse audiovormingusse ma saan üles laadida ElevenLabs STT?

Can ElevenLabs STT identify different speakers?

Kas ma võin kirjutada ElevenLabs STT?

Kas ElevenLabs STT jaoks on olemas API?

Aga privaatsus, kui ma transkribeerin ElevenLabs STT?

Is ElevenLabs STT output safe for commercial use?

Kui kaua võtab ElevenLabs STT?

Hangi 10 000 Tasuta Tokenit

Oodake, saage 10K Tasuta Tokenid!

Tahad veel?