ElevenLabs STT

Free.ai · stt · ~500 tokens per minute

Carica l'audiu

Lascia calà un figghiu audio o vidìu, o incolla un URL sutta

~500 tokens per minute

Funziona liberamenti supra li nostri GPU. Aggiornamentu pi ElevenLabs STT →

ElevenLabs STT is a mudellu di sintesi vocali-versu-testu. Routed attraversu mudelli esterni — ~ 500 tokens à u minutu (50% markup supra u costu a monte).

Usare via API

API REST compatibili OpenAI. Genera una chiave è chiama stu mudellu in uni pochi di siconni.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'

Documentazione Otteni a chiave API

Modelli simili

Fal Speech-to-Text

Wizper (Whisper v3)

Sfoglia tutti i mudelli →

Dumande frequenti

ElevenLabs STT trascrivi l'audiu parlatu in testu. Carica un MP3, WAV, M4A, o un figghiu video è ElevenLabs STT riturna a trascrizzioni cumpleta più i sottotituli SRT/VTT opziunali cù timestamps.

ElevenLabs STT gestisci decine di lingue — i mudelli di a famiglia Whisper coprenu 90%, Parakeet coprenu ~25, altri varianu. Sceglite "auto-detect" o specificate a lingua pi a massimu accuratezza.

U tassu di erruri di parolla hè 5-10% in audio inglese pulitu, 10-20% in audio rumorosu o accentatu. Varianti grandi di a stessa architettura facenu significativamente megliu in casi duri - sceglite più grandi quandu l'audiu hè russu.

Sì — ogni segmentu cuntene l'indicazioni di l'ora di iniziu/fini. Esportà comu SRT o VTT è a mappatura di l'ora direttamente in u vostru video.

ElevenLabs STT hè un mutore di trascrizzioni premium. Circa ~500-1,500 tokens per minutu di audio. $1 = 750,000 tokens.

MP3, WAV, M4A, FLAC, OGG, più video (MP4, MOV, WebM) — estraemu l'audiu. Max 500 MB per caricamentu. File più lunghi? Divide cù /audio/cut/ o usa /v1/stt/batch/.

A diarizazione di l'oratori hè un passaggiu separatu — attivate "diarize" in /transcribe/. ElevenLabs STT gestisci a trascrizzioni; a diarizazione etichetta ogni segmentu cu L'oratori 1 / L'oratori 2 / ecc.

Sì — /batch/ accitta na cartella di figghi audio. Ogni trascrizzioni finisci nta /account/?tab=history cu lu nomi di figghiu origiinali. Pi cunservari l'arburi di cartelli usa l'API.

Sì — POST u vostru audio à /v1/stt/transcribe/ cù model="ElevenLabs STT". Ritorna JSON cù testu + segmenti + timestamp a livellu di parolla. /api/ hà a riferenza piena.

I mudelli auto-ospitati mantèninu l'audiu supra a nostra GPU; i mudelli premium passanu cu un DPA. L'audiu si cancia dopu a finestra di cunnizzioni (24 ore anònimu, 7 ghjorni di cunnessione). Noi nun ci addestramu supra i vostri input.

Sì — Free.ai cunzenti l'usu cummerciali di li trascrizzioni. Avete bisognu di li diritti di l'audiu ca caricate (a vostra registrazioni, materiali cun licenza, o cuntinutu cu cunsensu).

U fatturi di tempu reale hè approssimativamente 0.05–0.2× — un podcast di 60 minuti trasscrivi in 3–12 minuti. I mudelli Premium spessu finiscinu più veloci. Usate u buttone di coda per chiudiri a scheda.

ElevenLabs STT

Usare via API

Modelli simili

Dumande frequenti

Cosa fa ElevenLabs STT?

Quanti lingue supporta ElevenLabs STT?

Quantu hè precisu ElevenLabs STT?

ElevenLabs STT include timestamps?

Quantu costa ElevenLabs STT à u minutu?

Quali formati audio pò caricà à ElevenLabs STT?

Pudete ElevenLabs STT identificà diversi parlanti?

Possu trascriviri in batch cù ElevenLabs STT?

Ci hè un API per ElevenLabs STT?

Quale hè a privacy quandu trascrivu cù ElevenLabs STT?

L'output di ElevenLabs STT hè sicuru per l'usu cummerciale?

Quantu tempu ci vole à ElevenLabs STT?

Get 10,000 Tokens gratuiti

Aspettate — Get 10K Tokens gratuiti!

Volete di più?