faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 token per minute

Lasciare un file audio o video, o incollare un URL qui sotto

~500 token per minute

faster-whisper large-v3 è a modello discorso-testo built by OpenAI / SYSTRAN. Il piu' forte degli Accurate transcription. Self-hosted on Free.ai GPU Il token è libero contro il tuo token pool giornaliero (500 tokens al minuto). Rilasciata sotto licenza MIT per uso commerciale consentito su Free.ai.

Utilizzare tramite API

API OpenAI-compatibile REST. Generare una chiave e chiamare questo modello in pochi secondi.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
Documentazione API Ottieni la chiave API

Domande frequenti

faster-whisper large-v3 traduce l'audio parlato in testo. Carica un file MP3, WAV, M4A o video e faster-whisper large-v3 restituisce la trascrizione completa più i sottotitoli opzionali SRT/VTT con timestamp.

faster-whisper large-v3 gestisce dozzine di lingue Whisper-family models cover 90+, Parakeet covers ~25, others variable. Scegli "auto-detect" o specifica la lingua per la massima precisione.

La velocità di Word-error è del 5/01/201210% sull'audio inglese pulito, del 10/20% sull'audio rumoroso o accentato. Le grandi varianti della stessa architettura fanno significativamente meglio su casi duri • selezionano più grande quando l'audio è grezzo.

Sì, ogni segmento include il timestamp di inizio/fine. Esporta come SRT o VTT e i tempi mappano direttamente sul tuo video.

faster-whisper large-v3 funziona sulle nostre GPU contro il vostro piscina gratuita quotidiana prima; $5 → 200.000 gettoni pagati dopo che. Circa ~500 gettoni al minuto.

MP3, WAV, M4A, FLAC, OGG, più il video (MP4, MOV, WebM) Estraiamo l'audio. Max 500 MB per upload. File più lunghi? Dividi con /audio/cut/ o usa /v1/stt/batch/.

La diarizzazione degli altoparlanti è un pass separato "diarize" su /transcribe/. faster-whisper large-v3 gestisce la trascrizione; etichette di diarization ogni segmento con Speaker 1 / Speaker 2 / etc.

Sì /batch/ accetta una cartella di file audio. Ogni trascrizione si trova in /account/?tab=storia con il nome originale del file. Per la conservazione dell'albero delle cartelle utilizzare l'API.

Sì POST il tuo audio a /v1/stt/transcribe/ con model="faster-whisper large-v3." Restituisce JSON con testo + segmenti + timestamp a livello word. /api/ ha il riferimento completo.

I modelli self-hosted mantengono l'audio sulle nostre GPU; il premio passa attraverso con un DPA. L'audio viene eliminato dopo la share-window (24h anon, 7d firmato-in). Non ci alleniamo sui vostri input.

Si Free.ai concede l'uso commerciale delle trascrizioni. Hai bisogno di diritti per l'audio che hai caricato (la tua registrazione, il materiale autorizzato, o il contenuto con il consenso).

Il fattore in tempo reale è di circa 0.05 0,060,2× di un podcast di 60 minuti trascrive in 3 0,012 minuti. I modelli premium spesso finiscono più velocemente. Usa il pulsante coda per chiudere la scheda.

Love this tool? Share it!

Valuta questa pagina