Wizper (Whisper v3)

Free.ai · stt · ~500 token per minute

Lasciare un file audio o video, o incollare un URL qui sotto

~500 token per minute
E' libero sulle nostre GPU. Aggiornamento per Wizper (Whisper v3) →

Wizper (Whisper v3) è a modello discorso-testo. Instradato attraverso modelli esterni Tokens 500 al minuto (con un markup del 50% rispetto al costo upstream).

Utilizzare tramite API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/wizper","audio_url":"https://..."}'
Documentazione API Ottieni la chiave API

Domande frequenti

Wizper (Whisper v3) traduce l'audio parlato in testo. Carica un file MP3, WAV, M4A o video e Wizper (Whisper v3) restituisce la trascrizione completa più i sottotitoli opzionali SRT/VTT con timestamp.

Wizper (Whisper v3) gestisce dozzine di lingue Whisper-family models cover 90+, Parakeet covers ~25, others variable. Scegli "auto-detect" o specifica la lingua per la massima precisione.

La velocità di Word-error è del 5/01/201210% sull'audio inglese pulito, del 10/20% sull'audio rumoroso o accentato. Le grandi varianti della stessa architettura fanno significativamente meglio su casi duri • selezionano più grande quando l'audio è grezzo.

Sì, ogni segmento include il timestamp di inizio/fine. Esporta come SRT o VTT e i tempi mappano direttamente sul tuo video.

Wizper (Whisper v3) è un motore di trascrizione premium. Circa ~500 token 1.500 al minuto di audio. $1 = 750.000 token.

MP3, WAV, M4A, FLAC, OGG, più il video (MP4, MOV, WebM) Estraiamo l'audio. Max 500 MB per upload. File più lunghi? Dividi con /audio/cut/ o usa /v1/stt/batch/.

La diarizzazione degli altoparlanti è un pass separato "diarize" su /transcribe/. Wizper (Whisper v3) gestisce la trascrizione; etichette di diarization ogni segmento con Speaker 1 / Speaker 2 / etc.

Sì /batch/ accetta una cartella di file audio. Ogni trascrizione si trova in /account/?tab=storia con il nome originale del file. Per la conservazione dell'albero delle cartelle utilizzare l'API.

Sì POST il tuo audio a /v1/stt/transcribe/ con model="Wizper (Whisper v3)." Restituisce JSON con testo + segmenti + timestamp a livello word. /api/ ha il riferimento completo.

I modelli self-hosted mantengono l'audio sulle nostre GPU; il premio passa attraverso con un DPA. L'audio viene eliminato dopo la share-window (24h anon, 7d firmato-in). Non ci alleniamo sui vostri input.

Si Free.ai concede l'uso commerciale delle trascrizioni. Hai bisogno di diritti per l'audio che hai caricato (la tua registrazione, il materiale autorizzato, o il contenuto con il consenso).

Il fattore in tempo reale è di circa 0.05 0,060,2× di un podcast di 60 minuti trascrive in 3 0,012 minuti. I modelli premium spesso finiscono più velocemente. Usa il pulsante coda per chiudere la scheda.

Love this tool? Share it!

Valuta questa pagina