Wizper (Whisper v3)

Free.ai · stt · ~500 token per minute

Carica audio

Lasciare un file audio o video, o incollare un URL qui sotto

~500 token per minute

E' libero sulle nostre GPU. Aggiornamento per Wizper (Whisper v3) →

Wizper (Whisper v3) è a modello discorso-testo. Instradato attraverso modelli esterni Tokens 500 al minuto (con un markup del 50% rispetto al costo upstream).

Utilizzare tramite API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/wizper","audio_url":"https://..."}'

Documentazione API Ottieni la chiave API

Similar models

ElevenLabs STT

Fal Speech-to-Text

Browse all models →

Domande frequenti

Wizper (Whisper v3) traduce l'audio parlato in testo. Carica un file MP3, WAV, M4A o video e Wizper (Whisper v3) restituisce la trascrizione completa più i sottotitoli opzionali SRT/VTT con timestamp.

Wizper (Whisper v3) gestisce dozzine di lingue Whisper-family models cover 90+, Parakeet covers ~25, others variable. Scegli "auto-detect" o specifica la lingua per la massima precisione.

La velocità di Word-error è del 5/01/201210% sull'audio inglese pulito, del 10/20% sull'audio rumoroso o accentato. Le grandi varianti della stessa architettura fanno significativamente meglio su casi duri • selezionano più grande quando l'audio è grezzo.

Sì, ogni segmento include il timestamp di inizio/fine. Esporta come SRT o VTT e i tempi mappano direttamente sul tuo video.

Wizper (Whisper v3) è un motore di trascrizione premium. Circa ~500 token 1.500 al minuto di audio. $1 = 750.000 token.

MP3, WAV, M4A, FLAC, OGG, più il video (MP4, MOV, WebM) Estraiamo l'audio. Max 500 MB per upload. File più lunghi? Dividi con /audio/cut/ o usa /v1/stt/batch/.

La diarizzazione degli altoparlanti è un pass separato "diarize" su /transcribe/. Wizper (Whisper v3) gestisce la trascrizione; etichette di diarization ogni segmento con Speaker 1 / Speaker 2 / etc.

Sì /batch/ accetta una cartella di file audio. Ogni trascrizione si trova in /account/?tab=storia con il nome originale del file. Per la conservazione dell'albero delle cartelle utilizzare l'API.

Sì POST il tuo audio a /v1/stt/transcribe/ con model="Wizper (Whisper v3)." Restituisce JSON con testo + segmenti + timestamp a livello word. /api/ ha il riferimento completo.

I modelli self-hosted mantengono l'audio sulle nostre GPU; il premio passa attraverso con un DPA. L'audio viene eliminato dopo la share-window (24h anon, 7d firmato-in). Non ci alleniamo sui vostri input.

Si Free.ai concede l'uso commerciale delle trascrizioni. Hai bisogno di diritti per l'audio che hai caricato (la tua registrazione, il materiale autorizzato, o il contenuto con il consenso).

Il fattore in tempo reale è di circa 0.05 0,060,2× di un podcast di 60 minuti trascrive in 3 0,012 minuti. I modelli premium spesso finiscono più velocemente. Usa il pulsante coda per chiudere la scheda.

Wizper (Whisper v3)

Utilizzare tramite API

Similar models

Domande frequenti

Che cosa fa Wizper (Whisper v3)?

Quante lingue supporta Wizper (Whisper v3)?

Quanto è preciso il nome?

Wizper (Whisper v3) include timestamps?

Quanto costa Wizper (Whisper v3) al minuto?

Quali formati audio posso caricare su Wizper (Whisper v3)?

Può Wizper (Whisper v3) identificare diversi altoparlanti?

Posso trascrivere batch con Wizper (Whisper v3)?

C'è un'API per Wizper (Whisper v3)?

E la privacy quando trascrivo con Wizper (Whisper v3)?

L'uscita Wizper (Whisper v3) è sicura per uso commerciale?

Quanto tempo ci vuole?

Ottieni 10.000 Token gratuiti

Aspetta. Ottieni 10K Token gratis!

Ne vuoi ancora?