Distil-Whisper large-v3

Free.ai (self-hosted) · stt · ~500 tokens per minute

Laat een audio- of videobestand vallen of plak een URL hieronder

~500 tokens per minute

Distil-Whisper large-v3 is a {categorie} gebouwd door HuggingFace. Sterkste op Real-time transcription, large-volume batch STT.. Zelf gehost op Free.ai GPU's loopt gratis tegen uw dagelijkse token pool (500 tokens per minuut). Vrijgegeven onder MIT..commercieel gebruik toegestaan op Free.ai.

Gebruik via API

OpenAI-compatibele REST API. Genereer een sleutel en bel dit model in seconden.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"distil-whisper-large-v3","audio_url":"https://..."}'
API-documentatie API-sleutel ophalen

Veelgestelde vragen

Distil-Whisper large-v3 transcribes gesproken audio in tekst. Upload een MP3, WAV, M4A, of videobestand en Distil-Whisper large-v3 geeft het volledige transcript plus optionele SRT/VTT ondertitels met tijdstempels.

Distil-Whisper large-v3 behandelt tientallen talen Whisper-familiemodellen bestrijken 90+, Parakeet covers ~25, andere variëren. Kies "auto-detect" of geef de taal voor de hoogste nauwkeurigheid.

Word-error rate is 5.00% op schone Engelse audio, 10.020% op luidruchtige of geaccentueerde audio. Grote varianten van dezelfde architectuur doen betekenisvol beter op harde gevallen Pick groter wanneer de audio is ruw.

Ja, elk segment bevat start/end tijdstempels. Exporteer als SRT of VTT en de tijdkaart direct op uw video.

Distil-Whisper large-v3 draait op onze eigen GPU's tegen uw dagelijkse gratis zwembad eerst; $ 5 → 200.000 betaalde tokens daarna. Ongeveer ~ 500 tokens per minuut.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) We halen de audio. Max 500 MB per upload. Langere bestanden? Splitsen met /audio/cut/of gebruik /v1/stt/batch/.

Speaker diarization is een aparte pass die "diarize" schakelt op /transcribe/. Distil-Whisper large-v3 verwerkt de transcriptie; diarization labels elk segment met Speaker 1 / Speaker 2 / etc.

Ja, /batch/ accepteert een map met audiobestanden. Elk transcript landt in /account/?tab=history met de oorspronkelijke bestandsnaam. Voor het bewaren van de map-boom gebruikt u de API.

Ja, POST je audio naar /v1/stt/transcribe/met model="Distil-Whisper large-v3." Geeft JSON terug met tekst + segmenten + woord-level timestamps. /api/ heeft de volledige referentie.

Zelfgehoste modellen houden audio op onze GPU's; premium pass through met een DPA. Audio wordt verwijderd na het share-venster (24h anon, 7d ingelogd). We trainen niet op uw ingangen.

Ja, Free.ai verleent commercieel gebruik van transcripten. U heeft rechten nodig op de audio die u hebt geüpload (uw eigen opname, gelicentieerd materiaal of inhoud met toestemming).

Real-time factor is ruwweg 0.50.0.2× een 60-minuten podcast transcribes in 3.12 minuten. Premium modellen vaak sneller eindigen. Gebruik de wachtrij knop om het tabblad te sluiten.

Love this tool? Share it!

Beoordeel deze pagina