Distil-Whisper large-v3

Free.ai (self-hosted) · stt · ~500 tokens per minute

Audio uploaden

Laat een audio- of videobestand vallen of plak een URL hieronder

~500 tokens per minute

Distil-Whisper large-v3 is a {categorie} gebouwd door HuggingFace. Sterkste op Real-time transcription, large-volume batch STT.. Zelf gehost op Free.ai GPU's loopt gratis tegen uw dagelijkse token pool (500 tokens per minuut). Vrijgegeven onder MIT..commercieel gebruik toegestaan op Free.ai.

Gebruik via API

OpenAI-compatibele REST API. Genereer een sleutel en bel dit model in seconden.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"distil-whisper-large-v3","audio_url":"https://..."}'

API-documentatie API-sleutel ophalen

Soortgelijke modellen

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Blader door alle modellen →

Veelgestelde vragen

Distil-Whisper large-v3 transcribes gesproken audio in tekst. Upload een MP3, WAV, M4A, of videobestand en Distil-Whisper large-v3 geeft het volledige transcript plus optionele SRT/VTT ondertitels met tijdstempels.

Distil-Whisper large-v3 behandelt tientallen talen Whisper-familiemodellen bestrijken 90+, Parakeet covers ~25, andere variëren. Kies "auto-detect" of geef de taal voor de hoogste nauwkeurigheid.

Word-error rate is 5.00% op schone Engelse audio, 10.020% op luidruchtige of geaccentueerde audio. Grote varianten van dezelfde architectuur doen betekenisvol beter op harde gevallen Pick groter wanneer de audio is ruw.

Ja, elk segment bevat start/end tijdstempels. Exporteer als SRT of VTT en de tijdkaart direct op uw video.

Distil-Whisper large-v3 draait op onze eigen GPU's tegen uw dagelijkse gratis zwembad eerst; $ 5 → 200.000 betaalde tokens daarna. Ongeveer ~ 500 tokens per minuut.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) We halen de audio. Max 500 MB per upload. Langere bestanden? Splitsen met /audio/cut/of gebruik /v1/stt/batch/.

Speaker diarization is een aparte pass die "diarize" schakelt op /transcribe/. Distil-Whisper large-v3 verwerkt de transcriptie; diarization labels elk segment met Speaker 1 / Speaker 2 / etc.

Ja, /batch/ accepteert een map met audiobestanden. Elk transcript landt in /account/?tab=history met de oorspronkelijke bestandsnaam. Voor het bewaren van de map-boom gebruikt u de API.

Ja, POST je audio naar /v1/stt/transcribe/met model="Distil-Whisper large-v3." Geeft JSON terug met tekst + segmenten + woord-level timestamps. /api/ heeft de volledige referentie.

Zelfgehoste modellen houden audio op onze GPU's; premium pass through met een DPA. Audio wordt verwijderd na het share-venster (24h anon, 7d ingelogd). We trainen niet op uw ingangen.

Ja, Free.ai verleent commercieel gebruik van transcripten. U heeft rechten nodig op de audio die u hebt geüpload (uw eigen opname, gelicentieerd materiaal of inhoud met toestemming).

Real-time factor is ruwweg 0.50.0.2× een 60-minuten podcast transcribes in 3.12 minuten. Premium modellen vaak sneller eindigen. Gebruik de wachtrij knop om het tabblad te sluiten.

Distil-Whisper large-v3

Gebruik via API

Soortgelijke modellen

Veelgestelde vragen

Wat doet Distil-Whisper large-v3?

Hoeveel talen ondersteunen Distil-Whisper large-v3?

Hoe nauwkeurig is Distil-Whisper large-v3?

Heeft Distil-Whisper large-v3 tijdstempels?

Hoeveel kost Distil-Whisper large-v3 per minuut?

Welke audioformaten kan ik uploaden naar Distil-Whisper large-v3?

Kan Distil-Whisper large-v3 verschillende sprekers identificeren?

Kan ik batch transcriberen met Distil-Whisper large-v3?

Is er een API voor Distil-Whisper large-v3?

Hoe zit het met privacy als ik me overschrijf met Distil-Whisper large-v3?

Is Distil-Whisper large-v3 output safe for commercial use?

Hoe lang duurt Distil-Whisper large-v3?

Krijg 10.000 gratis tokens

Wacht. Krijg 10K gratis tokens.

Wil je meer?