faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 polletter per minute

Ladda upp ljud

Släpp en ljud- eller videofil, eller klistra in en webbadress nedan

~500 polletter per minute

faster-whisper large-v3 är {artikel} {kategori} byggd av OpenAI / SYSTRAN. Starkast på Accurate transcription. Självvärdig på Free.ai GPUs – körs gratis mot din dagliga tokenpool (500 tokens per minut). Släppt under MIT – tillåten kommersiell användning på Free.ai.

Använd via API

OpenAI-kompatibelt REST API. Skapa en nyckel och ring denna modell på några sekunder.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'

API-dokumentation Hämta API- nyckel

Liknande modeller

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Bläddra bland alla modeller →

Vanliga frågor

faster-whisper large-v3 transkriberar talat ljud till text. Ladda upp en MP3, WAV, M4A eller videofil och faster-whisper large-v3 returnerar den fullständiga utskriften plus valfria SRT/VTT text med tidsstämplar.

faster-whisper large-v3 hanterar dussintals språk — Whisper-familj modeller täcker 90+, Parakeet täcker ~25, andra varierar. Välj "auto-detect" eller ange språket för högsta noggrannhet.

Word-terror är 5–10% på rent engelskt ljud, 10-20% på bullriga eller accentuerade ljud. Stora varianter av samma arkitektur gör meningsfullt bättre på hårda fall - plocka större när ljudet är grov.

Ja — varje segment inkluderar start/slut timestamps. Exportera som SRT eller VTT och gånger kartan direkt till din video.

faster-whisper large-v3 körs på våra egna GPUs mot din dagliga gratis pool först; $5 → 200 000 betalade polletter efter det. Om ~500 polletter per minut.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) – vi extraherar ljudet. Max 500 MB per uppladdning. Längre filer? Dela med /audio/cut/ eller använd /v1/st/batch/.

Speaker diarization är ett separat pass — växla "diarize" på /transcribe /. faster-whisper large-v3 hanterar transkriptionen; diarization etiketter varje segment med högtalare 1 / högtalare 2 / etc.

Ja — / batch/ accepterar en katalog med ljudfiler. Varje utskrift landar i / account/?tab= historia med det ursprungliga filnamnet. För arkivering av katalogträd använd API:et.

Ja — Skicka ditt ljud till /v1/st/transcribe/ med modell="faster-whisper large-v3". Returnerar JSON med text + segment + Word-level timestamps. /api/ har den fullständiga referensen.

Självvärdiga modeller håller ljud på våra GPUs; premium passera genom med en DPA. Ljud tas bort efter share-window (24h anon, 7d inloggad). Vi tränar inte på dina ingångar.

Ja — Free.ai beviljar kommersiell användning av utskrifter. Du behöver rättigheter till det ljud du laddat upp (din egen inspelning, licensierat material eller innehåll med samtycke).

Realtidsfaktorn är ungefär 0,05–0,2× — en 60-minuters podcast transkriberar i 3–12 minuter. Premium modeller ofta slutar snabbare. Använd köknappen för att stänga fliken.

faster-whisper large-v3

Använd via API

Liknande modeller

Vanliga frågor

Vad gör faster-whisper large-v3?

Hur många språk stöder faster-whisper large-v3?

Hur korrekt är faster-whisper large-v3?

Innehåller faster-whisper large-v3 tidsstämpelr?

Hur mycket kostar faster-whisper large-v3 per minut?

Vilka ljudformat kan jag ladda upp till faster-whisper large-v3?

Kan faster-whisper large-v3 identifiera olika högtalare?

Kan jag batch transkribera med faster-whisper large-v3?

Finns det ett API för faster-whisper large-v3?

Hur är det med integritet när jag transkriberar med faster-whisper large-v3?

Är faster-whisper large-v3 utgång säker för kommersiell användning?

Hur lång tid tar det faster-whisper large-v3?

Få 10 000 gratis tokener

Vänta — få 10 000 gratis tokener!

Vill du ha mer?