faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 tokenuri per minute

Încărcă audio

Aruncă un fișier audio sau video, sau cotează o URL de mai jos

~500 tokenuri per minute

_ Cel mai puternic la Accurate transcription. Self-hosted pe Free.ai GPUs — rula gratuit împotriva poolului de token zilnic (500 tokens pe minut). Eliberat în MIT — utilizare comercială permisă la Free.ai.

Utilizare prin API

API REST compatible cu OpenAI. Generați o cheie și sunați acest model în secunde.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'

Documentare API Obține cheie API

Modele similare

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Explorează toate modelele →

Întrebări frecvente

faster-whisper large-v3 transcrie audio vorbit în text. Încarcă un fișier MP3, WAV, M4A sau video și faster-whisper large-v3 returnează transcripția completă plus subtitrarea opțională SRT/VTT cu timelor.

faster-whisper large-v3 se ocupă de zeci de limbi — Whisper-familia modele acoperă 90+, Parakeet acoperă ~25, altele variază. Alegeți "auto-detectare" sau specificați limba pentru cea mai mare precizie.

Rata de eroare a cuvântului este de 5–100% pe audio curat englez, 10–20% pe audio zgomotos sau accentuat. Variante mari ale aceleiași arhitecturi fac în mod semnificativ mai bine pe cazurile grele — alege mai mare atunci când audio este dur.

Da — fiecare segment include start/end timelor. Export ca SRT sau VTT și harta de timpuri direct pe video.

faster-whisper large-v3 rula pe propriile noastre GPUs împotriva piscină gratuită zilnic mai întâi; $5 → 200.000 de jetonuri plătite după asta. Aproximativ ~500 jetonuri pe minut.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) - extragem audio. Max 500 MB pe încărcare. Fișiere mai lungi? Split cu /audio/cut/ sau folosirea /v1/stt/batch /.

Diarizarea speakerului este un pas separat — comutați "diarizarea" pe /transcribe /. faster-whisper large-v3 se ocupă de transcriere; etichete de diarizarea fiecare segment cu Speaker 1 / Speaker 2 / etc.

Da — /batch/ acceptă un dosar de fișiere audio. Fiecare transcriere de terenuri în /compte /?tab=historia cu numele de fișier original. Pentru conservarea dosarului-arbore utiliza API.

Da — POST audio dumneavoastră la /v1/stt/transcribe/ cu model="faster-whisper large-v3". Returnează JSON cu text + segmente + fuste orare de word-level. /api/ are referință completă.

Modelele auto-gazdă păstrează audio pe GPU-urile noastre; premium trec prin cu un DPA. Audio este șterse după curent (24h anon, 7d semnat-in). Noi nu antrenăm pe intrarea dumneavoastră.

Da — Free.ai acordă utilizarea comercială a transcripcionelor. Ai nevoie de drepturi la audio pe care l-ai încărcat (înregistrarea propriu, material licențiat sau conținut cu consimțământul).

Factorul în timp real este de aproximativ 0,05–0.2× – un podcast de 60 de minute transcrie în 3–12 de minute. Modelele premium se termină adesea mai repede. Utilizați butonul de coadă pentru a închide tab.

faster-whisper large-v3

Utilizare prin API

Modele similare

Întrebări frecvente

Ce face faster-whisper large-v3?

Câte limbi suportă faster-whisper large-v3?

Cât de precisă este faster-whisper large-v3?

Are faster-whisper large-v3 include timurile de timp?

Cât costă faster-whisper large-v3 pe minut?

Ce formate audio pot încărca pe faster-whisper large-v3?

Se poate identifica faster-whisper large-v3 diferite speakers?

Pot să transcriu pe lot cu faster-whisper large-v3?

Există o API pentru faster-whisper large-v3?

Cum rămâne cu intimitatea când transcriu cu faster-whisper large-v3?

faster-whisper large-v3 ieșire sigură pentru utilizarea comercială?

Cât durează faster-whisper large-v3?

Obţine 10.000 de token gratuit

Aşteaptă! Ia 10K tokens gratis!

Vrei mai mult?