faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 jetons par minute

Déposer un fichier audio ou vidéo, ou coller une URL ci-dessous

~500 jetons par minute

faster-whisper large-v3 est a modèle de la parole au texte construit par OpenAI / SYSTRAN. Plus fort à {meilleur_pour}. Self-hosted sur Free.ai GPUs — fonctionne gratuitement contre votre pool de jetons journaliers (500 jetons par minute). Libéré sous MIT — utilisation commerciale autorisée sur Free.ai.

Utiliser via l'API

API REST compatible OpenAI. Générez une clé et appelez ce modèle en quelques secondes.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
Documentation de l'API Obtenir la clé API

Foire aux questions

faster-whisper large-v3 transcrit l'audio parlé en texte. Téléchargez un fichier MP3, WAV, M4A ou vidéo et faster-whisper large-v3 retourne la transcription complète ainsi que les sous-titres optionnels SRT/VTT avec horodatage.

faster-whisper large-v3 gère des dizaines de langues — Whisper-les modèles familiaux couvrent 90+, Parakeet couvre ~25, d'autres varient.

Le taux d'erreur de mot est de 5 à 10 % sur l'audio anglais propre, de 10 à 20 % sur l'audio bruyant ou accentué. Les grandes variantes de la même architecture font significativement mieux sur les cas durs — choisissez plus grand lorsque l'audio est rugueux.

Oui — chaque segment comprend des horodatages start/end. Exportez en tant que SRT ou VTT et la carte des heures directement sur votre vidéo.

faster-whisper large-v3 fonctionne sur nos propres GPU contre votre piscine gratuite quotidienne d'abord; $5 → 200 000 jetons payés après cela. Environ ~500 jetons par minute.

MP3, WAV, M4A, FLAC, OGG, plus vidéo (MP4, MOV, WebM) — nous extrayons l'audio. Max 500 MB par téléchargement. Fichiers plus longs? Split avec /audio/cut/ ou utilisez /v1/stt/batch/.

La diarisation des haut-parleurs est une passe séparée — basculer « diarize » sur /transcribe/. faster-whisper large-v3 gère la transcription; la diarisation étiquette chaque segment avec Speaker 1 / Speaker 2 / etc.

Oui — /batch/ accepte un dossier de fichiers audio. Chaque transcription se trouve dans /account/?tab=history avec le nom de fichier original. Pour la préservation des arbres de dossiers, utilisez l'API.

Oui — POST votre audio vers /v1/stt/transcribe/ avec model=faster-whisper large-v3". Retourne JSON avec texte + segments + word-level timestamps. /api/ a la référence complète.

Les modèles auto-organisés gardent l'audio sur nos GPUs; la prime passe avec un DPA. L'audio est supprimé après la fenêtre de partage (24h anon, 7d signé-in). Nous ne formons pas sur vos entrées.

Oui — Free.ai accorde l'utilisation commerciale des transcriptions. Vous avez besoin de droits sur l'audio que vous avez téléchargé (votre propre enregistrement, matériel sous licence, ou contenu avec consentement).

Le facteur temps réel est d'environ 0,05–0,2× — un podcast de 60 minutes transcrit en 3–12 minutes. Les modèles Premium finissent souvent plus vite. Utilisez le bouton de queue pour fermer l'onglet.

Love this tool? Share it!

Noter cette page