STT Online

Utilisation commerciale OK 380+ modèles Pas de filigrane Pas besoin d'inscription
Modèle:
+ GPT-5, Claude, Gemini
Téléchargez un fichier audio ou vidéo — ou collez une URL — et obtenez une transcription propre avec des horodatages. Diarisation des haut-parleurs, exportation de sous-titres SRT/VTT, 100+ langues avec détection automatique. Échelle des coûts exactement avec la longueur du clip. Powered by Whisper grand-v3 and Parakeet (auto-hosted), plus haut de gamme Wizper et ElevenLabs STT.

Faites glisser et déposez audio/vidéo, ou cliquez pour parcourir

MP3, WAV, MP4, WebM, M4A — jusqu'à 500 Mo

Whisper grand-v3 — 99 langues, la meilleure précision en classe.
Estimation des jetons pour ce clip
YouTube, Instagram, TikTok, Spotify et plus de 1 300 plateformes
Le coût de transcription de l'URL est basé sur la durée réelle du clip — nous citons après téléchargement. Attendez ~500 jetons/minute sur Whisper.
Enregistrement : 0:00

Transcription en temps réel à l'aide de votre microphone

Transcription

Tracant votre son...

Cela peut prendre un moment pour des fichiers plus longs.

Ce que les gens transcrivent avec Free.ai

Interviews + podcasts

La diarisation étiquette chaque haut-parleur. Exportez SRT directement dans votre éditeur vidéo, ou texte simple pour un article écrit.

Auto captions + subtitles

Téléchargez un téléchargement YouTube ou TikTok, choisissez SRT ou WebVTT, et gravez les sous-titres avec /video/subtitle/.

Notes de séance

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Tracscrivez une conférence de 90 minutes, puis utilisez /study/flashcards/ ou /write/summarize/ pour la transformer en matériel d'étude.

Audio en langue étrangère

Whisper détecte automatiquement 99 langues. Traînez dans l'original, puis envoyez le texte à travers /translate/ pour sauter les langues.

Legal + medical

Timestamps, étiquettes de haut-parleurs, JSON exportent avec l'heure de début/de fin de chaque mot — un rédacteur précis ou une préparation de notes cliniques.

Comparaison de la transcription de Free.ai

Qu'est-ce que tu as Free.ai Otter.ai Descript Rev.com
Utilisation quotidienne gratuite5K+ tokens/day300 minutes/mo1 hr/month
MoteurWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Langues99English-focused2230+
Diarisation des orateurs
Exportation de TTS/TTVPaidPaid
API publiqueLimitedLimited
Diffusion en direct STT (gratuit) Paid
Inscription requiseNuméroYesYesYes
Les chiffres des concurrents reflètent les niveaux libres cotés en bourse à partir de 2026. Vérifiez chaque fournisseur pour connaître les plans actuels.
Options avancées
Résultat
Les jetons sont bas. Get More Tokens
Want better results? Modèles premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

Inscrivez-vous pour obtenir un lien de référence et gagner 25 000 jetons par ami.

Tu en veux plus? Inscrivez-vous gratuitement pour 5K jetons/jour + 10K bonus
Inscription gratuite

Traitement de votre demande...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

Comment utiliser STT Online

1
Saisissez votre entrée

Tapez du texte, téléchargez un fichier ou décrivez ce que vous voulez. Aucun compte n'est nécessaire.

2
Cliquez sur générer

Notre AI traite votre demande en quelques secondes à l'aide des meilleurs modèles open-source.

3
Télécharger et partager

Téléchargez, copiez ou partagez votre résultat. Gratuit pour un usage personnel et commercial.

Utilisez cet outil via l'API

Automatisez cet outil à partir de votre propre code. Endpoint REST compatible OpenAI, Auth-token auth, pas de SDK supplémentaire requis.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT (Speech-to-Text) convertit l'audio parlé en texte écrit en utilisant AI. Free.ai lance Whisper large-v3 — le modèle de reconnaissance vocale open-source le plus précis — sur nos propres GPU.

Oui. Télécharger des fichiers audio jusqu'à 500 Mo. STT coûte ~500 jetons par minute d'audio. Vous obtenez 2 500 à 5 000 jetons gratuits par jour — plusieurs fichiers par jour gratuitement.

STT accepte MP3, WAV, MP4, WebM, M4A, OGG, FLAC — pratiquement n'importe quel format audio ou vidéo — jusqu'à 500 Mo par téléchargement.

Oui. Les résultats STT exportent sous forme de sous-titres TXT, SRT (sous-titres) ou VTT (sous-titres Web).

Notre STT utilise Whisper large-v3 — généralement 95%+ précision de mots pour un anglais clair et une excellente qualité en 99 langues.

Oui. Activer la diarisation des haut-parleurs dans les options STT et les segments AI en tant que haut-parleur 1, haut-parleur 2, etc. coûte 50% de jetons de plus.

Oui. L'API STT est compatible OpenAI — POST audio vers /v1/audio/transcriptions et reçoit JSON. Fonctionne depuis n'importe quelle langue qui peut envoyer des requêtes HTTP.

Oui. L'onglet Live capture votre microphone et le diffuse à travers STT en temps réel avec une latence minimale.

Oui. Coller un YouTube, TikTok, Instagram, Spotify, ou Vimeo URL et STT extrait l'audio et le transcrit. 1.300+ plates-formes prises en charge.

Rapide — un clip d'une minute se termine en quelques secondes, un enregistrement de 30 minutes en une minute, un fichier d'une heure en environ 2 minutes. Whisper fonctionne sur notre grappe GPU.

Oui. L'audio est traité sur nos propres GPUs et supprimé après STT complète. Il n'est jamais stocké à long terme, jamais partagé et jamais utilisé pour la formation de modèle.

Whisper grand-v3 — le plus grand et le plus précis modèle Whisper (1,55B paramètres). Nous l'hébergons sur A100 GPU pour la vitesse et l'intimité.

Inscrivez-vous gratuitement pour 10 000 jetons

Créer un compte gratuit

Aucune carte de crédit requise

Comment évalueriez-vous cet outil?

Love this tool? Share it!