Transcription de podcast

Utilisation commerciale OK 380+ modèles Pas de filigrane Pas besoin d'inscription
Modèle:
+ GPT-5, Claude, Gemini
Télécharger un épisode de podcast et obtenir une transcription propre, marquée par haut-parleur avec des marqueurs de chapitre détectés automatiquement à partir de lacunes de silence. Fichiers de forme longue jusqu'à 2 Go, 99 langues, Whisper-large-v3. Exporter comme SRT/VTT pour votre podcast vidéo, TXT simple pour les notes de présentation, ou JSON pour l'édition dans les workflows de style Descript.

Faites glisser et déposez votre épisode de podcast, ou cliquez pour parcourir

MP3, WAV, M4A, OGG, MP4 — épisodes longs jusqu'à 2 Go

Les marqueurs de chapitre sont calculés côté client des lacunes de segment et attachés à la transcription. Collez-les dans YouTube ou Spotify descriptions as-is.
Estimation des jetons pour ce clip
Transcription par baladodiffusion
Chapitres détectés automatiquement

Traçant votre podcast...

Les épisodes longs prennent plusieurs minutes. Vous pouvez fermer cet onglet si l'email-quand-none est coché.

Construit pour podcasters + éditeurs d'expositions

Afficher les notes en une seule pâte

Télécharger l'épisode, télécharger les étiquettes TXT. Haut-parleur en ligne, chapitre horodatage prêt pour votre description Spotify/YouTube, blog écrit en 10 minutes au lieu de 4 heures.

Sous-titres de podcast vidéo

Exportez SRT ou WebVTT avec les étiquettes de haut-parleurs. Déposer directement dans Premiere, Final Cut ou DaVinci Resolve — ou télécharger à côté de votre vidéo YouTube pour les légendes propres.

Révision d'épisodes par texte

JSON export vous donne chaque mot avec des horodatages start/end. Pipe dans le Descript, Reaper, ou un workflow personnalisé — éditer en surbrillant le texte au lieu de frotter.

Comment fonctionne la transcription podcast

  1. Faites glisser votre épisode sur la zone de dépôt — MP3, WAV, M4A, MP4, jusqu'à 2 Go.
  2. Laissez les étiquettes des haut-parleurs et les marqueurs de chapitre allumés (ils sont les valeurs par défaut). Choisissez votre format de sortie.
  3. Nous vérifions la durée + le prix avant de dépenser des jetons. Cliquez sur Transcrire.
  4. Télécharger le haut-parleur TXT, SRT, VTT ou JSON. Les marqueurs de chapitre sont livrés à côté, prêts à coller.

Transcription des podcasts Free.ai vs Descript, Riverside, Otter

Fonctionnalité Free.ai Descript Riverside Otter.ai
PrixPay-per-use ($0.003/min)$15-30/mo$19/mo$16.99/mo
Taille maximale du fichier2 GB5 GBTied to record session500 MB (varies)
Diarisation des orateurs
Marqueurs de chapitre automatique (basé sur la silence)ManualPaid tier
Exportation de TTS/TTVPaid
Langues9922100+English-focused
API publiqueLimited
Les prix des concurrents reflètent les niveaux cotés en bourse en 2026. Consultez chaque fournisseur pour connaître les plans actuels.
Options avancées
Résultat
Les jetons sont bas. Obtenez plus de jetons
Vous voulez de meilleurs résultats? Modèles premium (GPT-5, Claude, Gemini) offrent une qualité supérieure. Afficher les plans

❤️ Love this tool? Share it!

Inscrivez-vous pour obtenir un lien de référence et gagner 25 000 jetons par ami.

Tu en veux plus? Inscrivez-vous gratuitement pour 30K jetons/jour + 10K bonus
Inscription gratuite

Traitement de votre demande...

Traçez gratuitement des podcasts en texte avec l'IA.

Comment utiliser Transcription de podcast

1
Saisissez votre entrée

Tapez du texte, téléchargez un fichier ou décrivez ce que vous voulez. Aucun compte n'est nécessaire.

2
Cliquez sur générer

Notre IA traite votre demande en quelques secondes à l'aide des meilleurs modèles open-source.

3
Télécharger et partager

Téléchargez, copiez ou partagez votre résultat. Gratuit pour un usage personnel et commercial.

Utilisez cet outil via l'API

Automatisez cet outil à partir de votre propre code. Endpoint REST compatible OpenAI, Auth-token auth, pas de SDK supplémentaire requis.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Transcription de podcast — FAQ

Transcription de podcast de podcast par défaut pour la diarisation des haut-parleurs et les marqueurs de chapitre (détection de l'écart de silence >2s), et prend en charge les fichiers de forme longue jusqu'à 2 Go. Les formats de sortie incluent SRT + VTT pour les clips vidéo de shownotes, TXT simple pour les messages de blog, et JSON structuré avec des horodatages par tour + étiquettes de haut-parleur pour l'édition dans les workflows de style Descript.

Jusqu'à 2 Go par fichier — environ un podcast audio de 14 heures à 128 kbps MP3. Les fichiers longs sont coupés côté serveur pour la résilience; vous obtenez une seule transcription fusionnée retour.

Oui. La diarisation des haut-parleurs est ON par défaut. Nous détectons 2-10 voix distinctes via ECAPA vocal embeddings, les labels Speaker 1 / 2 /... et appliquons les étiquettes à chaque segment. Vous pouvez les renommer dans la vue des résultats.

Silence s'écarte plus de 2 secondes — les podcasters se cassent naturellement entre les segments. Chaque chapitre reçoit un horodatage que vous pouvez coller directement dans vos notes avec un bloc "Chapitres:" pour YouTube + Spotify.

Nous facturons par utilisation à ~500 jetons/min sur Whisper (5$ = 200K jetons = ~400 minutes), pas d'abonnement, exportation simple vous pouvez coller n'importe où.

Riverside est un studio d'enregistrement qui transcrit vos propres sessions gratuitement dans leur application, mais seulement après l'enregistrement avec eux. Nous transcrivons n'importe quel MP3/WAV/MP4 quel que soit l'endroit où il a été enregistré.

Nous soutenons 99 langues à la même précision Whisper-large-v3 sans plafond mensuel — vous payez par minute transcrite.

Oui — choisissez SRT ou WebVTT comme format de sortie. Les étiquettes de haut-parleur sont incluses en ligne (SRT) ou sous les balises <v Speaker N> (VTT) que la plupart des joueurs modernes rendent correctement.

Whisper-large-v3 gère bien les lits de musique et la réverbération de la lumière (taux normal d'erreur de mot 3-7%). La musique très forte ou le chevauchement lourd dégrade la précision — considérez courir /musique/vocal-remover/ d'abord sur une copie, ou fractionner vos ouvertures froides.

Whisper gère la plupart des noms courants, mais jargon très spécifique de marque peut avoir besoin d'un passe post-édition. Un épisode ~30 minutes a généralement 5-10 corrections de marque / nom à appliquer manuellement.

Téléchargez-les une à la fois ici, ou utilisez notre fonction /batch/ une fois connecté pour faire la queue jusqu'à une saison. L'API à /api/ accepte également POST /v1/stt/ pour le batch programmatique.

Non. Les fichiers téléchargés sont supprimés après la transcription complète. Votre transcription se trouve dans votre /compte/ historique à télécharger s'ils sont signés; les utilisateurs anonymes obtiennent un lien de partage de 24 heures.

Inscrivez-vous gratuitement pour 30 000 jetons

Créer un compte gratuit

Aucune carte de crédit requise

Comment évalueriez-vous cet outil?

Love this tool? Share it!