Discours au texte Transcription en direct Transcription YouTube Transcription de la réunion Zoom Transcription Audio au texte Vidéo dans le texte Transcription des appels téléphoniques Plus →

Transcription de podcast

Utilisation commerciale OK 380+ modèles Pas de filigrane Pas besoin d'inscription

Télécharger un épisode de podcast et obtenir une transcription propre, marquée par haut-parleur avec des marqueurs de chapitre détectés automatiquement à partir de lacunes de silence. Fichiers de forme longue jusqu'à 2 Go, 99 langues, Whisper-large-v3. Exporter comme SRT/VTT pour votre podcast vidéo, TXT simple pour les notes de présentation, ou JSON pour l'édition dans les workflows de style Descript.

Faites glisser et déposez votre épisode de podcast, ou cliquez pour parcourir

MP3, WAV, M4A, OGG, MP4 — épisodes longs jusqu'à 2 Go

Langue

Moteur

Format de sortie

Haut-parleurs d'étiquettes (hôte / invité) — label qui parle quand (+50% jetons)

Nombre de haut-parleurs:

Marqueurs de chapitre automatique — Lacunes dans le silence >2s

Les marqueurs de chapitre sont calculés côté client des lacunes de segment et attachés à la transcription. Collez-les dans YouTube ou Spotify descriptions as-is.

Construit pour podcasters + éditeurs d'expositions

Afficher les notes en une seule pâte

Télécharger l'épisode, télécharger les étiquettes TXT. Haut-parleur en ligne, chapitre horodatage prêt pour votre description Spotify/YouTube, blog écrit en 10 minutes au lieu de 4 heures.

Sous-titres de podcast vidéo

Exportez SRT ou WebVTT avec les étiquettes de haut-parleurs. Déposer directement dans Premiere, Final Cut ou DaVinci Resolve — ou télécharger à côté de votre vidéo YouTube pour les légendes propres.

Révision d'épisodes par texte

JSON export vous donne chaque mot avec des horodatages start/end. Pipe dans le Descript, Reaper, ou un workflow personnalisé — éditer en surbrillant le texte au lieu de frotter.

Comment fonctionne la transcription podcast

Faites glisser votre épisode sur la zone de dépôt — MP3, WAV, M4A, MP4, jusqu'à 2 Go.
Laissez les étiquettes des haut-parleurs et les marqueurs de chapitre allumés (ils sont les valeurs par défaut). Choisissez votre format de sortie.
Nous vérifions la durée + le prix avant de dépenser des jetons. Cliquez sur Transcrire.
Télécharger le haut-parleur TXT, SRT, VTT ou JSON. Les marqueurs de chapitre sont livrés à côté, prêts à coller.

Transcription des podcasts Free.ai vs Descript, Riverside, Otter

Fonctionnalité	Free.ai	Descript	Riverside	Otter.ai
Prix	Pay-per-use ($0.003/min)	$15-30/mo	$19/mo	$16.99/mo
Taille maximale du fichier	2 GB	5 GB	Tied to record session	500 MB (varies)
Diarisation des orateurs
Marqueurs de chapitre automatique	(basé sur la silence)	Manual	—	Paid tier
Exportation de TTS/TTV				Paid
Langues	99	22	100+	English-focused
API publique		—	—	Limited

Les prix des concurrents reflètent les niveaux cotés en bourse en 2026. Consultez chaque fournisseur pour connaître les plans actuels.

Traçez gratuitement des podcasts en texte avec l'IA.

Comment utiliser Transcription de podcast

Saisissez votre entrée

Tapez du texte, téléchargez un fichier ou décrivez ce que vous voulez. Aucun compte n'est nécessaire.

Cliquez sur générer

Notre IA traite votre demande en quelques secondes à l'aide des meilleurs modèles open-source.

Télécharger et partager

Téléchargez, copiez ou partagez votre résultat. Gratuit pour un usage personnel et commercial.

Utilisez cet outil via l'API

Automatisez cet outil à partir de votre propre code. Endpoint REST compatible OpenAI, Auth-token auth, pas de SDK supplémentaire requis.

Documentation de l'API Obtenir la clé API

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Outils d'IA gratuits connexes

Discours au texte

Transcription en direct

Transcription YouTube

Transcription de la réunion

Zoom Transcription

Audio au texte

Vidéo dans le texte

Transcription des appels téléphoniques

Transcription de podcast — FAQ

Transcription de podcast de podcast par défaut pour la diarisation des haut-parleurs et les marqueurs de chapitre (détection de l'écart de silence >2s), et prend en charge les fichiers de forme longue jusqu'à 2 Go. Les formats de sortie incluent SRT + VTT pour les clips vidéo de shownotes, TXT simple pour les messages de blog, et JSON structuré avec des horodatages par tour + étiquettes de haut-parleur pour l'édition dans les workflows de style Descript.

Jusqu'à 2 Go par fichier — environ un podcast audio de 14 heures à 128 kbps MP3. Les fichiers longs sont coupés côté serveur pour la résilience; vous obtenez une seule transcription fusionnée retour.

Oui. La diarisation des haut-parleurs est ON par défaut. Nous détectons 2-10 voix distinctes via ECAPA vocal embeddings, les labels Speaker 1 / 2 /... et appliquons les étiquettes à chaque segment. Vous pouvez les renommer dans la vue des résultats.

Silence s'écarte plus de 2 secondes — les podcasters se cassent naturellement entre les segments. Chaque chapitre reçoit un horodatage que vous pouvez coller directement dans vos notes avec un bloc "Chapitres:" pour YouTube + Spotify.

Nous facturons par utilisation à ~500 jetons/min sur Whisper (5$ = 200K jetons = ~400 minutes), pas d'abonnement, exportation simple vous pouvez coller n'importe où.

Riverside est un studio d'enregistrement qui transcrit vos propres sessions gratuitement dans leur application, mais seulement après l'enregistrement avec eux. Nous transcrivons n'importe quel MP3/WAV/MP4 quel que soit l'endroit où il a été enregistré.

Nous soutenons 99 langues à la même précision Whisper-large-v3 sans plafond mensuel — vous payez par minute transcrite.

Oui — choisissez SRT ou WebVTT comme format de sortie. Les étiquettes de haut-parleur sont incluses en ligne (SRT) ou sous les balises <v Speaker N> (VTT) que la plupart des joueurs modernes rendent correctement.

Whisper-large-v3 gère bien les lits de musique et la réverbération de la lumière (taux normal d'erreur de mot 3-7%). La musique très forte ou le chevauchement lourd dégrade la précision — considérez courir /musique/vocal-remover/ d'abord sur une copie, ou fractionner vos ouvertures froides.

Whisper gère la plupart des noms courants, mais jargon très spécifique de marque peut avoir besoin d'un passe post-édition. Un épisode ~30 minutes a généralement 5-10 corrections de marque / nom à appliquer manuellement.

Téléchargez-les une à la fois ici, ou utilisez notre fonction /batch/ une fois connecté pour faire la queue jusqu'à une saison. L'API à /api/ accepte également POST /v1/stt/ pour le batch programmatique.

Non. Les fichiers téléchargés sont supprimés après la transcription complète. Votre transcription se trouve dans votre /compte/ historique à télécharger s'ils sont signés; les utilisateurs anonymes obtiennent un lien de partage de 24 heures.

Inscrivez-vous gratuitement pour 30 000 jetons

Créer un compte gratuit

Aucune carte de crédit requise

Comment évalueriez-vous cet outil?

Transcription de podcast

Construit pour podcasters + éditeurs d'expositions

Afficher les notes en une seule pâte

Sous-titres de podcast vidéo

Révision d'épisodes par texte

Comment fonctionne la transcription podcast

Transcription des podcasts Free.ai vs Descript, Riverside, Otter

Résultat

Comment utiliser Transcription de podcast

Saisissez votre entrée

Cliquez sur générer

Télécharger et partager

Utilisez cet outil via l'API

Outils d'IA gratuits connexes

Transcription de podcast — FAQ

En quoi la transcription du podcast diffère-t-elle de Transcription de podcast générique?

Quel est le podcast le plus long que vous pouvez transcrire?

Est-ce que vous étiquettez automatiquement les haut-parleurs?

Quels sont les marqueurs de chapitre basés sur?

Comment cela se compare-t-il au Descript?

Comment cela se compare-t-il à Riverside?

Comment cela se compare-t-il à Otter.ai?

Puis-je obtenir des sous-titres SRT pour mon podcast vidéo?

À quelle précision dois-je m'attendre sur les podcasts avec des lits de musique?

Est-ce qu'il reconnaît les termes de marque et les noms d'invités?

Puis-je traiter plusieurs épisodes à la fois?

Mon audio sera-t-il stocké après la transcription?

Obtenez 10 000 jetons gratuits

Attendez — Obtenez 10 000 jetons gratuits!

Tu en veux plus?