Rede zum Text

Kommerzielle Nutzung OK 380+ Modelle Kein Wasserzeichen Keine Anmeldung erforderlich
Modell:
+ GPT-5, Claude, Gemini
Laden Sie eine Audio- oder Videodatei hoch – oder fügen Sie eine URL ein – und erhalten Sie ein sauberes Transkript mit Zeitstempeln. Lautsprecherdiarisierung, SRT/VTT-Untertitelexport, 100+ Sprachen mit automatischer Erkennung. Kostenskalen exakt mit Cliplänge. Powered by Whisper large-v3 and Parakeet (self-hosted), plus Premium Wizper und ElevenLabs STT.

Drag & Drop Audio/Video, oder klicken Sie zum Durchsuchen

MP3, WAV, MP4, WebM, M4A — bis zu 500MB

Whisper large-v3 — 99 Sprachen, Best-in-Class-Genauigkeit.
Token-Schätzung für diesen Clip
Kostenlos registrieren — 10K tokens Token kaufen
YouTube, Instagram, TikTok, Spotify und 1.300+ Plattformen
URL-Transkriptionskosten basieren auf der tatsächlichen Dauer des Clips — wir zitieren nach dem Download. Erwarten Sie ~500 Token/Minute auf Whisper.
Aufzeichnung: 0:00

Echtzeit-Transkription mit Ihrem Mikrofon

Text

Transkribieren Sie Ihre Audio...

Dies kann einen Moment für längere Dateien dauern.

Was Menschen transkribieren mit Free.ai

Interviews + podcasts

Diarization beschriftet jeden Lautsprecher. Exportieren Sie SRT direkt in Ihren Video-Editor, oder Klartext für einen Artikel schreiben.

Auto captions + subtitles

Laden Sie einen YouTube-Upload oder TikTok hoch, wählen Sie SRT oder WebVTT und brennen Sie die Untertitel mit /video/subtitle/.

Sitzungsnotizen

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Transcribe eine 90-minütige Vorlesung, dann verwenden /study/flashcards/ oder /write/summarize/, um es in Studienmaterial zu verwandeln.

Fremdsprachen-Audio

Whisper erkennt automatisch 99 Sprachen. Transcribe im Original, dann senden Sie den Text durch /translate/, um Sprachen zu springen.

Legal + medical

Zeitstempel, Lautsprecheretiketten, JSON-Export mit jedem Wort Anfang/Ende Zeit — genaue Gericht-Reporter oder klinisch-Noten-Vorbereitung.

Wie Free.ai Transkription verglichen wird

Was du bekommst Free.ai Otter.ai Descript Rev.com
Tägliche kostenlose Nutzung5K+ tokens/day300 minutes/mo1 hr/month
MotorWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Sprachen99English-focused2230+
Wahl des Sprechers
Ausfuhr von SRT/VTTPaidPaid
Öffentliche APILimitedLimited
Live-Streaming STT (frei) Paid
Anmeldung erforderlichNeinYesYesYes
Die Wettbewerbszahlen spiegeln die öffentlich gelisteten freien Stufen ab 2026 wider. Prüfen Sie jeden Anbieter auf aktuelle Pläne.
Erweiterte Optionen
Ergebnis
Die Tokens sind knapp. Get More Tokens
Want better results? Premium-Modelle (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

Sign up um einen Verweis zu erhalten und 25.000 Token pro Freund zu verdienen.

Willst du mehr? Sign up free for 10,000 tokens
Kostenlos anmelden

Ihre Anfrage bearbeiten...

Transcribe Audio und Video zu Text mit AI. Hochladen von Dateien, Einfügen von URLs, oder verwenden Sie Ihr Mikrofon.

Verwendung Rede zum Text

1
Geben Sie Ihre Eingabe ein

Geben Sie Text ein, laden Sie eine Datei hoch oder beschreiben Sie, was Sie wollen.

2
Klicken Sie auf Generieren

Unsere KI verarbeitet Ihre Anfrage in Sekundenschnelle mit den besten Open-Source-Modellen.

3
Herunterladen & Teilen

Downloaden, kopieren oder teilen Sie Ihr Ergebnis. Kostenlos für den persönlichen und kommerziellen Gebrauch.

Verwenden Sie dieses Tool über API

Automatisieren Sie dieses Tool aus Ihrem eigenen Code. OpenAI-kompatible REST-Endpunkt, Bearer-Token-Auth, kein zusätzliches SDK erforderlich. Tokenkosten entsprechen der Web-Schnittstelle.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Rede zum Text — FAQ

Kostenlose KI-Transkription konvertiert Audio- und Videodateien in Text mit Whisper, dem hochmodernen Spracherkennungsmodell. Laden Sie eine Datei hoch und erhalten Sie präzise Texte in Sekundenschnelle.

Ja! Transkription kostet ~4 Token pro Sekunde Audio. Eine 5-Minuten-Datei kostet ~1.200 Token. Sie erhalten 10.000 / Tag kostenlos.

Whisper unterstützt 99+ Sprachen mit automatischer Spracherkennung. Laden Sie einfach Ihr Audio hoch und es erkennt die Sprache automatisch.

MP3, WAV, M4A, FLAC, OGG, MP4, WEBM, und die meisten gängigen Audio-/Video-Formate.

Whisper ist eines der genauesten verfügbaren STT-Modelle, vergleichbar mit kommerziellen Dienstleistungen. Genauigkeit variiert nach Audioqualität und Sprache.

Ja! Wählen Sie zwischen Klartext oder Zeitstempelausgabe (SRT-Untertitelformat).

Bis zu 25MB für anonyme Benutzer, 100MB für angemeldete Benutzer. Für größere Dateien, teilen Sie sie zuerst.

Nein! Transcribe Dateien sofort ohne Konto.

Nicht direkt, aber Sie können das Audio von einem YouTube-Video herunterladen und hier hochladen.

Unsere Transkription verwendet das gleiche Whisper-Modell und ist völlig kostenlos. Otter Gebühren $8-24 / Monat, Rev Gebühren pro Minute.

Der transkribierte Text ist vollständig editierbar – Kopieren, Modifizieren und Herunterladen nach Bedarf.

Ja! Greifen Sie auf unsere Transkriptions-API bei /api/ für die Batch-Verarbeitung zu.

Melde dich kostenlos an für 10.000 Token

Kostenloses Konto erstellen

Keine Kreditkarte erforderlich

Wie würden Sie dieses Tool bewerten?

Love this tool? Share it!