Speech to Text

Kommersiell användning OK 380+ modeller Inget vattenmärke Ingen registrering behövs
Förlaga:
+ GPT-5, Claude, Gemini
Ladda upp en ljud- eller videofil — eller klistra in en URL — och få en ren utskrift med tidsstämpel. Högtalare diarization, SRT / VTT textning export, 100+ språk med automatisk upptäckt. Kostnadsskalor exakt med klipplängd. Drivs av Whisper stor-v3 och Parakeet (självvärdig), plus premium Wizper och ElevenLabs STT.

Dra och släpp ljud/video, eller klicka för att bläddra

MP3, WAV, MP4, WebM, M4A – upp till 500MB

Whisper large-v3 – 99 språk, bäst i klassen noggrannhet.
Token uppskattning för detta klipp
YouTube, Instagram, TikTok, Spotify och 1.300+ plattformar
URL transkription kostnad är baserad på klippets faktiska varaktighet — vi citerar efter nedladdning. Förvänta ~500 polletter / minut på Whisper.
Inspelning: 0:00

Realtid transkription med hjälp av din mikrofon

Transkription

Skriva in ditt ljud...

Detta kan ta en stund för längre filer.

Vad människor transkriberar med Free.ai

Interviews + podcasts

Diarisering märker varje högtalare. Exportera SRT direkt till din videoredigerare, eller vanlig text för en artikelskrivning.

Auto captions + subtitles

Ladda upp en YouTube-uppladdning eller TikTok, välj SRT eller WebVTT och bränn undertexter på med /video/subtitle/. One-stop bildtext arbetsflöde.

Möteskommentarer

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Skriv en 90 minuter lång föreläsning, använd sedan /study/flashcards/ eller /write/summarize/ för att göra den till studiematerial.

Ljud på främmande språk

Whisper automatiskt detekterar 99 språk. Texta i originalet, skicka sedan texten via /translate/ för att hoppa språk.

Legal + medical

Tidstämpelr, högtalaretiketter, JSON exporterar med varje ords start/sluttid – korrekt rättsreporterare eller klinisk notprep.

Hur Free.ai transkription jämför

Vad du får Free.ai Otter.ai Descript Rev.com
Gratis daglig användning5K+ tokens/day300 minutes/mo1 hr/month
MotorWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Språk99English-focused2230+
Högtalardiarisering
SRT/VTT-exportPaidPaid
Offentligt APILimitedLimited
Live streaming STT (fri) Paid
Registrering krävsEj tillämpligtYesYesYes
Konkurrenter siffror återspeglar offentligt noterade fria nivåer från och med 2026. Kontrollera varje leverantör för aktuella planer.
Avancerade alternativ
Resultat
Tokens börjar ta slut. Get More Tokens
Want better results? Premiemodeller (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

< a href="/signup/" style="color:#16A34A">Registrera dig för att få en referenslänk och tjäna 25 000 polletter per vän.

Vill du ha mer? Registrera dig gratis för 5K tokens/dag + 10K bonus
Registrera dig gratis

Bearbetning av din begäran...

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Hur du använder Speech to Text

1
Ange din inmatning

Skriv text, ladda upp en fil eller beskriv vad du vill. Inget konto behövs.

2
Klicka på generera

Vår AI behandlar din begäran på några sekunder med hjälp av de bästa open-source modellerna.

3
Ladda ner & resurs

Ladda ner, kopiera eller dela ditt resultat. Gratis för personligt och kommersiellt bruk.

Använd det här verktyget via API

Automatisera detta verktyg från din egen kod. OpenAI-kompatibel REST endpoint, Bearer-token auth, ingen extra SDK krävs. Token kostnader matchar webbgränssnittet.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai erbjuder Whisper-drivet tal till text med utmärkt exakthet, 99 språk, undertext export, högtalare upptäckt, och levande mikrofon fånga — helt gratis.

Ladda upp en ljud-eller videofil (MP3, WAV, MP4, M4A), klicka på transkribera, och få korrekt tal till text på några sekunder. Eller spela in live från din mikrofon.

Ja. Klistra in alla YouTube-webbadresser i URL-fliken och talet till textverktyget extraherar ljudet och konverterar det. Fungerar med Instagram, TikTok, Spotify och 1.300+ plattformar.

Ja. Automatisk upptäckt eller välj mellan 99 språk. Vårt tal till text hanterar accenter, bakgrundsljud och blandad språkljud väl.

Ja. Välj flera ljudfiler på en gång - varje skickas via tal till text med framsteg spårning och resultaten kan laddas ner separat eller kombineras.

Ja. Talet till text API på /api/ är OpenAI-kompatibel. Ladda upp ljudprogrammatiskt och ta emot JSON med utskrift, språk och tidsstämpel.

Ja. Växla högtalardetektion innan du laddar upp och talet till textutmatningen är märkt per högtalare (talare 1, talare 2...). Lägger till 50% till tokenkostnad.

Tal till text accepterar filer upp till 500 MB per uppladdning. För flertimmarsinnehåll, dela ljudet i bitar först.

Mycket exakt för klart ljud — typiskt 95% + ordnoggrannhet på engelska med vår Whisper stor-v3 bakgrundsljud. Kvalitet beror på ljud klarhet, accent och bakgrundsljud.

Ja. Avskriften är fullt redigerbar på plats. Rätta fel, omformulera och kopiera/ladda ner som TXT, SRT eller VTT.

Ja. Ljud behandlas på våra egna GPU:er och raderas efter tal till text fullbordar. Ingenting lagras långsiktigt, delas eller används för utbildning.

Ja. Ladda upp en ljud- eller videofil i /chat/ och be AI att transkribera den — kombinera tal till text med uppföljande frågor och sammanfattning i ett arbetsflöde.

Registrera dig gratis för 10 000 polletter

Skapa gratis konto

Inget kreditkort krävs

Hur skulle du värdera det här verktyget?

Love this tool? Share it!