STT Online

Kommersiell användning OK 380+ modeller Inget vattenmärke Ingen registrering behövs
Förlaga:
+ GPT-5, Claude, Gemini
Ladda upp en ljud- eller videofil — eller klistra in en URL — och få en ren utskrift med tidsstämpel. Högtalare diarization, SRT / VTT textning export, 100+ språk med automatisk upptäckt. Kostnadsskalor exakt med klipplängd. Drivs av Whisper stor-v3 och Parakeet (självvärdig), plus premium Wizper och ElevenLabs STT.

Dra och släpp ljud/video, eller klicka för att bläddra

MP3, WAV, MP4, WebM, M4A – upp till 500MB

Whisper large-v3 – 99 språk, bäst i klassen noggrannhet.
Token uppskattning för detta klipp
YouTube, Instagram, TikTok, Spotify och 1.300+ plattformar
URL transkription kostnad är baserad på klippets faktiska varaktighet — vi citerar efter nedladdning. Förvänta ~500 polletter / minut på Whisper.
Inspelning: 0:00

Realtid transkription med hjälp av din mikrofon

Transkription

Skriva in ditt ljud...

Detta kan ta en stund för längre filer.

Vad människor transkriberar med Free.ai

Interviews + podcasts

Diarisering märker varje högtalare. Exportera SRT direkt till din videoredigerare, eller vanlig text för en artikelskrivning.

Auto captions + subtitles

Ladda upp en YouTube-uppladdning eller TikTok, välj SRT eller WebVTT och bränn undertexter på med /video/subtitle/. One-stop bildtext arbetsflöde.

Möteskommentarer

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Skriv en 90 minuter lång föreläsning, använd sedan /study/flashcards/ eller /write/summarize/ för att göra den till studiematerial.

Ljud på främmande språk

Whisper automatiskt detekterar 99 språk. Texta i originalet, skicka sedan texten via /translate/ för att hoppa språk.

Legal + medical

Tidstämpelr, högtalaretiketter, JSON exporterar med varje ords start/sluttid – korrekt rättsreporterare eller klinisk notprep.

Hur Free.ai transkription jämför

Vad du får Free.ai Otter.ai Descript Rev.com
Gratis daglig användning5K+ tokens/day300 minutes/mo1 hr/month
MotorWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Språk99English-focused2230+
Högtalardiarisering
SRT/VTT-exportPaidPaid
Offentligt APILimitedLimited
Live streaming STT (fri) Paid
Registrering krävsEj tillämpligtYesYesYes
Konkurrenter siffror återspeglar offentligt noterade fria nivåer från och med 2026. Kontrollera varje leverantör för aktuella planer.
Avancerade alternativ
Resultat
Tokens börjar ta slut. Get More Tokens
Want better results? Premiemodeller (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

< a href="/signup/" style="color:#16A34A">Registrera dig för att få en referenslänk och tjäna 25 000 polletter per vän.

Vill du ha mer? Registrera dig gratis för 5K tokens/dag + 10K bonus
Registrera dig gratis

Bearbetning av din begäran...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

Hur du använder STT Online

1
Ange din inmatning

Skriv text, ladda upp en fil eller beskriv vad du vill. Inget konto behövs.

2
Klicka på generera

Vår AI behandlar din begäran på några sekunder med hjälp av de bästa open-source modellerna.

3
Ladda ner & resurs

Ladda ner, kopiera eller dela ditt resultat. Gratis för personligt och kommersiellt bruk.

Använd det här verktyget via API

Automatisera detta verktyg från din egen kod. OpenAI-kompatibel REST endpoint, Bearer-token auth, ingen extra SDK krävs. Token kostnader matchar webbgränssnittet.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT (Speech-to-Text) konverterar talat ljud till skriven text med AI. Free.ai körningar Whisper large-v3 – den mest korrekta öppen källkod taligenkänning modell – på våra egna GPU:er.

Ja. Ladda upp ljudfiler upp till 500MB. STT kostar ~500 tokens per minut ljud. Du får 2.500–5,000 gratis polletter per dag — flera filer per dag gratis.

STT accepterar MP3, WAV, MP4, WebM, M4A, OGG, FLAC – praktiskt taget alla ljud- eller videoformat – upp till 500MB per uppladdning.

Ja. STT resultat exportera som TXT, SRT (undertexter), eller VTT (webbtexter). Perfekt för YouTube textning och videotextning.

Vår STT använder Whisper large-v3 — typiskt 95% + ordnoggrannhet för tydlig engelska och utmärkt kvalitet på 99 språk. Bakgrundsljud och tunga accenter lägre noggrannhet.

Ja. Aktivera högtalardiarisering i STT-alternativen och AI-etiketterna segment som högtalare 1, högtalare 2, etc. kostar 50% fler tokens.

Ja. STT API är OpenAI-kompatibel — POST-ljud till /v1/audio/ranscriptions och ta emot JSON. Fungerar från alla språk som kan skicka HTTP-förfrågningar.

Ja. Fliken Live fångar din mikrofon och strömmar den genom STT i realtid med minimal latens.

Ja. Klistra in ett YouTube, TikTok, Instagram, Spotify, eller Vimeo URL och STT extraherar ljudet och transkriberar det. 1.300+ plattformar stöds.

Snabbt — ett 1-minuters klipp avslutas på några sekunder, en 30-minuters inspelning på ungefär en minut, en 1-timmars fil på ungefär 2 minuter. Whisper körs på vår GPU kluster.

Ja. Ljud behandlas på våra egna GPU:er och raderas efter STT färdig. Det lagras aldrig långsiktigt, aldrig delas, och aldrig används för modellutbildning.

Whisper large-v3 – den största, mest exakta Whisper modellen (1.55B parametrar). Vi själv värd det på A100 GPUs för hastighet och integritet.

Registrera dig gratis för 10 000 polletter

Skapa gratis konto

Inget kreditkort krävs

Hur skulle du värdera det här verktyget?

Love this tool? Share it!