Fri engelska Transkription
Översätt engelska ljud och video till text med AI. Snabb, korrekt och gratis.
Hur den fungerar
- Gå till Free.ai transkriberare
- Ladda upp din engelska ljud- eller videofil
- Vår AI detekterar automatiskt engelska och transkriberar det
- Ladda ner din utskrift som text eller SRT-text
engelska Transkriptionsfunktioner
- ✓Drivs av snabbare whisper (MIT licensierad)
- ✓Automatisk engelska språkdetektering
- ✓Stöder MP3, WAV, MP4, M4A, FLAC, och mer
- ✓Tidstämpel och undertextexport (SRT)
- ✓Inga filstorleksgränser för betalda planer
- ✓Privat och säker – filer raderas efter behandling
Språkdetaljer
| Språk | engelska |
| ISO-kod | en |
| Förlaga till AI | Snabbare viskningar |
| Pris | Avgiftsfri |
Fler språk
Visa alla språkVanliga frågor
Whisper stor-v3-turbo landar i sin högsta noggrannhet nivå på engelska — under 7% ord felfrekvens på standard riktmärken. I praktiken som innebär ren studio ljud kommer tillbaka nära perfekt, och konversationsljud är användbart med minimal rensning.(Tier A, under 7% word error rate på referensuppsättningar — vi publicerar ärliga WER nivåer snarare än marknadsföringskrav.)
Ja — engelska transkription drar från din dagliga gratis token pool först. Ljud kostar ca 50 polletter per minut, så den anonyma dagliga poolen täcker några timmar av ljud per dag. Signed-in konton får en större pool plus 10.000 signup tokens. Förr i tiden köper $ 1 750.000 tokens (~250 timmar ljud).
Engelska transkription omfattar USA, Storbritannien, Australien, indiska och andra stora accenter i en modell. Whisper utbildades på alla av dem och transkriptet kommer ut i standard engelska stavning oavsett talarens accent.
MP3, WAV, M4A, FLAC, OGG, OPUS och WEBM accepteras direkt. För video (MP4, MOV, MKV) extraherar vi ljudspår server-sidan innan du skickar den till Whisper — du behöver inte konvertera något själv. Samma rörledning oavsett källspråk, inklusive engelska.
Anonyma uppladdningar cap på ungefär 500 MB per fil. Inloggade konton går upp till 2 GB. Varaktighet är inte en hård gräns — långa filer skärs automatiskt (30-sekunders fönster med överlappning) och sys tillbaka till en enda utskrift med kontinuerliga timestamps. Multi-hour engelska inspelningar (podcasts, fullständiga föreläsningar, möten) fungerar bra.
Ja — högtalare diarization är på som standard för varje engelska utskrift. Utmatningen är segmenterad som högtalare 1 / högtalare 2 / högtalare 3 med tidsstämplar, så intervjuer, paneldiskussioner och flerpartsmöten kommer tillbaka märkt. Diarization körs på en separat modell och fungerar på samma sätt över alla språk vi stöder.
Ja — klistra in webbadressen i /transcribe/youtube/ för YouTube eller /transcribe/podcast/ för podcast-flöden (Apple, Spotify, RSS). Vi laddar ner ljudet, kör det genom Whisper med språk=en och returnerar utskriften med tidsstämplar och högtalaretiketter. Typiskt engelska innehåll: föreläsningar, intervjuer, röstanteckningar och YouTube-innehåll i engelska allt arbete — klistra in en webbadress i /transcribe/youtube/ eller ladda upp filen direkt.
Whisper kostar ca 50 polletter per minut av ljud, så en timme inspelning är ~3,000 tokens. $ 1 köper 750.000 polletter, som fungerar ut till ungefär 250 timmar av ljud per dollar. De flesta användare aldrig spendera något - den fria dagliga poolen täcker korta klipp, röst anteckningar, och engångs podcasts.
Ja — både segment-nivå (varje ~10-30 sekunder) och tidstämpel på ordnivå är tillgängliga. Word-nivå är standard för VTT/SRT-textexport så bildtexterna synkroniserar rad-för-rad. På API-uppsättningen tidsstämpelr="ord" i begärans kropp. engelska utskrifter returneras i standard UTF-8 med språkets normala ortografi.
Ja. POST-ljud (multipart/form-data, fältnamn "fil") till /v1/transcribe/ med språk=en — eller utelämna språkparametern för att låta Whisper automatiskt detektera. Returnerar JSON med utskrift, segment, tidsstämpel och högtalaretiketter. Full referens och SDK-slippar på /api/.
Ja — när transkriptionen är klar, klicka på Översätt eller klistra in texten i /translate/. engelska par med alla andra språk som vi stöder (200+). För mötesminuter rör utskriften genom /summarize /; för dubbning skicka den till /voice/tts / att göra ljud i målspråket.
Whisper är utbildad på 680K timmar av bullriga verkliga ljud, så engelska transkription är robust för bakgrundsljud, musik sängar, och telefon-kvalitet inspelningar. Svår klippning eller flera överlappande högtalare kommer fortfarande att skada noggrannhet.Om en utskrift kommer tillbaka oanvändbar, e-post contact@free.ai med filen — vi kommer att återbetala tokens och titta på om en annan motor hanterar ditt ljud bättre.