Question 1

Hur korrekt är Whisper transkription för engelska?

Accepted Answer

Whisper stor-v3-turbo landar i sin högsta noggrannhet nivå på engelska — under 7% ord felfrekvens på standard riktmärken. I praktiken som innebär ren studio ljud kommer tillbaka nära perfekt, och konversationsljud är användbart med minimal rensning.(Tier A, under 7% word error rate på referensuppsättningar — vi publicerar ärliga WER nivåer snarare än marknadsföringskrav.)

Question 2

Är engelska audio-to-text transkription gratis?

Accepted Answer

Ja — engelska transkription drar från din dagliga gratis token pool först. Ljud kostar ca 50 polletter per minut, så den anonyma dagliga poolen täcker några timmar av ljud per dag. Signed-in konton får en större pool plus 10.000 signup tokens. Förr i tiden köper $ 1 750.000 tokens (~250 timmar ljud).

Question 3

Hanterar transcriber engelska dialekter?

Accepted Answer

Engelska transkription omfattar USA, Storbritannien, Australien, indiska och andra stora accenter i en modell. Whisper utbildades på alla av dem och transkriptet kommer ut i standard engelska stavning oavsett talarens accent.

Question 4

Vilka ljudformat stöds för engelska transkription?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS och WEBM accepteras direkt. För video (MP4, MOV, MKV) extraherar vi ljudspår server-sidan innan du skickar den till Whisper — du behöver inte konvertera något själv. Samma rörledning oavsett källspråk, inklusive engelska.

Question 5

Hur länge kan en engelska ljudfil vara?

Accepted Answer

Anonyma uppladdningar cap på ungefär 500 MB per fil. Inloggade konton går upp till 2 GB. Varaktighet är inte en hård gräns — långa filer skärs automatiskt (30-sekunders fönster med överlappning) och sys tillbaka till en enda utskrift med kontinuerliga timestamps. Multi-hour engelska inspelningar (podcasts, fullständiga föreläsningar, möten) fungerar bra.

Question 6

Identifierar utskriften engelska olika talare?

Accepted Answer

Ja — högtalare diarization är på som standard för varje engelska utskrift. Utmatningen är segmenterad som högtalare 1 / högtalare 2 / högtalare 3 med tidsstämplar, så intervjuer, paneldiskussioner och flerpartsmöten kommer tillbaka märkt. Diarization körs på en separat modell och fungerar på samma sätt över alla språk vi stöder.

Question 7

Kan jag transkribera en engelska YouTube-video eller podcast?

Accepted Answer

Ja — klistra in webbadressen i /transcribe/youtube/ för YouTube eller /transcribe/podcast/ för podcast-flöden (Apple, Spotify, RSS). Vi laddar ner ljudet, kör det genom Whisper med språk=en och returnerar utskriften med tidsstämplar och högtalaretiketter. Typiskt engelska innehåll: föreläsningar, intervjuer, röstanteckningar och YouTube-innehåll i engelska allt arbete — klistra in en webbadress i /transcribe/youtube/ eller ladda upp filen direkt.

Question 8

Hur mycket kostar en timme av engelska audio i tokens?

Accepted Answer

Whisper kostar ca 50 polletter per minut av ljud, så en timme inspelning är ~3,000 tokens. $ 1 köper 750.000 polletter, som fungerar ut till ungefär 250 timmar av ljud per dollar. De flesta användare aldrig spendera något - den fria dagliga poolen täcker korta klipp, röst anteckningar, och engångs podcasts.

Question 9

Kan jag få tidstämpel på ordnivå för engelska audio?

Accepted Answer

Ja — både segment-nivå (varje ~10-30 sekunder) och tidstämpel på ordnivå är tillgängliga. Word-nivå är standard för VTT/SRT-textexport så bildtexterna synkroniserar rad-för-rad. På API-uppsättningen tidsstämpelr="ord" i begärans kropp. engelska utskrifter returneras i standard UTF-8 med språkets normala ortografi.

Question 10

Finns det ett API för engelska transkription?

Accepted Answer

Ja. POST-ljud (multipart/form-data, fältnamn "fil") till /v1/transcribe/ med språk=en — eller utelämna språkparametern för att låta Whisper automatiskt detektera. Returnerar JSON med utskrift, segment, tidsstämpel och högtalaretiketter. Full referens och SDK-slippar på /api/.

Question 11

Kan jag översätta avskriften engelska till ett annat språk?

Accepted Answer

Ja — när transkriptionen är klar, klicka på Översätt eller klistra in texten i /translate/. engelska par med alla andra språk som vi stöder (200+). För mötesminuter rör utskriften genom /summarize /; för dubbning skicka den till /voice/tts / att göra ljud i målspråket.

Question 12

Vad händer om engelska audio är bullriga eller låg kvalitet?

Accepted Answer

Whisper är utbildad på 680K timmar av bullriga verkliga ljud, så engelska transkription är robust för bakgrundsljud, musik sängar, och telefon-kvalitet inspelningar. Svår klippning eller flera överlappande högtalare kommer fortfarande att skada noggrannhet.Om en utskrift kommer tillbaka oanvändbar, e-post contact@free.ai med filen — vi kommer att återbetala tokens och titta på om en annan motor hanterar ditt ljud bättre.

Språk	engelska
ISO-kod	`en`
Förlaga till AI	Snabbare viskningar
Pris	Avgiftsfri

Fri engelska Transkription

Hur den fungerar

engelska Transkriptionsfunktioner

Språkdetaljer

Fler språk

Vanliga frågor