Trawssgrifiad am ddim Wrdw

Trosysgrifo Wrdw sain a fideo i destun gyda AI. Cyflym, cywir, a rhad.

Sut mae'n Gweithio

  1. Mynd i'r Trawsysgrifydd Free.ai
  2. Lanlwytho eich Wrdw ffeil sain neu fideo
  3. Mae ein DA yn canfod Wrdw yn awtomatig ac yn ei throsysgrifo
  4. Lawrlwytho eich trawsgrifiad fel testun neu isdeitlau SRT

Wrdw Nodweddion Trawslythyr

  • Gwefru gan faster-whisper (trwyddedig MIT)
  • Canfod iaith Wrdw yn awtomatig
  • Cynhelir MP3, WAV, MP4, M4A, FLAC, a mwy
  • Allforio isdeitlau (SRT)
  • Dim terfyn maint ffeil ar gynlluniau talu
  • Preifat a diogel -- ffeiliau yn cael eu dileu ar ôl eu prosesu

Manylion Iaith

IaithWrdw
Côd ISOur
Model AIfaster-whisper
PrisRhydd

Cwestiynau Cyffredin

Iaith adnodd canolig yw Wrdw ar gyfer Whisper — mae lar-v3-turbo yn cyrraedd y band o 15-25% o wallau gair. Mae'r cyfanswm o'r trosiad yn ddi-os; disgwyliwch wallau enwau-entrwydd, problemau newid cod o bryd i'w gilydd, a methiannau mewn ymadroddion byr. Penderfynwch ar deithiau dynol ar gyfer allbwn o ansawdd cyhoeddi.(Tier C, 15-25% word error rate ar set o feini prawf - cyhoeddwn lefelau WER gwirion yn hytrach na chwynion marchnata.)

Ie — Mae Wrdw yn tynnu o'ch cronfa tocynnau di-dâl bob dydd yn gyntaf. Mae sain yn costio tua 50 tocyn y funud, felly mae'r gronfa di-enw bob dydd yn cwmpasu ychydig o oriau o sain bob dydd. Mae cyfrifon sydd wedi mewngofnodi yn cael cronfa fwy a 10,000 o tocynnau cofrestru. Ar ôl hynny, mae $1 yn prynu 750,000 o tocynnau (~250 awr o sain).

Dychwelir trosysgrifau Wrdw yn eu sgript de-i-chwith wreiddiol a'u darlunio'n gywir mewn unrhyw ddarparwr gwelydd RTL (borwyr, Word, Dogfennau Google).

Derbynir MP3, WAV, M4A, FLAC, OGG, OPUS, a WEBM yn uniongyrchol. Am fideo (MP4, MOV, MKV) rydym yn echdynnu'r trac sain ar ochr y gweinydd cyn ei anfon i Whisper — nid oes angen i chi drosi unrhyw beth eich hun. Y un pibell waeth beth yw'r iaith ffynhonnell, gan gynnwys Wrdw.

Mae terfyn ar lawrlwythiadau di-enw yn oddeutu 500 MB y ffeil. Mae cyfrifon wedi mewngofnodi yn mynd hyd at 2 GB. Nid yw'r hyd yn gyfyngiad anodd - mae ffeiliau hir yn cael eu rhannu'n awtomatig (ffenestri 30 eiliad gyda gorgyffwrdd) ac yn cael eu cyfuno yn ôl i mewn i drosigraffiad sengl gyda stampiau amser parhaus. Mae recordiadau Wrdw aml-awr (podlediadau, darlithoedd llawn, cyfarfodydd) yn gweithio'n dda.

Ydy - mae diareiddio siaradwyr ar waith yn rhagosodedig ar gyfer pob trosysgrif Wrdw. Mae'r allbwn yn cael ei rannu fel siaradwr 1 / siaradwr 2 / siaradwr 3 gyda stampiau amser, felly mae cyfweliadau, trafodaethau panel, a chyfarfodydd aml-barti yn dod yn ôl wedi'u labelu. Rheda diareiddio ar ddull ar wahân ac mae'n gweithio'n yr un modd ar draws pob iaith rydym yn ei gynnal.

Ie — gludwch y URL i /transcribe/youtube/ ar gyfer YouTube neu /transcribe/podcast/ ar gyfer poblogaethau (Apple, Spotify, RSS). Ni lwythwn i lawr yr sain, rhennir hi drwy Whisper gyda language=ur, a dychwelir y trosglwyddiad gyda stampiau amser a labeli siaradwr. Cynnwys Wrdw arferol: Nodiadau llais WhatsApp, vlogiau YouTube, a fideos byr yw'r llwyth gwaith Wrdw mwyaf cyffredin - gludwch URL i /transcribe/youtube/ neu lawrlwythwch y sain yn uniongyrchol.

Mae Whisper yn costio tua 50 tocyn am bob munud o sain, felly mae recordiad awr yn costio ~3,000 o tocynnau. Mae $1 yn prynu 750,000 o tocynnau, sy'n cyfateb i tua 250 awr o sain am bob doler. Nid yw'r rhan fwyaf o ddefnyddwyr byth yn gwario dim — mae'r gronfa ddienw bob dydd yn cynnwys clipiau byr, nodiadau llais, a podiau un-amser.

Ydy — mae'r ddau lefel-segment (bob ~10-30 eiliad) a lefel-gair o daflenni amser ar gael. Lefel-gair yw'r rhagosodiadau ar gyfer allforio isdeitlau VTT/SRT felly mae'r isdeitlau yn cydweddu llinell-yn-llinell. Ar yr API gosod timestamps="word" yn corff y cais. Dychwelir trosysgrifau Wrdw yn eu sgript de-i-chwith wreiddiol a'u darlunio'n gywir mewn unrhyw ddarparwr gwelydd RTL (borwyr, Word, Dogfennau Google).

Ie. POST sain (data aml-ran/fformwlâu, enw maes "file") i /v1/transcribe/ gyda language=ur — neu hepgor y paramedr iaith i adael i Whisper ganfod yn awtomatig. Dychwelyd JSON gyda'r trosysgrif, segmentau, stampiau amser, a labeli siaradwr. Cyfeiriad llawn a darnau SDK yn /api/.

Ie — ar ôl i'r trosglwyddiad orffen, cliciwch Cyfieithu neu gludwch y testun i /translate/. Mae Wrdw yn cydweddu â phob iaith arall yr ydym yn ei chynnal (200+). Ar gyfer cofnodion cyfarfodydd, pibella'r trosglwyddiad trwy /summarize/; ar gyfer dyblygu, anfonwch ef i /voice/tts/ i gynhyrchu sain yn y iaith targed.

Mae grym sŵn Whisper yn dal i weithredu ar Wrdw, ond ar y lefel cywirdeb hon mae unrhyw sŵn ychwanegol yn cynyddu'r gyfradd gwall sylfaenol. Mae sain clustffonau glan yn rhoi canlyniadau gwell na recordiadau ffôn neu microffon llechen.Os nad yw'r trosglwyddiad yn defnyddiol, anfonwch e-bost at contact@free.ai gyda'r ffeil — byddwn yn ad-dalu'r tocynnau a gweld a yw peiriant gwahanol yn trin eich sain yn well.

Hoffwch Free.ai? Meddwl am eich ffrindiau!

Graddio'r dudalen hon