Trawssgrifiad am ddim Japaneeg

Trosysgrifo Japaneeg sain a fideo i destun gyda AI. Cyflym, cywir, a rhad.

Sut mae'n Gweithio

  1. Mynd i'r Trawsysgrifydd Free.ai
  2. Lanlwytho eich Japaneeg ffeil sain neu fideo
  3. Mae ein DA yn canfod Japaneeg yn awtomatig ac yn ei throsysgrifo
  4. Lawrlwytho eich trawsgrifiad fel testun neu isdeitlau SRT

Japaneeg Nodweddion Trawslythyr

  • Gwefru gan faster-whisper (trwyddedig MIT)
  • Canfod iaith Japaneeg yn awtomatig
  • Cynhelir MP3, WAV, MP4, M4A, FLAC, a mwy
  • Allforio isdeitlau (SRT)
  • Dim terfyn maint ffeil ar gynlluniau talu
  • Preifat a diogel -- ffeiliau yn cael eu dileu ar ôl eu prosesu

Manylion Iaith

IaithJapaneeg
Côd ISOja
Model AIfaster-whisper
PrisRhydd

Cwestiynau Cyffredin

Mae Whisper large-v3-turbo yn cyrraedd ei lefel cywirdeb uchaf ar Japaneeg — islaw 7% o gyfradd gwallau geiriau ar feini prawf safonol. Yn ymarferol, mae hynny'n golygu bod sain stiwdio glan yn dod yn ôl yn agos-berffaith, ac mae sain cyfathrebu'n ddefnyddiol gydag ychydig o lanhau.(Tier A, under 7% word error rate ar set o feini prawf - cyhoeddwn lefelau WER gwirion yn hytrach na chwynion marchnata.)

Ie — Mae Japaneeg yn tynnu o'ch cronfa tocynnau di-dâl bob dydd yn gyntaf. Mae sain yn costio tua 50 tocyn y funud, felly mae'r gronfa di-enw bob dydd yn cwmpasu ychydig o oriau o sain bob dydd. Mae cyfrifon sydd wedi mewngofnodi yn cael cronfa fwy a 10,000 o tocynnau cofrestru. Ar ôl hynny, mae $1 yn prynu 750,000 o tocynnau (~250 awr o sain).

Dychwelir trosysgrifau Japaneeg mewn sgript wreiddiol (UTF-8). Nid oes gan destun Japaneeg unrhyw bylchau rhwng geiriau yn wreiddiol; mae stampiau amser diareiddio yn ychwanegu lloriau naturiol wrth droi siaradwyr.

Derbynir MP3, WAV, M4A, FLAC, OGG, OPUS, a WEBM yn uniongyrchol. Am fideo (MP4, MOV, MKV) rydym yn echdynnu'r trac sain ar ochr y gweinydd cyn ei anfon i Whisper — nid oes angen i chi drosi unrhyw beth eich hun. Y un pibell waeth beth yw'r iaith ffynhonnell, gan gynnwys Japaneeg.

Mae terfyn ar lawrlwythiadau di-enw yn oddeutu 500 MB y ffeil. Mae cyfrifon wedi mewngofnodi yn mynd hyd at 2 GB. Nid yw'r hyd yn gyfyngiad anodd - mae ffeiliau hir yn cael eu rhannu'n awtomatig (ffenestri 30 eiliad gyda gorgyffwrdd) ac yn cael eu cyfuno yn ôl i mewn i drosigraffiad sengl gyda stampiau amser parhaus. Mae recordiadau Japaneeg aml-awr (podlediadau, darlithoedd llawn, cyfarfodydd) yn gweithio'n dda.

Ydy - mae diareiddio siaradwyr ar waith yn rhagosodedig ar gyfer pob trosysgrif Japaneeg. Mae'r allbwn yn cael ei rannu fel siaradwr 1 / siaradwr 2 / siaradwr 3 gyda stampiau amser, felly mae cyfweliadau, trafodaethau panel, a chyfarfodydd aml-barti yn dod yn ôl wedi'u labelu. Rheda diareiddio ar ddull ar wahân ac mae'n gweithio'n yr un modd ar draws pob iaith rydym yn ei gynnal.

Ie — gludwch y URL i /transcribe/youtube/ ar gyfer YouTube neu /transcribe/podcast/ ar gyfer poblogaethau (Apple, Spotify, RSS). Ni lwythwn i lawr yr sain, rhennir hi drwy Whisper gyda language=ja, a dychwelir y trosglwyddiad gyda stampiau amser a labeli siaradwr. Cynnwys Japaneeg arferol: podiau, darlithoedd, cyfweliadau, a chynnwys YouTube ffurf hir yn Japaneeg yw'r llwyth gwaith mwyaf cyffredin yr ydym yn ei weld.

Mae Whisper yn costio tua 50 tocyn am bob munud o sain, felly mae recordiad awr yn costio ~3,000 o tocynnau. Mae $1 yn prynu 750,000 o tocynnau, sy'n cyfateb i tua 250 awr o sain am bob doler. Nid yw'r rhan fwyaf o ddefnyddwyr byth yn gwario dim — mae'r gronfa ddienw bob dydd yn cynnwys clipiau byr, nodiadau llais, a podiau un-amser.

Ydy — mae'r ddau lefel-segment (bob ~10-30 eiliad) a lefel-gair o daflenni amser ar gael. Lefel-gair yw'r rhagosodiadau ar gyfer allforio isdeitlau VTT/SRT felly mae'r isdeitlau yn cydweddu llinell-yn-llinell. Ar yr API gosod timestamps="word" yn corff y cais. Dychwelir trosysgrifau Japaneeg mewn sgript wreiddiol (UTF-8). Nid oes gan destun Japaneeg unrhyw bylchau rhwng geiriau yn wreiddiol; mae stampiau amser diareiddio yn ychwanegu lloriau naturiol wrth droi siaradwyr.

Ie. POST sain (data aml-ran/fformwlâu, enw maes "file") i /v1/transcribe/ gyda language=ja — neu hepgor y paramedr iaith i adael i Whisper ganfod yn awtomatig. Dychwelyd JSON gyda'r trosysgrif, segmentau, stampiau amser, a labeli siaradwr. Cyfeiriad llawn a darnau SDK yn /api/.

Ie — ar ôl i'r trosglwyddiad orffen, cliciwch Cyfieithu neu gludwch y testun i /translate/. Mae Japaneeg yn cydweddu â phob iaith arall yr ydym yn ei chynnal (200+). Ar gyfer cofnodion cyfarfodydd, pibella'r trosglwyddiad trwy /summarize/; ar gyfer dyblygu, anfonwch ef i /voice/tts/ i gynhyrchu sain yn y iaith targed.

Mae Whisper wedi ei hyfforddi ar 680K o oriau o sain byd go iawn, felly mae Japaneeg yn wydn i sŵn cefndir, gwelyau cerddoriaeth, a recordiadau ansawdd ffôn. Bydd cnydio difrifol neu nifer o siaradwyr gorgyffwrdd yn dal i niweidio cywirdeb.Os nad yw'r trosglwyddiad yn defnyddiol, anfonwch e-bost at contact@free.ai gyda'r ffeil — byddwn yn ad-dalu'r tocynnau a gweld a yw peiriant gwahanol yn trin eich sain yn well.

Hoffwch Free.ai? Meddwl am eich ffrindiau!

Graddio'r dudalen hon