Ókeypis japanska Uppskrift
Afrita japanska hljóð og myndskeið í texta með AI. Fljótur, nákvæmur og ókeypis.
Hvernig það virkar
- Fara á síðuna Free.ai- afritunartæki
- Hladdu inn japanska hljóð- eða myndskránni þinni
- AI okkar greinir sjálfkrafa japanska og skrifar það
- Sækja afritunarskrá sem texta eða SRT texta
japanska Uppskriftarmöguleikar
- ✓Powered by hraðar-hvísla (MIT leyfi)
- ✓Sjálfvirk greining á japanska tungumáli
- ✓Styður MP3, WAV, MP4, M4A, FLAC og fleira
- ✓Tímastimpill og textaútflutningur (SRT)
- ✓Engin takmörk á skráarstærð á greiddum áætlunum
- ✓Einkamál og öruggt -- skrám er eytt eftir vinnslu
Upplýsingar um tungumál
| Tungumál | japanska |
| ISO kóði | ja |
| AI líkan | faster- whisper |
| Verð | Frjáls |
Fleiri tungumál
Skoða öll tungumálAlgengar spurningar
Whisper stór-v3-turbo lendir í efstu nákvæmni stigi á japanska - undir 7% orð villa hlutfall á venjulegum viðmiðum.Í reynd sem þýðir hreint stúdíó hljóð kemur aftur nánast fullkominn, og samtal hljóð er nothæft með lágmarks hreinsun.(Tier A, under 7% word error rate á viðmiðunarmörkum - við birtum heiðarlega WER stig frekar en markaðskröfur.)
Já — japanska afritunin dregur úr daglegu ókeypis táknunum þínum fyrst. Hljóð kostar um 50 tákn á mínútu, þannig að nafnlaus daglegur laug nær yfir nokkrar klukkustundir af hljóði á dag. Innskráðir reikningar fá stærri laug auk 10.000 skráningartákna.
japanska afritunarskrár eru skilaðar í innfæddum skriftum (UTF-8). japanska texti hefur engin bil á milli orða innfæddur; diarization tímastimpill bætir náttúrulegum hléum við hátalara.
MP3, WAV, M4A, FLAC, OGG, OPUS og WEBM eru samþykkt beint. Fyrir myndskeið (MP4, MOV, MKV) tökum við út hljóðlagið á miðlarahliðinni áður en það er sent til Whisper - þú þarft ekki að breyta neinu sjálfur. Sama leiðsla óháð upprunalegu tungumáli, þar á meðal japanska.
Nafnlaus upphleðsla má ekki vera stærri en 500 MB á skrá. Innskráðir aðilar mega hlaða upp allt að 2 GB. Lengd er ekki takmörkuð - langar skrár eru sjálfkrafa skiptar í hluta (30 sekúndna gluggar með skarast) og settar saman í eina upptöku með samfelldum tímastimpli. japanska upptökur sem endast í margar klukkustundir (podcast, fullar fyrirlestrar, fundir) virka vel.
Já — sjálfgefið er að kveikt sé á talsmannagreiningu fyrir hvert japanska afritunarrit. Úttak er skipt í málsvara 1 / málsvara 2 / málsvara 3 með tímastimpli, þannig að viðtöl, spjallborðsumræður og fjölþáttafundir koma aftur merktir.
Já — límdu slóðina í /transcribe/youtube/ fyrir YouTube eða /transcribe/podcast/ fyrir podcast strauma (Apple, Spotify, RSS). Við sækjum hljóð, keyra það í gegnum Whisper með language=ja, og skila afrituninni með tímastimpil og ræðumaður merki. Dæmigert japanska efni: Podcasts, fyrirlestrar, viðtöl og langur-form YouTube efni í japanska eru algengustu vinnuálag sem við sjáum.
Whisper kostar um 50 tákn á mínútu af hljóði, þannig að klukkustundar upptöku er ~ 3.000 tákn. $ 1 kaupir 750.000 tákn, sem virkar út í um það bil 250 klukkustundir af hljóði á dollara.Flestir notendur eyða aldrei neinu - ókeypis daglega laug nær stuttar hreyfimyndir, raddskýringar og einn-off podcast.
Já — bæði tímastimpill á hlutastig (á ~10-30 sekúndna fresti) og tímastimpill á orðstigi eru í boði. Orðsstig er sjálfgefið fyrir útflutning á VTT/SRT texta svo textarnir samstillast línu fyrir línu. Á API-inu er sett timestamps="word" í beiðni. japanska afritunarskrár eru skilaðar í innfæddum skriftum (UTF-8). japanska texti hefur engin bil á milli orða innfæddur; diarization tímastimpill bætir náttúrulegum hléum við hátalara.
Já. POST hljóð (multipart/form-data, field name "file") til /v1/transcribe/ með language=ja — eða slepptu tungumálabreytunni til að láta Whisper finna sjálfkrafa. Skilur JSON með afrituninni, hlutum, tímastimpli og hátalaramerkjum. Full tilvísun og SDK-sniðið er á /api/.
Já — þegar uppskriftinni er lokið skaltu smella á Translate eða líma textann í /translate/. japanska passar við öll önnur tungumál sem við styðjum (200+). Fyrir fundargerðir skal senda uppskriftina í gegnum /summarize/; fyrir dublering skal senda hana í /voice/tts/ til að gera hljóð á markmálinu.
Whisper er þjálfað á 680K klukkustundum háværra raunverulegra hljóð, þannig að japanska uppskrift er öflugur við bakgrunnshljóð, tónlistarrúm og upptökur í síma.Alvarleg klippa eða margar skarast hátalara mun enn meiða nákvæmni.Ef afritunarrit kemur aftur ónýtt, sendu tölvupóst á contact@free.ai með skránni - við munum endurgreiða táknin og líta á hvort önnur vél meðhöndlar hljóð þitt betur.