B'xejn Vjetnamiż Traskrizzjoni

Ittraskrivi Vjetnamiż awdjo u vidjow għal test b'AI. Mgħaġġel, preċiż u b'xejn.

Kif jaħdem

  1. Mur fil- Free.ai Traskritur
  2. Ittella' l-fajl awdjo jew vidjo Vjetnamiż tiegħek
  3. L-AI tagħna awtomatikament jiskopri Vjetnamiż u jittraskriviha
  4. Niżżel it-traskrizzjoni tiegħek bħala test jew sottotitli SRT

Vjetnamiż Karatteristiċi tat-Traskrizzjoni

  • Powered by aktar mgħaġġel-whisper (MIT liċenzjati)
  • Sejbien awtomatiku tal-lingwa Vjetnamiż
  • Jappoġġja MP3, WAV, MP4, M4A, FLAC, u aktar
  • Timbru tal-ħin u sottotitli esportazzjoni (SRT)
  • L-ebda limiti tad-daqs tal-fajl fuq il-pjanijiet imħallsa
  • Privat u sigur -- fajls huma mħassra wara l-ipproċessar

Dettalji tal-Lingwa

Il-lingwaVjetnamiż
Kodiċi ISOvi
Mudell tal-AIWhisper
PrezzĦieles

Aktar Lingwi disponibbli

Ara l-Lingwi Kollha

Mistoqsijiet Frekwenti

Whisper kbar-v3-turbo jimmaniġġja Vjetnamiż solidament — 7-15% rata żball kelma fuq il-punt ta' riferiment awdjo. tistenna sostituzzjonijiet okkażjonali fuq l-entitajiet imsemmija, in-numri, u vokabularju tekniku densi; il-biċċa l-kbira tal-traskrizzjoni se tkun korretta.(Livell B, 7-15% word error rate fuq settijiet ta' punti ta' riferiment — aħna nippubblikaw livelli WER onesti aktar milli dikjarazzjonijiet ta' kummerċjalizzazzjoni.)

Iva — Vjetnamiż traskrizzjoni jiġbed mill-pool token kuljum ħielsa tiegħek l-ewwel. Awdjo jiswa madwar 50 tokens kull minuta, sabiex il-pool anonimu kuljum tkopri ftit sigħat ta awdjo kuljum. Signed-in kontijiet jiksbu pool akbar flimkien ma 10,000 sinjali reġistrazzjoni. Past li, $ 1 jixtri 750,000 tokens (~ 250 sigħat ta awdjo).

It-transkrizzjonijiet Vjetnamiż jiġu rritornati fl-istandard UTF-8 bl-ortografija normali tal-lingwa.

MP3, WAV, M4A, FLAC, OGG, OPUS, and WEBM are accepted directly. For video (MP4, MOV, MKV) we extract the audio track server-side before sending it to Whisper — you do not need to convert anything yourself. Same pipeline regardless of source language, including Vjetnamiż.

Il-limitu ta' upload anonimu huwa ta' madwar 500 MB għal kull fajl. Kontijiet li jkunu rreġistrati jmorru sa 2 GB. It-tul mhuwiex limitu strett — fajls twal jiġu maqsuma awtomatikament (twieqi ta' 30 sekonda b'kopertura) u jingħaqdu flimkien f'tranżkript wieħed b'timestamps kontinwi. Reġistrazzjonijiet ta' Vjetnamiż sigħat multipli (podcasts, lekċers sħaħ, laqgħat) jaħdmu tajjeb.

Iva — id-dijarizzazzjoni tal-kelliema hija attivata awtomatikament għal kull traskrizzjoni ta’ Vjetnamiż. L-output huwa segmentat bħala Kelliem 1 / Kelliem 2 / Kelliem 3 b’timestamps, għalhekk intervisti, diskussjonijiet ta’ panel, u laqgħat ta’ diversi partijiet jiġu lura b’tikketta.

Iva — waħħal il-URL f'/transcribe/youtube/ għal YouTube jew /transcribe/podcast/ għal podcast feeds (Apple, Spotify, RSS). Inniżżlu l-awdjo, inħaddmuh permezz ta' Whisper b'lingwa=vi, u nirritornaw it-tranżmissjoni b'timestamps u tikketti tal-kelliema. Kontenut tipiku Vjetnamiż: Noti bil-vuċi ta’ WhatsApp, vlogs ta’ YouTube, u vidjows b’forma qasira huma l-aktar tagħbijiet ta’ xogħol komuni Vjetnamiż — waħħal URL f’/transcribe/youtube/ jew ittella’ l-awdjo direttament.

Whisper jiswa madwar 50 tokens kull minuta tal-awdjo, sabiex reġistrazzjoni siegħa hija ~ 3,000 tokens. $ 1 jixtri 750,000 tokens, li taħdem out biex bejn wieħed u ieħor 250 siegħa tal-awdjo għal kull dollaru. ħafna utenti qatt jonfqu xejn - il-pool kuljum b'xejn tkopri klipps qosra, noti tal-vuċi, u podcasts one-off.

Iva — kemm it-timestamps fil-livell tas-segment (kull ~10-30 sekonda) kif ukoll fil-livell tal-kelma huma disponibbli. Il-livell tal-kelma huwa l-istandard għall-esportazzjoni tas-sottotitoli VTT/SRT sabiex it-titli jiġu sinkronizzati linja b'linja. Fuq l-API, issettja timestamps="word" fil-korp tat-talba. It-transkrizzjonijiet Vjetnamiż jiġu rritornati fl-istandard UTF-8 bl-ortografija normali tal-lingwa.

Iva. POST awdjo (multipart/form-data, l-isem tal-qasam "fajl") biex /v1/transcribe/ ma lingwa=vi — jew ommi l-parametru tal-lingwa biex tħalli Whisper awtomatikament jiskopri. Jirritorna JSON bit-transkrizzjoni, segmenti, timestamps, u tikketti kelliem.

Iva — ladarba t-traskrizzjoni tkun lesta, ikklikkja Traduċi jew waħħal it-test f’/translate/. Vjetnamiż jaqbel ma’ kull lingwa oħra li nappoġġjaw (200+). Għal minuti ta’ laqgħat, it-traskrizzjoni għandha tintbagħat permezz ta’ /summarize/; għad-doppjaġġ ibgħatha lil /voice/tts/ biex tirrendi l-awdjo fil-lingwa fil-mira.

Whisper huwa mħarreġ fuq mijiet ta’ eluf ta’ sigħat ta’ awdjo tad-dinja reali, għalhekk jittollera ħsejjes fl-isfond u reġistrazzjonijiet ta’ kwalità tat-telefown fuq Vjetnamiż.Għall-aħjar riżultati, ipprovdi awdjo nadif (mikrofonu tal-headphones, l-ebda sodda tal-mużika) — f’dan il-livell l-istorbju jikkomponi r-rata ta’ żball bażika.Jekk traskrizzjoni tiġi lura ma tistax tintuża, email contact@free.ai bil-fajl — aħna se tirrifondi l-tokens u ħarsa lejn jekk magna differenti jimmaniġġja awdjo tiegħek aħjar.

Imħabba Free.ai? Għid lill-ħbieb tiegħek!

Irraporta din il-paġna