Question 1

Ingabe i-Whisper ibhala ngokucophelela isi-Chinese?

Accepted Answer

I-Whisper large-v3-turbo iwela engxenyeni ephezulu yezinga lokunemba ku-isi-Chinese — ngaphansi kwe-7% yezinga lephutha legama ku-benchmarks ejwayelekile. Emisebenzini, lokhu kusho ukuthi umsindo westudio ohlanzekile ubuyela emuva ogcwele, futhi umsindo wokuxoxa ungasetshenziswa ngokulungisa okuncane.(I-Tier A, under 7% word error rate kusethingi se-benchmark — sishicilela ama-tiers we-WER athembekile ngaphezu kokuphikisana nokumaketha.)

Question 2

Ingabe i-isi-Chinese imahhala ukudlulisa umsindo-ku-umbhalo?

Accepted Answer

Yebo — isi-Chinese ukudluliswa kuqala kusuka ku-token pool yakho yamahhala yansuku zonke. Umsindo ubiza ama-token angama-50 ngomzuzu, ngakho-ke i-pool yansuku zonke engaziwa ifaka amahora ambalwa we-audio ngosuku. Ama-akhawunti abhalisiwe athola i-pool enkulu kanye nama-token angama-10,000 wokubhalisa. Phakathi kwalokhu, i-$1 ithenga ama-token angama-750,000 (amahora angama-250 e-audio).

Question 3

Ingabe umbhali uphatha isi-Chinese izilimi?

Accepted Answer

Ngenisa ulwimi=zh lwe-Mandarin (iphutha - i-output elula noma ejwayelekile ngokuya ngomthombo). Nge-Cantone use ulwimi=yue uma umsindo wakho u-Hong Kong / Guangzhou ukukhuluma; i-Cantone ebhalwe njenge-zh izokhiqiza i-Mandarin-ortography elinganiselwe elahlekelwa amathoni ne-slang.

Question 4

Yini amafomethi omsindo axhaswe nge-isi-Chinese transcription?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS, ne WEBM zivunyelwe ngokuqondile. Ngevidiyo (MP4, MOV, MKV) sikhipha umsindo we-server-side ngaphambi kokuthunyelwa ku-Whisper — awudingi ukushintsha noma yini ngokwakho. Ipayipi elifanayo ngaphandle komthombo we-language, kufaka phakathi i-isi-Chinese.

Question 5

Ingabe ihele lomsindo isi-Chinese lide kangakanani?

Accepted Answer

Ukufaka okungenagama kufinyelela kuma-500 MB ngefayela ngalinye. Ama-akhawunti abhalisiwe afinyelela ku-2 GB. Ukuphela kwesikhathi akuyona umkhawulo onzima - amafayela ade ahlukaniswa ngokuzenzakalela (amafasitela emizuzu engu-30 ahlukaniswe) futhi aphinde ahlukaniswe ibe yi-transcript eyodwa nesikhathi esiqhubekayo. Ukurekhodwa kwehora eliningi isi-Chinese (amapodcasts, izifundo ezigcwele, izinhlanganiso) kusebenza kahle.

Question 6

Ingabe i-isi-Chinese transcript ikhomba abakhulumayo abahlukene?

Accepted Answer

Yebo — ukudweba umsindo komsindo kusetshenzisiwe ngokuzenzakalela kuwo wonke ama-isi-Chinese transcript. I-output ihlukaniswe njenge-Speaker 1 / Speaker 2 / Speaker 3 nge-timestamps, ngakho-ke izingqungquthela, izingqungquthela zepaneli, nezingqungquthela zeqembu eliningi zibuyela emuva zinikezwe i-label. Ukudweba umsindo kusebenza ngemodeli ehlukile futhi kusebenza ngokufanayo kuwo wonke ama-languages esiwaxhasayo.

Question 7

Ingabe ngingakwazi ukudlulisa i-isi-Chinese YouTube video noma i-podcast?

Accepted Answer

Yebo — chofoza i-URL ku /transcribe/youtube/ ye-YouTube noma /transcribe/podcast/ ye-podcast feeds (Apple, Spotify, RSS). Silanda umsindo, siwuqhube nge-Whisper nge-language=zh, futhi sibuyisele i-transcript nge-timestamps ne-speaker labels. I-isi-Chinese ejwayelekile: amapodcast, izifundo, izingqungquthela, kanye ne-YouTube equkethwe ngefomu elide ku-isi-Chinese yizinto ezivame kakhulu esizibonayo.

Question 8

Ingabe ihora le-isi-Chinese lesandi libiza malini nge-token?

Accepted Answer

I-Whisper ibiza cishe ama-token angama-50 ngomzuzu we-audio, ngakho-ke ukurekhodwa kwehora elinye kubiza ama-token angama-3,000. I-$1 ithenga ama-token angama-750,000, okusebenza cishe amahora angama-250 we-audio ngedola. Abaningi abasebenzisayo abachithanga lutho — i-pool yamahhala yosuku lonke ifaka ama-clip aphansi, ama-notes omsindo, nama-podcasts afanayo.

Question 9

Ingabe ngithola i-word-level timestamps ye-isi-Chinese umsindo?

Accepted Answer

Yebo — zombili isigaba-sezinga (noma yikuphi ~10-30 imizuzwana) kanye negama-level timestamps zikhona. Igama-level yiphutha le-VTT/SRT subtitle export ngakho ama-captions asynchronize line-by-line. Kwi-API hlela timestamps="word" kwi-body yesicelo. isi-Chinese izixhumanisi zibuyiselwa ngezinhlamvu ze-Han (UTF-8) — ezilula noma ezijwayelekile ngokuya ngendawo yomsindo kanye nekhowudi ye-ISO.

Question 10

Ingabe kune-API ye-isi-Chinese transcription?

Accepted Answer

Yebo. POST umsindo (ingxenye/ifomu-data, igama lendawo "ihele") ku /v1/transcribe/ nge lingu=zh — noma ushiye i parameter yesilimi ukuze i Whisper ikwazi ukukhomba ngokuzenzakalela. Ibuyisela i JSON nge lingu, amasegmenti, ama-timestamps, nama-speaker labels. Umbiko ophelele kanye ne-SDK snippets ku /api/.

Question 11

Ingabe ngiguqula isi-Chinese transcript ibe ulwimi olulodwa?

Accepted Answer

Yebo — uma ukuguqulelwa kuqediwe, chofoza guqula noma chofoza umbhalo ku /guqula/. isi-Chinese ixhumana nanoma iyiphi enye ulwimi esixhasayo (200+). Usuku lwengxoxo lidlulisa ukuguqulelwa /summarize/; ukuguqulelwa lithunyelwe ku /voice/tts/ ukuze kunikezwe umsindo kulimi oluzosetshenziswa.

Question 12

Yini uma umsindo we-isi-Chinese uzwakala ubuhlungu noma usezingeni eliphansi?

Accepted Answer

I-Whisper iqeqeshwe ngehora le-680K le-audio yezwe elingokoqobo, ngakho-ke i-isi-Chinese transcription inamandla kakhulu ku-background noise, music beds, ne-phone-quality recordings. Ukucisha okunzima noma izikhulumi ezingaphezu kwezingu-100 zizoqhubeka nokulimaza ukuthembeka.Uma i-transcript ibuyela ingasebenzi, thumela i-imeyili ku contact@free.ai ngefayela — sizobuyisela imali ye-token futhi sibheke ukuthi ngabe i-engine eyahlukileyo iphatha umsindo wakho kahle.

I-Language	isi-Chinese
Ikhowudi ye-ISO	`zh`
Imodeli ye-AI	i-faster-whisper
Intengo	Ikhululekile

I-isi-Chinese yokudlulisa

Indlela isebenza ngayo

isi-Chinese Izici zokudlulisa

Iminingwane yesilimi

Izilimi Eziningi

Imibuzo ebuzwa kaningi