Question 1

Колку точно е Whisper транскрипција за кинески?

Accepted Answer

Whisper големи-v3-турбо слетува во својот највисок степен на точност на кинески — под 7% стапка на грешка на зборот на стандардните стандарди. Во практика тоа значи чист студио аудио се враќа блиску совршено, а разговорниот аудио може да се користи со минимално чистење.(Тир A, under 7% word error rate на референтни сетови — објавуваме чесни WER редови наместо маркетинг тврдења.)

Question 2

Дали кинески аудио-то-текст транскрипцијата е бесплатна?

Accepted Answer

Да — кинески транскрипција извлекува од вашиот дневен бесплатни жетони прво. Аудио чини околу 50 жетони во минута, така што анонимниот дневен базен покрива неколку часа аудио дневно. Потпишани сметки добиваат поголем базен плус 10.000 жетони за регистрирање.

Question 3

Дали транскриберот раководи со кинески дијалекти?

Accepted Answer

Предавај јазици=zh за мандарински (стандардно — поедноставен или традиционален излез во зависност од изворот). За кантонски користи јазик=yue ако вашиот аудио говор е Hong Kong / Guangzhou; кантонски транскриптиран како zh ќе произведе приближување на мандарин- ортографија што губи тонови и сленг.

Question 4

Кои аудио формати се поддржани за кинески транскрипција?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS и WEBM се прифаќаат директно. За видеото (MP4, MIV, MKV) ние ја вадиме аудио траката од страна на серверот пред да го испратиме на Whisper — не морате да конвертирате ништо лично. Истиот гасовод без оглед на изворниот јазик, вклучувајќи го и кинески.

Question 5

Колку долго може да биде кинески аудио датотека?

Accepted Answer

Анонимното поставување на капакот е приближно 500 MB по датотеката. Потпишаните сметки се одвиваат до 2 GB. Трајноста не е тешко ограничување — долгите датотеки се дели автоматски (30- секунди прозорци со поклопување) и зашиени назад во еден транскрипт со континуирани временски знаци. Мултичасовни кинески снимки (подкасти, целосни предавања, состаноци) работат фино.

Question 6

Дали кинески преписот ги идентификува различните звучници?

Accepted Answer

Да — дијализацијата на звучникот е стандардно за секој кинески транскрипт. Излезот е сегментиран како спикер 1 / Спикер 2 / Спикер 3 со временски знаци, така што интервјуата, дискусиите на панелот и состаноците со повеќе партии се враќаат со етикета. DiaRising работи на одделен модел и работи исто на сите јазици што ги поддржуваме.

Question 7

Можам ли да запишам кинески видео или подкаст?

Accepted Answer

Да — го вметнуваме URL во /transcribe/youtube/ за YouTube или /transcribe/podcast/ за подкаст доводи (Apple, Spotify, RSS). Го симнуваме аудиото, го пренесуваме преку Whisper со јазик=zh, и го враќаме транскриптот со временски означувачи и говорници. Типична кинески содржина: Подкастовите, предавањата, интервјуата и содржината на YouTube во кинески се најчеста работа што ја гледаме.

Question 8

Колку чини еден час од кинески аудио во жетоните?

Accepted Answer

Whisper чини околу 50 жетони во минута на аудио, така што еден час снимање е ~3.000 жетони. $ купува 750.000 жетони, кои работат на околу 250 часа аудио по долар. Повеќето корисници никогаш не трошат ништо — бесплатниот дневен базен покрива кратки клипови, гласови и еднократни подкасти.

Question 9

Може ли да добијам временски знаци на ниво на збор за кинески аудио?

Accepted Answer

Да — и сегмент- ниво (секои ~10- 30 секунди) и временски знаци на ниво на збор се достапни. Нивото на збор е стандардно за извезувањето на VTT/ SRT на титлови така што насловите се синхронизираат линија по линија. На API поставените временски тампови=" збор" во телото на барањето. кинески транскрипти се враќаат во домородните Хан знаци (UTF-8) — поедноставени или традиционални во зависност од изворниот аудио и ISO код.

Question 10

Дали постои API за кинески транскрипција?

Accepted Answer

Да. ПОСТ аудио (многупарт/ формат- податоци, име на полето „ датотека “) на / v1/ transcribe/ со јазик=zh — или омили го параметарот на јазикот за да дозволите Whisper автоматско детектирање. Враќа JSON со транскрипт, сегменти, временски табели и говорници. Целосна референца и SDK сегменти на / api /.

Question 11

Можам ли да го преведам кинески на друг јазик?

Accepted Answer

Да — еднаш кога транскрипцијата ќе заврши, кликнете на Преведи или вметни го текстот во /превод /. кинески парови со секој друг јазик што го поддржуваме (200+). За состанокот на минутите преносот преку /summarize /; за дублирање испратете го на /voice/tts / за да направите аудио на целниот јазик.

Question 12

Што ако кинески аудиото е бучно или ниско квалитетно?

Accepted Answer

Whisper е обучуван на 680K часови бучен аудио звук во реалниот свет, па кинески транскрипцијата е робусна до бучавата позадина, музичките кревети и записите на квалитетот на телефонот. Тешкиот исечок или повеќекратни преклопувачки звучници сепак ќе ја повредат точноста.Ако преписот се врати неупотреблив, e-mail contact@free.ai со датотеката — ќе ги вратиме жетоните и ќе погледнеме дали некој друг мотор подобро управува со вашиот звук.

Јазик	кинески
ISO код	`zh`
ВИ модел	побрз шепот
Цена	Слободен

Слободно кинески Транкрипција

Како функционира

кинески Својства за препишување

Детали за јазикот

Повеќе јазици

Прашања