Слободно кинески Транкрипција
Transcribe кинески аудио и видео за текст со ВИ. Брзо, точно и бесплатно.
Како функционира
- Оди на Free.ai Транскрибер
- Качи ја вашата кинески аудио или видео датотека
- Нашиот АИ автоматски открива кинески и го транскрибира.
- Превземете го вашиот транскрипт како текст или SRT субтитри
кинески Својства за препишување
- ✓Појачано од побрз шепнувач (МИТ лиценца)
- ✓Автоматско откривање на јазикот кинески
- ✓Ја поддржува MP3, WAV, MP4, M4A, FLAC и повеќе
- ✓Временски паузи и извоз на поднаслови (SRT)
- ✓Нема ограничувања на големината на датотеките за платените планови
- ✓Приватни и безбедни -- датотеките се избришуваат по обраќањето
Детали за јазикот
| Јазик | кинески |
| ISO код | zh |
| ВИ модел | побрз шепот |
| Цена | Слободен |
Повеќе јазици
Преглед на сите јазициПрашања
Whisper големи-v3-турбо слетува во својот највисок степен на точност на кинески — под 7% стапка на грешка на зборот на стандардните стандарди. Во практика тоа значи чист студио аудио се враќа блиску совршено, а разговорниот аудио може да се користи со минимално чистење.(Тир A, under 7% word error rate на референтни сетови — објавуваме чесни WER редови наместо маркетинг тврдења.)
Да — кинески транскрипција извлекува од вашиот дневен бесплатни жетони прво. Аудио чини околу 50 жетони во минута, така што анонимниот дневен базен покрива неколку часа аудио дневно. Потпишани сметки добиваат поголем базен плус 10.000 жетони за регистрирање.
Предавај јазици=zh за мандарински (стандардно — поедноставен или традиционален излез во зависност од изворот). За кантонски користи јазик=yue ако вашиот аудио говор е Hong Kong / Guangzhou; кантонски транскриптиран како zh ќе произведе приближување на мандарин- ортографија што губи тонови и сленг.
MP3, WAV, M4A, FLAC, OGG, OPUS и WEBM се прифаќаат директно. За видеото (MP4, MIV, MKV) ние ја вадиме аудио траката од страна на серверот пред да го испратиме на Whisper — не морате да конвертирате ништо лично. Истиот гасовод без оглед на изворниот јазик, вклучувајќи го и кинески.
Анонимното поставување на капакот е приближно 500 MB по датотеката. Потпишаните сметки се одвиваат до 2 GB. Трајноста не е тешко ограничување — долгите датотеки се дели автоматски (30- секунди прозорци со поклопување) и зашиени назад во еден транскрипт со континуирани временски знаци. Мултичасовни кинески снимки (подкасти, целосни предавања, состаноци) работат фино.
Да — дијализацијата на звучникот е стандардно за секој кинески транскрипт. Излезот е сегментиран како спикер 1 / Спикер 2 / Спикер 3 со временски знаци, така што интервјуата, дискусиите на панелот и состаноците со повеќе партии се враќаат со етикета. DiaRising работи на одделен модел и работи исто на сите јазици што ги поддржуваме.
Да — го вметнуваме URL во /transcribe/youtube/ за YouTube или /transcribe/podcast/ за подкаст доводи (Apple, Spotify, RSS). Го симнуваме аудиото, го пренесуваме преку Whisper со јазик=zh, и го враќаме транскриптот со временски означувачи и говорници. Типична кинески содржина: Подкастовите, предавањата, интервјуата и содржината на YouTube во кинески се најчеста работа што ја гледаме.
Whisper чини околу 50 жетони во минута на аудио, така што еден час снимање е ~3.000 жетони. $ купува 750.000 жетони, кои работат на околу 250 часа аудио по долар. Повеќето корисници никогаш не трошат ништо — бесплатниот дневен базен покрива кратки клипови, гласови и еднократни подкасти.
Да — и сегмент- ниво (секои ~10- 30 секунди) и временски знаци на ниво на збор се достапни. Нивото на збор е стандардно за извезувањето на VTT/ SRT на титлови така што насловите се синхронизираат линија по линија. На API поставените временски тампови=" збор" во телото на барањето. кинески транскрипти се враќаат во домородните Хан знаци (UTF-8) — поедноставени или традиционални во зависност од изворниот аудио и ISO код.
Да. ПОСТ аудио (многупарт/ формат- податоци, име на полето „ датотека “) на / v1/ transcribe/ со јазик=zh — или омили го параметарот на јазикот за да дозволите Whisper автоматско детектирање. Враќа JSON со транскрипт, сегменти, временски табели и говорници. Целосна референца и SDK сегменти на / api /.
Да — еднаш кога транскрипцијата ќе заврши, кликнете на Преведи или вметни го текстот во /превод /. кинески парови со секој друг јазик што го поддржуваме (200+). За состанокот на минутите преносот преку /summarize /; за дублирање испратете го на /voice/tts / за да направите аудио на целниот јазик.
Whisper е обучуван на 680K часови бучен аудио звук во реалниот свет, па кинески транскрипцијата е робусна до бучавата позадина, музичките кревети и записите на квалитетот на телефонот. Тешкиот исечок или повеќекратни преклопувачки звучници сепак ќе ја повредат точноста.Ако преписот се врати неупотреблив, e-mail contact@free.ai со датотеката — ќе ги вратиме жетоните и ќе погледнеме дали некој друг мотор подобро управува со вашиот звук.