Слободно кантонски Транкрипција
Transcribe кантонски аудио и видео за текст со ВИ. Брзо, точно и бесплатно.
Како функционира
- Оди на Free.ai Транскрибер
- Качи ја вашата кантонски аудио или видео датотека
- Нашиот АИ автоматски открива кантонски и го транскрибира.
- Превземете го вашиот транскрипт како текст или SRT субтитри
кантонски Својства за препишување
- ✓Појачано од побрз шепнувач (МИТ лиценца)
- ✓Автоматско откривање на јазикот кантонски
- ✓Ја поддржува MP3, WAV, MP4, M4A, FLAC и повеќе
- ✓Временски паузи и извоз на поднаслови (SRT)
- ✓Нема ограничувања на големината на датотеките за платените планови
- ✓Приватни и безбедни -- датотеките се избришуваат по обраќањето
Детали за јазикот
| Јазик | кантонски |
| ISO код | yue |
| ВИ модел | побрз шепот |
| Цена | Слободен |
Повеќе јазици
Преглед на сите јазициПрашања
кантонски е помалку изворен јазик за Whisper — големиот- v3-turbo седи над 25% стапка на грешка на збор, понекогаш многу повисока. Преписот е корисен за пребарување и одржување, но не треба да се третира како подготвен за публикација. Ако повисока точност за кантонски ќе го приклучиме автоматски.(Тир D, over 25% word error rate на референтни сетови — објавуваме чесни WER редови наместо маркетинг тврдења.)
Да — кантонски транскрипција извлекува од вашиот дневен бесплатни жетони прво. Аудио чини околу 50 жетони во минута, така што анонимниот дневен базен покрива неколку часа аудио дневно. Потпишани сметки добиваат поголем базен плус 10.000 жетони за регистрирање.
кантонски транскрипти се враќаат во стандарден UTF- 8 со нормалната ортографија на јазикот.
MP3, WAV, M4A, FLAC, OGG, OPUS и WEBM се прифаќаат директно. За видеото (MP4, MIV, MKV) ние ја вадиме аудио траката од страна на серверот пред да го испратиме на Whisper — не морате да конвертирате ништо лично. Истиот гасовод без оглед на изворниот јазик, вклучувајќи го и кантонски.
Анонимното поставување на капакот е приближно 500 MB по датотеката. Потпишаните сметки се одвиваат до 2 GB. Трајноста не е тешко ограничување — долгите датотеки се дели автоматски (30- секунди прозорци со поклопување) и зашиени назад во еден транскрипт со континуирани временски знаци. Мултичасовни кантонски снимки (подкасти, целосни предавања, состаноци) работат фино.
Да — дијализацијата на звучникот е стандардно за секој кантонски транскрипт. Излезот е сегментиран како спикер 1 / Спикер 2 / Спикер 3 со временски знаци, така што интервјуата, дискусиите на панелот и состаноците со повеќе партии се враќаат со етикета. DiaRising работи на одделен модел и работи исто на сите јазици што ги поддржуваме.
Да — го вметнуваме URL во /transcribe/youtube/ за YouTube или /transcribe/podcast/ за подкаст доводи (Apple, Spotify, RSS). Го симнуваме аудиото, го пренесуваме преку Whisper со јазик=yue, и го враќаме транскриптот со временски означувачи и говорници. Типична кантонски содржина: лекции, интервјуа, гласовни белешки и содржина на YouTube во кантонски сите работи — вметнете URL во /transcribe/youtube / или внесете ја датотеката директно.
Whisper чини околу 50 жетони во минута на аудио, така што еден час снимање е ~3.000 жетони. $ купува 750.000 жетони, кои работат на околу 250 часа аудио по долар. Повеќето корисници никогаш не трошат ништо — бесплатниот дневен базен покрива кратки клипови, гласови и еднократни подкасти.
Да — и сегмент- ниво (секои ~10- 30 секунди) и временски знаци на ниво на збор се достапни. Нивото на збор е стандардно за извезувањето на VTT/ SRT на титлови така што насловите се синхронизираат линија по линија. На API поставените временски тампови=" збор" во телото на барањето. кантонски транскрипти се враќаат во стандарден UTF- 8 со нормалната ортографија на јазикот.
Да. ПОСТ аудио (многупарт/ формат- податоци, име на полето „ датотека “) на / v1/ transcribe/ со јазик=yue — или омили го параметарот на јазикот за да дозволите Whisper автоматско детектирање. Враќа JSON со транскрипт, сегменти, временски табели и говорници. Целосна референца и SDK сегменти на / api /.
Да — еднаш кога транскрипцијата ќе заврши, кликнете на Преведи или вметни го текстот во /превод /. кантонски парови со секој друг јазик што го поддржуваме (200+). За состанокот на минутите преносот преку /summarize /; за дублирање испратете го на /voice/tts / за да направите аудио на целниот јазик.
Whisper-овиот тренинг помага помалку на овој степен — улецот на шише е количина на кантонски аудио Whisper виден за време на тренингот, а не на вревата. Чистото студио аудио уште победува бучно аудио, но ниту ќе стигне до точноста која би ја добил на јазик со висок извор.Ако преписот се врати неупотреблив, e-mail contact@free.ai со датотеката — ќе ги вратиме жетоните и ќе погледнеме дали некој друг мотор подобро управува со вашиот звук.