Слободно асамски Транкрипција

Transcribe асамски аудио и видео за текст со ВИ. Брзо, точно и бесплатно.

Како функционира

  1. Оди на Free.ai Транскрибер
  2. Качи ја вашата асамски аудио или видео датотека
  3. Нашиот АИ автоматски открива асамски и го транскрибира.
  4. Превземете го вашиот транскрипт како текст или SRT субтитри

асамски Својства за препишување

  • Појачано од побрз шепнувач (МИТ лиценца)
  • Автоматско откривање на јазикот асамски
  • Ја поддржува MP3, WAV, MP4, M4A, FLAC и повеќе
  • Временски паузи и извоз на поднаслови (SRT)
  • Нема ограничувања на големината на датотеките за платените планови
  • Приватни и безбедни -- датотеките се избришуваат по обраќањето

Детали за јазикот

Јазикасамски
ISO кодas
ВИ моделпобрз шепот
ЦенаСлободен

Повеќе јазици

Преглед на сите јазици

Прашања

асамски е помалку изворен јазик за Whisper — големиот- v3-turbo седи над 25% стапка на грешка на збор, понекогаш многу повисока. Преписот е корисен за пребарување и одржување, но не треба да се третира како подготвен за публикација. Ако повисока точност за асамски ќе го приклучиме автоматски.(Тир D, over 25% word error rate на референтни сетови — објавуваме чесни WER редови наместо маркетинг тврдења.)

Да — асамски транскрипција извлекува од вашиот дневен бесплатни жетони прво. Аудио чини околу 50 жетони во минута, така што анонимниот дневен базен покрива неколку часа аудио дневно. Потпишани сметки добиваат поголем базен плус 10.000 жетони за регистрирање.

асамски транскрипти се враќаат во стандарден UTF- 8 со нормалната ортографија на јазикот.

MP3, WAV, M4A, FLAC, OGG, OPUS и WEBM се прифаќаат директно. За видеото (MP4, MIV, MKV) ние ја вадиме аудио траката од страна на серверот пред да го испратиме на Whisper — не морате да конвертирате ништо лично. Истиот гасовод без оглед на изворниот јазик, вклучувајќи го и асамски.

Анонимното поставување на капакот е приближно 500 MB по датотеката. Потпишаните сметки се одвиваат до 2 GB. Трајноста не е тешко ограничување — долгите датотеки се дели автоматски (30- секунди прозорци со поклопување) и зашиени назад во еден транскрипт со континуирани временски знаци. Мултичасовни асамски снимки (подкасти, целосни предавања, состаноци) работат фино.

Да — дијализацијата на звучникот е стандардно за секој асамски транскрипт. Излезот е сегментиран како спикер 1 / Спикер 2 / Спикер 3 со временски знаци, така што интервјуата, дискусиите на панелот и состаноците со повеќе партии се враќаат со етикета. DiaRising работи на одделен модел и работи исто на сите јазици што ги поддржуваме.

Да — го вметнуваме URL во /transcribe/youtube/ за YouTube или /transcribe/podcast/ за подкаст доводи (Apple, Spotify, RSS). Го симнуваме аудиото, го пренесуваме преку Whisper со јазик=as, и го враќаме транскриптот со временски означувачи и говорници. Типична асамски содржина: лекции, интервјуа, гласовни белешки и содржина на YouTube во асамски сите работи — вметнете URL во /transcribe/youtube / или внесете ја датотеката директно.

Whisper чини околу 50 жетони во минута на аудио, така што еден час снимање е ~3.000 жетони. $ купува 750.000 жетони, кои работат на околу 250 часа аудио по долар. Повеќето корисници никогаш не трошат ништо — бесплатниот дневен базен покрива кратки клипови, гласови и еднократни подкасти.

Да — и сегмент- ниво (секои ~10- 30 секунди) и временски знаци на ниво на збор се достапни. Нивото на збор е стандардно за извезувањето на VTT/ SRT на титлови така што насловите се синхронизираат линија по линија. На API поставените временски тампови=" збор" во телото на барањето. асамски транскрипти се враќаат во стандарден UTF- 8 со нормалната ортографија на јазикот.

Да. ПОСТ аудио (многупарт/ формат- податоци, име на полето „ датотека “) на / v1/ transcribe/ со јазик=as — или омили го параметарот на јазикот за да дозволите Whisper автоматско детектирање. Враќа JSON со транскрипт, сегменти, временски табели и говорници. Целосна референца и SDK сегменти на / api /.

Да — еднаш кога транскрипцијата ќе заврши, кликнете на Преведи или вметни го текстот во /превод /. асамски парови со секој друг јазик што го поддржуваме (200+). За состанокот на минутите преносот преку /summarize /; за дублирање испратете го на /voice/tts / за да направите аудио на целниот јазик.

Whisper-овиот тренинг помага помалку на овој степен — улецот на шише е количина на асамски аудио Whisper виден за време на тренингот, а не на вревата. Чистото студио аудио уште победува бучно аудио, но ниту ќе стигне до точноста која би ја добил на јазик со висок извор.Ако преписот се врати неупотреблив, e-mail contact@free.ai со датотеката — ќе ги вратиме жетоните и ќе погледнеме дали некој друг мотор подобро управува со вашиот звук.

Like this tool? Share it!

Оцени ја оваа страница