фин буш транскрипция

фин аудио һәм видеоны иҗтимагый тәнкыйть ярдәмендә текстка күчерегез. Шуның белән тиз, төгәл һәм бушлай.

Ничек эшли

  1. Барырга Free.ai Transcriber
  2. фин аудио яки видео файлыгызны йөкләү
  3. Безнең ДНК финне автоматик рәвештә таба һәм аны күчерә
  4. Текст яки SRT субтитрлары белән транскрипцияне юкка чыгару

фин Транскрипция сыйфатлары

  • faster-whisper ярдәмендә (MIT лицензиясе белән)
  • фин телен автоматик ачыклау
  • MP3, WAV, MP4, M4A, FLAC һәм башкаларны яклый
  • Вак билгеләрен һәм субтитрларны экспортлау (SRT)
  • Платинум планнарда файл зурлыгы чикләүләре юк
  • Шәхси һәм куркынычсыз -- файллар эшкәртелгәннән соң юк ителә

Тел турында мәгълүмат

Телфин
ISO кодыfi
Модельтизрәк-шыбырдау
БатареяБушлай

Кайвакыт бирелә торган сораулар

Whisper large-v3-turbo фин сүзен яхшы эшли — аудиода 7-15% сүз хатасы. Кайчак исемләнгән объектлар, саннарны һәм киң кулланылган техник сүзлекләрне алмаштырырга мөмкин; транскрипциянең күбесе дөрес булачак. (Tier B, 7-15% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)

Әйе — фин транскрипциясе беренче чиратта сезнең көн саен бушлай булган токеннарыгыздан файдалана. Аудио минутына якынча 50 токенга төшә, шуңа күрә аноним көнлек токеннар бер көн эчендә берничә сәгать аудионы каплый. Кергән исәп-хисаплар зуррак токеннар запасы һәм 10 000 язылу токены ала. Аннары 1$ өчен 750 000 токен (~250 сәгать аудио) сатып алына.

фин транскрипцияләре UTF-8 стандарты белән кайтарыла, телнең нормаль орфографиясе белән.

MP3, WAV, M4A, FLAC, OGG, OPUS, һәм WEBM форматлары турыдан-туры кабул ителә. Видео өчен (MP4, MOV, MKV) без аудио юлны сервер тарафыннан чыгарабыз һәм аны Whisper-га җибәрәбез — сез үзегез берни дә үзгәртергә тиеш түгелсез. Башлангыч телдән тыш, фин белән бер үк канал кулланыла.

Аноним куюлар файл өчен 500 МБ га кадәр чикләнгән. Кергән исәп-хисаплар 2 ГБ га кадәр. Озынлыгы чикләнмәгән — озын файллар автоматик рәвештә киселә (30 секундлы бер-берсенә туры килгән тәрәзәләр) һәм бер вакыт билгесе белән бер транскриптка беркетелә. Берничә сәгатьлек фин яздырулар (подкастлар, тулы лекцияләр, очрашулар) яхшы эшли.

Әйе — сөйләүчене диаризацияләү һәр фин транскрипциясе өчен алдан билгеләнгәнчә эшли. Чыгу 1нче сөйләүче / 2нче сөйләүче / 3нче сөйләүче дип вакыт билгесе белән бүленә, шуңа күрә интервьюлар, дискуссияләр һәм күп кеше катнашындагы очрашулар да билгеләнгәнчә чыга. Диаризацияләү аерым модельдә эшли һәм без яклаган барлык телләрдә дә бертигез эшли.

Әйе — URLны /transcribe/youtube/ дип YouTube өчен яки /transcribe/podcast/ дип подкастлар өчен (Apple, Spotify, RSS) куегыз. Без аудионы төшерәбез, аны Whisper аша language=fi белән эшлибез, һәм вакыт билгесе һәм сөйләүченең билгесе белән транскриптны кайтарабыз. Типик фин эчтәлеге: фин файлындагы дәресләр, интервьюлар, тавыш язулары һәм YouTube эчтәлеге барсы да эшли — URLны /transcribe/youtube/ка куегыз яки файлны турыдан-туры куегыз.

2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә.

Әйе — сегмент дәрәҗәсе (~10-30 секунд саен) һәм сүз дәрәҗәсе вакыт билгесе бар. Сүз дәрәҗәсе VTT/SRT субтитр экспорты өчен алдан билгеләнгән, шуңа күрә субтитрлар юлдан-юлга синхронлаштырыла. API-да сорау эчендә timestamps="word" билгеләнгән. фин транскрипцияләре UTF-8 стандарты белән кайтарыла, телнең нормаль орфографиясе белән.

Әлбәттә. Аудио (multipart/form-data, field name "file") белән /v1/transcribe/ адресына language=fi белән POST җибәрегез — яки Whisper-га автоматик ачыклау өчен тел параметрын калдырыгыз. JSON форматында транскрипция, сегментлар, вакыт билгесе һәм сөйләүченең язуы белән кайтара. /api/ адресында тулы мәгълүмат һәм SDK фрагментлары бар.

Әйе — транскрипция тәмамлангач, тәрҗемә итү төймәсенә басыгыз яки текстны /translate/ каталогына урнаштырыгыз. фин безнең башка телләр белән дә (200+) кушылып эшли. Очрашу протоколлары өчен транскрипцияне /summarize/ каталогына җибәрегез; дубляж өчен аны /voice/tts/ каталогына җибәрегез, бу максатлы телдә аудионы күрсәтү өчен.

Whisper реаль дөньядагы уеннар өчен йөз меңләгән сәгатьләр белән өйрәнелгән, шуңа күрә ул фон тавышы һәм телефон сыйфатындагы фин яздыруларына чыдам. Иң яхшы нәтиҗәләр өчен, чиста уеннар бирегез (гарнитура микрофоны, музыка ятаклары юк) — бу дәрәҗәдә тавыш төп хата дәрәҗәсен арттыра.Әгәр дә берәр текст кулланылмыйча кире кайтса, contact@free.ai электрон почтасына файл белән җибәрегез — без сезнең аудионы башка мотор яхшырак кабул итәме-юкмы дип карыйбыз.

Free.aiне яратасызмы?

Бу битне бәяләү