һинд буш транскрипция

һинд аудио һәм видеоны иҗтимагый тәнкыйть ярдәмендә текстка күчерегез. Шуның белән тиз, төгәл һәм бушлай.

Ничек эшли

  1. Барырга Free.ai Transcriber
  2. һинд аудио яки видео файлыгызны йөкләү
  3. Безнең ДНК һиндне автоматик рәвештә таба һәм аны күчерә
  4. Текст яки SRT субтитрлары белән транскрипцияне юкка чыгару

һинд Транскрипция сыйфатлары

  • faster-whisper ярдәмендә (MIT лицензиясе белән)
  • һинд телен автоматик ачыклау
  • MP3, WAV, MP4, M4A, FLAC һәм башкаларны яклый
  • Вак билгеләрен һәм субтитрларны экспортлау (SRT)
  • Платинум планнарда файл зурлыгы чикләүләре юк
  • Шәхси һәм куркынычсыз -- файллар эшкәртелгәннән соң юк ителә

Тел турында мәгълүмат

Телһинд
ISO кодыhi
Модельтизрәк-шыбырдау
БатареяБушлай

Кайвакыт бирелә торган сораулар

Whisper large-v3-turbo һинд сүзен яхшы эшли — аудиода 7-15% сүз хатасы. Кайчак исемләнгән объектлар, саннарны һәм киң кулланылган техник сүзлекләрне алмаштырырга мөмкин; транскрипциянең күбесе дөрес булачак. (Tier B, 7-15% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)

Әйе — һинд транскрипциясе беренче чиратта сезнең көн саен бушлай булган токеннарыгыздан файдалана. Аудио минутына якынча 50 токенга төшә, шуңа күрә аноним көнлек токеннар бер көн эчендә берничә сәгать аудионы каплый. Кергән исәп-хисаплар зуррак токеннар запасы һәм 10 000 язылу токены ала. Аннары 1$ өчен 750 000 токен (~250 сәгать аудио) сатып алына.

Һинд телендәге аудио текстлар шәһәр сөйләшүендә еш кына инглиз теле белән (Hinglish) кушылып языла. Whisper бу кушылуны үз өстенә ала һәм инглиз сүзләрен латин әлифбасында һәм хинди сүзләрен деванагари әлифбасында бер үк транскрипциядә яздыра. Район телендәге сүзләр күп булган авыл сөйләшүе C дәрәҗәсендә дөреслеккә ирешә.

MP3, WAV, M4A, FLAC, OGG, OPUS, һәм WEBM форматлары турыдан-туры кабул ителә. Видео өчен (MP4, MOV, MKV) без аудио юлны сервер тарафыннан чыгарабыз һәм аны Whisper-га җибәрәбез — сез үзегез берни дә үзгәртергә тиеш түгелсез. Башлангыч телдән тыш, һинд белән бер үк канал кулланыла.

Аноним куюлар файл өчен 500 МБ га кадәр чикләнгән. Кергән исәп-хисаплар 2 ГБ га кадәр. Озынлыгы чикләнмәгән — озын файллар автоматик рәвештә киселә (30 секундлы бер-берсенә туры килгән тәрәзәләр) һәм бер вакыт билгесе белән бер транскриптка беркетелә. Берничә сәгатьлек һинд яздырулар (подкастлар, тулы лекцияләр, очрашулар) яхшы эшли.

Әйе — сөйләүчене диаризацияләү һәр һинд транскрипциясе өчен алдан билгеләнгәнчә эшли. Чыгу 1нче сөйләүче / 2нче сөйләүче / 3нче сөйләүче дип вакыт билгесе белән бүленә, шуңа күрә интервьюлар, дискуссияләр һәм күп кеше катнашындагы очрашулар да билгеләнгәнчә чыга. Диаризацияләү аерым модельдә эшли һәм без яклаган барлык телләрдә дә бертигез эшли.

Әйе — URLны /transcribe/youtube/ дип YouTube өчен яки /transcribe/podcast/ дип подкастлар өчен (Apple, Spotify, RSS) куегыз. Без аудионы төшерәбез, аны Whisper аша language=hi белән эшлибез, һәм вакыт билгесе һәм сөйләүченең билгесе белән транскриптны кайтарабыз. Типик һинд эчтәлеге: WhatsApp тавыш язулары, YouTube видеолары һәм кыска видеолар иң киң таралган һинд эш йөкләмәләре — URLны /transcribe/youtube/ка куегыз яки аудионы турыдан-туры куегыз.

2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә, 2009 елда 1000 кешегә 1000 сум акча бирелә.

Әйе — сегмент дәрәҗәсе (~10-30 секунд саен) һәм сүз дәрәҗәсе вакыт билгесе бар. Сүз дәрәҗәсе VTT/SRT субтитр экспорты өчен алдан билгеләнгән, шуңа күрә субтитрлар юлдан-юлга синхронлаштырыла. API-да сорау эчендә timestamps="word" билгеләнгән. һинд транскрипцияләре деванагари язуында (UTF-8) кайтарыла.

Әлбәттә. Аудио (multipart/form-data, field name "file") белән /v1/transcribe/ адресына language=hi белән POST җибәрегез — яки Whisper-га автоматик ачыклау өчен тел параметрын калдырыгыз. JSON форматында транскрипция, сегментлар, вакыт билгесе һәм сөйләүченең язуы белән кайтара. /api/ адресында тулы мәгълүмат һәм SDK фрагментлары бар.

Әйе — транскрипция тәмамлангач, тәрҗемә итү төймәсенә басыгыз яки текстны /translate/ каталогына урнаштырыгыз. һинд безнең башка телләр белән дә (200+) кушылып эшли. Очрашу протоколлары өчен транскрипцияне /summarize/ каталогына җибәрегез; дубляж өчен аны /voice/tts/ каталогына җибәрегез, бу максатлы телдә аудионы күрсәтү өчен.

Whisper реаль дөньядагы уеннар өчен йөз меңләгән сәгатьләр белән өйрәнелгән, шуңа күрә ул фон тавышы һәм телефон сыйфатындагы һинд яздыруларына чыдам. Иң яхшы нәтиҗәләр өчен, чиста уеннар бирегез (гарнитура микрофоны, музыка ятаклары юк) — бу дәрәҗәдә тавыш төп хата дәрәҗәсен арттыра.Әгәр дә берәр текст кулланылмыйча кире кайтса, contact@free.ai электрон почтасына файл белән җибәрегез — без сезнең аудионы башка мотор яхшырак кабул итәме-юкмы дип карыйбыз.

Free.aiне яратасызмы?

Бу битне бәяләү