финче бош транскрипция

финче аудио жана видеону AI менен текстке которуу. Жылдам, так жана акысыз.

Кантип иштейт

  1. _Жогору Free.ai транскриптору
  2. финче аудио же видео файлды жүктөп алуу
  3. Биздин ИИ автоматтык түрдө финчеди таап, аны транскрипциялайт
  4. Транскрипцияңызды текст же SRT субтитрлери катары жүктөп алуу

финче Транскрипциянын өзгөчөлүктөрү

  • faster-whisper (MIT лицензиясы)
  • финче тилин автоматтык түрдө аныктоо
  • MP3, WAV, MP4, M4A, FLAC жана башкаларды колдойт
  • Время и субтитры экспорта (SRT)
  • Платалык пландарда файлдын өлчөмүн чектөө жок
  • Жеке жана коопсуз -- файлдар иштетилгенден кийин өчүрүлөт

Тил тууралуу маалымат

Тилфинче
ISO кодуfi
AI моделитез-шыбыр
БаасыАкысыз

Дагы тилдер

Бардык тилдер

Кайсы

Whisper large-v3-turbo финче менен жакшы иштей алат — 7-15% сөз каталары аудио тестте. Аты берилген объекттер, сандар жана техникалык сөздөрдүн кээде алмаштырылышына жол берилбейт; транскрипциянын көпчүлүгү туура болот.(Tier B, 7-15% word error rate on benchmark sets — биз маркетингдик билдирүүлөрдүн ордуна чыныгы WER деңгээлдерин жарыялайбыз.)

Да — финче транскрипциясы алгач сиздин күн сайын акысыз токендериңиздин топтомун алат. Аудио бир мүнөтүнө 50 токенге бааланат, ошондуктан анонимдүү күн сайынгы топтом бир нече сааттык аудиону камтыйт. Кирген колдонуучулардын эсептери чоң топтомду жана 10 000 жазылуу токенин алат. Андан кийин, $1 750 000 токенди сатып алат (~250 сааттык аудио).

финче транскрипциялары стандарттуу UTF-8 форматында, тилдин нормалдуу орфографиясы менен кайтарылат.

MP3, WAV, M4A, FLAC, OGG, OPUS жана WEBM түздөн-түз кабыл алынат. Видео үчүн (MP4, MOV, MKV) биз аудио тректи серверден чыгарып, аны Whisperге жөнөтөбүз — сиз өзүңүз эч нерсени которууга муктаж эмессиз. Баштапкы тилден көз карандысыз бирдей конвейер, анын ичинде финче.

Анонимдүү жүктөө файлдын көлөмүн 500 МБга чейин чектейт. Кирген колдонуучулардын эсеби 2 ГБга чейин жетет. Узактыгы чектелбейт - узун файлдар автоматтык түрдө бөлүнөт (30 секунддук терезелер бирин-бири каптап) жана бирдиктүү транскриптке бирдиктүү убакыт белгилери менен бириктирилет. Бир нече сааттык финче жаздыруулар (подкасттар, толук лекциялар, жолугушуулар) жакшы иштейт.

Да — диаризация говорящего включена по умолчанию для каждого финче транскрипта. Вывод сегментируется как Говорящий 1 / Говорящий 2 / Говорящий 3 с временными метками, поэтому интервью, дискуссии и многосторонние встречи возвращаются с метками. Диаризация работает по отдельной модели и работает одинаково для всех поддерживаемых нами языков.

Да — URL-адрести /transcribe/youtube/ деп YouTube үчүн же /transcribe/podcast/ деп подкасттар үчүн (Apple, Spotify, RSS) киргизиңиз. Биз аудиону жүктөп, аны Whisper менен language=fi менен иштетип, транскрипт менен убакыт белгилерин жана сүйлөгөндөрдүн этикеткаларын кайтарабыз. Типтүү финче мазмуну: лекциялар, интервьюлар, үн жазмалар жана YouTube мазмуну финче бардык иштешет — URL /transcribe/youtube/ге киргизиңиз же файлды түз эле жүктөңүз.

Whisper бир мүнөттүк аудио үчүн 50 токенди талап кылат, андыктан бир сааттык аудио ~3000 токенди түзөт. $1 750 000 токенди сатып алат, бул болжол менен 250 сааттык аудиону түзөт. Колдонуучулардын көбү эч нерсеге акча сарптабайт — күн сайын акысыз берилип турган ресурстар кыска клиптерди, үн жазмаларын жана бир жолу жазылган подкасттарды камтыйт.

Да — сегменттик (ар бир ~10-30 секунд сайын) жана сөз деңгээлиндеги убакыт белгилери бар. Сөз деңгээли VTT/SRT субтитр экспорту үчүн алдын-ала орнотулган, ошондуктан субтитрлер саптан-сатка синхрондошот. APIде талаптын денесинде timestamps="word" коюңуз. финче транскрипциялары стандарттуу UTF-8 форматында, тилдин нормалдуу орфографиясы менен кайтарылат.

Да. POST аудио (multipart/form-data, field name "file") to /v1/transcribe/ with language=fi — же Whisper-ге авто-таап алууга тил параметрин калтырыңыз. JSON менен транскрипт, сегменттер, убакыт белгилери жана сүйлөгөндөрдүн этикеткаларын кайтарат. Толук шилтеме жана SDK фрагменттери /api/.

Да — транскрипция бүткөндөн кийин, Тартуу баскычын басыңыз же текстти /translate/ папкасына көчүрүп салыңыз. финче колдогон бардык тилдер менен шайкеш келет (200+). Жолугушуу протоколдору үчүн транскрипцияны /summarize/ папкасына жөнөтүңүз; дублдоо үчүн аны /voice/tts/ папкасына жөнөтүңүз, ал жерде ал тилдеги аудиону көрсөтөт.

Whisper жүздөгөн миңдеген сааттык реалдуулуктун аудиосун үйрөнгөндүктөн, ал фондук ызы-чууну жана финчеде телефондук сапаттагы жаздырууларды толеранттуу кабыл алат. Эң мыкты натыйжалар үчүн таза аудиону (гарнитурадагы микрофон, музыкалык орундук жок) бериңиз — бул деңгээлде ызы-чуу базалык ката ылдамдыгын көбөйтөт.Эгерде транскрипт иштебей калса, файл менен бирге contact@free.ai дарегине кат жөнөтүңүз — биз сиздин акчаңызды кайтарып беребиз жана башка двигатель сиздин аудиоңузду жакшыраак иштете алабы деп карап көрөлү.

Free.aiди сүйөсүңбү? Досторуңа айт!

Бул барактын баасын берүү