Question 1

пуштуча үчүн Whisper транскрипциясы канчалык так?

Accepted Answer

пуштуча — Whisper үчүн ресурстары аз тил — large-v3-turbo 25% сөз каталарынын деңгээлинен жогору, кээде андан да жогору. Транскрипт издөө жана гист үчүн пайдалуу, бирок аны жарыяланууга даяр деп эсептебөө керек. Эгерде пуштуча үчүн жогорку тактыктагы двигатель пайда болсо, биз аны автоматтык түрдө киргизебиз.(Tier D, over 25% word error rate on benchmark sets — биз маркетингдик билдирүүлөрдүн ордуна чыныгы WER деңгээлдерин жарыялайбыз.)

Question 2

пуштуча аудио-текст транскрипциясы акысызбы?

Accepted Answer

Да — пуштуча транскрипциясы алгач сиздин күн сайын акысыз токендериңиздин топтомун алат. Аудио бир мүнөтүнө 50 токенге бааланат, ошондуктан анонимдүү күн сайынгы топтом бир нече сааттык аудиону камтыйт. Кирген колдонуучулардын эсептери чоң топтомду жана 10 000 жазылуу токенин алат. Андан кийин, $1 750 000 токенди сатып алат (~250 сааттык аудио).

Question 3

пуштуча транскрипциясы кандай скрипт жана орфографияны колдонот?

Accepted Answer

пуштуча транскрипциялары стандарттуу UTF-8 форматында, тилдин нормалдуу орфографиясы менен кайтарылат.

Question 4

пуштуча транскрипциясы үчүн кандай аудио форматтар колдоого алынат?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS жана WEBM түздөн-түз кабыл алынат. Видео үчүн (MP4, MOV, MKV) биз аудио тректи серверден чыгарып, аны Whisperге жөнөтөбүз — сиз өзүңүз эч нерсени которууга муктаж эмессиз. Баштапкы тилден көз карандысыз бирдей конвейер, анын ичинде пуштуча.

Question 5

пуштуча аудиофайлы канчалык узун болушу мүмкүн?

Accepted Answer

Анонимдүү жүктөө файлдын көлөмүн 500 МБга чейин чектейт. Кирген колдонуучулардын эсеби 2 ГБга чейин жетет. Узактыгы чектелбейт - узун файлдар автоматтык түрдө бөлүнөт (30 секунддук терезелер бирин-бири каптап) жана бирдиктүү транскриптке бирдиктүү убакыт белгилери менен бириктирилет. Бир нече сааттык пуштуча жаздыруулар (подкасттар, толук лекциялар, жолугушуулар) жакшы иштейт.

Question 6

пуштуча транскрипциясы ар кандай сүйлөгөндөрдү аныктайбы?

Accepted Answer

Да — диаризация говорящего включена по умолчанию для каждого пуштуча транскрипта. Вывод сегментируется как Говорящий 1 / Говорящий 2 / Говорящий 3 с временными метками, поэтому интервью, дискуссии и многосторонние встречи возвращаются с метками. Диаризация работает по отдельной модели и работает одинаково для всех поддерживаемых нами языков.

Question 7

YouTube'дагы пуштуча видеосун же подкастын транскрипциялай аламбы?

Accepted Answer

Да — URL-адрести /transcribe/youtube/ деп YouTube үчүн же /transcribe/podcast/ деп подкасттар үчүн (Apple, Spotify, RSS) киргизиңиз. Биз аудиону жүктөп, аны Whisper менен language=ps менен иштетип, транскрипт менен убакыт белгилерин жана сүйлөгөндөрдүн этикеткаларын кайтарабыз. Типтүү пуштуча мазмуну: лекциялар, интервьюлар, үн жазмалар жана YouTube мазмуну пуштуча бардык иштешет — URL /transcribe/youtube/ге киргизиңиз же файлды түз эле жүктөңүз.

Question 8

пуштуча аудиосунун бир сааты канча токендерге турат?

Accepted Answer

Whisper бир мүнөттүк аудио үчүн 50 токенди талап кылат, андыктан бир сааттык аудио ~3000 токенди түзөт. $1 750 000 токенди сатып алат, бул болжол менен 250 сааттык аудиону түзөт. Колдонуучулардын көбү эч нерсеге акча сарптабайт — күн сайын акысыз берилип турган ресурстар кыска клиптерди, үн жазмаларын жана бир жолу жазылган подкасттарды камтыйт.

Question 9

пуштуча аудиосу үчүн сөз деңгээлиндеги убакыт белгилерин алууга болобу?

Accepted Answer

Да — сегменттик (ар бир ~10-30 секунд сайын) жана сөз деңгээлиндеги убакыт белгилери бар. Сөз деңгээли VTT/SRT субтитр экспорту үчүн алдын-ала орнотулган, ошондуктан субтитрлер саптан-сатка синхрондошот. APIде талаптын денесинде timestamps="word" коюңуз. пуштуча транскрипциялары стандарттуу UTF-8 форматында, тилдин нормалдуу орфографиясы менен кайтарылат.

Question 10

пуштуча транскрипциясы үчүн API барбы?

Accepted Answer

Да. POST аудио (multipart/form-data, field name "file") to /v1/transcribe/ with language=ps — же Whisper-ге авто-таап алууга тил параметрин калтырыңыз. JSON менен транскрипт, сегменттер, убакыт белгилери жана сүйлөгөндөрдүн этикеткаларын кайтарат. Толук шилтеме жана SDK фрагменттери /api/.

Question 11

пуштуча транскриптин башка тилге которуп бере аламбы?

Accepted Answer

Да — транскрипция бүткөндөн кийин, Тартуу баскычын басыңыз же текстти /translate/ папкасына көчүрүп салыңыз. пуштуча колдогон бардык тилдер менен шайкеш келет (200+). Жолугушуу протоколдору үчүн транскрипцияны /summarize/ папкасына жөнөтүңүз; дублдоо үчүн аны /voice/tts/ папкасына жөнөтүңүз, ал жерде ал тилдеги аудиону көрсөтөт.

Question 12

Эгерде пуштуча аудиосу ызы-чуу же сапаты төмөн болсо эмне кылыш керек?

Accepted Answer

Whisper'дин ызы-чууларды үйрөтүү бул деңгээлде жардам бербейт — көйгөй пуштуча аудиосунун көлөмүндө, ал эми Whisper'дин ызы-чууларды үйрөтүү учурунда көргөн аудиосунда эмес. Тиркеме студиялык аудио дагы эле ызы-чууларды жеңет, бирок алардын бири да ресурстары көп тилдерде алган тактыкка жетет.Эгерде транскрипт иштебей калса, файл менен бирге contact@free.ai дарегине кат жөнөтүңүз — биз сиздин акчаңызды кайтарып беребиз жана башка двигатель сиздин аудиоңузду жакшыраак иштете алабы деп карап көрөлү.

Тил	пуштуча
ISO коду	`ps`
AI модели	тез-шыбыр
Баасы	Акысыз

пуштуча бош транскрипция

Кантип иштейт

пуштуча Транскрипциянын өзгөчөлүктөрү

Тил тууралуу маалымат

Дагы тилдер

Кайсы