хинди тілі бос транскрипция

хинди тілі аудио мен видеоны AI-мен мәтінге аудару. Жедел, дәл және тегін.

Не істеп тұр

  1. Келесіге өту Free.ai транскрипторы
  2. хинди тілі аудио не бейне файлды жүктеп алу
  3. Біздің ДЖ автоматты түрде хинди тілі-ді анықтап, оны көшіріп алады
  4. Транскрипцияңызды мәтін немесе SRT субтитрлер ретінде жүктеп алу

хинди тілі Транскрипция қасиеттері

  • faster- whisper (MIT лицензиясымен)
  • хинди тілі тілінің автоматты анықтауы
  • MP3, WAV, MP4, M4A, FLAC және басқа да форматтарды қолдайды
  • Уақыт белгісі мен субтитрлерді экспорттау (SRT)
  • Қосымша төлемдер үшін файл өлшемінің шектеуі жоқ
  • Жеке және қауіпсіз -- файлдар өңделгеннен кейін өшіріледі

Тілдің егжей- тегжейі

Тілхинди тілі
ISO кодыhi
AI үлгісіжылдам- жымиып
БағасыБос

ЖҚС

Whisper large-v3-turbo хинди тілі-ді жақсы өңдейді — аудионың 7-15% сөз қателігі. Аталған объектілер, сандар, тығыз техникалық сөздіктер кездейсоқ ауыстырылады; транскрипцияның көпшілігі дұрыс болады.(Бұл ретте, B, 7-15% word error rate бенчмарк жиындары — біз маркетингтік мәлімдемелерден гөрі шынайы WER деңгейлерін жарияладық.)

Иә — хинди тілі транскрипциясы алдымен күнделікті тегін жетондар қорыңыздан алады. Аудио минутына шамамен 50 жетонға тұрады, сондықтан анонимді күнделікті қор күніне бірнеше сағат аудионы қамтиды. Кіріс алған тіркелгілер үлкен қорға және 10,000 тіркелу жетонына ие болады. Бұдан кейін $1 750,000 жетон (~250 сағат аудио) сатып алады.

Хинди дыбысы қалалық сөйлеу кезінде ағылшынмен (Hinglish) жиі араласады. Whisper бұл араласуды басқарып, ағылшын сөздерін латын әріптерімен, хинди сөздерін деванагари әріптерімен бір транскрипцияда аударады. Аудандық сөздік қоры мол ауылдық сөйлеу C дәрежесіне дейін төмендеуі мүмкін.

MP3, WAV, M4A, FLAC, OGG, OPUS, және WEBM тікелей қабылданады. Видео үшін (MP4, MOV, MKV) біз оны Whisper- ке жібермес бұрын сервер жағынан аудио жолағын тарқатамыз — Сізге ештеңені өзіңіз аудару керек емес. Бастапқы тілге қарамастан, хинди тілі де қоса, бірдей конвейер қолданылады.

Анонимді жүктеудің шекті өлшемі - бір файл үшін шамамен 500 Мб. Жүйеге кірген тіркелгілер үшін бұл 2 Гб-қа дейін. Уақыт ұзақтығы шектеу емес - ұзын файлдар автоматты түрде бөлініп (30 секундтық терезелер бір-бірімен ауысып) бір уақыт белгісімен бір транскриптке біріктіріледі. Бірнеше сағаттық хинди тілі жазбалар (подкасттар, толық лекциялар, кездесулер) жақсы жұмыс істейді.

Иә — сөйлеушілерді хронологиялық ретімен көрсету әрбір хинди тілі транскрипті үшін әдетті түрде қосылған. Шығыс 1- сөйлеуші / 2- сөйлеуші / 3- сөйлеуші секілді уақыт белгісімен бөлінеді, сондықтан сұхбаттар, пікірталас, көпшілік кездесулер тегтермен қайтарылады. Ұйымдастыру бөлек модельде орындалады және қолдайтын барлық тілдерде бірдей жұмыс істейді.

Иә — URL-ді YouTube үшін /transcribe/youtube/, ал подкасттар үшін /transcribe/podcast/ дегенге көшіріңіз. Аудио файлды жүктеп алып, language=hi дегенмен Whisper арқылы орындап, уақыт белгісі мен сөйлеушінің тегімен бірге транскриптті қайтарамыз. хинди тілі мазмұны: WhatsApp дыбыс жазбалары, YouTube видеоблогтары және қысқа бейнелер хинди тілі жұмыс жүктемелерінің ең көп таралған түрлері — URL-ді /transcribe/youtube/-ге енгізіңіз немесе аудионы тікелей жүктеп алыңыз.

Whisper-дің құны минутына 50 жетон, яғни бір сағаттық жазба үшін ~3000 жетон. 1 долларға 750 000 жетон сатып алуға болады, бұл бір долларға шамамен 250 сағат аудио жазылады дегенді білдіреді. Пайдаланушылардың көпшілігі ештеңе жұмсамайды - күнделікті тегін жинақ қысқа клиптер, дыбыс жазбалар және бір реттік подкасттарды қамтиды.

Иә — сегмент деңгейіндегі (әр ~10-30 секунд сайын) және сөз деңгейіндегі уақыт белгісі бар. VTT/SRT субтитр экспорттау үшін сөз деңгейі әдетті, сондықтан субтитрлер жол бойынша қадамдастырады. API-де сұраныс мәтіні кезінде timestamps="word" дегенді орнатыңыз. хинди тілі транскрипттері деванагари жазуымен (UTF-8) қайтарылады.

Иә. Аудио (multipart/form-data, өріс атауы "file") /v1/transcribe/ дегенге language=hi деп POST жіберіңіз — немесе Whisper-ге тіл параметрін автоматты түрде анықтауға рұқсат беру үшін оны жібермеңіз. JSON-ды транскрипт, сегменттер, уақыт белгісі және дыбыс шығарушы тегтерімен қайтарады. Толық сілтеме және SDK фрагменттері /api/ деген жерде.

Иә — транскрипция аяқталғанда, Аудару батырмасын басыңыз немесе мәтіннің /translate/ дегенге көшірмесін жасаңыз. хинди тілі қолдайтын барлық тілдермен үйлесімді (200+). Кездесу хаттамаларын транскрипциялау үшін /summarize/ дегенге, дубляждау үшін /voice/tts/ дегенге жіберіңіз, сонда ол тілде дыбыс шығарылады.

Whisper жүздеген мың сағаттық шынайы дыбыспен оқытылды, сондықтан фон шуы мен хинди тілі-дегі телефон сапасының дыбысын қабылдайды. Ең жақсы нәтижеге жету үшін таза дыбыс (гарнитура микрофоны, музыкалық үстел жоқ) беріңіз - бұл деңгейде шу негізгі қателік деңгейін арттырады.Егер транскрипт қолданылмай қалса, файлды contact@free.ai электрондық поштасына жіберіңіз — біз текондарды қайтарып береміз және басқа жүйе сіздің аудиоңызды жақсырақ өңдей ала ма деп тексереміз.

Free.ai-ды ұнатасыз ба? Достарыңызға хабарлаңыз!

Парақты бағалау