араб тілі бос транскрипция

араб тілі аудио мен видеоны AI-мен мәтінге аудару. Жедел, дәл және тегін.

Не істеп тұр

  1. Келесіге өту Free.ai транскрипторы
  2. араб тілі аудио не бейне файлды жүктеп алу
  3. Біздің ДЖ автоматты түрде араб тілі-ді анықтап, оны көшіріп алады
  4. Транскрипцияңызды мәтін немесе SRT субтитрлер ретінде жүктеп алу

араб тілі Транскрипция қасиеттері

  • faster- whisper (MIT лицензиясымен)
  • араб тілі тілінің автоматты анықтауы
  • MP3, WAV, MP4, M4A, FLAC және басқа да форматтарды қолдайды
  • Уақыт белгісі мен субтитрлерді экспорттау (SRT)
  • Қосымша төлемдер үшін файл өлшемінің шектеуі жоқ
  • Жеке және қауіпсіз -- файлдар өңделгеннен кейін өшіріледі

Тілдің егжей- тегжейі

Тілараб тілі
ISO кодыar
AI үлгісіжылдам- жымиып
БағасыБос

ЖҚС

Whisper large-v3-turbo араб тілі-ді жақсы өңдейді — аудионың 7-15% сөз қателігі. Аталған объектілер, сандар, тығыз техникалық сөздіктер кездейсоқ ауыстырылады; транскрипцияның көпшілігі дұрыс болады.(Бұл ретте, B, 7-15% word error rate бенчмарк жиындары — біз маркетингтік мәлімдемелерден гөрі шынайы WER деңгейлерін жарияладық.)

Иә — араб тілі транскрипциясы алдымен күнделікті тегін жетондар қорыңыздан алады. Аудио минутына шамамен 50 жетонға тұрады, сондықтан анонимді күнделікті қор күніне бірнеше сағат аудионы қамтиды. Кіріс алған тіркелгілер үлкен қорға және 10,000 тіркелу жетонына ие болады. Бұдан кейін $1 750,000 жетон (~250 сағат аудио) сатып алады.

Араб тілі әдетті түрде Жаңа стандартты араб тілінде (MSA) өңделеді. Египет, Левант, Перси бұғазы және Магриб тілдеріндегі сөйлеу түсініледі, бірақ MSA орфографиясымен транскрипцияланады - Whisper романизацияламайды немесе диалектіге тән емлесі сақталмайды. МСА жаңалықтары/ дәрістер аудиосы үшін B деңгейі дәлдігін күтіңіз; қатты Магриб немесе Египет тілдеріндегі сөйлеу бұл деңгейді төмендетеді.

MP3, WAV, M4A, FLAC, OGG, OPUS, және WEBM тікелей қабылданады. Видео үшін (MP4, MOV, MKV) біз оны Whisper- ке жібермес бұрын сервер жағынан аудио жолағын тарқатамыз — Сізге ештеңені өзіңіз аудару керек емес. Бастапқы тілге қарамастан, араб тілі де қоса, бірдей конвейер қолданылады.

Анонимді жүктеудің шекті өлшемі - бір файл үшін шамамен 500 Мб. Жүйеге кірген тіркелгілер үшін бұл 2 Гб-қа дейін. Уақыт ұзақтығы шектеу емес - ұзын файлдар автоматты түрде бөлініп (30 секундтық терезелер бір-бірімен ауысып) бір уақыт белгісімен бір транскриптке біріктіріледі. Бірнеше сағаттық араб тілі жазбалар (подкасттар, толық лекциялар, кездесулер) жақсы жұмыс істейді.

Иә — сөйлеушілерді хронологиялық ретімен көрсету әрбір араб тілі транскрипті үшін әдетті түрде қосылған. Шығыс 1- сөйлеуші / 2- сөйлеуші / 3- сөйлеуші секілді уақыт белгісімен бөлінеді, сондықтан сұхбаттар, пікірталас, көпшілік кездесулер тегтермен қайтарылады. Ұйымдастыру бөлек модельде орындалады және қолдайтын барлық тілдерде бірдей жұмыс істейді.

Иә — URL-ді YouTube үшін /transcribe/youtube/, ал подкасттар үшін /transcribe/podcast/ дегенге көшіріңіз. Аудио файлды жүктеп алып, language=ar дегенмен Whisper арқылы орындап, уақыт белгісі мен сөйлеушінің тегімен бірге транскриптті қайтарамыз. араб тілі мазмұны: араб тілі-де жаңалықтар, уағыздар, лекторлар, саяси сұхбаттар жиі қолданылады; YouTube URL-ін /transcribe/youtube/ дегенге енгізіңіз немесе файлды жүктеп алыңыз.

Whisper-дің құны минутына 50 жетон, яғни бір сағаттық жазба үшін ~3000 жетон. 1 долларға 750 000 жетон сатып алуға болады, бұл бір долларға шамамен 250 сағат аудио жазылады дегенді білдіреді. Пайдаланушылардың көпшілігі ештеңе жұмсамайды - күнделікті тегін жинақ қысқа клиптер, дыбыс жазбалар және бір реттік подкасттарды қамтиды.

Иә — сегмент деңгейіндегі (әр ~10-30 секунд сайын) және сөз деңгейіндегі уақыт белгісі бар. VTT/SRT субтитр экспорттау үшін сөз деңгейі әдетті, сондықтан субтитрлер жол бойынша қадамдастырады. API-де сұраныс мәтіні кезінде timestamps="word" дегенді орнатыңыз. араб тілі транскрипттері өзінің бастапқы оңнан солға скриптімен қайтарылады және кез келген RTL-ді қабылдайтын қарау құралында (браузер, Word, Google Docs) дұрыс көрсетіледі.

Иә. Аудио (multipart/form-data, өріс атауы "file") /v1/transcribe/ дегенге language=ar деп POST жіберіңіз — немесе Whisper-ге тіл параметрін автоматты түрде анықтауға рұқсат беру үшін оны жібермеңіз. JSON-ды транскрипт, сегменттер, уақыт белгісі және дыбыс шығарушы тегтерімен қайтарады. Толық сілтеме және SDK фрагменттері /api/ деген жерде.

Иә — транскрипция аяқталғанда, Аудару батырмасын басыңыз немесе мәтіннің /translate/ дегенге көшірмесін жасаңыз. араб тілі қолдайтын барлық тілдермен үйлесімді (200+). Кездесу хаттамаларын транскрипциялау үшін /summarize/ дегенге, дубляждау үшін /voice/tts/ дегенге жіберіңіз, сонда ол тілде дыбыс шығарылады.

Whisper жүздеген мың сағаттық шынайы дыбыспен оқытылды, сондықтан фон шуы мен араб тілі-дегі телефон сапасының дыбысын қабылдайды. Ең жақсы нәтижеге жету үшін таза дыбыс (гарнитура микрофоны, музыкалық үстел жоқ) беріңіз - бұл деңгейде шу негізгі қателік деңгейін арттырады.Егер транскрипт қолданылмай қалса, файлды contact@free.ai электрондық поштасына жіберіңіз — біз текондарды қайтарып береміз және басқа жүйе сіздің аудиоңызды жақсырақ өңдей ала ма деп тексереміз.

Free.ai-ды ұнатасыз ба? Достарыңызға хабарлаңыз!

Парақты бағалау