парсы тілі бос транскрипция

парсы тілі аудио мен видеоны AI-мен мәтінге аудару. Жедел, дәл және тегін.

Не істеп тұр

  1. Келесіге өту Free.ai транскрипторы
  2. парсы тілі аудио не бейне файлды жүктеп алу
  3. Біздің ДЖ автоматты түрде парсы тілі-ді анықтап, оны көшіріп алады
  4. Транскрипцияңызды мәтін немесе SRT субтитрлер ретінде жүктеп алу

парсы тілі Транскрипция қасиеттері

  • faster- whisper (MIT лицензиясымен)
  • парсы тілі тілінің автоматты анықтауы
  • MP3, WAV, MP4, M4A, FLAC және басқа да форматтарды қолдайды
  • Уақыт белгісі мен субтитрлерді экспорттау (SRT)
  • Қосымша төлемдер үшін файл өлшемінің шектеуі жоқ
  • Жеке және қауіпсіз -- файлдар өңделгеннен кейін өшіріледі

Тілдің егжей- тегжейі

Тілпарсы тілі
ISO кодыfa
AI үлгісіжылдам- жымиып
БағасыБос

ЖҚС

парсы тілі - Whisper үшін орташа ресурсты тіл - large-v3-turbo 15-25% сөз қателік жиілігіне ие. Транскрипттің негізгі бөлігі сенімді; атау-субъект қателерін, кейбір код-ауысу қателерін, қысқа-сөз қателерін күтіңіз. Жарияланым сапасы үшін адам өтуін жоспарлаңыз.(Бұл ретте, C, 15-25% word error rate бенчмарк жиындары — біз маркетингтік мәлімдемелерден гөрі шынайы WER деңгейлерін жарияладық.)

Иә — парсы тілі транскрипциясы алдымен күнделікті тегін жетондар қорыңыздан алады. Аудио минутына шамамен 50 жетонға тұрады, сондықтан анонимді күнделікті қор күніне бірнеше сағат аудионы қамтиды. Кіріс алған тіркелгілер үлкен қорға және 10,000 тіркелу жетонына ие болады. Бұдан кейін $1 750,000 жетон (~250 сағат аудио) сатып алады.

парсы тілі транскрипттері өзінің бастапқы оңнан солға скриптімен қайтарылады және кез келген RTL-ді қабылдайтын қарау құралында (браузер, Word, Google Docs) дұрыс көрсетіледі.

MP3, WAV, M4A, FLAC, OGG, OPUS, және WEBM тікелей қабылданады. Видео үшін (MP4, MOV, MKV) біз оны Whisper- ке жібермес бұрын сервер жағынан аудио жолағын тарқатамыз — Сізге ештеңені өзіңіз аудару керек емес. Бастапқы тілге қарамастан, парсы тілі де қоса, бірдей конвейер қолданылады.

Анонимді жүктеудің шекті өлшемі - бір файл үшін шамамен 500 Мб. Жүйеге кірген тіркелгілер үшін бұл 2 Гб-қа дейін. Уақыт ұзақтығы шектеу емес - ұзын файлдар автоматты түрде бөлініп (30 секундтық терезелер бір-бірімен ауысып) бір уақыт белгісімен бір транскриптке біріктіріледі. Бірнеше сағаттық парсы тілі жазбалар (подкасттар, толық лекциялар, кездесулер) жақсы жұмыс істейді.

Иә — сөйлеушілерді хронологиялық ретімен көрсету әрбір парсы тілі транскрипті үшін әдетті түрде қосылған. Шығыс 1- сөйлеуші / 2- сөйлеуші / 3- сөйлеуші секілді уақыт белгісімен бөлінеді, сондықтан сұхбаттар, пікірталас, көпшілік кездесулер тегтермен қайтарылады. Ұйымдастыру бөлек модельде орындалады және қолдайтын барлық тілдерде бірдей жұмыс істейді.

Иә — URL-ді YouTube үшін /transcribe/youtube/, ал подкасттар үшін /transcribe/podcast/ дегенге көшіріңіз. Аудио файлды жүктеп алып, language=fa дегенмен Whisper арқылы орындап, уақыт белгісі мен сөйлеушінің тегімен бірге транскриптті қайтарамыз. парсы тілі мазмұны: парсы тілі-де жаңалықтар, уағыздар, лекторлар, саяси сұхбаттар жиі қолданылады; YouTube URL-ін /transcribe/youtube/ дегенге енгізіңіз немесе файлды жүктеп алыңыз.

Whisper-дің құны минутына 50 жетон, яғни бір сағаттық жазба үшін ~3000 жетон. 1 долларға 750 000 жетон сатып алуға болады, бұл бір долларға шамамен 250 сағат аудио жазылады дегенді білдіреді. Пайдаланушылардың көпшілігі ештеңе жұмсамайды - күнделікті тегін жинақ қысқа клиптер, дыбыс жазбалар және бір реттік подкасттарды қамтиды.

Иә — сегмент деңгейіндегі (әр ~10-30 секунд сайын) және сөз деңгейіндегі уақыт белгісі бар. VTT/SRT субтитр экспорттау үшін сөз деңгейі әдетті, сондықтан субтитрлер жол бойынша қадамдастырады. API-де сұраныс мәтіні кезінде timestamps="word" дегенді орнатыңыз. парсы тілі транскрипттері өзінің бастапқы оңнан солға скриптімен қайтарылады және кез келген RTL-ді қабылдайтын қарау құралында (браузер, Word, Google Docs) дұрыс көрсетіледі.

Иә. Аудио (multipart/form-data, өріс атауы "file") /v1/transcribe/ дегенге language=fa деп POST жіберіңіз — немесе Whisper-ге тіл параметрін автоматты түрде анықтауға рұқсат беру үшін оны жібермеңіз. JSON-ды транскрипт, сегменттер, уақыт белгісі және дыбыс шығарушы тегтерімен қайтарады. Толық сілтеме және SDK фрагменттері /api/ деген жерде.

Иә — транскрипция аяқталғанда, Аудару батырмасын басыңыз немесе мәтіннің /translate/ дегенге көшірмесін жасаңыз. парсы тілі қолдайтын барлық тілдермен үйлесімді (200+). Кездесу хаттамаларын транскрипциялау үшін /summarize/ дегенге, дубляждау үшін /voice/tts/ дегенге жіберіңіз, сонда ол тілде дыбыс шығарылады.

Whisper-дің шуға төзімділігі парсы тілі-ге де қолданылады, бірақ бұл дәлдік деңгейінде қосымша шудың өзі де қателік деңгейін арттырады. Телефон немесе ноутбук микрофонынан жазылғаннан гөрі таза гарнитураның дыбысы жақсы нәтиже береді.Егер транскрипт қолданылмай қалса, файлды contact@free.ai электрондық поштасына жіберіңіз — біз текондарды қайтарып береміз және басқа жүйе сіздің аудиоңызды жақсырақ өңдей ала ма деп тексереміз.

Free.ai-ды ұнатасыз ба? Достарыңызға хабарлаңыз!

Парақты бағалау