қытай тілі бос транскрипция
қытай тілі аудио мен видеоны AI-мен мәтінге аудару. Жедел, дәл және тегін.
Не істеп тұр
- Келесіге өту Free.ai транскрипторы
- қытай тілі аудио не бейне файлды жүктеп алу
- Біздің ДЖ автоматты түрде қытай тілі-ді анықтап, оны көшіріп алады
- Транскрипцияңызды мәтін немесе SRT субтитрлер ретінде жүктеп алу
қытай тілі Транскрипция қасиеттері
- ✓faster- whisper (MIT лицензиясымен)
- ✓қытай тілі тілінің автоматты анықтауы
- ✓MP3, WAV, MP4, M4A, FLAC және басқа да форматтарды қолдайды
- ✓Уақыт белгісі мен субтитрлерді экспорттау (SRT)
- ✓Қосымша төлемдер үшін файл өлшемінің шектеуі жоқ
- ✓Жеке және қауіпсіз -- файлдар өңделгеннен кейін өшіріледі
Тілдің егжей- тегжейі
| Тіл | қытай тілі |
| ISO коды | zh |
| AI үлгісі | жылдам- жымиып |
| Бағасы | Бос |
Басқа тілдері
Барлық тілдерді көрсетуЖҚС
Whisper large-v3-turbo қытай тілі-де ең жоғары дәлдік деңгейіне жетеді — стандартты ереже бойынша сөз қателігі 7% -дан төмен. Практикада бұл таза студиялық дыбыс нұсқасы мүлдем мықты болып шығады, ал әңгімедегі дыбыс минималды тазартумен қолданылады дегенді білдіреді.(Бұл ретте, A, under 7% word error rate бенчмарк жиындары — біз маркетингтік мәлімдемелерден гөрі шынайы WER деңгейлерін жарияладық.)
Иә — қытай тілі транскрипциясы алдымен күнделікті тегін жетондар қорыңыздан алады. Аудио минутына шамамен 50 жетонға тұрады, сондықтан анонимді күнделікті қор күніне бірнеше сағат аудионы қамтиды. Кіріс алған тіркелгілер үлкен қорға және 10,000 тіркелу жетонына ие болады. Бұдан кейін $1 750,000 жетон (~250 сағат аудио) сатып алады.
Мандарин үшін language=zh деп беріңіз (әдетте — көзіне қарай қарапайым немесе дәстүрлі). Кантон үшін, егер аудиоңыз Гонконг / Гуанчжоу тілінде болса, language=yue деп беріңіз; кантон тілін zh деп транскрипцияласаңыз, мандарин емлесін интонация мен сленгті жоғалтып алу арқылы шығарады.
MP3, WAV, M4A, FLAC, OGG, OPUS, және WEBM тікелей қабылданады. Видео үшін (MP4, MOV, MKV) біз оны Whisper- ке жібермес бұрын сервер жағынан аудио жолағын тарқатамыз — Сізге ештеңені өзіңіз аудару керек емес. Бастапқы тілге қарамастан, қытай тілі де қоса, бірдей конвейер қолданылады.
Анонимді жүктеудің шекті өлшемі - бір файл үшін шамамен 500 Мб. Жүйеге кірген тіркелгілер үшін бұл 2 Гб-қа дейін. Уақыт ұзақтығы шектеу емес - ұзын файлдар автоматты түрде бөлініп (30 секундтық терезелер бір-бірімен ауысып) бір уақыт белгісімен бір транскриптке біріктіріледі. Бірнеше сағаттық қытай тілі жазбалар (подкасттар, толық лекциялар, кездесулер) жақсы жұмыс істейді.
Иә — сөйлеушілерді хронологиялық ретімен көрсету әрбір қытай тілі транскрипті үшін әдетті түрде қосылған. Шығыс 1- сөйлеуші / 2- сөйлеуші / 3- сөйлеуші секілді уақыт белгісімен бөлінеді, сондықтан сұхбаттар, пікірталас, көпшілік кездесулер тегтермен қайтарылады. Ұйымдастыру бөлек модельде орындалады және қолдайтын барлық тілдерде бірдей жұмыс істейді.
Иә — URL-ді YouTube үшін /transcribe/youtube/, ал подкасттар үшін /transcribe/podcast/ дегенге көшіріңіз. Аудио файлды жүктеп алып, language=zh дегенмен Whisper арқылы орындап, уақыт белгісі мен сөйлеушінің тегімен бірге транскриптті қайтарамыз. қытай тілі мазмұны: қытай тілі-де бізге ең көп кездесетін жұмыс жүктемесі - подкасттар, лекторлар, сұхбаттар және YouTube-тағы қысқа мазмұн.
Whisper-дің құны минутына 50 жетон, яғни бір сағаттық жазба үшін ~3000 жетон. 1 долларға 750 000 жетон сатып алуға болады, бұл бір долларға шамамен 250 сағат аудио жазылады дегенді білдіреді. Пайдаланушылардың көпшілігі ештеңе жұмсамайды - күнделікті тегін жинақ қысқа клиптер, дыбыс жазбалар және бір реттік подкасттарды қамтиды.
Иә — сегмент деңгейіндегі (әр ~10-30 секунд сайын) және сөз деңгейіндегі уақыт белгісі бар. VTT/SRT субтитр экспорттау үшін сөз деңгейі әдетті, сондықтан субтитрлер жол бойынша қадамдастырады. API-де сұраныс мәтіні кезінде timestamps="word" дегенді орнатыңыз. қытай тілі транскрипттері Han таңбаларымен (UTF-8) қайтарылады — бастапқы аудио мен ISO кодына байланысты қарапайым немесе дәстүрлі.
Иә. Аудио (multipart/form-data, өріс атауы "file") /v1/transcribe/ дегенге language=zh деп POST жіберіңіз — немесе Whisper-ге тіл параметрін автоматты түрде анықтауға рұқсат беру үшін оны жібермеңіз. JSON-ды транскрипт, сегменттер, уақыт белгісі және дыбыс шығарушы тегтерімен қайтарады. Толық сілтеме және SDK фрагменттері /api/ деген жерде.
Иә — транскрипция аяқталғанда, Аудару батырмасын басыңыз немесе мәтіннің /translate/ дегенге көшірмесін жасаңыз. қытай тілі қолдайтын барлық тілдермен үйлесімді (200+). Кездесу хаттамаларын транскрипциялау үшін /summarize/ дегенге, дубляждау үшін /voice/tts/ дегенге жіберіңіз, сонда ол тілде дыбыс шығарылады.
Whisper 680K сағаттық шулы шынайы дыбыспен оқытылды, сондықтан қытай тілі транскрипциясы фон шуына, музыкалық креслоларға және телефон сапасының жазбаларына төзімді. Қатты қысқарту немесе бірнеше дыбыс таратқыштардың бір-біріне жабысуы әлі де дәлдікке зиян келтіреді.Егер транскрипт қолданылмай қалса, файлды contact@free.ai электрондық поштасына жіберіңіз — біз текондарды қайтарып береміз және басқа жүйе сіздің аудиоңызды жақсырақ өңдей ала ма деп тексереміз.