arab эркин транскрипция

arab аудио ва видеони AI билан матнга кўчиринг. Тез, аниқ ва бепул.

У қандай ишлайди

  1. _Кейинги саҳифага ўтиш Free.ai Транскриптор
  2. arab аудио ёки видео файлингизни юклаб олиш
  3. Бизнинг ИИ arab ни автоматик равишда аниқлаб, уни кўчириб ёзади
  4. Транскриптингизни матн ёки SRT субтитрлари сифатида юклаб олиш

arab Транскрипция хусусиятлари

  • faster-whisper (MIT лицензияси билан) томонидан қўллаб-қувватланади
  • arab тили автоматик аниқлаш
  • MP3, WAV, MP4, M4A, FLAC ва бошқаларни қўллаб-қувватлайди
  • Вақт белгилари ва субтитрларни экспорт қилиш (SRT)
  • Файл ҳажми чекловлари йўқ
  • Шахсий ва хавфсиз -- файллар ишловдан сўнг ўчирилади

Тил тафсилотлари

Тилarab
ISO кодиar
AI моделитезроқ-шўхлик
НархОқ

Кўпроқ тиллар

Барча тилларни кўриш

Кўп бериладиган саволлар

Whisper large-v3-turbo arab ни яхши бошқаради — бенчмарк аудиода 7-15% сўз хато даражаси. Айрим ҳолларда номланган объектлар, рақамлар ва йирик техник луғатлар алмаштирилишини кутинг; транскриптнинг катта қисми тўғри бўлади. (Tier B, 7-15% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)

Ҳа — arab транскрипцияси аввало сизнинг кундалик бепул токенлар жамғармасидан фойдаланади. Аудио дақиқасига 50 та токенга тушади, шунинг учун аноним кундалик жамғарма кунига бир неча соатлик аудиони қамраб олади. Кирган ҳисоблар каттароқ жамғарма ва 10 000 та рўйхатдан ўтиш токенларини олади. Бунинг ортидан, $1 750 000 та токенни (~250 соатлик аудио) сотиб олади.

Араб тили стандарт тарзда замонавий стандарт араб тили (MSA) даражасида ишлатилади. Миср, Левант, Ғарбий денгиз ва Магриб тилларида сўзлашув тиллари тан олинади, аммо MSA орфографиясида ёзилади — Whisper романизация қилмайди ёки диалектларга хос орфографияни сақлаб қолмайди. МСА янгиликлари/лекциялар учун B даражали аниқликни кутинг; оғир Maghrebi ёки Миср тилларида сўзлашув буни пастга туширади.

MP3, WAV, M4A, FLAC, OGG, OPUS ва WEBM тўғридан-тўғри қабул қилинади. Видео учун (MP4, MOV, MKV) биз аудио йўлакни Whisper'га жўнатишдан олдин сервер томонида ажратамиз — сиз ҳеч нарсани ўзингизга айлантиришга эҳтиёж сезмайсиз. Манба тилидан қатъи назар, arab ҳам қўшилган ҳолда, бир хил канал.

Аноним юклашлар ҳар бир файл учун тахминан 500 MB гача чекланади. Кирган ҳисоблар 2 GB гача. Умумий муддат чеклови йўқ - узун файллар автоматик равишда бўлакларга ажратилади (30 сониялик ойналар бир-бирига ўхшаш) ва давомли вақт белгилари билан бир нусхага бирлаштирилади. Бир неча соатлик arab ёзувлари (подкастлар, тўлиқ дарсликлар, йиғилишлар) яхши ишлайди.

Ҳа — ҳар бир arab транскрипти учун сўзловчининг диаризацияси аввалдан ишга туширилган. Чоп этилган маълумотлар 1-сўзловчи / 2-сўзловчи / 3-сўзловчига бўлинади ва вақт белгилари билан белгиланади, шунинг учун интервьюлар, панел муҳокамалари ва кўп томонлама учрашувлар белгиланган ҳолда қайтарилади. Диаризация алоҳида моделда ишлайди ва биз қўллаб-қувватлайдиган барча тилларда бир хил ишлайди.

Ҳа — URL-манзилни YouTube учун /transcribe/youtube/ ёки подкастлар учун /transcribe/podcast/ га жойланг (Apple, Spotify, RSS). Биз аудиони юклаб оламиз, уни Whisper орқали language=ar билан ишга туширамиз ва вақт белгилари ва сўзловчилар белгилари билан транскриптни қайтарамиз. Типик arab мазмуни: arabда янгиликлар, маърузалар, лекциялар ва сиёсий интервьюлар энг кўп учрайдиган иш юкларидир; YouTube URL манзилини /transcribe/youtube/га жойланг ёки файлни юкланг.

Whisper ҳар бир дақиқа аудио учун 50 токенга тушади, яъни бир соатлик ёзув ~3000 токенга тушади. $1 750000 токен сотиб олади, бу эса ҳар бир доллар учун 250 соат аудиога тушади. Кўпчилик фойдаланувчилар ҳеч нарса сарфламайди — ҳар куни бепул бўлган пуллар қисқа клиплар, овозли ёзувлар ва бир марталик подкастларга сарфланади.

Ҳа — сегмент даражасидаги (ҳар ~10-30 сонияда) ва сўз даражасидаги вақт белгилари мавжуд. ВТТ/SRT субтитр экспорти учун сўз даражаси олдиндан белгиланган, шунинг учун субтитрлар сатрма-сатр синхронлаштирилади. API талабнинг бошида timestamps="word"ни ўрнатиш керак. arab транскриптлари ўзларининг ўнгдан чапга скриптлари билан қайтарилади ва RTL-эҳтиёткор кўрувчида (браузерлар, Word, Google Docs) тўғри кўрсатилади.

Ҳа. Audio (multipart/form-data, field name "file") ни language=ar билан /v1/transcribe/'га POST қилинг — ёки Whisper'га автоматик аниқлаш учун тил параметрини қолдиринг. Транскрипт, сегментлар, вақт белгилари ва сўзловчи белгилари билан JSON'ни қайтаради. /api/'да тўлиқ манба ва SDK парчалари.

Ҳа — транскрипция тугаганидан сўнг, Таржимани босинг ёки матнни /translate/ га жойланг. arab биз қўллаб-қувватлайдиган барча тиллар билан (200+) жуфтлашади. Йиғилишда протокол учун транскрипцияни /summarize/ орқали юборинг; дубллаш учун уни /voice/tts/ га юборинг, у ерда у мақсад тилидаги аудиони кўрсатади.

Whisper юз минглаб соатлик реал дунё аудиоси асосида тайёрланган, шунинг учун у фон шовқинига ва arab даги телефон сифатидаги ёзувларга чидамли. Энг яхши натижалар учун тоза аудиони (қулоқчин микрофони, мусиқа остида эмас) тақдим қилинг - бу даражада шовқин асосий хато даражасини оширади.Агар транскрипт ишлатилмаса, contact@free.ai манзилига файл билан бирга электрон почта юборинг — биз сизга тўловни қайтарамиз ва бошқа мотор сизнинг аудионгизни яхшироқ ишлатишини текширамиз.

Free.aiни севасанми? Дўстларингга айт!

Бу саҳифани баҳолаш