араб чөлөөт орчуулга
араб аудио болон видеог AI-ээр текст болгон хөрвүүл. Хурдан, үнэн зөв, үнэгүй.
Яаж ажилладаг вэ
- Дараагийн хуудас Free.ai-ийн хөрвүүлэгч
- араб аудио эсвэл видео файлаа өргөтгө
- араб-ийг бидний хиймэл оюун ухаан автоматаар олж, хөрвүүлжээ
- Таны бичлэгийг текст эсвэл SRT субтитр болгон татаж аваарай
араб-ийн хөрвүүлэлтийн онцлог
- ✓faster-whisper (MIT лицензтэй)
- ✓араб хэлийг автоматаар олж илрүүлэх
- ✓MP3, WAV, MP4, M4A, FLAC болон бусад форматуудыг дэмждэг
- ✓Цаг хугацааны тэмдэглэгээ ба субтитр экспортлох (SRT)
- ✓Нэмэлт төлөвлөгөөнд файлын хэмжээний хязгаарлалт байхгүй
- ✓Хувийн ба аюулгүй -- файлууд боловсруулсны дараа устгагдана
Тодорхойлолтууд
| Хэл | араб |
| ISO код | ar |
| Модель | хурдан-хөгжүүлэх |
| Үнэ | Хязгааргүй |
Олон хэл
Бүх хэлийг харахТодорхойгүй асуултууд
Whisper large-v3-turbo нь араб-ийг маш сайн зохицуулдаг — 7-15% үгийн алдаа нь аудиог харьцуулахад. Заримдаа нэртэй зүйлс, тоонууд, өргөн техникийн үгийн санг солих шаардлагатай болдог; бичлэгийн ихэнх нь зөв байх болно. (Tier B, 7-15% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)
Тийм — араб транскрипц нь өдөр тутмын үнэгүй жетонуудыг эхлээд авч байна. Аудио нь минутанд 50 жетон зарцуулдаг, ингэснээр өдөр тутмын нууцлаг жетон нь өдөрт хэдэн цагийн аудиог хамардаг. Нэвтрсэн хэрэглэгчид илүү их жетон, 10,000 бүртгэлийн жетон авах боломжтой. Үүнээс гадна $1 нь 750,000 жетон (~250 цагийн аудио) худалдан авна.
Араб хэлийг ерөнхийдөө МСА түвшинд (Modern Standard Arabic) хянадаг. Египет, Левант, Персийн булан, Магрибын яриа нь MSA орфографиор бичдэг боловч Whisper нь латинаар бичиж, хэлний онцлог орфографио хадгалдаггүй. МСА-ийн мэдээ/ лекцийн аудио нь B түвшний нарийвчлалтай байх ёстой; Магриб, Египетийн яриа нь энэ түвшинг доошлуулдаг.
MP3, WAV, M4A, FLAC, OGG, OPUS, WEBM форматууд шууд хүлээн авагдана. Видео (MP4, MOV, MKV)-ийн хувьд бид Whisper-д илгээхдээ серверийн талд дууны бичлэгийг гаргаж авдаг - та өөртөө юу ч өөрчлөх шаардлагагүй. Эх хэлнээс үл хамааран ижил хоолой, араб-г багтаасан.
Анноним өргөтгөлийн хэмжээ нь файл бүрт 500 MB-аас хэтрэхгүй. Нэвтрсэн хэрэглэгчид 2GB хүртэлх хэмжээтэй өргөтгөлийг өргөж болно. Энэ нь хатуу хязгаарлалт биш - урт файлууд автоматаар хэсэгчлэн хуваагддаг (30 секундын дэлгэц хоорондоо давхцаж) ба үргэлжилсэн цаг хугацааны тэмдэглэлтэй нэг файлд нэгтгэдэг. Олон цагийн араб бичлэгүүд (подкаст, бүрэн лекц, уулзалт) сайн ажилладаг.
Тийм ээ — яригчдын тэмдэглэл нь араб бичлэг бүрийн хувьд хэвийн байдлаар идэвхтэй байдаг. Үр дүн нь яригч 1 / яригч 2/ яригч 3- ын хуваагдан цаг хугацааны тэмдэглэлтэй байдаг тул ярилцлага, хэлэлцүүлэг, олон талт уулзалтууд тэмдэглэгдсэнээр гарч ирдэг. Диариг нь тусгай загвар дээр ажилладаг бөгөөд бидний дэмждэг бүх хэл дээр адилхан ажилладаг.
Тийм — URL-ийг YouTube-ийн хувьд /transcribe/youtube/, подкастын (Apple, Spotify, RSS) хувьд /transcribe/podcast/ руу оруулах. Аудиог татаж аваад, хэл=ar-тэй Whisper-ээр дамжуулан, цаг хугацааны тэмдэглэгээ болон яригчдын тэмдэглэгээтэй хамт буцаана. араб-ийн нийтлэг агуулга: араб-д мэдээний бичлэг, номлолын бичлэг, лекц, улс төрийн ярилцлага нь хамгийн түгээмэл ажил юм. YouTube URL-ийг /transcribe/youtube/ руу оруулах эсвэл файлыг өргөтгөх.
Whisper нь минут тутамд 50 токен зарцууладаг, ингэснээр нэг цагийн бичлэг ~3000 токен зарцуулдаг. $1-ээр 750,000 токен худалдан авч болно, энэ нь нэг долларын үнэтэй 250 цагийн аудио бичлэгийг авч болно. Ихэнх хэрэглэгчид юу ч зарцуулахгүй - өдөр тутмын үнэгүй багц нь богино клип, дууны тэмдэглэл, нэг удаагийн подкастуудыг багтаадаг.
Тийм ээ — хэсэг түвшний (~10-30 секунд тутамд) болон үг түвшний цаг тэмдэглэгээнүүд байдаг. VTT/SRT субтитр экспортлохдоо үг түвшин нь урьдчилсан тохиргоо бөгөөд ингэснээр субтитрүүд мөр бүрээр синхрончлогдоно. API дээр хүсэлтийн биед timestamps="word"-ийг тохируулна. араб транскриптүүд нь өөрийнх нь баруунаас зүүн тийш бичлэгээр буцаж ирдэг ба RTL-ийг мэддэг ямар ч үзэгчид (хөтөч, Word, Google Docs) зөв дүрслэн харуулдаг.
Тийм. POST аудио (multipart/form-data, field name "file")-г /v1/transcribe/ руу language=ar-тэй явуулна — эсвэл Whisper-ийг автоматаар олж мэдэхийн тулд хэлний параметрийг үлдээх. JSON-г бичлэг, хэсгүүд, цагны тэмдэг, дуугаргагчдын тэмдэгтүүдтэй нь буцаана. Бүх холбоос болон SDK-ийн хэсгүүд /api/-д байна.
Тийм — орчуулга дууссаны дараа "Түлхүүр" товчийг дарж эсвэл текстийг /translate/ рүү байрлуулна. араб нь бидний дэмждэг бүх хэлтэй (200+) хослодог. Хурлын тэмдэглэл /summarize/ рүү дамжуулах; дуу оруулах бол /voice/tts/ руу дамжуулж, зорилгот хэл дээр дууг гаргах.
Whisper нь хэдэн зуун мянган цагийн бодит дууны туршлага дээр суурилсан тул араб дээрх дууны чимээ болон утасны чанартай бичлэгийг хүлээн авдаг. Хамгийн сайн үр дүнд хүрэхийн тулд цэвэр дуу (гар утасны микрофон, дууны өрөөгүй) оруулна уу. Энэ түвшинд чимээ нь үндсэн алдааны түвшинг нэмэгдүүлдэг.Хэрэв бичлэг ашиглагдахгүй бол contact@free.ai хаягаар файлыг илгээж болно — бид таны төлбөрийг буцааж өгч, өөр нэг програм таны аудиог илүү сайн боловсруулж чадах эсэхийг шалгана.