Ազատ արաբերեն Հատվածագրում
Առաջարկվում է թարգմանել արաբերեն ձայնային և տեսահոլովակները տեքստի։ Շատ արագ, ճշգրիտ և անվճար։
Ինչպես է այն աշխատում
- Գնալ դեպի Free.ai-ի թարգմանիչ
- Բեռնել արաբերեն ձայնային կամ վիդեո ֆայլը
- Մեր ինտելեկտուալ սարքը ինքնաբերաբար հայտնաբերում է արաբերեն և փոխանցում այն
- Տեղադրել ձեր ձայնագրությունը որպես տեքստը կամ SRT ենթատեքստերը
արաբերեն Հատկություններ
- ✓Օգտագործվում է faster-whisper-ի կողմից (MIT-ի լիցենզիա)
- ✓արաբերեն լեզվի ինքնաբերաբար հայտնաբերում
- ✓աջակցում է MP3, WAV, MP4, M4A, FLAC և այլն
- ✓Ժամանակագրական նշաններ և ենթատեքստերի արտահանում (SRT)
- ✓Փոխհատուցվող պլանների դեպքում ցուցակի չափի սահմանափակում չկա
- ✓Անանուն և անվտանգ -- ֆայլերը վերացվում են գործընթացից հետո
Լեզվի մանրամասներ
| Լեզու | արաբերեն |
| ISO կոդ | ar |
| Օգտագործողի մոդել | արագ շշնջալ |
| Գին | Ազատ |
Ավելի շատ լեզուներ
Դիտել բոլոր լեզուներըՀաճախ տրվող հարցեր
Whisper large-v3-turbo-ն արաբերեն-ը լավ է կառավարում, ձայնային ցուցանիշների դեպքում 7-15% սխալներ է թույլ տալիս։ Պատահական փոխարինումներ են սպասվում անվանումներով միավորների, թվերի և հաստ տեխնիկական բառապաշարի դեպքում։ Տեղեկատվության մեծ մասը ճիշտ է։ (Tier B, 7-15% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)
Այո — արաբերեն-ի փոխանցումը նախևառաջ ձեր օրական անվճար տոկոսադրույքներից է վերցնում։ Ավտոմատ ձայնագրությունը րոպեական 50 տոկոսադրույք է պահանջում, այսպիսով անանուն օրական տոկոսադրույքը օրական մի քանի ժամ ձայնագրություն է ներառում։ Գրանցված հաշիվները ստանում են ավելի մեծ տոկոսադրույք և 10,000 գրանցման տոկոսադրույք։ Այնուհետև $1-ը գնում է 750,000 տոկոսադրույք (~250 րոպե ձայնագրություն)։
Արաբերենը լռելյայն կառավարվում է Օրգանական արաբերենի (MSA) մակարդակով։ Եգիպտական, Լևանտինյան, Գոլֆ և Մագրեբի լեզուների խոսակցությունները ճանաչվում են, բայց թարգմանվում են MSA ուղղագրությամբ՝ Whisper-ը չի լատինականացնում կամ պահպանում է լեզուների հատուկ գրաբարը։ Մագրեբի կամ եգիպտական լեզուների լեզվակիրները սպասում են B-մակարդակ ճշգրտության։
MP3, WAV, M4A, FLAC, OGG, OPUS և WEBM ֆայլերը ընդունվում են ուղղակիորեն։ Տեսահոլովակների (MP4, MOV, MKV) դեպքում ձայնային սկավառակը սերվերի կողմից է վերցվում և ուղարկվում Whisper-ին՝ առանց որևէ բան փոխակերպելու։ Միևնույն սկավառակը, անկախ աղբյուրի լեզվից, ներառյալ արաբերեն-ը։
Անանուն կերպով ներբեռնման չափը կազմում է 500 ՄԲ յուրաքանչյուր ֆայլի համար։ Գրանցված հաշիվները հասնում են մինչև 2 ԳԲ։ Տևողությունը սահմանափակ չէ՝ երկար ֆայլերը ավտոմատ կերպով բաժանվում են (30 վայրկյան տևողությամբ պատուհաններ, որոնք միմյանց են հաջորդում) և միավորվում են մեկ ձայնագրության մեջ՝ շարունակական ժամանակային նշումներով։ Շատ ժամեր տևող արաբերեն ձայնագրությունները (podcasts, ամբողջական դասընթացներ, հանդիպումներ) լավ են աշխատում։
Այո, լռելյայն ներառված է յուրաքանչյուր արաբերեն ձայնագրության համար։ Էջը բաժանված է 1-ին / 2-րդ / 3-րդ ձայնագրության ժամանակային նշաններով, այսպես որ հարցազրույցները, քննարկումները և բազմակողմանի հանդիպումները վերադարձվում են նշված։ Լռելյայն ներառված է նաև ձայնագրության մոդելը, որը նույնն է բոլոր լեզուների համար, որոնք մենք աջակցում ենք։
Այո, URL- ը կպցրեք /transcribe/youtube/ URL- ին YouTube- ի համար կամ /transcribe/podcast/ URL- ին podcast- ի համար (Apple, Spotify, RSS)։ Մենք ներբեռնում ենք ձայնը, այն գործարկվում է Whisper- ի միջոցով language=ar- ի հետ, և վերադարձնում ենք transcript- ը ժամանակային նշաններով և խոսնակի պիտակներով։ Տիպիկ արաբերեն պարունակությունը` արաբերեն-ում լուրերի կտորներ, քարոզներ, դասընթացներ և քաղաքական հարցազրույցներ են ամենատարածված աշխատանքային ծանրաբեռնվածությունները։ YouTube URL-ը կպցրեք /transcribe/youtube/ կամ տեղադրեք ֆայլը։
Whisper-ը արժե մոտ 50 տոկոս ձայնագրության րոպեի համար, այսինքն մեկ ժամվա ձայնագրությունը արժե ~3000 տոկոս։ $1-ը գնում է 750,000 տոկոս, ինչը նշանակում է մոտավորապես 250 ժամ ձայնագրություն մեկ դոլարի դիմաց։ Բոլորից շատ օգտագործողները երբեք ոչինչ չեն ծախսում, քանի որ անվճար օրական գումարը ներառում է կարճ տեսանյութեր, ձայնային գրառումներ և միանգամից մի քանի podcast-ներ։
Այո, ևս երկուսը՝ սեկցիոն մակարդակի (յուրաքանչյուր ~10-30 վայրկյանում) և բառային մակարդակի ժամանակային նշանները հասանելի են։ Բառային մակարդակը VTT/SRT ենթատեքստի արտահանման համար լռելյայն է, այնպես որ վերնագրերը սխալվում են տող առ տող։ API-ում պահանջի մարմնի մեջ սահմանել է timestamps="word"։ արաբերեն տրանսկրիպտները վերադարձվում են իրենց բնական աջից ձախ սկրիպտում և ճիշտ են ցուցադրվում ցանկացած RTL-ի ճանաչող դիտողում (բրաուզերներ, Word, Google Docs)։
Այո։ POST ձայնային (multipart/form-data, դաշտի անունը "file") /v1/transcribe/ language=ar — կամ բաց թողնել լեզվի պարամետրը, որպեսզի Whisper-ը ինքնաբերաբար հայտնաբերի այն։ Վերադարձնում է JSON-ը, որը պարունակում է ձայնագրությունը, սեկցիաները, ժամանակային նշանները և խոսնակի պիտակները։ Ամբողջական հղումը և SDK-ի հատվածները /api/ կայքում են։
Այո, երբ վերծանումը ավարտվի, սեղմեք Թարգմանել կամ կպցրեք տեքստը /translate/ ցուցակում։ արաբերեն-ը համընկնում է մեր աջակցվող բոլոր այլ լեզուների հետ (200+)։ Հանդիպումների րոպեների համար վերծանումը ուղարկեք /summarize/ ցուցակով։ Դիբյուտի համար ուղարկեք /voice/tts/ ցուցակով՝ ձայնը նպատակային լեզվով ցուցադրելու համար։
Whisper-ը սովորեցվել է հարյուրավոր հազարավոր ժամերի իրական ձայնագրության վրա, այնպես որ այն կարող է դիմանալ ֆոնային աղմուկին և հեռախոսային որակի ձայնագրություններին արաբերեն-ում։ Լավագույն արդյունքների համար, ապահովեք մաքուր ձայնագրություն (հեռախոսային միկրոֆոն, առանց երաժշտական սենյակ)՝ այս մակարդակում աղմուկը ավելացնում է հիմքային սխալների տոկոսը։Եթե ձայնագրությունը չի աշխատում, ուղարկեք այն contact@free.ai հասցեին՝ ֆայլի հետ միասին — մենք կվերադարձնենք տոկոսները և կտեսնենք, թե արդյոք այլ համակարգը ավելի լավ է աշխատում ձեր ձայնագրության հետ։