Question 1

Որքան ճշգրիտ է Whisper-ի արաբերեն-ի թարգմանությունը։

Accepted Answer

Whisper large-v3-turbo-ն արաբերեն-ը լավ է կառավարում, ձայնային ցուցանիշների դեպքում 7-15% սխալներ է թույլ տալիս։ Պատահական փոխարինումներ են սպասվում անվանումներով միավորների, թվերի և հաստ տեխնիկական բառապաշարի դեպքում։ Տեղեկատվության մեծ մասը ճիշտ է։ (Tier B, 7-15% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)

Question 2

արաբերեն-ը ձայնային-տեքստական փոխանցումը անվճար է ՞։

Accepted Answer

Այո — արաբերեն-ի փոխանցումը նախևառաջ ձեր օրական անվճար տոկոսադրույքներից է վերցնում։ Ավտոմատ ձայնագրությունը րոպեական 50 տոկոսադրույք է պահանջում, այսպիսով անանուն օրական տոկոսադրույքը օրական մի քանի ժամ ձայնագրություն է ներառում։ Գրանցված հաշիվները ստանում են ավելի մեծ տոկոսադրույք և 10,000 գրանցման տոկոսադրույք։ Այնուհետև $1-ը գնում է 750,000 տոկոսադրույք (~250 րոպե ձայնագրություն)։

Question 3

Արդյո՞ք փոխանցողը կառավարում է արաբերեն լեզուները։

Accepted Answer

Արաբերենը լռելյայն կառավարվում է Օրգանական արաբերենի (MSA) մակարդակով։ Եգիպտական, Լևանտինյան, Գոլֆ և Մագրեբի լեզուների խոսակցությունները ճանաչվում են, բայց թարգմանվում են MSA ուղղագրությամբ՝ Whisper-ը չի լատինականացնում կամ պահպանում է լեզուների հատուկ գրաբարը։ Մագրեբի կամ եգիպտական լեզուների լեզվակիրները սպասում են B-մակարդակ ճշգրտության։

Question 4

Ո՞ր ձայնային ձևաչափերն են աջակցվում արաբերեն-ի փոխանցման համար։

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS և WEBM ֆայլերը ընդունվում են ուղղակիորեն։ Տեսահոլովակների (MP4, MOV, MKV) դեպքում ձայնային սկավառակը սերվերի կողմից է վերցվում և ուղարկվում Whisper-ին՝ առանց որևէ բան փոխակերպելու։ Միևնույն սկավառակը, անկախ աղբյուրի լեզվից, ներառյալ արաբերեն-ը։

Question 5

Որքա՞ն երկար կարող է լինել արաբերեն ձայնային ֆայլը։

Accepted Answer

Անանուն կերպով ներբեռնման չափը կազմում է 500 ՄԲ յուրաքանչյուր ֆայլի համար։ Գրանցված հաշիվները հասնում են մինչև 2 ԳԲ։ Տևողությունը սահմանափակ չէ՝ երկար ֆայլերը ավտոմատ կերպով բաժանվում են (30 վայրկյան տևողությամբ պատուհաններ, որոնք միմյանց են հաջորդում) և միավորվում են մեկ ձայնագրության մեջ՝ շարունակական ժամանակային նշումներով։ Շատ ժամեր տևող արաբերեն ձայնագրությունները (podcasts, ամբողջական դասընթացներ, հանդիպումներ) լավ են աշխատում։

Question 6

արաբերեն-ի տրանսկրիպտը տարբեր խոսողների՞ն է ճանաչում։

Accepted Answer

Այո, լռելյայն ներառված է յուրաքանչյուր արաբերեն ձայնագրության համար։ Էջը բաժանված է 1-ին / 2-րդ / 3-րդ ձայնագրության ժամանակային նշաններով, այսպես որ հարցազրույցները, քննարկումները և բազմակողմանի հանդիպումները վերադարձվում են նշված։ Լռելյայն ներառված է նաև ձայնագրության մոդելը, որը նույնն է բոլոր լեզուների համար, որոնք մենք աջակցում ենք։

Question 7

Կարո՞ղ եմ վերարտադրել արաբերեն YouTube տեսանյութը կամ podcast-ը։

Accepted Answer

Այո, URL- ը կպցրեք /transcribe/youtube/ URL- ին YouTube- ի համար կամ /transcribe/podcast/ URL- ին podcast- ի համար (Apple, Spotify, RSS)։ Մենք ներբեռնում ենք ձայնը, այն գործարկվում է Whisper- ի միջոցով language=ar- ի հետ, և վերադարձնում ենք transcript- ը ժամանակային նշաններով և խոսնակի պիտակներով։ Տիպիկ արաբերեն պարունակությունը` արաբերեն-ում լուրերի կտորներ, քարոզներ, դասընթացներ և քաղաքական հարցազրույցներ են ամենատարածված աշխատանքային ծանրաբեռնվածությունները։ YouTube URL-ը կպցրեք /transcribe/youtube/ կամ տեղադրեք ֆայլը։

Question 8

Որքա՞ն է արժե արաբերեն-ի ձայնային ալիքի մեկ ժամը տոկոսներով։

Accepted Answer

Whisper-ը արժե մոտ 50 տոկոս ձայնագրության րոպեի համար, այսինքն մեկ ժամվա ձայնագրությունը արժե ~3000 տոկոս։ $1-ը գնում է 750,000 տոկոս, ինչը նշանակում է մոտավորապես 250 ժամ ձայնագրություն մեկ դոլարի դիմաց։ Բոլորից շատ օգտագործողները երբեք ոչինչ չեն ծախսում, քանի որ անվճար օրական գումարը ներառում է կարճ տեսանյութեր, ձայնային գրառումներ և միանգամից մի քանի podcast-ներ։

Question 9

Կարո՞ղ եմ ստանալ արաբերեն ձայնային ֆայլի համար բառային մակարդակով ժամանակային նշաններ

Accepted Answer

Այո, ևս երկուսը՝ սեկցիոն մակարդակի (յուրաքանչյուր ~10-30 վայրկյանում) և բառային մակարդակի ժամանակային նշանները հասանելի են։ Բառային մակարդակը VTT/SRT ենթատեքստի արտահանման համար լռելյայն է, այնպես որ վերնագրերը սխալվում են տող առ տող։ API-ում պահանջի մարմնի մեջ սահմանել է timestamps="word"։ արաբերեն տրանսկրիպտները վերադարձվում են իրենց բնական աջից ձախ սկրիպտում և ճիշտ են ցուցադրվում ցանկացած RTL-ի ճանաչող դիտողում (բրաուզերներ, Word, Google Docs)։

Question 10

Կա՞ API արաբերեն-ի փոխանցման համար։

Accepted Answer

Այո։ POST ձայնային (multipart/form-data, դաշտի անունը "file") /v1/transcribe/ language=ar — կամ բաց թողնել լեզվի պարամետրը, որպեսզի Whisper-ը ինքնաբերաբար հայտնաբերի այն։ Վերադարձնում է JSON-ը, որը պարունակում է ձայնագրությունը, սեկցիաները, ժամանակային նշանները և խոսնակի պիտակները։ Ամբողջական հղումը և SDK-ի հատվածները /api/ կայքում են։

Question 11

Կարո՞ղ եմ թարգմանել արաբերեն-ի ձայնագրությունը այլ լեզու։

Accepted Answer

Այո, երբ վերծանումը ավարտվի, սեղմեք Թարգմանել կամ կպցրեք տեքստը /translate/ ցուցակում։ արաբերեն-ը համընկնում է մեր աջակցվող բոլոր այլ լեզուների հետ (200+)։ Հանդիպումների րոպեների համար վերծանումը ուղարկեք /summarize/ ցուցակով։ Դիբյուտի համար ուղարկեք /voice/tts/ ցուցակով՝ ձայնը նպատակային լեզվով ցուցադրելու համար։

Question 12

Ի՞նչ անել, եթե արաբերեն-ի ձայնը աղմկոտ է կամ ցածր որակով է

Accepted Answer

Whisper-ը սովորեցվել է հարյուրավոր հազարավոր ժամերի իրական ձայնագրության վրա, այնպես որ այն կարող է դիմանալ ֆոնային աղմուկին և հեռախոսային որակի ձայնագրություններին արաբերեն-ում։ Լավագույն արդյունքների համար, ապահովեք մաքուր ձայնագրություն (հեռախոսային միկրոֆոն, առանց երաժշտական սենյակ)՝ այս մակարդակում աղմուկը ավելացնում է հիմքային սխալների տոկոսը։Եթե ձայնագրությունը չի աշխատում, ուղարկեք այն contact@free.ai հասցեին՝ ֆայլի հետ միասին — մենք կվերադարձնենք տոկոսները և կտեսնենք, թե արդյոք այլ համակարգը ավելի լավ է աշխատում ձեր ձայնագրության հետ։

Լեզու	արաբերեն
ISO կոդ	`ar`
Օգտագործողի մոդել	արագ շշնջալ
Գին	Ազատ

Ազատ արաբերեն Հատվածագրում

Ինչպես է այն աշխատում

արաբերեն Հատկություններ

Լեզվի մանրամասներ

Ավելի շատ լեզուներ

Հաճախ տրվող հարցեր