Question 1

Որքան ճշգրիտ է Whisper-ի հինդի-ի թարգմանությունը։

Accepted Answer

Whisper large-v3-turbo-ն հինդի-ը լավ է կառավարում, ձայնային ցուցանիշների դեպքում 7-15% սխալներ է թույլ տալիս։ Պատահական փոխարինումներ են սպասվում անվանումներով միավորների, թվերի և հաստ տեխնիկական բառապաշարի դեպքում։ Տեղեկատվության մեծ մասը ճիշտ է։ (Tier B, 7-15% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)

Question 2

հինդի-ը ձայնային-տեքստական փոխանցումը անվճար է ՞։

Accepted Answer

Այո — հինդի-ի փոխանցումը նախևառաջ ձեր օրական անվճար տոկոսադրույքներից է վերցնում։ Ավտոմատ ձայնագրությունը րոպեական 50 տոկոսադրույք է պահանջում, այսպիսով անանուն օրական տոկոսադրույքը օրական մի քանի ժամ ձայնագրություն է ներառում։ Գրանցված հաշիվները ստանում են ավելի մեծ տոկոսադրույք և 10,000 գրանցման տոկոսադրույք։ Այնուհետև $1-ը գնում է 750,000 տոկոսադրույք (~250 րոպե ձայնագրություն)։

Question 3

Արդյո՞ք փոխանցողը կառավարում է հինդի լեզուները։

Accepted Answer

Հնդկական ձայնագրությունը հաճախ խառնվում է անգլերենի հետ (Hinglish) քաղաքային խոսակցության ժամանակ։ Whisper- ը կառավարում է խառնվածքը և անգլերեն բառերը թարգմանում է լատինական գրությամբ, իսկ հնդկական բառերը՝ դեվանագարի գրությամբ նույն թարգմանության մեջ։ Գյուղական խոսակցությունը, որը պարունակում է շատ տեղական բառապաշար, կարող է ընկնել C- աստիճանի ճշգրտության մեջ։

Question 4

Ո՞ր ձայնային ձևաչափերն են աջակցվում հինդի-ի փոխանցման համար։

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS և WEBM ֆայլերը ընդունվում են ուղղակիորեն։ Տեսահոլովակների (MP4, MOV, MKV) դեպքում ձայնային սկավառակը սերվերի կողմից է վերցվում և ուղարկվում Whisper-ին՝ առանց որևէ բան փոխակերպելու։ Միևնույն սկավառակը, անկախ աղբյուրի լեզվից, ներառյալ հինդի-ը։

Question 5

Որքա՞ն երկար կարող է լինել հինդի ձայնային ֆայլը։

Accepted Answer

Անանուն կերպով ներբեռնման չափը կազմում է 500 ՄԲ յուրաքանչյուր ֆայլի համար։ Գրանցված հաշիվները հասնում են մինչև 2 ԳԲ։ Տևողությունը սահմանափակ չէ՝ երկար ֆայլերը ավտոմատ կերպով բաժանվում են (30 վայրկյան տևողությամբ պատուհաններ, որոնք միմյանց են հաջորդում) և միավորվում են մեկ ձայնագրության մեջ՝ շարունակական ժամանակային նշումներով։ Շատ ժամեր տևող հինդի ձայնագրությունները (podcasts, ամբողջական դասընթացներ, հանդիպումներ) լավ են աշխատում։

Question 6

հինդի-ի տրանսկրիպտը տարբեր խոսողների՞ն է ճանաչում։

Accepted Answer

Այո, լռելյայն ներառված է յուրաքանչյուր հինդի ձայնագրության համար։ Էջը բաժանված է 1-ին / 2-րդ / 3-րդ ձայնագրության ժամանակային նշաններով, այսպես որ հարցազրույցները, քննարկումները և բազմակողմանի հանդիպումները վերադարձվում են նշված։ Լռելյայն ներառված է նաև ձայնագրության մոդելը, որը նույնն է բոլոր լեզուների համար, որոնք մենք աջակցում ենք։

Question 7

Կարո՞ղ եմ վերարտադրել հինդի YouTube տեսանյութը կամ podcast-ը։

Accepted Answer

Այո, URL- ը կպցրեք /transcribe/youtube/ URL- ին YouTube- ի համար կամ /transcribe/podcast/ URL- ին podcast- ի համար (Apple, Spotify, RSS)։ Մենք ներբեռնում ենք ձայնը, այն գործարկվում է Whisper- ի միջոցով language=hi- ի հետ, և վերադարձնում ենք transcript- ը ժամանակային նշաններով և խոսնակի պիտակներով։ Տիպիկ հինդի պարունակությունը` WhatsApp ձայնային գրառումները, YouTube վիդեոբլոգները և կարճ տեսագրությունները հինդի-ի ամենատարածված աշխատանքային ծանրաբեռնվածություններն են՝ URL-ը /transcribe/youtube/-ում տեղադրել կամ ձայնը ուղղակիորեն տեղադրել։

Question 8

Որքա՞ն է արժե հինդի-ի ձայնային ալիքի մեկ ժամը տոկոսներով։

Accepted Answer

Whisper-ը արժե մոտ 50 տոկոս ձայնագրության րոպեի համար, այսինքն մեկ ժամվա ձայնագրությունը արժե ~3000 տոկոս։ $1-ը գնում է 750,000 տոկոս, ինչը նշանակում է մոտավորապես 250 ժամ ձայնագրություն մեկ դոլարի դիմաց։ Բոլորից շատ օգտագործողները երբեք ոչինչ չեն ծախսում, քանի որ անվճար օրական գումարը ներառում է կարճ տեսանյութեր, ձայնային գրառումներ և միանգամից մի քանի podcast-ներ։

Question 9

Կարո՞ղ եմ ստանալ հինդի ձայնային ֆայլի համար բառային մակարդակով ժամանակային նշաններ

Accepted Answer

Այո, ևս երկուսը՝ սեկցիոն մակարդակի (յուրաքանչյուր ~10-30 վայրկյանում) և բառային մակարդակի ժամանակային նշանները հասանելի են։ Բառային մակարդակը VTT/SRT ենթատեքստի արտահանման համար լռելյայն է, այնպես որ վերնագրերը սխալվում են տող առ տող։ API-ում պահանջի մարմնի մեջ սահմանել է timestamps="word"։ հինդի transscripts returned in Devanagari script (UTF-8) Վիքիպահեստում

Question 10

Կա՞ API հինդի-ի փոխանցման համար։

Accepted Answer

Այո։ POST ձայնային (multipart/form-data, դաշտի անունը "file") /v1/transcribe/ language=hi — կամ բաց թողնել լեզվի պարամետրը, որպեսզի Whisper-ը ինքնաբերաբար հայտնաբերի այն։ Վերադարձնում է JSON-ը, որը պարունակում է ձայնագրությունը, սեկցիաները, ժամանակային նշանները և խոսնակի պիտակները։ Ամբողջական հղումը և SDK-ի հատվածները /api/ կայքում են։

Question 11

Կարո՞ղ եմ թարգմանել հինդի-ի ձայնագրությունը այլ լեզու։

Accepted Answer

Այո, երբ վերծանումը ավարտվի, սեղմեք Թարգմանել կամ կպցրեք տեքստը /translate/ ցուցակում։ հինդի-ը համընկնում է մեր աջակցվող բոլոր այլ լեզուների հետ (200+)։ Հանդիպումների րոպեների համար վերծանումը ուղարկեք /summarize/ ցուցակով։ Դիբյուտի համար ուղարկեք /voice/tts/ ցուցակով՝ ձայնը նպատակային լեզվով ցուցադրելու համար։

Question 12

Ի՞նչ անել, եթե հինդի-ի ձայնը աղմկոտ է կամ ցածր որակով է

Accepted Answer

Whisper-ը սովորեցվել է հարյուրավոր հազարավոր ժամերի իրական ձայնագրության վրա, այնպես որ այն կարող է դիմանալ ֆոնային աղմուկին և հեռախոսային որակի ձայնագրություններին հինդի-ում։ Լավագույն արդյունքների համար, ապահովեք մաքուր ձայնագրություն (հեռախոսային միկրոֆոն, առանց երաժշտական սենյակ)՝ այս մակարդակում աղմուկը ավելացնում է հիմքային սխալների տոկոսը։Եթե ձայնագրությունը չի աշխատում, ուղարկեք այն contact@free.ai հասցեին՝ ֆայլի հետ միասին — մենք կվերադարձնենք տոկոսները և կտեսնենք, թե արդյոք այլ համակարգը ավելի լավ է աշխատում ձեր ձայնագրության հետ։

Լեզու	հինդի
ISO կոդ	`hi`
Օգտագործողի մոդել	արագ շշնջալ
Գին	Ազատ

Ազատ հինդի Հատվածագրում

Ինչպես է այն աշխատում

հինդի Հատկություններ

Լեզվի մանրամասներ

Ավելի շատ լեզուներ

Հաճախ տրվող հարցեր