Ազատ հինդի Հատվածագրում

Առաջարկվում է թարգմանել հինդի ձայնային և տեսահոլովակները տեքստի։ Շատ արագ, ճշգրիտ և անվճար։

Ինչպես է այն աշխատում

  1. Գնալ դեպի Free.ai-ի թարգմանիչ
  2. Բեռնել հինդի ձայնային կամ վիդեո ֆայլը
  3. Մեր ինտելեկտուալ սարքը ինքնաբերաբար հայտնաբերում է հինդի և փոխանցում այն
  4. Տեղադրել ձեր ձայնագրությունը որպես տեքստը կամ SRT ենթատեքստերը

հինդի Հատկություններ

  • Օգտագործվում է faster-whisper-ի կողմից (MIT-ի լիցենզիա)
  • հինդի լեզվի ինքնաբերաբար հայտնաբերում
  • աջակցում է MP3, WAV, MP4, M4A, FLAC և այլն
  • Ժամանակագրական նշաններ և ենթատեքստերի արտահանում (SRT)
  • Փոխհատուցվող պլանների դեպքում ցուցակի չափի սահմանափակում չկա
  • Անանուն և անվտանգ -- ֆայլերը վերացվում են գործընթացից հետո

Լեզվի մանրամասներ

Լեզուհինդի
ISO կոդhi
Օգտագործողի մոդելարագ շշնջալ
ԳինԱզատ

Ավելի շատ լեզուներ

Դիտել բոլոր լեզուները

Հաճախ տրվող հարցեր

Whisper large-v3-turbo-ն հինդի-ը լավ է կառավարում, ձայնային ցուցանիշների դեպքում 7-15% սխալներ է թույլ տալիս։ Պատահական փոխարինումներ են սպասվում անվանումներով միավորների, թվերի և հաստ տեխնիկական բառապաշարի դեպքում։ Տեղեկատվության մեծ մասը ճիշտ է։ (Tier B, 7-15% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)

Այո — հինդի-ի փոխանցումը նախևառաջ ձեր օրական անվճար տոկոսադրույքներից է վերցնում։ Ավտոմատ ձայնագրությունը րոպեական 50 տոկոսադրույք է պահանջում, այսպիսով անանուն օրական տոկոսադրույքը օրական մի քանի ժամ ձայնագրություն է ներառում։ Գրանցված հաշիվները ստանում են ավելի մեծ տոկոսադրույք և 10,000 գրանցման տոկոսադրույք։ Այնուհետև $1-ը գնում է 750,000 տոկոսադրույք (~250 րոպե ձայնագրություն)։

Հնդկական ձայնագրությունը հաճախ խառնվում է անգլերենի հետ (Hinglish) քաղաքային խոսակցության ժամանակ։ Whisper- ը կառավարում է խառնվածքը և անգլերեն բառերը թարգմանում է լատինական գրությամբ, իսկ հնդկական բառերը՝ դեվանագարի գրությամբ նույն թարգմանության մեջ։ Գյուղական խոսակցությունը, որը պարունակում է շատ տեղական բառապաշար, կարող է ընկնել C- աստիճանի ճշգրտության մեջ։

MP3, WAV, M4A, FLAC, OGG, OPUS և WEBM ֆայլերը ընդունվում են ուղղակիորեն։ Տեսահոլովակների (MP4, MOV, MKV) դեպքում ձայնային սկավառակը սերվերի կողմից է վերցվում և ուղարկվում Whisper-ին՝ առանց որևէ բան փոխակերպելու։ Միևնույն սկավառակը, անկախ աղբյուրի լեզվից, ներառյալ հինդի-ը։

Անանուն կերպով ներբեռնման չափը կազմում է 500 ՄԲ յուրաքանչյուր ֆայլի համար։ Գրանցված հաշիվները հասնում են մինչև 2 ԳԲ։ Տևողությունը սահմանափակ չէ՝ երկար ֆայլերը ավտոմատ կերպով բաժանվում են (30 վայրկյան տևողությամբ պատուհաններ, որոնք միմյանց են հաջորդում) և միավորվում են մեկ ձայնագրության մեջ՝ շարունակական ժամանակային նշումներով։ Շատ ժամեր տևող հինդի ձայնագրությունները (podcasts, ամբողջական դասընթացներ, հանդիպումներ) լավ են աշխատում։

Այո, լռելյայն ներառված է յուրաքանչյուր հինդի ձայնագրության համար։ Էջը բաժանված է 1-ին / 2-րդ / 3-րդ ձայնագրության ժամանակային նշաններով, այսպես որ հարցազրույցները, քննարկումները և բազմակողմանի հանդիպումները վերադարձվում են նշված։ Լռելյայն ներառված է նաև ձայնագրության մոդելը, որը նույնն է բոլոր լեզուների համար, որոնք մենք աջակցում ենք։

Այո, URL- ը կպցրեք /transcribe/youtube/ URL- ին YouTube- ի համար կամ /transcribe/podcast/ URL- ին podcast- ի համար (Apple, Spotify, RSS)։ Մենք ներբեռնում ենք ձայնը, այն գործարկվում է Whisper- ի միջոցով language=hi- ի հետ, և վերադարձնում ենք transcript- ը ժամանակային նշաններով և խոսնակի պիտակներով։ Տիպիկ հինդի պարունակությունը` WhatsApp ձայնային գրառումները, YouTube վիդեոբլոգները և կարճ տեսագրությունները հինդի-ի ամենատարածված աշխատանքային ծանրաբեռնվածություններն են՝ URL-ը /transcribe/youtube/-ում տեղադրել կամ ձայնը ուղղակիորեն տեղադրել։

Whisper-ը արժե մոտ 50 տոկոս ձայնագրության րոպեի համար, այսինքն մեկ ժամվա ձայնագրությունը արժե ~3000 տոկոս։ $1-ը գնում է 750,000 տոկոս, ինչը նշանակում է մոտավորապես 250 ժամ ձայնագրություն մեկ դոլարի դիմաց։ Բոլորից շատ օգտագործողները երբեք ոչինչ չեն ծախսում, քանի որ անվճար օրական գումարը ներառում է կարճ տեսանյութեր, ձայնային գրառումներ և միանգամից մի քանի podcast-ներ։

Այո, ևս երկուսը՝ սեկցիոն մակարդակի (յուրաքանչյուր ~10-30 վայրկյանում) և բառային մակարդակի ժամանակային նշանները հասանելի են։ Բառային մակարդակը VTT/SRT ենթատեքստի արտահանման համար լռելյայն է, այնպես որ վերնագրերը սխալվում են տող առ տող։ API-ում պահանջի մարմնի մեջ սահմանել է timestamps="word"։ հինդի transscripts returned in Devanagari script (UTF-8) Վիքիպահեստում

Այո։ POST ձայնային (multipart/form-data, դաշտի անունը "file") /v1/transcribe/ language=hi — կամ բաց թողնել լեզվի պարամետրը, որպեսզի Whisper-ը ինքնաբերաբար հայտնաբերի այն։ Վերադարձնում է JSON-ը, որը պարունակում է ձայնագրությունը, սեկցիաները, ժամանակային նշանները և խոսնակի պիտակները։ Ամբողջական հղումը և SDK-ի հատվածները /api/ կայքում են։

Այո, երբ վերծանումը ավարտվի, սեղմեք Թարգմանել կամ կպցրեք տեքստը /translate/ ցուցակում։ հինդի-ը համընկնում է մեր աջակցվող բոլոր այլ լեզուների հետ (200+)։ Հանդիպումների րոպեների համար վերծանումը ուղարկեք /summarize/ ցուցակով։ Դիբյուտի համար ուղարկեք /voice/tts/ ցուցակով՝ ձայնը նպատակային լեզվով ցուցադրելու համար։

Whisper-ը սովորեցվել է հարյուրավոր հազարավոր ժամերի իրական ձայնագրության վրա, այնպես որ այն կարող է դիմանալ ֆոնային աղմուկին և հեռախոսային որակի ձայնագրություններին հինդի-ում։ Լավագույն արդյունքների համար, ապահովեք մաքուր ձայնագրություն (հեռախոսային միկրոֆոն, առանց երաժշտական սենյակ)՝ այս մակարդակում աղմուկը ավելացնում է հիմքային սխալների տոկոսը։Եթե ձայնագրությունը չի աշխատում, ուղարկեք այն contact@free.ai հասցեին՝ ֆայլի հետ միասին — մենք կվերադարձնենք տոկոսները և կտեսնենք, թե արդյոք այլ համակարգը ավելի լավ է աշխատում ձեր ձայնագրության հետ։

Սիրում ես Free.ai-ը, ասա ընկերներիդ։

Առաջարկել այս էջը