Ազատ թայերեն Հատվածագրում
Առաջարկվում է թարգմանել թայերեն ձայնային և տեսահոլովակները տեքստի։ Շատ արագ, ճշգրիտ և անվճար։
Ինչպես է այն աշխատում
- Գնալ դեպի Free.ai-ի թարգմանիչ
- Բեռնել թայերեն ձայնային կամ վիդեո ֆայլը
- Մեր ինտելեկտուալ սարքը ինքնաբերաբար հայտնաբերում է թայերեն և փոխանցում այն
- Տեղադրել ձեր ձայնագրությունը որպես տեքստը կամ SRT ենթատեքստերը
թայերեն Հատկություններ
- ✓Օգտագործվում է faster-whisper-ի կողմից (MIT-ի լիցենզիա)
- ✓թայերեն լեզվի ինքնաբերաբար հայտնաբերում
- ✓աջակցում է MP3, WAV, MP4, M4A, FLAC և այլն
- ✓Ժամանակագրական նշաններ և ենթատեքստերի արտահանում (SRT)
- ✓Փոխհատուցվող պլանների դեպքում ցուցակի չափի սահմանափակում չկա
- ✓Անանուն և անվտանգ -- ֆայլերը վերացվում են գործընթացից հետո
Լեզվի մանրամասներ
| Լեզու | թայերեն |
| ISO կոդ | th |
| Օգտագործողի մոդել | արագ շշնջալ |
| Գին | Ազատ |
Ավելի շատ լեզուներ
Դիտել բոլոր լեզուներըՀաճախ տրվող հարցեր
թայերեն-ը Whisper-ի համար միջին ռեսուրսների լեզուն է — մեծ-v3-turbo-ն ընկնում է 15-25% բառային սխալների ցուցանիշի շրջանակում։ Տեղեկատվության բովանդակությունը վստահելի է, սպասեք անուն ունեցող բովանդակության սխալների, ժամանակ առ ժամանակ կոդ փոխելու սխալների և կարճ արտահայտությունների սխալների։ Պլանավորեք մարդկային անցում հրապարակման որակի ելքի համար։ (Tier C, 15-25% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)
Այո — թայերեն-ի փոխանցումը նախևառաջ ձեր օրական անվճար տոկոսադրույքներից է վերցնում։ Ավտոմատ ձայնագրությունը րոպեական 50 տոկոսադրույք է պահանջում, այսպիսով անանուն օրական տոկոսադրույքը օրական մի քանի ժամ ձայնագրություն է ներառում։ Գրանցված հաշիվները ստանում են ավելի մեծ տոկոսադրույք և 10,000 գրանցման տոկոսադրույք։ Այնուհետև $1-ը գնում է 750,000 տոկոսադրույք (~250 րոպե ձայնագրություն)։
թայերեն-ի տրանսկրիպտները վերադարձվում են ստանդարտ UTF-8-ով՝ լեզվի բնական ուղղագրությամբ։
MP3, WAV, M4A, FLAC, OGG, OPUS և WEBM ֆայլերը ընդունվում են ուղղակիորեն։ Տեսահոլովակների (MP4, MOV, MKV) դեպքում ձայնային սկավառակը սերվերի կողմից է վերցվում և ուղարկվում Whisper-ին՝ առանց որևէ բան փոխակերպելու։ Միևնույն սկավառակը, անկախ աղբյուրի լեզվից, ներառյալ թայերեն-ը։
Անանուն կերպով ներբեռնման չափը կազմում է 500 ՄԲ յուրաքանչյուր ֆայլի համար։ Գրանցված հաշիվները հասնում են մինչև 2 ԳԲ։ Տևողությունը սահմանափակ չէ՝ երկար ֆայլերը ավտոմատ կերպով բաժանվում են (30 վայրկյան տևողությամբ պատուհաններ, որոնք միմյանց են հաջորդում) և միավորվում են մեկ ձայնագրության մեջ՝ շարունակական ժամանակային նշումներով։ Շատ ժամեր տևող թայերեն ձայնագրությունները (podcasts, ամբողջական դասընթացներ, հանդիպումներ) լավ են աշխատում։
Այո, լռելյայն ներառված է յուրաքանչյուր թայերեն ձայնագրության համար։ Էջը բաժանված է 1-ին / 2-րդ / 3-րդ ձայնագրության ժամանակային նշաններով, այսպես որ հարցազրույցները, քննարկումները և բազմակողմանի հանդիպումները վերադարձվում են նշված։ Լռելյայն ներառված է նաև ձայնագրության մոդելը, որը նույնն է բոլոր լեզուների համար, որոնք մենք աջակցում ենք։
Այո, URL- ը կպցրեք /transcribe/youtube/ URL- ին YouTube- ի համար կամ /transcribe/podcast/ URL- ին podcast- ի համար (Apple, Spotify, RSS)։ Մենք ներբեռնում ենք ձայնը, այն գործարկվում է Whisper- ի միջոցով language=th- ի հետ, և վերադարձնում ենք transcript- ը ժամանակային նշաններով և խոսնակի պիտակներով։ Տիպիկ թայերեն պարունակությունը` դասընթացներ, հարցազրույցներ, ձայնային գրառումներ և YouTube-ի բովանդակությունը թայերեն-ում բոլորը աշխատում են — կպցրեք URL-ը /transcribe/youtube/-ում կամ ուղղակիորեն ներբեռնեք ֆայլը։
Whisper-ը արժե մոտ 50 տոկոս ձայնագրության րոպեի համար, այսինքն մեկ ժամվա ձայնագրությունը արժե ~3000 տոկոս։ $1-ը գնում է 750,000 տոկոս, ինչը նշանակում է մոտավորապես 250 ժամ ձայնագրություն մեկ դոլարի դիմաց։ Բոլորից շատ օգտագործողները երբեք ոչինչ չեն ծախսում, քանի որ անվճար օրական գումարը ներառում է կարճ տեսանյութեր, ձայնային գրառումներ և միանգամից մի քանի podcast-ներ։
Այո, ևս երկուսը՝ սեկցիոն մակարդակի (յուրաքանչյուր ~10-30 վայրկյանում) և բառային մակարդակի ժամանակային նշանները հասանելի են։ Բառային մակարդակը VTT/SRT ենթատեքստի արտահանման համար լռելյայն է, այնպես որ վերնագրերը սխալվում են տող առ տող։ API-ում պահանջի մարմնի մեջ սահմանել է timestamps="word"։ թայերեն-ի տրանսկրիպտները վերադարձվում են ստանդարտ UTF-8-ով՝ լեզվի բնական ուղղագրությամբ։
Այո։ POST ձայնային (multipart/form-data, դաշտի անունը "file") /v1/transcribe/ language=th — կամ բաց թողնել լեզվի պարամետրը, որպեսզի Whisper-ը ինքնաբերաբար հայտնաբերի այն։ Վերադարձնում է JSON-ը, որը պարունակում է ձայնագրությունը, սեկցիաները, ժամանակային նշանները և խոսնակի պիտակները։ Ամբողջական հղումը և SDK-ի հատվածները /api/ կայքում են։
Այո, երբ վերծանումը ավարտվի, սեղմեք Թարգմանել կամ կպցրեք տեքստը /translate/ ցուցակում։ թայերեն-ը համընկնում է մեր աջակցվող բոլոր այլ լեզուների հետ (200+)։ Հանդիպումների րոպեների համար վերծանումը ուղարկեք /summarize/ ցուցակով։ Դիբյուտի համար ուղարկեք /voice/tts/ ցուցակով՝ ձայնը նպատակային լեզվով ցուցադրելու համար։
Whisper-ի աղմուկի արդյունավետությունը դեռևս գործում է թայերեն-ի վրա, բայց այս ճշգրտության մակարդակում ցանկացած ավելորդ աղմուկը ավելացնում է հիմքային սխալի տոկոսը։ Շնչառական ականջակալների ձայնը ավելի լավ արդյունք է տալիս, քան հեռախոսի կամ նոութբուքի միկրոֆոնի ձայնագրությունը։Եթե ձայնագրությունը չի աշխատում, ուղարկեք այն contact@free.ai հասցեին՝ ֆայլի հետ միասին — մենք կվերադարձնենք տոկոսները և կտեսնենք, թե արդյոք այլ համակարգը ավելի լավ է աշխատում ձեր ձայնագրության հետ։