faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 Ցուցադրել minute

Առաջարկել ձայնային կամ տեսագրական ֆայլ կամ ներքևում տեղադրել URL

~500 Ցուցադրել minute

faster-whisper large-v3 is a ձայնից-տեքստի մոդել built by OpenAI / SYSTRAN. Ֆրանսիայի ազգային հավաքականի կազմում Ֆրանսիայի առաջնությունում (ֆր.՝ Ligue 1). Free.ai GPU-ների վրա ինքնուրույն տեղադրված — աշխատում է անվճար ձեր օրական token pool-ի դեմ (500 tokens րոպե). Free.ai-ի տակ թողարկված է MIT — առևտրային օգտագործման թույլտվություն.

Օգտագործել API- ի միջոցով

OpenAI-ի հետ համընկնող REST API-ն է։ Գործարկեք կոդը և մի քանի վայրկյանում զանգահարեք այս մոդելին։

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
API փաստաթղթավորում Գրանցվել API կոդով

Հաճախակի տրվող հարցեր

faster-whisper large-v3-ը ձայնային հաղորդագրությունները փոխակերպում է տեքստի։ Փոխադրեք MP3, WAV, M4A կամ վիդեո ֆայլ և faster-whisper large-v3-ը կվերադարձնի ամբողջական փոխակերպումը և SRT/VTT ենթատեքստերը ժամանակային նշումներով։

faster-whisper large-v3-ը բաշխված է տասնյակ լեզուների վրա — Whisper-ի ընտանիքի մոդելները ներառում են 90+, Parakeet-ը ներառում է ~25, մյուսները տարբերվում են։ Ամենաբարձր ճշգրտության համար ընտրեք «auto-detect» կամ նշեք լեզու։

Խոսքի սխալների ցուցանիշը 5-10% է անգլերեն լեզվի դեպքում, 10-20%` աղմկոտ կամ ակցենտավոր լեզվի դեպքում։ Այդ նույն ճարտարապետության մեծ տարբերակները ավելի լավ են աշխատում դժվար օրինակներում, ավելի մեծը ընտրել, երբ լեզուն խիստ է։

Այո, յուրաքանչյուր հատված ներառում է սկզբ/ավարտ ժամանակային նշաններ։ Արտահանել որպես SRT կամ VTT և ժամանակային նշանները ուղղակիորեն նկարել Ձեր տեսանյութում։

faster-whisper large-v3-ը աշխատում է մեր սեփական GPU-ների վրա, սկզբում ձեր օրական անվճար ռեսուրսների հաշվին, հետո $5 → 200,000 վճարված տոկոսադրույքով։ Մոտավորապես ~500 տոկոսադրույքով րոպեում։

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — մենք դուրս ենք բերում ձայնը։ Ավելի շատ 500 ՄԲ մեկ բեռնման համար։ Ավելի երկար ֆայլեր? Փոխարինել /audio/cut/-ով կամ օգտագործել /v1/stt/batch/-ը։

1999 թվականից 2002 թվականը նկարահանվել է «Անհիշելի կինը» ֆիլմում։ 2002 թվականից 2004 թվականը նկարահանվել է «Անհիշելի կինը 2» ֆիլմում։ 2004 թվականից 2006 թվականը նկարահանվել է «Անհիշելի կինը 2» ֆիլմում։

Այո — /batch/-ը ընդունում է ձայնային ֆայլերի պանակ։ Յուրաքանչյուր ձայնագրություն տեղադրվում է /account/?tab=history պանակում՝ սկզբնական ֆայլի անունով։ Ծառի պանակի պահպանման համար օգտագործեք API-ն։

Այո — POST ձայնային տվյալները /v1/stt/transcribe/-ին՝ model="faster-whisper large-v3"-ով։ Վերադարձնում է JSON-ը տեքստի + հատվածների + բառային մակարդակով ժամանակային նշաններով։ /api/-ը ունի ամբողջական հղում։

Իրենց վրա աշխատող մոդելները պահում են ձայնը մեր GPU-ներում, premium-ը անցնում է DPA-ով։ Ձայնը հեռացվում է կիսում-պատուհանի (24 ժամ անոն, 7 օր մուտքագրում) ավարտին։ Մենք չենք սովորում ձեր մուտքագրումներից։

Այո — Free.ai-ը թույլ է տալիս օգտագործել ձայնագրությունները առևտրային նպատակներով։ Դուք պետք է ունեք ձեր տեղադրած ձայնագրության իրավունքները (ձեր սեփական ձայնագրությունը, լիցենզավորված նյութը կամ համաձայնությամբ ներառված բովանդակությունը)։

Օգտագործեք ընթացիկ ժամանակի գործոնը մոտավորապես 0.05-0.2× — 60 րոպեանոց podcast-ը վերծանում է 3-12 րոպեում։ Premium մոդելները հաճախ ավելի արագ են ավարտվում։ Ձեռքի վրա պահեք ընթացիկ ժամանակի գործոնը, որպեսզի փակեք վահանակը։

Սիրում ես Free.ai-ը, ասա ընկերներիդ։

Առաջարկել այս էջը