Question 1

Kiek tiksliai yra Whisper transkripcija valų?

Accepted Answer

valų is vid-resource language for Whisper – large-v3-turbo lands in the 15-25% word error rate. Transkripto turinys yra patikimas; tikėtis pavadinimų klaidų, retkarčiais koduojančių žiebtuvėlių ir trumpo ištarimo paklaidų. Planuokite žmogaus leidimą leidybai-kokybei.(Tier C, 15-25% word error rate lyginamųjų indeksų rinkiniuose – skelbiame sąžiningas WER pakopas, o ne rinkodaros reikalavimus.)

Question 2

Ar valų audio-to-teksto transkripcija nemokama?

Accepted Answer

Taip — valų Transkripcija pirmiausiai patraukia iš jūsų kasdienio nemokamo žetono. Garso kaštai kainuoja apie 50 žetonų per minutę, todėl anoniminis dienos baseinas apima kelias valandas garso per dieną. Pasirašyta paskyra gauna didesnį fondą ir 10 000 ženklų. Praeityje 1 doleris perka 750 000 žetonų (~250 valandų garso).

Question 3

Kokį scenarijų ir ortografiją naudoja valų transkriptas?

Accepted Answer

valų transkriptai grąžinami standartinėje UTF-8 su normalia kalbos ortografija.

Question 4

Kokie garso formatai palaikomi valų transkripcijos?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS, ir WEBM yra priimami tiesiogiai. Vaizdo (MP4, MOV, MKV) ištraukiame garso takelių serverio pusę prieš siunčiame jį į Whisper - jums nereikia konvertuoti nieko sau. Tas pats vamzdynas nepriklausomai nuo šaltinio kalbos, įskaitant valų.

Question 5

Kiek laiko gali būti valų audio failas?

Accepted Answer

Anoniminis įkelia dangtelį maždaug 500 MB vienam failui. Pasirašyta paskyra siekia iki 2 GB. Trukmė nėra didelė — ilgi failai automatiškai komplektuojami (30 sekundžių su sutapimu) ir surišti atgal į vieną transkriptą su nuolatinėmis žymomis. Daugiavalandiai valų įrašai (podcasts, pilnos paskaitos, susitikimai) veikia gerai.

Question 6

Ar valų transkriptas identifikuoja skirtingus garsiakalbius?

Accepted Answer

Taip — garsiakalbio diarizacija yra pagal nutylėjimą už kiekvieną valų transscript. Rezultatas yra segmentuojamas kaip Garsiakalbis 1 / Garsiakalbis 2 / Garsiakalbis 3 su timestamp reikšmėmis, todėl interviu, skydo diskusijos, ir daugiapartijų susitikimai grįžti žymėti. Diarizacija vyksta su atskiru modeliu ir veikia vienodai visose kalbose mes palaikome.

Question 7

Ar galima perrašyti valų YouTube video ar podcast?

Accepted Answer

Taip — įklijuokite URL į / transkripcija/ youtube/ YouTube arba / transkripcija/podcast/ podcast/ podcast kanalus (Aplikacija, Spotify, RSS). Atsisiunčiame garsą, paleiskite jį per Whisper kalba=cy ir grąžinkite transkripciją su žymomis ir garsiakalbiais. Tipinis valų turinys: paskaitos, interviu, balso užrašai, ir "YouTube" turinys valų visi darbai — įdėti URL į / transliuoti / youtube / arba įkelti failą tiesiogiai.

Question 8

Kiek valų audio kaina žetonų valandą?

Accepted Answer

Whisper kainuoja apie 50 žetonų per minutę garso, todėl vienos valandos įrašas yra ~ 3000 žetonų. $ 1 perka 750000 žetonų, kuris veikia maždaug 250 valandų garso už dolerį. Dauguma vartotojų niekada praleisti nieko – nemokamas dienos baseinas apima trumpus klipus, balso užrašus, ir vienkartinių podcast.

Question 9

Ar galiu gauti žodžio lygio žymes valų audio?

Accepted Answer

Taip — yra tiek segmento lygis (kas ~10-30 sekundžių), tiek žodžio lygio žymos. Žodžių lygis yra numatytasis VTT/SRT subtitrų eksportui, todėl antraštės sinchronizuoja eilutę pagal eilę. API set žymos="žodis" užklausoje institucijoje. valų transkriptai grąžinami standartinėje UTF-8 su normalia kalbos ortografija.

Question 10

Ar yra API valų transkripcijai?

Accepted Answer

Taip. Po garso (daugiadalis/forma-duomenys, lauko pavadinimas "failas") /v1/tractor/ su kalba=cy – arba praleisti kalbos parametrą, kad Whisper automatiškai nustatyti. Grįžta JSON su stenograma, segmentai, žymos, ir garsiakalbio etiketėmis. Visas nuoroda ir SDK fragmentai ties /api/.

Question 11

Ar galiu išversti valų transkriptą į kitą kalbą?

Accepted Answer

Taip — kai transkripcija baigiasi, spustelėkite Paspauskite arba įklijuokite tekstą į /translate/. valų poros su kiekviena kita kalba, mes palaikome (200+). Norėdami susitikti minučių stenogramą per /summarize/; dubbbing siųsti jį į /balsas/ tts/ padaryti garso tikslinės kalbos.

Question 12

Kas, jei valų audio yra triukšmingas ar žemos kokybės?

Accepted Answer

Whisper triukšmas patvarumas vis dar taikomas valų, bet šiuo tikslu bet koks papildomas triukšmas sujungia bazinį klaidų lygį. Švarios ausinės audio suteikia pastebimus geresnius rezultatus nei telefonas ar nešiojamieji mikrofonai.Jei transkriptas grįžta nenaudingas, el. paštas contact@free.ai su failu – mes grąžinti simbolius ir pažvelgti, ar kitas variklis veikia jūsų garso geriau.

Kalba	valų
ISO kodas	`cy`
AI modelis	greitesnis whisper
Kaina	Neapmuitinama

Laisvas valų perrašymas

Kaip tai veikia

valų perrašymo savybės

Kalbos detalės

Daugiau kalbų

DUK