Question 1

Kiek tiksliai yra Whisper transkripcija katalonų?

Accepted Answer

Whisper didelis-v3-turbo žemės savo aukščiausio tikslumo pakopoje katalonų - iki 7% žodžio klaidų dažnis standartinių etalonų. Praktikoje tai reiškia, kad švari studija garso grįžta beveik tobulas, ir pokalbių garso yra naudojamas su minimaliu valymas.(Tier A, under 7% word error rate lyginamųjų indeksų rinkiniuose – skelbiame sąžiningas WER pakopas, o ne rinkodaros reikalavimus.)

Question 2

Ar katalonų audio-to-teksto transkripcija nemokama?

Accepted Answer

Taip — katalonų Transkripcija pirmiausiai patraukia iš jūsų kasdienio nemokamo žetono. Garso kaštai kainuoja apie 50 žetonų per minutę, todėl anoniminis dienos baseinas apima kelias valandas garso per dieną. Pasirašyta paskyra gauna didesnį fondą ir 10 000 ženklų. Praeityje 1 doleris perka 750 000 žetonų (~250 valandų garso).

Question 3

Kokį scenarijų ir ortografiją naudoja katalonų transkriptas?

Accepted Answer

katalonų transkriptai grąžinami standartinėje UTF-8 su normalia kalbos ortografija.

Question 4

Kokie garso formatai palaikomi katalonų transkripcijos?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS, ir WEBM yra priimami tiesiogiai. Vaizdo (MP4, MOV, MKV) ištraukiame garso takelių serverio pusę prieš siunčiame jį į Whisper - jums nereikia konvertuoti nieko sau. Tas pats vamzdynas nepriklausomai nuo šaltinio kalbos, įskaitant katalonų.

Question 5

Kiek laiko gali būti katalonų audio failas?

Accepted Answer

Anoniminis įkelia dangtelį maždaug 500 MB vienam failui. Pasirašyta paskyra siekia iki 2 GB. Trukmė nėra didelė — ilgi failai automatiškai komplektuojami (30 sekundžių su sutapimu) ir surišti atgal į vieną transkriptą su nuolatinėmis žymomis. Daugiavalandiai katalonų įrašai (podcasts, pilnos paskaitos, susitikimai) veikia gerai.

Question 6

Ar katalonų transkriptas identifikuoja skirtingus garsiakalbius?

Accepted Answer

Taip — garsiakalbio diarizacija yra pagal nutylėjimą už kiekvieną katalonų transscript. Rezultatas yra segmentuojamas kaip Garsiakalbis 1 / Garsiakalbis 2 / Garsiakalbis 3 su timestamp reikšmėmis, todėl interviu, skydo diskusijos, ir daugiapartijų susitikimai grįžti žymėti. Diarizacija vyksta su atskiru modeliu ir veikia vienodai visose kalbose mes palaikome.

Question 7

Ar galima perrašyti katalonų YouTube video ar podcast?

Accepted Answer

Taip — įklijuokite URL į / transkripcija/ youtube/ YouTube arba / transkripcija/podcast/ podcast/ podcast kanalus (Aplikacija, Spotify, RSS). Atsisiunčiame garsą, paleiskite jį per Whisper kalba=ca ir grąžinkite transkripciją su žymomis ir garsiakalbiais. Tipinis katalonų turinys: paskaitos, interviu, balso užrašai, ir "YouTube" turinys katalonų visi darbai — įdėti URL į / transliuoti / youtube / arba įkelti failą tiesiogiai.

Question 8

Kiek katalonų audio kaina žetonų valandą?

Accepted Answer

Whisper kainuoja apie 50 žetonų per minutę garso, todėl vienos valandos įrašas yra ~ 3000 žetonų. $ 1 perka 750000 žetonų, kuris veikia maždaug 250 valandų garso už dolerį. Dauguma vartotojų niekada praleisti nieko – nemokamas dienos baseinas apima trumpus klipus, balso užrašus, ir vienkartinių podcast.

Question 9

Ar galiu gauti žodžio lygio žymes katalonų audio?

Accepted Answer

Taip — yra tiek segmento lygis (kas ~10-30 sekundžių), tiek žodžio lygio žymos. Žodžių lygis yra numatytasis VTT/SRT subtitrų eksportui, todėl antraštės sinchronizuoja eilutę pagal eilę. API set žymos="žodis" užklausoje institucijoje. katalonų transkriptai grąžinami standartinėje UTF-8 su normalia kalbos ortografija.

Question 10

Ar yra API katalonų transkripcijai?

Accepted Answer

Taip. Po garso (daugiadalis/forma-duomenys, lauko pavadinimas "failas") /v1/tractor/ su kalba=ca – arba praleisti kalbos parametrą, kad Whisper automatiškai nustatyti. Grįžta JSON su stenograma, segmentai, žymos, ir garsiakalbio etiketėmis. Visas nuoroda ir SDK fragmentai ties /api/.

Question 11

Ar galiu išversti katalonų transkriptą į kitą kalbą?

Accepted Answer

Taip — kai transkripcija baigiasi, spustelėkite Paspauskite arba įklijuokite tekstą į /translate/. katalonų poros su kiekviena kita kalba, mes palaikome (200+). Norėdami susitikti minučių stenogramą per /summarize/; dubbbing siųsti jį į /balsas/ tts/ padaryti garso tikslinės kalbos.

Question 12

Kas, jei katalonų audio yra triukšmingas ar žemos kokybės?

Accepted Answer

Whisper yra mokoma 680K valandas triukšmingo garso realiame pasaulyje, todėl katalonų transkripcija yra tvirta fono triukšmo, muzikos lovų ir telefono kokybės įrašus. Sunkus kirpimas ar daug persidengiančių garsiakalbių vis dar pakenks tikslumą.Jei transkriptas grįžta nenaudingas, el. paštas contact@free.ai su failu – mes grąžinti simbolius ir pažvelgti, ar kitas variklis veikia jūsų garso geriau.

Kalba	katalonų
ISO kodas	`ca`
AI modelis	greitesnis whisper
Kaina	Neapmuitinama

Laisvas katalonų perrašymas

Kaip tai veikia

katalonų perrašymo savybės

Kalbos detalės

Daugiau kalbų

DUK