Laisvas katalonų perrašymas

Perrašyti katalonų garso ir vaizdo įrašą į tekstą naudojant AI. Greitas, tikslus ir nemokamas.

Kaip tai veikia

  1. Eikite į Free.ai Transkrastų
  2. Iškelkite katalonų garso ar vaizdo failą
  3. Mūsų AI automatiškai aptinka katalonų ir perrašo ją
  4. Atsisiųskite stenogramą kaip tekstą arba SRT subtitrus

katalonų perrašymo savybės

  • Galioja greičiau-whisper (MIT licencijuota)
  • Automatinis katalonų kalbos nustatymas
  • Palaiko MP3, WAV, MP4, M4A, FLAC ir daugiau
  • Laikraščiai ir subtitrų eksportas (SRT)
  • Nėra mokamų planų failų dydžio ribų
  • Privatūs ir saugūs -- failai ištrinami po apdorojimo

Kalbos detalės

Kalbakatalonų
ISO kodasca
AI modelisgreitesnis whisper
KainaNeapmuitinama

Daugiau kalbų

Rodyti visas kalbas

DUK

Whisper didelis-v3-turbo žemės savo aukščiausio tikslumo pakopoje katalonų - iki 7% žodžio klaidų dažnis standartinių etalonų. Praktikoje tai reiškia, kad švari studija garso grįžta beveik tobulas, ir pokalbių garso yra naudojamas su minimaliu valymas.(Tier A, under 7% word error rate lyginamųjų indeksų rinkiniuose – skelbiame sąžiningas WER pakopas, o ne rinkodaros reikalavimus.)

Taip — katalonų Transkripcija pirmiausiai patraukia iš jūsų kasdienio nemokamo žetono. Garso kaštai kainuoja apie 50 žetonų per minutę, todėl anoniminis dienos baseinas apima kelias valandas garso per dieną. Pasirašyta paskyra gauna didesnį fondą ir 10 000 ženklų. Praeityje 1 doleris perka 750 000 žetonų (~250 valandų garso).

katalonų transkriptai grąžinami standartinėje UTF-8 su normalia kalbos ortografija.

MP3, WAV, M4A, FLAC, OGG, OPUS, ir WEBM yra priimami tiesiogiai. Vaizdo (MP4, MOV, MKV) ištraukiame garso takelių serverio pusę prieš siunčiame jį į Whisper - jums nereikia konvertuoti nieko sau. Tas pats vamzdynas nepriklausomai nuo šaltinio kalbos, įskaitant katalonų.

Anoniminis įkelia dangtelį maždaug 500 MB vienam failui. Pasirašyta paskyra siekia iki 2 GB. Trukmė nėra didelė — ilgi failai automatiškai komplektuojami (30 sekundžių su sutapimu) ir surišti atgal į vieną transkriptą su nuolatinėmis žymomis. Daugiavalandiai katalonų įrašai (podcasts, pilnos paskaitos, susitikimai) veikia gerai.

Taip — garsiakalbio diarizacija yra pagal nutylėjimą už kiekvieną katalonų transscript. Rezultatas yra segmentuojamas kaip Garsiakalbis 1 / Garsiakalbis 2 / Garsiakalbis 3 su timestamp reikšmėmis, todėl interviu, skydo diskusijos, ir daugiapartijų susitikimai grįžti žymėti. Diarizacija vyksta su atskiru modeliu ir veikia vienodai visose kalbose mes palaikome.

Taip — įklijuokite URL į / transkripcija/ youtube/ YouTube arba / transkripcija/podcast/ podcast/ podcast kanalus (Aplikacija, Spotify, RSS). Atsisiunčiame garsą, paleiskite jį per Whisper kalba=ca ir grąžinkite transkripciją su žymomis ir garsiakalbiais. Tipinis katalonų turinys: paskaitos, interviu, balso užrašai, ir "YouTube" turinys katalonų visi darbai — įdėti URL į / transliuoti / youtube / arba įkelti failą tiesiogiai.

Whisper kainuoja apie 50 žetonų per minutę garso, todėl vienos valandos įrašas yra ~ 3000 žetonų. $ 1 perka 750000 žetonų, kuris veikia maždaug 250 valandų garso už dolerį. Dauguma vartotojų niekada praleisti nieko – nemokamas dienos baseinas apima trumpus klipus, balso užrašus, ir vienkartinių podcast.

Taip — yra tiek segmento lygis (kas ~10-30 sekundžių), tiek žodžio lygio žymos. Žodžių lygis yra numatytasis VTT/SRT subtitrų eksportui, todėl antraštės sinchronizuoja eilutę pagal eilę. API set žymos="žodis" užklausoje institucijoje. katalonų transkriptai grąžinami standartinėje UTF-8 su normalia kalbos ortografija.

Taip. Po garso (daugiadalis/forma-duomenys, lauko pavadinimas "failas") /v1/tractor/ su kalba=ca – arba praleisti kalbos parametrą, kad Whisper automatiškai nustatyti. Grįžta JSON su stenograma, segmentai, žymos, ir garsiakalbio etiketėmis. Visas nuoroda ir SDK fragmentai ties /api/.

Taip — kai transkripcija baigiasi, spustelėkite Paspauskite arba įklijuokite tekstą į /translate/. katalonų poros su kiekviena kita kalba, mes palaikome (200+). Norėdami susitikti minučių stenogramą per /summarize/; dubbbing siųsti jį į /balsas/ tts/ padaryti garso tikslinės kalbos.

Whisper yra mokoma 680K valandas triukšmingo garso realiame pasaulyje, todėl katalonų transkripcija yra tvirta fono triukšmo, muzikos lovų ir telefono kokybės įrašus. Sunkus kirpimas ar daug persidengiančių garsiakalbių vis dar pakenks tikslumą.Jei transkriptas grįžta nenaudingas, el. paštas contact@free.ai su failu – mes grąžinti simbolius ir pažvelgti, ar kitas variklis veikia jūsų garso geriau.

Like this tool? Share it!

Įvertinti šį puslapį