Laisvas valų perrašymas

Perrašyti valų garso ir vaizdo įrašą į tekstą naudojant AI. Greitas, tikslus ir nemokamas.

Kaip tai veikia

  1. Eikite į Free.ai Transkrastų
  2. Iškelkite valų garso ar vaizdo failą
  3. Mūsų AI automatiškai aptinka valų ir perrašo ją
  4. Atsisiųskite stenogramą kaip tekstą arba SRT subtitrus

valų perrašymo savybės

  • Galioja greičiau-whisper (MIT licencijuota)
  • Automatinis valų kalbos nustatymas
  • Palaiko MP3, WAV, MP4, M4A, FLAC ir daugiau
  • Laikraščiai ir subtitrų eksportas (SRT)
  • Nėra mokamų planų failų dydžio ribų
  • Privatūs ir saugūs -- failai ištrinami po apdorojimo

Kalbos detalės

Kalbavalų
ISO kodascy
AI modelisgreitesnis whisper
KainaNeapmuitinama

Daugiau kalbų

Rodyti visas kalbas

DUK

valų is vid-resource language for Whisper – large-v3-turbo lands in the 15-25% word error rate. Transkripto turinys yra patikimas; tikėtis pavadinimų klaidų, retkarčiais koduojančių žiebtuvėlių ir trumpo ištarimo paklaidų. Planuokite žmogaus leidimą leidybai-kokybei.(Tier C, 15-25% word error rate lyginamųjų indeksų rinkiniuose – skelbiame sąžiningas WER pakopas, o ne rinkodaros reikalavimus.)

Taip — valų Transkripcija pirmiausiai patraukia iš jūsų kasdienio nemokamo žetono. Garso kaštai kainuoja apie 50 žetonų per minutę, todėl anoniminis dienos baseinas apima kelias valandas garso per dieną. Pasirašyta paskyra gauna didesnį fondą ir 10 000 ženklų. Praeityje 1 doleris perka 750 000 žetonų (~250 valandų garso).

valų transkriptai grąžinami standartinėje UTF-8 su normalia kalbos ortografija.

MP3, WAV, M4A, FLAC, OGG, OPUS, ir WEBM yra priimami tiesiogiai. Vaizdo (MP4, MOV, MKV) ištraukiame garso takelių serverio pusę prieš siunčiame jį į Whisper - jums nereikia konvertuoti nieko sau. Tas pats vamzdynas nepriklausomai nuo šaltinio kalbos, įskaitant valų.

Anoniminis įkelia dangtelį maždaug 500 MB vienam failui. Pasirašyta paskyra siekia iki 2 GB. Trukmė nėra didelė — ilgi failai automatiškai komplektuojami (30 sekundžių su sutapimu) ir surišti atgal į vieną transkriptą su nuolatinėmis žymomis. Daugiavalandiai valų įrašai (podcasts, pilnos paskaitos, susitikimai) veikia gerai.

Taip — garsiakalbio diarizacija yra pagal nutylėjimą už kiekvieną valų transscript. Rezultatas yra segmentuojamas kaip Garsiakalbis 1 / Garsiakalbis 2 / Garsiakalbis 3 su timestamp reikšmėmis, todėl interviu, skydo diskusijos, ir daugiapartijų susitikimai grįžti žymėti. Diarizacija vyksta su atskiru modeliu ir veikia vienodai visose kalbose mes palaikome.

Taip — įklijuokite URL į / transkripcija/ youtube/ YouTube arba / transkripcija/podcast/ podcast/ podcast kanalus (Aplikacija, Spotify, RSS). Atsisiunčiame garsą, paleiskite jį per Whisper kalba=cy ir grąžinkite transkripciją su žymomis ir garsiakalbiais. Tipinis valų turinys: paskaitos, interviu, balso užrašai, ir "YouTube" turinys valų visi darbai — įdėti URL į / transliuoti / youtube / arba įkelti failą tiesiogiai.

Whisper kainuoja apie 50 žetonų per minutę garso, todėl vienos valandos įrašas yra ~ 3000 žetonų. $ 1 perka 750000 žetonų, kuris veikia maždaug 250 valandų garso už dolerį. Dauguma vartotojų niekada praleisti nieko – nemokamas dienos baseinas apima trumpus klipus, balso užrašus, ir vienkartinių podcast.

Taip — yra tiek segmento lygis (kas ~10-30 sekundžių), tiek žodžio lygio žymos. Žodžių lygis yra numatytasis VTT/SRT subtitrų eksportui, todėl antraštės sinchronizuoja eilutę pagal eilę. API set žymos="žodis" užklausoje institucijoje. valų transkriptai grąžinami standartinėje UTF-8 su normalia kalbos ortografija.

Taip. Po garso (daugiadalis/forma-duomenys, lauko pavadinimas "failas") /v1/tractor/ su kalba=cy – arba praleisti kalbos parametrą, kad Whisper automatiškai nustatyti. Grįžta JSON su stenograma, segmentai, žymos, ir garsiakalbio etiketėmis. Visas nuoroda ir SDK fragmentai ties /api/.

Taip — kai transkripcija baigiasi, spustelėkite Paspauskite arba įklijuokite tekstą į /translate/. valų poros su kiekviena kita kalba, mes palaikome (200+). Norėdami susitikti minučių stenogramą per /summarize/; dubbbing siųsti jį į /balsas/ tts/ padaryti garso tikslinės kalbos.

Whisper triukšmas patvarumas vis dar taikomas valų, bet šiuo tikslu bet koks papildomas triukšmas sujungia bazinį klaidų lygį. Švarios ausinės audio suteikia pastebimus geresnius rezultatus nei telefonas ar nešiojamieji mikrofonai.Jei transkriptas grįžta nenaudingas, el. paštas contact@free.ai su failu – mes grąžinti simbolius ir pažvelgti, ar kitas variklis veikia jūsų garso geriau.

Like this tool? Share it!

Įvertinti šį puslapį