sundan dili boş

sundan dili audio we videony AI bilen metin'e geçir. Tiz, dogry we bellige al

Nädip işleýär

  1. _Git Free.ai Transcriber
  2. Upload your sundan dili audio or video file
  3. Biziň AI-miz sundan dili-i awtomatik tapyp ony ýazýar
  4. Siziň transkripsiýaňyzy metin ýa-da SRT subtitleler hökmünde ýükläň

sundan dili Öňki

  • faster-whisper tarapyndan işledilýär (MIT lisenziýaly)
  • sundan dili dili otomatlykça tap
  • MP3, WAV, MP4, M4A, FLAC we başgalary goldaýar
  • Zaman damgalary we subtitle eksport (SRT)
  • Faýl ululyk çäkleri ýok
  • Özüne we howpsuz -- faýllar işlemeden soň pozulýar

Dil Täzelikleri

Dilsundan dili
ISO Kodysu
Modelfaster-whisper
_Baj_Boş

Gynançly Soraglar

sundan dili Whisper üçin az-resursly dildir — large-v3-turbo 25% söz hatasy derejesinden ýokary, bazen has ýokary. Transkript gözlemek we gist üçin peýdalydyr emma çap etmek üçin taýyn hasaplanmaly däl. Eger sundan dili üçin has ýokary-dogrylykly enjam elýeterli bolsa biz ony awtomatiki bir şekilde goşarys.(Tier D, over 25% word error rate on benchmark sets - we publish honest WER tiers rather than marketing claims.)

Eý — sundan dili transkripsiýasy siziň her günlik mugt token ätiýaçlykyňyzdan öňe çekýär. Ses minutda 50 tokena çykýar, şonuň üçin anonim her günlik ätiýaçlyk günde bir näçe sagat ses ätiýaçlyklaryny örtýär. Ýatdan çykan hasaplar has uly bir ätiýaçlyk bilen 10,000 ýazgy tokena çykýar. Bundan soň, $1 750,000 tokena çykýar (~250 sagat ses ätiýaçlyk).

sundan dili transkriptler standart UTF-8 bilen dilin kadaly elipbiýinde dogrylaşar.

MP3, WAV, M4A, FLAC, OGG, OPUS, we WEBM dogrydan kabul edilýär. Video üçin (MP4, MOV, MKV) biz ses çyzygyny serwer tarapdan çykaryp ony Whisper'e iberýäris — siz hiç zat öz eliňiz bilen üýtgetmäge mätäç dälsiňiz. sundan dili bilen birmeňzeş çyzgy çeşme diline garamazdan kabul edilýär.

Anonym ýüklemek faýl üçin takmynan 500 MB çäklendirýär. Ýatdan çykan hasaplar 2 GB çenli ýetip biler. Uzaklyk çäklendirme däl - uzak faýllar awtomatiki bölüp alynýar (30 sekuntlyk äpişgeler bir birini örtüp) we dowamly wagt möhürleri bilen bir transkripte birikdirilýär. Birden köp sagatlyk sundan dili ýazgylar (podkastlar, doly leksiýalar, duşuşyklar) gowy işleýär.

Eý — her bir sundan dili transkript üçin sözleýji diaryzasiýa öň bellenen ýaly işleýär. Çykyş 1-nji sözleýji / 2-nji sözleýji / 3-nji sözleýji ýaly wagt möhürleri bilen bölüp çykarylýar, şeýlelik bilen söhbetdeşlikler, panel gürrüňler we köpçülikleýin duşuşyklar etiketlenipdir. Diaryzasiýa başga bir modelde işleýär we biz goldaýan ähli dillerde birmeňzeş işleýär.

Eý — URL-i /transcribe/youtube/ içine YouTube üçin ýa-da /transcribe/podcast/ içine podcast feeds (Apple, Spotify, RSS) üçin goýaň. Biz sesni ýükläp, ony Whisper bilen language=su bilen işledýäris, we wagt möhürleri we sözleýji taglary bilen transkripti gaýtarýarys. Tipik sundan dili mazmuny: leksiýalar, söhbetdeşlikler, ses ýazgylary we YouTube mazmuny sundan dili içinde ähli iş — bir URL'i /transcribe/youtube/'e goýdy ýa-da faýly göçürdi.

Whisper bir minut ses üçin 50 token töleg edýär, ýagny bir sagat ýazgy üçin ~3,000 token töleg edilýär. $1 750,000 token töleg edýär, bu bolsa bir dollar üçin 250 sagat ses töleg edilýär. Çagalanyjylaryň köpüsi hiç zat tölemeýär - her günki bellige alnanlar gysga klipleri, ses ýazgylary we bir gezeklik podkastlary öz içine alýar.

sundan dili transkriptler standart UTF-8 bilen dilin kadaly elipbiýinde dogrylaşar.

Eý. POST audio (multipart/form-data, field name "file") to /v1/transcribe/ with language=su — or leave the language parameter out to let Whisper auto-detect. Returns JSON with the transcript, segments, timestamps, and speaker labels. Full reference and SDK snippets at /api/.

Eý — transkripsiýa tamamlanandan soň, Terjime düwmesini basyp ýa-da metini /translate/-e goýdyň. sundan dili biz goldaýan her bir dil bilen (200+) deňleşýär. Duşuşyk minutlary üçin transkripsiýa /summarize/-den geçýär; dublaj üçin ony /voice/tts/-e iberiň audiony maksat dilinde görkezmek üçin.

Whisper's noise training less helps at this level - the bottleneck is the amount of sundan dili audio Whisper saw during training, not noise. Clean studio audio still beats noise audio, but neither will reach the accuracy you would get on a high-resource language.Eger bir transkripsiýa ulanylmazlyk bilen gaýdyp gelse, contact@free.ai e-poçta bilen faýly iberiň — biz tokeni yzyna gaýtaryp bereris we başga bir enjamyň siziň audioňyzy has gowy işledip biljekmigine serederis.

Free.ai-i söýýäňmi? Dostlaryňa aýt!

Bu sahypany bahala