iňlis dili boş

iňlis dili audio we videony AI bilen metin'e geçir. Tiz, dogry we bellige al

Nädip işleýär

  1. _Git Free.ai Transcriber
  2. Upload your iňlis dili audio or video file
  3. Biziň AI-miz iňlis dili-i awtomatik tapyp ony ýazýar
  4. Siziň transkripsiýaňyzy metin ýa-da SRT subtitleler hökmünde ýükläň

iňlis dili Öňki

  • faster-whisper tarapyndan işledilýär (MIT lisenziýaly)
  • iňlis dili dili otomatlykça tap
  • MP3, WAV, MP4, M4A, FLAC we başgalary goldaýar
  • Zaman damgalary we subtitle eksport (SRT)
  • Faýl ululyk çäkleri ýok
  • Özüne we howpsuz -- faýllar işlemeden soň pozulýar

Dil Täzelikleri

Diliňlis dili
ISO Kodyen
Modelfaster-whisper
_Baj_Boş

Gynançly Soraglar

Whisper large-v3-turbo iňlis dili-de iň ýokary dogrylyk derejesine düşdi — standart ölçeglerde 7% söz hatasy derejesinden aşak. Praktikada bu arassa studiýa sesiň näzik-mukam gelip çykýan we gürleşýän sesiň azça arassalamak bilen ulanylýan manysyna gelýär.(Tier A, under 7% word error rate on benchmark sets - we publish honest WER tiers rather than marketing claims.)

Eý — iňlis dili transkripsiýasy siziň her günlik mugt token ätiýaçlykyňyzdan öňe çekýär. Ses minutda 50 tokena çykýar, şonuň üçin anonim her günlik ätiýaçlyk günde bir näçe sagat ses ätiýaçlyklaryny örtýär. Ýatdan çykan hasaplar has uly bir ätiýaçlyk bilen 10,000 ýazgy tokena çykýar. Bundan soň, $1 750,000 tokena çykýar (~250 sagat ses ätiýaçlyk).

Inglizçe transkripsiýa ABŞ, BMG, Awstraliýa, Hindistan we beýleki esasy aksentleri bir modelde öz içine alýar. Whisper olardan ählisi üçin taýýarlandy we transkripsiýa sözleýjiniň aksentine garamazdan standart inglizçe hecelenişi bilen çykýar.

MP3, WAV, M4A, FLAC, OGG, OPUS, we WEBM dogrydan kabul edilýär. Video üçin (MP4, MOV, MKV) biz ses çyzygyny serwer tarapdan çykaryp ony Whisper'e iberýäris — siz hiç zat öz eliňiz bilen üýtgetmäge mätäç dälsiňiz. iňlis dili bilen birmeňzeş çyzgy çeşme diline garamazdan kabul edilýär.

Anonym ýüklemek faýl üçin takmynan 500 MB çäklendirýär. Ýatdan çykan hasaplar 2 GB çenli ýetip biler. Uzaklyk çäklendirme däl - uzak faýllar awtomatiki bölüp alynýar (30 sekuntlyk äpişgeler bir birini örtüp) we dowamly wagt möhürleri bilen bir transkripte birikdirilýär. Birden köp sagatlyk iňlis dili ýazgylar (podkastlar, doly leksiýalar, duşuşyklar) gowy işleýär.

Eý — her bir iňlis dili transkript üçin sözleýji diaryzasiýa öň bellenen ýaly işleýär. Çykyş 1-nji sözleýji / 2-nji sözleýji / 3-nji sözleýji ýaly wagt möhürleri bilen bölüp çykarylýar, şeýlelik bilen söhbetdeşlikler, panel gürrüňler we köpçülikleýin duşuşyklar etiketlenipdir. Diaryzasiýa başga bir modelde işleýär we biz goldaýan ähli dillerde birmeňzeş işleýär.

Eý — URL-i /transcribe/youtube/ içine YouTube üçin ýa-da /transcribe/podcast/ içine podcast feeds (Apple, Spotify, RSS) üçin goýaň. Biz sesni ýükläp, ony Whisper bilen language=en bilen işledýäris, we wagt möhürleri we sözleýji taglary bilen transkripti gaýtarýarys. Tipik iňlis dili mazmuny: leksiýalar, söhbetdeşlikler, ses ýazgylary we YouTube mazmuny iňlis dili içinde ähli iş — bir URL'i /transcribe/youtube/'e goýdy ýa-da faýly göçürdi.

Whisper bir minut ses üçin 50 token töleg edýär, ýagny bir sagat ýazgy üçin ~3,000 token töleg edilýär. $1 750,000 token töleg edýär, bu bolsa bir dollar üçin 250 sagat ses töleg edilýär. Çagalanyjylaryň köpüsi hiç zat tölemeýär - her günki bellige alnanlar gysga klipleri, ses ýazgylary we bir gezeklik podkastlary öz içine alýar.

iňlis dili transkriptler standart UTF-8 bilen dilin kadaly elipbiýinde dogrylaşar.

Eý. POST audio (multipart/form-data, field name "file") to /v1/transcribe/ with language=en — or leave the language parameter out to let Whisper auto-detect. Returns JSON with the transcript, segments, timestamps, and speaker labels. Full reference and SDK snippets at /api/.

Eý — transkripsiýa tamamlanandan soň, Terjime düwmesini basyp ýa-da metini /translate/-e goýdyň. iňlis dili biz goldaýan her bir dil bilen (200+) deňleşýär. Duşuşyk minutlary üçin transkripsiýa /summarize/-den geçýär; dublaj üçin ony /voice/tts/-e iberiň audiony maksat dilinde görkezmek üçin.

Whisper 680K sagatlyk gürleşikli real dünýä sesinden öwredildi, şoňa görä iňlis dili transkripsiýasy arkaplan gürleşiklerine, müzik yataklaryna we telefon hili ýazgylara durnukly. Agyr kesmek ýa-da birnäçe üsti üste düşen sözçüler hakykatlylygy halas eder.Eger bir transkripsiýa ulanylmazlyk bilen gaýdyp gelse, contact@free.ai e-poçta bilen faýly iberiň — biz tokeni yzyna gaýtaryp bereris we başga bir enjamyň siziň audioňyzy has gowy işledip biljekmigine serederis.

Free.ai-i söýýäňmi? Dostlaryňa aýt!

Bu sahypany bahala