faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 ტოკენები minute

აუდიო ან ვიდეო ფაილის ჩამოტვირთვა ან URL-ის ქვემოთ ჩასმა

~500 ტოკენები minute

faster-whisper large-v3 is a საუბრის ტექსტად გადამუშავების მოდელი built by OpenAI / SYSTRAN. საუბრის ტექსტად გადამუშავების მოდელი არის a. 1995) 1 იანვარი : ფრიდრიხ ვილჰელმ ბერლინი — გერმანელი ფილოსოფოსი (გ. Free.ai GPU-ზე — მუშაობს უფასოდ თქვენი ყოველდღიური ტოკენების ბაზის წინააღმდეგ (500 tokens წუთში). Released under MIT — commercial use permitted on Free.ai.

API- ს გამოყენება

OpenAI- სთან თავსებადი REST API. გასაღების შექმნა და ამ მოდელის გამოძახება წამებში.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
დოკუმენტაცია API კოდის მიღება

ხშირად დასმული კითხვები

faster-whisper large-v3 აუდიოს ტექსტად გადაწერს. ჩატვირთეთ MP3, WAV, M4A ან ვიდეო ფაილი და faster-whisper large-v3 დააბრუნებს სრულ ტრანსკრიპციას და შესაძლებელია SRT/VTT სუბტიტრებს დროის ნიშნებით.

faster-whisper large-v3 ასობით ენაზე მუშაობს - Whisper-ს ოჯახის მოდელები მოიცავს 90+-ს, Parakeet მოიცავს ~25-ს, სხვები კი იცვლება. აირჩიეთ "ავტომატური აღმოჩენა" ან მიუთითეთ ენა ყველაზე მაღალი სიზუსტის მისაღებად.

სიტყვების შეცდომის მაჩვენებელი 5-10% -ია სუფთა ინგლისურ აუდიოში, 10-20% -ია ხმაურიან ან აქცენტირებული აუდიოში. იგივე არქიტექტურის დიდი ვარიანტები უფრო მეტად მოქმედებენ რთული შემთხვევების დროს - აირჩიეთ უფრო დიდი, თუ აუდიო უხეშია.

დიახ - ყველა სეგმენტი შეიცავს დაწყების/დასრულების დროის ნიშნებს. ექსპორტი როგორც SRT ან VTT და დროის ნიშნები პირდაპირ თქვენს ვიდეოზე.

faster-whisper large-v3 მუშაობს ჩვენი GPU-ების წინააღმდეგ თქვენი ყოველდღიური უფასო აუზით; $5 → 200,000 გადახდილი ტოკენები ამის შემდეგ. დაახლოებით ~500 ტოკენები წუთში.

MP3, WAV, M4A, FLAC, OGG, და ვიდეო (MP4, MOV, WebM) — აუდიოს ამოღება. მაქსიმალური 500 MB ერთ ჩატვირთვაზე. უფრო დიდი ფაილები? გაყოფა /audio/cut/-ით ან /v1/stt/batch/-ის გამოყენებით.

2002 წელს გამოვიდა ალბომი „The Voice of the Universe“ („საუკუნის ხმა“), რომელშიც შეტანილია სიმღერები „The Voice of the Universe“ და „The Voice of the Universe 2“.

დიახ — /batch/ იღებს აუდიო ფაილების საქაღალდეს. ყოველი ტრანსკრიპცია ხვდება /account/?tab=history- ში ორიგინალური ფაილის სახელით. საქაღალდეების ხის შენარჩუნებისთვის გამოიყენეთ API.

1999 წელს, ფილმმა „სუპერმენი: ომის ეპიზოდი II“ (Superman: Episode II - The War Crack) ოსკარის დაჯილდოება მიიღო. ფილმი 1999 წლის ოქტომბერში გამოვიდა და ფილმის ოფიციალური ვებ-გვერდი

თვით-მომსახურე მოდელი ტოვებს აუდიოს ჩვენს გრაფიკულ პროცესორზე; პრემიუმი გადადის DPA-ზე. აუდიო იშლება გაზიარების ფანჯრის შემდეგ (24 საათი ონონ, 7 დღე შესვლის შემდეგ). ჩვენ არ ვასწავლით თქვენს შეყვანებს.

დიახ — Free.ai ნებაყოფლობით ანიჭებს კომერციულ გამოყენებას ტრანსკრიპტებს. თქვენ გჭირდებათ აუდიოს უფლება, რომელიც თქვენ ჩატვირთეთ (თქვენი საკუთარი ჩანაწერი, ლიცენზირებული მასალა ან შენახვა ნებართვით).

რეალური დროის ფაქტორი დაახლოებით 0.05–0.2×-ია — 60 წუთიანი ვიდეო ჩანაწერი 3–12 წუთში იწერება. Premium მოდელი ხშირად უფრო სწრაფად მთავრდება. ჩანართის დახურვისთვის გამოიყენეთ რიგის ღილაკი.

ჲბთფაქ ლთ Free.ai?

ამ გვერდის შეფასება