Fal Speech-to-Text
Free.ai
·
stt
·
~500 ტოკენები minute
Fal Speech-to-Text is a საუბრის ტექსტად გადამუშავების მოდელი. 1999 წელს ფილმმა მიიღო ოსკარის ჯილდო საუკეთესო ფილმისთვის („სამყაროს საზღვრები“). ფილმი 1999 წლის ოსკარის ნომინაციაში იყო წარდგენილი.
API- ს გამოყენება
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/speech-to-text","audio_url":"https://..."}'
დოკუმენტაცია
API კოდის მიღება
ხშირად დასმული კითხვები
Fal Speech-to-Text აუდიოს ტექსტად გადაწერს. ჩატვირთეთ MP3, WAV, M4A ან ვიდეო ფაილი და Fal Speech-to-Text დააბრუნებს სრულ ტრანსკრიპციას და შესაძლებელია SRT/VTT სუბტიტრებს დროის ნიშნებით.
Fal Speech-to-Text ასობით ენაზე მუშაობს - Whisper-ს ოჯახის მოდელები მოიცავს 90+-ს, Parakeet მოიცავს ~25-ს, სხვები კი იცვლება. აირჩიეთ "ავტომატური აღმოჩენა" ან მიუთითეთ ენა ყველაზე მაღალი სიზუსტის მისაღებად.
სიტყვების შეცდომის მაჩვენებელი 5-10% -ია სუფთა ინგლისურ აუდიოში, 10-20% -ია ხმაურიან ან აქცენტირებული აუდიოში. იგივე არქიტექტურის დიდი ვარიანტები უფრო მეტად მოქმედებენ რთული შემთხვევების დროს - აირჩიეთ უფრო დიდი, თუ აუდიო უხეშია.
დიახ - ყველა სეგმენტი შეიცავს დაწყების/დასრულების დროის ნიშნებს. ექსპორტი როგორც SRT ან VTT და დროის ნიშნები პირდაპირ თქვენს ვიდეოზე.
Fal Speech-to-Text არის პრემიუმ ტრანსკრიპციის მოდული. დაახლოებით ~500–1,500 ტოკენი აუდიოს წუთში. $1 = 750,000 ტოკენი.
MP3, WAV, M4A, FLAC, OGG, და ვიდეო (MP4, MOV, WebM) — აუდიოს ამოღება. მაქსიმალური 500 MB ერთ ჩატვირთვაზე. უფრო დიდი ფაილები? გაყოფა /audio/cut/-ით ან /v1/stt/batch/-ის გამოყენებით.
2002 წელს გამოვიდა ალბომი „The Voice of the Universe“ („საუკუნის ხმა“), რომელშიც შეტანილია სიმღერები „The Voice of the Universe“ და „The Voice of the Universe 2“.
დიახ — /batch/ იღებს აუდიო ფაილების საქაღალდეს. ყოველი ტრანსკრიპცია ხვდება /account/?tab=history- ში ორიგინალური ფაილის სახელით. საქაღალდეების ხის შენარჩუნებისთვის გამოიყენეთ API.
1999 წელს, ფილმმა „სუპერმენი: ომის ეპიზოდი II“ (Superman: Episode II - The War Crack) ოსკარის დაჯილდოება მიიღო. ფილმი 1999 წლის ოქტომბერში გამოვიდა და ფილმის ოფიციალური ვებ-გვერდი
თვით-მომსახურე მოდელი ტოვებს აუდიოს ჩვენს გრაფიკულ პროცესორზე; პრემიუმი გადადის DPA-ზე. აუდიო იშლება გაზიარების ფანჯრის შემდეგ (24 საათი ონონ, 7 დღე შესვლის შემდეგ). ჩვენ არ ვასწავლით თქვენს შეყვანებს.
დიახ — Free.ai ნებაყოფლობით ანიჭებს კომერციულ გამოყენებას ტრანსკრიპტებს. თქვენ გჭირდებათ აუდიოს უფლება, რომელიც თქვენ ჩატვირთეთ (თქვენი საკუთარი ჩანაწერი, ლიცენზირებული მასალა ან შენახვა ნებართვით).
რეალური დროის ფაქტორი დაახლოებით 0.05–0.2×-ია — 60 წუთიანი ვიდეო ჩანაწერი 3–12 წუთში იწერება. Premium მოდელი ხშირად უფრო სწრაფად მთავრდება. ჩანართის დახურვისთვის გამოიყენეთ რიგის ღილაკი.