თავისუფალი იაპონური ტრანსკრიპცია

იაპონური აუდიოს და ვიდეოების ტექსტად გადაწერა AI-ით. სწრაფი, ზუსტი და უფასო.

როგორ მუშაობს

  1. გადასვლა Free.ai გადამწერი
  2. თქვენი იაპონური აუდიო ან ვიდეო ფაილის ატვირთვა
  3. ჩვენი AI ავტომატურად იპყრობს იაპონური და გადაწერს მას
  4. ჩამოტვირთეთ თქვენი ტრანსკრიპცია როგორც ტექსტი ან SRT სუბტიტრები

იაპონური ტრანსკრიპციის ფუნქციები

  • ოჲმჲღჲრ ნა ჟკჲპჲ- ჟყმ ჟვ ჲბყპკალ (MIT ლთცენჱთწ)
  • ენა იაპონური ავტომატური ამოცნობა
  • მხარს უჭერს MP3, WAV, MP4, M4A, FLAC და სხვა ფორმატებს
  • დროის ნიშნები და სუბტიტრების ექსპორტი (SRT)
  • ფაილის ზომის საზღვარი არ არსებობს გადახდილი გეგმებისთვის
  • პირადი და უსაფრთხო -- ფაილები დამუშავების შემდეგ იხელება

ენის დეტალები

ენაიაპონური
ISO კოდიja
AI მოდელიოჲ-ბყპჱჲ ჟთ ჟვ ჟყჟრჲწგა.
ფასითავისუფალი

ხშირად დასმული კითხვები

Whisper large-v3-turbo-ს ოპტიმალური ზუსტობა იაპონური-ზეა — სიტყვების შეცდომის 7%-ზე ნაკლები სტანდარტულ ბაზებში. პრაქტიკაში ეს ნიშნავს, რომ სუფთა სტუდიური აუდიო იდეალურად ჟღერს, ხოლო საუბრის აუდიო გამოიყენება მინიმალური გასუფთავებით.(Tier A, under 7% word error rate on benchmark sets — ჩვენ გამოვცემთ ნამდვილ WER-ის დონეებს, ვიდრე მარკეტინგულ განცხადებებს.)

დიახ — იაპონური ტრანსკრიპცია ჯერ თქვენი ყოველდღიური უფასო ტოკენების ბაზის იღებს. აუდიო ღირს დაახლოებით 50 ტოკენი წუთში, ასე რომ ყოველდღიური ანონიმური ბაზა ფარავს რამდენიმე საათის აუდიოს დღეში. შესული ანგარიშები იღებენ უფრო დიდ ბაზაზე დამატებით 10,000 რეგისტრაციის ტოკენს. ამის შემდეგ, $1 ყიდულობს 750,000 ტოკენს (~250 საათის აუდიოს).

იაპონური ტრანსკრიპტები იგზავნება ადგილობრივი სკრიპტით (UTF-8). იაპონური ტექსტი არ შეიცავს სიტყვებს შორის სივრცეებს; დიარიზაციის დროის ნიშნები მატებს ბუნებრივ შეწყვეტებს მთარგმნელების გადასვლისას.

MP3, WAV, M4A, FLAC, OGG, OPUS და WEBM იღება პირდაპირ. ვიდეო (MP4, MOV, MKV) აუდიოს დისკის ამოღება ხდება სერვერის მხრიდან, სანამ იგი Whisper- ში გაგზავნილი იქნება - თქვენ არ გჭირდებათ რაიმეს თვითონ გადამუშავება. იგივე კონვეინერები, მიუხედავად წყაროს ენისა, მათ შორის იაპონური.

ანონიმური ჩატვირთვების საზღვარია დაახლოებით 500 MB ფაილზე. შესული ანგარიშები იზრდება 2 GB-მდე. ხანგრძლივობა არ არის მკაცრი საზღვარი - გრძელი ფაილები ავტომატურად იყოფა ნაჭრებად (30 წამიანი ფანჯრები გადაჭიმვით) და ერთ ტრანსკრიპტში იკრიბება უწყვეტი დროის ნიშნებით. მრავალსაათიანი იაპონური ჩანაწერები (podcasts, სრული ლექციები, შეხვედრები) კარგად მუშაობს.

დიახ - მთარგმნელის დიარიზაცია ნაგულისხმევად ჩართულია ყველა იაპონური ტრანსკრიპტისთვის. გამონატანი სეგმენტირებულია როგორც მთარგმნელი 1 / მთარგმნელი 2 / მთარგმნელი 3 დროის ნიშნებით, ასე რომ ინტერვიუები, პანელის განხილვები და მრავალპარტიული შეხვედრები დაბრუნდება წარწერებით. დიარიზაცია მუშაობს განსხვავებულ მოდელში და იგივე მუშაობს ყველა ენაზე, რომელსაც ჩვენ ვემხრობით.

დიახ — URL- ის ჩასმა /transcribe/youtube/- ში YouTube- ისთვის ან /transcribe/podcast/- ში podcast- ების (Apple, Spotify, RSS) მისაღებად. ჩვენ ავტვირთავთ აუდიოს, ვახორციელებთ მას Whisper- ით language=ja- ით და ვუბრუნებთ ტრანსკრიპციას დროის ნიშნებით და მთარგმნელის ჭდეებით. ტიპიური იაპონური შინაარსი: ვიდეოები, ლექციები, ინტერვიუები და YouTube-ის გრძელი ფორმის შინაარსი იაპონური-ში არის ყველაზე გავრცელებული სამუშაოები, რომელსაც ვხედავთ.

Whisper-ის ღირებულებაა 50 ტოკენი აუდიოს წუთში, ასე რომ ერთი საათიანი ჩაწერა ღირს ~3000 ტოკენი. $1-ით იყიდება 750 000 ტოკენი, რაც 250 საათიან აუდიოს ნიშნავს დოლარზე. მომხმარებელთა უმეტესობა არასდროს ხარჯავს რაიმეს - ყოველდღიური უფასო ბაზები მოიცავს მოკლე კლიპებს, ხმიან ჩანაწერებს და ერთჯერად ვიდეო ჩანაწერებს.

დიახ — დროის ნიშნები ხელმისაწვდომია როგორც სეგმენტის დონეზე (ყველა ~10-30 წამში), ასევე სიტყვის დონეზე. სიტყვის დონე არის ნაგულისხმევი VTT/SRT სუბტიტრების ექსპორტისთვის, ასე რომ სინქრონიზაცია ხდება ხაზ-ხაზ. API-ზე დაწესებულია დროის ნიშნები "word" მოთხოვნის ტექსტში. იაპონური ტრანსკრიპტები იგზავნება ადგილობრივი სკრიპტით (UTF-8). იაპონური ტექსტი არ შეიცავს სიტყვებს შორის სივრცეებს; დიარიზაციის დროის ნიშნები მატებს ბუნებრივ შეწყვეტებს მთარგმნელების გადასვლისას.

დიახ. POST აუდიო (multipart/form-data, field name "file") /v1/transcribe/-ში language=ja-ით — ან გამოტოვეთ ენის პარამეტრი, რომ Whisper-მა ავტომატურად აღმოაჩინოს. უკან იბრუნებ JSON-ს ტრანსკრიპტით, სეგმენტებით, დროის ნიშნებით და მთარგმნელის ჭდეებით. სრული მითითება და SDK ნაჭრები /api/-ში.

დიახ — როგორც კი ტრანსკრიპცია დასრულდება, დააჭირეთ მთარგმნელს ან ჩასვით ტექსტი /translate/-ში. იაპონური თავსებადია ყველა სხვა ენასთან, რომელსაც ჩვენ ვემხრობით (200+). შეხვედრის ანგარიშების შემთხვევაში ტრანსკრიპცია გადაეგზავნება /summarize/-ში; დუბლირების შემთხვევაში გადაეგზავნება /voice/tts/-ში, რათა აუდიო ენაზე გადავიდეს.

Whisper-ი 680K საათის ხმაურიანი რეალური აუდიოს საფუძველზეა მომზადებული, ამიტომ იაპონური ტრანსკრიპცია ძლიერია ფონური ხმაურის, მუსიკალური საწოლებისა და ტელეფონის ხარისხის ჩანაწერების მიმართ. მძიმე ჭრილობა ან მრავალჯერადი გადაჭიმული დინამიკები მაინც დააზარალებს სიზუსტეს.2007 წლის 12 იანვარს, ოფიციალური ვებ-გვერდი დასრულდა. ↑ If a transcript comes back unuseable, email contact@free.ai with the file — we will refund the tokens and look if another engine handles your audio better.

ჲბთფაქ ლთ Free.ai?

ამ გვერდის შეფასება