Question 1

faster-whisper large-v3 ทำอะไร

Accepted Answer

faster-whisper large-v3 ใช้บันทึกเสียงที่พูดออกมาเป็นข้อความ โหลดแฟ้ม MP3, WAV, M4A หรือวิดีโอ และ faster-whisper large-v3 จะส่งผลลัพธ์เป็นข้อความที่บันทึกออกมาเต็มรูปแบบ รวมถึงตัวเลือกของคำอธิบาย SRT/VTT ด้วยสแตมป์เวลา

Question 2

faster-whisper large-v3 รองรับภาษากี่ภาษา?

Accepted Answer

faster-whisper large-v3 สามารถจัดการภาษาได้หลายสิบภาษา — แบบจำลอง Whisper-family รองรับ 90+, Parakeet รองรับ ~25, อื่นๆ อาจแตกต่างกันไป เลือก "ตรวจจับอัตโนมัติ" หรือระบุภาษาเพื่อความแม่นยำสูงสุด

Question 3

ชื่อ faster-whisper large-v3 ถูกต้องแค่ไหน

Accepted Answer

อัตราความผิดพลาดของคำคือ 5- 10% สำหรับเสียงอังกฤษที่สะอาด 10- 20% สำหรับเสียงที่มีเสียงรบกวนหรือเสียงที่เน้นเสียง ตัวแปรขนาดใหญ่ของสถาปัตยกรรมเดียวกันทำได้ดีกว่าในกรณีที่ยาก - เลือกขนาดใหญ่เมื่อเสียงมันหยาบ

Question 4

faster-whisper large-v3 มีสแตมป์เวลาหรือไม่?

Accepted Answer

ใช่ — ทุกๆ ส่วนจะรวมถึงสแตมป์เวลาเริ่ม/จบ นำออกเป็น SRT หรือ VTT และเวลาจะถูกแปลงไปยังวิดีโอของคุณโดยตรง

Question 5

ค่าบริการนาทีละเท่าไหร่

Accepted Answer

faster-whisper large-v3 ทำงานบน GPU ของพวกเราเอง ต่อสู้กับสระฟรีของคุณในแต่ละวันก่อน หลังจากนั้น $5 → 200,000 โต๊กเก็ตที่จ่ายแล้ว ประมาณ ~500 โต๊กเก็ตต่อนาที

Question 6

ฉันสามารถอัพโหลดรูปแบบเสียงอะไรไปยัง faster-whisper large-v3 ได้?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, รวมถึงวิดีโอ (MP4, MOV, WebM) — เราจะดึงเสียงออกมา สูงสุด 500 MB ต่อการอัพโหลด แฟ้มยาวกว่านี้? แยกด้วย /audio/cut/ หรือใช้ /v1/stt/batch/

Question 7

faster-whisper large-v3 สามารถระบุผู้พูดได้หรือไม่

Accepted Answer

การแปลภาษาเป็นภาษาของผู้พูดเป็นขั้นตอนที่แยกกันออกไป - เปลี่ยน "diarize" ใน / transcribe / faster-whisper large-v3 จัดการการแปลภาษา; การแปลภาษาจะระบุแต่ละส่วนด้วย คนพูด 1 / คนพูด 2/ ฯลฯ

Question 8

ฉันสามารถแปลงเสียงได้ด้วย faster-whisper large-v3

Accepted Answer

ใช่ — / batch / รองรับโฟลเดอร์ของแฟ้มเสียง ทุกๆ ส่วนที่แปลเป็นภาษาอื่น จะถูกเก็บไว้ใน / account /? tab=history ด้วยชื่อแฟ้มเดิม สำหรับการเก็บรักษาโฟลเดอร์- ต้นไม้ ใช้ API

Question 9

มี API สำหรับ faster-whisper large-v3 หรือไม่?

Accepted Answer

ใช่ — POST เสียงของคุณไปยัง /v1/stt/transcribe/ ด้วย model="faster-whisper large-v3". คืนค่า JSON ด้วยข้อความ + ส่วน + ตราเวลาระดับคำ. /api/ มีข้อมูลอ้างอิงเต็ม

Question 10

แล้วเรื่องความเป็นส่วนตัวล่ะ ถ้าฉันแปลเป็นภาษาไทยด้วยชื่อ faster-whisper large-v3?

Accepted Answer

โมเดลที่ใช้ตัวมันเองจะเก็บเสียงไว้บน GPU ของเรา; โมเดลพิเศษจะส่งผ่านผ่าน DPA เสียงจะถูกลบหลังจากที่เปิดหน้าต่างแบ่งปัน (24 ชั่วโมงโดยไม่ระบุชื่อ, 7วันหลังจากเข้าระบบ) เราจะไม่ฝึกการเข้าถึงข้อมูลของคุณ

Question 11

ผลลัพธ์ของ faster-whisper large-v3 นั้นปลอดภัยสำหรับการใช้ในเชิงพาณิชย์หรือไม่?

Accepted Answer

ใช่ — Free.ai อนุมัติการใช้ในเชิงพาณิชย์ของการตีความ คุณต้องมีสิทธิ์ในการใช้งานเสียงที่คุณอัพโหลด (การบันทึกของคุณเอง, วัสดุที่ได้รับอนุญาต, หรือเนื้อหาที่ได้รับอนุญาต)

Question 12

faster-whisper large-v3 ใช้เวลานานแค่ไหน

Accepted Answer

ค่าเวลาจริงประมาณ 0.05–0.2× — พอดคาสต์ 60 นาที จะถูกบันทึกในเวลา 3–12 นาที รุ่นพิเศษจะทำงานเร็วกว่า ใช้ปุ่มคิวเพื่อปิดแท็บ

faster-whisper large-v3

ใช้ผ่าน API

รุ่นที่คล้ายกัน

คำถามที่ถามบ่อย

faster-whisper large-v3

ใช้ผ่าน API

รุ่นที่คล้ายกัน

คำถามที่ถามบ่อย