Question 1

ElevenLabs STT ทำอะไร

Accepted Answer

ElevenLabs STT ใช้บันทึกเสียงที่พูดออกมาเป็นข้อความ โหลดแฟ้ม MP3, WAV, M4A หรือวิดีโอ และ ElevenLabs STT จะส่งผลลัพธ์เป็นข้อความที่บันทึกออกมาเต็มรูปแบบ รวมถึงตัวเลือกของคำอธิบาย SRT/VTT ด้วยสแตมป์เวลา

Question 2

ElevenLabs STT รองรับภาษากี่ภาษา?

Accepted Answer

ElevenLabs STT สามารถจัดการภาษาได้หลายสิบภาษา — แบบจำลอง Whisper-family รองรับ 90+, Parakeet รองรับ ~25, อื่นๆ อาจแตกต่างกันไป เลือก "ตรวจจับอัตโนมัติ" หรือระบุภาษาเพื่อความแม่นยำสูงสุด

Question 3

ชื่อ ElevenLabs STT ถูกต้องแค่ไหน

Accepted Answer

อัตราความผิดพลาดของคำคือ 5- 10% สำหรับเสียงอังกฤษที่สะอาด 10- 20% สำหรับเสียงที่มีเสียงรบกวนหรือเสียงที่เน้นเสียง ตัวแปรขนาดใหญ่ของสถาปัตยกรรมเดียวกันทำได้ดีกว่าในกรณีที่ยาก - เลือกขนาดใหญ่เมื่อเสียงมันหยาบ

Question 4

ElevenLabs STT มีสแตมป์เวลาหรือไม่?

Accepted Answer

ใช่ — ทุกๆ ส่วนจะรวมถึงสแตมป์เวลาเริ่ม/จบ นำออกเป็น SRT หรือ VTT และเวลาจะถูกแปลงไปยังวิดีโอของคุณโดยตรง

Question 5

ค่าบริการนาทีละเท่าไหร่

Accepted Answer

ElevenLabs STT เป็นเครื่องมือแปลภาษาระดับพรีเมี่ยม ประมาณ ~500-1,500 โต๊กเกอร์ต่อนาทีของเสียง 1 ดอลลาร์ = 750,000 โต๊กเกอร์

Question 6

ฉันสามารถอัพโหลดรูปแบบเสียงอะไรไปยัง ElevenLabs STT ได้?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, รวมถึงวิดีโอ (MP4, MOV, WebM) — เราจะดึงเสียงออกมา สูงสุด 500 MB ต่อการอัพโหลด แฟ้มยาวกว่านี้? แยกด้วย /audio/cut/ หรือใช้ /v1/stt/batch/

Question 7

ElevenLabs STT สามารถระบุผู้พูดได้หรือไม่

Accepted Answer

การแปลภาษาเป็นภาษาของผู้พูดเป็นขั้นตอนที่แยกกันออกไป - เปลี่ยน "diarize" ใน / transcribe / ElevenLabs STT จัดการการแปลภาษา; การแปลภาษาจะระบุแต่ละส่วนด้วย คนพูด 1 / คนพูด 2/ ฯลฯ

Question 8

ฉันสามารถแปลงเสียงได้ด้วย ElevenLabs STT

Accepted Answer

ใช่ — / batch / รองรับโฟลเดอร์ของแฟ้มเสียง ทุกๆ ส่วนที่แปลเป็นภาษาอื่น จะถูกเก็บไว้ใน / account /? tab=history ด้วยชื่อแฟ้มเดิม สำหรับการเก็บรักษาโฟลเดอร์- ต้นไม้ ใช้ API

Question 9

มี API สำหรับ ElevenLabs STT หรือไม่?

Accepted Answer

ใช่ — POST เสียงของคุณไปยัง /v1/stt/transcribe/ ด้วย model="ElevenLabs STT". คืนค่า JSON ด้วยข้อความ + ส่วน + ตราเวลาระดับคำ. /api/ มีข้อมูลอ้างอิงเต็ม

Question 10

แล้วเรื่องความเป็นส่วนตัวล่ะ ถ้าฉันแปลเป็นภาษาไทยด้วยชื่อ ElevenLabs STT?

Accepted Answer

โมเดลที่ใช้ตัวมันเองจะเก็บเสียงไว้บน GPU ของเรา; โมเดลพิเศษจะส่งผ่านผ่าน DPA เสียงจะถูกลบหลังจากที่เปิดหน้าต่างแบ่งปัน (24 ชั่วโมงโดยไม่ระบุชื่อ, 7วันหลังจากเข้าระบบ) เราจะไม่ฝึกการเข้าถึงข้อมูลของคุณ

Question 11

ผลลัพธ์ของ ElevenLabs STT นั้นปลอดภัยสำหรับการใช้ในเชิงพาณิชย์หรือไม่?

Accepted Answer

ใช่ — Free.ai อนุมัติการใช้ในเชิงพาณิชย์ของการตีความ คุณต้องมีสิทธิ์ในการใช้งานเสียงที่คุณอัพโหลด (การบันทึกของคุณเอง, วัสดุที่ได้รับอนุญาต, หรือเนื้อหาที่ได้รับอนุญาต)

Question 12

ElevenLabs STT ใช้เวลานานแค่ไหน

Accepted Answer

ค่าเวลาจริงประมาณ 0.05–0.2× — พอดคาสต์ 60 นาที จะถูกบันทึกในเวลา 3–12 นาที รุ่นพิเศษจะทำงานเร็วกว่า ใช้ปุ่มคิวเพื่อปิดแท็บ

ElevenLabs STT

ใช้ผ่าน API

Similar models

คำถามที่ถามบ่อย