STT Online

ใช้ในเชิงพาณิชย์ได้ 380+ โมเดล ไม่มีสัญลักษณ์น้ำ ไม่ต้องลงทะเบียน
รุ่น:
+ GPT-5, Claude, Gemini
โหลดแฟ้มเสียงหรือวิดีโอ - หรือปักที่อยู่ URL - และรับการตีพิมพ์ที่สะอาดพร้อมสแตมป์เวลา การจัดเรียงตัวอักษรของผู้พูด, การส่งออกคำอธิบาย SRT/VTT, ภาษามากกว่า 100 ภาษาพร้อมการตรวจจับอัตโนมัติ ค่าใช้จ่ายปรับขนาดได้ตามความยาวของคลิป ใช้พลังงานจาก Whisper large- v3 และ Parakeet (โฮสต์เอง), รวมถึง Wizper และ ElevenLabs STT ระดับพรีเมี่ยม

ลากและวางเพลง/วิดีโอ หรือคลิกเพื่อค้นหา

MP3, WAV, MP4, WebM, M4A - สูงสุด 500MB

วิสเปอร์ ใหญ่-v3 - 99 ภาษา, ความแม่นยำที่ดีที่สุดในระดับ
ค่าที่คาดการณ์ไว้สำหรับคลิปนี้
ยูทูบ, อินสตารแกรม, ติ๊กต๊อก, สปอตฟิช และอีก 1,300+ แพลตฟอร์ม
ค่าแปล URL ขึ้นอยู่กับความยาวของคลิปจริงๆ เราจะให้ราคาหลังดาวน์โหลด ประมาณ 500 โต๊ก/นาทีบน Whisper
บันทึก: 0:00

พิมพ์คำสั่งแบบเรียลไทม์โดยใช้ไมโครโฟนของคุณ

คำแปล

กำลังแปลงเสียงของคุณ...

อาจใช้เวลาสักครู่สำหรับแฟ้มที่ยาวกว่า

สิ่งที่คนอื่นบันทึกไว้ด้วย Free.ai

Interviews + podcasts

การจัดเรียงข้อมูลจะติดป้ายทุกตัวเล่าเรื่อง ส่งออก SRT ไปยังเครื่องมือแก้ไขวิดีโอของคุณ หรือใช้ข้อความธรรมดาในการเขียนบทความ

Auto captions + subtitles

อัพโหลดวิดีโอจาก YouTube หรือ TikTok เลือก SRT หรือ WebVTT และเขียนคำอธิบายลงใน /video/subtitle/ กระบวนการทำงานคำอธิบายแบบหยุดชะงัก

ข้อความที่ไม่สามารถอ่านได้

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

เขียนบทเรียน 90 นาที แล้วใช้ /study/flashcards/ หรือ /write/summarize/ เพื่อเปลี่ยนเป็นวัสดุการเรียนรู้

เสียงภาษาต่างประเทศ

วิสเซอร์สามารถตรวจจับภาษาได้ 99 ภาษา เขียนเป็นภาษาต้นฉบับ แล้วส่งข้อความผ่าน / translate / ไปยังภาษาที่ต้องการ

Legal + medical

ตราเวลา เลขบันทึกเสียง ส่งออก JSON ด้วยเวลาเริ่ม/จบของทุกคำ รายงานทางการแพทย์ที่แม่นยำ

Free.ai แบบแปลภาษาเปรียบเทียบ

สิ่งที่คุณได้รับ Free.ai Otter.ai Descript Rev.com
ใช้ฟรีทุกวัน5K+ tokens/day300 minutes/mo1 hr/month
เครื่องยนต์Whisper large-v3, ParakeetProprietaryProprietaryHuman + AI
ภาษา99English-focused2230+
ปรับแต่งการแสดงผลของตัวเล่าเรื่อง
ส่งออก SRT / VTTPaidPaid
API สาธารณะLimitedLimited
ถ่ายทอดสด STT (ว่าง) Paid
ต้องการลงทะเบียนไม่มีYesYesYes
ตัวเลขของคู่แข่งสะท้อนให้เห็นถึงระดับฟรีที่เปิดเผยต่อสาธารณะตั้งแต่ปี 2026 ตรวจสอบแผนปัจจุบันของแต่ละผู้ให้บริการ
ตัวเลือกระดับสูง
ผลลัพธ์
เหรียญหมดแล้ว Get More Tokens
Want better results? รุ่นพิเศษ (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

ลงทะเบียนเพื่อรับลิงค์แนะนำ และรับ 25,000 โต๊กเกอร์ต่อเพื่อน

อยากได้อีกมั้ย ลงทะเบียนฟรี 5K ชิ้น/วัน + 10K โบโน
ลงทะเบียน

กำลังประมวลผลคำขอของคุณ...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

วิธีการใช้ STT Online

1
เติมข้อมูลของคุณ

พิมพ์ข้อความ, โหลดแฟ้ม, หรืออธิบายสิ่งที่คุณต้องการ ไม่จำเป็นต้องมีบัญชีผู้ใช้

2
คลิกสร้าง

ระบบ AI ของเราจะประมวลผลคำขอของคุณในไม่กี่วินาที โดยใช้แบบจำลอง Open Source ที่ยอดเยี่ยม

3
ดาวน์โหลดและแบ่งปัน

ดาวน์โหลด, คัดลอก, หรือแบ่งปันผลลัพธ์ของคุณ ฟรีสำหรับใช้ส่วนตัวและใช้ในเชิงพาณิชย์

ใช้เครื่องมือนี้ผ่าน API

สร้างเครื่องมือนี้โดยอัตโนมัติจากโค้ดของคุณเอง จุดจบ REST ที่เข้ากันได้กับ OpenAI, การตรวจสอบสิทธิ์ด้วยโทเค็นผู้ใช้, ไม่จำเป็นต้องใช้ SDK เพิ่มเติม ค่าโทเค็นจะตรงกับส่วนติดต่อของเว็บ

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT (Speech-to-Text) เปลี่ยนเสียงที่พูดออกมาเป็นข้อความที่เขียนขึ้นมา โดยใช้ AI Free.ai ใช้ Whisper large-v3 โมเดลการจดจำเสียงแบบเปิดซอร์สที่แม่นยำที่สุด บน GPU ของพวกเราเอง

ใช่ สามารถอัพโหลดแฟ้มเสียงได้สูงสุด 500MB STT มีค่าใช้จ่าย ~500 โต๊กเกอร์ต่อนาทีของเสียง คุณจะได้รับ 2,500-5,000 โต๊กเกอร์ฟรีต่อวัน — แฟ้มหลายแฟ้มต่อวันโดยไม่เสียค่าใช้จ่าย

STT รองรับ MP3, WAV, MP4, WebM, M4A, OGG, FLAC — แทบจะทุกรูปแบบเสียงหรือวิดีโอ — สูงสุด 500MB ต่อการอัพโหลด

ใช่ ผลลัพธ์ของ STT จะถูกส่งออกเป็น TXT, SRT (คำอธิบาย) หรือ VTT (คำอธิบายบนเว็บ) เหมาะสำหรับคำอธิบายใน YouTube และคำอธิบายในวิดีโอ

STT ของเราใช้ Whisper ขนาดใหญ่-v3 - โดยทั่วไปแล้วความถูกต้องของคำ 95% + สำหรับภาษาอังกฤษที่ชัดเจนและคุณภาพที่ดีใน 99 ภาษา เสียงรบกวนในพื้นหลังและสำเนียงที่หนักทำให้ความถูกต้องลดลง

ใช่ เปิดการแยกเสียงในตัวเลือก STT และ AI จะระบุกลุ่มเสียงเป็น เสียง 1 เสียง2และอื่นๆ ใช้เงินเพิ่มอีก 50%

ใช่ API ของ STT รองรับ OpenAI — ส่งเสียงไปยัง /v1/audio/transcriptions และรับ JSON ทำงานจากภาษาใดๆที่สามารถส่งคำร้องขอ HTTP ได้

ใช่ แท็บสด เก็บไมโครโฟนของคุณ และสตรีมมันผ่าน STT ในเวลาจริง ด้วยความล่าช้าที่น้อยที่สุด

ใช่ ใส่ URL ของยูทูป ติ๊กต๊อก อินสตกรัม สปอตฟิช หรือ วิเมโอ และ STT จะดึงเสียงออกมา และแปลมันออกมา

เร็ว - คลิป 1 นาที เสร็จสิ้นใน 1 วินาที บันทึก 30 นาที ใน 1 นาที แฟ้ม 1 ชั่วโมง ใน 2-3 นาที Whisper ทำงานบน GPU cluster

ใช่ เสียงจะถูกประมวลผลบน GPU ของพวกเรา และถูกลบออกหลังจาก STT เสร็จสิ้น มันจะไม่ถูกเก็บไว้นาน ไม่ถูกแบ่งปัน และไม่ถูกใช้ในการฝึกแบบจำลอง

Whisper large-v3 — โมเดล Whisper ขนาดใหญ่และแม่นยำที่สุด (พารามิเตอร์ 1.55B) เราโฮสต์มันบน A100 GPUs เพื่อความเร็วและความเป็นส่วนตัว

ลงทะเบียนฟรี 10,000 ชิ้น

สร้างบัญชีผู้ใช้ฟรี

ไม่ต้องใช้บัตรเครดิต

คุณจะให้คะแนนเครื่องมือนี้ยังไง

Love this tool? Share it!