Speech to Text

Dùng thương mại được. 380+ mẫu Không dấu nước Không cần đăng ký

Tải lên một tập tin âm thanh hoặc video — hoặc dán một URL — và nhận được một bản ghi rõ ràng với dấu thời gian. Tạo bản ghi âm, xuất bản phụ đề SRT/ VTT, hơn 100 ngôn ngữ với khả năng tự động phát hiện. Giá cả được tính chính xác theo độ dài đoạn phim. Được cung cấp bởi Whisper large- v3 và Parakeet (tự lưu trữ), cộng thêm Wizper và ElevenLabs STT. Name

Kéo và thả âm thanh/video, hoặc nhấn để duyệt

MP3, WAV, MP4, WebM, M4A — lên đến 500MB

Ngôn ngữ

Động cơ Whisper large-v3 — 99 ngôn ngữ, độ chính xác tốt nhất trong lớp.

Định dạng xuất

Kiểm tra loa — nhãn người nói khi nào (+50% tokens)

Số loa

YouTube, Instagram, TikTok, Spotify, và hơn 1.300 nền tảng

Động cơ

Định dạng xuất

Kiểm tra loa — +50%

URL transcription cost is based on the clip's actual duration — we quote after download. Expect ~500 tokens/minute on Whisper.

Phiên dịch thời gian thực bằng micro của bạn

Những gì người ta viết bằng Free.ai

Phỏng vấn + podcast

Diarization đánh dấu mỗi loa. Xuất SRT trực tiếp vào trình biên tập video của bạn, hoặc văn bản đơn giản cho một bài viết viết.

Tự động

Tải lên một video YouTube hoặc TikTok, chọn SRT hoặc WebVTT, và ghi phụ đề vào với /video/subtitle/.

Ghi chú cuộc họp

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Bài học

Transcript a 90-minute lecture, then use /study/flashcards/ or /write/summarize/ to turn it into study material.

Âm thanh ngôn ngữ ngoại quốc

Whisper tự động phát hiện 99 ngôn ngữ. Phiên âm theo bản gốc, sau đó gửi văn bản qua /translate/ để nhảy ngôn ngữ.

Luật + y tế

Time stamps, speaker labels, JSON export with every word's start/end time — chính xác court-reporter hoặc clinical-note prep.

Free.ai phiên âm so sánh

Điều mà anh nhận được	Free.ai	Otter.ai	Descript	Rev.com
Sử dụng miễn phí hàng ngày	5K+ tokens/day	300 minutes/mo	1 hr/month	—
Động cơ	Whisper large-v3, Parakeet	Proprietary	Proprietary	Human + AI
Ngôn ngữ	99	English-focused	22	30+
Tự động
Xuất SRT / VTT		Paid	Paid
API công cộng		Limited	Limited
Truyền trực tiếp STT	(đóng)	Paid	—	—
Cần đăng ký	Không	Yes	Yes	Yes

Các con số cạnh tranh phản ánh các cấp miễn phí được liệt kê công khai vào năm 2026.

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Cách sử dụng Speech to Text

Nhập thông tin

Nhập văn bản, tải lên tập tin, hoặc mô tả điều bạn muốn. Không cần tài khoản.

Nhấn để tạo

AI của chúng tôi xử lý yêu cầu của bạn trong vài giây sử dụng các mô hình nguồn mở tốt nhất.

Tải về và chia sẻ

Tải xuống, sao chép, hoặc chia sẻ kết quả của bạn. Miễn phí cho sử dụng cá nhân và thương mại.

Dùng công cụ này qua API

Tự động hóa công cụ này từ mã của bạn. Điểm kết thúc REST tương thích với OpenAI, xác thực bằng token của người mang, không cần SDK bổ sung. Chi phí token tương ứng với giao diện web.

Tài liệu API Lấy khóa API

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai cung cấp lời nói Whisper-powered để văn bản với độ chính xác tuyệt vời, 99 ngôn ngữ, xuất bản phụ đề, phát hiện người nói, và ghi mic trực tiếp - hoàn toàn miễn phí.

Tải lên một tập tin âm thanh hoặc video (MP3, WAV, MP4, M4A), nhấn vào Phép dịch, và nhận được giọng nói chính xác thành văn bản trong vài giây. Hoặc ghi trực tiếp từ micro của bạn.

Có. dán bất kỳ URL YouTube nào vào thẻ URL và công cụ nói đến văn bản sẽ trích xuất âm thanh và chuyển đổi nó. Làm việc với Instagram, TikTok, Spotify, và hơn 1.300 nền tảng.

Có, tự động phát hiện hoặc chọn từ 99 ngôn ngữ. Tự động chuyển đổi giọng nói thành văn bản, xử lý giọng điệu, tiếng ồn nền và âm thanh hỗn hợp ngôn ngữ tốt.

Có. Chọn nhiều tập tin âm thanh cùng một lúc — mỗi tập tin sẽ được gửi qua giọng nói sang văn bản với việc theo dõi tiến độ và kết quả có thể tải về riêng lẻ hoặc kết hợp.

Vâng. API chuyển đổi giọng nói thành văn bản ở /api/ tương thích với OpenAI. Tải lên âm thanh bằng lập trình và nhận JSON với bản ghi, ngôn ngữ và dấu thời gian.

Có. Bật/ tắt Kiểm tra người nói trước khi tải lên và kết quả nói ra sẽ được dán nhãn cho mỗi người nói (Người nói 1, Người nói 2...). Thêm 50% vào giá trị token.

Speech to text chấp nhận tập tin lên đến 500MB mỗi lần tải lên. Đối với nội dung nhiều giờ, chia âm thanh thành các mảnh trước.

Rất chính xác cho âm thanh rõ ràng — thông thường chính xác từ 95% + trong tiếng Anh với phần mềm sau Whisper large- v3 của chúng tôi. Chất lượng phụ thuộc vào độ rõ ràng âm thanh, giọng nói, và tiếng ồn nền.

Có. Bản ghi có thể được chỉnh sửa hoàn toàn. Sửa lỗi, định dạng lại, và sao chép/tải về dạng TXT, SRT, hay VTT.

Có. Âm thanh được xử lý trên GPU của chúng tôi và bị xóa sau khi chuyển đổi từ nói sang văn bản hoàn tất. Không có gì được lưu trữ lâu dài, chia sẻ, hay dùng để huấn luyện.

Có. Tải lên một tập tin âm thanh hoặc video trong /chat/ và yêu cầu AI chuyển đổi nó — kết hợp nói chuyện thành văn bản với các câu hỏi tiếp theo và tóm tắt trong một luồng công việc.

Đăng ký miễn phí 30,000 token

Tạo tài khoản miễn phí

Không cần thẻ tín dụng

Anh đánh giá công cụ này thế nào?

Speech to Text

Những gì người ta viết bằng Free.ai

Phỏng vấn + podcast

Tự động

Ghi chú cuộc họp

Bài học

Âm thanh ngôn ngữ ngoại quốc

Luật + y tế

Free.ai phiên âm so sánh

Kết quả

Cách sử dụng Speech to Text

Nhập thông tin

Nhấn để tạo

Tải về và chia sẻ

Dùng công cụ này qua API

Speech to Text — FAQ

Công cụ chuyển đổi từ nói tự do sang văn bản tốt nhất là gì?

Làm thế nào để tôi chuyển đổi lời nói thành văn bản trên mạng?

Có thể chuyển từ nói sang văn bản để xử lý video YouTube không?

Liệu chuyển từ nói sang văn bản có hoạt động với các ngôn ngữ khác không?

Tôi có thể tải lên nhiều tập tin để chuyển từ nói sang văn bản không?

Có một API chuyển từ nói sang văn bản không?

Liệu chuyển từ nói sang văn bản có hỗ trợ nhãn loa không?

Tập tin âm thanh có kích thước nào để chuyển đổi giọng nói thành văn bản?

Lời nói đến văn bản xuất ra chính xác như thế nào?

Tôi có thể chỉnh sửa bài phát biểu thành văn bản không?

Liệu giọng nói sang văn bản có riêng tư và an toàn không?

Tôi có thể dùng giọng nói để chuyển đổi văn bản trong AI Chat không?

Lấy 10.000 token miễn phí

Chờ đã — Cầm 10K token miễn phí!

Muốn thêm nữa không?