Speech to Text

Dùng thương mại được. 380+ mẫu Không dấu nước Không cần đăng ký
Mô hình:
+ GPT-5, Claude, Gemini
Tải lên một tập tin âm thanh hoặc video — hoặc dán một URL — và nhận được một bản ghi rõ ràng với dấu thời gian. Tạo bản ghi âm, xuất bản phụ đề SRT/ VTT, hơn 100 ngôn ngữ với khả năng tự động phát hiện. Giá cả được tính chính xác theo độ dài đoạn phim. Được cung cấp bởi Whisper large- v3 và Parakeet (tự lưu trữ), cộng thêm Wizper và ElevenLabs STT. Name

Kéo và thả âm thanh/video, hoặc nhấn để duyệt

MP3, WAV, MP4, WebM, M4A — lên đến 500MB

Whisper large-v3 — 99 ngôn ngữ, độ chính xác tốt nhất trong lớp.
Ước tính token cho đoạn phim này
YouTube, Instagram, TikTok, Spotify, và hơn 1.300 nền tảng
URL transcription cost is based on the clip's actual duration — we quote after download. Expect ~500 tokens/minute on Whisper.
Ghi âm: 0:00

Phiên dịch thời gian thực bằng micro của bạn

Bản dịch

Đang phiên âm...

Điều này có thể mất một chút thời gian cho các tập tin dài.

Những gì người ta viết bằng Free.ai

Interviews + podcasts

Diarization đánh dấu mỗi loa. Xuất SRT trực tiếp vào trình biên tập video của bạn, hoặc văn bản đơn giản cho một bài viết viết.

Auto captions + subtitles

Tải lên một video YouTube hoặc TikTok, chọn SRT hoặc WebVTT, và ghi phụ đề vào với /video/subtitle/.

Ghi chú cuộc họp

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Transcript a 90-minute lecture, then use /study/flashcards/ or /write/summarize/ to turn it into study material.

Âm thanh ngôn ngữ ngoại quốc

Whisper tự động phát hiện 99 ngôn ngữ. Phiên âm theo bản gốc, sau đó gửi văn bản qua /translate/ để nhảy ngôn ngữ.

Legal + medical

Time stamps, speaker labels, JSON export with every word's start/end time — chính xác court-reporter hoặc clinical-note prep.

Free.ai phiên âm so sánh

Điều mà anh nhận được Free.ai Otter.ai Descript Rev.com
Sử dụng miễn phí hàng ngày5K+ tokens/day300 minutes/mo1 hr/month
Động cơWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Ngôn ngữ99English-focused2230+
Tự động
Xuất SRT / VTTPaidPaid
API công cộngLimitedLimited
Truyền trực tiếp STT (đóng) Paid
Cần đăng kýKhôngYesYesYes
Các con số cạnh tranh phản ánh các cấp miễn phí được liệt kê công khai vào năm 2026.
Tùy chọn cao cấp
Kết quả
Tiền hết rồi. Get More Tokens
Want better results? Các mẫu cao cấp (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

Đăng ký để nhận được một liên kết giới thiệu và kiếm được 25.000 token cho mỗi người bạn.

Muốn thêm nữa không? Đăng ký miễn phí 5K token/ngày + 10K thưởng
Đăng ký miễn phí

Đang xử lý yêu cầu của bạn...

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Cách sử dụng Speech to Text

1
Nhập thông tin

Nhập văn bản, tải lên tập tin, hoặc mô tả điều bạn muốn. Không cần tài khoản.

2
Nhấn để tạo

AI của chúng tôi xử lý yêu cầu của bạn trong vài giây sử dụng các mô hình nguồn mở tốt nhất.

3
Tải về và chia sẻ

Tải xuống, sao chép, hoặc chia sẻ kết quả của bạn. Miễn phí cho sử dụng cá nhân và thương mại.

Dùng công cụ này qua API

Tự động hóa công cụ này từ mã của bạn. Điểm kết thúc REST tương thích với OpenAI, xác thực bằng token của người mang, không cần SDK bổ sung. Chi phí token tương ứng với giao diện web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai cung cấp lời nói Whisper-powered để văn bản với độ chính xác tuyệt vời, 99 ngôn ngữ, xuất bản phụ đề, phát hiện người nói, và ghi mic trực tiếp - hoàn toàn miễn phí.

Tải lên một tập tin âm thanh hoặc video (MP3, WAV, MP4, M4A), nhấn vào Phép dịch, và nhận được giọng nói chính xác thành văn bản trong vài giây. Hoặc ghi trực tiếp từ micro của bạn.

Có. dán bất kỳ URL YouTube nào vào thẻ URL và công cụ nói đến văn bản sẽ trích xuất âm thanh và chuyển đổi nó. Làm việc với Instagram, TikTok, Spotify, và hơn 1.300 nền tảng.

Có, tự động phát hiện hoặc chọn từ 99 ngôn ngữ. Tự động chuyển đổi giọng nói thành văn bản, xử lý giọng điệu, tiếng ồn nền và âm thanh hỗn hợp ngôn ngữ tốt.

Có. Chọn nhiều tập tin âm thanh cùng một lúc — mỗi tập tin sẽ được gửi qua giọng nói sang văn bản với việc theo dõi tiến độ và kết quả có thể tải về riêng lẻ hoặc kết hợp.

Vâng. API chuyển đổi giọng nói thành văn bản ở /api/ tương thích với OpenAI. Tải lên âm thanh bằng lập trình và nhận JSON với bản ghi, ngôn ngữ và dấu thời gian.

Có. Bật/ tắt Kiểm tra người nói trước khi tải lên và kết quả nói ra sẽ được dán nhãn cho mỗi người nói (Người nói 1, Người nói 2...). Thêm 50% vào giá trị token.

Speech to text chấp nhận tập tin lên đến 500MB mỗi lần tải lên. Đối với nội dung nhiều giờ, chia âm thanh thành các mảnh trước.

Rất chính xác cho âm thanh rõ ràng — thông thường chính xác từ 95% + trong tiếng Anh với phần mềm sau Whisper large- v3 của chúng tôi. Chất lượng phụ thuộc vào độ rõ ràng âm thanh, giọng nói, và tiếng ồn nền.

Có. Bản ghi có thể được chỉnh sửa hoàn toàn. Sửa lỗi, định dạng lại, và sao chép/tải về dạng TXT, SRT, hay VTT.

Có. Âm thanh được xử lý trên GPU của chúng tôi và bị xóa sau khi chuyển đổi từ nói sang văn bản hoàn tất. Không có gì được lưu trữ lâu dài, chia sẻ, hay dùng để huấn luyện.

Có. Tải lên một tập tin âm thanh hoặc video trong /chat/ và yêu cầu AI chuyển đổi nó — kết hợp nói chuyện thành văn bản với các câu hỏi tiếp theo và tóm tắt trong một luồng công việc.

Đăng ký miễn phí 10,000 token

Tạo tài khoản miễn phí

Không cần thẻ tín dụng

Anh đánh giá công cụ này thế nào?

Love this tool? Share it!