STT Online

Dùng thương mại được. 380+ mẫu Không dấu nước Không cần đăng ký
Mô hình:
+ GPT-5, Claude, Gemini
Tải lên một tập tin âm thanh hoặc video — hoặc dán một URL — và nhận được một bản ghi rõ ràng với dấu thời gian. Tạo bản ghi âm, xuất bản phụ đề SRT/ VTT, hơn 100 ngôn ngữ với khả năng tự động phát hiện. Giá cả được tính chính xác theo độ dài đoạn phim. Được cung cấp bởi Whisper large- v3 và Parakeet (tự lưu trữ), cộng thêm Wizper và ElevenLabs STT. Name

Kéo và thả âm thanh/video, hoặc nhấn để duyệt

MP3, WAV, MP4, WebM, M4A — lên đến 500MB

Whisper large-v3 — 99 ngôn ngữ, độ chính xác tốt nhất trong lớp.
Ước tính token cho đoạn phim này
YouTube, Instagram, TikTok, Spotify, và hơn 1.300 nền tảng
URL transcription cost is based on the clip's actual duration — we quote after download. Expect ~500 tokens/minute on Whisper.
Ghi âm: 0:00

Phiên dịch thời gian thực bằng micro của bạn

Bản dịch

Đang phiên âm...

Điều này có thể mất một chút thời gian cho các tập tin dài.

Những gì người ta viết bằng Free.ai

Interviews + podcasts

Diarization đánh dấu mỗi loa. Xuất SRT trực tiếp vào trình biên tập video của bạn, hoặc văn bản đơn giản cho một bài viết viết.

Auto captions + subtitles

Tải lên một video YouTube hoặc TikTok, chọn SRT hoặc WebVTT, và ghi phụ đề vào với /video/subtitle/.

Ghi chú cuộc họp

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Transcript a 90-minute lecture, then use /study/flashcards/ or /write/summarize/ to turn it into study material.

Âm thanh ngôn ngữ ngoại quốc

Whisper tự động phát hiện 99 ngôn ngữ. Phiên âm theo bản gốc, sau đó gửi văn bản qua /translate/ để nhảy ngôn ngữ.

Legal + medical

Time stamps, speaker labels, JSON export with every word's start/end time — chính xác court-reporter hoặc clinical-note prep.

Free.ai phiên âm so sánh

Điều mà anh nhận được Free.ai Otter.ai Descript Rev.com
Sử dụng miễn phí hàng ngày5K+ tokens/day300 minutes/mo1 hr/month
Động cơWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Ngôn ngữ99English-focused2230+
Tự động
Xuất SRT / VTTPaidPaid
API công cộngLimitedLimited
Truyền trực tiếp STT (đóng) Paid
Cần đăng kýKhôngYesYesYes
Các con số cạnh tranh phản ánh các cấp miễn phí được liệt kê công khai vào năm 2026.
Tùy chọn cao cấp
Kết quả
Tiền hết rồi. Get More Tokens
Want better results? Các mẫu cao cấp (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

Đăng ký để nhận được một liên kết giới thiệu và kiếm được 25.000 token cho mỗi người bạn.

Muốn thêm nữa không? Đăng ký miễn phí 5K token/ngày + 10K thưởng
Đăng ký miễn phí

Đang xử lý yêu cầu của bạn...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

Cách sử dụng STT Online

1
Nhập thông tin

Nhập văn bản, tải lên tập tin, hoặc mô tả điều bạn muốn. Không cần tài khoản.

2
Nhấn để tạo

AI của chúng tôi xử lý yêu cầu của bạn trong vài giây sử dụng các mô hình nguồn mở tốt nhất.

3
Tải về và chia sẻ

Tải xuống, sao chép, hoặc chia sẻ kết quả của bạn. Miễn phí cho sử dụng cá nhân và thương mại.

Dùng công cụ này qua API

Tự động hóa công cụ này từ mã của bạn. Điểm kết thúc REST tương thích với OpenAI, xác thực bằng token của người mang, không cần SDK bổ sung. Chi phí token tương ứng với giao diện web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT (Speech-to-Text) chuyển đổi âm thanh nói thành văn bản viết bằng AI. Free.ai chạy Whisper large-v3 — mô hình nhận dạng giọng nói mã nguồn mở chính xác nhất — trên GPU của chúng tôi.

Có. Tải lên tập tin âm thanh lên đến 500MB. STT tốn ~500 token mỗi phút âm thanh. Bạn sẽ nhận được 2.500–5.000 token miễn phí mỗi ngày — nhiều tập tin mỗi ngày miễn phí.

STT chấp nhận MP3, WAV, MP4, WebM, M4A, OGG, FLAC — hầu như bất kỳ định dạng âm thanh hoặc video nào — lên đến 500MB mỗi lần tải lên.

Có. Kết quả STT được xuất thành TXT, SRT (bản phụ), hoặc VTT (bản phụ mạng). Tốt cho bản phụ YouTube và bản phụ video.

STT của chúng tôi sử dụng Whisper large-v3 — thông thường chính xác từ 95% + cho tiếng Anh rõ ràng và chất lượng tuyệt vời trong 99 ngôn ngữ.

Có. Bật tính toán âm thanh trong tùy chọn STT và AI sẽ đánh dấu các phân đoạn như: Người nói 1, Người nói 2, v.v.

Vâng. API STT tương thích với OpenAI — POST âm thanh đến /v1/audio/transcriptions và nhận JSON. Tính năng từ bất kỳ ngôn ngữ nào có thể gửi yêu cầu HTTP.

Ừ, tab trực tiếp ghi lại micro của anh và truyền qua STT trong thời gian thực với thời gian chờ tối thiểu.

Có. dán một URL YouTube, TikTok, Instagram, Spotify, hoặc Vimeo và STT sẽ trích xuất âm thanh và phiên dịch nó.

Nhanh — một đoạn phim 1 phút kết thúc trong vài giây, một đoạn ghi âm 30 phút trong khoảng một phút, một tập tin 1 giờ trong khoảng 2 phút. Whisper chạy trên cụm GPU của chúng tôi.

Vâng, âm thanh được xử lý trên GPU của chúng tôi và bị xóa sau khi STT hoàn tất. Nó không bao giờ được lưu trữ lâu dài, không bao giờ được chia sẻ, và không bao giờ được sử dụng để huấn luyện mô hình.

Whisper large-v3 — mô hình Whisper lớn nhất, chính xác nhất (1.55B tham số). Chúng tôi tự lưu nó trên GPU A100 cho tốc độ và riêng tư.

Đăng ký miễn phí 10,000 token

Tạo tài khoản miễn phí

Không cần thẻ tín dụng

Anh đánh giá công cụ này thế nào?

Love this tool? Share it!