AI Voice — CosyVoice 2

Dùng thương mại được. 380+ mẫu Không dấu nước Không cần đăng ký
Mô hình:
+ GPT-5, Claude, Gemini
Bộ máy TTS Tự lưu Apache 2.0
CosyVoice 2 — CosyVoice 2 — Apache 2.0. Streaming multilingual speech synthesis with low latency and natural cross-lingual cloning (Chinese, English, Japanese, Korean and dialects). Self-hosted on Free.ai.
0 chữ cái ~0 token
Đếm chữ cái
Đang tạo giọng nói...

Cái gì? CosyVoice 2 Nghe như thế nào?

CosyVoice 2 — Apache 2.0. Streaming multilingual speech synthesis with low latency and natural cross-lingual cloning (Chinese, English, Japanese, Korean and dialects). Self-hosted on Free.ai.

Hãy thử hộp bên trên với: Hello, tên tôi là Sam, và tôi đang đọc mẫu này để minh họa giọng nói. — đó là cụm từ TTS demo chuẩn.

Khi nào dùng CosyVoice 2

Sách âm thanh

Truyện ngắn với giọng điệu đồng nhất. Chọn một chương, tải về dạng WAV hoặc MP3, và ghép bên ngoài.

Podcast

Điều chỉnh tốc độ để tiết kiệm năng lượng, chuyển định dạng sang MP3 cho các tập tin nhỏ hơn.

IVR + thư thoại

Hệ thống điện thoại báo hiệu, chất lượng phòng thu không cần đặt phòng, ghi âm, hay NDA với giọng ca.

Tính truy cập

Thêm âm thanh cùng với nội dung viết cho người có thị lực kém và người bị khó đọc. Đặt vào bất kỳ trang nào.

Cụm từ mẫu

"Welcome to the show, today we are exploring the future of AI."
"Your package has arrived. Please retrieve it from the front desk."
"Once upon a time, in a quiet village far away, lived a curious child."
"Press one for sales, two for support, or stay on the line for an agent."
"Breaking news: scientists have discovered a new species of deep-sea fish."
"Thank you for choosing us. We appreciate your business and look forward to serving you again."

Giá

Tự lưu trên GPU của chúng tôi. Generation rút từ hồ bơi miễn phí hàng ngày của bạn trước tiên; khi hết, các gói token trả tiền bắt đầu từ $5 → 200,000 token. Khoảng ~5 token mỗi nhân vật, tối thiểu 100 mỗi đoạn phim.

Để xem mẫu đầy đủ → · Xem tất cả giọng nói TTS → · So sánh 2 giọng nói cạnh nhau →

Tùy chọn cao cấp
Kết quả
Tiền hết rồi. Lấy thêm biểu tượng
Muốn kết quả tốt hơn? Các mẫu cao cấp (GPT-5, Claude, Gemini) cung cấp chất lượng cao hơn. Xem kế hoạch

❤️ Love this tool? Share it!

Đăng ký để nhận được một liên kết giới thiệu và kiếm được 25.000 token cho mỗi người bạn.

Muốn thêm nữa không? Đăng ký miễn phí 30K token/ngày + 10K thưởng
Đăng ký miễn phí

Đang xử lý yêu cầu của bạn...

CosyVoice 2 — Apache 2.0. Streaming multilingual speech synthesis with low latency and natural cross-lingual cloning (Chinese, English, Japanese, Korean an…

Cách sử dụng AI Voice — CosyVoice 2

1
Nhập thông tin

Nhập văn bản, tải lên tập tin, hoặc mô tả điều bạn muốn. Không cần tài khoản.

2
Nhấn để tạo

AI của chúng tôi xử lý yêu cầu của bạn trong vài giây sử dụng các mô hình nguồn mở tốt nhất.

3
Tải về và chia sẻ

Tải xuống, sao chép, hoặc chia sẻ kết quả của bạn. Miễn phí cho sử dụng cá nhân và thương mại.

Dùng công cụ này qua API

Tự động hóa công cụ này từ mã của bạn. Điểm kết thúc REST tương thích với OpenAI, xác thực bằng token của người mang, không cần SDK bổ sung. Chi phí token tương ứng với giao diện web.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"text": "Hello from Free.ai", "voice": "af_heart", "model": "kokoro"}'

AI Voice — CosyVoice 2 — FAQ

CosyVoice 2 hỗ trợ nhiều ngôn ngữ. Danh sách chính xác phụ thuộc vào bộ máy; bảng trên trang này chấp nhận bất kỳ văn bản nào và bộ máy sẽ hiển thị bằng ngôn ngữ được hỗ trợ. Xem /voice/ cho bộ chọn đa-bộ máy đầy đủ nếu bạn cần một ngôn ngữ cụ thể.

Hầu hết các engine tạo ra tiếng Anh Mỹ trung lập theo mặc định và một giọng nói phù hợp với khu vực cho các ngôn ngữ không phải tiếng Anh. Các engine Premium có thể cho thấy các biến thể giọng nói — dán một mẫu để so sánh.

Hỗ trợ SSML khác nhau tùy vào động cơ. Thẻ tạm dừng, ngữ điệu, và nhấn mạnh được tôn trọng trên hầu hết động cơ cao cấp và trên một vài động cơ tự lưu. Văn bản đơn giản luôn luôn hoạt động — không cần đánh dấu.

TTS truyền trực tiếp có sẵn trên các engine cao cấp thông qua điểm kết thúc API /v1/tts/ với stream=true. Giao diện người dùng web trên trang này trả về đoạn phim đầy đủ khi hoàn thành trình chiếu.

CosyVoice 2 chạy trên GPU của chúng tôi. Thế hệ rút từ hồ bơi miễn phí hàng ngày của bạn trước tiên. Khi hết, tiền thưởng bắt đầu từ $5 → 200,000 token. Khoảng ~5 token mỗi nhân vật, tối thiểu 100 mỗi đoạn phim.

Đối với các đoạn dài hơn (audiosbooks, toàn bộ các chương), sử dụng /voice/audiobook/ mà tự động chia nhỏ và dệt, hoặc gọi API trong một vòng tròn.

Có — POST một danh sách các chuỗi vào /v1/tts/batch/, hoặc sử dụng giao diện người dùng workspace tại /workspace/ để liên kết TTS vào một đường ống dài hơn (ví dụ, translate → speak → stitch).

Có — POST văn bản đến /v1/tts/ với model="CosyVoice 2" (hoặc slug trên trang này). Trả WAV hoặc MP3. Xem /api/ để tham khảo đầy đủ + đoạn SDK.

Trang này là văn bản-để-nói, không phải sao chép giọng nói — giọng nói là mặc định của động cơ. Đối với sao chép giọng nói (tải lên một âm thanh tham khảo), xem /voice/clone/, yêu cầu bạn phải sở hữu quyền giọng nói hoặc có sự đồng ý bằng văn bản rõ ràng.

Các động cơ tự chủ chạy trên GPU của Free.ai; không có gì rời khỏi máy chủ của chúng tôi. Các động cơ cao cấp truyền văn bản đến các nhà cung cấp mô hình trên dưới DPA của chúng tôi. Chúng tôi không huấn luyện vào đầu vào của bạn và không bán dữ liệu.

Có — Free.ai cho phép sử dụng thương mại âm thanh được tạo ra. Giấy phép cơ bản của engine (Apache 2.0, MIT, hoặc các điều khoản của nhà cung cấp) được hiển thị trên và trên trang tham khảo mô hình; trong thực tế, điều này có nghĩa là lồng tiếng, quảng cáo, podcast, và ứng dụng đều trong phạm vi.

Có — công việc thất bại tự động được trả lại nguồn (tập hợp hàng ngày hoặc token trả tiền). Nếu không có tiền trả lại trong cùng ngày, gửi email đến contact@free.ai.

Đăng ký miễn phí 30,000 token

Tạo tài khoản miễn phí

Không cần thẻ tín dụng

Anh đánh giá công cụ này thế nào?

4.3/5 from 3 ratings

Love this tool? Share it!