CosyVoice 2

Free.ai (self-hosted) · tts · ~500 token mỗi clip · 4.3 từ 3 người dùng trong danh mục này
~500 token mỗi clip

CosyVoice 2 là a giọng nói chuyển văn bản thành nói được xây dựng bởi Alibaba FunAudioLLM. Strongest tại Low-latency streaming TTS, cross-lingual voice cloning, real-time voice.. Tự lưu trữ trên Free.ai GPU — chạy miễn phí đối với hồ token hàng ngày của bạn (500 tokens mỗi đoạn). Phát hành dưới Apache 2.0 — sử dụng thương mại được phép trên Free.ai.

Dùng qua API
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"cosyvoice2","text":"hello world"}'
Tài liệu API Lấy khóa API

Câu hỏi thường gặp

CosyVoice 2 hỗ trợ nhiều ngôn ngữ. Danh sách chính xác phụ thuộc vào bộ máy; bảng trên trang này chấp nhận bất kỳ văn bản nào và bộ máy sẽ hiển thị bằng ngôn ngữ được hỗ trợ. Xem /voice/ cho bộ chọn đa-bộ máy đầy đủ nếu bạn cần một ngôn ngữ cụ thể.

Hầu hết các engine tạo ra tiếng Anh Mỹ trung lập theo mặc định và một giọng nói phù hợp với khu vực cho các ngôn ngữ không phải tiếng Anh. Các engine Premium có thể cho thấy các biến thể giọng nói — dán một mẫu để so sánh.

Hỗ trợ SSML khác nhau tùy vào động cơ. Thẻ tạm dừng, ngữ điệu, và nhấn mạnh được tôn trọng trên hầu hết động cơ cao cấp và trên một vài động cơ tự lưu. Văn bản đơn giản luôn luôn hoạt động — không cần đánh dấu.

TTS truyền trực tiếp có sẵn trên các engine cao cấp thông qua điểm kết thúc API /v1/tts/ với stream=true. Giao diện người dùng web trên trang này trả về đoạn phim đầy đủ khi hoàn thành trình chiếu.

CosyVoice 2 chạy trên GPU của chúng tôi. Thế hệ rút từ hồ bơi miễn phí hàng ngày của bạn trước tiên. Khi hết, tiền thưởng bắt đầu từ $5 → 200,000 token. Khoảng ~5 token mỗi nhân vật, tối thiểu 100 mỗi đoạn phim.

Đối với các đoạn dài hơn (audiosbooks, toàn bộ các chương), sử dụng /voice/audiobook/ mà tự động chia nhỏ và dệt, hoặc gọi API trong một vòng tròn.

Có — POST một danh sách các chuỗi vào /v1/tts/batch/, hoặc sử dụng giao diện người dùng workspace tại /workspace/ để liên kết TTS vào một đường ống dài hơn (ví dụ, translate → speak → stitch).

Có — POST văn bản đến /v1/tts/ với model="CosyVoice 2" (hoặc slug trên trang này). Trả WAV hoặc MP3. Xem /api/ để tham khảo đầy đủ + đoạn SDK.

Trang này là văn bản-để-nói, không phải sao chép giọng nói — giọng nói là mặc định của động cơ. Đối với sao chép giọng nói (tải lên một âm thanh tham khảo), xem /voice/clone/, yêu cầu bạn phải sở hữu quyền giọng nói hoặc có sự đồng ý bằng văn bản rõ ràng.

Các động cơ tự chủ chạy trên GPU của Free.ai; không có gì rời khỏi máy chủ của chúng tôi. Các động cơ cao cấp truyền văn bản đến các nhà cung cấp mô hình trên dưới DPA của chúng tôi. Chúng tôi không huấn luyện vào đầu vào của bạn và không bán dữ liệu.

Có — Free.ai cho phép sử dụng thương mại âm thanh được tạo ra. Giấy phép cơ bản của engine (Apache 2.0, MIT, hoặc các điều khoản của nhà cung cấp) được hiển thị trên và trên trang tham khảo mô hình; trong thực tế, điều này có nghĩa là lồng tiếng, quảng cáo, podcast, và ứng dụng đều trong phạm vi.

Có — công việc thất bại tự động được trả lại nguồn (tập hợp hàng ngày hoặc token trả tiền). Nếu không có tiền trả lại trong cùng ngày, gửi email đến contact@free.ai.

Love this tool? Share it!

Đánh giá trang này