Đầu nói của AIName

Dùng thương mại được. 380+ mẫu Không dấu nước Không cần đăng ký
Mô hình:
+ GPT-5, Claude, Gemini
Animate any portrait photo to speak. Drop a face image + an audio file (or paste TTS text), AI generates a video of the face talking with synchronized lip movements. Powered by SadTalker — fast and reliable for professional talking-head explainer videos.

PNG/JPG — thẳng đứng hướng trước, mặt rõ

MP3/ WAV — hoặc để trống + dùng TTS bên dưới

Nếu bạn cung cấp âm thanh ở trên, văn bản này sẽ bị bỏ qua. Hơn 1000 ký tự.
~6,000 token mỗi clip (miễn phí); Premium tăng dần theo độ dài
Tải về
Tùy chọn cao cấp
Kết quả
Tiền hết rồi. Lấy thêm biểu tượng
Muốn kết quả tốt hơn? Các mẫu cao cấp (GPT-5, Claude, Gemini) cung cấp chất lượng cao hơn. Xem kế hoạch

❤️ Love this tool? Share it!

Đăng ký để nhận được một liên kết giới thiệu và kiếm được 25.000 token cho mỗi người bạn.

Muốn thêm nữa không? Đăng ký miễn phí 30K token/ngày + 10K thưởng
Đăng ký miễn phí

Đang xử lý yêu cầu của bạn...

Chỉnh sửa bất kỳ hình ảnh chân dung nào để nói. SadTalker miễn phí (tự lưu) hoặc lipsync cao cấp — thả một hình ảnh mặt + âm thanh, lấy lại một video đầu nói đồng bộ môi. Tốt cho những người giải thích, avatar, lồng tiếng cho video.

Cách sử dụng Đầu nói của AIName

1
Nhập thông tin

Nhập văn bản, tải lên tập tin, hoặc mô tả điều bạn muốn. Không cần tài khoản.

2
Nhấn để tạo

AI của chúng tôi xử lý yêu cầu của bạn trong vài giây sử dụng các mô hình nguồn mở tốt nhất.

3
Tải về và chia sẻ

Tải xuống, sao chép, hoặc chia sẻ kết quả của bạn. Miễn phí cho sử dụng cá nhân và thương mại.

Dùng công cụ này qua API

Tự động hóa công cụ này từ mã của bạn. Điểm kết thúc REST tương thích với OpenAI, xác thực bằng token của người mang, không cần SDK bổ sung. Chi phí token tương ứng với giao diện web.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

Đầu nói của AIName — FAQ

Tải lên một bức ảnh chân dung + một đoạn nhạc (hoặc tập tin nói), AI tạo động vật trên khuôn mặt để đồng bộ âm thanh với môi. Xuất ra là một video MP4 của bức ảnh "nói" âm thanh với chuyển động miệng thực tế, đầu lắc, và nháy mắt. Hai mô hình: SadTalker miễn phí (tự lưu, MIT) hoặc lipsync cao cấp (miệng sắc nét hơn, nhanh hơn).

Có — SadTalker chạy trên GPU tự chủ của chúng tôi, miễn phí trong nguồn token hàng ngày. Mỗi đoạn phim có giá ~6,000 token cơ bản + 800 token mỗi giây âm thanh. Vì vậy, một đoạn phim 10 giây là ~14,000 token. Nặc danh nhận được 2,500/ngày, đăng nhập nhận được 10,000/ngày. Premium cũng tăng dần theo độ dài nhưng với kết quả rõ nét hơn.

SadTalker (mặc định) miễn phí và tạo ra một đầu nói tự nhiên với chuyển động đầu + nháy mắt tinh tế. Lipsync Premium có hình dạng miệng sắc nét hơn (đặc biệt là cho các âm trầm và lưỡi như "p", "b", "m") và tạo ra nhanh hơn 2-3 lần trên âm thanh dài. Đối với các diễn giải và hình tượng truyền thông xã hội, SadTalker rất tuyệt. Đối với lồng tiếng chất lượng cao và nội dung cần đồng bộ môi, hãy chuyển sang Premium.

Chụp chân dung hướng về phía trước, khuôn mặt rõ ràng, ánh sáng đều, biểu cảm trung tính. Mặt phải lấp đầy ít nhất 30% khung hình. Tránh kính râm nặng (nó phá vỡ việc theo dõi mắt), chụp chân dung (người mẫu cần có thể nhìn thấy cả hai mắt), và biểu cảm cực đoan. Chụp mặt trong phòng thu và selfie tốt sẽ hoạt động tốt.

WAV hoặc MP3 của lời nói rõ ràng. SadTalker xử lý các đoạn phim 1- 30 giây một cách đáng tin cậy, hỗ trợ dài hơn nhưng chậm hơn. Để đồng bộ môi tốt nhất, dùng một loa duy nhất, tiếng ồn nền thấp, và nói rõ ràng. Tạo âm thanh đầu tiên qua / tts / nếu muốn lập trình đầu nói.

SadTalker mất khoảng 10 giây thời gian GPU mỗi giây âm thanh. Vì vậy, một đầu nói 10 giây mất ~100 giây. Premium lipsync nhanh hơn (~3-5 giây mỗi giây âm thanh) nhưng tốn nhiều tiền hơn. Cả hai đều chạy trên A100s của chúng tôi — bạn có thể đóng thẻ và kết quả sẽ xuất hiện trên bảng điều khiển của bạn.

D-ID tính phí 5,99 USD/tháng cho 5 phút video. HeyGen là 24 USD/tháng. Synthesia là 30 USD/tháng. Chúng tôi cung cấp SadTalker miễn phí trong bể bơi hàng ngày — chất lượng tương đương cho các video giải thích / avatar. Lipsync Premium tương đương chất lượng D-ID Studio. Chọn miễn phí là đủ tốt cho hầu hết các trường hợp sử dụng ngắn TikTok / YouTube.

Có — tạo một khuôn mặt qua / image/ avatar / hoặc / image/ generate /, sau đó nhập nó vào đây. Mô hình xử lý bất kỳ chân dung nào nhìn về phía trước theo cách tương tự. Chuỗi chung: yêu cầu → chân dung SDXL → SadTalker hoạt hình → / tts / cho giọng nói → hoàn thành.

SadTalker tạo động khu vực mặt (miệng, mắt, đầu lắc, nháy mắt). Vai, quần áo, và nền gần như tĩnh. Đối với đầu nói toàn thân với chuyển động cơ thể, dùng mô hình đồng bộ môi cao cấp với cắt rộng hơn.

Có — POST to /v1/video/talking-head/ with multipart `image` + `audio`. Or use /scheduled/ to queue many runs. /batch/ also accepts CSV of image-URL + audio-URL pairs.

Có — POST nhiều phần `image` + `audio` to /v1/video/talking-head/ on api.free.ai. Bearer auth. Returns JSON with `video_url` + `share_token`. 10,000 tokens/month free. Premium scales linearly with audio duration. /api/ has the curl example.

Tấm ảnh và âm thanh sẽ bị xóa trong vòng 24 giờ sau khi tạo ra. Phim ảnh xuất vào CDN của chúng tôi trong 24 giờ (7 ngày cho người dùng trả phí) để bạn có thể tải lại từ /account/?tab=history. Không bao giờ được sử dụng cho mục đích huấn luyện. Chính sách riêng tư đầy đủ tại /privacy/.

Đăng ký miễn phí 30,000 token

Tạo tài khoản miễn phí

Không cần thẻ tín dụng

Anh đánh giá công cụ này thế nào?

Love this tool? Share it!