Dia Voice Clone

Free.ai · voice · ~500 znaki na clip

Klip do głosu referencyjnego

Wyślij krótki klip audio (5-15s) głosu do klonu

Tekst do wypowiedzenia

~500 znaki na clip

Albo spróbujmy wolnych samodomówców. voice cloning → — nie jest potrzeba rejestracji

Dia Voice Clone to a Model AI. Skierowane przez modele zewnętrzne — ~500 tokeny na użycie (50% markingu nad kosztami strumienia).

Użyj przez API

Kompatybilny z OpenAI REST API. Generuj klucz i zadzwoń po ten model w sekundach.

curl -X POST https://api.free.ai/v1/voice/clone/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/dia-tts/voice-clone","text":"hello world","audio_url":"https://..."}'

Dokumentacja API Pobierz klucz API

Podobne modele

MiniMax Voice Clone

Przeglądaj wszystkie modele →

Często zadawane pytania

Dia Voice Clone obsługuje szeroki zakres języków. Dokładna lista zależy od silnika; formularz na tej stronie akceptuje dowolny tekst i silnik będzie wyświetlany w obsługiwanych językach. Zobacz /voice/ dla pełnego wybieracza wielosilnika, jeśli potrzebujesz określonego języka.

Większość silników czyni neutralny amerykański angielski domyślnie i odpowiedni akcent regionowy dla języków nieangielskich. Motory premium mogą wystawić warianty akcentu — wklej próbkę do porównania.

Wsparcie SSML różni się w zależności od silnika. Pauza, prozodia i znaczniki akcentu są respektowane na większości silników premium i na kilku samorządzonych. Prosty tekst zawsze działa – nie wymaga się znaczenia.

Streaming TTS jest dostępny na silnikach premium za pomocą punktu końcowego /v1/tts/ API z stream=true. Web interfejs na tej stronie zwraca pełny klip po wykończeniu.

Dia Voice Clone jest silnikiem premium TTS. Kosztowe wagi z liczbą znaków — zazwyczaj ~30 tokenów na znak. $1 kupuje 750,000 tokenów, więc pakiet $5 pokrywa dziesiątki tysięcy znaków.

Do 5000 znaków na żądanie w interfejsie internetowym. Dla dłuższych kawałków (Audiobooks, pełne rozdziały), użyj /voice/audiobook / które kawałki i szwy automatycznie, lub wywołaj API w pętli.

Tak — POST lista strun do /v1/tts/batch /, lub użyć interfejsu roboczego w /pracownik / do łańcucha TTS do dłuższego rurociągu (np. przetłumaczenie → mów → szw).

Tak – tekst POST do /v1/tts/ z modelem="Dia Voice Clone" (lub łużka na tej stronie). Zwraca WAV lub MP3. Patrz /api/ dla pełnego odniesienia + SDK fragmenty.

Ta strona jest tekst-to-speech, a nie klonowanie głosu – głos jest domyślnym silnikiem. Dla klonowania głosu (rozładowywania dźwięku referencyjnego), patrz /voice/clone /, który wymaga od Ciebie albo posiada prawa głosowe lub posiada wyraźną pisemną zgodę.

Samodzielne silniki działają na Free.ai własnych GPU; nic nie opuszcza naszych serwerów. Silniki Premium przekazują tekst dostawcom modeli górnego stream w ramach naszego DPA. Nie trenujemy na wejściach i nie sprzedajemy danych.

Tak — Free.ai przyznaje komercyjne wykorzystanie generowanego dźwięku. Licencja fundamentalna silnika (Apache 2.0, MIT lub warunki dostawcy) jest wyświetlana powyżej i na stronie referencyjnej modelu; w praktyce oznacza to głosowe, reklamy, podcasty i aplikacje są wszystkie w skali.

Tak – niepowodzenie automatycznego zwrotu kosztów pracy do źródła (dawny basen lub zapłacone tokeny). Jeżeli refundacja nie pojawia się w tym samym dniu, email contact@free.ai.

Dia Voice Clone

Użyj przez API

Podobne modele

Często zadawane pytania

Jakie języki Dia Voice Clone?

Czy Dia Voice Clone ma rozpoznawany akcent?

Czy mogę użyć SSML z Dia Voice Clone?

Czy Dia Voice Clone obsługuje streaming?

Ile kosztuje Dia Voice Clone na klip?

Jaka jest maksymalna długość tekstu dla Dia Voice Clone?

Czy mogę uruchomić Dia Voice Clone w partii?

Czy istnieje API dla Dia Voice Clone?

Czy potrzebuję zgody na sklonowanie głosu przez Dia Voice Clone?

A co z prywatnością z Dia Voice Clone?

Czy Dia Voice Clone wyjście jest bezpieczne do użytku komercyjnego?

Mogę dostać zwrot zwrotu, jeśli Dia Voice Clone zawiodła?

Zdobądź 10 tysięcy darmowych tokenów

Poczekaj, zdobądź 10 tysięcy darmowych toków!

Chcesz więcej?