Gemini 3.1 Flash TTS
Google
·
tts
·
~500 бирдик clip
·
4.3
_Жаңылоо 3 категориядагы колдонуучулары
Gemini 3.1 Flash TTS - a текст-сөзгө, Google тарабынан курулган. Сырткы моделдер аркылуу багытталган — ~500 токендери Клип үчүн (50% маркировка жогорудагы баадан).
API аркылуу колдонуу
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/gemini-3.1-flash-tts","text":"hello world"}'
Документация
API ачкычын алуу
Кайсы убакта суроолор берилет
Gemini 3.1 Flash TTS колдогон тилдердин саны көп. Тез арада тизме иштелип чыккан программага жараша өзгөрөт; бул барактагы форма каалаган текстти кабыл алат жана программа колдогон тилдердин тизмесин көрсөтөт. Эгерде сизге конкреттүү тил керек болсо, анда /voice/ дегенди караңыз.
Көпчүлүк программалык камсыздоо стандарттуу түрдө нейтралдуу америкалык англис тилин жана англис эмес тилдер үчүн регионго ылайыктуу акцентти көрсөтөт. Premium программалык камсыздоолору акценттин варианттарын көрсөтө алышат — салыштыруу үчүн мисалды киргизиңиз.
SSML колдоосу движоктун түрүнө жараша өзгөрөт. Пауза, прозодия жана басым тегдери көпчүлүк премиум движоктарда жана кээ бир жеке уюмдарда колдонулат. Текст дайыма иштей берет — маркировка талап кылынбайт.
Транслирование TTS доступно на премиум-двигателях через /v1/tts/ API endpoint with stream=true. Веб-интерфейс на этой странице возвращает полный клип после завершения отображения.
Gemini 3.1 Flash TTS - бул жогорку сапаттагы TTS двигатели. Баасы символдорду эсептөө менен өлчөнөт - адаттагыдай эле ~30 жетон бир символ үчүн. $1 750,000 жетон сатып алат, андыктан $5 пакети он миңдеген символдорду камтыйт.
Веб-интерфейсте бир суроого 5000 символго чейин. Узак тексттер үчүн (аудиокитептер, толук бөлүктөр) /voice/audiobook/ колдонуп, автоматтык түрдө бөлүктөрдү жана бөлүктөрдү бириктирүү, же APIни цикл менен чакыруу.
Да — POST строктардын тизмесин /v1/tts/batch/'ге, же иштетүү чөйрөсүнүн интерфейсин /workspace/'де колдонуп, TTS'ди узун каналга бириктирүү (мисалы, translate → speak → stitch).
Да — текст POST /v1/tts/ менен model="Gemini 3.1 Flash TTS" (же бул барактагы slug). WAV же MP3 форматында кайтарылат. Толук шилтеме + SDK фрагменттери үчүн /api/ дегенди караңыз.
Бул барак текст-в-слов, үн-клонирование эмес — үн - бул двигательдин стандарты. Сөз-клонирование (загрузка справочного аудио) - это /voice/clone/, для которого требуется либо владение правом на голос, либо письменное разрешение.
Өзүнө-өзү кызмат көрсөткөн двигатели работают на Free.ai-собственных GPU; ничто не покидает наши серверы. Премиум-двигатели передают текст нашим DPA подрядчикам. Мы не тренируем ваши вводные данные и не продаем данные.
Да — Free.ai генерацияланган аудиону коммерциялык максатта колдонууга уруксат берет. Двигательдин негизи болгон лицензия (Apache 2.0, MIT же дилердин шарттары) жогоруда жана моделдин шилтеме бетинде көрсөтүлөт; практикада бул үн жаздыруу, жарнама, подкасттар жана тиркемелерди колдонууга уруксат берет.
Да — неудачные задания автоматически возвращаются источнику (ежедневному пулу или оплаченным токенам). Если возврат не появится в тот же день, отправьте электронное письмо на адрес contact@free.ai.