OpenAI: GPT Audio
OpenAI
·
tts
·
~4781 tokens per clip
·
4.3
desde 3 usuarios de esta categoría
OpenAI: GPT Audio es a voz de texto a voz construido por OpenAI. Enrutado a través de modelos externos — ~4,781 tokens por clip(marque del 50% sobre el coste ascendente).
Uso a través de API
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"openai/gpt-audio","text":"hello world"}'
Documentación API
Obtener clave de API
Preguntas frecuentes
OpenAI: GPT Audio soporta una amplia gama de idiomas. La lista exacta depende del motor; el formulario de esta página acepta cualquier texto y el motor se renderizará en sus idiomas soportados. Vea /voice/ para el selector multimotor completo si necesita un idioma específico.
La mayoría de los motores representan neutro-estadounidense Inglés por defecto y un acento apropiado para la región para los idiomas no-inglés. Los motores premium pueden exponer variantes de acento - pegar una muestra para comparar.
El soporte SSML varía según el motor. Las etiquetas de pausa, prosodia y énfasis se honran en la mayoría de los motores premium y en algunos auto-anfitriones. El texto plano siempre funciona, no se requiere marcado.
Streaming TTS está disponible en motores premium a través del /v1/tts/ API endpoint con streaming=true. La interfaz de usuario web en esta página devuelve el clip completo una vez terminado el renderizado.
OpenAI: GPT Audio es un motor TTS premium. Escalas de costos con recuento de caracteres — típicamente ~30 tokens por carácter. $1 compra 750.000 tokens, por lo que un paquete de $5 cubre decenas de miles de caracteres.
Hasta 5.000 caracteres por petición en la interfaz de usuario web. Para piezas más largas (audiolibros, capítulos completos), use /voice/audiobook/ que trozos y puntos automáticamente, o llame a la API en un bucle.
Sí — Enviar una lista de cadenas a /v1/tts/batch/, o utilizar la interfaz de usuario del espacio de trabajo en /workspace/ para encadenar TTS en una tubería más larga (por ejemplo, traducir → hablar → punto).
Sí — POST text to /v1/tts/ with model="OpenAI: GPT Audio" (o la bala en esta página). Devuelve WAV o MP3. Vea /api/ para una referencia completa + fragmentos SDK.
Esta página es texto a voz, no clonación de voz — la voz es el valor predeterminado del motor. Para la clonación de voz (cargando un audio de referencia), véase /voice/clone/, que requiere que usted sea propietario de los derechos de voz o tenga consentimiento explícito por escrito.
Los motores auto hospedados funcionan en GPUs de Free.ai; nada sale de nuestros servidores. Los motores premium pasan texto a proveedores de modelos ascendentes bajo nuestro DPA. No entrenamos en sus entradas y no vendemos datos.
Sí — Free.ai concede el uso comercial de audio generado. La licencia subyacente del motor (Apache 2.0, MIT, o términos del vendedor) se muestra arriba y en la página de referencia del modelo; en la práctica esto significa que las voces en offs, anuncios, podcasts y aplicaciones están en el alcance.
Sí — trabajos fallidos auto-reembolso a la fuente (al día pool o tokens pagados). Si un reembolso no aparece el mismo día, envíe un correo electrónico a contact@free.ai.