OpenAI: GPT Audio

OpenAI · tts · ~4781 tokens per clip · 4.3 desde 3 usuarios de esta categoría

Texto para hablar

Voz

Velocidad

~4781 tokens per clip

Es gratis en nuestras GPUs. Actualizar para OpenAI: GPT Audio →

OpenAI: GPT Audio es a voz de texto a voz construido por OpenAI. Enrutado a través de modelos externos — ~4,781 tokens por clip(marque del 50% sobre el coste ascendente).

Uso a través de API

API REST compatible con OpenAI. Genera una clave y llama a este modelo en segundos.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"openai/gpt-audio","text":"hello world"}'

Documentación API Obtener clave de API

Modelos similares

Bark TTS

Cartesia Sonic 3 (real-time)

ElevenLabs Multilingual v2

ElevenLabs Turbo v2.5

Inworld TTS

Orpheus TTS

Parler TTS Large

PlayAI v3 TTS

Examinar todos los modelos →

Preguntas frecuentes

OpenAI: GPT Audio soporta una amplia gama de idiomas. La lista exacta depende del motor; el formulario de esta página acepta cualquier texto y el motor se renderizará en sus idiomas soportados. Vea /voice/ para el selector multimotor completo si necesita un idioma específico.

La mayoría de los motores representan neutro-estadounidense Inglés por defecto y un acento apropiado para la región para los idiomas no-inglés. Los motores premium pueden exponer variantes de acento - pegar una muestra para comparar.

El soporte SSML varía según el motor. Las etiquetas de pausa, prosodia y énfasis se honran en la mayoría de los motores premium y en algunos auto-anfitriones. El texto plano siempre funciona, no se requiere marcado.

Streaming TTS está disponible en motores premium a través del /v1/tts/ API endpoint con streaming=true. La interfaz de usuario web en esta página devuelve el clip completo una vez terminado el renderizado.

OpenAI: GPT Audio es un motor TTS premium. Escalas de costos con recuento de caracteres — típicamente ~30 tokens por carácter. $1 compra 750.000 tokens, por lo que un paquete de $5 cubre decenas de miles de caracteres.

Hasta 5.000 caracteres por petición en la interfaz de usuario web. Para piezas más largas (audiolibros, capítulos completos), use /voice/audiobook/ que trozos y puntos automáticamente, o llame a la API en un bucle.

Sí — Enviar una lista de cadenas a /v1/tts/batch/, o utilizar la interfaz de usuario del espacio de trabajo en /workspace/ para encadenar TTS en una tubería más larga (por ejemplo, traducir → hablar → punto).

Sí — POST text to /v1/tts/ with model="OpenAI: GPT Audio" (o la bala en esta página). Devuelve WAV o MP3. Vea /api/ para una referencia completa + fragmentos SDK.

Esta página es texto a voz, no clonación de voz — la voz es el valor predeterminado del motor. Para la clonación de voz (cargando un audio de referencia), véase /voice/clone/, que requiere que usted sea propietario de los derechos de voz o tenga consentimiento explícito por escrito.

Los motores auto hospedados funcionan en GPUs de Free.ai; nada sale de nuestros servidores. Los motores premium pasan texto a proveedores de modelos ascendentes bajo nuestro DPA. No entrenamos en sus entradas y no vendemos datos.

Sí — Free.ai concede el uso comercial de audio generado. La licencia subyacente del motor (Apache 2.0, MIT, o términos del vendedor) se muestra arriba y en la página de referencia del modelo; en la práctica esto significa que las voces en offs, anuncios, podcasts y aplicaciones están en el alcance.

Sí — trabajos fallidos auto-reembolso a la fuente (al día pool o tokens pagados). Si un reembolso no aparece el mismo día, envíe un correo electrónico a contact@free.ai.

OpenAI: GPT Audio

Uso a través de API

Modelos similares

Preguntas frecuentes

¿Qué idiomas cubre OpenAI: GPT Audio?

¿Tiene un acento reconocible OpenAI: GPT Audio?

¿Puedo usar SSML con OpenAI: GPT Audio?

¿Es compatible con la transmisión OpenAI: GPT Audio?

¿Cuánto cuesta OpenAI: GPT Audio por clip?

¿Cuál es la longitud máxima de texto para OpenAI: GPT Audio?

¿Puedo ejecutar OpenAI: GPT Audio por lotes?

¿Hay una API para OpenAI: GPT Audio?

¿Necesito consentimiento para clonar una voz con OpenAI: GPT Audio?

¿Qué hay de la privacidad con OpenAI: GPT Audio?

¿La salida OpenAI: GPT Audio es segura para uso comercial?

¿Puedo obtener un reembolso si OpenAI: GPT Audio falla?

Obtener 10.000 tokens gratis

Espere... ¡Obtenga 10 mil tokens gratis!

¿Quieres más?