AudioLDM 2

Free.ai (self-hosted) · music · ~5000 tokens per track · 4.0 desde 4 usuarios de esta categoría

Describe la música que quieres

Letra (opcional)

Duración

Género (opcional)

~5000 tokens per track

AudioLDM 2 es a modelo de generación de música construido por Haohe Liu. Más fuerte en Music generation from text. Auto-alojado en Free.ai GPUs — funciona gratis contra su piscina diaria de tokens (5,000 tokens por vía). Liberado bajo Apache 2.0 — uso comercial permitido el Free.ai.

Uso a través de API

API REST compatible con OpenAI. Genera una clave y llama a este modelo en segundos.

curl -X POST https://api.free.ai/v1/music/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"audioldm2","prompt":"your prompt here"}'

Documentación API Obtener clave de API

Modelos similares

ACE-Step Music

DiffRhythm

ElevenLabs Music

Lyria 3 Music

MusicGen (MG-Medium)

Stable Audio

Examinar todos los modelos →

Preguntas frecuentes

AudioLDM 2 genera música instrumental original (y en algunos motores, voces) a partir de un prompt de texto. Describir el estado de ánimo, género, instrumentación o BPM y AudioLDM 2 devuelve una pista de audio terminada.

10 a 60 segundos por generación dependiendo del motor. Para piezas más largas, encadene varias generaciones a través de /music/stitch/ o genere en segmentos de 30 segundos y crossfade.

Algunos motores sintetizan voces a partir de las letras que proporcionas (pegar letras en el formulario); otros son sólo instrumentales. Compruebe el formulario en esta página — un campo de letras significa que las voces son soportadas.

Pop, rock, EDM, jazz, ambiente, clásico, lo-fi, instrumentales de hip-hop todos representan razonablemente. Géneros de nicho (gamelan, carnático, canto de garganta) son más débiles — describir instrumentos explícitamente para los mejores resultados.

AudioLDM 2 se ejecuta en nuestras propias GPUs contra su piscina gratuita diaria primero; $5 → 200.000 tokens pagados después de eso. Alrededor de ~5,000 tokens por pista.

WAV por defecto (sin pérdidas, listo para una mayor mezcla). MP3 está disponible en el selector de salida para archivos más pequeños.

No — AudioLDM 2 devuelve una pista mixta. Para separarse en tallos, ejecute la salida a través de /music/separate/ que utiliza Demucs para extraer voces, tambores, bajos y otros.

Sí — /batch/ acepta una lista de avisos. Cada pista aterriza en /account/?tab=historia con el prompt como nombre de archivo. Para más control, utilice la API.

Sí — POST su prompt to /v1/music/generate/ with model="AudioLDM 2". /api/ tiene la referencia completa incluyendo letras, duración y parámetros de tempo.

AudioLDM 2 no reproduce composiciones protegidas por derechos de autor — las salidas se sintetizan frescas. Free.ai concede uso comercial; usted mantiene los derechos de sus pistas generadas. Nombrar a un artista en el prompt pide "al estilo de" — el audio real es original.

15 segundos a 2 minutos por pista dependiendo de la duración + motor. Modelos premium terminan más rápido. Utilice el botón de cola para cerrar la pestaña — resultado aterriza en /account/?tab=historia cuando se hace.

Sí — renders fallidos auto-reembolso. Para pistas que funcionaban pero suenan mal, envíe un correo electrónico a contact@free.ai con el enlace share y revisaremos caso por caso.

AudioLDM 2

Uso a través de API

Modelos similares

Preguntas frecuentes

¿Qué genera AudioLDM 2?

¿Cuánto tiempo puede durar una pista AudioLDM 2?

¿Incluye AudioLDM 2 las voces?

¿Qué géneros manejan bien AudioLDM 2?

¿Cuánto cuesta AudioLDM 2 por pista?

¿Qué formato de audio devuelve AudioLDM 2?

¿Puede AudioLDM 2 generar tallos (voz + tambores + bajo por separado)?

¿Puedo generar por lotes con AudioLDM 2?

¿Hay una API para AudioLDM 2?

¿Qué hay de los derechos de autor cuando publico la salida AudioLDM 2?

¿Cuánto tiempo tarda AudioLDM 2 en renderizar?

¿Puedo obtener un reembolso si AudioLDM 2 falla?

Obtener 10.000 tokens gratis

Espere... ¡Obtenga 10 mil tokens gratis!

¿Quieres más?