AudioLDM 2

Free.ai (self-hosted) · music · ~5000 tokens per track · 4.0 desde 4 usuarios de esta categoría
~5000 tokens per track

AudioLDM 2 es a modelo de generación de música construido por Haohe Liu. Más fuerte en Music generation from text. Auto-alojado en Free.ai GPUs — funciona gratis contra su piscina diaria de tokens (5,000 tokens por vía). Liberado bajo Apache 2.0 — uso comercial permitido el Free.ai.

Uso a través de API

API REST compatible con OpenAI. Genera una clave y llama a este modelo en segundos.

curl -X POST https://api.free.ai/v1/music/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"audioldm2","prompt":"your prompt here"}'
Documentación API Obtener clave de API

Preguntas frecuentes

AudioLDM 2 genera música instrumental original (y en algunos motores, voces) a partir de un prompt de texto. Describir el estado de ánimo, género, instrumentación o BPM y AudioLDM 2 devuelve una pista de audio terminada.

10 a 60 segundos por generación dependiendo del motor. Para piezas más largas, encadene varias generaciones a través de /music/stitch/ o genere en segmentos de 30 segundos y crossfade.

Algunos motores sintetizan voces a partir de las letras que proporcionas (pegar letras en el formulario); otros son sólo instrumentales. Compruebe el formulario en esta página — un campo de letras significa que las voces son soportadas.

Pop, rock, EDM, jazz, ambiente, clásico, lo-fi, instrumentales de hip-hop todos representan razonablemente. Géneros de nicho (gamelan, carnático, canto de garganta) son más débiles — describir instrumentos explícitamente para los mejores resultados.

AudioLDM 2 se ejecuta en nuestras propias GPUs contra su piscina gratuita diaria primero; $5 → 200.000 tokens pagados después de eso. Alrededor de ~5,000 tokens por pista.

WAV por defecto (sin pérdidas, listo para una mayor mezcla). MP3 está disponible en el selector de salida para archivos más pequeños.

No — AudioLDM 2 devuelve una pista mixta. Para separarse en tallos, ejecute la salida a través de /music/separate/ que utiliza Demucs para extraer voces, tambores, bajos y otros.

Sí — /batch/ acepta una lista de avisos. Cada pista aterriza en /account/?tab=historia con el prompt como nombre de archivo. Para más control, utilice la API.

Sí — POST su prompt to /v1/music/generate/ with model="AudioLDM 2". /api/ tiene la referencia completa incluyendo letras, duración y parámetros de tempo.

AudioLDM 2 no reproduce composiciones protegidas por derechos de autor — las salidas se sintetizan frescas. Free.ai concede uso comercial; usted mantiene los derechos de sus pistas generadas. Nombrar a un artista en el prompt pide "al estilo de" — el audio real es original.

15 segundos a 2 minutos por pista dependiendo de la duración + motor. Modelos premium terminan más rápido. Utilice el botón de cola para cerrar la pestaña — resultado aterriza en /account/?tab=historia cuando se hace.

Sí — renders fallidos auto-reembolso. Para pistas que funcionaban pero suenan mal, envíe un correo electrónico a contact@free.ai con el enlace share y revisaremos caso por caso.

Love this tool? Share it!

Calificar esta página