Free AI Hosting | Free.ai
Host AI models for free. GPU access, API hosting, and cloud deployment.
Cloud Hosted
Gebruik Free.ai infrastructuur. Zero setup, nul onderhoud. Alle modellen zijn voorgeladen en klaar voor gebruik via API of web UI.
Nu beschikbaarDocker Self-Hosted
Start onze open-source AI modellen op uw eigen hardware. Docker beelden met GPU ondersteuning, geoptimaliseerd voor gevolgtrekkingen.
ZelfbedieningBeheerde privé
Dedicated GPU servers beheerd door ons, geïmplementeerd in uw gewenste cloud regio. Volledige data isolatie en aangepaste SLA.
OndernemingZelfstandige inzet
Al onze modellen zijn open-source (Apache 2.0 / MIT). U kunt ze uitvoeren op uw eigen GPU-infrastructuur:
# Pull and run a model with Docker
docker pull ghcr.io/free-ai/inference:latest
docker run --gpus all -p 8000:8000 ghcr.io/free-ai/inference:latest \
--model qwen2.5-72b --quantization awq
Minimumvoorschriften
- NVIDIA GPU met 24GB+ VRAM (RTX 4090, A5000, A100)
- CUDA 12.0+ en Docker met NVIDIA Container Toolkit
- 16GB+ systeem RAM, 100GB+ opslag per model
- Voor 72B parametermodellen: 80GB VRAM (A100) of multi-GPU setup
Waarom Self-Host?
- Gegevensbescherming — Your data never leaves your servers
- Geen tarieflimieten — Unlimited inference on your hardware
- Naleving — Meet data residency requirements
- Aanpassen — Fine-tune models on your data
- Kostenbeheersing — Fixed hardware costs, no per-token fees
- met luchtgap — Runs fully offline