Free AI Hosting | Free.ai
Host AI models for free. GPU access, API hosting, and cloud deployment.
Cloud hosted
Využijte infrastrukturu Free.ai. Nula nastavení, nula údržba. Všechny modely jsou přednaloženy a připraveny k použití přes API nebo webové UI.
Dostupné nyníDocker Self-Hosted
Spusťte naše Open-source AI modely na vlastním hardwaru. Docker obrázky s podporou GPU, optimalizované pro inferenci.
SamoslužbaManaged Private
Dedikované GPU servery řízené námi, nasazené ve vašem preferovaném cloudovém regionu. Plná izolace dat a vlastní SLA.
PodnikSelf-hosted Deployment
Všechny naše modely jsou open-source (Apache 2.0 / MIT). Můžete je spustit na vlastní GPU infrastruktuře:
# Pull and run a model with Docker
docker pull ghcr.io/free-ai/inference:latest
docker run --gpus all -p 8000:8000 ghcr.io/free-ai/inference:latest \
--model qwen2.5-72b --quantization awq
Minimální požadavky
- NVIDIA GPU s 24GB+ VRAM (RTX 4090, A5000, A100)
- CUDA 12.0+ a Docker s nástrojem NVIDIA Container Toolkit
- 16GB+ systém RAM, 100GB+ úložiště na model
- Pro 72B modely parametrů: 80GB VRAM (A100) nebo multi-GPU nastavení
Proč sebehostit?
- Ochrana osobních údajů — Your data never leaves your servers
- Žádná omezení sazeb — Unlimited inference on your hardware
- Soulad — Meet data residency requirements
- Přizpůsobení — Fine-tune models on your data
- Kontrola nákladů — Fixed hardware costs, no per-token fees
- Vzduchově uzavřené — Runs fully offline