Free AI Hosting | Free.ai
Host AI models for free. GPU access, API hosting, and cloud deployment.
Dihostakan awan
Gunakan infrastruktur Free.ai. Setup sifar, penyelenggaraan sifar. Semua model telah dimuatkan dan bersedia untuk digunakan melalui API atau UI web.
Ada SekarangDihost-sendiri Docker
Jalankan model AI sumber terbuka kami pada perkakasan anda sendiri. Imej Docker dengan sokongan GPU, dioptimumkan untuk inferensi.
Servis-SendiriPersendirian Terurus
Pelayan GPU khusus yang dikendalikan oleh kami, ditempatkan di kawasan awan yang anda pilih. Pengekodan data penuh dan SLA tersendiri.
EnterprisePelaksanaan Dihost-Sendiri
Semua model kami adalah sumber terbuka (Apache 2.0 / MIT). Anda boleh jalankan mereka pada infrastruktur GPU anda sendiri:
# Pull and run a model with Docker
docker pull ghcr.io/free-ai/inference:latest
docker run --gpus all -p 8000:8000 ghcr.io/free-ai/inference:latest \
--model qwen2.5-72b --quantization awq
Keperluan Minimum
- GPU NVIDIA dengan 24GB+ VRAM (RTX 4090, A5000, A100)
- CUDA 12.0+ dan Docker dengan NVIDIA Container Toolkit
- RAM sistem 16GB+, storan 100GB+ setiap model
- Untuk model parameter 72B: 80GB VRAM (A100) atau konfigurasi multi-GPU
Kenapa Self-Host?
- Keprihatinan data — Your data never leaves your servers
- Tiada had kadar — Unlimited inference on your hardware
- Keserasian — Meet data residency requirements
- Pemilihan — Fine-tune models on your data
- Kawalan kos — Fixed hardware costs, no per-token fees
- Air-gapped — Runs fully offline