raketenkater

raketenkater

Achievements

llm-server llm-server Public

Auto-tuned launcher for GGUF models on llama.cpp / ik_llama.cpp — OpenAI-compatible server with multi-GPU tensor-split, MoE expert placement, measured flag tuning (AI Tune), hardware-matched Huggin…

Go 223 11