Kimi K2.7-Code: open-source MoE z biliоnem parametrów zoptymalizowany pod agentowe kodowanie
Moonshot AI wypuściło 12 czerwca 2026 r. model Kimi K2.7-Code: Mixture-of-Experts z bilionem parametrów (32 mld aktywnych), kontekstem 256K i 30% niższym zużyciem tokenów myślenia niż poprzednik. Wagi open-source na Hugging Face, kompatybilny z vLLM i SGLang.
Moonshot AI (Beijing) opublikowało 12 czerwca 2026 r. model Kimi K2.7-Code — piąty duży release serii Kimi w ciągu ostatniego roku. Wagi są w pełni open-source (licencja Modified MIT) i dostępne na Hugging Face.
Architektura
Model to Mixture-of-Experts z bilionem całkowitych parametrów i 32 miliardami aktywnych parametrów na token. Szczegóły:
- 384 ekspertów, 8 wybieranych na każdy token
- 61 warstw (1 gęsta + 60 MoE)
- Kontekst: 256K tokenów (Multi-head Latent Attention)
- Enkoder wizyjny MoonViT 400M parametrów
Co się zmieniło względem K2.6
Kluczowa poprawa to 30% mniejsze zużycie tokenów myślenia przy wyższej skuteczności. Na wewnętrznych benchmarkach Moonshot: Kimi Code Bench v2 +21,8% (62,0 vs 50,9), Program Bench +11,0%, MLS Bench Lite +31,5%. Ważna uwaga: wyniki te nie były jeszcze zreplikowane niezależnie na publicznych leaderboardach (SWE-bench Verified, LiveCodeBench).
Uruchamianie lokalnie
Model jest kompatybilny z vLLM, SGLang i KTransformers — te same skrypty deploymentu co K2.6 działają bez zmian. Ze względu na architekturę MoE (32 mld aktywnych parametrów), do pracy w rozsądnej prędkości potrzeba kart z łącznie co najmniej ~40 GB VRAM. Pełna precyzja BF16 wymaga więcej; kwantyzacje Q4/Q8 obniżają wymagania.