Kimi K2.7-Code: open-source MoE z biliоnem parametrów zoptymalizowany pod agentowe kodowanie

Moonshot AI wypuściło 12 czerwca 2026 r. model Kimi K2.7-Code: Mixture-of-Experts z bilionem parametrów (32 mld aktywnych), kontekstem 256K i 30% niższym zużyciem tokenów myślenia niż poprzednik. Wagi open-source na Hugging Face, kompatybilny z vLLM i SGLang.

Moonshot AI (Beijing) opublikowało 12 czerwca 2026 r. model Kimi K2.7-Code — piąty duży release serii Kimi w ciągu ostatniego roku. Wagi są w pełni open-source (licencja Modified MIT) i dostępne na Hugging Face.

Architektura

Model to Mixture-of-Experts z bilionem całkowitych parametrów i 32 miliardami aktywnych parametrów na token. Szczegóły:

384 ekspertów, 8 wybieranych na każdy token
61 warstw (1 gęsta + 60 MoE)
Kontekst: 256K tokenów (Multi-head Latent Attention)
Enkoder wizyjny MoonViT 400M parametrów

Co się zmieniło względem K2.6

Kluczowa poprawa to 30% mniejsze zużycie tokenów myślenia przy wyższej skuteczności. Na wewnętrznych benchmarkach Moonshot: Kimi Code Bench v2 +21,8% (62,0 vs 50,9), Program Bench +11,0%, MLS Bench Lite +31,5%. Ważna uwaga: wyniki te nie były jeszcze zreplikowane niezależnie na publicznych leaderboardach (SWE-bench Verified, LiveCodeBench).

Uruchamianie lokalnie

Model jest kompatybilny z vLLM, SGLang i KTransformers — te same skrypty deploymentu co K2.6 działają bez zmian. Ze względu na architekturę MoE (32 mld aktywnych parametrów), do pracy w rozsądnej prędkości potrzeba kart z łącznie co najmniej ~40 GB VRAM. Pełna precyzja BF16 wymaga więcej; kwantyzacje Q4/Q8 obniżają wymagania.

#Kimi#MoE#kodowanie#open-source#vLLM#Moonshot AI

Kimi K2.7-Code: open-source MoE z biliоnem parametrów zoptymalizowany pod agentowe kodowanie

Architektura

Co się zmieniło względem K2.6

Uruchamianie lokalnie

Źródła