JetBrains wydaje Mellum2 — otwartoźródłowy model 12B MoE dla programistów
JetBrains opublikowało Mellum2 na licencji Apache 2.0 — model Mixture-of-Experts (12 mld parametrów, 2,5 mld aktywnych), wytrenowany na ponad 10,6 bln tokenów kodu, do szybkich, wyspecjalizowanych zadań w pipeline'ach AI.
JetBrains opublikowało 2 czerwca 2026 roku Mellum2 — otwartoźródłowy model językowy oparty na architekturze Mixture-of-Experts (MoE) z 12 miliardami łącznych parametrów, z których jedynie 2,5 miliarda jest aktywnych przy przetwarzaniu każdego tokenu. Model wytrenowano od podstaw na ponad 10,6 biliona tokenów kodu i treści związanych z inżynierią oprogramowania. Architektura MoE z 64 ekspertami (8 aktywnych na token) pozwala osiągnąć ponad dwukrotnie szybsze wnioskowanie w porównaniu z modelami o podobnej liczbie parametrów w klasycznej architekturze „dense".
Mellum2 jest pozycjonowany jako tzw. model ogniskowy (focal model) — szybki, wyspecjalizowany komponent osadzany wewnątrz większych systemów AI, a nie samodzielny zamiennik dla modeli frontierowych. Obsługuje generowanie i edycję kodu, debugowanie, wieloetapowe rozumowanie, wywoływanie narzędzi/funkcji oraz konwersacyjną pomoc programistyczną. Dzięki licencji Apache 2.0 i możliwości lokalnego wdrożenia nadaje się zarówno do prywatnych deploymentów on-premise, jak i do roli sub-agenta w systemach agentowych.