MiniMax M3 — open-weight z milionem tokenów kontekstu i 59% na SWE-Bench Pro
Chiński MiniMax opublikował 1 czerwca flagowy model M3 z kontekstem miliona tokenów, natywną multimodalnością i wynikiem 59% na SWE-Bench Pro. Wagi są dostępne na Hugging Face. Nowy mechanizm uwagi redukuje koszty obliczeniowe do 1/20 standardowej uwagi przy pełnym kontekście.
MiniMax, chiński startup AI, ogłosił 1 czerwca 2026 model M3, który jako pierwszy open-weight łączy trzy właściwości naraz: kontekst miliona tokenów, natywną multimodalność (tekst + obraz) i wyniki kodowania na poziomie frontier. Wagi trafiły na Hugging Face około 11 czerwca, zgodnie z obietnicą "10 dni od ogłoszenia".
Kluczowe parametry
- Kontekst: 1 000 000 tokenów — do tej pory takie okna miały tylko modele zamknięte
- SWE-Bench Pro: 59,0% — wyżej niż GPT-5.5 i Gemini 3.1 Pro według własnych pomiarów
- BrowseComp: 83,5 pkt — benchmark wyszukiwania i syntezy z sieci, lepiej niż Claude Opus 4.7
- Multimodal: trenowany na przeplatanych sekwencjach tekstu i obrazu od początku (nie adapter post-hoc)
Przełom: MiniMax Sparse Attention
Problem z oknem miliona tokenów to koszt — standardowa uwaga (full attention) rośnie kwadratowo. MiniMax Sparse Attention redukuje ten koszt do 1/20 standardowego przy pełnym milionowym kontekście. W praktycznym teście model samodzielnie odtworzył wybraną pracę naukową w 12 godzin, a w benchmarku optymalizacji jąder CUDA poprawił wykorzystanie GPU z 7,6% do 71,3%.
Dostępność i cena API
Wagi dostępne na Hugging Face (licencja do weryfikacji). API MiniMax kosztuje 0,60 USD/M tokenów wejściowych i 2,40 USD/M tokenów wyjściowych — plan subskrypcji od 20 USD/miesiąc z 1,7 miliarda tokenów.