MiniMax M3 — open-weight z milionem tokenów kontekstu i 59% na SWE-Bench Pro

Chiński MiniMax opublikował 1 czerwca flagowy model M3 z kontekstem miliona tokenów, natywną multimodalnością i wynikiem 59% na SWE-Bench Pro. Wagi są dostępne na Hugging Face. Nowy mechanizm uwagi redukuje koszty obliczeniowe do 1/20 standardowej uwagi przy pełnym kontekście.

MiniMax, chiński startup AI, ogłosił 1 czerwca 2026 model M3, który jako pierwszy open-weight łączy trzy właściwości naraz: kontekst miliona tokenów, natywną multimodalność (tekst + obraz) i wyniki kodowania na poziomie frontier. Wagi trafiły na Hugging Face około 11 czerwca, zgodnie z obietnicą "10 dni od ogłoszenia".

Kluczowe parametry

Kontekst: 1 000 000 tokenów — do tej pory takie okna miały tylko modele zamknięte
SWE-Bench Pro: 59,0% — wyżej niż GPT-5.5 i Gemini 3.1 Pro według własnych pomiarów
BrowseComp: 83,5 pkt — benchmark wyszukiwania i syntezy z sieci, lepiej niż Claude Opus 4.7
Multimodal: trenowany na przeplatanych sekwencjach tekstu i obrazu od początku (nie adapter post-hoc)

Przełom: MiniMax Sparse Attention

Problem z oknem miliona tokenów to koszt — standardowa uwaga (full attention) rośnie kwadratowo. MiniMax Sparse Attention redukuje ten koszt do 1/20 standardowego przy pełnym milionowym kontekście. W praktycznym teście model samodzielnie odtworzył wybraną pracę naukową w 12 godzin, a w benchmarku optymalizacji jąder CUDA poprawił wykorzystanie GPU z 7,6% do 71,3%.

Dostępność i cena API

Wagi dostępne na Hugging Face (licencja do weryfikacji). API MiniMax kosztuje 0,60 USD/M tokenów wejściowych i 2,40 USD/M tokenów wyjściowych — plan subskrypcji od 20 USD/miesiąc z 1,7 miliarda tokenów.

#MiniMax#M3#open-weight#1M context#multimodal#coding#SWE-Bench

MiniMax M3 — open-weight z milionem tokenów kontekstu i 59% na SWE-Bench Pro

Kluczowe parametry

Przełom: MiniMax Sparse Attention

Dostępność i cena API

Źródła