LFM2.5-230M: model 230 mln parametrów, który działa na Raspberry Pi i smartfonie
Liquid AI wypuściło LFM2.5-230M — model o zaledwie 230 mln parametrów gotowy do wdrożenia na urządzeniach brzegowych. Na Raspberry Pi 5 osiąga 42 tok/s, na Samsung Galaxy S25 Ultra — 213 tok/s, a zajmuje zaledwie 293–375 MB pamięci po kwantyzacji 4-bitowej.
25 czerwca 2026 Liquid AI opublikowało LFM2.5-230M — swój dotychczas najmniejszy model, zbudowany z myślą o wdrożeniach lokalnych na dowolnym sprzęcie: od chmurowych GPU przez laptopy po Raspberry Pi i smartfony. Model trenowany był na 19 bilionach tokenów i obsługuje 10 języków, w tym angielski, chiński i arabski.
Wydajność na słabym sprzęcie
Wyniki pomiarów na CPU z kwantyzacją 4-bitową (kontekst 2K):
- Raspberry Pi 5: 42 tok/s dekodowania, 523 tok/s prefill, pamięć 293 MB
- Samsung Galaxy S25 Ultra (Snapdragon Gen 4): 213 tok/s dekodowania, 1158 tok/s prefill, pamięć 375 MB
Dla porównania: modele z rodziny 0,5–1B, które zwykle konkurują w tej kategorii (Qwen3.5-0.8B, Gemma 3 1B), ustępują LFM2.5-230M na benchmarkach IFEval i IFBench odpowiednio o 12 i kilka punktów procentowych.
Gdzie model sprawdza się najlepiej
LFM2.5-230M zoptymalizowany jest pod ekstrakcję danych i narzędziowe przepływy agentowe — zadania, gdzie liczy się szybkość i niezawodność formatu, a nie głęboka logika matematyczna czy generacja kodu. Twórcy wprost zaznaczają, że model nie jest przeznaczony do zaawansowanego rozumowania, zaawansowanego kodowania ani tworzenia treści kreatywnych.
Obsługiwane frameworki do inferencji: llama.cpp (GGUF), MLX (Apple Silicon), vLLM, SGLang i ONNX — co sprawia, że model można uruchomić na praktycznie dowolnej platformie bez zmiany stosu technologicznego. W demonstracji Liquid AI model działał także na humanoidalnym robocie Unitree G1 z modułem NVIDIA Jetson Orin.