← Wszystkie artykuły

LFM2.5-230M: model 230 mln parametrów, który działa na Raspberry Pi i smartfonie

Liquid AI wypuściło LFM2.5-230M — model o zaledwie 230 mln parametrów gotowy do wdrożenia na urządzeniach brzegowych. Na Raspberry Pi 5 osiąga 42 tok/s, na Samsung Galaxy S25 Ultra — 213 tok/s, a zajmuje zaledwie 293–375 MB pamięci po kwantyzacji 4-bitowej.

25 czerwca 2026 Liquid AI opublikowało LFM2.5-230M — swój dotychczas najmniejszy model, zbudowany z myślą o wdrożeniach lokalnych na dowolnym sprzęcie: od chmurowych GPU przez laptopy po Raspberry Pi i smartfony. Model trenowany był na 19 bilionach tokenów i obsługuje 10 języków, w tym angielski, chiński i arabski.

Wydajność na słabym sprzęcie

Wyniki pomiarów na CPU z kwantyzacją 4-bitową (kontekst 2K):

  • Raspberry Pi 5: 42 tok/s dekodowania, 523 tok/s prefill, pamięć 293 MB
  • Samsung Galaxy S25 Ultra (Snapdragon Gen 4): 213 tok/s dekodowania, 1158 tok/s prefill, pamięć 375 MB

Dla porównania: modele z rodziny 0,5–1B, które zwykle konkurują w tej kategorii (Qwen3.5-0.8B, Gemma 3 1B), ustępują LFM2.5-230M na benchmarkach IFEval i IFBench odpowiednio o 12 i kilka punktów procentowych.

Gdzie model sprawdza się najlepiej

LFM2.5-230M zoptymalizowany jest pod ekstrakcję danych i narzędziowe przepływy agentowe — zadania, gdzie liczy się szybkość i niezawodność formatu, a nie głęboka logika matematyczna czy generacja kodu. Twórcy wprost zaznaczają, że model nie jest przeznaczony do zaawansowanego rozumowania, zaawansowanego kodowania ani tworzenia treści kreatywnych.

Obsługiwane frameworki do inferencji: llama.cpp (GGUF), MLX (Apple Silicon), vLLM, SGLang i ONNX — co sprawia, że model można uruchomić na praktycznie dowolnej platformie bez zmiany stosu technologicznego. W demonstracji Liquid AI model działał także na humanoidalnym robocie Unitree G1 z modułem NVIDIA Jetson Orin.

#Liquid AI#LFM2.5#edge AI#on-device#llama.cpp#vLLM#MLX#ONNX

Źródła