← Wszystkie artykuły

OmniRoute: jeden endpoint do 160+ dostawców AI z kompresją tokenów do 95%

OmniRoute to bezpłatny gateway AI podpinający Claude Code, Codex, Cursor i 14 innych agentów do ponad 160 dostawców (50+ bezpłatnych) za pomocą jednego endpointu /v1. Wbudowana kompresja tokenów RTK+Caveman oszczędza 15–95% kosztów. Wersja v3.8.37 wyszła 26 czerwca 2026.

26 czerwca 2026 projekt OmniRoute wypuścił wersję v3.8.37 — bezpłatny, samohosowalny gateway AI, który agreguje ponad 160 dostawców modeli (z czego ponad 50 bezpłatnych) za pojedynczym endpointem kompatybilnym z OpenAI API (/v1).

Co robi OmniRoute

Zamiast konfigurować osobno klucze i adresy dla Anthropic, OpenAI, Google, OpenRouter i dziesiątek innych, deweloper wskazuje swoje narzędzia (Claude Code, Codex, Cursor, Cline, Copilot, Antigravity i innych spośród 16 obsługiwanych agentów) na jeden lokalny adres OmniRoute. Gateway sam decyduje, do którego dostawcy przekierować zapytanie, zgodnie z jedną z 17 dostępnych strategii routingu.

Kompresja tokenów: 15–95% oszczędności

Flagowa funkcja to stack kompresji RTK+Caveman: dwie warstwy optymalizacji, które przed wysłaniem promptu do modelu usuwają redundancje, skracają kontekst i przepakowują wiadomości. Według autorów przekłada się to na oszczędność 15–95% tokenów wejściowych przy zachowaniu jakości odpowiedzi.

Inne kluczowe funkcje

OmniRoute zawiera serwer MCP z 87 narzędziami, obsługę protokołu A2A (Agent-to-Agent), podpięcia pamięci długoterminowej oraz guardrails i monitoring. Gateway działa jako pakiet npm, kontener Docker, aplikacja desktopowa Electron lub PWA — działa też na Androidzie przez Termux. Opcja self-hosted jest kluczowa dla środowisk z wymogami rezydencji danych.

Auto-Combo engine ocenia każdego dostawcę w 9 wymiarach (zdrowie, dostępny limit, koszt, latencja, wskaźnik sukcesu) i przełącza transparentnie między dostawcami, gdy jeden wyczerpie limit lub ulegnie awarii.

#open source#AI gateway#Claude Code#Codex#Cursor#routing#MCP#narzędzia deweloperskie

Źródła