В нашия AI агентски флот

Какво всъщност прави флотът

Флотът е малък набор от специализирани агенти, всеки с роля, памет и лента. Prime е операторски супервайзър — планира, координира, верифицира и възлага работа на останалите. Dev работи с code-truth задачи: дълбока инспекция на репо, TypeScript/Next.js верификация, билдове, тестове, refactor-и, миграции. Forger владее бизнеса ForgingApps: бранд, пакети, цени, блог, lead pipeline. Alfa е сложният автономен ремоут агент, който изпълнява дълги многостепни задачи без надзор. Personal е фокусиран върху здраве, хранене и акаунтабилност извън бизнеса. Извън това, два Docker бота (Ember и FB) работят изолирани клиентски задачи — Ember уиджетът, който виждате на началната страница на ForgingApps, е един от тях. Формата е преднамерена: един общенареден агент, няколко специалисти, всеки с ясен бриф.

Runtime отдолу

Всички Legion агенти работят на един Ubuntu хост наречен Hydra. Супервизирани са от systemd user услуги, за да оцеляват при рестарт и да пишат чисто в същите логове. Има два runtime-а. Hermes е messaging gateway — насочва работата към флота, превежда между chat surfaces и е мястото, където живее Dev. OpenClaw е agent framework-ът, който изпълнява alfa, forger, personal и Docker ботовете; той управлява сесии, инструменти, памет и моделно рутиране. И двете са на Python, ориентирани към CLI и свързани през Tailscale, така че мога да говоря с тях от лаптоп в София или от coworking в Берлин със същата команда.

Трайната памет променя всичко

Агенти, които забравят, са стажанти в цикъл. Парчето, което прави флота ни наистина полезен във времето, е споделена уики, към която агентите пишат и четат. Живее на Hydra, версионирана е и има стриктен схема: всяка страница има заглавие, updated печат, агент, който е обновил, тагове и lifecycle флаг. Когато агент прави нетривиална промяна — оправя бъг, добавя услуга, затваря инцидент, решава патерн — записва това решение в уикито през flock-защитен append скрипт, за да не се корумпира логът дори когато няколко агента пишат едновременно. Подобна детайлност звучи като излишна — докато четири агента не се сблъскат при логване и не разберете защо ключът е важен. Трайната обща памет е разликата между флот, който натрупва, и флот, който постоянно преоткрива същите уроци.

Делегиране по лента, не по внушение

Най-голямата полза идва от твърдо правило кой какво прави. Code-truth задачи — всичко, изискващо дълбока инспекция на репо, TypeScript верификация, билд/тест рънове или архитектурни refactor-и — отиват при Dev. Бизнес и съдържателска работа — пакетни описания, блог постове, промени в цени, lead pipeline — при Forger. Prime координира, планира и верифицира, но сам не произвежда код за клиенти. Без тази дисциплина генералистски агенти биха взели всички задачи и биха ги свършили 80% добре. С дисциплината специалистите остават в sweet spot-а на своя контекст и произвеждат работа, която не се нуждае от повторна човешка верификация във всеки преглед.

Моделите са множествено число

Изпълняваме няколко модела зад един и същ CLI. Първият модел за повечето работа е OpenAI Codex GPT-5.4, извикван през ChatGPT backend API — там е най-доброто съотношение цена-възможност в момента. Fallback-ите включват MiniMax-M2.7 за дълъг контекст бач работа и Claude Sonnet 4.6 за задачи, където искаме неговия специфичен стил на разсъждение. Vision е активиран в тези моделни дефиниции, за да могат агентите да четат скрийншотове, diff-ове и UI състояния без допълнителен инструментариум. Това е важно, защото отговорът с един-единствен модел — койтои вендор е най-шумен този квартал — остарява бързо. Изпълняването на флота над тънка абстракция от няколко доставчика не ни прави зависими от API промяна на един вендор.

Какво всъщност се счупва в продукция

Failure modes-ите, които имат значение, са скучни и конкретни. Изчерпване на сесионен контекст е най-честото: агентът препълва conversation history, тихо деградира по качество, но продължава да отговаря. Справяме се чрез наблюдение на сесиите и ротация (преименуване на JSONL, махане от sessions.json, рестарт на gateway) преди качеството да падне видимо. Конкурентни записи в споделени файлове преди корумпираха лога на уикито; flock-защитеният append shim беше написан в деня, когато четири агента се сблъскаха и произведоха смесица, която трябваше да се възстановява ръчно. Docker ботовете понякога изостават, когато mount пътища се различават между base image актуализации — третираме всеки изолиран бот със собствена локална уики и държим регистър, за да могат Legion агентите да четат тези уикита без да влизат сляпо в контейнерите. Нищо бляскаво. Всичко оперативно.

Защо това формира как консултираме клиенти

Причината този пост да съществува на консултантски сайт е проста: съветите, които даваме на клиенти, са следствие от това, което реално изпълняваме. Препоръката, когато бизнес пита дали да разгръща AI агенти, винаги е с еднакъв твар: започнете с тесен обхват. Дайте на агента една задача. Дайте му трайна, структурирана памет. Дайте му ясни граници къде може да пише и къде не. Изградете оперативната повърхност — логване, ротация, верификация — преди да разширите обхвата. Всичко друго изглежда като прогрес в демо и натрупва цена в продукция. Знаем го, защото го преживяхме: флотът, който виждате тук, не се появи готов; той е резултат от достатъчно итерации, за да направим грешките достатъчно евтино, за да ги задържим вътре в семейството. Това е опитът, който внасяме във всеки Oracle консултатски ангажимент и AI Chat Assistant изграждане. Ако искате да обсъдите как все това се отнася към вашия бизнес, контакт формата е в менюто.

В нашия AI агентски флот

Какво всъщност прави флотът

Runtime отдолу

Трайната памет променя всичко

Делегиране по лента, не по внушение

Моделите са множествено число

Какво всъщност се счупва в продукция

Защо това формира как консултираме клиенти

Готови ли сте за AI?

Свързани статии

AI чатбот за e-commerce поддръжка: какво да автоматизирате първо

AI сигурността вече е въпрос при покупка

Защо местното студио за разработка е по-добро от фрилансер