В нашия AI агентски флот
Когато AI консултант каже, че изпълнява агенти в продукция, честният отговор е: покажи ми. Това е нашият отговор. Работим малък AI агентски флот върху собствена инфраструктура всеки ден. Това не е слайд или пилот проект. Това е нервната система, която планира, пише, делегира и верифицира работа в ForgingApps. Ето какво има във вътре, защо е така формирано и какво научихме, след като новостта отшумя.
Какво всъщност прави флотът
Флотът е малък набор от специализирани агенти, всеки с роля, памет и лента. Prime е операторски супервайзър — планира, координира, верифицира и възлага работа на останалите. Dev работи с code-truth задачи: дълбока инспекция на репо, TypeScript/Next.js верификация, билдове, тестове, refactor-и, миграции. Forger владее бизнеса ForgingApps: бранд, пакети, цени, блог, lead pipeline. Alfa е сложният автономен ремоут агент, който изпълнява дълги многостепни задачи без надзор. Personal е фокусиран върху здраве, хранене и акаунтабилност извън бизнеса. Извън това, два Docker бота (Ember и FB) работят изолирани клиентски задачи — Ember уиджетът, който виждате на началната страница на ForgingApps, е един от тях. Формата е преднамерена: един общенареден агент, няколко специалисти, всеки с ясен бриф.
Runtime отдолу
Всички Legion агенти работят на един Ubuntu хост наречен Hydra. Супервизирани са от systemd user услуги, за да оцеляват при рестарт и да пишат чисто в същите логове. Има два runtime-а. Hermes е messaging gateway — насочва работата към флота, превежда между chat surfaces и е мястото, където живее Dev. OpenClaw е agent framework-ът, който изпълнява alfa, forger, personal и Docker ботовете; той управлява сесии, инструменти, памет и моделно рутиране. И двете са на Python, ориентирани към CLI и свързани през Tailscale, така че мога да говоря с тях от лаптоп в София или от coworking в Берлин със същата команда.
Трайната памет променя всичко
Агенти, които забравят, са стажанти в цикъл. Парчето, което прави флота ни наистина полезен във времето, е споделена уики, към която агентите пишат и четат. Живее на Hydra, версионирана е и има стриктен схема: всяка страница има заглавие, updated печат, агент, който е обновил, тагове и lifecycle флаг. Когато агент прави нетривиална промяна — оправя бъг, добавя услуга, затваря инцидент, решава патерн — записва това решение в уикито през flock-защитен append скрипт, за да не се корумпира логът дори когато няколко агента пишат едновременно. Подобна детайлност звучи като излишна — докато четири агента не се сблъскат при логване и не разберете защо ключът е важен. Трайната обща памет е разликата между флот, който натрупва, и флот, който постоянно преоткрива същите уроци.
Делегиране по лента, не по внушение
Най-голямата полза идва от твърдо правило кой какво прави. Code-truth задачи — всичко, изискващо дълбока инспекция на репо, TypeScript верификация, билд/тест рънове или архитектурни refactor-и — отиват при Dev. Бизнес и съдържателска работа — пакетни описания, блог постове, промени в цени, lead pipeline — при Forger. Prime координира, планира и верифицира, но сам не произвежда код за клиенти. Без тази дисциплина генералистски агенти биха взели всички задачи и биха ги свършили 80% добре. С дисциплината специалистите остават в sweet spot-а на своя контекст и произвеждат работа, която не се нуждае от повторна човешка верификация във всеки преглед.
Моделите са множествено число
Изпълняваме няколко модела зад един и същ CLI. Първият модел за повечето работа е OpenAI Codex GPT-5.4, извикван през ChatGPT backend API — там е най-доброто съотношение цена-възможност в момента. Fallback-ите включват MiniMax-M2.7 за дълъг контекст бач работа и Claude Sonnet 4.6 за задачи, където искаме неговия специфичен стил на разсъждение. Vision е активиран в тези моделни дефиниции, за да могат агентите да четат скрийншотове, diff-ове и UI състояния без допълнителен инструментариум. Това е важно, защото отговорът с един-единствен модел — койтои вендор е най-шумен този квартал — остарява бързо. Изпълняването на флота над тънка абстракция от няколко доставчика не ни прави зависими от API промяна на един вендор.
Какво всъщност се счупва в продукция
Failure modes-ите, които имат значение, са скучни и конкретни. Изчерпване на сесионен контекст е най-честото: агентът препълва conversation history, тихо деградира по качество, но продължава да отговаря. Справяме се чрез наблюдение на сесиите и ротация (преименуване на JSONL, махане от sessions.json, рестарт на gateway) преди качеството да падне видимо. Конкурентни записи в споделени файлове преди корумпираха лога на уикито; flock-защитеният append shim беше написан в деня, когато четири агента се сблъскаха и произведоха смесица, която трябваше да се възстановява ръчно. Docker ботовете понякога изостават, когато mount пътища се различават между base image актуализации — третираме всеки изолиран бот със собствена локална уики и държим регистър, за да могат Legion агентите да четат тези уикита без да влизат сляпо в контейнерите. Нищо бляскаво. Всичко оперативно.
Защо това формира как консултираме клиенти
Причината този пост да съществува на консултантски сайт е проста: съветите, които даваме на клиенти, са следствие от това, което реално изпълняваме. Препоръката, когато бизнес пита дали да разгръща AI агенти, винаги е с еднакъв твар: започнете с тесен обхват. Дайте на агента една задача. Дайте му трайна, структурирана памет. Дайте му ясни граници къде може да пише и къде не. Изградете оперативната повърхност — логване, ротация, верификация — преди да разширите обхвата. Всичко друго изглежда като прогрес в демо и натрупва цена в продукция. Знаем го, защото го преживяхме: флотът, който виждате тук, не се появи готов; той е резултат от достатъчно итерации, за да направим грешките достатъчно евтино, за да ги задържим вътре в семейството. Това е опитът, който внасяме във всеки Oracle консултатски ангажимент и AI Chat Assistant изграждане. Ако искате да обсъдите как все това се отнася към вашия бизнес, контакт формата е в менюто.
Искате да обсъдим как това се отнася до Вашия бизнес? Запазете безплатен разговор.
Готови ли сте за AI?
Помагаме на компании да идентифицират, проектират и внедряват AI решения, които реално работят. Запишете безплатна консултация.
Запазете безплатен разговор →Свързани статии
Всички статии →AI сигурността вече е въпрос при покупка
Mythos Preview на Anthropic и скорошният инцидент с външен инструмент при OpenAI сочат към едно и също: бизнесът трябва да оценява права, интеграции и риск, а не само качеството на модела.
Защо местното студио за разработка е по-добро от фрилансер
Фрилансерите са евтини. Агенциите са скъпи. Бутиковите студия предлагат нещо по-добро: старши опит, пряка отговорност и без аутсорсинг.
Персонализиран срещу готов софтуер: кога да строиш, кога да купуваш
Не всеки бизнес се нуждае от персонализиран софтуер. Но някои плащат SaaS такси завинаги за инструмент, който едва им отговаря. Ето практична рамка за решение.