Dezvoltarea unei aplicații enterprise complete cu agenți de codare harnext

AI Agents Agentic Workflows Developer Productivity Engineering Culture

„IA scrie cea mai mare parte din codul nostru" sună ca un slogan de startup. Poate fi real pentru o aplicație enterprise — clienți live, facturare live, un monorepo unde o fuziune proastă costă bani? La QualityUnit este. Iată urma de zece luni de dovezi și regulile care o fac să funcționeze.

TL;DR: În zece luni, munca creată de agenți a trecut de la primele PR-uri experimentale la 133 din 144 cererile de pull de dezvoltare fuzionate în mai (92%) — verificate printr-o audit forenzică cu trei căi a tuturor 1.409 PR-uri fuzionate, până la trailers de commit și o inspecție manuală a fiecărui PR nemarcate din 2026. Nu s-a întâmplat prin „a permite IA să codeze": s-a întâmplat prin adăugarea de reguli — o configurație harness cu nivel de risc, un pipeline de agenți în etape cu bucle de revizuire delimitate, căi protejate și un om ținând fiecare fuziune. Regulile sunt produsul. Și cu un motor de context hrănind agenții, aceeași muncă costă acum ~30% mai puțin pe sarcină (măsurat aici ).

Ce cere de fapt

Nu un instrument. Un pipeline, un fișier de politică și o poartă — conduse de harnext .

Pipeline-ul: agenți în etape, un om

Harness-ul este harnext — harness de agent de codare open-source al QualityUnit, independent de furnizor. În monorepo-ul nostru de producție, fiecare problemă care intră în pipeline rulează același gantlet de etape de agent declanșate de CI, progresul său urmărit prin etichete pe care un om le poate citi dintr-o privire:

Pipeline-ul de producție: tagger, triage, plan, implementare, revizuire cu o buclă de revizuire-reparare limitată, un agent independent de revizuire de cod, fuziunea umană — plus grădinărit de documente ținând docurile per-folder în sincronizare după fuziune

Două detalii contează mai mult decât numărul de etape. Bucla este limitată: defectele găsite în revizuire se întorc la etapa de implementare un număr limitat de ori — agenții converg sau escaladează către un om, nu se agită. Nimic nu începe orb: înainte de a scrie o linie, agenții care implementează trebuie să încarce convenția proiectului și să emită un bloc de confirmare pe care revizorii îl pot verifica.

Fișierul de politică

Cealaltă jumătate este o politică citibilă de mașină: fiecare cale din repo clasificată în niveluri de risc, fiecare nivel cu porți aplicabile. CI o citește; politica de fuziune o citește; agenții sunt informați despre ea. Nu este sfat:

Ce trebuie să treacă o schimbare de risc ridicat: verificări necesare, două aprobări, agent de revizuire obligatoriu, fără auto-fuziune, căi protejate, limite arhitecturale, dovezi screenshot — și o confirmare obligatorie a contextului

Căile protejate — migrări, plăți, autentificare — sunt fișiere pe care niciun agent nu le poate atinge. Limitele arhitecturale sunt aplicate, nu sugerate. Luați aceste reguli și un agent de codare este un generator foarte rapid de responsabilități care arată plauzibil.

Zece luni, un grafic

Pista de adoptare, măsurată din repository-ul însuși.

Cererile de pull de dezvoltare fuzionate pe lună, iulie 2025 până iunie 2026 — tealprofund a rulat pipeline-ul complet de agenți de la început la sfârșit, teal ușor este un dezvoltator împerecheat cu agenții direct, gri este nemarcate. Procentajul este implicare totală a agentului, atingând 92% în mai 2026

Graficul numără, pentru fiecare lună, câte PR-uri de dezvoltare fuzionate *poartă orice semnal hard al agentului — piciorul agentului de codare, etichetele pipeline-ului, convenția nivelului harness, trailers de co-autor de commit, e-mailuri de commit de agent, sau contul propriu al pipeline-ului ca autor. PR-urile dependency-bot (aproximativ 8% din toate fuziunile) sunt excluse complet din grafic — nu sunt nici muncă umană, nici muncă de agent de codare. Am auditat semnalele în trei moduri independente: metadate PR pentru toate 1.409 fuziuni, trailers la nivel de commit pe 5.000+ commit-uri și o trecere forenzică manuală peste fiecare PR nemarcate din 2026. Trei citiri contează:

Entuziasmul se estompează; infrastructura rămâne. Era 2025 a fost adoptare ad-hoc, personală — și a oscilat exact cum fac obiceiurile personale: 44% o lună, abia 4% în noiembrie când utilizatorii cei mai grei au pus pauză. Harness-ul a schimbat forma curbei: în decurs de o lună de la sosirea nivelurilor de risc, cota măsurată a sărit la 89%; cu pipeline-ul complet a atins 92% și a rămas acolo. Fiecare strat de reguli a crescut adoptarea mai mult decât entuziasmul oricărui individ a făcut vreodată. Cele două nuanțe spun aceeași poveste în cadrul cotei de agenți: banda ușoară este dezvoltatori împerecheat cu agenții manual; banda întunecată — munca care a rulat pipeline-ul complet de la problemă la PR revizuit — apare doar când harness-ul aterizeaza, și în mai poartă majoritatea muncii de agenți.

Am inspectat restul, PR cu PR. Pentru aprilie–iunie 2026, PR-urile fără niciun marcator se descompun în: automatizare dependency-bot, munca de agenți a cărei singură atribuire a supraviețuit în trailers de commit și un rest de schimbări plauzibil scrise manual — aproximativ 11% din fuziuni non-automatizare. Deci propoziția sinceră este: ~89% din fuziuni de dezvoltare reale din ultimul trimestru arată implicare verificabilă a agentului — și chiar și asta este o limită inferioară, deoarece asistența IA la nivel de editor nu lasă urme. Am trimis și auditori sceptici la cele trei luni cele mai slabe, PR cu PR: numărul din noiembrie a crescut de la 1 la 3 dovedite (plus 3 suspectate pe stil), ianuarie a scăzut de la 10 la 8 după a prinde două fals pozitive, și decembrie a fost confirmat exact — cu o răsturnare: după volum de cod, opt PR-urile marcate din decembrie au livrat 39% din liniile introduse ale acelei luni. Agenții scriau deja caracteristicile mari; numărul pur și simplu nu le putea vedea. Adoptarea, de asemenea, nu este uniformă: unii dezvoltatori rulează aproape 100% asistență de agenți, câțiva încă scriu mai mult manual — pipeline-ul poartă o cotă din ce în ce mai mare în ambele cazuri.

Calitatea nu s-a mișcat înapoi. Aceeași fereastră a expediat schimbări Tier-3 — integrare furnizor LLM, muncă adiacentă plăților, o expansiune i18n — sub porți care au devenit mai stricte în perioada respectivă, nu mai ușoare. Și când am măsurat consistența revizuirii agentului direct, 21 din 22 agenți de revizuire independenți au ajuns la același verdict pe același PR.

Deci cine este autorul?

Cea mai bună articulare a locului unde aceasta lasă omul vine dintr-o teză de inginerie care a studiat dezvoltarea condusă de harness pe un proiect de calitate aviație:

Până când o schimbare a ajuns la autorul uman, problemele de calitate obișnuite au fost rezolvate — revizuirea autorului s-a concentrat pe decizii arhitecturale și la nivel de domeniu. Fuziunea a fost decizia autorului. Autoria codului fuzionat aparține autorului uman, indiferent de care actor a produs proiectul inițial.

— Štefan Moravík, Proiectare și implementare a unui modul de planificare a misiunilor de drone pentru inspecția iluminării aeroportului (teză, 2026)

Asta este acordul în producție și: agenții fac redactarea și munca de calitate obișnuită; omul face arhitectură, judecată de domeniu și deține fuziunea.

Întrebări frecvente

Ștefan este un inginer AI și software care construiește FlowHunt. Dincolo de produs, el proiectează fluxuri de lucru agentic de inginerie software pentru dezvoltatori care reduc costurile de dezvoltare și ridică calitatea codului.

Štefan Moravík
Štefan Moravík
Inginer AI și Software

Aduceți un pipeline de agenți în echipa voastră

FlowHunt ajută echipele de inginerie să proiecteze pipeline-uri de agenți, porți cu niveluri de risc și fluxuri de lucru cu context care ridică calitatea codului în timp ce reduc costurile de dezvoltare.