Pot agenții de codare să producă cu adevărat software enterprise de calitate producție?

Da — dar nu nesupravegheat. În monorepo-ul nostru de producție, 92% din cererile de pull de dezvoltare din mai 2026 arată implicare verificabilă a agentului, expediate sub porți care au devenit mai stricte în aceeași perioadă: niveluri de risc, revizuiri obligatorii, căi protejate și un om luând fiecare decizie de fuziune. Regulile sunt ceea ce transformă viteza agentului în calitate de producție.

Ce este o harness de agent?

O harness de agent este schela în care funcționează un agent de codare: un fișier de politică citibil de mașină (niveluri de risc, căi protejate, limite arhitecturale), un pipeline în etape de agenți specializați (tag, triage, plan, implementare, revizuire), bucle de corecție delimitate și încărcare obligatorie a contextului înainte ca orice cod să fie scris. harnext este implementarea open-source a QualityUnit, independentă de furnizor.

Cât din codul vostru este de fapt scris de IA?

Măsurat din repository-ul însuși: 92% din cererile de pull de dezvoltare fuzionate în mai 2026 poartă semnale hard ale agentului (picioare de atribuire, etichete de pipeline, trailers de commit, sau contul propriu al pipeline-ului ca autor). Fiecare număr este o limită inferioară — atribuirea este rutina dezbrăcată — și o audit manual al fiecărui PR nemarcate din 2026 a găsit aproximativ 11% din fuziunile de dezvoltare sunt plauzibil complet scrise manual.

Oamenii încă revizuiesc codul?

Fiecare schimbare fuzionată a trecut printr-o revizuire umană și o decizie umană de fuziune. Rolul pipeline-ului este să rezolve problemele de calitate obișnuite înainte ca un om să se uite, deci revizuirea umană se concentrează pe arhitectură și judecată de domeniu — nu pentru a elimina omul.

Cum au fost verificate aceste numere de adoptare?

Trei moduri independente: metadate PR pentru toate 1.409 PR-uri fuzionate pe zece luni, analiză la nivel de commit a 5.000+ commit-uri pentru trailers de co-autor și e-mailuri de agent, și o inspecție forenzică manuală a fiecărui PR nemarcate din 2026. Am trimis apoi auditori sceptici la cele trei luni cele mai slabe PR cu PR — un număr a crescut, unul a scăzut, unul a fost confirmat exact. Toate corecțiile sunt reflectate în graficul publicat.

Dezvoltarea unei aplicații enterprise complete cu agenți de codare harnext

Zece luni, 1.409 PR-uri fuzionate, trei audituri forenzice: cum a dus un pipeline de agenți în etape o bază de cod enterprise de la 12% la 92% dezvoltare implicând agenți — cu reguli, porți și un om ținând fiecare fuziune.

AI Agents Agentic Workflows Developer Productivity Engineering Culture

Încercați FlowHunt Citiți studiul Context Engine

„IA scrie cea mai mare parte din codul nostru" sună ca un slogan de startup. Poate fi real pentru o aplicație enterprise — clienți live, facturare live, un monorepo unde o fuziune proastă costă bani? La QualityUnit este. Iată urma de zece luni de dovezi și regulile care o fac să funcționeze.

TL;DR: În zece luni, munca creată de agenți a trecut de la primele PR-uri experimentale la 133 din 144 cererile de pull de dezvoltare fuzionate în mai (92%) — verificate printr-o audit forenzică cu trei căi a tuturor 1.409 PR-uri fuzionate, până la trailers de commit și o inspecție manuală a fiecărui PR nemarcate din 2026. Nu s-a întâmplat prin „a permite IA să codeze": s-a întâmplat prin adăugarea de reguli — o configurație harness cu nivel de risc, un pipeline de agenți în etape cu bucle de revizuire delimitate, căi protejate și un om ținând fiecare fuziune. Regulile sunt produsul. Și cu un motor de context hrănind agenții, aceeași muncă costă acum ~30% mai puțin pe sarcină (măsurat aici ).

Ce cere de fapt

Nu un instrument. Un pipeline, un fișier de politică și o poartă — conduse de harnext .

Pipeline-ul: agenți în etape, un om

Harness-ul este harnext — harness de agent de codare open-source al QualityUnit, independent de furnizor. În monorepo-ul nostru de producție, fiecare problemă care intră în pipeline rulează același gantlet de etape de agent declanșate de CI, progresul său urmărit prin etichete pe care un om le poate citi dintr-o privire:

Pipeline-ul de producție: tagger, triage, plan, implementare, revizuire cu o buclă de revizuire-reparare limitată, un agent independent de revizuire de cod, fuziunea umană — plus grădinărit de documente ținând docurile per-folder în sincronizare după fuziune

Două detalii contează mai mult decât numărul de etape. Bucla este limitată: defectele găsite în revizuire se întorc la etapa de implementare un număr limitat de ori — agenții converg sau escaladează către un om, nu se agită. Nimic nu începe orb: înainte de a scrie o linie, agenții care implementează trebuie să încarce convenția proiectului și să emită un bloc de confirmare pe care revizorii îl pot verifica.

Fișierul de politică

Cealaltă jumătate este o politică citibilă de mașină: fiecare cale din repo clasificată în niveluri de risc, fiecare nivel cu porți aplicabile. CI o citește; politica de fuziune o citește; agenții sunt informați despre ea. Nu este sfat:

Ce trebuie să treacă o schimbare de risc ridicat: verificări necesare, două aprobări, agent de revizuire obligatoriu, fără auto-fuziune, căi protejate, limite arhitecturale, dovezi screenshot — și o confirmare obligatorie a contextului

Căile protejate — migrări, plăți, autentificare — sunt fișiere pe care niciun agent nu le poate atinge. Limitele arhitecturale sunt aplicate, nu sugerate. Luați aceste reguli și un agent de codare este un generator foarte rapid de responsabilități care arată plauzibil.

Zece luni, un grafic

Pista de adoptare, măsurată din repository-ul însuși.

Cererile de pull de dezvoltare fuzionate pe lună, iulie 2025 până iunie 2026 — tealprofund a rulat pipeline-ul complet de agenți de la început la sfârșit, teal ușor este un dezvoltator împerecheat cu agenții direct, gri este nemarcate. Procentajul este implicare totală a agentului, atingând 92% în mai 2026

Graficul numără, pentru fiecare lună, câte PR-uri de dezvoltare fuzionate *poartă orice semnal hard al agentului — piciorul agentului de codare, etichetele pipeline-ului, convenția nivelului harness, trailers de co-autor de commit, e-mailuri de commit de agent, sau contul propriu al pipeline-ului ca autor. PR-urile dependency-bot (aproximativ 8% din toate fuziunile) sunt excluse complet din grafic — nu sunt nici muncă umană, nici muncă de agent de codare. Am auditat semnalele în trei moduri independente: metadate PR pentru toate 1.409 fuziuni, trailers la nivel de commit pe 5.000+ commit-uri și o trecere forenzică manuală peste fiecare PR nemarcate din 2026. Trei citiri contează:

Entuziasmul se estompează; infrastructura rămâne. Era 2025 a fost adoptare ad-hoc, personală — și a oscilat exact cum fac obiceiurile personale: 44% o lună, abia 4% în noiembrie când utilizatorii cei mai grei au pus pauză. Harness-ul a schimbat forma curbei: în decurs de o lună de la sosirea nivelurilor de risc, cota măsurată a sărit la 89%; cu pipeline-ul complet a atins 92% și a rămas acolo. Fiecare strat de reguli a crescut adoptarea mai mult decât entuziasmul oricărui individ a făcut vreodată. Cele două nuanțe spun aceeași poveste în cadrul cotei de agenți: banda ușoară este dezvoltatori împerecheat cu agenții manual; banda întunecată — munca care a rulat pipeline-ul complet de la problemă la PR revizuit — apare doar când harness-ul aterizeaza, și în mai poartă majoritatea muncii de agenți.

Am inspectat restul, PR cu PR. Pentru aprilie–iunie 2026, PR-urile fără niciun marcator se descompun în: automatizare dependency-bot, munca de agenți a cărei singură atribuire a supraviețuit în trailers de commit și un rest de schimbări plauzibil scrise manual — aproximativ 11% din fuziuni non-automatizare. Deci propoziția sinceră este: ~89% din fuziuni de dezvoltare reale din ultimul trimestru arată implicare verificabilă a agentului — și chiar și asta este o limită inferioară, deoarece asistența IA la nivel de editor nu lasă urme. Am trimis și auditori sceptici la cele trei luni cele mai slabe, PR cu PR: numărul din noiembrie a crescut de la 1 la 3 dovedite (plus 3 suspectate pe stil), ianuarie a scăzut de la 10 la 8 după a prinde două fals pozitive, și decembrie a fost confirmat exact — cu o răsturnare: după volum de cod, opt PR-urile marcate din decembrie au livrat 39% din liniile introduse ale acelei luni. Agenții scriau deja caracteristicile mari; numărul pur și simplu nu le putea vedea. Adoptarea, de asemenea, nu este uniformă: unii dezvoltatori rulează aproape 100% asistență de agenți, câțiva încă scriu mai mult manual — pipeline-ul poartă o cotă din ce în ce mai mare în ambele cazuri.

Calitatea nu s-a mișcat înapoi. Aceeași fereastră a expediat schimbări Tier-3 — integrare furnizor LLM, muncă adiacentă plăților, o expansiune i18n — sub porți care au devenit mai stricte în perioada respectivă, nu mai ușoare. Și când am măsurat consistența revizuirii agentului direct, 21 din 22 agenți de revizuire independenți au ajuns la același verdict pe același PR.

Deci cine este autorul?

Cea mai bună articulare a locului unde aceasta lasă omul vine dintr-o teză de inginerie care a studiat dezvoltarea condusă de harness pe un proiect de calitate aviație:

Până când o schimbare a ajuns la autorul uman, problemele de calitate obișnuite au fost rezolvate — revizuirea autorului s-a concentrat pe decizii arhitecturale și la nivel de domeniu. Fuziunea a fost decizia autorului. Autoria codului fuzionat aparține autorului uman, indiferent de care actor a produs proiectul inițial.

— Štefan Moravík, Proiectare și implementare a unui modul de planificare a misiunilor de drone pentru inspecția iluminării aeroportului (teză, 2026)

Asta este acordul în producție și: agenții fac redactarea și munca de calitate obișnuită; omul face arhitectură, judecată de domeniu și deține fuziunea.

Întrebări frecvente

: Da — dar nu nesupravegheat. În monorepo-ul nostru de producție, 92% din cererile de pull de dezvoltare din mai 2026 arată implicare verificabilă a agentului, expediate sub porți care au devenit mai stricte în aceeași perioadă: niveluri de risc, revizuiri obligatorii, căi protejate și un om luând fiecare decizie de fuziune. Regulile sunt ceea ce transformă viteza agentului în calitate de producție.
: O harness de agent este schela în care funcționează un agent de codare: un fișier de politică citibil de mașină (niveluri de risc, căi protejate, limite arhitecturale), un pipeline în etape de agenți specializați (tag, triage, plan, implementare, revizuire), bucle de corecție delimitate și încărcare obligatorie a contextului înainte ca orice cod să fie scris. harnext este implementarea open-source a QualityUnit, independentă de furnizor.
: Măsurat din repository-ul însuși: 92% din cererile de pull de dezvoltare fuzionate în mai 2026 poartă semnale hard ale agentului (picioare de atribuire, etichete de pipeline, trailers de commit, sau contul propriu al pipeline-ului ca autor). Fiecare număr este o limită inferioară — atribuirea este rutina dezbrăcată — și o audit manual al fiecărui PR nemarcate din 2026 a găsit aproximativ 11% din fuziunile de dezvoltare sunt plauzibil complet scrise manual.
: Fiecare schimbare fuzionată a trecut printr-o revizuire umană și o decizie umană de fuziune. Rolul pipeline-ului este să rezolve problemele de calitate obișnuite înainte ca un om să se uite, deci revizuirea umană se concentrează pe arhitectură și judecată de domeniu — nu pentru a elimina omul.
: Trei moduri independente: metadate PR pentru toate 1.409 PR-uri fuzionate pe zece luni, analiză la nivel de commit a 5.000+ commit-uri pentru trailers de co-autor și e-mailuri de agent, și o inspecție forenzică manuală a fiecărui PR nemarcate din 2026. Am trimis apoi auditori sceptici la cele trei luni cele mai slabe PR cu PR — un număr a crescut, unul a scăzut, unul a fost confirmat exact. Toate corecțiile sunt reflectate în graficul publicat.

Aduceți un pipeline de agenți în echipa voastră

FlowHunt ajută echipele de inginerie să proiecteze pipeline-uri de agenți, porți cu niveluri de risc și fluxuri de lucru cu context care ridică calitatea codului în timp ce reduc costurile de dezvoltare.

Încercați FlowHunt Citiți studiul Context Engine

Dezvoltarea unei aplicații enterprise complete cu agenți de codare harnext