„AI píše většinu našeho kódu" zní jako slogan startupu. Může to být realitou pro podnikovou aplikaci — živí zákazníci, živá fakturace, monorepo, kde špatné sloučení stojí peníze? V QualityUnit to je. Zde je deset měsíců důkazů a pravidla, která to umožňují.
TL;DR: Za deset měsíců se práce s autorstvím agenta posunula z prvních experimentálních PR na 133 ze 144 sloučených PR vývoje v květnu (92%) — ověřeno tříčetným forenzním auditem všech 1 409 sloučených PR, až na commit trailery a ruční inspekci každého neoznačeného PR z roku 2026. Nestalo se to tím, že bychom „nechali AI kódovat": stalo se to přidáním pravidel — konfigurace harnessu se stupňovaným rizikem, pipeline stupňovaných agentů s omezenými smyčkami recenzí, chráněnými cestami a člověkem, který drží každé sloučení. Pravidla jsou produktem. A s context engine, který krmí agenty, stejná práce nyní stojí ~30 % méně na úkol (měřeno zde )."
Co to skutečně vyžaduje
Nikoli nástroj. Pipeline, soubor zásad a brána — provozované harnext .
Pipeline: stupňovaní agenti, jeden člověk
Harness je harnext — open-source implementace QualityUnit, nezávislá na poskytovateli, kodovacího agenta harness. V našem produkčním monorepo každý problém, který vstoupí do pipeline, projde stejnou řadou stupňů agenta spouštěných CI, jeho pokrok sledován pomocí štítků, které může člověk přečíst na první pohled:
Dva detaily jsou důležitější než počet stupňů. Smyčka je omezena: defekty nalezené v recenzi se vrátí do etapy implementace omezeně — agenti se sbíhají nebo eskalují na člověka, nevrací se do smyčky. Nic nezačíná slepě: před napsáním řádku musí implementační agent načíst konvence projektu a vyzářit blok potvrzení, který mohou recenzenti zkontrolovat.
Soubor zásad
Druhou polovinu je zásada čitelná strojem: každá cesta v repozitáři klasifikována do rizikových úrovní, každá úroveň s vymahatelných branami. CI ji čte; zásada sloučení ji čte; agenti jsou o ní informováni. Není to rady:
Chráněné cesty — migrace, platby, ověřování — jsou soubory, které nesmí dotknout žádný agent. Architektonické hranice jsou vynuceny, ne navrhnuty. Vezměte tato pravidla a kodovací agent je velmi rychlý generátor věrohodně vypadajících závazků.
Deset měsíců, jeden graf
Cesta adopce, měřená z vlastního repozitáře.
Graf počítá pro každý měsíc, kolik sloučených vývojových PR nese jakýkoli silný signál agenta — zápatí kodovacího agenta, štítky pipeline, konvence harness tier, commit co-author trailery, e-maily agentů nebo vlastní účet pipeline jako autor. Dependency-bot PR (asi 8 % všech sloučení) jsou z grafu zcela vyloučeny — nejsou ani lidská, ani práce kodovacího agenta. Signály jsme auditovali třemi nezávislými způsoby: metadata PR pro všech 1 409 sloučení, commit-level trailery v 5 000+ commitech a ruční forenzní průchod každým jednotlivým neoznačeným PR z roku 2026. Tři čtení jsou důležitá:
Nadšení slábne; infrastruktura zůstává. Éra 2025 byla ad-hoc, osobní adopce — a oscilovala přesně jako osobní zvyky: 44 % jeden měsíc, sotva 4 % v listopadu, když nejaktivnější uživatelé zastavili. Harness změnil tvar křivky: během měsíce, kdy dorazily rizikové úrovně, měřený podíl skočil na 89 %; s plnou pipeline dosáhl 92 % a zůstal tam. Každá vrstva pravidel zvýšila adopci více než nadšení kteréhokoli jedince. Dva odstíny vypráví stejný příběh uvnitř podílu agenta: světlý pás je vývojáři párující se s agentem ručně; tmavý pás — práce, která spustila plnou pipeline od problému k recenzovanému PR — se objevuje pouze když dorazí harness a v květnu nese většinu práce agenta.
Zbytek jsme inspekovali, PR po PR. Pro duben–červen 2026 se PR bez jakéhokoli markeru rozloží na: dependency-bot automatizaci, práci agenta, jejíž jediná přiřazení přežila v commit trailerech, a zbytek věrohodně ručně psaných změn — asi 11 % sloučení bez automatizace. Takže upřímná věta zní: ~89 % skutečných sloučení vývoje v posledním čtvrtletí vykazuje ověřitelnou účast agenta — a to je ještě dolní hranice, protože AI asistence na úrovni editoru nezanechává žádné stopy. Také jsme poslali skeptické auditory v třech nejslabších měsících, PR po PR: počet listopadu stoupnul z 1 na 3 prokázané (plus 3 podezřelé na styl), počet ledna klesl z 10 na 8 po chycení dvou falešných pozitiv a prosince byl potvrzen přesně — s jedním zvratem: podle objemu kódu osm označených PR prosince doručilo 39 % vloženého řádků toho měsíce. Agent již psal velké funkce; počet to prostě nemohl vidět. Adopce také není rovnoměrná: někteří vývojáři běží blízko 100 % asistenci agenta, pár stále převážně píše ručně — pipeline nese rostoucí podíl v každém případě.
Kvalita se nezhoršila. Stejné okno doručilo změny Tier-3 — integraci poskytovatele LLM, práci přilehlou k platbám, expanzi i18n — pod branami, které se během období zpřísňovaly, ne uvolňovaly. A když jsme měřili konzistenci recenze agenta přímo, 21 z 22 nezávislých agentů recenze dosáhlo stejného verdiktu na stejném PR.
Takže kdo je autorem?
Nejlepší artikulace toho, kde to zanechává člověka, pochází z inženýrské práce, která studovala vývoj řízený harnesem na projektu v letecké třídě:
Když změna dosáhla lidského autora, rutinní problémy s kvalitou byly vyřešeny — recenze autora se soustředila na rozhodnutí na architektonické a doménové úrovni. Sloučení bylo rozhodnutím autora. Autorství sloučeného kódu spočívá s lidským autorem, bez ohledu na to, který subjekt vytvořil počáteční návrh.
— Štefan Moravík, Design and Implementation of a Drone Mission Planning Module for Airport Lighting Inspection (práce, 2026)
To je dohoda v produkci také: agenti dělají návrh a rutinní práci na kvalitě; člověk dělá architekturu, doménový úsudek a vlastní sloučení.

