“AI skriver det meste av koden vår” høres ut som en oppstartsslogan. Kan det være virkelig for en bedriftsapplikasjon — live-kunder, live-fakturering, en monorepo hvor en dårlig merge koster penger? I QualityUnit er det det. Her er ti måneders bevissti, og reglene som gjør det fungerer.
TL;DR: I løpet av ti måneder gikk agentforfattet arbeid fra de første eksperimentelle anmodningene til 133 av 144 utviklingsanmodninger sammenslått i mai (92%) — verifisert av en tre-veis rettsmediskinsk revisjon av alle 1 409 slåtte anmodninger, ned til commit-trailers og en manuell inspeksjon av hver umarkert 2026-anmodning. Det skjedde ikke ved å “la AI kode”: det skjedde ved å legge til regler — en risikonivå-harness-config, en stegvis agentpipeline med avgrensede gjennomgangssløyfer, beskyttede stier og en menneske som holder hver merge. Reglene er produktet. Og med en kontekstmotor som mater agentene, koster det samme arbeidet nå ~30% mindre per oppgave (målt her ).
Hva det faktisk kreves
Ikke et verktøy. En pipeline, en policyfil og en port — kjørt av harnext .
Pipelinen: stegvise agenter, en menneske
Harnessen er harnext — QualityUnits åpen kildekode, leverandøruavhengig kodingsagent-harness. I vår produksjon monorepo kjører hver sak som kommer inn i pipelinen samme serie av CI-utløste agenttrinn, med fremgangen sporet gjennom etiketter en menneske kan lese med et blikk:
To detaljer betyr mer enn antall trinn. Sløyfen er avgrenset: defekter funnet i gjennomgang går tilbake til implementeringsstadiet et begrenset antall ganger — agenter konvergerer eller eskalerer til en menneske, de kastes ikke rundt. Ingenting starter blindt: før en linje skrives, må implementeringsagenten laste inn prosjektets konvensjoner og sende ut en bekreftelsesblokk som revisorer kan sjekke.
Policyfilen
Den andre halvdelen er en maskinlesbar policy: hver sti i depotet klassifisert i risikonivåer, hvert nivå med håndhevbare porter. CI leser det; merge-policy leser det; agenter blir informert om det. Det er ikke råd:
Beskyttede stier — migrasjoner, betalinger, autentisering — er filer som ingen agent kan berøre. Arkitektoniske grenser håndheves, ikke foreslått. Ta bort disse reglene og en kodingsagent er en veldig rask generator av sannsynlige forpliktelser.
Ti måneder, ett diagram
Adopsjonstien, målt fra selve depotet.
Diagrammet teller, for hver måned, hvor mange sammenslåtte utviklings-anmodninger som bærer noen sterke agentsignaler — kodingsagentens footer, pipelinens etiketter, harness-tierkonvensjonen, commit medforfattere-trailers, agentcommit-poster eller pipelinens egen konto som forfatter. Dependency-bot-anmodninger (omtrent 8% av alle sammenslåinger) er helt utelukket fra diagrammet — de er verken menneske- eller kodingsagentarbeid. Vi reviderte signalene på tre uavhengige måter: PR-metadata for alle 1 409 sammenslåinger, commit-nivå-trailers over 5 000+ commits, og en manuell rettsmediskinsk gjennomgang av hver eneste umarkert anmodning fra 2026. Tre avlesninger betyr noe:
**Entusiasme falmer; infrastruktur holder. ** 2025-æraen var ad-hoc, personlig adopsjonen — og den svingde nøyaktig som personlige vaner gjør: 44% en måned, knapt 4% i november da de tyngste brukerne pauserte. Harnessen endret kurveformen: innen en måned etter at risikonivåene ankom, hoppet den målte andelen til 89%; med hele pipelinen nådde den 92% og ble der. Hvert lag av regler økte adopsjonen mer enn noen enkeltpersons entusiasme noensinne gjorde. De to skygger forteller samme historie innenfor agentandelen: det lyse båndet er utviklere som parrer seg med agenten for hånd; det mørke båndet — arbeid som kjørte hele pipelinen fra sak til revidert anmodning — vises bare når harnessen lander, og innen mai bærer det mesteparten av agentarbeidet.
**Vi inspiserte resten, anmodning for anmodning. ** For april–juni 2026 dekomponeres anmodningene uten noen markør til: dependency-bot-automatisering, agentarbeid hvis eneste attribusjon overlevde i commit-trailers, og en rest av sannsynligvis håndskrevne endringer — omtrent 11% av ikke-automatiseringssammenslåinger. Så den ærlige setningen er: ~89% av ekte utviklingssammenslåinger i siste kvartal viser verifiserbar agentinvolvering — og selv det er en nedre grense, siden AI-assistanse på redigeringsnivå etterlater ingen spor. Vi sendte også skeptiske revisorer på de tre svakeste månedene, anmodning for anmodning: novembers telling steg fra 1 til 3 bevist (pluss 3 mistenkt på stil), januars falt fra 10 til 8 etter å ha fanget to falske positive, og desember ble bekreftet nøyaktig — med en vri: etter kodevolum leverte desembers åtte merkede anmodninger 39% av den månedes innsatte linjer. Agenten skrev allerede de store funksjonene; tellingen kunne bare ikke se det. Adopsjonen er heller ikke ensartet: noen utviklere kjører nær-100% agentassistert, et par skriver fortsatt stort sett for hånd — pipelinen bærer en voksende andel uansett.
**Kvaliteten gikk ikke bakover. ** Det samme vinduet leverte Tier-3-endringer — LLM-leverandørintegrasjon, betalingsrelatert arbeid, en i18n-utvidelse — under porter som ble strengere i perioden, ikke løsere. Og da vi målte agentgjennomgangskonsekvens direkte, 21 av 22 uavhengige gjennomgangsagenter nådde samme konklusjon på samme anmodning.
Så hvem er forfatteren?
Den beste artikulasjonen av hvor dette etterlater mennesket kommer fra en ingeniøroppgave som studerte harness-drevet utvikling på et luftfartsgradig prosjekt:
Når en endring nådde menneskelig forfatter, var rutinekvalitetsproblemene løst — forfatterens gjennomgang konsentrerte seg om arkitektoniske og domenelevelsbeslutninger. Mergen var forfatterens beslutning. Forfatterskapet av den sammenslåtte koden hviler på menneskelig forfatter, uavhengig av hvilken aktør som produserte det første utkastet.
— Štefan Moravík, Design and Implementation of a Drone Mission Planning Module for Airport Lighting Inspection (thesis, 2026)
Det er avtalen i produksjon også: agenter gjør utkastene og rutinekvalitetsarbeidet; mennesket gjør arkitektur, domenejudgement og eier mergen.

