Kan kodingsagenter virkelig produsere produksjonskvalitet bedriftsprogramvare?

Ja — men ikke uovervåket. I vår produksjon monorepo viser 92% av mai 2026s utviklingsanmodninger verifiserbar agentinvolvering, levert under porter som ble strengere i samme periode: risikonivåer, obligatoriske gjennomganger, beskyttede stier og en menneske som tar hver mergeavgjørelse. Reglene er det som gjør agentens hastighet til produksjonskvalitet.

Hva er en agentharness?

En agentharness er stillas som en kodingsagent arbeider innenfor: en maskinlesbar policyfil (risikonivåer, beskyttede stier, arkitektoniske grenser), en stegvis pipeline av spesialiserte agenter (tag, triage, plan, implement, review), avgrensede korreksjonssløyfer og obligatorisk kontekstlasting før koden skrives. harnext er QualityUnits åpen kildekode, leverandøruavhengig implementasjon.

Hvor mye av koden din er faktisk skrevet av AI?

Målt fra selve depotet: 92% av utviklingsanmodningene som ble slått sammen i mai 2026 har sterke agentsignaler (attribusjonsfooter, pipelineetiketter, commit-trailers eller pipelinens egen konto som forfatter). Hvert tall er en nedre grense — attribusjon blir rutinemessig fjernet — og en manuell revisjon av hver umarkert 2026-anmodning fant at omtrent 11% av utviklingssammenslåingene sannsynligvis er helt håndskrevne.

Gjennomgår mennesker fortsatt koden?

Hver sammenslått endring passerte en menneskelig gjennomgang og en menneskelig mergeavgjørelse. Pipelinens oppgave er å løse rutinekvalitetsproblemer før en menneske ser det, slik at menneskelig gjennomgang konsentrerer seg om arkitektur og domenejudgement — ikke for å fjerne mennesket.

Hvordan ble disse adopsjonstallene verifisert?

På tre uavhengige måter: PR-metadata for alle 1 409 slåtte anmodninger over ti måneder, commit-nivåanalyse av 5 000+ commits for medforfattere-trailers og agente-poster, og en manuell rettsmediskinsk inspeksjon av hver umarkert 2026-anmodning. Vi sendte deretter skeptiske revisorer på de tre svakeste månedene PR for PR — ett tall gikk opp, ett gikk ned, ett ble bekreftet nøyaktig. Alle korreksjoner gjenspeiles i det publiserte diagrammet.

Utvikling av en fullstendig bedriftsapplikasjon med harnext-kodingsagenten

Ti måneder, 1 409 slåtte pull requests, tre rettsmedisinske revisjoner: hvordan en stegvis agentpipeline tok en bedrifts kodebase fra 12% til 92% agentinvolvert utvikling — med regler, porter og en menneske som holder hver merge.

AI Agents Agentic Workflows Developer Productivity Engineering Culture

Try FlowHunt Read the Context Engine Study

“AI skriver det meste av koden vår” høres ut som en oppstartsslogan. Kan det være virkelig for en bedriftsapplikasjon — live-kunder, live-fakturering, en monorepo hvor en dårlig merge koster penger? I QualityUnit er det det. Her er ti måneders bevissti, og reglene som gjør det fungerer.

TL;DR: I løpet av ti måneder gikk agentforfattet arbeid fra de første eksperimentelle anmodningene til 133 av 144 utviklingsanmodninger sammenslått i mai (92%) — verifisert av en tre-veis rettsmediskinsk revisjon av alle 1 409 slåtte anmodninger, ned til commit-trailers og en manuell inspeksjon av hver umarkert 2026-anmodning. Det skjedde ikke ved å “la AI kode”: det skjedde ved å legge til regler — en risikonivå-harness-config, en stegvis agentpipeline med avgrensede gjennomgangssløyfer, beskyttede stier og en menneske som holder hver merge. Reglene er produktet. Og med en kontekstmotor som mater agentene, koster det samme arbeidet nå ~30% mindre per oppgave (målt her ).

Hva det faktisk kreves

Ikke et verktøy. En pipeline, en policyfil og en port — kjørt av harnext .

Pipelinen: stegvise agenter, en menneske

Harnessen er harnext — QualityUnits åpen kildekode, leverandøruavhengig kodingsagent-harness. I vår produksjon monorepo kjører hver sak som kommer inn i pipelinen samme serie av CI-utløste agenttrinn, med fremgangen sporet gjennom etiketter en menneske kan lese med et blikk:

The production pipeline: tagger, triage, plan, implement, review with a bounded review-fix loop, an independent code-review agent, the human merge — plus doc-gardening keeping per-folder docs in sync after the merge

To detaljer betyr mer enn antall trinn. Sløyfen er avgrenset: defekter funnet i gjennomgang går tilbake til implementeringsstadiet et begrenset antall ganger — agenter konvergerer eller eskalerer til en menneske, de kastes ikke rundt. Ingenting starter blindt: før en linje skrives, må implementeringsagenten laste inn prosjektets konvensjoner og sende ut en bekreftelsesblokk som revisorer kan sjekke.

Policyfilen

Den andre halvdelen er en maskinlesbar policy: hver sti i depotet klassifisert i risikonivåer, hvert nivå med håndhevbare porter. CI leser det; merge-policy leser det; agenter blir informert om det. Det er ikke råd:

What a high-risk change must clear: required checks, two approvals, mandatory review agent, no self-merge, protected paths, architecture boundaries, screenshot evidence — and a mandatory context confirmation

Beskyttede stier — migrasjoner, betalinger, autentisering — er filer som ingen agent kan berøre. Arkitektoniske grenser håndheves, ikke foreslått. Ta bort disse reglene og en kodingsagent er en veldig rask generator av sannsynlige forpliktelser.

Ti måneder, ett diagram

Adopsjonstien, målt fra selve depotet.

Development pull requests merged per month, July 2025 to June 2026 — dark teal ran the full agent pipeline end-to-end, light teal is a developer pairing with the agent directly, gray is unmarked. The percentage is total agent involvement, reaching 92% in May 2026

Diagrammet teller, for hver måned, hvor mange sammenslåtte utviklings-anmodninger som bærer noen sterke agentsignaler — kodingsagentens footer, pipelinens etiketter, harness-tierkonvensjonen, commit medforfattere-trailers, agentcommit-poster eller pipelinens egen konto som forfatter. Dependency-bot-anmodninger (omtrent 8% av alle sammenslåinger) er helt utelukket fra diagrammet — de er verken menneske- eller kodingsagentarbeid. Vi reviderte signalene på tre uavhengige måter: PR-metadata for alle 1 409 sammenslåinger, commit-nivå-trailers over 5 000+ commits, og en manuell rettsmediskinsk gjennomgang av hver eneste umarkert anmodning fra 2026. Tre avlesninger betyr noe:

**Entusiasme falmer; infrastruktur holder. ** 2025-æraen var ad-hoc, personlig adopsjonen — og den svingde nøyaktig som personlige vaner gjør: 44% en måned, knapt 4% i november da de tyngste brukerne pauserte. Harnessen endret kurveformen: innen en måned etter at risikonivåene ankom, hoppet den målte andelen til 89%; med hele pipelinen nådde den 92% og ble der. Hvert lag av regler økte adopsjonen mer enn noen enkeltpersons entusiasme noensinne gjorde. De to skygger forteller samme historie innenfor agentandelen: det lyse båndet er utviklere som parrer seg med agenten for hånd; det mørke båndet — arbeid som kjørte hele pipelinen fra sak til revidert anmodning — vises bare når harnessen lander, og innen mai bærer det mesteparten av agentarbeidet.

**Vi inspiserte resten, anmodning for anmodning. ** For april–juni 2026 dekomponeres anmodningene uten noen markør til: dependency-bot-automatisering, agentarbeid hvis eneste attribusjon overlevde i commit-trailers, og en rest av sannsynligvis håndskrevne endringer — omtrent 11% av ikke-automatiseringssammenslåinger. Så den ærlige setningen er: ~89% av ekte utviklingssammenslåinger i siste kvartal viser verifiserbar agentinvolvering — og selv det er en nedre grense, siden AI-assistanse på redigeringsnivå etterlater ingen spor. Vi sendte også skeptiske revisorer på de tre svakeste månedene, anmodning for anmodning: novembers telling steg fra 1 til 3 bevist (pluss 3 mistenkt på stil), januars falt fra 10 til 8 etter å ha fanget to falske positive, og desember ble bekreftet nøyaktig — med en vri: etter kodevolum leverte desembers åtte merkede anmodninger 39% av den månedes innsatte linjer. Agenten skrev allerede de store funksjonene; tellingen kunne bare ikke se det. Adopsjonen er heller ikke ensartet: noen utviklere kjører nær-100% agentassistert, et par skriver fortsatt stort sett for hånd — pipelinen bærer en voksende andel uansett.

**Kvaliteten gikk ikke bakover. ** Det samme vinduet leverte Tier-3-endringer — LLM-leverandørintegrasjon, betalingsrelatert arbeid, en i18n-utvidelse — under porter som ble strengere i perioden, ikke løsere. Og da vi målte agentgjennomgangskonsekvens direkte, 21 av 22 uavhengige gjennomgangsagenter nådde samme konklusjon på samme anmodning.

Så hvem er forfatteren?

Den beste artikulasjonen av hvor dette etterlater mennesket kommer fra en ingeniøroppgave som studerte harness-drevet utvikling på et luftfartsgradig prosjekt:

Når en endring nådde menneskelig forfatter, var rutinekvalitetsproblemene løst — forfatterens gjennomgang konsentrerte seg om arkitektoniske og domenelevelsbeslutninger. Mergen var forfatterens beslutning. Forfatterskapet av den sammenslåtte koden hviler på menneskelig forfatter, uavhengig av hvilken aktør som produserte det første utkastet.

— Štefan Moravík, Design and Implementation of a Drone Mission Planning Module for Airport Lighting Inspection (thesis, 2026)

Det er avtalen i produksjon også: agenter gjør utkastene og rutinekvalitetsarbeidet; mennesket gjør arkitektur, domenejudgement og eier mergen.

Vanlige spørsmål

: Ja — men ikke uovervåket. I vår produksjon monorepo viser 92% av mai 2026s utviklingsanmodninger verifiserbar agentinvolvering, levert under porter som ble strengere i samme periode: risikonivåer, obligatoriske gjennomganger, beskyttede stier og en menneske som tar hver mergeavgjørelse. Reglene er det som gjør agentens hastighet til produksjonskvalitet.
: En agentharness er stillas som en kodingsagent arbeider innenfor: en maskinlesbar policyfil (risikonivåer, beskyttede stier, arkitektoniske grenser), en stegvis pipeline av spesialiserte agenter (tag, triage, plan, implement, review), avgrensede korreksjonssløyfer og obligatorisk kontekstlasting før koden skrives. harnext er QualityUnits åpen kildekode, leverandøruavhengig implementasjon.
: Målt fra selve depotet: 92% av utviklingsanmodningene som ble slått sammen i mai 2026 har sterke agentsignaler (attribusjonsfooter, pipelineetiketter, commit-trailers eller pipelinens egen konto som forfatter). Hvert tall er en nedre grense — attribusjon blir rutinemessig fjernet — og en manuell revisjon av hver umarkert 2026-anmodning fant at omtrent 11% av utviklingssammenslåingene sannsynligvis er helt håndskrevne.
: Hver sammenslått endring passerte en menneskelig gjennomgang og en menneskelig mergeavgjørelse. Pipelinens oppgave er å løse rutinekvalitetsproblemer før en menneske ser det, slik at menneskelig gjennomgang konsentrerer seg om arkitektur og domenejudgement — ikke for å fjerne mennesket.
: På tre uavhengige måter: PR-metadata for alle 1 409 slåtte anmodninger over ti måneder, commit-nivåanalyse av 5 000+ commits for medforfattere-trailers og agente-poster, og en manuell rettsmediskinsk inspeksjon av hver umarkert 2026-anmodning. Vi sendte deretter skeptiske revisorer på de tre svakeste månedene PR for PR — ett tall gikk opp, ett gikk ned, ett ble bekreftet nøyaktig. Alle korreksjoner gjenspeiles i det publiserte diagrammet.

Štefan Moravík
AI- og programvaringeniør

Bring an Agent Pipeline to Your Team

FlowHunt helps engineering teams design agent pipelines, risk-tier gates, and context workflows that raise code quality while cutting development costs.

Try FlowHunt Read the Context Engine Study

Utvikling av en fullstendig bedriftsapplikasjon med harnext-kodingsagenten