Czy agenci kodowania mogą naprawdę tworzyć oprogramowanie klasy produkcyjnej dla przedsiębiorstw?

Tak — ale nie bez nadzoru. W naszym produkcyjnym monorepo, 92% pull requestów rozwojowych z maja 2026 wykazuje weryfikowalne zaangażowanie agenta, dostarczone w ramach bramek, które stały się bardziej rygorystyczne w tym samym okresie: poziomy ryzyka, obowiązkowe przeglądy, chronione ścieżki i człowiek podejmujący każdą decyzję dotyczącą scalenia. Reguły to to, co zmienia szybkość agenta w jakość produkcyjną.

Co to jest uprząż agenta?

Uprząż agenta to rusztowanie, w którym pracuje agent kodowania: plik polityki czytelny dla maszyn (poziomy ryzyka, chronione ścieżki, granice architektoniczne), potokowa linia wyspecjalizowanych agentów (tag, triage, plan, implementacja, przegląd), ograniczone pętle korekcji i obowiązkowe ładowanie kontekstu przed napisaniem jakiegokolwiek kodu. harnext to implementacja open-source firmy QualityUnit, niezależna od dostawcy.

Ile twojego kodu jest faktycznie napisane przez AI?

Mierzone z samego repozytorium: 92% pull requestów rozwojowych scalonych w maju 2026 nosi twarde sygnały agenta (stopki przypisania, etykiety potoku, przyczepki commit, lub własne konto potoku jako autor). Każda liczba to dolna granica — przypisanie jest rutynowo usuwane — a ręczna audyt każdego nieoznaczonego PR-u z 2026 roku wykazał, że około 11% scalonych zmian rozwojowych to prawdopodobnie w pełni napisane ręcznie.

Czy ludzie wciąż przeglądają kod?

Każda scalona zmiana przeszła przegląd człowieka i decyzję człowieka dotyczącą scalenia. Zadaniem potoku jest rozwiązanie rutynowych problemów jakości przed przejrzeniem przez człowieka, dzięki czemu przegląd człowieka koncentruje się na architekturze i osądzie domenowym — nie aby usunąć człowieka.

Jak te liczby adopcji zostały zweryfikowane?

Trzema niezależnymi sposobami: metadane PR dla wszystkich 1409 scalonych PR-ów przez dziesięć miesięcy, analiza na poziomie commit 5000+ commitów dla przyczepek współautora i wiadomości e-mail agenta, oraz ręczna inspekcja kryminalistyczna każdego nieoznaczonego PR-u z 2026 roku. Następnie wysłaliśmy skeptycznych audytorów w trzech najsłabszych miesiącach PR po PR — jedna liczba wzrosła, jedna spadła, jedna została potwierdzona dokładnie. Wszystkie poprawki są odzwierciedlone na opublikowanym wykresie.

Opracowanie w pełni funkcjonalnej aplikacji enterprise z agentem kodowania harnext

Dziesięć miesięcy, 1409 połączonych PR-ów, trzy audyty kryminalistyczne: jak potokowa linia agentów przesunęła jeden repozytorium korporacyjne z 12% na 92% rozwoju zaangażowanego przez agenta — z regułami, bramkami i człowiekiem podejmującym każdą decyzję dotyczącą scalenia.

AI Agents Agentic Workflows Developer Productivity Engineering Culture

Spróbuj FlowHunt Przeczytaj studium Context Engine

“AI pisze większość naszego kodu” brzmi jak slogan startupowy. Czy to może być realne dla aplikacji enterprise — żywi klienci, żywe rozliczenia, monorepo, gdzie złe scalenie kosztuje pieniądze? W QualityUnit tak jest. Oto dziesięciomiesięczny ślad dowodów i reguły, które to sprawiają.

TL;DR: W ciągu dziesięciu miesięcy praca autorstwa agenta przeszła od pierwszych eksperymentalnych PR-ów do 133 z 144 pull requestów rozwojowych scalonych w maju (92%) — zweryfikowane trzystronnym audytem kryminalistycznym wszystkich 1409 scalonych PR-ów, aż do przyczepek commit i ręcznej inspekcji każdego nieoznaczonego PR-u z 2026 roku. Nie stało się to przez “pozwolenie AI kodować”: stało się to przez dodanie reguł — konfiguracji uprząży poziomu ryzyka, potokowej linii wyspecjalizowanych agentów z ograniczonymi pętlami przeglądu, chronionymi ścieżkami i człowiekiem podejmującym każde scalenie. Reguły to produkt. A dzięki silnikowi kontekstowemu zasilającemu agentów, ta sama praca kosztuje teraz ~30% mniej na zadanie (mierzone tutaj ).

Co to faktycznie wymaga

Nie narzędzie. Potok, plik polityki i bramka — uruchamiane przez harnext .

Potok: agenci etapowi, jeden człowiek

Uprząż to harnext — open-source’owa, niezależna od dostawcy uprząż agenta kodowania firmy QualityUnit. W naszym produkcyjnym monorepo, każdy problem, który wchodzi do potoku, przebiega tę samą sekwencję etapów agenta wyzwalanego przez CI, jego postęp śledzony poprzez etykiety, które człowiek może przeczytać na pierwszy rzut oka:

Potok produkcyjny: tagger, triage, plan, implement, review z ograniczoną pętlą review-fix, niezależnym agentem przeglądu kodu, scaleniem człowieka — plus pielęgnacja dokumentacji utrzymująca dokumenty per-folder w synchronizacji po scaleniu

Dwa szczegóły są ważniejsze niż liczba etapów. Pętla jest ograniczona: wady znalezione w przeglądzie wracają do etapu implementacji ograniczoną liczbę razy — agenci zbiegają się lub eskalują do człowieka, nie kłócą się. Nic nie zaczyna się ślepo: przed napisaniem linii, implementujący agent musi załadować konwencje projektu i wyemitować blok potwierdzenia, który recenzenci mogą sprawdzić.

Plik polityki

Druga połowa to czytelna dla maszyn polityka: każda ścieżka w repo sklasyfikowana na poziomy ryzyka, każdy poziom z egzekwowalnymi bramkami. CI ją czyta; polityka scalenia ją czyta; agenci są informowani o niej. To nie rada:

Co zmiana wysokiego ryzyka musi przejść: wymagane kontrole, dwie aprobaty, obowiązkowy agent przeglądu, brak samoscalenia, chronione ścieżki, granice architektury, dowód zrzutu ekranu — i obowiązkowe potwierdzenie kontekstu

Chronione ścieżki — migracje, płatności, auth — to pliki, których żaden agent nie może dotykać. Granice architektoniczne są wymuszane, nie sugerowane. Weź te reguły i agent kodowania to bardzo szybki generator wiarygodnie wyglądających zobowiązań.

Dziesięć miesięcy, jeden wykres

Ślad adopcji, mierzony z samego repozytorium.

Pull requesty rozwojowe scalane na miesiąc, lipiec 2025 do czerwca 2026 — ciemny turkus uruchomił pełną linię agenta end-to-end, jasny turkus to developer parujący z agentem bezpośrednio, szary jest nieoznaczony. Procent to całkowite zaangażowanie agenta, osiągające 92% w maju 2026

Wykres liczy, dla każdego miesiąca, ile scalonych pull requestów rozwojowych nosi jakikolwiek twardy sygnał agenta — stopkę agenta kodowania, etykiety potoku, konwencję poziomu uprząży, przyczepki współautora commit, wiadomości e-mail agenta, lub własne konto potoku jako autor. PR-y dependency-bota (około 8% wszystkich scaleń) są całkowicie wykluczone z wykresu — to ani praca człowieka, ani agenta kodowania. Sygnały audytowaliśmy trzema niezależnymi sposobami: metadane PR dla wszystkich 1409 scaleń, przyczepki na poziomie commit w 5000+ commitach, i ręczna kryminalistyczna przesiewka każdego nieoznaczonego PR-u z 2026 roku. Trzy odczyty są ważne:

Entuzjazm zanika; infrastruktura pozostaje. Era 2025 była ad-hoc, osobistą adopcją — i oscylowała dokładnie jak osobiste nawyki: 44% jeden miesiąc, ledwie 4% w listopadzie, gdy najciężsi użytkownicy się zatrzymali. Uprząż zmieniła kształt krzywej: w ciągu miesiąca od przybycia poziomów ryzyka, zmierzona część wzrosła do 89%; z pełnym potokiem osiągnęła 92% i tam pozostała. Każda warstwa reguł zwiększyła adopcję bardziej niż entuzjazm jakiegokolwiek indywiduum. Dwa odcienie opowiadają tę samą historię wewnątrz udziału agenta: jasny pas to developerzy parujący z agentem ręcznie; ciemny pas — praca, która ran pełny potok od problemu do przejrzanego PR — pojawia się tylko gdy uprząż ląduje, i do maja nosi większość pracy agenta.

Przeanalizowaliśmy resztę, PR po PR. W przypadku kwietnia–czerwca 2026, PR-y bez jakiegokolwiek markera rozkładają się na: automatyzacja dependency-bota, pracę agenta, której jedynym przypisaniem przetrwało w przyczepkach commit, i pozostałość prawdopodobnie napisanych ręcznie zmian — około 11% nieautomatyzacyjnych scaleń. Więc uczciwe zdanie to: ~89% rzeczywistych scaleń rozwojowych w ostatnim kwartale wykazuje weryfikowalne zaangażowanie agenta — i nawet to jest dolną granicą, ponieważ pomoc AI na poziomie edytora nie pozostawia śladu. Wysłaliśmy również skeptycznych audytorów w trzech najsłabszych miesiącach, PR po PR: liczba listopada wzrosła z 1 do 3 udowodnionych (plus 3 podejrzane w stylu), liczba stycznia spadła z 10 do 8 po złapaniu dwóch fałszywych pozytywów, a grudzień został potwierdzony dokładnie — z jednym zwrotem: według objętości kodu, osiem zaznaczonych PR-ów grudnia dostarczyło 39% wstawionych linii tego miesiąca. Agent już pisał duże funkcje; liczba po prostu nie mogła tego zobaczyć. Adopcja też nie jest jednolita: niektórzy developerzy działają blisko 100% wspomaganego agentem, kilka wciąż głównie pisze ręcznie — potok niesie rosnący udział w każdym razie.

Jakość się nie pogorszyła. To samo okno dostarczyło zmiany Tier-3 — integrację dostawcy LLM, pracę przylegającą do płatności, rozszerzenie i18n — w ramach bramek, które stały się bardziej rygorystyczne w tym okresie, nie luźniejsze. A gdy zmierzyliśmy spójność przeglądu agenta bezpośrednio, 21 z 22 niezależnych agentów przeglądu osiągnęło ten sam werdykt na tym samym PR.

Więc kto jest autorem?

Najlepsze sformułowanie tego, gdzie to zostawia człowieka, pochodzi z pracy inżynierskiej, która badała rozwój napędzany uprzążą w projekcie klasy lotniczej:

Do czasu, gdy zmiana dotarła do autora człowieka, rutynowe problemy jakości zostały rozwiązane — przegląd autora koncentrował się na decyzjach architektonicznych i domenowych. Scalenie było decyzją autora. Autorstwem scalonego kodu jest autor człowieka, niezależnie od tego, który aktor wyprodukował pierwotny szkic.

— Štefan Moravík, Design and Implementation of a Drone Mission Planning Module for Airport Lighting Inspection (thesis, 2026)

To jest umowa w produkcji: agenci zajmują się szkicowaniem i rutynową pracą jakości; człowiek zajmuje się architekturą, osądem domenowym i jest właścicielem scalenia.

Najczęściej zadawane pytania

: Tak — ale nie bez nadzoru. W naszym produkcyjnym monorepo, 92% pull requestów rozwojowych z maja 2026 wykazuje weryfikowalne zaangażowanie agenta, dostarczone w ramach bramek, które stały się bardziej rygorystyczne w tym samym okresie: poziomy ryzyka, obowiązkowe przeglądy, chronione ścieżki i człowiek podejmujący każdą decyzję dotyczącą scalenia. Reguły to to, co zmienia szybkość agenta w jakość produkcyjną.
: Uprząż agenta to rusztowanie, w którym pracuje agent kodowania: plik polityki czytelny dla maszyn (poziomy ryzyka, chronione ścieżki, granice architektoniczne), potokowa linia wyspecjalizowanych agentów (tag, triage, plan, implementacja, przegląd), ograniczone pętle korekcji i obowiązkowe ładowanie kontekstu przed napisaniem jakiegokolwiek kodu. harnext to implementacja open-source firmy QualityUnit, niezależna od dostawcy.
: Mierzone z samego repozytorium: 92% pull requestów rozwojowych scalonych w maju 2026 nosi twarde sygnały agenta (stopki przypisania, etykiety potoku, przyczepki commit, lub własne konto potoku jako autor). Każda liczba to dolna granica — przypisanie jest rutynowo usuwane — a ręczna audyt każdego nieoznaczonego PR-u z 2026 roku wykazał, że około 11% scalonych zmian rozwojowych to prawdopodobnie w pełni napisane ręcznie.
: Każda scalona zmiana przeszła przegląd człowieka i decyzję człowieka dotyczącą scalenia. Zadaniem potoku jest rozwiązanie rutynowych problemów jakości przed przejrzeniem przez człowieka, dzięki czemu przegląd człowieka koncentruje się na architekturze i osądzie domenowym — nie aby usunąć człowieka.
: Trzema niezależnymi sposobami: metadane PR dla wszystkich 1409 scalonych PR-ów przez dziesięć miesięcy, analiza na poziomie commit 5000+ commitów dla przyczepek współautora i wiadomości e-mail agenta, oraz ręczna inspekcja kryminalistyczna każdego nieoznaczonego PR-u z 2026 roku. Następnie wysłaliśmy skeptycznych audytorów w trzech najsłabszych miesiącach PR po PR — jedna liczba wzrosła, jedna spadła, jedna została potwierdzona dokładnie. Wszystkie poprawki są odzwierciedlone na opublikowanym wykresie.

Štefan Moravík
Inżynier AI i Oprogramowania

Wprowadź linię agenta do swojego zespołu

FlowHunt pomaga zespołom inżynierskim projektować linie agentów, bramki ryzyka i przepływy pracy kontekstowe, które podnoszą jakość kodu, jednocześnie zmniejszając koszty rozwoju.

Spróbuj FlowHunt Przeczytaj studium Context Engine

Opracowanie w pełni funkcjonalnej aplikacji enterprise z agentem kodowania harnext