Kodlama ajanları gerçekten üretim kalitesinde kurumsal yazılım üretebilir mi?

Evet — ancak gözetimsiz değil. Üretim monorepomuzda, Mayıs 2026'nın geliştirme pull isteklerinin %92'si doğrulanabilir ajan katılımı gösteriyor, giderek daha katı hale gelen kapılar altında gönderiliyor: risk seviyeleri, zorunlu incelemeler, korunan yollar ve her birleştirme kararını veren bir insan. Kurallar, ajan hızını üretim kalitesine dönüştüren şeydir.

Ajan taşıyıcısı nedir?

Ajan taşıyıcısı, kodlama ajanının içinde çalıştığı yapıdır: makine tarafından okunabilir bir politika dosyası (risk seviyeleri, korunan yollar, mimari sınırlar), uzmanlaşmış ajanların aşamalı bir hattı (etiket, sınıflandır, planla, uygula, incele), sınırlı düzeltme döngüleri ve herhangi bir kod yazılmadan önce zorunlu bağlam yükleme. harnext, QualityUnit'in açık kaynaklı, sağlayıcıdan bağımsız uygulamasıdır.

Kodunuzun ne kadarı gerçekten yapay zeka tarafından yazılıyor?

Depo kendisinden ölçüldüğünde: Mayıs 2026'da birleştirilen geliştirme PR'larının %92'si sabit ajan sinyalleri taşıyor (atıf altbilgileri, hat etiketleri, commit trailerları veya hatın kendi hesabı yazar olarak). Her sayı bir alt sınır — atıf rutin olarak çıkarılıyor — ve 2026'nın işaretlenmemiş her PR'ının manuel denetimi, geliştirme birleştirmelerinin yaklaşık %11'inin tamamen el yazısı olma olasılığı buldu.

İnsanlar hala kodu inceleyor mu?

Birleştirilen her değişiklik, bir insan incelemesini ve bir insan birleştirme kararını geçti. Hatın işi, bir insan bakmadan önce rutin kalite sorunlarını çözmektir, böylece insan incelemesi mimari ve alan yargısına yoğunlaşır — insanı kaldırmak için değil.

Bu benimseme numaraları nasıl doğrulandı?

Üç bağımsız yolla: on ay içinde birleştirilen tüm 1.409 PR için PR meta verileri, ortak yazar trailerları ve ajan e-postaları için 5.000+ commit'in commit seviyesi analizi ve işaretlenmemiş 2026'nın her PR'ının manuel adli muayenesi. Daha sonra en zayıf üç ayda şüpheci denetçiler gönderdik PR'ı PR'ye — bir sayı yükseldi, bir düştü, biri tamamen doğrulandı. Tüm düzeltmeler yayınlanan grafiğe yansıtıldı.

harnext Kodlama Aracı ile Tam Teşekküllü Bir Kurumsal Uygulama Geliştirme

On ay, 1.409 birleştirilmiş PR, üç adli denetim: aşamalı bir ajan hattının tek bir kurumsal kod tabanını %12’den %92’ye ajan katılımı geliştirmeye nasıl taşıdığını — kurallar, kapılar ve her birleştirmeyi tutan bir insan ile.

AI Agents Agentic Workflows Developer Productivity Engineering Culture

FlowHunt'ı Deneyin Bağlam Motoru Çalışmasını Okuyun

“Yapay zeka kodumuzun çoğunu yazıyor” bir startup sloganı gibi görünüyor. Kurumsal bir uygulama için — canlı müşteriler, canlı faturalandırma, kötü bir birleştirmenin para maliyeti olan bir monorepo — gerçek olabilir mi? QualityUnit’te öyle. İşte on aylık kanıt yolu ve bunu çalışan kurallar.

Özet: On ayda, ajan tarafından yazılan çalışma ilk deneysel PR’lardan Mayıs’ta birleştirilen 144 geliştirme PR’ından 133’üne (%92) — tüm 1.409 birleştirilen PR’ının üç yönlü adli denetimi ile doğrulanmış, commit trailerlarına ve işaretlenmemiş 2026’nın her PR’ının manuel incelemesine kadar — gitti. “Yapay zekaya kod yazdırmakla” olmadı: kurallar eklemeyle olmadı — bir risk seviyesi taşıyıcı yapılandırması, sınırlı inceleme döngüleri olan aşamalı bir ajan hattı, korunan yollar ve her birleştirmeyi tutan bir insan. Kurallar ürün. Ve ajanları besleyen bir bağlam motoru ile, aynı iş şimdi görev başına ~%30 daha az maliyeti (burada ölçüldü ).

Gerçekten neler gereklidir

Bir araç değil. Bir hat, bir politika dosyası ve bir kapı — harnext tarafından çalıştırılan.

Hat: aşamalı ajanlar, bir insan

Taşıyıcı harnext — QualityUnit’in açık kaynaklı, sağlayıcıdan bağımsız kodlama-ajan taşıyıcısı. Üretim monorepomuzda, hatta giren her sorun CI tarafından tetiklenen aynı ajan aşamaları dizisini çalıştırır, ilerlemesi bir insanın bir bakışta okuyabileceği etiketler aracılığıyla izlenir:

Üretim hattı: etiketçi, sınıflandırıcı, planlayıcı, uygulayıcı, sınırlı inceleme-düzeltme döngüsü ile incelemeci, bağımsız bir kod-inceleme ajanı, insan birleştirmesi — artı birleştirmeden sonra klasör başına belgeleri senkronize tutan belge bahçıvanlığı

İki ayrıntı aşama sayısından daha önemlidir. Döngü sınırlıdır: incelemede bulunan kusurlar uygulama aşamasına sınırlı sayıda geri gider — ajanlar birleşir veya bir insana yükseltilir, thrash yapmazlar. Hiçbir şey kör başlamaz: bir satır yazmadan önce, uygulayan ajan projenin kurallarını yüklemelidir ve incelemecilerin kontrol edebileceği bir onay bloğunu yayınlamalıdır.

Politika dosyası

Diğer yarısı makine tarafından okunabilir bir politikadır: repodaki her yol risk seviyelerine sınıflandırılır, her seviye uygulanabilir kapılarla. CI bunu okur; birleştirme politikası bunu okur; ajanlar bunu hakkında bilgilendirilir. Bu tavsiye değildir:

Yüksek riskli bir değişikliğin temizlemesi gereken şey: gerekli kontroller, iki onay, zorunlu inceleme ajanı, kendi birleştirmesi yok, korunan yollar, mimari sınırlar, ekran görüntüsü kanıtı — ve zorunlu bağlam onayı

Korunan yollar — göçler, ödemeler, kimlik doğrulama — hiçbir ajanın dokunmasına izin verilmeyen dosyalardır. Mimari sınırlar uygulanır, önerilmez. Bu kuralları alıp bir kodlama ajanı çok hızlı bir inandırıcı görünümlü sorumluluk üretecidir.

On ay, bir grafik

Depodan kendisi ölçülen benimseme izi.

Temmuz 2025'ten Haziran 2026'ya birleştirilen aylık geliştirme pull istekleri — koyu yeşil-mavi tam ajan hattını uçtan uca çalıştırdı, açık yeşil-mavi bir geliştirici doğrudan ajanla eşleşiyor, gri işaretlenmemiş. Yüzde toplam ajan katılımıdır, Mayıs 2026'da %92'ye ulaşır

Grafik, her ay için, herhangi bir sabit ajan sinyali taşıyan kaç birleştirilmiş geliştirme PR’ını sayar — kodlama ajanının altbilgisi, hatın etiketleri, taşıyıcı seviye kuralı, commit ortak yazar trailerları, ajan commit e-postaları veya hatın kendi hesabı yazar olarak. Bağımlılık-bot PR’ları (tüm birleştirmelerin yaklaşık %8’i) grafikten tamamen çıkarılır — ne insan ne de kodlama-ajan işidir. Sinyalleri üç bağımsız yolla denetledik: tüm 1.409 birleştirme için PR meta verileri, 5.000+ commit arasında commit seviyesi trailerları ve 2026’nın işaretlenmemiş her PR’ının manuel adli geçişi. Üç okuma önemlidir:

Heveslilik azalır; altyapı kalır. 2025 dönemi ad-hoc, kişisel benimsemeydi — ve kişisel alışkanlıklar gibi tam olarak salındı: bir ay %44, Kasım’da en ağır kullanıcılar duraklatıldığında zar zor %4. Taşıyıcı eğrinin şeklini değiştirdi: risk seviyeleri geldikten bir ay içinde, ölçülen pay %89’a sıçradı; tam hat ile %92’ye ulaştı ve orada kaldı. Her kurallar katmanı, herhangi bir bireyin hevesliliğinden daha fazla benimsemeyi artırdı. İki gölge, ajan payı içinde aynı hikayeyi anlatır: açık bant, geliştiricilerin elle ajanla eşleştirmesidir; koyu bant — sorunundan incelenen PR’ya tam hattı çalıştıran iş — yalnızca taşıyıcı iniş olduğunda görünür ve Mayıs’ta ajan çalışmasının çoğunu taşır.

Kalanını PR’ı PR’ye inceledik. Nisan–Haziran 2026 için, herhangi bir işaretçisi olmayan PR’lar şunlara ayrılır: bağımlılık-bot otomasyonu, tek atıfı commit trailerlerinde hayatta kalan ajan çalışması ve plausibly el yazısı değişiklikleri kalıntısı — otomasyonu olmayan birleştirmelerin yaklaşık %11’i. Yani dürüst cümle şudur: son çeyrekteki gerçek geliştirme birleştirmelerinin ~%89’u doğrulanabilir ajan katılımı gösteriyor — ve editor seviyesi yapay zeka yardımı hiçbir iz bırakmadığından bu bile bir alt sınırdır. Ayrıca üç en zayıf ayda şüpheci denetçiler gönderdik, PR’ı PR’ye: Kasım sayısı 1’den 3’e kanıtlanmış (artı stil hakkında 3 şüpheli) yükseldi, Ocak 10’dan 8’e düştü iki yanlış pozitif yakaladıktan sonra ve Aralık tam olarak doğrulandı — bir bükülme ile: kod hacmine göre, Aralık’ın sekiz işaretli PR’ı o ayın eklenen satırlarının %39’unu teslim etti. Ajan zaten büyük özellikleri yazıyordu; sayı sadece göremedi. Benimseme de eşit değildir: bazı geliştiriciler neredeyse %100 ajan yardımı ile çalışır, bir çift hala çoğunlukla elle yazar — hat her iki şekilde de artan bir payı taşır.

Kalite geriye gitmedi. Aynı pencere Tier-3 değişiklikleri gönderdi — LLM-sağlayıcı entegrasyonu, ödemeye bitişik çalışma, bir i18n genişlemesi — dönem boyunca daha gevşek değil, daha katı hale gelen kapılar altında. Ve ajan inceleme tutarlılığını doğrudan ölçtüğümüzde, 22 bağımsız inceleme ajanından 21’i aynı PR’da aynı karara ulaştı .

Peki yazar kim?

İnsan nereye bıraktığının en iyi açıklaması, taşıyıcı tarafından yönlendirilen geliştirmeyi havacılık derecesinde bir projede incelemiş bir mühendislik tezinden geliyor:

Bir değişiklik insan yazara ulaştığında, rutin kalite sorunları çözülmüştü — yazarın incelemesi mimari ve alan seviyesi kararlarına yoğunlaşıyordu. Birleştirme yazarın kararıydı. Birleştirilen kodun yazarlığı, hangi aktörün ilk taslağı ürettiğine bakılmaksızın insan yazara aittir.

— Štefan Moravík, Design and Implementation of a Drone Mission Planning Module for Airport Lighting Inspection (tez, 2026)

Bu üretimde de anlaşma: ajanlar taslaklamayı ve rutin kalite işini yapar; insan mimari, alan yargısı yapar ve birleştirmeyi sahiplenilir.

Sıkça sorulan sorular

: Evet — ancak gözetimsiz değil. Üretim monorepomuzda, Mayıs 2026'nın geliştirme pull isteklerinin %92'si doğrulanabilir ajan katılımı gösteriyor, giderek daha katı hale gelen kapılar altında gönderiliyor: risk seviyeleri, zorunlu incelemeler, korunan yollar ve her birleştirme kararını veren bir insan. Kurallar, ajan hızını üretim kalitesine dönüştüren şeydir.
: Ajan taşıyıcısı, kodlama ajanının içinde çalıştığı yapıdır: makine tarafından okunabilir bir politika dosyası (risk seviyeleri, korunan yollar, mimari sınırlar), uzmanlaşmış ajanların aşamalı bir hattı (etiket, sınıflandır, planla, uygula, incele), sınırlı düzeltme döngüleri ve herhangi bir kod yazılmadan önce zorunlu bağlam yükleme. harnext, QualityUnit'in açık kaynaklı, sağlayıcıdan bağımsız uygulamasıdır.
: Depo kendisinden ölçüldüğünde: Mayıs 2026'da birleştirilen geliştirme PR'larının %92'si sabit ajan sinyalleri taşıyor (atıf altbilgileri, hat etiketleri, commit trailerları veya hatın kendi hesabı yazar olarak). Her sayı bir alt sınır — atıf rutin olarak çıkarılıyor — ve 2026'nın işaretlenmemiş her PR'ının manuel denetimi, geliştirme birleştirmelerinin yaklaşık %11'inin tamamen el yazısı olma olasılığı buldu.
: Birleştirilen her değişiklik, bir insan incelemesini ve bir insan birleştirme kararını geçti. Hatın işi, bir insan bakmadan önce rutin kalite sorunlarını çözmektir, böylece insan incelemesi mimari ve alan yargısına yoğunlaşır — insanı kaldırmak için değil.
: Üç bağımsız yolla: on ay içinde birleştirilen tüm 1.409 PR için PR meta verileri, ortak yazar trailerları ve ajan e-postaları için 5.000+ commit'in commit seviyesi analizi ve işaretlenmemiş 2026'nın her PR'ının manuel adli muayenesi. Daha sonra en zayıf üç ayda şüpheci denetçiler gönderdik PR'ı PR'ye — bir sayı yükseldi, bir düştü, biri tamamen doğrulandı. Tüm düzeltmeler yayınlanan grafiğe yansıtıldı.

Štefan Moravík
Yapay Zeka & Yazılım Mühendisi

Ekibinize Bir Ajan Hattı Getirin

FlowHunt, mühendislik ekiplerinin ajan hatları, risk seviyesi kapıları ve bağlam iş akışlarını tasarlamasına yardımcı olarak kod kalitesini artırırken geliştirme maliyetlerini azaltır.

FlowHunt'ı Deneyin Bağlam Motoru Çalışmasını Okuyun

harnext Kodlama Aracı ile Tam Teşekküllü Bir Kurumsal Uygulama Geliştirme