“Yapay zeka kodumuzun çoğunu yazıyor” bir startup sloganı gibi görünüyor. Kurumsal bir uygulama için — canlı müşteriler, canlı faturalandırma, kötü bir birleştirmenin para maliyeti olan bir monorepo — gerçek olabilir mi? QualityUnit’te öyle. İşte on aylık kanıt yolu ve bunu çalışan kurallar.
Özet: On ayda, ajan tarafından yazılan çalışma ilk deneysel PR’lardan Mayıs’ta birleştirilen 144 geliştirme PR’ından 133’üne (%92) — tüm 1.409 birleştirilen PR’ının üç yönlü adli denetimi ile doğrulanmış, commit trailerlarına ve işaretlenmemiş 2026’nın her PR’ının manuel incelemesine kadar — gitti. “Yapay zekaya kod yazdırmakla” olmadı: kurallar eklemeyle olmadı — bir risk seviyesi taşıyıcı yapılandırması, sınırlı inceleme döngüleri olan aşamalı bir ajan hattı, korunan yollar ve her birleştirmeyi tutan bir insan. Kurallar ürün. Ve ajanları besleyen bir bağlam motoru ile, aynı iş şimdi görev başına ~%30 daha az maliyeti (burada ölçüldü ).
Gerçekten neler gereklidir
Bir araç değil. Bir hat, bir politika dosyası ve bir kapı — harnext tarafından çalıştırılan.
Hat: aşamalı ajanlar, bir insan
Taşıyıcı harnext — QualityUnit’in açık kaynaklı, sağlayıcıdan bağımsız kodlama-ajan taşıyıcısı. Üretim monorepomuzda, hatta giren her sorun CI tarafından tetiklenen aynı ajan aşamaları dizisini çalıştırır, ilerlemesi bir insanın bir bakışta okuyabileceği etiketler aracılığıyla izlenir:
İki ayrıntı aşama sayısından daha önemlidir. Döngü sınırlıdır: incelemede bulunan kusurlar uygulama aşamasına sınırlı sayıda geri gider — ajanlar birleşir veya bir insana yükseltilir, thrash yapmazlar. Hiçbir şey kör başlamaz: bir satır yazmadan önce, uygulayan ajan projenin kurallarını yüklemelidir ve incelemecilerin kontrol edebileceği bir onay bloğunu yayınlamalıdır.
Politika dosyası
Diğer yarısı makine tarafından okunabilir bir politikadır: repodaki her yol risk seviyelerine sınıflandırılır, her seviye uygulanabilir kapılarla. CI bunu okur; birleştirme politikası bunu okur; ajanlar bunu hakkında bilgilendirilir. Bu tavsiye değildir:
Korunan yollar — göçler, ödemeler, kimlik doğrulama — hiçbir ajanın dokunmasına izin verilmeyen dosyalardır. Mimari sınırlar uygulanır, önerilmez. Bu kuralları alıp bir kodlama ajanı çok hızlı bir inandırıcı görünümlü sorumluluk üretecidir.
On ay, bir grafik
Depodan kendisi ölçülen benimseme izi.
Grafik, her ay için, herhangi bir sabit ajan sinyali taşıyan kaç birleştirilmiş geliştirme PR’ını sayar — kodlama ajanının altbilgisi, hatın etiketleri, taşıyıcı seviye kuralı, commit ortak yazar trailerları, ajan commit e-postaları veya hatın kendi hesabı yazar olarak. Bağımlılık-bot PR’ları (tüm birleştirmelerin yaklaşık %8’i) grafikten tamamen çıkarılır — ne insan ne de kodlama-ajan işidir. Sinyalleri üç bağımsız yolla denetledik: tüm 1.409 birleştirme için PR meta verileri, 5.000+ commit arasında commit seviyesi trailerları ve 2026’nın işaretlenmemiş her PR’ının manuel adli geçişi. Üç okuma önemlidir:
Heveslilik azalır; altyapı kalır. 2025 dönemi ad-hoc, kişisel benimsemeydi — ve kişisel alışkanlıklar gibi tam olarak salındı: bir ay %44, Kasım’da en ağır kullanıcılar duraklatıldığında zar zor %4. Taşıyıcı eğrinin şeklini değiştirdi: risk seviyeleri geldikten bir ay içinde, ölçülen pay %89’a sıçradı; tam hat ile %92’ye ulaştı ve orada kaldı. Her kurallar katmanı, herhangi bir bireyin hevesliliğinden daha fazla benimsemeyi artırdı. İki gölge, ajan payı içinde aynı hikayeyi anlatır: açık bant, geliştiricilerin elle ajanla eşleştirmesidir; koyu bant — sorunundan incelenen PR’ya tam hattı çalıştıran iş — yalnızca taşıyıcı iniş olduğunda görünür ve Mayıs’ta ajan çalışmasının çoğunu taşır.
Kalanını PR’ı PR’ye inceledik. Nisan–Haziran 2026 için, herhangi bir işaretçisi olmayan PR’lar şunlara ayrılır: bağımlılık-bot otomasyonu, tek atıfı commit trailerlerinde hayatta kalan ajan çalışması ve plausibly el yazısı değişiklikleri kalıntısı — otomasyonu olmayan birleştirmelerin yaklaşık %11’i. Yani dürüst cümle şudur: son çeyrekteki gerçek geliştirme birleştirmelerinin ~%89’u doğrulanabilir ajan katılımı gösteriyor — ve editor seviyesi yapay zeka yardımı hiçbir iz bırakmadığından bu bile bir alt sınırdır. Ayrıca üç en zayıf ayda şüpheci denetçiler gönderdik, PR’ı PR’ye: Kasım sayısı 1’den 3’e kanıtlanmış (artı stil hakkında 3 şüpheli) yükseldi, Ocak 10’dan 8’e düştü iki yanlış pozitif yakaladıktan sonra ve Aralık tam olarak doğrulandı — bir bükülme ile: kod hacmine göre, Aralık’ın sekiz işaretli PR’ı o ayın eklenen satırlarının %39’unu teslim etti. Ajan zaten büyük özellikleri yazıyordu; sayı sadece göremedi. Benimseme de eşit değildir: bazı geliştiriciler neredeyse %100 ajan yardımı ile çalışır, bir çift hala çoğunlukla elle yazar — hat her iki şekilde de artan bir payı taşır.
Kalite geriye gitmedi. Aynı pencere Tier-3 değişiklikleri gönderdi — LLM-sağlayıcı entegrasyonu, ödemeye bitişik çalışma, bir i18n genişlemesi — dönem boyunca daha gevşek değil, daha katı hale gelen kapılar altında. Ve ajan inceleme tutarlılığını doğrudan ölçtüğümüzde, 22 bağımsız inceleme ajanından 21’i aynı PR’da aynı karara ulaştı .
Peki yazar kim?
İnsan nereye bıraktığının en iyi açıklaması, taşıyıcı tarafından yönlendirilen geliştirmeyi havacılık derecesinde bir projede incelemiş bir mühendislik tezinden geliyor:
Bir değişiklik insan yazara ulaştığında, rutin kalite sorunları çözülmüştü — yazarın incelemesi mimari ve alan seviyesi kararlarına yoğunlaşıyordu. Birleştirme yazarın kararıydı. Birleştirilen kodun yazarlığı, hangi aktörün ilk taslağı ürettiğine bakılmaksızın insan yazara aittir.
— Štefan Moravík, Design and Implementation of a Drone Mission Planning Module for Airport Lighting Inspection (tez, 2026)
Bu üretimde de anlaşma: ajanlar taslaklamayı ve rutin kalite işini yapar; insan mimari, alan yargısı yapar ve birleştirmeyi sahiplenilir.

