
Akışlar
Akışlar, FlowHunt'ta her şeyin beyni. İlk bileşeni yerleştirmekten web sitesine entegre etmeye, sohbet botlarını dağıtmaya ve hazır şablonlardan yararlanmaya ka...
FlowHunt’ın yeni açık kaynak CLI araç seti, LLM Hakemi ile kapsamlı akış değerlendirmesi sağlar, yapay zeka iş akışları için ayrıntılı raporlama ve otomatik kalite değerlendirmesi sunar.
FlowHunt CLI Araç Seti’nin – geliştiricilerin yapay zeka akışlarını değerlendirme ve test etme biçimini dönüştürmek için tasarlanmış yeni açık kaynak komut satırı aracımızın – yayınlandığını duyurmaktan heyecan duyuyoruz. Bu güçlü araç seti, ileri düzey raporlama ve yenilikçi “LLM Hakemi” uygulamamız ile birlikte kurumsal seviyede akış değerlendirme yeteneklerini açık kaynak topluluğuna getiriyor.
FlowHunt CLI Araç Seti, yapay zeka iş akışı testleri ve değerlendirmelerinde önemli bir adımı temsil ediyor. Şu anda GitHub üzerinden erişilebilen bu açık kaynak araç seti, geliştiricilere kapsamlı araçlar sunuyor:
Araç seti, şeffaflık ve topluluk odaklı geliştirme taahhüdümüzü yansıtıyor ve gelişmiş yapay zeka değerlendirme tekniklerini dünya genelindeki geliştiriciler için erişilebilir kılıyor.
CLI araç setimizin en yenilikçi özelliklerinden biri “LLM Hakemi” uygulamasıdır. Bu yaklaşım, yapay zekanın oluşturduğu yanıtların kalitesini ve doğruluğunu değerlendirmek için yapay zekadan yararlanır – yani AI’nın performansını yine AI’nın gelişmiş muhakeme yetenekleriyle yargılaması sağlanır.
Bizi farklı kılan yönümüz, değerlendirme akışını oluşturmak için bizzat FlowHunt’ı kullanmış olmamızdır. Bu meta-yaklaşım, platformumuzun gücünü ve esnekliğini gösterirken aynı zamanda sağlam bir değerlendirme sistemi sunar. LLM Hakemi akışı, birkaç birbiriyle bağlantılı bileşenden oluşur:
1. İstem Şablonu: Değerlendirme istemini belirli kriterlerle oluşturur
2. Yapılandırılmış Çıktı Üretici: Değerlendirmeyi bir LLM ile işler
3. Veri Ayrıştırıcı: Yapılandırılmış çıktıyı raporlama için biçimlendirir
4. Sohbet Çıktısı: Nihai değerlendirme sonuçlarını sunar
LLM Hakemi sistemimizin merkezinde, tutarlı ve güvenilir değerlendirmeler sağlayan özenle hazırlanmış bir istem yer alır. İşte kullandığımız temel istem şablonu:
You will be given an ANSWER and REFERENCE couple.
Your task is to provide the following:
1. a 'total_rating' scoring: how close is the ANSWER to the REFERENCE
2. a binary label 'correctness' which can be either 'correct' or 'incorrect', which defines if the ANSWER is correct or not
3. and 'reasoning', which describes the reason behind your choice of scoring and correctness/incorrectness of ANSWER
An ANSWER is correct when it is the same as the REFERENCE in all facts and details, even if worded differently. the ANSWER is incorrect if it contradicts the REFERENCE, changes or omits details. its ok if the ANSWER has more details comparing to REFERENCE.
'total rating' is a scale of 1 to 4, where 1 means that the ANSWER is not the same as REFERENCE at all, and 4 means that the ANSWER is the same as the REFERENCE in all facts and details even if worded differently.
Here is the scale you should use to build your answer:
1: The ANSWER is contradicts the REFERENCE completely, adds additional claims, changes or omits details
2: The ANSWER points to the same topic but the details are omitted or changed completely comparing to REFERENCE
3: The ANSWER's references are not completely correct, but the details are somewhat close to the details mentioned in the REFERENCE. its ok, if there are added details in ANSWER comparing to REFERENCES.
4: The ANSWER is the same as the REFERENCE in all facts and details, even if worded differently. its ok, if there are added details in ANSWER comparing to REFERENCES. if there are sources available in REFERENCE, its exactly the same as ANSWER and is for sure mentioned in ANSWER
REFERENCE
===
{target_response}
===
ANSWER
===
{actual_response}
===
Bu istem sayesinde LLM hakemimiz:
LLM Hakemi akışımız, FlowHunt’ın görsel akış oluşturucusu kullanılarak gelişmiş yapay zeka iş akışı tasarımını gösteriyor. Bileşenlerin birlikte nasıl çalıştığı aşağıda açıklanmıştır:
Akış, hem gerçek yanıtı hem de referans cevabı içeren değerlendirme isteğini alan bir Sohbet Girdisi bileşeniyle başlar.
İstem Şablonu bileşeni değerlendirme istemini dinamik olarak oluşturur:
{target_response}
yerine yerleştirir{actual_response}
yerine yerleştirirYapılandırılmış Çıktı Üretici, istemi seçili bir LLM ile işler ve yapılandırılmış çıktıyı üretir:
total_rating
: 1-4 arasında sayısal puancorrectness
: Doğru/yanlış ikili sınıflandırmareasoning
: Değerlendirmenin ayrıntılı açıklamasıVeri Ayrıştırıcı bileşeni yapılandırılmış çıktıyı okunabilir formata dönüştürür ve Sohbet Çıktısı bileşeni nihai değerlendirme sonuçlarını sunar.
LLM Hakemi sistemi, yapay zeka akış değerlendirmelerinde onu özellikle etkili kılan çeşitli gelişmiş yetenekler sunar:
Basit dize eşleştirmeden farklı olarak LLM hakemimiz şunları anlar:
4 puanlık değerlendirme ölçeği ayrıntılı analiz sunar:
Her değerlendirme ayrıntılı gerekçelendirme içerir, böylece:
CLI araç seti, akış performansı ile ilgili uygulanabilir içgörüler sağlayan ayrıntılı raporlar üretir:
Yapay zeka akışlarınızı profesyonel seviyede değerlendirmeye hazır mısınız? İşte başlama adımları:
Tek Satırlık Kurulum (Önerilen) macOS ve Linux için:
curl -sSL https://raw.githubusercontent.com/yasha-dev1/flowhunt-toolkit/main/install.sh | bash
Bu adım aşağıdakileri otomatik olarak yapar:
flowhunt
komutunu PATH’inize eklerManuel Kurulum:
# Depoyu klonlayın
git clone https://github.com/yasha-dev1/flowhunt-toolkit.git
cd flowhunt-toolkit
# pip ile kurulum
pip install -e .
Kurulumu Doğrulayın:
flowhunt --help
flowhunt --version
1. Kimlik Doğrulama Önce FlowHunt API’niz ile kimlik doğrulaması yapın:
flowhunt auth
2. Akışlarınızı Listeleyin
flowhunt flows list
3. Bir Akışı Değerlendirin Test verilerinizle bir CSV dosyası oluşturun:
flow_input,expected_output
"2+2 kaçtır?","4"
"Fransa'nın başkenti nedir?","Paris"
LLM Hakemi ile değerlendirme çalıştırın:
flowhunt evaluate your-flow-id path/to/test-data.csv --judge-flow-id your-judge-flow-id
4. Akışları Toplu Çalıştırma
flowhunt batch-run your-flow-id input.csv --output-dir results/
Değerlendirme sistemi kapsamlı analizler sunar:
flowhunt evaluate FLOW_ID TEST_DATA.csv \
--judge-flow-id JUDGE_FLOW_ID \
--output-dir eval_results/ \
--batch-size 10 \
--verbose
Özellikler arasında şunlar bulunur:
CLI araç seti, FlowHunt platformu ile sorunsuz entegre olur ve size şunları sağlar:
CLI araç setimizin yayınlanması yalnızca yeni bir araçtan fazlasını temsil ediyor – bu, yapay zeka geliştirmede bir vizyon:
Kalite Ölçülebilir: Gelişmiş değerlendirme teknikleriyle yapay zeka performansı nicelenebilir ve karşılaştırılabilir.
Testler Otomatikleşiyor: Kapsamlı test çerçeveleri manuel çabayı azaltır ve güvenilirliği artırır.
Şeffaflık Standart: Ayrıntılı gerekçelendirme ve raporlama ile yapay zeka davranışı anlaşılır ve hata ayıklanabilir olur.
Topluluk Yeniliği Yönlendirir: Açık kaynak araçlar işbirliğine dayalı gelişime ve bilgi paylaşımına olanak tanır.
FlowHunt CLI Araç Setini açık kaynak yaparak şunlara bağlılığımızı gösteriyoruz:
LLM Hakemi ile FlowHunt CLI Araç Seti, yapay zeka akış değerlendirme yetkinliklerinde önemli bir ilerlemeye işaret ediyor. Gelişmiş değerlendirme mantığını kapsamlı raporlama ve açık kaynak erişilebilirliği ile birleştirerek, geliştiricilere daha iyi, daha güvenilir yapay zeka sistemleri oluşturma gücü veriyoruz.
FlowHunt’ı FlowHunt akışlarını değerlendirmek için kullanmak, platformumuzun olgunluğunu ve esnekliğini gösterirken, daha geniş yapay zeka geliştirme topluluğu için güçlü bir araç sunar.
İster basit sohbet robotları, ister karmaşık çoklu ajan sistemleri geliştiriyor olun, FlowHunt CLI Araç Seti kalite, güvenilirlik ve sürekli iyileştirme için ihtiyacınız olan değerlendirme altyapısını sağlar.
Yapay zeka akış değerlendirmesini bir üst seviyeye taşımaya hazır mısınız? GitHub depomuzu ziyaret ederek FlowHunt CLI Araç Seti ile bugün başlayın ve LLM Hakemi’nin gücünü bizzat deneyimleyin.
Yapay zeka geliştirmenin geleceği burada – ve açık kaynak.
FlowHunt CLI Araç Seti, kapsamlı raporlama yeteneklerine sahip yapay zeka akışlarını değerlendirmek için açık kaynaklı bir komut satırı aracıdır. LLM Hakemi değerlendirmesi, doğru/yanlış sonuç analizi ve ayrıntılı performans metrikleri gibi özellikler içerir.
LLM Hakemi, diğer akışları değerlendirmek için FlowHunt içerisinde oluşturulmuş gelişmiş bir yapay zeka akışını kullanır. Gerçek yanıtları referans cevaplarla karşılaştırır, puanlama, doğruluk değerlendirmesi ve her değerlendirme için ayrıntılı gerekçelendirme sunar.
FlowHunt CLI Araç Seti açık kaynaktır ve GitHub'da https://github.com/yasha-dev1/flowhunt-toolkit adresinde mevcuttur. Kendi yapay zeka akış değerlendirmeleriniz için özgürce klonlayabilir, katkıda bulunabilir ve kullanabilirsiniz.
Araç seti, doğru/yanlış sonuç dökümü, LLM Hakemi değerlendirmeleriyle puanlama ve gerekçelendirme, performans metrikleri ve farklı test senaryolarında akış davranışının ayrıntılı analizi dahil olmak üzere kapsamlı raporlar üretir.
Evet! LLM Hakemi akışı, FlowHunt platformu kullanılarak oluşturulmuştur ve çeşitli değerlendirme senaryolarına uyarlanabilir. Kendi kullanım senaryolarınıza uygun şekilde istem şablonunu ve değerlendirme kriterlerini değiştirebilirsiniz.
Yasha, Python, Java ve makine öğrenimi konusunda uzmanlaşmış yetenekli bir yazılım geliştiricisidir. Yasha, yapay zeka, prompt mühendisliği ve sohbet botu geliştirme konularında teknik makaleler yazar.
FlowHunt platformu ile gelişmiş yapay zeka iş akışları oluşturun ve değerlendirin. Bugün başka akışları yargılayabilen akışlar oluşturmaya başlayın.
Akışlar, FlowHunt'ta her şeyin beyni. İlk bileşeni yerleştirmekten web sitesine entegre etmeye, sohbet botlarını dağıtmaya ve hazır şablonlardan yararlanmaya ka...
FlowHunt, kullanıcıların özel araçlar oluşturmasını sağlayan kodsuz bir platform ile zahmetsiz AI otomasyonu sunar. LiveAgent ve PostAffiliatePro'nun yaratıcısı...
FlowHunt, özel MCP Sunucuları, kurumsal müşteriler için SSO girişi, Odoo entegrasyonu, yeni AI modelleri (Grok 4 ve Kimi K2) ve uzak MCP sunucularına bağlanmak ...