AI Evaluation

FlowHunt CLIツールキット：LLMを判定者としたオープンソースのフロー評価

FlowHuntは、高度なレポーティング機能を備えたAIフロー評価用のオープンソースCLIツールキットをリリースしました。自社プラットフォームを活用し、LLMを判定者として実装した高度なフロー評価システムの構築方法をご紹介します。...

Jul 27, 2025 3 分で読める

FlowHunt CLI Open Source +8

BLEUスコア

BLEUスコア（Bilingual Evaluation Understudy）は、機械翻訳システムによって生成されたテキストの品質を評価する際に重要な指標です。2001年にIBMによって開発され、人間による翻訳品質の評価と強い相関があることを示した先駆的な指標です。BLEUスコアは自然言語処理（NLP）分野の礎となっ...

May 30, 2025 1 分で読める

BLEU Machine Translation +3