Score BLEU
Le score BLEU, ou Bilingual Evaluation Understudy, est une métrique essentielle pour évaluer la qualité des textes produits par les systèmes de traduction automatique. Développé par IBM en 2001, il a été une métrique pionnière qui a démontré une forte corrélation avec l’évaluation humaine de la qualité des traductions. Le score BLEU demeure une référence dans le domaine du traitement automatique des langues (TALN) et est largement utilisé pour évaluer les systèmes de traduction automatique.