Puntaje BLEU
El puntaje BLEU, o Evaluación Bilingüe de Referencia (Bilingual Evaluation Understudy), es una métrica fundamental para evaluar la calidad del texto producido por sistemas de traducción automática. Desarrollada por IBM en 2001, fue una métrica pionera que mostró una fuerte correlación con las evaluaciones humanas de la calidad de la traducción. El puntaje BLEU sigue siendo una piedra angular en el campo del procesamiento de lenguaje natural (PLN) y se utiliza ampliamente para evaluar sistemas de traducción automática.