AI Evaluation

Alle Inhalte mit dem Tag AI Evaluation durchsuchen

Glossary

BLEU-Score

Der BLEU-Score (Bilingual Evaluation Understudy) ist eine entscheidende Kennzahl zur Bewertung der Qualität von Texten, die von maschinellen Übersetzungssystemen erzeugt werden. Entwickelt von IBM im Jahr 2001, war er ein wegweisendes Maß, das eine starke Korrelation mit menschlichen Bewertungen der Übersetzungsqualität zeigte. Der BLEU-Score ist ein Grundpfeiler im Bereich der Verarbeitung natürlicher Sprache (NLP) und wird umfassend zur Beurteilung von maschinellen Übersetzungssystemen eingesetzt.

3 min read

Weitere Tags

ai (467) automation (268) machine learning (209) flowhunt (108) nlp (74) ai tools (73) productivity (71) chatbots (57) components (55) deep learning (52) chatbot (46) ai agents (43) workflow (42) seo (38) content creation (34) llm (34) integration (33) no-code (32) data science (28) neural networks (26) content generation (25) generative ai (25) reasoning (24) image generation (23) slack (23) openai (22) computer vision (21) business intelligence (19) data (19) marketing (19) open source (19) prompt engineering (17) summarization (17) classification (16) content writing (16) education (16) python (16) slackbot (16) customer service (15) ethics (15) model evaluation (14) natural language processing (14) rag (14) text-to-image (14) transparency (14) creative writing (13) ai chatbot (12) artificial intelligence (12) business (12) compliance (12) content marketing (12) creative ai (12) data analysis (12) digital marketing (12) hubspot (12) sales (12) text generation (12) llms (11) ocr (11) predictive analytics (11) regression (11) text analysis (11) workflow automation (11) ai agent (10) crm (10) customer support (10) speech recognition (10) knowledge management (9) personalization (9) problem-solving (9) readability (9) ai automation (8) ai reasoning (8) collaboration (8) information retrieval (8) lead generation (8) research (8) search (8) team collaboration (8) transfer learning (8) ai comparison (7) ai ethics (7) ai models (7) anthropic (7) data processing (7) google sheets (7) large language models (7) reinforcement learning (7) risk management (7) robotics (7) semantic search (7) social media (7) stable diffusion (7) structured data (7) accessibility (6) agi (6) ai integration (6) algorithms (6) anomaly detection (6) bias (6)