
Förstärkningsinlärning från mänsklig feedback (RLHF)
Förstärkningsinlärning från mänsklig feedback (RLHF) är en maskininlärningsteknik som integrerar mänsklig input för att styra träningsprocessen av förstärknings...
2 min läsning
AI
Reinforcement Learning
+4