AI Alignment

Forstærkningslæring fra menneskelig feedback (RLHF)
Forstærkningslæring fra menneskelig feedback (RLHF)

Forstærkningslæring fra menneskelig feedback (RLHF)

Forstærkningslæring fra menneskelig feedback (RLHF) er en maskinlæringsteknik, der integrerer menneskelig input for at guide træningsprocessen af forstærkningsl...

2 min læsning
AI Reinforcement Learning +4