AI Alignment

Reinforcement learning z lidské zpětné vazby (RLHF)
Reinforcement learning z lidské zpětné vazby (RLHF)

Reinforcement learning z lidské zpětné vazby (RLHF)

Reinforcement Learning z lidské zpětné vazby (RLHF) je technika strojového učení, která zapojuje lidský vstup k usměrnění trénovacího procesu algoritmů posilova...

2 min čtení
AI Reinforcement Learning +4