** Lập trình các tác nhân thông minh với học tập củng cố + phòng tập thể dục ** Học củng cố (RL) là một loại máy học cho phép một tác nhân học cách cư xử trong môi trường bằng cách tương tác với nó và nhận phần thưởng.Điều này trái ngược với việc học được giám sát, trong đó tác nhân được cung cấp một tập hợp dữ liệu được dán nhãn và học cách ánh xạ đầu vào cho đầu ra.Trong RL, tác nhân phải khám phá môi trường và học cách đạt được các mục tiêu của mình bằng cách dùng thử và lỗi. Phòng tập thể dục là một bộ công cụ để phát triển và đánh giá các thuật toán học tập củng cố .... Chi tiết tại: https://tricksmmo.com/threads/programming-intelligent-agents-with-reinforcement-learning-gym.6090/