** Lập trình các tác nhân thông minh với học tập củng cố ** Học củng cố (RL) là một loại học máy cho phép một tác nhân học cách cư xử trong môi trường bằng cách tương tác với nó và nhận phần thưởng hoặc hình phạt cho hành động của mình.Kiểu học tập này rất phù hợp cho các vấn đề trong đó môi trường không được biết đến đầy đủ hoặc mục tiêu là tối đa hóa phần thưởng dài hạn. Trong bài viết này, chúng tôi sẽ thảo luận về cách lập trình các tác nhân thông minh với học tập củng cố.Chúng tôi sẽ bắt đầu bằng cách giới thiệu các khái niệm cơ bản của RL, sau đó chúng tôi sẽ thảo luận về m .... Chi tiết tại: https://tricksmmo.com/threads/programming-intelligent-agents-with-reinforcement-learning.5930/