قایم موشک - یادگیری عمیق تقویتی
در ابتدا hider ها یاد می گیرند که همکاری کنند و پنهان شوند. در ادامه seeker ها یاد می گیرند که راه حل مناسب پیدا کنند. در ادامه hider ها مجدد راه حل پیدا می کنند و رمپ را این بار ابتدا پنهان می کنند بعد دیوار ها را می بندند.
https://biasvariance.ir
نظرات