بایاس واریانس | ویدیو | حل‌کردن بازی و یادگیری تقویتی عمیق

روش های deep RL به صورت کلی سعی می کنند که یک معیاری برای خوب بودن را بهبود ببخشند. این روند با تجربه کردن و آزمون و خطا انجام می شود. در حین این فرآیند، پاسخ های پیدا شده دارای تفاوت های ماهوی هستند. به گونه ای که نحوه حل مساله در طی یادگیری ممکن است به کل تغییر کند.