روش های deep RL به صورت کلی سعی می کنند که یک معیاری برای خوب بودن را بهبود ببخشند. این روند با تجربه کردن و آزمون و خطا انجام می شود. در حین این فرآیند، پاسخ های پیدا شده دارای تفاوت های ماهوی هستند. به گونه ای که نحوه حل مساله در طی یادگیری ممکن است به کل تغییر کند.
نوشته شده بوسیله:
کامران پناهی
کارشناسی ارشد هوش مصنوعی
علاقه مند به یادگیری عمیق