یادگیری عمیق گونهای از الگوریتمهای یادگیری ماشین است که وابسته به انجام تعداد زیادی محاسبه است. از زمان معرفی این دسته از الگوریتمهای یادگیری که با نام شبکههای عصبی نیز شناخته میشوند، سالها سپری شده است ولی رشد واقعی این دسته از روشها به سالهای اخیر و همزمان با پیشرفت رایانههای تک عملیات چند داده باز میگردد. این دسته از یادگیری به دلیل حجم بالای محاسبات در زمان آموزش و بازشناسی، برای سالها مورد استفاده قرار نمیگرفت تا اینکه در سال 2012 و با پیشرفت سخت افزارهای پردازشی، در رقابتی در حوزهی بینایی ماشین مورد استفاده قرار گرفت و بیسابقهترین نتایج را تا آن زمان بدست آورد.
در سالهای اخیر و با بهبود سخت افزارهای رایانهای، رایانههای تک عملیات چند داده پیشرفت چشمگیری داشتهاند. این پیشرفت سبب شده که واحدهای پردازشگر گرافیکی نیز افزایش سرعت و کارایی داشته باشند، به نحوی که توان امروز آنها چندین برابر سالهای نزدیک پیشین است. قدرت این رایانهها در انجام کارهای تکراری روی دادههای ماتریسی است. این عمل سبب میشود بتوانند یک عملیات مشخص را همزمان بر روی چند داده انجام دهند. با این کار، عملیاتی که با واحد پردازشگر مرکزی ممکن است ساعتها طول بکشد در کمتر از یک ثانیه قابلیت انجام خواهد داشت.
کلیتِ روشهای تحتِ نظارتِ یادگیریِ ژرف به این صورت است که شبکه، ورودی و خروجیِ مربوط به دادههای آموزش را دریافت میکند و با توجه به پارامترها و محاسباتی که در داخل شبکه وجود دارد، خروجیِ شبکه روی دادههای ورودیِ آموزش محاسبه میشود. با استفاده از یک تابع هزینه، خطایی که شبکه برای محاسبهی خروجی دارد، محاسبه میشود. در ادامه، با استفاده از روشهای بهینهسازی، تلاش میشود وزنها به گونهای تغییر کنند تا خطا بر روی دادگان آموزش کم شود.
اشاره شد که روشهای یادگیری عمیق در سالهای اخیر بسیار مورد اقبال قرار گرفتهاند. یکی از عوامل موثر در این زمینه، قدرت بالای این الگوریتمها در یادگیری و عمومیت بخشیدن نسبت به سایر روشهای دیگر یادگیری است. از سویی دیگر، این شبکهها میتوانند بر روی انواع دادهها با ویژگیهای متفاوت استفاده بشوند؛ برای مثال، اگر دادهها ماهیت زمانی داشته باشند و به صورت دنبالههای زمانی باشند، میتوان از شبکههای عصبی بازگشتی و شبکههای عصبی کوتاه مدت پایدار استفاده کرد. اگر دادهها ماهیت مکانی داشته باشند، میتوان از شبکههای عصبی کانولوشنی و در صورتی که دادهها ساختار یافته باشند (همانند دادههای پایگاه داده)، میتوان از شبکههای عصبی پرسپترون چندلایه استفاده کرد.
اصلیترین مزیت شبکههای عصبی نسبت به سایر روشهای یادگیری، قابلیت گسترش بودن آنها بدلیل وجود قابلیت سرهم کردن قطعات مشتق پذیر است؛ به همین سبب میتوان قطعات مختلف این شبکهها را به هم متصل کرد و تحت یک تابع خطا، فرآیند یادگیری را انجام داد؛ به این ترتیب، در هنگام یادگیری، بدلیل مشتق پذیریِ کامل شبکه، تمامیِ پارامترها را به کمک قاعدهی مشتق زنجیرهای میتوان یادگرفت و خطا را در سراسر شبکه رو به عقب پخش کرد. این برتری سبب میشود اگر دادهای دارای ساختار مکانی و زمانی باشد (همانند دادههای ویدیویی)، بتوان شبکههای کانولوشنی و شبکههای کوتاه مدت پایدار را با هم ادغام کرد. به عبارتی دیگر، شبکههای ژرف دارای این ویژگی هستند که برای کارهای متفاوت و با توجه به نوع دادههایشان، قابلیت طراحی شدن داشته باشند.
یکی از نیازهای اساسی دانشجویان برای فراگیری مباحث مربوط به یادگیری عمیق، مباحث مربوط به ریاضیات شبکه های عصبی است. به دلیل اینکه در یادگیری عمیق از بهینه سازی، جبر خطی، آمار و ریاضیات به صورت گسترده ای استفاده می شود، معمولا یادگرفتن شبکه های عصبی تا حدودی چالش برانگیز است و نیاز به پیشنیازهای متعددی دارد. از سویی، برای ارایه روشهای نوین و فهم روشهای نو ظهور، دانستن مباحث ذکر شده بسیار مورد نیاز است؛ علاوه بر موارد ذکر شده، بسیار پیش می آید که دانشجویان در فهم روابط ارایه شده و اصطلاحات به کار برده شده در مقالات به مشکل برخورد کنند.
در این دوره ریاضی محور، سعی شده است تا وارد جزییات نظری و ریاضیات مربوط به یادگیری عمیق شویم تا فراگیران این مجموعه بعد از این دوره، مقالات این حوزه را به خوبی متوجه شوند و روابط مقالات را بتوانند تفسیر کنند؛ همچنین، مقالات متعددی از یادگیری عمیق را در زمینه های بینایی ماشین، پردازش زبان طبیعی و ... بررسی کرده ایم و جزییات عملیات شبکه ها را شرح داده و عملکرد آنها را مقایسه کرده ایم.
افرادی که بر روی پایان نامه کارشناسی ارشد و دکتری کار می کنند، برای ارایه مقاله تلاش می کنند یا در صنعت از یادگیری عمیق استفاده می کنند، بیشترین نیاز را به این دوره خواهند داشت؛ با این حال، این دوره برای تمامی افراد قابل مطالعه است و پیشنیازی ندارد.
سردبیر بخش هوش مصنوعی وبسایت هستم. زمینه های فعالیت من عبارت است از یادگیری عمیق، یادگیری تقویتی، بازیابی اطلاعات و بینایی ماشین. به ریاضیات، جبر و بهینه سازی علاقه فراوانی دارم. تجربیات بسیاری در برنامه نویسی دارم و فریمورکهای مورد علاقه من عبارتند از django ،pytorch و tensorflow. از دانشگاه …