حتما شنیده اید که به لایه های پولینگ از جمله max-pool انتقادات زیادی وارد شده است. یکی از مهمترین این انتقادات این است که این لایه در هر بار استفاده حداقل 75% از اطلاعات تصاویر را دور می ریزد. با اینکه این انتقاد کاملا وارد است اما لایه max-pool یک ویژگی بسیار پراهمیت دارد که معمولا نادیده گرفته می شود. یکی از مهمترین کارهایی که این لایه انجام می دهد این است که باعث می شود receptive field لایه های نهایی شبکه های کانولوشنی افزایش پیدا کند تا دید جامع تری داشته باشند. خوبی این لایه زمانی خودش را نشان می دهد که شبکه های عادی مبتنی بر transformer دارای receptive field بسیار محدودی هستند و روی داده های با سایز متوسط نمی توانند خوب کار کنند.
نوشته شده بوسیله:
کامران پناهی
کارشناسی ارشد هوش مصنوعی
علاقه مند به یادگیری عمیق