Некоторые основные отличия между AlexNet и VGGNet в области компьютерного зрения:
Размер фильтров. habr.com В AlexNet использовались более крупные фильтры, например 11×11 в первом свёрточном слое. habr.com VGGNet применяет небольшие фильтры размером 3×3 во всех свёрточных слоях, что позволяет более точно захватывать детали изображения. habr.com
Использование max‑pooling. habr.com VGGNet применяет max‑pooling слои с размером окна 2×2 и шагом 2 для уменьшения размерности признаковых карт и обеспечения некоторой степени инвариантности к смещениям. habr.com Этот подход схож с AlexNet, но VGGNet применяет pooling более регулярно, что способствует уменьшению размерности изображения. habr.com
Функция активации. habr.com VGGNet использует ReLU для активации, что позволяет сети обучаться быстрее и избегать проблем, связанных с затухающими градиентами. habr.com AlexNet использует Local Response Normalization (LRN). habr.com
Количество параметров. habr.com VGGNet имеет большое количество параметров из‑за использования многих свёрточных слоёв с 3×3 фильтрами. habr.com Это приводит к высокому потреблению ресурсов и долгому времени обучения, особенно на крупных наборах данных. habr.com AlexNet имеет около 60 миллионов параметров. habr.com
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.