[딥러닝] CNN 구조를 한눈에!

728x90

이미지 인식에 특화된 딥러닝 모델

일반 DNN은 이미지의 공간 구조를 무시하고 1차원으로 펼침
→ 위치 정보 손실, 파라미터 수 증가

CNN은 위치, 모양, 패턴을 잘 포착함

3. CNN 핵심 구조

입력 → Convolution → ReLU → Pooling → Flatten → FC Layer → Softmax

- 이미지: 3차원 텐서 (W × H × C)

예: 32×32×3 (RGB 이미지)

- 필터: 3차원 (W × H × D), 깊이 D는 입력과 동일
→ 여러 개의 필터 사용 → 여러 개의 Feature map 생성

모델	특징
VGGNet	3×3 필터 반복 → 단순하고 깊은 구조
GoogLeNet	다양한 필터를 병렬 사용 (Inception module)
ResNet	Skip connection 사용 → gradient vanishing 방지
MobileNet	경량화된 구조, Depthwise Separable Conv 사용
Vision Transformer	CNN 대신 Attention 사용

728x90

[딥러닝] 딥러닝 모델의 초기화와 정규화 기법 (0)	2025.06.01
[딥러닝] 딥러닝 기반 시각 인식 모델: CNN 구조 및 활용 (0)	2025.05.17
[딥러닝] DNN 학습의 원리와 최적화 전략 (0)	2025.04.20
[딥러닝] 딥러닝 모델은 어떻게 학습되는가? – DNN & CNN 학습 구조 (1)	2025.04.20
[딥러닝] DNN 설계에 관한 핵심 내용들 (0)	2025.04.14