본문 바로가기

분류 전체보기9

SPP-Net 논문 리뷰 https://arxiv.org/abs/1406.4729Abstract기존 CNN은 고정된 크기(224X224)의 입력이미지가 요구되는데 이는 임의의 크기 이미지에 대한 인식 정확도가 낮아지게 됩니다. 해당 논문에서는 이를 해결하기 위해 “spatial pyramid pooling” 이라는 새로운 pooling 기법에 대해 소개합니다.SPP-net은 이미지의 크기/스케일에 관계없이 고정 길이의 표현을 생성하며 객체 변형에 강합니다. 이러한 장점을 통해 일반적으로 모든 CNN기반 이미지 분류 방법을 개선하였고, 객체 탐지 분야에서 뛰어납니다. SPP-net 은 전체 이미지에서 feature map을 구하는 연산을 한번만 계산하여 고정된 크기를 출력하며 이는 합성곱 계산을 반복하지 않아도 됩니다.이를 통해 .. 2025. 3. 25.
Attention 논문 리뷰 보호되어 있는 글 입니다. 2025. 3. 21.
Inception v2,3 논문 리뷰 1. Introduction2012년 AlexNet은 객체 탐지, 포즈 추정 등 다양한 컴퓨터 비전 task에 성공적으로 적용되었고, 이러한 성공은 더 좋은 성능의 CNN을 찾는 연구를 촉진하였다.2014년 VGGNet이나 GoogLeNet은 비슷하게 높은 결과를 보였다. 해당 연구의 관찰 결과 중 하나는 분류 성능의 향상이 다른 영역에서의 성능 향상으로 이어지는 것을 파악하였고, 이를 통해 구조적 향상이 다른 CV분야의 task에도 성능 향상으로 이어진다는 것을 알게 되었다. 또한, 네트워크 성능의 향상으로 CNN이 새로운 응용분야로 확장되었다.VGGNet은 구조적 단순성이라는 특징을 가졌지만, 이는 많은 계산이 필요하여 높은 비용을 요구한다. 반면 GoogLeNet의 Inception 구조는 메모리와.. 2025. 3. 19.
[딥러닝 논문 리뷰] VGG 딥러닝의 CNN모델의 구조 중 VGG에 대해 알아보겠습니다. 오늘 내용의 논문은 15년 ICRL학술대회에 게재된 Karen Simonyan ∗ & Andrew Zisserman의 VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION라는 논문을 참고하였습니다. 해당 논문은 네트워크 이가 대규모 이미지 인식에 정확도에 미치는 영향을 조사하였습니다. 이를 위해 매우 작은(3X3)의 convolution필터를 사용해 깊이가 증가하는 네트워크를 평가하며 이를 16-19개의 가중치의 레이어로 넣어 정확도가 개선되었음을 확인하였다. 이를 통해서 해당 논문에서는 두가지 최고 성능의 convnet 모델을 공개하였다.1. INTRODUCTION  convn.. 2024. 5. 16.