꾸준히 성장하기

[D+59] 교육 | 딥러닝: Object Detection 용어 정리 본문

KT 에이블스쿨 5기/교육

[D+59] 교육 | 딥러닝: Object Detection 용어 정리

data.dohii 2024. 4. 19. 23:33

오늘은 딥러닝 분야에서 매우 중요한 한 영역인 '오브젝트 디텍션(Object Detection)'에 대해 공부했습니다. 

이 영역은 컴퓨터 비전에서 물체를 인식하고 그 위치를 파악하는 기술로 다양한 실제 문제를 해결하는 데 사용되죠.


1. Bounding Box Regression: 하나의 object가 있는 최소 크기 박스

사실 이미지 속에서 '고양이'를 찾아낸다는 것은, 단순히 고양이가 '있다'는 것을 넘어서 그 정확한 '위치'를 알아내는 과정입니다. 

이 과정에서 Bounding Box Regression이 중요한 역할을 하는데요, 

이것은 고양이의 위치를 이미지 내의 좌표로 표시하고, 그 크기를 결정하는 것입니다. 

x, y 좌표로 시작점을 찾고, w와 h로 너비와 높이를 정의함으로써, 우리는 물체를 '상자' 안에 정확히 담아내죠.

 

2. Class Classification: 이미지 내의 다양한 객체들을 식별하고 분류하는 과정

한 장의 사진 속에는 수많은 이야기가 담겨 있을 수 있습니다. 

Class Classification은 이러한 이야기들 중에서 '무엇'이 있는지를 식별해내는 과정이에요. 

이는 객체 각각에 대한 정확한 '분류'를 가능하게 하며, 딥러닝 모델이 이해할 수 있는 '언어'로 물체를 설명해줍니다. 

예를 들면, 모델에게 사진 속에 고양이가 있다는 것을 알려주는 겁니다.

 

3. Confidence Score: Bounding Box 안에 object가 있는지 확신의 정도

Bounding Box가 잘 그려졌다고 해서 바로 끝나는 건 아닙니다. 

Confidence Score는 그 박스 안에 물체가 '정말로' 있는지, 그리고 얼마나 '확신'하는지를 수치로 나타내요. 

이 점수가 높다면 모델이 그 물체를 높은 확률로 식별했다는 뜻이죠.

 

4. IoU(Intersection over Union): 0과 1 사이의 값

정확도를 얘기할 때 IoU는 빼놓을 수 없는 지표입니다. 

이것은 예측된 Bounding Box와 실제 Bounding Box가 얼마나 잘 맞는지를 보여주는 지표에요. 

'교집합을 합집합으로 나눈 값'이 IoU라고 할 수 있겠죠. 이 값이 1에 가까울수록, 우리의 예측이 정확하다는 것을 의미합니다.

 

5. NMS(Non-Maximum Suppression): 특정 object라고 예측한 Bounding Box의 중복을 제거함

여러 개의 Bounding Box가 한 객체에 대해 겹쳐져 있다면, 이를 정리할 필요가 있어요. 

NMS는 이런 중복된 박스들 중 가장 정확도가 높은 박스 하나를 선택하는 과정입니다. 이는 예측의 정확성을 크게 향상시키죠.

*Confidence Score Threshold가 높을수록,  IoU Threshold가 낮을수록 중복 박스에 대한 판단히 엄밀(=객체 수가 줄어든다.)

 

6. Precision-Recall Curve: 평가지표 mean AP가 높을수록 GOOD

모델의 성능을 평가하는 또 다른 방법으로 Precision-Recall Curve가 있습니다. 

이 그래프는 모델이 얼마나 잘 예측을 하고 있는지 전반적인 '품질'을 보여줍니다. 

'mean AP(mean Average Precision)' 값이 높을수록 모델의 성능이 좋다고 볼 수 있겠죠.


이러한 용어들은 처음에는 다소 복잡하고 어려울 수 있지만, 한 단계씩 차근차근 알아가다 보면 객체 탐지의 세계가 훨씬 더 명확하고 흥미롭게 다가올 거예요. 오늘도 화이팅🔥

반응형