Intro
Ground-truth는 기상학에서 유래된 용어로 어느한 장소에서 수집된 정보를 의미한다. Ground-truth는 보통 '지상 실측 정보'로 해석되며 인공위성과 같이 지구에서 멀리 떨어져서 지구를 관찰하였을 때 지구의 전체적인 관점을 보는 것에는 넓은 시야를 가질 수 있지만 실제 지면의 구조를 세밀하게 보는 것은 빛이 구름이나 대기를 통과하게 되면서 실제 모습이 왜곡되어 제대로 파악하는 것은 어렵다.
이러한 상황에세 지상 정보를 직접 측정한다면 보다 정확한 정보를 얻을 수 있고, 이러한 정보에 인공위성에서 관측된 데이터를 참조하여 사용한다면 좀 더 정확한 데이터를 얻을 수 있게 된다.
ML에서의 Ground-Truth 예시
기계학습의 관점에서 보았을때 Ground-truth는 학습하고자 하는 데이터의 원본 혹은 실제 값을 표현할때 사용된다.
이미지에서 객체 감지를 목표로 하는 알고리즘의 예를 보자.
위 그림에서 맨 오른쪽에 있는 그림이 Ground-truth에 해당하여 실제 이미지에서 해당 객체의 정보를 나타낸 것이다. 초록색은 자전거이고 분홍색은 자전거를 모는 사람임을 유추해볼 수 있다. 왼쪽에 있는 사진들은 사진에서 객체 감지를 한 결과로 Ground-truth 이미지와 완전히 일치하지는 않지만 기계학습으로 학습된 딥러닝 모델에 의해 해당 위치의 물체가 존재함을 확인할 수 있으며, 이는 Ground-truth와 비교하였을 때 어느 정도 일치함을 알 수 있다.
다음으로 이미지를 통해 Object detection에서의 Bounding box로 감지된 객체의 위치를 표현한 사진을 보자.
위 사진은 표지판을 감지하여 이를 경계 상자로 표현한 것으로 파란색 상자가 Ground-truth이고 빨간 상자가 딥러닝 모델이 예측하여 표시한 부분이다. 객체를 잘 감지한 딥러닝 모델이라면 Ground-truth와 가장 가까운 경계 상자를 표현한 예측값이 좋은 성능을 가진 딥러닝 모델이라고 할 수 있다.
그렇다면, 어떠한 기준으로 딥러닝 모델이 예측을 잘 했는지를 알 수 있을까?
이를 수치로 비교하기 위해 IoU(Intersection over Union) 공식을 사용한다. IoU 공식은 Ground-truth의 경계상자와 예측된 경계상자가 겹치는 부분의 너비에 두 경계상자가 사진에서 차지하는 너비를 나눈 값이다.
위와 같은 식을 적용하면 다음과 같이 딥러닝 모델의 성능을 비교할 수 있게된다.
이제 기계학습의 관점에서 Ground-truth의 정의는 위의 예시가 대표적이다.
위의 예는 CV에서 설명했지만 Ground-truth는 데이터의 Label 값으로 이해한다면 어떤 의미인지 와 닿을 것 같다.
'Deep Learning' 카테고리의 다른 글
[DL] Anomaly Detection (1) | 2023.10.07 |
---|