이번 특허는 ‘비전 트랜스포머(Vision Transformer, ViT)’라는 최신 AI 모델을 활용해 이미지를 분석하는 새로운 기술에 관한 내용이다. 지금까지 이미지 검색 분야에서는 보통 CNN이라 불리는 합성곱신경망 모델을 사용해 왔다. 그러나 최근 AI업계에서는 트랜스포머가 이미지를 더 넓은 시각에서 이해하는 데 강점을 보이며 주목받아 왔고, 딜리셔스는 이 기술을 패션 분야에 가장 적합하도록 재설계하는 데 성공했다.
새롭게 개발된 기술의 가장 큰 특징은 하나의 이미지를 ‘전체적으로 보는 시각’과 ‘세부적으로 들여다보는 시각’을 동시에 확보했다는 점이다. 기존 트랜스포머 모델은 이미지를 전체적으로 파악하는 데는 뛰어난 반면, 작은 디테일을 잡아내는 데 상대적으로 약한 한계가 있었다. 딜리셔스는 이 문제를 해결하기 위해 이미지 전체를 대표하는 정보와 패턴·디테일 등 세부 요소를 따로 분석해 각각의 장점을 살리도록 구조를 분리해 설계했다. 이를 통해 옷의 색상·패턴·질감처럼 패션업계에서 특히 중요한 미세한 차이까지 정확하게 구분할 수 있게 됐다.
또한 딜리셔스는 이미지가 어떤 크기나 비율로 주어지더라도 안정적으로 처리할 수 있는 보정 기술과, 복잡한 이미지에서도 핵심 부분을 더 잘 찾아내도록 돕는 구조를 함께 도입했다. 덕분에 다양한 해상도와 조건에서도 흔들림 없이 높은 정확도를 유지할 수 있게 되었으며, 실제 쇼핑 환경처럼 다양한 사진이 섞여 있는 상황에서 더욱 강한 성능을 발휘한다.
본 연구에 참여한 딜리셔스 AI파트 윤주영 파트장은 이번 특허에 대해 "패션업계는 작은 디테일의 차이로도 전혀 다른 상품이 되기 때문에 이미지 검색 기술이 매우 중요하다"며 "이번 기술은 단일 기능을 넘어서 플랫폼 전반의 기반 기술로 활용될 수 있는 만큼, 앞으로도 실제 사용자 경험에 직접적인 가치를 주는 AI 기능으로 확장해 나가겠다"고 밝혔다.
한경비즈니스 온라인뉴스팀 기자 biznews@hankyung.com
© 매거진한경, 무단전재 및 재배포 금지