AI OCR 세계 최고 권위 대회서 4개부문 1위 수상

업스테이지가  'ICDAR 로버스트 리딩 컴페티션'에서 △HierText-1/2 △VQAonBD △IHTR 등 4개 종목에서 1위를 기록했다. 사진은 VQAonBD 순위. (사진=업스테이지)
업스테이지가 'ICDAR 로버스트 리딩 컴페티션'에서 △HierText-1/2 △VQAonBD △IHTR 등 4개 종목에서 1위를 기록했다. 사진은 VQAonBD 순위. (사진=업스테이지)
업스테이지가 AI OCR 세계 최고 권위 대회에서 아마존과 엔비디아 등을 제쳤다.

24일 업스테이지는 국제패턴인식협회 'IAPR'의 국제 경진 대회 'ICDAR 로버스트 리딩 컴페티션'에서 △HierText-1/2 △VQAonBD △IHTR 등 4개 종목에서 1위를 기록했다고 밝혔다.

ICDAR 로버스트 리딩 컴페티션은 디지털 이미지와 비디오 상에서 텍스트를 감지/인식하는 기술인 로버스트 리딩(Robust Reading) 분야에서 가장 권위있는 국제경진대회다. ICDAR는 1991년을 시작으로 매년 열리는 국제 학회로 문서 분석 및 인식 분야에서 활동하는 글로벌 기업 및 연구자와 전문가들이 참여하는 국제 학회다.

OCR(Optical Character Recognition)은 크게 이미지에서 △문자의 위치를 찾는 검출 기술과 △문자가 무엇인지 알아내는 인식 기술로 나뉜다. 업스테이지는 문자 검출 기술과 인식기술 모두에서 아마존, 엔비디아, 알리바바, 화웨이 등 글로벌 빅테크 기업들과의 경쟁에서 가장 높은 점수를 기록했다.

20일 업스테이지가 1위의 결과를 받은 IHTR 종목은 인도에서 쓰이는 대표 10종의 언어에 대한 글자 인식 문제를 다루었다. 업스테이지는 글자 인식 기술을 활용했다.

단순 OCR기술만으로 좋은 평가를 받을 수 없는 VQAonBD 종목에서도 업스테이지는 2위와 엄청난 점수 차이로 글로벌 톱의 성적을 거두며 두각을 나타냈다. VQAonBD는 문서 이미지를 주고 이미지 내 데이터의 답을 얻는 과제를 수행하는 종목으로, 예를 들면 계산이 복잡한 세금문서를 준 후 "2019년의 세금 합계가 뭐야?"와 같은 질문에 대해 정확한 답변을 추출하는 것뿐만 아니라 그 값을 이용, 비율, 평균, 최소 최대 값 등을 구하는 연산 작업까지 수행하는 문제도 제시됐다.

업스테이지 김성훈 대표는 "AI OCR 분야 최고 권위의 대회인 ICDAR 로버스트 리딩 컴페티션에서 4개 부문의 1위를 휩쓸며 다시 한 번 업스테이지가 글로벌 톱 AI기술력을 인정 받아 무척 기쁘다"라며 "세계최고의 기술력이 검증된 업스테이지의 AI OCR로 문서 자동화가 필요한 전 산업의 디지털 전환과 AI 글로벌 혁신을 도울 것"이라고 전했다.

최수진 기자 jinny0618@hankyung.com