연합뉴스
연합뉴스
오픈AI가 12일 새로운 버전인 ‘GPT-5.2’를 출시했다. 이전 버전인 ‘GPT-5.1’이 공개된 지 한 달 만이다. 오픈AI가 한 달 만에 새 버전을 내놓은 것은 지난 2022년 챗GPT 서비스를 시작한 이후 처음 있는 일이다.

구글의 제미나이3 프로가 출시된 후, 제미나이의 이용자 수 증가와 챗gpt 이용자 수 감소가 ‘GPT-5.2’를 새로운 버전 출시를 앞당긴 것으로 알려졌다.

시장조사업체 시밀러웹에 따르면, 챗GPT의 생성AI 트래픽 점유율은 12월 초 71.3%다. 1년 전 87%였던 것과 달리 감소한 수치다. 반면, 제미나이의 점유율은 같은 기간 5.7%에서 약 3배로 늘어나 15.1%를 기록했다.

이에 오픈AI 최고경영자(CEO) 샘 올트먼은 사내에 중대경보(코드레드)를 발령하고 챗GPT 성능과 사용성 개선에 집중하라고 주문했다.

‘GPT-5.2’은 즉답(Instant), 사고(Thinking) 모드에 프로 모드를 더해 모두 세 가지 모드다. 오픈AI는 새 버전이 추론과 코딩 능력을 강화하고, 환각을 줄였다고 밝혔다. 환각은 AI가 사실과 다른 정보를 진짜처럼 제시하는 현상을 말한다. AI 성능을 측정하는 다양한 벤치마크에서 최고 수준을 달성했다고 강조했다. AI 벤치마크는 여러 모델을 같은 문제, 같은 기준으로 테스트해 성능을 객관적으로 비교하기 위한 일종의 시험이다.

GDPval 평가에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록했다. GDPval 평가는 전문 산업 현장 44개 직종의 업무 수행 능력을 평가한다. GPT-5.2는 인간 전문가들과 대등하거나 더 뛰어난 능력을 갖춘 것으로 평가됐다. 이전 버전은 38.3%였으니 큰 폭의 성장을 보였다.

‘인간의 마지막 시험’으로 불리는 박사급 추론 능력 측정 벤치마크 HLE에서의 평가에서도 성장을 보였다. 별도 도구를 사용하지 않고 모델 자체의 능력만으로 진행한 평가에선 GPT-5.2 프로는 36.6%로 제미나이3 프로의 37.5%보다 소폭 낮은 평가를 보였다. 다만 검색 등 도구를 사용해서 진행한 평가에서는 50%로 제미나이3 프로(45.8%)보다 더 높은 점수를 얻었다.

GPT-5.2는 유료 요금제 구독자에게 12일부터 순차적으로 제공되며, 개발자들도 API를 통해 이용할 수 있다. 이전 버전인 GPT-5.1은 앞으로 3개월 동안만 서비스가 제공된 후 종료된다.

배현의 기자 baehyeonui@hankyung.com