지식재산권, 편견·차별, 개인 정보, 가짜 뉴스에 대한 부작용 해소 필요

인공지능(AI) 기술이 새로운 전환기에 있다. (사진=게티이미지)
인공지능(AI) 기술이 새로운 전환기에 있다. (사진=게티이미지)
최근 인플레이션과 금리 인상에 이은 글로벌 경기 침체 위기로 글로벌 기업들의 인원 감축과 투자 축소가 잇따르고 있다. 지난해 말부터 애플·메타·구글 등 빅테크 기업을 중심으로 구조 조정이 이뤄지고 있고 아마존도 1만8000명의 감원 계획을 발표했다.

혁신 기술을 무기로 지속적인 호황을 누리던 실리콘밸리의 정보기술(IT) 관련 투자도 얼어붙었다. CNN의 보도처럼 실리콘밸리 기업의 상징적 표현인 ‘빠르게 움직이고 혁신하라(move fast and break things)’도 ‘비용을 줄이고 생존하라(cut costs and try to survive)’로 바뀌고 있다.‘챗GPT’의 등장…새로 창조하는 생성형 AI 하지만 이런 암울한 상황에서도 일부 인공지능(AI) 기술이 새로운 전환기를 맞이하고 있다는 것은 그나마 반가운 소식이다. 대표적인 사례가 챗GPT·달리·발리 등으로 상징되는 생성형 AI(Generative AI) 기술이다.

생성형 AI는 비지도 학습 알고리즘을 사용해 새로운 디지털 이미지·비디오·오디오·텍스트 또는 코드를 생성하는 AI 기술의 하나다. 단순히 기존 데이터를 분석하거나 특정 개념을 학습하는 대신 세상에 없는 새로운 형태의 디지털 콘텐츠를 스스로 예측하고 만드는 혁신 기술이다.

가트너의 2022년 미래 전략 기술 중의 하나로 꼽히기도 했던 생성형 AI는 현재 미국에서만 450개 이상의 스타트업이 관련 연구를 하고 있는 것으로 추정된다. 또한 피치북 자료에 따르면 2022년 생성형 AI 스타트업에만 13억7000만 달러(약 1조7000억원)가 투자됐다.

이처럼 생성형 AI가 주목받게 된 것은 2021년 미국 AI 연구소 오픈AI가 출시한 ‘달리’의 영향이다. 달리는 텍스트를 이미지로 바꿔 주는 생성형 AI다. 2022년 해상도와 사실적인 이미지가 대폭 개선된 ‘달리2’가 나오면서 AI에 대한 관심을 이끌었다.

‘달리2’ 이외에도 우리가 접할 수 있는 생성형 AI는 제법 많다. 텍스트 생성 AI인 오픈AI의 GPT-3, 텍스트에서 이미지를 생성(text-to-image)하는 미드저니, 스테이블디퓨전, 구글의 이매젠, 대화형 AI인 구글의 람다가 그것이다.

최근에는 텍스트를 동영상으로 만들어 주는 기술(test-to-video)인 웨인힐스브라이언트A.I(WayneHills Bryant A.I)와 텍스트를 음성으로 바꿔 주는 기술(text-to-voice)인 마이크로소프트(MS)의 ‘발리’도 출시되는 등 진화한 형태의 생성 AI가 계속 나오고 있다.

이 가운데 언론의 관심을 받고 있는 대표적인 생성형 AI는 챗GPT다. 2022년 말 출시된 챗GPT는 출시와 함께 경이로움과 두려움 대상이 되고 있다. 제품 출시 후 5일 만에 사용자 100만 명을 돌파했는데 넷플릭스가 3년 6개월, 페이스북이 10개월 걸린 것을 감안하면 엄청난 성장세다.

챗GPT를 만든 오픈AI의 가치도 작년 140억 달러(약 17조2500억원)에서 현재 290억 달러(약 35조7000억원)로 2배 이상 올랐다. 도대체 챗GPT가 무엇이기에 이처럼 초미의 관심사가 되고 있을까.

GPT는 사전에 학습을 통해(Pre-trained) 문장을 생성(Generative)할 수 있는 AI다. 여기에 대화형을 의미하는 챗(Chat)이 붙어 인간과 컴퓨터 간 자연어를 통해 대화가 가능한 수준의 챗GPT가 탄생했고 이를 대화형 AI(Conversational AI)라고도 한다.

실제로 현재 베타 테스트 중인 챗GPT에 가입해 프롬프트 창에 질문하면 사람이 이야기하듯 대화체로 응답한다. 응답 내용도 상당히 구체적이고 백과사전 수준의 전문적인 답변을 질문 맥락에 맞게 제시한다. 이전 대화를 기억하고 그에 맞는 맞춤화된 답변도 내놓는다. 마치 SF영화에서 주인공과 슈퍼 컴퓨터가 주고받는 대화처럼 말이다. ‘검색 시장 지배자’ 구글까지 위협하는 챗GPT구글이 검색을 통한 인터넷 링크 목록을 보여주는 데 반해 챗GPT는 사람들이 이해할 수 있는 대화체로 해당 질문에 맞는 답을 내놓는다. 그동안 20년 넘게 인터넷 검색 시장을 지배해 온 구글이 위기의식을 가지게 된 이유다.

물론 구글도 검색 엔진 이외에 ‘람다’라는 좋은 챗봇 기술을 가지고 있다. 하지만 구글이 ‘람다’를 본격적으로 내세우기 어려운 이유가 있다. 전문가들은 챗봇 AI가 구글 매출의 80%를 차지하는 검색 광고 제공에 적합하지 않다는 점을 지적한다. 즉, 챗봇 기술이 문장이 긴 질문에 응답하면 사람들이 광고 링크를 클릭할 이유가 줄어들기 때문이다.

챗GPT의 가능성과 한계에 대한 높은 관심은 곧 다양한 사업자들 간의 협력으로 이어지고 있다. 오픈AI와 MS는 그간 긴밀한 협력 관계를 구축해 왔다.

MS는 2019년 오픈AI에 10억 달러(약 1조2400억원)를 투자한 이후 2020년 GPT-3 기반 기술에 대한 독점 라이선스를 구입했다. MS는 챗GPT를 MS의 ‘워드’ ‘아웃룩’ ‘파워포인트’ 애플리케이션 등과 자사 검색 엔진인 빙에도 통합할 계획이다.

더 나아가 MS는 오픈AI와의 협력과 별도로 올 1월 새로운 생성형 AI인 ‘발리’를 출시하며 생성형 AI에 대한 자체 역량을 키우고 있다. ‘빌리’는 음성을 복제하는 AI로 전화 통화, 대면 대화, 심지어 인터넷 방송 등에서 녹음한 제삼자의 목소리 3초 분량만 있으면 어떤 문장이든 합성해 만들어 낼 수 있다.

보통 텍스트에서 음성으로 변환하는 모델은 분량이 방대한 훈련 샘플이 필요하다. 하지만 발리는 약 6만 시간의 음성 훈련만으로도 음성을 복제할 수 있고 원래 샘플의 억양이나 스타일을 유지하는 등 다른 언어 모델보다 훨씬 자연스러운 합성 음성을 생성할 수 있다.

이처럼 혁신적인 기능을 갖춘 챗GPT와 같은 생성형 AI는 향후 그 활용 범위가 무궁무진할 것으로 예상된다. 생성형 AI가 갖는 장점은 무엇보다 생산성 향상이다. 단순한 사실을 찾거나 기본적인 정보로 콘텐츠를 만드는 작업은 AI가 수행하고 더 중요하고 창조적인 일은 인간이 할 수 있기 때문이다.

하지만 생성형 AI가 제공하는 놀라운 기능만큼 그로 인한 부작용도 적지 않다. 특히 법적·윤리적으로 해결해야 할 이슈가 많다. 가짜 뉴스, 지식재산권, 편견과 차별, 개인 정보 등이 그것이다. 생성형 AI는 학습된 내용을 기반으로 그것이 사실인지 여부와 관계없이 새로운 것을 재구성해 내기 때문이다. ‘달리’는 실제 음성인지, 가짜 음성인지 구분하기 어려워 합성된 목소리를 피싱 공격 시 사용하거나 유튜브나 팟캐스트를 통해 온라인에서 가짜 뉴스를 퍼뜨리는 데 악용될 수 있다.

MS는 과거 테이라는 채팅 봇을 출시했다가 인종 차별적인 언어 문제로 중단한 적이 있다. 메타도 2021년 8월 AI 챗봇 블렌더봇을 내놓았지만 특정 인종에 대한 고정관념을 드러내는 등 비난을 받으며 주춤하고 있다. 소프트웨어 개발자를 위한 질의응답 사이트인 스택 오버프로는 응답을 신뢰할 수 없다는 이유로 챗GPT를 금지했다. 미국 뉴욕시 교육국도 학생들의 에세이 표절에 대한 우려로 챗GPT 접근을 불허했다.

역사적으로 보더라도 항상 혁신적인 기술이 등장하면 그에 따른 논란이 끊임없이 제기된다. 생성형 AI가 이러한 논란을 잠재우고 향후 차세대 혁신을 주도할지 지켜보자.

심용운 SK경영경제연구소 수석연구원