‘자연어 처리’ 분야 권위자인 서정연 서강대 컴퓨터공학과 교수는 이 대목에서 힘줘 말했다. 서강대 R관에서 3월 9일 만난 서 교수는 기술 발전의 ‘혁명’이 일어났다고 전했다. 그는 “이 분야의 연구가 워낙 어려운 문제가 많았기 때문에 지난 20여 년간 느리게 발전해 왔는데 딥러닝이 인식 분야에서 괄목할 만한 성능을 내기 시작하면서 급속히 발전하게 됐다”며 “기존 연구자들이 끝없이 도전을 이어 가고 있지만 AI 비전공자 역시 얼마든지 새로운 발견을 할 수 있는 기회의 장이 열렸다는 점에서 고무적”이라고 말했다.
컴퓨터에 데이터는 곧 인간의 경험
2016년 ‘알파고’가 나타난 이후 AI가 세상을 바꿀 핵심 기술로 부상하고 있다. 전 산업 분야에서 AI의 영향력이 커지고 있다. 자연어 처리 분야 국내 1세대 석학에 해당하는 서 교수가 생각하는 AI의 힘은 ‘의사결정 능력’이다. 방대한 양의 데이터로 학습한 AI가 빠르고 정확한 의사결정을 하기 시작했다.
“사람의 지능에서 가장 기본적인 능력 중 하나가 ‘인식’입니다. 외부의 환경 변화를 눈으로 보고 귀를 듣는 능력이 중요하죠. 컴퓨터에 인식 능력을 가르쳐 보려고 했는데 쉽지 않았어요. 그 사이 인터넷을 통해 방대한 양의 데이터가 수집되고 하드웨어 측면에선 막강한 컴퓨팅 파워가 뒷받침되기 시작했죠. 수백만 장의 사진을 보여 줬더니 컴퓨터가 사람보다 더 잘 알아맞히기 시작했습니다. 로 데이터(raw data)로 학습한 결과입니다.”
사람은 오랜 기간의 ‘경험’을 통해 결정을 내린다. 컴퓨터에 경험은 곧 데이터다. 방대한 양의 데이터에서 스스로 규칙을 학습해 인간의 능력을 넘어서면서 ‘계산하는 기계’에서 ‘생각하는 기계’로 전환됐다. 서 교수는 “그동안 매우 어려웠던 인식 부문이 상당히 해결됐는데 중요한 점은 이 해결 방법이 매우 일반적이어서 비슷한 모든 문제 해결에 적용할 수 있다는 것”이라며 “방대한 데이터로 자동 학습해 다양한 입력된 신호를 분별할 수 있는 기법인데, 이 기법은 모든 과학적 접근 방법의 새로운 모델로 자리 잡게 될 것”이라고 설명했다.
“모든 과학적 연구가 자연 현상을 관찰하고 규칙을 찾아 증명하는 것이라면 사람이 설정한 가설보다 데이터를 통해 더 정확한 규칙을 찾아내면서 난제에 새로운 돌파구를 제시할 것으로 기대됩니다. 물리·화학·생명과학·의학과 같은 자연과학뿐만 아니라 금융·경영·경제·언어 등 인문사회 과학 분야에도 적용될 수 있습니다. 심지어 음악·미술과 같은 창의적인 부분까지도 변화를 가져옵니다.”
인간의 창의적 능력에 해당하는 예술은 학습을 통해 모방한 후 변화를 주는 방식으로 새로운 창작 활동을 수행한다. 기존 기사와 스토리 틀을 모방해 문장 생성 능력을 가진 자동 기사 작성 AI는 이미 활발히 활동 중이다.
또 ‘자동화’의 범위가 크게 늘어난다. 기존의 벨트 컨베이어 시스템에 AI가 적용되면 생산성과 효율성이 올라간다. 자율주행 시스템도 수많은 센서들로부터 데이터를 받아 스스로 의사결정을 하면서 가능해진다. 기업에선 더 적은 인력으로 더 많은 생산을 할 수 있게 되는 셈이다. 전문 지식을 학습하는 영역에서도 의료나 금융 공학 등 분야에서 이미 전문가를 넘어서는 시스템이 나오고 있다.
이에 따라 일자리 변화가 불가피하다. 서 교수는 “산업혁명 과정을 생각해 보면 획기적인 기술 발전으로 기존의 일자리가 사라지고 동시에 새로운 일자리가 늘어났다”며 “확실한 것은 AI와 소프트웨어 분야의 일자리가 늘어날 수밖에 없기 때문에 초등학교에서부터 관련 분야의 지식을 배우고 익히는 교육 개혁이 필요하다”고 말했다. 서 교수는 ‘코딩’을 컴퓨터의 구구단에 비유했다. 그는 “모두가 컴퓨터 엔지니어가 될 필요는 없지만 AI 기술을 알고 일하는 사람과 모르는 사람은 차이가 날 수밖에 없다”고 말했다.
AI 시대에는 전반적인 교육 과정의 재편도 고려해야 한다.
“이미 하버드대에서는 AI 시대의 의사 교육이 어떻게 바뀌어야 하는지 논의하고 있습니다. 다양한 임상 사례를 외우는 데 치중했던 기존 교육에서 종합적 판단을 내리고 환자에게 신뢰감을 형성하는 능력을 키우는 쪽으로 커리큘럼을 변경하고 있습니다. 충분한 데이터가 주어진다면 전문가 영역은 AI가 넘어설 수 있기 때문에 의사의 능력이 바뀔 것으로 보고 교육 과정을 재편한 것입니다.”
인간의 말과 글을 배우는 컴퓨터
서 교수는 자연어 처리 분야의 중요성에 대해서도 강조했다. 자연어 처리는 AI의 핵심 분야로 시장 규모가 점차 커지고 있다.
인간의 가장 기본적인 소통이 ‘말’과 ‘언어’다. 소리로 전달되면 말이 되고 기록으로 전달되면 언어가 된다. 이러한 소통은 인간의 가장 기본적인 지적 활동에 해당한다. 기계가 인간의 소통 방식을 이해하도록 하는 것이 AI의 가장 중요한 미션이었다. 자연어 처리는 인간의 언어를 기계가 이해하고 생성할 수 있도록 하는 연구에 해당한다. 소리를 글로 바꾸는 음성 인식, 언어를 분석하는 기계 번역 등이 자연어 처리의 주요 영역에 해당한다. 딥러닝 방식을 적용한 음성 인식의 성능은 간단한 음성 대화가 가능한 수준으로 향상됐다.
“가장 기본적인 산업 적용은 구글이나 네이버의 검색 엔진입니다. 검색은 사용자의 질의에 대해 가장 정확한 대답을 가진 문서를 찾아 제시해 주는 것이죠. 초창기 검색엔진에는 자연어 분석을 많이 하지 못했지만 지금의 검색 엔진들은 거의 질의응답 수준의 의미적인 검색까지도 가능해져 가고 있습니다.”
서 교수는 “미래의 검색 엔진은 질문에 대해 의미적인 부분뿐만 아니라 ‘상황’까지 파악해 최선의 대답을 해주는 방식으로 진화할 것”이라고 전망했다.
또한 대화 인터페이스도 중요한 연구 분야다. 최근 나오는 AI 스피커들이 낮은 수준의 ‘대화하는 로봇’에 해당한다. 명령을 하면 기계가 알아서 처리하는 수준으로 이 분야는 더 진화할 것으로 보인다.
서 교수는 특히 대화 인터페이스에 집중하면서 이를 위한 지능형 정보 검색, 질의응답 시스템, 지능형 로봇 음성 대화 인터페이스, 지능형 비서 에이전트 개발 등을 연구해 왔다. 현재는 딥러닝과 기존의 지식 그래프(knowledge graph)를 결합하는 방식의 연구에 초점을 맞추고 있다. 서 교수는 “딥러닝과 기존의 규칙 기반 시스템을 융합하는 단초를 찾아낼 수 있을 것으로 기대한다”고 말했다.
음성 인식을 비롯한 자연어 처리의 괄목할 만한 성과를 기록했음에도 불구하고 여전히 한계는 있다. 인간의 ‘상식’에는 AI가 여전히 미치지 못하고 있다.
서 교수는 “AI 스피커가 어린 아이와 대화하는 수준의 단순한 소통은 가능하지만 여전히 인간과 기계와의 자유로운 소통은 요원하다”며 “상황 지식을 어떻게 기계에 학습시킬 것인지, 맥락과 의도를 파악해 소통할 수 있을지에 대해 많은 도전과 기회가 열려 있다”고 말했다.
charis@hankyung.com
[한국의 AI 프런티어들에게 듣는다 커버스토리 기사 인덱스]
-서정연 서강대 교수, AI의 힘은 ‘의사결정 능력’…‘자연어 처리’ 기술 키울 때
-박상규 ETRI 부원장 “AI는 ‘플랫폼 경쟁’…승자 독식 시장에서 이겨야 한다”
-조성배 연세대 교수 “‘포스트 딥러닝’으로 미래 인공지능 시대 대비해야”
-이성환 고려대 교수 “AI 시대에 한발 늦은 한국…제조업 기술에 특화한 ‘선택과 집중’ 필요”
-인공지능 전쟁은 곧 인재 전쟁…모자란 AI 인력에 해외로 눈 돌리는 삼성·LG
[본 기사는 한경비즈니스 제 1268호(2020.03.16 ~ 2020.03.22) 기사입니다.]
© 매거진한경, 무단전재 및 재배포 금지