[AI 이야기] 어린이도 잘 아는 ‘강아지’와 ‘고양이’…AI는 왜 구별하지 못할까


[AI·tech=LG CNS의 AI 이야기]
- 특징 분류하는 기존 방식은 예외 많아 신뢰성 낮아…신경망 기반 딥 러닝으로 돌파구 열려








[이주열 LG CNS AI빅데이터연구소장, 김명지 AI빅데이터연구소 책임] 최근 산업계에서 가장 화두가 되는 단어 중 하나는 바로 인공지능(AI)이다. AI는 넓은 의미에서 인간의 합리적인 사고나 행동을 모방해 자동화한 프로세스를 일컫는다. 간단히 생각하면 숫자와 연산 기호 버튼만 눌러 자동으로 값을 계산해 주는 계산기도 일종의 AI라고 볼 수 있다. 하지만 최근에 학계와 산업계에 불고 있는 AI 열풍은 이렇게 단순히 ‘규칙의 자동화’를 지칭하는 넓은 의미의 AI는 아닐 것이다.


요즈음 회자되는 AI는 좁은 의미로 딥 러닝 기반의 AI를 일컫는 경우가 대부분이다. 딥 러닝은 인공 신경망으로 이뤄진 모델을 활용해 기계가 의사 결정에 필요한 특징을 데이터로부터 알아서 추출하고 최종 판단을 내리는 기계학습(machine learning)의 한 방식이다. 하지만 회귀 분석이나 의사 결정 나무 등의 전통적인 머신 러닝 기법과는 조금 차이가 있다.


기계가 자동으로 강아지와 고양이를 구별하게 하려면 어떻게 해야 할까. 기계에 강아지와 고양이에 대한 우리의 지식을 전수할 방법을 생각해 보자. 고양이는 대체로 귀가 작고 뾰족하고 주둥이 길이가 상대적으로 강아지보다 짧은 특징이 있다. 또 박스를 던져 주면 고양이는 그 안에 들어가고 강아지는 박스를 물어뜯고 좋아한다. 이러한 정보를 활용해 볼 수 있지 않을까.





딥 러닝 이전의 AI
우리의 지식을 토대로 분류 규칙을 만들어 프로그래밍하면 자동화 시스템을 만들 수 있을 것이다. 사람은 강아지와 고양이를 구분하는 주요 특징들을 정리해 기계에 알려줘야 한다. 그런데 이대로 두면 몇 가지 문제가 발생한다.


예를 들어 강아지처럼 귀가 접힌 스코티시폴드, 박스 안에서 눈만 보이는 시베리안 허스키 사진이 있다고 하자.


이 데이터들은 우리가 정의했던 강아지와 고양이의 특징에 부합하지 않는다. 이러한 특정 케이스에 대해 ‘예외 규칙을 추가하면 되지 않을까’라고 쉽게 생각해 볼 수 있지만 예외란 것이 언제 어떤 것이 발생할지 알 수 없고 그때마다 매번 규칙을 수정하거나 추가해 주는 공수가 많이 들어가게 된다. 편하기 위해 AI를 개발하는 것인데 더 귀찮은 상황이 발생할 수도 있는 것이다. 사람은 척 보면 이 친구들이 강아지인지 고양이인지 알 수 있는데 사람은 도대체 어떻게 이런 예외들에 대해서도 유연하게 대처할 수 있을까.


사람은 세상에 태어나 ‘고양이는 주둥이가 짧고 귀가 뾰족하고 박스를 좋아한다’와 같은 규칙, 사전적인 정의를 통해 고양이를 배우지 않았다. 동물 그림 카드를 보면서 ‘아 강아지는 이렇게 생겼구나’ 또는 TV나 동화책에 나온 여러 동물들, 지나가면서 마주친 고양이를 부모님이 ‘저기 귀여운 야옹이가 있구나’라고 말해 주는 것을 들으면서 배우게 된다.


우리는 사전적 정의나 규칙이 아니라 다양한 여러 사례들을 보고 귀납적으로 강아지와 고양이에 대한 정보를 습득한다. 말로는 구체화하기 어렵지만 대충 강아지와 고양이는 각각 이러저러한 특징들이 있다는 것을 깨닫는다.


그렇다면 기계에도 수많은 사례를 통해 구별하게 하면 다양한 예외에도 잘 대처할 수 있지 않을까. 딥 러닝은 바로 이러한 모티브를 기계 학습에 녹여낸 방법이다.






딥 러닝 기반의 AI
사람의 사고방식을 기계에 적용하기 위해 컴퓨터공학과 신경과학이 손을 잡는다. 사람에게는 ‘뉴런’이라는 신경 세포가 있어 세포의 한쪽에서 받아들인 전기 자극 정보를 다른 쪽 끝에서 다음 세포로 전달한다. 이 모양을 그대로 본떠 만든 것이 ‘인공 뉴런’으로, 입력 노드로부터 받아들인 데이터를 가중합 연산을 한 뒤 비선형 함수를 적용, 정보를 가공해 다음 인공 뉴런으로 넘기는 역할을 한다.


이런 인공 뉴런을 다양한 방식으로 여러 층 쌓아 연결하게 되면 딥 러닝의 기본 구조인 ‘인공 신경망’이 된다. 그리고 수많은 강아지와 고양이 사진을 인공 신경망에 보여주면 자동으로 강아지와 고양이 분류를 위한 최적의 연산 모델을 찾아낸다. 여기엔 귀가 어떻다든지, 주둥이 길이가 어떻다든지 하는 인간의 지식은 필요 없다. 딥 러닝 모델은 데이터를 통해 자동으로 필요한 특징을 찾아내고 분류를 수행한다.


기계 자동화를 위한 방법은 점점 사람의 개입이 줄어드는 방향으로 발전하고 있다. 예전엔 어떻게 해서든지 인간이 알고 있는 지식(규칙)을 기계에 전수하려고 했다면 이제는 인간이 사고하는 방식 그 자체를 기계에 알려주고 데이터를 제공하게 됐다. 최근엔 딥 러닝 기반의 AI가 다양한 영역에서 인간의 성능을 뛰어넘었다는 기사도 많이 볼 수 있다. 기계는 과연 어디까지 발전할 수 있을까.



[본 기사는 한경비즈니스 제 1293호(2020.09.07 ~ 2020.09.13) 기사입니다.]
상단 바로가기