[AI 따라잡기]
앨런 튜링, 1950년 첫 AI 논문 발표…규칙 기반 시스템에서 학습 기반 시스템으로 진화
[한경비즈니스 칼럼=유성민 건국대·부산대 겸임교수] 주위를 보면 ‘정말로 인공지능(AI) 시대가 맞구나’라는 생각이 들 정도로 AI 관련 얘기를 쉽게 접할 수 있다. 콘퍼런스, 기업 로드맵, 제품 홍보 자료, 대학 교육 등에서 AI 얘기가 빠지지 않고 등장하는데 이제는 AI 관련 주제가 빠지면 뭔가 허전하다는 느낌이 들 정도다.
현재 AI는 완전 새로운 기술인 것처럼 여러 산업에 적용되고 있다. 그런데 엄밀히 생각해 보면 AI 역사는 새로운 기술이라는 생각이 들 정도로 오래됐다. 무려 70년에 달한다. 그뿐만 아니라 이러한 기술은 이미 오래전부터 여러 산업에 적용돼 있다.
물론 현재 언급되는 AI는 이전과 달리 훨씬 더 진화된 형태라고 볼 수 있다. 이러한 이유로 일부 전문가는 이전 AI를 약 AI로, 현재 AI를 강 AI라고 표현하기도 한다. 복잡 문제 해결 가능 여부에 따라 약 AI와 강 AI를 나뉘는데 해결할 수 있으면 강 AI에 해당하고 그렇지 않으면 약 AI에 해당한다.
AI의 두 흐름, 기호주의와 연결주의
AI는 사람의 지능을 시스템으로 구현한 것으로 정의할 수 있다. 엄밀히 말하면 계산기도 AI라고 볼 수 있다. 사람의 계산 지능을 구현한 것이기 때문이다.
당연하게도 AI에서는 지능을 ‘어떻게’ 구현하는지가 주된 관심사였는데 이에 따라 AI 연구는 두 가지 분류로 자연스럽게 나뉘게 된다. 다시 말해 지능 구현 방법에 따라 기호주의와 연결주의 학파로 나뉘게 된다.
기호주의는 ‘사람이 지능을 기호화해 직접 구현하는 방식으로 AI를 연구한 학파’를 말한다. 쉽게 말해 시스템에 공식을 주입하고 이에 따라 움직이게 하는 방식이다. 이에 기반한 시스템을 규칙 기반 시스템이라고 한다.
이러한 시스템 특징은 예상되는 결과값이 명확하다는 것이다. 사람이 직접 지능을 구현했기 때문에 가능한 일이다. 하지만 단점은 얼굴 인식, 자율주행 등 수많은 요인을 고려해야 하는 복잡 문제에 관해서는 적용하기가 어렵다는 것이다. 사람 또한 이러한 복잡 문제를 인식하고 푸는 것이 아니라 직관으로 푸는 것이기 때문이다. 다시 말해 이를 시스템으로 구현할 방법을 구체적으로 모르기 때문이다. 이에 따라 기호주의 기반의 AI는 앞서 언급한 약 AI에 해당하는 것으로 볼 수 있다.
연결주의는 ‘사람의 학습 방식을 시스템에 적용해 스스로 지능을 구현할 방법을 연구하는 학파’라고 정의할 수 있다. 현재 자주 언급되는 기계 학습 방식이 여기에 해당한다. 연결주의에서는 공식이 주어지지 않는다. 그 대신 투입 값과 산출 값으로 이뤄진 데이터만 주어질 뿐이다. 시스템은 이러한 데이터를 가지고 스스로 지능을 만들어 낸다.
이러한 지능을 만들어 내는 방식은 사람의 두뇌 신경망이 모방된다. 신경망 특징은 서로 연결돼 있다. 연결주의 학파라고 불리는 이유가 바로 서로 연결된 신경망을 본뜬 것이기 때문이라고 할 수 있다.
두뇌는 주어진 자극에 따라 신경망이 서로 유기적으로 주고받음에 따라 반응하는 특징이 있다. 서로 연결된 신경망의 반응에 의해 지능이 만들어지는 셈이다. 서로 연결된 신경망의 반응 정도는 경험에 의한 것이고 사람은 학습에 따라 지능이 만들어지는 것으로 볼 수 있다.
연결주의에서 다루는 AI도 똑같이 지능을 구현한다. 퍼셉트론(perceptron)은 AI의 신경망을 본뜬 기계 학습 알고리즘인데 주어진 데이터를 학습해 투입 값에 따른 반응 정도를 계산에서의 가중치 형태로 저장한다. 연결주의 방식으로 구현한 AI는 강 AI에 해당하는 것으로 볼 수 있다. 복잡 문제도 해결할 수 있기 때문이다. 얼굴 인식과 운전 등 복잡 문제를 푸는 방식을 사람과 같은 방식으로 스스로 학습하게 함으로써 이러한 문제를 해결할 수 있게 했다.
단점은 시스템의 결과 값을 예측하기 어렵다는 점이다. 사람이 직접 지능을 구현한 것이 아니기 때문이다. 이에 따라 기계 학습 방식에서 나온 지능을 블랙박스로 표현하기도 한다.
한계점도 있는데 이러한 방식은 수많은 데이터를 요구한다는 점이다. 기계 학습 기반의 시스템 또한 사람처럼 학습에 의해 지능을 구현하는 것이기 때문에 이를 위한 충분한 데이터가 없다면 구현하기 어려운 단점이 있다.
빅데이터 등장으로 연결주의 방식 주목
AI 구현 방식이 두 가지로 나뉘고 있음을 살펴봤다. 그러면 이러한 AI는 어떻게 발전돼 온 것일까. 70년 동안의 AI 발전 역사에 관해 살펴보자.
올해가 정확히 AI 70주년에 해당한다고 볼 수 있다. 최초 AI 관련 논문이 1950년 10월 게재됐기 때문이다. 영국 수학자이자 컴퓨터공학의 아버지라고 불리는 앨런 튜링은 1950년 10월 논문 1편을 게재했다. 바로 ‘컴퓨팅 머신과 지능(Computing Machinery and Intelligence)’이라는 제목의 논문인데 해당 논문에는 최초로 기계가 지능을 가질 수 있는지에 관한 내용을 담고 있다. 튜링이 AI 시작을 알린 셈인데 이러한 이유로 1950년대를 AI의 새벽녘이라고 묘사하기도 한다.
AI 개념은 이보다 한참 뒤인 1956년 등장했다. 1956년 존 매커시 다트머스대 교수는 다트머스 회의에서 AI에 관한 개념을 언급했다. 그리고 이에 관한 연구도 함께 제안했다.
1958년 기계 학습의 시초가 되는 ‘퍼셉트론’의 연구 논문이 게재된다. 미국 컴퓨터 공학자인 프랭크 로젠블라트가 퍼셉트론이라는 제목으로 논문을 발표했다. 이후 퍼셉트론을 보완한 논문들이 나온다. 참고로 1960년을 AI의 낭만시대라고 표현하는데 이때 AI 관련 연구 논문들이 많이 발표됐기 때문이다. 하지만 1970년 AI 구현 가능성에 관한 의문점이 제기되면서 기술적인 한계에 부딪치게 된다. 이에 따라 1970년대를 AI의 격차 시대라고 묘사하기도 한다. 당시 미국 정부는 1960년대에 AI 연구를 적극적으로 지원하고 있었는데 1970년대에 현실적인 적용 가능성을 언급하면서 지원을 중단했다.
그렇다고 AI 연구가 중단된 것은 아니다. AI 연구는 연결주의 중심으로 시작됐는데 현실 가능성 문제로 기호주의가 주목받기 시작했다. 기호주의 학파는 1959년 의료 진단에 활용되는 전문가 시스템에 유래돼 등장했다. 이후 AI는 기호주의 학파 중심으로 발전하기 시작했고 1980년대를 AI의 산업화로 묘사한다.
물론 연결주의 학파도 계속 유지된 채로 AI 연구도 끊임없이 진행됐다. 그러다가 2010년대 연결주의 학파가 또다시 주목받게 된다. 이유는 기술적 진보와 함께 빅데이터 시대가 도래했기 때문이다.
알파고의 등장이 AI 주목 시점을 앞당긴 것은 사실이다. 하지만 알파고가 없었더라도 AI 시대는 도래했을 것으로 생각한다. 이유는 빅데이터 등장 때부터 AI도 함께 주목받았기 때문이다.
빅데이터 등장인 연결주의 방식에 주목한 이유는 기계 학습에 필요한 무수한 데이터를 제공할 뿐만 아니라 AI 학습 속도 또한 비약적으로 빠르게 증가시켰기 때문이다. 이는 기계 학습을 강조한 연결주의 학파에 최적의 조건을 제공했다.
이러한 결과를 보여주는 사례가 바로 이미지 인식이라고 볼 수 있다. 이미지넷(Imagenet)은 매년 AI의 이미지 인식률 경진 대회를 개최하는데 2011년까지만 해도 AI의 이미지 인식률은 74%에 불과했다. 그런데 2012년 인식률이 비약적으로 증가했다. 이유는 알렉스넷(Alexnet)이 기계 학습 알고리즘의 일종인 ‘콘볼루션 신경망(CNN)’을 탑재했기 때문이다. 알렉스넷은 84%의 인식률을 보였고 그 덕분에 이미지 인식에서 기계 학습이 많이 활용되는 계기로 작용했다. 이후 기계 학습은 이미지 인식에 사용되면서 2015년 인간의 이미지 인식률(94.9%)을 추월하기까지 했다. 2017년 기준으로 97.9%의 정확도를 보인다.
잃어버린 40년 시대, 연결주의 방식이 부상
AI 시작은 연결주의로 시작했다. 하지만 현실적인 문제로 1970년부터 2010년까지 연구가 활발히 진행되지 못했다. 그러나 빅데이터의 등장으로 재조명받기 시작했고 현재 여러 산업에 기계 학습 방식이 도입되고 있다.
앞으로 기업은 이러한 시대에 맞춘 방향 설정이 중요하다. 가령 인력 양성 방식을 새로 바꿀 필요가 있다.
기존 개발 방식은 알고리즘을 직접 구현하는 형태였다. 코딩에 드는 공수가 많았다. 하지만 현재 개발 방식은 약간 다르다. 코딩보다 데이터 구조를 설계하는 것이 더 중요하다. 다시 말해 데이터 과학자에 관한 인력 양성이 더욱더 중요해지고 있다. 알고리즘은 기계 학습 방식에 의해 스스로 만들어지기 때문이다.
반면 기계 학습 시스템의 학습 방식은 사람이 직접 개입해야 한다. 특히 학습 방식에 해당하는 데이터 설계가 잘못되면 AI가 오작동하기 쉽다. 이전까지 AI는 현실과의 타협으로 적용 범위가 좁았다. 하지만 현재 새롭게 주목받는 AI는 원래 추구했던 방식이다. 후자의 AI가 앞으로 더욱더 주목받을 것으로 보인다. 그리고 거의 모든 산업의 구조를 바꿀 것으로 보인다.
[본 기사는 한경비즈니스 제 1305호(2020.11.30 ~ 2020.12.06) 기사입니다.]