메뉴 건너뛰기

IT기술과 인간 10 왜 인지자동화(소위 인공지능)인가?

 

코난(진보교육연구소 회원)

 

 

지난 글(진보교육 70호 담론과 문화 프로그래밍 이야기’)에서 프로그래밍(코딩)이란 무엇인가에 대해서 이야기 했습니다. 요약 하면 프로그래밍이란 알고리즘을 소프트웨어로 구현하는 것이고, 알고리즘이란 어떤 문제를 해결하기 위한 일련의 절차를 공식화한 형태로 표현한 것입니다. 알고리즘은 당연히 사람이 고안해야 하지만, 컴퓨터는 사람보다 아주 빠르고 정확하게 알고리즘을 실행(계산)할 수 있습니다. 여기서 알고리즘을 인간이 고안한다는 사실을 망각하면 컴퓨터가 인간의 정신 능력을 초월할 수 있다는 막연한 환상이 생겨날 수 있음에 유의해야 합니다. 자동차가 인간보다 빠르게 달리고 기중기가 인간보다 무거운 것을 들어 올리는 것처럼 계산기는 인간보다 빠르게 계산을 할 뿐입니다. 사실 프로그래밍의 핵심은 알고리즘에 있다고 말할 수 있습니다.

 

이 이야기는 현재까지의 모든 프로그래밍에 해당하며, 컴퓨터 프로그래밍에 기반한 소위 인공지능도 마찬가지입니다. 하지만 요즘 부각되고 있는 딥러닝에 기반한 인공지능에 다른 점이 있다면, 현재의 인공지능에는 알고리즘의 알고리즘’, 즉 메타 알고리즘이라고 부를 수 있는 측면이 있다는 것입니다. 기존의 대부분의 프로그래밍이 직접적으로 절차적 알고리즘에 기반한다면, 현재의 인공지능은 학습 알고리즘에 기반하기 때문입니다. 위에서 어떤 문제를 해결하기 위한 절차를 표현한 것이 알고리즘이라고 했는데, 학습 알고리즘의 경우 그 문제문제를 해결하는 방법을 학습하는 것입니다. 다시 말해 어떤 문제를 해결하는 방법을 학습하는 일련의 절차를 공식화한 형태로 표현한 것을 학습 알고리즘이라고 말할 수 있습니다.

 

 

모라벡의 역설

 

이러한 학습 알고리즘이 등장한 배경은 다음과 같습니다.

사진을 보고 동물을 구별하는 프로그램을 만든다고 합시다. 습성이나 서식지, 행동방식 등은 복잡하니까 다 빼고 외양적 특징만 보고 구별해야 한다고 제한하겠습니다. 날개와 다리의 유무만으로 물고기, , 산짐승을 구별할 경우, 그 절차를 기술하는 알고리즘은 예컨대 다음과 같을 것입니다.

 

날개가 있는가? 있으면 새, 없으면

다리는 있는가? 있으면 산짐승, 없으면 물고기

 

하지만 사실 새에도 수많은 종류가 있습니다. 몸집이 큰 가, 부리는 긴 가, 몸 색깔이 검은가 등등의 특징에 따라 더 세분해야 합니다. 이렇게 세분하다 보면 동물의 종류가 너무 많아서 막막하기는 하지만, 특징만 뚜렷하다면 절차를 기술하는 일이 불가능하지는 않아 보입니다. 하지만 이런 식의 구분에는 다른 문제점이 있습니다.

 

첫째, 컴퓨터는 날개가 무엇인지, 다리가 무엇인지 모릅니다. 날개는 상부 몸통에서 양쪽으로 뻗어 나온 깃털로 이루어진 신체 기관이라고 정의할 경우, 깃털은 무엇인지 몸통은 무엇인지 또 기술해 주어야 합니다. 끝이 없습니다. 이는 기술할 특징이 너무 많고 복잡한 것뿐만이 아니라, 근본적으로 컴퓨터가 특징 개념을 이해하지 못하기 때문입니다. 따라서 기존의 컴퓨터 프로그래밍에서는 특징을 설명하는 것이 아니라, 동물마다 어떤 특징에 해당하는 이름을 붙이고 그 속성 정보를 저장하여 문제를 해결합니다. 예컨대 다리라는 이름의 속성에 있다또는 없다는 정보를 저장하거나, ‘다리 갯수라는 이름의 속성에 0(물고기), 2(), 4(), 6(곤충), 8(거미)과 같은 숫자 정보를 저장하는 것입니다.

 

둘째, 개와 고양이 같이 외양이 매우 비슷할 경우 위와 같은 속성 부여만으로 특징을 기술하기 어렵습니다. 눈이 둘, 코 하나, 입 하나, 귀 둘, 다리 넷, 수염 있음, 털 있음 등등 공통점이 너무 많습니다. 사람이라면 외양의 차이를 어떻게든(?) 인식하고 개와 고양이를 구분하지만 그것을 말로 표현하기가 막막합니다.

 

그림입니다.

원본 그림의 이름: 펫닥터스_표지.jpg

원본 그림의 크기: 가로 736pixel, 세로 232pixel

 

이처럼 인간에게는 쉬운 일이 컴퓨터에게는 어렵다(반대로 인간에게 어려운 것은 컴퓨터에게 쉽다)는 것을 모라벡의 역설이라고 합니다. 이는 쉬운 일처럼 보이는 개와 고양이의 구별이 어떻게 이루어지는지 사실 우리가 잘 모른다는 것을 보여주는 것 같습니다. 인간의 뇌에서 이루어지는 시각적 인식은 즉각적이고 당연해 보이지만, 우리는 아직 그 기제를 모릅니다. 이와 같이 기존의 절차적 알고리즘으로 개와 고양이를 구별하는 알고리즘을 직접 구현하는 것은 너무 어려운 문제라는 것이 밝혀집니다.

 

 

학습 알고리즘

 

딥러닝에서는 이 문제에 전혀 다른 방식으로 접근합니다. 뇌의 신경망이 작동하는 원리를 모방하여 인공 신경망을 구성하고 이를 빅데이터로 학습시켜 문제를 해결하는 것입니다. 뇌는 수많은 뉴런(신경세포)으로 구성되어 있고, 뉴런 간의 연결 강도를 변화시킴으로써, 상황에 대처하는 능력을 변화(향상)시킵니다. 이러한 뉴런의 활동을 수치화하여 만든 것이 인공 신경망입니다. 뉴런 간 연결 강도를 변수로 놓고, 뉴런에 들어오는 입력 신호 값을 변화시키는 반복 학습(연산)을 통해 문제 해결에 적합한 최적의 뉴런 간 연결 강도(변수) 집합을 찾아내는 것입니다. 컴퓨터에서는 이를 절차적 알고리즘으로 구현하지만, 그 알고리즘은 직접문제를 해결하는 알고리즘이 아니라, 문제를 해결할 수 있는 최적의 신경망을 학습시키는 방법을 구현한 학습 알고리즘인 것입니다.

 

절차적 알고리즘으로 구현한 프로그램은 바로 문제 해결에 적용할 수 있지만, 학습 알고리즘으로 구현한 프로그램은 바로 문제를 해결하지 못합니다. 문제 해결에 사용하기 전에 학습을 하는 단계가 필요한 것입니다. 기계학습에서는 이를 훈련 단계예측 단계라 부르며 구분합니다. 따라서 똑같은 프로그램이라도 어떤 데이터로 얼마나 훈련 했느냐에 따라 예측 성능이 달라집니다. 컴퓨터가 개와 고양이를 구별하는 것을 제대로 학습하기 위해서는 수 만 장의 다양한 개와 고양이 사진이 필요하다고 합니다.

 

그림입니다.

원본 그림의 이름: mem000016940002.tmp

원본 그림의 크기: 가로 1617pixel, 세로 653pixel

 

또한 현재의 학습 알고리즘은 어떤 문제에나 동일하게 적용할 수 있는 범용 알고리즘이 아닙니다. 일단 인공 신경망에도 심층 신경망(DNN), 순환 신경망(RNN), 합성곱 신경망(CNN), 생성적 적대 신경망(GAN) 등의 여러 종류가 있고, 그 학습 방법에도 경사 하강법, 확률적 경사 하강법, Adam, Nadam 등 여러 가지가 있기 때문입니다. 아울러 같은 신경망과 학습 방법을 사용하더라도 최적의 학습을 위해 아직 사람이 경험을 통해 시행착오를 하면서 알아내야하는 여러 가지 하이퍼파라미터들이 존재합니다.

 

 

시각적 인식(지각)

 

여기서 학습은 당연히 비유입니다. 딥러닝에서 데이터를 추가함에 따라 성능이 조금씩 향상되며 그 향상을 스스로의 알고리즘에 따라 진행한다는 점 때문에 학습이라는 이름을 붙였지만, 아직 인간의 학습과는 다른 면이 많기 때문에 훈련혹은 좀 더 기계적인 표현으로 최적화등이 더 알맞은 표현이라는 생각을 해 봅니다.

 

현재의 인공지능 열풍을 불러온 딥러닝의 성과가 가시적으로 드러나기 시작한 것은 알파고가 아니라 인간의 시각 기능 영역이었습니다. 앞의 모라벡의 역설에서 이야기했듯이 시각적 인식이 인간에게 쉽지만 컴퓨터에게 어려운 것은, 본다는 것이 단순히 선명한 상을 얻는 카메라의 성능에 있는 것이 아니라, 그 시각적 이미지를 이해하는 데 있는 것이고 그 과정이 실제로는 인간의 뇌에서 매우 복잡한 과정을 거쳐 이루어지기 때문입니다. 영어에서 “I see.”가 의미하는 것처럼 인간이 본다는 것은 사실 이해한다는 것을 함축합니다. 이와 같이 본다는 것과 이해한다는 것이 결합되어 있는 것이 인간의 시각, 즉 지각일 것입니다. 하지만 다른 측면에서 볼 때 이해한다는 것은 본다는 것을 훨씬 넘어서는 인간의 상상이나 생각 능력을 포괄합니다. 때문에 현재의 딥러닝이 비약적으로 발달하여 어떤 면에서는 시각적 인식 분야에서 인간의 능력을 넘어섰다고 말하지만, 다른 측면에서는 여전히 인간의 시각과 기계의 시각 기능에 커다란 간극이 존재하는 것입니다.

 

다음 사진은 페이페이 리TED2015 강의 어떻게 컴퓨터가 사진을 이해하게 되었는가라는 영상에서 캡춰한 것입니다. 사진을 보고 상황을 말로(또한 글로) 표현할 수 있는 시각 인식 프로그램이 사진을 보고 판단한 내용을 보여주는 예시입니다. 왼쪽 사진에 대한 묘사는 적절해 보이지만, 오른쪽 사진에서는 칫솔야구 방망이로 오인하는 것이 눈에 띱니다.

 

그림입니다.

원본 그림의 이름: 남자가코끼리옆에서있습니다.PNG

원본 그림의 크기: 가로 800pixel, 세로 481pixel 그림입니다.

원본 그림의 이름: 어린소년이 야구방망이를 들고 있습니다.PNG

원본 그림의 크기: 가로 796pixel, 세로 489pixel

 

이러한 간극은 어디에서 비롯되는 것일까요? 많은 이유가 있겠지만 쉽게 떠오르는 이유가 있습니다. 일단 인간이 개와 고양이를 구별할 때는 사진처럼 고정된 외양 정보만을 이용하지 않습니다. 인간이 개와 고양이를 대할 때는 울음소리나 짖는 소리와 같은 소리 정보, 걸음걸이와 같은 동작 정보, 사람을 대하는 태도나 습성 등 수많은 정보가 감각 기관을 통해 인간에게 동시에 들어오며, 이 모든 것이 개와 고양이를 구분하는 단서가 됩니다. 하지만 기계 학습에서는 아직 이러한 다양한 정보를 통합하여 연결 지어 학습하는 방법은 없는 것으로 알고 있습니다. 대신 기계는 이러한 약점을 빅데이터와 빠른 연산력으로 극복하기 시작했으며, 딥러닝의 최근 성과는 이에 기반한 것으로 보입니다. 기계는 다른 다양한 정보들이 없어도, 사진(고정된 시각 정보)과 같은 한 가지 정보에서 패턴을 인식하는 학습 알고리즘을 통해 개와 고양이를 구분할 수 있게 되었고, 그 정확도는 오히려 인간을 넘어서고 있는 것입니다.

 

사실 사람은 따로 배우지(학습) 않고 태어나서 자라면서 주위에서 자연스럽게 개와 고양이를 목격하는 것만으로 개와 고양이를 쉽게 구별합니다. 이는 인간의 뇌 신경망에는 오랜 세월의 진화를 통해 최적화되어, 유전을 통해 전달되는 고도의 패턴 인식기가 이미 들어 있기 때문일지도 모르며, 이제야 딥러닝 기술을 통해 인간의 시각적 인식(지각)의 바탕이 되는 패턴 인식 방법을 시뮬레이션하기 시작한 것은 아닌가라는 생각도 해 봅니다. 올바른 방법이나 모형만 개발되면 많은 데이터와 엄청난 연산력을 통해 빠르게 학습함으로써 특정 분야에서 순식간에 인간을 따라잡고 넘어설 수 있다는 것을 다시 한 번 보여주고 있습니다.

 

 

알파 제로(강화학습)

 

이는 승패를 명확히 가를 수 있는 게임 분야에서 두드러지게 드러납니다. 2016년 이세돌 9단을 꺽은 알파고를 알파고 리라고 부르는데, 그 후 성능이 보다 최적화되고 효율이 향상된 알파고 마스터가 출현(2017년 커제 9단 완파) 하였고, 알파고의 최종 버전인 알파고 제로의 경우 인간의 기보(빅데이터)에 의존하는 지도학습 없이 바둑 규칙만으로 스스로 학습(강화학습)하는 방식으로 기존의 모든 알파고의 성능을 뛰어 넘었다고 합니다. ‘알파고 제로알파고 리를 능가한 것은 학습 36시간만이고, 40일 후에는 알파고 마스터도 완전히 능가했다고 하는데, 그 동안 진행한 자가 대국이 무려 2900만 판이라고 합니다. 또한 이 알파고 제로를 좀 더 다양한 보드게임(체스 등)에 일반적으로 적용되도록 만든 것을 알파 제로라고 하며 범용 인공지능의 가능성에 한층 다가선 것으로 평가받고 있습니다.

 

그림입니다.

원본 그림의 이름: 강화학습.png

원본 그림의 크기: 가로 1280pixel, 세로 759pixel

강화학습

 

그래서 여기 왼쪽 편에는 시스템 자체가 있습니다. AI 시스템과 AI 시스템은 목표를 달성하기 위해 노력하고 있는 일종의 환경을 발견하고 그 환경은 실제 세계 또는 가상 세계일 수 있습니다. 이제 시스템은 두 가지 방식으로 환경과만 상호 작용합니다. 처음에는 그 감각 신경을 통해 환경에 대한 관찰을 얻습니다. 우리는 일반적으로 DeepMind에서 시력을 사용하지만 다른 방식을 사용할 수 있습니다. 이러한 관찰은 언제나 불완전하고 불완전합니다. 따라서 체스 게임이 아닌 현실 세계는 실제로 매우 시끄럽고 지저분합니다. 그리고 당신은 계속 진행되는 것에 대해 완전한 정보를 얻지 못합니다. 시스템의 임무는 거기 세계의 가장 좋은 모델을 구축하는 것입니다. 세계의 그 모델을 가지고 있습니다.

이 시스템의 두 번째 작업은 그 순간에 그곳에서 사용할 수 있는 일련의 행동에서 가장 가까운 행동을 취할 수 있는 최선의 행동을 선택하는 것입니다. 일단 시스템이 어떤 행동을 취했는지 결정하면, 행동이 실행되고, 그 행동이 실행되면 환경에 변화가 생길 수도 있고 그렇지 않을 수도 있으며, 그것은 새로운 관찰을 유도합니다. 이 모든 시스템이 비록 이 도표에 아주 간단하게 설명되어 있지만 숨겨진 복잡성이 많이 있습니다. 이 다이어그램 뒤에 있는 모든 것을 해결할 수 있다면 지능으로 인정받기에 충분할 것입니다. 우리는 그것이 정보를 얻기에 충분하다는 것을 압니다. 왜냐하면 이것이 인간을 포함한 모든 포유류가 배우는 방법이기 때문입니다. 우리 인류의 도파민 시스템은 강화 학습을 구현하는 두뇌입니다.

- 데미스 하사비스, Deepmind

 

저는 한 때 바둑을 좋아해서 2000년대 초에 재미삼아 컴퓨터 프로그램과 바둑을 두어보았던 적이 있습니다. 사실 오목이나 오셀로 같은 보드게임은 바둑보다 경우의 수가 훨씬 적어 그 당시 이미 컴퓨터 프로그램이 엄청난 실력을 보여주고 있었습니다. 물론 오목이나 오셀로보다 훨씬 복잡한 체스도 그 당시 이미 인간을 넘어섰지만(IBM딥 블루라는 체스 프로그램), 제가 구해서(?) 해 볼 수는 없었습니다. 그 바둑 프로그램이 초반에는 인간과 유사하게 포석을 하기도 하고(이 넓은 바둑판에서 어떻게?), 특정 사활이나 끝내기에서는 뛰어난(저보다) 능력을 보여 주는 것을 보며 놀라웠지만, 정형적인 수가 아니라 (초반에 중앙 화점에 돌을 놓는 식으로) 조금만 변칙적인 수를 두면, 어이없는 수로 대응하는 모습(마치 당황한 것처럼)을 보였던 것이 기억납니다.

 

그 당시 프로그램이 끝내기나 사활에서는 고성능을 보였지만 포석에서 성능 향상이 어려웠던 것은, 끝내기나 사활은 어려워 보이지만 사실 문제가 명확하여 프로그램으로 구현이 가능했지만, 초반 포석은 문제는 명확하지 않은 데 경우의 수는 너무 많아 프로그램으로 구현하기 어려웠기 때문입니다. 결론적으로 인간보다 훨씬 못했습니다. 하지만 컴퓨터 성능이 좋아지고 경우의 수(초반 포석 까지도)를 줄여가며 따질 수 있는 방법(물론 다 따질 수는 없습니다)이 개발되면서, 컴퓨터가 인간을 능가하게 된 것이라 볼 수 있습니다. 그래서 현재 인간 고수와 컴퓨터의 실력 차이는 끝내기나 사활이 아니라, 초반 포석에서부터 드러난다고 합니다. 또한 어느 정도 초반 포석의 경우의 수를 따질 수 있게 되면서, 알파고 제로는 기보 없이 자가 대국을 통한 학습을 통해 인간의 실력을 넘어설 수 있었던 것으로 보입니다. 그래서 알파고 제로가 자가 대국을 하면서 바둑을 두는 모습을 엿보면, 인간이 오랜 세월을 거쳐 오면서 바둑에서 알아낸 정석이나 격언(붙이면 젖혀라 등), 개념(축 등)을 알아내는 것을 볼 수도 있지만, 때로 인간의 기존 상식을 벗어난(상상을 뛰어넘는) 새로운 수가 등장하기도 한다고 합니다.

 

우주에 있는 원자의 개수 보다 더 많다는 바둑의 경우의 수를 다 따져볼 수는 없겠지만, 인간의 능력을 넘어설 만큼은 따져 볼 수 있게 된 것이 현재의 알파 제로는 아닐까 생각해 봅니다. 그 발전이 놀랍고 인간이 생각하지 못하는 부분을 제시하는 부분이 있기는 하지만 범용 알파 제로의 적용이 아직은 규칙이 명확한 보드게임 등에 한정되어 있다는 것은 직시해야 할 것으로 보입니다. 알파고를 개발한 딥마인드가 알파고 이전에 아타리의 고전 게임(벽돌깨기 등)으로 인공지능을 테스트 할 때 이미 알파 제로의 싹이 들어 있었고, 알파고의 승리를 통해 바둑에서도 그 가능성을 확인한 딥마인드가 알파 제로를 통해 그 범위를 확장시킨 것으로 볼 수 있습니다. 인터넷에서 찾은 글을 직접 인용해 보겠습니다.

 

알파고 제로까지 나왔으니 이제 인간 지식 없이 스스로 성장하는 인공지능이 가능해진 걸까? 안타깝게도 그 질문에 대한 답변은 바둑 게임에서만 그렇다. 알파고 제로가 인간 도움 없이 스스로 성장하려면 바둑 규칙에 따른 승률함수 기반 트리탐색 알고리즘이 필요한데 그걸 만드는 건 결국 똑똑한 소프트웨어 개발자, 즉 인간의 몫이다(출처 불명).

 

 

패턴 인식 : 휴리스틱스(발견법)

 

여기서 다시 한 번 지적하고 싶은 것은 딥러닝이 수학적 이치에 기반한 계산으로 이루어져 있지만, 왜 그러한 답을 출력하는지 엄밀히 설명하지 못하고 있다는 것입니다. 심하게 말해 기계의 학습이란 좋은 결과를 내는 신경망의 계수 집합을 때려 맞추는 기술입니다. 이처럼 휴리스틱한 측면이 있기 때문에 현재 딥러닝 기술은 격렬한 기술적 시행착오를 겪고 있다고 말하기도 합니다.

 

현재의 딥러닝은 스스로 패턴(특징)을 학습한다고 합니다. 어떻게 하는지는 정확히 모르지만 그 성능은 특정 분야에서 인간을 뛰어넘거나 육박하고 있습니다. 또한 반복되는 패턴만 있다면 이 방법은 여러 곳에 적용이 가능합니다. 개와 고양이의 구분과 같은 이미지뿐 아니라, 음성과 언어에도 패턴이 있습니다. 상용화되기 시작한 음성 인식 기술(애플 시리, 구글 어시스턴트, 아마존 알렉사 등)과 성능이 점점 향상되고 있는 언어 번역(구글 번역, 마이크로소프트 빙번역, 네이버 파파고, 카카오 I 번역) 기능도 모두 패턴 학습에 기반합니다.

 

특이점이 온다는 책을 통해 모든 인류의 지성을 합친 것보다 뛰어난 초인공지능(혹은 강인공지능)의 출현을 예견한 레이 커즈와일은 마음의 탄생이라는 책에서 인간의 뇌(특히 신피질) 자체가 수많은 패턴 인식기의 집합이라고 이야기하면서, 생각은 신피질에서 발생하므로 인간의 인지지능의 모방은 신피질에 대한 연구(패턴 인식)만으로 충분하다고 말하고 있습니다. 하지만 인간의 지능을 패턴 인식으로 환원하는 것은 과도해 보입니다. 이는 마치 뉴턴의 운동 법칙에 의한 기계적 세계관이 휩쓸 당시 인간의 신체를 톱니나 관절로 이루어진 기계 인형으로 구현할 수 있다고 생각한 것과 마찬가지일 수도 있습니다. 실용적으로 문제를 해결했다고 문제의 본질을 이해한 것은 아닐 수 있는 것입니다.

 

컴퓨터 과학의 선구자로 알려진 앨런 튜링이 인공지능을 판단하는 기준으로 제시한 튜링 테스트도 실용주의적 접근법을 취하고 있습니다. 튜링 테스트란 인간이 서로 보이지 않는 상태에서 상대와 대화를 나누어, 대화 상대가 컴퓨터인지 사람인지 구분할 수 없다면 그 컴퓨터는 지능을 갖고 있다(인공지능)고 봐야 한다는 주장입니다. 2014년 영국에서 유진이라는 인공지능이 튜링 테스트를 통과했다는 주장과 논란이 일었는데, 그 과정에서 튜링 테스트 자체가 인공지능이라는 개념을 제대로 반영하고 있지 못하다는 주장까지 나오고 있습니다. 이는 실용주의적 접근으로 지능을 판별하는 튜링 테스트의 한계를 보여주고 있으며, 튜링이 이런 실용주의적 테스트를 고안한 것 자체가 지능이 무엇인지 몰랐기 때문이라는 생각도 듭니다.

 

50년 뒤에는 이미테이션 게임을 해서

보통 사람으로 구성된 질문자들이

5분 동안 대화를 한 뒤 (컴퓨터의) 진짜 정체를

알아낼 수 있는 확률이 70%를 넘지 않도록

프로그래밍하는 것이 가능해질 것으로 믿는다.

 

- Alan Turing, Computing Machinery and Intelligence

 

 

인공지능? 인지자동화!

 

현재의 소위 인공지능 기술은 놀라운 성과를 보이기는 하지만 아직 인간과의 간극은 커 보입니다. 따라서 현 시점에서는 이라는 접두어를 붙이더라도 인공지능이라 명명하기보다는 냉정히 고도화된 패턴 인식에 기반한 인지자동화로 규정할 필요가 있다고 생각합니다. 아직도 기계는 생각을 하지 못하며, 단지 인간의 지각이나 일부 기억 기능을 흉내 내고 있을 뿐입니다. 사실 생각이 무엇인지 지능이 무엇인지도 정확히 모른다는 것이 솔직한 말일 것입니다.

 

한편 알파 제로의 성공은 패턴 인식에 기반한 인지자동화와 뭔가 달라 보이기도 합니다. 단순히 오목이나 오셀로, 체스 보다는 바둑이 훨씬 복잡하고 경우의 수가 많아 정복하기 힘들었기 때문입니다. 그래서 바둑을 이기는 것은 좀 더 지능에 가까워 보이며, 데이터 없이 스스로 자가 대국(자기주도학습?)을 통해 인간을 능가했기 때문에 더욱 그런 인상을 주기도 합니다. 하지만 인간에게 어려워 보이는 바둑에서 컴퓨터가 뛰어난 성능을 보이는 것은 또 하나의 모라벡의 역설일 수도 있습니다. 사람에게 쉬운 것이 컴퓨터에게는 어렵지만, 반대로 인간에게 어려운 것은 컴퓨터에게 쉽기 때문입니다.

 

더 나아가 컴퓨터로 범용 학습 알고리즘 개발에 성공한다 할지라도, 그것이 인간 존재를 능가하는 존재의 탄생이라 말할 수 있을까라는 의문은 여전히 남는다고 생각합니다. ‘사피엔스의 저자 유발 하라리호모 데우스’(신이 된 인간)라는 책에서 현재의 인공지능 기술을 보며, 지능이 의식에서 분리되고 있으며, 인간의 감각, 감정, 욕망이 모두 알고리즘에 불과하다도 말하고 있습니다. 감정이란 동물들의 올바른 결정을 돕기 위해 진화가 갈고 닦은 복잡한 알고리즘이며, 여기에 의식은 필요하지 않다고 말합니다. 그래서 인간을 능가하는 비의식적 지능인 인공지능이 출현하고, 인간은 스스로 신의 반열에 올라선다는 것입니다. 다시 말하면 유발 하라리는 인간의 자유 의지의 존재를 부정하며 의식에 대한 질문을 치워버리고, 모든 것을 생존을 위한 알고리즘의 진화로 환원하고 있는 것입니다. 물론 빅뱅에서 시작하여 의식을 가진 인간이 출현한 우주의 역사를 볼 때, 의식을 지닌 인공지능의 출현이 불가능하다고 말할 수는 없을 테지만, 의식에 대한 설명 없이 그것이 가능할지는 의문입니다.

 

강인공지능의 출현이 요원하다고 해서 현재의 기술이 별것 아니라는 것은 또 다른 이야기입니다. 김대식은 인간 vs 기계 : 인공지능이란 무엇인가라는 책에서 다음과 같이 말합니다.

 

지금까지 우리는 물질적인 생산은 다 자동화했는데 인지적인 것은 다 수작업으로 하고 있었습니다. 코딩, 디자인, 보고서를 쓰는 일들 말이죠. 다시 말해서, 약한 인공지능이 가지고 올 인지자동화로 상상을 초월하는 변화가 일어날 겁니다.

 

변화의 구체적인 사례로는 일단 내로라하는 글로벌 기업들이 공을 들이고 있는 서비스로 인공지능 비서 서비스가 있습니다. 앞에서 언급한 '아마존 알렉사', '구글 어시스턴트', '마이크로소프트 코타나', '애플 시리' 등이 그것이며 현재 국내 업체들도 서비스를 개발했거나 개발 중인 것으로 알고 있습니다. 또한 의학 치료, 법률 상담 등 빅데이터 기반 의사 결정분야에서 활용이 기대되고 있습니다(생각보다 잘 안된다는 이야기도 있습니다). 자율주행차도 빼 놓을 수 없습니다. 그리고 인터넷에 찾아보니 이제 검색의 시대는 지고 추천의 시대가 뜬다는 글이 눈에 띄었습니다. 이미 넷플릭스 영화 스트리밍 서비스, 아마존 전자상거래 서비스, 구글 뉴스 서비스, 구글 유튜브의 동영상이나 음악 추천 기능 등이 이미 추천 시스템을 이용하고 있으며, 인공지능 기술을 이용하여 그 기능이 점점 정교해지고 있으며 이러한 분야가 점점 늘어나고 있습니다. 이것이 확장되어 미래에는 광고시장 대부분이 인공지능 기술로 대체되어 맞춤형 광고를 하게 된다는 이야기도 나오고 있습니다.

 

현재 이 거대한 변화에 반응하는 방식을 몇 가지로 나누어 보고자 합니다.

 

첫째, 호들갑형. 4차 산업혁명 담론이 알파고의 성공 등으로 대중의 관심을 휘어잡으며, 일단 가장 눈에 띠고 다수가 휩쓸리고 있는 형태로 보입니다. “기계와 인간의 대결이 시작됐다. 일자리 없어진다. 큰 일 났다. 이제 우리는 감정과 같은 인간 고유의 능력 개발에 집중해야 한다.” 대체로 비관적 논조이며 기술 발전에 의한 사회 변화에 대한 대응을 전형적으로 자본주의 내에서 개인의 생존 문제로 환원하는 시각으로 보입니다.

 

둘째, 대안형. 4차 산업혁명의 사회적 변화 문제에 천착하여, 신자유주의 시대를 넘어서는 새로운 자본주의의 시대의 도래에 주목하고 새로운 대안 사회의 출현 가능성을 모색하는 시각입니다. 정보 자본주의, 포스트 자본주의, 인지 자본주의, 플랫폼 자본주의 등 새로운 명명이 등장하고 있습니다.

 

셋째, 초월형. 유발 하라리의 호모 데우스의 논조가 여기에 해당합니다. 인류는 지난 시기 자신을 괴롭히던 기아, 역병, 전쟁을 진압하고, 이제 신의 영역으로 여겨지던 불멸, 행복, 신성의 영역에 다가가고 있다는 것입니다. 인류가 신이 된다니 언뜻 낙관적 전망으로 보이지만, 신이 된다는 것이 함축하는 인본주의(인간중심주의)의 몰락은 우리에게 그저 낙관적이고 낭만적인 것으로만 보이지는 않기도 합니다.

 

넷째, 해방형. 새로운 인공지능 기술에 기반한 4차 산업혁명은 엄청난 생산력 발전을 의미하며, 이는 맑스의 예언에 따라 새로운 생산 관계를 추동한다. 자본주의는 끝났다는 시각도 보입니다.

 

다섯째, 무시형. 4차 산업혁명은 실체가 없는 허구이다. 호들갑 떨지 마라.

 

위는 어디 까지나 주관적인 구분입니다. 개인적으로 여기저기 조금씩 동의되는 부분도 있고 아닌 부분도 있지만 무엇이 맞는지는 모르겠습니다. 어쩌면 인간의 주체적 대응을 무시하고 미래를 맞추려 하는 것 자체(점쟁이도 아니고)가 비과학적이라는 생각도 듭니다. 의식적 존재인 인간의 행동 자체가 사회 변화의 변수이고 역동성의 근원이기 때문입니다. 단지 섣부른 비관이나 낙관의 호들갑을 경계하고 냉정하게 현재 기술을 돌아보며 변화에 대비하자는 생각을 해 봅니다.