[IT동아 권명관 기자] 2016년 8월 16일, 안양창조경제융합센터 3층에 위치한 '에이큐브:인텔TG랩(이하 에이큐브)'에서 안양창조경제산업진흥원(원장 박병선)과 IT동아(대표 강덕원) 주최로 '인공지능의 과거와 현재 그리고 미래'라는 주제의 세미나가 열렸다. 이날 강연은 KBS 차정인 기자의 티타임, SBS 생활경제, KBS1 라디오 인문학의 산책 등에 출연하고, 국정원, 서울대, 서울시립대, 고려대, 삼성생명, 현대자동차 등 다양한 기업체 및 교육기관에서 강연하고 있는 한국인사이트연구소의 김덕진 부소장이 나섰다.
인공지능, 알파고로 시작된 관심
그는 "영국 GQ 잡지에서 한국의 '갈아만든 배'를 숙취 해소에 최고의 음료라고 언급한 바 있다. 그리고 한 국가에서 한글 '배'를 영어 'IdH'로 읽어 이 단어가 SNS 검색 수치에 상위로 올라온 적이 있다. 이렇듯 수치라는 것은 조건에 따라 판이하게 다른 결과가 도출될 수 있기 때문에 잘 살펴야 한다"라며, "지난 3월 9일부터 3월 16일까지 일주일 동안 '인공지능'이라는 단어는에 SNS 상에서 22만 2,000여 건 등장했다. 해당 기간 동안 인공지능이 언급된 이 수치는 최근 1년 3개월 동안 쌓인 데이터의 2/3가량이다. 이유는 간단하다. 알파고 때문이다"라고 설명을 시작했다.
"여기 2015년 1월 기준, 인공지능 관련 연관 검색어 수치가 있다. 1위는 로봇청소기였다. 그리고 관련 심리 검색어 중 상위 키워드는 '대체하다', '멀다', '새로운' 등으로 나타났다. 하지만, 알파고와 이세돌 9달이 대전이 있었던 3월 이후, 인공지능 관련 키워드는 '무섭다', '경이롭다', '알파고' 등으로 바뀌었다. 알파고 이전과 이후, 인공지능을 생각하는 사람들의 생각은 이렇게 많은 차이가 난다. 여기서 중요한 것은, 단순히 사람들이 인공지능을 얼마나 많이 언급했는지, 그 수치가 아니다. 우리네 실생활에서 멀리 있다고 느꼈던 '인공지능'이라는 단어가 어느 순간 훅하고 우리 일상 속으로 들어온 것을 의미한다."
김덕진 부소장은 최근 자신이 경험한 일상 속 인공지능에 대해 이야기를 보탰다. 그는 "얼마 전 첫 아이를 낳았다. 요즘 젊은이들처럼 아이 사진과 동영상을 많이 찍었다. 그리고 이렇게 자주 찍었던 사진과 동영상을 구글 포토에 모두 올렸다. 그랬더니, 지금 화면에 나오는 것처럼 여러 동영상을 편집해 하나로 보여주고, 4장의 사진을 한장의 사진으로 보여주고, 연관된 사진을 모아서 움짤처럼 보여주더라"라며, "이 콘텐츠들은 직접 만든 것이 아니다. 구글 포토가, 알아서, 자동으로 만든 콘텐츠다. 페이스북도 이와 유사한 기능을 제공한다. 여러 장의 사진을 (관련 있는 사진으로 알아서 분석해) 모으고, 음악을 선택하면 해당 음악에 맞춰 사진이 알아서 슬라이드처럼 재생된다"라고 말했다.
"대체 구글 포토와 페이스북은 어떻게 이런 기능을 제공할까. 인공지능이다. 과거에는 찍은 사진을 촬영자가 직접 폴더별로 정리해야 했다. 하지만, 요즘 누가 사진이나 동영상을 날짜나 장소별로 직접 분류하나. 그 많은 사진을. 드라이브나 하드디스크 등에 모아놓기만 해도 다행이다. 그런데, 이러한 인공지능 기능을 탑재한, 구글 포토나 페이스북은, 자체적으로 위치정보나 사진을 분석해 일관된 형태를 토대로 알아서 분류한다. 지금 보이는 '군포시', '셀카', '결혼식'이란 태그는 직접 입력하지 않았다. 구글 포토가 위치 정보와 사진 형태에 따라 알아서 분류해 준 결과다. 인공지능은 이만큼 우리들 실생활 옆에 다가와 있다."
인공지능의 역사
인공지능의 과거, 역사에 대한 설명이 이어졌다. 그는 "1956년 미국 다트머스대 수학자이자 컴퓨터 과학자였던 존 매커시는 '기계가 지식을 가지고 스스로 학습하고 행동하는 시대가 온다'라며 인공지능을 예고했다. 컴퓨터가 사람을 상대로 체스를 이기고, 알아서 음악을 만들거라는 설명도 덧붙였다. 그리고 시간이 흘러 1997년 IBM 슈퍼컴퓨터 딥블루가 체스 세계챔피언을 상대로 승리를 거뒀다. 현재에지 이르러 IBM 왓슨, 딥마인드 알파고도 등장했다"라고 말을 이어갔다.
"사실 인공지능의 역사는 1940년대로 거슬러 올라간다. 앨런 튜닝을 아시는 분이 있을지 모르겠다. 얼마 전 개봉했던 영화 '이미테이션 게임'에서 그의 일대기를 다루기도 했다. 그는 당시 2차 세계 대전 중 독일군이 매일 바꾸는 암호를 해독하기 위해 '튜링 머신'을 개발했다. 그리고 이때 적용한 이론이 '튜링 게임'이다. 자, 여기 기계(컴퓨터)와 사람이 있다고 가정하자. 그리고 기계와 사람이 다른 제 3자에게 카카오톡을 보내고, 그 카카오톡을 제 3자가 읽었을 때 기계가 보낸 것인지, 사람이 보낸 것인지 판단하지 못한다면, 인공지능이라고 봐야 한다는 이론이 튜링 게임이다. 튜링 머신은 이 이론을 기반으로 개발한 초기 인공지능이다. 기계가 모든 경우의 수를 스스로 찾아서 해결하는 방식. 때문에 인공지능에 필수라고 언급되는 '기계학습'에 가장 큰 영향을 미친 사람 중 하나로 앨런 튜닝을 꼽는다."
"튜링 머신이 공개된 이후, 당시 전세계는 인공지능 개발에 막대한 투자를 단행했다. 하지만, 별다른 성과가 나오지는 않았고, 인공지능 개발은 암흑기에 빠졌다. 90년대에 퍼지 이론을 바탕으로 자동차의 ADSL 브레이크, 세탁기의 퍼지 버튼(세탁물의 양을 세탁기가 판단한 뒤 물양을 조절하는 기능), 에어컨의 온도 조절 기능, 등에 사용되었지만, 이 역시 반짝하다가 다시 사라졌다."
"그런데, 갑자기, 어느 순간 우리는 (알파고 사건을 기점으로) 다시 인공지능에 대해서 이야기하고 있는 것일까. 역으로 생각하면 된다. 과거 인공지능을 개발하며, 문제 해결에 실패했던 것을 이제는 해결할 수 있기 때문이다. 기술이 그만큼 발전했다. 1970년대에는 영어 1줄을 번역하기 위해 컴퓨터 전체 자원이 필요했지만, 지금은 어떤가. 번역 정도는 실시간, 그 순간 바로다. 빅데이터, 클라우드, IoT 기술과 이를 뒷받침하는 막대한 인프라 자원이 있었기에 가능하다."
"그리고 이제 인공지능은, 스스로 '학습'한다. 말 그대로 사람이 아닌 기계(컴퓨터)가 지능을 갖는다. 과거의 기계가 말하는 지능은 메모리였다. 무언가를 저장하고, 이걸 기억해서, 그대로 실행하는 메모리. 이제는 한단계 더 발전해 스스로 학습하는 인공지능이 등장한 것이다. 이해하기 쉽게, 게임을 예로 들어보자. 많은 인기를 끌었던, 스트리트 파이터와 스타크래프트. 이 게임에는 사용자가 컴퓨터와 대전 또는 대결하는 시스셈이 있다. 그런데, 컴퓨터는 이 대전을 단순하게 패턴 형태로 진행한다. 각 상황에 맞춰서 여러 가지 전술을 적용해 바꾸는 것이 아니라, 일정한 패턴으로 움직이기 때문에 사용자가 편법을 사용하면 아주 쉽게 대결에서 승리할 수 있다. 그리고 게임 개발사는 이런 패턴을 다음 패치에 적용해서 업데이트하지만, 결국 패턴을 하나 더 추가했을 뿐이다. 하지만, 이제는 인공지능이 학습해서 그 상황을 터득하고, 다음을 예측해서, 결과값을 도출한다. 간단히 말해, 한번 사용했던 전술을 또 사용할 수 없는 셈이다."
인공지능, 머신 러닝
머신러닝이란 이름 그대로 컴퓨터에게 학습할 수 있는 능력을 주는 기술이다. 사람은 학습을 통해 스스로를 더욱 발전시킬 수 있다. 머신러닝도 마찬가지다. 컴퓨터에게 데이터(학습)를 제공해 성능을 더욱 향상시키는 것이다. 과거 컴퓨터의 성능을 향상시키려면 사람이 일일이 프로그램을 개발하고 이를 추가해야 했다. 반면 머신러닝을 활용하면 컴퓨터가 수집된 데이터를 바탕으로 스스로의 성능을 개선한다. 머신러닝을 활용하면 과거 컴퓨터와 인공지능에게 불가능했다고 여겨졌던 것이 가능해진다. 대표적인 것이 사진 구분.
과거에는 PC나 인터넷에서 '개'와 관련된 이미지를 찾으려면 파일에 개와 관련된 태그가 붙어 있어야 했다. 하지만, 머신러닝은 기계가 이미지를 직접 분석하고 그 속에서 개를 찾는다. 사용자가 일일이 태그나 제목을 붙이지 않아도 된다. 즉, 머신러닝에서 가장 중요한 것은 데이터다. 데이터가 축적되면 축적될 수록 더 정확하고 개선된 결과를 도출한다. 1~2건의 데이터를 추가했다고, 당장 극적인 성능 개선은 없다. 수백~수천 건의 데이터를 축적해야 성능을 개선할 수 있다. 구글 알파고도 마찬가지다. 이세돌 9단과 1번 겨루었다고 해서 '깨달음'을 얻어서 성능이 강화되지는 않는다. 수많은 기보를 입력하고 입력해야 더 나은 결과를 얻을 수 있다.
머신러닝의 데이터 학습 방식은 크게 '감독학습'과 '비감독학습'으로 나뉜다다. 감독학습은 개발자의 감독하에 데이터를 습득하는 기법으로, 특정 데이터 결과의 옳고 그름 또는 중요도를 개발자가 인공지능이나 컴퓨터에게 직접 알려주는 것이다. 인공지능은 이러한 감독학습을 통해 자신의 실수를 개선하거나, 더 비중있게 다뤄야하는 데이터가 무엇인지 파악할 수 있다.
비감독학습은 개발자의 감독 없이 스스로 데이터를 습득하고 성능을 개선하는 것이다. 개발자의 감독이 필요없기 때문에 고도의 기술이 필요하다. 머신러닝이 고도화되면 고도화될 수록 감독학습으로 습득하는 데이터보다 비감독학습으로 습득하는 데이터의 비중이 더 늘어난다. 구글 알파고가 제공받은 3,000만 가지 이상의 수는 감독학습, 100만 번 이상의 자가 대국 및 외부 대국은 비감독학습에 비유할 수 있다.
빅데이터, 클라우드, IoT = 4차 산업 혁명
마지막으로 김덕진 부소장은 "강인공지능과 약인공지능이라는 말이 있다. 강인공지능은 인공지능이 스스로 정해진 규칙을 벗어나 능동적으로 학습해 새로운 것을 창조하는 기능을 뜻하고, 약인공지능은 특정 분야에서 정햐진 규칙 내에서 학습하는 기능을 뜻한다. 그럴 일은 없지만, 영화 터미네이터 속에 등장하는 스카이넷은 강인공지능, 구글 알파고는 약인공지능이라 할 수 있다. 사람들은 강인공지능의 등장에 무서워하지만, 그럴 일은 아직 없다. 먼 미래의 요원한 일이다. 인공지능을 도입한 새로운 산업의 등장을 기대해야 한다"라고 설명을 마쳤다.
인공지능의 등장은 곧 제 4차 산업 혁명으로 이어질 것이라는 의견이 있다. 현재 IT 업계의 화두로 떠오르고 있는 빅데이터, 클라우드, IoT 기술에 기계학습과 지각 인식, 지식 추론을 할 수 있는 인공지능이 더해지면 제 4차 산업 혁명으로 이어진다는 의견이다. 이날 세미나를 주최한 안양창조산업진흥원의 박병선 원장은 "에이큐브는 창업뿐만 아니라, 다양한 트렌드를 공유하고 배울 수 있는 기회의 장을 제공하고 있다"라며, "앞으로도 여러 산업의 의미있는 주제를 공유하고, 서로 의견을 주고 받을 수 있는 네트워크 모임을 주기적으로 제공할 예정이다. 젊은 창업가들이 에이큐브를 통해 꿈을 실현할 수 있도록 지원을 아끼지 않을 것"이라고 말했다.
글 / IT동아 권명관(tornadosn@itdonga.com)