[IT동아 안수영 기자] 최근 다양한 창업 지원 공간들이 생겨나고 있고, 국가에서도 많은 지원을 하고 있다. 경기도도 예외가 아니다. 예를 들면 광교 지역에서는 지난 4월에 광교 경기문화창조허브가 개소했다.
광교 경기문화창조허브는 주로 미디어아트와 문화기술 분야에 특화된 사업들을 펼치는 창업 지원 공간이다. 그 사업의 일환으로 현재 미디어아트와 문화기술을 주제로 한 특강을 6월부터 8월까지 개최하고 있다. 해당 분야에 관심있는 일반인, 대학생, 예비창업자라면 누구나 참여 가능하다.
7월 24일 개최된 강연은 '텍스트 마이닝에 기반한 마케팅 전략 수립'이라는 주제로 엔데이터의 최영준 이사가 강연을 펼쳤다. 이날 행사에는 약 30명의 참가자들이 참석했다.
텍스트 분석으로 마케팅 전략을 도출할 수 있다?
최근 IT 분야뿐만 아니라 다양한 산업 분야에서 '빅데이터 분석'이 중요하다고 말한다. 빅데이터란 무엇일까. 말 그대로 '큰 데이터, 많은 데이터'를 뜻한다. 과거에는 방대한 양의 데이터를 모두 분석하기 어려웠지만, 이제는 기술이 발달해 많은 양의 데이터를 빠르게 처리, 저장할 수 있게 됐다. 이처럼 방대한 데이터를 분석하면 기존에는 알기 어려웠던 새로운 통찰이나 가치를 추출해낼 수 있다. 예를 들면 빅데이터를 활용해 자연재해에 대비하거나, 소비자들이 제품에 대해 느끼는 불만을 찾아내고 새로운 전략을 수립할 수 있다.
그렇다면 데이터를 분석하려면 어떻게 해야 할까? 최 이사는 "먼저 데이터의 종류에 대해 알아둘 필요가 있다"라고 말했다. 데이터의 종류는 크게 정형 데이터, 비정형 데이터다. 정형 데이터란 수치로 표현되고 데이터베이스에 저장되는 값이라 할 수 있다. 비정형 데이터는 우리가 일상에서 적은 글(텍스트), 사진, 비디오, 오디오 등을 일컫는다. 사실상 우리가 일상에서 접하는 정보들의 대다수가 비정형 데이터인 셈이다. 그런데 데이터를 분석하려면 비정형 데이터를 정형화된 형태로 바꿔야 한다. 만약 우리가 비정형 데이터를 분석한다면, 생각지도 못한 영역을 활용할 수 있는 시대가 열릴 것이다.
비정형 데이터 중에서도 텍스트 데이터를 분석해 의미 있는 정보를 추출하고 가공하는 것을 '텍스트 마이닝'이라고 한다. 텍스트 마이닝은 어떤 가치를 줄 수 있을까. 최 이사는 "우리가 포털사이트에 맛집을 검색하면 수많은 글들이 나온다. 만약 서울에서 맛있는 한식집을 찾으려 할 경우, 수많은 뉴스와 블로그를 모두 살펴보게 된다. 검색 기능은 유용하기도 하지만, 사용자가 검색 결과를 모두 살펴보아야 한다는 점에서는 다소 불편하다. 특정 키워드가 들어 있는 글이라면, 사용자가 원하는 내용과 관계가 없더라도 모두 조회되기 때문이다. 만약 텍스트마이닝을 통해 분류, 태깅한다면 어떨까. 사용자가 원하는 정보만 효율적으로 추출하기 쉬울 것이다"라고 설명했다.
텍스트 마이닝은 그 유용함 덕분에 소비재 및 금융, 하이테크, 통신, 보험, 의료, 교육, 정치 등 사회 전반 분야에서 활용될 가능성이 무궁무진하다. 예를 들어, 은행의 입출금 내역 기록을 모두 분석해보면 자산관리 분야에 도움이 되는 방법이 나올 수도 있다. 의사들의 진료 기록을 모두 분석한다면 과거 병원을 방문한 환자와 비슷한 증상을 보이는 사람이 향후 어떤 병에 걸릴 가능성이 있는지 예측할 수도 있다.
그렇다면 텍스트 분석은 어떻게 할 수 있고, 어떻게 해야 할까. 최 이사는 "텍스트를 분석하는 컴퓨터가 인간의 말을 이해하도록 해야 한다"고 말했다. 인간이 하는 말과 글은 컴퓨터 프로그램 코드처럼 정확하지 않고, 같은 말이라도 문맥이나 뉘앙스에 따라 다양한 의미를 내포한다. 예를 들어 "괜찮아요"라는 말이 인물이나 상황에 따라서는 긍정적일 수도, 부정적인 의미일 수도 있다. 또한, 텍스트 분석을 할 때는 띄어쓰기도 중요하다. 컴퓨터는 텍스트를 분석할 때 인간이 의도한 그대로 띄어쓰기를 이해하지 못하는 경우가 있다. 예를 들면 '전부드러운남자입니다', '아버지가방에들어가신다'와 같은 표현이 그렇다. 특히 인터넷, SNS에서 사람들이 적는 텍스트는 띄어쓰기가 정확하지 않은 경우도 흔하다. 이것이 텍스트 마이닝으로 의미 있는 데이터를 얻으려 할 때, 단순한 분석을 해서는 안 되는 이유다.
의미있는 데이터를 얻으려 할 때, 오피니언 마이닝도 중요하다. 오피니언 마이닝은 텍스트로 표현된 의견, 감성, 주관, 평가, 태도, 판단, 영향, 관점, 감정 등을 파악하기 위한 분석 기법이다. 주로 리뷰, 블로그, 토론, 뉴스, 댓글, 피드백 등 다양한 문서를 대상으로 한다. 최 이사는 오피니언 마이닝이 중요한 이유에 대해 "인간은 어떤 행동을 할 때 다른 사람들의 의견이나 감성을 참고하기 때문이다. 또는 다른 사람들이 어떤 결정을 내릴 때 의견을 피력함으로서 영향을 미치기도 한다"라고 설명했다. 사람들이 물건을 구매하기 전에 블로그를 참고하는 것과 같은 논리다. 많은 기업들이 고객들의 반응을 궁금해하는 만큼, 오피니언 마이닝에 많은 관심을 기울이고 있다.
강의에서 최 이사는 실제 텍스트 마이닝을 이용해 마케팅에 도움이 된 사례를 소개했다. 한 콜센터 전문기업에서 상담 노트 기록을 텍스트마이닝으로 분석한 것이다. 우선, 텍스트 분석을 위해 문서 내 주제와 키워드를 분석하고 감정노출, 대외기관 언급, 서비스, 업무 처리현황 등을 다각도로 분석했다. 또한, 이러한 결과를 토대로 소비자가 제품에 대해 어떠한 불만을 갖고 있는지를 파악해 브랜드 리스크를 최소화하고, 민원을 예측할 수 있었다. 제품의 경쟁력, 기술 동향, 커뮤니케이션에 대한 고객 반응 역시 추출할 수 있었다.
최 이사는 "이것이 바로 텍스트 마이닝을 통해 도출할 수 있는 결과물이며, 이는 마케터가 알아야 하는 내용이 추출되는 셈이다. 이러한 분석을 통해 마케팅 전략과 대응을 효율화할 수 있다"라고 설명했다. 텍스트 분석을 통해 기존에는 정확히 알 수 없었던 수많은 가치와 전략을 발굴할 수 있는 셈이다. 방대한 자료를 실시간으로 분석할 경우, 시시각각 변화하는 시장 상황에 대해서도 파악할 수 있다. 최 이사는 "마케팅을 할 때는 고객에게 무엇을 말할 수 있는지가 중요하다. 소비자에게 어떤 이야기를 할지, 이를 텍스트 분석을 통해 얻어낼 수 있다"라고 전했다.
한편, 이날 행사에는 경품 추첨도 이루어졌다. 강연에 참석한 사람들 중 1명에게 추첨을 통해 에이수스 태블릿(모델명 ME70CX)를 전달했다. 매주 금요일 열리는 문화기술 세미나는 에이수스가 후원하며, 매주 추첨을 통해 태블릿을 제공할 예정이다.
광교 경기문화창조허브의 주제 특강은 미디어아트 및 문화기술 분야로 나누어 진행되며, 2개월에 걸쳐 각 7회, 9회씩 열린다. 미디어아트 분야 세미나는 매주 목요일, 문화기술 분야 세미나는 매주 금요일 개최된다.
* 해당 기사에 대한 의견은 IT동아 페이스북(www.facebook.com/itdonga)으로도 받고 있습니다.
글 / IT동아 안수영(syahn@itdonga.com)