ref.
http://www.ibm.com/developerworks/kr/library/dwclm/20070109/?ca=drs-kr
개인 취향에 따른 정보와 서비스를 제공한다는 개념의 개인화 기술(Personalization Technologies) 기술이 최근 들어 높은 관심을 받고 있다. 개인화를 지원하는(혹은 그렇게 주장하는) 기술 개발이 한창이고, 이를 실제 출시했다는 기업들의 소식도 줄을 잇고 있다.
왜 개인화가 새로운 기술 코드처럼 부각되고 있을까? 필자의 생각으로는 개인화가 최근에 더 중요해진 것이라기보다는, 최근에 와서야 구현 가능하게 되었기 때문이라고 생각한다.
개인화 기술이 성숙해져 이것이 널리 보급되면 웹은 한 단계 업그레이드될 것이고 시스템 개발에 대한 수요도 크게 늘어나는 등, 새로운 성장엔진이 될 가능성이 충분하다.
그런데 컴퓨터로 개인화를 구현하는데 한가지 결정적인 문제가 있다. 그것은 컴퓨터와 인간의 차이에서 비롯된다. 예를 들어 숙달된 판매원(혹은 과거에는 구멍가게 주인)은 손님의 표정이나 행동에서 그들의 상태나 기분 등을 쉽게 파악하고 그에 맞게 적절한 대처를 할 수 있다. 그러나 컴퓨터로는 이러한 정보를 수집하는 것이 쉽지 않고, 정보가 있더라도 이를 판단하기가 어렵다. 다시 말해 컴퓨터로 개인화를 구현하려면 극복해야 할 수많은 기술적 난관이 있다는 것이다.
개인의 취향과 요구를 어떻게 알 수 있을까?
개인화에서 부딪히는 난관은 크게 개인의 취향과 요구를 어떻게 알아내느냐와 각 개인에게 맞는 제품/서비스를 어떻게 제공하느냐 하는 것으로 나눠볼 수 있다. 이 중 IT 입장에서 흥미 있는 것은 개인화된 제품/서비스 제공에 앞서 개인의 취향과 요구를 어떻게 알아내느냐 하는 것이다.
가장 손쉬운 방법은 개인에게 직접 물어 보는 것이다. 예를 들어 요즘 대부분의 사이트는 가입할 때 관심분야를 입력하도록 요구한다. 즉 이러한 관심분야에 대한 정보를 제공하겠다는 의도인데, 문제는 사람들이 정보 입력을 잘 하지 않을뿐더러 정보 자체가 불명확하다는 것이다. 어떤 사람의 관심 분야를 정치, 경제, 스포츠 등의 분류만으로 정확히 파악할 수 있을까? 물론 이러한 정보가 없는 것보다는 낫겠지만 이러한 간단한 분류는 효용이 크지 않다고 생각한다. 거기다가 사람들의 관심분야는 상황에 따라 계속 변한다. 평소에는 스포츠에 거의 관심이 없지만 월드컵, 아시안게임 같은 특별한 이벤트가 있을 때에는 스포츠에 관심을 갖는 사람들이 그 예일 것이다.
사람, 내용, 지식체계를 바탕으로 하는 기술
그래서 직접 물어보지 않고 개개인의 취향을 알아내는 기술이 고안되었다. 대표적으로 사용되는 기술은 크게 사람을 바탕으로 하는 기술, 내용을 바탕으로 하는 기술, 지식체계를 바탕으로 하는 기술 등 세 가지로 나누어 볼 수 있다.
사람을 바탕으로 하는 기술의 기본 아이디어는 어떤 사람과 비슷한 사람들을 찾아내면 이들로부터 그 사람의 선호도를 알아낼 수 있다는 것이다. 가수 A와 B의 노래를 무척 좋아하는 사람이 있다고 하자. 그러면 가수 A와 B를 좋아하는 사람들을 찾아낸 후에 이 사람들이 좋아하는 다른 공통적인 것이 무엇인지 살펴봄으로써 이들의 선호도를 유추해 볼 수 있다. 아마존의 추천 시스템이 이에 근간한 협업 필터링(collaborative filtering)을 사용한다.
내용을 바탕으로 하는 기술은 어떤 정보의 내용을 분석함으로써 개개인의 선호도를 파악한다. 어떤 사람이 아시안 게임에 대한 기사를 읽고 있다고 하자. 이 사람이 어떤 특성의 기사들을 주로 읽었는지를 분석해 보면 이 사람의 선호도에 대한 유추가 가능하다. 문서 내용을 분석하는 기술은 내용 필터링(content filtering, 문헌 정보학에서 오래 전부터 발전되어온 기술)이 대표적이다. 구글에서 검색결과를 보여줄 때 문서 뒤에 꼭 ‘비슷한 페이지(similar documents)’라는 링크가 붙는데, 이때 사용되는 기술 중 하나가 내용 필터링이다.
지식체계를 바탕으로 하는 기술은 주어진 도메인이나 상황에 대한 지식을 컴퓨터 안에 일정 형태로 집어 넣어 이를 이용하는 기술이다. 사람이 컴퓨터보다 우월한 점 중 하나가 애매하고 불확실한 정보라도 이를 바탕으로 맞든 틀리든 나름의 지식체계를 구축할 수 있다는 점이다. 그래서 컴퓨터도 이러한 지식체계 혹은 큰 그림을 갖추면 훨씬 똑똑하게 사람을 이해할 수 있으리라 생각하는 것이다. 시맨틱 웹(semantic web)이나 온톨로지(ontology)라는 개념도 결국 크게 보면 컴퓨터에 지식체계를 적용하기 위한 기술이라고 할 수 있다.
상황에 따라 개인의 취향도 바뀐다
여기에 더하여 최근에 개발되는 기술들은 사용자의 상황 정보(context information)를 활용하려는 추세를 보인다. 상황이라는 것은 같은 사람이라도 그때그때 바뀐다는 특징이 있다. 앞에서 예로 들었던 스포츠를 좋아하지 않는 사람이 아시안 게임이나 올림픽 때문에 스포츠 기사에 관심을 갖는 것이 상황 변화의 좋은 예라고 할 수 있다.
상황 변수를 활용하는 가장 간단한 방법은 사람이 규칙을 만들어 활용하는 방법이다. “밸런타인데이 전날에 꽃에 관계된 정보를 찾는 20대 남자에게는 보석류를 추천하라” 같은 규칙을 만들어 컴퓨터에 입력하는 형태다.
또 다른 방법은 컴퓨터가 스스로 학습해 위와 같은 규칙을 만들 수 있게 하는 것이다. 인공지능 분야에서 개발된 신경망(neural network)이나 생물의 진화를 흉내낸 제네틱 알고리듬(genetic algorithm) 등은 상황 변수에 따른 컴퓨터의 행동 규칙을 학습하는 좋은 기술이 될 수 있다. 하지만 아직 이 기술은 완벽하지 않기 때문에 당분간은 사람의 수작업과 병행될 것으로 보인다.
하이브리드를 고려해보자
필자의 견해로는 개인화는 아주 유망한 분야지만 단기간 내에 완벽한 구현이 이뤄질 만큼 기술 개발이 가능한 성질은 아니다. 개인화 기술에 관심을 갖고 있는 개발자가 있다면 한 가지 기술에 집착하지 말고 여러 가지 기술을 결합하는 것을 권하고 싶다. 여러 가지 기술을 결합한 하이브리드 시스템이 더 정확하기 때문이다.
또한 상황 정보가 중요하므로 이를 어떻게 최대한 수집하고 활용할 수 있을지 그 방법을 찾는 것이 성공의 관건이 될 것으로 생각한다. 개발자의 입장에서 방대한 자료를 어떻게 수집하고 처리하느냐 하는 이슈가 당장에는 중요하겠지만 장기적으로는 이를 어떻게 활용하느냐가 부가가치도 높고 성공을 좌우하는 기술이 될 것이다. 구글 검색이 정확한 이유 중 하나는 기본적인 키워드 검색에다 사람이 생성한 링크 구조(link structure)라는 정보를 추가적으로 활용하기 때문이다. 마찬가지로 사람들이 생성하는 수많은 상황 변수를 적절히 활용하면 훨씬 더 정확한 개인화가 가능할 것이다. 웹의 새로운 변화 가능성을 제시할 수 있는 개인화 기술이 더욱 발전하길 기대해본다.