앞서 사람과 사람 사이의 거리에 대한 이야기를 했었는데요, 오늘은 잠시 다차원 척도법(이하 MDS, Multi-Dimensional Scaling)에 대해서 간단히 말씀 드리겠습니다.

SNA 관점에서 다차원척도법이란관심이 되는 Social Network 에 속한사람에 대한 다차원상의 거리를 나타내는 자료로부터 그들간의 상사성(similarity)혹은 비상사성(dissimilarity)을 저차원의 공간에 기하적으로 나타내려는분석기법입니다.

원래 MDS는정치학, 경제학, 심리학, 사회학,지리학, 교육학 등의 여러분야에서 많이 활용되는그래프적 시각화 분석 방법입니다.

MDS를 이용하면 오프라인이나 인터넷 상에서의 인맥관계나프로파일의유사성 데이터를 기반으로 친구를 추천하거나,성향을 파악하거나혹은 그룹핑을하는데 도움을 받을 수 있습니다.

그런데 다차원 척도법에서 이용되는 자료의 형태는 nXn 인상사/비상사성 행렬입니다.

일반적으로 이러한 자료는획득하기가 무척어렵습니다.

서울과 부산의 거리는 말그대로 measure 가 가능한 metric 이지만, 대부분의 경우 관계란 non metric한 정보들이기때문이지요.

보통, 사내에서메일을 주고받은 사람간의 상호 주고 받은횟수에 대한 행렬이나, SNS 에서 친구관계등을 nXn 의 행렬로 표현할 수는 있습니다.

그러나 이 역시 우리가관심있어하는 넓은 영역에 비해서는 아주 단순한 자료들 일 수 밖에 없습니다.

따라서, 통상 우리가 얻는 데이터들 즉, 관심을 이루는 n 명으로 구성된 social network데이터와 p개의 프로파일 혹은,획득된 정보가 있다고 하면, 우리는 먼저 이를 기준으로 상호간의 거리나 유사도를 측정합니다.

거리나 유사도를 측정하는 방식은,자료의 종류와 성격에 따라 앞서 말씀 드린각각의 거리에 맞는사용되는공식이 적용 되거나,잘 알고 계신피어슨 상관계수 혹은, jaccard's coefficient 와 같은 유사성 계수를통해 구하게 됩니다.이 과정을 nXn (혹은 nXn/2)-n 만큼 반복하면 되겠습니다.

이렇게 구해진 행렬은 MDS 알고리즘을 적용해 구성원들 개개인을 저차원의 공간에 투영할 수 있는 좌표를 구하게 될 수 있습니다.

< MDS - Toby Segaran 의 자료에서 빌려왔습니다..>



사람과 사람 사이를 분석하는 것은 멀고도 험한 길인가 봅니다..^^

2009. 1. 19. 00:34