계보적/계층적 클러스터링은 말그대로 계층적으로 군집을 나누는 방법입니다.
흔히사람들은관심 집단을 동일수준에서몇개의 그룹으로 서로 배타적으로 구분하고싶어하는 욕심이 있습니다.
제가 2004년에 허명회 선생님의 글을 포스팅한적이 있었는데, 그 글에적절한 예가 있습니다.
"고등학교 때 학우들을 생각해보자. 얌전한 모범생부터 활동적인 리더, 지사적 극기형, 몽상가형, 사고뭉치형 등 여러 그룹이 있었다. 인간이란 본래 집합적 대상을 이해할 때는 이와 같이 분류를 중간과정으로 활용하는 경향이 있다."
Social Network Analysis 에서 K-means Clustering 은 어떤 소셜 네트웍을 주어진 수(=K)의 그룹으로 분류하기 위한 방법입니다.
K-means Clustering 의 알고리즘은 대충 아래와 같습니다.
1) 임의의 중심점(Centroid)를 K개 잡습니다.
2)중심점(Centroid)에서 가장 가까운 거리에 있는 사람들을 해당 그룹에 배속시킵니다.
3) 모두 배속되면 각 그룹의 중심점(Centroid)을 새롭게 계산합니다.
4) 위의 2)~3)번과정을 충분히 반복하여 최적의 중심점을 찾습니다.
Clustering 및 Classification Software인 Clustan 사이트에서는 K=2 인 K-means Procedure 에 대해서 아주 명쾌한 설명을 해주고 있습니다. http://www.clustan.com/k-means_critique.html
문제는 그룹의 갯수 K개 입니다. 사전에 해당 Social Network 에 대한 정보가 없다면 K 개의 그룹도 의미가 없을 수 있습니다.
그래서, 관심대상이되는 그룹의 수 K를 결정하기 위한 연구들도 많습니다.
K를 잘 찾기위해서는 사전에 해당 Social Network 에 대한 기술적 분석이나, 다른 그룹핑 방법들을 통해 해당 Social Network 의 특성을 이해하는 것도 좋은 방법입니다.
'아임IN, 푸딩과 SNS' 카테고리의 다른 글
사람들은 facebook 으로 무엇을 할까 - 사회학적 접근 (0) | 2009.02.23 |
---|---|
조직이 커지면 왜 커뮤니케이션 하기 힘들까? (0) | 2009.02.20 |
Supervised or Unsupervised .... (2) | 2009.01.20 |
A라는 사람과 B라는 사람은 유사한가? - 다차원 척도법(MDS)에 대해서 (1) | 2009.01.19 |
그사람과 나의거리 - 상사성(similarity)와 거리(distance) (1) | 2009.01.17 |
COMMENT