카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체가 개시된다. 본 발명에 따른 카테고리 태그 정보를 이용한 웹 페이지 분류 방법은, 분류하고자 하는 웹 페이지로부터 상기 웹 페이지의 구조 정보를 포함하는 카테고리 태그 정보를 추출하는 단계; 상기 추출된 카테고리 태그 정보 및 상기 웹 페이지의 각각의 섹션에 관리자에 의해 미리 설정된 가중치를 부여하는 단계; 상기 부여된 가중치에 따라 상기 웹 페이지를 구성하는 구(phrase)를 이용하여 상기 웹 페이지의 다큐먼트 벡터(document vector)를 생성하는 단계; 상기 웹 페이지의 다큐먼트 벡터와 데이터베이스에 미리 저장된 트리 형태의 자료 구조인 분류 트리(Taxonomy tree)의 각 노드를 구성하는 구를 이용하여 생성된 각 노드의 센트로이드 벡터(centroid vector)의 코사인 유사도(Cosine Similarity) 함수값을 연산함으로써, 상기 웹 페이지와 유사한 복수 개의 노드들을 추출하는 단계; 상기 추출된 복수 개의 노드들 간의 상기 분류 트리 상의 상대 거리를 연산하는 단계; 상기 연산된 상대 거리를 이용하여 상대 거리 스코어를 추출하고, 최소 상대 거리 스코어를 가지는 상기 웹 페이지와 가장 유사한 노드를 선정하는 단계; 및 상기 선정된 가장 유사한 노드에 상기 웹 페이지를 부착...(이하생략)
|