Clustering using PK-D: A connectivity and density dissimilarity

Baya, Ariel Emilio; Larese, Monica Graciela; Granitto, Pablo Miguel

doi:https://dx.doi.org/10.1016/j.eswa.2015.12.037

Artículo

Clustering using PK-D: A connectivity and density dissimilarity

Baya, Ariel Emilio Icon

; Larese, Monica Graciela Icon

; Granitto, Pablo Miguel Icon

Fecha de publicación: 06/2016

Editorial: Pergamon-Elsevier Science Ltd

Revista: Expert Systems with Applications

ISSN: 0957-4174

Idioma: Inglés

Tipo de recurso: Artículo publicado

Clasificación temática:

Ciencias de la Computación

Resumen

We present a new dissimilarity, which combines connectivity and density information. Usually, connectivity and density are conceived as mutually exclusive concepts; however, we discuss a novel procedure to merge both information sources. Once we have calculated the new dissimilarity, we apply MDS in order to find a low dimensional vector space representation. The new data representation can be used for clustering and data visualization, which is not pursued in this paper. Instead we use clustering to estimate the gain from our approach consisting of dissimilarity + MDS. Hence, we analyze the partitions' quality obtained by clustering high dimensional data with various well known clustering algorithms based on density, connectivity and message passing, as well as simple algorithms like k-means and Hierarchical Clustering (HC). The quality gap between the partitions found by k-means and HC alone compared to k-means and HC using our new low dimensional vector space representation is remarkable. Moreover, our tests using high dimensional gene expression and image data confirm these results and show a steady performance, which surpasses spectral clustering and other algorithms relevant to our work.

Palabras clave: Clustering , Dimensionality Reduction

Ver el registro completo

Archivos asociados

Tamaño: 1.588Mb

Formato: PDF

Descargar

Licencia

Excepto donde se diga explícitamente, este item se publica bajo la siguiente descripción: Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Unported (CC BY-NC-SA 2.5)

Identificadores

URI: http://hdl.handle.net/11336/52658

DOI: https://dx.doi.org/10.1016/j.eswa.2015.12.037

URL: https://www.sciencedirect.com/science/article/pii/S0957417415008453

Colecciones

Articulos(CIFASIS)
Articulos de CENTRO INT.FRANCO ARG.D/CS D/L/INF.Y SISTEM.

Citación

Baya, Ariel Emilio; Larese, Monica Graciela; Granitto, Pablo Miguel; Clustering using PK-D: A connectivity and density dissimilarity; Pergamon-Elsevier Science Ltd; Expert Systems with Applications; 51; 6-2016; 151-160

Altmétricas