Mostrar el registro sencillo del ítem
dc.date.available
2024-09-09T12:29:45Z
dc.identifier.citation
Alberca, Lucas Nicolás; Bellera, Carolina Leticia; Prada Gori, Denis Nihuel; Llanos, Manuel; Talevi, Alan; (2024): Datasets used in the benchmarking exercise by SOMOC and iRAPCA. Consejo Nacional de Investigaciones Científicas y Técnicas. (dataset). http://hdl.handle.net/11336/243803
dc.identifier.uri
http://hdl.handle.net/11336/243803
dc.description.abstract
Two open-source in-house methodologies for clustering of small molecules are presented: iterative Random subspace Principal Component Analysis clustering (iRaPCA), an iterative approach based on feature bagging, dimensionality reduction, and K-means optimization; and Silhouette Optimized Molecular Clustering (SOMoC), which combines molecular fingerprints with the Uniform Manifold Approximation and Projection (UMAP) and Gaussian Mixture Model algorithm (GMM). In a benchmarking exercise, the performance of both clustering methods has been examined across 29 datasets containing between 100 and 5000 small molecules, comparing these results with those given by two other well-known clustering methods, Ward and Butina. iRaPCA and SOMoC consistently showed the best performance across these 29 datasets, both in terms of within-cluster and between-cluster distances.
dc.rights
info:eu-repo/semantics/openAccess
dc.rights.uri
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.title
Datasets used in the benchmarking exercise by SOMOC and iRAPCA
dc.type
dataset
dc.date.updated
2024-09-09T11:06:47Z
dc.description.fil
Fil: Alberca, Lucas Nicolás. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata; Argentina. Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos; Argentina
dc.description.fil
Fil: Bellera, Carolina Leticia. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata; Argentina. Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos; Argentina
dc.description.fil
Fil: Prada Gori, Denis Nihuel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata; Argentina. Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos; Argentina
dc.description.fil
Fil: Llanos, Manuel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata; Argentina. Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos; Argentina
dc.description.fil
Fil: Talevi, Alan. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata; Argentina. Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos; Argentina
dc.datacite.PublicationYear
2024
dc.datacite.Creator
Alberca, Lucas Nicolás
dc.datacite.Creator
Bellera, Carolina Leticia
dc.datacite.Creator
Prada Gori, Denis Nihuel
dc.datacite.Creator
Llanos, Manuel
dc.datacite.Creator
Talevi, Alan
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata
dc.datacite.affiliation
Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata
dc.datacite.affiliation
Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata
dc.datacite.affiliation
Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata
dc.datacite.affiliation
Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata
dc.datacite.affiliation
Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos
dc.datacite.publisher
Consejo Nacional de Investigaciones Científicas y Técnicas
dc.datacite.subject
Otras Ciencias Químicas
dc.datacite.subject
Ciencias Químicas
dc.datacite.subject
CIENCIAS NATURALES Y EXACTAS
dc.datacite.date
01/03/2021-31/07/2021
dc.datacite.DateType
Recolectado
dc.datacite.language
eng
dc.datacite.version
1.0
dc.datacite.description
The datasets were compiled from various repositories, are represented in SMILES notation and have been curated and standardized.
dc.datacite.DescriptionType
Métodos
dc.datacite.FundingReference
PICT-CATI-2021-00073
dc.datacite.FundingReference
00984-2019-PICT
dc.datacite.FunderName
Ministerio de Ciencia, Tecnología e Innovación Productiva. Agencia Nacional de Promoción Científica y Tecnológica. Fondo para la Investigación Científica y Tecnológica
dc.datacite.FunderName
Ministerio de Ciencia, Tecnología e Innovación Productiva. Agencia Nacional de Promoción Científica y Tecnológica. Fondo para la Investigación Científica y Tecnológica
dc.relationtype.isSourceOf
11336/223388
dc.subject.keyword
CLUSTERING
dc.subject.keyword
SMALL MOLECULES
dc.subject.keyword
BENCHMARKING
dc.subject.keyword
DATASETS
dc.subject.keyword
CHEMINFORMATICS
dc.subject.keyword
MEDICINAL CHEMISTRY
dc.datacite.resourceTypeGeneral
dataset
dc.conicet.datoinvestigacionid
20151
dc.datacite.awardTitle
Reposicionamiento de fármacos dirigido contra la N-miristoil transferasa de Toxoplasma gondii, un nuevo blanco terapéutico contra la toxoplasmosis humana
dc.datacite.awardTitle
Cribado fenotípico in silico aplicado a la búsqueda de alternativas terapéuticas para la enfermedad de Chagas, validación in vitro y caracterización in vivo.
dc.datacite.geolocation
La Plata
dc.datacite.formatedDate
2021
Archivos del conjunto de datos
Archivo
Notas de uso
Tamaño