Artículo
La predicción de múltiples localizaciones subcelulares en proteínas brinda información relavante para el descubrimiento de funciones biológicas. El uso de métodos computacionales basados en el conocimiento puede ser un buen punto de partida para conducir a las costosas validaciones experimentales. En este trabajo, presentamos un framework de clasificación multi-etiqueta para para realizar la predicción en Gene Ontology - Componente Celular enfocada en la mejora de dos aspectos del diseño: i) la caracterización de la secuencia proteica, relacionando el conocimiento biológico con la evidencia experimental; y ii) la evaluación de errores al considerar un modelo de ruido inherente a los frameworks de predicción reales. Nuestra propuesta es validada contra un conjunto de secuencias de proteínas de cuatro organismos modelos D. rerio, A. thaliana, S. cerevisiae and D. melanogaster. Prediction of multiple subcellular localizations in proteins brings relevant information for biologicalfunction discovery. The use of computational methods based on knowledge can be a helpful starting point forguiding the costly experimental validation. In this work, we present a multilabel classifier framework to performGene Ontology - Cellular Component prediction focused on the improvement of two design aspects: i) the proteinsequence characterization, regarding biological knowledge with experimental evidence, and ii) the error evaluation byconsidering a noise model inherent in real prediction frameworks. Our proposal is validated against sets of well-knownprotein sequences of four model organisms D. rerio, A. thaliana, S. cerevisiae and D. melanogaster
Proper integration of feature subsets boosts GO subcellular localization predictions
Spetale, Flavio Ezequiel
; Tapia Paredes, Elizabeth; Murillo, Javier
; Krsticevic, Flavia Jorgelina
; Ponce, Sergio; Angelone, Laura Monica; Bulacio, Pilar Estela
Fecha de publicación:
03/2018
Editorial:
Sociedad Argentina de Bioingeniería
Revista:
Revista Argentina de Bioingeniería
ISSN:
0329-5257
Idioma:
Inglés
Tipo de recurso:
Artículo publicado
Clasificación temática:
Resumen
Palabras clave:
Cellular Component
,
Prediction
,
Multilabel Classification
Archivos asociados
Licencia
Identificadores
Colecciones
Articulos(CIFASIS)
Articulos de CENTRO INT.FRANCO ARG.D/CS D/L/INF.Y SISTEM.
Articulos de CENTRO INT.FRANCO ARG.D/CS D/L/INF.Y SISTEM.
Citación
Spetale, Flavio Ezequiel; Tapia Paredes, Elizabeth; Murillo, Javier; Krsticevic, Flavia Jorgelina; Ponce, Sergio; et al.; Proper integration of feature subsets boosts GO subcellular localization predictions; Sociedad Argentina de Bioingeniería; Revista Argentina de Bioingeniería; 22; 1; 3-2018; 3-6
Compartir