Mostrar el registro sencillo del ítem
dc.contributor.author
Amalfitano, Agustín
dc.contributor.author
Stocchi, Nicolas
dc.contributor.author
Atencio, Hugo Marcelo
dc.contributor.author
Villarreal, Fernando Daniel
dc.contributor.author
Ten Have, Arjen
dc.date.available
2025-07-22T13:15:01Z
dc.date.issued
2024-08
dc.identifier.citation
Amalfitano, Agustín; Stocchi, Nicolas; Atencio, Hugo Marcelo; Villarreal, Fernando Daniel; Ten Have, Arjen; Seqrutinator: scrutiny of large protein superfamily sequence datasets for the identification and elimination of non-functional homologues; BioMed Central; Genome Biology; 25; 1; 8-2024; 1-23
dc.identifier.issn
1474-760X
dc.identifier.uri
http://hdl.handle.net/11336/266803
dc.description.abstract
Seqrutinator is an objective, flexible pipeline that removes sequences with sequencing and/or gene model errors and sequences from pseudogenes from complex, eukaryotic protein superfamilies. Testing Seqrutinator on major superfamilies BAHD, CYP, and UGT removes only 1.94% of SwissProt entries, 14% of entries from the model plant Arabidopsis thaliana, but 80% of entries from Pinus taeda’s recent complete proteome. Application of Seqrutinator on crude BAHDomes, CYPomes, and UGTomes obtained from 16 plant proteomes shows convergence of the numbers of paralogues. MSAs, phylogenies, and particularly functional clustering improve drastically upon Seqrutinator application, indicating good performance.
dc.format
application/pdf
dc.language.iso
eng
dc.publisher
BioMed Central
dc.rights
info:eu-repo/semantics/openAccess
dc.rights.uri
https://creativecommons.org/licenses/by-nc-nd/2.5/ar/
dc.subject
Sequence analysis
dc.subject
Sequence mining
dc.subject
Clustering
dc.subject
Bioinformatics
dc.subject.classification
Biología
dc.subject.classification
Ciencias Biológicas
dc.subject.classification
CIENCIAS NATURALES Y EXACTAS
dc.title
Seqrutinator: scrutiny of large protein superfamily sequence datasets for the identification and elimination of non-functional homologues
dc.type
info:eu-repo/semantics/article
dc.type
info:ar-repo/semantics/artículo
dc.type
info:eu-repo/semantics/publishedVersion
dc.date.updated
2025-07-22T12:04:13Z
dc.journal.volume
25
dc.journal.number
1
dc.journal.pagination
1-23
dc.journal.pais
Reino Unido
dc.journal.ciudad
Londres
dc.description.fil
Fil: Amalfitano, Agustín. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Mar del Plata. Instituto de Investigaciones Científicas y Tecnológicas en Electrónica. Universidad Nacional de Mar del Plata. Facultad de Ingeniería. Instituto de Investigaciones Científicas y Tecnológicas en Electrónica; Argentina
dc.description.fil
Fil: Stocchi, Nicolas. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Mar del Plata. Instituto de Investigaciones Biológicas. Universidad Nacional de Mar del Plata. Facultad de Ciencias Exactas y Naturales. Instituto de Investigaciones Biológicas; Argentina
dc.description.fil
Fil: Atencio, Hugo Marcelo. Instituto Nacional de Tecnología Agropecuaria. Centro Regional Buenos Aires Sur. Estación Experimental Agropecuaria Balcarce; Argentina
dc.description.fil
Fil: Villarreal, Fernando Daniel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Mar del Plata. Instituto de Investigaciones Biológicas. Universidad Nacional de Mar del Plata. Facultad de Ciencias Exactas y Naturales. Instituto de Investigaciones Biológicas; Argentina
dc.description.fil
Fil: Ten Have, Arjen. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Mar del Plata. Instituto de Investigaciones Biológicas. Universidad Nacional de Mar del Plata. Facultad de Ciencias Exactas y Naturales. Instituto de Investigaciones Biológicas; Argentina
dc.journal.title
Genome Biology
dc.relation.alternativeid
info:eu-repo/semantics/altIdentifier/url/https://genomebiology.biomedcentral.com/articles/10.1186/s13059-024-03371-y
dc.relation.alternativeid
info:eu-repo/semantics/altIdentifier/doi/http://dx.doi.org/10.1186/s13059-024-03371-y
Archivos asociados