Repositorio Institucional
Repositorio Institucional
CONICET Digital
  • Inicio
  • EXPLORAR
    • AUTORES
    • DISCIPLINAS
    • COMUNIDADES
  • Estadísticas
  • Novedades
    • Noticias
    • Boletines
  • Ayuda
    • General
    • Datos de investigación
  • Acerca de
    • CONICET Digital
    • Equipo
    • Red Federal
  • Contacto
JavaScript is disabled for your browser. Some features of this site may not work without it.
  • INFORMACIÓN GENERAL
  • RESUMEN
  • ESTADISTICAS
 
Artículo

Seqrutinator: scrutiny of large protein superfamily sequence datasets for the identification and elimination of non-functional homologues

Amalfitano, AgustínIcon ; Stocchi, NicolasIcon ; Atencio, Hugo Marcelo; Villarreal, Fernando DanielIcon ; Ten Have, ArjenIcon
Fecha de publicación: 08/2024
Editorial: BioMed Central
Revista: Genome Biology
ISSN: 1474-760X
Idioma: Inglés
Tipo de recurso: Artículo publicado
Clasificación temática:
Biología

Resumen

Seqrutinator is an objective, flexible pipeline that removes sequences with sequencing and/or gene model errors and sequences from pseudogenes from complex, eukaryotic protein superfamilies. Testing Seqrutinator on major superfamilies BAHD, CYP, and UGT removes only 1.94% of SwissProt entries, 14% of entries from the model plant Arabidopsis thaliana, but 80% of entries from Pinus taeda’s recent complete proteome. Application of Seqrutinator on crude BAHDomes, CYPomes, and UGTomes obtained from 16 plant proteomes shows convergence of the numbers of paralogues. MSAs, phylogenies, and particularly functional clustering improve drastically upon Seqrutinator application, indicating good performance.
Palabras clave: Sequence analysis , Sequence mining , Clustering , Bioinformatics
Ver el registro completo
 
Archivos asociados
Thumbnail
 
Tamaño: 4.397Mb
Formato: PDF
.
Descargar
Licencia
info:eu-repo/semantics/openAccess Excepto donde se diga explícitamente, este item se publica bajo la siguiente descripción: Atribución-NoComercial-SinDerivadas 2.5 Argentina (CC BY-NC-ND 2.5 AR)
Identificadores
URI: http://hdl.handle.net/11336/266803
URL: https://genomebiology.biomedcentral.com/articles/10.1186/s13059-024-03371-y
DOI: http://dx.doi.org/10.1186/s13059-024-03371-y
Colecciones
Articulos(ICYTE)
Articulos de INSTITUTO DE INVESTIGACIONES CIENTIFICAS Y TECNOLOGICAS EN ELECTRONICA
Articulos(IIB)
Articulos de INSTITUTO DE INVESTIGACIONES BIOLOGICAS
Citación
Amalfitano, Agustín; Stocchi, Nicolas; Atencio, Hugo Marcelo; Villarreal, Fernando Daniel; Ten Have, Arjen; Seqrutinator: scrutiny of large protein superfamily sequence datasets for the identification and elimination of non-functional homologues; BioMed Central; Genome Biology; 25; 1; 8-2024; 1-23
Compartir
Altmétricas
 

Enviar por e-mail
Separar cada destinatario (hasta 5) con punto y coma.
  • Facebook
  • X Conicet Digital
  • Instagram
  • YouTube
  • Sound Cloud
  • LinkedIn

Los contenidos del CONICET están licenciados bajo Creative Commons Reconocimiento 2.5 Argentina License

https://www.conicet.gov.ar/ - CONICET

Inicio

Explorar

  • Autores
  • Disciplinas
  • Comunidades

Estadísticas

Novedades

  • Noticias
  • Boletines

Ayuda

Acerca de

  • CONICET Digital
  • Equipo
  • Red Federal

Contacto

Godoy Cruz 2290 (C1425FQB) CABA – República Argentina – Tel: +5411 4899-5400 repositorio@conicet.gov.ar
TÉRMINOS Y CONDICIONES