Fiche technique | |
---|---|
Système d'exploitation : | Linux |
Auteur : | Dinghua Li |
Date de publication : | 2015 à maintenant |
Catégorie : | Bioinformatique |
Site Web : | https://github.com/voutcn/megahit |
Sommaire
Le logiciel open-source MEGAHIT est conçu pour assembler des séquences d'ADN à partir de données de séquençage à haut débit NGS (Next-Generation Sequencing). Il est particulièrement utilisé pour assembler des génomes à partir de lectures courtes et de données complexes, comme celles provenant de métagénomes. Les principales fonctionnalités de MEGAHIT sont :
- L'assemblage de génomes et de métagénomes : MEGAHIT permet d'assembler des génomes à partir de lectures courtes, ceci étant essentiel pour l'étude de nouveaux organismes dont les génomes ne sont pas encore bien connus. Il est excellant également dans l'assemblage de métagénomes, étant des échantillons d'ADN prélevés dans des environnements complexes contenant de multiples organismes (comme des sols, des intestins, des océans,...).
- La performance et l'efficacité : MEGAHIT est conçu pour être rapide et peu gourmand en mémoire, ceci le rendant adapté pour traiter de grandes quantités de données, typiques des expériences de séquençage moderne. Il utilise des algorithmes avancés pour gérer efficacement les lectures courtes et produire des assemblages de haute qualité.
- Le support de diverses plateformes de séquençage : MEGAHIT prend en charge les données provenant de différentes plateformes de séquençage telles que Illumina. Il est optimisé pour les lectures courtes, ce qui est courant pour les technologies de séquençage de nouvelle génération.
- Flexibilité d'échelle : Il peut être utilisé pour assembler des données sur des ordinateurs personnels ainsi que sur des supercalculateurs ou des serveurs haute performance.
Voici quelques cas d'utilisation typiques :
- Recherche en génomique : Assemblage de génomes complets à partir de données de séquençage.
- Études métagénomiques : Assemblage de séquences pour explorer la diversité microbienne dans des échantillons environnementaux.
- Biologie de la conservation : Analyse de l'ADN environnemental (eDNA) pour identifier des espèces présentes dans un écosystème.
- Médecine personnalisée : Assemblage de génomes humains pour identifier des variations génétiques spécifiques.
Le logiciel MEGAHIT s'utilise uniquement en ligne de commande et nécessite une bonne connaissance des systèmes d'exploitation de style Unix. Toutefois, MEGAHIT est un outil puissant pour les scientifiques travaillant en bioinformatique, en génomique, et en métagénomique. Son efficacité et sa capacité à gérer de vastes ensembles de données le rendent très utile pour des projets nécessitant l'assemblage de séquences d'ADN.