Illumina Short‑Read Sequencing : principes, technologies et applications | BIOEDUC

🧬 Génomique & Séquençage Haut Débit

Séquençage Illumina (lectures courtes) : principes, technologies et applications

Par Abdelmalek | Mis à jour le 8 juin 2026

1. Vue d’ensemble du séquençage nouvelle génération (NGS)

Le séquençage nouvelle génération (NGS) désigne les technologies à haut débit permettant le séquençage simultané de millions à des milliards de fragments d’ADN. Contrairement au séquençage Sanger traditionnel, les plateformes NGS augmentent considérablement la rapidité, la scalabilité et la rentabilité. Les technologies NGS se divisent en deux grandes catégories : le séquençage à lectures courtes (Illumina) et le séquençage à lectures longues (PacBio, Oxford Nanopore). Parmi ces approches, le séquençage Illumina domine le domaine grâce à sa grande précision, son débit et sa polyvalence.

2. Principe du séquençage Illumina (lectures courtes)

La technologie Illumina repose sur une méthode appelée séquençage par synthèse (SBS). Le principe fondamental consiste à détecter des nucléotides marqués par fluorescence au fur et à mesure qu’ils sont incorporés dans un brin d’ADN en croissance. Les principaux avantages sont une haute précision (>99,9 %), une parallélisation massive, un faible coût par base et une large gamme d’applications. Ses limites sont la longueur courte des lectures (typiquement 50–300 pb) et la difficulté à résoudre les régions répétées ou les variants structuraux, ce qui nécessite des outils d’assemblage dédiés. Malgré ces limites, Illumina reste le référence pour de nombreuses applications génomiques où la précision et la profondeur sont critiques.

⚙️ Le séquençage par synthèse (SBS) en bref
Chaque cycle ajoute un seul nucléotide fluorescent (terminateur réversible). Après incorporation, la flow cell est imagée, le fluorophore est clivé et le blocage 3′ est éliminé, permettant le cycle suivant. Ce processus produit des milliards de lectures en parallèle.

3. Flux de travail général et protocole de préparation des librairies

Extraction d’ADN/ARN : les acides nucléiques de haute qualité sont isolés.
Fragmentation : l’ADN est fragmenté en petits morceaux (200–600 pb) par des méthodes enzymatiques ou mécaniques (sonication).
Ligature d’adaptateurs : des séquences adaptatrices courtes (amorces de séquençage et indices/barcodes) sont ligaturées aux extrémités des fragments.
Amplification de la librairie (optionnelle) : la PCR enrichit les fragments ligaturés (des kits sans PCR existent pour une représentation non biaisée).
Génération des clusters : les fragments d’ADN se fixent sur une flow cell et subissent une amplification en pont (bridge PCR), formant des clusters de molécules identiques.
Séquençage par synthèse : les nucléotides fluorescents sont incorporés un à la fois ; chaque incorporation est imagée pour déterminer la séquence.
Analyse des données : appel des bases, alignement et bioinformatique aval.

4. Kits de préparation des librairies et réactifs

Les kits compatibles Illumina les plus courants incluent :

ADN : TruSeq DNA PCR‑Free, Illumina DNA Prep (anciennement Nextera DNA Flex).
ARN : TruSeq Stranded mRNA, TruSeq Total RNA with Ribo‑Zero.
Séquençage ciblé : panels AmpliSeq, TruSeq Custom Amplicon.

Les réactifs clés sont : enzymes de fragmentation, ADN ligase, master mix PCR, adaptateurs indexés et billes magnétiques (ex. AMPure XP).

5. Flow cells en séquençage Illumina

Les flow cells sont des lames de verre recouvertes d’oligonucléotides qui capturent les fragments d’ADN. On distingue les flow cells non matricées (génération aléatoire des clusters) et les flow cells matricées (nanopuits ordonnés pour une densité plus élevée).

Tableau comparatif des flow cells

Type de flow cell	Plateforme	Type	Capacité de sortie	Densité de lectures	Remarques
Standard Flow Cell	MiSeq	Non‑matricée	~1–15 Gb	Faible	Runs à petite échelle
High Output Flow Cell	NextSeq	Matricée	~100–400 Gb	Moyenne	Débit intermédiaire
S1 Flow Cell	NovaSeq	Matricée	~500 Gb	Élevée	Entrée de gamme NovaSeq
S2 Flow Cell	NovaSeq	Matricée	~1 Tb	Très élevée	Projets moyens à grands
S4 Flow Cell	NovaSeq	Matricée	~6 Tb	Ultra‑haute	Génomique des populations

6. Plateformes Illumina

iSeq 100 : sortie ~1–4 Gb, compacte et abordable, idéale pour les petits laboratoires et les études pilotes.
MiSeq : sortie jusqu’à ~15 Gb, lectures 2×300 bp, parfaite pour le séquençage d’amplicons et les petits génomes.
NextSeq (1000/2000) : sortie ~100–400 Gb, débit moyen, adaptée au RNA‑seq et au séquençage d’exomes.
NovaSeq 6000 / X series : sortie jusqu’à plusieurs Tb par run, débit ultra‑élevé pour la génomique des populations et le WGS à grande échelle.

Tableau comparatif des plateformes

Plateforme	Sortie	Longueur de lecture	Débit	Utilisation typique
iSeq 100	1–4 Gb	2×150 bp	Faible	Petits projets
MiSeq	Jusqu’à 15 Gb	2×300 bp	Faible–moyen	Amplicons
NextSeq	100–400 Gb	2×150 bp	Moyen	RNA‑seq, exomes
NovaSeq	0.5–6 Tb	2×150 bp	Élevé	Génomique à grande échelle

7. Kits et réactifs de séquençage

Les kits de réactifs sont spécifiques à chaque plateforme : MiSeq Reagent Kit v2/v3, NextSeq 1000/2000 P2/P3, NovaSeq S1/S2/S4. Leurs composants incluent la flow cell, le tampon de séquençage, les nucléotides fluorescents, l’ADN polymérase et des solutions de lavage. Chaque kit détermine la longueur de lecture, le rendement et la durée du run.

8. Applications des lectures courtes Illumina

Biologie : séquençage de génomes entiers (WGS), RNA‑seq, métagénomique, ChIP‑seq, ATAC‑seq.
Médecine : diagnostic clinique (maladies génétiques), génomique du cancer (détection de mutations), surveillance des maladies infectieuses, pharmacogénomique.
Avantages : haute profondeur → détection de variants rares ; haute précision → identification fiable des SNPs ; multiplexage → efficacité des coûts.

Pour des applications de métagénomique, le séquençage Illumina est souvent associé aux approches 16S. Découvrez le principe de la métagénomique pour en savoir plus.

9. Outils bioinformatiques et pipelines d’analyse

Analyse primaire : Real‑Time Analysis (RTA) pour l’appel des bases.
Analyse secondaire : bcl2fastq / BCL Convert (génération FASTQ), plateforme DRAGEN Bio‑IT (alignement accéléré et détection de variants).
Analyse tertiaire : Illumina BaseSpace Sequence Hub (applications cloud pour RNA‑seq, WGS, métagénomique).
Pipelines open‑source : alignement (BWA, Bowtie2), détection de variants (GATK), RNA‑seq (STAR + DESeq2), QC (FastQC, MultiQC).

💡 Concept clé – Indexation (multiplexage) : des codes‑barres uniques (indices) sont ajoutés à chaque librairie lors de la ligature des adaptateurs. Après séquençage, les lectures sont démixées bioinformatiquement, permettant de regrouper des dizaines à des milliers d’échantillons dans un seul run.

10. Conclusion

Le séquençage Illumina est devenu une pierre angulaire de la génomique moderne en raison de sa précision, de sa scalabilité et de sa rentabilité. Si les technologies à lectures longues (PacBio, Oxford Nanopore) et les approches semi‑conductrices (Ion Torrent) répondent à certains besoins spécifiques, les plateformes Illumina restent indispensables pour une large gamme d’applications biologiques et médicales. La combinaison de protocoles de laboratoire robustes, de plateformes évolutives et d’outils bioinformatiques avancés garantit que le séquençage Illumina continuera à jouer un rôle central en recherche génomique et en médecine de précision.

📝 Quiz : Séquençage Illumina (lectures courtes)

👤 Votre nom complet :

📚 Références : livres blancs Illumina, Mardis ER (2013) “Next‑generation sequencing platforms”, Bentley et al. (2008) Nature, et cours BIOEDUC.