Analyse à l’échelle du génome de la liaison à la condensine chez Caenorhabditis elegans
Les condensines I et II partagent les deux sous-unités SMC MIX-1 et SMC-4, et se distinguent par trois sous-unités non SMC (Figure 1A). La condensine IDC diffère de la condensine I par une seule sous-unité, la variante SMC-4 DPY-27. Nous avons utilisé un ou deux anticorps différents contre chaque sous-unité de condensine pour ChIP-seq et identifié les sites de liaison communs à plusieurs anticorps et réplicats biologiques (fichier supplémentaire 1: Tableau S1). La validation des anticorps et les interactions de co-immunoprécipitation attendues de l’holocomplexe de la condensine sont présentées dans le fichier supplémentaire 2. La corrélation par paires des scores médians d’enrichissement en copeaux regroupait séparément les sous-unités I-IDC et II de la condensine, confirmant la distribution des sous-unités individuelles entre les trois types de condensine (Figure 1B).
- Les motifs de liaison à haute résolution des trois complexes de condensine sont similaires
- Les sites de liaison à la condensine sont enrichis au niveau des promoteurs actifs
- Les sites de liaison à la condensine coïncident de manière significative avec un sous-ensemble de facteurs de transcription
- La mutation de la condensine II provoque des défauts transcriptionnels suggérant une fonction répressive
- Les modifications des histones associées à la chromatine ouverte sont en corrélation positive avec la liaison à la condensine
- Les motifs de séquence d’ADN enrichis aux sites de liaison à la condensine présentent des caractéristiques spécifiques
- La SDC-2 est nécessaire pour la liaison de la condensine I-IDC, de la condensine II et du chargeur de cohésine aux sites de recrutement du DCC du chromosome X
Les motifs de liaison à haute résolution des trois complexes de condensine sont similaires
C. elegans condensine I et II ont des localisations chromosomiques partiellement chevauchantes mais différentes dans la mitose et la méiose, et la condensine IDC est spécifiquement ciblée sur le X. Par conséquent, nous nous attendions à trouver différents modèles de CHIP-seq pour la condensine I, IDC et II. Au lieu de cela, les modèles de liaison des sous-unités de la condensine I, IDC et II étaient généralement similaires (Figure 1C). Cette similitude n’était pas due à la réactivité croisée des anticorps, car l’anticorps HCP-6, qui ne présente aucune réactivité croisée et n’immunoprécipite aucune sous-unité de condensine I-IDC, a montré une co-localisation étendue avec les sous-unités de condensine I-IDC (voir HCP-6 sur la figure 1C). De plus, si le chevauchement de la condensine II était dû à une réactivité croisée avec la condensine IDC, on se serait attendu à un enrichissement des sites de liaison de la condensine II sur le X, ce qui n’était pas le cas (Figure 1D). Par rapport à la condensine II, les sous-unités IDC de la condensine présentaient systématiquement des scores de PuCE plus élevés sur le X, suggérant une différence d’association chromosomique des deux complexes de condensine capturés par la puce (notez différentes échelles sur le X et le chromosome I sur la figure 1C). Étant donné que nous avons effectué la CHIP-seq dans des embryons à stade mixte, la plupart des cellules (plus de 95% estimées par coloration 4′, 6-diamidino-2-phénylindole (DAPI)) étaient en interphase. L’absence de sous-unités de condensine I sur les autosomes (Figure 1C et fichier supplémentaire 3: Figure S1A) et l’observation précédente selon laquelle la condensine I se localise en chromosomes mitotiques après la dégradation de l’enveloppe nucléaire suggèrent que la majeure partie du signal ChIP-seq provient de l’interphase. À l’appui de cela, la condensine II s’est avérée nucléaire pendant l’interphase et a montré une distribution plus égale des sites de liaison entre tous les chromosomes (figure 1D).
KLE-2, HCP-6 et CAPG-2 sont spécifiques de la condensine II, représentent donc la liaison à la condensine II. La condensine I et l’IDC partagent les trois sous-unités non-SMC, de sorte que nous nous référons ci-après au signal ChIP-seq de DPY-26, DPY-28 et CAPG-1 à partir de la condensine I-IDC. Pour nous concentrer sur les sites liés en tant que complexe, nous avons fait la moyenne du signal de puce provenant des sous-unités de CAP spécifiques du type condensine. En plus d’utiliser des données moyennées, nous avons vérifié que chaque analyse était vraie avec des sous-unités uniques, et nous présentons HCP-6 et DPY-28 dans des chiffres supplémentaires. Nous avons identifié un ensemble de sites de liaison de la condensine I-IDC et II à haute confiance en sélectionnant uniquement les pics ChIP-seq qui étaient cohérents entre deux sous-unités non SMC ou plus (Figure 1D). Comme indiqué précédemment, 97% de la liaison de la condensine I-IDC s’est produite sur le chromosome X. La condensine II a été distribuée de la même manière entre les autosomes et la X. Condensine II liée à des sites de condensine I-IDC plus forts sur le chromosome X (Figure 1E et fichier supplémentaire 3: Figure S1B).
Les sites de liaison à la condensine sont enrichis au niveau des promoteurs actifs
Pour identifier les régions où les condensines se lient préférentiellement, nous avons analysé les sites de liaison à la condensine par rapport à plusieurs annotations génomiques. Les sites de liaison à la condensine ont été considérablement enrichis au niveau des promoteurs, à proximité des gènes de l’ARNt et des ARN non codants (Figure 2A, fichier supplémentaire 4: Figure S2). Pour éliminer la possibilité que les gènes d’ARNt liés à la condensine ne se produisent qu’au niveau des promoteurs, nous avons retiré les gènes d’ARNt qui se trouvaient à moins de 1 kb d’un site de début de transcription (TSS) et déterminé que le chevauchement des sites de liaison à l’ARNt et à la condensine restait significatif (23% et 6% des ARNT chevauchaient respectivement les sites I-IDC et II de la condensine, P = 0,0002). La liaison de la condensine au niveau des gènes de l’ARNt suggère que le recrutement de la condensine à médiation TFIIIQUE peut être conservé entre C. elegans et la levure.
La liaison était la plus élevée à moins de 500 pb du TSS (fichier supplémentaire 5: Figure S3A) et 45% des pics de condensine I-IDC et 62% des pics de condensine II étaient localisés au niveau des promoteurs. La liaison de la condensine aux promoteurs est en corrélation positive avec l’activité transcriptionnelle du gène en aval (Figure 2B, C), mais tous les promoteurs actifs n’étaient pas liés (Figure 2D). L’analyse des termes de l’ontologie génique des promoteurs liés a montré un enrichissement léger (1,3 fois) mais significatif (P = 3,5e-17) pour les gènes ayant une fonction de développement embryonnaire (fichier supplémentaire 6 : Tableau S2). Environ 20% des gènes fortement exprimés (quartile supérieur par niveau d’ARN) avaient un site de liaison à la condensine II à moins de 1 kb, et environ 70% des gènes du chromosome X avaient un site de liaison à la condensine I-IDC à moins de 1 KB. Par conséquent, bien que l’activité transcriptionnelle soit importante, elle ne suffit pas à expliquer la spécificité de la liaison à la condensine chez certains promoteurs.
Nous avons remarqué que tous les sites de liaison à la condensine présentaient un enrichissement important de la teneur en GC par rapport aux régions environnantes et aux coordonnées aléatoires (Figure 2E). Chez C. elegans, la teneur en GC des promoteurs du chromosome X est plus élevée que celle des promoteurs autosomiques. Il est possible qu’une teneur plus élevée en GC soit une caractéristique de la séquence d’ADN pour la liaison à la condensine, et les promoteurs X ont évolué pour contenir une teneur plus élevée en GC pour soutenir la liaison IDC à la condensine.
Les sites de liaison à la condensine coïncident de manière significative avec un sous-ensemble de facteurs de transcription
Pour déterminer des facteurs supplémentaires qui distinguent les promoteurs liés à la condensine, nous avons comparé les sites de liaison à la condensine et à la TF, et avons trouvé un sous-ensemble de TFs qui se liaient aux mêmes promoteurs que les condensines (figure 3A). Des études antérieures ont montré que plusieurs FT se lient à un ensemble de sites de liaison à occupation élevée (HOT). Il y avait un chevauchement de 5 % et 22 % des sites de condensine I-IDC et de condensine II avec des sites CHAUDS, respectivement (P = 0,0002). L’importance du chevauchement avec les FT est demeurée la même lorsque les sites CHAUDS ont été éliminés de l’analyse (fichier supplémentaire 5 : Figure S3B). Les pourcentages de chevauchement pour chaque TF dépendaient du nombre de sites de liaison, et sont indiqués dans le fichier supplémentaire 5: Figure S3C. Parmi les FT individuelles, nous avons constaté que 69% des sites de condensine II et 53% des sites de LIN-13 se chevauchaient, ce qui fait de LIN-13 le TF supérieur qui chevauchait significativement la condensine II.
Lin-13 a un motif d’interaction de la protéine du rétinoblastome (pRb) et fonctionne dans le développement vulvaire avec l’homologue unique de pRb LIN-35 chez C. elegans. Chez D. melanogaster, la sous-unité dCAPD3 de la condensine II se liant à la chromatine est réduite lors de la mutation du pRb. Si, chez C. elegans, LIN-13 recrute de la condensine II par LIN-35, alors les sites LIN-13 qui sont également liés par LIN-35 (576) devraient chevaucher davantage la condensine II que les sites LIN-13 qui ne sont pas liés par LIN-35 (1 033). Le chevauchement des sites cooccupés LIN-13 et LIN-35 avec les sites de condensine II n’était que légèrement supérieur à celui des sites LIN-13 sans LIN-35, respectivement de 60 % et 50 % (figure 3B). Inversement, le chevauchement de LIN-35 avec la condensine II était plus élevé dans les sites qui étaient également liés par LIN-13 (45 %) que dans les sites non liés (9 %). Ceci suggère que l’interaction potentielle entre la LIN-13 et la condensine II est principalement indépendante de la LIN-35. LIN-35 fonctionne au sein d’un complexe multi-protéique conservé appelé DRM chez C. elegans (hDREAM chez l’homme) qui contient également EFL-1 et DPL-1. Les 555 sites de liaison DRM qui étaient liés par LIN-13 ont montré un chevauchement plus important avec la condensine II (63%) par rapport aux 787 sites DRM qui n’étaient pas liés par LIN-13 (13%). Nous avons divisé les sites de condensine II en quatre groupes en fonction du chevauchement des sites de liaison avec LIN-13 et LIN-35 (Figure 3C). Ce groupe indique qu’un grand nombre de sites de condensine II présentent une liaison élevée à la LIN-13, mais pas à la LIN-35, ce qui suggère que si le recrutement de la condensine II par le pRb est conservé chez C. elegans, la LIN-35 peut dépendre de la présence de la LIN-13 pour le recrutement de la condensine II.
La mutation de la condensine II provoque des défauts transcriptionnels suggérant une fonction répressive
Chez la levure et le D. melanogaster, la condensine a été impliquée dans la répression transcriptionnelle. Une étude récente sur D. melanogaster a indiqué que la sous-unité CAPD3 de la condensine II est nécessaire à l’activation transcriptionnelle d’un groupe de gènes peptidiques antimicrobiens. Pour comprendre le rôle de la condensine II dans la régulation de la transcription, nous avons effectué une analyse de l’ARN-seq chez des larves mutantes nulles kle-2 L2/L3. Le KLE-2 chargé par la mère permet au mutant nul kle-2 (allèle ok1151) de grandir pour devenir des adultes stériles. Nous avons comparé l’expression des gènes chez des mutants hétérozygotes et homozygotes kle-2 chez des larves L2/L3 avant la prolifération de la lignée germinale, contenant ainsi presque entièrement des noyaux d’interphase. L’analyse d’expression différentielle utilisant DESeq2 a permis d’identifier 356 gènes dont l’expression était significativement différente chez les homozygotes par rapport aux larves hétérozygotes (taux de fausses découvertes < 5% ; Les résultats de DESeq2 sont présentés dans le fichier supplémentaire 7 : Tableau S3). La majorité des gènes exprimés différentiellement ont augmenté (70%) plutôt que diminué (30%) dans l’expression. L’analyse des termes de l’ontologie des gènes n’a pas révélé de groupe particulier de gènes affectés par la mutation KLE-2. À l’instar des données publiées pour l’IDC de la condensine, il n’y avait pas de corrélation directe entre la liaison à la KLE-2 et les modifications de l’expression des gènes. Fait important, parmi les 46 gènes exprimés de manière différentielle et liés à KLE-2, 83% ont augmenté leur expression par rapport à 67% des 310 gènes qui n’étaient pas liés à KLE-2 (Figure 3D), ce qui suggère que l’effet direct de la liaison à la condensine II est largement répressif.
Les modifications des histones associées à la chromatine ouverte sont en corrélation positive avec la liaison à la condensine
Pour comprendre le contexte de la liaison à la condensine par la chromatine, nous avons analysé la relation entre les sites de liaison à la condensine et les caractéristiques de la chromatine cartographiées par modENCODE. Nous avons observé une corrélation positive générale entre la liaison à la condensine et les marques de la chromatine active. Chez la levure, le nombre de sites de liaison à la condensine tout au long du cycle cellulaire est directement en corrélation avec la longueur des chromosomes. Le nombre de C. les sites de liaison de l’elegans condensine II n’étaient pas proportionnels à la longueur des chromosomes (Figure 4A), mais étaient positivement corrélés à la longueur des chromosomes associés aux marques d’histones actives (Figure 4B). Le chromosome X était une exception, peut-être en raison des mécanismes de compensation posologique qui modifient sa chromatine. La liaison de la condensine I-IDC et II à travers le génome est corrélée positivement avec les marques de chromatine ouvertes telles que H3K27ac et négativement avec les marques d’hétérochromatine telles que H3K27me3 et H3K9me3 (Figure 4C et fichier supplémentaire 8: Figure S4). Cette corrélation était au niveau du domaine (tel qu’analysé dans les fenêtres de 1 ko), car nous n’avons pas vu de modification particulière des histones qui culminait aux sites de condensine dans une analyse de type “métagène” (données non montrées). Dans les études d’immunofluorescence, les protéines centromères chevauchaient la liaison à la condensine II dans les cellules mitotiques. Nous n’avons pas observé de corrélation positive entre les signaux CENP-A et condensine II ChIP-seq dans les embryons à stade mixte, ce qui suggère que, dans les noyaux d’interphase (la plupart des noyaux dans les cellules embryonnaires à stade mixte), il n’y a pas de chevauchement. Alternativement, étant donné que le CENP-A ne se lie qu’à un petit sous-ensemble des régions positives du CENP-A dans le génome par cellule, le chevauchement du CENP-A avec la condensine II pourrait n’être apparent que dans des cellules uniques. Pour comprendre quels facteurs de chromatine prédisent le mieux la liaison à la condensine, nous avons utilisé une approche d’apprentissage automatique. Chez C. elegans, H4K20me1 est fortement enrichi à travers le chromosome X par DCC, et donc H4K20me1 était le facteur le plus discriminant pour la liaison IDC de la condensine (Figure 4D). Pour la condensine II, les caractéristiques hautement prédictives de la chromatine sont H3K27ac et CBP, deux marqueurs des activateurs actifs, suggérant que la liaison à la condensine est enrichie aux activateurs actifs. Parmi les 201 sites de liaison à la condensine II qui se trouvaient à 2 ko d’un TSS annoté, 58 chevauchaient un site de liaison au CBP (P = 0,0002).
Les motifs de séquence d’ADN enrichis aux sites de liaison à la condensine présentent des caractéristiques spécifiques
Bien que la condensine II se soit liée aux sites de liaison à la condensine I-IDC sur le X, la condensine I-IDC ne s’est pas liée à la plupart des sites de liaison à la condensine II autosomique (Figure 1D). Pour comprendre la spécificité du recrutement de la condensine IDC et II, nous avons cherché des caractéristiques de séquence d’ADN qui distinguent la liaison de la condensine II et de la condensine IDC. Des études antérieures ont montré que la condensine IDC est d’abord recrutée sur environ 100 sites, puis se propage à d’autres sites chromosomiques. Un motif de séquence d’ADN de 10 pb a été enrichi aux sites de recrutement de la condensine IDC (Figure 5A) et une mutation du motif a aboli le recrutement de la condensine IDC sur des réseaux extrachromosomiques, indiquant que le motif de séquence d’ADN de la condensine IDC joue un rôle important dans le recrutement de la condensine IDC.
Nous avons trouvé un motif de séquence d’ADN contenant du GCGC qui a été enrichi sous des sites de liaison à la condensine II (Figure 5A). Il est intéressant de noter que le motif condensine II et le motif condensine IDC comprenaient le noyau GCGC, mais le motif condensine IDC a été étendu d’un côté par AGGG, suggérant que la spécificité X du recrutement de la condensine IDC est obtenue par des cofacteurs qui reconnaissent AGGG. À l’échelle du génome, 11% des motifs de la condensine II étaient liés par la condensine II. Ainsi, comme pour d’autres FT (par exemple), seule une partie des motifs potentiels de la séquence d’ADN était liée par la condensine II. D’autres facteurs tels que l’accessibilité de la chromatine et des co-facteurs inconnus peuvent être impliqués dans la spécificité de liaison. En effet, si nous prenions les motifs qui étaient dans une fenêtre de 2 kb significativement enrichis pour une marque d’histone active, tels que H4K16ac, le pourcentage de motifs liés est passé de 11% à 29%. De plus, à l’instar du motif IDC de la condensine, qui est plus groupé aux sites liés, nous avons constaté que les fenêtres génomiques de 1 kb contenant plus d’un motif de la condensine II étaient environ 2,5 fois plus susceptibles d’être liées par la condensine II, par rapport à celles avec un seul motif. Par conséquent, le regroupement de motifs et le contexte de chromatine ouverte aident à spécifier la sélection des motifs liés.
Tous les sites de liaison à la condensine II n’ont pas le motif. Sur les sites de condensine II sans motif, d’autres facteurs peuvent être responsables de la liaison. Alternativement, la faible proportion de sites de condensine II (27%) contenant un motif peut s’expliquer par une propagation potentielle de la condensine II après recrutement. Les sites d’épandage ne devraient pas contenir le motif. Par exemple, pour condensin IDC, un pourcentage élevé de sites de recrutement potentiels (56%) contiennent le motif, mais pas de sites de propagation (8%). Une analyse systématique de la capacité de recrutement des sites de condensine II identifiés est nécessaire pour déterminer s’il y a propagation.
La SDC-2 est nécessaire pour la liaison de la condensine I-IDC, de la condensine II et du chargeur de cohésine aux sites de recrutement du DCC du chromosome X
Chez les métazoaires, les protéines impliquées dans le recrutement de la condensine sur les chromosomes ne sont pas bien comprises. Chez la levure, la liaison à la condensine chevauche celle du complexe de charge de cohésine Scc2/4, ce qui augmente l’association de la condensine avec les chromosomes. Pour vérifier si le chevauchement avec Scc2/4 est conservé entre la levure et C. elegans, nous avons effectué une analyse ChIP-seq de SCC-2 (également connu sous le nom de PQN-85) et avons constaté qu’un remarquable 95% des sites de SCC-2 chevauchaient la condensine I-IDC sur le X, et 60% avec la condensine II à l’échelle du génome (Figure 5B). Le chevauchement est demeuré similaire lorsque les régions CHAUDES ont été exclues (fichier supplémentaire 9 : Figure S5A). Tous les sites de condensine ne chevauchaient pas le SCC-2, ce qui suggère que, contrairement à la levure, la condensine ne dépend pas du SCC-2 pour se lier. La liaison SCC-2 était plus élevée chez les promoteurs et était en corrélation positive avec la transcription (fichier supplémentaire 9: Figure S5B). Un motif de séquence d’ADN contenant du GAGA était présent dans 58 % des sites de liaison du SCC-2 (fichier supplémentaire 9 : Figure S5C). Contrairement à la Drosophile Pincée-B, et semblable à S. cerevisiae Scc2, la liaison au SCC-2 n’était pas élevée dans les régions transcrites, mais restait intergénique (Figure 5C).
Le chevauchement presque complet (96%) des sites de liaison de la condensine II avec la condensine I-IDC sur le chromosome X soutient l’existence de mécanismes communs de liaison chromosomique de différentes condensines. Étant donné que la condensine II et le SCC-2 sont liés aux sites de recrutement de la condensine IDC sur le X (Figure 5D et fichier supplémentaire 9: Figure S5D), nous avons émis l’hypothèse que les recruteurs de condensine IDC recrutent également condensine II et SCC-2. Le recrutement spécifique à l’hermaphrodite de la condensine IDC sur le chromosome X est réalisé par SDC-2, SDC-3 et DPY-30. Nous avons réalisé HCP-6 et KLE-2 (condensine II), DPY-26 (condensine I-IDC) et SCC-2 ChIP-seq dans des embryons mutants nuls sdc-2. Chez le mutant sdc-2, la liaison DPY-26, HCP-6, KLE-2 et SCC-2 a été abolie sur un site de recrutement de la condensine IDC spécifique à l’X (rex-2) (Figure 5E). On ne sait pas pourquoi la liaison de HCP-6 et de KLE-2 à rex-2 a été diminuée au lieu de ressembler à un site de condensine autosomique. La liaison du CSC-2 aux autosomes et aux sites du chromosome X indépendants de la SDC-2 est restée similaire chez le mutant de la SDC-2 comparativement aux sites liés par la SDC-2 (figure 5F). Nos résultats suggèrent que la SDC-2, la TF spécifique à l’hermaphrodite qui recrute la condensine IDC sur le chromosome X, recrute également la condensine II et la sous-unité du complexe de chargement de la cohésine SCC-2 sur les mêmes sites (fichier supplémentaire 10: Figure S6). Des études génétiques antérieures ont établi qu’une mutation nulle de la SDC-2 ne provoque pas de létalité embryonnaire chez les mâles, de sorte que la fonction de la condensine II et du recrutement de la SCC-2 par la SDC-2 n’est pas essentielle à la condensation et à la ségrégation générales des chromosomes. Il est possible que le recrutement de la SCC-2 et de la condensine II par la SDC-2 ait une fonction régulatrice génique spécifique à l’hermaphrodite.
Pour tester si SCC-2 a un effet sur l’association chromosomique de la condensine IDC sur le site de recrutement, nous avons effectué une analyse PCR quantitative de la puce DPY-27 chez le contrôle par rapport aux embryons de knockdown SCC-2. En alimentant l’ARNi, nous avons pu réduire les niveaux de SCC-2 d’environ 80% (fichier supplémentaire 9: Figure S5E). Lors du renversement de SCC-2, nous n’avons pas constaté de changement significatif dans la liaison du DPY-27 au rex-1 ou au rex-2 (Figure 5G). De façon constante, l’analyse par immunofluorescence de la liaison de la condensine I et II sur les chromosomes méiotiques n’a pas montré de différence significative entre les mutants de type sauvage et de type scc-2.