Analisi Genome-wide del legame di condensina in Caenorhabditis elegans
Le condensine I e II condividono le due subunità SMC MIX-1 e SMC-4 e si distinguono per tre subunità non SMC (Figura 1A). Condensin IDC differisce dalla condensin I da una sola subunità, la variante SMC-4 DPY-27. Abbiamo usato uno o due anticorpi diversi contro ogni subunità condensina per CHIP-seq e identificato quei siti di legame comuni in più anticorpi e repliche biologiche (file aggiuntivo 1: Tabella S1). La convalida dell’anticorpo e le interazioni attese di co-immunoprecipitazione dall’holocomplex di condensina sono presentate nel file aggiuntivo 2. Correlazione a coppie dei punteggi medi di arricchimento del chip cluster condensin I-IDC e II subunità separatamente, confermando la distribuzione delle singole subunità tra i tre tipi di condensina (Figura 1B).
- I modelli di legame ad alta risoluzione dei tre complessi di condensina sono simili
- I siti di legame alla condensina sono arricchiti dai promotori attivi
- I siti di legame della condensina coincidono significativamente con un sottoinsieme di fattori di trascrizione
- La mutazione della Condensina II causa difetti trascrizionali che suggeriscono una funzione repressiva
- Le modifiche istoniche associate alla cromatina aperta sono correlate positivamente con il legame alla condensina
- I motivi di sequenza del DNA arricchiti nei siti di legame della condensina mostrano caratteristiche specifiche
- La DSC-2 è necessaria per il legame della condensina I-IDC, della condensina II e del caricatore della coesina ai siti di reclutamento del cromosoma X DCC
I modelli di legame ad alta risoluzione dei tre complessi di condensina sono simili
C. elegans condensin I e II hanno localizzazioni cromosomiche parzialmente sovrapposte ma diverse nella mitosi e nella meiosi , e condensin IDC è specificamente mirato alla X . Pertanto, ci aspettavamo di trovare diversi modelli di CHIP-seq per condensina I, IDC e II. Invece, i modelli di legame delle subunità condensina I, IDC e II erano generalmente simili (Figura 1C). Questa somiglianza non era dovuta alla cross-reattività degli anticorpi, perché l’anticorpo HCP-6, che non mostra alcuna cross-reattività e non immunoprecipita alcuna subunità condensina I-IDC , ha mostrato un’ampia co-localizzazione con le subunità condensina I-IDC (vedere HCP-6 in Figura 1C). Inoltre, se la sovrapposizione della condensina II fosse dovuta alla reattività crociata con la condensina IDC, ci saremmo aspettati un arricchimento dei siti di legame della condensina II sulla X, cosa che non era il caso (Figura 1D). Rispetto alla condensina II, le subunità IDC della condensina avevano costantemente punteggi di chip più alti sulla X, suggerendo una differenza nell’associazione cromosomica dei due complessi di condensina catturati dal ChIP (notare diverse scale su X e cromosoma I in Figura 1C). Dal momento che abbiamo eseguito CHIP-seq in embrioni stadio misto,la maggior parte delle cellule (più del 95% stimato da 4′, 6-diamidino-2-fenilindolo (DAPI) colorazione) erano in interfase. La mancanza di sottounità condensin I su autosomi (Figura 1C e file aggiuntivo 3: Figura S1A) e la precedente osservazione che la condensina I si localizza ai cromosomi mitotici dopo la rottura dell’involucro nucleare suggeriscono che la maggior parte del segnale CHIP-seq proviene da interfase. A sostegno di ciò, la condensina II ha dimostrato di essere nucleare durante l’interfase e ha mostrato una distribuzione più equa dei siti di legame tra tutti i cromosomi (Figura 1D).
KLE-2, HCP-6 e CAPG-2 sono specifici della condensina II, quindi rappresentano il legame della condensina II. Condensin I e IDC condividono tutte e tre le subunità non SMC, quindi di seguito ci riferiamo al segnale CHIP-seq da DPY-26, DPY-28 e CAPG-1 come da condensin I-IDC. Per concentrarci sui siti che sono legati come un complesso, abbiamo calcolato la media del segnale del CHIP dalle subunità CAP specifiche di tipo condensin. Oltre a utilizzare i dati medi, abbiamo verificato che ogni analisi ha tenuto vero con singole subunità, e presentiamo HCP-6 e DPY-28 in cifre supplementari. Abbiamo identificato una serie di siti di legame condensin I-IDC e II ad alta affidabilità selezionando solo i picchi CHIP-seq che erano coerenti tra due o più subunità non SMC (Figura 1D). Come notato in precedenza, il 97% del legame condensina I-IDC si è verificato sul cromosoma X. La condensina II è stata distribuita in modo simile tra autosomi e X. Condensina II legata a siti condensina I-IDC più forti sul cromosoma X (Figura 1E e file aggiuntivo 3: Figura S1B).
I siti di legame alla condensina sono arricchiti dai promotori attivi
Per identificare le regioni in cui le condensine si legano preferenzialmente, abbiamo analizzato i siti di legame alla condensina rispetto a diverse annotazioni genomiche. I siti di legame della condensina sono stati significativamente arricchiti a promotori, vicino ai geni tRNA e agli RNA non codificanti (Figura 2A, File aggiuntivo 4: Figura S2). Per eliminare la possibilità che i geni tRNA legati alla condensina si verifichino solo nei promotori, abbiamo rimosso i geni tRNA che si trovavano entro 1 kb da un sito di inizio trascrizione (TSS) e determinato che la sovrapposizione dei siti di legame tRNA e condensina rimaneva significativa (23% e 6% di TRNA si sovrapponevano ai siti condensina I-IDC e II, rispettivamente, P = 0,0002). Il legame con la condensina nei geni tRNA suggerisce che il reclutamento di condensina mediato da TFIIIC può essere conservato tra C. elegans e lievito .
Il legame era più alto entro 500 bp del TSS (file aggiuntivo 5: Figura S3A) e il 45% della condensina I-IDC e il 62% dei picchi di condensina II erano localizzati ai promotori. Il legame della condensina ai promotori è correlato positivamente con l’attività trascrizionale del gene a valle (Figura 2B,C), ma non tutti i promotori attivi sono stati legati (Figura 2D). Gene Ontology term analysis of bound promoters showed a slight (1.3-fold) but significant (P = 3.5 e-17) enrichment for genes with embryo development function (Additional file 6: Table S2). Circa il 20% dei geni altamente espressi (quartile superiore per livello di RNA) aveva un sito di legame condensina II entro 1 kb e circa il 70% dei geni del cromosoma X aveva un sito di legame condensina I-IDC entro 1 kb. Pertanto, sebbene l’attività trascrizionale sia importante, non è sufficiente spiegare la specificità del legame della condensina a determinati promotori.
Abbiamo notato che tutti i siti di legame della condensina mostravano un notevole arricchimento del contenuto di GC rispetto alle regioni circostanti e alle coordinate casuali (Figura 2E). In C. elegans, il contenuto di GC dei promotori del cromosoma X è superiore a quello dei promotori autosomici . È possibile che un contenuto di GC più elevato sia una caratteristica della sequenza del DNA per il legame con la condensina e che i promotori X si siano evoluti per contenere un contenuto di GC più elevato per supportare il legame con la condensina IDC.
I siti di legame della condensina coincidono significativamente con un sottoinsieme di fattori di trascrizione
Per determinare ulteriori fattori che distinguono i promotori legati alla condensina, abbiamo confrontato i siti di legame della condensina e del TF e abbiamo trovato un sottoinsieme di TFS legato agli stessi promotori delle condensine (Figura 3A). Studi precedenti hanno dimostrato che più TFS si legano a una serie di siti di legame ad alta occupazione (HOT) . C’è stata una sovrapposizione del 5% e del 22% dei siti di condensina I-IDC e condensina II con siti CALDI, rispettivamente (P = 0,0002). Il significato della sovrapposizione con TFs è rimasto lo stesso quando i siti CALDI sono stati eliminati dall’analisi (File aggiuntivo 5: Figura S3B). Le percentuali di sovrapposizione per ogni TF dipendevano dal numero di siti di legame e sono mostrate nel file aggiuntivo 5: Figura S3C. Tra i singoli TFs, abbiamo scoperto che il 69% dei siti di condensina II e il 53% dei siti LIN-13 si sovrapponevano tra loro, rendendo LIN-13 il TF superiore che si sovrapponeva significativamente con condensina II.
Lin-13 ha un motivo di interazione della proteina del retinoblastoma (pRb) e funziona nello sviluppo vulvale con il singolo omologo pRb LIN-35 in C. elegans . In D. melanogaster, la subunità condensina II dCAPD3 che si lega alla cromatina è ridotta in seguito alla mutazione pRb . Se, in C. elegans, LIN-13 recluta condensina II attraverso LIN-35, allora quei siti LIN-13 che sono anche legati da LIN-35 (576) dovrebbero sovrapporsi con condensina II più di quei siti LIN-13 che non sono legati da LIN-35 (1.033). La sovrapposizione dei siti co-occupati LIN-13 e LIN-35 con i siti di condensina II era solo leggermente superiore a quella dei siti LIN-13 senza LIN-35, rispettivamente del 60% e del 50% (Figura 3B). Al contrario, la sovrapposizione di LIN-35 con condensina II era più elevata in quei siti che erano anche legati da LIN-13 (45%) rispetto ai siti non legati (9%). Ciò suggerisce che la potenziale interazione tra LIN-13 e condensina II è per lo più indipendente da LIN-35. LIN-35 funziona all’interno di un complesso multiproteico conservato chiamato DRM in C. elegans (hDREAM in humans) che contiene anche EFL-1 e DPL-1 . I 555 siti di legame DRM che erano legati da LIN-13 hanno mostrato una maggiore sovrapposizione con condensina II (63%) rispetto ai 787 siti DRM che non erano legati da LIN-13 (13%). Abbiamo diviso i siti di condensina II in quattro gruppi in base alla sovrapposizione del sito di legame con LIN-13 e LIN-35 (Figura 3C). Questo raggruppamento ha indicato che un gran numero di siti di condensina II mostrano un elevato legame LIN-13, ma non LIN-35, suggerendo che se il reclutamento di condensina II mediato da pRb è conservato in C. elegans, LIN-35 può dipendere dalla presenza di LIN-13 per il reclutamento di condensina II.
La mutazione della Condensina II causa difetti trascrizionali che suggeriscono una funzione repressiva
Nel lievito e nel D. melanogaster, la condensina è stata implicata nella repressione trascrizionale . Uno studio recente in D. melanogaster ha indicato che la subunità condensina II CAPD3 è necessaria per l’attivazione trascrizionale di un cluster di geni peptidici antimicrobici . Per comprendere il ruolo della condensina II nella regolazione della trascrizione, abbiamo eseguito RNA-seq in larve kle-2 null mutant L2/L3. Maternally caricato KLE-2 permette kle-2 null mutante (ok1151 allele) per crescere fino ad essere adulti sterili. Abbiamo confrontato l’espressione genica nei mutanti kle-2 eterozigoti e omozigoti nelle larve L2/L3 prima che la linea germinale sia proliferata, contenendo così nuclei quasi interamente interfase. L’analisi dell’espressione differenziale utilizzando DESeq2 ha identificato 356 geni la cui espressione era significativamente diversa nell’omozigote rispetto alle larve eterozigote (tasso di falsa scoperta < 5%; I risultati di DESeq2 sono presentati nel file aggiuntivo 7: Tabella S3). La maggior parte dei geni espressi in modo differenziale è aumentata (70%) piuttosto che diminuita (30%) nell’espressione. Gene Ontology term analysis non ha rivelato un particolare gruppo di geni che sono stati colpiti dalla mutazione KLE-2. Analogamente ai dati pubblicati per la condensina IDC, non vi è stata alcuna correlazione diretta tra il legame KLE-2 e i cambiamenti nell’espressione genica. È importante sottolineare che, tra i 46 geni differenzialmente espressi e legati al KLE-2, l ‘ 83% è aumentato nell’espressione rispetto al 67% dei 310 geni che non erano legati al KLE-2 (Figura 3D), suggerendo che l’effetto diretto del legame della condensina II è in gran parte repressivo.
Le modifiche istoniche associate alla cromatina aperta sono correlate positivamente con il legame alla condensina
Per comprendere il contesto della cromatina del legame alla condensina, abbiamo analizzato la relazione tra i siti di legame alla condensina e le caratteristiche della cromatina mappate da modENCODE . Abbiamo osservato una correlazione positiva generale tra il legame della condensina e i segni di cromatina attiva. Nel lievito, il numero di siti di legame della condensina in tutto il ciclo cellulare è direttamente correlato alla lunghezza del cromosoma. Il numero di C. elegans condensin II siti di legame non era proporzionale alla lunghezza del cromosoma (Figura 4A), ma positivamente correlato con la lunghezza dei cromosomi associati con segni istonici attivi (Figura 4B). Il cromosoma X era un’eccezione, forse a causa dei meccanismi di compensazione del dosaggio che alterano la sua cromatina . Condensina I-IDC e II legame attraverso il genoma correlato positivamente con segni cromatina aperti come H3K27ac e negativamente con segni eterocromatina come H3K27me3 e H3K9me3 (Figura 4C e file aggiuntivo 8: Figura S4). Questa correlazione era a livello di dominio (come analizzato in 1 kb di windows), in quanto non abbiamo visto una particolare modifica dell’istone che ha raggiunto il picco nei siti di condensina in un tipo di analisi “metagene” (dati non mostrati). Negli studi di immunofluorescenza, le proteine centromeriche si sono sovrapposte al legame della condensina II nelle cellule mitotiche . Non abbiamo osservato una correlazione positiva tra i segnali CENP-A e condensin II ChIP-seq negli embrioni a stadio misto, suggerendo che, nei nuclei interfase (la maggior parte dei nuclei nelle cellule embrionali a stadio misto), non vi è sovrapposizione. In alternativa, dato che CENP-A si lega solo a un piccolo sottoinsieme delle regioni positive CENP-A nel genoma per cellula , la sovrapposizione di CENP-A con condensina II potrebbe essere evidente solo in singole cellule. Per capire quali fattori di cromatina prevedono al meglio il legame con la condensina, abbiamo utilizzato un approccio di apprendimento automatico. In C. elegans, H4K20me1 è altamente arricchito attraverso il cromosoma X da DCC, e quindi H4K20me1 è stato il fattore più discriminativo per il legame IDC condensina (Figura 4D). Per la condensina II, le caratteristiche altamente predittive della cromatina sono H3K27ac e CBP, entrambi indicatori degli stimolatori attivi, suggerenti che il legame della condensina è arricchito agli stimolatori attivi . Tra i 201 siti di rilegatura condensin II che si trovavano a 2 kb di distanza da un TSS annotato, 58 si sovrapponevano a un sito di rilegatura CBP (P = 0,0002).
I motivi di sequenza del DNA arricchiti nei siti di legame della condensina mostrano caratteristiche specifiche
Sebbene la condensina II si legasse ai siti di legame della condensina I-IDC sulla X, la condensina I-IDC non si legava alla maggior parte dei siti di legame della condensina II autosomica (Figura 1D). Per comprendere la specificità del reclutamento di condensina IDC e II, abbiamo cercato le caratteristiche della sequenza del DNA che distinguono il legame condensina II e condensina IDC. Studi precedenti hanno dimostrato che la condensina IDC viene prima reclutata in circa 100 siti e quindi si diffonde in altri siti cromosomici . Un motivo di sequenza del DNA di 10 bp è stato arricchito nei siti di reclutamento della condensina IDC (Figura 5A) e la mutazione del motivo ha abolito il reclutamento della condensina IDC su matrici extracromosomiali , indicando che il motivo della sequenza del DNA della condensina IDC svolge un ruolo importante nel reclutamento della condensina IDC.
Abbiamo trovato un motivo di sequenza di DNA contenente GCGC che è stato arricchito sotto i siti di legame della condensina II (Figura 5A). È interessante notare che sia il motivo condensin II che condensin IDC includevano il nucleo GCGC, ma il motivo condensin IDC è stato esteso su un lato da AGGG, suggerendo che la specificità X del reclutamento di condensin IDC è ottenuta da cofattori che riconoscono AGGG. A livello del genoma, l ‘ 11% dei motivi della condensina II era legato dalla condensina II. Pertanto, in modo simile ad altri TFs (ad esempio), solo una parte dei potenziali motivi della sequenza del DNA erano legati dalla condensina II. Altri fattori come l’accessibilità della cromatina e co-fattori sconosciuti possono essere coinvolti nella specificità del legame. Infatti, se abbiamo preso quei motivi che erano in una finestra 2 kb significativamente arricchita per un segno istone attivo, come H4K16ac, la percentuale di motivi che sono stati legati aumentato da 11% a 29%. Inoltre, simile al motivo condensin IDC, che è più raggruppato nei siti legati, abbiamo scoperto che le finestre genomiche da 1 kb che contenevano più di un motivo condensin II avevano circa 2,5 volte più probabilità di essere legate da condensin II, rispetto a quelle con un solo motivo. Pertanto, il clustering del motivo e il contesto aperto della cromatina aiutano a specificare la selezione dei motivi associati.
Non tutti i siti di legame condensin II hanno il motivo. In quei siti di condensina II senza il motivo, altri fattori possono essere responsabili del legame. In alternativa, la bassa percentuale di siti di condensina II (27%) contenenti un motivo può essere spiegata dalla potenziale diffusione di condensina II dopo il reclutamento. I siti di diffusione non dovrebbero contenere il motivo. Ad esempio, per condensin IDC, un’alta percentuale di potenziali siti di reclutamento (56%) contiene il motivo, ma non i siti di diffusione (8%) . È necessaria un’analisi sistematica della capacità di reclutamento dei siti di condensina II identificati per affrontare l’eventuale diffusione.
La DSC-2 è necessaria per il legame della condensina I-IDC, della condensina II e del caricatore della coesina ai siti di reclutamento del cromosoma X DCC
Nei metazoani, le proteine coinvolte nel reclutamento della condensina nei cromosomi non sono ben comprese. Nel lievito, il legame della condensina si sovrappone a quello del complesso di caricamento della coesina Scc2 / 4, che aumenta l’associazione della condensina con i cromosomi . Per verificare se la sovrapposizione con Scc2 / 4 è conservata tra lievito e C. elegans, abbiamo eseguito l’analisi CHIP-seq di SCC-2 (noto anche come PQN-85) e ha scoperto che un notevole 95% dei siti SCC-2 sovrapposti con condensina I-IDC sulla X, e il 60% con condensina II genome-wide (Figura 5B). La sovrapposizione è rimasta simile quando sono state escluse le regioni calde (file aggiuntivo 9: Figura S5A). Non tutti i siti di condensina si sovrapponevano a SCC-2, suggerendo che, a differenza del lievito, la condensina non dipende da SCC-2 per il legame . Il legame SCC-2 era più alto nei promotori e correlato positivamente con la trascrizione (file aggiuntivo 9: Figura S5B). Un motivo di sequenza di DNA contenente GAGA era presente nel 58% dei siti di legame SCC-2 (File aggiuntivo 9: Figura S5C). A differenza di Drosophila Nipped-B, e simile a S. cerevisiae Scc2, il legame SCC-2 non era elevato all’interno delle regioni trascritte, ma rimaneva intergenico (Figura 5C).
La sovrapposizione quasi completa (96%) dei siti di legame condensina II con condensina I-IDC sul cromosoma X supporta l’esistenza di meccanismi comuni per il legame cromosomico di diverse condensine. Poiché condensin II e SCC-2 legati a condensin siti di reclutamento IDC sulla X (Figura 5D e file aggiuntivo 9: Figura S5D), abbiamo ipotizzato che i reclutatori di condensin IDC reclutino anche condensin II e SCC-2. Il reclutamento ermafrodita-specifico di condensina IDC al cromosoma X è compiuto da DSC-2, DSC-3 e DPY-30 . Abbiamo eseguito HCP-6 e KLE-2 (condensin II), DPY-26 (condensin I-IDC) e SCC-2 ChIP-seq in sdc-2 embrioni mutanti nulli. Nel mutante dsc-2, il legame DPY-26, HCP-6, KLE-2 e SCC-2 è stato abolito in un sito di reclutamento IDC condensina X-specifico (rex-2) (Figura 5E). Non è chiaro perché il legame HCP-6 e KLE-2 a rex-2 fosse diminuito invece di assomigliare a un sito di condensazione autosomica. Il legame SCC-2 sugli autosomi e sui siti del cromosoma X indipendenti dalla DSC-2 è rimasto simile nel mutante della DSC-2 rispetto ai siti legati dalla DSC-2 (Figura 5F). I nostri risultati suggeriscono che SDC-2, la TF ermafrodita specifica che recluta condensina IDC al cromosoma X, recluta anche condensina II e la subunità complessa di caricamento della coesina SCC-2 negli stessi siti (File aggiuntivo 10: Figura S6). Precedenti studi genetici hanno stabilito che una mutazione nulla della dsc-2 non causa letalità embrionale nei maschi, pertanto la funzione di condensina II e di reclutamento di SCC-2 da parte della DSC-2 non è essenziale per la condensazione e la segregazione cromosomica generale . È possibile che il reclutamento di SCC-2 e condensina II da parte della DSC-2 abbia una funzione regolatrice genica ermafrodita-specifica.
Per verificare se SCC-2 ha un effetto sull’associazione cromosomica di condensina IDC nel sito di reclutamento, abbiamo eseguito l’analisi PCR quantitativa del chip DPY-27 in controllo rispetto agli embrioni di knockdown SCC-2. Alimentando RNAi, siamo stati in grado di abbattere i livelli di SCC-2 di circa l ‘ 80% (file aggiuntivo 9: Figura S5E). Al knockdown SCC-2, non abbiamo visto un cambiamento significativo nel legame DPY-27 a rex-1 o rex-2 (Figura 5G). Coerentemente, l’analisi di immunofluorescenza del legame condensina I e II sui cromosomi meiotici non ha mostrato una differenza significativa tra i mutanti wild type e scc-2 .