Il progetto genoma di anguria (Citrullus lanatus) e risequenziazione di 20 diverse adesioni
- il sequenziamento del Genoma e montaggio
- Annotazione di sequenza ripetuta e previsione genica
- Cucurbit genome evolution
- Valutazione della diversità genetica nel germoplasma dell’anguria
- Evoluzione dei geni di resistenza alle malattie nell’anguria
- Analisi della linfa del floema cucurbita e dei trascrittomi vascolari
- Regolazione dello sviluppo e della qualità della frutta dell’anguria
il sequenziamento del Genoma e montaggio
Abbiamo selezionato i Cinesi elite anguria linea inbred 97103 per il sequenziamento del genoma. Abbiamo generato un totale di 46,18 Gb di sequenza genomica di alta qualità utilizzando la tecnologia di sequenziamento Illumina (Tabella supplementare 1), che rappresenta 108.6-fold copertura dell’intero genoma anguria, che ha una dimensione del genoma stimato di Mb 425 Mb sulla base della nostra analisi di distribuzione profondità 17-mer delle letture sequenziati (Fig supplementare. 1) e una precedente analisi della citometria a flusso9. L’assemblaggio de novo delle letture Illumina ha portato a un assemblaggio finale di 353,5 Mb, che rappresenta l ‘ 83,2% del genoma dell’anguria. L’assemblaggio è costituito da 1.793 scaffold (≥500 bp) con lunghezze N50 di 2,38 Mb e 26,38 kb rispettivamente per gli scaffold e i contig (Tabella supplementare 2). Un totale di 234 scaffold che coprono circa 330 Mb (93.5% del genoma assemblato) sono stati ancorati agli 11 cromosomi cocomero, tra cui 126 e 94 scaffold che rappresentano il 70% e il 65% del genoma assemblato sono stati ordinati e orientati, rispettivamente10.
Abbiamo cercato di determinare perché il 16,8% del genoma non fosse coperto dal nostro assemblaggio del genoma allineando le letture non assemblate (17,4% delle letture totali) al genoma assemblato con criteri meno rigorosi (Nota supplementare e tabella supplementare 3). Abbiamo scoperto che le regioni del genoma non assemblate sono composte principalmente da sequenze simili a quelle delle regioni assemblate. La distribuzione delle letture non assemblate sui cromosomi dell’anguria ha mostrato lo stesso schema di quello per gli elementi trasponibili (Fig. 1a e Fig. 2). Abbiamo identificato tre unità di ripetizione principali dalle sequenze non assemblate sulla base delle loro sostanziali profondità di lettura e somiglianze di sequenza con centromeri, telomeri e cluster di DNA ribosomiale (rDNA). Abbiamo inoltre confermato la natura di queste ripetizioni da parte dei PESCI (Fig. 1 ter-d). Insieme questi risultati supportano l’idea che la sottostima della proporzione di ripetizione abbia un ruolo importante nella componente non assemblata degli assemblaggi del genoma de novo, in particolare quelli generati utilizzando tecnologie di sequenziamento di prossima generazione11,12,13,14,15,16,17,18.
Abbiamo inoltre valutato la qualità del genoma dell’anguria assemblato utilizzando circa un milione di EST, quattro BAC completamente sequenziati e sequenze accoppiate di 667 cloni BAC. Le nostre analisi hanno supportato l’alta qualità dell’assemblaggio del genoma dell’anguria (nota supplementare, tabelle supplementari 4-6 e fichi supplementari. 3 e 4), che è favorevolmente paragonabile a molti altri genomi vegetali recentemente pubblicati11,12,13,14,15,16,17,18 utilizzo di tecnologie di sequenziamento di nuova generazione (Tabella 1).
Annotazione di sequenza ripetuta e previsione genica
Gli elementi trasponibili sono componenti principali dei genomi eucariotici. Abbiamo identificato un totale di 159,8 Mb (45,2%) del genoma dell’anguria assemblato come ripetizioni di elementi trasponibili. Tra queste ripetizioni, il 68,3% potrebbe essere annotato con famiglie di ripetizioni note. I retrotrasposoni long terminal repeat (LTR), principalmente LTR di tipo zingaro e di tipo Copia, sono predominanti. La distribuzione dei tassi di divergenza degli elementi trasponibili ha mostrato un picco al 32% (Fig. 5). Abbiamo inoltre identificato 920 (7,8 Mb) retrotrasposoni LTR a lunghezza intera nel genoma dell’anguria. Abbiamo scoperto che negli ultimi 4,5 milioni di anni, i retrotrasposoni LTR si sono accumulati molto più velocemente nell’anguria che nel cetriolo14 (Fig. 6) tale che la differenza complessiva nelle dimensioni del genoma possa riflettere l’accumulo differenziale di retrotrasposoni LTR.
Abbiamo previsto 23.440 geni codificanti proteine ad alta fiducia nel genoma dell’anguria (Tabella supplementare 7), che è vicino al numero di geni previsti nel genoma del cetriolo19. Circa l ‘ 85% dei geni predetti dall’anguria aveva omologhi noti o poteva essere classificato funzionalmente (Tabella supplementare 8). Inoltre, abbiamo anche identificato 123 RNA ribosomiale (rRNA), 789 RNA di trasferimento, 335 piccoli RNA nucleari e 141 geni microRNA (Tabella supplementare 9).
In accordo con i genomi vegetali precedentemente riportati, i geni codificanti proteine dell’anguria hanno mostrato un chiaro pattern di arricchimento all’interno delle regioni subtelomeriche. Al contrario, la frazione correlata all’elemento trasponibile del genoma si trovava principalmente all’interno delle regioni pericentromeriche e centromeriche. I bracci corti dei cromosomi 4, 8 e 11 sono altamente arricchiti con sequenze ripetute (Fig. 7). Il genoma 97103 conteneva un cluster rDNA 5S e due 45S sul braccio corto dei cromosomi 4 e 8 (ref. 10). Utilizzando il PESCE, abbiamo ulteriormente studiato i modelli rDNA nei genomi di 20 adesioni rappresentative dell’anguria (Tabella supplementare 10). Il numero e la posizione dei siti 5S e 45S rDNA nei genomi dei dieci moderni coltivati (C. lanatus subsp. vulgaris) e sei semi anguria (C. lanatus subsp. mucosospermus) erano identici a quelli del genoma 97103, mentre i genomi dei quattro cocomeri selvatici più distanti (C. lanatus subsp. lanatus) conteneva un 45S e due siti rDNA 5S, con il sito rDNA 5S aggiuntivo sul braccio corto del cromosoma 11(Fig. 8). Questi risultati indicano che la fusione cromosomica, la fissione e la trasposizione di rDNA potrebbero verificarsi durante l’evoluzione delle specie di C. lanatus. La nostra analisi ha anche confermato la relazione filogenetica di queste tre sottospecie di cocomero 20 e ha sostenuto l’ipotesi che C. lanatus subsp. mucosospermus è il recente antenato di C. lanatus subsp. vulgaris.
Cucurbit genome evolution
La duplicazione del genoma nelle angiosperme è comune e rappresenta un importante meccanismo molecolare che ha plasmato i moderni cariotipi vegetali. Nel genoma dell’anguria, abbiamo identificato sette triplicazioni principali che corrispondevano a 302 relazioni paralogiche che coprivano il 29% del genoma (Fig. 2 bis). Questi triplicati ancestrali corrispondevano all’evento di paleoesaploidizzazione condiviso (riferito come γ) riportato per eudicots21 che risale a 76-130 milioni di anni fa. Questo sarebbe in anticipo rispetto all’evento di speciazione del genoma cucurbita che si è verificato 15-23 milioni di anni fa (Fig. 9).
Per accedere alla natura degli eventi evolutivi che portano alle moderne strutture del genoma della cucurbita, abbiamo analizzato le relazioni sinteniche tra anguria, cetriolo19, melon22 e grape21. Abbiamo scelto l’uva come riferimento, in quanto è noto per essere il parente più prossimo all’antenato eudicot strutturato in sette protocromosomi23. Abbiamo identificato un totale di 3.543 relazioni ortologhe che coprono il 60% del genoma dell’anguria. Abbiamo quindi studiato le relazioni cromosoma-cromosoma dettagliate all’interno della famiglia delle Cucurbitacee e identificato i cromosomi ortologhi tra anguria, cetriolo e melone (Fig. 2 ter). I complicati schemi sintenici illustrati come relazioni ortologhe cromosomiche a mosaico hanno svelato un alto grado di complessità dell’evoluzione cromosomica e del riarrangiamento tra queste tre importanti specie di colture della famiglia delle Cucurbitacee.
L’integrazione di analisi indipendenti delle duplicazioni all’interno e delle syntenie tra i quattro genomi di eudicot (anguria, cetriolo, melone e uva) ha portato alla caratterizzazione precisa nell’anguria delle sette paleotriplicazioni identificate di recente come base per la definizione di sette gruppi cromosomici ancestrali negli eudicot24. Sulla base dell’hexaploidization ancestrale (γ) riportato per gli eudicots, proponiamo uno scenario evolutivo che ha modellato i cromosomi 11 dell’anguria dagli antenati eudicot del cromosoma 7 attraverso gli intermedi paleoesaploidi 21. Suggeriamo che la transizione dagli antenati intermedi eudicot a 21 cromosomi abbia coinvolto 81 fissioni e 91 fusioni per raggiungere la moderna struttura a 11 cromosomi dell’anguria, che è rappresentata come un mosaico di 102 blocchi ancestrali (Fig. 2 quater).
Valutazione della diversità genetica nel germoplasma dell’anguria
Abbiamo selezionato 20 adesioni rappresentative dell’anguria per il resequencing del genoma. Queste includevano dieci adesioni coltivate che rappresentano le principali varietà di C. lanatus subsp. vulgaris (cinque ecotipi dell’Asia orientale e cinque dell’America), sei semiwild C. lanatus subsp. mucosospermus e quattro selvatici C. lanatus subsp. lanatus (Tabella supplementare 10 e Fig. 10). Abbiamo sequenziato queste adesioni tra 5× e 16× copertura e mappato le brevi letture al genoma di 97103 (Tabella supplementare 11). Abbiamo identificato un totale di SNP candidati 6,784,860 e 965,006 piccoli inserimenti/eliminazioni (indel) tra le 20 linee risequenziate e 97103. Le principali variazioni esistevano tra C. lanatus subsp. lanatus e le altre due sottospecie, mentre la variazione all’interno dell’anguria coltivata, in particolare C. lanatus subsp. l’ecotipo vulgaris America era relativamente basso (Tabella supplementare 12). Le precisioni delle nostre chiamate SNP e indel erano rispettivamente del 99,3% e del 98%, come indicato dal sequenziamento Sanger (Nota supplementare e tabella supplementare 13). Questo ampio set di dati di variazione del genoma dell’anguria, che copre un ampio spettro di diversità genetica dell’anguria, rappresenta una risorsa preziosa per la scoperta biologica e il miglioramento del germoplasma.
Abbiamo valutato la diversità genetica della popolazione di cocomeri utilizzando due statistiche di riepilogo comuni, valori π e θw25. La quantità stimata di diversità nell’anguria (tabella supplementare 14) era sostanzialmente inferiore a quella riscontrata in maize26, soia 27 e riso28. L’anguria selvatica contiene una maggiore diversità genetica, indicando ulteriori opportunità genetiche per il miglioramento dell’anguria. Abbiamo anche studiato la struttura della popolazione e le relazioni tra le adesioni cocomero attraverso la costruzione di un albero vicino di casa-unendo (Fig. 3a) e analisi delle componenti principali (PCA) (Fig. 3 ter). Entrambe le analisi hanno indicato la stretta relazione tra C. lanatus subsp. vulgaris e C. lanatus subsp. mucosospermus (nota complementare). Ulteriori analisi della struttura della popolazione utilizzando il programma FRAPPE29 con K (il numero di popolazioni) impostato da 2 a 5 hanno identificato un nuovo sottogruppo all’interno della subsp C. lanatus. gruppo mucosospermus (quando K = 5) e additivi tra C. lanatus subsp. vulgaris e C. lanatus subsp. mucosospermus (Fig. 3c e Nota integrativa). Il nuovo sottogruppo mostra alcune caratteristiche dell’anguria coltivata, come la consistenza della carne morbida, il colore della carne rosa e il contenuto di zucchero relativamente elevato (Tabella supplementare 10 e Fig. 10). Insieme questi risultati offrono un ulteriore supporto per il nostro scenario evolutivo proposto di C. lanatus subsp. mucosospermus a C. lanatus subsp. vulgaris derivato dall’analisi dei PESCI della distribuzione cromosomica di rDNA.
Abbiamo poi scansionato il genoma per le regioni con le più alte differenze di diversità genetica (nmucosospermus/nvulgaris) tra C. lanatus subsp. mucosospermus e C. lanatus subsp. vulgaris. Queste regioni rappresentano potenziali spazzate selettive durante l’addomesticamento dell’anguria, poiché si pensa che le moderne cultivar di anguria siano state addomesticate da C. lanatus subsp. mucosospermus. Abbiamo identificato un totale di 108 regioni (7,78 Mb di dimensione) contenenti 741 geni candidati (Fig. 4 e Tabella complementare 15). Anche se complementi di gene in queste regioni potrebbero essere stati influenzati dalla genetica autostop, abbiamo identificato i processi biologici notevolmente arricchito in geni candidati che sono stati collegati con importanti tratti rispetto all’intero genoma, compreso il regolamento di carboidrati l’uso di zucchero-mediata segnalazione, il metabolismo dei carboidrati, la risposta al saccarosio stimolo, il regolamento di azoto e di composti del metabolismo cellulare risposta alla fame di azoto e di crescita (Nota Integrativa e Complementare Tabelle 16-18).
È interessante notare che alcune regioni non centromeriche, in particolare una vasta regione sul cromosoma 3 (da Mb 3,4 Mb a Mb 5,6 Mb), hanno una divergenza nucleotidica particolarmente elevata solo tra C. lanatus subsp. adesioni mucosospermus (Fig. 4). Un rapporto precedente descriveva un risultato simile in tre diverse croci di riso, ed è stato suggerito che queste regioni ad alta divergenza specifiche per la popolazione erano altamente associate a geni coinvolti nelle barriere riproduttive30. Abbiamo analizzato i geni nella grande regione ad alta diversità sul cromosoma 3 e, in effetti, abbiamo scoperto che le categorie geniche più significativamente arricchite erano il riconoscimento del polline e l’interazione polline-pistillo; entrambe queste categorie geniche sono correlate alle barriere riproduttive (Tabella supplementare 19). Inoltre, abbiamo determinato che la regione conteneva un grande gruppo di 12 geni della proteina chinasi S-locus disposti in tandem, che sono coinvolti nelle barriere riproduttive31. L’alta divergenza nucleotidica dei geni barriera riproduttiva in C. lanatus subsp. mucosospermus, il recente progenitore dell’anguria coltivata moderna, indica che l’addomesticamento dell’anguria potrebbe essere una possibile forza responsabile della rapida evoluzione delle barriere riproduttive, come è stato riportato in rice30. Inoltre, anche i geni coinvolti nelle risposte delle piante agli stress abiotici e biotici sono stati significativamente arricchiti in questa regione, oltre ai geni correlati a diversi tratti selezionati noti come il metabolismo dei carboidrati, il sapore della frutta (metabolismo dei terpeni) e il contenuto di olio di semi (metabolismo degli acidi grassi) (Tabella supplementare 19).
Evoluzione dei geni di resistenza alle malattie nell’anguria
Il raccolto di anguria subisce gravi perdite da numerose malattie. Pertanto, il miglioramento della resistenza agli agenti patogeni è un obiettivo costante dei programmi di allevamento dell’anguria. Per studiare le basi molecolari per la suscettibilità agli agenti patogeni, abbiamo cercato tre principali classi di geni di resistenza nel genoma dell’anguria, vale a dire il sito di legame nucleotidico e la ripetizione ricca di leucina (NBS-LRR), la lipossigenasi (LOX)32 e le famiglie di geni simili ai recettori33. Abbiamo identificato un totale di 44 geni NBS-LRR, tra cui 18 Toll recettore interleuchina (TIR)-NBS-LRR– e 26 a spirale-bobina (CC)-NBS-LRR–codifica geni (Tabella supplementare 20). I geni dell’anguria NBS-LRR si sono evoluti indipendentemente e non abbiamo rilevato scambi di sequenze tra diversi omologhi. Tali modelli evolutivi sono simili a quelli dei geni R di tipo II in lattuga e Arabidopsis34, indicando che l’anguria ha una bassa diversità di geni NBS-LRR. Il numero di geni NBS-LRR nel genoma dell’anguria è simile a quello di cucumber14 e papaya35, ma è considerevolmente inferiore a quello di maize36, rice37 e apple12. Al contrario, la famiglia di geni LOX ha subito un’espansione nel genoma dell’anguria con 26 membri, 19 dei quali sono disposti in due array di geni tandem (Fig. 11). Risultati simili sono stati riportati nel cetriolo, con l’espansione della famiglia del gene LOX che è stata considerata come un possibile meccanismo complementare per far fronte all’invasione dei patogeni14. Abbiamo inoltre identificato 197 geni simili a recettori nel genoma dell’anguria, tra cui 35 codificano proteine simili a recettori prive di un dominio chinasico e 162 codificano chinasi simili a recettori che hanno un dominio chinasico intracellulare oltre ai domini extracellulari LRR e transmembrana (Tabella supplementare 20). Molti di questi geni di resistenza si trovano sui cromosomi in cluster (Fig. 11), suggerendo duplicazioni tandem come loro base evolutiva.
È stato ipotizzato che la mancanza di resistenza a una vasta gamma di malattie nelle moderne cultivar di anguria sia il risultato dei molti anni di coltivazione e selezione che si sono concentrati sulle qualità di frutta desiderabili a scapito della resistenza alle malattie8,38. Per testare questa nozione, abbiamo eseguito assemblee de novo di letture non mappate raggruppate ciascuna da moderne coltivate (C. lanatus subsp. vulgaris) e semiwild e selvaggio (C. lanatus subsp. mucosospermus e C. lanatus subsp. lanatus, rispettivamente) adesioni. Abbiamo identificato 11 e 69 geni dei gruppi coltivati e semiwild e wild, rispettivamente, omologhi alle proteine vegetali conosciute (Tabella supplementare 21). Vale la pena ricordare qui che i 69 nuovi geni identificati dal gruppo semiwild e wild erano altamente arricchiti con geni correlati alla malattia, tra cui 6 geni TIR-LRR-NBS, 1 gene PR-1 e 3 geni lipossigenasi, mentre nessuno degli 11 geni identificati nel gruppo coltivato era correlato alla malattia. Inoltre, tutti i 44 geni NBS-LRR identificati nel genoma 97103 erano presenti anche nelle adesioni semiwild e wild (Nota supplementare). Questi risultati supportano l’ipotesi che una gran parte dei geni di resistenza alle malattie sia stata persa durante l’addomesticamento dell’anguria.
Analisi della linfa del floema cucurbita e dei trascrittomi vascolari
Il sistema di tubi a setaccio enucleato angiosperm contiene mRNA, alcuni dei quali hanno dimostrato di funzionare come agente di segnalazione a lunga distanza39,40. Attraverso il sequenziamento profondo del trascrittoma (Tabella supplementare 22), abbiamo identificato 13.775 e 14.242 specie di mRNA nei fasci vascolari di anguria e cetriolo, rispettivamente, e 1.519 e 1.012 trascritti nella linfa del floema di anguria e cetriolo, rispettivamente (tabelle supplementari 23-26). In particolare, abbiamo scoperto che i set di geni nei fasci vascolari tra le due specie di cucurbite erano quasi identici, mentre solo il 50-60% dei trascritti rilevati nella linfa del floema erano comuni tra le due specie (Nota supplementare e Tabella supplementare 27). Gene Ontology (GO) term enrichment analysis indicated that the major categories among the common phloem transcripts were response to stress or stimulus (Supplementary Table 28), which is fully consistent with the central role of the plant vascular system, and the floem in particular, in the long-distance communication system that integrates abiotic and biotic stress signaling at the whole-plant level41. Al contrario, l’analisi dei trascritti del floema che sono unici per l’anguria ha identificato il processo di biosintesi macromolecolare e il processo metabolico delle proteine come le principali categorie GO (Tabella supplementare 29). Le trascrizioni uniche di sap del floema possono riflettere le funzioni specializzate che sono uniche al ruolo del floema in queste specie. È interessante notare che il floema dell’anguria conteneva 118 fattori di trascrizione, mentre abbiamo identificato solo 46 fattori di trascrizione nel cetriolo e 32 fattori di trascrizione che erano comuni a entrambi (tabelle supplementari 30-32).
La zucca (Cucurbita maxima) è stata utilizzata come sistema modello per gli studi sul floeme42,43. Abbiamo sviluppato pumpkin vascular bundle e phloem sap transcript catalogs attraverso la generazione e l’assemblaggio de novo delle letture Illumina paired-end RNA sequencing (RNA-Seq). L’analisi comparativa dei trascrittomi del floema di anguria, cetriolo e zucca ha indicato che circa il 36% delle loro trascrizioni erano in comune (Fig. 12). Questi trascritti conservati probabilmente svolgono funzioni che sono centrali per il funzionamento del sistema di tubi del setaccio nella maggior parte delle cucurbite e possibilmente altre specie.
Regolazione dello sviluppo e della qualità della frutta dell’anguria
Lo sviluppo della frutta dell’anguria è un processo complesso che comporta importanti cambiamenti in termini di dimensioni, colore, consistenza, contenuto di zucchero e componenti nutrizionali. Per ottenere una caratterizzazione completa dei geni coinvolti nello sviluppo e nella qualità del frutto dell’anguria, abbiamo eseguito RNA-Seq44 specifico del filo sia della carne che della crosta in quattro fasi cruciali dello sviluppo del frutto nella linea inbred 97103 (Tabella supplementare 33). Abbiamo identificato 3.046 e 558 geni che sono stati espressi in modo differenziale nella carne e nella crosta, rispettivamente, durante lo sviluppo del frutto e 5.352 geni che sono stati espressi in modo differenziale tra la carne e la crosta in almeno uno dei quattro stadi (Tabelle supplementari 34-36). VAI termine di arricchimento analisi ha indicato che durante la messa a frutto sia la carne e cotenna, processi biologici come la parete cellulare biogenesi, flavonoidi metabolismo e risposte di difesa sono stati significativamente alterati (false tassi di scoperta (FDR) < 0,01), mentre carotenoidi, esoso e monosaccaride processi metabolici erano solo alterato in modo significativo nella carne, che supporta i principali differenze fisiologiche, tra cui il contenuto di zucchero e la frutta di colore, tra la carne e cotenna (Complementare Tabella 37).
Il contenuto di zucchero è un fattore chiave nel determinare la qualità dei frutti dell’anguria. La dolcezza di un cocomero è determinata sia dal contenuto totale di zucchero che dai rapporti tra i principali zuccheri accumulati: glucosio, fruttosio e sucrose45. Nella polpa di frutta giovane 97103, fruttosio e glucosio sono gli zuccheri predominanti, mentre nella polpa di frutta matura 97103, sia il saccarosio che il tenore totale di zucchero sono notevolmente aumentati, con il saccarosio che diventa lo zucchero dominante; nella crosta, il tenore di zucchero rimane relativamente basso (Tabella supplementare 38). L’accumulo finale di zucchero nel frutto dell’anguria è determinato dallo scarico dello zucchero dal floema seguito dall’assorbimento e dal metabolismo all’interno della polpa del frutto. Il genoma annotato dell’anguria contiene un totale di 62 geni dell’enzima metabolico dello zucchero e 76 geni del trasportatore dello zucchero, tra cui 13 geni metabolici dello zucchero e 14 geni del trasportatore dello zucchero sono stati espressi in modo differenziato durante lo sviluppo della carne e tra la carne e i tessuti della crosta (Tabelle supplementari 39 e 40). Sulla base di questi risultati e del precedente lavoro pubblicato da altre specie vegetali46,47, proponiamo un modello per il metabolismo dello zucchero nelle cellule della polpa di frutta dell’anguria (Fig. 13). In particolare, durante lo sviluppo della carne di anguria, α-galattosidasi, invertasi acida insolubile, invertasi neutra, saccarosio fosfato sintasi, UDP-glucosio 4-epimerasi, invertasi acida solubile e UDP-galattosio/glucosio pirofosforilasi funzionano come enzimi chiave coinvolti nella regolazione dello scarico e del metabolismo dello zucchero. Inoltre, i 14 trasportatori di zucchero espressi in modo differenziato sono probabilmente responsabili della ripartizione dello zucchero (nota complementare).
Anche i fattori di trascrizione hanno un ruolo nell’accumulo di zucchero48. Dei 1.448 geni del fattore di trascrizione putativo identificati nel genoma dell’anguria, 193 hanno mostrato cambiamenti significativi di espressione (FDR < 0,01) durante lo sviluppo della carne e anche nella carne rispetto alla crosta nelle fasi successive, compresi i fattori di trascrizione delle famiglie note per essere coinvolte nella regolazione dell’accumulo di zucchero (Nota supplementare e tabelle supplementari 41 e 42). È interessante notare che un gene bZIP, Cla014572, è downregulated durante lo sviluppo della carne e contiene il telaio di lettura aperto upstream controllato dal saccarosio (SC-uORF) (Nota supplementare e Fig. 14). Recentemente è stato riferito che le piante transgeniche che esprimono costitutivamente il tabacco SC-uORF contenente il gene bZIP tbz17 ma privo del suo SC-uORF avevano aumentato le concentrazioni di zucchero49. Pertanto, la nostra analisi è coerente con un ruolo per Cla014572 come regolatore chiave dell’accumulo di zucchero durante lo sviluppo della frutta.
Geni MADS-box, come MADS-RIN (noto anche come LeMADS-RIN) 50 e TAGL1 (ref. 51) nel pomodoro, sono stati segnalati per regolare i processi di espansione e maturazione dei frutti. L’analisi filogenetica dei fattori di trascrizione di anguria, cetriolo e Arabidopsis MADS-box, insieme a MADS-RIN e TAGL1, ha identificato due fattori di trascrizione di MADS-box dall’anguria in ciascuno dei cladi RIN e AGL1 (Nota supplementare e Fig supplementare. 15). Questi quattro geni (Cla000691 e Cla010815 nel clade RIN e Cla009725 e Cla019630 nel clade AGL1) sono tra i fattori di trascrizione MADS-box più altamente espressi durante lo sviluppo del frutto (Tabella supplementare 43). In particolare, a differenza di MADS-RIN, che è altamente espresso solo nella maturazione dei frutti, sia Cla000691 che Cla010815 sono altamente espressi durante lo sviluppo dei frutti, indicando che potrebbero essersi evoluti per partecipare ad altre funzioni oltre alla maturazione. È interessante notare a questo proposito che gli omologhi vicini alla banana e alla fragola di MADS-RIN mostrano anche attività espressive e/o funzionali che si estendono oltre il frutto maturo52,53. I profili di espressione di Cla009725 e Cla019630 durante lo sviluppo della frutta sono simili a quelli di TAGL1, che sono coerenti con i loro potenziali ruoli nella regolazione dell’espansione e della maturazione51.
La citrullina è un aminoacido non essenziale prodotto dalla glutammina e ha vari benefici per la salute e le prestazioni atletiche. Il suo nome deriva da citrullus, la parola latina per anguria, da cui è stato isolato per la prima volta54. La polpa e la crosta dell’anguria servono come fonte naturale di citrullina e la sua abbondanza aumenta sostanzialmente durante la maturazione della frutta, ma poi diminuisce man mano che la frutta diventa troppo matura (Fig. 16). Sulla base della nostra annotazione del genoma dell’anguria, abbiamo identificato 14 geni nella via metabolica della citrullina (Fig. 17). Rispetto alla via metabolica della citrullina Arabidopsis, questa via nell’anguria ha subito un’espansione nelle famiglie arginosuccinasi e arginosuccinato sintasi. Entrambi sono coinvolti nella conversione della citrullina in L-arginina. Abbiamo trovato un arginosuccinasi e due geni arginosuccinato sintasi per essere altamente downregulated durante lo sviluppo della carne di anguria (Tabella supplementare 44). Pertanto, l’accumulo di citrullina nella polpa del frutto in maturazione è probabilmente il risultato di una diminuzione delle attività di degradazione della citrullina.