Genska podlaga cirkadianih in krožno-prilagodljivih časovnih prilagoditev v pomoli | naravo

Genska podlaga cirkadianih in krožno-prilagodljivih časovnih prilagoditev v pomoli | naravo

Anonim

Predmeti

  • Cirkadijska ureditev
  • Ekološka genetika
  • Evolucijska genetika
  • Genom

Izvleček

Organizmi uporabljajo endogene ure za predvidevanje rednih okoljskih ciklov, kot so dnevi in ​​plimovanje. Naravne različice, ki bi povzročile drugače časovno vedenje ali fiziologijo, ki so pri ljudeh znane kot kronotipi, na molekularni ravni niso bile dobro označene. Sekvencirali smo genom Clunio marinus , morskega griča , katerega razmnoževanje je časovno razporejeno s cirkadijanskimi in cirkalunarnimi urami. Mulji z različnih lokacij kažejo prilagojene genetsko časovne prilagoditve, specifične za sev. Preiskali smo genetsko variacijo petih vrst C. marinus z različnih lokacij in presodili kvantitativne lokute lastnosti za cirkalunarne in cirkadijske kronotipe. Območje, ki je najbolj povezano s cirkadijskimi kronotipi, povzroča razlike, specifične za sev, v številu različic zapletov, ki so odvisne od kalcija / kalmodulina kinaze II.1 (CaMKII.1). Ker so bile prikazane enakovredne različice, ki spreminjajo aktivnost CaMKII v Drosophila melanogaster in C. marinus ( Cma ) - CaMKII.1 poveča transkripcijsko aktivnost dimerja cirkadianih proteinov Cma- CLOCK in Cma- CYCLE, predlagamo, da modulacijo nadomestnega spajanja je mehanizem naravne prilagoditve v cirkadianih časovnih presledkih.

Glavno

Okoli nove ali polne lune se v nekaj specifičnih urah, ki obkrožajo plimovanje, iz morja izvira na milijone neplodnih mulcev vrste C. marinus , da izvedejo svoj bračni ples. Odrasli živijo le nekaj ur, med katerimi se parijo in se odlagajo. Zato morajo nastajati sinhrono in - glede na to, da se v morju odvija zarodek, ličinke in zenice - v času, ko najbolj ekstremne plime zanesljivo izpostavljajo življenjski prostor ličinke. Najnižje plimovanje je predvidljivo v določenih dneh lunarnega meseca ob določenem času dneva. Posledično je pojav odraslih v C. marinus pod nadzorom cirkalunarnih in cirkadianskih ur 1, 2 . Čeprav se najnižje plimovanje na določeni lokaciji vedno znova pojavlja, se njihov čas razlikuje med geografskimi lokacijami 3 . Posledično sevi C. marinus z različnih lokacij (razširjeni podatki sl. 1a) kažejo lokalno prilagoditev v cirkadianih in cirkalunarnih časih nastanka (razširjeni podatki sl. 1b, c). Križanci med navojema Jean in Por so pokazali, da so razlike v cirkadianih in cirkalunarnih časovnih presledkih gensko določene 4, 5 in v veliki meri pojasnjene z dvema kvadrantskima in dvema krožnima količinama ločljivosti (QTL) 6 .

Študije sprememb časovnih sprememb ali kronotipov pri živalih in ljudeh so se pogosto osredotočile na kandidatne gene iz cirkadianega transkripcijsko-translacijskega oscilatorja. V D. melanogaster so polimorfizmi v jedru cirkadianskih urnih časov , brezčasni in kriptohrom povezani s prilagodljivimi razlikami v temperaturni kompenzaciji 7, fotoodzivnostjo cirkadianske ure 8 in pojavnimi ritmi 9 . Medtem ko te študije ponujajo vpogled v evolucijo znanih molekul za cirkadijsko uro, so študije asociacije na celotnem genomu 10, 11 in drugi napredni genetski pristopi (pregledani v ref. 12) bistvenega pomena za zagotovitev celovite, nepristranske ocene spreminjanja naravnih časov, na primer temeljne motnje človeške faze spanja. Medtem ko prilagodljiva narava človeških kronotipov ostaja nejasna, kronotipi vrste C. marinus predstavljajo evolucijske prilagoditve njihovemu habitatu. Naša raziskava je želela ugotoviti genetsko podlago prilagoditve C. marinus njeni specifični ekološki „časovni niši“. Poleg tega lahko genetska disekcija prilagodljivih naravnih različic ne-cirkadianih ritmov 13, kot je prisotna tudi pri C. marinus, lahko zagotovi vstop v njihove neznane molekularne mehanizme.

Kot izhodišče za te analize smo sekvencirali, sestavili, preslikali in označili referenčni genom C. marinus .

Genom Clunio in QTL za določanje časa

Naš referenčni genom CLUMA_1.0 iz laboratorijskega seva Jean je vseboval 85, 6 Mb zaporedja (preglednica 1), kar je blizu prejšnje ocene, ki temelji na pretočni citometriji, 95 Mb 6, kar poudarja, da imajo kironomidi na splošno majhne genome 14, 15, 16 . Končni sklop ima oder N50 v velikosti 1, 9 Mb. Genotipizacija družine preslikav v celotnem genom z zaporedjem DNK, ki je povezano z omejitvenim mestom, je omogočila, da se 92% referenčnega zaporedja dosledno zasidra na zemljevidu genetske povezave (slika 1a in razširjeni podatki, slika 2), s čimer se je izboljšala izvirna karta povezave (dopolnilo Metode 5). Avtomatska pripomba o genomu je povzročila 21.672 genskih modelov. Podobnost beljakovin in razpoložljivi transkripti podpirajo 14.041 genskih modelov (dopolnilna tabela 1) v območju števila genov za D. melanogaster (15.507) in Anopheles gambiae (13.460). Tako se zdi, da je zelo majhen genom C. marinus popoln (preglednica 1, razširjeni podatki Slika 3, dodatna opomba 1 in dodatna tabela 2). Zaradi referenčnega genoma C. marinus so kironomidi tretja difterana poddružina z označenim genomom, rekonstruiranim na lestvici kromosomov (slika 1a in razširjeni podatki, slike 2, 3b – f).

Tabela polne velikosti

Image

a, Tri povezovalne skupine C. marinus z referenčnimi odri (desno), zasidrane na zemljevidu genske povezave (levo). Odri, ki so urejeni in usmerjeni, črne palice; ni usmerjena, sive palice; ne urejene niti orientirane, bele palice. Siva senčenja, velika nerekombinirajoča področja. QTL, cirkadiani (oranžna), cirkalunar (cijan). Ena cirkadiana in cirkalunarna QTL se prekrivata, kar ima za posledico tri fizična področja QTL (C1 / L1, C2 in L2, vijolična, oranžna in cijan). b, Populacijska genska analiza QTL C2. Analiza sevov Por in Jean (modra in rdeča, na srednjih dveh ploščah). Zgornja plošča, genska diferenciacija za enojne SNP (rdeče pike) in okna s 5 kb (črna črta). Druga plošča, genetska raznolikost ( θ ) v oknih 20 kb (tanka črta) in 200 kb (debela črta). Tretja plošča, neravnovesje povezave ( r 2 ) v oknih 100 kb. Spodnja plošča, korelacijska ocena (CS) za gensko diferenciacijo z vrednostmi za cirkadijsko časovno razporeditev (zgoraj), krožno časovno merjenje (srednja) in geografska razdalja (spodaj) za seve Vigo, Jean, Por, He in Ber. Spodnje številke, ID-ji odrov. Za nadaljnje podrobnosti, vključno s QTLs C1 / L1 in L2, glejte razširjene podatke Sl. 5a, b.

Slika v polni velikosti

  • Prenesite diapozitiv PowerPoint

Opravili smo osnovno karakterizacijo genoma in primerjavo z drugimi diterani. Roke kromosoma C. marinus C. (dodatna opomba 2, razširjeni podatki sl. 3c in dodatna tabela 3) smo razmejili na D. melanogaster in A. gambiae s sintetičnimi primerjavami (razširjeni podatki Fig. 3 in 4, dodatna opomba 2 in Dopolnilna tabela 3). ZW-podobno spolno lokuso smo našli tudi v C. marinus 6 zunaj homologa X kromosoma X (dodatna opomba 2) in zaznali povišano stopnjo kromosomske preurejenosti (slika 1a, dodatna opomba 3 in razširjeni podatki, slike 2, 3b – f, 4). Vsem skupaj je referenčni genom C. marinus videti dobro sestavljen.

Kot naslednji korak k identifikaciji molekulske osnove cirkadianih in cirkalunarnih časovnih prilagoditev v C. marinusu smo prečistili predhodno opredeljene časovne položaje QTL 6 na podlagi novih označevalcev DNK sekvenciranja z visoko gostoto, z omejevanjem na mestu (dopolnilna tabela 4 in Dopolnilna opomba 4) in določila referenčno zaporedje, ki ustreza intervalom zaupanja QTL (slika 1, oranžna in cijan palica; in dodatna tabela 4). V teh QTL ni bilo najdenih nobenih jedrnih cirkadianskih urnih genov (slika 1a). V QTL se nahaja samo timeout / timeless2 , brezčasni homolog z manjšo vlogo pri cirkadiani ponastavitvi ure 17 .

Genetska variacija časovnih sevov Clunio

Nato smo ponovno sekvencirali seva Por in Jean (razširjeni podatki Slika 1), za katere smo izvedli začetno analizo QTL 6 . Dva bazena s 300 osebami, ujetih na terenu, so bili zaporedoma razporejeni pri pokritju> 240 × (dodatna tabela 5) Mapiranje na referenčnem genomu je odkrilo 1.010.052 polimorfizmov z enim nukleotidom (SNP), od katerih je bilo 72% prisotnih tako v sevih Por kot Jean. Na podlagi vseh SNP smo določili gensko diferenciacijo ( F ST ), gensko raznolikost ( θ ) in neravnovesje povezave na kratkem dosegu (merjeno kot r 2 ) (slika 1b in razširjeni podatki Fig. 3c, 5a, b).

Genska diferenciacija med sevima Por in Jean v celotnem genomu je zmerna ( F ST = 0, 11), kar daje dobro osnovo za presejanje genoma za lokalno prilagoditev časovnega obdobja, ki temelji na genskem razhajanju. Po analizi QTL dva cirkadijska QTL pojasnjujeta 85% dnevne razlike, dva krožna QTL pa pojasnjujeta celotno mesečno razliko (dodatna tabela 4 in ref. 6). Ker ima vsak lokus močan vpliv na časovno razporeditev, mora biti selekcija proti nepravilno prirejenim alelom močna in časovni lokusi morajo biti močno diferencirani.

Znotraj intervalov zaupanja QTL-jev se močno razlikuje 158 SNP-jev in 106 indeksov (vstavki ali izbrisi) ( F ST ≥ 0, 8; slika 1b in razširjeni podatki Slika 5; SNP-ji, rdeče pike na ploščah F ST, za genom primerjava glej dopolnilno opombo 5). Sestavili smo seznam genskih kandidatov za cirkadiane in cirkalunarne časovne prilagoditve na podlagi njihove bližine diferenciranih SNP-jev in indeklov v QTL (dopolnilna tabela 6). Kandidatski geni ne vsebujejo jedrnih cirkadianskih genov ure ( brezčasni2 / timeout , max. F ST ≤ 0, 5; povprečje F ST = 0, 07), niti niso obogateni za nobeno določeno pot (analiza genske ontologije-term; dodatna tabela 7).

Časovni fenotip z korelacijo genotipa

Ob predpostavki, da aleli, povezani s prilagoditvijo časa, verjetno izvirajo iz stalne genske variacije (dodatna opomba 5), ​​se genetska variacija v časovnih lokusih ne sme prosto spreminjati med sevi, temveč naj bi sevi s podobno časovno razporeditvijo delili funkcionalno ustrezne alele. Za prepoznavo takih lokusov smo razširili genski zaslon na tri dodatne seve: od Vigo (Vigo), Helgolanda (He) in Bergen (Ber; razširjeni podatki sl. 1 in dopolnilne tabele 5, 8). Nato smo testirali vseh pet zaporednih sevov glede korelacije med genetsko diferenciacijo ( F ST ) in časovnimi razlikami ali geografskimi razdaljami kot ničelni model (dodatna tabela 8).

Na splošno genska diferenciacija na celotnem genomu ni bila povezana s cirkadijanskimi ( r = 0, 10, P = 0, 31) ali cirkalunarnimi ( r = 0, 56, P = 0, 12) časovnimi razlikami, ampak z geografsko razdaljo ("izolacija po razdalji"; r = 0, 88, P = 0, 008). Glede na to gensko ozadje signala izolacije na daljavo smo pregledali genom v drsnih oknih s 5 kb in dosegli vrhove korelacije med gensko diferenciacijo in časom, kar je povzročilo korelacijsko oceno (slika 1b in razširjeni podatki sl. 5a, b, plošče CS, ocena se giblje od 0 do 5; podrobnosti glej Metode). Z združevanjem dokazov iz zaslona F ST seva Por proti Žanu (dopolnilna tabela 6) s temi vzorci korelacije med časovnim razporedom in gensko divergenco je seznam kandidatnih genov zmanjšal na 49 genov (dodatna tabela 9).

Posebej je treba opozoriti, da je bilo eno območje v cirkadianskem QTL C2 izrazito diferencirano (slika 1b). V tej regiji je bila motnja povezave v sevu Por znatno povišana (test permutacije; P = 0, 002), genetska raznolikost pa se je v nekaterih raztežajih občutno zmanjšala (test permutacije; P = 0, 037 in 0, 020) v primerjavi s povprečjem gena Por. To lahko kaže na zadnjo epizodo izbire na Poru, ki je potencialno med prilagoditvijo časovne prilagoditve, saj je to območje tudi močno obogateno za časovno korelirane polimorfizme (slika 1b, plošča CS). Najbolj ekstremne vrednosti genske diferenciacije, genske raznolikosti in časovne korelacije so locirane na lokusu CaMKII.1 in na sprednjem delu gena, ki je homologen genu velikega banga (bbg) .

CaMKII vpliva na uro cirkadiana

V lokusu CaMKII.1 ni samo največ diferenciranega polimorfizma (dodatna tabela 9), ampak tudi CaMKII vpliva na cirkadijsko časovno razporeditev. Miški CaMKIIα fosforilira CLOCK in olajša njegovo dimerizacijo z BMAL in vivo 18 . Miševi z neaktivnim, kinazno odmrlim CaMKIIα K42R so dušili cirkadiane ritme in podaljšali cirkadijansko obdobje prostega teka 18 . CaMKII fosforilira tudi protein CLOCK v celični liniji D. melanogaster S2 in in vivo inhibicija Dme-CaMKII v senzibiliziranem ozadju z znižanimi ravnmi Ca 2+ podaljša cirkadijsko obdobje prostega teka 20, kar kaže, da vloga CAMKII v cirkadijski čas se ohranja pri živalih.

Da bi ugotovili, ali lahko CaMKII vpliva tudi na uro cirkadiana v C. marinus , smo preizkusili učinek Cma -CaMKII.1 v celičnem testu z uporabo celic D. melanogaster S2 19, 21 . Ponovili smo prejšnje poskuse 19, ki kažejo, da kemična inhibicija endogene Dme-CaMKII zmanjšuje količino ustvarjene luciferaze (razširjeni podatki Slika 6a), medtem ko dodajanje (Ca 2+ ] -odvisne in zato konstitutivno aktivne variante CaMKII ( miš, T286D) poveča količino luciferaze (razširjeni podatki Sl. 6b). Nato smo ustvarili konstrukcije za uro C. marinus, cikel C. marinus in mutirane kinaze-mrtve (K42R) in [Ca 2+ ] -neodvisne (T286D) različice Cma-CaMKII.1 . Transfekcija Cma-ure in Cma-cikla v celice D. melanogaster S2 vodi do aktivnosti luciferaze, ki jo poganja promotor 3X69, pridobljen iz promotorja obdobja Dme (slika 2a). Dodajanje [Ca 2+ ] -odvisnega Cma -CaMKII.1 T286D povzroči znatno povečanje signala luciferaze (slika 2a), medtem ko dodajanje mrtve zaradi kinaze Cma - CaMKII.1 K42R ne poveča aktivnosti luciferaze ( Slika 2a). Ti podatki kažejo, da aktivnost CaMKII kinaze poveča transkripcijo, ki je odvisna od E-polja, kar nakazuje proizvodnja luciferaze, ki jo poganja promotor 3X69 , prek dimerja CLOCK-CYCLE v C. marinus .

Image

a, dodatni C. marinus CaMKII.1 poveča transkripcijsko aktivnost C. marinus Clk in Cyc v testu luciferaze D. melanogaster S2 z uporabo ojačevalca 3X69 E-box, ki vsebuje ( obdobje 3X69- luc (ref. 21)). Podatki so predstavljeni kot srednja vrednost ± sem; dvostranski Welch dvo vzorčni t- test; biološke ponovitve, n = 5, razen brez nadzora klk , n = 3, vsaka biološka ponovitev predstavlja povprečje treh ponovitev pripravka. *** P <0, 0005. b, Ekson polnih (RA – RD) in delnih (RE – RO) Cma-CaMKII.1 prepisov. c, porazdelitev SNP -ov (črna), indel (oranžna) in 125-bp vstavka (rdeča pika) vzdolž lokuma Cma-CaMKII.1 , vse s F ST ≥ 0, 8.

Slika v polni velikosti

  • Prenesite diapozitiv PowerPoint

CaMKII.1 spajanje korelira s časom

Nato smo raziskali, kako polimorfizmi v lokusu Cma-CaMKII.1 vplivajo na encim. Našli smo dva alela CaMKII.1 : enega v zgodnje nastajajočih sevih Por, He in Ber ter drugega v pozno nastajajočih sevih Jean in Vigo. Večina polimorfizmov, specifičnih za soje, se nahaja v intronih (slika 2b, c in dodatna tabela 9). Če bi bili ti polimorfizmi pomembni, bi morali vplivati ​​na ekspresijo in / ali spajanje CaMKII.1 . Cma-CaMKII.1 ima štiri funkcionalna področja 22 (slika 2b). Večina diferenciranih polimorfizmov se gruči v območje spremenljive povezovalne domene (slika 2b, c), vključno s 125-bp vstavkom (rdeča pika na sliki 2c; razširjeni podatki sl. 7). Identificirali smo štiri nadomestne celovite prepise Cma-CaMKII.1 (RA – RD), ki se razlikujejo po dolžini povezovalca (slika 2b). Sekvence RNA z visoko pokritostjo so pokazale za različno uporabo eksona med sevi Jean in Por, pa tudi za prej neoznačene eksone znotraj spremenljivega veznega območja (razširjeni podatki sl. 6c). PCR in Sangerjevo zaporedje je potrdilo več delnih prepisov dodatnih različic spajkanja vezne regije (RE-RO; slika 2b). Za določitev vseh prepisov iz ličink tretjega namestnika smo uporabili qPCR za specifični prepis. Na splošno so prepisi RE – RO izraženi na zelo nizkih ravneh. Od teh je samo RO pokazal merljive razlike v izražanju med vrstama Jean in Por (slika 3a in razširjeni podatki, slika 6d). Pomembno je, da je qPCR, specifičen za prepis, potrdil pomembno diferencialno izražanje glavnih prepisov v sevih Jean proti Poru (slika 3a, razširjeni podatki, slika 6d), ki se ujemajo s podatki o zaporedju RNA (RNA-seq) (razširjeni podatki sl. 6c) . V skladu s tem so variante z dolgimi vezniki (RA, RB) pokazale večjo ekspresijo v sevu Por, medtem ko so krajše variante (RD, RO) pokazale večjo ekspresijo v sevu Jean (slika 3a in razširjeni podatki sl. 6c, d).

Image

a, vrednosti qPCR za variante zmesi CaMKII.1 iz sevov Por in Jean, normalizirane na Por (za ne-normalizirane podatke glej razširjene podatke Slika 6d). Podatki so predstavljeni kot srednja vrednost ± sem; Por, n = 9 bioloških ponovitev; Žan, n = 10; RO, Por, n = 3; Jean n = 8; RO niso zaznali v šestih bioloških ponovitvah Por, kar kaže na še večjo izrazno razliko; dvostranski test ranga Wilcoxon-a; * P <0, 05; ** P <0, 005; *** P <0, 0005; NS, ni pomembno; Holm popravek za večkratno testiranje. Za količinsko določitev podatkov RNA glej Razširjeni podatki Sl. 6c. b, diferencialno spajanje vezne regije CaMKII.1 v celicah D. melanogaster S2R +, normalizirano na Por, n = 7 bioloških ponovitev; dvostranski dvo vzorčni t- test, sicer kot a . c, reprezentativni odseki gela za fosforimacijo, količinsko opredeljeni za b, dve ločeni stezi iz istega gela (za polni gel glejte vhodne podatke). d, prosto teče ritem nastajanja odraslih pod stalno nejasno belo svetlobo (približno 100 lx). On in Por delita alele CaMKII.1 , medtem ko ima Jean drugi alel. Za izračun obdobja prostega teka smo povprečno določili čas med naslednjimi vrhovi vznikanja, pri čemer je vsak vrh tehtal s številom posameznikov.

Slika v polni velikosti

  • Prenesite diapozitiv PowerPoint

Če so odkrite razlike v številčnosti različic CaMKII.1 zmesi povezane s časovnimi razlikami, bi jih morali neposredno povzročiti polimorfizmi, specifični za sev, v lokusu CaMKII.1 . Da bi to preizkusili, smo ustvarili minigene, ki so vsebovali alternativno zlepljeno vezniško območje lokusa CaMKII.1 bodisi od sevov Jean ali Por. Dva minigena smo transfektirali v celice D. melanogaster S2R + celične linije, izražanje različic zlitkov pa smo analizirali z radioaktivnim RT-PCR (slika 3b, c). Zaznali smo štiri variante, ki ustrezajo različicam spajanja RB, RC, RD in RO. Vse variante so pokazale enake sevske razlike v številčnosti v celičnem testu S2R + kot v sevih C. marinus in vivo (slika 3a, b). Ker je celični kontekst enak za Jean in Por minigene v testu S2R +, lahko transaktivne elemente izključimo kot vzrok za diferencialno spajanje, kar pomeni, da je neposreden rezultat razlik v genskem zaporedju na Cma-CaMKII .1 lokus. Medtem ko so različice RB, RC in RD in njihovi sestavljajoči eksoni ohranjeni v D. melanogaster (glej priloge Flybase in ref. 23), kolega D. melanogaster RA ne obstaja. To lahko razloži, zakaj je ta varianta v celicah S2R + neodkrita (slika 3b).

Od različic spajanja do časovnih razlik

Različice dolžine vezav CaMKII so bile raziskane pri več vrstah. Izoforme D. melanogaster CaMKII, ki ustrezajo različicam C. marinus RB, RC in RD, imajo različne substine do substrata in stopnje ciljne fosforilacije 23 . Te razlike v aktivnostih razlaga dejstvo, da CaMKII deluje kot dodekamera, dolžina veznika pa določa kompaktnost in s tem dostopnost substrata holoencimu - encimi z dolgimi vezniki imajo večjo aktivnost. To razmerje med strukturo in funkcijo je morda univerzalno, saj se ohranja med ljudmi in C. elegans 22, 24 .

Neaktivacija ali inhibicija CaMKII podaljša cirkadijska obdobja pri miših in plodovih 18, 20 . Povezava med dolžino cirkadianega obdobja in fazo aktivnosti v ciklih svetlo-temno je znana iz mutacij v obdobju D. melanogaster 25 in človeških kronotipov 26 . Te ugotovitve pomenijo, da bi morale pri C. marinus bolj aktivne in lažje aktivirane Ca2 +, dolgovezniške variante CaMKII.1 pospeševati nastanek odraslih s skrajšanjem obdobja cirkadiane ure. Dejansko ugotavljamo, da imajo zgodnje nastajajoči sevi Por in He, ki imajo enake alele CaMKII.1 na dolge vezi, krajše proste cirkadanske ure kot pozni nastajajoči sev Žana (sl. 3d).

Z vključevanjem naših rezultatov s tistimi iz prej omenjene literature predlagamo, da uravnavanje razmerja CaMKII.1 variante zmesi predstavlja evolucijski mehanizem za prilagajanje cirkadianega časovnega razporeda (razširjeni podatki Slika 8): razlike v genskem zaporedju CaMKII.1 vodijo do diferencialno spajanje in aktivnost CaMKII.1 . Med številnimi možnimi cilji to vpliva na CLOCK-CYCLE-dimer-odvisno transkripcijo, kar posledično vpliva na dolžino cirkadiana obdobja in na koncu povzroči razlike v času nastanka odraslih.

Diskusija

Letni, lunarni in plimovalni ritmi ter naravno spreminjanje časa med posamezniki so pomembni in razširjeni pojavi, ki jih slabo razumemo. Referenčni genom C. marinus in gensko variacijska plošča za pet sevov z različnimi cirkadijanskimi in cirkalunarnimi časovnimi razporedi vzpostavljajo nove vire za nadaljnje študije teh tem.

Ortologe C. marinus smo identificirali za vse jedrne cirkadijske gene ure, pri čemer nobeden od njih ni vpleten v cirkadiane ali cirkalunarne časovne prilagoditve. Za krožno časovno merjenje to podpira molekularno neodvisnost cirkalunarne ure od cirkadijanske ure, kot poročajo za Platynereis dumerilii 27 .

Za cirkadijsko merjenje časa se za alternativno spajanje CaMKII.1 pojavi možna mehanizem za naravno prilagajanje. Glede na prejšnje poskuse na D. melanogaster in miši 18, 19, 20, 23 se zdi najverjetneje, da razlike v aktivnosti CaMKII v različnih zmesnih oblikah vodijo do cirkadianih časovnih razlik s pomočjo fosforilacije CLOCK-CYCLE (razširjeni podatki Fig. 8).

Možno je tudi, da CaMKII vpliva na cirkadijsko merjenje časa preko drugih ciljev. Na primer, za CaMKII je znano, da fosforilira vezani protein cAMP odzivnega elementa (CREB) 28, 29 . CREB je povezan s cirkadijsko uro s pomočjo elementov odziva cAMP (CRE) v promotorjih obdobja in brezčasnih genov 30, 31 ter s fizično interakcijo proteina, ki veže CREB (CBP), s CREB, CLOCK in CIKLOM 32, 33 . Poleg tega je ena najbolj dobro raziskanih vlog CaMKII morfološka modulacija nevronske plastičnosti in povezljivosti 34, 35, 36 . Takšne spremembe v povezljivosti so vse pogosteje vključene kot del cirkadianskega časovnega mehanizma pri D. melanogaster in sesalcih 37 . Zanimivo je, da je vloga CaMKII pri oblikovanju nevronske povezanosti predlagana tudi za povezavo z več nevropsihiatričnimi boleznimi 38, ki se pogosto pojavljajo s kronobiološkimi motnjami 39, 40, 41, 42 . Potrebne so nadaljnje študije, da se ugotovi, ali modulacija aktivnosti CaMKII predstavlja molekularno vez med temi pojavi.

Metode

Za določitev velikosti vzorca niso bile uporabljene statistične metode. Poskusi niso bili randomizirani in preiskovalci niso bili zaslepljeni pri dodeljevanju med poskusi in oceno rezultatov.

Živalska kultura in svetlobni režimi

Laboratorijske zaloge C. marinus so bile vzrejene v skladu z Neumannom 1, oskrbo z vodnim objektom MFPL. Na kratko so C. marinus hranili v plastičnih posodah 20 × 20 × 5 cm s peskom in naravno morsko vodo, razredčeno do 15 ° z razsoljeno vodo, nahranjenimi diatomi ( Phaeodactylum tricornutum , sev UTEX 646) v zgodnjih fazah ličink in kopriv v prahu v kasnejših fazah. Temperatura v klimatskih komorah je bila nastavljena na 20 ° C, cikel svetlo-temen pa 12:12 (razen če je drugače navedeno). Luna je bila simulirana z žarnico z žarilno nitko (približno 1 lx), ki je bila vklopljena vso noč štiri zaporedne noči vsakih 30 dni.

Sestavljanje genoma

Postopek sestavljanja genoma (razširjeni podatki Sl. 9a) je temeljil na treh zaporednih knjižnicah (dodatna tabela 10): knjižico vstavljenih 0, 2 kb je bilo pripravljeno iz enega odraslega samca laboratorijskega sena Jean (ugotovljeno iz vzorcev polja, odvzetih v St. Jean-de-Luz, Francija, leta 2007;> 12 generacij v laboratoriju), ki so stradali in hranili v morski vodi s penicilinom (60 enot na ml), streptomicinom (60 μg ml -1 ) in neomicinom (120 μg ml - 1 ) v zadnjih 2 tednih razvoja. DNK smo ekstrahirali z metodo soljenja 46, striženo na sovatorju Covaris S2 (frekvenčni način pometanja; 4 ° C; delovni cikel, 10%; intenzivnost, 7; cikli na razpok, 300; vlakna microTUBE AFA 6 × 16 mm; 30 s) in pripravili za zaporedje Illumina s standardnimi protokoli. 2, 2-kb in 7, 6-kb knjižica z vstavki so bili pripravljeni iz polimorfne baze DNK> 300 odraslih samcev Žana odraslih pri Eurofins MWG Operon (Ebersberg, Nemčija) v skladu s protokolom proizvajalca. Vsaka knjižnica je bila sekvencirana v enem pasu Illumina HiSeq2000 s parimi odčitki s 100 bp v enoti za zaporedno sledenje naslednje generacije dunajskih biocentričnih centrov (//vbcf.ac.at).

Bralne filtre smo filtrirali za zaporedje kakovosti odčitavanja, adapterje in distančnike s cutadaptom 47 (−b −n 3 −e 0, 1 −O 8 −q 20 −m 13), podvojene pa smo odstranili s fastq-mcf iz enostavnih pripomočkov 48 (−D 70 ). Bralni pari so bili prepleteni z ngm-utils 49, pri čemer so ostali samo seznanjeni odčitki. Kontaminacija s človeško DNK, ki jo najdemo v knjižnici z 0, 2 kb, je bila odstranjena tako, da smo črtali odčitke, ki se ujemajo s človeškim genomom, in sicer z oceno kakovosti ≥ 20 (v skladu z BWA 50 ).

Sestavljanje v kontige z Velvet 51 (odri onemogočeni; kmetri s 57 bp, kot je določil VelvetOptimiser 52 ), je temeljilo izključno na manj polimorfni 0, 2-kb knjižnici. Približno 600 preostalih adapterskih zaporedij na koncih sestavljenih kontig je bilo obrezanih s cutadaptom (-O 8 −e 0, 1 −n 3). Za statistiko montaže glej dopolnilno tabelo 11.

Odrivanje kontigov je temeljilo na vseh treh knjižnicah in se izvajalo s programom SSPACE 53 v dveh iteracijah, to je, da so bili odri iz prvega kroga znova odrezani. Uporaba različnih parametrov v iteracijah (dodatna tabela 12) je omogočila različne povezave in s tem povečala povezljivost odrov (dodatna tabela 13). Učinek je verjetno posledica polimorfne narave knjižnic 2, 2-kb in 7, 6-kb; Rezultat je „najpogostejša ureditev odrov s soglasjem prebivalstva“. Postopek iterativnega odra je bil izveden z in brez uporabe odreza velikosti brez contigov <1 kb, kar je povzročilo dva neodvisna sklopa (CLUMA_0.3 in CLUMA_0.4; glej razširjene podatke Slika 9a), ki sta se razlikovala v celotni povezljivosti in zaporedju vsebino (dopolnilna tabela 11), pa tudi v identiteti in strukturi velikih odrov. Da bi združili tako vsebino povezovanja kot zaporedja in da bi odpravili protislovja v strukturi največjih odrov, sta oba sklopa primerjala in uskladila v ročnem postopku superzidarstva, kot je podrobno opisano v Dopolnilni metodi 1. Na kratko prekrivanje odrov iz obeh sklopov je bilo preizkušeno z iskanjem BLAST in predstavljeno v grafični mrežni strukturi. Odri z vsebino skladne sekvence v obeh sklopih bi povzročili linearno mrežo, medtem ko bi odri s protislovno vsebino zaporedja povzročili razvejane mreže. Hkrati sta bila oba sklopa podvržena kartiranju genske povezave, ki temelji na genotipih, pridobljenih z sekvenciranjem DNK, ki je povezano z omejevanjem, (zaporedje RAD) objavljene družine za kartiranje 6 (dopolnilna metoda 2). Tako dobljene informacije o genetski povezavi služijo razrešitvi razvejanih mrež v najdaljše možne nedvoumne linearne podmreže z doslednimi informacijami o genetski povezavi (glej shemo A v dodatni metodi 1). Končno je bila struktura nastalih superzidkov kodirana v YAML formatu in prevedena v DNA zaporedje s Scaffolder 54, kar je povzročilo 75 preslikanih super odrov.

Preostale majhne in neopisane skele smo filtrirali za fragmente mitohondrijskega genoma, gensko gručo histona in gensko gručo 18S / 28S ribosomske rDNA, ki smo jih ločeno sestavili (dodatna metoda 3; razširjeni podatki Slika 10). Odstranjeni gradbeni odri so bili filtrirani tudi zaradi očitne kontaminacije drugih vrst (dodatna metoda 3). Stopnja, v kateri so preostali neobdelani odri, ki so ostali polimorfni različici delov preslikanih superzidarjev, je bila ocenjena tako, da so prve razstrelili proti slednjim (dodatna metoda 3 in dodatna tabela 14).

Vsi odri so bili podvrženi vrzeli z GapFiller-om 55 in ponavljajočimi se robovi, torej vrzeli s skoraj enakimi zaporedji na obeh straneh, ki zaradi genetskih polimorfizmov na splošno niso zaprti in so bili po možnosti odstranjeni s prilagojeno skriptu (Dopolnilna metoda 4; koda na voljo v datoteki izvornih podatkov).

Končni sklop CLUMA_1.0 je bil predložen v okviru projekta PRJEB8339 (75 preslikanih odrov; 23.687 nepreglednih odrov ≥100 bp). Sklop in dodatne informacije lahko dobite tudi pri ClunioBase (//cluniobase.cibiv.univie.ac.at).

Rekonstrukcija kromosomov in QTL analiza

Podatki o genetski povezavi za končnih 75 superzidkov so bili dobljeni s ponavljanjem preslikave branja v genotip, ki zahteva preizkus zaporedja RAD, kot je opisano zgoraj (dodatna metoda 2), zdaj pa je sestavljen z CLUMA_1.0 kot referenco. To nam je omogočilo postavitev in usmerjanje superzidkov vzdolž zemljevida genske povezave (slika 1a in razširjeni podatki Sl. 2). Položaji dogodkov rekombinacije znotraj odra so bili približni kot sredina med položajema dveh markerjev RAD, med katerimi se je vzorec označevalcev spreminjal z ene lokacije na drugo. Objavljeni zemljevid genske povezave je bil izpopolnjen in spremenjen (dopolnilna metoda 5 in razširjeni podatki Slika 2). Na podlagi izpopolnjene karte povezav je bila analiza QTL objavljene družine preslikav ponovljena, kot je opisano 6 (dodatna tabela 4 in dodatna opomba 5). S pomočjo korespondence med referenčnim sklopom in zemljevidom genske povezave smo lahko neposredno identificirali genska območja, ki ustrezajo intervalom zaupanja QTL (slika 1 in razširjeni podatki sl. 5a, b).

Zaporedje prepisov

V prejšnjih poskusih so bili na voljo sestavljeni transkripti normalizirane knjižnice cDNA vseh življenjskih stopenj in različnih sevov C. marinus (454 zaporedja), za odrasle pase Jean-e (Illumina zaporedje) so bili na voljo podatki o sekvenciranju RNA. Poleg tega je bila posebej za opombo o genomu pripravljena RNA iz 80 tretjih ličink iz laboratorijskih sevov Jean in Por za sekvenco RNA v skladu s standardnimi protokoli (dodatna metoda 6). Vsak vzorec je bil sekvenciran na enem pasu Illumina HiSeq 2000. Vsi prepisi so bili poslani v Evropski arhiv nukleotidov (ENA) v okviru projekta PRJEB8339.

Za podatke o zaporedju RNA za odrasle in ličinke smo neobdelane odčitke preverjali s hitrostjo 56, obdelovali kakovost adapterjev s cutadaptom 47 in filtrirali tako, da so vsebovali samo brane pare z uporabo vmesnega ukaza ngm-utils 49 . Reads were assembled separately for larvae and adults with Trinity 57 (path_reinforcement_distance: 25; maximum paired-end insert size: 1, 500 bp; otherwise default parameters).

Opomba o genomu

Automated annotation was performed with MAKER2 58 . Repeats were masked based on all available databases in repeatmasker. MAKER2 combined evidence from assembled transcripts (see above), mapped protein data sets from Culex quinquefasciatus (CpipJ1), Anopheles gambiae (AgamP3), Drosophila melanogaster (BDGP5), Danaus plexippus (DanPle_1.0), Apis mellifera (Amel4.0), Tribolium castaneum (Tcas3), Strigamia maritima (Smar1) and Daphnia pulex (Dappu1) and ab initio gene predictions with AUGUSTUS 59 and SNAP 60 into gene models. AUGUSTUS was trained for C. marinus based on assembled transcripts from the normalized cDNA library. SNAP was run with parameters for A. mellifera , which had the highest congruence with known C. marinus genes in preliminary trials (Supplementary Method 7). MAKER was set to infer gene models from all evidence combined (not transcripts only) and gene predictions without transcript evidence were allowed. Splice variant detection was enabled, single-exon genes had to be larger than 250 bp and intron size was limited to a maximum of 10 kb.

All gene models within the QTL confidence intervals, as well as all putative circadian clock genes and light receptor genes were manually curated: exon–intron boundaries were corrected according to transcript evidence (approximately 500 gene models), chimeric gene models were separated into the underlying individual genes (approximately 100 gene models separated into around 300 gene models) and erroneously split gene models were joined (approximately 15 gene models). Finally, this resulted in 21, 672 gene models, which were given IDs from CLUMA_CG000001 to CLUMA_CG021672 ('CLUMA' for Clunio marinus , following the controlled vocabulary of species from the UniProt Knowledgebase; CG for 'computated gene'). Splice variants of the same gene (detected in 752 gene models) were identified by the suffix '-RA', '-RB' and so on, and the corresponding proteins by the suffix '-PA', '-PB' and so forth.

Gene models were considered as supported if they overlapped with mapped transcripts or protein data (Supplementary Table 1). Gene counts for D. melanogaster were retrieved from BDGP5, version 75.546 and for A. gambiae from AgamP3, version 75.3. The putative identities of the C. marinus gene models were determined in reciprocal BLAST searches, first against UniProtKB/Swiss-Prot (8, 379 gene models assigned) and if no hit was found, second against the non-redundant protein sequences (nr database) at NCBI (1, 802 additional genes assigned). Reciprocal best hits with an e value < 1 × 10 −10 were considered putative orthologues (termed 'putative gene X'), non-reciprocal hits with the same e value were considered paralogues (termed 'similar to'). All remaining gene models were searched against the PFAM database of protein domains (111 gene models assigned; termed 'gene containing domain X'). If still no hit was found, the gene models were left unassigned ('NA').

Synteny comparisons

Genome-wide synteny between the C. marinus , D. melanogaster and A. gambiae genomes was assessed based on reciprocal best BLAST hits ( e value < 10 × 10 -10 ) between the three protein data sets (Ensembl Genomes, Release 22, for D. melanogaster and A. gambiae ). Positions of pairwise orthologous genes were retrieved from the reference genomes (BDGP5, AgamP3 and CLUMA_1.0) and plotted with Circos 61 . C. marinus chromosome arms were delimited based on centromeric and telomeric signatures in genetic diversity and linkage disequilibrium (Extended Data Fig. 3c and Supplementary Table 3; for data source see 'strain re-sequencing' below). Homologues for C. marinus chromosome arms were assigned based on enrichment with putative orthologous genes from specific chromosome arms in D. melanogaster and A. gambiae (Extended Data Figs 3, 4 and Supplementary Table 3). Additionally, for the 5, 388 detected putative 1:1:1 orthologues ( C. marinus : D. melanogaster : A. gambiae ), microsynteny was assessed by testing if all pairs of directly adjacent genes in one species were also directly adjacent in the other species. The degree of microsynteny was then calculated as the fraction of conserved adjacencies among all pairs of adjacent genes. From this fraction the relative levels of chromosomal rearrangements in the evolutionary lineage leading to C. marinus were estimated (Supplementary Note 3 and Extended Data Fig. 4).

Strain re-sequencing

Genetic variation in five C. marinus strains (Extended Data Fig. 1) was assessed based on pooled-sequencing data from field-caught males from the strains of St. Jean-de-Luz (Jean; Basque Coast, France; sampled in 2007; n = 300), Port-en-Bessin (Por; Normandie, France; 2007; n = 300), as well as Vigo (Spain; 2005; n = 100), Helgoland (He; Germany; 2005; n = 300) and Bergen (Ber; Norway; 2005; n = 100). Samples from Vigo and Bergen, were provided by D. Neumann and C. Augustin, respectively. For each strain we chose the largest available number of individuals to obtain the best possible resolution of allele frequencies. Females are not available, because they are virtually invisible in the field. For an overview of the experimental procedure, see Extended Data Fig. 9b. DNA was extracted with a salting-out method 46 from sub-pools of 50 males, the DNA pools were mixed at equal DNA amounts, sheared and prepared as described above and sequenced on four lanes of an Illumina HiSeq2000 with paired-end 100-bp reads (Ber and Vigo combined in one lane, distinguished by index reads). All reads were submitted to the European Nucleotide Archive (ENA) under project PRJEB8339. Sequencing reads were filtered for read quality and adaptor sequences with cutadapt 47 (−b −n 2 −e 0.1 −O 8 −q 13 −m 15), interleaved with ngm-utils 49 and duplicates were removed with fastq-mcf from ea-utils 48 (−D 70). Reads were aligned to the mapped super-scaffolds of assembly CLUMA_1.0 with BWA 50 (aln and sampe; maximal insert size (bp): −a 1500).

Detection of re-arrangements

Based on the unfiltered alignments, the samples from Por and Jean were screened for genomic inversions and indels relative to the reference sequence with the multi-sample version of DELLY 62 . Paired-end information was only considered if the mapping quality was high ( q ≥ 20) (see also Supplementary Note 3).

Population genomic analysis of the timing strains

For population genomic analysis (Extended Data Fig. 9b), the alignments of the pool-sequencing (pool–seq) data from Vigo, Jean, Por, He and Ber were filtered for mapping quality ( q ≥ 20), sorted, merged and indexed with SAMtools 63 . Reads were re-aligned around indels with the RealignerTargetCreator and the IndelRealigner in GATK 64 . The resulting coverage per strain is given in Supplementary Table 5.

For identification of SNPs, a pileup file was created with the mpileup command of SAMtools 63 . Base Alignment Quality computation was disabled (−B); instead, after creating a synchronized file with the mpileup2sync script in PoPoolation2 65, indels that occurred more than ten times were masked (including 3 bp upstream and downstream) with the identify-indel-regions and filter-sync-by-gtf scripts of PoPoolations2. F ST values were determined with the fst-sliding script of PoPoolation2, applying a minimum allele count of 10 (so that any false-positive SNPs resulting from the remaining unmasked indels were effectively excluded) and a minimum coverage of 40× for the comparison between Por and Jean or 10× for the comparison of all five strains. F ST was calculated at a single base resolution, as well as in windows of 5 kb (step size, 1 kb). Individual SNPs were only considered for further analyses or plotted if they were significantly differentiated as assessed by Fisher's exact test (fisher-test in PoPoolation2).

Average genome-wide genetic differentiation between timing strains, as obtained by averaging over 5-kb sliding-windows, was compared to the respective timing differences and geographic distances (see Supplementary Table 8) in Mantel tests (Pearson's product moment correlation; 9, 999 permutations), as implemented in the vegan package in the R statistical programming environment (ref. 66). Geographic distances and circadian timing differences were determined as described previously 67 (see Supplementary Table 8). For determination of lunar timing differences when comparing lunar with semilunar rhythms see Supplementary Note 6. In order to find genomic regions for which genetic differentiation is correlated with the timing differences between strains, the Mantel test was then applied to 5-kb genomic windows every 1 kb along the reference sequence. 5 kb is roughly the average size of a gene locus in C. marinus . Windows with a correlation coefficient of r ≥ 0.5 were tested for significance (999 permutations). For each genomic position the number of overlapping significantly correlated 5-kb windows was enumerated, resulting in a correlation score (CS; ranging from 0 to 5).

Genetic diversity, measured as Watterson's theta ( θ W ), for each strain was assessed with PoPoolation1.1.2 (ref. 68) in 20-kb windows with 10-kb steps. In order to save computing time, the pileup files of Jean, Por and He were linearly downscaled to 100× coverage with the subsample-pileup script ('fraction' option), positions below 100× coverage were discarded. Indel regions were excluded (default in PoPoolation 1.1.2) and a minimum of 66% of a sliding window needed to be covered. SNPs were only considered in θ W calculations if present ≥2 times, leading to slight inconsistencies in θ W estimates between strains due to differing coverage, but not affecting diversity comparisons within strains.

Linkage disequilibrium between the SNPs was determined for the Por and Jean strains with LDx 69, assuming physical linkage between alleles on the same read or read pairs. r 2 was determined by a maximum likelihood estimator, minimum and maximum read depths corresponded to the 2.5% and 97.5% coverage depths for each population (Jean, 111–315; Por, 98–319), total insert distance was limited to 600 bp, minimum phred-scaled base quality was 20, minimum allele frequency was 0.1 and a minimum coverage per pair of SNPs was 11. SNPs were binned by their physical distance for the plots (0–200 bp, 200–400 bp, 400–600 bp), with the mean value plotted.

Finally, small indels (<30 bp) in the Por and Jean strains were detected with the UnifiedGenotyper (−glm INDEL) in GATK 64 for positions with more than 20× coverage. Genetic differentiation for indels was calculated with the classical formula F ST = ( H T − H S )/ H T, where H S is the average expected heterozygosity according to Hardy–Weinberg Equilibrium (HWE) in the two subpopulations and H T is the expected heterozygosity in HWE of the hypothetical combined total population. If more than two alleles were present, only the two most abundant alleles were considered in the calculation of F ST .

Assessment of candidate genes

Gene models from the automated annotation were considered candidate genes, if they fulfilled the following criteria. (1) The gene was located within the reference sequence corresponding to the QTL confidence intervals as determined for the Por and Jean strains. (2) The gene contained a strongly differentiated SNP or small indel or it was directly adjacent to such a SNP or small indel ( F ST ≥ 0.8 for Por versus Jean, that is, the strains used in QTL mapping). This resulted in a preliminary list of 133 genes based on the comparison between Por and Jean (Supplementary Table 6). These candidate genes were narrowed down based on their overlap with genomic 5-kb windows, for which genetic differentiation between five European timing strains correlated with their timing differences (Fig. 1a, Extended Data Fig. 5a, b and Supplementary Table 9).

The location and putative effects of the SNPs and indels relative to the gene models were assessed with SNPeff 70 (−ud 0, otherwise default parameters; Extended Data Fig. 5c, d and Supplementary Tables 6, 9).

For Gene Ontology (GO) term analysis, all C. marinus gene models with putative orthologues in the UniProtKB/Swiss-Prot and non-redundant protein sequences (nr) databases based on reciprocal best BLAST hits (see above) were annotated with the GO terms of their detected orthologues (6, 837 gene models). Paralogues were not annotated. The enrichment of candidate SNPs and indels ( F ST ≥ 0.8 between Por and Jean) in specific GO terms was tested with SNP2GO 71 (min.regions = 1, otherwise default parameters). Hyper-geometric sampling was applied to test if individual genes of a GO term or a whole pathway of genes are enriched for SNPs (Supplementary Table 7).

Molecular characterization of CaMKII.1

RNA-seq data of the Por and Jean strains for CaMKII.1 were obtained from the larval RNA sequencing experiment described above. Besides four assembled full-length transcripts (RA–RD) from RNA-seq and assembled EST libraries, additional partial transcripts (RE–RO) were identified by PCR amplification (for PCR primers see Supplementary Table 15), gel extraction (QIAquick Gel Extraction Kit, Qiagen), cloning with the CloneJET PCR Cloning Kit (Thermo Scientific) and Sanger sequencing with pJET1.2 primers (LGC Genomics & Microsynth). cDNA was prepared from RNA extracted from third instar larvae of the Por and Jean laboratory strains (RNA extraction with RNeasy Plus Mini Kit, Qiagen; reverse transcription with QuantiTect Reverse Transcription Kit, Qiagen).

qPCR was performed with variant-specific primers and actin was used as a control gene (Supplementary Table 16). cDNA was obtained from independent pools of 20 third instar larvae of the Por and Jean strains. Sample size was ten pools per strain to cover different time points during the day and to test for reproducibility (two samples each at zeitgeber times 0, 4, 8, 16 and 20; for one Por sample extraction failed; RNA extraction and reverse transcription as above). qPCR was performed with Power SYBR Green PCR Master Mix on a StepOnePlus Real Time System (both Applied Biosystems). Fold-changes were calculated according to ref. 72 in a custom excel sheet. The assumption of equal variance was violated for the RD comparison ( F -test) and the assumption of normal distribution was violated for the data of RA and RC in the Por strain (Shapiro–Wilk normality test), possibly reflecting circadian effects in the samples from different times of day. Thus, expression differences were assessed for significance in a two-tailed Wilcoxon rank-sum test (wilcox.test in R 66 ). Holm correction 73 was used for multiple testing (default in p.adjust function of R).

CaMKII.1 minigenes

PCR fragments containing the CaMKII.1 linker region (exons 10–15) were amplified from genomic Por or Jean DNA, respectively, with primers CaMKII-Sc61-F-344112 and CaMKII-Sc61-R-351298 (Supplementary Table 15), cloned with the CloneJET PCR Cloning Kit (Thermo Scientific), transferred into the pcDNA3.1+ vector using NotI and XbaI (Thermo Scientific). These constructs were transfected into D. melanogaster S2R+ cells and RNA was prepared 48 h after transfection. After DNase digestion, isoform expression was analysed by radioactive, splicing-sensitive RT–PCR (primers in Supplementary Table 17) and phosphorimager quantification as described 74 . Identity of isoforms is based on size and sequencing of PCR products. To test for reproducibility, there were seven biological replicates (raw data in Supplementary Table 18). As the assumptions of equal variance ( F -test) and normal distribution of data (Shapiro–Wilk normality test) were not violated, the significance of expression differences was assessed in unpaired, two-sided two-sample t -tests. Holm correction 73 was used for multiple testing (default in p.adjust function of R). S2R+ cells were obtained from the laboratory of S. Sigrist, regularly authenticated by morphology and routinely tested for absence of mycoplasma contamination. The entire experiment was reproduced several months later with three biological replicates (raw data in Supplementary Table 18).

S2 cell luciferase assay

Firefly luciferase is driven from a period 3X69 promoter under control of the CLOCK and CYCLE protein 19, 21 . The D. melanogaster pAc–clk construct was obtained from F. Rouyer, pCopia–Renilla luciferase and period 3X69–luc reporter constructs from M. Rosbash, a [Ca 2+ ]-independent mouse CaMKII T286D was provided by M. Mayford. The CaMKII inhibitor KN-93 was purchased from Abcam (#ab120980).

C. marinus Cyc , C. marinus Clk and C. marinus CaMKII.1–RD were cloned into the pAc5.1/V5–His A plasmid (Invitrogen) with stop codons before the tag. The Q5 Site-Directed Mutagenesis Kit (NEB) was used to make kinase-dead and [Ca 2+ ]-independent versions of C. marinus CaMKII.1–RD (for primers, see Supplementary Table 17).

D. melanogaster S2 cells (Invitrogen) were cultured at 25 °C in Schneider's D. melanogaster medium (Lonza) supplemented with fetal bovine serum (FBS, 10%, heat-inactivated), penicillin (100 U ml −1 ), streptomycin (100 μg ml −1 ) and 2 mM l -glutamine; Sigma). Cells were seeded into 24-well plates (800, 000 cells per well) and transfected with Effectene transfection reagent (Qiagen) according to the manufacturer's instructions. Experiment with mouse [Ca 2+ ]-independent CaMKII: 25 ng pCopia–Renilla , 10 ng period 3X69–luc , 0.5 ng D. melanogaster pAc–clk , 200 ng mouse pAc–CaMKII T286D . Experiment with CaMKII inhibitor KN-93: 25 ng pCopia–Renilla , 10 ng period 3X69–luc , 0.5 ng D. melanogaster pAc–clk , various amounts of KN-93. Experiment with C. marinus genes: 25 ng pCopia–Renilla , 10 ng period 3X69–luc , 100 ng C. marinus pAc–cyc , 100 ng C. marinus pAc–clk , 200 ng C. marinus CaMKII.1–RD K42R or 200 ng C. marinus CaMKII.1–RD T286D . In all experiments, the transfection mix was filled up with empty pAc5.1/V5–His A vector to a total of 435 ng DNA per well. After 48 h, cells were washed with PBS and lysed with Passive Lysis Buffer (Promega). Luciferase activities were determined on a Synergy H1 plate reader (Biotek) using a Dual-Luciferase Reporter Assay System (Promega). For each biological replicate three independent cell lysates were measured and their mean value determined. Firefly luciferase activity was normalized to Renilla luciferase activity and values were normalized to controls transfected with D. melanogaster pAc–clk or C. marinus pAc–clk and C. marinus pAc–cyc , respectively. S2 cells (Invitrogen/Life Technologies, Cat.no. R690-07) were regularly authenticated by morphology and routinely tested for absence of mycoplasma contamination (Lonza MycoAlert). Sample size was chosen to test for reproducibility.

Circadian free-run experiments

For circadian free-run experiments, culture boxes of the Por, He and Jean strains were transferred from light–dark cycle (16:8) to constant dim light (light–light cycle, about 100 lx). Emerging adults were collected in 1-h intervals by a custom made C. marinus fraction collector (similar to those described in ref. 75) and counted once a day. Because collection was automated, the experimenter had no influence on the results and blinding was not necessary. As the circalunar clock restricts adult emergence to a few days, the circadian emergence rhythm can only be assessed over a few days. Several culture boxes were transferred to a light–light cycle at different time points. The resulting emergence data were combined for each strain using the switch to a light–light cycle as a common reference point. We used the maximum number of available individuals. Free-running period was calculated as the mean interval between subsequent emergence peaks, weighting each peak by the number of individuals.

Razpoložljivost podatkov

All sequence data are deposited in the European Nucleotide Archive (ENA) under PRJEB8339. The reference genome is also on ClunioBase (//cluniobase.cibiv.univie.ac.at). Machine readable super-scaffolding data and the computer source code for the removal of repeated edges are supplied as source data files.

Razširjeni podatki

Razširjene podatkovne številke

  1. 1.

    The biology of Clunio marinus .

  2. 2

    The reconstructed chromosomes of C. marinus based on the genetic linkage map.

  3. 3.

    C. marinus genome characterization.

  4. 4.

    Synteny analyses of C. marinus chromosome arms.

  5. 5.

    Population genomic analysis of QTLs C1/L1 and C2 and genome-wide analysis of locations and putative effects of SNPs and indels.

  6. 6.

    CaMKII regulates CLK/CYC transcriptional activity and exhibits strain-specific splice variants.

  7. 7.

    A differentiated 125-bp insertion in the CaMKII locus.

  8. 8.

    Model of circadian timing adaptation via sequence differences in the CaMKII.1 genomic locus.

  9. 9.

    Analyses overview.

  10. 10.

    Arrangement of the mitochondrial genome and of the histone gene cluster in C. marinus .

Dodatne informacije

Datoteke PDF

  1. 1.

    Dodatne informacije

    This file contains Supplementary Tables 1-19, Supplementary Methods, Supplementary Notes, Supplementary References and a Supplementary Figure – see contents page for details.

Zip datoteke

  1. 1.

    Dopolnilni podatki

    This zipped file contains .yaml files containing all changes made to the genome assembly during the super-scaffolding process.

  2. 2

    Dopolnilni podatki

    This zipped file contains the source code for the software "Repeated Edge Remover (RE 2 )".

Pripombe

Z oddajo komentarja se strinjate, da se boste držali naših pogojev in smernic skupnosti. Če se vam zdi nekaj zlorabe ali ne ustreza našim pogojem ali smernicam, označite to kot neprimerno.