Məlumat

Bir Nümunə, Fərqli Metilləşmə Dəyərləri

Bir Nümunə, Fərqli Metilləşmə Dəyərləri


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ümid edirəm ki, burada kimsə mənim əldə etdiyim bu qeyri-adi nəticəni bəzi pirosequencing məlumatları ilə izah edə bilər. Müxtəlif layihələr üçün illər ərzində bir neçə dəfə bir neçə nümunəni bisulfitə çevirmişəm. Bu yaxınlarda mən bu fərqli məlumatların bəzilərini bir araya toplayırdım və gördüm ki, bu nümunələrdə eyni pirosequencing analizindən istifadə edildikdə, sonradan çevrilənlər ilkin bisulfitə çevrilmiş nümunələrlə müqayisədə maraq doğuran CpG sahələrində metilasiyanı azaldır. Orijinal çevrilmə 2010-cu ildə, təkrar çevrilmələr isə 2014/2015-ci illərdə olmuşdur. Təhlillər eynidir və bunu bir klonu digəri üzərində gücləndirən PCR-də günahlandırmaq çətindir, çünki mən hər bir alikvota texniki təkrarlamalar etmişəm. Hətta 2010-cu ildə çevrilmiş nümunə də 2010-cu ildə əldə etdiyi nəticə ilə 2015-ci ildə eyni nəticəyə malikdir, lakin bu, 2015-ci ildə dəyişdirilmiş nümunədən fərqlidir.

Biz bisulfit çevrilməsi üçün eyni dəsti (Qiagen) istifadə edirik və prosedurumuzda əsaslı dəyişiklik etməmişik (biz Qiagen protokoluna dəyişiklik etmədən əməl edirik). Daha əvvəl kimsə bu fenomeni görübmü? Saxlanılan DNT-nin metilasiya dəyişiklikləri yaşaması mümkündürmü? Problemin texniki olması ehtimalı daha yüksəkdir, lakin mən bu texniki problemin dəqiq nə olduğunu anlamaqda çətinlik çəkirəm.


Mən buna baxdım və əgər təsir həqiqətən olduğu kimi səslənirsə, 5-formilsitozin ola bilər.

Metilsitozin, gözlədiyiniz kimi (eyni şəkildə) bisulfitlə reaksiya verən hidroksimetilsitozinə oksidləşir. Hidroksimetilsitozin daha sonra dəyişdirilməmiş sitozin kimi davranan 5-formilsitozinə oksidləşir (yəni, U əmələ gətirmək üçün deaminasiya olunur). TET fermentləri bu davranışa in vivo vasitəçilik edir, lakin mən spontan metil qrupunun oksidləşməsi və ya kinetikanın necə ola biləcəyi barədə heç bir məlumat tapa bilmirəm. Bu yazı yuxarıda göstərilən 5-formilsitozinin xüsusiyyətlərinə əsaslanır.

Bunun doğru olub olmadığını yoxlamaq üçün bu kağızdan istifadə edə bilərsiniz. Natrium borhidridlə reduksiya 5-formilsitozini yenidən hidroksimetilsitozinə çevirir, bu da bisulfit ardıcıllığı altında metilləşmiş kimi oxunur.


BoostMe, çoxlu insan toxumalarının bütün genom bisulfit ardıcıllığında DNT metilasiya dəyərlərini dəqiq proqnozlaşdırır

Bisulfit ardıcıllığı xəstəlikdə DNT metilasiyasının rolunu öyrənmək üçün geniş istifadə olunur, lakin məlumatlar əhatə dairəsinin dərinliyi dəyişkənliyinə görə qərəzlərdən əziyyət çəkir. Aşağı əhatə dairəsi olan yerlərdə metilasiya dəyərlərinin təyin edilməsi bu qərəzləri azalda bilər, eyni zamanda proqnozlaşdırıcı güclə əlaqəli vacib genomik xüsusiyyətləri müəyyən edə bilər.

Nəticələr

Burada biz bütün genom bisulfit ardıcıllığı (WGBS) məlumatları daxilində aşağı keyfiyyətli DNT metilasiya təxminlərini təyin etmək üçün bir üsul olan BoostMe-ni təsvir edirik. BoostMe gradient gücləndirici alqoritmdən, XGBoost-dan istifadə edir və proqnozlaşdırmaq üçün çoxlu nümunələrdən məlumatdan istifadə edir. Biz görürük ki, BoostMe insan toxumalarının WGBS-lərinə tətbiq edildikdə sürət və dəqiqlik baxımından mövcud alqoritmləri üstələyir. Bundan əlavə, biz göstəririk ki, imputasiya WGBS və aşağı WGBS dərinliyində MethylationEPIC massivi arasında uyğunluğu yaxşılaşdırır və bu, təxmindən sonra təkmilləşdirilmiş WGBS dəqiqliyini təklif edir.

Nəticələr

Tapıntılarımız BoostMe-nin WGBS təhlili üçün ön emal addımı kimi istifadəsini dəstəkləyir.


1. Giriş

Ümumi DNT ardıcıllığı kontekstində hüceyrələr inkişaf və fizioloji vəziyyət zamanı hüceyrə şəxsiyyətini və taleyini, habelə xarici stimullara uyğunlaşmanı təyin etmək üçün ifadə edilmiş və repressiya edilmiş genlər toplusunu əlaqələndirmək üçün müxtəlif strategiyalardan istifadə edirlər. Epigenetika bu kontekstdə müəyyən edilir və onilliklər ərzində elmi ictimaiyyətin diqqətini müəyyən genotipin fenotiplərini modulyasiya edən tənzimlənən adaptiv təbəqə kimi cəlb edir [1]. Buna baxmayaraq, epigenetikaya dair bu baxış hələ də mübahisəlidir, çünki o, nəsillərarası irsiyyəti mütləq daxil etmir [2].

Epigenetik məlumat xromatinin əlçatanlığı ilə iç-içədir və bir neçə effektor DNT metilasiyası, histon quyruqlarının translasiyadan sonrakı modifikasiyası və seçilmiş kodlaşdırmayan RNT kimi iştirak edir. Bu effektorların ümumi xromatinin qablaşdırma sıxlığını gücləndirmək üçün sinerji təsir göstərdiyi də müşahidə olunur ki, bu da öz növbəsində genlərin transkripsiya vəziyyətinə təsir göstərir [3,4].

Epigenetik işarələrin ən erkən və yəqin ki, ən çox tanınanı DNT metilasiyasıdır, bu, bir neçə qorunmuş və nəsildən-nəslə məxsus DNT metiltransferazaları tərəfindən sitozinlərin 5' mövqeyinə (5mC) bir metil qrupunun əlavə edilməsinin nəticəsidir [5]. Məməlilərin genomlarında bu dəyişikliklər əsasən CG ardıcıllığı kontekstində baş verir, lakin digər orqanizmlərdə, xüsusən də bitkilərdə CHG və CHH (H = A, C və ya T) kimi digər dəyişikliklər də müşahidə olunur. Baza modifikasiyalarının digər formaları tanınsa da və mühüm rollarla əlaqələndirilir [6], sitozin metilasiya işarəsi eukaryotik DNT-də ən çox rast gəlinən kimyəvi etiketdir [7]. Baza eyniliyi eyni qalsa da, 5mC hüceyrə mühitində aktiv şəkildə qəbul edilir və genomda dərin təsir göstərir, bu da onun DNT-nin beşinci bazası kimi təyin edilməsinə səbəb olur [8]. Onun hədsiz dərəcədə baş verməsinə baxmayaraq, eukaryotlarda metilləşmənin universal olmadığını vurğulamaq vacibdir, çünki 5mC kimi model orqanizmlərdə yoxdur. Saccharomyces cerevisiae, C. elegansDrosophila melanogaster [7].

5 mC ilə zənginləşdirilmiş bölgələr ümumiyyətlə qapalı xromatin vəziyyəti ilə əlaqələndirilir və buna görə də transkripsiya ilə repressiya olunur [9]. Qurucu xromatində yüksək səviyyəli DNT metilasiyası genomun təkrarlanan fraksiyasını, məsələn, transpozisiya elementləri (TE) və peyk DNT-ni bəzəyir. Bu, xromosom sabitliyində və genom bütövlüyündə əsas rol oynayır, TE-ləri susdurulmuş vəziyyətdə saxlayır [10]. Gen bölgələrinin yaxınlığında metilasiya dərəcəsi gen ifadəsi ilə bağlı ziddiyyətli nəticələrə sahib ola bilər. Promotor bölgə metilləşərsə, transkripsiya bloklanır [9]. Əksinə, ekzonik bölgələrdə 5mC insidansı orta dərəcədə ifadə olunan və konstitutiv olan genlər alt qrupunun fərqli xüsusiyyətidir [5,11]. Gen bədəni metilasiyası (GBM) kimi tanınan bu fenomen, taksonomik olaraq geniş yayılmış olsa da, canlılıq üçün zəruri deyil və onun dəqiq rolu aydın şəkildə müəyyən edilməmişdir [12], baxmayaraq ki, bu, splicingə kömək etməkdə və saxta transkripsiya başlanğıc yerlərindən qaçmaqda iştirak etmişdir [13] .

5mC-nin yüksək yayılmasını və funksional təsirlərini nəzərə alaraq, onun aşkarlanması epigenetik hadisələri araşdırmaq üçün ən çox istifadə edilən üsuldur. Metilasiya profili inkişafı, ətraf mühitin ipuçları və ya hüceyrələrin və fərdlərin fizioloji/patoloji vəziyyətləri ilə əlaqəli xromatin strukturunda dinamik dəyişiklikləri aşkar etmək üçün proxy kimi istifadə edilə bilər. Bu məqsədlə, yeni nəsil sekvensiyanın (NGS) meydana gəlməsi ilə gücləndirilmiş bir neçə dahiyanə eksperimental yanaşma illər ərzində sitozin metilasiya vəziyyətini müxtəlif həll dərəcələri ilə sorğulamaq üçün tətbiq edilmişdir [14-16]. Ümumiyyətlə, bu üsulları üç sinfə bölmək olar: bisulfit çevrilməsi, yaxınlığın zənginləşdirilməsi və məhdudlaşdırıcı fermentin vasitəçiliyi ilə filtrasiya [17].

Natrium bisulfit ilə müalicə metilləşməmiş sitozini urasilə deaminləşdirir, 5mC isə təsir etmir. Sonrakı PCR gücləndirilməsi urasilləri timinlərlə əvəz edəcəkdir. Bisulfit müalicəsi ilə və olmadan paralel olaraq yaradılan NGS kitabxanalarından oxunuşlar istinad genomlarına uyğunlaşdırılır və kitabxanalar arasında ziddiyyətli C/T mövqeləri tək əsas rezolyusiyada metilləşmə dərəcəsini göstərir. Bütün genom bisulfit ardıcıllığı (WGBS həmçinin BS-seq və ya MethylC-seq) 5mC profilləşdirmə üçün ən yüksək ayırdetmə üsulu hesab olunur [8,18], müəyyən bir nümunənin, yəni metilomun ən əhatəli DNT metilasiya xəritəsini verir. WGBS-in genişliyi yüksək xərclər və yüksək keyfiyyətli istinad genomuna tələbat səbəbindən onun istifadəsini paradoksal şəkildə zəiflədir.

WGBS-ə alternativlər çoxlu nümunələrlə, hədəflənmiş metilasiya profili ilə məşğul olan tədqiqatları və zəif genom resurslarına malik növlər üçün işlənib hazırlanmışdır. Həll yolu, metilasiya sıxlığına və ya ardıcıllığın işarələrinə əsaslanan bölgələri süzərək genom nümunəsini daraltmaqdır. Məhdudiyyət fermentlərinə və ya yaxınlıq zənginləşdirilməsinə əsaslanan genomun azaldılmasından istifadə edən metilasiya profili üsulları, genomun bir hissəsini nümunə götürür və buna görə də ardıcıllıq səylərini və xərclərini azaldır. Beləliklə, bu üsullar WGBS ilə müqayisədə səmərəli alternativ yanaşmaları təmsil edir, bu da bütün genom ardıcıllığının yüksək əhatəsini (>30X) tələb edir və beləliklə, böyük nümunə ölçüsü tədqiqatları üçün qadağanedici xərclərə səbəb olur [19]. Ümumi tətbiqi üsullar iki geniş kateqoriyaya bölünür: yaxınlıq filtri və məhdudlaşdırıcı ferment (RE) əsasında. Yaxınlıq zənginləşdirmə üsulları (Zenq və digərlərində [16] nəzərdən keçirilir) antikorlardan (MeDIP-seq Down və digərləri [20]) və ya CpG bağlayıcı zülallardan (MDB-seq, Li) istifadə edərək genomdakı metilləşdirilmiş bölgələrin DNT parçalanmasından sonrakı tutulmasına əsaslanır. və başqaları [21] MethylCap-seq, Brinkman və başqaları [22]), ardınca NGS. Əsas çatışmazlıqlar hipermetilləşdirilmiş bölgələrə meyl və oxunuşlar daxilində 5 mC-nin yerini təyin etməyin mümkün olmamasıdır [17,23].

Metilləşdirilmiş bölgələrə məhdudlaşdırıcı fermentlərin həssaslığına əsaslanan genomun azaldılması onilliklər ərzində istifadə edilmişdir [24]. Kimi tez-tez kəsici fermentdən istifadə HpaII, CCGG sahələrini yalnız sitozinlər metilləşdirilmədikdə parçalayır, həzm fraqmentləri ölçüsü seçilir və NGS-ə məruz qalır. Metil-həssas kəsiklərin hesablanması (MSCC Ball və digərləri [25]), Methyl-seq (Brunner və digərləri [26]) və HELP-seq (Oda və digərləri [27]) kimi texnikalar azaldılmış təmsil kitabxanalarını qurur. HpaII istifadə həzm MspI, onun metilasiyasına həssas olmayan izoschizomer, normallaşdırıcı nəzarət kimi. Bu fraqmentlər genomun çox kiçik bir hissəsini təmsil etsələr də, onlar hipometilləşdirilmiş bölgələrdə və CpG adaları, promotorlar və gen cisimləri kimi müvafiq funksional elementlərlə zənginləşdirilmişdir [25,27]. Tətbiq edilən CpG-lərin əskik nümunəsini aradan qaldırmaq üçün HpaGenişlənmiş MSCC [28] və MRE-seq [29] vəziyyətində olduğu kimi, II CCGG tanıma sahəsi, digər metil həssas məhdudlaşdırıcı fermentlər (MRE) nümunə götürülmüş lokusları genişləndirmək üçün istifadə edilmişdir. Hər iki üsul müşahidəni gücləndirir ki, məməlilərdə promotorlar intergenik və intragenik bölgələrdə 5 mC-dən fərqli olaraq hipometilləşirlər. MRE-seq və MeDIP-seq ilə nümunə götürülmüş saytlar arasında mənfi korrelyasiya göstərildi ki, hər iki metod dəqiqdir və fərdi 5mC-ni tanıya bilməməsinə baxmayaraq, ümumi metilasiya vəziyyətini qiymətləndirmək üçün istifadə edilə bilər [29].

Burada biz Methyl Sensitive DArT-seq (MS-DarT-seq) adlı MRE-seq-ə əsaslanan texnikanı tətbiq etdik. genomları, ardınca xüsusi adapter bağlaması və növbəti nəsil ardıcıllığı [30-33]. Bu RE mürəkkəbliyinin azalması, WGBS-ə (Xing və digərlərində [19] və Paun və başqalarında [34] yenidən işlənmişdir) qənaətli metilasiya profilinin yaradılması alternativini təmin edərək, metilləşmə yerlərini təmsil edən seçmə və təkrarlana bilən fraqmentlər istehsal edərək, genomun azaldılmış təmsilini yaradır. ). MS-DArT-seq, CCGG sahələrini hədəf alan və ziddiyyətli metilləşmə həssaslığı göstərən məhdudlaşdırıcı fermentlərdən istifadə etməklə paralel olaraq iki kitabxananın qurulduğu MSCC prosedurunu əks etdirərək metilasiya profilini həyata keçirir (MspI, metilasiyaya həssas deyil HpaII, daxili sitozin 5'-metilləşdikdə parçalanmır). MSCC-dən fərqli olaraq, ikiqat həzm ilə PstMən MS-DarT-seq-də işləyirəm və yalnız ikiqat həzm olunmuş fraqmentlər (Pstmən-Mspmən/HpaII) iki RE çıxıntısına uyğun gələn adapterlərin bağlanması ilə seçilir. Ferment PstMən həmçinin DNT metilasiyası həssaslığını təqdim edirəm, buna görə də nümunə götürmə meylini hipometilləşdirilmiş bölgələrə doğru genişləndirirəm. Konsepsiyanın sübutu olaraq, biz bu texnikanı müxtəlif toxumalarda minlərlə saytın DNT metilasiya vəziyyətini araşdırmaq üçün tətbiq etdik. Böyük evkalipt növün istinad genomunu yaratmaq üçün istifadə edilən ağac [35].


Materiallar və metodlar

Genom-geniş DNT metilasiya profilinin yaradılması və marker seçimi

Illumina Human Methylation BeadChips 27 və 450k üzərində üç il fasilələrlə iki genom geniş metilasiya tədqiqatı aparıldı. Daha yeni HumanMethylation450 BeadChip, 27K massivinin 27,578 saytının 90%-i daxil olmaqla, 482,421 CpG yerində DNT metilasiyasını təhlil edir. Beləliklə, daha çox marker namizəd əldə etmək üçün ikinci araşdırma aparıldı. Hər iki metilasiya skrininqi üçün hər bir hədəf mayenin müxtəlif nümunələri istifadə edilmişdir. Hər bir araşdırmada iki DNT nümunəsi (500 ng) periferik qan, menstrual qan, tüpürcək, vaginal maye, sperma və bir endometrium nümunəsi, vazektomiya edilmiş kişilərin sperması, dəri və penis selikli qişası müvafiq olaraq təhlil edilmişdir. Bədən mayesinin hər bir nümunəsi üçün metilasiyanın fərdlərarası dəyişkənliyini düzəltmək üçün 3-8 fərddən bərabər miqdarda DNT topladıq. Standart protokollardan (DNeasy Blood & amp Tissue Kit, EpiTect ® Bisulfite Kit, Qiagen) istifadə etməklə DNT çıxarıldı və bisulfit çevrildi. Mikroarray hibridizasiyası və β-dəyərlərin çıxarılması istehsalçının göstərişlərinə (Illumina) uyğun olaraq həyata keçirildi. β-dəyəri hər aşkar edilmiş CpG yerində metilləşmə faizinə uyğundur və 0 (metilləşmə yoxdur) ilə 1 (100% metilləşmə) arasında dəyişir. Ən yaxşı ayrı-seçkilik sahələri, hər iki hədəf bədən maye nümunəsinin orta metilasiya dəyərləri müvafiq olaraq hər bir nümunə ilə müqayisə edilərək axtarıldı. Namizəd CpG sahələri hədəf mayedə ən azı 0,4 β-dəyəri nümayiş etdirməlidir, qalan nümunələrin ß-qiymətləri isə 0,05-dən çox olmamalıdır. Qarşılıqlı marker lokuslarını müəyyən etmək üçün - hədəf metillənməmiş və qalan mayelər metilləşdirilmişdir - biz eyni eşikləri tətbiq etdik, lakin əksinə. Ən yüksək diskriminasiya gücünə malik CpG-lər marker namizədləri kimi seçildi. Hər bir namizəd sayt üçün biz ardıcıllıq üçün amplikonlar yaratmaq üçün bisulfit çevrilmiş genomik DNT-nin gücləndirilməsi üçün PCR primerləri hazırladıq. Əldə edilmiş məlumatlar, mümkünsə, onlardan daha çox ayrı-seçkilik gücünə malik çip-analiz tərəfindən müəyyən edilmişlərə bitişik CpG-ləri seçmək üçün istifadə edilmişdir. Əslində, ən çox yer üçün biz son msSNuPE analizi üçün orijinal CpG-ləri tətbiq etmədik.

Nümunə Kolleksiyası

Statistik yoxlama üçün cəmi 100 periferik qan (45 qadın, 55 kişi), 96 menstrual qan, 100 tüpürcək (56 qadın, 44 kişi), 55 vaginal maye və 91 sperma nümunəsi toplanıb. Əksər hallarda menstrual qan və vaginal maye nümunələri eyni qadın donorlardan tədarük edilirdi. Ümumilikdə 197 qadın və 190 kişi donor, tədqiqatın fonu izah edildikdən sonra yazılı razılıq verdi. Layihə Almaniyanın Bad Homburg vdH şəhərində yerli Etika Komitəsi və Almaniyanın Bonn Universitetinin Etika Komitəsi tərəfindən təsdiq edilmişdir. Tüpürcək və vaginal maye steril pambıq çubuqlara verildi. Təzə periferik qan və sperma mikrosentrifuqa borularında toplandı. Menstrual qan tamponlar və ya gigiyena salfetləri ilə təmin edildi. Bundan əlavə, markerlərin bəzən cinayət yerində qarışığın bir hissəsi ola bilən digər bədən mayeləri və toxumaları ilə çarpaz reaksiyasını yoxlamaq istədik. Bu məqsədlə biz iki sidik nümunəsi (bir kişi, bir qadın), vazektomiya edilmiş kişilərdən iki sperma və kişi və qadınların neştərindən və ön qolundan alınan 4 sidik nümunəsi topladıq.

Anonim karsinoma nümunələri Bad Homburqdakı müxtəlif klinik müəssisələrdən və Bonn Universitet Xəstəxanalarından 34 xəstə (13 kişi və 21 qadın) tərəfindən təqdim edilmişdir. Aşağıdakı nümunələr əldə edilmişdir: 7 qan nümunəsi CLL (xroniki limfositik lösemi), 3 qan nümunəsi CML (xroniki mielositik leykemiya), 1 qan nümunəsi MPS (miyeloproliferativ sindrom), 2 qan nümunəsi B hüceyrəli limfoma, 9 qan nümunəsi döş xərçəngi olan xəstələrin, kolorektal xərçəngli xəstələrin 3 qan nümunəsi (biri tanış polipoz adematoza və iki irsi polipozis olmayan kolorektal xərçəng), testis xərçəngi olan xəstələrin 2 sperma nümunəsi, qida borusu xərçəngi olan xəstənin 1 tüpürcək nümunəsi, 1 vaginal endometrium xərçəngi olan bir xəstənin maye nümunəsi, uşaqlıq boynu karsinoması olan xəstələrin 2 vaginal maye nümunəsi, yumurtalıq xərçəngi olan xəstələrin 2 vaginal maye nümunəsi və endometriozlu bir xəstənin 1 nümunəsi. Bütün nümunələr emal olunana qədər dondurulmuş vəziyyətdə saxlanıldı.

Məhkəmə Ekspertizası üçün Nümunə Hazırlanması

Məhkəmə simulyasiya təcrübələri Setzer və digərlərinin [19] tövsiyələrinə uyğun olaraq təşkil edilmişdir. 50μl periferik qan, menstruasiya qanı və sperma pambıq parçalarına çəkildi. Vaginal maye və tüpürcək pambıq çubuqlarda saxlanıldı. Məhkəmə reallığını təqlid etmək üçün üç növ ətraf mühitə təsirlər hazırlanmışdır - otaq temperaturunda quru, ekssikatorda yaş və çöldə yerdə. İlkin təhlil dərhal aparıldı (t0) nümunə götürdükdən sonra. Daha sonra nümunələr 1, 2, 3 və 6 ay saxlandıqdan sonra sınaqdan keçirildi. Beləliklə, məhkəmə-tibbi ekspertiza üçün ümumilikdə 75 bədən maye nümunəsi hazırlanmış və təhlil edilmişdir.

Bədən Maye Nümunələrinin Emalı

DNT QIAmp ® DNT Mini Kit (Qiagen) istifadə edərək qan, tüpürcək və sidikdən və istehsalçının göstərişlərinə uyğun olaraq DNeasy ® Qan və Toxuma Dəsti (Qiagen) istifadə edərək menstrual qandan, vaginal tamponlardan, spermadan, vazektomiya edilmiş kişilərin spermasından və dəridən çıxarılıb. təlimatlar. Spermanın çıxarılması üçün əlavə olaraq 20μl 1M DTT istifadə edilmişdir. Statistik qiymətləndirmə üçün müvafiq olaraq 100 μl periferik qan, 50 μl sperma, bir parça (0,5 sm 2) tampon və ya gigiyena salfeti və bir tampon vaginal maye və tüpürcək istifadə edilmişdir. Məhkəmə ekspertizası üçün periferik qanın 1/2 ləkəsi, menstruasiya qanı və sperma ləkələri, həmçinin 1/2 çubuq vaginal maye və tüpürcək ləkələri istifadə edilmişdir.

DNT ekstraktları Nanodrop ™ ND-1000 Spektrometrindən (NanoDrop Technologies) istifadə edilərək ölçüldü və emal olunana qədər dondurulmuş halda saxlanıldı. DNT-nin bisulfit çevrilməsi istehsalçının protokollarına uyğun olaraq EpiTect ® Plus Bisulfite Kit və EpiTect ® 96 Bisulfite Kit (Qiagen) istifadə edərək həyata keçirilib. Doğrulama təcrübələri üçün 2ng DNT istifadə edilmişdir. Məhkəmə təcrübələrində çıxarılan DNT-nin ümumi miqdarı çevrildi. Həssaslıq testi üçün DNT-nin dəyişkən miqdarları μl başına 5 ng - 25 pg bisulfit çevrilmiş DNT-nin yekun konsentrasiyalarını əldə etmək üçün tətbiq edilmişdir.

Qarışıqların hazırlanması

Məhkəmə reallığında bədən mayesinin ləkələri çox vaxt qarışıqdır. Qarışıq bədən mayelərinin hədəfin metilləşmə markerinə potensial təsirini öyrənmək üçün biz markerə xas mayenin 0, 20, 40, 60, 80 və 100 faiz DNT-sini və 100, 80, 60, 40, Qalan 4 bədən maye DNT-nin ekvimolyar qarışığının 20 və 0 faizi. Təhlildən əvvəl hər bir qarışıq nümunə və hər bir təmiz nümunə ölçüldü və bisulfit çevrildi.

PCR-Şərtlər

Bir μl bisulfit çevrilmiş DNT 25μl son həcmdə gücləndirildi. İki fərqli PCR qarışığı aparıldı.Blut1, Blut2, Spei1, Spei2, Vag1, Vag2 və Sperm1 amplikonları 1x PCR Buferi, 2.0 mM MgCl, 0.2 mM dNTP, 1U Taq DNT polimerazı (Qiagen) və hər bir 4,5p forvard primerindən ibarət reaksiyada gücləndirildi. (S1 Cədvəl). Mens1 və Sperm2 amplikonları MgCl olmadan gücləndirildi. Gücləndirmə şərtləri 15 dəqiqə üçün 95 ° C, 1 dəqiqə üçün 95 ° C-də 10 dövr, 45 saniyə üçün 56 ° C və 1 dəqiqə üçün 72 ° C, 1 dəqiqə üçün 20 dövr 95 ° C, 45 saniyə üçün 55 ° C idi. və 72°C-də 1 dəqiqə və 10 dövr 95°C-də 1 dəqiqə, 54°C-də 45 saniyə və 72°C-də 1 dəqiqə və 72°C-də 10 dəqiqəlik son uzatma addımı. PCR məhsulları ExoSAP IT ® (USB) vasitəsilə təmizləndi.

Məqsədli Bisulfit ardıcıllığı

Ardıcıllıq reaksiyası dəyişdirilmiş Sanger ardıcıllıq protokolundan istifadə etməklə həyata keçirilmişdir. Təmizlənmiş PCR məhsulları 1pmol irəli və ya tərs PCR primeri, 25μM dNTP və ABI Big Dye Terminator v1.1 dövr ardıcıllığı kimyası (Tətbiq olunan Biosistemlər) tətbiq edilərək, ABI 3730 genetik analizatorunda kapilyar elektroforez tətbiq edilməklə ardıcıllıqla aparıldı. Faylların ardıcıllığı ESME [20] istifadə edərək şərh edilmişdir. Bu proqram izləri normallaşdırdıqdan və natamam bisulfit çevrilməsini korrektə etdikdən sonra metilasiya siqnallarının kəmiyyətini müəyyən etməyə imkan verir.

Metilləşməyə Həssas Tək Nukleotid Primer Uzatma Təhlili (msSNuPE)

Təhlil aşkarlanacaq nukleotidin düz 5´ hissəsini yumşaltmaq üçün daxili primerlərdən istifadə edir. Primer bir tamamlayıcı flüoresan etiketli ddNTP ilə uzadılır (S1 Şəkil). Hər iki ardıcıllıq növündə (metilləşdirilmiş və metillənməmiş) əritmək üçün primerin hədəf ardıcıllığı əlavə CpG-ləri ehtiva edə bilməz. Yüksək CpG sıxlığına görə biz Mens1 və Spei1 üçün bir qədər fərqli aşkarlama strategiyası tətbiq etdik. Primer ardıcıllığı metilləşdirilmiş və ya metillənməmiş ola bilən iki CpG-ni əhatə edir. Burada eyni vaxtda metilləşdirilmiş ardıcıllığa tam uyğun gələn bir primerdən digərini metillənməmişə uyğunlaşdırdıq (S2 Şəkil ). Primerlər fərqli bir nukleotidlə 5' bitir. Blut1 və Blut2 üçün biz diplex primer uzatma analizi kimi iki fərqli CpG-dən istifadə etdik.

MS-SNuPE ABI SNaPshot Multiplex Kit (Applied Biosystems) istifadə edərək həyata keçirilib. Nümunə DNT materialları və metodları əsas sənədində qeyd olunan PCR şərtlərindən istifadə etməklə gücləndirildi. Reaksiya 1pmol daxili SNuPE-Primerləri (S2 Cədvəl) və 3μl təmizlənmiş PZR məhsullarından ibarət 10μl həcmdə aparılmışdır. Termal velosipeddən sonra uzadılmış məhsullar 1U Karides Qələvi Fosfatazı (Thermo Fischer elmi) ilə müalicə olundu. Təhlil ABI 3730 Genetic Analyzer və GeneMapper ID proqram təminatından (v3.2) istifadə edərək kapilyar elektroforez vasitəsilə həyata keçirilib. Metilləşmənin kəmiyyətini müəyyən etmək üçün biz metilləşdirilmiş/metilləşməmiş flüoresan siqnalının nisbətini və hər ikisinin cəmini təyin etdik və beləliklə, yarı kəmiyyətli PCR nəticələrindən yayındıq.

Növbəti nəsil ardıcıllığı (NGS)

Biz SNuPE-təhlilini, bisulfit ardıcıllığını, 454-pirosekvensiyanı (Roche Diaqnostika) və MiSeq (Sequencing-by-Synthesis, Illumina) tətbiq etdiyimiz üçün onların nisbi analitik effektivliyini müqayisə etdik. Bu müqayisə təcrübəsi üçün hər bir bədən mayesinin eyni DNT nümunələrindən istifadə edilmişdir.

Metilləşmə dərəcəsinə mümkün genetik təsirləri aydınlaşdırmaq üçün biz analitik CpG-lərimizi və onların molekulyar ətrafını yalnız MiSeq-platformasında ardıcıllıqla sıraladıq. Bu məqsədlə 5 bədən mayesinin hamısını tədqiq etdik. Bədən mayesinin hər bir növü üçün 10 nəfərdən müvafiq olaraq ekvimolyar miqdarda yığılmış bisulfit çevrilmiş DNT ehtiva edən 5 PCR həyata keçirdik. Beləliklə, biz hər bir bədən mayesi üçün 50 fərddən metilasiya yerlərini ardıcıllıqla sıraladıq.

Hər iki təcrübə üçün müvafiq nümunələr yuxarıda qeyd olunan PCR-protokolu ilə gücləndirilmişdir. 18 müxtəlif barkod ilə təmin edilən 9 lokusun irəli və tərs primerlərindən istifadə edərək vahid kitabxana qurduq. PCR məhsulları maqnit muncuqlarla (Beckman Coulter) təmizləndi və flüorometrik olaraq ölçüldü. 454-pirosequencing üçün biz 454 GS FLX+ platforması üçün istehsalçının təlimatlarına uyğun olaraq sürətli kitabxana hazırlama metodundan (Roche) istifadə etdik. MID tərəfindən yaradılan amplikonların ekvimolyar miqdarları kitabxanaya birləşdirildi və GS Titanium kimyası ilə amplikon ardıcıllığı protokoluna uyğun olaraq 454 Genome Sequencer FLX+ Sistemində ardıcıllaşdırıldı. 454 məlumatın təsdiqi üçün yalnız 20-dən yuxarı keyfiyyət balı olan tam oxunuşlardan istifadə edilmişdir.

MiSeq-alətində NGS təhlili üçün kitabxananın hazırlanması Illumina üçün NEBNext ® Ultra DNT Library Prep Kit istifadə edərək həyata keçirildi. Eyni ştrix kodlu primerlərlə PCR-dən sonra təmizlənmiş amplikonlar ekvimolyar miqdarlarda birləşdirildi və kitabxananın hazırlanması üçün giriş kimi istifadə edildi. Kitabxana MiSeq platformasında MiSeq Reagent dəsti v2 istifadə edərək, 2x250-bp qoşalaşmış ardıcıllıq protokoluna uyğun olaraq ardıcıllıqla tərtib edilmişdir.

İkinci NGS-təcrübəsinin köməyi ilə biz əlaqəli SNV-lərin texnikamızda istifadə olunan CpG-lərə potensial təsirlərini öyrənməyə çalışdıq. Bu NGS analizləri yalnız MiSeq platformasında aparılmışdır. Nəticə oxunuşlar MiSeq keyfiyyət meyarlarına uyğun olaraq seçilmişdir. Məlumatlar CLC Genomics Workbench kommersiya proqram paketi ilə ətraflı təhlil edilib. Keyfiyyətə nəzarət olaraq məlumatlar Q-qiyməti 30-a uyğun olaraq süzülürdü. Nəzərə alınacaq variant üçün minimum əhatə dairəsi 1000 oxunuş, irəli/geri balans ən azı 0,3 idi. Bununla belə, ümumilikdə müşahidə olunan ardıcıllığın bəzi variantlarının gücləndirmə xətalarını əks etdirməsi şansı var, məsələn. gücləndirmə prosesində erkən tətbiq edilmişdir. İşimizdə yalnız 1% həddini aşan və eyni zamanda metilləşmə dərəcəsinə müəyyən təsir göstərən variantlar nəzərdən keçirilmişdir.


Müzakirə

Bu tədqiqatın məqsədi əhəmiyyətli çətinliklər şəraitində kiçik uşaqlar kimi övladlığa götürülmüş yeniyetmələrdə periferik qanda immun hüceyrələrin epigenomlarında fərqləri araşdırmaq idi. Bu çətinliklər Rusiyada/Şərqi Avropada valideynlik hüquqlarından imtina edən və körpələrini həyatının ilk bir neçə ilində tərbiyə olunduqları müəssisələrə/uşaqlar evinə yerləşdirən qadınların doğulması zamanı bu gənclərin yaşadıqları erkən çətinliklər şəklini aldı. Bunun ardınca uşaqlar ABŞ-da yaxşı imkanlı ailələrə övladlığa götürüldü. Başlanğıcda, biz bu iştirakçılardakı ağ qan hüceyrələrinin əsas tərkibini ona nəzarət etmək məqsədi ilə təxmin etdik və CD4T/CD8T hüceyrə nisbətlərində kəskin fərqləri qeyd etdik. Bu hüceyrə tipli fərqləri korrektə etdikdən və təhlili dəyişən CpG lokusları ilə məhdudlaşdırdıqdan sonra 19 gen üzrə 30 sayt övladlığa götürmə qrupu tərəfindən diferensial DNT metilasiyası meyarlarına cavab verdi. Biz həmçinin GO terminlərinin funksional təhlilini apardıq və qrup fərqlərinin iki sahədə toplaşdığını aşkar etdik: neyron və inkişaf. Bu nəticələr uşaq evində böyüdükdən sonra dünyanın bu bölgəsindən övladlığa götürülən uşaqlar üçün tez-tez qeyd olunan davranış və sağlamlıq fərqlərinə uyğundur (Kumsta və digərləri, 2010 Loman, və digərləri, 2009 Zeanah və digərləri, 2003). Bununla belə, bu məlumatlara yalnız erkən mənfi təsirlər kimi baxmaq üçün bir sıra səbəblər var, çünki övladlığa götürülmüş və övladlığa götürülməyən gənclər arasında çoxlu fərqlər aşağıda müzakirə olunacaq digər izahatları açıq qoyur.

DNT metilasiyası tapıntılarını müzakirə etməzdən əvvəl həm hüceyrə tipli fərqləri, həm də bu fərqlərin düzəldilməməsi ilə düzəldilməsinin təsirlərini qeyd etmək vacibdir. Övladlığa götürülən və övladlığa götürülməyən gənclər dövriyyədə olan immun hüceyrələrinin tipinə görə təəccüblü şəkildə fərqlənirdilər. Xüsusilə, övladlığa götürülmüş gənclər, övladlığa götürülməyən gənclərə nisbətən daha az CD4+ və daha çox CD8+ hüceyrəsi və daha az B hüceyrələri nümayiş etdirdilər. Bu nümunə, bu uşaqların övladlığa götürülməmişdən əvvəl doğulduğu və böyüdüldüyü mühitdə müəyyən uyğunlaşma əhəmiyyəti ola bilən azalmış immunitet səriştəsini göstərir. Fərq qan nümunələrinin götürülməsindən əvvəlki ayda əhəmiyyətli sağlamlıq fərqləri ilə izah edilmədi və bu dəyişənlərin qruplar arasında fərqli olmasına və CD4/CD8 nisbəti ilə korrelyasiya olmasına baxmayaraq, xarici və DEHB simptomları ilə izah edilmədi. Psixoimmunologiya sahəsində, bir çox heyvan tədqiqatları, müxtəlif erkən çətinliklərin timusun içərisindəki T hüceyrələrinin diferensiallaşmasına və onların dövran edən sayına təsir etdiyini sənədləşdirdi (Eriksen et al., 2014). Azaldılmış CD4 + və dövriyyədə artan CD8 + T hüceyrələri də son zamanlarda körpəlikdə pis rəftar edilən yeniyetmə Rhesus meymunlarında da qeyd edilmişdir (Kohn və digərləri, 2014). Hazırkı araşdırmada olduğu kimi, həyat şəraiti pis rəftara məruz qalanlar və süddən kəsildikdən sonra müqayisə meymunları üçün müqayisə edilə bilən idi. Hazırkı tapıntı, həmçinin, post-institusionallaşmış gənclərin fiziki zorakılıqdan uşaqların müdafiəsində olan gənclərdən daha yüksək titrlərə malik Herpes simplex virusunu ehtiva etmələrinin pozulduğuna dair sübutlarla uyğundur (Shirtcliff, Coe, & Pollak, 2009).

Bununla belə, əvvəllər qeyd edildiyi kimi, hazırkı araşdırmada övladlığa götürülmüş və övladlığa götürülməyən uşaqlar arasında konsepsiyadan övladlığa götürməyə qədər bir çox amillər fərqlənmişdir. Uşaqlar yalnız bir dəfə övladlığa götürüldükdən sonra iki qrup fiziki və sosial qayğı baxımından müqayisə edilə bilərdi. Rusiyada/Şərqi Avropada yoxsulluq içində doğulma ilə bağlı ümumi kontekstlə müqayisədə hüceyrə tipindəki fərqləri və ya digər metilasiya fərqlərini institusional qayğıya aid etmədiyimizə əmin olmaq üçün biz yoxsul rus uşaqları üzərində aparılan araşdırmadan DNT metilasiyası məlumatını əldə etdik. bəziləri ailələri tərəfindən böyüdü, bəziləri isə Rusiya uşaq evlərində yaşayırlar (Naumova et al., 2011). Məlumatlarımızda istifadə etdiyimiz hüceyrə növünü geri proqnozlaşdırmaq üçün eyni üsullardan istifadə edərək (Houseman et al., 2012), Naumova məlumat dəstində CD4+ ilə CD8+ nisbətini təxmin etdik. Nəticələr göstərdi ki, bu tədqiqatda övladlığa götürülmüş uşaqlar CD4/CD8 nisbətində Rusiyada həm ailədə, həm də yetimlər evində tərbiyə olunan yoxsul uşaqlara çox oxşar görünürdülər və hər üç qrup yaxşı şəraitdə doğulmuş, doğulmuş və böyümüş övladlığa götürülməyən uşaqlarla müqayisədə bir qədər immunosupressiyaya məruz qalmışdır. Amerika Birləşmiş Ştatlarında qaynaqlı ailələr. Beləliklə, nümunəmizdə hüceyrə tiplərində övladlığa götürülmüş və övladlığa götürülməyən uşaqlar arasında fərqlər institusional qayğı ilə bağlı deyildi, lakin Rusiya/Şərqi Avropadan olan digər yoxsul uşaqlarda da müşahidə olunacaq. Əlbəttə ki, qeyd etməliyik ki, bu fərqlər həm də Rusiya/Şərqi Avropa populyasiyaları ilə Avropa mənşəli amerikalılar arasındakı allel fərqlərlə bağlı ola bilər (Chami & Lettre, 2014). Erkən əlverişsiz şəraitdən övladlığa götürülmüş uşaqların immun sistemlərinin infeksiyalarla nə dərəcədə mübarizə apardığını və ehtiva etdiyini göstərən immun-fenotipləşdirmə və funksional təhlillər vasitəsilə bu tapıntıları təkrarlamaq üçün təqib tədqiqatlarına ehtiyac var.

Hüceyrə tipli fərqin izahından asılı olmayaraq, bu cür təəccüblü fərqlərin mövcudluğu onlara nəzarət etməsəydik, çox saxta epigenetik nəticələr verərdi. Hüceyrə növünə nəzarət ehtiyacı başqaları tərəfindən qeyd edilmişdir, lakin hələ də müntəzəm olaraq həyata keçirilmir (Houseman et al., 2012 Lam et al., 2012 Liu et al., 2013). Eynilə, əvvəlki bir araşdırma göstərdi ki, hüceyrə tərkibi yaşla dəyişdiyi üçün hüceyrə heterojenliyinin hesablanması da DNT metilasiyası və yaşı ilə bağlı hər hansı bir araşdırmada vacibdir (Jaffe & Irizarry, 2014). Hüceyrə tipli korreksiyanın əhəmiyyətinin nümayişi olaraq, hüceyrə növü üçün düzəliş etmədiyimiz zaman qruplar arasında 136,339 metilasiya fərqi, hüceyrə növü üçün düzəliş etdikdən sonra isə əhəmiyyətli dərəcədə az olduğunu bildirdik. Toxuma/hüceyrə növü növü DNT metilasiya nümunələrinin əsas determinantı olduğundan, bu işdə immun hüceyrə tiplərində nəzərəçarpacaq fərqlər qruplar arasında metilasiya fərqlərinin böyük həddən artıq qiymətləndirilməsinə səbəb olardı. Hüceyrə növünün tədqiqi və sonra bu işdə onun düzəldilməsi qəbul edilmiş və övladlığa götürülməyən qruplar arasında erkən həyat fərqləri ilə əlaqəli DNT metilasiyasının əsl siqnallarını müəyyən etmək üçün çox vacib idi.

Hüceyrə növü üçün düzəliş etdikdən sonra, massivdəki bütün zondlardan istifadə etdiyimiz zaman, xüsusi saytların heç biri çoxsaylı sınaq üçün düzəlişdən sağ çıxa bilmədi. Bununla belə, p-dəyərləri açıq şəkildə əyri idi və bu, statistik əhəmiyyətə çatmayan bir siqnal olduğunu göstərir. Bu problemi iki yolla həll etdik. Birincisi, heç bir dəyişiklik göstərməyən bütün metilasiya sahələrini çıxararaq düzəliş əmsalını tənzimlədik. Bu məlumatların azaldılması yanaşması, genomik DNT metilasiyası və ya gen ifadəsi tədqiqatlarında əldə edilən çoxlu sayda məlumat nöqtəsini ümumiyyətlə kiçik kohort ölçüləri ilə uzlaşdırmağa yönəlmiş nəşr edilmiş tədqiqatlardan sonra modelləşdirilmişdir (Bourgon və digərləri, 2010 Teh et al., 2014). Dəyişməyən zondları çıxardıqdan sonra, korreksiyadan sağ çıxan 30 saytın xəritələşdirilməsində 19 geni qeyd etdik. Bunlar müxtəlif çeşidlər idi (Cədvəl 1). Qruplar arasında differensial şəkildə metilləşmiş ən çox sahəyə malik olan transmembran zülalı 200C nisbətən az məlum funksional məlumatı olan bir gendir. Xromosom 18-in perisentrik çevrilməsi ilə əlaqəli psixiatrik xəstəliklə əlaqəli genlər üçün namizəd kimi müəyyən edilmişdir (Pickard və digərləri, 2005), lakin onun funksiyası aydınlaşdırılmamışdır. PPP1R3GÜç fərqli metilləşdirilmiş CpG-yə malik olan , oruc-qidalanma dövrlərində qlükoza homeostazının tənzimlənməsində və yeməkdən sonra qlükozanın artmasında iştirak edir (Luo et al., 2011 Y. Zhang et al., 2014). Böyümə gecikməsinin yoxsul uşaqlarda (Fernald & Grantham-McGregor, 2002) və institusional qayğıda olan uşaqlarda (DE Johnson & Gunnar, 2011) erkən həyat çətinlikləri ilə əlaqəli olduğunu nəzərə alsaq, bəlkə də enerji mübadiləsini tənzimləyən bir gendə dəyişikliklər. qida qəbulu ilə əlaqədar olaraq gözlənilə bilər. GLYATL2 iki differensial metilləşdirilmiş sahə ilə də nisbətən xarakterik olmayan bir qlisin asetiltransferazadır. Bioloji fəaliyyətlərinə antinosiseptiv, iltihab əleyhinə və proliferativ təsir göstərən qlisin-N-asiltransferaza ailəsinin bir hissəsidir (Waluk, Schultz, & Hunt, 2010). miR-324 həm infeksiyaya qarşı immun funksiyasına, həm də travma sonrası stress pozğunluğunun bir heyvan modelinə aid edilmişdir (Balakathiresan et al., 2014 Chang et al., 2014). Bu, övladlığa götürülmüş uşaqların immun statusunda müşahidə olunan fərqləri əks etdirə bilər və əlavə araşdırma tələb edir. Nəhayət, CYP1A1, həmçinin iki diferensial metilləşdirilmiş CpG ilə, yüksək çoxfunksiyalı metabolik fermentdir və onun erkən həyat çətinlikləri ilə əlaqəli diferensial metilasiyası GO analizində çox sayda terminin səbəblərindən biri ola bilər. Maraqlıdır ki, DNT metilasyonunda artım CYP1A1 erkən yaşda siqaret tüstüsünün məruz qalmasına cavab olaraq bildirilmişdir (K. W. K. Lee et al., 2014). Övladlığa götürülmüş uşaqlarda daha yüksək DNT metilasiyası tapdıq ki, bu da onların həm doğuşdan əvvəl, həm də sonra siqaret tüstüsünə daha çox məruz qaldığını göstərə bilər ki, bu da bu uşaqların mənşə ölkələrində siqaret çəkmənin yüksək nisbətinə uyğundur. CpG-lərin bir hissəsini araşdıraraq bu tapıntını dəstəklədik AHRR siqaret tüstüsü ilə əlaqəli olan gen və AHRR tam və ya süzülmüş məlumat dəstimizdə diferensial şəkildə metilləşdirilməsə də, onu xüsusi olaraq araşdırdığımız zaman müşahidə olunan nümunə övladlığa götürülmüş uşaqlarda artan məruz qalma ilə uyğun gəlirdi. Bu fərziyyə CpG-lərin bir alt dəsti istifadə edərək daha da dəstəkləndi AHRR siqaret tüstüsü ilə əlaqəli olan gen. Qeyd etmək lazımdır ki, siqaret tüstüsünə məruz qalma ailə tərbiyəsi ilə müqayisədə institusional olaraq xüsusi olmayacaqdır. Təbii ki, bu fərq gənclərin özləri siqaret çəkmələri ilə bağlı ola bilər. İştirakçıların siqaret çəkib-çəkmədiyini soruşmadıq. Valideynlərdən yeniyetmələrin siqaret çəkməsi ilə əlaqəli olan və qrupa görə fərqlənən xarici problemlər haqqında məlumat vermələrini xahiş etdik. Bununla belə, biz xariciləşdirməni kovariativ olaraq daxil etdiyimiz zaman AHRR gen analizi, metilasiya fərqi hələ də qeyd edildi.

İkincisi, biz ErmineJ's Gen Score Resampling metodundan istifadə edərək funksional zənginləşdirmə təhlili apardıq. Biz bu metodu seçdik, çünki o, GO şərtlərini müəyyən etmək üçün sıralanmış genlər və p-dəyərləri siyahısından istifadə edərək qərəzliyi azaldır və beləliklə, bütün CpG saytlarını əhatə edən daha böyük verilənlər toplusunda nümunələri araşdırmaq üçün idealdır (Gillis et al., 2010). P-dəyəri əhəmiyyət həddi istifadə etmədiyi üçün bu təhlil üçün uyğun idi və öz fonu kimi xidmət etdi. Diferensial metilasiya olunmuş saytların ortaya çıxan siyahısındakı yüksək səviyyəli genlərin çoxunda çoxfunksiyalılıq səbəbindən onlarla əlaqəli bir çox GO termini var idi. Klasterləşdirmə təhlili apararaq bu effekti azaltdıqdan sonra nəticələr qruplar arasında diferensial şəkildə metilləşdirilmiş iki növ genə işarə etdi. Xüsusilə, neyron və inkişaf gen qrupları, erkən həyat tarixlərinin geniş təsirlərini təklif etdi.

Geniş genom analizində yüksək səviyyəli genlərlə əlaqəli funksiyaların çoxu erkən həyat çətinliklərinin məlum təsirlərini əks etdirirdi. Məsələn, böyrək inkişafındakı dəyişiklik ananın stressini və qidalanmasını nəsillərin gec ömür metabolik sindromu və ürək-damar xəstəlikləri ilə əlaqələndirən mexanizmlərdən biridir (Barker, 1997). Beləliklə, funksional analizin qruplarından birinin nefron borularının inkişafı olması diqqətəlayiq idi. Eynilə, BMP (sümük morfogen zülalları) siqnalı, müəssisələrdə böyüyən körpələr və yeniyetmələr arasında müşahidə edilən sümük böyüməsində nəzərəçarpacaq ləngimə olduğu üçün xüsusi əhəmiyyət kəsb edə bilər (D. E. Johnson & Gunnar, 2011). Şübhəsiz ki, idrak və beyin strukturunda çoxsaylı fərqləri nəzərə alsaq (Sheridan et al., 2012 Tottenham et al., 2010), klasterlərdən ikisinin sinir sistemi və onun tənzimlənməsi ilə əlaqəli olması təəccüblü deyil, baxmayaraq ki, bizim idrak və beyin quruluşumuzun necə işlədiyi bəlli deyil. qandakı müşahidələr beyindəki dəyişiklikləri əks etdirir. Göstərilmişdir ki, qan və beyin arasındakı uyğunluq CpGs yerləri arasında dəyişkəndir, bəziləri digərlərinə nisbətən daha çox oxşarlıq göstərir (Davies et al., 2012 Farre et al., 2015). Bundan əlavə, gözün və ürəyin morfogenezi ilə bağlı çoxlu funksiyaları olan çoxlu genlər müəssisələrdə böyüyən uşaqlar arasında tez-tez qeyd olunan görmə problemləri ilə uyğun ola bilər (Eckerle et al., 2014) və bu uşaqlar yaşlandıqca ürək-damar xəstəlikləri potensialını təklif edə bilər. .

Hazırkı tədqiqatda bir sıra məhdudiyyətlər var idi. Birincisi, etnik mənsubiyyəti əsas amil kimi istisna etmək üçün erkən bədbəxtliyin uzunmüddətli təsirlərini araşdırmaq və daha sonra aşağı riskli şəraitdə böyütmək məqsədi ilə ideal müqayisə qrupu övladlığa götürülməyən Rusiya/Şərqi Avropa uşaqları olardı. övladlığa götürən Amerika ailələri ilə müqayisə edilə bilən təhsil və gəlirə malik ailələrdə. Müəssisə qayğısını erkən çətinliklərdən kənarlaşdırıldıqdan sonra uzunmüddətli nəticələr yaradan amil kimi təcrid etmək üçün Naumova və həmkarları (2011) kimi müəssisələrə yerləşdirilən və edilməyən yoxsul rus/Şərqi Avropa uşaqları, lakin sonradan hamısı çıxarılan uşaqları müqayisə etmək olar. Təxminən iki yaşa qədər çətin şəraitdən və yeniyetmə olana qədər aşağı riskli, yüksək resurslu ailələrə yerləşdirilir. Buxarest Erkən Müdaxilə Araşdırması (məsələn, Drury et al., 2012) kimi tədqiqatlar müvafiq araşdırma aparmaq üçün kifayət qədər yaxşı qurulmuşdur və onların hazırkı tapıntıların bəzilərini təkrarlaya biləcəyinə ümid edilir.Bu araşdırmada biz təsirləri institusional qayğıya aid etmirik, əksinə, konsepsiyadan övladlığa götürməyə qədər qruplar arasında fərqlənən hər şeyin qeyd etdiyimiz fərqlərə töhfə verə biləcəyini fərz edirik. Həqiqətən də, tərk edilmiş və ya ailələrindən uzaqlaşdırılan və müəssisə baxımına yerləşdirilən uşaqlar tez-tez çətin prenatal tarixlərə malikdirlər və/yaxud laqeydlik, sui-istifadə və valideynlərin həbsi səbəbindən ailələrindən çıxarılırlar (Gunnar et al., 2000). Beləliklə, erkən inkişafı nisbətən aşağı stress kontekstində baş verən uşaqlarla müqayisədə, erkən həyatda əhəmiyyətli stress keçirən və tüstü kimi müxtəlif ətraf mühit faktorlarına məruz qalan uşaqlar arasında epigenetik fərqləri araşdırırıq.

İkincisi, əldə etdiyimiz nəticələri müqayisə etmək üçün övladlığa götürmə zamanı toplanmış qanımız olmadığına görə, biz yeniyetməlik dövründə metilasiya fərqlərinin uşaqların ailələrində vaxt keçirməmişdən əvvəl qeyd olunanlardan fərqli olub-olmadığını müəyyən edə bilmirik. Uzunlamasına iş aydın şəkildə lazımdır. Üçüncüsü, təsir ölçüləri ədəbiyyatdakı digər oxşar işlərə uyğun olsa da, təvazökardır (D. Mehta et al., 2013 Naumova et al., 2011). Dördüncüsü, nümunə ölçüsü məhdud idi və daha çox iştirakçı p-dəyəri düzəlişlərindən sonra daha çox yerlərdə metilasiya fərqlərini aşkar etmək üçün güc təmin edərdi. Beşincisi, orijinal qan nümunələri üzərində diferensial CBC aparılmadı, buna görə də hüceyrə növləri dərc edilmiş bir alqoritm əsasında hesablandı və hüceyrə növünün təsiri məlumatlardan geri çəkildi (Houseman et al., 2012 Jones et al., 2015) . Həm alqoritm, həm də reqressiya metodu geniş şəkildə istifadə olunduğundan və bizim PCA analizimiz hüceyrə tipli effektlərin məlumat dəstimizdən səmərəli şəkildə silindiyini göstərdiyi üçün biz hər iki üsula əminik. Buna baxmayaraq, məlumatlarda hüceyrə tipli təsir qalıqlarının qalması və ya yalnız bir hüceyrə tipində mövcud olan mühüm DNT metilasiya dəyişikliklərinin bizim korreksiya metodumuzla silinməsi mümkündür. Nəhayət, övladlığa götürülən və müqayisə edilən gənclər Qafqaz əsilli olduğu halda, övladlığa götürülməyən gənclərin əksəriyyəti Nordic və Avropa mənşəli, övladlığa götürülmüş gənclər isə Rusiya/Şərqi Avropa irsindən idi. Beləliklə, qruplar arasındakı allel fərqlər nəticələrə təsir göstərə bilər.

Bu məhdudiyyətlərə baxmayaraq, nəticələr çətin vəziyyətdən çıxarıldıqdan və dəstəkləyici, yaxşı qaynaqlı evlərdə yerləşdirildikdən sonra illərlə davam edən erkən çətinliklərin bir funksiyası olaraq DNT metilasiya nümunələrində fərqlərin olma ehtimalını artırır. Bununla belə, qeyd olunan məhdudiyyətlərə görə, bu tapıntılar ilkin hesab edilməlidir və təkrarlanmaya ehtiyac var.


Təşəkkürlər

Müəlliflər Raine Study iştirakçılarına və onların ailələrinə, kohort koordinasiyası və məlumatların toplanması üçün Raine Tədqiqat Qrupuna, son 25 ildə tədqiqatın maliyyələşdirilməsinə uzunmüddətli töhfələrinə görə NHMRC-ə və uzunmüddətli dəstək üçün Telethon Kids İnstitutuna təşəkkür edir. Raine Araşdırması. Biz həmçinin Qərbi Avstraliya Universitetinə, Kertin Universitetinə, Qadın və Körpə Araşdırma Fonduna, Edith Cowan Universitetinə, Murdoch Universitetinə, Notre Dame Avstraliya Universitetinə və Reyn Tibb Tədqiqat Fonduna Raine Tədqiqatının əsas idarəçiliyi üçün maliyyə ayırdıqlarına görə təşəkkür edirik.

Müəlliflər P. Rantakallio (NFBC1966-nın işə salınması və ilkin məlumatların toplanması) daha çox təşəkkür edirlər. Biz Şimali Finlandiya Doğum Kohortu 1966 və Şimali Finlandiya Doğum Kohortu 1986 tədqiqatının iştirakçılarının töhfələrini minnətdarlıqla qəbul edirik. Müəlliflər həmçinin bütün sahə işçilərinə və laboratoriya işçilərinə səylərinə görə təşəkkür edirlər.

Bu iş Avstraliya Hökuməti və Qərbi Avstraliya Hökuməti tərəfindən maliyyələşdirilən Pawsey Supercomputing Center tərəfindən təmin edilmiş resurslar tərəfindən dəstəklənmişdir.

S.R. 2018 LifeCycle təqaüdünün laureatı olaraq bu iş üçün Avropa Birliyinin Horizon 2020 LifeCycle layihəsindən maliyyə almışdır.

DNT metilasiyası işi NHMRC qrantı 1059711 tərəfindən dəstəkləndi. R.C.H. və T.A.M. NHMRC təqaüdləri tərəfindən dəstəklənir (qrant nömrəsi müvafiq olaraq 1053384 və 1042255).

K.M.G. Böyük Britaniya Tibbi Tədqiqatlar Şurası (MC_UU_12011/4), Milli Sağlamlıq Araşdırmaları İnstitutu [NIHR Baş Müstəntiqi (NF-SI-0515-10042) və NIHR Southampton Biotibbi Tədqiqat Mərkəzi vasitəsilə] və Avropa Birliyinin Erasmus proqramı tərəfindən dəstəklənir. Potensialın Yaradılması ENeASEA Layihəsi və Yeddinci Çərçivə Proqramı (FP7/2007-2013), 289346 və 613977 nömrəli qrant müqaviləsi çərçivəsində EarlyNutrition və ODIN layihələri.

NFBC1966, Oulu Universitetindən maliyyə dəstəyi aldı. 65354, Oulu Universiteti Xəstəxanası qrant №. 2/97, 8/97 Səhiyyə və Sosial İşlər Nazirliyinin qrant №. 23/251/97, 160/97, 190/97 Milli Sağlamlıq və Rifah İnstitutu Helsinki qrantı №. 54121 və Regional İş Sağlamlığı İnstitutu, Oulu, Finlandiya qrant nömrəsi. 50621, 54231. NFBC1986 AB QLG1-CT-2000-01643 (EUROBLCS) qrant nömrəsindən maliyyə dəstəyi aldı. E51560 NorFA qrant nömrəsi. 731, 20056, 30167 ABŞ/NIHH 2000 G DF682 qrant nömrəsi. 50945. S.S., A.H., V.K. və M.R.J. H2020-633595 DynaHEALTH, H2020 733206 LifeCycle, Finlandiya EGEA-layihəsi (285547), Biocenter Oulu, H2020-733206 LifeCycle, H2020-824989 EUC2020H (EUC202089 EUC2020) akademiyası tərəfindən dəstək aldı. EarlyCause (qrant № 848158), Aİ-H2020 LongITools (qrant № 873749), AB H2020-MSCA-ITN-2016 CAPICE Marie Sklodowska-Curie qrantı (qrant № 721567) və [Böyük Britaniya Tibbi Araşdırmalar Şurası, . MR/M013138/1, MRC/BBSRC MR/S03658X/1 (AB JPI HDHL)]. V.K. Marie Sklodowska-Curie qrantı (721567) çərçivəsində Avropa İttifaqının Horizon 2020 tədqiqat və innovasiya proqramı tərəfindən maliyyələşdirilir.


MATERİALLAR VƏ METODLAR

Yol Xəritəsi Epigenomika Layihəsi (REP) WGBS və mRNA-seq

Uyğun bütöv genom bisulfit ardıcıllığı (WGBS) və RNT seq ilə 17 əsas toxumadan nümunələr Yol Xəritəsi Epigenomika Layihəsindən (REP, Əlavə Cədvəl S1) əldə edilmişdir (22). Fraksiya metilasiyası (M) mCG/CG kimi müəyyən edilir. Diferensial metilasiya (ΔM) kimi müəyyən edilir: |$Delta M = <>>> - <>>>$|⁠ , harada S1S2 diferensial müqayisədə müvafiq olaraq birinci və ikinci nümunəyə uyğundur. Biz birləşdirilmiş metilasiya məlumatlarını əldə etdik, bu məlumatlar əvvəllər çarpaz analiz standartlaşdırılmış və vahid şəkildə işlənmişdir. Bütün CpG saytları 4 × və ya daha çox əhatə dairəsi üçün süzüldü və analiz REP-də müəyyən edilmiş analiz standartlarına uyğun olaraq hg19 genom birləşməsindən istifadə edilərək aparıldı. Standartlaşdırılmış FPKM dəyərlərini əldə etmək üçün Genecode V10-dan vahid şəkildə işlənmiş zülal kodlayan gen səviyyəli annotasiyalardan istifadə etdik. Hər bir Genecode V10 annotasiyası mygene python paketindən istifadə edərək RefSeq annotasiyalarına çevrildi (23). Yüksək keyfiyyətli metilasiya məlumatı ilə standartlaşdırılmış gen dəsti yaratmaq üçün biz qeyri-müəyyən və ya natamam TSS annotasiyaları olan genləri, 5 kb-dan qısa genləri, TSS-nin ±5 kb daxilində yoxlanılan <40 CpG-li genləri, bütün CpG-lərin ±5 kb daxilində olduğu genləri istisna etdik. TSS-də <0,2 metilasiya dəyişikliyi və alternativ promotorlar var idi. Bu filtrlər kodlaşdırılmayan və psevdogenləri, interpolyasiya sərhədindən qısa olan genləri, fərdi CpG-lərin yaratdığı qərəzliyi azaltmaq üçün az sayda CpG-yə malik genləri və müvafiq olaraq promotorunun yaxınlığında heç bir metilasiya dəyişikliyi olmayan genləri istisna etmək üçün istifadə edilmişdir. Biz yalnız cdsStartStat ilə RefSeq genlərini daxil etdik (n = 47 637 gen) və cdsEndStat (n = 47 621 gen) UCSC Cədvəl Brauzerinə görə 'cmpl' ilə. Lazımsız annotasiyaları aradan qaldırmaq üçün eyni TSS məkanına uyğun gələn çoxsaylı RefSeq ID-ləri olan istənilən RefSeq genləri üçün biz yalnız ən aşağı qoşulma nömrəsi olan tək RefSeq ID-dən istifadə etdik. ROI təsnifatı ilə aparılan təhlillərdə (aşağıya bax), dörddən az eksonu olan bütün genlər analizdən çıxarıldı. Diferensial şəkildə ifadə edilmiş genlər, ifadə dəyişikliyinin mühafizəkar qiymətləndirilməsini təmin etmək üçün beş FPKM tətbiq olunan mərtəbədən sonra nümunələr arasında ≥2 qat fərq olan genlər kimi müəyyən edilmişdir. Bu filtrləmə meyarları CpG Adası (CGI) ilə əlaqəli promotorların fraksiyasına minimal təsir göstərir, süzülməzdən əvvəl genlərin 65,9%-dən sonra 67,3%-ə çatmışdır. CpG adaları UCSC Genome Browser-dən CGI treki əsasında müəyyən edilmişdir (24). Süzgəcdən keçirilmiş gen saylarının tam xülasəsi Əlavə Cədvəl S2-də verilmişdir.

Blueprint Epigenome layihəsi WGBS və mRNA-seq

32 venoz və kordon qan nümunəsindən WGBS və RNT-seq Blueprint Epigenome layihəsindən əldə edilmişdir (25). hg38-dən genom koordinatları liftOver (24) istifadə edərək hg19-a çevrildi. Bütün digər təhlil addımları yuxarıdakı REP məlumatlarına eyni şəkildə yerinə yetirildi.

Xərçəng WGBS və mRNA-seq

Döş invaziv karsinoması (BRCA), kolon adenokarsinoması (COAD), düz bağırsağın adenokarsinoması (READ) və uşaqlıq korpusunun endometrial karsinoması (UCEC) ilə uyğun gələn normal şiş WGBS və mRNA-seq nümunələri bir model hazırlamaq üçün Xərçəng Genom Atlasından (TCGA) əldə edilmişdir. şişlərin əmələ gəlməsi. Normal sigmoid kolon (E106) WGBS və mRNA-seq məlumatları REP-dən əldə edilmişdir (22). HCT116 DKO1 (DNMT1 və DNMT3b-nin bi-allelik nokautu) WGBS və mRNA-seq məlumatları Blattler-dən əldə edilmişdir. və b. (26). Bütün digər təhlil addımları yuxarıdakı REP məlumatlarına eyni şəkildə yerinə yetirildi.

Tək pəncərə (SW)

Hər genin TSS ətrafında tək, sabit ±1 kb pəncərədə orta metilasiyanı hesabladıq (17, 27). TSS ətrafında orta metilasiya dəyişikliyindən diferensial ifadəni proqnozlaşdırmaq üçün logistik reqressiya həyata keçirdik (Şəkil 1A və B). Logistik reqressiya çarpaz doğrulaması optimallaşdırma alqoritminin 1000 maksimum təkrarlanması ilə həyata keçirildi.

Diferensial DNT metilasiyasından diferensial gen ifadə dəyişikliyini proqnozlaşdırmaq üçün DNT metilasiyası modelləri və doğrulama çərçivəsi. (A) İstilik xəritəsi ayrı-ayrı CpG sahələrində metilləşmə vəziyyətini göstərir - qırmızı tam metilləşmişdir, mavi tam metillənməmişdir - iki nümunədə bir gen nümunəsi (Metil. 1 və Metil. 2). Aşağıdakı ayrı-ayrı nöqtələr fərdi CpG yerlərində nümunə gen üzrə diferensial DNT metilasiyasını (Metil. 2—Metil. 1) göstərir. (B) (A)-dakı məlumatlardan istifadə edərək vahid pəncərə (SW) və diferensial metilləşmiş bölgəni (DMR) hesablamaq üçün istifadə ediləcək nümunə bölgələr. (C) (A)-da genin Maraq Bölgəsi (ROI) təmsili üçün metilasiya xüsusiyyətlərini hesablamaq üçün istifadə edilən bölgələr. (D) (A)-dakı genin ME-Class təmsilçisi. Hər bir fərdi nöqtə interpolyasiya və hamarlamadan sonra Təsadüfi Meşədə xüsusiyyət kimi istifadə edilən diferensial metilasiya dəyəridir. (E) Çapraz doğrulama müqayisə çərçivəsi. Qiymətləndirmə 17 nümunə müqayisəsi üzrə nümunə əsasında aparılır. Qiymətləndirmə müqayisəsində genlər 10 qata bölünür. Təlimdən əvvəl hər bir qiymətləndirmə geni bütün digər toxumalar üçün çıxarılır. Əlavə model təfərrüatları Cədvəl 1-də verilmişdir. CGI = CpG adası.

Diferensial DNT metilasiyasından diferensial gen ifadə dəyişikliyini proqnozlaşdırmaq üçün DNT metilasiyası modelləri və doğrulama çərçivəsi. (A) İstilik xəritəsi ayrı-ayrı CpG sahələrində metilləşmə vəziyyətini göstərir - qırmızı tam metilləşmişdir, mavi tam metillənməmişdir - iki nümunədə bir gen nümunəsi (Metil. 1 və Metil. 2). Aşağıdakı ayrı-ayrı nöqtələr fərdi CpG yerlərində nümunə gen üzrə diferensial DNT metilasiyasını (Metil. 2—Metil. 1) göstərir. (B) (A)-dakı məlumatlardan istifadə edərək vahid pəncərə (SW) və diferensial metilləşmiş bölgəni (DMR) hesablamaq üçün istifadə ediləcək nümunə bölgələr. (C) (A)-da genin Maraq Bölgəsi (ROI) təmsili üçün metilasiya xüsusiyyətlərini hesablamaq üçün istifadə edilən bölgələr. (D) (A)-dakı genin ME-Class təmsilçisi. Hər bir fərdi nöqtə interpolyasiya və hamarlamadan sonra Təsadüfi Meşədə xüsusiyyət kimi istifadə edilən diferensial metilasiya dəyəridir. (E) Çapraz doğrulama müqayisə çərçivəsi. Qiymətləndirmə 17 nümunə müqayisəsi üzrə nümunə əsasında aparılır. Qiymətləndirmə müqayisəsində genlər 10 qata bölünür. Təlimdən əvvəl hər bir qiymətləndirmə geni bütün digər toxumalar üçün çıxarılır. Əlavə model təfərrüatları Cədvəl 1-də verilmişdir. CGI = CpG adası.

Diferensial metilləşdirilmiş bölgələr (DMR)

Fərdi nümunələr arasında DMR-ləri müqayisə etmək üçün DSS-tək istifadə etdik (28). DMR-ləri müəyyən etdik (P < 0.01) və onların ölçüsünü (bp), orta diferensial metilasiyanı və ən yaxın TSS-ə (≥1 bp ilə üst-üstə düşürsə 0) zəncirli məsafəni (bp) ilə Təsadüfi Meşə (RF) təsnifatı ilə gen ifadə dəyişikliyi təsnifatı üçün xüsusiyyətlər kimi istifadə etdi. 1001 qiymətləndirici (Şəkil 1A və B).

Maraq bölgələri (ROI)

Maraq Bölgələri (ROI) klassifikatoru ifadə sinfini proqnozlaşdırmaq üçün Təsadüfi Meşə (RF) funksiyaları kimi şərh edilmiş gen elementləri (yuxarı, ekson, intron və aşağı axın qutuları) üzrə DNT metilasiyasını çoxlu orta qiymətlərə endirir (Şəkil 1C). ROI təsnifatının xüsusiyyətləri (29)-da təsvir olunduğu kimi həyata keçirildi ki, tək nümunəli birləşdirilmiş ifadə dəyərlərindən daha çox diferensial ifadə sinfini proqnozlaşdırmaq üçün. Biz əvvəlcə təsvir olunduğu kimi 100 ağacdan ibarət RF təsnifatçısından istifadə etdik. Ağacların sayının 1001-ə qədər artırılması performansda nəzərəçarpacaq artım olmadan iş vaxtını əhəmiyyətli dərəcədə artırdı (Əlavə Şəkil S1).

ME-Class

Gen imzaları VanderKraatsdakı kimi quruldu və b. kiçik dəyişikliklə (16). Bu imza modelə istənilən CGI və CGI sahil bölgələri daxil olmaqla genin promotor bölgəsində metilasiya dəyişikliklərinin bütün profilini daxil etməyə imkan verir (Şəkil 1A və D). Bundan əlavə, bu imzalar müxtəlif yerlərdə CpG-ləri olan genlər arasında metilasiya fərqlərini müqayisə etməyə imkan verir. Lokalizasiya tətbiq etdik z-TSS-ni əhatə edən 10 kb-lıq pəncərədə hər bir diferensial metilasiya dəyərinin 100 kb-lik lövbər pəncərəsində metilasiya dəyərlərinin paylanmasına əsaslanaraq normallaşdırılması. Bir əyrini interpolyasiya etmək üçün hissə-hissə kubik hermit interpolyasiya polinomundan (PCHIP) istifadə edərək metilasiya imzaları yaratdıq. z-Hər bir diferensial şəkildə ifadə olunan gen üçün TSS ətrafındakı 10 kb pəncərədə normallaşdırılmış diferensial metilasiya dəyərlərini hesablayın. Daha sonra interpolyasiya edilmiş əyri 50 bp bant genişliyi ilə Qauss hamarlanmasına məruz qaldı. CpG metilasiya dəyərləri yüksək avtokorrelyasiyaya malik olduğundan (30), məlumatların interpolyasiyası və hamarlanması fərdi CpG-lərdə ardıcıllıq xətasının təsirini azaldır (16). Oxşar hamarlaşdırma yanaşmaları DMR-ləri təyin etmək qabiliyyətinin nəzərəçarpacaq dərəcədə yaxşılaşdığını göstərdi (31). Diskret xüsusiyyətlər əldə etmək üçün biz interpolyasiya edilmiş metilasiya imzamızı 20 bp qətnamə ilə nümunə götürdük. Sonra biz bu xüsusiyyətləri 1001 qiymətləndiricisi olan RF təsnifatı ilə istifadə etdik. Biz əvvəlcə RF təsnifatını seçdik, çünki o, qeyri-parametrik model təqdim edir, az sayda hiperparametrə malikdir, sınaq xətasının daxili qərəzsiz qiymətləndirilməsini yaradır, xüsusiyyətin əhəmiyyətini müəyyən edir və adətən minimal tənzimləmə ilə optimala yaxın işləyir (32). Logistic Regression (LR) (max_iter = 1001), Gradient Artırılmış Təsnifat Ağacları (GBCT) (n_estimators = 1001), Gaussian Naïve Bayes (NB), L2 məsafəyə əsaslanan k-Narest Neighbors (kNN) (k = 21) və Dinamik Zaman Təhrifi (DTW) kNN (k = 21) qeyd olunan dəyişikliklərdən başqa standart parametrlərlə həyata keçirilmişdir. Bütün maşın öyrənmə üsulları scikit-learn və mlpy (yalnız DTW) python paketləri ilə həyata keçirilmişdir (33, 34).

Bütün gen metilasiya modelləri

Bütün gen üzrə metilasiya dəyişikliklərinin tam profilini daxil etmək üçün metilasiya məlumatlarının üç alternativ təqdimatını da həyata keçirdik (Əlavə Şəkil S2A): Tam Ölçülü Gen (WSG), Bütün Gen (WG) və Vahid Gen Xüsusiyyətləri (UGF). Hər təqdimat üçün biz TSS-dən 5 kb yuxarıda və TES-dən (Transkripsiyanın Son Saytı) aşağı axınında (20 bp ayırdetmə) 125 qutu yaratdıq. Bu bölgələr/xüsusiyyətlər daha sonra aşağıdakı kimi hər bir təmsil üçün xüsusi xüsusiyyətlərə əlavə edildi. WSG təmsili, bütün gen üzrə metilləşmə profilini xətti olaraq miqyaslandıraraq metilasiya dəyişikliklərini təsvir etmək üçün ədəbiyyatda ortaya çıxan bir nümayəndəlikdir (22, 26, 35). Diskret xüsusiyyətlər əldə etmək üçün gen üzrə 500 qutu istifadə etdik (Əlavə Şəkil S2B). WG təqdimatı üçün biz metilasiya məlumatlarını genin bütün uzunluğu boyunca əyri (20 bp qətnaməyə uyğun olaraq seçilmiş) kimi modelləşdirdik (Əlavə Şəkil S2C). UGF yanaşması üçün biz hər eksonu 10 miqyaslı qutu və hər bir intronu 30 miqyaslı qutu ilə təmsil etdik. Çoxlu ekzonlar və ya intronlar birlikdə orta hesablanmayıb (Əlavə Şəkil S2D). WSG üçün biz RF təsnifatçısından istifadə etdik. Həm WG, həm də UGF üçün DTW (36) ilə müəyyən edilmiş əyri oxşarlıqdan istifadə etdik və kNN () istifadə edərək ifadə dəyişikliklərini təsnif etdik.k = 21).

Klassifikatorun performansı

ME-Class təlimi üçün lazım olan məlumatların miqdarını qiymətləndirmək üçün biz 17 REP məlumat dəstini qiymətləndirmə üçün nəzərdə tutulmuş səkkiz nümunəyə və təlim üçün istifadə edilən doqquz nümunəyə böldük. Müəyyən sayda təlim nümunələri üçün (n), doqquz təsadüfi dəyişdirmə n Təlim nümunələrindən ikili müqayisələr seçilmiş və doqquz ME-Class təsnifatını hazırlamaq üçün istifadə edilmişdir. Nəticədə doqquz təsnifatçı daha sonra saxlama qiymətləndirmə nümunələrindən səkkiz müqayisədən ibarət sabit dəstdə qiymətləndirildi (Əlavə Şəkil S10).

Hər bir təsnifatı qiymətləndirmək üçün, modelin hər hansı bir nümunəyə və ya fərdi genə uyğunlaşmamasını təmin etmək üçün mühafizəkar iki mərhələli çarpaz doğrulama çərçivəsini (Şəkil 1E) tətbiq etdik. Verilmiş qiymətləndirmə üçün biz aşağıdakı proseduru yerinə yetirdik: (i) bir-birindən kənar nümunə cütlərinin çarpaz təsdiqi: Biz bütün diferensial təlim nümunələrini təlim dəstinə və qiymətləndirmə dəstinə böldük. Bu, təlim dəstindən heç bir fərdi nümunənin qiymətləndirmə dəstində görünməməsini təmin etdi (ii) 10 qatlı gen çarpaz təsdiqi: biz təsadüfi olaraq qiymətləndirmə nümunəsindən genləri 10 qata böldük. Hər bir qatı qiymətləndirmək üçün biz əvvəlcə təlimdən əvvəl təlim dəstindəki bütün nümunələrdən qiymətləndirmə qatındakı bütün genlərin nümunələrini çıxardıq. Beləliklə, əgər A geni qiymətləndirmə məlumatlarındadırsa, hər hansı bir toxuma üçün A geninin nümunələri təlim üçün istifadə edilmir. Sonra biz təlim nümunələri/genləri üzrə təlim keçdik və qiymətləndirmə nümunələrində seçilmiş gen qatını qiymətləndirdik. Daha sonra qiymətləndirmə nümunəsinin hər qatı və verilənlər bazasındakı hər diferensial nümunə üçün bu prosesi 10 dəfə təkrarladıq. Bu proses təsnifatlaşdırıcıya genlər və nümunələr üzrə ümumiləşdirməyə kömək etdi ki, hər bir qiymətləndirmə geninin nə özünün nümunəsini, nə də fərdi nümunəsindəki hər hansı digər genləri müşahidə etməsin.

Dəqiqliyə, rədd etmə dərəcəsinə, müsbət proqnozlaşdırıcı dəyərə (PPV) və mənfi proqnozlaşdırıcı dəyərə (NPV) əsaslanan orta performans bütün nümunələrdən vahid hovuz kimi qəbul edilən bütün genlər üzrə bildirilmişdir. Testin dəqiqliyi düzgün proqnozlaşdırılan ifadəyə malik genlərin sayının qaytarılan ümumi genlərə bölünməsi kimi müəyyən edilmişdir. Qəbuledici Operator Xarakteristikası (ROC) və Precision Recall (PR) əyriləri nümunə üzrə hesabat səviyyəsini təmin etmək üçün orta hesabla götürülüb. RF xüsusiyyətinin əhəmiyyəti Gini əhəmiyyəti kimi qiymətləndirildi. Başqa cür göstərilmədiyi təqdirdə, bütün statistik müqayisələr R.-də FDR ilə düzəldilmiş qoşalaşmış, cütləşmiş Wilcoxon dərəcə cəmi testindən istifadə etməklə aparılmışdır.

Gen ontologiyasının təhlili

Gen Ontologiyası təhlili DAVID-dən standart parametrlərlə Funksional Annotasiya Klasterləşdirmə ilə gen siyahılarının təhlili ilə həyata keçirilmişdir (37).Blueprint analizi gen siyahıları ≥2 diferensial nümunələrdə təsnifat ehtimalı ≥90% olan hər hansı gen tərəfindən müəyyən edilmişdir. Kolon xərçəngi gen siyahıları ME-Class üzrə ≥90% təsnifat ehtimalı ilə aşağı tənzimlənmiş genlər tərəfindən müəyyən edilmişdir (Nəticələrdə rədd nisbətinin müzakirəsinə baxın).


NƏTİCƏ

WSH balları nümunə tərkibi və hüceyrə alt populyasiyaları haqqında məlumat verir. Beləliklə, onlar naməlum funksional təsiri olan fərdi hüceyrələr və allellər arasında fərqləri aşkar edərək DNT metilasiya səviyyəsini tamamlayırlar. Buna baxmayaraq, bu günə qədər WSH nadir hallarda epigenomik tədqiqatlarda nəzərə alınır. Burada biz birbaşa ardıcıl oxunuşlardan DNT metilasiya nümunəsi variasiyalarını tutan WSH skorlarının ilk sistematik və hərtərəfli qiymətləndirilməsini təqdim edirik. Simulyasiyalara və eksperimental məlumatlara əsaslanaraq, biz heterojenliyin surroqatı kimi DNT metilasiya səviyyələrini tamamlamaq üçün ən uyğun olan WSH xalını seçmək üçün təlimatlar təqdim edirik. Nəticələrimiz göstərir ki, WSH skorları DNT metilasiya heterojenliyinin inkişaf və xəstəlikdə fenotipik dəyişikliklərə səbəb olduğu genomik bölgələrin müəyyən edilməsi üçün uyğundur.


Nəticələr

MethylToSNP icmalı

MethylToSNP, yalnız metilləşmə dəyərlərinin matrisindən istifadə edərək Illumina metilasiya massivi məlumatlarına təsir edən SNP-lərin yerini proqnozlaşdırır. O, nümunə dəstindəki bütün potensial SNP-lərin yerlərini ehtiva edən siyahı yaradır, etibarlılıq xalını hesablayır və annotasiya mənbəyinə uyğun olaraq məlum SNP-lərə, məsələn, dbSNP [18] annotasiya edir. Etibarlılıq balının hesablanmasından sonra istifadəçi SNP-nin təsirinə məruz qalan məlumatları təhlildən seçici şəkildə silə bilər. Proqramın sxematik diaqramı Şəkil 2-də tapıla bilər. Prosesin hər bir addımı “Metodlar” bölməsində (və Əlavə fayl 1) təsvir edilmişdir.

a MethylToSNP mövcud metilasiya massivinin emal boru kəmərlərinə inteqrasiya oluna bilər, burada mənbə məlumatı GEO və ya yerli fayllar kimi uzaq məlumat mənbələrindən əldə edilə bilər. MethylToSNP artıq əvvəlcədən işlənmiş məlumatları tələb edir və əgər varsa, SNP proqnozlarını mövcud SNP annotasiyaları ilə birləşdirəcək. Buna görə də onu Bioconductor ilə birlikdə istifadə etməyi tövsiyə edirik minfi paket. b MethylToSNP iş axınının sxematik təsviri. Verilmiş a minfi obyekt və ya düz matris, MethylToSNP beta-dəyərləri çıxaracaq və hər dəfə bir 'cg' probu emal edəcək. Hər bir zond üçün müxtəlif nümunələrdə metilasiya dəyərləri isteğe bağlı kənar istisnalarla çoxluqlar arasında boşluqları tapmaq üçün qruplaşdırılır (bax “Metodlar”). Boşluqlar proqramın parametrləri kimi qəbul edilmiş hədlərə qarşı sınaqdan keçirilir. Daha sonra proqnozlaşdırılan SNP-lər mövcud olduqda mövcud SNP annotasiyası ilə birlikdə bildirilir. Etibarlılıq balları meC > T keçidlərinə uyğun olan nümunələrin aşkarlanmasını vurğulamaq üçün hesablanır.

SNP tapma alqoritmi

MethylToSNP, SNP-lərin mövcudluğunu təxmin etmək üçün SNP yerlərində [5, 7, 8] tapılan xarakterik metilasiya modelindən istifadə edir. Polimorf sahə tez-tez üç diskret metilləşmə səviyyəsini qaytarır: məsələn, tam metilləşmə metilləşdirilmiş CC genotipinə, qismən metilləşmə metilləşdirilmiş CT genotipinə, metilləşmənin olmaması isə TT genotipinə uyğun olacaq. Bu hallarda, bütün nümunələr 0-1 davamlı miqyasda tərtib edildikdə, β-dəyərlər, aralarındakı boşluqlarla üç səviyyəyə düşür (Şəkil 3a). MethylToSNP bu nümunə ilə əlaqəli boşluqları axtarır. Məsələn, SNP ilə uyğun gələn bir məkanda nümunələr çox vaxt diapazonun ən yüksək sonuna yaxındır (0,75 və daha yüksək), bəzi nümunələr isə diapazonun ortasına yaxındır. β-dəyər diapazonu (təxminən 0,4-0,6) və nümunələr β-aralığın aşağı sonundakı dəyərlər (baxmayaraq ki, fon səs-küyünə görə mütləq sıfır deyil). Bu nümunə bütün SNP lokuslarında təkrarlana bilər, lakin diapazonun ölçüsünün aşağıdan yüksək dəyərlərə qədər dəyişməsi hər mövqedə boşluğun bir qədər fərqli sərhədlərini yaradır (Şəkil 3b). Əksinə, β-SNP olmayan bir sayt üçün dəyərlər məlumat nöqtələri arasında böyük boşluqlar olmadan dar bir diapazonda və ya kontinuum daxilində düşə bilər. Beləliklə, meC > T SNP mövcud olduqda, metilasiya dəyərlərinin məhdud birləşməsi verilənlərdən azad bölgələr və ya boşluqlarla ayrılmış məlumatlarda üç diskret "səviyyə" yaradacaq, halbuki məlumat sahəsində böyük boşluqlar olmadıqda, SNP yoxdur. proqnozlaşdırmaq olar.

SNP varlığı metilasiya məlumatlarını üç səviyyəyə paylayır. Bütün nümunələr 95 Cənubi Afrika nümunəsindən istifadə edərək təsvir edilmişdir. a Tək bir SNP yerində DNT metilasiya beta-dəyərləri bütün nümunələr üzrə tərtib edilmişdir. b Hər bir SNP mövqeyində istifadə edilən kəsmə dəyərlərində dəyişkənliyə ehtiyacı göstərmək üçün bütün nümunələr üzrə birlikdə tərtib edilmiş SNP kimi üç səviyyəli nümunələri olan 40 təsadüfi seçilmiş saytdan alınan məlumatlar. c ilə eyni məlumatlar (b) hər bir massiv zondu (yəni, genom yeri) üçün ayrıca göstərilir. Prob-müdrik həddlər məlumatları üç səviyyəyə ayırmağa imkan verir

YRI və CEU DNT metilasiya məlumat dəstlərində SNP qiymətləndirilməsi

YRI və CEU HapMap nümunələri yaxşı öyrənilmişdir, əlavə yeni polimorfizm aşkarlanması gözləntilərini məhdudlaşdırır və proqram alətinin sınaqdan keçirilməsi üçün istinad məlumat dəstini təmin edir. 77 YRI nümunəsində və 90 CEU nümunəsində 24,000 metilasiya zondunda nəticələri sınaqdan keçirdik. MethylToSNP, YRI məlumatlarında asanlıqla təsdiq edə biləcəyimiz yeddi saytı qeyd etdi. Bundan əlavə, proqram həmçinin hər bir saytda 0,5 həddən yuxarı olan etibarlılıq ballarını da bildirdi (bax: “Metodlar”). Yeddi saytdan ikisi dbSNP versiya 146-da (yəni, metilasiya zondları cg21505334 və cg21226234) 1000 Genomes Data Brauzerində cg21226234 (Şəkil 4-də təsvir) mövqeyi üçün bildirilən heterozigot allelləri ilə mövcud idi. Əvvəlki verilənlər bazası buraxılışına aid olan digər iki sayt, dbSNP 142 versiyası (cg08261841 və cg09953122). Qalan üç sahə (cg02119982, cg16757724 və cg22484980), metilasiya analizində zondların hibridləşməsinə təsir edəcək məlum SNP tərkibli mövqelərə bitişik idi. Təsdiqlənmiş saytlara əlavə olaraq, biz YRI-də altı və CEU-da 31 saytı 0,50-dən yuxarı etibarlılıq balı müəyyən etdik ki, bu da yeni SNP kimi güclü namizədlər olacaq (Cədvəl 1).

İbadan, Nigeriya (YRI) Yorubadakı cg21226234 zond yerində beta-dəyərlərin planı MethylToSNP tərəfindən aşkar edilmiş Illumina 27K nümunələri. Sayt 0,958 yüksək etibarlılıq balı alıb. Bu saytdakı zond məlum SNP rs775651175-ə uyğundur

Ümumilikdə, proqram 37 və 283 potensial SNP mövqelərini proqnozlaşdırdı (Cədvəl 1). Məlum SNP mövqeləri bu məlumat dəstlərində SNP-ləri daşıyan 9 və 57 mövqeləri kəsdi (dbSNP146 istifadə edərək). YRI-da qalan 28 mövqe və CEU-da 226 sayt da SNP-lərə bənzəyən fərqli nümunələrə malikdir. Biz bu mövqeləri MethylToSNP etibarlılıq ballarından istifadə edərək (bax “Metodlar”) araşdırdıq və aşkar etdik ki, YRI-da altı və CEU-da 31 sayt istisna olmaqla, əksəriyyət YRI proqnozları üçün orta xal cəmi 0,02 olmaqla 0,50 həddindən aşağı bal toplayıb. və CEU proqnozları üçün 0,01, bu saytlardan bir neçəsinin həyat qabiliyyətli meC > T SNP namizədləri olacağını göstərir.

Aşağı etibarlılıq balları olan proqnozların SNP-ləri təmsil etmədiyini təsdiqləmək üçün biz 77 YRI nümunəsindən 15-də üç səviyyəli metilasiya nümunələri olan 28 YRI nəticələrindən üçünü seçdik. Üç nümunə üçün etibarlılıq balları aşağı idi (0.042, 0.034 və 0.070) və məlumat nöqtələrinin əksəriyyəti beta-dəyər aralığının aşağı hissəsini (metilləşməmiş C-ləri təmsil edir) tuturdu. Bisulfit ardıcıllığı ilə biz üç səviyyəli metilasiya səviyyələrini yaradan DNT metilasiyasının mövcudluğunu təsdiqlədik, halbuki hədəflənmiş Sanger ardıcıllığı heç bir polimorfizm göstərmədi (Cədvəl 2). Bundan əlavə, yalnız bir nümunədə maraq doğuran CpG-nin 50 bp daxilində SNP var idi, halbuki 10 bp-dən çox olan hər hansı bir şeyin metilasiya səviyyələrinə təsir göstərməsi ehtimalı azdır [7, 8]. Bu nəticələr göstərir ki, fərdi lokuslar MethylToSNP etibarlılıq balından istifadə edərək potensial meC > T SNP saytlarından süzülə bilən Illumina metilasiya məlumatlarında heterojen nukleotid modelini təqlid edən DNT metilasiyasının heterojen səviyyələrini göstərə bilər. Qeyd edək ki, cg23886551 probu çap olunduğu bildirilən bir gen ilə əlaqələndirilir (TMEM121 [19]), halbuki cg18335068 ən azı bir monoalelik ifadə hesabatı olan bir gen ilə əlaqələndirilir (ZNF677 [20]).

Daha az xarakterizə edilən populyasiyalarda yeni polimorfizmlərin qiymətləndirilməsi

MetilToSNP ( ( < mətn>\_> = 0,75, >\_>\_> = 0.5, ) heç bir kənar xaric etmə) müqayisəli populyasiyaları təmin edərək, özünü etno-linqvistik olaraq KhoeSan və ya Bantu dilli cənub afrikalılar kimi tanıdan şəxslərin epigenomlarından əldə edilən metilasiya massiv məlumatlarına tətbiq edilmişdir. Illumina 450K massivlərindəki 473,767 metilasiya zondu yerindən biz 2296 potensial meC > T SNP müəyyən etdik. dbSNP146-da məlum SNP-lər bu saytların 1402-ni təşkil edir (Cədvəl 3) və > 61% minimum təxmin edilən həqiqi müsbət nisbət verir. Qalan 894 sayt potensial yeni variantları təmsil edir. Onların orta etibarlılıq balı 0,979 olub, onlardan 827 saytın etibarlılıq balları ≥ 0,5 olub. Bu nəticə 2229/2296 və ya 97% həqiqi müsbət nisbəti təklif edir ki, bu da simulyasiya edilmiş məlumat dəstlərindəki həssaslığımızla müqayisə edilə bilər (bax: “Metodlar”). Hamısının çıxarılmasının ənənəvi yanaşması ilə müqayisədə

Illumina metilasiya massivi məlumatlarını üst-üstə düşən 144.000 məlum SNP saytı [7], qeyd edirik ki, yalnız 2296 potensial SNP-nin çıxarılması Cənubi Afrika epigenomik məlumatlarından çoxlu məlumat nöqtələrinin itirilməsinin qarşısını alır. Bu tapıntı, SNP-lərin mövcudluğu üçün məlumatları diqqətlə süzgəcdən keçirməyin zəruriliyini vurğulayır, lakin bütün mümkün SNP mövqelərini, xüsusən də məlum yüksək səviyyəli genetik müxtəlifliyə malik Afrikadan olan bir əhali daxil edərkən, fərq qoymadan bütün mümkün SNP mövqelərini aradan qaldıran həddindən artıq mühafizəkar yanaşmalardan istifadə etməmək lazımdır. Qeyd edək ki, bu variantların çoxu yeni müəyyən edilib, dbSNP142-dən sonra 153-ü əlavə edilib.

KhoeSan və Bantu cənub Afrikalıları arasında diferensial metilləşdirilmiş saytlar, SNP üçün süzülmüşdür.

KhoeSan və Bantu cənub Afrikalıları arasında diferensial metilasiyanın müqayisəsi üçün (tədqiqat altında olan əlyazma) biz ehtimal olunan SNP tərkibli zondları müəyyən etmək və təhlildən çıxarmaq üçün MethylToSNP-dən istifadə etdik. SNP-nin tam çıxarılmasından əvvəl, Illumina metilasiya zondu cg00117311-də məlum SNP mövqeyində bir SNP proqnozunu daha da araşdırdıq. İki KhoeSan fərdinin heterozigot allel modelini göstərən 50% metilasiya (beta-dəyər) göstərdiyi 0.963 etibarlılıq balı ilə bir SNP proqnozlaşdırdıq (Cədvəl 4). KhoeSan fərdlərindən əldə edilən dörd mövcud genomik ardıcıllıq iki fərddə C-T SNP [21] daşıdığını göstərməklə polimorfizm haqqında proqnozlarımızı təsdiqlədi, digər ikisində isə yalnız istinad allele (Penn State Genome Browser [21, 21, 21, 21]) istinad allele malikdir. 22]). Sonuncu iki şəxs göstərdi

95% metilləşmə, metilləşmə məlumatlarından homozigot allelin göstəricisidir.

Yeni, lakin sübut olunmamış SNP mövqelərini göstərən dörd əlavə araşdırma saytını araşdırdıq. Orijinal CpG mövqelərinin 10 bp daxilində bir neçə genomik ardıcıllığı qiymətləndirərək həm ümumi, həm də nadir variantların mövcudluğunu təsdiqlədik (Cədvəl 5). Bir sayt, cg10633981, diferensial metilasiya məlumatlarımızın ilk 5%-də qeydə alınmamış tək polimorfik saytı təmsil edirdi. Onun 0,779 etibarlılıq balı var və bu, yeni bir polimorfizm kimi uyğun olduğunu göstərir. Polimorfizm mövcud olan dörd ardıcıl KhoeSan genomunda baş vermir və buna görə də bu mövqeyi yoxlamaq üçün əlavə ardıcıllıq məlumatlarını araşdırdıq. Lakin cg10633981-də proqnozlaşdırılan variantı daşıyan şəxs üçün ardıcıllıq məlumatlarının olmaması səbəbindən proqnoz təsdiqlənmədi.

Gücləndiricilərdə və CTCF sahələrində diferensial DNT metilasiyası və ya SNP-lərin fərqləndirilməsi

Metilasiyanın gücləndirici bölgələrə təsir edib-etmədiyini ayırd etmək üçün biz Illumina 450K massivində insan genomunda annotasiya edilmiş gücləndiricilərlə üst-üstə düşən 102,559 CpG mövqelərinin siyahısını müəyyən etdik. Biz siyahını KhoeSan və Bantu cənub Afrikalıları (Mann-Whitney) arasında 12,613 diferensial metilləşdirilmiş zond mövqeyini üst-üstə düşən 1235 gücləndirici mövqeyə qədər daraltdıq. U Bonferroni korreksiyası ilə test edin). Bunlardan 892/1235 və ya 72% üst-üstə düşmüş mövqelər bəzi populyasiyalarda SNP ehtiva etdiyi bilinir (dbSNP146 istifadə edərək). Bunun əksinə olaraq, MethylToSNP 1235 saytdan yalnız altısının SNP daşıyıcısı olduğunu proqnozlaşdırdı (hər biri 0,5-dən çox etibarlılıq balına malikdir), hamısı 892 məlum SNP mövqeləri dəstində qeyd edildi və bu, bu 892 mövqenin əksəriyyətinin diferensial metilləşdirilmiş gücləndiricilər olduğunu göstərir. KhoeSan və Bantu müqayisəsi, bu şəxslərdə polimorfik saytlar deyil. Yenə də bu məlumatlar göstərir ki, bütün məlum SNP saytlarının metilasiya verilənlər bazasından silinməsi potensial informativ məlumatları lazımsız şəkildə aradan qaldıra bilər. Biz həmçinin MethylToSNP-ni KhoeSan və Bantu nümunələrimizdən metilasiya məlumatlarında təmsil olunan 102,559 gücləndirici CpG-nin tam dəstinə tətbiq etdik. MethylToSNP 685 yüksək etibarlı SNP mövqeyini proqnozlaşdırdı (burada etibarlılıq balları ≥ 0,5), bunlardan 327 sayt insan genomunda məlum SNP saytları ilə üst-üstə düşür və bu nümunələrdə baş verir. Bu yanaşma həmçinin KhoeSan və ya Bantu cənub Afrika məlumatlarında gücləndirici mövqelərə daxil olan yeni SNP ola biləcək 358 mövqeyi müəyyən edir, baxmayaraq ki, əhəmiyyətli dərəcədə differensial metilləşdirilmiş mövqelər kimi müəyyən edilməmişdir.

Cənubi Afrika, CEU və YRI məlumat dəstlərindəki CTCF saytlarında proqnozlaşdırılan SNP-ləri DNT metilasiyasına qarşı da araşdırdıq. CTCF saytları 450K massivində 79,856 CpG zond mövqeləri ilə üst-üstə düşdü. MethylToSNP istifadə edərək biz siyahını 3279 diferensial metilləşdirilmiş CTCF sahəsinə qədər daraltdıq (Mann-Whitney) U KhoeSan və Bantu qrupları arasında Bonferroni düzəlişi ilə sınaqdan keçirdi və onların SNP-lərin olmadığını "təsdiq etdi". Bu nəticələr CTCF sahələrində polimorfizmdən daha çox metilasiya fərqlərini nəzərdə tutur. Diferensial metilasiya olmadan CTCF saytlarını araşdırdığımızda, 101-in MethylToSNP tərəfindən Cənubi Afrika məlumat dəstində SNP-lərin olması proqnozlaşdırıldı (etibarlılıq balları ≥ 0.5). Bunun əksinə olaraq, CTCF saytlarını ehtiva edən 79,856 CpG-dən yalnız 18-i YRI fərdlərinin məlumatlarında SNP boşluq nümunələrini göstərdi. Bunlar SNP kimi istisna edildi, çünki orta etibarlılıq balı 0,006 idi, heç biri 0,5 bal həddinə çatmadı. Beləliklə, nümunələr polimorfizmlərdən daha çox bu CTCF yerlərində dəyişən metilasiya ilə əlaqədardır. Eyni şəkildə, CEU fərdlərində 61 CTCF mövqeyi SNP nümunələrinə bənzəyirdi, lakin ümumi olaraq 0,017 orta etibarlılıq balı var idi, heç bir fərdi etibarlılıq balları > 0,5 daşımır. Beləliklə, Cənubi Afrika məlumatlarında yeni SNP-lərin və diferensial metilasiyanın olması, müxtəlif mexanizmlər vasitəsilə CTCF bağlanmasına müdaxilə edərək, genom biologiyasında funksional olaraq müvafiq təsir potensialına malikdir. Bunun əksinə olaraq, YRI və CEU nümunələrində CTCF saytları dəyişkən metilasiya daşıyır, lakin polimorfizm deyil. Beləliklə, MethylToSNP analiz yanaşması, genotip məlumatı olmayan nümunələr üçün əlavə dəyər təmin edən funksional yerlərdə SNP məzmununu məlumatlandıra bilər.

Boşluq ovunun təhlili ilə müqayisə

Bu yaxınlarda təklif olunan "boşluq ovçuluğu" adlı başqa bir üsul da məlumat nöqtələrində boşluqları axtararaq müxtəlif metilasiya səviyyələrinin mövcud olduğu CpG saytlarını müəyyən etmək üçün massiv məlumatlarından istifadə edir [15]. Metod müxtəlif SNP siqnalları, indekslər və surət nömrə variantları nəticəsində yaranan doqquz səviyyəyə qədər məlumatı müəyyən edə bilər. Bununla belə, müəlliflər hər bir nümunə növünün nəyi təmsil edə biləcəyi ilə bağlı xüsusi iddialar irəli sürmürlər, yalnız işarələnmiş saytların metilasiya təhlilində ayrıca nəzərdən keçirilməli olduğuna dair xəbərdarlıq edirlər. Nəticələri MethylToSNP ilə müqayisə etmək üçün "3-qrup" etiketli boşluq nümunəsinə diqqət yetirdik (iki boşluq boşluğuna uyğundur). Verilənlər dəstimizdən istifadə edən vasitələrin keyfiyyətlə müqayisəsi zamanı hər bir alətdən işarələnmiş saytların siyahısının eyni olmadığını və standart proqram parametrlərindən istifadə edərkən MethylToSNP-nin problemli saytların siyahısının daha mühafizəkar olduğunu gördük (Cədvəl 6). Məsələn, boşluq ovlama yanaşması MethylToSNP tərəfindən proqnozlaşdırılan 381 ilə müqayisədə 8486 mövqe qeyd etdi. MethylToSNP-nin 3-qrup adlanan boşluq ovlama kateqoriyasına səliqəli düşməyən saytları müəyyən etdiyi hallar da var. Fərqlər çox güman ki, MethylToSNP-nin bir yüksək etimad nümunəsini (yəni, beta-dəyərlərin həddindən artıq diapazonunu tətbiq etməklə meC > T SNP-lər) tapmağa yönəlməsi ilə əlaqədar yaranır, halbuki boşluq axtarışı ümumiyyətlə geniş boşluq diapazonu olan məlumat nümunələrini axtarır. - şərhli SNP, indellər, mikrosatellitlər və ya çoxnukleotid polimorfizmləri də daxil olmaqla bir çox müxtəlif növ genomik hadisələri təmsil edə bilən kosmik nümunələr. Bu qruplar kiçik və ya böyük beta-dəyərləri əhatə edə bilər.


2.1 DNT metilasiyası

DNT metilasiyası sitozin pirimidin halqasında beşinci karbona bir metil qrupunun əlavə edilməsini nəzərdə tutur. Onurğalıların somatik toxumalarında bu, əsasən CpG dinukleotidlərindəki iki zəncirdə simmetrik olaraq baş verir, baxmayaraq ki, embrion kök hüceyrələrində 24 və siçan oositlərində nəzərəçarpacaq dərəcədə qeyri-CpG metilasiyası müəyyən edilmişdir. 25 Buradakı bütün əlavə müzakirələr CpG metilasiyasına istinad edəcək. Məməli CpG-lərin 70%-80%-nin metilləşdiyi güman edilir 26, metillənməmiş CpG-lərin əksəriyyəti CpG adaları adlanan yüksək sıxlıqlı klasterlərdə tapılır, bunlar tez-tez tənzimləyici funksiyaları yerinə yetirir və tez-tez gen promotorlarında olur. İki məməli de novo metiltransferaz, DNMT3A və DNMT3B metilasiya nümunələrinin qurulmasından məsuldur, DNMT1 isə hemi-metilləşdirilmiş DNT-yə üstünlük verir və beləliklə, DNT replikasiyasında CpG metilasiyasını effektiv şəkildə saxlayır. 27,28 De novo metilasiyanın hədəflənməsinin DNMT3A və DNMT3B de novo metiltransferazalarının DNMT3L (DNMT3Like, katalitik olmayan paraloq) və Np95 (İst. 29,30-da nəzərdən keçirilir) kimi amillərlə qarşılıqlı əlaqəsi ilə vasitəçilik edildiyi düşünülür. . DNMT3L-in in vitro metillənməmiş H3K4 quyruğuna bağlandığı göstərilmişdir və buna görə də təklif edilmişdir ki, H3K4 metilasiyasının olmaması, tez-tez açıq xromatin və aktiv şəkildə transkripsiya edilmiş sahələrlə əlaqəli olan histon modifikasiyası (aşağıya bax) hədəflənmə ilə nəticələnə bilər. DNMT3A vasitəsilə spesifik lokuslara, o cümlədən çap olunmuş genlərə de novo metilasiya. Alternativ olaraq H3K4 metilasiyasının olması DNT metiltransferazalarının təsirindən qoruya bilər. 31,32 Həqiqətən də, çoxsaylı tədqiqatlar H3K4 metilasiyası və DNT metilasiyası arasında genom miqyasında mənfi korrelyasiya tapmışdır (məsələn: Ref. 33-36). Buna uyğun olaraq, H3K4 demetilaz AOF1/KDM1B-də homozigot rüşeym xətti mutasiyasının oogenez zamanı bəzi ananın metilasiya izlərinin əldə edilməsini pozduğu göstərilmişdir. Bu, bəzi imprinting nəzarət bölgələrində, ICR-lərdə cücərmə xətti CpG metilasiyasını yaratmaq üçün histon demetilasiyası tələbini göstərir. 37 Genomik imprinting və onu idarə edən epigenetik mexanizmlər daha sonra Bölmə 3.2-də müzakirə olunacaq.

2.1.1 DNT metilasiyası və transkripsiyaya nəzarət

DNT metilasiyası heteroxromatik bölgələrdə və təkrarlanan elementlərdə zənginləşir, burada qapalı xromatin strukturunu təşviq edir və ekspressiyanın və/və ya rekombinasiyanın qarşısını almağa kömək edir (İst. 2-də nəzərdən keçirilir).DNT metilasiyasının transkripsiyanın basdırılmasında və heterokromatinin saxlanmasında danılmaz rolu olsa da, müəyyən genomik kontekstlərdə DNT metilasiyası daha nüanslı rola malik ola bilər.

Ümumiyyətlə, promotor bölgələrin metilasiyası transkripsiyanın aşağı tənzimlənməsi ilə əlaqələndirilir. Tez-tez güman edilir ki, metilləşmənin qazanılması transkripsiyanın bastırılması ilə nəticələnir, lakin metilləşmənin əldə edilməsi əslində transkripsiyanın bastırılmasının nəticəsi ola bilər, baxmayaraq ki, promotorun metilasiyası daha sonra səssiz vəziyyətin saxlanmasına kömək edə bilər. 38-40 Promotorun metilasiyası və transkripsiyası arasında əlaqə qismən promotorun CpG sıxlığından asılıdır. Təşviqçilər CpG məzmununa görə yüksək, orta və aşağı sıxlıq siniflərinə, HCP, ICP və LCP-yə bölünə bilər. 35,36 HCP-lərin böyük əksəriyyəti, hətta transkripsiya baxımından səssiz olsalar da, metillənməmişdir. HCP-lərin CpG ada nüvəsinin metilasiyası adətən promotorla əlaqəli tritoraks və polikomb qruplarının xaric edilməsinə, yerli heterokromatinin əmələ gəlməsinə və gen susdurulmasına səbəb olur. Belə HCP susdurulması ümumiyyətlə yalnız çap edilmiş və ya cücərmə xətti ilə əlaqəli genlərdə və X-xromosomunun inaktivasiyası zamanı istifadə olunur. 35 Belə promotorların DNT metilasiyası ilkin susdurma siqnalı hesab edilmir, əksinə “bağlanır” və sabit səssiz vəziyyəti saxlayır. Əksinə, LCP-lərdə daha nadir CpG-lər promotorun fəaliyyət vəziyyətindən asılı olmayaraq metilləşməyə meyllidirlər. 36 Bu, əvvəllər müşahidə edildiyi kimi, metilləşdirilmiş CpG-lərin aşağı sıxlığının transkripsiya fəaliyyəti ilə uyğunsuz olmadığını təsdiqləyir. 41 ICP-lərdə metilləşmə dərəcəsi ilə transkripsiya aktivliyi arasında mənfi əlaqə var. ICP-lərin susdurulması ilə əlaqəli metilasiya daha çox müşahidə olunur, bu, ya bu promotorların de novo metilasiyaya daha həssas olduğunu və/yaxud CpG metilasiyasının bu promotorlarda transkripsiyaya nəzarətdə mexaniki funksiyaya malik olduğunu göstərir. Metilləşmənin əsasən metil bağlayan domen zülallarının cəlb edilməsi yolu ilə transkripsiya fəaliyyətini pozduğu güman edilir, baxmayaraq ki, CpG metilasiyası transkripsiya faktorunun bağlanmasını da birbaşa maneə törədə bilər. 42

Son tədqiqatlar transkripsiya nəzarətinin tənzimlənməsində qeyri-5' CpG adalarının DNT metilasyonunun rolunu yenidən nəzərdən keçirdi. İnsan və siçan beynində intragenik CpG adalarının proksimal promotor CpG adalarından (müvafiq olaraq 34% və 2%) daha çox toxuma spesifik metilasiya tezliyinə malik olduğu göstərilmişdir. Təklif edilmişdir ki, bu intragenik CpG adaları alternativ promotorlar ola bilər və beləliklə, intragenik CpG metilasiyası müxtəlif hüceyrə növləri arasında alternativ transkript istifadəsinin tənzimlənməsində rol oynaya bilər. 43 Bununla belə, belə bir korrelyasiya səbəbli əlaqəni nəzərdə tutmur və intragenik CpG adasından transkripsiya başlanğıcının olmaması DNT metilasiyasının əldə edilməsinə icazə verə bilər.

Gen bədəni üzərində DNT metilasiyasının siçan və insan genomlarında gen transkripsiyası səviyyəsi ilə müsbət əlaqədə olduğu bilinir. 33,44,45 Həqiqətən də, dişi məməlilərdə aktiv X-in bəzi bölgələri qeyri-aktiv X-dən daha yüksək ümumi DNT metilasiyası səviyyəsini göstərir. Bu metilasiya gen orqanlarında cəmləşmişdir. 46 X inaktivasiyası belə gen-bədən metilasyonunun azalmasına gətirib çıxarır. 47 In Arabidopsis thaliana, belə gen-bədən metilasiyası saxta transkripsiya başlanmasını maneə törətmək üçün təklif edilmişdir, lakin əgər varsa, məməlilərin genomlarında funksiya naməlum olaraq qalır. 42 Həqiqətən də mümkündür ki, aktiv X-də metilləşmənin yığılması sadəcə olaraq bu xromosoma DNT metiltransferazalarının daha çox əlçatanlığının simptomatikdir.

Wu və başqaları. postnatal neyrogenezdə gen ifadəsinin idarə edilməsində DNMT3A və qeyri-promoter metilasiyanın rolunu təklif etdilər. DNMT3A −/− siçanlar sinir kök hüceyrələrində yuxarı tənzimlənmiş transkriptlər kimi aşağı tənzimlənmiş təxminən bərabər sayda nümayiş etdirir. Bu, promotorun susdurulması mexanizmi kimi neyronların differensasiyası zamanı DNT metilasiyası üçün əsas rola uyğun gəlmir. Wu və başqaları. proksimal promotordan kənar DNT metilasiyasının PRC2 kompleksinin bağlanmasına müdaxilə edərək Polycomb vasitəçiliyi ilə gen repressiyasının qarşısını aldığını göstərir. DNMT3A-nın itirilməsi H3K27-nin yığılması və genin susdurulması ilə nəticələnir. 48 Beyin inkişafında DNMT3A-nın mühüm rolu ilə uyğun olaraq, insanlarda bir allelin funksiyasının itirilməsi intellektual qüsur, uzun boy və fərqli üz görünüşü ilə xarakterizə olunan autosomal dominant inkişaf pozğunluğu ilə nəticələnir. 49 DNMT3A bu yaxınlarda motor neyron inkişafında da əhəmiyyətli olduğu göstərilmişdir. 9 CNS DNMT3A olmayan siçanlar doğulanda sağlamdırlar, lakin daha az motor neyronlarına, hərəkət qüsurlarına malikdirlər və vaxtından əvvəl ölürlər.

Beyin DNT metilasyonunun əhəmiyyətini göstərən başqa bir neyroinkişaf pozğunluğu Rett sindromudur. Rett sindromu metil-CpG bağlayan domen zülalını kodlayan MECP2-də mutasiyalara səbəb olan X ilə əlaqəli dominant autizm spektri pozğunluğudur. 50 Təsirə məruz qalan uşaqlar adətən 6-12 aylıq olana qədər normal inkişafa malikdirlər, ardınca reqressiya və əldə edilmiş inkişaf bacarıqlarının itirilməsi ağır əqli geriliyə və motor pozğunluğuna səbəb olur. MECP2 bir çox toxumada ifadə edilsə də, siçan modellərində beyinə xas itkilər MeCP2 adi fenotipi təkrar edir. 51 Maraqlıdır ki, siçanda fenotipik xilasetmə yetkin MeCP2 mutant heyvanlarında normal MeCP2 ifadəsini induksiya etməklə əldə edilə bilər. Əhəmiyyətli odur ki, bu cür xilasetmə xəstəliyin artıq təzahür etdiyi heyvanlarda müşahidə olunur. Əvvəlcə MeCP2-nin metilləşdirilmiş bölgələrə bağlandığı və transkripsiya repressoru kimi çıxış etdiyi düşünülürdü. 52,53 Bununla belə, daha yeni məlumatlar MeCP2-nin postnatal neyronlarda çox yüksək səviyyələrdə ifadə edildiyini, genom miqyasında bağlanma profilinə malik olduğunu göstərir. Nəticə etibarilə onun spesifik genlərin transkripsiya tənzimləyicisindən daha çox xromatinin struktur elementi kimi çıxış edə biləcəyi fərz edilmişdir. 54 MeCP2-nin rolunun yenidən tədqiqi, MeCP2-nin 5 mC-yə oxşar yaxınlığı olan neyronlarda hidroksimetilləşdirilmiş sitozinlərə (5hmC, aşağıya bax) bağlandığını və R133C mutasiyasına səbəb olan Rett sindromunun üstünlük verdiyini göstərən son məlumatlar ilə təhrik edilmişdir. MeCP2-nin 5hmC-yə bağlanması. 55,56


Videoya baxın: Ders #6 -Cinsiyyetin genetikasi (Iyun 2022).