Məlumat

Histon modifikasiyası üçün ChIP-seq ifadə üçün RNT-seq ilə uyğun gəlmir


Məndə H3K79me2 və H3K36me3 üçün ChIP-seq və işlənmiş və təmizlənməmiş nümunələr üçün RNT seq məlumatları var. Bu iki histon aktiv genləri qeyd edir. Deyək ki, hipotetik olaraq, pik zəng edən hər iki histon modifikasiyası üçün A genində diferensial yerlər tapır. Bununla belə, mən RNT-seq analiz alətlərini (məsələn, edgeR və ya DESeq2) işə saldığım zaman bu gen diferensial şəkildə ifadə olunmuş kimi qeyd olunmur (yaxşı ki, onun FDR dəyəri >0,05-dir).

RNT seq analizi üsullarının bu genin diferensial şəkildə ifadə edildiyi kimi tapılmamasının bir neçə texniki səbəbi ola bilər, çünki

  1. həqiqətən fərqli şəkildə ifadə olunmur
  2. ya da alətlərin onu aşkar etməsi üçün kifayət qədər diferensial şəkildə ifadə olunmur

Bununla belə, məni daha çox bioloji aspekt maraqlandırır. Əgər iki histon A genini müalicə olunan nümunələrdə aktiv olaraq qeyd edərsə, onun RNT seqmentində ifadə olunacağını gözləmək olardı. Hansı mexanizm nəticəyə gətirib çıxara bilər ki, genlər histonlar tərəfindən aktiv olaraq qeyd olunsa da, RNT-seqdə diferensial şəkildə ifadə olunmayacaq?


Əlavə təcrübələr olmadan hər hansı bir nəticə çıxarmaq çətindir. Post-transkripsiya tənzimləyiciləri kimi faktorlar da daxil olmaqla, genin ifadəsinə mane olan bir çox başqa amillər ola bilər. Qeyd etdiyiniz kimi bəzi histon modifikasiyaları da bir az zərifdir və ikivalent modifikasiyalar da ola bilər. Bununla belə, bu işarələrin repressiya ilə əlaqəli olduğunu düşünmək üçün güclü səbəb varsa, bunları sınaya bilərsiniz:

  1. İfadəsi histon işarələrinə uyğun olmayan neçə genin olduğunu yoxlaya bilərsiniz. Bu, az sayda gen üçünsə, onları ayrıca araşdıra bilərsiniz. Histon işarəsi və ifadə arasındakı əlaqənizin əhəmiyyətini yoxlamaq üçün statistik testdən istifadə edin. Uyğunsuzluq geniş yayılıbsa, mən sizə RNAseq-i təkrar etməyi təklif edərdim (ChIP-seq-in təkrarlanmasından daha asan və daha ucuz). BTW, oxumaq keyfiyyətləri necə idi? Bundan asılı olaraq, hansı təcrübənin təkrarlanması lazım olduğuna qərar verə bilərsiniz. Təkrarlama müşahidənin həqiqətən düzgün olub-olmadığını bilməyə kömək edəcək (bioloji təkrar); ola bilsin ki, siz də bu işarələrin əslində qərəzli olduğu qənaətinə gələ bilərsiniz.

  2. Bir neçə gen uyğunsuzluq göstərirsə, bu genlər üçün Real-Time PCR edin. RT-PCR daha həssasdır və kəmiyyətin təyini üçün başqa bir üsul hər halda yaxşıdır. Təcrübədə bir neçə uyğun gendən də istifadə edin.


ChIP-seq mükəmməl deyil. Texniki təkrarlar arasında belə, xüsusilə istifadə etdiyiniz kimi geniş markalar üçün kifayət qədər variasiya əldə edirsiniz. İnsanların bir genin ifadə edilib-edilmədiyini müəyyən etmək üçün H3K79me2 və H3K36me3 istifadə etdiyini görmək olduqca nadirdir. H3K4me3 və H3K27ac və ya H3ac istifadə transkripsiya edilmiş genlərin promotorlarını işarələmək üçün daha çox yayılmış üsuldur.

Ardıcıllıq təcrübələrinin hər ikisi üçün həqiqətən aşağı oxumasanız, uyğun olmayan 40 gen məni çox narahat etməz. @WYSIWYG-nin bir neçə gen üçün RNT-seq məlumatlarınızı yoxlamaq üçün RT-PCR-dən istifadə etmək təklifi yaxşıdır.


Mürəkkəb və az bol ağac qönçələri üçün ChIP-seq və RNT-seq şirin albalı qönçələrinin yuxusuzluğu zamanı xromatin və ekspressiya ko-dinamikası aşkar edir.

Xromatin immunoprecipitation-sequencing (ChIP-seq) histonlar və ya transkripsiya faktorları və DNT kimi zülallar arasında qarşılıqlı əlaqəni öyrənmək üçün güclü bir texnikadır. Bu texnika RNT ardıcıllığı (RNT-seq) ilə birlikdə eukariotlarda bioloji prosesləri daha yaxşı başa düşmək üçün güclü vasitədir. Biz ağac qönçələri üçün birləşmiş ChIP-seq və RNT-seq protokolunu hazırladıq (Prunus avium L., Prunus persica L Dəstə, Malus x domestica Borkh.) bu da uğurla sınaqdan keçirilmişdir Arabidopsis thalianaSaccharomyces cerevisiae. Ağac qönçələrində ChIP və RNT çıxarılmasına mənfi təsir göstərən fenolik birləşmələr var. Bu problemi həll etməklə yanaşı, protokolumuz kiçik miqdarda material üzərində işləmək üçün optimallaşdırılıb. Bundan əlavə, bu protokolun üstünlüklərindən biri odur ki, ChIP-seq üçün nümunələr flaş dondurulduqdan sonra çarpaz əlaqələndirilir, bu da sahədə böyüyən ağaclar üzərində işləməyi və eyni başlanğıc materialı üzərində ChIP-seq və RNT-seq həyata keçirməyi mümkün edir. . Şirin albalıdakı hərəkətsiz qönçələrə diqqət yetirərək, biz ifadə səviyyəsi ilə bütün genlər üçün H3K4me3 zənginləşdirilməsi arasındakı əlaqəni, o cümlədən, H3K4me3 zənginləşdirilməsi arasında güclü əlaqəni araşdırdıq. DORMANSİYYƏ İLƏ ƏLAQƏLİ MADS-BOX 5 (PavDAM5) lokuslar və onun ifadə nümunəsi. Bu protokol ağac qönçələrində, xüsusən onun inkişafı və ətraf mühitə reaksiyası zamanı xromatinin və transkriptomik dinamikanın təhlilinə imkan verəcək.


İnsan hüceyrə dövrünün transkripsiya mənzərəsi

Hüceyrə dövrü boyunca sabit vəziyyətli gen ifadəsi geniş şəkildə tədqiq edilmişdir. Bununla birlikdə, transkripsiya gen tənzimlənməsi və müxtəlif hüceyrə dövrünün mərhələlərində histon modifikasiyasının dinamikası əsasən məlum deyil. Qlobal nüvə ardıcıllığı (GRO-seq), RNT ardıcıllığı (RNA-seq) və histon modifikasiyası Çip ardıcıllığının (ChIP-seq) birləşməsini tətbiq etməklə biz G0/G1, G1-də hərtərəfli transkripsiya mənzərəsini təsvir etdik. Döş xərçəngi MCF-7 hüceyrələrinin / S və M fazaları. Əhəmiyyətli odur ki, GRO-seq və RNT-seq analizi hüceyrə dövrü ilə tənzimlənən müxtəlif genləri müəyyən etdi, bu da hüceyrə dövrü ərzində transkripsiya və sabit vəziyyət ifadəsi arasında gecikmə olduğunu göstərir. Maraqlıdır ki, biz erkən M fazasında aktiv şəkildə transkripsiya edilmiş genləri müəyyən etdik ki, onların uzunluğu daha uzun və ifadəsi aşağıdır və aktiv histon 3 lizin 4 metilasiyası (H3K4me2) və histon 3 lizin 27 asetilasiyası (H3K27ac) modifikasiyalarında qlobal artımla müşayiət olunur. Bundan əlavə, diferensial aktiv transkripsiya ilə güclü əlaqəli olan, lakin hüceyrə dövrü boyunca sabit ifadə səviyyələri ilə olmayan 2,440 hüceyrə dövrü ilə tənzimlənən gücləndirici RNT (eRNA) müəyyən etdik. Dinamik eRNA-ların motiv təhlili G1/S keçidinin əsas tənzimləyicisi kimi Kruppelə bənzər amil 4-ü (KLF4) proqnozlaşdırdı və bu identifikasiya eksperimental olaraq təsdiqləndi. Birgə götürdükdə, bizim birləşmiş analizimiz insan hüceyrə dövrünün transkripsiya və histon modifikasiya profilini xarakterizə etdi və hüceyrə dövrü boyunca dinamik transkripsiya imzalarını müəyyənləşdirdi.

Açar sözlər: GRO-seq hüceyrə dövrü epigenetikası yaranan RNT transkripsiya tənzimlənməsi.

Maraqların toqquşması bəyanatı

Müəlliflər maraqların toqquşması olmadığını bəyan edirlər.

Rəqəmlər

GRO-seq və RNT-seq fərqli…

GRO-seq və RNT-seq fərqli hüceyrə dövrü ilə tənzimlənən genləri müəyyən edir. ( A ) Transkripsiyanın təsviri...

Erkən M-də aktiv transkripsiya ...

Erkən M fazasında aktiv transkripsiya. ( A ) Diferensial transkripsiya edilənlərin qruplaşdırılması…

H3K4me2-də qlobal artım və…

Erkən M fazasında H3K4me2 və H3K27ac siqnallarında qlobal artım. ( A…

Hüceyrə dövrü ilə tənzimlənən eRNA-ların müəyyən edilməsi. (…

Hüceyrə dövrü ilə tənzimlənən eRNA-ların müəyyən edilməsi. ( A ) Hüceyrə dövrü mərhələsinə xas eRNA-ların identifikasiyası üçün iş axını.

KLF4 eRNA-ları tənzimləyir və…

KLF4 G1/S keçidini idarə etmək üçün eRNA-ları və hədəf genləri tənzimləyir. ( A )…


Materiallar və metodlar

Johns Hopkins Universitetinin ilkin nümunələr kohortu

İlkin şiş toxuması nümunələri əvvəllər təsvir edildiyi kimi HPV ilə əlaqəli orofaringeal skuamöz hüceyrəli karsinoması olan 47 xəstənin kohortundan əldə edilmişdir (13). Müqayisə üçün, uvulopalatopharingoplasty (UPPP) cərrahi nümunələrindən sağlam orofarenksin selikli qişası xərçəngdən təsirlənməmiş 25 nəzarətdən əldə edilmişdir (13). Bütün toxuma nümunələri bütün subyektlərdən məlumatlı yazılı razılıq alındıqdan sonra təsdiq edilmiş İnstitusional Nəzarət Şurasının (IRB) protokolu (NA_00036235) əsasında Johns Hopkins (JHU) Toxuma Özündən toplanmışdır. Bu protokol həm də PDX modelinin inkişafı üçün şiş toxumasının istifadəsinə icazə verdi. Bu tədqiqat ABŞ Səhiyyə və İnsan Xidmətləri Departamentinin insan subyektlərinin mühafizəsi siyasətinə uyğun olaraq azadlığa layiq görüldü [45 CFR 46.101(b)] (IRB tədqiqat nömrəsi NA_00036235). Əlavə təfərrüatlar Əlavə Materiallarda və Metodlarda verilmişdir.

Hüceyrə xətləri

İnsan HPV + HNSCC hüceyrə xətləri UM-SCC-047 və UPCI-SCC-090 müvafiq olaraq Dr. Thomas Carey (Michigan Universiteti, Ann Arbor, MI) və Dr. Susanne Gollin (Pittsburgh Universiteti, Pittsburgh, PA) tərəfindən təmin edilmişdir. . Əlavə təfərrüatlar Əlavə Materiallarda və Metodlarda verilmişdir.

HPV aşkarlanması

Bütün nümunələrimizdə HPV statusunu təsdiqləmək üçün dörd müstəqil metodologiyadan istifadə edilmişdir: yerində HR-HPV üçün hibridləşdirmə, p16 üçün ICH boyanması, HPV DNT üçün qRT-PCR aşkarlanması və HPV ifadəsinin RNT-Seq əsaslı aşkarlanması. Əlavə təfərrüatlar Əlavə Materiallarda və Metodlarda verilmişdir.

ChIP-Seq analizi üçün nümunələrin seçilməsi

Johns Hopkins Universitetinin (JHU) birincili şişlər kohortundan (13) iki HPV + OPSCC nümunəsi referanslarda təsvir olunan ksenoqrastlaşdırma prosedurlarından istifadə etməklə birinci nəsil (F1) PDX modellərinin, PDX1 və PDX2-nin hazırlanması üçün istifadə edilmişdir. ChIP-Seq analizi üçün 6 və 15. Bu PDX-lər üçün RNT-Seq məlumatları daha əvvəl təsvir edilən metodlardan və normallaşdırma prosedurlarından istifadə etməklə toplanmışdır (13). PDX modellərinin onların əldə edildiyi şiş nümunələrinə bənzədiyini təsdiqləmək üçün biz RNT-Seq geninin ifadə profilini onun müvafiq valideyn toxumasının profili ilə müqayisə etdik. Pearson korrelyasiya əmsalları PDX1 üçün 0,83 və PDX2 üçün 0,9 idi və hər ikisi P dəyərlər 10 −16-dan aşağı idi. Bu tapıntı HNSCC PDX nümunələrində yüksək məhsuldarlıq profillərinin digər şiş nümunələri və ya hüceyrə xətlərinə nisbətən onların ana şiş toxumasına daha çox bənzədiyinə dair əvvəlki müşahidələrimizə uyğun idi (6). Biz həmçinin 2 HPV + HNSCC hüceyrə xəttində (UM-SCC-047 və UPCI-SCC-090) və iki UPPP nümunəsində (UPPP1 və UPPP2) ChIP-Seq analizi apardıq, burada hər iki UPPP nümunəsi eyni JHU kohortundan idi (13) . UPPP sağlam fərdlərdə orofaringeal sahədə həyata keçirilən yeganə cərrahi prosedurdur ki, bu da HNSCC-nin əvvəlki genomik tədqiqatlarına uyğun olaraq xərçəng olmayan xəstələrdən orofaringeal toxumaların nəzarət kimi toplanmasına imkan verir (16-18). Həmçinin, burada araşdırma üçün seçilmiş UPPP nümunələri ChIP-Seq analizi üçün seçilmiş HPV + HNSCC nümunələri ilə oxşar cins, irq, etnik mənsubiyyət, siqaret və içki statusuna malik idi (Əlavə Cədvəl S1). Şişlərin və nəzarət vasitələrinin bu uyğunluğu, xromatin strukturuna toxumanın spesifik təsirindən asılı olmayaraq, xromatin strukturunda şişə xas fərqlər haqqında nəticə çıxarmağa imkan verdi.

ChIP-Seq analizində istifadə edilən histon işarələri

ChIP-Seq analizi üçün H3K4me3, H3K9ac, H3K9me3 və H3K27ac histon modifikasiyaları seçilmişdir. H3K4me3, H3K9ac və H3K27ac gen ifadəsinin tənzimlənməsində güclü rol oynadıqları üçün seçilmişdir (19). H3K9me3 repressiv histon işarəsi mənfi nəzarət kimi seçilmişdir.

Nümunələrin mühafizəsi

Hüceyrələr 80% birləşməyə qədər böyüdü. Hər bir immunoprecipitation (IP) preparatı 4 × 10 6 hüceyrədən ibarət idi. Hüceyrə nömrəsi Cellometer Auto T4 (Nexcelom Bioscience) tərəfindən təsdiq edilmişdir. Mədəniyyətdən canlı hüceyrələr birbaşa ChIP təcrübələrinə aparıldı. Toxuma nümunələrini yığarkən, nümunədən yağ və nekrotik material kimi arzuolunmaz material çıxarıldı. Sonra toxuma daha sonra emal üçün maye azotda donduruldu. Optimal xromatin məhsuldarlığı və ChIP nəticələri üçün biz həyata keçiriləcək hər bir immunoprecipitation üçün 25 mq toxuma istifadə etdik. Dondurulmuş toxuma buz üzərində əriməyə buraxıldı və kütlə çəki ilə müəyyən edildi.

Protein-DNT çarpaz əlaqəsi

ChIP-DNT mikrokok nükleaz və sonikasiya mərhələlərində nümunəyə xüsusi düzəlişlər ilə istehsalçının protokoluna əsasən, bu yaxınlarda hazırlanmış SimpleChIP Enzimatik Xromatin IP Kit #9005 (Hüceyrə Siqnal Texnologiyası) istifadə edilməklə hazırlanmışdır. PBS göstərildiyi yerdə Quality Biological Inc.-dən 10× PBS pH 7.4 istifadə edilmişdir.

MNase/Sonication

Nümunələr həm mikrokokal nukleaz, həm də sonikasiya ilə həzm edilmişdir. Bu proses əlavə olaraq optimallaşdırıldı və sonra DNT-nin genomda vahid kəsilməsini təmin etmək üçün gel elektroforezi aparıldı. Əlavə təfərrüatlar Əlavə Materiallar və Metodlarda verilmişdir.

ChIP tətbiqi (Cell Signaling Technology) üçün təsdiqlənmiş müstəsna performans (XP) mAbs ilə IP addımı üçün bərabər miqdarda xromatin istifadə edilmişdir. Dovşan mAb-ları, geniş çeşidli kommersiya mAb-larında qiymətləndirilmiş optimallaşdırılmış konsentrasiyaya əsaslanaraq xüsusi seyreltmə ilə əlavə edilmişdir. H3K4me3 (9751), H3K9ac (9649), H9K9me3 (13969) antikorları üçün 1:50 seyreltmə və H3K27ac (8173) antikoru üçün 1:100 seyreltmə fərdi histon modifikasiyası ilə bağlanmış DNT seqmentlərini təcrid etmək üçün istifadə edilmişdir. Müsbət nəzarət kimi 1:50 seyreltilmiş ümumi H3 (4620) antikorundan və mənfi nəzarət kimi 1:250 nisbətində seyreltilmiş normal dovşan IgG (2729) istifadə etdik. Elüsyon zamanı 3527-5 inkubator çalkalayıcısından (Lab-Line) istifadə edilmişdir. ChIP-DNT təmizləndi və ChIP dəsti protokoluna uyğun olaraq ölçüldü. Hər bir nümunə üçün eyni xromatinin 1/50 hissəsi (2%) (PDX1, PDX2, UPPP1, UPPP2, UM-SCC-047, UPCI-SCC-090) antikor zənginləşdirmə mərhələlərini atlayaraq DNT çıxarılması üçün istifadə edildi və daha sonra qRT-PCR və giriş nəzarəti kimi ardıcıllıq üçün istifadə olunur.

Kəmiyyət real vaxt PCR

ChIP-DNT istehsalçının tövsiyələrinə uyğun olaraq TaqMan 7900HT Fast Real-Time PCR Sistemi (Tətbiq olunan Biosistemlər) istifadə edərək qRT-PCR-dən keçdi. Johns Hopkins laboratoriya standartı 10 × PCR Bufer (20), dNTPs (Biolin), FAM (Thermo Fisher Scientific) istifadə etdik. Astarlar və problar promotor bölgəsində dizayn edilmiş aktiv şəkildə ifadə edilir GAPDHRPL10 genlər və 3' sonu transkripsiya ilə basdırılır ZNF333 gen (ətraflı məlumat üçün Əlavə Cədvəl S2-ə baxın. 19). Hər bir nümunə üç nüsxədə təhlil edildi və 95°C-də 10 dəqiqəlik bir dövrə və 15 saniyəlik 95°C/60 saniyəlik 60°C-də 50 dövrə məruz qaldı. Fərdi nümunələrdə müxtəlif histonların nisbi qat zənginləşdirilməsi 2 −ΔΔ istifadə edərək, 2%-lik giriş nümunəsinə nisbətən üç nüsxədə ölçüldü. C t üsul (21).

ChIP-DNT tam genom ardıcıllığı və normallaşdırılması

Fərdi nümunə/antikor və onların giriş nəzarətləri üçün ChIP-DNT istehsalçının tövsiyə etdiyi protokola (NEB) uyğun olaraq SOLiD üçün NEBNext DNT Library Prep Set istifadə edərək, 5′ fosfat qrupları olmayan SOLiD P1 və P2 sıralama adapterlərinə sonikləşdirilib, son təmir edilib və bağlanıb. ). Kitabxanalar daha sonra Platinum Taq ilə nick-tərcümə edildi. ChIP-DNT, Cons Hopkins Universitetinin Eksperimental və Hesablama Genomikası nüvəsində təxminən 45.000.000 × hədəf ardıcıllığı əhatə dairəsi və 150 ​​bp cütləşmiş oxunuşlarla ardıcıllaşdırıldı. Illumina CASAVA 1.8.2 standart parametrlərdən istifadə edərək BCL fayllarını FASTQ fayllarına çevirmək üçün istifadə edilmişdir (22). Bowtie 2.2.1 standart parametrlərdən istifadə edərək hg19 insan istinad genomuna qoşalanmış oxunuşların xəritəsini çıxarmaq üçün istifadə edilmişdir və samtools 0.1.19 SAM fayllarını çevirmək, çeşidləmək və indeksləşdirmək üçün istifadə edilmişdir (23). Hesablama funksionallığı IGVTools paketi standart parametrlərdən istifadə edərək kirəmitli məlumat faylı yaratmaq üçün istifadə edilmişdir. MACS (ChIP-Seq alqoritminin Model əsaslı Analizi, versiya 1.4.2) nəzarət kimi həmin nümunədə daxil olan DNT-dən istifadə edərək hər bir işarə və hər bir nümunə üçün ChIP-Seq zirvələri adlanır (24). ChIP-Seq zirvələri, əgər MACS pik modelləşdirilərsə, əhəmiyyətli adlandırıldı P dəyərlər 10 −6 həddən aşağıdır və bu zirvələr genomik intervallar kimi təmsil olunub. The cisBu genomik intervalları genlərlə əlaqələndirmək üçün tənzimləyici element annotasiya sistemindən (CEAS) istifadə edilmişdir (25).

ChIP-Seq məlumatlarının DiffBind təhlili

Müxtəlif nümunələr və müxtəlif modifikasiyalar üçün ChIP-Seq zirvələrini müqayisə etmək üçün DiffBind R/Bioconductor paketindən istifadə etdik (26). Altı nümunə üçün MACS yataq faylları və onların H3K4me3, H3K9ac, H3K27ac və H3K9me3 histon işarələri Əlavə S1 faylındakı koddan istifadə edərək giriş kimi istifadə edilmişdir. DiffBind-dən yalnız bütün mümkün ChIP-Seq siqnal cütləri (cəmi 24 × 24) arasında cüt-cüt genom miqyaslı korrelyasiya əmsallarını hesablamaq üçün istifadə etdik.

Bütün genomun ChIP-Seq zənginləşdirilməsinin genomik bölgələr üzərində vizuallaşdırılması

MACS zəngləri ilə hesablanan qat zənginləşdirmə vizuallaşdırma üçün deepTools-a (27) daxil edilmişdir. DeepTools istilik xəritəsi funksiyaları bütün məlum genlər üçün transkripsiya başlanğıc yerləri (TSS) ətrafında ChIP-Seq qat zənginləşdirilməsini −1,5–+1,5 kb bölgəni vizuallaşdırmaq üçün istifadə edilmişdir. TSS ətrafında eyni −1,5–+1,5 kb regionda ChIP-Seq zənginləşdirilməsi üçün orta profillər də deepTools-da profilləşdirmə aləti ilə yaradılıb.

ChIP-Seq zirvələri ilə əlaqəli xəstəliyə spesifik genlərin müəyyən edilməsi

Hər bir histon işarəsi üçün ChIP-Seq məlumatlarından xəstəliyə xas əhatə dairəsi olan genlərin siyahısını axtardıq. Bu genləri əldə etmək üçün biz hər bir nümunədə ChIP-Seq məlumatları üçün CEAS çıxış gen siyahılarını müqayisə etdik. Xüsusilə, hər histon işarəsi üçün şiş və ya normal nümunələrə xas olan 5' UTR bölgələrində ChIP-Seq əhatə dairəsi olan genlərin siyahısını müəyyən etmək üçün müəyyən fərqlər etdik (Əlavə Cədvəllər S3-S6). Normal spesifik gen siyahısını əldə etmək üçün dəstləri hər iki UPPP nümunəsi tərəfindən paylaşılan və heç bir xərçəng hüceyrə xətti və ya PDX nümunəsində olmayan genlərlə məhdudlaşdırdıq. Şiş spesifik gen siyahılarını əldə etmək üçün dəstləri hər iki xərçəng hüceyrə xətti və ya hər iki PDX tərəfindən paylaşılan və heç bir UPPP nümunəsində olmayan genlərlə məhdudlaşdırdıq. Biz həm PDX-lərdə, həm də hüceyrə xətlərində şişə-spesifik genlərin siyahısı və yalnız PDX-lərdə olan şişə xas genlərin siyahısı üçün əlavə qeydlər yaratdıq. Bu gen siyahıları Əlavə Fayl S2-dəki koddan istifadə etməklə yaradılıb və xəstəliyə xas genlərin funksional nəticələrini müəyyən etmək üçün RNT-Seq məlumatlarının təhlili üçün irəli sürülüb.

Gen dəsti analizi

MSigDB (28) "gen dəstlərini araşdırmaq" funksiyası hər bir şiş və normal spesifik H3K4me3 və H3K27ac histon işarəsi üçün xəstəliyə xas genlərin analizini həyata keçirdi (Əlavə Cədvəllər S3 və S4). Bu proqramda gen dəsti təhlili hipergeometrik testdən istifadə edərək Hallmark gen dəstləri ilə aparılmışdır (Əlavə Cədvəllər S7-S10).

H3K27ac ilə zənginləşdirilmiş genlərin digər tanınmış HPV + HNSCC gen dəstləri ilə korrelyasiyası

R/Bioconductor paketi GeneOverlap, H3K27ac üçün xəstəliyə xas gen dəstini əlaqələndirmək üçün istifadə edilmişdir (29, 30). Ref.dən HPV + HNSCC alt tipləri üçün gen təsnifatının davamlı çəkiləri ilə xəstəliyə xas H3K27ac gen dəstinin zənginləşdirilməsini qiymətləndirmək üçün birtərəfli Wilcoxon gen dəsti testi əlavə edildi. 29.

RNT-Seq normallaşdırılması və təhlili

RNT-Seq məlumatlarından gen səviyyəsinin sayları ref.-də təsvir olunduğu kimi Xərçəng Genom Atlası (TCGA refer. 3) üçün RSEM V2 boru kəmərindən əldə edilmişdir. 13. Xəstəliyə xüsusi genlər üçün RNT-Seq məlumatlarının istilik xəritələri (Əlavə Cədvəllər S3-S6-da verilmişdir) hər bir histon işarəsi üçün yaradılmışdır. İstilik xəritələrində nəzarətsiz iyerarxik qruplaşma Kendall-Tau fərqlilik məsafələrindən istifadə etdi. Əvvəlki iş göstərdi ki, bu məsafə gen ifadə profillərinin (14) nisbi dəyişkənliyini kəmiyyətləndirdi və bu, bu işdə açıq xromatin bölgələri tərəfindən gen ifadəsinin disregulyasiyasını kəmiyyətcə müəyyən etməyə imkan verdi.

Toxuma spesifik ChIP-Seq zirvələrində RNT-Seq-in tənzimlənməməsi üçün ifadə dəyişkənliyinin təhlili bioinformatikası

Xromatin strukturundakı dəyişikliklərin 5' UTR bölgələrində ChIP-Seq əhatəsi ilə genlərdə ifadə dəyişikliklərinə imkan verdiyini fərz etdik. Bununla belə, gen ifadəsini dəyişdirmək üçün digər epigenetik dəyişikliklərə əsaslanan tənzimləmə mexanizmləri (məsələn, transkripsiya faktorunun bağlanması, surət sayının gücləndirilməsi və s.) hələ də tələb olunurdu. Nəticə etibarilə, 5′ UTR-də şişə xas ChIP-Seq əhatəsi olan genlərdəki ifadə dəyişiklikləri, normal spesifik ChIP-Seq əhatəsi olan genlərdəki ifadə dəyişikliklərindən daha dəyişkən olacaqdır. Bu fərziyyəyə uyğun olaraq, U-nəzəriyyə statistikasından (14) istifadə edərək, şiş və normal nümunələrdə gen ifadə profillərinin nisbi fərqlilik ölçüsünü (məsələn, variasiya dərəcəsi proksi) kəmiyyətini müəyyən etmək üçün EVA gen dəsti disregulyasiya alqoritmindən istifadə etdik. R/Bioconductor paketində GSReg-də EVA alqoritmini xəstəliyə xas xromatin modifikasiyaları ilə müəyyən edilmiş gen dəstləri üçün RNT-Seq məlumatlarına tətbiq etdik (Əlavə Fayl S2).

MapSplice tərəfindən HPV inteqrasiyasının aşkarlanması

Aşkarlama RNT-Seq məlumatlarında birləşmələri müəyyən etmək seçimi ilə işləyən MapSplice (31) ilə həyata keçirilmişdir. Xəritəçəkiləcək oxunuşlar üçün istinad insan və HPV16 genomundan birgə hazırlanmış kimera idi. Bu şəkildə, bir insan xromosomunun və HPV genomunun birləşməsi kimi bir viral inteqrasiya sahəsi göründü. Ən azı üç uyğunsuz cüt (burada qoşalaşmış ucun oxunuşunun bir ucu viral genomla xəritələnmiş və onun həyat yoldaşı cütü insan genomu ilə xəritələnmiş) və bir bölünmüş oxu (bir ucu olan) varsa, viral genomu inteqrasiya olunmuş hesab etdik. oxunan qoşalaşmış uc insan-viral birləşməni əhatə edirdi və onun mate cütü ya insan, ya da HPV genomuna uyğunlaşdırıldı). Son təhlilimizə görə, bu yeddi ümumi oxunuş eyni lokusda inteqrasiyanı dəstəkləyir (32). Əlavə təfərrüatlar Əlavə Materiallarda və Metodlarda verilmişdir.

Transkripsiya gücləndiricilərinin müəyyən edilməsi

H3K27ac üçün MACS zirvələri hər bir nümunə üçün gücləndirici çağırışlar etmək üçün Ranking Of Super Enhancers (ROSE) analiz proqramına (33) əlavə edildi. Biz bu alqoritmi MACS-dən H3K27ac zirvələrini birləşdirmək üçün tətbiq etdik və nəticədə birləşmiş zirvələri gücləndiricilər kimi sıraladıq.


Materiallar və metodlar

Hüceyrə mədəniyyəti və hüceyrə dövrü sinxronizasiyası

U2OS hüceyrələri DMEM (Gibco) və 10% FBS-də becərildi. RPE1 hüceyrələri DMEM-F12 (Gibco) və 10% FBS-də becərildi. Hüceyrələr 37°C və 5% CO-da inkubasiya edilmişdir2. Hüceyrələr timidin və nokodazol müalicələrindən istifadə edərək sinxronlaşdırıldı. Mitotik hüceyrələr mitotik sarsıntı ilə toplandı. A-485 (10 μM Tocris) H3K27ac səviyyələrini maneə törətmək üçün istifadə edilmişdir. Ətraflı təsvir üçün Əlavə Materiala baxın.

İmmunofluoressensiya

Hüceyrələr şüşə örtüklərdə böyüdüldü və otaq temperaturunda 5 dəqiqə ərzində PBS-də 4% paraformaldehid ilə sabitləndi. Sabit hüceyrələr 5 dəqiqə ərzində 0,5% Triton X-100 olan soyuq PBS ilə permeabilized edilmişdir. Hüceyrələr otaq temperaturunda 1 saat ərzində PBS-də 1% BSA ilə bloklandı və 4°C-də gecə ərzində bloklama tamponunda birincil antikorda inkubasiya edildi, ardınca otaq temperaturunda 1 saat ərzində ikincil antikor. Hüceyrələr daha sonra PBS-də 1 μg/mL Hoechst 33342 (Molecular Probes H-1399) ilə qısa müddətə boyandı və VectaShield (Vektor Laboratoriyaları) cihazına quraşdırıldı. Şəkillər Zeiss LSM710 konfokal mikroskopunda əldə edilib. Şəkillər təhlil edilərək Photoshop proqramında təqdimata hazırlanıb.

Nüvə və sitoplazmatik fraksiyaların izolyasiyası

Hüceyrələr hipotonik tamponda (pH 8-də 5 mM Borular, 85 mM KCl, 0,5% NP-40, proteaz inhibitoru) buz üzərində 10 dəqiqə ərzində yenidən dayandırıldı, ardınca 500 ° C-də sentrifuqasiya edildi.g 4°C-də 10 dəqiqə. Tərkibində sitoplazmik fraksiya olan supernatant köçürüldü və saxlanıldı. Qranul lizis tamponunda (pH 7.9-da 50 mM Hepes, 5 mM MgCl) yenidən dayandırıldı.2, 0.2% Triton X-100, 20% qliserin, 300 mM NaCl, proteaz inhibitoru) buz üzərində 30 dəqiqə, sonra 12.000-də sentrifuqasiyag 4°C-də 20 dəqiqə. Supernatant nüvə hissəsi kimi toplandı.

Histon izolyasiyası və Western blotting

Histonun çıxarılması üçün protokol əvvəlki işdən uyğunlaşdırılmışdır (Shechter et al. 2007). Qısaca olaraq, nüvələrin təcrid olunmasından sonra həll olunan histonlar 0,2 M HCl ilə ekstraksiya edildi, ardınca TCA/aseton çöküntüsü. Western blot analizi üçün protein nümunələri SDS-PAGE gellərində həll edildi və PVDF membranlarına (Millipore) köçürüldü. Membranlar TBST-də 5% süd (pH 8.0-da 0.25% Tween 20, 20 mM Tris, 137 mM NaCl) ilə bloklanmış və gecə ərzində 4°C-də birincil antikorla inkubasiya edilmişdir. TBST-də üç dəfə 5 dəqiqəlik yuyulmadan sonra HRP ilə birləşdirilmiş ikincil antikor otaq temperaturunda 1 saat əlavə edildi. Membranlar SuperSignal West Pico və ya Femto (Thermo Fisher Scientific) reagenti ilə vizuallaşdırılıb.

Antikorlar

Göstərilən kommersiya mənbələrindən aşağıdakı antikorlar alınıb: anti-H3K4me3 (Abcam ab8580), anti-H3K4me1 (Abcam ab8895), anti-H3K27ac (Abcam ab4729), anti-CTCF (Active Motif 61311), anti-spike ( Aktiv Motif 61686), anti-α-Tubulin (Sigma T5168), anti-Histon H3 (Cell Signaling 4499) və anti-H3S10p (Cell Signaling 3377).

ChIP-seq

Hüceyrələr (5 × 10 6) 10 dəqiqə ərzində 1% formaldehid ilə çarpaz bağlandı və ChIP-seq daha əvvəl təsvir edildiyi kimi edildi (Toyama et al. 2019). Spike-in satıcı protokollarına (Active Motif) uyğun olaraq həyata keçirilmişdir. Qısaca olaraq, 50 ng sünbüllü xromatin (Aktiv Motif 53083) 5 mkq anti-H3K4me3, anti-H3K4me1, anti-H3K4me1, anti-H3K4me1, 2 μg spike-in antikoru ilə inkubasiya etmək üçün 25 μg U2OS və ya RPE1 xromatinə əlavə edildi. , və ya anti-CTCF antikorları. DNT kitabxanaları Illumina platformaları (Kapa Biosystems) üçün Kapa Hyper hazırlıq dəstindən istifadə etməklə yaradılıb. Kitabxanalar NextSeq 500 sistemində (Illumina) ardıcıllıqla tərtib edilmişdir. Məlumatların təhlili, o cümlədən uyğunlaşdırma, normallaşdırma, pik çağırış, cis-RE-nin müəyyənləşdirilməsi, motiv təhlili və Pearson korrelyasiya əmsalı testi.

Spike-in nəzarət ardıcıllığı və AB-RNT-seq

Biotinləşdirilmiş sünbül nəzarətləri və AB-RNT-seq üçün nümunələr əvvəllər təsvir edildiyi kimi hazırlanmışdır (Palozola et al. 2017). Qısaca olaraq, U2OS hüceyrələri 37°C-də 35 dəqiqə ərzində 0,5 mM AB ilə nəbzlə etiketlənmişdir. Ümumi RNT Trizol (Ambion) istifadə edərək yığıldı və miRNeasy (Qiagen) istifadə edərək təmizləndi. Click-iT yeni yaranan RNT tutma dəsti (Invitrogen) istifadə edərək biotini AB etiketli RNT ilə birləşdirmək üçün klik reaksiyası həyata keçirilib. Hər biotinləşdirilmiş nümunənin 1,5 mq-a iki biotinləşdirilmiş sünbül nəzarət RNT əlavə edildi (0,36 ng nəzarət №1 və 0,036 ng nəzarət №2). Biotin-AB-RNT-ləri, o cümlədən sünbüllü nəzarətlər, streptavidinlə örtülmüş maqnit muncuqlarla aşağı çəkildi. Biotin-RNT sıçrayış nəzarətlərinin təsdiqi üçün SuperScript VILO cDNA sintez dəsti (Invitrogen) və ardınca qPCR istifadə edərək cDNA yaradıldı. Ardıcıllıq üçün Ovation insan FFPE RNA-seq multipleks sistemindən istifadə edərək cDNT kitabxanaları yaradıldı. Multipleksləşdirilmiş cüt uc ardıcıllığı NextSeq 500 alətində (Illumina) həyata keçirilmişdir. Uyğunlaşdırma, normallaşdırma, gen ifadəsinin iyerarxiyasının müəyyən edilməsi və GO zənginləşdirmə təhlili daxil olmaqla, məlumatların təhlili haqqında ətraflı məlumat üçün Əlavə Materiala baxın.

Hi-C əvvəllər təsvir edildiyi kimi in situ metodundan istifadə etməklə həyata keçirilmişdir (Rao et al. 2014). Qısaca, U2OS hüceyrələri (2 × 10 6) formaldehidlə çarpaz bağlandı. Xromatin MboI (NEB) məhdudlaşdırıcı fermenti ilə həzm olundu, biotin-ATP (Life Technologies) ilə biotinləşdirildi və sonra T4 DNT liqaza (NEB) ilə bağlandı. DNT təmizləndi və Covaris LE220 aləti (Covaris) ilə kəsildi. Biotinləşdirilmiş DNT qarşılıqlı əlaqələri Dynabeads MyOne Streptavin T1 Beads (Life Technologies) ilə aşağı çəkildi və NovaSeq 6000 ardıcıllıq sistemində (Illumina) ardıcıllıqla sıralandı. Məlumatların təhlili haqqında ətraflı məlumat üçün Əlavə Materiala baxın.

Qoşulma nömrələri

Bu araşdırmada bildirilmiş ChIP-seq, EU-RNA-seq və Hi-C məlumatları üçün Gen İfadəsi Omnibus qoşulma nömrəsi GSE141139-dur.


Mücərrəd

Gələcək nəsil xromatin immunopresipitasiyası və mükafat beyin bölgələrinin RNT ardıcıllığına əsaslanan cəlbedici ədəbiyyat toplusu epigenetik mənzərənin tənzimlənməsinin, ehtimal ki, xroniki narkomaniya və asılılığın əsasını təşkil etdiyini göstərir. Nöropsikiyatrik xəstəliyin əsasını təşkil edən müvafiq tənzimləyici transkripsiya mexanizmlərini aşkar etmək üçün yüksək innovativ hesablama strategiyalarının hazırlanması indi çox vacibdir. Siçanlarda kokainə məruz qalma ilə əlaqəli olan alternativ birləşmənin xromatin tənzimlənməsini təhlil etdik. Son ədəbiyyatda xromatinlə tənzimlənən alternativ birləşmə təsvir edilmişdir, bu da dərmanın yaratdığı neyroepigenetik remodeling üçün yeni bir funksiya təklif edir. Bununla belə, xüsusi histon modifikasiyaları və alternativ birləşmə arasında genom miqyaslı əlaqənin dərəcəsi araşdırılmamış olaraq qalır. Bunu həll etmək üçün, beyin mükafatı bölgəsi olan nüvə accumbens (NAc) bölgəsində alternativ birləşdirmə və histon posttranslational modifikasiyaları arasındakı əlaqəni modelləşdirmək üçün yeni hesablama yanaşmaları hazırladıq. ChIP-Seq və RNT-Seq məlumatlarını birləşdirmək üçün klassik statistik metodlardan və maşın öyrənməsindən istifadə edərək, xüsusi histon modifikasiyalarının diferensial birləşdirmənin müxtəlif aspektləri ilə güclü şəkildə əlaqəli olduğunu gördük. H3K36me3 və H3K4me1, beyin mükafatı toxumasında alternativ birləşmədə əhəmiyyətli rol oynadıqlarını göstərən splays ilə ən güclü əlaqəyə malikdir.


Metodlar

Bitki materialları

ChIP-seq təcrübələri aparıldı E. grandis TAG0014 klonu (Mondi Ağacının Təkmilləşdirilməsi Araşdırması, KwaMbonambi, Cənubi Afrika). KwaMbonambi, KwaZulu-Natal əyaləti, Cənubi Afrikada klonal sınaqda böyüyən yeddi yaşlı rametlərdən DSX qırıntıları 2012-ci ilin sentyabrında (erkən yazın) nümunə götürüldü. V5 və V11 adlı iki şəxsin DSX toxumasını ifşa etmək üçün qabıq döş hündürlüyündə soyulur. 1-2 mm ülgüclə yüngülcə və bərabər şəkildə sıyrıldı, artıq şirədən yumşaq bir şəkildə sıxıldı və dərhal maye azotda donduruldu. Nümunələr istifadə olunana qədər -80 ° C-də saxlanıldı.

Xromatinin fiksasiyası, izolyasiyası və sonikasiyası

Nüvələr Kaufmann təsvir etdiyi kimi təmizləndi və b. [44], dəyişikliklərlə. Dondurulmuş DSX toxuması model A 11 əsas analitik dəyirmanından (IKA, Almaniya) istifadə edilərək üyüdüldü, ardınca havan və havan istifadə edərək maye azotda incə üyüdüldü. Hər beş qram dondurulmuş, üyüdülmüş DSX toxuması 1% formaldehid, 1 mM EDTA və 1 mM fenilmetansülfonil flüorid (PMSF) ilə əlavə edilmiş 25 ml M1 tamponda 30 dəqiqə ərzində buz üzərində sabitlənmişdir. Fiksasiya buz üzərində 5 dəqiqə ərzində 1/10 həcmdə 1,25 M qlisinlə söndürüldü, sonra 50 ml-ə formaldehidsiz M1 tamponu əlavə edildi. Süspansiyon M1 buferi ilə isladılmış 60 μm neylon mesh vasitəsilə süzüldü, filtri ən azı 50 ml asqıya bir dəfə dəyişdirdi və yenidən ikiqat 60 μm neylon meshdən keçirdi. 1000 ×-də sentrifuqadan sonra g 20 dəqiqə (4°C) müddətində qranul 1 mM PMSF və Tam Proteaz İnhibitoru kokteyli (CPIC Roche) olan 25 ml buz kimi soyuq M2 tamponda yenidən dayandırıldı, 1000 × temperaturda sentrifuqa edildi. g 10 dəqiqə 4°C-də və 1 mM PMSF və CPIC ilə əlavə edilmiş 25 ml buz kimi soyuq M3 tamponunda yenidən suspenziya edilir. Eyni şəkildə 10 dəqiqə sentrifuqa edildikdən sonra nüvə pelleti yenidən süspanse edildi

1 mM PMSF və CPIC ehtiva edən 1,5 ml səs tamponu. Sonikasiya 1-ci qəbulda 10 s müddətində 20 impulslu Branson Sonifier 450 zond sonikatorundan istifadə edərək buz üzərində 1,5 ml boru üçün 250 μl xam xromatində həyata keçirildi və impulslar arasında buz üzərində >30 s dayandı. Nümunələr hər on dövrədə qarışdırılırdı. Sonikasiyadan sonra nümunələr 16000 ×-də iki dəfə sentrifuqa edilmişdir g (10 dəq, 4°C) və -80°C-də saxlanılır.

Mikrokok nukleazasının (S7) analizi

Dondurulmuş DSX toxuması (2 q) maye azotda incə toz halına gətirildi. Nüvələr yuxarıda təsvir edildiyi kimi, formaldehidin çarpaz bağlanması və səs tamponunun əlavə edilməsi istisna olmaqla, təcrid edilmişdir. Xam nüvə qranul 400 μg RNase A olan 350 μl nüvə həzm tamponunda [66] yenidən dayandırıldı. Nümunələr bərabər şəkildə dörd boruya bölündü və 0, 5, 10 və ya 20 U Nuclease S7 (Roche) ilə 37°C temperaturda inkubasiya edildi. 15 dəq. Hidroliz 5 mM EDTA ilə dayandırıldı. Nüvələr 0,5% SDS ilə parçalanmış və sentrifuqa edilmişdir (20,000 × g, 5 dəq) təmizləmək üçün. Həll olunan DNT Nucleospin PCR təmizləmə dəsti (Macherey-Nagel, Düren, Almaniya) istifadə edərək təmizləndi.

Protein çıxarılması və Western blot analizi

Nüvələr Kaufman üsulu ilə təmizləndi və b. [44], dəyişikliklərlə. DSX maye azotda üyüdüldü və 1 mM PMSF və 1 mM EDTA olan M1 tamponunda hər qram toxuma üçün 5 ml, 30 dəqiqə dayandırıldı. Süspansiyon 60 μm neylon mesh vasitəsilə iki dəfə süzüldü və 1000 ×-də qranullandı. g (20 dəq, 4°C). Qranul 1 mM PSMF və CPIC ilə əlavə edilmiş 5 ml M2 tamponda yenidən suspenziya edildi, yenidən qranullandı (1000 × g, 10 min, 4°C) and resuspended in 250 ul M3 buffer containing 1.7 M sucrose and CPIC. The suspension was overlaid on 1.5 ml 1.7 M sucrose in M3 buffer and centrifuged for 40 min at 16,000 × g (4°C). The pellet was resuspended in 1 ml M3 to wash, re-pelleted (12,000 × g, 5 min, 4°C) and the remaining pellet resuspended in 1 pellet volume of extraction buffer (10 mM sodium phosphate buffer pH 7.0, 150 mM NaCl, 0.1 mM EDTA, 5% glycerol, 10 mM β-mercaptoethanol, 0.1 mM PMSF, CPIC). The pellet was briefly sonicated with a Branson 450 sonicator (30s, 10% power output) and gently vortexed for 30 min at 4°C. Soluble protein in the supernatant from two rounds of centrifugation (16 000 × g, 10 min, 4°C) was quantified using the Qubit Protein Assay Kit (Invitrogen), subjected to denaturing electrophoresis on a 12% SDS-PAGE gel and transferred to a nitrocellulose membrane using the semidry method. Blots were blocked with 5% nonfat milk, probed with 1:2000 dilution of anti-H3K4me3 antibody (Millipore #07-473) overnight (4°C) and incubated with horseradish peroxidase-conjugated goat anti-rabbit secondary antibody (Cappel Laboratories Inc., PA). Blots were treated with SuperSignal West Pico Chemiluminescent substrate (Thermo Scientific, Rockford, IL) and developed with CL-XPosure film (Thermo Scientific).

Chromatin immunoprecipitation, DNA amplification and sequencing

A minimum of 3 μg E. grandis DSX chromatin was incubated with 1 μg anti-H3K4me3 antibody (Millipore #07-473), or 1 μg naïve mouse IgG2a (sc-3878, Santa Cruz Biotechnology, CA) as negative control, overnight at 4°C. Chromatin immunoprecipitation was performed as described by Adli & Bernstein [45] using 40 μl protein A-agarose beads, 25% slurry (sc-2001, Santa Cruz Biotechnology, CA). After crosslink reversal and DNA purification, the ChIP DNA was quantified with the Qubit HS dsDNA kit (Invitrogen). A minimum of 1 ng ChIP or input DNA was amplified according to the protocol of Adli & Bernstein [45], with modifications. We replaced the use of Sequenase v.2.0 DNA polymerase (Affymetrix, CA) with Bsu DNA polymerase, large fragment (NEB, MA), and substituted the corresponding Sequenase reaction buffer with NEB Buffer 2. We used 2 U of Bsu DNA polymerase per pre-amplification cycle, extended the pre-amplification extension time to 20 min and used 32 pmol P1 primer. Both the pre-amplification and PCR reactions were supplemented with 50 ng/μl tRNA. We applied a generic ExoSAP cocktail by adding 0.5 U rAPID alkaline phosphatase (Roche Applied Science, Ltd) and 5 U E. coli Exonuclease I (NEB), incubating at 37°C for 30 min and heat-inactivating the enzymes at 80°C for 20 min. For the Phusion PCR reactions we used 4 ul 10 mM dNTPs and 0.5 ul Phusion DNA polymerase per 50 ul reaction. PCR extension time was reduced to 5 s. Amplified DNA was digested with BciVI to yield 3’ adenosine overhangs 20 ng template was ligated to Illumina primers for library preparation and DNA sequencing (Beijing Genome Institute, Hong Kong), generating 50 nt paired-end sequences.


ChIP-seq for histone modification not in agreement with RNA-seq for expression - Biology

Excuse me? A few days ago I read a paper "Histone modification levels are predictive for gene expression" (PNAS (2010), 107, 2926-2931). It proposed a linear model predicting gene expression levels from the combination of different histone modifications, such as H3K4me3, H3K27me3, etc. The predictor variables were of the form log(Nj+aj), where Nj representing the number of tags of modification j in each promoter region (4001bp surrounding TSS), and aj was a pseudocount to make the logarithm be defined when Nj was zero. The authors didn't refered to normalize Nj. But when I read another paper titled "Computational inference of mRNA stability from histone modification and transcriptome profiles" (Nucleic Acids Res (2012), 40(14):6414-23), which also involving a linear model, the authors used the normalized read coverage of histone modification as the predictor variable. These authors said "the read coverage of each histone modification in the 15 regions (read count per bp) was calculated and normalized according to the sequencing library size". The former paper didn't say normalization, but the latter one said to normalize. I'm wondering why there is such a difference and in what condition, a normalization should be performed.

Hope some one to give some help. Thank you so much!

My 2c: I mostly rely on edgeR which takes raw counts over regions of interest and uses normalisation factors as an offset in the model instead of adjusting the counts directly. Competing popular methods use the library size to adjust fragment counts, so the 'right' answer depends on the specific model and biological question.

If you want advice from more reputable statisticians working on these interesting and important issues, they are more likely found on (eg) the Bioconductor list or perhaps seqanswers than this Galaxy forum - so if you don't get a good answer here, perhaps try there.


Müzakirə

We have shown that the levels of histone modifications at a promoter proximal region are well correlated to the expression of genes. Other studies classified the promoters for each modification into groups (17, 26), e.g., modification X is present or absent. Discretization ought to have two beneficial effects, namely the reduction of noise and parameters. Although discretization is necessary in some modeling approaches to reduce the number of parameters, e.g., learning a Bayesian network (26), in our approach, it increases the number of parameters, because one has to choose at least one threshold for each modification in addition to the slopes in the linear regression model. If discretization is indeed beneficial for modeling gene expression, we expect that the results of a discrete model should be better than a corresponding continuous model. Thus, we compared full models incorporating either the levels directly (continuous model) or a binary classification of them (discrete model). Although the correlation is not significantly different (Fig. 2A and Fig. S5A), the mean squared error (MSE) increased from 1.54 for the continuous model to 1.71 for the discrete model. The same is true for the best three-modification continuous and discrete models. Here, the discrete model is only able to reproduce the general trend in expression values and thus has a higher MSE (MSE = 1.84 Fig. S5B) than the continuous model (MSE = 1.68, which is even lower than the MSE for the full discrete model Fig. S5C). We conclude that discretization has no beneficial effect on the prediction accuracy and argue that in our modeling framework discretization is not necessary and is even reducing the predictive power at the cost of increasing the number of parameters.

We demonstrated that only a few histone modifications are necessary to faithfully model gene expression. This finding can be understood if one assumes that the histone modifications belong to different groups, whose members are either involved in transcription or not. The modifications within the transcription-related groups provide almost the same information and our approach selects one representative modification. Alternatively, the selected histone modifications are involved in distinct steps during the transcription cycle. For example, they could recruit activities that are required to enable RNA pol II to progress from an initiating to an elongating state. In the light of the “Histone Code Hypothesis,” the latter idea is very attractive, but we would have much more confidence in supporting this idea if we were able to reproduce our results using an equally rich dataset in a preferentially independent cell type, which to our knowledge is currently not available.

We used three sets of promoters, namely all, LCPs, and HCPs to identify “important” modifications. Upon analyzing all promoters, we found that H2BK5ac, H3K27ac, H3K79me1, and H4K20me1 are overrepresented in models giving rise to the highest prediction accuracy in CD4+ T-cells. A recent study identified a common set of 17 modifications (mainly acetylations), referred to as the backbone. These modifications colocalize and their levels are well correlated (17). Genes with all of these backbone modifications present tend to be expressed, suggesting that either all or a subset of them are involved in transcription. Our analysis revealed only two of these modifications, H3K27ac and H2BK5ac, are important for modeling gene expression. This indicates that the remaining backbone modifications carry either redundant information or are less important for gene expression. Furthermore, the other two important modifications, H3K79me1 and H4K20me1, have been shown to be enriched in highly expressed genes, along with the modification backbone (17). This observation is in line with the idea that H3K79me1 and H4K20me1 are also involved in transcription. Thus, we conclude that our approach identified histone modifications which are likely to be key players in the transcriptional process.

We identified different sets of modifications important for modeling gene expression driven by LCPs or HCPs. In LCPs, we found that H3K4me3 and H3K79me1, while in HCPs H3K27ac and H4K20me1, were identified. These assignments can be reproduced using RNA-seq (27) instead of the microarray data, suggesting that a possible measurement bias due to the microarray technology is not a major factor. The prediction accuracy for modeling RNA-seq derived expression values is even higher (r = 0.81 Fig. S6A) than the one using microarray expression data (r = 0.77). The results of the overrepresentation analysis for all, HCPs, and LCPs are comparable between the RNA-seq and microarray-derived expression values. The only difference was that only H4K20me1, H3K27ac, and H2BK5ac, but not H3K79me1, are identified as being overrepresented in best scoring linear models for all promoters. However, when analyzing best scoring models for LCPs, H3K79me1 clearly comes up as overrepresented (Fig. S6BD).

The reason for the difference in the important histone modifications in LCPs and HCPs is unclear, but indicates that different regulatory mechanisms act on these two promoter types. A possible clue for the function of the selected modifications is provided by the localization analysis (Fig. 3C). H3K4me3, H3K27ac, and H2BK5ac have the highest levels at the promoter, with the highest peak around 100 base pairs downstream of the TSS. H3K79me1 is enriched along the gene body, and H4K20me1 shows two distinct patterns: a peak close to the promoter at a similar position to H3K4me3 and H3K27ac, and an enrichment across the gene body region. The localization of these histone modifications suggests that H3K27ac, H2BK5ac, H3K4me3, and H4K20me1 function during transcription initiation and/or promoter clearance, whereas H3K79me1 and H4K20me1 are involved in transcription elongation.

Although for H3K4me3 a function during transcription initiation has been proposed (e.g., ref. 14 and references therein), a similar function has not been established for H3K27ac. A possible action of H3K27ac might be to prevent the repressive trimethylation of the same residue, because H3K27ac and H3K27me3 are mutually exclusive. Alternatively, H3K27ac itself could be recognized by a protein complex required for transcription. H3K79me1 is almost absent at the TSS and its levels increase in the gene body, indicating that it is involved in transcription elongation, in line with previous observations (28, 29). The functions of H2BK5ac and H4K20me1 in general, and in particular during transcription, are not well understood.

Because we showed that histone modification levels are predictive of the gene expression levels in CD4+ T-cells, we further investigated whether this is a universal property which holds true for other cell types. We were able to successfully predict expression of genes in CD36+ and CD133+ cells, using histone modification data measured in these cells and model parameters trained on CD4+ data. Significantly, the prediction accuracy does not depend strongly on the level of change in expression in different cell types. Thus, our results establish the idea that the relationships between histone modification and gene expression are general. Furthermore, they underscore that the histone modifications and the transcriptional process are tightly connected to each other. We want to emphasize that our analysis as well as the data do not allow for deciding whether the histone modifications are cause or consequence of transcription, because the uncovered relationships are correlative in nature and therefore inherently undirected. However, our results imply that the histone modifications are very close to RNA pol II in the regulatory network controlling its activity. Whether they are upstream and/or downstream has to be elucidated in further experimental studies.

In summary, we have shown that the relationships between histone modification and transcription are well reproducible across different cell types. Furthermore, we singled out a small number of modifications, which together can account for a large portion of the expression variance. Whether these modifications play a crucial role during transcription, or whether they are representatives for groups of equally important modifications has to be clarified by further experimental studies. Regardless of which scenario turns out to be true, we can pinpoint a small number of modifications whose levels at the promoter can be used to infer gene expression and hence provide some information about the transcriptional process, which reduces the experimental effort to study the relationship between histone modifications and transcription.


Dəstəkləyici məlumat

S1 Fig. Distribution of H3K27me3, H3K27ac, and H3K36me3 in M. oryzae Guy11.

(A) and (B) Violin plots illustrating genome-wide distribution of domains (A) and ChIP signals (B) of H3K27me3, H3K27ac, and H3K36me3 in Guy11 wide type growing under in vitro complete medium. Letters above the violin plots indicates the significance.

S2 Fig. Distribution of histone modifications at H3K27 across diverse types of transposable elements in M. oryzae.

(A) and (B) ChIP signals of H3K27me3 and H3K27ac from MACS2 peak calling across transposable elements (TE) families (A) and subfamilies (B). ChIP-Seq data were collected from M. oryzae Guy11 wild type growing under in vitro complete medium. The number of TEs for each group is shown above each violin plot. Letters above the violin plots indicate the significant difference among groups based on ANOVA and Tukey’s HSD test.

S3 Fig. Phylogenetic and homology matrix analysis of PRC2 core components in different organisms.

(A) Neighbor-joint tree of selected PRC2 core components generated by MEGA X with 1000 bootstrap replications. The protein domains are predicated by SMART and visualized by TBtools. The sequences used for analysis included MoKmt6 (MGG_00152), MoSuz12 (MGG_03169) and MoEed (MGG_06028) from M. oryzae FgKmt6 (FGSG_15795), FgSuz12 (FGSG_04321), and FgEed (FGSG_15909) from F. graminearum FfKmt6 (FFUJ_00719), FfSuz12 (FFUJ_09784) and FfEed (FFUJ_12272) from F. fujikuroi NcSet7 (NCU07496), NcSuz12 (NCU05460), and NcEed (NCU05300) from N. crassa Ezh2 (NP_001190176.1), Ezh1 (NP_001308008.1), Suz12 (NP_056170.2) and Eed (AAC23685) from H. sapiens E(z) (NP_001137932.1), Su(z)12 (NP_730465.1), and Esc (NP_477431.1) from D. melanoqaster. (B) Homology matrix analysis of M. oryzae PRC2 core components with PRC2 homologs in different organisms as described above. Numbers indicate protein coverage and identity.

S4 Fig. Homologous recombination strategy was used for generating deletion mutants.

(A) Homologous recombination was used for gene knockout. ±1 kb gene flanking region (black lines) was amplified for targeting gene of interest. The gene coding region was replaced with hygromycin resistant cassette (HPH) for single knockout or geneticin resistant cassette (G418) for double knockout. Inside primer pair (blue arrow) was used for testing the presence/absence of gene of interest in transformants. Outside primer pair (yellow arrow) was used for testing whether there is correct resistant cassette integration in transformants. Green lines indicate upstream and downstream sequences of interested gene and red lines indicate upstream and downstream sequences of the resistant cassette. (B) ΔMokmt6, ΔMoeed, və ΔMosuz12 were confirmed by PCR amplifications with inside and outside primers.

S5 Fig. The complemented strains were screened by PCR.

The complementation for ΔMokmt6, ΔMosuz12Δmoeed was screened by inside and outside primers. Amplifications with inside primers suggested the success in re-introducing the original gene back to the deletion mutants.

S6 Fig. Loss of H3K27me3 leads to dynamics of H3K27ac and H3K36me3 at whole genome level.

Heatmap illustrating pairwise Pearson correlation coefficiency of ChIP signals of H3K27me3, H3K27ac, H3K36me3 between Guy11 wild type (WT) and mutant ΔMokmt6 lacking H3K27me3.

S7 Fig. Loss of H3K27me3 leads to re-distribution of H3K27ac and H3K36me3.

Heat maps visualizing profiles of ChIP signals for H3K27me3, H3K27ac and H3K36me3 across transposable elements (TEs) in Guy11 wild type (WT) and mutant ΔMokmt6. Two clusters of TEs are generated by unsupervised k-means analysis and ranked according to their H3K27me3 enrichment from wild type grown in vitro complete medium.

S8 Fig. The majority of downregulated genes in ΔMokmt6 are not marked by H3K27me3.

Venn diagram showing the overlap of genes downregulated in ΔMokmt6 and marked by H3K27me3 in Guy11 wild type.

S9 Fig. Expression profiles in wild type and ΔMokmt6 for genes that gained and lost H3K27ac in ΔMokmt6.

(A) Violin plot and (B) scatter plot showing gene expression profiles during in vitro complete medium (CM) growth in wild type and ΔMokmt6 for 218 expressed genes that gained H3K27ac in ΔMokmt6. (C) Violin plot and (D) scatter plot showing gene expression profiles during in vitro complete medium (CM) growth in wild type and ΔMokmt6 for 794 expressed genes that lost H3K27ac in ΔMokmt6. Letters above the violin plots indicate the significant difference among groups based on ANOVA and Tukey’s HSD test.

S10 Fig. Expression profiles in wild type and ΔMokmt6 for genes that lost H3K36me3 in ΔMokmt6 mutant.

(A) Violin plots and (B) scatter plot showing the expression profiles during in vitro complete medium (CM) growth in wild type and ΔMokmt6 for 321 expressed genes that lost H3K36me3 in ΔMokmt6. Letters above the violin plots indicate the significant difference among groups based on ANOVA and Tukey’s HSD test.

S11 Fig. Comparison of gene expression profiles under a combination of genotypes and growth conditions.

(A) Venn diagram showing the number and overlap of genes that only gained H3K27ac, only lost H3K36me3 or had both changes occur in the ΔMokmt6 mutant compared to wild type under in vitro complete medium (CM) growth. (B) Violin plots for the RNA-seq expression of wild type (WT_CM) and ΔMokmt6 (ΔMokmt6_CM) during in vitro complete medium (CM) growth for the gene sets from (A). Letters above the violin plots indicate the significant difference among groups based on ANOVA and Tukey’s HSD test.

S12 Fig. MoGcn5 is involved in mediating majority of H3K27ac in M. oryzae.

(A) ΔMogcn5ΔMokmt6ΔMogcn5 were confirmed by PCR amplification with inside and outside primers. (B) The anti-H3K27ac was used for detecting the global level of H3K27ac in the samples and anti-H3 was used as loading control. Signal intensities were measured by ImageJ.

S13 Fig. The double mutant ΔMokmt6ΔMogcn5 has abnormal growth and conidia morphology.

(A) Colony morphology of wild type and ΔMokmt6ΔMogcn5 on complete medium agar (CM) at 12 days. (B) Colony diameters measured at 12 days. The growth rates were determined to be significantly different (**, səh <0.01) between wild type and ΔMokmt6ΔMogcn5 compared using student’s t-test. (C) Representative conidial morphology of wild type (WT), ΔMokmt6, ΔMogcn5, və ΔMokmt6ΔMogcn5 collected after growth on rice polish agar. Bar = 20 μm.

S14 Fig. Single mutants ΔMokmt6, ΔMogcn5 caused reduced symptoms on rice, while ΔMokmt6ΔMogcn5 fails to cause disease.

(A) Representative blast lesions of rice leaves sprayed with wild type (WT), ΔMokmt6, ΔMogcn5, ΔMokmt6ΔMogcn5 and 0.25% gelatin (control). The photos were taken at 7 days post inoculation and show typical blast lesions during a compatible interaction. (B) Bar plots showing quantitative analysis of 14 independent infected rice leaves (n = 14) from two biological experiments, classified as described in [68]. The disease severity rating for each treatment was compared to the wild type infection and student’s t-test was used to determine statistically significant differences. **, səh <0.01 *, səh <0.05.

S15 Fig. Distinct gene expression pattern of effectors in H3K27me3-dependent and -independent manners.

Expression of effector gene SLP1 (A), MoCDIP5 (B), BAS1 (C), and MC69 (D). RNA-seq data are collected from wild type (WT) M. oryzae strain Guy11 growing under in vitro complete medium (CM) and bitkilərdə, and two mutants ΔMokmt6ΔMokmt6ΔMogcn5 growing in CM. The mutant ΔMokmt6 lacks H3K27me3 and the double mutant ΔMokmt6ΔMogcn5 lacks H3K27me3 and majority of H3K27ac. Letters above the violin plots indicate the significant difference among groups based on ANOVA and Tukey’s HSD test.

S16 Fig. Reproducibility of ChIP-seq data across biological replicates by pair-wise Pearson correction analysis.

ChIP-seq experiment were conducted on M. oryzae Guy11 wild type (WT) and the mutant ΔMokmt6 with absence of H3K27me3 growing in complete medium (CM). R represents biological replicates.

S17 Fig. Principal component analysis on RNA-Seq dataset.

RNA-Seq experiment was conducted on RNAs extracted from M. oryzae Guy11 wild type (WT) growing under in vitro complete medium (CM) and bitkilərdə, and two mutants ΔMokmt6ΔMokmt6ΔMogcn5 growing in complete medium. The mutant ΔMokmt6 lacks H3K27me3 and the double mutant ΔMokmt6ΔMogcn5 lacks H3K27me3 and majority of H3K27ac.


Videoya baxın: Immunoprecipitation IP principles and troubleshooting (Yanvar 2022).