Məlumat

Kopya nömrəsi dəyişikliyinin təhlili üçün kəsilmə nöqtəsi həlli

Kopya nömrəsi dəyişikliyinin təhlili üçün kəsilmə nöqtəsi həlli


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Mən oxuyuram [1].

Oxuma Dərinliyi yanaşmasının bir məhdudiyyəti "kəsik nöqtənin həlli çox vaxt zəif olmasıdır". Bu halda aşağı ayırdetmə nöqtəsinin mənası nədir?

Qırılma nöqtəsi ardıcıllığın kəsilmə nöqtəsi kimi müəyyən edilir:

Struktur dəyişikliyinə misal olaraq böyük silmə, daxiletmə, təkrarlama və inversiya daxildir. Hər biri DNT dupleksinin qırılmasını və yenidən birləşməsini tələb edir və bu, yenidən birləşdirilən yerlərdə, yəni kəsilmə nöqtələrində əsasların yeni ardıcıllığını yaradır.

Yeni kəsilmə nöqtəsi bölgələrinin ardıcıllığı DNT miqdarını artırmayan və ya azaltmayan inversiya nümayiş etdirmək üçün yaxşı bir yoldur (bəlkə də yeganə yoldur?).

Orijinal ardıcıllıq: 123456789

İnversiya ilə ardıcıllıq: 123765489

Breakpoint ardıcıllığı 37 və 48-dir

[1]: C. Alkan, B. P. Coe və E. E. Eichler, “Genome structural variation Discovery and genotyping,” Nature Publishing Group, cild. 12, yox. 5, səh. 363-375, mart 2011.


Bu o deməkdir ki, yalnız oxunuş dərinliyi məlumatından istifadə edərək, struktur dəyişikliyi hadisəsinin başladığı və bitdiyi xromosomda dəqiq yeri söyləmək çətindir.

Oxuma dərinliyi hədəflənmiş bölgələr, aka zibil qutuları ilə üst-üstə düşən xəritələnmiş oxuların sayını hesablamaqla ölçülür. Bu qutular adətən bir çox baza cütü genişliyindədir və müxtəlif parametrlər (məsələn, GC məzmunu) ilə əlaqədar əhatə dairəsini normallaşdırmaq üçün istifadə olunur. Kiçik qutular daha yaxşı kəsilmə nöqtəsi ayırd edə bilər, lakin daha səs-küylü statistikaya malikdir. Böyük qutuların daha yaxşı statistikası var, lakin SV sərhədlərini dəqiq adlandırmaq üçün istifadə edilə bilməz.

CNVnator məqaləsi mövzunu müzakirə edir https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3106330/


Kopiya sayı dəyişkənliyi və bitkilərdə xəstəliklərə qarşı müqavimət

Bitki genomunun müxtəlifliyi tək nukleotid polimorfizmindən tutmuş geniş miqyaslı delesiyalara, əlavələrə, dublikasiyalara və ya yenidən təşkillərə qədər dəyişir. DNT seqmentlərinin dublikasiyası, qazanc və ya itkiləri nəticəsində yaranan ardıcıllığın bu yenidən təşkili surət sayı variasiyaları (CNVs) adlanır. Son onillikdə çoxsaylı tədqiqatlar insan fenotipinə təsir edən bir amil kimi CNV-lərin əhəmiyyətini vurğuladı, xüsusən də CNV-lər bir sıra ağır xəstəliklər üçün risklərlə əlaqələndirildi. Bitkilərdə, patogenlərə və zərərvericilərə qarşı müqavimətdə CNV-lərin həcmi və rolunun tədqiqi yeni başlayır. CNV-lərin bitkilərdə xəstəlik müqaviməti ilə əlaqəli olması ehtimalı olduğundan, CNV-lərin paylanmasının anlaşılması yeni bitki xəstəliklərinə davamlı genlərin müəyyən edilməsinə kömək edə bilər. Bu yazıda biz CNV-lər haqqında mövcud məlumatları onların əhəmiyyəti, rolu və funksiyası, eləcə də bitkilərdə xəstəliklərə qarşı müqavimət ilə əlaqəsini nəzərdən keçiririk.

Bu, abunə məzmununun, qurumunuz vasitəsilə girişin önizləməsidir.


Yaponiyada şizofreniyanın yüksək dəqiqlikli surət sayı dəyişkənliyi təhlili

Son zamanlarda şizofreniya (SCZ) araşdırmaları şizofreniya yükünün artdığını bildirdi de novo Dəyişən fenotip ekspressivliyinə baxmayaraq, nömrə variantlarını (CNVs) kopyalayın və xüsusi yüksək riskli CNV-ləri müəyyənləşdirin. Bununla belə, SCZ-nin patogenezi tam aydınlaşdırılmamışdır. Massiv müqayisəli genomik hibridləşmədən istifadə edərək, biz əsasən (92%) Yapon populyasiyasında (1699 SCZ hadisəsi və 824 nəzarət) yüksək ayırdetməli genom miqyasında CNV analizi apardıq və 70,0%-i kiçik (<100 kb) olan 7066 nadir CNV müəyyən etdik. . Klinik cəhətdən əhəmiyyətli CNV-lər nəzarət qruplarına nisbətən hallarda əhəmiyyətli dərəcədə daha tez-tez olmuşdur (əmsal nisbəti = 3.04, P=9,3 × 10 −9 , 9,0% hallarda). X-xromosom anöploidiyalarının SCZ ilə əhəmiyyətli əlaqəsini təsdiqlədik və 11-i müəyyən etdik. de novo CNV-lər (məsələn, MBD5 silinməsi) hallarda. Kliniki əhəmiyyətli KNV olan xəstələrdə 41,7%-nin anadangəlmə/inkişaf fenotipləri var idi və müalicəyə qarşı müqavimət nisbəti əhəmiyyətli dərəcədə yüksək idi (əmsal nisbəti = 2,79, P=0,0036). İki klinik əhəmiyyətli CNV olan xəstələrdə daha ağır klinik təzahürlər tapdıq. Gen dəsti təhlili əvvəlki tapıntıları təkrarladı (məsələn, sinaps, kalsium siqnalı) və oksidləşdirici stress reaksiyası, genomik bütövlüyü, kinaz və kiçik GTPaz siqnalı daxil olmaqla yeni bioloji yolları müəyyən etdi. Bundan əlavə, müəyyən edilmiş SCZ ilə əlaqəli CNV lokuslarında SCZ-nin patogenezində çoxsaylı SCZ namizəd genlərinin və bioloji yolların iştirakı təklif edilmişdir. Tədqiqatımız SCZ-nin yüksək genetik heterojenliyini və onun klinik xüsusiyyətlərini göstərir və genomik qeyri-sabitliyin onun patogenezində iştirak etməsi ehtimalını artırır, bu da artan yüklə əlaqəli ola bilər. de novo CNV-lər və CNV-lərin dəyişən ifadəliliyi.


Parkin genində on səkkiz silinmə nöqtəsinin təhlili

Parkin mutasiyaları otosomal-resessiv yetkinlik yaşına çatmayan parkinsonizmin (AR-JP) patogenezindən məsuldur. AR-JP olan yapon xəstələrinin ilkin müayinəsi zamanı parkin mutasiyalarının təxminən yarısının 2 və 5-ci ekzonlar arasında baş verən silinmələr olduğunu və silinmə qaynar nöqtəsini meydana gətirdiyini aşkar etdik. Bu işdə AR-JP-li 22 ailədə parkin mutasiyalarının silinmə qırılma nöqtələrini araşdırdıq və bu silmə hadisələri ilə meiotik rekombinasiyalar arasında mümkün əlaqəni araşdırdıq. DNT nukleotid ardıcıllığı səviyyəsində 18 silinmə nöqtəsini müəyyən etdik. Demək olar ki, bütün bu silinmələr fərqli idi, bu, silinmə qaynar nöqtəsinin təkrarlanan, lakin müstəqil hadisələr tərəfindən yaradıldığını göstərir. Silinmələrlə xüsusi DNT elementləri arasında heç bir əlaqə tapmadıq. Müxtəlif etnik qrupların son nüsxə sayı dəyişkənliyi (CNV) məlumatları göstərdi ki, silinmə qaynar nöqtəsi yüksək polimorfik CNV bölgəsi ilə üst-üstə düşür və bu, təkrarlanan silinmə mutasiyasının və ya CNV-nin bütün dünyada müşahidə olunduğunu göstərir. Marshfield və deCODE əlaqə xəritələrini müqayisə edərək, parkin silinməsinin qaynar nöqtəsinin meiotik rekombinasiya qaynar nöqtəsi ilə əlaqəli ola biləcəyini aşkar etdik, baxmayaraq ki, Beynəlxalq HapMap layihəsindən yaradılan son yüksək ayırdetməli genetik xəritələrlə müqayisədə belə bir əlaqə tapılmadı. Burada, isti nöqtənin silinməsinin mümkün mexanizmlərini və onun insan genomlarına təsirlərini müzakirə edirik.


Növbəti nəsil ardıcıllıq məlumatları və xəritələşdirməni oxuyur

50 düyü qoşulması üçün Illumina qoşalanmış oxu ardıcıllığı məlumatları NCBI Qısa Oxuma Arxivində [36] qoşulma nömrəsi SRA023116 ilə nəşr olunmuş məqalədən əldə edilmişdir. Bu məlumat toplusuna Asiya düyülərinin əsas qruplarını təmsil edən 40 becərilən düyü əlavəsi və 10 yabanı düyü nümunəsi daxildir - hər biri 5 birləşmə Oryza rufipogonO. nivara. Biz BWA v0.5.8c [90, 91] istifadə edərək, 'bwa aln -e 10' və 'bwa sampe -o 1000' parametrləri ilə Nipponbare'nin (TIGR6.1) düyü istinad genomuna hər qoşulmadan bütün oxunuşları uyğunlaşdırdıq. Alignment bam faylları samtool v0.1.18 [92] ilə indekslənmiş və çeşidlənmişdir. Oxunan cüt dublikatlar Picard (http://broadinstitute.github.io/picard) istifadə edərək silindi.

CNV kəşf dəsti yaradılır

Bu birləşmələrdə CNV-ləri aşkar etmək üçün üç PE, SR və RD metodunu tətbiq etdik. Bununla belə, bu yanaşmaların hər biri aşkar edilmiş CNV-lərin ölçüsü və növü baxımından məhdudiyyətlərə malikdir [77]. Məsələn, oxunan cütlərin CNV kəsilmə nöqtələrini civarında olmayan CNV-ləri cüt-üçlü xəritələşdirmə aşkar edə bilməz. Split-oxumaq təhlili məhduddur ki, CNV-nin hər iki kəsilmə nöqtəsi bir oxunuşda olmalıdır. Oxuma dərinliyi yanaşması CNV zənglərinin dəqiq kəsilmə nöqtələrini çıxara bilməz. Beləliklə, yüksək etibarlı CNV-lərin tam çeşidini əldə etmək üçün biz üç CNV kəşf alətinin nəticələrini üç addımda birləşdirdik. Birincisi, biz hər bir nümunə üçün ən azı iki üsulla dəstəklənən CNV zənglərini 50% qarşılıqlı üst-üstə düşmə kriteriyası tətbiq edərək birləşdirdik. İkincisi, CNV zənglərinin düzgünlüyünü yoxlamaq və qeyri-dəqiq kəsilmə nöqtələrini dəqiqləşdirmək üçün yerli de novo montajlar Velvet [93] istifadə edərək yerinə yetirildi və kontiglər Exonerate [94] [77] tərəfindən istinad genomuna uyğunlaşdırıldı. Üçüncüsü, biz CNV zənglərini ən azı üç qoşulmada birləşdirdik. CNV-lərin əcdad vəziyyətlərini təsnif etmək üçün biz variasiyaları ehtiva edən bölgələri onların ortoloji bölgələri ilə müqayisə etdik. O. glaberrima. Əsas-ortoloji gen cütləri arasında O. glaberrima və Nipponbare ortoloji blokları müəyyən etmək üçün istifadə edilmişdir. 2 kbp cinah ardıcıllığı daxil olmaqla CNV bölgələri, ehtimal olunan ata-baba vəziyyətini çıxarmaq üçün müvafiq ortoloji ardıcıllıqla uyğunlaşdırıldı. Əgər CNV bölgəsində yox idi O. glaberrima, variasiya əlavə kimi müəyyən edildi. Əgər mövcud olsaydı O. glaberrima, biz bunu silinmə kimi təyin etdik.

CNV təsdiqi

PCR validasiyası Nipponbare ilə birlikdə təsadüfi seçilmiş beş düyü birləşməsində aparıldı. Primerlər Primer5 [95] tərəfindən hazırlanmışdır və PCR qarışığı BioTeke Korporasiyasından (Pekin, Çin) 2X Power Taq PCR MasterMix (No: PR1701) istifadə etmişdir. Dərc edilmiş məlumatlar, o cümlədən eyni populyasiyada oxuma dərinliyinə əsaslanan metodla aşkar edilmiş CNV-lər [36], mikroarray əsaslı tədqiqat yapongöstərici alt növ [34] və düyüdə BAC əsaslı hesabat və onun üç ən yaxın qohumu [35], bu layihədə yaradılan CNV məlumatları ilə müqayisə üçün istifadə edilmişdir..

CNV-lərin funksional təsirinin təhlili

Gen mövqeləri TIGR verilənlər bazasından (http://rice.plantbiology.msu.edu/) əldə edilmişdir. Gen Ontologiyası annotasiyalarını təyin etmək üçün CNV genləri InterProScan tərəfindən şərh edilmişdir [96]. Gen Ontologiyasının (GO) zənginləşdirilməsi saxta kəşf dərəcəsi (FDR) korreksiyası ilə hiperhəndəsi paylanma statistik sınaq metodundan istifadə etməklə hesablanmışdır [97]. Düyü üçün spesifik CNV genləri və növlər arasında qorunan CNV genləri düyüdə CNV genlərinin homoloji qruplaşması ilə müəyyən edilmişdir, S. ikirəngli [98] və O. brachyantha Blast proqramından istifadə etməklə. CNV-lərdən təsirlənən funksional genlərin təsdiqi üçün CNV-lərin ortoloji bölgələri O. nivara, O. barthii, O. glaberrima, O. glumaepatula, və O. meridionalis düzülmələri üçün istifadə edilmişdir. Bu genom ardıcıllığı I-OMAP (International Oryza Xəritə Alignment Project) 18 seçilmiş düyü birləşməsində PCR validasiyası həyata keçirilib. Düzəlişlərin vizuallaşdırılması üçün ACT v11.0.0 proqramından istifadə edilmişdir.

CNV əmələ gəlmə mexanizmlərinin təhlili

CNV genlərinin co-xətti analizi ilə müqayisədə O. glaberrima əvvəlki təsvir edilən üsula [50] uyğun olaraq yerinə yetirilmişdir. CNV əmələ gəlmə mexanizmləri Breakseq boru kəmərindən istifadə etməklə müəyyən edilmişdir [47].

Statistik təhlillər və rəqəmlər

Statistik təhlillər R v2.15.1 proqram təminatı [99] vasitəsilə aparılmışdır. Rəqəmlər R v2.15.1, Circos v0.63 [100] və Intergrative Genomics Viewer v2.1.28 [101] istifadə edərək yaradılıb. Düzəlişlərin diaqramları bir sıra xüsusi Perl skriptləri ilə izlənildi.

Dəstəkləyici məlumatların mövcudluğu

CNV məlumatları nstd96 təqdim nömrəsi ilə NCBI dbVar-a yerləşdirilib.


Metodlar

Bitki böyüməsi, DNT və RNT ardıcıllığı

Sun və digərlərinə görə 93 düyü birləşməsinin toxumları yetişdirildi. [76], bəzi dəyişikliklərlə: 28 °C-də 2 gün cücərdikdən sonra ardıcıl tumurcuqlu toxumlar aşağıdan kəsilmiş PCR boşqabına yerləşdirilmək üçün seçildi və dörddə birdən yarım gücə qədər dəyişən qida məhlulu ilə 7 gün ərzində yetişdirildi. 7 günlük vahid ölçüdə və gücdə olan şitillər qabların üstünə qoyulan sistosepimentdə deşiklərə köçürüldü. Bitkilər 3 həftə ərzində hər 3 gündən bir təzə məhlulla əvəz olunan yarım güclü qida məhlulu ilə əkilmişdir. Beynəlxalq Düyü Tədqiqat İnstitutunun (IRRI) qida məhlulunun tam kimyəvi tərkibində 1,25 mM NH var idi.4YOX3, 0,3 mM KH2PO4, 0,35 mM K2BELƏ Kİ4, 1.0 mM CaCl2, 1.0 mM MgSO4·7H2O, 0,5 mM Na2SiO3, 20.0 μM Fe-EDTA, 9.0 μM MnCl2, 0,39 μM (NH4)6Mo7O24, 20.0 μM H3BO3, 0,77 μM ZnSO4, və 0,32 μM CuSO4 (pH 5,4-5,6). Bitkilər floresan altında 70% nisbi rütubətlə, 30/28 °C fotoperiodda 16 saat işıq/8 saat qaranlıq temperaturda yüngül (150-200 μM m-2S-1) olan isti evdə yetişdirilmişdir.

93 düyü qoşulma genomunun təkrar sıralanması üçün QIAamp DNA Mini Kit (Qiagen) istifadə edərək yüksək saflıqda genomik DNT çıxarılıb. Genomun yenidən sıralanması üçün DNT kvalifikasiyası, kitabxananın qurulması və təkrar sıralama Novogene-də (Pekin) həyata keçirildi. Yüksək məhsuldarlıqlı DNT Sequencing Cütlük ardıcıllığı Illumina® NovaSeq platformasında həyata keçirilib, oxunma uzunluğu hər uçda 150 bp və hər kitabxana üçün orta hesabla 20 Gb ardıcıllıq məlumatı.

Ümumi RNT TRIzol® Reagentindən istifadə etməklə çıxarılıb (Invitrogen, Lot: 180702). Hər bir birləşmənin beş fidanının bütün kökləri ümumi RNT çıxarılması üçün nümunə götürüldü. Düyü transkriptomunun ardıcıllığı üçün RNT kvalifikasiyası, kitabxana hazırlığı və RNT-Seq Berry Genomics Corporation-da (Pekin) icra edilmişdir. İstehsalçının göstərişinə uyğun olaraq Illumina Cluster Kit vasitəsilə cBot Klaster Yaratma Sistemində yerinə yetirilən indeks kodlu nümunələrin qruplaşdırılmasından sonra, kitabxana hazırlıqları Illumina® Hiseq2500 platformasında ardıcıllıqla aparıldı və 125-bp cütləşdirilmiş oxunuşlar yaradıldı. Hər qoşulmanın transkriptomik ardıcıllıq məlumatları orta hesabla 5 Gb idi.

RNT-Seq məlumat təhlili

Təmiz oxunuşlar əldə etmək üçün Trimmomatic [77] paketindən (versiya 0.32) istifadə edilmişdir. Adapterlər, N-lər və aşağı keyfiyyətli əsaslar çıxarıldı və uzunluğu 36 bp-dən az olan kəsilmiş oxunuşlar da atıldı. Nipponbare RefSeq [28] (versiya 7.0) istinad kimi istifadə edilmişdir. Bütün təmiz oxunuşlar defolt parametrlərlə Tophat2 [78] (versiya 2.1.1) istifadə edərək istinadla əlaqələndirilmişdir. Sonra, birdən çox bildirilmiş uyğunlaşdırma ilə oxunuşlar xaric edildi və TPM (milyon başına transkript) dəyərləri TPMCalculator [79] (versiya 0.0.3) ilə hesablandı. TPM ≥ 0,5 olan genlər ifadə edilmiş genlər kimi qəbul edildi.

Yenidən sıralama filtrləmə, xəritələşdirmə və SNP çağırış və filtrləməni oxuyur

Nipponbare RefSeq və onun annotasiyası MSU Rays Genome Annotasiya Layihəsindən endirilib [28]. Adapter ardıcıllıqlarını və aşağı keyfiyyətli oxunuşları ehtiva edən oxumalar cutadapt [80] (versiya 1.5) və SolexaQA [81] (versiya 3.1.3) istifadə edərək aşağıdakı meyarlara uyğun olaraq çıxarıldı: (i) bir ucun Ns faizi > 5%, (ii) orta keyfiyyət balı Q < 20, (iii) kəsildikdən sonra uzunluq < 75 bp. Süzgəcdən keçirilmiş oxunuşlar BWA-MEM [82] (versiya 0.7.15-r1140) istifadə edərək Nipponbare RefSeq (versiya 7.0) ilə əlaqələndirilmişdir. Xəritəli oxunuşlar çeşidləndi və PCR dublikatları SAMtools [83] (versiya 1.5) tərəfindən silindi. Xəritəçəkilən oxunuşlar həmçinin < 30 xəritələmə keyfiyyəti ilə silindi. Variantlar SAMtools və BCFtools [83] (versiya 1.6) tərəfindən çağırıldı. Xam SNP-lər aşağıdakı meyarlardan istifadə etməklə süzülüb: (i) QUAL ≥ 100 (ii) xam oxunma dərinliyi 1000-dən 50.000-ə qədər dəyişir (iii) MAF ≥ 5% və (iv) bialel sahələr.

Nömrə dəyişikliyini kopyalayın

CNVnator [29] (versiya 0.3.4), Delly [30] (sadəcə silinmə çağırışı üçün versiya 0.7.3) və CtgRef-CNV-dən ibarət olan hərtərəfli boru kəmərimizdən (əvvəlcədən qeyd edildiyi kimi) surət sayı dəyişiklikləri müəyyən edilmişdir. Sonrakı təhlilləri yerinə yetirmək üçün yalnız uzunluğu 1000 bp-dən az olmayan CNV-lər seçilmişdir.

CNVnator üçün, RD (oxu dərinliyi) siqnalının orta göstəricisinin standart sapmaya nisbətinin 4 və 5 arasında olduğuna əmin olmaq üçün hər bir qoşulma 100-dən 1000 bp-ə qədər bir neçə qutu ölçüsü ilə sınaqdan keçirilmişdir. Delly paketi üçün yalnız onun DEL nəticələrindən istifadə edilmişdir. bu layihə.

CtgRef-CNV boru kəməri üçün məlumatlar aşağıdakı kimi işlənmişdir:

Hər genomun de novo yığılması. Kontiglər SOAPdenovo2 [84] paketindən istifadə etməklə yığılmışdır (versiya 2.04). Layihə montajının nəticələrindəki boşluqlar GapCloser [84] (versiya 1.12) tərəfindən dolduruldu. Montajların N50 uzunluğu < 200 bp olan kiçik kontiglər xaric edildikdən sonra qiymətləndirildi. Yığılmış genomların tamlığı BUSCO [85] tərəfindən “liliopsida_odb10” məlumat dəstindən istinad kimi istifadə edilərək qiymətləndirilmişdir.

Xəritəçəkməni onun kontiglərinə oxuyun. Təmiz oxunuşlar yuxarıda qeyd olunduğu kimi eyni paketdən istifadə edərək ≥ 1000 bp kontiglərə uyğunlaşdırılıb. Dərinlik məlumatları üst-üstə düşməyən sürüşmə pəncərə üsulu ilə hesablanmışdır (bizim tədqiqatımızda pəncərənin ölçüsü 250 bp idi) və əvvəlki tədqiqatda eyni metoddan istifadə etməklə düzəliş edilmişdir [86].

Contig-reference hizalama blokları. (ii)-dəki kontiglər “--maxmatch -c 90 -l 40” parametri ilə MUMmer (versiya 3.23) [87] paketindəki nukmer proqramı vasitəsilə Nipponbare RefSeq (versiya 7.0) ilə uyğunlaşdırıldı. Digərində olan qısa düzülmə kontig fraqmenti uzunluq dərəcəsi (qısa/uzun) 0,8-dən az olduqda süzülür. İki üst-üstə düşən uyğunlaşma kontig fraqmentləri üçün (1) üst-üstə düşmə dərəcəsi (üst-üstə düşmə/daha uzun) 0,7-dən az olmadıqda hər ikisi saxlanıldı, əks halda (2) uzunluq dərəcəsi (qısa/uzun) < 0,2 olarsa, daha qısa düzülmə silindi.

İstinadın dərinliyi məlumatları. Contig-referans hizalama bloklarına əsaslanaraq, biz kontig dərinliyini istinad dərinliyi nəticəsinə çevirdik. Bir kontig istinadda bir neçə bölgəyə uyğunlaşdırılıbsa, onun xəritələnmiş oxu dərinliyi istinaddakı hər düzlənmiş bölgəyə bərabər bölünəcək. Digər tərəfdən, istinaddakı bir bölgə üçün onun dərinliyi xəritələnmiş kontiglərdən bölünmüş dərinliyə görə toplanmışdır. Sonra üst-üstə düşməyən qutuların və xromosomların orta dərinliyi hesablanmışdır.

CNV zəngi. CN_index (Orta_dərinlik) olan qutularzibil qabı /Orta_dərinlikChr) Silinmə və təkrarlama namizədləri üçün müvafiq olaraq < 0,5 və ya ≥ 1,5 seçilmişdir. CNV növləri eyni olarsa, bitişik qutular intervallarla əlaqələndirilirdi. Sonra intervallar CNVnator alqoritmində təsvir edilən eyni yanaşma ilə uzadıldı. Bu uzadılmış intervallar süzülməyə namizəd CNV-lər idi.

CNV-lərin süzülməsi və inteqrasiyası

Xam CNV nəticələri çağırış metodundan asılı olaraq süzülüb. CNVnator CNV zəngləri üçün nüsxə sayı təxmini 0,8 və 1,4 arasında olan bölgələr əvvəlcə silindi [88]. Etibarlı silmə aşağıdakı üç şərtə cavab verməlidir: (i) ən azı 5 uyğunsuz oxunuş cütü (insert ölçüsü intervalın ölçüsünə yaxındır) və ya kəsilmə nöqtəsinin yuxarı və aşağı axınında 500 bp daxilində dəstəklənən bölünmüş oxunuşlar (ii) əhatə dairəsi və (iii) dp10_cvrg (dərinliyi ≥ 10 olan ərazilərin əhatə dairəsi) 50%-dən çox olmamalıdır. Təkrarlanmalar üçün onlar aşağıdakıları təmin etməlidirlər: (i) əhatə dairəsi və (ii) dp10_cvrg 80%-dən az olmamalı və (iii) dup_cvrg (CN_index ≥ 1.4 olan saytların əhatə dairəsi) 50-dən az olmamalıdır. %. Delly (DEL) nəticələri üçün nüsxə sayı təxmini 0,5-dən az olmalıdır və digər məhdudiyyətlər yuxarıdakı kimi idi. CtgRef-CNV nəticələrini süzgəcdən keçirərkən məhdudiyyətlər bir az daha sərt idi. Təxminən 0,4 və 1,7 arasında surət sayı olan CNV zəngləri silindi. Yuxarıda göstərilən şərtlərə əlavə olaraq, silinmənin algn_cvrg (düzləşdirmə bloklarının əhatə dairəsi) < 50% və təkrarlama üçün ≥ 90% olmalıdır. Süzgəcdən keçirilmiş CNV zəngləri əvvəlcə qoşulma yolu ilə birləşdirildi və Wang et al. [31].

CNV-lərin gen annotasiyası

Transpozon genləri ilk olaraq MSU Rays Genom Annotasiya Layihəsində (buraxılış 7) gff3 faylından süzülür [28]. Və namizəd CNV geni, gen bədəninin ən azı 50% -i CNV ilə əhatə olunarsa müəyyən edilmişdir. Gen annotasiyasının dəqiqliyini artırmaq üçün oxunuş əhatə dairəsi ≥ 50% və CN_index ≥ 0,5 olduqda surət nömrəsi 0 olan gen normal tipə (CN = 1) geri çağırıldı. Qoşulmaların bütün surət sayı matrisləri əhali matrisinə birləşdirildi.

CNV nəticələrinin qPCR yoxlanışı

Nisbi surət nömrəsini müəyyən etmək üçün qPCR analizindən istifadə edilmişdir. 15 birləşmə arasından 10 xromosomda təsadüfi olaraq on lokus seçilmişdir (Əlavə fayl 4: Cədvəl S5). Primerlər (Əlavə fayl 6: Cədvəl S22) Primer3 [89] (versiya 0.4.0) vebsaytından istifadə etməklə tərtib edilmişdir. The OsACTIN2 (LOC_Os05g36280) daxili istinad geni kimi istifadə edilmişdir. ABI istifadə edərək ChamQ™ SYBR® Color qPCR Master Mix (Q441-02, Vazyme Biotech Co., Ltd., Nankin, Çin) protokoluna uyğun olaraq hər bir nümunə üçün eyni miqdarda genomik DNT şablon kimi istifadə edilmişdir. Üç texniki təkrarı olan StepOnePlus Real-Time PCR Sistemi. Gücləndirmə reaksiyaları denaturasiya mərhələsi (10 dəqiqə ərzində 95 °C), sonra 40 denatürasiya dövrü (15 s üçün 95 °C), yumşalma və uzatma (35 s üçün 60 °C) ilə başladıldı. Məlumatlar 2 −(∆∆Ct) metodu ilə [90] nisbi nüsxə nömrəsini əldə etmək üçün təhlil edilmişdir.

Xəbər verilmiş tandem dublikatının yoxlanılması GL7 və təbliğatçısı IPA1

PCR analizi təkrarlamanın aşkarlanması üçün xüsusi primerlərdən istifadə etməklə aparılmışdır GL7 [23] və təbliğatçısı IPA1 [25] (Əlavə fayl 6: Cədvəl S22) istehsalçının təlimatlarına uyğun olaraq T100™ Termal Cycler (Bio-Rad) üzərində. Qısaca, 2 μL seyreltilmiş DNT, 1,5 μL primerlər (10 μM/L), 4 μL dNTP (2,5 mM/L), 3 μL 10 × PCR tamponu (Mg 2+ plus) və 0,3 μL daxil olmaqla 30 μL reaksiya sistemində rTaq (5 U/μL, TaKaRa, R001B), gücləndirmə reaksiyaları denaturasiya mərhələsi (2 dəqiqə ərzində 98 °C), ardınca 30 denatürasiya dövrü (10 s üçün 98 °C), yumşalma (55 °C üçün) ilə başladıldı. 30 s) və uzadılması (1 dəqiqə üçün 72 °C). PCR gücləndirildikdən sonra məhsullar 1% agaroz gel ilə aşkar edilmişdir.

Filogenetik analiz və PCA

Süzülmüş SNP-lər nukleotid müxtəlifliyini (π) və F-statistikasını hesablamaq üçün istifadə edilmişdir.FST), sonra a ilə sürüşən pəncərələrdəki SNP-lər FST ≤ 0,4 və a π 0,1 ×-dən az olmamalıdır π_aver (genom üzrə orta π) filogenetik analiz üçün istifadə edilmişdir. CNV-lərin matrisi dublikasiyaları və silinmələri bölmək yolu ilə genotipləmə üçün istifadə edilmişdir. Qoşulmada dublikasiya baş veribsə, biz onu 1-ə təyin etdik, əks halda 0-a təyin olundu. Silinmələr üçün də eyni idi. CNV-lərin bütün genotip dəyərləri R-də APE paketi [91] (versiya 5.2) tərəfindən Qonşu-Qoşulma ağacını qurmaq üçün birləşdirildi. Topoloji möhkəmlik 1000 replika ilə bootstrap analizi ilə qiymətləndirildi. PCA üçün nüsxə nömrəsi növü > 3 və ya MAF < 0.03 olan CNV-lər əvvəlcə çıxarıldı. Kopya sayı matrisi xüsusi Perl skriptimizdən istifadə edərək plink formatına çevrildi. Sonra PCA PLINK [92] (versiya 1.9) istifadə edərək yerinə yetirildi.

Çəkili dəqiqliyin hesablanması

Bu araşdırmada biz CNVnator, Delly və CtgRef-CNV-nin hərtərəfli dəqiqliklərini qiymətləndirmək üçün çəkili dəqiqliklərdən istifadə etdik. Və aşağıdakı kimi müəyyən edildi: Rw=PtRt, harada PtRt müvafiq olaraq DUP (CN ≥ 2), DEL (CN = 0) və CN1 növlərinin faizləri və dəqiqliyidir. Hər növ lokusun faizi 15 birləşmənin surət sayı matrisi əsasında hesablanmışdır. Və dəqiqlik çağırılan və qPCR nəticələrindən asılı idi. DEL və CN1 yerləri üçün yalnız CN olduqdazəng edin (proqram tərəfindən çağırılan nüsxə nömrəsi) qoşulmadakı lokusu CN-ə bərabər idiqPCR (nüsxə nömrəsi qPCR tərəfindən təsdiqlənmiş), biz onu düzgün hesab etdik. Və DUP yeri üçün, əgər CNzəng edin 0 və ya 1 idi, biz bunun tamamilə səhv olduğunu söylədik, lakin CNzəng edin 2-dən az deyildi, biz onu qismən müalicə edərdik (CN-ə bərabər deyilqPCR) və ya tamamilə (CN-ə bərabərdirqPCR) düzgün və düzgün DUP-ların sayı CN tərəfindən toplanacaqMin/CNMayor, harada CNMin və CNMayor massivin kiçik və böyük qiymətləri idi: [CNzəng edin, CNqPCR], müvafiq olaraq. Xüsusilə, əgər CNzəng edin DUP lokusu onun CN ilə eyni idiqPCR, düzgün DUP-ların sayı da 1-ə yığılacaq.

Korrelyasiya təhlili

CNV-lər nümunə üzrə qeyd edilmiş gen nümunəsi idi və sonra bütün gen surəti sayı matrisi əhalinin ümumi matrisinə inteqrasiya edildi. Nüsxə sayı və gen ifadə səviyyəsi arasında korrelyasiya təhlilini aparmaq üçün yalnız CNV-nin təsirinə məruz qalan genlər (minimum 50% gen modeli üst-üstə düşür) və dəyişmə qatı (maks/dəq) 1,1-dən az olmayan genlər seçilib. TPM kənar göstəriciləri (diapazondan kənarda μ ± 3σ) və onun surət nömrəsi süzülüb. Sonra üç təkrardan az olan nüsxə nömrəsi silindi. Qalan nüsxə sayı yalnız iki növdən ibarət idisə və daha kiçik nüsxə sayı 0-a bərabər idisə, bu genlər də korrelyasiya təhlilindən əvvəl atıldı. Populyasiya strukturunun təsirini minimuma endirmək üçün yuxarıda göstərilən standartlarla süzülmüş genlərin surət nömrələrindən istifadə edilmişdir. VST dəyərlər [4] və yalnız genlər VST növbəti analizlər üçün 0,4-dən çox olmayan qiymətlər aparılmışdır. Düzəliş üçün 0,05 əhəmiyyətlilik səviyyəsi təyin edilmişdir t-test P dəyərlər (Benjamini-Hochberg metodu [93]).

Kopiyaya xas ifadə

Nüsxə nömrəsi montaj kontiglərindəki dublikatların sayına uyğun olan dublikat cütləri seçilmişdir. Pseudogenlər və kodlaşdırma ardıcıllığı (CDS) GeneWise [94] (versiya 2.4.1) istifadə edərək proqnozlaşdırıldı. Sonra qoşalaşmış CDS-lər təsvir edilən [52] metoduna bənzər surətə xas variasiyaları (CSV-lər) müəyyən etmək üçün ClustalW2 [95] (versiya 2.0.12) ilə uyğunlaşdırıldı. CSV-lər, hər bir nüsxənin ifadə səviyyəsini hesablamaq üçün RNT-Seq məlumatlarında nüsxəyə məxsus oxunuşları saymaq üçün istifadə edilmişdir. Hər bir cütlükdə daha yüksək ifadə səviyyəsinə malik nüsxəni “əsas” nüsxə, onun tərəfdaşını isə “kiçik” nüsxə kimi təsnif etdik. “Böyük” nüsxə ilə “kiçik” nüsxə arasındakı ifadə fərqi müvafiq dublikat cütünün ifadə fərqi kimi müəyyən edilmişdir. Əgər böyük nüsxənin ifadə səviyyəsi kiçik nüsxənin ifadə səviyyəsinə görə iki dəfədən çox idisə, bu cütlükdə surət dominantlıq ifadəsi fenomeninin olduğunu söylədik.

The Ka, Ks və divergensiya vaxtı hesablamaları

Kopiyaya xas ifadə analizində istifadə edilən qeyri-psevdogen dublikat cütlərinin CDS-ləri zülallara çevrildi. Sinonim olmayan sayt üçün qeyri-sinonim əvəzetmələrin sayı (Ka) və sinonim sayt başına sinonim əvəzetmələrin sayı (Ks) Nei-Gojobori [51] metodundan istifadə etməklə PAML4 paketlərində [96] yn00 proqramı ilə hesablanmışdır. Pseudogene ilə əlaqəli düzülmə MASCE [97] (versiya 2.03) proqramı tərəfindən həyata keçirilmişdir. Ayrılıqdan sonrakı vaxt (Tdublikatların ) kimi hesablanmışdır T = Ks/2μ, harada μ hər sinonim sayt üçün mütləq əvəzetməyə uyğundur və burada biz otun əvəzetmə sürətindən istifadə edirik Adh ardıcıllıqlar (6,5 × 10 − 9 ) [98].

Valideyn və nəsil nüsxələrinin proqnozu

Nipponbare genomunda hər bir dublikat cütünün uyğunlaşma mövqeyinə əsasən, dörd bitişik gen (iki yuxarı və iki aşağı axın) normal surət nömrəsi ilə birləşmələrin yığılmış genomları ilə uyğunlaşdırıldı. NGS oxunuşlarından istifadə edərək yığılmış kontiglərin qısa uzunluğunu nəzərə alaraq, ən azı iki bitişik gen hədəf gen ilə eyni kontigdə yığılmışdır ki, bu da onun qoşulma və Nipponbare arasında hədəf gen yaxınlığında eyni kolinearlıq olduğunun effektiv sübutu idi. Nipponbarda gen mövqeyini dəstəkləyən 10-dan çox birləşmə (və ya qoşulmaların əksəriyyəti) varsa, kolinearlıq qorunmuş hesab olunurdu. Sonra bütün uyğunlaşdırma nəticələrində eyni meyar tətbiq edildi. Kolinearlıq blokundakı nüsxə ana nüsxə, digərləri isə nəsil nüsxələr kimi müəyyən edildi. Bununla belə, tandem dublikat cütləri üçün hansının valideyn surəti, hansının övlad olduğunu ayırd etmək mümkün olmaya bilər.

Neofunksionalizasiyanın və subfunksionalizasiyanın müəyyən edilməsi

Qeyri-psevdogen dublikat cütlərin bütün zülal ardıcıllıqları və müvafiq istinadlar, E-qiyməti 1,0 × 10 - 5-dən çox olmayan InterProScan [99] (5.21-60.0 versiyası) vasitəsilə domen təhlili üçün istifadə edilmişdir. Bir nüsxədə istinad analoqundan daha az domen var idi ki, bu da subfunksionallaşdırma hadisəsinin olduğunu, daha çox və ya yeni domenləri ehtiva edən nüsxə isə neofunksionalizasiya hadisəsini göstərdi. Əgər dublikat cütlüyün eyni domenləri varsa, ifadə nümunələrinin sübutu olmadan neofunksionalizasiya və ya subfunksionallaşma hadisəsinin olub olmadığını müəyyən etmək mümkün deyildi.


Materiallar və metodlar

Mikroarray Təcrübələri və Məlumat Axtarışı.

22-ci xromosomu əhatə edən ≈385.000 müxtəlif zond ilə 85-bp kirəmitli yol addımı ölçüsündə mikroarraylar təsvir edildiyi kimi dizayn edilmişdir (16). İnsan subyektinin etiketli genomik DNT-si və istinad nümunələri (sonuncu nümunə, yəni Promega, Madison, WI-dan yeddi sağlam kişidən genomik DNT hovuzundan ibarət olan nəzarət) massivlərə kohibridləşdirildi (16, 17). Hər bir ləkə (16) (“zond”) üçün flüoresans intensivliyi əldə edilmişdir. Floresans intensivliyinin normallaşdırılması Qspline alqoritmindən istifadə etməklə həyata keçirilmişdir (31). Əvvəlki araşdırmadan HighRes-CGH məlumatlarını əlavə etdik və yenidən təhlil etdik (16).

Tam Parametrləşdirmədən istifadə edərək CNV Breakpoint Proqnozu.

HighRes-CGH məlumatları istifadə edilərək qiymətləndirildi BreakPtr (mənbə kodları http://breakptr.gersteinlab.org saytında mövcuddur). Onun tam modeli iki emissiya kanalı ilə işləyən yeddi ştatlı dbHMM-ni əhatə edir: yəni, normallaşdırılmış flüoresan intensivlik jurnalından istifadə edir.2-nisbətlər və BlastZ (32) düzülüşündən əldə edilən əsas DNT ardıcıllığının artıqlığını kəmiyyət göstərən dəyər [SD-ləri müəyyən etmək üçün istifadə edilə bilər (32, 33)]. Normallaşdırılmış BlastZ balları (32) genom miqyasında insan-insan (yəni, BlastZ-öz zənciri) düzülüşündən, nəsil-xüsusi ümumi (səpələnmiş) təkrarların tükənməsi Kaliforniya Universitetindən (Santa Clara, CA) Genomdan götürülüb. Brauzer (http://genome.ucsc.edu Self-Chain Track-ə uyğun olaraq defolt parametrlər, yəni minimum BlastZ xam xalı = 10,000 normallaşdırılmış BlastZ-balı = xam xal/hizalanmış əsasların sayı). Biz zondun genomik koordinatı ilə kəsişən hər BlastZ vuruşu üçün normallaşdırılmış BlastZ-ballarını cəmləməklə əldə edilmiş məcmu ballardan istifadə etdik. Bu tədbir nukleotid ardıcıllığının, xüsusən də SD-lərin artıqlığı ilə əlaqələndirilir və biz bunu dbHMM-ə daxil etmək üçün hesab etdik. BreakPtrnin keçid vəziyyətləri kəsilmə nöqtələrinin SD-lərlə üst-üstə düşmə meylini əks etdirir. Model arxitekturası keçid vəziyyətlərinin buraxılmasına imkan verdiyi üçün kəsilmə nöqtələri SD-lərlə üst-üstə düşmədikdə də proqnozlaşdırılır. dbHMM, bir zond tərəfindən hədəflənən hər bir genomik koordinat üçün diskret simvollar buraxır, hər bir simvol xüsusi mikroarray dəyərləri və nukleotid ardıcıllığı tərkibi ilə əlaqəli emissiya paylanmasının qutusuna uyğun gəlir (Şəkil 3). Zibil qutuları aşağıdakı şəkildə quruldu: məcmu ballar arasında bölündü N 1 = 5 zibil qutusu, hər qutuya təxminən bərabər sayda məlumat nöqtəsi yerləşdirmək şərtindən istifadə etməklə zibil ölçüləri seçilir. Normallaşdırılmış floresan intensivliyi qeydi2 nisbətləri təyin edildi N 2 = 100 zibil qutusu aşağıdakı prosedura uyğun olaraq: −1 və 1 arasındakı qiymətlər təyin edildi N 2 − bərabər ölçülü flüoresan intensivliyi jurnalını əhatə edən 2 qutu2-nisbət intervalları. Bundan əlavə, log2 nisbətləri < −1 və log2 nisbətləri >1, əlavə zibil qutularına təyin edildi. Proqnozlar zibil qutusunun ölçüsü seçiminə uyğun idi. Ən çox ehtimal olunan dövlət tapşırıqları Viterbi alqoritmindən istifadə etməklə tapılmışdır (23). BreakPtr “silinmə” və “təkrarlanma” vəziyyətlərinə (və ya onlardan) keçid yerlərinə kəsilmə nöqtələri təyin edir. Bu xüsusi tədqiqatda, mövcud qızıl standartlarının kiçik miqdarını nəzərə alaraq, tam modelin emissiya paylamaları, normal vəziyyətin (yəni, təsirsiz genomik DNT) emissiya dəyərlərinin paylanmasına bənzəyən parametrlərdən istifadə etməklə Qauss hamarlaşdırması (parametrlərin qiymətləndirilməsindən sonra) ilə dəqiqləşdirilmişdir. ). Skota (24) əsaslanan meyarlar yerinə yetirilərsə, bu addım lazımsızdır (aşağıya bax).

Alternativ Parametrləşdirmələr.

Mövcud məlumatların miqdarından asılı olaraq, alternativ parametrləşdirmələr (əsas və ara modellər) Skotta (24) uyğun olaraq həyata keçirilir (bax. SI Mətni və SI Şəkil 4). For instance, the core model uses a univariate continuous three-state HMM with Gaussian emission and 10 parameters. Focusing on HighRes-CGH data, it is not trained on DNA sequence signatures. Alternative models use the same structure of modules (Finder/Annotator/Flagger Fig. 2) as the full model.

Training/Optimization of BreakPtr.

BreakPtr was iteratively optimized by using training data and gold standards. For instance, the core model was trained as follows: (i) parameter estimation was based on a labeled training set, i.e., parameters for CNV-states were estimated from approximately mapped breakpoints (see SI Table 3). For the normal state, a control microarray experiment [same DNA applied to both channels (16)] was used. Transition probabilities səh b were estimated for each transition between states by dividing the number of previously known aberrations (based on approximately mapped deletions/duplications) in the concatenated training set by the number of probes. Then, transition probabilities səh w within states were set: (ii) Parameter optimization was carried out by using a larger unlabeled training set (in practice, the entire set of arrays is used). (iii) Breakpoints were predicted, and (iv) validated. These four steps were iterated, by using refined breakpoints for each round. Steps iii can be viewed as a special case of semisupervised learning (34), because unlabeled data are used to improve a model based on labeled data. Steps iiiiv are closely related to active sampling/learning, because a subset of unlabeled data is selected and validated, and results are subsequently incorporated in the rescoring process. BreakPtr's alternative parameterizations are optimized similarly to the core model: Transition states were trained based on data points corresponding to an interval ±1,000 bp from a mapped breakpoint. Transition-state emission distributions were assumed to be identical for both (the telomeric and centromeric) boundaries of CNVs. BreakPtr allows transition probabilities to be refined by using EM or to be adjusted manually. The latter, e.g., allows the stringency of CNV detection to be adjusted gradually if a CNV reported by using a complementary technology was initially missed.

Dosage Estimation.

Copy number ratios were identified by using a six-state HMM (Annotator). Parameters were estimated from biological samples (if corresponding samples were missing, parameters were manually specified see SI Table 3 and SI Fig. 8).

Identification of False-Positive Signals Resulting from Cross-Hybridization.

Cross-hybridization of probes may, to a certain extent, affect HighRes-CGH experiments putative cross-hybridization is identified by using a sequence alignment-based approach (this module, Flagger, is described in detail in SI Text ).

Validation of Breakpoints.

Genomic regions surrounding predicted breakpoints were amplified by conventional PCR or vectorette PCR and sequenced (16).


Exonic duplication CNV of NDRG1 associated with autosomal-recessive HMSN-Lom/CMT4D

Məqsəd: Copy-number variations as a mutational mechanism contribute significantly to human disease. Approximately one-half of the patients with Charcot-Marie-Tooth (CMT) disease have a 1.4 Mb duplication copy-number variation as the cause of their neuropathy. However, non-CMT1A neuropathy patients rarely have causative copy-number variations, and to date, autosomal-recessive disease has not been associated with copy-number variation as a mutational mechanism.

Metodlar: We performed Agilent 8 × 60 K array comparative genomic hybridization on DNA from 12 recessive Turkish families with CMT disease. Additional molecular studies were conducted to detect breakpoint junctions and to evaluate gene expression levels in a family in which we detected an intragenic duplication copy-number variation.

Nəticələr: We detected an

6.25 kb homozygous intragenic duplication in NDRG1, a gene known to be causative for recessive HMSNL/CMT4D, in three individuals from a Turkish family with CMT neuropathy. Further studies showed that this intragenic copy-number variation resulted in a homozygous duplication of exons 6-8 that caused decreased mRNA expression of NDRG1.

Nəticə: Exon-focused high-resolution array comparative genomic hybridization enables the detection of copy-number variation carrier states in recessive genes, particularly small copy-number variations encompassing or disrupting single genes. In families for whom a molecular diagnosis has not been elucidated by conventional clinical assays, an assessment for copy-number variations in known CMT genes might be considered.

Rəqəmlər

Figure 1. Array comparative genomic hybridization (aCGH)…

Figure 1. Array comparative genomic hybridization (aCGH) results of the NDRG1 gene region in family…

Figure 2. Polymerase chain reaction (PCR) results…

Figure 2. Polymerase chain reaction (PCR) results for copy-number variation (CNV) gain and breakpoint junction

14.8 kb in size, individuals with heterozygous duplication (BAB4146, BAB4147, and BAB4151) have two bands at 14.8 and 7.4 kb, and individuals who only carry the wild-type allele (BAB4150 and BAB4152) have one 7.4 kb band. (c) Long-range PCR assay results for the breakpoint junction by primer pair 3724-2F1 and 3724-2R1. Individuals who carry at least one duplicated segment have a 1 kb amplicon and individuals who are wild type do not, as expected, show any breakpoint junction fragment. (d) Array comparative genomic hybridization image showing location and orientation of primers to detect breakpoint junction and to amplify the entire duplicated segment. F1 and R1 primers amplify the entire product. 2F1 and 2R1 primers are placed inside the duplication in outward-facing orientation to obtain the breakpoint junction.

Figure 3. Sequence analysis for cDNA and…

Figure 3. Sequence analysis for cDNA and quantitative reverse transcriptase-polymerase chain reaction (RT-PCR) study for…

Şəkil 4. NDRG1 resides in an

Şəkil 4. NDRG1 resides in an

22 Mb region of absence of heterozygosity (AOH) shared…

22 Mb region of absence of heterozygosity (AOH) shared by all affected individuals

21.9 Mb of AOH that encompasses the NDRG1 gene locus. All unaffected family members lacked a predicted AOH region that overlapped this gene. The location of NDRG1 is depicted at the bottom of the figure, and its location for each individual in the pedigree is denoted with the red vertical line.


Abyzov, A., Urban, A. E., Snyder, M., and Gerstein, M. (2011). CNVnator: an approach to discover, genotype, and characterize typical and atypical CNVs from family and population genome sequencing. Genom Res. 21, 974�. doi: 10.1101/gr.114876.110

Bellos, E., Johnson, M. R., and Coin, L. J. (2012). cnvHiTSeq: integrative models for high-resolution copy number variation detection and genotyping using population sequencing data. Genom Biol. 13:R120. doi: 10.1186/gb-2012-13-12-r120

Bodian, D. L., McCutcheon, J. N., Kothiyal, P., Huddleston, K. C., Iyer, R. K., Vockley, J. G., et al. (2014). Germline variation in cancer-susceptibility genes in a healthy, ancestrally diverse cohort: implications for individual genome sequencing. PLoS BİR 9:e94554. doi: 10.1371/journal.pone.0094554

Chen, K., Chen, L., Fan, X., Wallis, J., Ding, L., and Weinstock, G. (2014). TIGRA: a targeted iterative graph routing assembler for breakpoint assembly. Genom Res. 24, 310�. doi: 10.1101/gr.162883.113

Chen, K., Wallis, J. W., McLellan, M. D., Larson, D. E., Kalicki, J. M., Pohl, C. S., et al. (2009). BreakDancer: an algorithm for high-resolution mapping of genomic structural variation. Nat. Metodlar 6, 677�. doi: 10.1038/nmeth.1363

Chiang, D. Y., Getz, G., Jaffe, D. B., O'Kelly, M. J. T., Zhao, X., Carter, S. L., et al. (2009). High-resolution mapping of copy-number alterations with massively parallel sequencing. Nat. Metodlar 6, 99�. doi: 10.1038/nmeth.1276

Chiara, M., Pesole, G., and Horner, D. S. (2012). SVM 2 : an improved paired-end-based tool for the detection of small genomic structural variations using high-throughput single-genome resequencing data. Nuklein turşuları Res. 40:e145. doi: 10.1093/nar/gks606

Day, N., Hemmaplardh, A., Thurman, R. E., Stamatoyannopoulos, J. A., and Noble, W. S. (2007). Unsupervised segmentation of continuous genomic data. Bioinformatika 23, 1424�. doi: 10.1093/bioinformatics/btm096

Emde, A.-K., Schulz, M. H., Weese, D., Sun, R., Vingron, M., Kalscheuer, V. M., et al. (2012). Detecting genomic indel variants with exact breakpoints in single- and paired-end sequencing data using SplazerS. Bioinformatika 28, 619�. doi: 10.1093/bioinformatics/bts019

Escaramís, G., Tornador, C., Bassaganyas, L., Rabionet, R., Tubio, J. M. C., Martínez-Fundichely, A., et al. (2013). PeSV-Fisher: identification of somatic and non-somatic structural variants using next generation sequencing data. PLoS BİR 8:e63377. doi: 10.1371/journal.pone.0063377

Glusman, G., Caballero, J., Robinson, M., Kutlu, B., and Hood, L. (2013). Optimal scaling of digital transcriptomes. PLoS BİR 8:e77885. doi: 10.1371/journal.pone.0077885

Handsaker, R. E., Korn, J. M., Nemesh, J., and McCarroll, S. A. (2011). Discovery and genotyping of genome structural polymorphism by sequencing on a population scale. Nat. Genet. 43, 269�. doi: 10.1038/ng.768

Hart, S. N., Sarangi, V., Moore, R., Baheti, S., Bhavsar, J. D., Couch, F. J., et al. (2013). SoftSearch: integration of multiple sequence features to identify breakpoints of structural variations. PLoS BİR 8:e83356. doi: 10.1371/journal.pone.0083356

Hayes, M., Pyon, Y. S., and Li, J. (2012). A model-based clustering method for genomic structural variant prediction and genotyping using paired-end sequencing data. PLoS BİR 7:e52881. doi: 10.1371/journal.pone.0052881

Hinrichs, A. S., Karolchik, D., Baertsch, R., Barber, G. P., Bejerano, G., Clawson, H., et al. (2006). The UCSC Genome Browser Database: update 2006. Nuklein turşuları Res. 34, D590�. doi: 10.1093/nar/gkj144

Hormozdiari, F., Hajirasouliha, I., Dao, P., Hach, F., Yorukoglu, D., Alkan, C., et al. (2010). Next-generation VariationHunter: combinatorial algorithms for transposon insertion discovery. Bioinformatika 26, i350–i357. doi: 10.1093/bioinformatics/btq216

Ivakhno, S., Royce, T., Cox, A. J., Evers, D. J., Cheetham, R. K., and Tavaré, S. (2010). CNAseg𠄺 novel framework for identification of copy number changes in cancer from second-generation sequencing data. Bioinformatika 26, 3051�. doi: 10.1093/bioinformatics/btq587

Jiang, Y., Wang, Y., and Brudno, M. (2012). PRISM: pair-read informed split-read mapping for base-pair level detection of insertion, deletion and structural variants. Bioinformatika 28, 2576�. doi: 10.1093/bioinformatics/bts484

Karakoc, E., Alkan, C., O'Roak, B. J., Dennis, M. Y., Vives, L., Mark, K., et al. (2012). Detection of structural variants and indels within exome data. Nat. Metodlar 9, 176�. doi: 10.1038/nmeth.1810

Klambauer, G., Schwarzbauer, K., Mayr, A., Clevert, D.-A., Mitterecker, A., Bodenhofer, U., et al. (2012). cn.MOPS: mixture of Poissons for discovering copy number variations in next-generation sequencing data with a low false discovery rate. Nuklein turşuları Res. 40:e69. doi: 10.1093/nar/gks003

Korbel, J. O., Abyzov, A., Mu, X. J., Carriero, N., Cayting, P., Zhang, Z., et al. (2009). PEMer: a computational framework with simulation-based error models for inferring genomic structural variants from massive paired-end sequencing data. Genom Biol. 10:R23. doi: 10.1186/gb-2009-10-2-r23

Krishnan, N. M., Gaur, P., Chaudhary, R., Rao, A. A., and Panda, B. (2012). COPS: a sensitive and accurate tool for detecting somatic copy number alterations using short-read sequence data from paired samples. PLoS BİR 7:e47812. doi: 10.1371/journal.pone.0047812

Lam, H. Y. K., Pan, C., Clark, M. J., Lacroute, P., Chen, R., Haraksingh, R., et al. (2012). Detecting and annotating genetic variations using the HugeSeq pipeline. Nat. Biotechnol. 30, 226�. doi: 10.1038/nbt.2134

Layer, R. M., Chiang, C., Quinlan, A. R., and Hall, I. M. (2014). LUMPY: a probabilistic framework for structural variant discovery. Genom Biol. 15:R84. doi: 10.1186/gb-2014-15-6-r84

Li, H. (2011). Tabix: fast retrieval of sequence features from generic TAB-delimited files. Bioinformatika 27, 718�. doi: 10.1093/bioinformatics/btq671

Li, H., Handsaker, B., Wysoker, A., Fennell, T., Ruan, J., Homer, N., et al. (2009). The Sequence alignment/map format and SAMtools. Bioinformatika 25, 2078�. doi: 10.1093/bioinformatics/btp352

Magi, A., Benelli, M., Yoon, S., Roviello, F., and Torricelli, F. (2011). Detecting common copy number variants in high-throughput sequencing data by using JointSLM algorithm. Nuklein turşuları Res. 39:e65. doi: 10.1093/nar/gkr068

Marschall, T., Costa, I. G., Canzar, S., Bauer, M., Klau, G. W., Schliep, A., et al. (2012). CLEVER: clique-enumerating variant finder. Bioinformatika 28, 2875�. doi: 10.1093/bioinformatics/bts566

Medvedev, P., Fiume, M., Dzamba, M., Smith, T., and Brudno, M. (2010). Detecting copy number variation with mated short reads. Genom Res. 20, 1613�. doi: 10.1101/gr.106344.110

Meyers, B. C., Tej, S. S., Vu, T. H., Haudenschild, C. D., Agrawal, V., Edberg, S. B., et al. (2004). The use of MPSS for whole-genome transcriptional analysis in Arabidopsis. Genom Res. 14, 1641�. doi: 10.1101/gr.2275604.1

Michaelson, J. J., and Sebat, J. (2012). forestSV: structural variant discovery through statistical learning. Nat. Metodlar 9, 819�. doi: 10.1038/nmeth.2085

Miller, C. A., Hampton, O., Coarfa, C., and Milosavljevic, A. (2011). ReadDepth: a parallel R package for detecting copy number alterations from short sequencing reads. PLoS BİR 6:e16327. doi: 10.1371/journal.pone.0016327

Mills, R. E., Walter, K., Stewart, C., Handsaker, R. E., Chen, K., Alkan, C., et al. (2011). Mapping copy number variation by population-scale genome sequencing. Təbiət 470, 59�. doi: 10.1038/nature09708

Mimori, T., Nariai, N., Kojima, K., Takahashi, M., Ono, A., Sato, Y., et al. (2013). iSVP: an integrated structural variant calling pipeline from high-throughput sequencing data. BMC Sistemi. Biol. 7 (Suppl. 6):S8. doi: 10.1186/1752-0509-7-S6-S8

Nguyen, H. T., Merriman, T. R., and Black, M. A. (2014). The CNVrd2 package: measurement of copy number at complex loci using high-throughput sequencing data. Ön. Genet. 5:248. doi: 10.3389/fgene.2014.00248

Nijkamp, J. F., van den Broek, M. A., Geertman, J.-M. A., Reinders, M. J. T., Daran, J.-M. G., and de Ridder, D. (2012). De novo detection of copy number variation by co-assembly. Bioinformatika 28, 3195�. doi: 10.1093/bioinformatics/bts601

Qi, J., and Zhao, F. (2011). inGAP-sv: a novel scheme to identify and visualize structural variation from paired end mapping data. Nuklein turşuları Res. 39, W567–W575. doi: 10.1093/nar/gkr506

Quinlan, A. R., Clark, R. A., Sokolova, S., Leibowitz, M. L., Zhang, Y., Hurles, M. E., et al. (2010). Genome-wide mapping and assembly of structural variant breakpoints in the mouse genome. Genom Res. 20, 623�. doi: 10.1101/gr.102970.109

Rausch, T., Zichner, T., Schlattl, A., Stütz, A. M., Benes, V., and Korbel, J. O. (2012). DELLY: structural variant discovery by integrated paired-end and split-read analysis. Bioinformatika 28, i333–i339. doi: 10.1093/bioinformatics/bts378

Rieber, N., Zapatka, M., Lasitschka, B., Jones, D., Northcott, P., Hutter, B., et al. (2013). Coverage bias and sensitivity of variant calling for four whole-genome sequencing technologies. PLoS BİR 8:e66621. doi: 10.1371/journal.pone.0066621

Rizk, G., Gouin, A., Chikhi, R., and Lemaitre, C. (2014). MindTheGap: integrated detection and assembly of short and long insertions. Bioinformatika 30, 3451�. doi: 10.1093/bioinformatics/btu545

Roach, J. C., Glusman, G., Smit, A. F. A., Huff, C. D., Hubley, R., Shannon, P. T., et al. (2010). Analysis of genetic inheritance in a family quartet by whole-genome sequencing. Elm 328, 636�. doi: 10.1126/science.1186802

Schrr, J., Hsu, A., Boyle, S. E., Macintyre, G., Cmero, M., Tothill, R. W., et al. (2014). Socrates: identification of genomic rearrangements in tumour genomes by re-aligning soft clipped reads. Bioinformatika 30, 1064�. doi: 10.1093/bioinformatics/btt767

Shen, Y., Gu, Y., and Peɾr, I. (2011). A hidden Markov model for copy number variant prediction from whole genome resequencing data. BMC Bioinformatics 12 (Suppl. 6):S4. doi: 10.1186/1471-2105-12-S6-S4

Sindi, S. S., Onal, S., Peng, L. C., Wu, H.-T., and Raphael, B. J. (2012). An integrative probabilistic model for identification of structural variation in sequencing data. Genom Biol. 13:R22. doi: 10.1186/gb-2012-13-3-r22

Stittrich, A.-B., Lehman, A., Bodian, D. L., Ashworth, J., Zong, Z., Li, H., et al. (2014). Mutations in NOTCH1 cause Adams-Oliver syndrome. am. J. Hum. Genet. 95, 275�. doi: 10.1016/j.ajhg.2014.07.011

Szatkiewicz, J. P., Wang, W., Sullivan, P. F., Wang, W., and Sun, W. (2013). Improving detection of copy-number variation by simultaneous bias correction and read-depth segmentation. Nuklein turşuları Res. 41, 1519�. doi: 10.1093/nar/gks1363

Teo, S. M., Pawitan, Y., Ku, C. S., Chia, K. S., and Salim, A. (2012). Statistical challenges associated with detecting copy number variations with next-generation sequencing. Bioinformatika 28, 2711�. doi: 10.1093/bioinformatics/bts535

Wang, J., Mullighan, C. G., Easton, J., Roberts, S., Heatley, S. L., Ma, J., et al. (2011). CREST maps somatic structural variation in cancer genomes with base-pair resolution. Nat. Metodlar 8, 652�. doi: 10.1038/nmeth.1628

Wang, Z., Hormozdiari, F., Yang, W.-Y., Halperin, E., and Eskin, E. (2013). CNVeM: copy number variation detection using uncertainty of read mapping. J. Comput. Biol. 20, 224�. doi: 10.1089/cmb.2012.0258

Wong, K., Keane, T. M., Stalker, J., and Adams, D. J. (2010). Enhanced structural variant and breakpoint detection using SVMerge by integration of multiple detection methods and local assembly. Genom Biol. 11:R128. doi: 10.1186/gb-2010-11-12-r128

Wu, Y., Tian, L., Pirastu, M., Stambolian, D., and Li, H. (2013). MATCHCLIP: locate precise breakpoints for copy number variation using CIGAR string by matching soft clipped reads. Ön. Genet. 4:157. doi: 10.3389/fgene.2013.00157

Xi, R., Hadjipanayis, A. G., Luquette, L. J., Kim, T.-M., Lee, E., Zhang, J., et al. (2011). Copy number variation detection in whole-genome sequencing data using the Bayesian information criterion. Proc. Natl. akad. Sci. U.S.A. 108, E1128�. doi: 10.1073/pnas.1110574108

Xie, C., and Tammi, M. T. (2009). CNV-seq, a new method to detect copy number variation using high-throughput sequencing. BMC Bioinformatics 10:80. doi: 10.1186/1471-2105-10-80

Yasuda, T., Suzuki, S., Nagasaki, M., and Miyano, S. (2012). ChopSticks: high-resolution analysis of homozygous deletions by exploiting concordant read pairs. BMC Bioinformatics 13:279. doi: 10.1186/1471-2105-13-279

Ye, K., Schulz, M. H., Long, Q., Apweiler, R., and Ning, Z. (2009). Pindel: a pattern growth approach to detect break points of large deletions and medium sized insertions from paired-end short reads. Bioinformatika 25, 2865�. doi: 10.1093/bioinformatics/btp394

Yoon, S., Xuan, Z., Makarov, V., Ye, K., and Sebat, J. (2009). Sensitive and accurate detection of copy number variants using read depth of coverage. Genom Res. 19, 1586�. doi: 10.1101/gr.092981.109

Zhang, J., and Wu, Y. (2011). SVseq: an approach for detecting exact breakpoints of deletions with low-coverage sequence data. Bioinformatika 27, 3228�. doi: 10.1093/bioinformatics/btr563

Zhang, Q., Ding, L., Larson, D. E., Koboldt, D. C., McLellan, M. D., Chen, K., et al. (2010). CMDS: a population-based method for identifying recurrent DNA copy number aberrations in cancer from high-resolution data. Bioinformatika 26, 464�. doi: 10.1093/bioinformatics/btp708

Zhang, Z. D., Du, J., Lam, H., Abyzov, A., Urban, A. E., Snyder, M., et al. (2011). Identification of genomic indels and structural variations using split reads. BMC Genomics 12:375. doi: 10.1186/1471-2164-12-375

Zhu, M., Need, A. C., Han, Y., Ge, D., Maia, J. M., Zhu, Q., et al. (2012). Using ERDS to infer copy-number variants in high-coverage genomes. am. J. Hum. Genet. 91, 408�. doi: 10.1016/j.ajhg.2012.07.004

Keywords: whole-genome sequencing, structural variation, depth of coverage, signal processing, clinical genomics

Citation: Glusman G, Severson A, Dhankani V, Robinson M, Farrah T, Mauldin DE, Stittrich AB, Ament SA, Roach JC, Brunkow ME, Bodian DL, Vockley JG, Shmulevich I, Niederhuber JE and Hood L (2015) Identification of copy number variants in whole-genome data using Reference Coverage Profiles. Ön. Genet. 6:45. doi: 10.3389/fgene.2015.00045

Received: 30 November 2014 Accepted: 30 January 2015
Published online: 17 February 2015.

Yih-Horng Shiao, US Patent Trademark Office, USA

Tony Merriman, University of Otago, New Zealand
Junjie Fu, Chinese Academy of Agricultural Sciences, China

Copyright © 2015 Glusman, Severson, Dhankani, Robinson, Farrah, Mauldin, Stittrich, Ament, Roach, Brunkow, Bodian, Vockley, Shmulevich, Niederhuber and Hood. Bu, Creative Commons Attribution License (CC BY) şərtləri əsasında yayılan açıq girişli məqalədir. Qəbul edilmiş akademik təcrübəyə uyğun olaraq, orijinal müəllif(lər) və ya lisenziar kredit verildiyi və bu jurnaldakı orijinal nəşrə istinad edildiyi təqdirdə digər forumlarda istifadəyə, yayılmasına və ya təkrar istehsalına icazə verilir. Bu şərtlərə uyğun olmayan heç bir istifadə, paylama və ya təkrar istehsala icazə verilmir.


Videoya baxın: Törəmə təkrarı. Bütün düsturların təkrarı.Hansı kitabdan və videodan fərq etməz mütləq təkrarlayın (Iyul 2022).


Şərhlər:

  1. Jaroslav

    umatovo

  2. Zuluzuru

    KEYFİYYƏT PİS AMMA GÖRƏ BİLƏRSİNİZ

  3. Kay

    Not to everybody.



Mesaj yazmaq