Məlumat

MinION nə yaxşıdır?

MinION nə yaxşıdır?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Bu il Oxford Nanopore MinION bəzi tədqiqatçılara sınaq üçün göndərilib.

Diaqnostika və fərdiləşdirilmiş tibb üçün masa üstü sequencerin üstünlüyü göz qabağındadır. Eynilə, "sahədə" araşdırma və məhkəmə elminə bu cihaz çox kömək edə bilər. Sualım tədqiqat laboratoriyasındakı tətbiqlərlə bağlıdır.

MinION nə edir ki, Sanger-ə çıxışı olan yaxşı təchiz olunmuş laboratoriya və növbəti nəsil ardıcıllıq artıq edə bilməz?

MinION nə qədər yaxşı işləyir? Nə qədər güclüdür?

MinION istifadə edərək hansı mühüm elmi kəşflər edilir?

Oxford Nanopore veb-saytında nəşrlərin siyahısı olsa da, ən sonuncusu 2013-cü ilə aiddir. Bu, erkən giriş proqramı başlamazdan əvvəldir - 2014-cü ilin fevralından bəri baş verən hadisələr məni xüsusilə maraqlandırır.


Oxford Nanopore portativ genom sekvenseri - MinION-u təqdim etdi

Bu diaqram elektrikə davamlı membran ikiqat qatında yığılmış zülal nanoporunu göstərir. İon cərəyanı bu membran üzərində gərginlik təyin edilərək nanopordan keçirilir. Kredit: Oxford Nanopore Technologies

(Phys.org) - Böyük Britaniya Oxford Nanopore Technologies şirkəti iki il əvvəl nanopore texnologiyasına əsaslanan ucuz genom sekvenseri istehsal etmək vədini yerinə yetirdi. David Jaffe, Broad Institute ilə birlikdə keçən həftə Floridada keçirilən Genom Biologiyası və Texnologiyasında İrəliləyişlər yığıncağında dinləyicilərə bildirdi ki, Oxford Nanopore ondan MinION adlı yeni cihazı sınamağı xahiş edib və bunun belə olduğunu tapıb. ümidverici.

Oxford Nanopore Technologies 2012-ci ildə biologiya elmləri dünyasında səs-küy yaratdı ki, şirkətin nümayəndələri öz tədqiqat qrupunun nanopore texnologiyasına əsaslanan ardıcıllıq cihazını uğurla yaratdığını və ucuz prototipin tezliklə şirkətdən kənar tədqiqatçılara çatdırılacağını elan etdi. Göründüyü kimi, şirkət məsamə texnologiyasını genişləndirməkdə çətinlik çəkdi və bəzi alternativ materiallar tapmalı oldu - beləliklə, iki il gecikmə.

Nanopore sequencing, DNT-nin tək zəncirlərinin məsamə vasitəsilə çəkildiyi yerdir (hər bir əsas cütü məsamədən keçərkən onun keçiriciliyi ölçülür) kompüter tərəfindən identifikasiya üçün istifadə edilə bilən məlumatdır. Bu yanaşmanın üstünlüyü ondan ibarətdir ki, ən azı prinsipcə, hər hansı bir ip uzunluğu ardıcıllıqla edilə bilər.

MinION hələ satışda deyil - hazırda şirkət prototipləri genom ardıcıllığı sahəsində seçilmiş bir neçə görkəmli şəxsə təqdim edir - hər biri şərəf üçün ilkin ödəniş kimi 1000 dollar qazanmalı olacaq. Cihaz emal edən kompüterdəki porta qoşulur. Saqqız paketinin ölçüsü ilə müqayisə edilən cihazla yanaşı, Oxford Nanopore Technologies tədqiqatçıların yeni cihazdan necə istifadə edəcəyini öyrənmək üçün istifadə edə biləcəkləri DNT nümunələrini də göndərəcək - bundan sonra onlar istədikləri hər şeyi ardıcıllıqla sıralaya bilərlər. Ona göndərilən iki növ bakterial DNT-nin zəncirlərini sınaqdan keçirərkən, Jaffe qarışıq nəticələr əldə etdiyini bildirdi - bəzi hallarda uzun məlumatlar düzgün əldə edildi, lakin bəzilərində bəzi səhvlər var idi. Məsələn, bir növ bakteriyanın bütün genomunu yığmaq üçün o, başqa bir şirkət tərəfindən istehsal olunan sekvensləmə cihazından da istifadə etməli idi. O qeyd etdi ki, o, cihazla bağlı nikbindir, lakin Oksford Nanopore-dən olan nümayəndələr onu əmin ediblər ki, hətta laboratoriyada cihazda təkmilləşdirmələr aparılsa belə, müəyyən üsullardan istifadə etməklə səhv nisbətlərini azaltmaq olar.

Əgər MinION-dan istifadə edən səhv nisbətləri praktiki səviyyəyə endirilə bilərsə, cihaz gemon sıralamasında dönüş nöqtəsini qeyd edə bilər, çünki bu, daşına və sahə işləri üçün istifadə edilə bilən bir cihaz olardı. Belə bir cihazın qiyməti açıqlanmasa da, Oxford Nanopore onu təsvir etmək üçün dəfələrlə ucuz və sərfəli kimi terminlərdən istifadə etmişdir ki, bu da onun satışa hazır olduqdan sonra hazırda markerdə olan digər ardıcıllıq cihazlarından xeyli ucuz başa gələcəyini göstərir.


Nanopore MinION ardıcıllığı

Oksford Nanopore MinION DNT sıralama sistemi, DNT-nin uzun hissələrinin ardıcıllaşdırılması üçün yeni "nanopore texnologiyasından istifadə edir. Qısacası, böyük nanoməsamələr sintetik, elektrikə davamlı membrana daxil edilir. Məsamələrdə ion cərəyanı yaradan membran boyunca bir gərginlik təyin olunur. Bağlanmış zülallarla işarələnmiş DNT molekulları nanoməsamələrə yönəldilir və elektrik sahəsi məsamə dəliyində DNT-yə bağlanan prosessiv ferment tərəfindən idarə olunan sürətdə fərdi DNT zəncirlərini bioloji nanoməsamələrdən keçir. Hər bir baza nanoməsamələrdə cərəyandakı dəyişiklikləri ölçməklə müəyyən edilir. Oxuma uzunluğu ardıcıllıq üçün təqdim edilən DNT fraqmentlərinin uzunluğunu əks etdirir.
Bu texnologiya haqqında ətraflı məlumatı burada tapa bilərsiniz https://nanoporetech.com.

Kiçik genomların və ya genomik lokusların Illumina oxunuşlarından əldə edilən boşluqları bağlamaq və kontigləri birləşdirmək üçün MinION uzun oxunuşlardan istifadə olunur və MCIC Hesablama Biologiya Laboratoriyasında lazımi bioinformatika alətləri quraşdırılmışdır.

Kitabxananın hazırlanması və ardıcıllığı

Kitabxananın hazırlanması DNT-nin parçalanması mərhələsini, adapterlərin bağlanmasını (indeksli və ya indekssiz), isteğe bağlı PCR gücləndirilməsini və zəncir/motor zülalının DNT molekullarının 5' ucuna yekun əlavə edilməsini əhatə edir. Giriş DNT-si 20 ng qədər aşağı ola bilər, lakin PCR pulsuz kitabxana hazırlama protokolu üçün ən azı 1-2 ug DNT lazımdır. Uzun və keyfiyyətli oxunuşlar əldə etmək üçün bütöv, yüksək molekulyar çəkili genomik DNT-nin hazırlanması çox vacibdir.

Ardıcıllıq təxminən 48 saat çəkir. İş zamanı məlumatlar yerli olaraq toplanır və Nanopre bulud hesablamalarına yüklənir, burada Metrichor proqram təminatından istifadə etməklə təhlil edilir. Metrichore proqramı həmçinin qaçışın keyfiyyəti ilə bağlı real vaxtda rəy verir. Oxunmaların uzunluğu DNT-nin parçalanma ölçüsündən və keyfiyyətindən (nick yoxdur) asılıdır. Sistem 200Kb-dən çox ardıcıl oxunuşlar istehsal etməyə qadirdir və bir axın hüceyrəsi üçün düşünmə qabiliyyəti hazırda

100-200 Mb. Hər bir fərdi şablon üçün daha aşağı ötürmə qabiliyyəti tələb olunarsa, bir neçə müxtəlif şablon axın xanasında ardıcıl olaraq sıralana bilər.

Əgər siz MinION ardıcıllığı layihəsinə başlamaq istəyirsinizsə, lütfən, e-poçt vasitəsilə və ya 330-263-3828 nömrəsinə zəng edərək MCIC işçiləri ilə əlaqə saxlayın.


2 Cavab 2

Qısa cavab: bəli, lakin bunu etməzdən əvvəl ONT-dən icazə (və dəyişdirilmiş proqram təminatı) almalısınız.

. lakin bu, bütün hekayəni izah etmir. Bu sual çox çaşdırıcı ola bilər və bu sual verənin heç bir günahı deyil. Məsələ ondadır ki, MinION üçün ardıcıllıq (və ya daha dəqiq desək, elektrik siqnalı izi şəklində xam verilənlərin yaradılması) əsas çağırışdan fərqli və ayrıla biləndir. Bir çox digər sekvenserlər də fərqli xam məlumatlara və əsas çağırış mərhələlərinə malikdir, lakin onlar MinION-da olduqları dərəcədə demokratikləşdirilməyiblər.

MinION ardıcıllığının "ardıcıllıq" hissəsi ONT proqramı, yəni MinKNOW tərəfindən həyata keçirilir. PoreCampAU 2017 zamanı mənə izah edildiyi kimi, MinION əvvəlcə kompüterə qoşulduqda ardıcıllığı həyata keçirmək üçün lazım olan proqram təminatı yoxdur. Bu proqram təminatının ən son versiyası adətən ONT serverlərinə sorğu göndərilməklə ardıcıllığın başlanğıcında endirilir. Adi halda siz həmin serverlərə daxil ola bilmədən ardıcıllığı edə bilməzsiniz və ONT-nin bundan xəbəri olmadan sekvensiya edə bilməzsiniz. Bununla belə, ONT etiraf edir ki, orada ardıcıllıqla (məsələn, Afrikada Ebola ardıcıllığı və ya okeanın ortasında metagenomik ardıcıllıqla) internetə çıxışı olmayan insanlar var və səbəbləri ilə [email protected]> ünvanına e-poçt göndərilə bilər. yerli ardıcıllıq probleminin sürətli proqram təminatı ilə nəticələnməsi.

Xam siqnallar əldə edildikdən sonra, MinION ardıcıllığının "əsas çağırış" hissəsi istənilən yerdə edilə bilər. ONT tərəfindən idarə olunan əsas zəng edən Albacore-dur və bu, ardıcıllıq texnologiyası dəyişdirildikdə (bu, çox olur) ilk model yeniləmələrini alacaq. Albacore yerli əsas zəng edəndir və ONT-dən icma səhifələrinə baxaraq əldə edilə bilər (MinION olan hər kəs üçün mövcuddur) ONT yalnız AWS serverlərindən istifadənin çox olduğunu müəyyən etdikdən sonra təxminən 2017-ci ilin aprelində insanlara yerli olaraq əsas zəng etməyə icazə verməyə keçdi. bahalı. Albacore açıq mənbədir və pivədə pulsuzdur, lakin proqramın yayılmasını (və dəyişdirilməsini) məhdudlaşdıran məhdudlaşdırıcı lisenziya müqaviləsinə malikdir. Bununla belə, Albacore yeganə mövcud baza zəngçisi deyil. ONT nanonet adlı bir FOSS bazası çağıran təmin edir. Texnologiyada Albacore-dan bir az geri qalır, lakin ONT bütün faydalı Albacore dəyişikliklərinin nəticədə nanonetə yayılacağını söylədi. Baza zəng etmək üçün neyron şəbəkəsindən istifadə etdiyindən xəbərdar olduğum başqa bir qeyri-ONT baza çağırıcısı var: deepnano. Hər biri texnologiya baxımından fərqli məsafələrdə olan digər əsas zəng edənlər mövcuddur və mən texnologiya sabitləşdikcə və daha çox dəyişikliyə davamlı kompüter alimləri işə qoşulduqca gələcəkdə daha çoxunun görünəcəyini gözləyirəm.

Redaktə: ONT indiyə qədər baxdığım bütün repozitoriyalar (Cliveome istisna olmaqla) Mozilla İctimai Lisenziyası (pulsuz və açıq mənbə, bəzi şərtlər və məhdudiyyətlərlə) əsasında buraxılıb. . Həmin proqram təminatı repozitoriyasına Albacore-un sınaqdan çıxmış / ən son versiyası olan Scrappie daxildir.


Materiallar və metodlar

Məlum Növlərlə Barkod Testi

DNT ştrix kodlamasını dörd fərqli nematod növü üzərində sınaqdan keçirdik, Anisakis sadə, Panagrellus redivius, Turbatrix aceti, və Caenorhabditis elegans. Bu növlər müxtəlif həyat tərzinə malik olan parazit və sərbəst yaşayan növlərin bir hissəsini təmsil edir.

Anisakis sadə təzə skumbriyadan parçalanmış və 70% etanolda saxlanılmış və DNT ekstraktı üçün bir fərdi nematod seçilmişdir. A. simpleks teleostlara və kalamarlara yoluxmaq üçün xərçəngkimilərdən ara ev sahibi kimi istifadə edən dəniz parazitidir (Anderson, 2000). Baxmayaraq ki, insanlar təsadüfi ev sahibidirlər Anisakis spp., son onilliklər ərzində ciddi zoonoz xəstəlik olan anisakiozun yayılmasında kəskin artım olmuşdur (Chai et al., 2005).

Panagrellus redivius yulaf ezmesi mühitində böyüyən təzə kulturadan yığılmış və DNT ekstraktı üçün istifadə edilmişdir. P. redivivus orqan inkişafını, siqnal ötürülməsini və toksikologiyanı öyrənmək üçün model sistem kimi istifadə edilən və bu yaxınlarda tam genomu və transkriptomu ardıcıllıqla tərtib edilmiş sərbəst yaşayan nematoddur (Srinivasan et al., 2013). Növlər digərləri arasında müqayisəli model kimi təklif olunur Strongyloides, çünki parazit taksonları sahiblərindən asılı olmayaraq yetişdirmək və təhlil etmək adətən çətindir (Blaxter et al., 1998).

Turbatrix aceti alma suyu sirkəsi mühitində təzə mədəniyyətdən yığılmış və DNT ekstraktı üçün istifadə edilmişdir. Sirkə mühitinin sonrakı Polimeraza Zəncirvari Reaksiyasına (PZR) inhibə edici təsirini azaltmaq üçün nematodlar DNT ekstraksiyasından əvvəl üç dəfə distillə edilmiş suda yuyuldu. T. aceti kimi digər sərbəst yaşayan nematodlarla paylaşılan yaşlanma fenotipləri ilə əlaqədar olaraq daha çox araşdırılan sərbəst yaşayan nematoddur. Caenorhabditis elegans (Reiss və Rothstein, 1975). O, həmçinin bir çox balıq növlərinin sürfə mərhələsində canlı qida kimi istifadə olunur (Brüggemann, 2012). Onun düzgün genetik tədqiqatları yoxdur, bu da onu əsasən morfoloji cəhətdən öyrənilən nematod növlərinin əksəriyyəti üçün maraqlı bir nümayəndə edir.

Caenorhabditis elegans N2 ştammı ilə nematodların böyümə mühiti (NGM) plitələrində yetişdirilmişdir E. coli OP50 standart prosedurlardan istifadə edərək bir neçə gün ərzində (Brenner, 1974) və sonra DNT hasilatı üçün yığılmışdır.

DNT-nin çıxarılması, PCR və ardıcıllıq

DNT-ni GeneJET Genomik DNT Təmizləmə Kitindən (ThermoFisher Scientific Ltd., Paisley, Birləşmiş Krallıq) istifadə edərək, istehsalçının məməlilərin toxuması və gəmirici quyruğunun genomik DNT-nin təmizlənməsi (protokol A) təlimatlarına uyğun olaraq çıxardıq. 3) tam kutikulun parçalanmasını təmin etmək. DNT təmizliyi NanoDrop 2000 spektrofotometrində ölçüldü (proqram təminatı: NanoDrop2000, versiya 1.4.2 ThermoFisher Scientific Ltd., Paisley, Birləşmiş Krallıq).

Floyd və digərləri tərəfindən optimallaşdırılmış primerlər və termosikl protokolundan istifadə edərək, DNT nümunələrimizdən 18S SSU rRNA geninin daxili fraqmentini gücləndirdik. (2005). Bu fraqment � bp uzunluğundadır və nematod növlərinin identifikasiyası üçün geniş istifadə olunur. ONT-nin təlimatına uyğun olaraq biz Floyd və digərlərinin primerlərini uyğunlaşdırdıq. (2005) MiniION iş axınları ilə uyğun gələn 5 ucunda (CMinION quyruğu, kiçik hərflə ”) bir adapter quyruğunu daxil etmək. Bu, aşağıdakı irəli primerlə nəticələndi: Nem_18S_F_MinION: 5′ tttctgttggtgctgatattgcCGCGAA TRGCTCATTACAACAGC 3′ və tərs astar: Nem_18S_ R_MinION: 5′ tttctgttggtgctgatattgcCGCGAA Fərqli bir primer cütü, SSU18A və SSU26R (Floyd et al., 2002) əvvəlcə MinION quyruqları ilə sınaqdan keçirildi, lakin bu nümunələr üçün PCR gücləndirmə ilə nəticələndi. Hər 25 BCl PCR qarışığında 2 μl təmizlənmiş DNT ekstraktı, hər biri 0,5 μl irəli və tərs primerlər (10 μM Sigma-Aldrich/Merck Ltd., Poole, Birləşmiş Krallıq), 9,5 μl nukleaz var idi. pulsuz su (NFW ThermoFisher Scientific Ltd., Paisley, Birləşmiş Krallıq) və 2X GoTaq Hot Start Colorless Master Mix (Promega, Southampton, Birləşmiş Krallıq). PCR Bio-Rad T100 Termal Cycler (Bio-Rad Laboratories Ltd., Watford, Birləşmiş Krallıq) üzərində aparılmışdır. PCR protokolu Floyd və digərləri ilə eyni qaldı. (2005): 94°C-də 5 dəqiqəlik ilkin denaturasiya, ardınca 94°C-də 30 saniyə ərzində 35 denaturasiya dövrü, 54°C-də 30 saniyəlik yumşalma və 72°C-də 1 dəqiqəlik uzadılma, bütün bunlardan sonra yekun a. 72ºC-də 10 dəqiqə uzadılır və 12ºC-ə qədər soyudulur.

Uğurlu gücləndirmə 1x TBE tamponu (Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) ilə hazırlanmış 2% agaroz gel (Agarose I, Molecular Biology Grade Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) istifadə edilməklə təsdiq edilmişdir. x03BCl NovelJuice nuklein turşusu ləkəsi (Sigma-Aldrich/Merck Ltd., Poole, Birləşmiş Krallıq) hər bir nümunə və ölçü nərdivanı ilə yüklənmişdir. PCR məhsulları istehsalçının göstərişinə əsasən GeneJET PCR Təmizləmə Kitindən (Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) istifadə edilərək təmizləndi və 50 ºBCl Elüsyon Tamponunda elüt edildi. DNT təmizliyi NanoDrop 2000 spektrofotometrində (proqram təminatı: NanoDrop2000, versiya 1.4.2 Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) və DNT konsentrasiyası Qubit 1.0 (Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) ilə ölçüldü. Qubit dsDNA HS Assay Kit (Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq). Ölçmənin düzgünlüyünü təsdiqləmək üçün həm Nanodrop, həm də Qubit ölçmələri nümunə başına iki dəfə ölçüldü.

Biz MinION kitabxanasını ONT-dən (PBAC12_9067_v109_revH_23MAY2018 versiyası) 1D PCR ştrix kodlaşdırma amplikonları/cDNA (SQK-LSK109) protokoluna uyğun hazırladıq. Bu protokol indeksləşdirmə vasitəsi kimi bizim birinci raund PCR məhsullarımıza ONT barkodlarını əlavə etmək üçün ikinci PCR-ni özündə birləşdirir ki, bu da çoxsaylı nümunələrin bir axın hüceyrəsində işləməsinə və bioinformatika mərhələsində sonrakı demultipleksləşdirməyə imkan verir. Qısaca olaraq, PCR Barkodlama Dəsti (EXP-PBC001 ONT Ltd., Oksford, Birləşmiş Krallıq) 2 μl ştrix kodu (10 μM ONT Ltd., Oksford, Birləşmiş Krallıq) olan 100 BCl PCR qarışığı hazırlamaq üçün istifadə edilmişdir. ), 48 μl birinci dövrə PCR məhsulu və 50 μl 2X LongAmp Taq Master Mix [New England BioLabs (NEB) Inc., Hitchin, Birləşmiş Krallıq].

Biz ştrix-kodlu PCR üçün ekvimolyar konsentrasiyalarda birinci dövrə PZR məhsullarını hazırlamağa çalışdıq, lakin nümunələr arasında DNT konsentrasiyalarında böyük fərqlərə görə biz ilk turun PCR məhsulunu seyreltdik. A. simpleksP. redivivus 100 ilə 150 ​​fmol arasında və bütün birinci dövrə PCR məhsulu üçün istifadə edilmişdir T. aceti. A. simpleks 05 nömrəli barkod qəbul edildi, P. redivivus barkod 06 və T. aceti barkod 07. PCR Bio-Rad T100 Termal Cycler (Bio-Rad Laboratories Ltd., Watford, Birləşmiş Krallıq) üzərində aparılmışdır. Amplikon uzunluğunun ≈223C1,000 bp (primerlər daxil olmaqla) üçün PCR protokolu aşağıdakı kimi idi: ilkin denaturasiya 3 dəqiqə @ 95 ° C denaturasiya 15 s 95 ° C-də, tavlama 15 s 62 ° C, uzadılması 65ºC (bütün 15 dövr) 65ºC-də son uzadılma 50º 4ºC-də saxlanılır. PCR məhsulları 1X Agencourt AMPure XP muncuqları ilə təmizləndi (Beckman Coulter Inc., İndianapolis, IN, Amerika Birləşmiş Ştatları). Nəhayət, Qubit dsDNA HS Test Kitindən (Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) istifadə etməklə Qubit 1.0 (Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) üzərində təmizlənmiş ikinci dövrə PCR məhsulu üçün 1 μl kəmiyyəti müəyyən edilmişdir. .

-nin konsentrasiyası A. simpleksP. redivivus DNT Qubit kəmiyyəti üçün çox yüksək idi, ona görə də biz irəli götürülən NFW-də (Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) 1/5 seyreltmə hazırladıq və kəmiyyətini təyin etdik. İkinci tur PCR məhsulları 47 ºBCl NFW-də (Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) təxminən ekvimolyar konsentrasiyalarda birləşdirildi.

Kitabxananın hazırlanması istehsalçının təlimatlarına uyğun olaraq Ligation Sequencing Kit (SQK-LSK109 ONT Ltd., Oksford, Birləşmiş Krallıq) reagentlərindən istifadə etməklə davam etdi. Qısaca olaraq, biz 47 μl NFW (ThermoFisher Scientific Ltd., Paisley, Birləşmiş Krallıq) ərazisində 325 ng birləşdirilmiş barkodlu kitabxana hazırladıq. Gücləndirilmiş məhsul NEBNext Ultra II End-Repair/dA-tailing modulu (NEB Inc., Hitchin, Birləşmiş Krallıq) istifadə edərək 20°C-də 5 dəqiqə və 65°C-də 5 dəqiqə ərzində son təmir edilib, sonra o, təmizlənmişdir. 1X Agencourt AMPure XP muncuqları (Beckman Coulter Inc., Indianapolis, IN, Amerika Birləşmiş Ştatları). Adapter bağlaması NEB Blunt/TA Ligation Master Mix (NEB Inc., Hitchin, Birləşmiş Krallıq) və SQK-LSK109 dəstində təqdim olunan reagentlərdən istifadə etməklə həyata keçirilib. Liqasiya otaq temperaturunda 10 dəqiqə davam etdi. DNT 0,4X AMPure XP muncuqları ilə təmizləndikdən və SQK-LSK109 dəstində təqdim olunan Qısa Fraqment Tamponu ilə yuyulduqdan sonra 15 μl Elüsyon Buferində elüt edilib. Hazırlanmış kitabxananın 1 μl miqdarı Qubit dsDNA HS Test Kitindən (Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) istifadə edilməklə Qubit 1.0 (Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) üzərində ölçüldü və 6,36 ölçü verdi. ng/μl, bu da 102,9 fmol molyarlığına bərabərdir.

ONT-dən olan protokol axın hüceyrəsinə 5-50 fmol amplikon məhsulunun yüklənməsini tövsiyə edir, ona görə də biz axın hüceyrəsinə 40 fmol kitabxana yükləmək üçün 6,56 μl Elüsyon Buferində 5,44 µm hazırlanmış kitabxananı seyreltdik. Hava qabarcıqlarının daxil olmasının qarşısını almaq üçün axın hüceyrəsi 1 ml astarlama qarışığı (bir Flush Bufer borusunda 30 º BCl Flush Tether) ilə yuyularaq yüklənmə üçün hazırlanmışdır. Kitabxana 37,5 μl Sequencing Buferi, 25,5 μl Loading Boncukları və 12 μl seyreltilmiş DNT kitabxanasını qarışdırmaqla yükləmə üçün hazırlanmışdır, bundan sonra nümunə SpotON nümunəsi vasitəsilə R9.5.1 tipli axın hüceyrəsinə əlavə edilmişdir. liman. Ümumi kitabxanaya hazırlıq vaxtı 𢏃 saat olaraq təxmin edildi.

Biz MinKNOW (versiya 3.4.5 ONT Ltd., Oksford, Birləşmiş Krallıq) istifadə edərək, MinIT-də (xüsusi ONT Ltd., Oksford, Birləşmiş Krallıq) sekvensiya işini həyata keçirdik. axın hüceyrə növü və istifadə edilən eksperimental dəst. MinKNOW proqramı axın hüceyrəsinin keyfiyyətinin metrikası olaraq, hər qaçışdan əvvəl multipleksor (MUX) skanında axın hüceyrəsinin aktiv məsamə sayını qiymətləndirir. Daha yüksək aktiv məsamə sayları maksimum 2,048 və 800 zəmanət səviyyəsi ilə yüksək axın hüceyrə keyfiyyətini təmsil edir. Bizim axın hüceyrəmizdə ardıcıllıq üçün 1,097 məsamə var idi. Axın hüceyrəsi 10 dəqiqə ardıcıllıqla 116,620 oxunuş yaratdı, bundan sonra qaçış dayandırıldı. Daha sonra axın hüceyrəsi Yuma Kitindən (EXP-WSH002 ONT Ltd., Oksford, Birləşmiş Krallıq) istifadə edərək 150 º3BCl A məhlulu, ardınca 500 º03BCl saxlama məhlulu ilə yuyuldu və təkrar istifadə üçün soyuducuda saxlandı. .

Portativ DNT Ekstraksiya, PCR və Sequencing

Sahə işlərinə hazırlaşarkən biz hazırlanmış MinION prosedurunun tam portativ sistemdə də həyata keçirilə biləcəyini sınaqdan keçirdik. Model orqanizmi hazırladıq C. elegans Portativ molekulyar laboratoriya, Bentolab Pro 3 (Nature Biotechnology, 2016 Bento Bioworks Ltd., London, Birləşmiş Krallıq) və çoxlu alət (CMFTLi 10.8V Li-Ion Simsiz Çoxfunksiyalı Alət, Clarke International Ltd., Epping, Birləşmiş Krallıq) aşağı qiymətli əl burulğanı kimi. Prosedurların əksəriyyəti yuxarıdakılara bənzəyir, lakin Bentolab üzərində işləmək üçün protokollara bəzi əsas uyğunlaşmalar tələb olunur.

GeneJET Genomik DNT Təmizləmə Kitindən (ThermoFisher Scientific Ltd., Paisley, Birləşmiş Krallıq) istifadə edərək DNT-ni məməlilərin toxuması və gəmirici quyruğunun genomik DNT-nin təmizlənməsi (protokol A) üçün istehsalçının təlimatlarına uyğun olaraq çıxardıq. Bu protokolun Bentolab üzərində işləməsi üçün prosedura uyğunlaşmalar aşağıdakı kimi idi: 3-cü addımda nümunə iki 0,2 ml PCR borusuna bölündü və Bentolab sentrifuqasından (Bento Bioworks Ltd., London, Birləşmiş Krallıq) istifadə edərək qısa müddətə fırlandı. ). Daha sonra iki PCR borusu istilik bloku kimi Bentolabs termosiklindən (Bento Bioworks Ltd., London, Birləşmiş Krallıq) istifadə edilərək 56°C-də 18 saat inkubasiya edildi. Thermocycler protokolu 56°C-də 1 saatlıq 18 dövrə yerinə yetirdi. 4-cü addımda lizat daha sonra 1,5 ml sentrifuqaya köçürüldü, 20 ½ RNase A əlavə edildi və multi alətdə 4 burulğan edildi. Çox alətdə vorteksləmə 𠇍üz mişar bıçağı” multi alətə əlavə etməklə əldə edilə bilər. Bu bıçaq eyni vaxtda dörd sentrifuqa borusu üçün kifayət qədər yer təmin edir. Təhlükəsizlik tədbiri olaraq mişar bıçağının iti ucu ördək lenti ilə örtülmüşdür. Sonra santrifüj borusu bıçağa ördək lenti ilə əlavə edildi və sıx uyğunluq təmin edildi. Çox alət ən yüksək sürətlə (21.000 vuruş/dəqiqədə) işə salınaraq laboratoriya burulğanına bənzər effekt yaratdı. 5 və 6-cı addımda burulğan çox alətdən istifadə etməklə həyata keçirilib. 7-ci addımda GeneJet təmizləmə sütununun 2 ml-lik toplama borusu qapağı kəsilmiş 1,5 ml sentrifuqa borusu ilə əvəz olundu. Bentolab's sentrifuqası yalnız 1,5 ml boruları idarə edə bilər 2 ml toplama/sentrifuqa borularından istifadə kiçik plastik hissəciklərə gətirib çıxaracaq ki, bu da sentrifuqa kilidləmə sisteminin səmərəliliyinin azalmasına səbəb ola bilər. Yığım borusunun həcmi azaldığından, lizat hazırlanmış sütuna bir dəfəyə maksimum 350 ºCl əlavə edildi, bundan sonra nümunə 1 dəqiqə 6000 º7 q-da sentrifuqa edildi və axın atıldı ( 7-ci addımı tamamlamaq üçün lazım olan cəmi üç təkrarla). 8-ci addımda bir dəfəyə 250 μl Yuma Buferi I əlavə edildi və 1 dəqiqə 8000 × g-də sentrifuqa edildi və axın atıldı (8-ci addımı tamamlamaq üçün cəmi iki təkrarlama lazımdır). 9-cu addımda bir anda 250 ½ Yuma Buferi II əlavə edildi və 8000 º7 q-da 4 dəqiqə sentrifuqa edildi və axın atıldı (9-cu addımı tamamlamaq üçün cəmi iki təkrarlama lazımdır və kompensasiya üçün artırılmış sentrifuqa vaxtı ilə) Bentolab sentrifuqasının maksimum 8000 × g qüvvəsi üçün). 8000 q-da 1 dəqiqəlik əlavə quru fırlanma yerinə yetirildi, bundan sonra toplama borusu atıldı və steril 1,5 ml sentrifuqa borusu ilə əvəz olundu. 10-cu addımda təmizləmə sütununa 50 μl Elüsyon Tamponu əlavə edildi.

PCR yuxarıda təsvir olunduğu kimi hazırlanmışdır, lakin bu dəfə Bentolab termosikl cihazından (Bento Bioworks Ltd., London, Birləşmiş Krallıq) istifadə edilmişdir. Həmçinin, alüminium folqa PCR başlığına alternativ olaraq steril iş mühiti kimi istifadə edilmişdir. Alüminium folqa maskalama lentindən istifadə edərək dəzgah boşluğuna yapışdırıldı. Ağartıcı (suda 1:10 nisbətində seyreltmə) səthə səpildi, 3 dəqiqə dayanmasına icazə verildi və səth təmiz kağız salfetka ilə silindi. Zərərsizləşdirmək üçün bu proses iki dəfə təkrarlandı, bundan sonra hər hansı qalıq ağartıcının çıxarılması üçün 70% etanol istifadə edildi. Nem_18S_F/R_MinION primerləri işləmədi C. elegans, belə ki, Floyd et al. (2002) MinION quyruqları ilə istifadə edilmişdir (kiçik hərflərlə). İrəli astar: SSU18A_MinION: 5′ tttctgttggtgctgatattgcAAAGATTAAGCCATGCATG 3′ və tərs astar: SSU26R_MinION: 5′ acttgcctgtcgctATCATTCTTG32 acttgcctgtcgctATCATTCTG3G2. Hər 25 BCl PCR qarışığında 2 μl təmizlənmiş DNT ekstraktı, hər biri 0,5 μl irəli və tərs primerlər (10 μM Sigma-Aldrich/Merck Ltd., Poole, Birləşmiş Krallıq), 9,5 μl nukleaz var idi. pulsuz su (NFW Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) və 2X GoTaq Hot Start Colorless Master Mix (Promega, Southampton, Birləşmiş Krallıq). PCR Bentolab cihazında (Bento Bioworks Ltd., London, Böyük Britaniya) həyata keçirilib. PCR protokolu Floyd və digərlərindən uyğunlaşdırılmışdır. (2002): ilkin denaturasiya 94°C-də 5 dəqiqə denaturasiya 94°C-də 1 dəq, 60°C-də 1.5 dəq yumşalma, 72°C-də uzadılma 2 dəq (bütün 35 dövr) son uzadılma 07°C-də 10 dəq. 12ଌ.

Uğurlu gücləndirmə 1x TBE buferi (Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) ilə hazırlanmış 2% agaroz geldən (Agarose I, Molecular Biology Grade Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) istifadə edilməklə təsdiq edilmişdir. Bentolabın kiçik gel kamerası (Bento Bioworks Ltd., London, Birləşmiş Krallıq) üçün biz 0,5 q agaroza ilə 27,5 ml 1X TBE buferindən istifadə etdik. Tərəzi ehtiyacı 0,5 q agaroza uyğun gələn lazımi həcmlə işarələnmiş Eppendorf borusundan istifadə etməklə aradan qaldırıldı. Agaroza plitə üzərində tipik konusvari formaya malik ənənəvi qəhvə qabından istifadə edərək TBE buferində əridildi. Düşərgə sobasında işləmək üçün bu üsulu da tapdıq. Sonra gel kameraya töküldü və � dəq. Daraq və qapaqlar çıxarıldı və biz gel elektroforezinin aparılması üçün 45 ml 1x TBE buferi əlavə etdik, 60V-da 60 dəqiqə. DNT-nin boyanması üçün ölçü nərdivanı və hər bir nümunə üçün yenidən 1 μl NovelJuice (Sigma-Aldrich/Merck Ltd., Poole, Birləşmiş Krallıq) istifadə etdik, çünki bu DNT ləkəsi ənənəvi etidium bromidlə müqayisədə daha təhlükəsizdir və hər ikisi ilə işləyir. UV transilluminatorları və Bentolabın mavi LED transilluminatoru ilə (Bento Bioworks Ltd., London, Birləşmiş Krallıq).

PCR məhsulu GeneJET PCR Təmizləmə Kitindən (Thermo Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq) istifadə edərək, istehsalçının sentrifuqadan istifadə edərək DNT-nin təmizlənməsi üçün təlimatına (protokol A) uyğun olaraq təmizləndi. Bu protokolun Bentolab üzərində işləməsi üçün prosedura uyğunlaşmalar aşağıdakı kimi idi: 3-cü addımda GeneJet təmizləmə sütununun 2 ml-lik toplama borusu qapağı kəsilmiş 1,5 ml sentrifuqa borusu ilə əvəz olundu (DNT təmizləmə protokoluna uyğunlaşmalara baxın). izahat üçün). 1-ci addımın məhlulu təmizləmə sütununa əlavə edildi, 8000 º7 q-da 1 dəqiqə sentrifuqa edildi və axın atıldı. 4-cü addımda bir dəfəyə 350 º03BCl Yuma Buferi əlavə edildi və 1 dəqiqə 8000 º7 q-da sentrifuqa edildi və axın atıldı (4-cü addımı tamamlamaq üçün cəmi iki təkrarlama lazımdır). 5-ci addımda 8000 º7 q-da 1,5 dəqiqəlik quru fırlanma yerinə yetirildi. 6-cı addımda toplama borusu atıldı və təmiz 1,5 ml sentrifuqa borusu ilə əvəz edildi. Təmizləmə sütununa 50 ºCl Elüsyon Tamponu əlavə edildi və 1 dəqiqə 8000 º7 q-da sentrifuqa edildi.

Biz MinION kitabxanasını ONT-dən (PBAC12_9067_v109_revH_23MAY2018 versiyası) 1D PCR ştrix kodlaşdırma amplikonları/cDNA (SQK-LSK109) protokoluna uyğun hazırladıq. Yuxarıda qeyd edildiyi kimi, bu protokol indeksləşdirmə vasitəsi kimi birinci dövrə PCR məhsullarımıza ONT barkodlarını əlavə etmək üçün ikinci PCR-ni özündə birləşdirir. Bu, təkcə bir axın hüceyrəsində birdən çox nümunənin işə salınmasına imkan vermir, həm də axın hüceyrəsi təkrar istifadə edildikdə bioinformatika mərhələsində demultipleksləşdirməyə imkan verir. Bir qaçışdan sonra bir axın hüceyrəsinin yuyulması əvvəlki qaçışlardan bəzi qalıq DNT saxlaya bilər. Buna görə də, ONT barkodları bioinformatika mərhələsində cari nümunəni müəyyən etməyə kömək edir. Qısaca olaraq, PCR Barkodlama Dəsti (EXP-PBC001 ONT Ltd., Oksford, Birləşmiş Krallıq) 2 μl barkod (10 μM ONT Ltd., Oksford, Birləşmiş Krallıq) olan 100 BCl PCR qarışığı hazırlamaq üçün istifadə edilmişdir. ), 2 μl birinci dövrə PCR məhsulu, 46 μl NFW (ThermoFisher Scientific Ltd., Paisley, Birləşmiş Krallıq) və 50 μl 2X LongAmp Taq Master Mix [New England BioLabs (NEB) Inc., Hitchin, Birləşmiş Krallıq]. C. elegans 10 nömrəli ştrix kodu aldı. PCR Bentolab termosiklində (Bento Bioworks Ltd., London, Birləşmiş Krallıq) aparıldı. Ştrix kodlaşdırma PCR protokolu Bentolab-ın 15 s-lik dövrləri və 10 ° C minimum termosikl temperaturunu təyin edə bilməməsinə uyğunlaşdırmaq üçün bir qədər düzəliş edilmişdir: ilkin denaturasiya 3 dəqiqə @ 95 ° C denaturasiya 20 s 92 ° C, əlavə, 02 ° C-də #x00B0C, 65°C-də 60 s uzatma (bütün 12 dövr) 65°C-də son uzatma 50 s 10°C-də saxlayır. PCR məhsulları 1X Agencourt AMPure XP muncuqları (Beckman Coulter Inc., Indianapolis, IN, Amerika Birləşmiş Ştatları) ilə 3D çap edilmiş maqnit BOMB mikrotube rafında 5 (Oberacker et al., 2019) ilə təmizləndi.

Kitabxananın hazırlanması istehsalçının təlimatlarına uyğun olaraq Ligation Sequencing Kit (SQK-LSK109 ONT Ltd., Oksford, Birləşmiş Krallıq) reagentlərindən istifadə etməklə davam etdi. Sahədə DNT-nin kəmiyyətini təyin etmək üçün dəqiq bir üsulumuz olmadığı üçün biz istifadə olunan DNT həcmini əvvəlki MiniON qaçışına (Düyün, dərc olunmamış məlumat) əsaslandıraraq 47 BCl NFW (Thermo) ilə 33 μl ştrix kodlu kitabxana hazırladıq. Fisher Scientific Ltd., Paisley, Birləşmiş Krallıq). Gücləndirilmiş məhsul Bentolab termosiklində (Bento Bioworks Ltd) 20°C-də 5 dəqiqə və 65°C-də 5 dəqiqə ərzində NEBNext Ultra II End-Repair/dA-tailing Modul (NEB Inc., Hitchin, Birləşmiş Krallıq) istifadə edilməklə son təmir edilib. ., London, Birləşmiş Krallıq). Son təmir edilmiş kitabxana 1X Agencourt AMPure XP muncuqları (Beckman Coulter Inc., Indianapolis, IN, Amerika Birləşmiş Ştatları) ilə 3D çap edilmiş maqnit BOMB mikrotube rafında (Oberacker və digərləri, 2019) təmizləndi. Adapter bağlaması NEB Blunt/TA Ligation Master Mix (NEB Inc., Hitchin, Birləşmiş Krallıq) və SQK-LSK109 dəstində təqdim olunan reagentlərdən istifadə etməklə həyata keçirilib. Liqasiya otaq temperaturunda 10 dəqiqə davam etdi. DNT 0,4X AMPure XP muncuqları ilə təmizləndikdən və SQK-LSK109 dəstində təqdim olunan Qısa Fraqment Tamponu ilə yuyulduqdan sonra 15 μl Elüsyon Buferində elüt edilib.

Hava qabarcıqlarının daxil olmasının qarşısını almaq üçün axın hüceyrəsi 1 ml astarlama qarışığı (bir Flush Bufer borusunda 30 º BCl Flush Tether) ilə yuyularaq yüklənmə üçün hazırlanmışdır. Kitabxana 37,5 μl Sequencing Buferi, 25,5 μl Loading Beads və 12 μl DNT kitabxanasını qarışdırmaqla yükləmə üçün hazırlanmışdır, bundan sonra nümunə SpotON nümunə portu vasitəsilə R9.5.1 tipli axın hüceyrəsinə əlavə edilmişdir. . Kitabxananın ümumi hazırlanması vaxtı 𢏄,5 saat olaraq təxmin edilmişdir.

Biz MinKNOW (versiya 3.4.5 ONT Ltd., Oksford, Birləşmiş Krallıq) istifadə edərək, MinIT-də (xüsusi ONT Ltd., Oksford, Birləşmiş Krallıq) sekvensiya işini həyata keçirdik. axın hüceyrə növü və istifadə edilən eksperimental dəst. Köhnə axın hüceyrələrinin kiçik barkodlu amplikon kitabxanalarını ardıcıllıqla sıralamaq üçün hələ də faydalı olub-olmadığını yoxlamaq üçün biz əvvəl iki dəfə, bir dəfə 24 saatlıq və bir dəfə 2,5 saatlıq qaçışda istifadə olunan axın hüceyrəsindən istifadə etdik. Axın hüceyrəsini təkrar istifadə edərkən başlanğıc gərginliyi tənzimləmək lazımdır və biz bunu -225 V-a tənzimlədik, bu, � saat əvvəlki iş vaxtından sonra ONT-nin tövsiyəsinə bərabərdir. Yuxarıda qeyd edildiyi kimi, daha yüksək aktiv məsamə sayları yeni axın hüceyrələri üçün maksimum 2048 və 800 zəmanət səviyyəsi ilə yüksək axın hüceyrə keyfiyyətini təmsil edir. MUX skanı göstərdi ki, axın hüceyrəmizdə ardıcıllıq üçün 43 məsamə var. Axın hüceyrəsi 14 dəqiqə ardıcıllıqla 2632 oxunuş yaratdı, bundan sonra qaçış dayandırıldı.

Sanger ardıcıllığı

MinION ardıcıllığı üçün istifadə edilən nümunələrin hər biri həmçinin Sanger ardıcıllığına (GATC/Eurofins Genomics) göndərilib. Həm irəli, həm də tərs tellər ardıcıllıq primerləri kimi gücləndirici primerlərdən istifadə edərək ardıcıllıqla tərtib edilmişdir. Sanger ardıcıllığının elektroferoqramları 4Peaks versiyası 1.8 (Nucleobytes B.V., Aalsmeer, Hollandiya) istifadə edərək vizual olaraq yoxlanılmış və redaktə edilmişdir. Redaktə edilmiş irəli tel və tərs tamamlanmış tərs tel ardıcıllıqları Seaview versiyası 4.7 (Gouy et al., 2010) istifadə edərək uyğunlaşdırılmışdır. Nukleotid uyğunsuzluqları orijinal elektroferoqrammada yoxlanılmış və həll edilmişdir. Hər bir nümunə üçün konsensus ardıcıllığı əldə edildi və onun hər ucundan kəsilmiş primer ardıcıllığı. Nəticədə ardıcıllıq 885 bp idi (A. simpleks), 887 bp (P. redivivus), 832 bp (T. aceti) və 844 bp (C. elegans) uzun.

Bioinformatik analizlər

Xam fast5 MinION oxunuşları hər bir nümunə üçün fastq faylları hazırlamaq üçün Guppy 3.2.4 + d9ed22f (ONT Ltd., Oksford, Birləşmiş Krallıq) istifadə edərək əsas adlandırılmış və demultipleksləşdirilmişdir. Oxumalar minimum 7 keyfiyyət balı əsasında keçdi/uğursuz kimi təsnif edildi. Fastq faylları hər nümunə üçün bir faylda birləşdirildi və Nanoplot (versiya 1.28.0 6) istifadə edərək tədqiq edildi və jurnalın dəyişdirilmiş oxunma uzunluğunu (“–loglength&) göstərən süjetlər yaratdı. #x201D). Barkod və astarın kəsilməsi Porechop (versiya 0.2.4 7) istifadə edərək həyata keçirilib. Oxunun hər iki ucunda barkod tələb edən demultipleksləşdirmənin ikinci mərhələsi Porechop istifadə edərək həyata keçirildi (“–require_two_barcodes”). Sonradan, MinION oxunuşları ONtrack boru kəmərinin standart parametrlərindən istifadə etməklə işlənmişdir (versiya 1.4.2 8 Maestri et al., 2019). Qısaca desək, Seqtk seq 9 fastq fayllarını tamamlayan fasta faylları yaratmaq üçün istifadə edilmişdir. Oxumalar VSEARCH (Rognes et al., 2016) istifadə edərək qruplaşdırıldı, bundan sonra ən bol klasterdəki oxunuşlar saxlanıldı. Sonra 200 təsadüfi seçilmiş oxunuşdan Seqtk nümunəsindən istifadə edərək konsensus ardıcıllığı layihəsi hazırlamaq üçün istifadə edildi və MAFFT istifadə edərək uyğunlaşdırıldı (Katoh et al., 2002). EMBOSS cons 10 daha sonra MAFFT düzülüşündən başlayaraq konsensus ardıcıllığı layihəsini əldə etmək üçün istifadə edilmişdir. Birinci iterasiyadan fərqli olaraq Seqtk nümunəsindən istifadə edərək təsadüfi seçilmiş digər 200 oxunuş əldə edilmiş konsensus ardıcıllığını cilalamaq üçün Minimap2 (Li, 2018) istifadə edərək konsensus ardıcıllığının layihəsinə uyğunlaşdırıldı. Samtools hizalama faylını süzgəcdən keçirmək və çeşidləmək və onu bam formatına sıxışdırmaq üçün istifadə edilmişdir (Li et al., 2009). Nanopolish indeksi və nanopolish variantları – Nanopolish 11 konsensus modulları cilalanmış konsensus ardıcıllığı əldə etmək üçün istifadə edilmişdir. ONtrack boru kəməri boru kəmərinin standart dəyəri olan üç iterasiya ilə işlədilib. Bu, əksər hallarda istehsal olunan konsensus ardıcıllığını seçmək üçün MAFFT ilə uyğunlaşdırılmış üç cilalanmış konsensus ardıcıllığı ilə nəticələndi. Boru kəmərinin bütün skriptləri heç bir internet bağlantısından istifadə etmədən Mac noutbukunda Ubuntu v18.04.2 LTS əməliyyat sistemini təqlid edən virtual maşında (ONtrack boru xəttinin bir hissəsi kimi) işlədilib. Bioinformatik analizlər üçün istifadə olunan bütün kodlar və analizləri təkrarlamaq üçün lazım olan əlavə fayllar https://github.com/ieknot/MinION-DNA-barcoding-of-nematodes saytında tapıla bilər. Nəticələrdə MinION fastq və Sanger fasta qoşulma nömrələri bildirilir.

Ardıcıllığın dəqiqliyini qiymətləndirmək üçün MinION xam oxunuşları və konsensus oxunuşları BLASTn (Altschul və digərləri, 1990) istifadə edərək müvafiq Sanger-dən alınmış istinad ardıcıllığına uyğunlaşdırıldı, heç bir ardıcıllıq mürəkkəbliyi maskalanmadan (“-tozsuz-soft_masking false”) . Konsensus ardıcıllığı Seaview 4.7 versiyasında MUSCLE alqoritmindən (Edgar, 2004) istifadə edərək müvafiq Sanger ardıcıllığına uyğunlaşdırıldı (Gouy et al., 2010).


Mən həmişə bitkilərlə maraqlanmışam və bitkilərin bioloji aspektinə, xüsusən də çiçək morfologiyasına və fiziologiyasına getdikcə daha dərindən dalmışam. Bir gün mən bitkilərlə gen mühəndisliyi konsepsiyası ilə rastlaşdım və əsasən internet və google forumlarında bunun necə ediləcəyi ilə bağlı resursları və bilikləri toplamağa başladım.

Marağım artdıqca ev laboratoriyam da artdı. Müxtəlif yararsız vəziyyətlərdə eBay-dən laboratoriya avadanlığı topladım və özümə bir az elektrik mühəndisliyi öyrətdim. Mən 40 dollara alınan ölü vahid kimi görünən şeyi düzəltdim və onu 2000 dollardan çox yeni dəyəri ilə işlək vəziyyətə gətirdim.

Bir neçə ildən sonra mən anamın mənzilinin 3-cü yataq otağında ümumi molekulyar biologiyadan gen mühəndisliyinə qədər hər şeyi edə bilən tam funksional genetik mühəndisliyi laboratoriyası qurdum və bu yaxınlarda laboratoriyamın bacarıqlar bazasına Next Generation Sequencing əlavə etdim.

Təsəvvür edin ki, məktəbli uşaqları öz tədqiqatlarının bir hissəsi kimi bu planetdəki 400.000 bitki növündən birini ardıcıllıqla sıralayır və erkən yaşda birbaşa elmi atribut alırlar.


Nəticələr

ONT MARC məlumatları

MARC 1-ci faza təcrübələri eyni ardıcıllıqla beş laboratoriya tərəfindən həyata keçirilmişdir E. coli SQKMAP005 (Mərhələ 1a) və SQKMAP005.1 (Mərhələ 2b) ilə R7.3 axın hüceyrələrindən istifadə edərək iki nüsxədə gərginləşdirin. MinION tərəfindən istehsal edilən hər bir ardıcıllıq əsas keyfiyyət əsasında keçid və uğursuz kimi təsnif edildi və poreTools [16] istifadə edərək fastQ fayllarına çevrildi (Metodlar bölməsinə baxın).

Bu məqalənin əsas məqsədi ONT məlumatlarının təkrar analizlərdə istifadə imkanlarını qiymətləndirmək olduğundan, bu bölmədə biz MARC təcrübələrinin ardıcıllıq qabiliyyəti, oxunma uzunluğu və keyfiyyət paylanması baxımından əsas xüsusiyyətləri haqqında qısa məlumat veririk. MARC tərəfindən yaradılan məlumatların xüsusiyyətlərinin dərin və hərtərəfli təhlili [15]-də tapıla bilər.

Hər bir təcrübənin ümumi ötürmə qabiliyyəti müxtəlif laboratoriyalar arasında və daxilində dəyişir, minimum 28 Mb ilə maksimum 385 Mb arasında dəyişir və ardıcıl oxunuşların ümumi sayı təxminən 6000 ilə 45 000 arasında dəyişir (Cədvəl 1).

MARC təcrübələri statistikası

Exp adı . Faza . Keçid oxuyur. Uğursuz oxuyur. Keçid bazası. Uğursuz baza. ARS keçidi . ARS uğursuz oldu . Əsas dayaq keçidi: uğursuz . Dəstək keçidini oxuyun: uğursuz .
Lab1_run1 1a 32 548 14 806 228.3 86.8 6825.5 5626 0.72:0.28 0.69:0.31
Lab1_run2 1a 17 805 11 303 120.9 65.7 6658 5729 0.65:0.35 0.61:0.39
Lab2_run1 1a 8289 4790 59.3 30.3 7060 6138 0.66:0.34 0.63:0.37
Lab2_run2 1a 2901 1708 21.1 10.1 7200 5681.5 0.68:0.32 0.63:0.37
Lab3_run1 1a 18 765 7951 121.5 40.7 6367 4744 0.75:0.25 0.7:0.3
Lab3_run2 1a 19 169 7538 156.8 48.4 8007 6152 0.76:0.24 0.72:0.28
Lab4_run1 1a 13 836 10 858 69.4 44.2 3931 3479 0.61:0.39 0.56:0.44
Lab4_run2 1a 19 024 12 341 98.3 52.8 4352 3563 0.65:0.35 0.61:0.39
Lab5_run1 1a 23 566 6069 153.7 33.2 6242 4780 0.82:0.18 0.8:0.2
Lab5_run2 1a 17 673 26 351 48.2 39.4 1528 439 0.55:0.45 0.4:0.6
Lab1_run1 1b 12 258 17 511 69.4 78.1 5664 4464 0.47:0.53 0.41:0.59
Lab1_run2 1b 14 235 10 162 72.4 24.7 4738 667 0.75:0.25 0.58:0.42
Lab2_run1 1b 5165 5960 28.9 28.6 5438 4517.5 0.5:0.5 0.46:0.54
Lab2_run2 1b 28 054 30 044 206.5 178.2 7261.5 5944 0.54:0.46 0.48:0.52
Lab3_run1 1b 30 364 11 757 225.1 70.4 7235 5819 0.76:0.24 0.72:0.28
Lab3_run2 1b 14 800 6569 94.1 34.1 6285 5164 0.73:0.27 0.69:0.31
Lab4_run1 1b 1493 4673 8.4 20.0 5612 4042 0.3:0.7 0.24:0.76
Lab4_run2 1b 11 484 5856 65.5 27.3 5381 4371 0.71:0.29 0.66:0.34
Lab5_run1 1b 12 844 7876 83.8 43.0 6454 5257.5 0.66:0.34 0.62:0.38
Lab5_run2 1b 11 126 5894 72.8 31.7 6382.5 5113 0.7:0.3 0.65:0.35
Exp adı . Faza . Keçid oxuyur. Uğursuz oxuyur. Keçid bazası. Uğursuz baza. ARS keçidi . ARS uğursuz oldu . Əsas dayaq keçidi: uğursuz . Dəstək keçidini oxuyun: uğursuz .
Lab1_run1 1a 32 548 14 806 228.3 86.8 6825.5 5626 0.72:0.28 0.69:0.31
Lab1_run2 1a 17 805 11 303 120.9 65.7 6658 5729 0.65:0.35 0.61:0.39
Lab2_run1 1a 8289 4790 59.3 30.3 7060 6138 0.66:0.34 0.63:0.37
Lab2_run2 1a 2901 1708 21.1 10.1 7200 5681.5 0.68:0.32 0.63:0.37
Lab3_run1 1a 18 765 7951 121.5 40.7 6367 4744 0.75:0.25 0.7:0.3
Lab3_run2 1a 19 169 7538 156.8 48.4 8007 6152 0.76:0.24 0.72:0.28
Lab4_run1 1a 13 836 10 858 69.4 44.2 3931 3479 0.61:0.39 0.56:0.44
Lab4_run2 1a 19 024 12 341 98.3 52.8 4352 3563 0.65:0.35 0.61:0.39
Lab5_run1 1a 23 566 6069 153.7 33.2 6242 4780 0.82:0.18 0.8:0.2
Lab5_run2 1a 17 673 26 351 48.2 39.4 1528 439 0.55:0.45 0.4:0.6
Lab1_run1 1b 12 258 17 511 69.4 78.1 5664 4464 0.47:0.53 0.41:0.59
Lab1_run2 1b 14 235 10 162 72.4 24.7 4738 667 0.75:0.25 0.58:0.42
Lab2_run1 1b 5165 5960 28.9 28.6 5438 4517.5 0.5:0.5 0.46:0.54
Lab2_run2 1b 28 054 30 044 206.5 178.2 7261.5 5944 0.54:0.46 0.48:0.52
Lab3_run1 1b 30 364 11 757 225.1 70.4 7235 5819 0.76:0.24 0.72:0.28
Lab3_run2 1b 14 800 6569 94.1 34.1 6285 5164 0.73:0.27 0.69:0.31
Lab4_run1 1b 1493 4673 8.4 20.0 5612 4042 0.3:0.7 0.24:0.76
Lab4_run2 1b 11 484 5856 65.5 27.3 5381 4371 0.71:0.29 0.66:0.34
Lab5_run1 1b 12 844 7876 83.8 43.0 6454 5257.5 0.66:0.34 0.62:0.38
Lab5_run2 1b 11 126 5894 72.8 31.7 6382.5 5113 0.7:0.3 0.65:0.35

Sütunlar MARC-nin beş laboratoriyası tərəfindən yaradılan hər bir təcrübənin əsas xüsusiyyətlərini bildirir. Hər bir təcrübə üçün biz mərhələni (Faza), oxumaların sayını (Keçid oxuduqlarını və uğursuz oxuduqlarını), Mb-də ötürmə qabiliyyətini (Keçmə bazası və Uğursuzluq bazası), orta oxuma uzunluğunu (ARS Keçid və ARS Uğursuzluğu) və nisbətini bildirdik. keçid və uğursuz oxunuşlar arasında oxunuş və ötürmə qabiliyyəti (Base Prop və Read Prop). Bütün statistika MARC fastQ fayllarından hesablanıb.

MARC təcrübələri statistikası

Exp adı . Faza . Keçid oxuyur. Uğursuz oxuyur. Keçid bazası. Uğursuz baza. ARS keçidi . ARS uğursuz oldu . Əsas dayaq keçidi: uğursuz . Dəstək keçidini oxuyun: uğursuz .
Lab1_run1 1a 32 548 14 806 228.3 86.8 6825.5 5626 0.72:0.28 0.69:0.31
Lab1_run2 1a 17 805 11 303 120.9 65.7 6658 5729 0.65:0.35 0.61:0.39
Lab2_run1 1a 8289 4790 59.3 30.3 7060 6138 0.66:0.34 0.63:0.37
Lab2_run2 1a 2901 1708 21.1 10.1 7200 5681.5 0.68:0.32 0.63:0.37
Lab3_run1 1a 18 765 7951 121.5 40.7 6367 4744 0.75:0.25 0.7:0.3
Lab3_run2 1a 19 169 7538 156.8 48.4 8007 6152 0.76:0.24 0.72:0.28
Lab4_run1 1a 13 836 10 858 69.4 44.2 3931 3479 0.61:0.39 0.56:0.44
Lab4_run2 1a 19 024 12 341 98.3 52.8 4352 3563 0.65:0.35 0.61:0.39
Lab5_run1 1a 23 566 6069 153.7 33.2 6242 4780 0.82:0.18 0.8:0.2
Lab5_run2 1a 17 673 26 351 48.2 39.4 1528 439 0.55:0.45 0.4:0.6
Lab1_run1 1b 12 258 17 511 69.4 78.1 5664 4464 0.47:0.53 0.41:0.59
Lab1_run2 1b 14 235 10 162 72.4 24.7 4738 667 0.75:0.25 0.58:0.42
Lab2_run1 1b 5165 5960 28.9 28.6 5438 4517.5 0.5:0.5 0.46:0.54
Lab2_run2 1b 28 054 30 044 206.5 178.2 7261.5 5944 0.54:0.46 0.48:0.52
Lab3_run1 1b 30 364 11 757 225.1 70.4 7235 5819 0.76:0.24 0.72:0.28
Lab3_run2 1b 14 800 6569 94.1 34.1 6285 5164 0.73:0.27 0.69:0.31
Lab4_run1 1b 1493 4673 8.4 20.0 5612 4042 0.3:0.7 0.24:0.76
Lab4_run2 1b 11 484 5856 65.5 27.3 5381 4371 0.71:0.29 0.66:0.34
Lab5_run1 1b 12 844 7876 83.8 43.0 6454 5257.5 0.66:0.34 0.62:0.38
Lab5_run2 1b 11 126 5894 72.8 31.7 6382.5 5113 0.7:0.3 0.65:0.35
Exp adı . Faza . Keçid oxuyur. Uğursuz oxuyur. Keçid bazası. Uğursuz baza. ARS keçidi . ARS uğursuz oldu . Əsas dayaq keçidi: uğursuz . Dəstək keçidini oxuyun: uğursuz .
Lab1_run1 1a 32 548 14 806 228.3 86.8 6825.5 5626 0.72:0.28 0.69:0.31
Lab1_run2 1a 17 805 11 303 120.9 65.7 6658 5729 0.65:0.35 0.61:0.39
Lab2_run1 1a 8289 4790 59.3 30.3 7060 6138 0.66:0.34 0.63:0.37
Lab2_run2 1a 2901 1708 21.1 10.1 7200 5681.5 0.68:0.32 0.63:0.37
Lab3_run1 1a 18 765 7951 121.5 40.7 6367 4744 0.75:0.25 0.7:0.3
Lab3_run2 1a 19 169 7538 156.8 48.4 8007 6152 0.76:0.24 0.72:0.28
Lab4_run1 1a 13 836 10 858 69.4 44.2 3931 3479 0.61:0.39 0.56:0.44
Lab4_run2 1a 19 024 12 341 98.3 52.8 4352 3563 0.65:0.35 0.61:0.39
Lab5_run1 1a 23 566 6069 153.7 33.2 6242 4780 0.82:0.18 0.8:0.2
Lab5_run2 1a 17 673 26 351 48.2 39.4 1528 439 0.55:0.45 0.4:0.6
Lab1_run1 1b 12 258 17 511 69.4 78.1 5664 4464 0.47:0.53 0.41:0.59
Lab1_run2 1b 14 235 10 162 72.4 24.7 4738 667 0.75:0.25 0.58:0.42
Lab2_run1 1b 5165 5960 28.9 28.6 5438 4517.5 0.5:0.5 0.46:0.54
Lab2_run2 1b 28 054 30 044 206.5 178.2 7261.5 5944 0.54:0.46 0.48:0.52
Lab3_run1 1b 30 364 11 757 225.1 70.4 7235 5819 0.76:0.24 0.72:0.28
Lab3_run2 1b 14 800 6569 94.1 34.1 6285 5164 0.73:0.27 0.69:0.31
Lab4_run1 1b 1493 4673 8.4 20.0 5612 4042 0.3:0.7 0.24:0.76
Lab4_run2 1b 11 484 5856 65.5 27.3 5381 4371 0.71:0.29 0.66:0.34
Lab5_run1 1b 12 844 7876 83.8 43.0 6454 5257.5 0.66:0.34 0.62:0.38
Lab5_run2 1b 11 126 5894 72.8 31.7 6382.5 5113 0.7:0.3 0.65:0.35

Sütunlar MARC-nin beş laboratoriyası tərəfindən yaradılan hər bir təcrübənin əsas xüsusiyyətlərini bildirir. Hər bir təcrübə üçün biz mərhələni (Faza), oxumaların sayını (Keçid oxuduqlarını və uğursuz oxuduqlarını), Mb-də ötürmə qabiliyyətini (Keçmə bazası və Uğursuzluq bazası), orta oxuma uzunluğunu (ARS Keçid və ARS Uğursuzluğu) və nisbətini bildirdik. keçid və uğursuz oxunuşlar arasında oxunuş və ötürmə qabiliyyəti (Base Prop və Read Prop). Bütün statistika MARC fastQ fayllarından hesablanıb.

Orta ardıcıllıq uzunluğu MARC təcrübələrinin böyük əksəriyyəti üçün 5 ilə 7 kb arasında dəyişir və tək oxunuşlar bütün 20 təcrübə üçün yüzlərlə bp ilə onlarla kb arasında dəyişir (Cədvəl 1 və Şəkil 1). Orta hesabla, keçid ardıcıllıqları uğursuz ardıcıllıqlardan (4-6 kb) daha uzundur (4-8 kb) və keçid oxunuşlarının miqdarı demək olar ki, bütün təcrübələrdə ümumi ardıcıllıq ötürmə qabiliyyətinin 60%-ni təşkil edir.

Keçid və uğursuz ONT ardıcıllığının ölçüsü və keyfiyyət paylanması. Panel (A) MARC tərəfindən həyata keçirilən 20 təcrübənin keçmə və uğursuzluq ardıcıllığı üçün oxunma uzunluğu paylanmasını göstərir. Panel (B) təsadüfi seçilmiş bölgələrlə müqayisədə keçid və uğursuz oxunuşlar üçün GC məzmun faizini bildirir E. coli genom. c, d və e panelləri orta oxu keyfiyyətini göstərir (C, ilk 20 barplot keçid oxunuşları ilə əlaqədardır, ikinci 20 isə uğursuz oxunur), əsas keyfiyyət paylanması (D) və ardıcıllıq mövqeyinin (E) funksiyası kimi əsas keyfiyyət müvafiq olaraq keçid və uğursuz oxuyur. Bu rəqəmin rəngli versiyası BIB-də onlayn mövcuddur: https://academic.oup.com/bib.

Keçid və uğursuz ONT ardıcıllığının ölçüsü və keyfiyyət paylanması. Panel (A) MARC tərəfindən həyata keçirilən 20 təcrübənin keçmə və uğursuzluq ardıcıllığı üçün oxunma uzunluğu paylanmasını göstərir. Panel (B) təsadüfi seçilmiş bölgələrlə müqayisədə keçid və uğursuz oxunuşlar üçün GC məzmun faizini bildirir E. coli genom. c, d və e panelləri orta oxu keyfiyyətini göstərir (C, ilk 20 barplot keçid oxunuşları ilə əlaqədardır, ikinci 20 isə uğursuz oxunur), əsas keyfiyyət paylanması (D) və ardıcıllıq mövqeyinin (E) funksiyası kimi əsas keyfiyyət müvafiq olaraq keçid və uğursuz oxuyur. Bu rəqəmin rəngli versiyası BIB-də onlayn mövcuddur: https://academic.oup.com/bib.

Oxunan GC məzmun paylanması yaxındır E. coli həm keçid, həm də uğursuz oxumaq üçün istinad genomu (Şəkil 1) və keçid oxunmasının orta keyfiyyəti uğursuz oxunuşdan açıq-aydın böyük olsa da, əsas keyfiyyət oxunma mövqeyindən asılı deyil (təxminən ilk 100 baza istisna olmaqla, Şəkil 1E), nümayiş etdirir nanopora vasitəsilə DNT zəncirinin köçürülməsi mövqe meyllərindən təsirlənmir. Bu nəticə fundamental əhəmiyyət kəsb edir, çünki o, nanopor-sequencing yanaşmasının nümunənin hazırlanması zamanı təqdim olunanlar istisna olmaqla, uzunluq üzrə nəzəri məhdudiyyətlər olmadan yüksək keyfiyyətli ardıcıllıqlar yarada biləcəyini təklif edir.

Cədvəl 1 və Şəkil 1-də ümumiləşdirilmiş nəticələr göstərir ki, [15]-də bildirilmiş məlumatlara uyğun olaraq 1a və 1b mərhələlərində yaradılmış təcrübələr arasında ardıcıllıq ötürmə qabiliyyəti və orta oxu uzunluqları baxımından əhəmiyyətli fərqlər yoxdur.

Hizalayıcılar və səhv dərəcəsinin qiymətləndirilməsi

TGS ardıcıllığının uyğunlaşdırılması onların yaratdığı çoxlu sayda uzun oxunma (kb-dən onlarla kb-a qədər) və əvəzetmələrdən daha çox InDels olan yüksək səhv dərəcələri üçün xüsusilə çətin ola bilər [17]. Əsas hesablama problemi SGS uyğunlaşdırma metodlarının eyni sürəti və həssaslığı ilə genomdan orta fərqlə (20%-ə qədər divergensiya, InDels-də cəmlənmiş) uzun (çoxlu kilobaza) oxunuşların necə uyğunlaşdırılmasıdır.

Hal-hazırda, TGS platformaları tərəfindən yaradılan uzun oxunuşların düzgün xəritələşdirilməsi üçün bir neçə üsul sınaqdan keçirilmiş və ya hazırlanmışdır. Chaisson və başqaları. [18] qısa oxunuş xəritəsində istifadə edilən məlumat strukturlarını bütün genom düzülüşündə istifadə olunan uyğunlaşdırma üsulları ilə birləşdirən yeni bir üsul (Basic Local Alignment with Successive Refinement, BLASR) təklif etdi (daha ətraflı məlumat üçün Metodlar bölməsinə baxın). Heng Li, PacBio və ONT oxunuşlarını dəstəkləmək üçün Smith-Waterman-ın rahat hesabını evristik filtrasiya ilə birləşdirərək BWA-MEM alqoritmini [19] genişləndirdi. LAST [20] tərəfindən qəbul edilmiş yanaşmadan istifadə edərək nanopore və PacBio məlumatlarının xəritələşdirilməsini təklif edən bir neçə məqalə. LAST üç addımlı yanaşmanı izləyir, burada əvvəlcə oxunanlar və genom arasında ilkin uyğunluqlar tapır, sonra onları boşluqsuz X-damcı alqoritmi ilə genişləndirir və nəhayət, boşluqlu X-damcı alqoritmindən istifadə edərək genişləndirir [21]. Bu yaxınlarda Jain et al. [17] yeni yanaşma təklif etdi, marginAlign [17], ONT məlumatları üçün düzgün şəkildə işlənib hazırlanmışdır ki, bu da HMM-ni LAST və BWA (burrows wheeler aligner) tərəfindən yaradılan hizalamalarla birləşdirərək istinad genomuna qarşı oxunuşları düzəldir. Bundan sonra biz marginAlign ilə LAST-a HMML, marginAlign ilə BWA-ya isə HMMB kimi istinad edəcəyik.

İstinad genomuna qarşı ONT ardıcıllığını düzgün xəritələşdirmək üçün müxtəlif uyğunlaşdırma yanaşmalarının qabiliyyətini başa düşmək üçün yuxarıda qeyd olunan beş uzun oxunuş uyğunlaşdırma metodunu (BWA, BLASR, LAST, HMML və HMMB, daha ətraflı məlumat üçün Metodlar bölməsinə baxın) keçid və uğursuzluğa tətbiq etdik. 20 MARC təcrübəsinin ardıcıllığı.

BWA, HMML və HMMB, xəritələnmiş keçid oxunuşlarının 1,5-5%-ni (BWA və HMMB üçün 1,5% və HMML üçün 5%) və xəritələnmiş uğursuz oxunuşların 10%-ni (daha ətraflı məlumat üçün Əlavə Cədvəl S1-ə baxın) təmsil edən yumşaq klipli hizalamalar istehsal etdi. Üstəlik, BWA bölünmüş xəritələmə istehsal edən yeganə hizalayıcı idi: keçid oxunuşlarının 1%-i və uğursuz oxunuşların 8%-i bölündü (Əlavə Cədvəl S1). Keçid oxunuşlarının təxminən 99%-i və uğursuz oxunuşların 80%-i (Şəkil 2A) göstəricilərə uyğunlaşdırılıb. E. coli istinad genomu və xəritələmə performansı ardıcıllığın ölçüsündən (Şəkil 2B və C və Əlavə Şəkil S1) çox asılıdır, çünki oxunmalar nə qədər uzundur və hər bir üsulla xəritələnmiş ardıcıllıqların payı bir o qədər yüksəkdir. Hazırda düzülmənin düzgün olma ehtimalını qiymətləndirməyin ən yaxşı yolu xəritəçəkmə keyfiyyətidir (MQ). Bu xal ümumiyyətlə əsas uyğunsuzluqların sayı və düzülmədə daxil edilmiş və ya silinmiş bölgələrin ölçüləri kimi müxtəlif amillər nəzərə alınmaqla qiymətləndirilir [22]. Biz BLASR və BWA tərəfindən yaradılan MQ dəyərlərini təhlil etdik (MQ yaradan xəritəçəkənlər qiymətləndirilir) və müəyyən etdik ki, xəritələnmiş keçid oxunuşlarının təxminən 99%-nin və xəritələnmiş uğursuz oxunuşların 90-95%-nin (Əlavə Cədvəl S1-ə baxın) MQ ≥ 20 ⁠ var. Bu səbəbdən, BWA və BLASR üçün bütün sonrakı təhlillər MQ ≥ 20 ⁠ olan oxunuşlardan istifadə edilərək həyata keçiriləcək. Bütün beş uyğunlaşdırma strategiyası oxşar nəticələr versə də, LAST alqoritmi ən pis qlobal performansı əldə etdi və həm keçid, həm də uğursuz oxunuşlar üçün ardıcıllığın uzunluğundan ən çox təsirlənən alqoritm oldu. Bu işdə sınaqdan keçirilmiş bütün xəritəçəkmə strategiyaları 1 kb-dan qısa keçid oxunuşlarının 10%-ni və 3 kb-dan qısa uğursuz oxunuşların 40%-ni uyğunlaşdıra bilmədi, bu da aşağı əsas keyfiyyətlərə malik qısa oxumaların daha yüksək olan qısa oxumalardan daha çox ardıcıllıq xətaları ehtiva etdiyini göstərir. əsas keyfiyyətlər.

Xəritəçəkmə alqoritmlərinin müqayisəsi və ardıcıllıqla səhv dərəcəsinin qiymətləndirilməsi. Panellər (A) bütün beş hizalayıcı üçün xəritələnmiş və xəritələnməmiş oxunuşlardakı nisbəti göstərir (rənglər orta oxu keyfiyyətlərini təmsil edir). Panellər (B) və (C) ötürmə (B) və uğursuzluq (C) ardıcıllığı üçün oxunma uzunluğu funksiyası kimi hizalayıcıların performansını bildirir. Ardıcıllıq xətası dərəcəsi ardıcıllıq mövqeyi (D–I) və əsas keyfiyyət (J–O) funksiyası kimi qiymətləndirilmişdir. Səhv dərəcəsi keçid üçün əvəz edilmiş (D, G, J, M), daxil edilmiş (E, H, K, N) və silinmiş əsaslar (F, I, L, O) üçün təxmin edilmişdir (D–F, J–L) və uğursuz (G–I, M–O) ardıcıllığı. Alt qrafiklərin qruplaşdırılmasını sadələşdirmək üçün panellərdə (D–O) variantları və oxunuş növünü təsvir edən əlavə etiketlər var: Alt- (əvəzetmələr), Daxiletmələr- (daxiletmələr), Sil- (silinmələr), -Keçmə (oxumaqdan keçmək) və -Uğursuzluq (uğursuzluq) oxuyur). Bu rəqəmin rəngli versiyası BIB-də onlayn mövcuddur: https://academic.oup.com/bib.

Xəritəçəkmə alqoritmlərinin müqayisəsi və ardıcıllıqla səhv dərəcəsinin qiymətləndirilməsi. Panellər (A) bütün beş hizalayıcı üçün xəritələnmiş və xəritələnməmiş oxunuşlardakı nisbəti göstərir (rənglər orta oxu keyfiyyətlərini təmsil edir). Panellər (B) və (C) ötürmə (B) və uğursuzluq (C) ardıcıllığı üçün oxunma uzunluğu funksiyası kimi hizalayıcıların performansını bildirir. Ardıcıllıq xətası dərəcəsi ardıcıllıq mövqeyi (D–I) və əsas keyfiyyət (J–O) funksiyası kimi qiymətləndirilmişdir. Səhv dərəcəsi keçid üçün əvəz edilmiş (D, G, J, M), daxil edilmiş (E, H, K, N) və silinmiş əsaslar (F, I, L, O) üçün təxmin edilmişdir (D–F, J–L) və uğursuz (G–I, M–O) ardıcıllığı. Alt qrafiklərin qruplaşdırılmasını sadələşdirmək üçün panellərdə (D–O) variantları və oxunuş növünü təsvir edən əlavə etiketlər var: Alt- (əvəzetmələr), Daxiletmələr- (daxiletmələr), Sil- (silinmələr), -Keçmə (oxumaqdan keçmək) və -Uğursuzluq (uğursuzluq) oxuyur). Bu rəqəmin rəngli versiyası BIB-də onlayn mövcuddur: https://academic.oup.com/bib.

Növbəti addım olaraq, yerli xətaların üç əsas mənbəyi üçün ONT səhv dərəcəsinin xam qiymətləndirilməsini əldə etmək üçün uyğunlaşdırılmış məlumatlar istifadə edilmişdir: uyğunsuzluq, silinmələr və əlavələr. Bu məqsədlə, hər bir xəritəçəkmə alqoritmi üçün, ardıcıllıq mövqeyi və oxu keyfiyyəti funksiyası olaraq istinad genomuna görə əvəz edilən, daxil edilən və silinən əsasların sayını hesabladıq.

Baxmayaraq ki, bu təhlillərin nəticələri ardıcıllıq və düzülmə xətalarının birləşməsini versə də, beş müxtəlif xəritəçəkmə strategiyasının istifadəsi ardıcıllıq xətalarının yaxşı qiymətləndirilməsini əldə edərək, hizalanma effektini azaltmağa imkan verdi. ONT məlumatları üçün təxmin edilən səhv dərəcələrini daha yaxşı qiymətləndirmək üçün biz bu nəticələri Illumina MiSeq və Pacific Bioscience platformaları tərəfindən əldə edilənlərlə müqayisə etdik (Metodlara baxın).

Bütövlükdə götürdükdə, Şəkil 2-nin d–o panelləri göstərir ki, ardıcıllıq xətası dərəcəsi oxunma yerindən bir qədər asılıdır, eyni zamanda oxu keyfiyyəti yüksək dərəcədə təsirlənir. Əvəz edilmiş, daxil edilmiş və silinmiş əsasların payı (Şəkil 2D-I) tək əsaslı əvəzləmələrdə SON istisna olmaqla, bütün beş düzləndirici üçün təxminən 50-100 bp sabit dəyərə çatana qədər ardıcıllıq mövqeyi ilə artır. Əksinə, üç variant kateqoriyası üçün xəta dərəcəsi orta oxunuşun əsas keyfiyyəti artdıqca azalır (Şəkil 2J–O), bu, oxu keyfiyyəti və oxuma xətalarının yüksək korrelyasiya olduğunu göstərir.

Bu korrelyasiyanı qiymətləndirmək üçün biz Q = − 10 log 10 P (burada) kimi Phred miqyaslı uyğunsuzluq dərəcəsini qiymətləndirmək üçün BLASR, BWA və LAST tərəfindən yaradılan uyğunlaşdırma məlumatlarından istifadə etdik. P hər düzülmüş oxunma üçün uyğunsuzluqların hissəsidir) və biz onu proqnozlaşdırılan keyfiyyət balları ilə müqayisə etdik. Bu təhlillərin nəticələri Əlavə Şəkil S2-də təqdim olunur və proqnozlaşdırılan keyfiyyət xalının həm keçid, həm də uğursuz oxunuşlar üçün ölçülmüş uyğunsuzluq dərəcəsini dəqiq şəkildə əks etdirdiyini göstərir (baxmayaraq ki, uğursuz oxunuşlar üçün proqnozlaşdırılan yüksək keyfiyyət balları aşağı qiymətləndirilir).

Bütün bu təhlillər həmçinin beş xəritəçəkmə metodunun üç səhv kateqoriyası üçün fərqli nəticələr verdiyini nümayiş etdirir. İki marginAlign metodu tək əsaslı əvəzləmələr üçün ən kiçik xəta dərəcəsini əldə etdi, LAST və BWA isə kiçik InDels üçün ən yaxşı performansı göstərdi (daha ətraflı məlumat üçün Cədvəl 2-ə baxın).

Düzləşdirici. Alt keçid . Ins pass . Del keçir . Ümumi keçid . Proporsional keçid . Alt uğursuzluq . Ins uğursuz . Uğursuzluq . Ümumi uğursuzluq . Proporsiya uğursuz .
BWA 5.87 2.37 3.66 11.9 49:20:31 13.82 3.6 6.16 23.58 59:15:26
BLASR 3.64 3.65 5.14 12.43 29:29:42 7.44 6.12 9.25 22.81 33:27:40
SON 8.01 2.43 3.71 14.15 57:17:26 39.11 5.19 5.11 49.41 79:11:10
HMMB 2.97 3.32 4.71 11 27:30:43 6.35 6.23 8.96 21.54 29:29:42
HMML 2.46 3.37 4.77 10.6 23:32:45 6.06 6.15 8.83 21.04 29:29:42
MiSeq 0.24 0 0 0.24 100:0:0 0.24 0 0 0.24 100:0:0
PacBio 1.15 6.73 3.29 11.17 10:60:30 1.15 6.73 3.29 11.17 10:60:30
Düzləşdirici. Alt keçid . Ins pass . Del keçir . Ümumi keçid . Proporsional keçid . Alt uğursuzluq . Ins uğursuz . Uğursuzluq . Ümumi uğursuzluq . Proporsiya uğursuz .
BWA 5.87 2.37 3.66 11.9 49:20:31 13.82 3.6 6.16 23.58 59:15:26
BLASR 3.64 3.65 5.14 12.43 29:29:42 7.44 6.12 9.25 22.81 33:27:40
SON 8.01 2.43 3.71 14.15 57:17:26 39.11 5.19 5.11 49.41 79:11:10
HMMB 2.97 3.32 4.71 11 27:30:43 6.35 6.23 8.96 21.54 29:29:42
HMML 2.46 3.37 4.77 10.6 23:32:45 6.06 6.15 8.83 21.04 29:29:42
MiSeq 0.24 0 0 0.24 100:0:0 0.24 0 0 0.24 100:0:0
PacBio 1.15 6.73 3.29 11.17 10:60:30 1.15 6.73 3.29 11.17 10:60:30

Sütunlar keçid və uğursuz oxunuşlar üçün əvəzetmələr (Alt), əlavələr (Daxillər) və silinmələr (Del) üçün səhv dərəcəsi haqqında ən uyğun məlumatları bildirir. "Cəmi" sütunları əvəzetmə, əlavə etmə və silmə xətalarının cəmini bildirir. 'Nətans' sütunları hər bir səhv sinfinin nisbi faizini bildirir (Sub:Ins:Del).

Düzləşdirici. Alt keçid . Ins pass . Del keçir . Ümumi keçid . Proporsional keçid . Alt uğursuzluq . Ins uğursuz . Uğursuzluq . Ümumi uğursuzluq . Proporsiya uğursuz .
BWA 5.87 2.37 3.66 11.9 49:20:31 13.82 3.6 6.16 23.58 59:15:26
BLASR 3.64 3.65 5.14 12.43 29:29:42 7.44 6.12 9.25 22.81 33:27:40
SON 8.01 2.43 3.71 14.15 57:17:26 39.11 5.19 5.11 49.41 79:11:10
HMMB 2.97 3.32 4.71 11 27:30:43 6.35 6.23 8.96 21.54 29:29:42
HMML 2.46 3.37 4.77 10.6 23:32:45 6.06 6.15 8.83 21.04 29:29:42
MiSeq 0.24 0 0 0.24 100:0:0 0.24 0 0 0.24 100:0:0
PacBio 1.15 6.73 3.29 11.17 10:60:30 1.15 6.73 3.29 11.17 10:60:30
Düzləşdirici. Alt keçid . Ins pass . Del keçir . Ümumi keçid . Proporsional keçid . Alt uğursuzluq . Ins uğursuz . Uğursuzluq . Ümumi uğursuzluq . Proporsiya uğursuz .
BWA 5.87 2.37 3.66 11.9 49:20:31 13.82 3.6 6.16 23.58 59:15:26
BLASR 3.64 3.65 5.14 12.43 29:29:42 7.44 6.12 9.25 22.81 33:27:40
SON 8.01 2.43 3.71 14.15 57:17:26 39.11 5.19 5.11 49.41 79:11:10
HMMB 2.97 3.32 4.71 11 27:30:43 6.35 6.23 8.96 21.54 29:29:42
HMML 2.46 3.37 4.77 10.6 23:32:45 6.06 6.15 8.83 21.04 29:29:42
MiSeq 0.24 0 0 0.24 100:0:0 0.24 0 0 0.24 100:0:0
PacBio 1.15 6.73 3.29 11.17 10:60:30 1.15 6.73 3.29 11.17 10:60:30

Sütunlar keçid və uğursuz oxunuşlar üçün əvəzetmələr (Alt), əlavələr (Daxillər) və silinmələr (Del) üçün səhv dərəcəsi haqqında ən uyğun məlumatları bildirir. "Cəmi" sütunları əvəzetmə, əlavə etmə və silmə xətalarının cəmini bildirir. 'Nətans' sütunları hər bir səhv sinfinin nisbi faizini bildirir (Sub:Ins:Del).

BWA və iki marginAlign yanaşması (performans baxımından ən yaxşı üç üsul) üçün ümumi xəta dərəcələri (üç səhv dərəcəsinin cəmi) təxminən 11% təşkil edir (Cədvəl 2-ə baxın) və birincidə təxmin edilən ümumi faiz xətasına uyğun olaraq. MARC [15] tərəfindən buraxılmış kağız. Gözlənildiyi kimi, keçid oxunması üçün orta xəta dərəcəsi (11%) uğursuz ardıcıllıqlar üçün əldə ediləndən çox kiçikdir (təxminən 21%, Cədvəl 2-ə baxın). Maraqlıdır ki, PacBio sekansları əvəzetmələr üçün aşağı xəta dərəcəsini təqdim etsə də (təxminən 1%), yüksək daxiletmə xətaları nəticəsində ONT məlumatları ilə müqayisə edilə bilən ümumi səhv dərəcəsi yaradır və bu, əvvəllər dərc edilmiş məqaləyə uyğundur [23, 24]. Gözlənildiyi kimi, SGS MiSeq oxunuşları üçün təxmin edilən ümumi xəta dərəcəsi digər TGS texnologiyalarından (həm PacBio, həm də ONT üçün təqribən 11%, Cədvəl 2) daha kiçikdir (0,24%, Cədvəl 2).

Səhv dərəcəsi paylanması

Tədqiqatların təkrarlanması zamanı oxunmalar düzgün xəritələşdirildikdən sonra istinad genomu ilə uyğunlaşdırılmış oxunuşlar arasında fərqlər axtarılaraq genomik variantlar aşkar edilir. Hər bir genomik mövqe üçün əvəzetmələr və kiçik InDels (bundan sonra "hadisələr") istinad alleli olmayan oxunuşların sayını və bu mövqeyə uyğunlaşdırılmış oxunuşların ümumi sayını müqayisə etməklə nəticələnir: oxunmaların sayı olduqda variant çağırılır. eyni alternativ alleli ehtiva edən oxunmaların ümumi sayına görə əhəmiyyətli dərəcədə böyükdür (haploid genomlar üçün, yarım oxunuşda eyni alternativ alleli ehtiva etdikdə variant təxminən adlandırıla bilər). Bu çərçivədə, əvvəlki bölmədə təxmin edilən xəta dərəcəsi ardıcıllığın düzgünlüyünə yaxşı bir təxmin (ardıcıllıq texnologiyasının DNT fraqmentini düzgün ardıcıllıqla sıralamaq qabiliyyəti) olsa da, o, tərəfindən yaradılan yalan-müsbət hadisələrin sayını proqnozlaşdırmaq iqtidarında deyil. təkrar sıralama analizi, çünki eyni genomik mövqedə düzülmüş təkrarlanan səhvlərdən asılıdır.

Bu səbəbdən, istinad genomunun hər bir mövqeyi üçün eyni əvəz edilmiş, daxil edilmiş və ya silinmiş bazaları ehtiva edən oxunuşların sayını saydıq. Bu şəkildə, hər bir uyğunlaşma üçün, istinad genomunun eyni mövqeyində düzülmüş eyni xətanı ehtiva edən N oxunuş tapmaq ehtimalını verən "təkrarlanan" səhv paylanmasını təxmin etdik. Bu paylanmaların tədqiqi bizə yalan-müsbət hadisələrin aşkarlanması ehtimalını qiymətləndirməyə və təkrarlanan səhvlərin təsadüfiliyini (tapma ehtimalını) anlamağa imkan verdi. N təsadüfən eyni mövqedə səhvlər).

Təkrarlanan xətaların stoxastik təbiətini öyrənmək üçün əvvəlki bölmədə təxmin edilən ardıcıllıq xəta dərəcələrindən istifadə edərək, biz təsadüfi paylanmış əvəz edilmiş, daxil edilmiş və ya silinmiş əsaslarla sintetik oxunuşları simulyasiya etdik və onların təkrarlanan xəta paylanmasını hesabladıq. Bu reseptdən istifadə edərək, tapıntının ehtimal paylanmasını əldə etdik N təsadüfən təkrarlanan səhvlər və biz Kolmogorov-Smirnov statistikası vasitəsilə hər düzülmənin yaratdığı səhvlərlə müqayisə etdik.

Bir tərəfdən, Kolmogorov-Smirnov statistikası D iki empirik paylama funksiyası ilə daha kiçik olan arasındakı məsafəni kəmiyyətlə ifadə edir D iki paylama daha yaxındır. Təhlillərimizdə kiçik D dəyər real və təsadüfi yaradılan oxunuşların təkrarlanan xəta paylanmasının yaxın olduğunu və nəticədə real xətaların xəritələşdirilmiş genomik mövqeyə görə müstəqil olaraq hər bir oxunuş boyunca təsadüfi paylandığını göstərir. Digər tərəfdən, böyük D dəyərlər real oxunuşda səhvlərin təsadüfi paylanmadığını, genomun təkrarlanan mövqelərinə düşdüyünü göstərir.

Bir tərəfdən, bütün D MiSeq və PacBio düzülmələri üçün təxmin edilən statistika (Şəkil 3) sıfıra yaxındır və bu, əvəzetmə, daxiletmə və silmə xətalarının bu texnologiyaların ardıcıllıq prosesi zamanı təsadüfi yaradıldığını göstərir. Digər tərəfdən, D ONT hizalamalarından əldə edilən statistik məlumatlar göstərir ki, nanopor ardıcıllığı prosesi ilə yaradılan oxunuşlar boyunca səhv paylanması tamamilə təsadüfi deyil (Şəkil 3 və Əlavə Şəkillər S3-S8). LAST əsaslı hizalamalar (LAST və HMML) əldə edildi D BWA, BLASR və HMMB isə hər üç səhv sinifi üçün birinə yaxın statistika verdi D Xüsusilə silinmiş bazalar üçün MiSeq və PacBio tərəfindən əldə edilənlərdən daha böyük dəyərlər.

Təkrarlanan səhvlərin paylanması təhlili. Əvəz edilmiş (A–F), daxil edilmiş (G–L) və silinmiş (M–R) əsaslar üçün təkrarlanan xəta paylanması təhlillərinin xülasəsi. Panellər (A, C, G, I, M və O) Kolmoqorov-Smirnov statistikasını oxu keyfiyyətinin bir funksiyası kimi bildirir, panellər isə (B, D, H, J, N və P) yanlış müsbət tezliyi göstərir. orta ardıcıllıqla əhatə funksiyası. Yanlış müsbət hadisələrin ümumi sayı ilə yanlış müsbət hadisələrin ölçüsü arasındakı nisbət kimi müəyyən edilir. E. coli bp-də genom. Yanlış müsbət hadisələr, düzülmüş oxunuşların yarısından çoxunun eyni xətanı ehtiva etdiyi genomik yerlər kimi müəyyən edilir. Panellərin barplotları (E, F, K, L, Q və R) əvəz edilmiş (E, F), daxil edilmiş (K, L) və silinmiş (Q, R) əsaslar üçün yanlış müsbət hadisələrin əsas məzmununu bildirir. -R şəkilçisi olan hər bir çubuq yalançı hadisənin baş verdiyi nukleotidlərin paylanmasını bildirir (InDels üçün hadisədən əvvəlki nukleotid). -E şəkilçisi olan hər bir sətir əvəz edilmiş/silinmiş/daxil edilmiş əsasların əsas məzmununu ehtiva edir. Panellər (A, B, E, G, H, K, M, N və Q) keçid oxunuşları üçün, panellər isə (C, D, F, I, J, L, O, P və R) keçid+ üçün nəticələri bildirir. uğursuz oxuyur. Alt xətlərin qruplaşdırılmasını sadələşdirmək üçün bütün panellərdə variantları və oxunuş növünü təsvir edən başlıq etiketləri var: Alt- (əvəzetmələr), Daxiletmələr- (daxiletmələr), Sil- (silinmələr), -Keçmə (keçmə oxumalar) və -Hamı (keçmə+uğursuz oxunuşlar) . Bu rəqəmin rəngli versiyası BIB-də onlayn mövcuddur: https://academic.oup.com/bib.

Təkrarlanan səhvlərin paylanması təhlili. Əvəz edilmiş (A–F), daxil edilmiş (G–L) və silinmiş (M–R) əsaslar üçün təkrarlanan xəta paylanması təhlillərinin xülasəsi. Panellər (A, C, G, I, M və O) Kolmoqorov-Smirnov statistikasını oxu keyfiyyətinin bir funksiyası kimi bildirir, panellər isə (B, D, H, J, N və P) yanlış müsbət tezliyi göstərir. orta ardıcıllıqla əhatə funksiyası. Yanlış müsbət hadisələrin ümumi sayı ilə yanlış müsbət hadisələrin ölçüsü arasındakı nisbət kimi müəyyən edilir. E. coli bp-də genom. Yanlış müsbət hadisələr, düzülmüş oxunuşların yarısından çoxunun eyni xətanı ehtiva etdiyi genomik yerlər kimi müəyyən edilir. Panellərin barplotları (E, F, K, L, Q və R) əvəz edilmiş (E, F), daxil edilmiş (K, L) və silinmiş (Q, R) əsaslar üçün yanlış müsbət hadisələrin əsas məzmununu bildirir. -R şəkilçisi olan hər bir çubuq yalançı hadisənin baş verdiyi nukleotidlərin paylanmasını bildirir (InDels üçün hadisədən əvvəlki nukleotid). -E şəkilçisi olan hər bir sətir əvəz edilmiş/silinmiş/daxil edilmiş əsasların əsas məzmununu ehtiva edir. Panellər (A, B, E, G, H, K, M, N və Q) keçid oxunuşları üçün, panellər isə (C, D, F, I, J, L, O, P və R) keçid+ üçün nəticələri bildirir. uğursuz oxuyur. Alt xətlərin qruplaşdırılmasını sadələşdirmək üçün bütün panellərdə variantları və oxunuş növünü təsvir edən başlıq etiketləri var: Alt- (əvəzetmələr), Daxiletmələr- (daxiletmələr), Sil- (silinmələr), -Keçmə (keçmə oxumalar) və -Hamı (keçmə+uğursuz oxunuşlar) . Bu rəqəmin rəngli versiyası BIB-də onlayn mövcuddur: https://academic.oup.com/bib.

Təkrarlanan xətaların yalançı-müsbət hadisələrin yaranmasına təsirini qiymətləndirmək üçün biz xəritələşdirilmiş oxuların yarısından çoxunun eyni əvəz edilmiş, silinmiş və ya daxil edilmiş əsasları ehtiva etdiyi genomik mövqelərin ümumi sayını hesabladıq. Gözlənildiyi kimi, yalan-müsbət hadisələrin tezliyi əhatə dairəsinin ardıcıllığından və əsas oxu keyfiyyətindən asılıdır. Şəkil 3 göstərir ki, əhatə dairəsinin artırılması təkrarlanan səhv meyllərinin təsirini azaldır və yanlış müsbət hadisələrin ümumi sayını azaldır. Eyni şəkildə, aşağı əsas keyfiyyətə malik oxunuşların silinməsi ardıcıllıqla əhatə dairəsini azaltmaqla yalançı müsbət tezlikləri artırır (Əlavə Şəkillər S9 və S10). Təəccüblüdür ki, PacBio məlumatları yüksək ardıcıllıq xətası dərəcəsini göstərsə də (ONT oxunuşlarının eyni miqyasında), onlar hər 100 kb-də birdən az yalançı əvəzetmə və təxminən bir InDel aşkar edərək, hər üç variant sinfi üçün ən aşağı yalan-müsbət dərəcəsi əldə ediblər. hər 1 Mb. Bu nəticələrin səbəbi, əsasən, PacBio ardıcıllığı (kiçik D dəyərləri) üzrə səhvlərin paylanmasının təxminən təsadüfi təbiəti ilə əlaqələndirilə bilər. MiSeq sequencer-in performansı PacBio-nun performansına bənzəyir və bu, əvvəlki bölmədə bildirilmiş SGS oxunuşlarının aşağı ardıcıllıq xətası dərəcəsinin birbaşa nəticəsidir.

ONT məlumatlarına gəldikdə, BLASR əvəzetmələr və daxiletmələr üçün ən yaxşı uyğunlaşdırıcı (yanlış-müsbət tezlik baxımından) və silinmələr üçün LAST nəticələnsə də, bu ardıcıllıq yanaşması ilə əldə edilən qlobal performans hər üç variant sinfi üçün zəifdir. Ən yaxşı eksperimental/hesablama mühitində (ən yaxşı uyğunlaşdırıcı və əhatə dairəsi 30×-dən böyük) ONT təcrübələri təxminən hər 10-50 kb-də bir yalançı əvəzetmə və daxiletmə və hər 1 kb-də bir yanlış silmə əmələ gətirir və bu məlumatların kiçik ölçülər üçün istifadəsini çətinləşdirir. variantlarının kəşfi. Üstəlik, keçid və uğursuz oxunuşların birləşməsi yanlış müsbət tezliklərin azaldılmasına az təsir göstərir (Şəkil 3).

Növbəti addım olaraq, təkrarlanan xətaların eksperimental və hesablama xarakterini başa düşmək üçün biz nukleotidlərin tərkibini və hər bir düzülmə nəticəsində yaranan bütün yanlış müsbət hadisələrin ölçü paylanmasını (daxil edilmiş və silinmiş əsaslar üçün) öyrəndik. Beş düzləndirici bir qədər fərqli nəticələr versə də, Şəkil 3 və Əlavə Şəkil S11-in çubuq qrafikləri göstərir ki, təkrarlanan səhvlər nanopor ardıcıllıq prosesinin daxili meyllərinə aid edilə bilən xüsusi nukleotid nümunələrinə əməl edir. Bir tərəfdən, təkrarlanan əvəzetmə xətaları əsasən C və G-yə təsir edir və təsir etdikləri nukleotiddən asılı olmayaraq, əvəz edilmiş əsaslar C və G ilə zənginləşir. Digər tərəfdən, təkrar-təkrar silinən əsaslar əsasən A və T-ni əhatə edir və əsasən A və G-dən sonra baş verir. Genomun T nukleotidləri. Əlavə Şəkil S11 həmçinin göstərir ki, marginAlign-in yenidən hizalanma strategiyası, ilkin düzülmə üçün seçilmiş xəritəçidən asılı olmayaraq, poli-X homopolimerlərində bir və ya daha çox nukleotidin itməsi ilə nəticələnən bir meyl təqdim edir. Maraqlıdır ki, daxil edilmiş əsaslar dörd nukleotid arasında bərabər paylanmış heç bir açıq-aydın meyldən əziyyət çəkmir.

Bundan əlavə, biz aşkar etdik ki, InDel zənglərinin böyük əksəriyyəti bütün uyğunlaşdırmalar üçün 1 əsaslı hadisələr olsa da, iki TGS məlumatında 1 bp-dən böyük daxil edilmiş (PacBio) və silinmiş (PacBio və ONT) əsasların əhəmiyyətli bir hissəsi var (Əlavə Şəkil S12).

Bütövlükdə götürdükdə, bu nəticələr göstərir ki, C(G)-nin nanopordan keçməsi üstünlük olaraq G (C) ilə yanlış adlandırılır, halbuki A və T translokasiyası ardıcıllıqla bir (və ya daha çox) sonrakı nukleotidin itirilməsi ilə nəticələnə bilər. /əsas çağırış prosesi.

Bu xətaların səbəblərini tam izah etmək çətin olsa da, biz hesab edirik ki, həm silinmələr, həm də C–G səhv çağırışları əsasən Metrichor bazası zəng edənin bazasında HMM-nin alqoritmik hədlərinə aid edilə bilər. Bütövlükdə götürsək, bu bölmədə təqdim olunan nəticələr əsas çağırış metodlarının işini yaxşılaşdırmaq və ONT məlumatlarından istifadə etməklə kiçik variantların identifikasiyası üçün yeni alqoritmlərin işlənib hazırlanması üçün fundamental əhəmiyyət kəsb edə bilər.

Əhatə dərinliyi

Hazırda təkrar ardıcıllıq analizlərində CNV-lərin müəyyən edilməsi üçün ən güclü üsul əhatə dairəsinin dərinliyi (DOC) yanaşmasıdır [25, 26].

DOC yanaşması sadə fikrə əsaslanır ki, ardıcıllıq prosesi zamanı oxunuşlar təsadüfi və müstəqil olaraq genomun hər hansı yerindən ardıcıllıqla sıralanır. Bu fərziyyəyə əsasən, istinad genomunun pəncərəsinə daxil olan oxunmaların sayı bölgənin DNT nümunəsində görünmə sayına mütənasib olmalı və Poisson paylanmasına əməl etməlidir. Bu fərziyyədən sonra, genomun ardıcıl və üst-üstə düşməyən pəncərələrinə uyğunlaşdırılmış oxunuşların DOC-unu hesablamaqla hər hansı genomik bölgənin surətinin sayı təxmin edilə bilər. ONT məlumatlarının CNV-lərdə iştirak edən genomik bölgələri müəyyən etmək qabiliyyətini anlamaq üçün biz DOC paylanmasının statistik xüsusiyyətlərini və qərəzlərini öyrəndik və onu digər iki ardıcıllıq texnologiyası ilə müqayisə etdik.

İlk addım olaraq biz DOC ilə klassik genomik meyllər arasındakı əlaqəni öyrəndik: yerli GC məzmunu və xəritələnmə qabiliyyəti (referans genomunda hər hansı mövqedən yaranan ardıcıllığın genomun özünə xəritə çəkməsinin sayının tərsi kimi müəyyən edilir) aşağıdakı kimi hesablanır. [27]-də.

Bir tərəfdən, DOC və GC məzmunu arasındakı korrelyasiya əvvəllər SGS məlumatları üçün bir neçə məqalədə bildirilmişdir və əsasən ardıcıllıq prosesinin gücləndirilməsi mərhələsi ilə əlaqədardır. Digər tərəfdən, xəritələşməyə meyllilik, genomun çoxlu təkrarlanan elementləri ehtiva etməsi və oxunuşların bu mövqelərə uyğunlaşdırılması qeyri-müəyyən xəritələşdirməyə səbəb olması ilə əlaqədardır. Magi və başqalarında. [25], Illumina, 454 və SoLID oxunuşlarını təhlil edərək, biz müşahidə etdik ki, DOC 35% ilə 60% arasında olan GC məzmunu dəyərləri üçün maksimumdur, hər iki ekstremalda azalır. Eyni məqalədə biz həmçinin aşkar etdik ki, yüksək xəritələnən bölgələr üçün DOC paylanması, aşağı xəritələnmə qabiliyyəti olan genomik bölgələrdən daha çox Poissonian-a yaxındır.

Bir tərəfdən, Şəkil 4-də ümumiləşdirilmiş nəticələr açıq şəkildə göstərir ki, ONT oxunuşları xəritələşmə qabiliyyətindən çox təsirlənən SON düzülmə istisna olmaqla, iki klassik ardıcıllıq meylindən bir qədər təsirlənir. Digər tərəfdən, PacBio və MiSeq əhatə dairələri yerli GC məzmunundan çox asılıdır və bu, əsasən bu iki ardıcıllıq yanaşmasının əsasında PCR kimyasına aid edilə bilər.

DOC paylamaları və qərəzlilik. Panellərin birinci sütunu (a–u) bütün düzülmələr üçün DOC histoqramlarını və üst-üstə qoyulmuş Poisson paylanması (bərk xətlər) haqqında məlumat verir. İkinci sütun DOC və GC məzmunu arasında korrelyasiya, üçüncü sütun isə DOC və Xəritəçəkmə qabiliyyəti arasındakı əlaqəni göstərir. Panel cərgələri (a–u) müxtəlif hizalayıcılar/platformalar üçün nəticələri göstərir: BWA (A–C), BLASR (D–F), LAST (G–I), HMML (J–L), HMMB (M– O), MiSeq (P–R) və PacBio (S–U). Panellər (v1) və (w1) pəncərə ölçüsü, (v2) və (w2) təkrarlamalar üçün xəta dərəcəsi və silinmələr üçün (v3) və (w3) funksiyası kimi ID-ni bildirir. Panellər (v1), (v2) və (v3) keçid oxunuşlarına, panellər (w1), (w2) və (w3) isə bütün (keçmə+uğursuz) oxunuşlara aiddir. Bu rəqəmin rəngli versiyası BIB-də onlayn mövcuddur: https://academic.oup.com/bib.

DOC paylamaları və qərəzlilik. Panellərin birinci sütunu (a–u) bütün düzülmələr üçün DOC histoqramlarını və üst-üstə qoyulmuş Poisson paylanması (bərk xətlər) haqqında məlumat verir. İkinci sütun DOC və GC məzmunu arasında korrelyasiya, üçüncü sütun isə DOC və Xəritəçəkmə qabiliyyəti arasındakı əlaqəni göstərir. Panel cərgələri (a–u) müxtəlif hizalayıcılar/platformalar üçün nəticələri göstərir: BWA (A–C), BLASR (D–F), LAST (G–I), HMML (J–L), HMMB (M– O), MiSeq (P–R) və PacBio (S–U). Panellər (v1) və (w1) pəncərə ölçüsü, (v2) və (w2) təkrarlamalar üçün xəta dərəcəsi və silinmələr üçün (v3) və (w3) funksiyası kimi ID-ni bildirir. Panellər (v1), (v2) və (v3) keçid oxunuşlarına, panellər (w1), (w2) və (w3) isə bütün (keçmə+uğursuz) oxunuşlara aiddir. Bu rəqəmin rəngli versiyası BIB-də onlayn mövcuddur: https://academic.oup.com/bib.

Əlavə bir addım olaraq, əhatə paylamalarının stoxastik xüsusiyyətlərini başa düşmək üçün müxtəlif pəncərə ölçüləri (10 bp, 20 bp, 50 bp, 100 bp, 200 bp, 500 bp, 1 kb, 2) üçün dispersiya indeksini (ID) hesabladıq. kb, 5 kb, 10 kb və 20 kb). Dispersiya və orta nisbət kimi müəyyən edilən İD, müşahidələr toplusunun qruplaşdırılıb və ya səpələnmiş olub-olmadığını kəmiyyətcə müəyyən etmək üçün istifadə olunur. Xüsusilə, birdən böyük İD mənfi binomial paylanmanı izləyən həddən artıq dağılmış məlumatları, birdən kiçik İD binomial paylanmanı izləyən az dağılmış verilənləri, ID = 1 isə Poisson paylanması olan məlumatları göstərir. [25]-də biz SGS ardıcıllığından DOC paylanmasının birdən çox identifikator nümayiş etdirdiyini və bunun artıq dispersiyanın yerli GC məzmununa və xəritələnmə qabiliyyətinə hesablana biləcəyini nümayiş etdirdik.

SON düzülmələr istisna olmaqla, bütün ONT DOC paylamalarının birinə yaxın identifikatoru var (Şəkil 4), bu məlumatlara GC məzmununun və xəritələnmə qabiliyyətinin aşağı təsirinin birbaşa nəticəsi kimi nanopor-sequencing prosesinin Poissonian xarakterini nümayiş etdirir. . LAST tərəfindən əldə edilən böyük identifikator əsasən bu uyğunlaşdırma metodunun xəritələşmə qabiliyyətinə aid edilə bilər, PacBio paylamalarının həddindən artıq yayılması isə əsasən yuxarıda təsvir edilən GC məzmununun qərəzliyi ilə bağlıdır. MiSeq məlumatlarına GC məzmunu güclü təsir göstərsə də, bu məlumatların kiçik fərqinin nəticəsi olan kiçik ID dəyərlərini göstərir.

Son addım olaraq, CNV hadisələrinin yanlış-müsbət nisbətini qiymətləndirmək üçün 1 nüsxəlik normallaşdırılmış DOC-nin 1,5-dən (təkrarlanma üçün) və 0,5-dən kiçik (silinmələr üçün) olduğu genomik pəncərələrin hissəsini hesabladıq. ONT məlumatları həm təkrarlanan, həm də silinmiş bölgələr üçün ən yaxşı nəticələri əldə etdi, PacBio oxuduqları isə CNV-lərin təhlili üçün zəif uyğunluğu nümayiş etdirən ən yüksək səhv nisbətini verdi. ONT hizalamalarına gəldikdə, BWA xəritələşdirmə məlumatları digər dörd metoddan daha çox performans göstərən ən kiçik səhv dərəcəsini əldə edir. Bundan əlavə, Şəkil 4-ün v1-w3 panellərində təqdim olunan nəticələr pəncərə ölçüsünün artması ilə ID və səhv nisbətinin azaldığını göstərir və bu tendensiya oxunuş ölçüsü ilə yüksək korrelyasiya olunur: MiSeq məlumatları 100 bp-dən böyük pəncərə ölçüsündən azalmağa başlayır. , 2 kb-dən böyük pəncərə ölçülərindən TGS məlumatları isə.

Bütövlükdə götürdükdə, bu təhlillər nümayiş etdirir ki, nanopor-sequencing prosesi oxunuşların təsadüfi və müstəqil ardıcıllıqla aparıldığı vahid prosesdir. Qeyd edək ki, "hamı" oxunuşları (keçid və uğursuzluğu birləşdirən) tərəfindən yaranan xəta dərəcəsi keçid oxunuşları ilə əldə edilən xəta nisbətindən çox kiçikdir: uğursuz oxunuşlar əvəz edilmiş, daxil edilmiş və silinmiş əsasların böyük bir hissəsini ehtiva etsə də, əhatə dairəsinin artmasına səbəb olur. DOC paylanmasının dispersiyasını və nəticədə yanlış müsbət pəncərələrin sayını azaldır.

Variantların aşkarlanması dəqiqliyi

Əvəzetmələr, kiçik InDels və CNV-lər üçün ONT məlumatlarının aşkarlanma sürətini qiymətləndirmək üçün biz MARC məlumatlarını (keçmə və birləşdirilmiş keçid və uğursuz) və digər ardıcıllıq təcrübələrini sintetik məlumatlara qarşı uyğunlaşdırdıq. E. coli istinad genomları.

Sintetik istinad genomları əsasların dəyişdirilməsi, daxil edilməsi və çıxarılması yolu ilə yaradılmışdır. E. coli istinad genomu (daha ətraflı məlumat üçün Metodlar bölməsinə baxın). Bu yanaşmadan istifadə etməklə biz əvəzetmələri, 1-dən 50 bp-ə qədər kiçik InDelləri və 200 bp-dən 5000 kb-a qədər silmələri simulyasiya edə bildik. Üstəlik, seqmental təkrarlanan bölgələrin silinməsinə əsaslanan mürəkkəb strategiyadan istifadə etməklə E. coli istinad genomu ilə biz çoxlu surət dublikasiyasını simulyasiya edə bildik (Usullara baxın). Sintetik istinad genomları ilə müqayisəli oxunuşdan sonra əvəzetmələrin və kiçik InDellərin aşkarlanma dərəcəsi, uyğunlaşdırılmış oxuların yarısından çoxunun orijinal istinad allelini ehtiva etdiyi dəyişdirilmiş lokusların nisbətinin hesablanması ilə təxmini olaraq təxmin edilmişdir. Aşkarlanma dərəcəsi dəyişdirilmiş lokusların yerli DOC funksiyası və kiçik InDels üçün variant ölçüsü funksiyası kimi öyrənilmişdir.

Bu təhlillərin nəticələri Şəkil 5-də ümumiləşdirilmişdir və göstərir ki, gözlənildiyi kimi, MiSeq həm əvəzetmələr, həm də kiçik InDels aşkarlama dəqiqliyi üçün TGS metodlarından üstündür. PacBio əvəzetmələrin kəşfi üçün yaxşı nəticələr əldə etdi, lakin kiçik İndellərin aşkarlanmasında tamamilə uğursuz oldu. ONT məlumatları iki marginAligner mapper ilə əvəzetmələrin aşkarlanması üçün 0,9 aşkarlama sürətinə çatdı və kiçik əlavələr üçün dəqiqlik zəif olsa da (< 0,1), kiçik silmələr üçün BWA və marginAlign ~ 0,3 ⁠ qaydasında aşkarlama dərəcələri əldə etdi, PacBio tərəfindən əldə ediləndən xeyli böyükdür. Gözlənildiyi kimi, InDel ölçüsü nə qədər böyük olarsa, bütün hizalama məlumatlarının onları aşkar etmək qabiliyyəti bir o qədər kiçik olar. Maraqlıdır ki, (MiSeq məlumatları istisna olmaqla) yerli DOC aşkarlama sürətinə az təsir edir, eyni zamanda birləşmiş keçid və uğursuz oxunuşların istifadəsi həm əvəzetmələr, həm də yalnız keçid ardıcıllığından istifadə ilə bağlı kiçik InDels identifikasiyası üçün həssaslığı azaldır.

Əvəzetmələr və kiçik InDels üçün aşkarlanma dərəcəsi. Sintetik istinad genomları ilə təxmin edilən aşkarlama sürətinin xülasəsi. Panellər (A) və (B) əsas əhatə dairəsinin funksiyası kimi əvəzetmələrin aşkarlanma sürətini bildirir. Panellər (C–F) və (G–J) müvafiq olaraq InDels üçün əhatə dairəsi və ölçü funksiyası kimi aşkarlama sürətini bildirir. Təhlillər keçid oxunuşları (A, C, D, G, H) və birləşmiş keçid və uğursuz oxunuşlar (B, E, F, I, J) üçün aparılmışdır. Alt xətlərin qruplaşdırılmasını sadələşdirmək üçün bütün panellərdə variantları və oxunuş növünü təsvir edən başlıq etiketləri var: Alt- (əvəzetmələr), Daxiletmələr- (daxiletmələr), Sil- (silinmələr), -Keçmə (keçmə oxumalar) və -Hamı (keçmə+uğursuz oxunuşlar) . Bu rəqəmin rəngli versiyası BIB-də onlayn mövcuddur: https://academic.oup.com/bib.

Əvəzetmələr və kiçik InDels üçün aşkarlanma dərəcəsi. Sintetik istinad genomları ilə təxmin edilən aşkarlama sürətinin xülasəsi. Panellər (A) və (B) əsas əhatə dairəsinin funksiyası kimi əvəzetmələrin aşkarlanma sürətini bildirir. Panellər (C–F) və (G–J) müvafiq olaraq InDels üçün əhatə dairəsi və ölçü funksiyası kimi aşkarlama sürətini bildirir. Təhlillər keçid oxunuşları (A, C, D, G, H) və birləşmiş keçid və uğursuz oxunuşlar (B, E, F, I, J) üçün aparılmışdır. Alt xətlərin qruplaşdırılmasını sadələşdirmək üçün bütün panellərdə variantları və oxunuş növünü təsvir edən başlıq etiketləri var: Alt- (əvəzetmələr), Daxiletmələr- (daxiletmələr), Sil- (silinmələr), -Keçmə (keçmə oxumalar) və -Hamı (keçmə+uğursuz oxunuşlar) . Bu rəqəmin rəngli versiyası BIB-də onlayn mövcuddur: https://academic.oup.com/bib.

Hal-hazırda, ONT məlumatları ilə variantları çağırmaq üçün bir neçə üsul işlənib hazırlanmışdır və Nanopolish [28] və marginCaller [17] daxil olan bu üsullar yalnız əvəzediciləri axtarmağa qadirdir. Nanopolish variantını çağıran şəxs əvvəlcə uyğunlaşdırılmış oxunuşlar və istinad genomu arasında uyğunsuzluqlar əsasında namizəd variantlarını seçir və sonra onları yaxın variantlar dəstlərində qruplaşdırır. Variantların hər bir çoxluğu SNV-lərin mümkün birləşmələrindən bir sıra namizəd haplotiplər yaratmaq üçün istifadə olunur və hadisə səviyyəsində məlumatların ehtimalını maksimuma çatdıran haplotip bölgə üçün ardıcıllıq adlanır. MarginCaller (marginAlign aləti) HMM-ə əsaslanan yenidən hizalama strategiyasından istifadə edərək oxunuşlardakı əsaslar və istinad arasında posterior uyğunlaşma uyğunluğu ehtimallarını hesablayır.

Təəssüf ki, nanopolish performansı xam Fast5 fayllarının olmaması səbəbindən sınaqdan keçirilə bilmədi, lakin sintetik variantlar məlumat dəstində marginCaller ilə aparılan təhlillər (Əlavə Şəkil S13) bu alətin 0,99 civarında aşkarlama sürətinə çata bildiyini göstərir. Bununla belə, bu təhlillər onu da göstərir ki, marginCaller-ın yüksək aşkarlanma dərəcəsi C və G-də xeyli sayda yanlış-müsbət əvəzləmələr hesabına əldə edilir ki, bu alətin əsasındakı HMM alqoritminin təsiri azaltmaq iqtidarında deyil. ONT oxunuşlarının təkrarlanan səhv meylinin.

CNV-lərdə iştirak edən genomik bölgələri müəyyən etmək üçün müxtəlif ardıcıllıq texnologiyalarının düzgünlüyünü qiymətləndirmək üçün müxtəlif pəncərə ölçüləri üçün 1 nüsxəlik normallaşdırılmış DOC hesabladıq. Hər bir simulyasiya edilmiş variantın DNT nüsxələrinin mütləq sayı region daxilindəki pəncərələrin median DOC-unun hesablanması yolu ilə təxmin edilmişdir və bu dəyər 0,5-dən kiçik olarsa silinmə, 1,5-dən böyük olarsa dublikasiya çağırılır. Şəkil 6 və Əlavə Şəkil S16-da verilən nəticələr aydın şəkildə göstərir ki, bütün ardıcıllıq texnologiyaları silinmiş bölgələri (0-nüsxə) düzgün müəyyən etməyə qadir olsa da, yalnız BWA ilə uyğunlaşdırılmış MiSeq və ONT oxunuşları yüksək dəqiqliklə təkrarlamaları müəyyən edə və təxmin edə bilir. hətta çox təkrarlanan bölgələr üçün də onların DNT nüsxələrinin dəqiq sayı. Bundan əlavə, ONT-BWA məlumatları, MiSeq məlumatlarını üstələyərək, simulyasiya edilmiş və proqnozlaşdırılan nüsxə sayı arasında ən yaxşı korrelyasiya əldə etdi. Qeyd edək ki, Əlavə Şəkil S14, ardıcıllığın əhatə dairəsinin CNV aşkarlama sürətinə az təsir etdiyini nümayiş etdirir.

CNV-lər üçün aşkarlanma dərəcəsi və DNT nüsxələrinin mütləq sayı proqnozu. Panellər (A–D) pəncərə ölçüsündən asılı olaraq simulyasiya edilmiş silinmələrin (A, B) və təkrarlamaların (C, D) aşkarlanma sürətini göstərir. Panellər (E və F) bütün hizalayıcılar/platformalar üçün DNT nüsxələrinin təqlid edilmiş və proqnozlaşdırılan mütləq sayı arasında korrelyasiya barədə məlumat verir. Panellər (A, C və D) keçid oxunuşları üçün, panellər isə (B, D və F) birləşdirilmiş keçid və uğursuz oxunuşlar üçün nəticələri göstərir. Bu rəqəmin rəngli versiyası BIB-də onlayn mövcuddur: https://academic.oup.com/bib.

CNV-lər üçün aşkarlanma dərəcəsi və DNT nüsxələrinin mütləq sayı proqnozu. Panellər (A–D) pəncərə ölçüsündən asılı olaraq simulyasiya edilmiş silinmələrin (A, B) və təkrarlamaların (C, D) aşkarlanma sürətini göstərir. Panellər (E və F) bütün hizalayıcılar/platformalar üçün DNT nüsxələrinin təqlid edilmiş və proqnozlaşdırılan mütləq sayı arasında korrelyasiya barədə məlumat verir. Panellər (A, C və D) keçid oxunuşları üçün, panellər isə (B, D və F) birləşdirilmiş keçid və uğursuz oxunuşlar üçün nəticələri göstərir. Bu rəqəmin rəngli versiyası BIB-də onlayn mövcuddur: https://academic.oup.com/bib.

Bu nəticələr, əvvəlki bölmədə bildirilənlərlə birlikdə, ONT məlumatlarının CNV-ləri yüksək dəqiqliklə müəyyən etmək üçün asanlıqla istifadə edilə biləcəyini nümayiş etdirir.


Deborah Pardo mobil postdokda….

Erkən karyera tədqiqatçılarının sosial kompromisləri haqqında…

Elmdə erkən karyera mövqeyinə çatmaq o deməkdir ki, siz və mən artıq şəxsi həyatımızda və ümumilikdə sosial həyatımızda bəzi fədakarlıqlar etmişik. Bu bloqu yazmaq istədim, çünki bu barədə tez-tez danışmırıq. Bunun hər şeyi çox dəyişəcəyinə əmin deyiləm, lakin bu, həm həyatımızda xoşbəxt olmaq, həm də peşəkar cəhətdən səmərəli olmaq üçün ən yaxşı tarazlığı tapmaq istiqamətində addımlar atmaq cəhdidir.

Mən Fransanın cənub-şərq sahilində çox gözəl bir yerdən gəlmişəm, burada güclü yerli mədəniyyət var və insanlar dünyanın ən yaxşı yerində yaşadıqlarına əmindirlər. Əminəm ki, bu sizin doğma şəhərlərinizə aiddir, ya yox. Tədqiqatçı olmaq arzusu ilə, tərifinə görə, köçməli və xaricdə bir müddət vaxt keçirməlisən. Xaricə getmək dedikdə təkcə səyahəti nəzərdə tutmuram, əslində xarici ölkədə yaşamaq və başqa insanların mədəniyyətlərini bölüşməkdir. Hərəkət edir…. kəşf üçün susuzluğunuz, maraqlı insanlarla tanış olmaq, dünyanı görmək, zehninizi açmaq və s. Amma o biri tərəfdən GAP yaradır.

İlk növbədə mədəniyyətlər arasında bəzən gözlədiyinizdən daha böyük bir boşluq. İlk post-doc üçün çox uzağa getmədim və Böyük Britaniyada Kembricdə bitirdim. Bu, həqiqətən də əla yerdir və işləmək üçün çox stimullaşdırıcı mühitdir. Amma mən bəzən insanları başa düşmürəm. Hər şey həmişə “möcüzəli” və “sevimli”dir, amma zəhmət olmasa, mənə həqiqətən nə düşündüyünüzü deyə bilərsinizmi? Mənim mədəniyyətimdən bu, səmərəsiz görünür, çox yaxşı, orta və ya pis arasında fərq yarada bilsək, hər kəsə irəliləməyə kömək edərdi. Kiməsə səhv yolda olub-olmadığını və bunun səbəbini söyləməkdə utanc yoxdur. Amma məncə, ingilislər başa düşdüyüm qədər sadəcə incitmək istəmirlər, ona görə də belə veb səhifələrə etibar etməli oluram: http://www.buzzfeed.com/lukelewis/what-british-people-say- nəyi nəzərdə tuturlar. Bu, bəzən gülməli olsa da, bəzən yorucu olur. Və bu sadəcə Avropadır, mən qitəni dəyişdirəndə mədəniyyətlər arasında uçurumu təsəvvür edə bilmirəm.

İşiniz üçün qürbətçi olduğunuz zaman qarşılaşdığınız ikinci boşluq uşaqlıq dostlarınız/ailənizlə olur. Bir dəfə ən yaxşı dostlarımdan biri İsveçə ERASMUS-a getməmişdən əvvəl mənə dedi: “Mən başa düşmürəm ki, sən öz işini sevgilinin əvəzinə necə seçə bilərsən, mən bunu heç vaxt edə bilməzdim və onun tək qalması kasıb üçün çox eqoistdir. burada”. Bəli, yəqin ki, bəziləriniz də bundan keçmisiniz. Onu başa düşməmək və/yaxud dəstəkləməmək çox çətindir. İndi olduğumuz nöqtəyə çatmaq üçün seçim etməli idik. Və bu, ehtiras, inam, pul qazanmaq üçün təsadüfi darıxdırıcı işə getməkdən daha güclü bir şeylə başlayır. Hesab edirəm ki, ətrafımızdakı prosesləri kəşf etmək və daha yaxşı başa düşmək ehtiyacı hər kəs tərəfindən hiss olunmayan bir şeydir. Bunu hiss etməyənlər heç vaxt başa düşə bilməzlər, lakin bu arada sizinlə köhnə dostunuz və ailə üzvləriniz arasında uçurum böyüyür. Aldığınız işin miqdarı və aldığınız az miqdarda pulla boşluq daha da böyüyür. Ailə üzvlərinin xəstələnməsi, nənə və babanın qocalması, yalnız bir dəfə gördüyünüz yeni doğulmuş körpələr, bütün toy təşkilatının qaçırılması və sırf bunun üçün geri qayıtmaq çox baha olduğu üçün iştirak edə bilmədiyiniz möhtəşəm məclislər. Düşünürəm ki, hamımız bununla qarşılaşırıq və bu çətindir, amma sonda bunu qəbul etmək üçün həqiqətən güclü olmalı və həqiqətən kim olduğunuza sadiq qalaraq çox çalışmaq lazımdır. Karyeramızın hansısa nöqtəsində biz əslində elə bir məqama çata bilərik ki, bu, artıq o qədər də böyük problem deyil…

Başqa bir boşluq, əlbəttə ki, münasibətlərinizdədir. Görünür, məsafəli əlaqələr və ya ümumiyyətlə heç bir əlaqənin olmaması karyeranın başlanğıcında olan tədqiqatçıların ixtisasıdır. Yenə də, ya həqiqətən başa düşən, ya da sizin kimi ehtiraslı birini tapmalısınız (baxmayaraq ki, bu, hər şeyi daha da çətinləşdirə bilər), lakin müxtəlif şəhərlərdə və ya ölkələrdə qarşıdan gələn qısamüddətli müqavilələr dəsti əsl problemə çevrilə bilər. Mən heç ailə qurmaqdan da danışmıram. Tədqiqatda iştirak edən həm kişilər, həm də qadınlar üçün uşaq sahibi olmaq üçün doğru vaxt deyil, çünki həmyaşıdlarınız tərəfindən tanınmaq üçün iş vaxtınızı maksimum dərəcədə artırmaq lazımdır. Mübahisə edərdim ki, qadınlar üçün ilk növbədə özünü hazır hiss etmək, düzgün müqaviləyə sahib olmaq, anlayışlı bir patron olmaq və bir müddət tədqiqatı yarımçıq qoymaqdan çox qorxmamaq daha çətindir. Partnyorunuz və dostlarınız eyni mövqedə olmadıqda, siz hamıdan çox yavaş olursunuz (buraya ev sahibi olmaq da daxildir) ki, sizin, dostlarınız, partnyorunuz, ailənizin sizi narahat etməsi, Siz hələ bioloji olaraq təsəvvür edə bildiyiniz zaman və əvvəllər yaşadığınız həyat ideyası…

Düşünə biləcəyim son boşluq özünüzlədir. Mən bunu niyə edirəm? Mən hər şeydən əl çəkib sevdiklərimlə və ya hər kəs kimi pul qazanmaq üçün təsadüfi darıxdırıcı işə qayıda bilmərəmmi? Niyə mən həmişə axşam, həftə sonları və bayramlarda iş haqqında düşünürəm? Araşdırdığım xırda konkret suallar kimin vecinədir? Həqiqətən mənim istədiyim/layiq olduğum həyat budurmu? Etdiyimə inanmaqda bəzən çətinlik çəkirəm və bu işdə tək olmadığıma inanıram. Ümumiyyətlə, tədqiqat işlərində də işin sonu yoxdur. Beləliklə, nə qədər çox işləsəniz, bir o qədər uzağa gedə bilərsiniz! Amma bu, sadəcə olaraq yeni suallar açır və onlara cavab vermək üçün daha çox işləməlisən…. Sonda məncə, sadəcə oturub bizim üçün düzgün balansın nə olduğunu düşünməliyik. Demək olar ki, hamımız bunu artıq bildiyimiz üçün, etdiyimizi o qədər sevirik ki, heç bir şey dəyişməyəcək. Amma heç olmasa bu bloqu yazmaqla onlardan xəbərdar olmağa çalışmaq xoş idi, ümid edirəm ki, bəyənəcəksiniz!


Oxford Nanopore Sequencing-in çatışmazlıqları hansılardır?

Beləliklə, mən bir neçə min dollara real vaxt rejimində, uzun müddət oxunuş ardıcıllığını təmin edən MinION sequencer ilə rastlaşdım və belə bir sekvencerin çatışmazlıqlarının nə olduğunu düşünürəm. Mən də gördüm ki, onların PromethION kimi daha böyük sequencerləri var və mənə maraqlıdır ki, onlar Illumia ilə müqayisədə necə işləyirlər. Bu cihazlar akademiklərdə RNT-seq üçün istifadə edilə bilərmi, yoxsa onlar o qədər də işlək deyillər? Deyəsən, onların bütün sequencerləri "nanopore" texnologiyasından asılıdır, lakin mən bildim ki, texnologiya 2010-cu ildən yaranan ideyaya görə nisbətən köhnədir, bəs nə üçün başqa heç kim bu növ ardıcıllığa keçməyibsə, əgər bu daha düzdür?

Təxminən 2010-cu ildən yaranan ideya ilə texnologiyanın nisbətən köhnə olduğunu öyrəndim

Uh? Bu son dərəcə olardı gənc. Mən də bilmirəm bu nömrəni haradan alırsınız. Reallıqda, sekvensiya üçün nanoporlardan istifadə ideyası 1990-cı illərdə yaranıb. Sadəcə uyğun bir məsamə hazırlamaq və texnikanı istifadəyə yararlılıq nöqtəsinə qədər təkmilləşdirmək çox uzun vaxt apardı.

İlk nanopor sekvenserləri mövcud olduqda (ilk kommersiya mövcudluğu 2015 idi), bazar artıq Solexa/Illumina-nın əlində idi.

2015-ci ildə laboratoriyam onu ​​təsadüfi bir baza generatoru tapırdı. Cəmi bir neçə il olduğunu nəzərə alsaq, o, mütləq sürətlə inkişaf etdi

Bəli, onlar mütləq cDNA ardıcıllığı üçün istifadə edilə bilər (və bu məsələdə əsl yerli RNT ardıcıllığı). Dəqiqliklə bağlı narahatlıqlar cDNA geni/transkriptinin hesablanması üçün 90%-dən yuxarı olduqda mübahisəli məqamdır (və Nanopore ən son əsas zəng edənlərlə 95%-ə yaxındır). Əhəmiyyətli olan hər şey bir ardıcıllığın onun başlanğıc transkriptinə etibarlı şəkildə təyin edilib-edilməməsidir.

Mənim fikrimcə, Nanopore cDNA sıralama işləri daha aşağı qiymətə, daha sürətli işləmə vaxtı və həqiqi izoform səviyyəli nəticələrlə Illumina ilə müqayisədə müqayisə edilə bilən (və ya bəlkə də daha yaxşı) həssaslıq və spesifikliyə malikdir. Bunun səbəbi daha az səs-küy səviyyəsinin olmasıdır (yəni Nanopore ilə müqayisədə ən çox 2-5 oxunuş).

Illumina üçün 100) daha aşağı oxunma sayını kompensasiya edir (məsələn, Nanopopore üçün 1M oxunuş, Illumina üçün 40M oxunması). Bundan əlavə, daha uzun oxunuşlar eşlenen oxuların izoforma unikal şəkildə toxunma ehtimalını artırır və xəritələnmiş oxunuşların transkriptin bütünlüklə əhatə etməsi ehtimalı daha yüksəkdir. Burada Nanopore ilə Illumina-nın fərqli oxu uzunluqlarını göstərən bir qrafik əldə etdim:

İnsanları sınamağa inandırmaq üçün göstərməli olduğum səylərin miqdarı. Oxford Nanopore öz məhsullarını bazara çıxarmaq üçün əsasən ağızdan-ağıza istifadə edir, bu da o deməkdir ki, onlar tədqiqatçı alimlərin (məsələn, mənim kimi) bacarıqsız marketinq qabiliyyətinə çox etibar edirlər. Onların işçiləri çıxış etmək üçün yerlərə gedəcəklər, lakin ümumiyyətlə yalnız dəvət olunduqları zaman. Mən digər insanların məlumatlarını təhlil edərək pul qazanıram, ona görə də bu səyləri sərf etmək mənim üçün faydalıdır.

İllər boyu dərc edilmiş araşdırmaların bu ifadələrə zidd olmasına baxmayaraq, ", heç vaxt klinik şəraitdə istifadə edilməyəcək" kimi yanlış məlumat yaymağa davam edən tənqidçilərlə qızğın müzakirələr. Mən bu ifadələrin şəxsi fikirlər/gözləntilər olduğunu güman edirəm, ona görə də bu ifadələri birbaşa təkzib etməkdən çəkinməyə çalışın.

İnsanlar adətən "ucuz" ilə "easy" bərabər olurlar. Bu, digər ardıcıllıqdan çox fərqli bir prosesdir, hətta laboratoriyaların ardıcıllığı özləri etməkdənsə, bir xidmət kimi yerinə yetirməyə meylli olduğunu nəzərə almasaq. Nanopore təlim təklif edir, lakin bu, çox bahadır, buna görə də insanların çoxu özlərini qarışdırmağa çalışırlar (buna görə də sekvensatorların toz toplamasına meyl var).

Oxford Nanopore-un rəsmi nümunə hazırlama protokolları düzgün versiyaya salınmayıb və sadəlövh istifadəçilər (xüsusilə də ardıcıllıq xidməti obyektində işləməyə öyrəşməyən istifadəçilər) üçün çoxlu tələlərə malikdir. ONT də açıq şəkildə deməyib ki, protokolları müvafiq protokol versiyalaşdırma xidmətinə (məsələn, protocols.io) köçürmək düzgündür, ona görə də tədqiqat işlərində bildirilənlərə müxtəlif rəqslər daxildir.

Nanopore oxunuşları ilə işləmək üçün proqram çox yenidir, əmr xəttinə əsaslanmağa meyllidir və buna görə də çox istifadəçi dostu deyil.

MinION sequencerləri ($1000 olanlar) digər insanlara kommersiya ardıcıllığı xidmətləri göstərmək üçün istifadə edilə bilməz [Nanoporenin cavabı odur ki, başqa insanlar sadəcə öz MinION-larını almalıdırlar].

GridION və PromethION-un dəyəri o qədər aşağıdır ki, o, maliyyələşdirmə üçün "doğru olmaq üçün çox yaxşı" şübhələr yaradır (sequencer alışına daxil olan axın hüceyrələrinin kommersiya dəyəri sekvenserin kapital dəyərinə bənzəyir).

Texnologiya yenilikləri. Müəyyən bir texnologiya nəşr edilmiş bir məqaləyə daxil olanda, Nanopore-nin hərəkətə keçməsi və daha yaxşı bir şey yaratması (və nəşr olunan texnologiya üçün protokollarını "arxivləşdirdi" / silməsi adi bir hadisədir.


Əlçatanlıq + Sürət = irəliləyişlər

2015-ci ildə istifadəyə verildiyi gündən bəri, MinION DNT ardıcıllığını ən maraqlı elm adamlarının əlinə verdi, bəziləri dünyanın ən çətin yerlərində işləyirlər. Nümunələr tez-tez Oxford Nanopore-un @nanopore twitter səhifəsində yerləşdirilir.

Yalnız bu həftə dərc edilən başqa bir əsər, dəniz suyunun göyərtəsində elmi təhlillər aparmaq üçün Alyaskada dəniz tədqiqat gəmisində MinIT və MinION-dan necə istifadə edildiyini təsvir edir.

İş dənizdəki mikrob həyatının DNT analizinə yönəlib, tədqiqatçılara dəniz ekosistemini, okeandakı biomüxtəlifliyi və iqlim dəyişikliyinin oradakı mikroorqanizmlərə necə təsir göstərə biləcəyini anlamağa kömək edir.

Performansa - həm sürətə, həm də dəqiqliyə diqqət yetirir - Oxford Nanopore bütün DNT sıralama cihazları ilə birlikdə məlumatların təhlili üçün NVIDIA GPU-lardan istifadə edir.

NVIDIA AGX-də MiniIT ilə onlar real vaxt rejimində insan və bitki genomikasının kilidini açmağa kömək etmək üçün əvvəlki versiyalarla müqayisədə performansı 10 dəfə artırmağa yaxınlaşırlar. Onun tezgah üstü PromethION məhsulu NVIDIA Volta GPU-ları ilə təchiz edilib və 800 dollardan aşağı qiymətə insan genomunu çıxara bilər.


Videoya baxın: Marvel Avengers Puzzle Palz 3D Puzzle Erasers (Iyun 2022).