Məlumat

1.7: Tapşırıq- Vizuallaşdırma Taksonomiyası - Biologiya

1.7: Tapşırıq- Vizuallaşdırma Taksonomiyası - Biologiya


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Açıq Pedaqogika Tapşırıqları tələbələrin öz öyrənmələrini, sinif yoldaşlarının öyrənmələrini və bütün dünyada tələbələrin öyrənmələrini dəstəkləyə biləcək bilik artefaktları yaratmaq üçün öz imkanlarından və yaradıcılıqlarından istifadə etdikləri tapşırıqlardır. (Ətraflı təfərrüatlar üçün nəzərdən keçirilən bu məqaləyə baxın.) Bu səhifədəki tapşırıq I Qeyri-İxtisaslar üçün Biologiya fənninin öyrənmə nəticəsi ilə uyğunlaşdırılıb və biz oxunun göründüyü modulu müəyyən etdik. Tapşırıq əsas veb və hesablama alətləri, mobil telefon kamerası və ya hər hansı videoyazma cihazı, Google və ya Word sənədləri və öyrənmə idarəetmə sisteminizlə yaradıla bilər.

Öyrənmə Məqsədləri

  • Əlaqələrin binomial adlandırma sistemi ilə necə göstərildiyini izah edin

Biologiyanın müəyyənləşdirilməsi və onun prinsiplərinin tətbiqi ilə bağlı giriş modulunda biz bioloqların həyatı necə və nə üçün öyrəndikləri barədə ümumi məlumat veririk. Bu tapşırıq üçün siz bioloqların müxtəlif həyat formalarını necə təşkil etdiyini və təsnif etdiyini düşünəcəksiniz ki, biz onları daha yaxşı başa düşə bilək.

İşinizin məhsulu gələcək tələbələrə kursda bəzi ən çətin anlayışları öyrənməyə kömək edə bilər. Beləliklə, auditoriyanızı növbəti dövr üçün Biologiyadan Qeyri-biologiyanı qəbul edən dostlar kimi düşünün. Məqsədiniz bioloqların konsepsiyanı vizuallaşdırmaqla istifadə etdikləri təsnifat sistemlərini anlamağa kömək etməkdir.

Birinci, bioloji taksonomiyadan istifadə edərək müəyyən etmək üçün bir orqanizm seçin. Bu, maraqlı, özünəməxsus və ya təcrübənizdən tapdığınız hər hansı bir bitki və ya heyvan ola bilər. Vizualizasiyanızı görə biləcək gələcək tələbələr haqqında bir daha düşünün: yerli mühitinizdən bir orqanizm seçə bilərsinizmi və ya müəssisənizdə oxuyan tələbələrdən xüsusi məna daşıyan orqanizmi seçə bilərsinizmi?

İkinci, orqanizmin binomial nomenklaturasındakı elmi adı, həmçinin orqanizminiz üçün taksonomik iyerarxiyanı təşkil edən təsnifatlar seriyasını müəyyənləşdirin. Carl Linnaeus tərəfindən təklif olunan sistemə görə, burada ən genişdən ən spesifikə qədər sadalanan səkkiz takson var:

  • domen
  • səltənət
  • filum
  • sinif
  • sifariş
  • ailə
  • cins
  • növlər

üçüncü, bu orqanizmin taksonomiyasını necə təsəvvür edərdiniz? Vizualizasiyaya baxan kimsə taksonomik qruplaşmaların iyerarxik və ya iç-içə əlaqələrini başa düşə bilməlidir. Orijinal vizuallaşdırmanızı etmək üçün istədiyiniz hər hansı vasitələrdən istifadə edə bilərsiniz: rəsm, kollaj, rəqəmsal illüstrasiya, video, slayd şousu və s. Uğurlu vizuallaşdırma aydın və dəqiq etiketləri əhatə edəcəkdir.

Nəhayət, vizualizasiyanı təlimatçı ilə paylaşın. Qiymətləndirdikdən sonra və sizin icazənizlə, digər tələbələrin öyrənməsini təkmilləşdirmək üçün vizuallaşdırmanız kursun gələcək bölmələrində görünə bilər!


Müəllimlərə Qeyd: Şagirdləriniz ilk dəfə bu tapşırığı yerinə yetirdikdə, ən yaxşılarını seçin və tələbələrdən onları gələcək bölmələrə daxil etmək üçün icazə istəyin. Sadəcə vizuallaşdırmaları LMS-də müvafiq modulda yerləşdirin. İdeya, tələbələrin bu tapşırıqda digər tələbələrin öyrənə biləcəyi məzmun yaratmasıdır.


1.7: Tapşırıq- Vizuallaşdırma Taksonomiyası - Biologiya

Zəhmət olmasa müraciət edin Kraken 2 Github Wiki irəliləyən bütün yeniləmələr üçün. Biz bütün müvafiq məlumatları/linkləri Github Wiki səhifəsinə köçürmək prosesindəyik. Səbr etdiyiniz üçün təşəkkürlər.

2020-ci ilin sentyabr ayından etibarən biz ən çox istifadə edilən Kraken2 indekslərinin bir çoxunu yerləşdirmək üçün Amazon Veb Xidmətləri saytını yaratdıq. https://github.com/BenLangmead/aws-indexes.

KrakenTools Kraken nəticələrinin təhlilinə kömək etmək üçün skriptlər dəstidir. KrakenTools Cennifer Lu tərəfindən idarə olunan davam edən bir layihədir. Daha ətraflı məlumat üçün KrakenTools veb səhifəsinə baxın.


Fon

Mikroorqanizmlərin populyasiyasının genomik təhlili olan metagenomika ətraf mühitdə və insan orqanizmində görünməmiş dərinlik və genişlikdə mikrob icmalarının profilini çıxarmağa imkan verir. Onun sürətlə genişlənən istifadəsi təbii və texnogen mühitlərdə mikrob müxtəlifliyi anlayışımızda inqilab edir və mikrob icmasının profillərini sağlamlıq və xəstəliklə əlaqələndirir [1-9]. Bu günə qədər əksər tədqiqatlar mikrob marker genlərinin (məsələn, bakterial 16S ribosomal RNT [rRNA]) PCR gücləndirilməsinə əsaslanır, bunun üçün böyük, seçilmiş verilənlər bazası yaradılmışdır [10-12]. Bu yaxınlarda daha yüksək məhsuldarlıq və aşağı qiymət ardıcıllığı texnologiyaları zənginləşdirmədən asılı olmayan metagenomikaya doğru keçidi təmin etdi. Bu yanaşmalar qərəzliyi azaldır, daha az bol olan taksonların aşkarlanmasını yaxşılaşdırır və yeni patogenlərin aşkar edilməsinə imkan verir [13-15]. Bundan əlavə, onlar yoluxucu xəstəliklərin diaqnozunun necə dəyişdiriləcəyini vəd edirlər.

Mikrob mədəniyyətinin molekulyar testlərlə əvəzlənməsi ilə yoluxucu xəstəliklərin laboratoriya diaqnostikası getdikcə patogenə xas testlərə əsaslanır. Daha həssas olsalar da, tələb edirlər a priori ehtimal olunan etioloji agentlər haqqında biliklər (yəni “patogen X mövcuddur” sualına cavab vermək). Bir neçə ümumi sindrom üçün (məsələn, sətəlcəm, sepsis, ensefalit) çoxlu müxtəlif patogenlər klinik cəhətdən fərqlənməyən simptomlara səbəb ola bilər. Beləliklə, ümumi patogenlərin aşkarlanması üçün getdikcə daha böyük, lakin mahiyyət etibarilə məhdud diaqnostik panellər lazımdır və birinci sıra testləri mənfi olarsa, geniş təqib testi tələb oluna bilər. Bunun əksinə olaraq, zənginləşdirmədən müstəqil yeni nəsil ardıcıllığı (NGS) nəzəri cəhətdən qeyri-məhdud sayda ümumi və qeyri-adi patogenləri qərəzsiz, hipotezsiz aşkar etməyə və molekulyar tipləşdirməyə imkan verir (yəni “hansı patogen var” sualına cavab verir). Qərəzsiz, NGS-ə əsaslanan patogen aşkarlanması əvvəllər tanınmamış infeksiyaların diaqnozuna və seçilmiş hallarda yeni patogenlərin aşkar edilməsinə səbəb olmuşdur (məsələn, [16]-ya baxın). Potensial patogenlərin aşkarlanması üçün vahid yanaşma diaqnostik məhsuldarlığı artıracaq, gözlənilməz patogenlərin ortaya çıxma müddətini azaldacaq, məqsədyönlü müalicəni təkmilləşdirəcək və ictimai səhiyyə fövqəladə hallarına operativ reaksiya verməyə kömək edəcək.

Ardıcıllıq məlumatlarından birbaşa patogenin identifikasiyası ümumiyyətlə məqsəd olsa da, hətta xüsusi törədici patogen müəyyən edilə bilmədikdə belə, məsələn, virusu bakterial infeksiyalardan fərqləndirmək antibiotik müalicəsinin zəruri olub-olmadığını göstərə bilər. Keçmişdə buna leykosit reaksiyasının, zülal markerlərinin (məsələn, prokalsitonin) və ya qan leykositlərindən mikroarray əsaslı host transkript ifadəsi profilinin qiymətləndirilməsi vasitəsilə cəhd edilmişdir [17-19]. RNT ardıcıllığının (RNT-seq) daha yüksək həssaslığı və qərəzsiz təbiəti eyni vaxtda patogenin aşkarlanmasına və ev sahibinin ifadə reaksiyasının profilinə imkan yaradır ki, bu da nəzəri olaraq müalicəni daha yaxşı məlumatlandırmaq üçün istifadə edilə bilər, potensial olaraq mövcud yanaşmaların bir çox məhdudiyyətini aradan qaldırır [20, 21] , patogenin qəti diaqnozu olmadıqda belə.

NGS həmçinin daha əhatəli mikrob profilləşdirmə tədqiqatlarına imkan verir. Məsələn, selikli qişanın və dəri mikrobiotasının disbiozu metabolik, immunoloji, ürək-damar və neoplastik xəstəliklərlə əlaqələndirilmişdir [5, 22-26]. Bununla belə, bu gün əksər mikrobiom tədqiqatları hələ də marker genlərinin (məsələn, bakterial 16S rRNA) PCR gücləndirilməsinə əsaslanır. Bu yanaşma qərəzliliyi təqdim edir [13], heç bir marker genin mövcud olmadığı müvafiq viral və faq florasının təsirlərinə məhəl qoymur [27-29] və bütün yoluxucu xəstəliklərin nəticələrinə təsir etdiyi məlum olan ev sahibinin reaksiya fərqlərini qiymətləndirə bilmir. və insan mikrob icmalarını modulyasiya edir.

NGS alətlərinin geniş əlçatanlığı, aşağı reagent xərcləri və sadələşdirilmiş nümunə hazırlama protokolları artan sayda tədqiqatçılara metagenomik tədqiqatlar üçün yüksək məhsuldarlıqlı DNT və RNT-seq həyata keçirməyə imkan verdi. Təəssüf ki, yüksək məhsuldarlıqlı metagenomika tərəfindən yaradılan böyük məlumat dəstlərinin təhlili əksər laboratoriyalarda, xüsusən də diaqnostik laboratoriyalarda olmayan bioinformatika bacarıqları, hesablama resursları və mikrobioloji təcrübənin birləşməsini tələb edir. Beləliklə, hərtərəfli diaqnostik və metagenomik analizlər üçün hesablama baxımından daha səmərəli, dəqiq və istifadəsi asan vasitələrə ehtiyac var.


Garrity, G.M. Bakteriya və Arxeyanın yeni genomikaya əsaslanan taksonomiyası: biz hələ oradayıq? J. Clin. Mikrobiol. 54, 1956–1963 (2016).

Hugenholtz, P., Sharshewski, A. & Parks, D.H. Genom əsaslı mikrob taksonomiyası yetkinləşir. in Mikrobların təkamülü (red. Ochman, H.) 55–65 (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Nyu-York, ABŞ, 2016).

Yoon, S.H. və b. EzBioCloud-u təqdim edirik: 16S rRNA gen ardıcıllığı və bütöv genom birləşmələrinin taksonomik cəhətdən birləşdirilmiş verilənlər bazası. Int. J. Sistem. Təkamül. Mikrobiol. 67, 1613–1617 (2017).

Godfray, H.C.J. Taksonomiya üçün problemlər. Təbiət 417, 17–19 (2002).

Federhen, S. NCBI taksonomiya verilənlər bazası. Nuklein turşuları Res. 40, D136–D143 (2012).

Yılmaz, P. və b. SILVA və “Bütün Növlər Yaşayan Ağac Layihəsi (LTP)” taksonomik çərçivələri. Nuklein turşuları Res. 42, D643–D648 (2014).

Cole, J.R. və başqaları. Ribosomal verilənlər bazası layihəsi: yüksək ötürücülü rRNA analizi üçün məlumat və alətlər. Nuklein turşuları Res. 42, D633–D642 (2014).

McDonald, D. et al. Bakteriyaların və arxelərin ekoloji və təkamül analizləri üçün açıq dərəcələri olan təkmilləşdirilmiş Greengenes taksonomiyası. ISME J. 6, 610–618 (2012).

Yutin, N. və Galperin, M.Y. Klostridial filogeniyaya dair genomik yeniləmə: Qram-mənfi spor əmələ gətirənlər və digər yersiz klostridiyalar. Ətraf. Mikrobiol. 15, 2631–2641 (2013).

Beiko, R.G. Mikrob nasazlığı: mikrobiomu necə təsnif edə bilərik? Trendlər Microbiol. 23, 671–679 (2015).

Yarza, P. et al. 16S rRNA gen ardıcıllığından istifadə edərək mədəni və mədəniyyətsiz bakteriyaların və arxelərin təsnifatının birləşdirilməsi. Nat. Rev. Mikrobiol. 12, 635–645 (2014).

Abbott, S.L. & Janda, J.M. in Prokaryotlar 3-cü nəşr. (red. Dworkin, M. et al.) 72-89 (Springer, New York, 2006).

Jumas-Bilak, E., Roudière, L. & Marchandin, H. Təsviri "Sinergistlər" fil. noyabr və filumun dəyişdirilmiş təsviri 'Deferribacteres' və ailədən Syntrophomonadaceae, filum 'Firmaçılar'. Int. J. Sistem. Təkamül. Mikrobiol. 59, 1028–1035 (2009).

Janda, J.M. və Abbott, S.L. Diaqnostik laboratoriyada bakteriya identifikasiyası üçün 16S rRNA gen ardıcıllığı: üstünlüklər, təhlükələr və tələlər. J. Clin. Mikrobiol. 45, 2761–2764 (2007).

Schulz, F. et al. Bakterial həyat ağacının balanslaşdırılmış görünüşünə doğru. Mikrobiom 5, 140 (2017).

DeSantis, T.Z. və b. Greengenes, kimera tərəfindən yoxlanılan 16S rRNA gen verilənlər bazası və ARB ilə uyğun iş masası. Tətbiq. Ətraf. Mikrobiol. 72, 5069–5072 (2006).

Brochier, C., Forterre, P. & Gribaldo, S. Archaea'nın yaranan filogenetik nüvəsi: transkripsiya və tərcümə mexanizmlərinin filogeniyaları yeni genom ardıcıllıqlarının əlavə edilməsindən sonra birləşir. BMC Evol. Biol. 5, 36 (2005).

Ciccarelli, F.D. və b. Yüksək həll edilmiş həyat ağacının avtomatik yenidən qurulmasına doğru. Elm 311, 1283–1287 (2006).

Thiergart, T., Landan, G. & amp Martin, W.F. Birləşdirilmiş düzülmələr və yoxa çıxan ağacın vəziyyəti. BMC Evol. Biol. 14, 266 (2014).

Brown, C.T. və b. Domen Bakteriyalarının 15%-dən çoxunu təşkil edən qrup üzrə qeyri-adi biologiya. Təbiət 523, 208–211 (2015).

Anantharaman, K. et al. Minlərlə mikrob genomları sulu təbəqə sistemindəki bir-biri ilə əlaqəli biogeokimyəvi proseslərə işıq salır. Nat. Kommun. 7, 13219 (2016).

Parks, D.H. et al. 8000-ə yaxın metagenom yığılmış genomun bərpası həyat ağacını əhəmiyyətli dərəcədə genişləndirir. Nat. Mikrobiol. 2, 1533–1542 (2017).

Bapteste, E. et al. Ortoloji gen filogenləri həqiqətən ağac düşüncəsini dəstəkləyirmi? BMC Evol. Biol. 5, 33 (2005).

Tonini, J., Moore, A., Stern, D., Shcheglovitova, M. & Ortí, G. Konkatenasiya və növ ağacı üsulları bir sıra simulyasiya edilmiş şərtlər altında statistik cəhətdən fərqlənməyən dəqiqlik nümayiş etdirir. PLoS Curr. https://doi.org/10.1371/currents.tol.34260cc27551a527b124ec5f6334b6be (2015).

Hug, L.A. və başqaları. Həyat ağacının yeni görünüşü. Nat. Mikrobiol. 1, 16048 (2016).

Lang, J.M., Darling, A.E. & amp Eisen, J.A. Konservləşdirilmiş genlərdən istifadə edərək bakterial və arxeal genomların filogeniyası: superağaclar və supermatrislər. PLoS One 8, e62510 (2013).

Dupont, C.L. və b. Bol və becərilməmiş dəniz bakteriya nəsli olan SAR86-ya genomik anlayışlar. ISME J. 6, 1186–1199 (2012).

Wu, D., Jospin, G. & amp Eisen, J.A. Bakteriyaların və arxeyaların və onların əsas alt qruplarının filogenetik və filogeniyaya əsaslanan ekoloji tədqiqatları üçün “markerlər” kimi istifadə üçün gen ailələrinin sistematik identifikasiyası. PLoS One 8, e77033 (2013).

Giovannoni, S.J., Rappé, M.S., Vergin, K.L. və Adair, N.L. 16S rRNA genləri Yaşıl Qeyri Kükürd bakteriyaları ilə əlaqəli təbəqəli açıq okean bakterioplankton populyasiyalarını aşkar edir. Proc. Natl. akad. Sci. ABŞ 93, 7979–7984 (1996).

Dojka, M.A., Hugenholtz, P., Haack, S.K. & Pace, N.R. Daxili bioremediasiyaya məruz qalan karbohidrogen və xlorlu həlledici ilə çirklənmiş su qatında mikrob müxtəlifliyi. Tətbiq. Ətraf. Mikrobiol. 64, 3869–3877 (1998).

Zwart, G. et al. Ters xətt ləkə hibridizasiyasından istifadə etməklə şirin su bakteriya qruplarının sürətli skrininqi. Tətbiq. Ətraf. Mikrobiol. 69, 5875–5883 (2003).

Wolf, M., Müller, T., Dandekar, T. və Pollack, J.D. Filogeniya Firmicutes xüsusi istinadla Mikoplazma (Mollikutlar) fosfogliserat kinaz amin turşusu ardıcıllığı məlumatlarından əldə edildiyi kimi. Int. J. Sistem. Təkamül. Mikrobiol. 54, 871–875 (2004).

Lonerqan, D.J. və b. Dissimilyasiya edən Fe(III)-reduksiya edən bakteriyaların filogenetik analizi. J. Bakteriol. 178, 2402–2408 (1996).

Beiko, R.G. Bütün hekayəni 10.000 genom dünyasında izah etmək. Biol. Birbaşa 6, 34 (2011).

Zhang, Y. və Sievert, S.M. Pan-genom analizləri təkamül və uyğunlaşmanın nəsil və niş-xüsusi markerlərini müəyyən edir. Epsilonproteobakteriyalar. Ön. Mikrobiol. 5, 110 (2014).

Hugenholtz, P., Pitulle, C., Hershberger, K.L. & Pace, N.R. Yellowstone isti bulağında yeni bölünmə səviyyəli bakteriya müxtəlifliyi. J. Bakteriol. 180, 366–376 (1998).

Konstantinidis, K.T. & Tiedje, J.M. Prokaryotlar üçün genom əsaslı taksonomiyaya doğru. J. Bakteriol. 187, 6258–6264 (2005).

Wu, D., Doroud, L. & amp Eisen, J.A. TreeOTU: filogenetik ağaclara əsaslanan əməliyyat taksonomik vahid təsnifatı. Önçap https://arxiv.org/abs/1308.6333 (2013).

Maniloff, J. in Mikoplazmanın Molekulyar Biologiyası və Patogenliyi (red. Razin, S. & Herrmann, R.) 31-43 (Springer, New York, 2002).

Kumar, S., Stecher, G., Suleski, M. & Hedges, S.B. TimeTree: vaxt qrafikləri, vaxt ağacları və fərqlilik vaxtları üçün resurs. Mol. Biol. Təkamül. 34, 1812–1819 (2017).

Marin, J., Battistuzzi, F.U., Brown, A.C. & Hedges, S.B. Prokaryotların zaman ağacı: onların təkamülü və spesifikasiyası ilə bağlı yeni anlayışlar. Mol. Biol. Təkamül. 34, 437–446 (2017).

Qadaqkar, S.R., Rozenberq, M.S. & Kumar, S. Çoxlu genlərdən növlərin filogeniyalarını çıxarmaq: konsensus gen ağacına qarşı birləşdirilmiş ardıcıllıq ağacı. J. Exp. Zooloq. B Mol. Dev. Təkamül. 304, 64–74 (2005).

Balvočiūtė, M. & Huson, D.H. SILVA, RDP, Greengenes, NCBI və OTT: bu taksonomiyalar necə müqayisə olunur? BMC Genomics 18 (Əlavə 2), 114 (2017).

Whitman, W.B. Prokariotların adlandırılması üçün tipli materialın genişləndirilməsi üçün təvazökar təkliflər. Int. J. Sistem. Təkamül. Mikrobiol. 66, 2108–2112 (2016).

Konstantinidis, K.T., Rosselló-Móra, R. & Amann, R. Öz taksonomiyalarına ehtiyacı olan becərilməmiş mikroblar. ISME J. 11, 2399–2406 (2017).

Comas, I., Homolka, S., Niemann, S. & Gagneux, S. Genetik monomorf bakteriyaların genotiplənməsi: DNT ardıcıllığı Mycobacterium tuberculosis mövcud metodologiyaların məhdudiyyətlərini vurğulayır. PLoS One 4, e7815 (2009).

Martiny, J.B.H. və b. Mikrob biocoğrafiyası: mikroorqanizmlərin xəritədə yerləşdirilməsi. Nat. Rev. Mikrobiol. 4, 102–112 (2006).

Trost, B., Haakensen, M., Pittet, V., Ziola, B. & Kusalik, A. Təhlili və on altı yaxşı səciyyələndirilmiş bakteriya cinslərinin pan-genomik xüsusiyyətlərinin müqayisəsi. BMC Microbiol. 10, 258 (2010).

Beaz-Hidalgo, R., Hossain, M.J., Liles, M.R. & Figueras, M.J. Misal olaraq aşkar edilmiş yanlış taksonomik mənsubiyyətdən istifadə edərək səhv etiketlənmiş genomlardan qaçınmaq üçün strategiyalar aeromonalar GenBank verilənlər bazasında genomlar. PLoS One 10, e0115813 (2015).

Kook, J.K. və b. Genom əsaslı yenidən təsnifat Fusobacterium nucleatum növ səviyyəsində alt növlər. Curr. Mikrobiol. 74, 1137–1147 (2017).

Bobay, L.M. & Ochman, H. Bioloji növlər həyatın bütün sahələrində universaldır. Genom Biol. Təkamül. 9, 491–501 (2017).

Qalperin, M.Y., Brover, V., Tolstoy, I. & Yutin, N. Ailənin filogenomik təhlili. Peptostreptokoklar (Clostridium klaster XI) və yenidən təsnifləşdirmə təklifi Clostridium litorale (Fendrich və b. 1991) və Eubacterium acidaminophilum (Zindel və b. 1989) kimi Peptoclostridium litorale gen. noyabr daraq. noyabr və Peptoclostridium acidaminophilum daraq. noyabr Int. J. Sistem. Təkamül. Mikrobiol. 66, 5506–5513 (2016).

Yarza, P. et al. Bütün Növlər Yaşayan Ağac layihəsi: bütün ardıcıl tipli suşların 16S rRNA əsaslı filogenetik ağacı. Sistem. Tətbiq. Mikrobiol. 31, 241–250 (2008).

Sakamoto, M., İino, T. və Ohkuma, M. Faecalimonas umbilicata gen. noyabr, sp. nov., insan nəcisindən təcrid olunmuş və yenidən təsnifləşdirilmiş Eubacterium contortum, Eubacterium fissicatenaClostridium oroticum kimi Faecalicatena contor gen. noyabr, daraq. noyabr, Faecalicatena fissicatena daraq. noyabr və Faecalicatena orotica daraq. noyabr Int. J. Sistem. Təkamül. Mikrobiol. 67, 1219–1227 (2017).

Hahnke, R.L. və başqaları. Genom əsaslı taksonomik təsnifat Bakteroidlər. Ön. Mikrobiol. 7, 2003 (2016).

Garrity, G.M., Bell, J.A. & Lilburn, T. in Bergeyin Sistematik Bakteriologiya Təlimatı (red. Garrity, G. et al.) 575-922 (Springer, New York, 2005).

Rinke, C. et al. Mikrob qaranlıq maddənin filogeniyasına və kodlaşdırma potensialına dair fikirlər. Təbiət 499, 431–437 (2013).

Waite, D.W. və b. Sinfin müqayisəli genomik analizi Epsilonproteobakteriyalar və Epsilonbacteraeota (fil. nov.) üçün yenidən təsnifat təklif etdi. Ön. Mikrobiol. 8, 682 (2017).

Braun, D.R. in Bergeyin Sistematik Bakteriologiya Təlimatı (red. Krieg, N.R. et al.) 567-724 (Springer, New York, 2010).

Skennerton, C.T. və b. Filogenomik təhlili Namizəd 'İzimaplasma' növləri: a.-dan sərbəst yaşayan nümayəndələr Tenerikutlar metan sızmalarında tapılan təbəqə. ISME J. 10, 2679–2692 (2016).

Munoz, R., Rosselló-Móra, R. & Amann, R. Bakteroidlərin yenidən işlənmiş filogeniyası və on altı yeni taksanın və Rhodothermaeota phyl daxil olmaqla iki yeni birləşmənin təklifi. noyabr Sistem. Tətbiq. Mikrobiol. 39, 281–296 (2016).

Tanner, M.A., Everett, C.L., Coleman, W.J. & Yang, M.M. Dəniz sahillərindəki sulfidlə zəngin qara palçıqda yaşayan mürəkkəb mikrob icmaları. Biotexnol. Alia 8, 1–16 (2000).

Yamada, T. et al. KSB3 namizəd filumuna aid olan, metanogen dənəvər çamurlarda toplanması ilə əlaqəli olan filamentli bakteriyaların xarakteristikası. ISME J. 1, 246–255 (2007).

Sekiguchi, Y. et al. Tullantı sularının yığılmasından məsul olan namizəd bakteriya filumunun üzvlərinə dair ilk genomik anlayışlar. PeerJ 3, e740 (2015).

Chuvochina, M. et al. Sistem. Tətbiq. Mikrobiol. Mədəniyyətsiz taksonlar üçün növ materialın təyin edilməsinin əhəmiyyəti https://doi.org/10.1016/j.syapm.2018.07.003 (2018).

Haft, D.H. və başqaları. RefSeq: prokaryotik genomun annotasiyası və kurasiyası üzrə yeniləmə. Nuklein turşuları Res. 46, D851–D860 (2018).

Leinonen, R., Sugawara, H. & Shumway, M. Arxiv oxunan ardıcıllıq. Nuklein turşuları Res. 39, D19–D21 (2011).

Ondov, B.D. və b. Mash: MinHash istifadə edərək sürətli genom və metagenom məsafəsinin qiymətləndirilməsi. Genom Biol. 17, 132 (2016).

Parks, D.H., Imelfort, M., Skennerton, C.T., Hugenholtz, P. & amp Tyson, G.W. CheckM: izolatlardan, tək hüceyrələrdən və metagenomlardan əldə edilən mikrob genomlarının keyfiyyətinin qiymətləndirilməsi. Genom Res. 25, 1043–1055 (2015).

Eddi, S.R. Sürətlənmiş profil HMM axtarışları. PLoS Comput. Biol. 7, e1002195 (2011).

Camacho, C. et al. BLAST+: memarlıq və tətbiqlər. BMC Bioinformatika 10, 421 (2009).

Finn, R.D. və başqaları. Pfam: protein ailələri verilənlər bazası. Nuklein turşuları Res. 42, D222–D230 (2014).

Haft, D.H., Selengut, J.D. & amp White, O. Zülal ailələrinin TIGRFAMs verilənlər bazası. Nuklein turşuları Res. 31, 371–373 (2003).

Hyatt, D. et al. Prodigal: prokaryotik genin tanınması və tərcümənin başlama yerinin identifikasiyası. BMC Bioinformatika 11, 119 (2010).

Qiymət, M.N., Dehal, P.S. & Arkin, A.P. FastTree: məsafə matrisi əvəzinə profillərlə böyük minimum təkamül ağaclarının hesablanması. Mol. Biol. Təkamül. 26, 1641–1650 (2009).

Whelan, S. & amp Goldman, N. Maksimum ehtimal yanaşmasından istifadə edərək, çoxlu protein ailələrindən əldə edilən zülal təkamülünün ümumi empirik modeli. Mol. Biol. Təkamül. 18, 691–699 (2001).

Yang, Z. Saytlar üzərində dəyişən sürətlərlə DNT ardıcıllığından maksimum ehtimal filogenetik qiymətləndirilməsi: təxmini üsullar. J. Mol. Təkamül. 39, 306–314 (1994).

Williams, T.A. və b. Filogenetik ağacların köklənməsi üçün yeni əvəzetmə modelləri. Fil. Trans. R. Soc. London. B 370, 20140336 (2015).

Ludwig, W. et al. ARB: ardıcıllıq məlumatları üçün proqram mühiti. Nuklein turşuları Res. 32, 1363–1371 (2004).

Euzéby, J.P. Nomenklaturada duran bakteriya adlarının siyahısı: internetdə mövcud qovluq. Int. J. Sistem. Bakteriol. 47, 590–592 (1997).

Parker, C.T., Tindall, B.J. və Garrity, G.M. Prokaryotların Beynəlxalq Nomenklatura Məcəlləsi. Int. J. Sistem. Təkamül. Mikrobiol. https://doi.org/10.1099/ijsem.0.000778 (2015).

Oren, A. et al. Prokaryotların Beynəlxalq Nomenklatura Məcəlləsinə filum rütbəsinin daxil edilməsi təklifi. Int. J. Sistem. Təkamül. Mikrobiol. 65, 4284–4287 (2015).

Wheeler, T.J. in Bioinformatikada alqoritmlər üzrə 9-cu seminarın materialları (red. Salzberg, S.L. & Warnow, T.) 375–389 (Springer, Berlin, 2009).

Kozlov, A.M., Aberer, A.J. & Stamatakis, A. ExaML versiyası 3: superkompüterlərdə filogenomik analizlər üçün alət. Bioinformatika 31, 2577–2579 (2015).

Nguyen, L.T., Schmidt, H.A., von Haeseler, A. & Minh, B.Q. IQ-TREE: maksimum ehtimallı filogeniyaları qiymətləndirmək üçün sürətli və effektiv stoxastik alqoritm. Mol. Biol. Təkamül. 32, 268–274 (2015).

Stamatakis, A. RAxML versiyası 8: filogenetik analiz və böyük filogeniyaların sonrakı təhlili üçün bir vasitədir. Bioinformatika 30, 1312–1313 (2014).

Le, S.Q. & Gascuel, O. Təkmilləşdirilmiş ümumi amin turşusu dəyişdirmə matrisi. Mol. Biol. Təkamül. 25, 1307–1320 (2008).

Nawrocki, E.P. Struktur RNT Homologiyası Axtarış və Kovariasiya Modellərindən istifadə edərək Alignment Doktorluq dissertasiyası, Vaşinqton Universiteti. Sent-Luisdə, (2009).

Tavaré, S. DNT ardıcıllığının təhlilində bəzi ehtimal və statistik problemlər. Mühazirə. Riyaziyyat Həyat Elmi. 17, 57–86 (1986).

Kupczok, A., Schmidt, H.A. & von Haeseler, A. Üst-üstə düşən gen məlumat dəstlərini birləşdirən filogeniyanın yenidən qurulması üsullarının dəqiqliyi. Alqoritmlər Mol. Biol. 5, 37 (2010).


Təşəkkürlər

CAV-Cre-ni təqdim etdiyinə görə M. Chillon Rodrigues-ə (Universitat Autònoma de Barcelona), məlumatların təhlili ilə bağlı məsləhət üçün S. Mihalas, texniki yardım üçün H. Qu, M. Mills, H. Gill və K. Hadley, C. Ye və A. Kaykaş'a gələcək nəsil sıralamasında kömək üçün və Şöbə Müdirliyi In vivo Elmlər, xüsusilə R. Larsen, L. Pearson və J. Harrington siçan yetişdirilməsi üçün. Əlyazma ilə bağlı şərhlərinə görə J. Waters və E. Leynə təşəkkür edirik. Müəlliflər Allen İnstitutunun təsisçiləri Paul G. Allen və Cody Allen-ə baxışlarına, təşviqinə və dəstəyinə görə təşəkkür edirlər. Bu iş Allen Beyin Elmi İnstitutu tərəfindən maliyyələşdirilib və ABŞ Milli Səhiyyə İnstitutu tərəfindən H.Z.


Nəticələr

Girişlər

OPAL bir və ya bir neçə taksonomik profili giriş kimi qəbul edir və onları verilmiş taksonomik qızıl standart profilinə qarşı müxtəlif taksonomik dərəcələrdə müqayisə edir.

Həm proqnozlaşdırılan, həm də qızıl standart taksonomik profillər zaman seriyası, texniki və ya bioloji təkrarlar kimi çoxsaylı nümunələr üçün məlumatları ehtiva edə bilər. Qızıl standart taksonomik profil, məsələn, CAMISIM metagenom simulyatoru ilə yaradıla bilər [21, 22]. Taksonomik profillər ya Bioboxes profilləşdirmə formatında [15, 23] və ya BIOM formatında [16] ola bilər. Nümunələr OPAL GitHub repozitoriyasında verilmişdir [24].

Metriklər və müşayiət olunan vizuallaşdırmalar

OPAL qızıl standart taksonomik profillə müqayisə edərək verilmiş verilənlər toplusunun bir və ya bir neçə taksonomik profili üçün [13] sahəsində geniş istifadə olunan müvafiq ölçülər sırasını hesablayır. Aşağıda biz bütün ölçülərin formal təriflərini və onların bioloji mənasının izahını veririk.

İlkin hazırlıqlar

üçün r, xüsusi taksonomik dərəcə (və ya sadəcə olaraq dərəcə), icazə verin xr rütbədə həqiqi bakteriya nisbi bolluğu olsun r qızıl standartı ilə verilir. Yəni, xr rütbədə bütün taksonlar tərəfindən indeksləşdirilmiş vektordur r, giriş (xr)i taksonun nisbi bolluğudur i rütbədə nümunə götürülmüş mikrob icmasında r. (x_ ilə)^<*>) , biz dərəcədə proqnozlaşdırılan bakteriya nisbi bolluğunun vektorunu işarə edirik r. Müvafiq olaraq, (sol (x_)^<*>sağ)_) taksonun proqnozlaşdırılan nisbi bolluğudur i rütbədə r.

Defolt olaraq, OPAL bütün (proqnozlaşdırılan) bolluqları hesablama metriklərindən əvvəl normallaşdırır ki, bütün bolluqların cəmi hər dərəcədə 1-ə bərabər olsun, yəni (sum _) (x_)_ = 1) və (sum _ sol (x_^<*>sağ)_ = 1) . Bu, məsələn, nümunənin yalnız 50%-i üçün daha az proqnoz verən proqram təminatının profilləşdirilməsinə qarşı hər hansı qərəzdən qaçmaq üçündür.

Taksonların mövcudluğunun və ya yoxluğunun qiymətləndirilməsi

Taksonomik proqnozların təmizliyi və tamlığı profilin keyfiyyətini qiymətləndirmək üçün ümumi ölçülərdir [25]. Onlar profilçinin nümunə götürülmüş mikrob icmasında taksonların varlığını və yoxluğunu onların nisbi bolluğunun nə qədər yaxşı nəticələndiyini nəzərə almadan necə düzgün müəyyən etdiyini qiymətləndirirlər. Bu, məsələn, klinik diaqnostikada fövqəladə vəziyyətdə, xəstə materialından götürülmüş metagenomik nümunədə patogen axtararkən müvafiq ola bilər. Bu tədbirləri müəyyən etmək üçün vektorun dəstəyinə icazə verin xr olmaq

Yəni, supp(xr) rütbə üzrə taksonların indekslərinin məcmusudur r nümunədə mövcuddur. Analoji olaraq, (suppsol (x_)^<*> ight)) rütbə üzrə taksonların indekslərinin məcmusudur r nümunədə olacağı proqnozlaşdırılır. Hər dərəcə üçün r, biz əsl müsbətləri müəyyən edirik TPr, yanlış pozitivlər FPr, və yalan neqativlər FNr, müvafiq olaraq, kimi

harada supp(xr) c və (suppsol (x_)^ <*>sağ)^) müvafiq dəstək vektorlarının tamamlayıcısıdır və beləliklə, dərəcədəki taksonların indekslərini verir. r yoxdur və ya nümunədə olmadığı kimi proqnozlaşdırılır. Konkret olaraq, TPrFPr müvafiq olaraq nümunədə mövcud olan düzgün və yanlış proqnozlaşdırılan taksonların sayıdır və FNr nümunədə olmadığı üçün səhv proqnozlaşdırılan taksonların sayıdır.

The saflıq səhr rütbədə r, həmçinin dəqiqlik və ya spesifiklik kimi tanınır, nümunədə mövcud olduğu kimi düzgün proqnozlaşdırılan taksonların və həmin dərəcədəki bütün proqnozlaşdırılan taksonların nisbətidir. Hər dərəcə üçün r, təmizlik kimi hesablanır

The tamlıq sr rütbədə r, həmçinin geri çağırma və ya həssaslıq kimi tanınır, indiki kimi düzgün proqnozlaşdırılan taksonlarla həmin dərəcədə nümunədə mövcud olan bütün taksonların nisbətidir. Hər taksonomik dərəcə üçün r, tamlıq kimi hesablanır

Təmizlik və tamlıq 0 (ən pis) ilə 1 (ən yaxşı) arasında dəyişir.

Biz onların harmonik ortasını hesablayaraq, təmizliyi və tamlığı vahid metrikada birləşdiririk. F1 hesabı. Hər dərəcə üçün müəyyən edilir r kimi

F1 balı 0-dan 1-ə qədər dəyişir, əgər metriklərdən ən azı birinin təmizliyi və ya tamlığı aşağı dəyərə malikdirsə, 0-a yaxındır, həm təmizlik, həm də tamlıq yüksəkdirsə, 1-ə yaxındır.

The Jaccard indeksi J iki populyasiya və ya nümunə üçün ümumi olan orqanizmlərin faizini təyin etmək üçün ümumi metrikdir. Biz onu hər bir rütbə üzrə həqiqi və proqnozlaşdırılan taksonlar çoxluğu arasında oxşarlığın göstəricisi kimi, bu dəstlərin kəsişməsindəki taksonların sayının onların birliyindəki taksonların sayına nisbətini hesablayaraq müəyyən edirik. Formal olaraq, hər bir dərəcə üçün hesablanır

Jaccard indeksi 0-dan (tam fərqlilik) 1-ə (tam üst-üstə düşür) qədər dəyişir.

Bolluq təxminləri

Profilin keyfiyyətinin qiymətləndirilməsi üçün ölçülərin növbəti kateqoriyası yalnız taksonların nümunədə mövcud və ya olmamasının proqnozlaşdırıldığını nəzərə almır, həm də onların bolluğunu nəzərə alır.

L1 norması dərəcə üzrə nümunədə taksonların nisbi bolluğunun yenidən qurulmasının düzgünlüyünü ölçür. r. L1 norması tərəfindən verilir

The L1 norması beləliklə, dərəcə üzrə taksonların həqiqi və proqnozlaşdırılan bolluqları arasında ümumi xətanı verir r. 0-dan 2-yə qədər dəyişir, burada 0 nümunədəki orqanizmlərin nisbi bolluğunun mükəmməl şəkildə yenidən qurulmasını, 2 isə nisbi bolluğun tamamilə səhv yenidən qurulmasını göstərir.

Başqa bir metrik, the Bray-Curtis məsafəsi dr, L1 normasından takson bolluqlarının mütləq qoşa fərqlərinin cəmini verilmiş dərəcə üzrə bütün bolluqların cəminə bölmək yolu ilə alınır. Bu, Bray-Curtis məsafəsini 0 və 1 arasında məhdudlaşdırır. Hər dərəcə üçün r, kimi müəyyən edilmişdir

The çəkili UniFrac məsafəsi həqiqi və proqnozlaşdırılan bolluqlar arasındakı oxşarlığı ölçən mikrob icmalarının taksonomik oxşarlığının ağaca əsaslanan ölçüsüdür [17]. [17]-də olduğu kimi filogenetik ağac əvəzinə, biz səkkiz əsas dərəcə ilə məhdudlaşdırılmış qovşaqları olan taksonomik ağacdan istifadə edirik və həqiqi və proqnozlaşdırılan bolluqları müvafiq qovşaqlarda saxlayırıq. Xülasə, UniFrac məsafəsi həqiqi nisbi bolluqlarla üst-üstə düşməsinə səbəb olmaq üçün köçürülməli (taksonomik ağacın kənarları boyunca, burada bütün budaq uzunluqları 1-ə təyin edilmiş) proqnozlaşdırılan bolluğun ümumi miqdarıdır. Biz UniFrac məsafəsinin EMDUnifrac tətbiqindən istifadə edirik [26-28]. Aşağı UniFrac məsafəsi onu göstərir ki, taksonomik profilləşdirmə alqoritmi taksonomik olaraq nümunənin faktiki profilinə bənzər bir proqnoz verir. Çəkili UniFrac məsafəsi istifadə olunan taksonomik ağacın hündürlüyünün 0 və iki qatı arasında dəyişir. Ağacın hər bir səviyyəsi super krallıq, filum, sinif, nizam, ailə, cins, növ və ştamlardan birini təmsil etdiyinə görə, maksimum çəkili UniFrac məsafəsi 16-dır.

The çəkisiz UniFrac məsafəsi ölçülmüş UniFrac məsafəsinə bənzəyir, lakin onu saxlamaq əvəzinə nisbi bolluq müvafiq qovşaqlar üçün, əgər profil həmin qovşaqda sıfırdan fərqli nisbi bolluğu göstərirsə, qovşaqda 1, əks halda isə 0 qoyulur. Deməli, onu (taksonomik oxşarlıq baxımından) profilçinin nümunədə taksonların olub-olmamasını nə dərəcədə düzgün müəyyən etməsinin ölçüsü hesab etmək olar. Maksimum çəkilməmiş UniFrac məsafəsi bərabərdir

harada R bütün taksonomik dərəcələrin məcmusudur.

Alfa müxtəliflik ölçüləri

Yuxarıdakı göstəricilərdən fərqli olaraq, alfa müxtəliflik göstəriciləri, məsələn, qızıl standart profili ilə müqayisə edilmədən hər bir dərəcə üzrə (proqnozlaşdırılan) bolluğun vahid profilindən hesablanır. Alfa müxtəliflik ölçüləri profildə mövcud olan taksonların müxtəlifliyini (və ya zənginliyini) və paylanmasını ümumiləşdirir [29] və digər istifadələr arasında bəzi ekoloji parametrlər [30-33] nəticəsində icma strukturunda qlobal dəyişiklikləri müşahidə etmək üçün adətən istifadə olunur.

Ən sadə alfa müxtəlifliyi metrikası müəyyən bir mühitdə mövcud olan taksonların sayıdır. Biz bunu hər bir rütbədə ayrı-ayrılıqda müəyyən bir profilçi üçün ölçürük, əsas qızıl standartla müqayisə etməyə imkan veririk. Verilmiş profil üçün xr (və ya (x_^<*>) ) ) dərəcə üzrə taksonların sayını göstəririk r kimi Sr=|supp(xr)|.

Nisbi takson bolluğunu da nəzərə alaraq müxtəliflik ölçüsü kimi biz birləşdiririk Sr və bütün bolluqlar (xr)i (və ya ((x_^<*>)_) ) istifadə edərək Şennon müxtəliflik indeksi Hr [34]. Hər dərəcə üçün r, kimi hesablanır

Hr 0 ilə ln arasında dəyişirSr), burada ln(Sr) bütün taksonların bərabər şəkildə təmsil olunduğu maksimum mümkün müxtəlifliyi təmsil edir. Qeyd edək ki, Şennon müxtəliflik indeksi ənənəvi olaraq bütün taksonların nümunədə təmsil olunduğunu fərz edir. Bununla belə, bəzi profilçilər bütün taksonlar üçün bolluğu proqnozlaşdıra bilmədiklərinə görə, biz bu cür taksonlara məhəl qoymuruq (burada (left (x^<*>_)sağ)_=0) və ya (xr)i=0).

ikən Hr müxtəlifliyi və bərabərliyi hesab edir, the Shannon ədalətlilik indeksi Er bərabərlik ölçüsüdür. Bölməklə əldə edilən Şennon müxtəliflik indeksinin normallaşdırılmış formasıdır Hr maksimum dəyəri ilə ln(Sr), yəni,

Beləliklə, Er tam bərabərliyi göstərən 1 ilə 0-dan 1-ə qədər dəyişir.

Beta müxtəliflik göstəriciləri

Alfa müxtəlifliyindən fərqli olaraq, beta müxtəliflik ölçüləri bir cüt profil arasında taksonların paylanması oxşarlığının göstəricisini verir [29]. Beta müxtəlifliyi kiçikdirsə, yalnız profillər arasındakı müxtəliflik deyil, həm də aktualdır paylanması profillər arasında nisbi bolluq oxşardır. Hər bir profilçi üçün beta müxtəliflik proqnozlarının oxşarlığını qızıl standartla müqayisə etmək üçün biz aşağıdakı məlumatları səpələnmə qrafikində göstəririk. Hər bir nöqtə ilə bir cüt giriş nümunəsinə uyğundur x-Nümunələr cütü üzrə taksonomik profilçilərin proqnozları arasında Bray-Kurtis məsafəsi olan koordinat. The y-koordinat nümunə cütlüyünə uyğun qızıl standartları arasındakı Bray-Kurtis məsafəsidir. Bu səpələnmə xətti xəttə nə qədər yaxındır y=x, daha yaxından taksonomik profilləşdirici qızıl standartına bənzər takson bölgüsü ilə nəticələnir. Bu süjetlər hər taksonomik dərəcədə göstərilir.

Reytinqlər

Qlobal nisbi performans hissini göstərmək üçün biz həmçinin profilçiləri hər bir nümunə, taksonomik dərəcə və metrik üzrə nisbi performansına görə sıralayırıq. Xüsusilə, hər bir profilçiyə taksonomik dərəcə və nümunə daxilində hər bir metrik üçün performansına görə xal verilir. Ən yaxşı performans göstərən profilçi 0, ikinci ən yaxşı, 1 və s. alır. Sonra bu xallar taksonomik dərəcələr və nümunələr üzərində əlavə olunur ki, hər bir profilçi üçün hər bir metrik üçün vahid xal hasil edilir. Həmçinin, hər bir profilçinin ümumi balı onun metrik üzrə bütün xallarını cəmləməklə hesablanır. Nəticə ballar HTML səhifəsinin interaktiv cədvəlində hər profilçi üçün sətir, hər metrik üçün sütun və ümumi ballar üçün əlavə sütunla göstərilir. Sütunlar istifadəçi tərəfindən çeşidlənə bilər və buna görə də bütün ölçülər üzrə və ya xüsusi bir üçün profilçilərin sıralamasını verir. İsteğe bağlı olaraq, hər bir profilçinin ümumi balı, hər bir metrik üzrə xalını ölçülmüş şəkildə yekunlaşdırmaqla hesablana bilər, yəni istifadəçi ehtiyaclarına ən çox uyğun gələn metriklərin birləşməsindən asılı olaraq, HTML səhifəsində interaktiv olaraq fərdi çəki seçə bilər. Hər bir metrikanın standart çəkisi 1-dir və 0,1 addımlarla 0 ilə 10 arasında dəyişə bilər. Məsələn, istifadəçi yüksək dəqiqlikli və proqnozlaşdırılan taksonların dəqiq nisbi bolluğunu yenidən quran profilçilərlə maraqlanırsa, onlar UniFrac xətası və tamlığı (məsələn, hər bir çəki 1). The resulting rankings are dynamically updated in real time and graphically presented to the user.

Output and visualizations

OPAL outputs the assessment of the predictions of multiple profilers in several formats: flat files, tables (per profiling program, taxonomic rank, and in tidy format [35]), plots, and in an interactive HTML visualization. An example page is available at [36]. The visualizations created include:

Absolute performance plots: To visually compare the relative performance of multiple profilers, spider plots (also known as radar plots) of completeness and purity are created, with the spokes labeled with the corresponding profiler name. At least three profilers are required for these plots. The completeness and purity metrics are shown as colored lines connecting the spokes, with the scale on the spokes indicating the value of the error metric. One such spider plot is created at each taxonomic rank to give an indication of performance versus rank. For examples, see Fig. 2b and Additional file 1: Figure S5b, d.

Relative performance plots: Similarly, spider plots are created for the completeness, purity, false positives, weighted UniFrac, and L1 norm for three or more profilers. Since the values of these metrics have very different scales, they are each normalized by the maximum value attained by any input profiler. Hence, these plots indicate the relative performance of each profiler with respect to the different metrics. For example, one profiler having the largest value of the purity metric would indicate that, among the compared profilers, it is the most precise (without indicating what the exact value of the purity metric is). These plots are also shown at each taxonomic rank. For examples, see Fig. 2a and Additional file 1: Figure S5a, c.

Shannon equitability: The Shannon equitability index is plotted against taxonomic ranks for each input profile along with the gold standard. This results in a visual indication of how closely a taxonomic profile reflects the actual alpha diversity of the gold standard. For examples, see Fig. 3a and Additional file 1: Figure S12.

Bray-Curtis distances: For each profiler, a scatter plot of Bray-Curtis distances is created to compare the similarity of beta diversity of the profiler predictions versus the gold standard. For details, see the section above on beta diversity metrics. Examples are given in Fig. 3b–h and Additional file 1: Figure S13.

Ranking: In a bar chart shown on the created HTML page, each bar corresponds to the sum of scores obtained by a profiler as a result of its ranking for the metrics completeness, purity, L1 norm, and weighted UniFrac over all major taxonomic ranks. The bar chart is dynamically updated in real time according to the weight assigned to each metric by the user. For details of the computation of the scores, see the above section on rankings. Examples of such bar charts are given in Additional file 1: Figure S11 and on the example HTML page at [36].

Taxa proportions: For each taxonomic rank, a stacked bar chart shows the taxa proportions in each sample of the gold standard, with each bar corresponding to a sample and each color to a taxon. This gives a visual indication of the taxa abundances and variations among the samples. On the HTML page, the user may opt to see a legend of the colors and corresponding taxa. The legend is only optionally displayed since the number of taxa can vary between a few superkingdoms to hundreds or thousands of species or strains, and these cannot all be reasonably displayed on a single image. Examples are given in Additional file 1: Figures S1, S2, and S3.

Rarefaction and accumulation curves: A plot simultaneously shows rarefaction and accumulation curves for all the major taxonomic ranks. To ease the visualization at different ranks, another plot shows the curves in logarithmic scale with base 10. For examples, see Additional file 1: Figure S4.

Comparison of taxonomic profilers: an application example

To demonstrate an application, we evaluated taxonomic profilers on three datasets. First, we evaluated taxonomic profiling submissions to the first CAMI challenge [13] on the dataset with the highest microbial complexity in the challenge. We will call this dataset CAMI I HC for short. This is a simulated time series benchmark dataset with five samples, each with size 15 Gbp, and a total of 596 genomes. It includes bacteria, archaea, and high-copy circular elements (plasmids and viruses) with substantial real and simulated strain-level diversity. We reproduce and extend the results for this dataset from [13] with alpha and beta diversity metrics implemented in OPAL and measure the run time and memory usage of profiling methods.

The second dataset that we evaluated taxonomic profilers on were the short-read data of a new practice dataset of the second CAMI challenge (CAMI II MG, for short). This consists of 64 samples with a total size of 320 Gbp and was simulated from taxonomic profiles for microbial communities from the guts of different mice [21]. This resulted in the inclusion of 791 genomes as meta-community members from public databases. The samples in both CAMI I HC and CAMI II MG are paired-end 150-bp Illumina reads and are available at [37, 38].

Lastly, to demonstrate the application of OPAL on a real (not simulated) dataset, we also benchmarked profilers on the Human Microbiome Project Mock Community dataset [39] (HMP MC, for short), namely on the staggered sample available from NCBI SRA (accession SRR172903). It comprises 7.9 million 75-bp reads, with organismal abundances available in [40].

To visualize the taxonomic composition and properties of these datasets, we produced plots of the taxa proportions at all major taxonomic ranks for all samples with OPAL (Additional file 1: Figures S1, S2, and S3 for CAMI I HC, CAMI II MG, and HMP MC, respectively) and calculated rarefaction curves (Additional file 1: Figure S4). All plots and assessments were computed with OPAL version 1.0.0 [41].

The assessed profilers were CommonKmers (corresponding to MetaPalette 1.0.0) [2, 42], CAMIARKQuikr 1.0.0 [43], abbreviated Quikr (a combination of Quikr [8], ARK [9], and SEK [10]), TIPP 2.0.0 [12], Metaphlan 2.2.0 [5], MetaPhyler 1.25 [6], mOTU 1.1 [7], and FOCUS 0.31 adapted for CAMI [4]. To facilitate the reproduction of the assessments, we ran the profilers as Bioboxes docker containers. The corresponding docker images are available on Docker Hub, and their names and the preconfigured parameters used by the profilers are provided in Additional file 1: Table S1. Instructions for reproducing the results are provided in Additional file 2 and in the OPAL GitHub repository [24]. The reference databases used by each profiler precede the release of the genomes used for generating the first CAMI challenge datasets. Thus, the metagenomic information of the CAMI I HC dataset was completely new for these profilers and at different taxonomic distances to available reference genomes, differently from the metagenome data of the CAMI II MG practice dataset. The Bioboxes were run on a computer with an Intel Xeon E5-4650 v4 CPU (virtualized to 16 CPU cores, 1 thread per core) and 512 GB of main memory. Metaphlan was the fastest method on CAMI II MG with a run time of 12.5 h, whereas on CAMI I HC, Metaphlan and Quikr were the fastest methods, requiring roughly the same execution time of 2.12 h (Fig. 1 and Additional file 1: Table S2). On HMP MC, FOCUS was the fastest method, requiring 0.07 h. mOTU was the most memory efficient method on all three datasets (1.19 GB of maximum main memory usage on CAMI I HC and CAMI II MG, and 1.01 GB on HMP MC), closely followed by Metaphlan (1.44, 1.66, and 1.41 GB maximum main memory usage on CAMI I HC, CAMI II MG, and HMP MC, respectively).

Computing efficiency. Run time in hours and maximum main memory usage in gigabytes required by the profilers to process the CAMI I high complexity (a), the CAMI II mouse gut (b), and the HMP Mock Community (c) datasets

On the CAMI I HC data, Quikr, TIPP, and MetaPhyler, in this order, achieved the overall highest completeness (Additional file 1: Figures S5a, b, e and S6-S8a-g). However, these profilers obtained the lowest purity. In this metric, CommonKmers and Metaphlan performed best. In terms of the F1 score, computed from completeness and purity, Metaphlan was the best method. This indicates that Metaphlan performed particularly well in determining the presence or absence of taxa. However, it could not accurately predict their relative abundances, as indicated by the high L1 norm error. In this metric, MetaPhyler did well, followed by FOCUS and CommonKmers.

When ranking methods over all taxonomic ranks using completeness, purity, L1 norm, and weighted UniFrac with equal weights (Additional file 1: Figures S5e and S11a), TIPP performed best with total score 184. TIPP ranked second for completeness and weighted UniFrac (scores 31 and 5, respectively), third for L1 norm (score 52), and only for purity it did not do so well and was ranked fifth (score 96). When considering the performance of the profilers at different taxonomic ranks, we found that most profilers performed well until the family level. For example, TIPP and MetaPhyler achieved a 0.92 completeness at the family level, but this decreased to 0.43 at the genus level. Similarly, the purity of CommonKmers decreased from 0.96 at the family level to 0.77 and 0.08 at the genus and species levels, respectively.

In terms of alpha diversity, no profiler estimated taxon counts well. Most programs overestimated the diversity at all taxonomic ranks. Quikr, FOCUS, and CommonKmers predicted taxon abundances that better reflect the Shannon equitability of the gold standard (Additional file 1: Figure S12a, b). However, Quikr, mOTU, and TIPP made no predictions at the strain level. The predicted abundance distributions of CommonKmers and mOTU across all samples at the species level best reflect the gold standard, as visualized with the scatter plots of Bray-Curtis distances (Additional file 1: Figure S13). Taken together, the OPAL results fully reproduce the results from [13], where performance was summarized in three categories of profilers: profilers that correctly predicted relative abundances, profilers with high purity, and those with high completeness. OPAL extends the overall performance view by providing analysis of computing efficiency and microbial diversity predictors.

On the CAMI II MG data, Metaphlan obtained the overall best ranking over all taxonomic ranks, using the equally weighted metrics completeness, purity, L1 norm, and weighted UniFrac (Fig. 2d and Additional file 1: Figure S11b). MetaPhyler achieved the highest completeness at most taxonomic ranks, followed by TIPP and Metaphlan (Additional file 1: Figures S6-S8h-n), whereas CommonKmers achieved the highest completeness at the species level (Fig. 2c). Metaphlan was not only among the profilers with the highest completeness, but it also maintained a high purity throughout all taxonomic ranks, with only a small decrease from genus (0.94) to species (0.89). This can be explained by a high coverage of CAMI II MG by the reference genomes used by Metaphlan. It also contrasts with the results in [13], showing that a profiler can be precise while achieving a relative high completeness, but with this being very dependent on the input data. Metaphlan also predicted taxon distributions across the samples well. MetaPhyler and TIPP could not identify well differences in taxa abundances for the samples and tended to predict similar abundances, which is reflected in many points in the plots being above the line x=y (Fig. 3b–h).

Assessment results on the CAMI II mouse gut dataset. a Relative performance plots with results for the metrics: weighted UniFrac, L1 norm, completeness, purity, and number of false positives at different taxonomic ranks. The values of the metrics in these plots are normalized by the maximum value attained by any profiler at a certain rank. b Absolute performance plots with results for the metrics completeness and recall, ranging between 0 and 1. c Results at the species level for all computed metrics, as output by OPAL in the produced HTML page. The values are averaged over the results for all 64 samples of the dataset, with the standard error being shown in parentheses. The colors indicate the quality of the prediction by a profiler with respect to a metric, from best (dark blue) to worst (dark red). d Rankings of the profilers according to their performance and scores for different metrics computed over all samples and taxonomic ranks

Examples of alpha and beta diversity plots from the results on the CAMI II mouse gut dataset. a Shannon equitability at different taxonomic ranks as a measure of alpha diversity. The closer the Shannon equitability of the predicted profile by a method to the gold standard, the better it reflects the actual alpha diversity in the gold standard in terms of evenness of the taxa abundances. bh Scatter plots of Bray-Curtis distances visualizing beta diversity at the species level. For each profiling method and plot, a point corresponds to the Bray-Curtis distance between the abundance predictions for a pair of input samples by the method (x-axis) and the Bray-Curtis distance computed for the gold standard for the same pair of samples (y-axis). The closer a point is to the line x=y, the more similar the predicted taxa distributions are to the gold standard

In terms of alpha diversity, Metaphlan, CommonKmers, and mOTU predicted taxon counts similar to the gold standard for most taxonomic ranks, whereas the other profilers mostly overestimated the counts. On the other hand, TIPP, MetaPhyler, and mOTU predicted taxon abundances that more closely reflect their evenness, i.e., Shannon equitability, in the gold standard (Fig. 3a and Additional file 1: Figure S12c, d). As on the CAMI I HC data, Quikr, mOTU, and TIPP made no strain-level predictions on this dataset.

On the HMP MC dataset, the profilers ranked similarly as on CAMI II MG dataset for the sum of scores of completeness, purity, L1 norm, and weighted UniFrac (Additional file 1: Figures S5f and S11c). Metaphlan and MetaPhyler, in this order, again performed best. They were followed by mOTU and CommonKmers (on CAMI II MG, CommonKmers and mOTU) and Quikr and FOCUS (on CAMI II MG, FOCUS and Quikr). Metaphlan ranked best for all these metrics except for completeness, being outperformed by MetaPhyler. At the species level, MetaPhyler and mOTU identified the highest number of true positives, with 21 and 18 out of 22, respectively (Additional file 1: Figure S10g). They also achieved the highest completeness of 95% and 81%, respectively. However, MetaPhyler reported 144 false positives, the highest number after Quikr, with 618, and achieved a relatively low purity. We did not assess TIPP, because it could not make predictions. We believe that blastn, which TIPP uses in its pipeline with default parameters, was not able to score part of the reads, consequently stopping the pipeline.

In terms of alpha diversity, Metaphlan’s (MetaPhyler’s) predicted taxon abundances were among the ones that best (worst) reflected the Shannon equitability of the gold standard throughout the rankings (Additional file 1: Figure S12e, f). At the strain level, CommonKmers performed best with this metric.


1.7: Assignment- Visualizing Taxonomy - Biology

TaxADivA - TAXonomy Assignment and DIVersity Assessment

TaxADivA is a wrapper script written in Perl to facilitate the analysis of nifH amplicon sequences.

The script uses threading to parallelize the processing of sequences and thereby reduce run time. This wrapper pipeline performs the following steps in order (including the optional steps):

  1. Sequences are merged with PEAR (Zhang J et al 2014. Bioinformatics 30:614–620)
  2. Primers are trimmed using PrinSeq
  3. Chimeras are removed and sequences clustered with VSEARCH (Rognes T et al. 2016. PeerJ. 4:e2584)
  4. Taxonomy is assigned with BLAST (Altschul SF. 1990. J Mol Biol. 215:403–410.) by reference to a nifH taxonomy database, cluster IV/V sequences are removed,
  5. Numerous outputs for taxonomy exploration are produced including a BIOM text table (for QIIME Caporaso JG et al. 2010. Nat Methods 7:335–336), Krona (Ondov BD et al. 2011. BMC Bioinformatics. 12:385.), STAMP (Parks DH et al. 2014. Bioinformatics. 30:3123-4.) and
  6. An optional oligotyping analysis by Minimum Entropy Decomposition (Eren M et al. 2014. ISME J 9:968–979.) which produces taxonomically-labeled oligotype networks explorable with the network visualization tool Gephi (Bastian M et al. 2009. International AAAI Conference on Weblogs and Social Media.).

The taxonomy assignment step relies on similarity between the input clustered reads to the reference database. Taxonomy of the reference database is transferred over to the clustered read based on a set of decision rules as shown in the figure below:

The percent identity parameters described in the chart above are derived by emperically comparing all the sequences in the database and estimating the cutoffs that maximizes the number of correctly placed sequence within the same species, genus and family. These parameters can be changed from inside the script. These are declared as follows:

The code has been lightly commented and going forward, if time permits, I will add more comments to help anyone read, modify or update the script. This README will be continuously updated, as required, going forward.

Citations: Gaby, J.C., Rishishwar, L., Valderrama-Aguirre, L., Green, S.J., Valderrama-Aguirre, A., Jordan, I.K., Kostka , J.E., 2017. Diazotroph community characterization via a high-throughput nifH amplicon sequencing and analysis pipeline. Applied and Environmental Microbiology. 84: e01512-17.

The script is written specifically for Linux operating system and has been tested on Ubuntu 14.04 and RedHat systems. Certain components of the script may throw error on other *nix systems. The script utilizes basic Linux commands and thus may work on Cygwin but not on MS-DOS. All the required dependencies will hopefully not require further dependency installation and may simply require placement of respective binaries in a folder in the $PATH variable in the best case scenario.

  • Perl (comes installed with Linux)
  • nifH sequence database (Comes with the script, files: fDb.fasta and fTax.db.tsv source: http://www.css.cornell.edu/faculty/buckley/nifh.htm Gaby JC, Buckley DH. 2013. A comprehensive aligned nifH gene database: a multipurpose tool for studies of nitrogen-fixing bacteria. Verilənlər bazası. doi: 10.1093/database/bau001)
  • PRINSEQ: http://prinseq.sourceforge.net/
    • Installation of the script simply requires placing the Perl script in a folder that is in the $PATH. See below.
    • Please note that the PEAR binaries may be on the bottom-right of the page! Download the binaries, extract them and place them in a folder that is in the $PATH variable. See below.
    • The binary can then be placed in a folder that is in the $PATH variable.
    • Binaries for the relevant system can directly be obtained and placed in a folder that is in the $PATH variable. See below.
    • Download the archive, unzip it and place them in a folder that is in the $PATH variable. See below.

    For users not familiar with the $PATH variable, please follow the following steps to create your own bin directory and add it to your $PATH variable:

    This will create a bin directory in your home folder (

    ) and add this folder to your PATH variable. All the local installations can be placed inside this folder.

    Download the dependency, install them and place it in a folder that is in your PATH. The script can then be run simply as ./taxadiva.pl

    In case of an issue with installation, please contact Lava [email protected]

    The argument and the type of argument expected are defined in the help below.

    Example usage: taxadiva.pl -d fDb.fasta -t fTax.db.tsv -j 18 -s list.txt -o output1 -m "-v 50 -m 450 -n 350 -p 1.0 -j 4"

    The script can work on a single set of files (using the -1 and -2 option) or a set of files provided as a list as shown below:

    The columns needs to be nişanı separated.

    The script takes advantage of the embarrasingly parallel nature of the problem. Basic parallelization is performed in the script using Perl threads (and threading whenever available inside dependencies).

    By default, the script assumes that it can run 10 threads which may not be possible on many systems. This can be changed using the -j command or from the beginning of the script where the variable is defined my $threads = 10 (in case the user want to permanently change the default for their machine).

    1. One of the BLAST version changes from -max_hsps to -max_hsps_per_subject. This will throw an error if there is a version conflict. Lava is looking into this.

    Software that can be used for downstream analysis

    • STAMP: Parks DH, Tyson GW, Hugenholtz P, Beiko RG. 2014. STAMP: statistical analysis of taxonomic and functional profiles. Bioinformatika. 30(21):3123-4.
    • MED: Eren a M, Morrison HG, Lescault PJ, Reveillaud J, Vineis JH, Sogin ML. 2014. Minimum entropy decomposition: Unsupervised oligotyping for sensitive partitioning of high-throughput marker gene sequences. ISME J 9:968–979.
    • QIIME: Caporaso JG, Kuczynski J, Stombaugh J, Bittinger K, Bushman FD, Costello EK, Fierer N, Peña AG, Goodrich JK, Gordon JI, Huttley GA, Kelley ST, Knights D, Koening JE, Ley RE, Lozupone CA, McDonald D, Muegge BD, Pirrung M, Reeder J, Sevinsky JR, Turnbaugh PJ, Walters WA, Widmann J, Yatsunenko T, Zaneveld J, Kinght R. 2010. QIIME allows analysis of high-throughput community sequencing data. Nat Methods 7:335–336
    • Gephi: Bastian M, Heymann S, Jacomy M. 2009. Gephi: an open source software for exploring and manipulating networks. International AAAI Conference on Weblogs and Social Media.
    • EMPeror: Vázquez-Baeza Y, Pirrung M, Gonzalez A, Knight R. 2013. EMPeror: a tool for visualizing high-throughput microbial community data. Gigascience. 2(1):16. doi: 10.1186/2047-217X-2-16.
    • 0.11 - Stable version. Alpha tested with following procedure: sequence quality control (prinseq), read merging (PEAR), read clustering (VSEARCH), taxonomy assignment (BLAST + processing), KRONA plot generation, oligotyping (MED optional). MED is fully functional. Cluster IV filtering is now optional. Instead of creating multiple output files, creates an output directory and places all the output files in it.
    • 0.10 - Stable version. Alpha tested with following procedure: sequence quality control (prinseq), read merging (PEAR), read clustering (USEARCH), taxonomy assignment (BLAST + processing), KRONA plot generation, oligotyping (MED optional). MED is fully functional. Instead of creating multiple output files, creates an output directory and places all the output files in it.
    • 0.9 - Last stable version. Alpha tested the following procedure: sequence quality control (prinseq), read merging (PEAR), read clustering (USEARCH), taxonomy assignment (BLAST + processing), KRONA plot generation, oligotyping (MED optional).

    İstinadlar

    Hebert PDN, Cywinska A, Ball SL, deWaard JR: Biological identifications through DNA barcodes. Proc Roy Soc Lond B Biol Sci. 2003, 270: 313-321. 10.1098/rspb.2002.2218.

    Hebert PDN, Penton EH, Burns JM, Janzen DH, Hallwachs W: Ten species in one: DNA barcoding reveals cryptic species in the neotropical skipper butterfly Astraptes fulgerator. Proc Natl Acad Sci Unit States Am. 2004, 101: 14812-14817. 10.1073/pnas.0406166101.

    Blaxter M: Counting angels with DNA. Təbiət. 2003, 421: 122-124. 10.1038/421122a.

    Floyd R, Abebe E, Papert A, Blaxter M: Molecular barcodes for soil nematode identification. Mol Ecol. 2002, 11: 839-850. 10.1046/j.1365-294X.2002.01485.x.

    Markmann M, Tautz D: Reverse taxonomy: an approach towards determining the diversity of meiobenthic organisms based on ribosomal RNA signature sequences. Phil Trans Biol Sci. 2005, 360: 1917-1924. 10.1098/rstb.2005.1723.

    Monaghan MT, Balke M, Gregory TR, Vogler AP: DNA-based species delineation in tropical beetles using mitochondrial and nuclear markers. Phil Trans Biol Sci. 2005, 360: 1925-1933. 10.1098/rstb.2005.1724.

    Vences M, Thomas M, Bonett RM, Vieites DR: Deciphering amphibian diversity through DNA barcoding: chances and challenges. Philos Trans Biol Sci. 2005, 360: 1859-1868. 10.1098/rstb.2005.1717.

    Lefébure T, Douady CJ, Gouy M, Gibert J: Relationship between morphological taxonomy and molecular divergence within Crustacea: proposal of a molecular threshold to help species delimitation. Mol Phylogenet Evol. 2006, 40: 435-447. 10.1016/j.ympev.2006.03.014.

    Casiraghi M, Bain O, Guerrero R, Martin C, Pocacqua V, Gardner SL, Franceschi A, Bandi C: Mapping the presence of Wolbachia pipientis on the phylogeny of filarial nematodes: evidence for symbiont loss during evolution. Int J Parasitol. 2004, 34: 191-203. 10.1016/j.ijpara.2003.10.004.

    Rach J, Desalle R, Sarkar IN, Schierwater B, Hadrys H: Character-based DNA barcoding allows discrimination of genera, species and populations in Odonata. Proc Roy Soc Lond B Biol Sci. 2008, 275: 237-247. 10.1098/rspb.2007.1290.

    Hebert PDN, Stoeckle MY, Zemlak TS, Francis CM: Identification of birds through DNA barcodes. PLoS Biology. 2004, 2: e312-10.1371/journal.pbio.0020312.

    Moritz C, Cicero C: DNA barcoding: Promise and pitfalls. PLoS Biology. 2004, 2: e354-10.1371/journal.pbio.0020354.

    Meyer CP, Paulay G: DNA barcoding: error rates based on comprehensive sampling. PLoS Biology. 2005, 3: e422-10.1371/journal.pbio.0030422.

    Wiemers M, Fiedler K: Does the DNA barcoding gap exist? – a case study in blue butterflies (Lepidoptera: Lycaenidae). Ön Zool. 2007, 4: 8-10.1186/1742-9994-4-8.

    Funk DJ, Omland KE: Species-level paraphyly and polyphyly: frequency, causes, and consequences, with insights from animal mitochondrial DNA. Annu Rev Ecol Evol Systemat. 2003, 34: 397-423. 10.1146/annurev.ecolsys.34.011802.132421.

    Besansky NJ, Severson DW, Ferdig MT: DNA barcoding of parasites and invertebrate disease vectors: what you don't know can hurt you. Trendlər Parazitol. 2003, 19: 545-546. 10.1016/j.pt.2003.09.015.

    Powers TO: Nematode molecular diagnostics: From bands to barcodes. Annu Rev Phytopathology. 2004, 42: 367-385. 10.1146/annurev.phyto.42.040803.140348.

    Blaxter M, Mann J, Chapman T, Thomas F, Whitton C, Floyd R, Abebe E: Defining operational taxonomic units using DNA barcode data. Phil Trans Roy Soc Lond B. 2005, 360: 1935-1943. 10.1098/rstb.2005.1725.

    Pion SD, Clarke P, Filipe JA, Kamgno J, Gardon J, Basanez MG, Boussinesq M: Co-infection with Onchocerca volvulusLoa loa microfilariae in central Cameroon: are these two species interacting?. Parazitologiya. 2006, 132: 843-854. 10.1017/S003118200600984X.

    Anderson RC, Bain O: Keys to genera of the order Spirurida. Part 3. Diplotriaenoidea, Aproctoidea and Filarioidea. CIH keys to the nematode parasites of vertebrates. 1976, Farnham Royal: Commonwealth Agricultural Bureaux, 3: 59-116.

    Stein LD, Bao Z, Blasiar D, Blumenthal T, Brent MR, Chen N, Chinwalla A, Clarke L, Clee C, Coghlan A, Coulson A, D'Eustachio P, Fitch DHA, Fulton LA, Fulton RE, Griffiths-Jones S, Harris TW, Hillier LDW, Kamath R, Kuwabara PE, Mardis ER, Marra MA, Miner TL, Minx P, Mullikin JC, Plumb RW, Rogers J, Schein JE, Sohrmann M, Spieth J, Stajich JE, Wei C, Willey D, Wilson RK, Durbin R, Waterston RH: The genome sequence of Caenorhabditis briggsae: a platform for comparative genomics. PLOS Biology. 2003, 1: 166-192. 10.1371/journal.pbio.0000045.

    Casiraghi M, Anderson TJC, Bandi C, Bazzocchi C, Genchi C: A phylogenetic analysis of filarial nematodes: comparison with the phylogeny of Wolbachia endosymbionts. Parazitologiya. 2001, 122: 93-103. 10.1017/S0031182000007149.

    Anderson RC: Nematode parasites of Vertebrates – Their development and transmission. 2000, Wallingford: CAB International

    Chabaud AG: Le genre Dipetalonema Diesing, 1861 esssai de classification. Annales de Parasitologie Humaine et Comparée. 1952, 27: 250-285.

    Bartlett CM: Cercopithifilaria leporinus n. sp. (Nematoda: Filarioidea) from the snowshoe hare (Lepus americanus Erxleben) (Lagomorpha) in Canada. Annales de Parasitologie Humaine et Comparée. 1983, 58: 275-283.

    Guerrero R, Martin C, Gardner SL, Bain O: New and known species of Litomosoides (Nematoda: Filarioidea): important adult and larval characters and taxonomic changes. Comp Parasitol. 2002, 69: 177-195. 10.1654/1525-2647(2002)069[0177:NAKSOL]2.0.CO2.

    Uni S, Suzuki Y, Baba M, Mitani N, Takaoka H, Katsumi A, Bain O: Coexistence of five Cercopithifilaria species in the Japanese rupricaprine bovid, Capricornis crispus. Parasite. 2001, 8: 197-213.

    Kimura M: A simple method for estimating evolutionary rates of base substitutions through comparative studies of nucleotide sequences. J Mol Evol. 1980, 16: 111-120. 10.1007/BF01731581.

    Tamura K, Dudley J, Nei M, Kumar S: MEGA4: Molecular Evolutionary Genetics Analysis (MEGA) software version 4.0. Mol Biol Evol. 2007, 24: 1596-1599. 10.1093/molbev/msm092.

    Britten RJ, Rowen L, Williams J, Cameron RA: Majority of divergence between closely related DNA samples is due to indels. Proc Natl Acad Sci Unit States Am. 2003, 100: 4661-4665. 10.1073/pnas.0330964100.

    Edgar RC: MUSCLE: yüksək dəqiqlik və yüksək ötürmə qabiliyyəti ilə çoxsaylı ardıcıl düzülmə. Nuklein turşuları Res. 2004, 32: 1792-1797. 10.1093/nar/gkh340.

    Thompson JD, Gibson TJ, Plewniak F, Jeanmougin F, Higgins DG: The ClustalX windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nuklein turşuları Res. 1997, 24: 4876-4882. 10.1093/nar/25.24.4876.

    Hall TA: BioEdit: a user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT. Nucleic Acids Symp. 1999, 41: 95-98.

    Peer Van de Y, De Wachter R: TREECON for Windows: a software package for the construction and drawing of evolutionary trees for the Microsoft Windows environment. CABIOS. 1994, 10: 569-570.

    Morales-Hojas R, Cheke RA, Post RJ: Molecular systematics of five Onchocerca species (Nematoda: Filarioidea) including the human parasite, O. volvulus, suggest sympatric speciation. J Helminthol. 2006, 80: 281-290.

    Agatsuma T, Iwagami M, Uni S, Takaoka H, Katsumi A, Kimura E, Bain O: Molecular phylogenetic relationships among seven Japanese species of Cercopithifilaria. Parasitol Int. 2005, 54: 195-199. 10.1016/j.parint.2005.04.002.

    Dorris M, Viney ME, Blaxter ML: Molecular phylogenetic analysis of the genus Strongyloides and related nematodes. Int J Parasitol. 2002, 32: 1507-1517. 10.1016/S0020-7519(02)00156-X.

    Bain O: Le genre Onchocerca: hypothèses sur son évolution et clé dichotomique des espèces. Annales de Parasitologie Humaine et Comparée. 1981, 56: 503-526.

    Bain O, Petit G, Diagne M: Etude de quelques Litomosoides parasites de rongeurs conséquences taxonomiques. Annales de Parasitologie Humaine et Comparée. 1989, 64: 268-289.

    DeSalle R, Egan MG, Siddall M: The unholy trinity: taxonomy, species delimitation and DNA barcoding. Phil Trans Roy Soc Lond B. 2005, 360: 1905-1916. 10.1098/rstb.2005.1722.

    Chu KH, Li CP, Qi J: Ribosomal RNA as molecular barcodes: a simple correlation analysis without sequence alignment. Bioinformatika. 2006, 22: 1690-1701. 10.1093/bioinformatics/btl146.

    Bensasson D, Zhang D, Hartl DL, Hewitt GM: Mitochondrial pseudogenes: evolution's misplaced witnesses. Trendlər Ecol Evol. 2001, 16: 314-321. 10.1016/S0169-5347(01)02151-6.

    Song H, Buhay JE, Whiting MF, Crandall KA: Many species in one: DNA barcoding overestimates the number of species when nuclear mitochondrial pseudogenes are coamplified. Proc Natl Acad Sci Unit States Am. 2008, 105: 13486-91. 10.1073/pnas.0803076105.

    Abbasi I, Hamburger J, Githure J, Ochola JJ, Agure R, Koech DK, Ramzy R, Gad A, Williams SA: Deection of Wuchereria bancrofti DNA in patients' sputum by the polymerase chain reaction. Trans R Soc Trop Med Hyg. 1996, 90: 531-32. 10.1016/S0035-9203(96)90308-9.

    Miller SE: DNA barcoding and the renaissance of taxonomy. Proc Natl Acad Sci Unit States Am. 2007, 104: 4775-4776. 10.1073/pnas.0700466104.

    Dettman JR, Jacobson DJ, Turner E, Pringle A, Taylor JW: Reproductive isolation and phylogenetic divergence in Neyrospora: comparing methods of species recognition in a model eukaryote. Təkamül. 2003, 57: 2721-2741.


    Taxonomic and functional assignment of cloned sequences from high Andean forest soil metagenome

    Total metagenomic DNA was isolated from high Andean forest soil and subjected to taxonomical and functional composition analyses by means of clone library generation and sequencing. The obtained yield of 1.7 μg of DNA/g of soil was used to construct a metagenomic library of approximately 20,000 clones (in the plasmid p-Bluescript II SK+) with an average insert size of 4 Kb, covering 80 Mb of the total metagenomic DNA. Metagenomic sequences near the plasmid cloning site were sequenced and them trimmed and assembled, obtaining 299 reads and 31 contigs (0.3 Mb). Taxonomic assignment of total sequences was performed by BLASTX, resulting in 68.8, 44.8 and 24.5% classification into taxonomic groups using the metagenomic RAST server v2.0, WebCARMA v1.0 online system and MetaGenome Analyzer v3.8 software, respectively. Most clone sequences were classified as Bakteriya belonging to phlya Actinobacteria, ProteobacteriaAcidobacteria. Among the most represented orders were Actinomycetales (34% average), Rhizobiales, BurkholderialesMyxococcales and with a greater number of sequences in the genus Mikobakteriya (7% average), Frankia, StreptomycesBradyrhizobium. The vast majority of sequences were associated with the metabolism of carbohydrates, proteins, lipids and catalytic functions, such as phosphatases, glycosyltransferases, dehydrogenases, methyltransferases, dehydratases and epoxide hydrolases. In this study we compared different methods of taxonomic and functional assignment of metagenomic clone sequences to evaluate microbial diversity in an unexplored soil ecosystem, searching for putative enzymes of biotechnological interest and generating important information for further functional screening of clone libraries.

    Bu, abunə məzmununun, qurumunuz vasitəsilə girişin önizləməsidir.


    Nəticələr

    Ponds represent a potential resource for freshwater, especially in agricultural settings. Here, we characterized the seasonal fluctuations in the microbial communities within one of these complex and often understudied water bodies. We found, through the use of shotgun metagenomics, that features of the bacterial community are strongly influenced by seasonal forces, including temperature, conductivity, precipitation, and turbidity. For instance, we noted that the abundance of Siyanobakteriyalar (məs. Nostoc spp), increased with rising ambient water temperature. In addition we characterized the functional potential of the bacterial fraction and identified 21 unique ARGs conferring resistance to over 15 drug classes, with the majority of hosts identified as members of the Aktinobakteriyalar phylum. Interestingly, we found that the diversity of ARGs, largely from Gammaproteobacterial ev sahibliyi edir, spiked with a large precipitation event. Moreover, for a subset of samples we were able to characterize the viral communities, an often overlooked, but incredibly important, member of freshwater systems. From these data we found that SiphoviridaeMyoviridae dominated the pond, with the latter increasing during the warmer months surveyed. Taken together, these data showcase the range of compositional and functional variability within a freshwater pond over the course of a year.


    Videoya baxın: Blum taksonomiyası (Iyul 2022).


Şərhlər:

  1. Jeremy

    Məncə, bu aktualdır, mən müzakirədə iştirak edəcəyəm. Bilirəm ki, birlikdə düzgün cavaba gələ bilərik.

  2. Klaus

    Nə maraqlı mövzu

  3. Jubair

    Doğrudanmı?

  4. Faelen

    Mən sizinlə bu məsələ ilə bağlı danışmaq istərdim.

  5. Orton

    Nə əyləncəli sualdır

  6. Aldwyn

    Üzr istəyirəm, amma mənim fikrimcə, yanılırsınız. Mən bunu müzakirə etməyi təklif edirəm. Mənə PM yazın, danışın.

  7. Heortwode

    Keçmiş yeni və qarşıdan gələn köhnə NG ilə. Bu öküzün rəqiblərinizi qurtarın

  8. Mungo

    Doğru sözlər nədir ... Super, gözəl söz

  9. Fenrigor

    Mənə zadəganlıq haradandır?



Mesaj yazmaq