Məlumat

Filogenetik siqnala nəzarət - statistik olaraq nə uyğundur?

Filogenetik siqnala nəzarət - statistik olaraq nə uyğundur?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Hazırda doktorant yoldaşımla əməkdaşlıq edirəm. İkimiz də eyni Biologiya şöbəsindəyik, amma əməkdaşım daha çox təbiət tarixçisidir, ona görə də mən işin statistik tərəfi ilə məşğul oluram.

O, yalnız Brownian modelləri və Pagel's istifadə edərək bir neçə məqalə dərc etmişdir $lambda$ (fərqli əməkdaşla). Bununla belə, çoxlu müxtəlif üsullar mövcuddur - Grafen, Blomberg və Martin, bir neçəsini adlandırmaq. Nisbətən kiçik filogeniyalarımız olduğu üçün OU modelləri məlumatlarımız üçün uyğun deyil (Cooper 2016). Ədəbiyyat Pagel-in olduğunu göstərir $lambda$ Blomberqdən daha möhkəmdir $kappa$, və ümumiyyətlə filogenetik siqnalı yoxlamaq üçün yaxşı bir üsul. Mən həmçinin aşkar etdim ki, bəzi insanlar hər şeyi və mətbəx lavabosunu öz məlumatlarına atırlar və sonra hər hansı bir iç-içə müqayisə üçün log-ehtimal əmsalları ilə AIC, BIC-i müqayisə edirlər.

İlk sualım budur ki, məlumatlarınız üçün hansı metodun uyğun olacağına dair hər hansı apriori fərziyyələriniz olmalıdırmı?

Mən hələ də PCM-də yeniyəm, ona görə də köhnə R skriptlərindən və AmNat kağızından (2019-cu ildən) istifadə etdim. Mən də AmNat kağızı ilə eyni filogeniyalardan istifadə edirəm. Həmin kağızdan və həmin skriptlərdən yalnız iki model istifadə edilmişdir, Brownian modeli (bu, mahiyyətcə $lambda$ = 1, hər halda) və təxmini $lambda$. İki modeli müqayisə etdilər, log-ehtimal nisbətinə görə daha uyğun modeli seçdilər və bu belə oldu.

İkinci sualım budur ki, siz həmişə öz modellərinizi sabit olan modellə müqayisə etməli deyilsiniz $lambda$=0?

Məsələn, R-də aşağıdakı çıxışım var,

#Brownian Model pglsModel_BM <- gls(sum_dep ~ ContGroup, korrelyasiya = corPagel(1, phy = UltTree, sabit = TRUE), data = temp, metod = "ML") #Təxmini Lambda Modeli pglsModel_E <- gls(sum_dep ~ ContGroup, korrelyasiya = corPagel(0.50, phy = UltTree, sabit = FALSE), data = temp, metod = "ML") ###Müqayisə nəticəsidir... Model df AIC BIC logLik Test L.Nisbəti p-dəyəri pglsModel_BM 1 3 528.4584 53434. -261.2292 pglsModel_E 2 4 528.0454 536.1468 -260.0227 1 vs 2 2.412992 0.1203 ###ANOVA üstünlük verilən model Denom. DF: 54 numDF F-dəyəri p-dəyəri (Kəsim) 1 7.039370 0.0104 ContGroup 1 6.480427 0.0138

Və Brownian model irəli getdi. Deyəsən, Brownian null model kimi qəbul edilir, amma niyə başımı yığa bilmirəm $lambda =0$ həm də null model deyil və ya the null modeli. Mənim fərziyyəmlə irəliləyirəm,

###Lambdada əlavə etmək=0 model pglsModel_0<- gls(sum_dep ~ ContGroup, korrelyasiya = corPagel(0, phy = UltTree, sabit = TRUE), data = temp, metod = "ML") ###Anovadan istifadə model müqayisəsi Model df AIC BIC logLik pglsModel_0 1 3 524.0962 530.1723 -259.0481 pglsModel_BM 2 3 528.4584 534.5344 -261.2292 ###0 model yoxlanılır…nom DF: 54 numDF F-dəyəri p-dəyəri (Kəsim) 1 289.67228 <.0001 ContGroup 1 0.21234 0.6468

Fərqlərin olduqca kiçik olduğunu başa düşürəm, lakin bütün üsullar buna işarə edir $lambda =0$ "daha çox ehtimal olunan" model kimi.

Üçüncü sualım -- baxmayaraq ki, bəlkə də ikinci sualla cavablandırılsa da, biz orada olduğunu güman edirik lazımdır ortaq tarixə görə müəyyən miqdarda filogenetik siqnal olsun ki, bu, yalnız sınamaq üçün kifayət etsin. $şapka{lambda}$ və müqayisə edin $lambda = 1$?

Qeyd: Əmin olmaq üçün bütün Brownian modellərini corBrownian ilə müqayisə etdim $lambda = 1$ekvivalentlər və eyni nəticələr əldə etdi.


Sualıma şərti cavabım var.

R paketi üçün nəşrdə filosiqnal (Keck, 2016), onlar bildirirlər:

Filogenetik siqnalın mövcudluğunu yoxlamaq üçün sıfır fərziyyə ondan ibarətdir ki, əlamət dəyərləri filogeniyada təsadüfi paylanır. Başqa bir sıfır fərziyyə, əlamət dəyərlərinin Brownian hərəkət modelini izləməsi ola bilər, lakin daha az istifadə olunur və həyata keçirilir.

Belə görünür ki, həqiqətən də iki boş fərziyyə var, lakin hər ikisini sınaqdan keçirməmək qeyri-ciddi görünür, xüsusən bunu etmək nisbətən sadə olduğundan. Və iki, siz nədənsə bir məhdud olmalıdır, üçün test $lambda = 0$ (və ya ümumi xətti modelin log ehtimalı) ilk seçiminiz olmalıdır.

Başqa bir məsələ ilə bağlı idi corPagel paketdən meymun. Pagel-i qiymətləndirmək üçün ilkin dəyər tələb olunur $lambda$ (Əlbəttə, dəyəri düzəltməyincə). Konvergensiyaya zəmanət verilmir və bəzən ilkin dəyərin bəzi incə tənzimlənməsini tələb edir. Bu, bir qədər qırmızı bayraq yaratdı, ona görə də mən məlumatlarımın 5000 alt dəstindən median lambda topladım (mən fərqli bir ailə/filogeniya/məlumat dəsti istifadə edirəm, burada $şapka{lambda}$ model Brownian üzərində üstünlük təşkil edir, lakin deyil $lambda = 0$).

Düşünürəm ki, bu, zəif siqnal olsa da, filogenetik siqnal üçün daha güclü arqumentasiyadır.

təxmin etmək median Lambda müqayisə müqayisə Lambda = 0, Lambda = 1 və median Lambda #output Model df AİŞ BIC logLik pglsModel_0 1 3 636.9876 643.6899 -315.4938 pglsModel_1 2 3 681.9784 688.6807 -337.9892 pglsModel_MEDIAN 3 3 636.4812 643.1836 -315.2406 #output tam verilənlər bazasından lambda Model df AIC BIC logLik Testi L.Nisbəti p-dəyəri pglsModel_MEDIAN 1 3 636.4812 643.1836 -315.2406 pglsModel_FULL 2 4 637.7024 8818.78.78.78.78.78.78.78.78.78.72.78.78.78.78.78.78.78.78.78.75.73.75.78.78.78.78.77.778.787.778 arası

Lambdaların paylanması və median modelin AIC, BIC və log-ehtimalının sübutu ilə biz median modelin lehinə mübahisə edə bilərik. Qalıqlar da normal və təsadüfi görünür. Etibar intervalları da əldə edilməlidir. Ancaq əslində burada zəif bir filogenetik siqnal ilə heç biri arasında fərq yoxa çıxacaq dərəcədə kiçikdir.


Gibbonlarda davranış ekologiyasının ekoloji və filogenetik korrelyasiyalarının müəyyən edilməsi: dünyanın ən nadir meymunun mühafizəsinin idarə edilməsinə təsirlər

Nəsli kəsilməkdə olan növlərin qorunub saxlanmasının effektiv olması üçün əhalinin təbii parametrlərini əhalinin artımını və bərpasını məhdudlaşdıra bilən insanların narahatlığı və yaşayış mühitinin deqradasiyası ilə əlaqəli atipik davranış, ekoloji və demoqrafik xüsusiyyətlərdən fərqləndirmək çox vacibdir. Təəssüf ki, son dərəcə nadir növlər üçün bu parametrləri müəyyən etmək çox çətin ola bilər. Hainan gibbonu (Nomascus hainanus), dünyanın ən nadir meymunu təqribən 25 fərddən ibarət vahid populyasiyadan ibarətdir, lakin intensiv idarəetmə növlərin gözlənilən populyasiya xüsusiyyətləri və ətraf mühit tələblərinin məhdud anlayışı ilə məhdudlaşdırılır. Hainan gibbonunun qorunması üçün daha möhkəm dəlil bazası yaratmaq üçün biz Hylobatidae boyunca əsas ekoloji və davranış xüsusiyyətlərində (ev diapazonunun ölçüsü, sosial qrup ölçüsü, cütləşmə sistemi) variasiyanın daxili və xarici səbəblərini müəyyən etmək üçün müqayisəli yanaşma tətbiq etdik. filogenetik qeyri-müstəqilliyə nəzarət.

Nəticələr

Hər üç tədqiq edilmiş əlamət Hylobatidae arasında güclü filogenetik siqnallar göstərir. Hainan gibbonunun və bəzi yaxından əlaqəli növlərin bildirilmiş böyük qrup ölçülərinə malik olmasına baxmayaraq, müşahidə edilən heç bir gibbon qrupunun ölçüsü təkcə filogenetik əlaqə əsasında gözlənilən dəyərlərdən əhəmiyyətli dərəcədə fərqlənmir. Lakin, Hainan gibbon və digər iki Nomascus növ (N. concolor, N. nasutus) bütün digər gibbon növlərinə nisbətən gözləniləndən yüksək olan ev diapazonu dəyərlərini göstərin. Növ daxili xüsusiyyətlərin variasiyasını özündə birləşdirən, lakin filogenetik əlaqəliliyə görə populyasiya nümunələri arasında kovariasiyaya nəzarət edən proqnozlaşdırıcı modellər gibon diapazonu tələblərində və sosial strukturda variasiyanın əlavə ekoloji və bioloji determinantlarını aşkar edir, lakin yaşayış mühitinin son deqradasiyası ilə dərhal əlaqəli olanları deyil.

Nəticələr

Tədqiqatımız müqayisəli təhlildə son yanaşmalardan istifadə edərək Hylobatidae boyunca davranış və ekoloji xüsusiyyət nümunələrinin ilk sistematik qiymətləndirilməsini təmsil edir. Hainan gibbonunun müşahidə edilən davranış və ekoloji xüsusiyyətlərini gibbonlarda ailə boyu dəyişkənlik daxilində rəsmi kontekstləşdirərək, biz bu Təhlükə altında olan bu növ üçün gözlənilən təbii populyasiya parametrlərini, eləcə də Hylobatidae boyunca əsas populyasiya xüsusiyyətləri üçün variasiyanın daha geniş korrelyasiyalarını müəyyən edə bilirik. Bu yanaşma gələcək Hainan gibbon mühafizəsinin planlaşdırılmasına birbaşa təsir göstərən əsas anlayışları ortaya qoyur və mühafizə ilə bağlı narahatlıq doğuran növlərin idarə edilməsinə dair məlumatlandırma üçün müqayisəli yanaşmanın faydalılığını nümayiş etdirir.


Mücərrəd

Filogenetik siqnal, yaxın qohum olan növlərin filogenetik yaxınlığının nəticəsi olaraq oxşar xüsusiyyət dəyərlərini nümayiş etdirmə meylidir. Ekoloqlar və təkamülçü bioloqlar filogenetik siqnalı və filogenezdə əlamət dəyərlərinin nümunələrini idarə edən prosesləri öyrənməyə getdikcə daha çox maraq göstərirlər. Burada biz davamlı bioloji əlamətlər üçün filogenetik siqnalı araşdırmaq üçün alətlər toplusunu təmin edən yeni R paketini, filosiqnal təqdim edirik. Bu alətlər əsasən avtokorrelyasiya konsepsiyasına əsaslanır və ilk dəfə məkan statistikası sahəsində işlənib hazırlanmışdır. Paketin istifadəsini göstərmək üçün 17 diatom növü üçün çirklənmə həssaslığında filogenetik siqnalı təhlil edirik.


Metodlar

Məlumatların toplanması və emalı

İstinad genomları müvafiq Ümumi Xüsusiyyət Format (GFF3) faylları ilə birlikdə NCBI FTP saytından istifadə edərək 2018-ci ilin avqustunda Milli Biotexnologiya İnformasiya Mərkəzindən (NCBI) 18,19,20,21 verilənlər bazasından endirilib: ftp://ftp.ncbi. nlm.nih.gov/genomes/refseq/. Biz 247 onurğalı növünün hər biri üçün ən son istinad montaj versiyasından istifadə etdik (bu tədqiqatda istifadə olunan növlərin siyahısı üçün S1 və S2 Əlavə Qeydlərə baxın). Məməlilərin taksonomik qrupu (114 məməli növü), eləcə də onların məməli olmayan onurğalılar qrupu (133 məməli olmayan növ) təhlil edilmişdir. Təhlillərimiz yalnız onurğalı növlərini əhatə edir, çünki digər taksonomik qruplarda qeyri-kafi ortoloji eniş ardıcıllığı müəyyən edilmişdir. Arxeya, bakteriyalar, göbələklər, onurğasızlar, məməli onurğalılar, digər onurğalılar, bitkilər, protozoa və viruslardan yalnız onurğalılar ortoloqların mövcud növlərin ən azı 5%-də rampa ardıcıllığını ehtiva etməsini təmin etmək üçün filtrləmə meyarlarımızı keçdi və mövcud növlərin ən azı 5%-i. Təhlillərimizə daxil edilmək üçün taksonomik qrup üçün filtrləmə meyarlarından keçmək üçün bütün şərh edilmiş orfoloqların ən azı 5%-i lazım idi.

Daha sonra məməlilər növləri və onların onurğalı qrupları daxilində rampa ardıcıllığının filogenetik siqnalının uyğunluğunu qiymətləndirdik. Bütün kodlaşdırma ardıcıllığı (CDS) məlumatları JustOrthologs 22-ə daxil edilmiş GFF3 analizatorundan istifadə edərək istinad genomlarından çıxarılmışdır. Tərcümə istisnaları, təsnif edilməmiş transkripsiya uyğunsuzluqları və şübhəli xətalar kimi şərh edilmiş istisnalarla istənilən ardıcıllıq verilənlər bazasından silindi. Təhlillərimizə bütün NCBI gen annotasiyaları daxildir. NCBI gen annotasiyaları NCBI Gen verilənlər bazası üçün NCBI-nin Eukaryotik Genom Annotasiyası boru xətti ilə hesablanır. Orfologiya yaratmaq üçün zülal ardıcıllığı oxşarlığı və yerli sinteniya məlumatlarının birləşməsindən istifadə edirlər. Manual kurator əlavə olaraq ortoloji gen əlaqələrini təyin edə bilər. NCBI verilənlər bazası məməlilər üçün 34,202 orfoloq və məməli olmayan onurğalılar üçün 41,337 orfoloqdan ibarətdir.

Ramp ardıcıllıqlarının müəyyən edilməsi

Ramp ardıcıllıqları ExtRamp istifadə edərək müəyyən edilmişdir (Şəkil 1). Nisbi kodon uyğunlaşma qabiliyyəti hər bir kodon üçün onun genomdakı tezliyindən istifadə etməklə hesablanmışdır. Gendəki hər bir kodonda tərcümə sürəti daha sonra kodonlar pəncərəsinin orta tərcümə səmərəliliyindən istifadə edərək təxmin edildi. ExtRamp sənədlərində 9 tövsiyə edildiyi kimi, ribosomun uzunluğunu təxmin etmək üçün doqquz kodonlu sürüşmə pəncərəsindən istifadə edilmişdir. Gen ardıcıllığının başlanğıcında kodon tərcümə effektivliyinin aşağı kənar bölgələri (yəni tərcümə darboğazları) meydana gəldiyi zaman rampa ardıcıllıqları müəyyən edilmişdir. ExtRamp, ExtRamp README faylında (https://github.com/ridgelab/ExtRamp) təsvir edildiyi kimi, rampa ardıcıllığını və eniş ardıcıllığından sonrakı hissəni çıxarmaq üçün seçimlərdən istifadə edərək, bütün genləri ehtiva edən hər bir növ FASTA faylı (.fasta) üzərində işlədilib. ) İstifadə olunan dəqiq əmr S3 Əlavə Qeydinə daxil edilmişdir.

ExtRamp istifadə edərək rampa ardıcıllığının müəyyən edilməsi. ExtRamp istifadə edərək rampa ardıcıllıqlarını tapmaq üçün axın cədvəli.

Pandusların olması və olmamasından istifadə edərək filogenlərin bərpası

Hər bir şərh edilmiş orfoloqda rampa ardıcıllığının olması və ya olmaması ikili matrisdə kodlaşdırılmışdır. Əgər orfoloqda rampa ardıcıllığı varsa, o, matrisdə '1', olmadıqda isə '0' kimi kodlaşdırılırdı. Orfoloqu olmayan növlərə '?' itkin dəyər üçün, kodon istifadə qərəzlərində filogenetik siqnalları tapmış digər üsullara bənzər 23,24,25 . İtkin məlumatların təsiri verilənlərə əlavə filtr tətbiq etməklə məhdudlaşdırıldı. Ortoloji gen yalnız növlərin ən azı 5%-də həmin gendə rampa ardıcıllığı aşkar edilərsə, analizlərə daxil edilmişdir. Bundan əlavə, bütün növlərdən həmin ilkin filtrdən keçən ortoloqların ən azı 5%-i üçün ortoloji annotasiyaların olması tələb olunurdu. Bu filtri tətbiq etdikdən sonra məməlilər növlərinin orta göstəricisi 16,31% ± 7,81%, qeyri-məməli onurğalılar isə 28,50% ± 13,11% itkin məlumatlara malik idi.

Parsimony filogenetik ağacları Yeni Texnologiyadan (TNT) istifadə edərək Ağac Analizi istifadə edərək bərpa edildi 26 . Ən səliqəli ağaclar, ağacın iki hissəsinin yenidən bağlanması (tbr) budaqlarının dəyişdirilməsi 27 istifadə edərək, bir neçə ağacı saxlamaqla tapıldı. Maksimum ehtimal ağacları IQTREE 28 istifadə edərək bərpa edildi.

İstinad filogeniyalarının əldə edilməsi

Ramp ardıcıllıqlarının filogenetik siqnalının uyğunluğunu müəyyən etmək üçün bərpa edilmiş filogeniyaların hər biri (yəni, parsimoniya və maksimum ehtimal ağacları) Açıq Həyat Ağacından (OTL) sintetik filogeniya ilə müqayisə edilmişdir 29 . Baxmayaraq ki, bu filogeniya "həqiqi" ağac sayıla bilməz, o, bir çox filogenetik tədqiqatların konqlomerasiyasından yaradılmışdır və yeni xarakter vəziyyəti kimi rampa ardıcıllıqlarını müqayisə etmək üçün faydalı mənbə təmin edir. Sintetik filogeniya OTL-dən hər növ üçün OTL taksonomiya identifikatorlarını əldə etmək üçün OTL tətbiqi proqramlaşdırma interfeysinə (API) istinad edən və OTL verilənlər bazasından filogeniyanı əldə edən getOTLtree.py 30 adlı daha əvvəl dərc edilmiş təhlilçidən istifadə edərək OTL-dən götürülüb. Dəqiq əmr S4 Əlavə Qeydinə daxil edilmişdir.

OTL sintetik ağacı ilə müqayisələr

Ramp ardıcıllığının mövcudluğu və ya olmaması əsasında bərpa edilmiş filogeniyaların dəqiqliyi hər bir ağacı OTL sintetik filogeniya ilə müqayisə etməklə qiymətləndirilmişdir. Fərq, Environment for Tree Exploration alətlər dəsti ete3 müqayisə modulu 31,32 tərəfindən həyata keçirildiyi kimi, filial faiz müqayisələrindən istifadə etməklə ölçüldü. Bu metrik iki ağac arasındakı budaq oxşarlığının faizini hesablayır, burada yüksək faiz daha çox oxşar ağaclara uyğun gəlir. Bu metrik böyük ağacları, o cümlədən köksüz ağacları və politomiyalı ağacları müqayisə etmək qabiliyyətinə görə seçilmişdir. ete3 filial faiz identiklik metrikasının baza performansı məməlilər və digər onurğalılar topologiyalarının 1000 təsadüfi dəyişməsini OTL ilə müqayisə etməklə müəyyən edilmişdir.

Hesablama ramp ardıcıllıqları

Hər bir ortoloqun daxilində rampa ardıcıllığının ikili matrisindən istifadə edərək, rampa ardıcıllıqlarının homoplaziyası dərəcəsi, hər bir rampa ardıcıllığının OTL ilə xəritələşdirilməsi yolu ilə ölçüldü. Hər bir eniş ardıcıllığı üçün növlər eniş ardıcıllığının mövcudluğu və ya olmaması əsasında iki hissəyə bölündü. Autapomorfiyalar filogenetik məlumat vermədiyinə görə, tam həll olunmuş ağacı fərz etməklə, ən azı iki növdə ortoloji eniş ardıcıllığının olması və ən azı iki növdə olmaması tələb olunurdu. Hər bir eniş ardıcıllığı üçün baş verən paralelliklərin və geri çevrilmələrin sayı kəmiyyətcə qiymətləndirilmişdir. Paralelliklər, konvergent təkamül səbəbindən bir xarakter bir neçə dəfə müstəqil olaraq yarandıqda baş verir. Geri çevrilmələr törəmə xarakter itirildikdə və ya xarakter öz ata-baba vəziyyətinə qayıtdıqda baş verir. OTL-də bildirilən əlaqələrə uyğun olaraq növləri düzgün ayırdıqda və digər kodon istifadə meylləri üçün əvvəllər hesablanmış mənfəət/zərər hadisələrinin ümumi sayı birinə bərabər olarsa, rampa ardıcıllığının ortoloji olduğu müəyyən edilmişdir. Daha sonra mənşə və itki hadisələrinin sayı hər bir eniş ardıcıllığı üçün saxlama indeksini hesablamaq üçün istifadə edilmişdir 33 , burada sıfır tutma indeksi tam homoplaziya xarakterini, bir tutma indeksi isə heç bir vəziyyətin homoplaziya olmadığı xarakteri təmsil edir. .

Təsadüfi permutasiya testindən istifadə edərək statistik hesablamalar

Ramp ardıcıllıqlarının müşahidə olunan orta tutma indeksinin təsadüfi şansla nə dərəcədə müqayisə olunduğunu müəyyən etmək üçün təsadüfi permutasiyalar aparılmışdır. Permutasiya testləri (həmçinin təsadüfiləşdirmə testləri adlanır) verilənlər toplusunun etiketlərini təsadüfi şəkildə yenidən təşkil etməklə statistik əhəmiyyəti müəyyən edən parametrik olmayan statistik testlərdir 34 . OTL-dəki taksonlar təsadüfi ağaclar yaratmaq üçün 1000 dəfə qarışdırıldı. OTL-nin ağac topologiyası ağac topologiyası ilə bağlı hər hansı qərəzliliyin qarşısını almaq üçün saxlanılmışdır. Təsadüfi şansa görə saxlama indekslərinin sıfır paylanmasını yaratmaq üçün hər bir təsadüfi ağac üçün rampa ardıcıllığının saxlama indeksləri hesablanmışdır. Rampın faktiki orta saxlama indeksi bu paylanma ilə müqayisə edildi və empirik p-qiyməti dəyişdirilmiş saxlama indekslərinin OTL-dən müşahidə edilən saxlama indeksindən az və ya ona bərabər nisbəti kimi hesablandı.

Tam orfoloji rampaların statistik hesablanması

Ramp ardıcıllığına malik olan və ya olmayan bütün növlər monofiletik qrup təşkil edərsə, rampa ardıcıllığı ortoloji sayılır. Hər bir ortoloji rampa ardıcıllığı üçün təsadüfi təsadüf nəticəsində OTL topologiyasına uyğun olaraq monofiletik qrup əmələ gətirmə ehtimalı hesablanmışdır. Növlər iki qrupa bölündü: eniş ardıcıllığı olan növlər və eniş ardıcıllığı olmayan növlər. Bundan sonra şərti ehtimal hesablanmışdır ki, növlər qrupunun əvvəllər Miller və başqalarında təsvir edilmiş metoddan istifadə edərək OTL-yə uyğun monofiletik qrupa təsadüfi bölünməsi. 23, necə təsvir edir (t) ilə ümumi növlər (s) iki qrupdan daha kiçik olan növlərin sayı (yəni, müəyyən bir gen üçün rampalı növlər və ya rampaları olmayan növlər) tənlikdən istifadə edərək təklif olunan filogeniyanı izləyəcək. (1).

Məsələn, əgər üç növ ortoloji gendə rampa ardıcıllığını ehtiva edirsə və cəmi yeddi növ varsa, onda ortoloji gendə rampa ardıcıllığını ehtiva edən üç növün təsadüfi təsadüf nəticəsində OTL topologiyasına uyğun olaraq monofiletik qrup meydana gətirməsi ehtimalı aşağıdakı kimidir:

Hər bir ortoloji eniş ardıcıllığı üçün gözlənilən rampa ardıcıllıq sayı şərti ehtimalı eyni taksonomik paylanmaya malik rampa ardıcıllıqlarının ümumi sayına vurmaqla hesablanmışdır (məsələn, əgər verilənlər toplusunda üç növ olan rampa ardıcıllığı olan 15 ortoloji gen varsa kiçik qrup və yeddi ümumi növ, onda bu paylanma üzrə gözlənilən orfoloji rampaların sayı (P*15= frac<1><15>*15=1) olacaqdır. Verilənlər toplusu üçün p-dəyəri hesablamaq üçün müşahidə edilən ədədlərə qarşı gözlənilən ortoloji rampa ardıcıllıqlarının sayından istifadə edərək, chi kvadrat analizi aparıldı.

Qısaldılmış ardıcıllıqla nəzarət müqayisələri

ExtRamp-ın bütün genlərdəki ilk 50 kodonu çıxararaq və analiz boru xəttimizi yenidən işə salmaqla genomik artefaktlar əvəzinə translyasiya səmərəliliyinə təsir edən rampa ardıcıllıqlarını müəyyən etdiyinə əmin olmaq üçün əlavə nəzarət təhlili apardıq. Ramp ardıcıllığı ümumiyyətlə bir genin ilk 50 kodonunda baş verdiyindən, biz bu nəzarət analizinin orijinal verilənlər toplusundan əhəmiyyətli dərəcədə daha az rampa ardıcıllığını müəyyən edəcəyini gözləyirdik. Biz bu fərqi ki-kvadrat statistikası və p-dəyəri ilə qiymətləndirdik.

Hizalanmış ardıcıllıq məlumatlarından istifadə edərək filogeniyaların bərpası

Ramp ardıcıllıqlarındakı nukleotidlərin genin digər hissələrinə nisbətən fərqli bir filogenetik siqnal təmin etdiyinə dair fərziyyəni araşdırmaq üçün düzlənmiş ardıcıllıqlar maksimum ehtimal və cüzilikdən istifadə edərək təhlil edilmişdir. Hər bir orfoloji qrup üçün rampa ardıcıllığı Clustal Omega 35 istifadə edərək düzəldilmişdir (əmr üçün Əlavə Qeyd S5-ə baxın). Növlər arasında birləşmə yeri oxu çərçivələrində potensial fərqləri yerləşdirmək üçün amin turşusu ardıcıllığının düzülüşündən fərqli olaraq, ardıcıllıqlar nukleotid ardıcıllığının uyğunlaşdırılmasından istifadə edərək uyğunlaşdırıldı. Nukleotid ardıcıllığının uyğunlaşdırılması, ardıcıllığın bir hissəsinin müxtəlif oxu çərçivələrindən istifadə edərək kodlaşdırıla bildiyi zaman baş verən ikili kodlaşdırma eksonlarını ehtiva edə bilən homoloji genlərin uyğunlaşdırılmasına imkan verir.

Simvol matrisi əvvəlcə hər bir orfoloqdan düzülmüş rampa ardıcıllıqlarını birləşdirməklə kodlaşdırılmışdır. Sonra bir növdə ortoloq yoxdursa, bu ardıcıllığın hər bir nukleotid xarakteri '?' kimi kodlaşdırılırdı. çatışmayan məlumatlar üçün. Daha sonra maksimum IQ-TREE 28-də ən yaxşı modeli 36 seçmək və filogenezin maksimum ehtimalını qiymətləndirmək üçün istifadə edilmişdir. Matris TNT-də parsimoniyadan istifadə edərək filogeniyaları bərpa etmək üçün də istifadə edilmişdir.

Filogeniyalar rampadan sonra düzülmüş ardıcıllıqla və hər bir ortoloji gen üçün tam gen ardıcıllığından istifadə etməklə eyni şəkildə bərpa edildi. Maksimum ehtimal analizi üçün rampa ardıcıllığından sonrakı hissə üçün verilənlər toplusunun ölçüsü və tam ardıcıllıq hesablama tələblərinə görə avtomatik model seçimini qeyri-mümkün etdi. Buna görə də, rampa ardıcıllığından sonra gen ardıcıllığını və tam gen ardıcıllığını qiymətləndirmək üçün məməlilər üçün GTR + F + R5 və məməli olmayan onurğalılar üçün GTR + F + R8 olan eyni modelləri seçdik.


Müzakirə

EST-lər və digər qismən gen ardıcıllıqları böyük və taksonomik cəhətdən müxtəlif növlər dəsti üçün ardıcıllıq məlumatlarının üstünlük təşkil edən mənbəyidir. Bu ardıcıllıqlar gen kəşfi, genom annotasiyası, müqayisəli genomika, markerin inkişafı və müxtəlif digər istifadələr üçün olduqca qiymətlidir [11, 33]. Bununla belə, gen ailəsinin təkamülünün tədqiqi və ya gen ailələrinin geniş miqyaslı təhlilləri üçün, qismən ardıcıllıqlardan əldə edilən uyğunlaşmalarda çox sayda itkin məlumatla mübarizə aparmaq lazımdır. Məsələn, Phytome verilənlər bazasında [30] üç və ya daha çox ardıcıllığın mövcud olduğu ≈27.000 ailədən düzülmə boşluqlarının orta nisbəti 37% təşkil edir.

Bu çatışmayan məlumatlar həqiqətən problemdirmi? Biz tapdıq ki, itkin qalıqların sütunlara yığıldığı düzlüklərdən dəqiq ağacları bərpa etmək mümkün idi. Simulyasiya edilmiş düzülmələrin yarısında 50% -dən 60% -ə qədər məlumat çatışmazlığı olsa da, median stQD NJ və ML ağacları üçün 0 idi və median stQD MP ağacları üçün 0,004 idi. Bu nəticələr təsdiq edir ki, təhlil üçün kifayət qədər məlumat mövcud olduğu müddətcə çatışmayan məlumatların olması yanlış filogeniyaya səbəb olmur [20, 22, 24, 25].

Bununla belə, EST-yə bənzər boşluqlu düzülmələr keyfiyyətcə fərqli görünür. Eyni miqdarda itkin məlumat EST unigenlərinə xas olan nümunədə paylandıqda, filogeniyalar daha az dəqiq idi: orta stQD bu hizalamalardan hesablanan ağaclar üçün ML üçün 0,17 ilə MP üçün 0,34 arasında dəyişdi. NJ istifadə edərkən, eyni sayda qalıqların təsadüfi silindiyi düzülmələrə nisbətən EST-yə bənzər boşluqlu düzülmələr üçün filogenetik dəqiqlik daha da aşağı idi. Bu nəticələrin izahı ondan ibarətdir ki, təsadüfi silinmiş düzülmələr üçün bütün ardıcıllıq cütləri arasında ən azı müəyyən qədər üst-üstə düşür. Digər tərəfdən, EST-yə bənzər boşluqlu düzülmələr üçün, bəzi ardıcıllıq cütləri üçün verilənlərin mövcud olduğu sütunları paylaşmaması adi haldır (məsələn, boşluq nümunələri 5, 6, 9 və 10-a baxın) və beləliklə, heç bir məsafə müəyyən edilə bilməz. hesablanmışdır. Bu, məsafəli üsullar üçün xüsusi problemlər yaradır. Məsələn, PHYLIP giriş düzülüşündə üst-üstə düşməyən hər hansı iki ardıcıllıq üçün "-1.0" məsafəni bildirir. Bu, NJ alqoritminin icrası zamanı nominal olaraq qəbul edilir və ağacdakı ardıcıllıqlar arasında üst-üstə düşmənin olmaması nəticəsində həddindən artıq sıx əlaqələrə sistematik bir meylə səbəb olur. İtkin məlumatların təkcə miqdarı deyil, paylanmasının vacibliyi Wiens [24] tərəfindən fərqli kontekstdə əvvəllər göstərilmişdir. Həmin araşdırmada, itkin genlərin taksonların monofiletik alt qrupları ilə məhdudlaşdırıldığı məlumat dəstləri ilə müqayisədə, itkin genlər nümunə götürülmüş taksonlar arasında təsadüfi paylandıqda daha aşağı dəqiqlik əldə edilmişdir.

Biz göstərdik ki, iki diametral əks yanaşmadan birini götürməklə filogenetik dəqiqliyi təkmilləşdirmək olar. Birinci yanaşmada, düzləşdirmə maskalanması vasitəsilə boşluqlu sütunlar və ardıcıllıqlar təhlildən xaric edilir. Maskalama (REAP) tətbiqimizdə, simulyasiyamızda heç bir hizalanma xətası olmasa da, yanlış hizalanma sübutunu göstərən sütunları və cərgələri istisna etməklə, onun real məlumatlar üzərində necə yerinə yetiriləcəyini təqlid edirik. NJ və ya ML metodlarından istifadə edərək maskalı düzülmələrdən hesablanan ağacların əksəriyyəti heç bir itkin məlumat olmadan düzülmələrdən hesablanmış ağaclarla müqayisə edilə bilərdi (ortalama stQD 0,0022 və 0,0026 və tam düzülmə üçün 0,0). Hətta MP ağacları üçün hizalanma maskalanması ağacları təxminən maskalanmamış NJ ağaclarının səviyyəsinə qədər yaxşılaşdıra bildi (stQD 0,2286). Bu, yalnız boşluqların aradan qaldırılması ilə bağlı ola bilsə də, bu, çoxlu əvəzləmələrə məruz qalmış hizalanma mövqelərinin aradan qaldırılmasını da əks etdirə bilər, beləliklə, qalanlarda filogenetik siqnal daha aydın olur. Hər iki halda, səhvsiz uyğunlaşdırma girişinə məhəl qoymadan filogeniyanın daha dəqiq olması paradoksundan qaçmaq olmaz. Başqa bir vacib məqam odur ki, hizalanma maskalanması bütün ardıcıllıqları saxlamamaq üçün lazımi xərcə gəlir. Təcrübələrimizdə orta hesabla EST-yə bənzər düzülmə daxilində ardıcıllığın 27%-i maskalanaraq xaric edilmişdir.

Çox fərqli bir yanaşma, uyğunlaşma bölməsi adlandırdığımız bir texnika vasitəsilə etdiyimiz çatışmayan məlumatları modelləşdirməyə çalışmaqdır. Maskalanma ilə əlaqədar olaraq biz tapdıq ki, hizalanma bölməsinin (SİA) tətbiqi ardıcıllıqların daha yüksək nisbətini saxlaya bildi, SIA istifadə edərək saxlanılan ardıcıllıqların median nisbəti 100% idi. SİA ümumiyyətlə, universal olmasa da, birbaşa boşluq düzülüşündən hesablanan ağaclardan daha dəqiq ağaclara gətirib çıxardı. SİA-da dəqiqlikdə ən böyük irəliləyişlər çoxlu alt sıralara malik olan ailələrdə müşahidə edilmişdir. Natamam düzülmələrin 12 və ya daha çox alt düzülmələrə bölündüyü yerlərdə SIA demək olar ki, bütün hallarda daha dəqiq filogeniya ilə nəticələndi. Digər tərəfdən, yalnız iki alt düzülmə olduqda, ilkin düzülmədən birbaşa hesablanan filogeniya zamanın üçdə ikisində daha dəqiq idi. Bəlkə də təəccüblü deyil ki, alt düzülmələrin sayı simulyasiyada istifadə olunan boşluq nümunəsi ilə sıx bağlı idi. Boşluq nümunələri 1, 2, 3 və 8 adətən yalnız bir-dörd alt düzülmə ilə nəticələndi, boşluq nümunələri 6, 9 və 10 isə adətən daha çox sayda nəticələndi, beləliklə, müəyyən boşluq nümunələri SİA-ya uyğun olaraq yaxşılaşma ehtimalı daha yüksəkdir. başqalarına nisbətən.

Filogenetik dəqiqliyin yaxşılaşması ümumiyyətlə bölmə ilə müqayisədə maskalama ilə daha yüksək idi. EST-yə bənzər düzülmələrdən hesablanmış NJ ağacları hizalanma maskalanması ilə 100 dəfədən çox daha dəqiq idi (stQD = 0,002) birbaşa hesablanandan (stQD = 0,246). SIA istifadə edərkən eyni diferensial yalnız iki dəfə idi (stQD = 0,127). Beləliklə, SİA-dan istifadə edən filogenetik dəqiqliyi maskalı MP ağacları və maskasız ML ağacları ilə müqayisə etmək olar. Bundan əlavə, SİA yanaşması hesablama baxımından zəhmətlidir. Birlikdə götürdükdə, əldə etdiyimiz nəticələr, çatışmayan məlumatların paylanması təbiətdə EST-yə bənzər olduqda, hizalanma maskalanmasının üstünlük verilən yanaşma olduğunu göstərir.

Nəticələrimizdən göründüyü kimi, ML-dən filogeniyanı çıxarmaq üçün istifadə edildikdə, hizalanma maskalanması lazım deyil, bu, simulyasiya edilmiş məlumatlarda hizalanma xətasının olmamasını əks etdirə bilər. Bəzi hallarda filogenetik nəticə çıxarma metodunun seçilməsinin filogenetik dəqiqliyə böyük təsir göstərdiyi bilinsə də [34], əvvəlki tədqiqatlar göstərmişdir ki, həm hizalanma dəqiqliyi [35-37], həm də hizalanmada filogenetik siqnalın səs-küyə nisbəti [34]. 38] filogenetik metodun seçimindən daha vacib ola bilər. Qismən gen ardıcıllığından giriş kimi istifadə edilməsi səbəbindən yanlış hizalanmanın təsirlərini tədqiq etməsək də, hizalanma xətasının maskalanmanın nisbi performansını yaxşılaşdıra biləcəyini təklif edirik.

Çatışmayan hizalanma məlumatlarını modelləşdirərkən, çatışmayan müşahidələr olmadıqda görməyi gözlədiyimiz məsafə matrisini təxmin etdik. SIA metodunu daha da inkişaf etdirmək və optimallaşdırmaq üçün gələcək tədqiqatlarda subalignmentləri birləşdirmək üçün digər yanaşmalar sınaqdan keçirilə bilər. Məsələn, dörd nöqtəli metrikdən istifadə edərək submatrislərdən hesablana bilməyən qoşa məsafələr hesabladıq [18, 39]. SİA-nın gələcək tətbiqləri üç nöqtəli metrik və ya çəkili ən kiçik kvadratlar təyinatını daxil etməklə təkmilləşdirilə bilər [18, 23, 40]. Bununla belə, birləşmiş matrislərdəki hüceyrələrin yalnız 17,5%-i əskik olduğundan, hesablama keyfiyyətindəki fərqin nəticələrə yalnız kiçik təsir göstərəcəyini gözləyirik. İtkin uyğunlaşma məlumatlarını ehtimal və ya təxminlər əsasında modelləşdirən alternativ yanaşmalar, bütün giriş ardıcıllıqlarını saxlamaqla daha dəqiq (ehtimal və ya Bayesian) filogenetik üsulların tətbiqinə imkan verəcəkdir. Başqa bir maraqlı yanaşma, hər bir alt düzülmə üçün ayrı-ayrılıqda filogeniyalar çıxarmaq və sonra tam verilənlər bazası üçün superağac hesablamaq olardı [41].


Açar sözlər

Mədəniyyətdən məlum olan bitki patogen və endofitik Botryosphaeriales

Siz paylaşmaqda sərbəstsiniz - işi kopyalamaq, yaymaq və ötürmək, aşağıdakı şərtlərlə:

Atribut: Siz əsəri müəllif və ya lisenziya verən tərəfindən müəyyən edilmiş qaydada aid etməlisiniz (lakin onların sizi və ya işdən istifadənizi təsdiqlədiyini göstərən hər hansı bir şəkildə deyil).

Qeyri-kommersiya: Bu işi kommersiya məqsədləri üçün istifadə edə bilməzsiniz.

Törəmə işləri yoxdur: Siz bu işi dəyişdirə, dəyişdirə və ya üzərində qura bilməzsiniz.


U NIVARIATE C ASE : P HYLOGENETIC S IGNAL

Birdəyişənli hal müstəqil dəyişənlər olmadıqda tətbiq edilən filogenetik logistik reqressiyaya uyğundur, ona görə də ortanı müəyyən edən yalnız bir parametr var. Bu halda, biz əlamətin filogenetik ağaca doğru inkişaf etdiyini fərz etməklə ikili əlamətin filogenetik dəyişmə modelini qururuq. Zamanın hər kiçik artımı zamanı müəyyən α ehtimalı var1 əlamətin hal-hazırda 0 olduğu halda 1-ə, digər ehtimal isə α-ya keçir0 Hal-hazırda 1 olarsa, əlamət 0-a keçir ki, beləliklə, filogenetik ağacdakı təkamül, ikili əlamətlərin təkamülünün əvvəlki modellərində istifadə edildiyi kimi, Markov prosesinin formasını alır (məsələn, Pagel 1994). Bu təkamül prosesi filogenetik ağacın uclarında əlamət dəyərləri üçün ehtimal paylanmasına gətirib çıxarır. α-nın mütləq böyüklükləri0 və α1 0 və 1 arasında keçid dərəcələrini təyin edin və beləliklə, uc növləri arasında müşahidə olunan filogenetik korrelyasiyanın gücünə təsir edin. Məsələn, əgər α0 və α1 böyük dəyərlərə malikdir, sonra 0 və 1 arasında keçidlər sürətlə baş verir və bu, yaxından əlaqəli növlərin bir-birinə bənzəmə meylini pozacaq.

Statistik model yaratmaq üçün təkamül prosesi ilə bağlı bu spesifik fərziyyələri irəli sürsək də, real xüsusiyyətin zamanla təkamülünün bu prosesi dəqiq şəkildə izləməsi ehtimalının az olduğunu qəbul edirik. Məsələn, keçid ehtimalı filogenetik ağacın budaqları arasında dəyişə bilər. Buna baxmayaraq, təhlillərimizi təkamül dəyişikliyinin spesifik (və kifayət qədər sadə) modeli ətrafında əsaslandırmaq, növlər arasında ikili əlamətin dəyərləri üçün açıq statistik paylanma əldə etməyə imkan verir.

Statistik modelimizdə μ və α-dan parametrlər kimi istifadə etməyi seçdik, çünki onlar intuitiv şərhlərə malikdir və model ilə standart logistik reqressiya arasında uyğunluğu artırır. Buna baxmayaraq, model digər parametrlərdə də formalaşdırıla bilər, məsələn, α0 və α1 (yəni keçid dərəcələri). Bununla belə, mühüm statistik məhdudiyyət ondan ibarətdir ki, məlumat dəstlərindən yalnız 2 məlumat əldə edilir, orta dəyəri Y və korrelyasiya Y növlər arasında. Buna görə də yalnız 2 parametri qiymətləndirmək mümkündür. Bu məhdudiyyət modeli tərtib edərkən verdiyimiz bəzi strateji qərarları izah edir. Məsələn, korrelyasiya matrisinin alınmasında C(α) biz fərz etdik ki, proses stasionardır, ona görə də filogenetik ağacın altındakı əlamətin Vəziyyət 1 olması ehtimalı ağacın uclarında olduğu kimi μ-ə bərabərdir. Əgər prosesin stasionar olmadığını fərz etsək, onda korrelyasiya matrisi ⁠ olar, burada m ipuçlarında gözlənilən xüsusiyyət dəyəridir və m0 filogenetik ağacın əsasında gözlənilən əlamət dəyəridir. Lakin bu modelin indi 3 parametri var (m, m0, və α) və yalnız 2 təxmin edilə bilər, ona görə də bu formula ilə heç nə əldə edilmir. Buna görə də, bu, ümumiliyin itirilməsinə səbəb olmadığı üçün, prosesin stasionar olduğu fərziyyəsindən istifadə etdik.

Korrelyasiya matrisi C(α) davamlı qiymətli əlamətlərin filogenetik reqressiyası üçün istifadə edilən korrelyasiya matrisindən fərqli struktura malikdir (Martins və Hansen 1997 Garland və Ives 2000 Lavin et al. 2008). Brownian hərəkət təkamülü altında davamlı qiymətli əlamətlər üçün növlər arasında əlamət dəyərlərindəki korrelyasiya matrisdə verilmiş paylaşılan budaqların uzunluğuna (diaqonaldan kənar) mütənasibdir. W, halbuki ikili prosesin təkamül modelimiz üçün korrelyasiyalar ilə verilir C(α). strukturu C(α) prosesin stasionar olduğu fərziyyəsi altında OU təkamül modelindən sonra davamlı qiymətli əlamətlər üçün yaradılanla eynidir (Hansen və Martins 1996 Martins və Hansen 1997 Butler and King 2004). Blomberg və digərlərində verilmiş OU prosesinin əldə edilməsi. (2003) filogenetik ağacın əsasındakı əlamət dəyərinin sıfır dispersiya ilə tanındığını fərz etməklə bu sitatlarda veriləndən fərqlənir, bu, orijinal ağacı qaytaran bir transformasiya yaratmaq üstünlüyünə malikdir (yəni, W) filogenetik siqnal verən parametr olduqda d = 1. Bu fərziyyə ikili dəyişənlər üçün seçim deyil, çünki dispersiya ciddi şəkildə orta ilə müəyyən edilir. Baxmayaraq ki, matris C(α) heç vaxt eyni deyil W, α = 1 olduqda filogenetik korrelyasiyanın güclü tərəfləri (diaqonaldan kənar elementlər) C(α) və W, və buna görə də α = 1 filogenetik siqnalın gücünü ölçmək üçün kobud istinad nöqtəsi kimi xidmət edir. Başqa sözlə, α = 1 olduqda, əlamətin uç dəyərləri arasındakı filogenetik korrelyasiyaların böyüklüyü, eyni ağacda Brown hərəkəti ilə inkişaf edən davamlı qiymətli əlamətlər üçün gözlənilən filogenetik korrelyasiya ilə təxminən eyni böyüklükdədir. Arasındakı əlaqə C(α) və W, lakin strukturundan asılıdır W və buna görə də PLogReg.m proqramı matrisanı çıxarır. C(α) bilavasitə tədqiq oluna bilməsi üçün (Əlavə materiala baxın).

Çünki statistik model matrisin daxil edilməsini tələb edir W növlər arasında gözlənilən filogenetik korrelyasiyanı təmin edən filogenetik ağacın müasir olmayan ucları olduqda xüsusi diqqət yetirilməlidir. Modelimizdəki filogenetik korrelyasiya ( tənlik (1)) 2(1 -) diaqonaldan kənar elementləri ilə verilən filogenetik ağacdakı uclar arasındakı budaq uzunluğu (patristik) məsafələrdən asılıdır. W). Müasir olmayan ucları olan bir ağac üçün nisbi məsafələri qorumaq üçün ipuçları arasında paylaşılan budaq uzunluqlarını verən elementləri olan matris olsun. ij (istənilən miqyasda ölçülür, məsələn, zamanın təxminləri, DNT-nin fərqliliyi). Əgər T elementləri əsasdan uclara qədər orta uzunluğa bərabər olan matrisdir ij, və əgər max( ⁠⁠ ) ⁠-dəki elementlərin maksimum qiymətidirsə, o zaman filogenetik ağacda uçdan uca məsafələri standartlaşdırılmış şəkildə verir ki, uclar arasındakı maksimum məsafə 2 olsun. Beləliklə, (1) tənliyində biz filogenetik ağacları müasir olmayan ipuçları ilə birləşdirmək üçün standart bir yol təqdim edək.

Açıq misal olaraq, A və B növlərinin əsasdan uca uzunluğu 2, C növünün əsasdan uca uzunluğu 8, B və C növlərinin budaq uzunluğunun 1 olduğunu və bununla da ⁠ . Növlərdən növə budaq uzunluqları ⁠ və beləliklə standartlaşdırılmış məsafə matrisi ⁠ olur. Burada A və B növləri ən yaxındır və buna görə də 2(1 −) ən aşağı uyğun elementə malikdir W), ilkin ağacda ⁠ , B və C növləri filogenetik cəhətdən əlaqəli növlər olsa da.

Parametrlərin qiymətləndirilməsi

Yuxarıda təsvir etdiyimiz təkamül prosesi üçün ehtimal funksiyasını əldə etmək (məsələn, Pagel 1994) və beləliklə, ML qiymətləndirməsindən istifadə edərək μ və α parametrlərini qiymətləndirmək mümkün olsa da, bunun əvəzinə biz daha çevik və ədədi cəhətdən daha səmərəli prosedurdan istifadə edirik. Konkret olaraq, biz kvazi ehtimal funksiyasından istifadə edərək μ verilmiş α-nı təxmin edirik və daha sonra hər iki dəyər yaxınlaşana qədər μ və α-nın qiymətləndirilməsi arasında təkrar-təkrar növbə ilə ən kiçik kvadratlar qiymətləndirməsindən istifadə edərək μ verilmiş α-nı qiymətləndiririk.Həm kvazi-ehtimal, həm də ən kiçik kvadratların qiymətləndirilməsi üçün əlamət dəyərlərinin uç növlər arasında ehtimal paylanmasının yalnız ilk 2 statistik anını bilmək tələb olunur, lakin binomial proses üçün ilk 2 an paylanmanı tam şəkildə müəyyənləşdirir və buna görə də qiymətləndirmə proseduru bütün məlumatlardan istifadə edir. məlumatlarla təmin edilir.

Kvazi-ehtimal funksiyası paylanmanın gözləntisindən və dispersiyasından əldə edilir Y. Hər hansı bir paylanma üçün kvazi ehtimal funksiyası yalnız ehtimal funksiyasına yaxınlaşsa da, kvazi-ehtimal təxminləri ML təxminləri ilə eynidir və məsələn, təxmini etibar intervallarını əldə etmək üçün istifadə edilən qiymətləndiricilərin asimptotik xassələri eynidir ( McCullagh və Nelder 1989). Yuxarıda təsvir edilən təkamül prosesində bütün elementlərin gözləməsi Y sadəcə olaraq μ və paylanmasının korrelyasiya strukturudur Y tərəfindən verilir C(α) ( tənlik (1)), bu birlikdə α-nın verilmiş dəyəri üçün kvazi ehtimal funksiyasını təyin edir. Kvazi-ehtimalın qiymətləndirilməsi GEE-nin əsasını təşkil edir (Liang and Zeger 1986 Zeger and Liang 1986 Zeger et al. 1988). Müqayisəli məlumatların filogenetik təhlili üçün təklif olunan GEE-lər (Paradis and Claude 2002 Forsyth et al. 2004) birinci dərəcəli yaxınlaşmalar (GEE1) olmuşdur, halbuki hər iki orta komponenti özündə birləşdirən ikinci dərəcəli yaxınlaşmalardan (GEE2) istifadə etmək də mümkündür. modellərin (reqressiya əmsalları) və dispersiya komponentlərinin (parametr α kimi kovariasiya matrisinə təsir edənlər) ( Prentice 1988 Zhao and Prentice 1990 Liang et al. 1992). Bununla belə, bizim tətbiqimiz üçün ikinci dərəcəli GEE2 olduqca mürəkkəbdir və birinci dərəcəli GEE1 tez-tez zəif yaxınlaşma xüsusiyyətlərinə malikdir (nəticələr təqdim edilmir). Buna görə də biz bilavasitə kvazi-ehtimal funksiyalarından istifadə edərək, adətən GEE yanaşmasında istifadə edilən Nyuton-Rafson minimizasiyasından daha çox, ML parametrlərinin qiymətlərini tapmaq üçün simplex minimizasiyasından istifadə etdik.


Filosimbioz haqqında təqdimat

Filosimbioz bu yaxınlarda ev sahibi ilə əlaqəli mikrobiomlarda yeni, sistemlərarası tendensiyanın səciyyələndirilməsi üçün hipoteza əsaslanan çərçivəni dəstəkləmək üçün tərtib edilmişdir. Filosimbiozu 'ev sahibinin filogeniyasını təkrarlayan mikrob icması əlaqələri' olaraq təyin edərək, təhlillərdə tez-tez istifadə olunan metodları və müntəzəm nümunələri vurğulayaraq, son onillikdə müvafiq ədəbiyyat və məlumatları nəzərdən keçiririk. Filosimbiozun kəmiyyət dəstəyi ev sahibi növlər arasında daha yüksək mikrobiom variasiyasını, ev sahibinin filogeniyası və mikrobiom dendroqramı arasında topoloji oxşarlıqları və ev sahibinin genetik əlaqələri ilə mikrobiomun beta müxtəlifliyi arasında müsbət əlaqəni qiymətləndirən statistik üsullarla təmin edilir. Filosimbiozun əhəmiyyətli dərəcələri quru və su yaşayış yerlərindən olan bitki və heyvanların mikrobiomlarında yayılmışdır, lakin universal deyil. Filosimbiozu formalaşdıran təbii seçmə ilə uyğun olaraq, mikrobiom transplantasiyası təcrübələri ev sahibi-mikrobiom uyğunsuzluğunda ev sahibi performansının və/yaxud uyğunluğunun azaldığını nümayiş etdirir. Hibridləşmə filosimbiotik mikrobiomları da poza və hibrid patologiyalara səbəb ola bilər. Filosimbiozun geniş yayılması, ev sahibi-mikrobiom qarşılıqlı təsirlərinə və dəqiq mikrobiologiyanın gələcək tətbiqlərinə təsir edən eko-təkamül prosesləri haqqında biliklərin inkişafı üçün bir neçə vacib təsir göstərir. Gələcəkdə atılacaq vacib addımlar filosimbiozu bakterial icmalardan kənarda araşdırmaq, filosimbiozun getdikcə daha təkmil başa düşülməsi üçün təkamül modelləşdirməsini tətbiq etmək və nümunəyə töhfə verən ev sahibi və mikrob mexanizmlərini açmaq olacaq. Bu icmal filosimbiozun eksperimental, konseptual və kəmiyyət mövzularına giriş qapısı kimi xidmət edir və müxtəlif fənlərdən araşdırma üçün yetişmiş imkanları təsvir edir.

1. Giriş

Son onillik bir sıra yeni empirik nəticələr, fəlsəfi konsepsiyalar və tədqiqat imkanları verən mikroorqanizmlərin ev sahibləri ilə birlikdə yaşayan mürəkkəbliyinə yenidən maraq göstərmişdir [1,2]. Ev sahibi-mikrobiom qarşılıqlı təsirinin öyrənilməsi ilə bağlı hər hansı müzakirə aydın təriflərlə başlamalıdır. Burada simbioz terminindən istifadə edirik (sim-'birlikdə', bios—yunan dilində ‘həyat’) müxtəlif növlərdən olan iki və ya daha çox orqanizm arasında birləşmənin müddəti və ya qarşılıqlı əlaqədə olan növlərin yaratdığı fenotiplərlə məhdudlaşdırılmadan birləşmələri əhatə edir. Simbiozda müvəqqəti və funksional variasiya kontekstdən asılı olduğundan, simbiotik qarşılıqlı təsirlərə müxtəlif dərəcədə spesifiklik və funksional xərc və faydaları olan bir sıra məcburi, fakultativ, keçici və daimi birləşmələr daxil ola bilər.

Son iki onillik tədqiqat və texnoloji irəliləyişlər mikrob simbiozunu biologiya daxilində və ondan kənarda bir çox alt fənlərin əlaqəsi kimi yerləşdirdi. Alimlər indi bir sıra alətlərə və cavablandırılmalı olan əsas suallara dair məlumatlılığa malikdirlər. Bunlara mikrobların taksonomik və funksional müxtəlifliyinin ekoloji [3] və ev sahibi [4-7] sürücülərinin müəyyən edilməsi üçün vahid yanaşmalar, həmçinin ötürülmə proseslərinə [8] və simbiozun fenotipik nəticələrinə təkamül və mexaniki anlayışları təmin edən reduksionist yanaşmalar daxildir. 1]. Sadə simbiozların ekologiyası və təkamülü ilə bağlı çoxlu empirik və nəzəri araşdırmalar həmçinin ev sahibləri və onların çoxsaylı mikrob assosiasiyaları arasında tez-tez mürəkkəb assosiasiyaları öyrənən mikrobiom sahəsi üçün zəmin yaratmaq üçün münbit zəmin yaradır. Müxtəlif sistemlər arasında sürətlə böyüyən tədqiqat sahəsi bu yaxınlarda müəyyən edilmiş filosimbioz modelidir [9]. Bu icmalın məqsədi aşağıdakıları təmin etmək üçün mövzunu sintez etməkdir: (i) terminin uzunmüddətli tərifi (ii) filosimbiozu yoxlamaq üçün praktiki bələdçi (iii) filosimbiozun yayılmasının icmalı (iv) bioloji əhəmiyyəti haqqında diskurs. filosimbioz və (v) filosimbioz tədqiqatında gələcək istiqamətlər.

2. Filosimbioz nədir və nə deyil?

Filosimbiozun ilkin və əsas tərifini təsvir etmək üçün aşağıdakı sitatdan istifadə edirik, yəni “ev sahibinin filogeniyasını əks etdirən mikrob icması əlaqələri” [9]. Filosimbioz, ilk növbədə, ev sahibinin filogenetik əlaqələri ilə ev sahibi ilə əlaqəli mikrob icması əlaqələri arasında əhəmiyyətli bir əlaqədir, burada "filo" ev sahibi qrupuna aiddir və "simbioz" ev sahibinin içərisində və ya üzərindəki mikrob icmasına aiddir.

Bir araşdırmada filosimbioz termininin tətbiqindən əvvəl Nasonia parazitoid arı növləri [9], erkən tədqiqatlar qarğıdalıda [10], həşəratlarda [5,11] və məməlilərdə [4,12] mikrob beta müxtəlifliyi ilə ev sahibi filogeniyaları və ya genetik məsafələr arasında əlaqələri müəyyən etdi. Bu tədqiqatlar yaxından əlaqəli növlərin uzaqdan əlaqəli növlərə nisbətən daha çox oxşar mikrobiomlara malik olduğunu nümayiş etdirmək üçün bir çox ev sahibi növlər arasında bakterial 16S rRNA gen ardıcıllığından istifadə etdi. Məsələn, qardaş növlər N. giraultiN. longicornis təqribən 0,4 milyon ay məsafədə ayrılmış və öz qrup növlərindəki mikrobiomla müqayisədə daha çox oxşar 2-ci dövr sürfə, pupa və yetkin mikrobiomlara malikdir. N. vitripennis [9,11], iki qardaş növdən təqribən 1.0 Ma ayrıldı [13].

Filosimbioz stoxastik və/və ya deterministik təkamül və ekoloji qüvvələrdən yarana bilər. Məsələn, stoxastik təsirlərə mikrob icmalarında səpələnmə dalğalanmaları (ekoloji sürüşmə) və ya ev sahibi coğrafi diapazonlarda sürüşmələr daxildir [14]. Filosimbioz həm də ev sahibi nəsillər arasında ekoloji [15-17] və pəhriz [4] niş dəyişkənliyi ilə formalaşa bilər. Deterministik təsirlərə müəyyən ev sahibi fonları üçün mikrob kolonizasiyası üstünlükləri və ya mikrob icmasının tərkibinə ev sahibi xüsusiyyət(lər) tərəfindən təsir edilən ev sahibi tənzimlənməsi daxildir [18]. Filosimbiotik nümunələri spesifik ev sahibi genlərin funksiyası ilə əlaqələndirən ilk tədqiqat aşkar etdi ki, Hidra Armenin antimikrobiyal peptid pozulmuş filosimbioz [6] bir neçə şirin su və laboratoriyada adətən müşahidə olunur. Hidra növlər [19]. Filosimbioz potensial olaraq, ev sahibi-mikrob birgə təkamülü, kodiversifikasiya [20] və kospesifikasiya [21] kimi təkamül zamanı uzunmüddətli, intim ev sahibi-mikrob assosiasiyalarından yarana bilsə də, əsas odur ki, o, həm də nisbi qısa müddətli dəyişikliklərlə idarə oluna bilər. mikrobiom tərkibi. Doğrudan da, son vaxtlar Drosophila melanogaster Tədqiqat beş nəsil ərzində bağırsaq mikrobiomunda dəyişikliklərin ev sahibinin genomik divergensiyasına təsirini aşkar etdi [22]. Bu onu göstərir ki, filosimbiozun passiv agentləri olmaqdansa, mikrob icmaları öz növbəsində filosimbiozun yaranmasına, saxlanmasına və ya parçalanmasına təsir göstərə biləcək ev sahibi genomik dəyişikliklərə səbəb olmaq potensialına malikdir.

Filosimbioz qeyri-filosimbiozdan ev sahibinin filogenetik və mikrobiom icma əlaqələri arasında əhəmiyyətli dərəcədə əlaqə ilə fərqlənsə də, universal deyil (§5) və buna görə də sınaqdan keçirilə bilən fərziyyə təmin edir. Filosimbiozun mövcudluğunun müəyyən edilməsi növ-növ birləşmələrinin təbiəti, filosimbiozu aparan seçici və ya neytral qüvvələr və ev sahibi və mikrob fenotipləri üzərində nümunənin nəticələri kimi ekoloji təkamül mexanizmlərinin əlavə tədqiqatlarından əvvəl ilk addımdır. . Əgər filosimbioz təkamül yolu ilə seçilən təzyiq nəticəsində yaranarsa, ev sahibinin müxtəlif ev sahibi nəsillərindən olan mikrobiomlara təkamül yolu ilə məlumatlı şəkildə məruz qalması nəticəsində ev sahibi və ya mikrob uyğunluğunda azalma gözlənilir. Filosimbiozla nəticələnən təkamül selektiv təzyiqlər mikrobiomun tərkibini tənzimləyən və ya ev sahibinin kolonizasiyasını gücləndirən mikrob xüsusiyyətlərinin yayılmasına səbəb ola bilər. Bu ümumi işıqda, ev sahibi və/və ya mikrob fenotipləri filosimbiotik birləşmələrə təsir etdikdə və ya təsirləndikdə “funksional filosimbioz”a istinad edirik.

Spesifik mikrobiom transplantasiyası təcrübələri funksional filosimbiozun aydınlaşdırılmasında faydalıdır. Laboratoriyada yetişdirilən dörd ev sahibi qrupda 24 növü əhatə edən geniş miqyaslı filosimbioz tədqiqatı (Nasonia eşşəkarısı, Drosophila milçəklər, ağcaqanadlar və Peromyscus maral siçanları) arasında bağırsaq mikrob icmalarının spesifik nəqli olduğunu nümayiş etdirdi Peromyscus növlər arasında nəql edilərkən quru maddənin həzm qabiliyyəti azaldı və qida qəbulu artdı Nasonia növlər sağ qalma müddətini yetkinlik yaşına qədər demək olar ki, yarıya endirmişdir [23]. Bundan əlavə, növlərarası mikrobiomlar daha baha başa gəlir Nasonia larva artımı və pupasiya növdaxili mikrobiomlarla müqayisədə [24]. Eynilə, iki vəhşi, simpatik arasında qarşılıqlı ana simbiont nəqli Ontofagus peyin böcəyi növləri gələcək nəslə qədər davam edən qeyri-doğma ev sahiblərində inkişaf ləngiməsinə və yüksək ölümə səbəb oldu [25]. Kollektiv olaraq, ev sahibinin fitnesinə təsir edən filosimbiotik assosiasiyalar ev sahiblərinin qeyri-doğma mikrobiomlara deyil, öz doğma mikrobiomlarına uyğunlaşdığına dair fərziyyəni dəstəkləyir, baxmayaraq ki, əsir və vəhşi ev sahibi populyasiyalarında bu assosiasiyaları və təsirləri təsdiqləmək üçün daha çox araşdırmaya ehtiyac var.

Ev sahibi növlər arasında hibridləşmə ev sahibi-mikrobiom uyğunsuzluğuna səbəb olur, çünki bir hibriddə müstəqil təkamülləşmiş ev sahibi genotiplərinin birləşdirilməsi ya müəyyən ev sahibləri üçün mikrob kolonizasiya üstünlüklərinin pozulmasına, ya da mikrobiomun sahib nəzarətinə səbəb ola bilər. Göstərildiyi kimi Nasonia [9], ev siçanları [26] və ağ balıq [27], hibridlərin valideyn mikrobiomuna nisbətən dəyişdirilmiş mikrobiomu var ki, bu da ev sahiblərinin mikrobiomlarını tənzimləmək qabiliyyətinin azaldığını və patogen mikrobların çiçəkləmə qabiliyyətinin artdığını göstərir. Ev sahibi-mikrobiom qarşılıqlı təsirindəki bu pozulmalar, növlər və ya populyasiyalar arasında çarpazlaşmanı azalda bilən immun disfunksiya, patoloji, toxunulmazlıq və sterillik [9,26] daxil olmaqla hibridlərdə uyğunlaşmayan fenotiplərlə əlaqələndirilə bilər. In Nasonia, yaşlı növlər cütü arasında hibridlərin ölümcülliyi mikrobsuz yetişdirmə yolu ilə xilas edilmiş və valideynlərdən seçilmiş bağırsaq bakteriyası növlərinin inokulumunu mikrobsuz hibridlərə verməklə bərpa edilmişdir [9]. Əksinə, gənc arasında hibridlər Nasonia növ cütünün dəyişdirilmiş mikrobiomu yox idi və funksional xərclərə məruz qalmadı. Kollektiv olaraq, növlərarası mikrobiom transplantasiyası təcrübələrinin və ev sahibinin hibridləşdirilməsi tədqiqatlarının nəticələri göstərir ki, ev sahibi növlər arasında ev sahibi-mikrobiom qarşılıqlı təsirləri növlər daxilində və arasında təkamül hadisələrinə təsir edən mühüm funksional nəticələrə səbəb ola bilər, o cümlədən ev sahibi populyasiyaların növlərə bölünməsi.

İndi filosimbiozu ümumiləşdirərək, aydınlıq üçün filosimbiozun nə olmadığını qısaca vurğulayırıq. Filosimbioz mütləq şaquli ötürülmə, qarşılıqlı əlaqə və ya birgə təkamül, kospesiasiya, birgə diversifikasiya və ya kokladogenez yolu ilə ortaq əcdaddan təkamüllə parçalanmağı nəzərdə tutmur. Bu proseslər filosimbioza gətirib çıxara bilsə də, model alternativ olaraq antaqonist qarşılıqlı təsirlər və/yaxud üfüqi mikrob ötürülməsi yolu ilə yarana bilər ki, bununla da sahiblər və ətraf mühit mikrobları arasında qarşılıqlı təsirlər hər nəsildə yenidən filosimbioz yaradır. Beləliklə, filosimbiozun empirik araşdırmaya məruz qalan müxtəlif əsasları var və o, ev sahibinin bütün ömrü boyu sabit olmaqdansa, müəyyən zaman və məkan nöqtələrində görünə bilər.

3. Filosimbiozun öyrənilməsi üçün praktiki təlimat

Filosimbiozun tədqiqləri yanaşma (keyfiyyət və kəmiyyət), metodologiya və statistik gücə görə dəyişir [18]. Beləliklə, filosimbiozu aşkar etmək üçün aydın, ardıcıl və möhkəm iş axını həm yeni gələnlər, həm də mütəxəssislər üçün arzuolunandır. Burada filosimbiozun tədqiqi üçün hərtərəfli iş axını təklif edirik (şəkil 1).

Şəkil 1. Filosimbioz analizləri üçün geniş istifadə olunan bioinformatik metodların ardıcıl icmalı. (Rəngli onlayn versiya.)

(a) Host taksonları və giriş məlumatları

Filosimbiozun aşkarlanması çoxsaylı taksonlar arasında təkrarlanmış nümunələrin toplanmasından ibarət olduğundan, həm statistik həssaslığın [28], həm də spesifikliyin [18] optimallaşdırılması, eləcə də ardıcıllıq seriyası effektlərinin minimuma endirilməsi səs-küy və siqnal arasında fərq qoymaq üçün çox vacibdir. Baxmayaraq ki, 2016-cı ildəki araşdırmamız dörd ağacın kökləndiyini göstərdi Nasonia növlər klada daxilində filosimbiozu aşkar etmək üçün kifayətdir [23], biz statistik gücün optimallaşdırılması üçün kifayət qədər replikaları və taksonları müəyyən etmək üçün müvafiq güc və təsir ölçüsü analizlərindən (mikrobioma məlumatları üçün [29]-da nəzərdən keçirilir) istifadə etməyi təklif edirik [28]. Növlər üzrə bir neçə fərddən nümunə götürmək mikrob icması əlaqələrində siqnaldan gələn səs-küyün həllinə kömək edəcək, lakin fərqlilik vaxtlarında dəyişə bilən ev sahibi qrupları arasında filosimbiozun öyrənilməsində növlərarası və növlərarası nümunələrin replikasiyalarının necə yaxşı istifadə edildiyinə dair əlavə araşdırma tələb olunur. Əgər varsa, oxşar nümunə növləri ilə uğurlu filosimbioz tədqiqatlarının eksperimental dizaynları da müvafiq olaraq uyğunlaşdırıla bilər [30]. Əvvəlki tədqiqatlar təqribən 0,3-100 Myr təkamül tarixini əhatə edən ev sahibi taksonlarında filosimbiozu uğurla aşkar etdi [21,23] və son ortaq əcdadın təsirindən sonra daha uzun müddətlərin filosimbiozun aşkarlanması əlavə araşdırma tələb edir. Ana növlərdən olan nukleotidlər və ya amin turşusu ardıcıllığı(lar)ı bootstrap [31] və ya digər ölçülər [32] ilə budaqlanan qovşaqlarda və bir neçə filogenetik nəticə çıxarma üsulları (məsələn, maksimum ehtimal [32] ilə etibarlı şəkildə dəstəklənən filogenetik və ya filogenomik ağac yaratmaq üçün istifadə edilə bilər. 33] və Bayes qənaəti [34]). Filosimbiozun qiymətləndirilməsi üçün dəqiq ev sahibinin filogenetik topologiyası vacib olduğundan, ağac uzun budaqlı cazibə kimi sistematik artefaktlardan azad olmalı və mümkün olduqda ev sahibinin filogenezində politomiyalar həll edilməlidir. Ev sahibinin filogeniyasını ardıcıl düzülmədən bərpa etmək üçün istifadə edilən üsullar geniş şəkildə nəzərdən keçirildiyinə görə [35], biz onları burada daha ətraflı müzakirə etməyəcəyik. Ev sahibi təkamül ağacı ilə ikili ev sahibi məsafələri də filogenetik ağacda bir cüt terminal qovşağını birləşdirən budaq uzunluqlarının cəmi kimi hesablanan kofenetik məsafələr kimi təqdim edilə bilər [36].

(b) Mikrobioma daxiletmə məlumatları

Filosimbioz analizi hər bir ana nəsildən mikrob müxtəlifliyi məlumatlarını tələb edir. Mikrob filogenetik marker genlərinin qısa oxunan ardıcıllığı (məsələn, 16S rRNA geni) mikrob profilinin yaradılması üçün ümumi və qənaətcildir. Emal edilmiş ardıcıl oxunuşlar iki cari üsuldan biri ilə təhlil edilə bilər. Birincisi, onlar müxtəlif ardıcıllıq kəsimlərində (məsələn, 97% və 99%) istinad ardıcıllığı verilənlər bazası ilə və/və ya olmadan əməliyyat taksonomik vahidlərinə (OTU) qruplaşdırıla bilər [37,38]. OTU klasterləşmə kəsikləri təkamül zamanı taksonlar arasında genetik məsafələri əks etdirir və filosimbiozun aşkarlanmasına təsir göstərə bilər [39] belə dəyişkənlik praktikada da müşahidə edilmişdir ([18]-də nəzərdən keçirilmişdir). İkincisi, oxunuşlar klasterləşmədən amplikon ardıcıllığı variantlarına (ASV) həll edilə bilər ki, bu da tək nukleotid həllini təklif edə bilər, baxmayaraq ki, ardıcıllıqla səhv nisbətləri nəzərə alınmalıdır [40]. Filosimbiozun qiymətləndirilməsində ən böyük həssaslıq üçün meta-omik məlumat dəstləri faydalıdır, çünki daha incə miqyaslı taksonomik və funksional profilləşdirmə əldə edilə bilər [41]. Metagenomik ardıcıllıq məlumatları viral filosimbiozu nümayiş etdirmək üçün istifadə edilmişdir Nasonia [42] həmçinin ev sahibi filogenezinin və ekologiyasının qeyri-insan, primat bağırsaq mikrobiomlarının tərkibinə və funksiyalarına müxtəlif təsirləri [43,44].

(c) Mikrob beta müxtəlifliyi tədbirləri

Ev sahibi nümunələri arasında mikrob tərkibində və strukturunda fərqlilikləri ölçən mikrob beta müxtəlifliyi şərti olaraq filosimbiozu ölçmək üçün istifadə olunur. Jaccard məsafəsi və Sørensen-Dice məsafəsi [45,46] kimi ikili ölçülər OTU varlıq/yoxluq məlumatları ilə hesablanır. OTU bolluğunun kəmiyyət deskriptorları həmçinin Motyka-dan əldə edilən Bray-Curtis fərqliliyi [47] daxil olmaqla beta müxtəlifliyini hesablaya bilər. və b.nin əmsalı [48]. Çəkili və çəkilməmiş unikal fraksiya (UniFrac) kimi filogeniyə əsaslanan metriklər mikrob icması fərqlərini hesablamaq üçün icmalar (nümunələr) arasında filogenetik məsafələrdən istifadə edir, ümumi icma məsafəsini hesablamaq üçün giriş kimi mikrob filogenetik ağacının istifadəsini tələb edir [49].

Beta müxtəliflik ölçüləri fərqliliyin müxtəlif aspektlərini əks etdirdiyinə görə, metrikanın seçimi tədqiqata xasdır və qismən öyrənilən nəsillərin mikrob tərkibindən və təkamül tarixindən asılıdır. Mövcudluq/yoxluğa əsaslanan ikili ölçülər nadir taksonların variasiyalarına daha həssasdır və nadir taksonların fərqli OTU-ların 90%-dən çoxunu təşkil etdiyi süngər mikrobiomlarının host spesifikliyini öyrənmək üçün tətbiq edilmişdir [50]. Binar ölçülər də son mikrob diversifikasiyasına həssas ola bilər, çünki bu yaxınlarda ayrılmış OTU-lar/ASV-lər daha uzun divergensiya tarixi olan OTU/ASV-lərlə eyni effekti verəcəkdir [39]. Bunun əksinə olaraq, kəmiyyət göstəriciləri bol taksonlardakı dəyişikliklərə daha həssasdır.Taksonomiyaya əsaslanan filosimbioz tədqiqatları [23,51-53] ilə yanaşı, metagenomik məlumatlara [42,43] kəmiyyət ölçüləri də tətbiq edilmişdir. UniFrac məsafələri [54] kimi OTU-lar arasında filogenetik əlaqələri nəzərə alan metriklər yarasalar [55], mərcanlar [20] və məməlilər [4,43] daxil olmaqla bir çox digər filosimbioz tədqiqatlarında tətbiq olunur.

Mikrobiomun fərqləndirilməsi və ya qiymətləndirilən ev sahibi nəsillərinin mikrob icmalarını əhəmiyyətli dərəcədə fərqləndirə bilmə xüsusiyyəti, filosimbioz üçün ilkin şərtdir və daha oxşar ev sahibi növlərin daha çox oxşar mikrobiomlara malik olduğuna dair filosimbioz proqnozunu qiymətləndirmədən əvvəl sınaqdan keçirilməlidir [20,23,51- 53]. Mikrobiomun fərqləndirilməsi beta müxtəlifliyi məlumatlarından və əsas koordinat analizi (PCoA) və qeyri-metrik çoxölçülü miqyaslama (NMDS) kimi təyinat planlarından istifadə edərək kateqoriyalı nümunə qruplaşdırma məlumatlarından vizuallaşdırıla bilər [56]. Bundan əlavə, mikrobiomun fərqləndirilməsi adətən qeyri-parametrik çoxdəyişənli analizlərdən, məsələn, oxşarlıqların təhlili (ANOSIM) [57] və permutasiya çoxdəyişənli variasiya analizinin variantları (PERMANOVA) [58] istifadə edilməklə əlavə qiymətləndirilə bilər. İntra- və interspesifik mikrob beta müxtəliflik məsafələrinin spesifik cüt müqayisələri də müvafiq qeyri-parametrik iki nümunəli test [23] ilə həyata keçirilə bilər.

(d) Filosimbiozun miqdarının müəyyən edilməsi

Filosimbiozun təyini ev sahibinin filogenetik əlaqələri və ev sahibi ilə əlaqəli mikrob icmasının məsafələri arasında əhəmiyyətli əlaqənin qiymətləndirilməsinə əsaslanır. Bu məqsədlə topoloji uyğunluq testləri birbaşa ev sahibi filogenetik ağacın topologiyalarını və mikrobiom dendroqramını müqayisə edir [23,42,51-53,59]. İerarxik dendroqram yaratmaq üçün bir neçə aqlomerativ iyerarxik klasterləşdirmə metodu ([56]-da nəzərdən keçirilir) mikrob beta müxtəlifliyi məsafələrini birləşdirə bilər. Ən çox istifadə edilən metod, hesablama ortası ilə çəkili olmayan cüt qrup metodu (UPGMA), onların orta fərqlilik dəyərlərindən cüt seçmə qruplaşdırılmasını həyata keçirir və bütün nümunələrə bərabər çəkilər verir [60]. Bağlantı klasterləşdirmə yanaşmaları ilə müqayisədə, UPGMA qruplar arasında əlaqələri fərdi nümunələrdən daha üstün tutur [56]. Bütün nümunələrə bərabər çəkilər təyin etməklə, UPGMA hər bir qrupdakı nümunələrin daha böyük istinad populyasiyasındakı qrupları təmsil etdiyini güman edir [56]. Beləliklə, o, nümunə ölçülərinə həssas ola bilər və bəzi qrupların həddindən artıq seçmə, bəzilərinin isə az seçmə olduğu balanssız məlumatlarla qeyri-sabit topologiyalar yarada bilər. Filogenetik cəhətdən xəbərdar olan balqabaq klasterləşdirmə metodu kimi daha yeni klasterləşdirmə üsulları mikrob filogenetik ağacındakı mövqelərinə əsasən nümunələr arasındakı məsafələri (beta müxtəliflik məsafələri arasındakı fərqlərdən çox) birbaşa hesablayır [61]. Ümumiyyətlə, klasterləşdirmə üsullarının filosimbiozun aşkarlanmasına təsiri əlavə araşdırma tələb edir.

Robinson-Fulds metrikası və daha möhkəm və həssas uyğun gələn klaster metrikası kimi topoloji müqayisə ölçüləri tez-tez filosimbiozu aşkar etmək üçün istifadə olunur [23,42,51,52,59,62]. Robinson-Fulds iki ağac arasındakı məsafəni bir topologiyanı digərinə çevirmək üçün tələb olunan ən kiçik əməliyyat sayı kimi təhlil edir [63], uyğun gələn klaster isə alt ağac səviyyəsində uyğunluğu nəzərdən keçirir və buna görə də kiçik topoloji dəyişikliklərin daha dəqiq qiymətləndirilməsidir. uyğunsuzluğa təsir göstərir [64]. Statistik əhəmiyyət (səh-dəyərlər) mikrobiom dendroqramından ekvivalent və ya daha çox konqruent filosimbiotik nümunələr verən 100 000 təsadüfi ikiləşən dendroqram topologiyalarının ehtimalını müəyyən etməklə qiymətləndirilmişdir [23]. İrəli getmək, konkret əlaqələri qoruyan təkmilləşdirilmiş randomizə üsulları yanlış pozitivlərin azaldılmasında faydalı olacaq. Normallaşdırılmış Robinson-Fulds və uyğun klaster xalları iki topologiya arasındakı fərqlərin sayının iki ağac üçün ümumi mümkün uyğunluq ballarına bölünməsi kimi hesablana bilər, normallaşdırılmış məsafələr 0-dan (tam uyğunluq) 1-ə (tam uyğunsuzluq) [23] ].

Matris korrelyasiya üsulları ev sahibi və mikrobial mənşəli məsafə matrisləri arasındakı oxşarlıqları müqayisə edərək filosimbiozu müəyyən edir. Filosimbioz tədqiqatlarında tətbiq edilən üsullara [20,21,39,50,65-72] permutasiya [73] və daha güclü Prokrust üst-üstə düşməsi ilə iki müstəqil matrisdən bütün müvafiq elementlər arasında xətti korrelyasiyanı statistik olaraq qiymətləndirən Mantel testinin variasiyaları daxildir. fərqlər assosiasiyasını minimuma endirmək üçün iki matrisi fırladan və uyğunlaşdıran yanaşma [74]. Qismən Mantel testləri [75] iki matris arasında korrelyasiyanı ölçərkən digər matrisdə təsvir edilən üçüncü dəyişənin təsirlərinə nəzarət etmək də mikrob icmaları və ev sahibi xüsusiyyətlərinin bir çox aspektləri, məsələn, filogeniya, eynilik, genetik məsafələr və coğrafi məsafələr [39,66,67,69].

Həm topologiyaya əsaslanan, həm də matrisa əsaslanan testlər müxtəlif empirik hallarda filosimbiozu aşkar etmək üçün kifayət qədər spesifik və həssas olsa da, onlar arasında bir neçə fərq var. Topoloji müqayisə ölçüləri budaq uzunluğu məlumatından istifadə etmir, çünki yoxdur a priori Hər bir nəsildə ev sahibinin təkamül sürətini güman etmək üçün səbəb mikrobiomda ekoloji icma dəyişikliyi nisbətlərinə bərabər olmalıdır. Həqiqətən, mikrobiomun dəyişmə sürətinin ev sahibinin genetik dəyişikliklərinin tədricən təkamülündən daha sürətli olacağı gözlənilir. Beləliklə, nisbi budaq uzunluqları olmayan topologiya testləri, ev sahibinin genetik fərqliliyinin mikrob icmasının fərqliliyi ilə birbaşa müqayisəsinə əsaslanan matris korrelyasiya metodlarına nisbətən mühafizəkardır. Simulyasiya təhlili, filosimbiozun ev sahibi xüsusiyyəti üçün mikrob üstünlükləri fərziyyəsinə əsaslandığı zaman Mantel testinin Robinson-Fulds metrikasından daha yüksək həssaslığa və gücə malik olduğunu irəli sürdü [19]. Bu nəticənin praktiki əhəmiyyəti aydın deyil, çünki filosimbioz mikrob kolonizasiyası üstünlüklərindən başqa səbəblərdən yaranacaq, məsələn, ev sahibi üstünlükləri, neytral proseslər və mikrob-mikrob qarşılıqlı əlaqəsi. Üstəlik, Mantel testi ilə daha həssas topologiyaya əsaslanan uyğunluq klaster məsafəsi arasındakı performans bu simulyasiyada qiymətləndirilməyib və bu cür müqayisələrin fərqli fikirlər verməsi ehtimalı var. Müxtəlif mümkün ssenarilər üzrə filosimbiozun ölçülməsi üsullarının I və II tip xəta dərəcələrinin sistematik müqayisəsi eksperimental dizayn və nəticələrin şərhinə kömək edəcəkdir. Beləliklə, təkmilləşdirilmiş filosimbiozun aşkarlanması üsullarının işlənib hazırlanması və tətbiqi üçün tədqiqat imkanları genişdir.

(e) Parametr seçimi

Filosimbiozun aşkarlanması OTU identifikasiyası kəsimi, beta müxtəliflik metrikası, klasterləşdirmə metodu və uyğunluq testi kimi müxtəlif parametrlərin seçilməsini əhatə edir ki, bunların hər birinin güclü tərəfləri və məhdudiyyətləri tədqiqat dizaynı və suallara görə dəyişir. Müxtəlif parametr birləşmələri eyni vaxtda sınaqdan keçirilə və müqayisə oluna bilsə də [39], bütün mümkün parametr birləşmələrindən yalnız bir neçəsi filosimbiozu aşkar etdiyi halda, seçilmiş parametrlərə münasibətdə nəticələrin ehtiyatla şərh edilməsini tövsiyə edirik. Əgər varsa, nəticələr eyni parametr birləşmələrindən istifadə edərək oxşar nümunə növləri ilə əvvəlki filosimbioz tədqiqatlarının nəticələri ilə də müqayisə edilməlidir. Eksperimental təkrarlama da filosimbiozu təsdiqləmək üçün lazımdır, xüsusən də ardıcıl olaraq aşkar edilmədikdə.

(f) Filogenetik müqayisəli üsullar

'Qohum növlərin ağacdan təsadüfi olaraq çəkilmiş növlərə bənzədiklərindən daha çox bir-birinə bənzəmə meyli' [76] kimi təyin olunan filogenetik siqnalın təkdəyişənli əlamətlərə (məsələn, mikrob alfa müxtəlifliyi) təsiri filosimbiozla paralel olaraq araşdırılmışdır. tədqiqatlar [66,67]. Pagel kimi filogenetik siqnal indeksləri λ [77] və Blomberq K [78] xüsusiyyətlərin təkamülünün təsadüfi Brown modelinə əsaslanır [79], lakin təbii seçməni nəzərə alan daha mürəkkəb modellərlə də istifadə edilə və müqayisə edilə bilər. Baxmayaraq ki, bu üsullar çoxdəyişənli məlumatlarda daha az istifadə olunur və filosimbiozu açıq şəkildə qiymətləndirmək üçün hələ də tətbiq edilməmişdir, onlar yalnız mikrob beta müxtəlifliyi üzrə ev sahibinin filogenetik siqnalını araşdırmaq üçün deyil, həm də filosimbiozla əlaqəli təkamül modellərini sınaqdan keçirmək üçün perspektivli alternativlərdir.

Filogenetik müstəqil təzadlar [79] və filogenetik ümumiləşdirilmiş xətti qarışıq modellər (pGLMMs) [80] kimi filogenetik müqayisəli üsullar məlum filogeniya və təkamül modeli nəzərə alınmaqla iki və ya daha çox diskret və ya davamlı əlamətlər arasında təkamül korrelyasiyasını proqnozlaşdırır. Bunlar filosimbioz tədqiqatlarına da inteqrasiya oluna bilər. Bu yaxınlarda pGLMM-lər mərcan alfa müxtəlifliyinə, kofilogenetik mərcan-bakteriya əlaqələrinə və alfa müxtəlifliyi ilə bakteriosin-produktorun nisbi bolluğu arasındakı əlaqələrə genişlik və koloniya ölçüsünün təsirini araşdırmaq üçün mərcan mikrobiomu [20] və ötücü lələk mikrobiomu tədqiqatlarında [71] tətbiq edilmişdir. bakteriya və keratinolitik lələklərə zərər verən bakteriyalar. Filosimbioz ekoloji (digər qüvvələr arasında) nəticəsində yarana bildiyi üçün bu üsullar filosimbiozun əsasını təşkil edən müxtəlif ekoloji qarşılıqlı əlaqəni başa düşməkdə faydalı ola bilər.

Ümumiyyətlə, meta-omika və xüsusiyyətlərin təkamülü təhlilləri filosimbioz üçün daha geniş tətbiq olunmağa başladıqca, gələcək filosimbioz tədqiqatlarının məcburi istiqamətlərindən biridir. silisiumda ev sahibinin filogeniyası, ev sahibi funksiyaları, mikrob müxtəlifliyi, mikrob funksiyaları, seçici qüvvələr və ətraf mühit amilləri arasındakı əlaqəni həll etmək üçün mikrob müxtəlifliyinə ev sahibinin filogenetik təsirlərindən kənara çıxmaqdır.

4. Filosimbiozun yayılması

Mikrobioma elminin əsas məqsədi müxtəlif sistemlər arasında müqayisə edilə bilən ümumi paradiqma və qaydaları tapmaqdır. Bu baxımdan, filosimbioz eukaryotik host sistemləri arasında tez-tez təkrarlanması səbəbindən vicdanlı bir tendensiya kimi ortaya çıxır (şəkil 2). Böcəklərdə filosimbiozun viromları daxildir Nasonia parazitoid zərgər arıları [42] və tarakanların, termitlərin [81], laboratoriyada yetişdirilən [23] və vəhşi ağcaqanadların [59] bağırsaq mikrobiomları, Sefalotlar tısbağa qarışqaları [39] və Apis sosial korbikulyar arılar [69]. In Drosophila milçəklər, filosimbioz nümunələri ya zəif dəstəklənir [23], ya da aşkar edilmir [82] laboratoriya ştammlarında və vəhşi populyasiyalarda.

Şəkil 2. Ev sahibi növlər, toxumalar, yaşayış yerləri və funksiyalar üzrə filosimbiozun reprezentativ müxtəlifliyi. Ulduzlar filosimbiozun qarışıq sübutu olan taksonları bildirir. (Rəngli onlayn versiya.)

Məməlilərin bağırsaq mikrobiomlarına dair ilk filosimbioz tədqiqatı [4] heyvan filogeniyasının və pəhrizinin bağırsaq mikrob icmasının fərqliliyinə təsirini nümayiş etdirdi [12,21,23,39,70,83]. Xüsusi heyvan qruplarının bağırsaq mikrobiomlarına diqqət yetirən tədqiqatlar Amerika pikalarında [51] və filosimbiozu aşkar etdi. Peromyscus maral siçanları [23,52], qərb sincaplarında filosimbioz yoxdur [84] və primatlar [17,43,44,70], yarasalar [55,85] və quşlarda filosimbiozun qarışıq sübutları [62,68,86,87] ]. Bu yaxınlarda aparılan geniş miqyaslı araşdırma, uçmayan məməlilərin bağırsaq mikrobiomlarına ev sahibinin filogenezinin və pəhrizinin yarasa və quşlarınkından daha güclü təsirini aşkar etdi [72]. Bağırsaq və ya nəcis mikrobiomları ilə yanaşı, heyvan səthi mikrobiomları da filosimbiotik birləşmələr üçün təhlil edilmişdir [88], məsələn, məməlilərin dərisində [53] və ötücü lələklərdə [71] meydana gəlir, lakin amfibiya dərisində deyil [3]. Filosimbioz ədəbiyyatının meta-analizi xarici ev sahibi bölmələrində yaşayanlara nisbətən daxili host bölmələrində yaşayan mikrobiomlarda tendensiyanın artdığını vurğuladı [18]. Bununla belə, tapıntı bağırsaqdakı filosimbiozun digər xarici ev sahibi bölmələri ilə əlaqəli araşdırılması ilə bağlı daha çox tədqiqatlar səbəbindən qeyri-obyektiv ola bilər.

Quru və əlaqəli yaşayış mühitlərindən başqa, su yaşayış mühitlərində filosimbiotik birliklərə olan tədqiqat marağı davamlı olaraq artır (şəkil 2), qlobal süngər mikrobiom tədqiqatlarını [67,89,90] və takson-xüsusi süngər tədqiqatlarını [50,65,66] əhatə edən qarışıq nəticələrə malikdir. . Süngərlərdə əvvəlki iki tədqiqat ev sahibinin filogeniyası və mikrob beta müxtəlifliyi arasında əhəmiyyətli korrelyasiya göstərdi [66,67]. Avstraliya skleraktinian mərcanlarında filosimbioz ümumiyyətlə toxuma və skelet bölmələrində müşahidə edilirdi, lakin əsasən ətraf mühitin təsirinə məruz qalan selik nümunələrində müşahidə olunmur [20], bu nümunəyə müxtəlif anatomik təsirlər təklif edir. Filosimbioz və ev sahibi pəhriz təsirləri, həmçinin Hind okeanının qərbindəki 44 balıq növünün dəri mikrobiomlarında baş verir [91], lakin simpatik kələm növlərinin səth mikrobiomlarında mövcud deyildir [92].

Bitkilərdə filosimbioz əsasən ev sahibinin filogenezinin və torpaq determinantlarının mikrob beta müxtəlifliyinə təsirini ayırd etmək üçün qiymətləndirilmişdir. Sahil tropik torpaq xronosekansı üzrə likopodların, qıjıların, gimnospermlərin və angiospermlərin müqayisəli təhlili göstərdi ki, ana filogenez torpaq yaşından sonra köklə əlaqəli bakteriya icmasının strukturunu formalaşdıran ikinci dərəcəli, lakin statistik cəhətdən əhəmiyyətli faktordur [15]. Daha taksonomik və/yaxud məkan baxımından məhdudlaşdırılmış tədqiqatlar, həmçinin rizobakteriya icmaları ilə Poaceae bitki bitkiləri [93], endosfer bakteriya birlikləri və 30 bitki növü [94], rizosferlə əlaqəli göbələk icmaları və karbohidrogenlə çirklənmiş torpaqlardan gələn söyüdlər [95], köklə əlaqəli eumikotan göbələk icmaları və Asteraceae quru otlaqda çiçəkli bitkilər [96], ektomikorizal göbələk icmaları və iynəyarpaqlı-enliyarpaqlı meşə ağacları [97] və ektomikorizal göbələk icmaları və Estoniya Salicaceae söyüdləri [98]. Əksinə, Brassicaceae ev sahibi filogeniyası ilə onların kök mikrobiomları arasında keyfiyyət uyğunsuzluğu müşahidə edilmişdir [99], digər bitki mikrobiomu tədqiqatlarında isə qeyri-statistik əhəmiyyətli filosimbiotik korrelyasiya bildirilmişdir [16,100].

5. Filosimbiozun əhəmiyyəti və gələcək istiqamətləri

Mikrobiom tədqiqatları multi-omika dövründə inqilab etməyə davam edəcək, burada məlumat daşqınları mikrob icmalarının və onlarla əlaqəli ev sahiblərinin geniş taksonomik, genetik və funksional tərkibinə misli görünməmiş anlayışlar əldə etməyə imkan verdi. Empirik və nəzəri tapıntıların bu cür geniş miqyaslı toplanması müxtəlif ev sahibi mikrobiom sistemlərində yeni fərziyyələrin, birləşdirici konsepsiyaların və çərçivələrin inkişafını gücləndirə bilər. Həqiqətən də, ev sahibi sistemlər arasında filosimbiozun təkrarlanması, filosimbiozun taksonomik diapazonunun məhdudiyyətlərini, eləcə də ətraf mühit parametrlərini (məsələn, torpaq və su xüsusiyyətləri) və ekoloji qarşılıqlı əlaqəni (məsələn, pəhriz və yırtıcı-ov) aşkar edə bilən həyat krallıqları arasında böyük müqayisəli tədqiqatlara imkan verir. əlaqələr) filosimbiozun harada və nə vaxt baş verdiyinin sərhədlərini müəyyən edən. Mikrobiom sahəsinin yeni sistemlərdə sınaqdan keçirilməsi üçün ümumi tendensiyaları varsa, filosimbioz bu vəziyyətə yaxşı hazırlaşır.

Filosimbioz, ev sahibinin filogenetik və mikrobiom icma əlaqələri arasında əhəmiyyətli dərəcədə əlaqəni xarakterizə etməklə özünü qeyri-filosimbiozdan fərqləndirir. O, sınaqdan keçirilə bilən fərziyyə təqdim edir, təbiətdə görünə bilən dəyişkənliyi əks etdirir və əlavə araşdırma tələb edən mexanizmlərlə izah oluna bilər. Filosimbiozun mövcud olub-olmamasının müəyyən edilməsi növ-növ birləşmələrinin təbiəti və filosimbiozun əsasını təşkil edən ekoloji və təkamül genetik proseslərin tip(lər)i kimi mexaniki təfərrüatlar üzrə əlavə araşdırmalardan əvvəl ilk addımdır.

Filosimbioz həm də ekologiya və təkamülün vahid mənzərəsini yaradır, burada ev sahibləri mikrob üzvləri təbii seçmə ilə genetik və fenotipik dəyişkənliyə kömək edə bilən icmalar və ya holobiontlardır. Bir neçə sual şərti olaraq nəzərdən qaçırıldı. Məsələn, ev sahibi allel tezliklərinə mikrob təsirləri hansılardır? Təbii populyasiyalarda ev sahibi gen axını mikrobiom dəyişikliyinə və filosimbioza təsir edirmi? Filosimbioz ev sahibinin spesifikasiyasının sürətlənməsi və ya yavaşlaması ilə əlaqələndirilirmi? Filosimbiozu tənzimləyən genetik və mexaniki amillər hansılardır və bu amillər populyasiyalar və ya növlər arasında necə dəyişir? Kollektiv olaraq, filosimbiozun qurulmasında ekoloji, təkamül və genetik qüvvələrin miqyasını müəyyən edən tədqiqatlar gələcək tədqiqatların mühüm sahəsini təşkil edir.

6. Nəticə

Filosimbioz ev sahibinin təkamül əlaqələri ilə mikrob müxtəlifliyi arasında kəmiyyətcə ölçülə bilən və canlı sistemlərdə tətbiq oluna bilən əlaqəni müəyyən edir. Bu sahədə tədqiqatlar çoxaldıqca, filosimbiozun qiymətləndirilməsi üçün tərif, konseptual çərçivə və iş prosesi filosimbiotik ev sahibi-mikrob qarşılıqlı təsirlərinin müəyyən edilməsini asanlaşdıracaq. Filosimbiozun gələcək səbəb-nəticə tədqiqatları təkamül, genetik və molekulyar əsasların daha da mexaniki anlayışını gətirəcəkdir. Biz irsiyyət üsulunu başa düşməyincə təkamül genetikasının heç bir yetkin nəzəriyyəsi mümkün olmadığı kimi, ev sahibi ilə əlaqəli mikrobiomlar üçün təkamül ekologiyasının heç bir yetkin prinsipi, biz ev sahibi mikrobiom birliklərini quran ümumi mexanizmləri başa düşməyincə mümkün görünmür.


Case Study I: Felsenstein-in ən pis vəziyyət ssenarisi

Hər şeydən çox, Felsensteinin 1985-ci ildə yazdığı “Filogeniyalar və müqayisəli üsul” məqaləsindən “ən pis vəziyyət ssenarisini” (şək. 5, 6 və 7-nin orijinalı bizim Şəkil 2) təsvir edən məşhur rəqəmlər silsiləsi idi. bioloqları ağac təfəkkürü ehtiyacına oyatdı və müasir müqayisəli biologiyada inqilaba başladı. İdeya sadədir: ortaq əcdad nəticəsində bir növ üzrə alınan ölçmələr digərində toplanan ölçülərdən müstəqil olmayacaq və xüsusən də, əgər iki növ yaxından əlaqəlidirsə. Bu qeyri-müstəqillik, əslində müstəqil şəkildə inkişaf edən əlamətlər arasında aşkar korrelyasiya yarada bilər. Personajların müstəqil olmamasının təsirini göstərmək üçün Felsenstein iki təbəqənin uzun budaqlarla ayrıldığı bir ssenari yaratdı (şək. 2). Sonra o, filogeniya boyunca BM prosesinə uyğun olaraq əlamətləri inkişaf etdirdi, əlamətlər arasında təkamül kovariasiyasının olmamasına baxmayaraq, Adi Ən Kiçik Kvadratlardan (OLS) istifadə edərək əhəmiyyətli bir reqressiya yamacını bərpa etdi.

Felsenstein-in ən pis vəziyyət ssenarisi (Felsenstein 1985) Maddison və FitzJohn tərəfindən müəyyən edilmiş problemə tamamilə bənzəyir. Burada biz Felsenstein-in orijinal generasiya prosesini sadə BM-dən, A) BM-yə, iki təbəqədən birinin gövdə budağında baş verən tək partlama ilə dəyişdiririk (şaquli tire ilə göstərilir). B) Xüsusiyyət dəyərlərinin paylanması Felsenstein-in orijinal ssenarisinə çox oxşar rəqəm yaradır, lakin nəticələnir C) təxmin edilən BM prosesi ilə yaxşı təsvir olunmayan tək kontrast (qara) və bununla da PIC Y və əhəmiyyətli reqressiya yaradır. PIC X (nöqtəli xətt) həm X, həm də Y növbəsində və BM paylamalarının korrelyasiyasız olmasına baxmayaraq.D) Dəyişmə dispersiyasının BM dispersiyasına nisbəti artdıqca, əhəmiyyətli nəticə qaytaran kontrast reqressiyaların nisbəti kəskin şəkildə artır (hər bir nöqtə sabit filogeniya üçün 200 simulyasiyanı təmsil edir, həm BM prosesi, həm də yerdəyişmədən təsadüfi çəkiliş ilə). paylanma hər iki əlamət üçün bərabər dispersiya ilə korrelyasiya olunmur). IC BM ilə uyğun gələn tək hadisələri korrektə etsə də, müqayisəli təhlillərdə əhəmiyyətli nəticələrə səbəb olan dramatik tək hadisələrin daha ümumi fenomeni üçün düzəliş etmir. Qeyd edək ki, növlərin müstəqil olmaması məsələ deyil.

Felsenstein-in ən pis vəziyyət ssenarisi (Felsenstein 1985) Maddison və FitzJohn tərəfindən müəyyən edilmiş problemə tamamilə bənzəyir. Burada biz Felsenstein-in orijinal generasiya prosesini sadə BM-dən, A) BM-yə, iki təbəqədən birinin gövdə budağında baş verən tək partlama ilə dəyişdiririk (şaquli tire ilə göstərilir). B) Xüsusiyyət dəyərlərinin paylanması Felsenstein-in orijinal ssenarisinə çox oxşar rəqəm yaradır, lakin nəticələnir C) təxmin edilən BM prosesi ilə yaxşı təsvir olunmayan tək kontrast (qara) və bununla da PIC Y və əhəmiyyətli reqressiya yaradır. PIC X (nöqtəli xətt) həm X, həm də Y növbəsində və BM paylamalarının korrelyasiyasız olmasına baxmayaraq. D) Dəyişmə dispersiyasının BM dispersiyasına nisbəti artdıqca, əhəmiyyətli nəticə qaytaran kontrast reqressiyaların nisbəti kəskin şəkildə artır (hər bir nöqtə sabit filogeniya üçün 200 simulyasiyanı təmsil edir, həm BM prosesi, həm də yerdəyişmədən təsadüfi çəkiliş ilə). paylanma hər iki əlamət üçün bərabər dispersiya ilə korrelyasiyasızdır). IC BM ilə uyğun gələn tək hadisələri korrektə etsə də, müqayisəli təhlillərdə əhəmiyyətli nəticələrə səbəb olan dramatik tək hadisələrin daha ümumi fenomeni üçün düzəliş etmir. Qeyd edək ki, növlərin müstəqil olmaması məsələ deyil.

Digər tədqiqatçılar 1980-ci illərin əvvəllərində oxşar anlayışlara toxunsalar da (məsələn, Clutton-Brock and Harvey 1980 Mace et al. 1981 Ridley 1983 Stearns 1983 Cheverud et al. 1985), bunların heç biri (Felsenstein-in təqdimatı kimi) geniş təsirə malik olmadı. məsələn, Losos 2011, o, Amerika Təbiətşünaslar Cəmiyyətinə prezidentlik müraciətində rəqəmləri və müşayiət olunan əsaslandırmaları təkrarlayır). Problem o qədər aydındır - ikivariantlı süjetin müxtəlif hissələrində toplanan müxtəlif təbəqələrdən alınan məlumatlar - sadəcə baxmaq lazımdır. Və əlbəttə ki, onun təklif etdiyi “müstəqil ziddiyyətlər” (IC) həlli geniş şəkildə qəbul edilsə də, biz şübhələnirik ki, Felsenstein problemi ifadə etdiyi aydınlıq onun məqaləsini bioloji təhsilin əlamətdar əlaməti və ağacın əhəmiyyətinin sübutu olaraq saxlayıb. -təfəkkür etmək, hətta onun metodu əsasən ən kiçik kvadratlarla əvəz olunduğu halda (Grafen 1989) (Əgər BM xətaların kovariansını modelləşdirmək üçün istifadə olunursa, IC ilə eynidir: Rohlf 2001 Blomberg et al. 2012) və qarışıq model (Lynch 1991) Housworth et al. 2004 Hadfield and Nakagawa 2010) yanaşmalar.

Bununla belə, bu hekayənin mühüm bir hissəsi tez-tez gözdən qaçırılır: Felsenstein həmçinin qeyd etdi ki, əgər "xarakterlər hazırkı mühitdə təbii seçimə mahiyyətcə dərhal reaksiya verirlərsə, filogenetik ətalət mahiyyətcə yoxdursa" müstəqillik problemi baş vermir (səh. 6). . Bu şərhə baxmayaraq, onun arqumentinin ümumi yanlış anlaşılması filogenetik strukturlaşdırılmış məlumatların filogenetik olmayan reqressiyasına xas olan problemin növlərin müstəqil olmamasıdır. Əslində, məlumatların müstəqilliyi standart (qeyri-filogenetik) xətti reqressiyanın heç bir fərziyyəsi deyil. Əksinə, standart xətti reqressiya güman edir ki, səhvlər quraşdırılmış model müstəqildir və eyni şəkildə paylanır (i.i.d.). Nəticədə, "filogenetik korreksiyanın" bir çox tətbiqi nöqtəni itirmiş kimi görünür (Revell 2010 Hansen and Bartoszek 2012): əgər məlumat dəstindəki bütün filogenetik siqnal proqnozlaşdırıcı xüsusiyyətdə mövcuddursa və səhvlər iiddirsə, o zaman heç bir filogenetik korreksiyaya ehtiyac yoxdur (Rohlf 2001, 2006). (Lakin bu vəziyyəti ilk növbədə müəyyən etmək üçün demək olar ki, həmişə filogenetik analizlərə ehtiyac var.)

Felsenstein-in nə olduğunu təklif edirik prima facie Arqument o qədər inandırıcı idi ki, bioloqların intuisiyasına müraciət etdi ki, bir çox böyük orqanizm qrupları bir çox potensial idiosinkratik yollarla fərqlidirlər (Vermeij 2006). Qeyri-filogenetik reqressiya təhlilində tapılan əlamətlər arasında görünən əlaqə sadəcə olaraq siniflər arasındakı bu idiosinkratik fərqlərin nəticəsidirsə, onda səhvlərin olub-olmamasının sırf statistik mülahizəsindən asılı olmayaraq, biz təkrarlanmamış məlumatlardan əlaqə çıxarmış olarıq (Nee et al. 1996). IIdir

Burada, IC və Filogenetik Ümumiləşdirilmiş Ən Kiçik Kvadratların (PGLS) bizim düşündüyümüz problemi tamamilə həll etmədiyini nümayiş etdirmək üçün Felsenstein-in ən pis vəziyyət ssenarisini nəzərdən keçiririk - bu üsullar hələ də tək təkamül hadisələrinə həssasdır. Bunu nümayiş etdirmək üçün biz Felsenstein-in orijinal nümunəsinə kiçik bir bükülmə əlavə edirik. Birincisi, biz 1985-ci il məqaləsində olduğu kimi, hər biri daxili həll edilməmiş iki təbəqədən ibarət bir filogeniyadan istifadə etdik. Yeganə filogenetik quruluşun ən dərin parçalanmadan qaynaqlanan quruluş olduğunu vurğulayırıq. Sonra biz müstəqil BM prosesləri altında hər birinin təkamül sürəti ( ⁠|$sigma^2$|⁠ ) 1 olan iki əlaməti təqlid etdik. Bununla belə, iki təbəqədən birinin gövdə budağında müəyyən bir nöqtədə tək təkamülü təqdim edirik. “hadisə” – yəni, nəslin fenotipində dramatik dəyişiklik – korrelyasiya olunmamış fərqlər və |$sigma^2$|⁠-in skalyar çoxluğu olan bərabər dispersiyalarla çoxdəyişənli normal paylanmadan götürülür. Nəticə etibarilə məlumatların yayılması Felsenstein-in ən pis ssenarisinə çox oxşar bir vəziyyəti təklif edir - və şübhələndiyimiz şey, əksər bioloqların tələbələrinə filogeniyaya məhəl qoymamağın təhlükələri barədə xəbərdarlıq etdikləri zaman nəzərdə tutduqları problem növüdür.

Ümid etmək olardı ki, bizim “filogenez üçün korrektə” alətlərimiz nümunəmizdəki iki əlamət arasındakı zahirən güclü əlaqənin yalnız bir təzadla idarə olunduğunu başa düşəcək. Lakin bu, belə deyil. Bu tək kontrast, yerdəyişmənin ölçüsü artdıqca əhəmiyyət kəsb edən çox yüksək leverajlı statistik göstərici ilə nəticələnir (Şəkil 2). Eyni məşqi daha filogenetik strukturlaşdırılmış məlumatlarla təkrarlaya bilərik (burada iki maraq dairəsi bir Yule prosesindən sonra tam ikiləşir) və eyni nəticələr əldə edə bilərik (Şəkil 2, http://dx.doi saytında Dryad-da mövcud olan Əlavə Materiala baxın. org/10.5061/dryad.p8066hd). Bu, narahatedicidir, çünki intuisiyamız bu iki əlamət arasında səbəb əlaqəsi üçün inandırıcı dəlillərimizin olmadığını göstərir (yəni, yalnız bu əlaqədən bir xüsusiyyətin digərinə uyğunlaşma olduğuna inanmaq üçün çox az səbəb var).

İntuisiyanın bizə səbəbli nəticə çıxarmaq üçün təhlükəli vəziyyət olduğunu izah edə biləcək daha yaxşı modellər toplusunu necə formalaşdırmaq olar? Biz bunu başqa bir filogenetik cəhətdən ağlabatan modeli daxil etməklə edə bilərik: bu əlamət korrelyasiyaları, qalan budaqlarda əlamətlərin təkamülünü modelləşdirmək üçün istifadə ediləndən fərqli bir paylanmadan alınan bir təsadüfi yerdəyişmə nəticəsində yaranır.

Felsenstein-in çoxvariantlı BM (mvBM) ssenarisindən tamamilə fərqli bir vəziyyəti nəzərdən keçirək. Burada əlamətlər mvBM tərəfindən təkamül etmir, əksinə bir nöqtədə dəyişikliyə məruz qalır (bəlkə də bir təbəqənin yeni mühiti işğal etdiyi qədim dağılma hadisəsi). Belə bir ssenaridə yalnız filogeniyanı, sözügedən hadisənin hər iki tərəfində müəyyən bir növün mövcud olduğu qədər nəzərə almalıyıq. Sonra iki statistik model qura bilərik: xətti reqressiya modeli və tək hadisə modeli.

Alternativ olaraq, |$X$| və |$Y$| bir-biri ilə ümumiyyətlə bağlı olmaya bilər. Əksinə, onlar |$E1$|⁠ və |$E2$|⁠ ilə işarələnmiş tək təsadüfi təkamül hadisələrinin məhsulu ola bilər ki, bu da iki təbəqəni ayıran budaqda baş verir.

Xətti reqressiya və tək hadisə modelləri uclarda əlamət məlumatlarının potensial olaraq çox fərqli paylanmasına səbəb olur. Məsələn, tək hadisə modeli altında Y-nin paylanması |$L_ hesablandıqdan sonra şərti olaraq X-dən müstəqildir., eta_Y, eta_$| - tez-tez bu iki modelin model seçimi ilə asanlıqla fərqləndirilməsi ilə nəticələnəcək sınaqdan keçirilə bilən empirik proqnoz. Lakin tək hadisə modelini bir ehtimal kimi nəzərdən keçirməmək problemdir: hətta iki davamlı əlamətin sadə halı üçün biz tək hadisə modeli altında simulyasiya edilmiş məlumatların OLS, PGLS və IC üçün nə qədər asan reqressiya ilə nəticələnə biləcəyini göstərdik. səhvlərin model və filogeniya ilə bağlı müstəqil və ya filogenetik korrelyasiya kimi simulyasiya edilməsindən asılı olmayaraq reqressiyalar. Biz həmçinin qeyd edirik ki, |$lambda$|-nın qiymətləndirilməsi səhvlər üçün transformasiya (Pagel 1999 Freckleton et al. 2002) analizi |$lambda$|-nin təxmini dəyərini xilas etməyəcək. 0 ilə 1 arasında olacaq və biz bu daha ekstremal halların (müvafiq olaraq OLS və IC) həssas olduğunu gördük.

Biri iddia edə bilər ki, təsvir etdiyimiz vəziyyət BM təkamül modelinin fərziyyəsinin pozulmasıdır və bu, əlbəttə ki, düzgün olardı (həmçinin Maddison and FitzJohn 2015-ə baxın). Həqiqətən, onilliklərdir ki, təzadların i.i.d. IC-dən istifadə edərək təhlil apardıqdan sonra (Garland et al. 1992 Purvis and Rambaut 1995 Slater and Pennell 2013 Pennell et al. 2015) və bir çox tədqiqatçılar reqressiyalardan kənar təzadları aradan qaldırmaqda Jones və Purvis (1997) nin ardınca getmişlər. Felsenstein öz metodunda bu xüsusi zəifliyi tanıdı və əsas modelin “gələcək inkişaf üçün aşkar nöqtə” olduğunu düzgün proqnozlaşdırdı (səh. 14). Baxmayaraq ki, bu gün uyğunlaşma dəyişikliklərinə imkan verən bəziləri də daxil olmaqla seçmək üçün daha geniş müqayisəli modellərimiz var, əksər davamlı xarakter modelləri Qauss modelləridir (məsələn, Pagel 1999 Blomberg et al. 2003 Butler and King 2004 O'Meara et al. 2006 Eastman et al. 2011 Beaulieu et al. 2012 Uyeda and Harmon 2014) və fenotiplərdə kəskin, fasiləsiz dəyişiklikləri qəbul etmir. Yalnız bu yaxınlarda modellərin alternativ sinifləri nəzərdən keçirilir (Landis et al. 2012 Elliot and Mooers 2014 Schraiber and Landis 2015 Blomberg 2017 Boucher et al. 2017 Duchen et al. 2017). Bu digər model növlərinin nadir, tək hadisələri kifayət qədər hesablaya bilib-bilməyəcəyi növbəti bölmədə araşdırılacaq.

Bununla belə, burada əsas məqsədimiz Felsenstein arqumentini bu qədər intuitiv edən fenomenin i.i.d.-nin pozulması olmadığını söyləməkdir. səhvlər, əksinə, tək bir budaqda təkrarlanmayan fərqlərin, əlamətlər arasında səbəb əlaqəsinin yalnız zəif sübutunu təmin etdiyinin bioloji intuitiv dərk edilməsi. Bundan əlavə, bizim “tək hadisələr” modelimiz kimi bu cür ssenariləri həqiqətən təsvir edən modellər müqayisəli təhlillərdə nadir hallarda nəzərə alınır. Etiraf etmək lazımdır ki, bu cür modelləri Felsenstein ssenarisindən daha mürəkkəb bioloji real hadisələrə uyğunlaşdırmaq hadisələrin yerini və sayını təxmin etməyi tələb edəcək və buna görə də biz “tək hadisələr” modelimizə ilk növbədə Felsenşteynin düşüncə təcrübəsinə illüstrativ alternativ həll kimi baxırıq. Buna baxmayaraq, misal göstərir ki, filogeniya əlamətlər arasında mənalı assosiasiyaların çıxarılmasına çətinlik yaradır, çünki o, səhvləri qeyri-müstəqil göstərdiyinə görə deyil, filogeniyanın strukturu qədim, potensial olaraq bilinməyən səbəb amillərinə imkan verir (bunlar az və ya hətta tək ola bilər) əlamətlər arasında geniş əlaqə yaratmaq. Davamlı əlamətlər halında belə, mənalı bir əlaqə üçün sübut kimi bu assosiasiyaların etibarlılığını qiymətləndirmək, Maddison və FitzJohn (2015) tərəfindən diskret xarakter korrelyasiyaları vəziyyətində müəyyən edilmiş həll olunmamış problemdir (Nəsəs Tədqiqatında daha ətraflı izah edəcəyik). III).


Mühafizə biologiyasında müqayisəli metod

Filogenetik müqayisəli yanaşma növlər arasında əlamətlər arasındakı əlaqəni təhlil etmək üçün statistik bir üsuldur. Təkamül biologiyasında inqilab etsə də, qorunma biologiyası üçün işləyə bilərmi? Müqayisəli metodun tərəfdarları ümid edirlər ki, o, mühafizədə ümumi mexanizmləri aşkar edəcək, mühafizə tədqiqatlarına prioritet vermək üçün qısa yollar verəcək və gələcəkdə hansı növlərin problem yaşayacağını (və ya yaradacağını) proqnozlaşdırmağa imkan verəcək. Burada qeyd olunan idarəetmə məqsədlərinə nail olub-olmadığını soruşuruq. Belə qənaətə gəlirik ki, müqayisəli üsullar mühafizənin əsasını təşkil edən ekoloji mexanizmlər üzrə tədqiqatları stimullaşdırır və problemli növlərin qabaqcadan yoxlanılması üçün məlumat verir. Lakin nəsli kəsilmə riskinin müqayisəli təhlilləri bu günə qədər nəsli kəsilməkdə olan xüsusi növlərin qorunması üçün qısa yollar təmin etmək üçün çox geniş əhatə dairəsinə malikdir. Mühafizə problemlərinə həssaslığın nisbətləri çox vaxt takson, region və təhlükəyə xasdır, ona görə də modellər maksimum praktiki istifadə üçün dar çərçivədə yönəldilməlidir.



Şərhlər:

  1. Goldwyn

    Siz tamamilə haqlısınız. Bunda da yaxşı bir şey düşünülür, mən dəstəkləyirəm.

  2. Dagwood

    Düşünürəm ki, yaxşı fikirdir.

  3. Zulushura

    Fikrinizi tam olaraq bölüşürəm. Əla fikirdir, sizinlə razıyam.



Mesaj yazmaq