Məlumat

Pop2-dən pop1-ə miqrasiya ilə pop1-dən pop2-yə keçidi ayırd edə bilən xülasə statistikası

Pop2-dən pop1-ə miqrasiya ilə pop1-dən pop2-yə keçidi ayırd edə bilən xülasə statistikası



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Bir müddət əvvəl ayrılan iki bacı populyasiyanı nəzərə alsaq, pop2-nin pop1-ə köçdüyünü və orada çoxaldığını və pop1-dəkilərə bənzər ardıcıl seqmentlərlə nəsillər verdiyini, lakin pop2-də olmadığını söyləyin. İki populyasiyanın nə qədər oxşar olduğunu tapmaq üçün statistik məlumatlar var; an üçün, orta dxy iki bacı populyasiya arasında cüt ardıcıllıq fərqlərinin sayının ortasını alır. Deyək ki, əgər miqrasiya yoxdursa, uzunluğu 10000 olan lokusda orta dxy 100-dür. Sonra miqrasiya ilə, deyək ki, həmin lokusda orta dxy 300-dür. Miqrasiya olmadığına dair sıfır fərziyyəsi altında mümkün olmayan dxy-nin aşkarlanması miqrasiya və çarpazlaşmanın baş verdiyini göstərir.

Mən bir müddətdir ki, pop2-dən pop1-ə miqrasiya ilə pop1-dən pop2-yə miqrasiyanı ayırd edə biləcək ümumi statistikanın olub-olmaması barədə düşünürdüm (bu hadisələrdən yalnız birinin baş verdiyini nəzərə alsaq). Belə statistika varmı? Ümumiliyi itirmədən pop2 üzvlərinin pop1-ə köçdüyünü fərz edin. Bundan sonra pop1 heç bir miqrasiya baş vermədiyi ilə müqayisədə pop2-yə daha çox bənzəyən üzvlərə sahib olacaq, lakin pop2 heç bir miqrasiya olmamış kimi olacaq.

Miqrasiya olmayan populyasiyanın simulyasiyalarını həyata keçirsək, pi və # ayıran saytların bəzi dəyərini görəcəyimizi gözləyə bilərik. Bu ölçülər pop2 pop1-ə köçdükdə pop1-də fərqli ola bilər; pop1-in bəzi üzvləri pop2-də olmayan SNP-lərə sahib olacaq və beləliklə, pop1-də heç bir miqrasiya altında gözlənilən pi və ss ilə müqayisədə daha çox genetik variasiya (daha yüksək pi və ss) olacaq. Beləliklə, dxy deyə bilər ki, pop1 və pop2 arasında null fərziyyə altında gözlənilməyən bəzi oxşarlıq var və sonra pi və ya ss ikisindən hansının gözləniləndən daha yüksək genetik variasiyaya malik olduğunu deyə bilər. Dxy və pi-dən asılı olan bəzi statistika pop1-dən pop2-yə miqrasiya ilə pop2-dən pop1-ə miqrasiyanı fərqləndirə bilərmi?


Bəli, miqrantlar genetik müxtəliflik nümunələrini təsir edir

İmmiqrantlar daha yüksək effektiv əhali sayına və buna görə də daha yüksək genetik müxtəlifliyə nail olurlar. Onlar saytın tezlik spektrinə də təsir edəcək və mən gözləyərdim ki, miqrantlar kifayət qədər çox olarsa, onlar müsbət Tajima-nın D.

Buna görə də, biristiqamətli miqrasiya mütləq populyasiyalar arasında genetik variasiya modellərindəki fərqlərə səbəb olacaqdır (bu, ərazi tezliyi spektrinin hər hansı ümumi statistikası ilə ölçülə bilər).

İstiqamətli seçimi aşkar etmək üçün mövcud üsullar

Mən heç vaxt belə bir nəticə çıxarmaq məcburiyyətində qalmamışam, ona görə də mövcud texnikaları yaxşı nəzərdən keçirə bilmirəm.

Siz yəqin ki, Slatkin və Maddison 1998-i və daha da əhəmiyyətlisi Beerli və Felsenstein 2001-i oxumalısınız. Beerli və Felsenstein 2001-ə 1341 dəfə istinad edilib və siz yəqin ki, bu sənədlərdən bəzilərinin daha yeni metodlar təklif edib-etmədiyini tez görməlisiniz. Con Novembrenin hər hansı iki əhali arasında miqrasiya nisbətini necə qiymətləndirmək barədə çox maraqlı işi var (məsələn, Novembre və Stephens 2008). Ola bilsin ki, probleminiz üçün maraqlı bir şey edib.

Hansı miqrasiyanın ən çox ehtimal olunduğunu anlamaq üçün hər zaman Təxmini Bayes hesablamasından istifadə edə bilərsiniz (ABC; misal üçün Cefri Jensenin populyasiya genetikasında ABC ilə nəticələrinə dair işinə baxın). Kifayət qədər sadə bir modellə yaxşı ABC alqoritmi o qədər də uzun deyil (yaxşı hesablama resursları ilə). O zaman sual rədd etmə alqoritmi üçün hansı statistik(lər)dən istifadə etməkdir. Yenə də, bir sıra potensial faydalı statistik məlumatlar əldə etmək üçün mövcud ədəbiyyata nəzər salmalısınız.


Klinik və ətraf mühitin genotipik təhlili Cryptococcus neoformans Braziliyadan gələn təcridlər VNB izolatlarının mövcudluğunu və bioloji amillərlə əlaqəni ortaya qoyur

Əlaqələr Yoluxucu Xəstəliklər Departamenti, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya, Klinik Patologiya şöbəsi, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya, Molekulyar Mikologiya Tədqiqat Laboratoriyası, Yoluxucu Xəstəliklər və Mikrobiologiya Mərkəzi, Mari Bəşir İnkişaf etməkdə olan Yoluxucu Xəstəliklər İnstitutu, Sydneyse Tibb Məktəbi-Westmead Xəstəxanası, Sidney Universiteti, Westmead Tibbi Araşdırmalar İnstitutu, Sidney, Avstraliya

Rolların tədqiqi, metodologiyası

Yoluxucu Xəstəliklər Departamenti, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya

Rolların Metodologiyası, Qiymətləndirmə

Yoluxucu Xəstəliklər Departamenti, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya

Yoluxucu Xəstəliklər Departamenti, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya

Rolların tədqiqi, metodologiyası

Yoluxucu Xəstəliklər Departamenti, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya

Biyotibb şöbəsi, Piaui Federal Universiteti, Parnaíba, Braziliya

Rolların Metodologiyası, Vizuallaşdırma

Yoluxucu Xəstəliklər Departamenti, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya

Rolların tədqiqi, metodologiyası

Yoluxucu Xəstəliklər Departamenti, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya

Rolların Metodologiyası, Vizuallaşdırma

Yoluxucu Xəstəliklər Departamenti, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya

Rolların tədqiqi, metodologiyası

Yoluxucu Xəstəliklər Departamenti, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya

Rolların Metodologiyası, Proqram təminatı

İmmunologiya Laboratoriyası, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya

Rollar Formal təhlil, Metodologiya, Proqram təminatı

İmmunologiya Laboratoriyası, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya

İmmunologiya Laboratoriyası, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya

Rolların Metodologiyası, Yazı – baxış və redaktə

Əlaqədar Molekulyar Mikologiya Tədqiqat Laboratoriyası, Yoluxucu Xəstəliklər və Mikrobiologiya Mərkəzi, Mari Bəşir İnkişaf etməkdə olan Yoluxucu Xəstəliklər və Biotəhlükəsizlik İnstitutu, Sidney Tibb Məktəbi-Westmead Xəstəxanası, Sidney Universiteti, Westmead Tibbi Araşdırmalar İnstitutu, Sidney, Avstraliya

Rolların Konseptuallaşdırılması, Maliyyələşdirmənin əldə edilməsi, Layihənin idarə edilməsi, Resurslar, Nəzarət, Yazı – orijinal layihə, Yazı – nəzərdən keçirmə və redaktə

Yoluxucu Xəstəliklər Departamenti, Trianqulo Mineiro Federal Universiteti, Uberaba, Braziliya


1. GİRİŞ

Bioloqlar üçün əlçatan olan genetik məlumatların müntəzəm artması ilə ayaqlaşmaq üçün populyasiyanın genetik nəticə çıxarması üçün hesablama metodologiyaları daim və sürətlə inkişaf etdirilir. Təxmini Bayes hesablaması (ABC Beaumont et al., 2002) kimi simulyasiyaya əsaslanan ehtimaldan azad üsullar, model ehtimallarının hesablanmasının çətin olduğu və kütləvi simulyasiyalarla təxmin edilməli olduğu Bayes mühitində model əsaslı nəticə çıxarmaq üçün mükəmməl yanaşmanı təmsil edir. Böyük çevikliyinə görə, ABC metodları fərqlilik hadisələri, populyasiya ölçüsü dəyişiklikləri və genetik qarışıq və ya miqrasiya hadisələrinin şübhələndiyi populyasiyaların və növlərin tarixinin mürəkkəb modellərinin (bundan sonra ssenarilər) təhlili üçün yaxşı uyğunlaşdırılmışdır. nəzərdən Beaumont, 2010 Bertorelle et al., 2010 Csilléry et al., 2010). Növbəti nəsil sekvensiya (NGS) texnologiyalarının meydana çıxması ilə populyasiyanın genetik məlumat dəstləri (həm genotiplənmiş lokusların sayı, həm də genetik olaraq xarakterizə edilən populyasiyaların sayı baxımından) kəskin şəkildə böyüdü, beləliklə, ABC istifadəçiləri iki əsas problemlə üzləşdilər: (i ) “ənənəvi” ABC metodları üçün tələb olunduğu kimi, istinad cədvəlini təşkil edən kütləvi sayda böyük məlumat dəstlərinin simulyasiyası geniş hesablama resursları olmadan qadağan edilir və (ii) çıxarmaq üçün istifadə edilən müstəqil olmayan statistik məlumatların sayında əhəmiyyətli artım. Genetik məlumatlardan alınan məlumatlar (NGS olmayan məlumatlar üçün də keçərli olan məsələ) müxtəlif statistik problemlər yaradır, o cümlədən “ölçülülük lənəti” və nəticədə yekun statistikanın sayı artdıqca nəticə çıxarmaların dəqiqliyi azalır (məsələn, Beaumont, 2010). ABC üçün ölçülərin azaldılması və xüsusiyyət seçiminə çox səy göstərilsə də (Blum et al., 2013 Estoup et al., 2012-də nəzərdən keçirilmişdir), qalan xülasələr məlumatlardan kifayət qədər məlumat əldə edə bilməsə, ölçünün azaldılması məlumat itkisinə səbəb ola bilər. .

Bu kontekstdə nəzarət edilən maşın öyrənməsi (SML) metodları statistik nəticə çıxarmaq üçün cəlbedici həllər təqdim edir. SML metodları, həqiqi cavab dəyərləri məlum olan etiketli simulyasiya edilmiş məlumat nümunələrinin təlim dəstindən istifadə etməklə yeni məlumat nöqtələrini proqnozlaşdırmağa imkan verir. Bu məlumat strukturu ABC istinad cədvəlini xatırladır. SML metodlarının simulyasiyadan müşahidə olunan məlumatlar üçün stand-in kimi istifadə etmək qabiliyyəti populyasiya genetikası tətbiqləri üçün çox vacibdir, burada yüksək etibarlı etiketlərə malik adekvat ölçülü məlumat dəstləri hazırda əldə etmək çətindir. Ən maraqlısı odur ki, bəzi SML üsulları yüksək ölçülü girişdən istifadə edə bilir və ölçülülük lənətindən yalnız bir qədər əziyyət çəkir (Anderson et al., 2014 Chen et al., 2013 Schrider & Kern, 2018). SML yanaşmaları hazırda bir çox sahədə inqilab edir (məs., Sebastiani, 2002 mətn təsnifatında Libbrecht & Noble, 2015 genomics Angermueller et al., 2016 in genomics and cellular views), lakin onların populyasiya genetik nəticələrində istifadəsi hələ başlanğıc mərhələsindədir (bax. məsələn, Chapuis et al., 2020 Fraimout et al., 2017 Pybus et al., 2015 Schrider & Kern, 2016, 2018 Sheehan & Song, 2016 Schrider et al., 2018 Smith & Carstens, 2071 Smith, 2020, Smith et al. ).

Breiman (2001) tərəfindən təklif olunan Random Forest (RF) yanaşması təsnifat (məsələn, ssenari seçimi üçün) və ya reqressiya (məsələn, davamlı parametrlərin qiymətləndirilməsi üçün) üçün əsas SML alqoritmlərindən biridir. Pudlo və başqaları. (2016) adətən ABC-də nəzərdən keçirildiyi kimi, böyük bir statistik dəst vasitəsilə ümumiləşdirilmiş simulyasiya edilmiş məlumat dəstlərindən ssenari seçimini yerinə yetirmək üçün bu yaxınlarda RF alqoritmlərini işləyib hazırladı və bu, ABC-RF yanaşmasına gətirib çıxardı. Klassik ABC metodları ilə müqayisədə, ABC-RF yanaşması ssenarilər arasında səmərəli ayrı-seçkiliyə və daha az hesablama yükü ilə ən yaxşı ssenarinin sonrakı ehtimalının qiymətləndirilməsinə imkan verir. Daha dəqiq desək, ABC-RF və digər ABC metodları çoxlu simulyasiya edilmiş məlumat dəstlərinə əsaslanan təhlillər üçün ardıcıl nəticələr verir, lakin ABC-RF daha kiçik (deməli daha idarəolunan) sayı əsasında çoxsaylı mürəkkəb ssenarilərin təhlili üçün digər ABC metodlarından üstündür. simulyasiya edilmiş məlumat dəstləri (Fraimout et al., 2017 Pudlo et al., 2016). Bu nəticələrə əsaslanaraq, Raynal et al. (2019) bu yaxınlarda verilmiş ssenari üzrə maraq parametrlərinin posterior paylanmalarını xarakterizə etmək üçün (parametrik olmayan) reqressiya şəraitində RF yanaşmasının genişləndirilməsini təklif etdi. Alternativ ABC həlləri ilə müqayisədə, Raynal və digərlərinin RF metodu. (2019) bir çox üstünlüklər təklif edir: (i) ümumi statistikanın seçimində möhkəmliyin əhəmiyyətli dərəcədə yaxşılaşması, (ii) hər hansı bir dözümlülük səviyyəsinin tələb olunmaması və (iii) nöqtə təxminlərinin dəqiqliyi arasında yaxşı uyğunlaşma. parametrlər və verilmiş hesablama yükü üçün etibarlı intervalların dəqiqliyi.

Populyasiyanın genetik məlumatlarına hər hansı SML metodlarının tətbiqi üçün iş prosesi bir neçə mərhələdən ibarətdir: (i) bir və ya bir neçə təkamül ssenarisi üzrə məlumatların simulyasiyası, (ii) həm simulyasiya edilmiş, həm də real (müşahidə edilmiş) məlumatların xüsusiyyət vektorları kimi kodlaşdırılması (yəni, xülasə ABC-də olduğu kimi statistika), (iii) alqoritmin öyrədilməsi, onun yeni (müşahidə edilmiş) məlumat nöqtələrində (nöqtələrində) tətbiqi və (iv) səhv və dəqiqlik ölçmələrinin hesablanması yolu ilə proqnoz müddətində onun fəaliyyətinin qiymətləndirilməsi. Bütün bu iş prosesini yerinə yetirməyə qadir olan müstəqil, səmərəli və istifadəçi dostu proqram paketləri yaratmaq üçün istənilən səy SML metodlarını sadələşdirəcək və onları tədqiqatçılar, o cümlədən qeyri-peşəkar istifadəçilər üçün daha əlçatan edəcək. Bu məqsədlə biz yeni kompüter paketində DİABC 2.1.0-da tətbiq edilmiş populyasiya genetik simulyatorunun genişləndirilmiş versiyasına əsaslanaraq, genetik polimorfizmlərdən əhalinin tarixçəsini çıxarmaq üçün bir sıra RF alqoritmlərini tətbiq etdik (Cornuet et al., 2014) . Məlumatlar müxtəlif növ genetik markerlərə uyğundur: mikrosatellitlər, DNT ardıcıllıqları və SNP-lər, o cümlədən fərdi ardıcıllıq və hovuz ardıcıllığı SNP məlumatları (Gautier et al., 2013 Schlötterer et al., 2014). SNP məlumat dəstlərindən genetik məlumatların çıxarılmasını təkmilləşdirmək üçün geniş ümumi statistika dəsti də həyata keçirilmişdir. DİABC Random Forest v1.0 adlı nəticə paketi, istifadəçi dostu interfeysdə iki funksiyanı birləşdirir: polimorfizm məlumatlarının fərdi təkamül ssenariləri altında simulyasiya (böyük təsviri statistik topluda ümumiləşdirilmiş) və qiymətləndirmək üçün müxtəlif statistik alətlər daxil olmaqla RF müalicəsi. RF əsaslı nəticələrin gücü və dəqiqliyi. Burada biz DIYABC Random Forest v1.0-ın əsas statistik xüsusiyyətlərini təsvir edirik və hovuz ardıcıllığına və fərdi ardıcıllığa malik SNP məlumatlarına uyğun gələn psevdo-müşahidə edilmiş və real məlumat dəstlərinin təhlili vasitəsilə həm ssenari seçimi, həm də parametrlərin qiymətləndirilməsi üçün onun potensialını və funksiyalarını təsvir edirik.


1. GİRİŞ

Təkamül radiasiyaları və ya təbəqələrin sürətli şaxələnməsi yeni növlərin meydana gəlməsinin və onların məkan və zaman boyunca birgə mövcudluğunun əsasını təşkil edir (Gittenberger, 1991 Simões et al., 2016). Təxminən 100 illik tədqiqatdan sonra ortaya çıxan mərkəzi model, tez-tez əhəmiyyətli gen axını (yəni, adaptiv şüalanma Simões et al., 2016). Bununla belə, artan sayda tədqiqatlar göstərir ki, bir çox radiasiya ilk növbədə əhalinin parçalanması, darboğazlar və məhdud gen axını daxil olmaqla demoqrafik amillərlə idarə olunur (Kozak et al., 2006 Prunier & Holsinger, 2010 Simões et al., 2016) və bəzilərində hallarda, daxili genomik xüsusiyyətlərə görə (məsələn, poliploidizasiya Van de Peer et al., 2017). Təkamül radiasiyasının altında yatan mexanizmləri tam başa düşmək üçün demoqrafik tarixin və ekoloji imkanların növlərin şaxələndirilməsinə və davamlılığına təsirini birlikdə araşdırmalıyıq (Foote et al., 2016 Gavrilets & Vose, 2005).

Əhali ölçüsü və gen axını təkamül radiasiyaları zamanı diversifikasiya, uyğunlaşma və davamlılığa təsir edən əsas demoqrafik dəyişənlərdir (Gavrilets & Vose, 2005 Simões et al., 2016). Təbii seçmənin effektivliyi uzunmüddətli populyasiyanın sayı ilə müsbət əlaqəli olduğundan (Kimura, 1983), tarixən böyük populyasiyaların ekoloji imkanlara sürətlə uyğunlaşması və onlardan istifadə etməsi ehtimalı daha yüksək ola bilər. Bununla belə, təkamül radiasiyaları tez-tez yeni bir mühitin kolonizasiyası ilə əlaqəli əhali darboğazları ilə əlaqələndirilir (Foxe et al., 2009 Särkinen et al., 2007 Wessel et al., 2013). Nadir hallarda, təsisçi hadisələrlə əlaqəli genetik sürüşmə əslində ekoloji şaxələndirməyə səbəb ola bilər (Wessel et al., 2013, baxmayaraq ki, Barton & Charlesworth, 1984-ə baxın). Bununla belə, darboğazlar ciddi olarsa, populyasiyalar əhəmiyyətli dərəcədə daimi genetik variasiyanı itirə bilər (James, 1971), potensial olaraq yeni mühitlərə sürətlə uyğunlaşmaq və davam etmək qabiliyyətini məhdudlaşdıra bilər (Frankham et al., 1999). Kolonizasiyanın erkən mərhələlərində populyasiyalar və ya növlər arasında gen axını adaptiv genetik müxtəlifliyi artırmaqla təsisçi hadisələrin təsirlərinə qarşı çıxa bilər (Dlugosch & Parker, 2008). Klassik radiasiyaların son genomik tədqiqatları (məsələn, Darvinin ispinozları [Lamichhaney et al., 2015] və Şərqi Afrika cichlidləri [Meier et al., 2017]) gen axınının uyğunlaşmanı asanlaşdıran genetik dəyişkənliyin toxumlanmasında mühüm rol oynadığını göstərir. Digər tərəfdən, gen axınının sürəti müəyyən bir həddi (Wright, 1932) keçərsə, sabit populyasiyaların yaradılmasına mane ola biləcək yerli uyğunlaşma, uyğunlaşmamış allellərin axını ilə bataqlığa düşə bilər. Diversifikasiya zamanı genetik sürüşmənin və gen axınının dinamikasını başa düşmək buna görə də fundamental tədqiqat məqsədi olaraq qalır (Lawton-Rauh et al., 2007).

Məkan və müvəqqəti ekoloji heterojenlik populyasiyalar üçün qeyri-adi iqlim şəraiti (Rainey & Travisano, 1998 Williams & Jackson, 2007) və ya coğrafi təcrid (Hewitt, 2000 Knowles & Massatti, 2017) yaşamaq imkanlarını artırmaqla biomüxtəlifliyin yaradılmasını və saxlanmasını asanlaşdırır. Şimali Amerikanın qərbindəki dağlararası region (bundan sonra Dağlararası Qərb adlandırılacaq) tarixdə dramatik iqlim dəyişiklikləri (məsələn, Pleystosen boyu regional iqlim qradiyentlərini dəyişdirən təkrar buzlaşmalar) olan məkan baxımından mürəkkəb landşaftdır və buna görə də bu ərazinin necə qurulduğunu araşdırmaq üçün mühüm sistemdir. demoqrafik və ekoloji şərait təkamül radiasiyalarını formalaşdırmaq üçün qarşılıqlı təsir göstərir (Egan & Crandall, 2008 Tidwell et al., 1972). Dağlararası Qərb kəskin iqlim və torpaq gradientlərini əhatə edən çoxlu endemik bitki təbəqələrinə (məsələn, Weber, 2003) ev sahibliyi edir (Tidwell et al., 1972). Bu bitki təbəqələrinin çoxunun şaxələndirilməsi buzlaq dövrləri vasitəsilə müvəqqəti ətraf mühitin heterojenliyi ilə əlaqələndirilmişdir (məsələn, Egan & Crandall, 2008 Levsen et al., 2012). Bundan əlavə, davam edən ekoloji dəyişikliklər (məsələn, quraqlıq, otlaq, meşə yanğınları və invaziv növlərin yayılması) yerli növlər və icmaları təhdid etməyə davam edir (Litt & Pearson, 2011 Winkler et al., 2019 Zedler et al., 1983). Bu bölgədə biomüxtəlifliyi formalaşdıran dəqiq mexanizmlərin aşkarlanması, həddindən artıq ətraf mühit dəyişikliyi dövrlərində təkamül və qorunma üçün daha geniş təsirlərə malikdir (Thorpe et al., 2015).

Demoqrafik və ekoloji proseslərin təkamül şaxələnməsinə necə təsir etdiyini yoxlamaq üçün biz populyasiya və landşaftın genomik analizlərini birləşdirərək nadir bir qrup insanı öyrəndik. Astragalus Dağlararası Qərbdə quru ekosistemdə dar paylanmış növlər (tədqiqat sistemi təfərrüatları üçün Metodlara baxın). Astragalus (Linnaeus 1753 Fabaceae ailəsi) dünyada ən çox növ zəngin bitki cinsidir.

3000 növ əsasən Şimal yarımkürəsinin mülayim bölgələrində yayılmışdır, o cümlədən ən azı 160 növ Dağlararası Qərbdə məhdudlaşdırılmışdır (Barneby, 1989). Maraqlıdır ki, qeyri-mütənasib sayda Astragalus növlər nadirdir və dar coğrafi və ya ekoloji bölgələrə endemikdir, mövcud növlərin təxminən üçdə biri ya həssas, nəsli kəsilməkdə olan və ya kritik təhlükə altında hesab olunur (IUCN, 2020 Rundel et al., 2015). Geniş marağa baxmayaraq Astragalus təkamül və konservasiya (Sanderson & Wojciechowski, 1996 Scherson et al., 2008 Stebbins, 1981 Wojciechowski et al., 1999), yaxından əlaqəli növlərin təfərrüatlı genomik tədqiqatlarının olmaması şaxələndirmə və endemizm nümunələrinin altında yatan mexanizmləri anlamamıza mane oldu. bu qrupda nadirlik (Rundel et al., 2015 baxmayaraq bax Záveská et al., 2019).

Daha geniş Astragalean təbəqəsi müəyyən ekoloji xüsusiyyətlərə (yəni, əsas yeniliklərə) malik görünmür və beləliklə, Sanderson və Wojciechowski (1996) bu qrup daxilində diversifikasiyanın məhdud gen axını və əhalinin parçalanması kimi demoqrafik amillərlə daha yaxşı izah oluna biləcəyini fərz etdilər. , ekoloji imkandan fərqli olaraq. Bununla belə, ekoloji ixtisaslaşmanın (xüsusilə də edafik ixtisaslaşma) aşkar yayılması Astragalus yerli uyğunlaşmanın nəsillərin fərqliliyini və davamlılığını təşviq etməkdə rol oynaya biləcəyini təklif edir (Rundel et al., 2015), baxmayaraq ki, yerli uyğunlaşma üçün genetik sübut Astragalus çatışmır. İstənilən halda, ətraf mühitin dəyişməsi, iki ölkə arasında fərq üçün demoqrafik və ya ekoloji şəraitin müəyyən edilməsində mühüm rol oynayacağı proqnozlaşdırıla bilər. Astragalus takson. Burada nadir və endemik olan proqnozları sınayırıq Astragalus növlər (a) böyük ətraf mühit dəyişikliyi dövrlərində şaxələnmiş, (b) gen axınının olmaması ilə əsasən şaxələnmiş (Sanderson & Wojciechowski, 1996) və (c) dar paylanmaları üzrə yerli olaraq uyğunlaşdırılmışdır. Bu proqnozları sınamaq üçün biz ikiqat həzm məhdudlaşdırma yeri ilə əlaqəli DNT (ddRAD) ardıcıllığını və populyasiyanın genetik quruluşunun, genetik müxtəlifliyin və qohumluq nümunələrini həyata keçirdik. Bu əsas məlumatlardan istifadə edərək, biz populyasiyanın ölçüsü dəyişikliklərinin tarixini, gen axını və diversifikasiya vaxtını yenidən qururuq (a və b Proqnozlarının sınaqdan keçirilməsi) və yerli ekoloji uyğunlaşmanın genom miqyasında imzalarını yoxlayırıq (Proqnoz c-nin sınaqdan keçirilməsi). Təhlillərimiz mürəkkəb demoqrafik və ekoloji tarixə əsaslandığını nümayiş etdirir Astragalus heterojen landşaftlarda yaşayan nadir və endemik bitkilərin təkamülü və mühafizəsi kontekstində müzakirə etdiyimiz diversifikasiya.


Materiallar və metodlar

Nümunə götürmə

Cortés-Rodríguez və digərlərində mtDNA məlumat dəstini əlavə etmək üçün. ( 2008 ) (n = 69 fərd), biz 88 əlavə fərd üçün yeni ardıcıllıq məlumatlarını təqdim edirik (Cədvəl S1). 157 fərd 43 ərazidən nümunə götürüldü və dağ coğrafiyasına görə beş qrupa təsnif edildi: SMO = Sierra Madre Oriental TUX = Sierra de Los Tuxtlas və Sierra de Santa Marta SMS = Sierra Madre del Sur (Guerrero və Sierra de Miahuatlán, Oaxaca) TMV = Trans-Meksika vulkanik qurşağı CHIS = Qvatemala və El Salvador ilə birlikdə Trans-İsthmian Dağları regionunu (TİH) təşkil edən Mərkəzi Depressiya ilə ayrılmış Chiapan dağlıqları Şəkil S1 və Cədvəl S1). Bu tədqiqatda təqdim olunan nümunə Meksikada ametist boğazlı kolibrilərin bütün paylanmasını praktiki olaraq əhatə edir. Quşlar dumanlı torlarda tutuldu və sonrakı genetik analiz üçün iki rektris və ya toxuma nümunəsi toplandı. Nümunələr tələb olunan icazələrdən və təsdiq edilmiş heyvan rifahı protokollarından istifadə etməklə toplanmışdır. Biz həmçinin ardıcıllıq məlumatı əldə etdik və ya GenBank-dan ardıcıllar üçün endirdik (L. clemenciae, L. viridipallens, L. hemileucus, L. calolaemus, L. sybillae), Lamprolaima rhami, Doricha eliza, Kalotoraks pulcher, Selasphorus platycercus,Archilochus colubris García-Moreno və digərlərinə görə kənar qruplar kimi istifadə edilməlidir. (2006), McGuire et al. (2014) və Ornelas et al. (2014).

Mitoxondrial DNT ardıcıllığı və mikrosatellit genotiplənməsi

İki mitoxondrial gen - NADH nikotinamid dehidrogenaz alt bölməsinin 349 əsas cütü (bp) 2 (ND2) və 402 bp sitoxrom b (sit b) genlər PCR ilə gücləndirilmiş və haplotiplər arasında filogenetik əlaqələri çıxarmaq üçün ardıcıllaşdırılmışdır. Genomik DNT istehsalçı tərəfindən tövsiyə olunan protokola uyğun olaraq Chelex (10%) və ya ekstraksiya DNeasy qan və toxuma dəsti (Qiagen, Valencia, CA) istifadə edilərək çıxarıldı. Gücləndirilməsi ND2 L5215–H5578 (Hackett 1996) primerləri ilə aparılmışdır, halbuki cyt üçün b biz L15560–H16064 istifadə etdik (Sorenson et al. 1999). 14 μHər iki fraqment üçün L PCR qarışığında 0,72 × PCR tamponu (Promega, Madison, WI), 3,6 mmol/L -1 MgCl yekun konsentrasiyası var.2, 0,58 mmol/L −1 dNTPs, 0,4 μg/μL BSA, 0.18 μmol/L -1 hər primer, 0,04 U Taq polimeraza (Promega) və 1-1,5 μL genomik DNT. üçün PCR dövrü şərtləri ND2 2 dəqiqə ərzində 95°C-də ilkin denaturasiyadan, ardınca 95°C-də 20 saniyə ərzində 35 denaturasiya dövrü, 47°C-də 20 saniyə ərzində yumşalma və 1 dəqiqə ərzində 74°C-də uzanma və son uzadılmadan ibarət idi. 72 ° C-də 3 dəqiqə. Cyt üçün b PCR dövriyyəsi şərtləri 5 dəqiqə ərzində 80°C-də ilkin denaturasiyadan, ardınca 1 dəqiqə ərzində 95°C-də denaturasiyadan və 47°C-də 4 dəqiqə ərzində yumşalmadan və 66°C-də son uzadılmadan ibarət 35 dövrədən ibarət idi. 10 dəq. Etidium bromid ilə boyanmış 1% agaroza gellərində vizuallaşdırılan PCR məhsulları QIAquick dəsti (Qiagen, Inc.) ilə təmizləndi və BigDye Terminator Cycle Sequencing dəsti (Applied Biosystems, Ann Arbor, MI) istifadə edərək ardıcıllıqla sıralandı. Ardıcıllıqlar INECOL-un sekvensiya qurğusunda 310 avtomatlaşdırılmış DNT sequencerində (Applied Biosystems, Carlsbad, CA) oxundu. Nəhayət, Sequencher ver istifadə edərək ardıcıllıqlar yığıldı. 5.2.3 (Gen Kodları, Ann Arbor, MI) və sonra əl ilə SE-AL ver. 2.0a11 (http://evolve.zoo.ox.ac.uk/software.html). Bütün yeni əldə edilmiş ardıcıllıqlar GenBank-da yatırılıb (Qoşulma nömrəsi KU375264–KU375338, KU375339–KU375423).

126 kolibri quşundan nümunələr səkkiz autosom mikropeyk lokusunda genotiplənmişdir. Campylopterus curvipennis (Molecular Ecology Resources Primer Development Consortium et al. 2010 GenBank qoşulma №. GQ294539–GQ294550) və Selasphorus platycercus (Oyler-McCance et al. 2011 HQ316946–HQ316955). Mikrosatellit lokuslarının gücləndirilməsi Multipleks PCR dəsti (Qiagen) ilə dörd flüoresan etiketli primerlərin iki qarışığından (Tətbiq olunan Biosistemlər) istifadə edilməklə həyata keçirilmişdir. Multipleks PCR gücləndirilməsi (5 μL ümumi həcmi) 1× Multiplex PCR Master Mix, 0.2 son konsentrasiyaları ehtiva edir μmol/L −1 primer qarışığı və 0,5 μL DNT. Allellərin vizuallaşdırılması və fraqmentlərin ölçülməsi GENEMAPPER ver. 3.2 (Tətbiqi Biosistemlər) daxili ölçü standartına (GeneScan-600LIZ Applied Biosystems) qarşı və əl ilə hesablanmışdır. Lokuslar üçün inkişaf protokolunun tam təsvirini Cacu16-1 və Cacu17- üçün Molekulyar Ekologiya Resursları Verilənlər Bazasında (http://tomato.biol.trinity.edu/ Molecular Ecology Resources Primer Development Consortium et al. 2010) tapa bilərsiniz. 2 və Oyler-McCance et al. (2011) HumB2, HumB3, HumB9, HumB10, HumB11 və HumB15 üçün.

Haplotiplər arasında əlaqələr

Haplotiplər arasında şəcərə əlaqələri haqqında nəticə çıxarmaq üçün TCS ver. 1.2.1 (Clement et al. 2000), 95% əlaqə ehtimalı həddi ilə və boşluqları tək təkamül hadisələri kimi nəzərdən keçirir. Döngələr Pfenninger və Posada (2002) tərəfindən verilən meyarlara uyğun olaraq həll edildi.

Genetik müxtəliflik və populyasiya quruluşu

MtDNA ardıcıllığı məlumatlarının təhlili

haplotip müxtəlifliyi (h) və nukleotid müxtəlifliyi (π) hər bir coğrafi qrup üçün və ikili müqayisələr FST populyasiyalar və 1000 dəyişdirmə qrupları arasında dəyərlər ARLEQUIN ver. 3.5 (Excoffier və Lischer 2010). Qeyd edək ki, “əhali” seçmə yerlərdir (n = 43), halbuki “qruplar” birləşmiş populyasiyalar toplusudur (n = 5), Cədvəl S1-də göstərildiyi kimi. Populyasiyaların coğrafi quruluşlu olub-olmadığını müəyyən etmək üçün molekulyar dispersiyaların üç təhlili (AMOVAs Excoffier et al. 1992) ARLEQUIN-dən istifadə edərək cütlü fərqlərə əsaslanaraq həyata keçirildi və populyasiyalar (1) arasında bölünmüş variasiya miqdarını müəyyən etmək üçün vahid qrup kimi qəbul edildi. yerlər daxilində və (2) İT-nin şərqinə və qərbinə qruplaşdırılmış və ya (3) dağ coğrafiyasına əsasən beş sahəyə qruplaşdırılmışdır (SMO, TUX, TMVB, SMS, CHIS Şəkil S1 və Cədvəl S1). AMOVA-lar 10.000 dəyişdirmə ilə Tamura və Nei modelindən istifadə edərək hər bir AMOVA-nın əhəmiyyətini müəyyən etmək üçün birləşdirilmiş parametrlərdən istifadə edərək işlədildi. ND2 + cyt b verilənlər toplusu.

Mikropeyk məlumatlarının təhlili

Gözlənilən və müşahidə edilən heterozigotluq, hər bir populyasiyada hər bir lokus üzrə allellərin orta sayı, lokus cütləri arasında əlaqənin qeyri-tarazlığının dərəcəsi və populyasiyalar və lokuslar daxilində Hardi-Vaynberq tarazlığından (HWE) kənarlaşmalar GENEPOP ver. 3.4 (Raymond və Rousset 1995), eyni vaxtda çoxsaylı müqayisələri düzəltmək üçün Bonferroni düzəlişi ilə. Bundan əlavə, nümunənin ölçüsündən asılı olmayaraq populyasiyalar arasında lokus başına allellərin sayının ölçüsü olan allel zənginliyi FSTAT versiyasında hesablanmışdır. 2.9.3 (Goudet 1995). Hər bir lokus üçün sıfır allel tezlikləri MICRO-CHECKER ver. 2.23 (Van Oosterhout et al. 2004).

Əhalinin genetik quruluşunu araşdırmaq üçün qlobal və cütlük müqayisələrini hesabladıq FST 10.000 dəyişdirmə ilə FSTAT istifadə edən populyasiyalar arasında dəyərlər. FST hesablamalar daha yaxşı işləyir RST nümunə ölçüləri kiçik olduqda və toplanan lokusların sayı aşağı olduqda (Gaggiotti et al. 1999). Bundan əlavə, mikropeyklər üçün genetik quruluş nümunələri STRUCTURE ver. 2.1 (Pritchard et al. 2000). Biz STRUCTURE-u əlaqəli allel tezlikləri və LOCPRIOR funksiyası ilə qarışıq modeli altında işlədik (Pritchard et al. 2000). Hər biri üçün iyirmi müstəqil zəncir işlədilib K, dən K = 1-ə K = 7. Yanmanın uzunluğu 500.000 və yanmadan sonra MCMC təkrarlarının sayı 1.000.000 idi. Populyasiyaların ən çox ehtimal olunan sayı Δ hesablanması ilə qiymətləndirilmişdirK dəyərlər (Evanno et al. 2005).

Demoqrafik tarix

Hər birinin demoqrafik tarixi L. ametistin qrup (şək. S1) ARLEQUIN-də qurulmuş neytrallıq testləri və uyğunsuzluq paylamaları vasitəsilə müəyyən edilmişdir. Populyasiyaların neytrallıq altında təkamül edib-etmədiyini yoxlamaq üçün Fu Fs test və Tajima D testlər 1000 permutasiya ilə hesablanmış, uyğunsuzluq paylamaları isə Schneider və Excoffier (1999) tərəfindən 9000 bootstrap replikasiyası ilə qəfil genişlənmə modelindən istifadə etməklə hesablanmışdır. Qəfil genişlənmə fərziyyəsinin etibarlılığı sabit, genişlənməyən populyasiyalarda daha yüksək olan kvadrat sapmaların (SSD) və Harpendinqin cırıqlıq indeksinin (Hri) cəmindən istifadə etməklə müəyyən edilmişdir (Rogers and Harpending 1992). Biz həmçinin BEAST ver.-də ifa olunan Bayes skyline süjetlərindən (BSP Drummond et al. 2005) istifadə etdik. 1.6.1 (Drummond və Rambaut 2007) mtDNA üçün effektiv populyasiya ölçüsündə müvəqqəti dəyişkənliyi qiymətləndirmək (Ne). Bu təhlil coğrafi qrupların hər biri üçün ayrı-ayrılıqda BEAST və AMOVA nəticələrinə əsasən BEAST-də fərqlilik vaxtının qiymətləndirilməsi üçün istifadə edilən eyni parametrlərlə həyata keçirilmişdir (aşağıya bax), bundan əvvəl birləşən ağac beş qrupla Bayes silueti kimi göstərilmişdir. Konvergensiyanı təmin etmək üçün 10 milyon addımdan ibarət üç qaçış və effektiv nümunə ölçüləri (ESS) > 200 müqayisə edildi. Çıxışlar LOGCOMBINER ver.-də birləşdirildi. 1.6.1 (Drummond və Rambaut 2007) və TRACER versiyasında vizuallaşdırılıb. 1.6.0 (http://tree.bio.ed.ac.uk/software/tracer/). Zaman oxu, 0,029 s/s/MY orta sürətlərə uyğun olaraq, hər milyon ildə hər bir nəsil üçün 0,010075 yer dəyişdirmə həndəsi orta əvəzetmə sürətindən istifadə etməklə miqyaslandı. ND2 və cyt üçün 0,014 s/s/MY b Hawaiian honeycreepers üçün əldə edilmişdir (Lerner et al. 2011).

Divergensiya vaxtının qiymətləndirilməsi

Birləşdirilmiş mtDNA-dan istifadə edərək BEAST-da tətbiq olunan Bayes yanaşması ilə qruplar arasında fərq vaxtlarını təxmin etdik (ND2 və cyt bjMODELTEST ver. tərəfindən təklif olunan Bayes məlumat meyarına (BIC), GTR uyğun olaraq ardıcıllıqlar və ən yaxın nukleotid əvəzetmə modeli. 0.1.1 (Posada 2008) saat modeli kimi. Inqrup bütün yeni əldə edilmiş mtDNT ardıcıllıqlarından ibarət idi L. ametistinND2 və cyt b ardıcıllıqlar GenBank of Cortés-Rodriguez et al. (2008), və Lampornis clemenciae, L. sybillae, L. viridipallens, L. calolaemus, Lamprolaima rhami, Doricha eliza, Kalotoraks pulcher, Selasphorus platycercus,Archilochus colubris García-Moreno və s. (2006), McGuire et al. (2014) və Ornelas et al. (2014) çoxlu qruplar kimi istifadə olunur. Arı kolibri qrupu, dağ daşları və L. ametistin McGuire və başqalarına əsaslanaraq monofiletik olmaları məhdudlaşdırıldı. (2014) və Ornelas et al. (2014). We ran BEAST two times for 10 million generations, sampling every 1000 steps and discarding the first 10% of trees as burn-in, using a coalescent tree prior assuming constant population size, and the mitochondrial geometric mean substitution rate of 0.01075 s/s/l/MY obtained for Hawaiian honeycreepers (Lerner et al. 2011 ) to calibrate the tree. To calibrate the root, we used 12.8 MYA (normal prior, SD 2.0 MYA, range of 16.09–9.51 MYA Smith and Klicka 2010 ) divergence time for the split between mountain gems and bee hummingbirds. The coalescent tree prior used in this analysis appears to be a better fit when datasets composed of both interspecific and intraspecific data are predominantly intraspecific (Ho et al. 2011 ). We combined log and trees files from each independent run using LOGCOMBINER, then viewed the combined log file in TRACER to ensure that ESS values for all priors and the posterior distribution were >200, and finally annotated the trees using TREEANNOTATOR ver. 1.6.1 (Drummond and Rambaut 2007 ) summarized as a maximum clade credibility tree with mean divergence times and 95% highest posterior density (HPD) intervals of age estimates and visualized in FIGTREE ver. 1.3.1 (http://tree.bio.ed.ac.uk/software/figtree/).

Historical and contemporary gene flow

The isolation-with-migration (IM) coalescent model implemented in IMa (Hey and Nielsen 2004 , 2007 ) was used to determine whether recent genetic divergence between groups of populations (see 3) occurred with gene flow. Several preliminary runs of IMa were conducted to optimize priors using mtDNA and microsatellite data to then estimate the effective population size of the ancestral (qa) and the two descendant populations (q1q2), effective number of migrants per generation in both directions (m1-to-2m2-to-1), and time since divergence (t) at which the ancestral population gave rise to the descendant populations. IM models search parameter space for the most likely estimates using a Bayesian framework assuming random mating within populations and that populations are each other's closest relatives not exchanging genes with other nonsampled populations (Hey and Nielsen 2004 Hey 2006 ). We used IMa on a subsample of 10–48 individuals from each population combining their microsatellite genotypes with 349 bp of mitochondrial ND2 and 402 bp of cyt b ardıcıllıqlar. The isolation-with-migration model implemented in IMa involves several simplifying assumptions, including no recombination within each locus, no population structure within each species, no genetic contribution from unsampled populations, and selective neutrality. Although we recognized that our data may violate some of the IM model assumptions, previous work has shown that IM models, as applied in IMa, are generally quite robust to small-to-moderate violations of the IM model assumptions (Strasburg and Rieseberg 2010 ). In particular, random mating within populations (panmixia) has little effect on parameter estimates ever for fairly high levels of population structure, and those involving small to moderate levels of introgression among considered taxa (Strasburg and Rieseberg 2010 ). Another important assumption of the IM model is that the populations in question have most recently split from one another. A violation of this assumption is possible because even moderate levels of gene flow from an unsampled third population may overestimate divergence times. However, we restricted our IM analyses to adjacent currently isolated populations that more likely have evolved under a divergence scenario in the face of gene flow.

Initial runs were conducted searching for suitable conditions to constrain parameter intervals and to alter the heating scheme to achieve sufficient mixing among chains (Hey and Nielsen 2007 ). The final runs were carried out with a Hasegawa-Kishino-Yano (HKY) mutation model (Hasegawa et al. 1985 ), a chain length of 2 million steps after a burn-in of 1 million steps using 15 chains for the joint mtDNA and microsatellites dataset, and a geometric heating scheme using high values (g1 = 0.85 and g2 = 0.95). We present results from two independent runs that were conducted using identical conditions, but different starting points. We confirmed sufficient mixing by observing that ESS values were ≥50 and inspecting parameter plots for trends (Hey and Nielsen 2007 ). We used the geometric mean substitution rates of 3.99 × 10 −4 substitutions per site per year (s/s/yr) for the ten loci according to the averages of 2.9 × 10 −8 s/s/MY for ND2 and 1.4 × 10 −8 s/s/MY for cyt b obtained for Hawaiian honeycreepers (Lerner et al. 2011 ) and 1.08 × 10 −3 s/s/yr based on an average mutation rate of 2.96 × 10 −3 s/s/generation for microsatellites (Ortego et al. 2008 ), to estimate the effective population sizes of each genetic group. The mutation rate was converted to per locus rate by multiplying the fragment length in base pairs for conversion to demographic units (Hey and Nielsen 2007 ). Although there is considerable uncertainty in the determination of these rates, they have been applied here systematically to all coalescent-based assessments. Consequently, estimates presented are relative to one another, and although not necessarily exact, they still likely reflect relative migration rates among populations. To convert the effective population size estimates, we used a 2.75-years generation time which is the average of those proposed for other hummingbird species based on the observation that the age of maturity begins 1 year after hatching, and an assumed low annual adult survival rate of 0.3 reported for Colibri thalassinus (Ruiz-Gutiérrez et al. 2012 ), Augastes scutatus (Da Cruz Rodrigues et al. 2013 ), and Archilochus colubris (Hilton and Miller 2003 ) or a high annual adult survival rate of 0.52 for an emerald resident species, Hylocharis leucotis (Ruiz-Gutiérrez et al. 2012 ). The approximate average generation time (T) is calculated according to T = a + [s/(1–s)] (Lande et al. 2003 ), where a is the time to maturity and s is the adult annual survival rate. Based on this, estimates for T range from 2.43 to 3.08 years (average 2.75 years). To convert time since divergence parameter of IMa to years, t, we divided the time parameter (B) by the mutation rate per year (U) converted to per locus rate by multiplying by the fragment length in base pairs.

Analyses of population history with coalescence models

We infer the population history of amethyst-throated hummingbirds using DIYABC ver. 2.0 (Cornuet et al. 2014 ), a coalescence-based program that infers the population history by looking backwards in time to examine the genealogy of alleles until reaching the most recent common ancestor using approximate Bayesian computation algorithm (ABC) (Cornuet et al. 2008 ). Populations covering the whole species’ distribution were analysed to infer the history of the genetic structure indicated by STRUCTURE and BEAST analyses. Using the DIYABC software (Cornuet et al. 2014 ), we simulated and compared through posterior probabilities three simple population demography scenarios considering both mtDNA sequences and microsatellites and parameter prior distributions based on results of BEAST, BSP, and IMa analyses (see 3). The evolutionary scenarios were built considering the STRUCTURE and BEAST analyses, which point to an older divergence between CHIS and the rest of groups west of IT (SMS, SMO and TMVB), and different combinations of splitting of unresolved relationships among the SMS, SMO, and TMVB geographic groups. Individuals from the TUX population were not included due to the small sample size. The first scenario (Sc1, isolation split model 1) predicts that TMVB (Pop1) merged with SMO (Pop2) at t1 then SMO merged with SMS (Pop3, margaritae) at t2 and subsequently with CHIS east of IT (Pop4) at t3. This scenario was expected to be the most likely according with hierarchical STRUCTURE and BEAST analyses. The second scenario (Sc2, isolation split model 2) is similar to the previous one but predicts that SMS (Pop3) merged with TMVB (Pop1) at t1 then TMVB merged with SMO (Pop2) at t2 and subsequently with CHIS east of IT (Pop4) at t3. The third scenario (Sc3, isolation with admixture model) consisted of the same basal split between CHIS (Pop4) and the rest of groups west of IT described in previous scenarios but includes a hybridization/lineage fusion event in which SMS (Pop3) is the descendent of admixture between TMVB (Pop1) and SMO (Pop2) at t1, then Pop1 merged with Pop2 at t2, and subsequently with Pop4 at t3. Although there are numerous possible scenarios of divergence, we considered that these three scenarios represent the close relationships among groups and the most likely demographic scenarios during Pleistocene climate cycles (see 3).

We generated one million simulated datasets per scenario considering a generalized stepwise-mutation model, a uniform prior distribution with 10–100,000 values for effective population sizes, and 100–50,000 generations for splitting events at t1, t2, and t3, depending on the population, and compared scenarios using DIYABC. The posterior probability of scenarios was assessed using a logistic regression on the 1% of simulated datasets closest to the observed data (Fontaine et al. 2013 ). For the best-supported scenario, we performed a model checking procedure by applying a principal component analysis (PCA) on test statistic vectors to visualize the fit between simulated and observed datasets. The number of alleles, mean genic diversity, mean size variance, number of haplotypes, number of segregating sites and mean pairwise differences were used as summary statistics for each of the four groups, whereas for each group pair we used combined mean genic diversity, FST, combined number of segregating sites and NST. To assess confidence in scenario choice, we simulated 500 pseudo-observed datasets (PODs) under each scenario to estimate Type I and Type II error rates (Robert et al. 2011 ). Finally, for the best-supported scenario, point estimates for demographic and temporal parameters were obtained by local linear regression on the 1% of simulations closest to the observed dataset (Cornuet et al. 2008 , 2014 ).

Palaeodistribution modelling

We constructed species distribution models (SDM Elith et al. 2011 ) to explore the potential distribution of L. amethystinus under current climatic conditions and to predict where the suitable conditions resided during the LGM (21,000–18,000 years ago) and LIG (120,000–140,000 years ago) and whether the conditions for range expansion and population connectivity occurred. We assembled a dataset of occurrences for L. amethystinus from georeferenced museum specimens obtained through http://vertnet.org and the Global Biodiversity Information Facility (GBIF, http://data.gbif.org/species/browse/taxon), supplemented with records from field collection. After careful verification of every data location and removing duplicate occurrence records, we restricted the dataset to unique records for the analyses, leaving 109 unique presence records for L. amethystinus. These localities sample the entire distribution range of each species. Distribution records were input into and analysed with the maximum entropy algorithm in MAXENT ver. 3.2.2 (Phillips et al. 2006 ) using the dismo ver. 1.0-5 package (Hijmans et al. 2014 ) in R ver. 3.0.3 (R Development Core Team http://www.r-project.org/) to infer the SDMs. Present-day temperature and precipitation data (BIO1–BIO19 variables) were drawn as climate layers from the WorldClim database (ca. 1 km 2 Hijmans et al. 2005 ). A principal components analysis (PCA) was carried out using SPSS ver. 17 for Mac (SPSS, Armonk, NY) to reduce the number of climatic variables and to minimize collinearity. We then ran a correlation analysis to eliminate correlated environmental variables using the program PAST ver. 2.12 (Hammer et al. 2001 ). When the correlation coefficient was higher than 0.8 the variables were considered highly correlated, and for each pair of correlated variables we selected the ones with the highest loadings on the first PC components. After removing the highly correlated variables, the remaining were used to generate the SDM model under current climate conditions using MAXENT (BIO4 = Temperature Seasonality, BIO7 = Temperature annual range, BIO12 = Annual Precipitation, BIO17 = Precipitation of Driest Quarter, BIO18 = Precipitation of Warmest Quarter) with the default parameters for convergence threshold (10 −5 ) and 500 iterations, ensuring only one locality per grid cell. We evaluated model performance using cross-validation running a random dataset using 70% of the occurrence points for training and 30% to test the model and then estimating the area under the receiver operating curve (AUC) of the threshold-independent receiving operating characteristic curve (ROC Mertz 1978 ).

Resulting species distribution under current climate conditions was projected onto past climate scenarios, at the LGM (at ca. 2.5 arc-min) and LIG (at 30 arc-sec), using the dismo package (Hijmans et al. 2014 ) in R. Past climate layers were drawn from WorldClim webpage for two LGM scenarios (Braconnot et al. 2007 ): the Community Climate System Model (CCSM Collins et al. 2004 ) and the Model for Interdisciplinary Research on Climate (MIROC Hasumi and Emori 2004 ), and for the LIG (Otto-Bliesner et al. 2006 ). The CCSM and MIROC climate models simulate different climate conditions, with cooler sea-surface temperature conditions assumed in CCSM than in MIROC, resulting in higher annual precipitation in CCSM than in MIROC (Otto-Bliesner et al. 2007 Ramírez-Barahona and Eguiarte 2014 ).

Morphological variation

Three body measurements were obtained from each of 242 hummingbirds (131 males and 111 females) from museum specimens (6) using a dial calliper with a precision of 0.1 mm: exposed culmen (from the base of the bill to the tip of the upper mandible) wing chord (the distance from the carpal joint to the tip of the longest unflattened primary) and tail length (from the uropygial gland to the tip of the longest rectrix). All measurements were taken by CG. Morphological data were tested for normality and log-transformed (x + 1) before statistical analysis.

We performed a multivariate analysis of variance (MANOVA) followed by one-way ANOVAs to examine morphological variation among groups of populations with SPSS ver. 17.0 for Mac (SPSS).

Gorget color variation

Reflectance measurements were taken from one feather of the gorget (the area of bright iridescent coloration in between the chest and throat) obtained from 85 male museum specimens to which we had permission for plucking (see 6). Bright iridescent coloration of feathers in gorgets, produced by nanoscale arrangements of multilayer stacks of keratin, melanosomes and air within feather barbules (Greenewalt et al. 1960 Maia et al. 2013a Eliason et al. 2015 ), are lacking entirely in L. amethystinus dişilər. Feather coloration between the chest and throat of females is dusky cinnamon, a pigment-based color that is likely constrained in their expression by metabolic pathways (Prum et al. 2012 Maia et al. 2013a ) and, therefore, their color variation was out of the scope of this study. We only measured iridescent gorget feathers based on apparent use of these ornaments in male courtships and agonistic displays and the nonornamental iridescent green back feathers is perhaps not sexually selected but under natural selection to aid in crypsis while perched (Ornelas et al. 2002 Meadows et al. 2012 ). Because measured feathers were iridescent (reflectance spectra change depending on the geometry of illumination and perception), reflectance measurements were taken at a 45° angle, while the illumination angle was fixed at 90° (Osorio and Ham 2002 Parra 2010 ). We performed preliminary measurements on possible angles to ensure that measurements taken at 45° captured the maximum percentage of reflectance. We used a RPH reflection probe holder (Ocean Optics, Dunedin, FL) that contained two apertures, at 45° and 90°, in which the light reception and light emission fibre cables were placed respectively. The probe holder was perfectly fitted in a box covered by black foamy material. The individual feather was placed in the box, flattened with a transparency sheet with a 5 mm diameter hole to allow the light sources reach the measured area directly (Parra 2010 ). Reflectance measurements were taken with an Ocean Optics Jaz-El200 spectrophotometer (Ocean Optics) coupled with a Premium QR600-7-SR125F optic fibre and a Miniature pulsed xenon light source for UV-VIS (220–750 nm) PX2 (Ocean Optics) as the illuminating light source. Measurements were taken relative to a WS-1 diffuse white standard (Ocean Optics).

The raw data files of measured reflectance spectra of 85 males were first loaded and organized for further analysis in the R package PAVO ver. 0.5–1 (Maia et al. 2013b ). Then the electrical noise arising from the spectrometer was removed using local regression smoothing implemented by the loess.smooth function in R, wrapped in the opt = “smooth” argument of procspec (span = 0.25). We plotted the resulting spectral data to visualize the mean reflectance curves for gorgets from each genetic group (or subspecies). Because we detected two peaks from the spectral curve (see 3), we extracted a metric of hue (wavelength of peak reflectance) independently from the UV/blue peak (between 300 and 500 nm) and from a second peak situated beyond 600 nm. To test for differences among groups, we conducted one-way ANOVAs with the hue data for each of the peaks and then plotted to visualize differences among genetic groups in R ver. 1.22 (http://www.r-project.org/). Although hues of the second peak are likely outside the range of avian vision, we provide these data to show that there is a previously unnoticed strong signal probably perceived by hummingbirds.

To explore how the birds perceive these colors, we also analysed the spectral data under the avian tetrahedral color space accounting for attributes of the color vision of the signal receiver. The avian visual system is comprised of four cone types, and under the color space model, all colors can be located in the volume of a tetrahedron, in which each of the four vertices represents the maximum stimulation of that particular cone type (Maia et al. 2012 , 2013b ). Using the R package PAVO, we first generated a three-dimensional plot indicating the location of each point in the color tetrahedron, and then calculated the Cartesian coordinates (X, Y, Z) for the points in the tetrahedral color space, the angles theta and phi (h.theta, h.phi) in radians, which determine the hue of the color, the r vector (r.vec), which measures saturation or the distance from the achromatic centre, the maximum r vector (r.max) achievable for the color's hue, and the r.achieved, which measures the relative r distance from the achromatic centre in relation to the maximum distance achievable (r.vec/r.max). These are receiver-centric variables that represent reflectance spectra in the avian tetrahedral color space (Maia et al. 2012 ). To test for differences between groups, we conducted a MANOVA with these coordinates and colorimetric variables followed by one-way ANOVAs in R. Finally, we calculated the volumes occupied by each group’ gorget plumage, as well as their overlap using the R package PAVO.


Licence and Citation

vortexR and its manual are distributed free of charge under the GPL-3 licence. We only ask you to please cite the following paper if you use vortexR for your work. If you customise a vortexR script to suit your specific needs, we would appreciate if you can still cite vortexR’s main reference stating something like: “we used a customised version of the script vortexR-script-name (Pacioni and Mayer, 2017)”.

Pacioni C, and Mayer F. 2017. VortexR: an R package for post Vortex simulation analysis. Methods in Ecology and Evolution. 8, 1477-1481

Please note that no commercial use of any part of vortexR is allowed.


Müzakirə

Overall our analyses here suggest evidence for strong bottleneck effects in the Blacksmiths (S13 and S14 Tables), and that these effects appear to be driving differences between the two Ari groups observed today using FST, unsupervised ADMIXTURE, and our CHROMOPAINTER analysis (A). Misal üçün, FST(ARIc,ORO) is lower than FST(ARIc,ARIb) (Fig 1b, S3 Table), and TVDXYFXY under analysis (A) suggest smaller genetic differences between the ARIc and other sampled groups including the ORO than that between ARIc and ARIb (Fig 3, S15 and S16 Tables). Nonetheless our analyses (B) and (C), designed to attenuate bottleneck effects in the Blacksmiths, show discernible differences between the inferred ancestry of ARIc and all other groups, including ORO, but no clear difference between the inferred ancestries of ARIc and ARIb (e.g. Fig 3, S15, S16 and S17 Tables). However, as we demonstrate via simulations, distinguishing between the MA and RN models is challenging if one assumes there was substantial one-way migration from the ancestors of Blacksmiths to those of the Cultivators under an RN model, as suggested from previous interpretations of unsupervised clustering algorithms [2, 11].

These difficulties notwithstanding, we believe the MA hypothesis is a more parsimonious explanation given the Blacksmiths’ currently marginalised status. yəni. such marginalisation can plausibly lead to a substantial bottleneck effect in the Blacksmiths, which in turn is consistent with all of our results. In contrast, harmonizing the RN model with the data analysed here requires an additional assumption beyond this bottleneck effect, namely (1) that we have not sampled a group whose ancestors split more recently from either Ari group than the Ari groups’ ancestors split from each other, or (2) that there were substantial levels of intermixing between the ancestors of ARIb and ARIc since the two groups initially were isolated from one another. Assumption (1) is perhaps less likely given our analyses included other Ethiopian groups described as agriculturalists [27] and groups that are more genetically similar to the ARIc than the ARIc are to the ARIb using the measures noted above. Assumption (2) is plausible under a RN model, given the two groups currently reside together. Indeed we detected likely very recent intermixing (perhaps occuring only a generation ago) between the two Ari groups in a “Blacksmiths” individual that we excluded from our analyses (S3 Fig), though this was the only case of such very recent intermixing observed in these data. Presuming assumption (1) is false, any older intermixing between the two Ari groups’ ancestors would have to be substantial enough to decrease our power to tell the two groups apart today. For example, our analysis (C) results suggest that the two Ari groups are more similar to one another when compared to outside groups than any other pairwise combination of Pagani groups (Fig 3, S11 Fig, S12, S15, S16 and S17 Tables), which is difficult to reconcile with the two Ari groups being anciently related without large amounts of subsequent intermixing.

If the RN model were true, simulations that replicate patterns in our observed data (Fig 5, S19 Fig, S18 Table) suggest our model should have power to distinguish the ancestries of the two Ari groups so long as one other sampled group, which we argue could be the ORO or MKK, split ≥ 400 generations more recently from the Cultivators than the two Ari groups split from each other, even if the Cultivators were comprised of 75% migrants from the Blacksmiths over the period 200 to 300 generations ago. We note again that one-way intermixing from Blacksmiths to Cultivators was proposed based on genetic evidence [2, 11] rather than anthropological findings, and that the overall inferred contribution of the ARIb to the ARIc’s ancestry profile is < 20% in all of our analysis (A) results. In contrast, our analysis (A) GLOBETROTTER results infer the ARIc contribution to the ARIb’s ancestry profile to be > 65%, which might argue for substantial asymmetric migration from the ancestors of the Cultivators to that of the Blacksmiths. However, we note that this need not be the case. In particular the ARIb has its lowest FST with the ARIc out of all other sampled groups (S3 Table), so it is not surprising that GLOBETROTTER infers the ARIb to share the majority of its ancestry with the ARIc relative to the other groups. Overall we argue that there is no evidence in these data that clearly support the RN hypothesis over the MA, with or without moderate levels of intermixing between the two groups, including the difficult-to-interpret GLOBETROTTER analysis (A) results. We note that currently the MA hypothesis is favored among anthropologists for explaining the existence of caste-like occupational groupings in southwest Ethiopia [1], and we show here that this hypothesis is consistent with available genetic evidence.

As further confirmation of the common recent genetic origins of the Ari, we also used the alternative approach of D-statistics (see [34]) to discern whether the ARIc and ARIb form a clade relative to a clade containing any pairing of sampled African groups with little to no inferred recent West Eurasian admixture (see S25 Table). Among six such pairings, we found no D-statistics with a corresponding ∣Z∣-statistic greater than 3, suggesting we could not reject an Ari clade and confirming the Ari groups appear more genetically related to one another than to these other African groups (S25 Table).

An artefact leading to our observations of substantial bottleneck effects in the ARIb could arise if at least some of the sampled ARIb individuals were more closely related (i.e. at a family level) to one another relative to the ARIc, perhaps due to sampling artefacts. However, the ARIb and ARIc from [2] each contained individuals with reported birthplaces spanning a similar number of different locations within the region, suggesting that it is unlikely that any such sampling artefacts are playing a major role. A similar artefact might occur if phase information was captured more accurately for the ARIb than the ARIc via the phasing program SHAPEIT [20]. yəni. the ARIbs’ inferred haplotypes may have fewer “switch errors”, which in turn could lead to them appearing relatively more genetically homogeneous. In fact, better phasing for the ARIb might be expected if they are less genetically diverse than the ARIc, consistent with a bottleneck in the Blacksmiths and the MA hypothesis. However, we note that the average sizes of contiguous DNA segments painted by a single donor haplotype as inferred by CHROMOPAINTER were very similar when forming the ARIc or the ARIb using the non-Ari groups as donors (S9 Table), suggesting higher levels of phasing errors or other genotyping inconsistencies in the ARIc relative to the ARIb are not playing a major role. Furthermore our IBD sharing analysis ignoring phase information gave a similar conclusion of greater homogeneity among ARIb relative to ARIc (S13 Table).

CHROMPAINTER analyses (B) and (C) suggest that the ARIb and ARIc are roughly equally related to all other sampled non-Ari groups. There is some ability to tell the two groups’ inferred ancestries apart under these analyses (e.g. S8 Fig), though we note that these differences are small relative to those between all other sampled groups (Fig 3, S15 and S16 Tables). Strong bottleneck effects in the Blacksmiths can result in their appearing genetically distinct from the Cultivators even under analyses (B)-(C), plausibly over a short time period depending on the strength of the bottleneck, which we try to account for by considering variation in inferred ancestry patterns among individuals’ chromosomes within each Ari group. Increasing the number of sampled individuals from each group (Ari or otherwise) could further increase the power to distinguish Ari groups under these approaches to shed further light on the MA versus RN hypotheses. Increasing the number of outside groups used to describe the Ari ancestry might increase power as well, though likely only if incorporating additional geographically near groups, given that other world-wide groups are not featured prominently in analysis (B). In particular our GLOBETROTTER results under analysis (A) suggest that in addition to admixture from “West Eurasia”, there is admixture in both Ari groups from a source best represented by the Ari out of all of our sampled groups. Further dense sampling of Ethiopia might enable a better genetic description of this group, helping to confirm whether it is the same admixing source for the ARIb and ARIc and whether there were multiple episodes of admixture from varying sources over different time periods. In addition, as GLOBETROTTER is more likely to pick up recent signals over older ones, increased sample sizes might enable detection of any potential older intermixing between the ARIb and ARIc under a hypothetical RN setting.

Using more dense genetic data, e.g. from sequencing, might also increase power in a similar manner. Acquiring sequenced individuals from each Ari group would have the additional benefit of allowing inference of the split time between the two groups using pairwise sequentially Markovian coalescent (i.e. PSMC and MSMC) techniques [35, 36, 37]. For example, a recent study applying these approaches to individuals sampled from Ethiopian groups included in this paper suggested one such group, the Gumuz (GUM in our study), split from each of four other Ethiopian groups (Amhara, Ethiopian Somali, Oromo, Wolayta) ≈20–40K years ago [38]. While that study did not include data from Blacksmiths or Cultivators, given that genetic differences are substantially larger between GUM and each of relative to differences between ARIb and ARIc in our analysis (C) (S15 and S16 Tables), it is plausible that 40kya provides a very conservative upper bound for the split time of Blacksmiths and Cultivators. Our attempts to refine this upper bound do not use the rich information from sequencing but are consistent with the bottleneck in the Blacksmiths occurring more recently than the “West Eurasia” admixture event, i.e. within the last ≈4,500 years, although this analysis may be influenced somewhat by a lack of power as discussed above. Evidence for the origins of blacksmithing in Ethiopia remain incomplete, but iron and bronze objects were first discovered on sites from the pre-Aksumite period, suggesting the existence of such practices in the mid to first Millennium BC [39, 40]. Therefore our results are consistent with the start of genetic isolation between Blacksmiths and Cultivators corresponding roughly to a time period near the introduction of blacksmithing in the region.

Our findings serve as a cautionary tale for over-interpreting clustering, e.g. ADMIXTURE plots or results from other unsupervised learning techniques applied to genetic data. In particular the ADMIXTURE plots appear similar in each of the “MA” and “RN” simulation scenarios in this case (S6 Fig), though the two hypotheses reflect very different ancestral histories. Previous studies have shown that individuals from a single genetically isolated group can be grouped into a distinct homogeneous cluster by these algorithms, for example the Kalash in an application of STRUCTURE to world-wide populations [41]. We believe a similar effect is causing the Blacksmiths to all be assigned to a single cluster here, although in this case one that is shared by nearby populations. In general this suggests that if such a homogeneous cluster is observed, one should check whether the individuals in the cluster appear to be more genetically homogeneous than the other sampled individuals, particularly when clustering individuals from isolated or geographically localised groups. If so, further investigations such as those performed here are warranted.

Importantly, a comparison of approaches here (analogous to supervised ADMIXTURE [42]) allows us to distinguish genetic structure attributable to bottleneck effects within a population from that attributable to shared ancestry with outside groups. In particular, after accounting for “self-copying” or high levels of genetic similarity within the ARIb (analysis (A)), we demonstrate that the ARIb and ARIc look genetically similar in terms of shared ancestry with other sampled groups (analyses (B)-(C)). A more parsimonious explanation for this observation favours the Marginalisation model over the Remnants hypothesis, and helps towards resolving a long-standing controversy on the origins of different Ari caste-like occupational groups [1]. Furthermore, this provides evidence that a societal practice, namely the marginalisation of artisan communities, can drive strong genetic differences (FST = 0.02 − 0.04) between groups without involving any outside introgression and possibly occurring within the last 4,500 years.

It is straight-forward to apply these models to samples from other geographic regions, and may be particularly helpful in similar cases where different groups might be subjected to strong isolation effects driving genetic differences due to societal divisions, such as in India [43]. Such careful analyses can help to resolve major questions about whether genetic diversity is primarily driven by ancient demography or by more recent factors such as admixture, social exclusion and drift.


Cins Gallus is distributed across a large part of Southeast Asia and has received special interest because the domestic chicken, Gallus gallus domesticus, has spread all over the world and is a major protein source for humans. There are four species: the red junglefowl (G. gallus), the green junglefowl (G. varius), the Lafayette’s junglefowl (G. lafayettii) and the grey junglefowl (G. sonneratii). The aim of this study is to reconstruct the history of these species by a whole genome sequencing approach and resolve inconsistencies between well supported topologies inferred using different data and methods.

Using deep sequencing, we identified over 35 million SNPs and reconstructed the phylogeny of the Gallus genus using both distance (BioNJ) and maximum likelihood (ML) methods. We observed discrepancies according to reconstruction methods and genomic components. The two most supported topologies were previously reported and were discriminated by using phylogenetic and gene flow analyses, based on ABBA statistics. Terminology fix requested by the deputy editor led to support a scenario with G. gallus as the earliest branching lineage of the Gallus genus, instead of G. varius. We discuss the probable causes for the discrepancy. A likely one is that G. sonneratii samples from parks or private collections are all recent hybrids, with roughly 10% of their autosomal genome originating from G. gallus. The removal of those regions is needed to provide reliable data, which was not done in previous studies. We took care of this and additionally included two wild G. sonneratii samples from India, showing no trace of introgression. This reinforces the importance of carefully selecting and validating samples and genomic components in phylogenomics.


Giriş

Islands are excellent models for the study of evolutionary processes (MacArthur and Wilson, 1967 Losos and Schluter, 2000 Vellend, 2003). Numerous studies have focused on island systems to quantify the relative roles of colonization, extinction and isolation in shaping island diversity (Mayr, 1963 Jaenike, 1973 Abbott and Grant, 1976). These studies have typically examined the interplay of these processes as determinants of species richness (MacArthur and Wilson, 1967 Losos and Schluter, 2000 Whittaker et al., 2001 Ricklefs and Bermingham, 2004). However, more recently, island studies have focused on the roles of the parallel processes of drift and island isolation in the evolution and genetic differentiation of single species distributed on multiple islands (Frankham, 1997 Calsbeek and Smith, 2003 Vellend, 2003 Grazziotin et al., 2006 Jordan and Snell, 2008).

When populations of a species occur both on islands and on the coast, we can predict levels of intraspecific genetic diversity on islands based on their area and distance from coastal source populations (Jaenike, 1973 Frankham, 1997 Vellend, 2003). As in classic island biogeography theory, the predictions will vary with the dispersal ability of the organism. If dispersal to islands is rare, and hence island populations experience negligible migration, we expect lower genetic diversity in island populations relative to larger, coastal populations due to genetic drift (Frankham, 1997). Similarly, islands that are more distant from the coast should receive fewer migrants and less influx of genetic diversity. Therefore, the effects of drift will be intensified when founding populations are small, when islands are small in area and when islands are far from the mainland source population (Jaenike, 1973 Frankham, 1997 Clegg et al., 2002a Velo-Antón et al., 2012).

Tests of these genetic predictions on island populations have been done primarily on oceanic islands (Frankham, 1997 Clegg et al., 2002a Calsbeek and Smith, 2003). However, more recently studies have also focused on taxa inhabiting continental islands (Gill, 1980 Bittkau and Comes, 2005 Jordan and Snell, 2008 Velo-Antón et al., 2012). In contrast to oceanic islands that are formed de novo by volcanic activity, continental islands were once continuous with continental landmasses and are formed by sea level changes that isolate the highest points on the edge of the continental shelf. Therefore, the evolutionary dynamics of populations on continental islands are likely very different from those on oceanic islands. The formation of continental islands necessarily fragments species’ ranges thus, although populations will be reduced in size and genetic drift will be increased due to population bottlenecks, the founding island population occurs through vicariance isolation, rather than a founding event by one or few immigrants from a mainland source population. Nonetheless, if the population remaining at the time of vicariance is small, and migration is sufficiently low, the predictions of island size and genetic diversity should hold, because smaller islands will support populations with lower sizes, and those populations will lose genetic diversity more rapidly due to drift (Frankham, 1996). Indeed, continental island populations examined to date show the expected pattern of reduced genetic diversity (Bittkau and Comes, 2005 Velo-Antón et al., 2012).

Migration patterns may also differ between continental and oceanic islands, because continental islands, by their nature, are generally closer to coastal landmasses. Migration between continental islands and the mainland may be more common, while species on oceanic islands that exist along an archipelago can exhibit gene flow among adjacent islands (Illera et al., 2007 Clegg and Phillimore, 2010 Illera et al., 2014 Bell et al., 2015a, 2015b). This distinction is a generalization the migration levels in both oceanic and continental islands will depend on the dispersal ability of particular colonizing organisms and the degree to which marine environments act as barriers to dispersal. If marine dispersal is unlikely, then we predict that smaller islands and those further from the coast will receive fewer migrants, and as a result, genetic drift will be the dominant force shaping the genetic diversity of those isolated populations. Bittkau and Comes (2005) reported low rates of marine dispersal and high drift in the Aegean Nigella arvensis alliance, a group of annual plants distributed in the Aegean archipelago. However, if marine dispersal is sustained after isolation of continental islands, then we expect genetic diversity in island populations to approximate levels observed in populations on the coast.

Amphibians are poor dispersers across marine environments because of their inability to osmoregulate in saltwater (Duellman and Trueb, 1994). Therefore, the general assumption is that island populations of amphibians are completely isolated at the time of vicariance during formation of continental islands (Richards and Moore, 1996 Brown and Guttman, 2002). This isolation scenario seems to hold for some continental island dwelling amphibians: a recent study of fire salamanders showed a reduction of genetic diversity on insular populations indicating that these populations evolved in isolation without any subsequent marine dispersal events (Velo-Antón et al., 2012). However, some studies indicate that amphibians are in fact able to disperse to islands (Seppa and Laurila, 1999 Evans et al., 2003 Vences et al., 2003), although the exact mechanism of dispersal is unknown. In this study, we examine the population genetics of Thoropa taophora, a frog species endemic to the Atlantic Coastal Forest of Brazil (Feio et al., 2006) that inhabits rocky coastal shores and has some physiological tolerance to seawater (Bokermann, 1965 Sazima, 1971 Abe and Bicudo, 1991 Brasileiro et al., 2010).

We focused on a series of continental islands that flank the southeast coast of Brazil. These islands were formed by historical marine incursions due to glaciation events, tectonic activities and coastal erosion dynamics (Suguio and Martin, 1978). Geologic records show evidence of repeated incursions since the Pleistocene, with the last major incursion occurring in the past 15 000 years (Suguio et al., 2005). During this last transgressive phase, coastal sea levels rose over 100 meters to reach present levels (Suguio et al., 2005). This incursion isolated present-day continental islands and likely fragmented the ranges of several Atlantic Coastal Forest species, including our focal species. Studies of other species endemic to this region show a reduction of genetic diversity in island species or populations relative to those on the mainland (Grazziotin et al., 2006 Bell et al., 2012). Here, we build on these studies by investigating fine-scale genetic diversity in an organism that exhibits tolerance to saltwater and thus may be capable of dispersing to continental islands.

We used nuclear microsatellite markers to examine the genetic diversity of coastal and island populations of Thoropa taophora. Our goals were to quantify (1) differences in genetic diversity of populations along the coast and on continental islands due to past vicariance and island isolation, (2) the genetic consequences of island area and distance from coast and (3) marine migration rates between coastal and island populations. Our study focuses on the microevolutionary processes contributing to the genetic patterns in continental island populations. We discuss our results in light of processes that are specific to continental islands, including the extent of genetic bottlenecks during population vicariance and the potential genetic contributions resulting from migration from nearby coastal populations.


Videoya baxın: changer le circuit de charge tecno pop 2 (Avqust 2022).