Məlumat

Müqayisəli təkamül tədqiqatı: amin turşusu və ya nukleotidlərin müqayisəsi daha faydalıdır?

Müqayisəli təkamül tədqiqatı: amin turşusu və ya nukleotidlərin müqayisəsi daha faydalıdır?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Mən lisey şagirdiyəm və hazırda biologiyada təkamül əlaqəsini öyrənirəm.

Müəllimim dedi ki, amin turşusu ardıcıllığının müqayisəli tədqiqi nukleotid ardıcıllığının müqayisəli tədqiqindən daha faydalıdır, çünki genetik kod təbiətdə degenerativdir - bir neçə kodon eyni amin turşusunu kodlaya bilər.

Ancaq mən sadəcə məntiqi başa düşə bilmirəm.

Bir neçə kodon eyni amin turşusunu kodlaya bildiyinə görə, mən (riyaziyyat adamı kimi) nukleotid ardıcıllığının amin turşusu ardıcıllığına çevrilməsini qeyri-inyeksiya funksiyası hesab edirəm və beləliklə, məlumat itkisidir.

(Analogiya: funksiyanı nəzərdən keçirin $f(x)=x^2$. Təsəvvür edin ki, bir nömrəniz var və onu daxil edirsiniz $f(x)$ almaq $1$ çıxış kimi. Orijinal nömrənin olub olmadığını heç vaxt bilməyəcəksiniz $1$ və ya $-1$.)

Ona görə də tam əks nəticəyə gəlirəm. Nəticələrim doğrudur, yoxsa yox və niyə?


Baxdığınız zaman çərçivəsindən asılı olaraq hər birinin öz faydası var. Təkamül tədqiqatları üçün variasiya lazımdır, lakin o qədər də variasiya deyil ki, eyni mövqedə bir əvəzetmə əvvəlki əvəzetmənin üzərinə yazır. Beləliklə, yüz milyonlarla il ərzində dərin bölünmələrə baxırsınızsa, amin turşularının daha etibarlı olması ola bilər. Ancaq siz haqlısınız ki, onlar funksional olaraq səssiz əvəzetmələrdən (amin turşusunu dəyişməyən nukleotid dəyişiklikləri) daha vacib olduğundan, amin turşularının müstəqil olaraq eyni vəziyyətdə birləşməsi mümkündür. Nukleotidlər də bunu edir. Hər ikisi eyni saytda çoxsaylı dəyişikliklərin mümkünlüyünü özündə cəmləşdirən statistik modellər (maksimum ehtimal) tələb edir. Əgər son təkamül parçalanmalarına baxırsınızsa, müqayisə etmək üçün kifayət qədər (və ya hər hansı) amin turşusu dəyişikliyi olmaya bilər, buna görə də bu halda nukleotidlər daha yaxşı olardı. Siz kontinental sürüşməni saniyəölçən və ya radiometrik tarixlə 100 metrlik məsafəni ölçməzdiniz.


Cavab

Düzdür, nukleotid ardıcıllığının konseptual şəkildə amin turşusu ardıcıllığına çevrilməsinin məhsulu birincidə mövcud olan müəyyən məlumatların itirilməsi ilə nəticələnir. Bunun bariz nümunəsi odur ki, iki fərddə eyni zülalın amin turşusu ardıcıllığı eyni ola bilər, lakin ola bilər. səssiz DNT-dəki mutasiyalar və bunlar əcdadların axtarışında faydalı ola bilər. Crick's-in bir hissəsi Mərkəzi dogma zülaldan DNT-yə keçə bilməyəcəyiniz barədə heç bir arqument ola bilməz, çünki genetik kodlu və ya genetik kod olmadan nukleotid ardıcıllığı üçün məlumat zülalda yoxdur.

Lakin…

Ardıcıllığı simvolların riyazi ardıcıllığı kimi qəbul etsək, bir amin turşusu ardıcıllığı, mənşəyi olduğu gendə olmayan məlumatları ehtiva edir. Və 4 əvəzinə 20 hərflə bu yeni məlumat fərqli (və daha böyük) mürəkkəbliyə malikdir. Səhv, genetik kodun məlumatının nukleotid ardıcıllığına xas olması ilə bağlı açıqlanmayan bir fərziyyədir. Bu deyil. Bəli, əgər genetik kod haqqında məlumatımız varsa, o zaman nukleotid ardıcıllığı da amin turşusu ardıcıllığının məlumatına malikdir, lakin bu, praktiki sual deyil.

Belə ki (plakata müraciət edərək) praktiki hallarda əksər hallarda məktəb müəlliminiz doğru deyir. Mən riyaziyyatçı deyiləm, ona görə də sizin arqumentinizin qüsurunun nə olduğuna əmin ola bilmirəm. Ola bilsin ki, ardıcıllıq müqayisəsində məlumatın yalnız bir alt bölməsindən istifadə edilə bilər, bəlkə də 20-lik çoxluqdan bir simvol yaratmaq üçün qeyri-injektif funksiyanızdakı dörd dəstdən üç simvoldan danışırsınız, və ya bəlkə də biologiyadır. Bu sizin üçün bir şeydir. Ancaq nəticələriniz səhvdirsə (ki bunlardır) məntiqinizdə bir qüsur olmalıdır)

Məsələ ilə bağlı sual

Praktik sual məsələ budur:

İki orqanizmin təkamül əlaqəsini təyin etmək üçün hansı daha uyğundur - funksional olaraq oxşar zülalın (məsələn, sitoxrom) amin turşusu ardıcıllığının ikili müqayisəsi. c) və ya müvafiq genin nukleotid ardıcıllığından?

General cavab edir:

Bu, orqanizmlərin qohumluğundan asılıdır, lakin çox yaxın qohumluq (məsələn, insanlar və neandertallar) və ya müəyyən ixtisaslaşmış problemlər istisna olmaqla, cavab çox güman ki, ola bilər. amin turşusu ardıcıllığı.

Bu necə ola bilər?

Orqanizmlər arasındakı təkamül məsafəsi ilə əlaqədar olaraq, nukleotidlərin və amin turşularının mutasiyaya uğradığı müxtəlif sürətləri və hansı mutasiyaların baş vermə ehtimalı ilə bağlı məhdudiyyətləri nəzərə almaq lazımdır. Əgər mutasiya sürəti çox sürətli olarsa, zaman fərqi olacaq, bundan sonra onların təkamül divergensiyasını dəqiq hesablamaq və nəticədə hətta aralarındakı hər hansı əlaqəni aşkar etmək çətin və ya qeyri-mümkün olacaq.

Nukleotidlər amin turşularından daha sürətli mutasiyaya uğrayır və praktikada nukleotid ardıcıllığının müqayisəsi daha uzun müddətlər üçün amin turşusu ardıcıllığının müqayisəsindən daha az faydalıdır.

  1. Genetik kodun degenerasiyası səbəbindən (bir amin turşusunun birdən çox üçlü nukleotidlə kodlana bilməsi) amin turşusu ardıcıllığına təsir etmədən bir və ya iki nukleotidin mutasiyaya uğraması mümkündür. (Və ardıcıllıqlar arasındakı oxşarlıq hərf-hərf müqayisəsindən hesablanır.)

  2. Statistika mənim üçün deyil, ümumi mənada, yalnız dörd əsas olduğundan, iki nukleotid ardıcıllığı arasında 25% eyniliyin təsadüfən meydana gəlməsi gözlənilir, halbuki 25% eyni olan iki amin turşusu ardıcıllığı statistik cəhətdən əhəmiyyətli dərəcədə oxşar olacaqdır. 20 amin turşusu var. (Yalnız 5% şəxsiyyət təsadüfən yaranır.)

Amin turşusu ardıcıllığının ayrı-seçkiliyinin təkamül müqayisəsi üçün faydalı olan daha bir aspekti var və bu, amin turşularının mutasiyasının təbiətinin nukleotidlərə nisbətən daha məhdud olmasıdır. Etiraf etmək lazımdır ki, purin-purin və ya pirimidin-pirimidin mutasiyaları purin/pirimidin mutasiyalarından daha tez-tez olur, lakin amin turşusu mutasiyaları çox vaxt amin turşusu zülalda rol oynayır. Bununla belə, a-nı əldə etmək üçün müxtəlif amin turşusu mutasiyalarının olma ehtimalının empirik matrislərini qurmaq olar daha incə və dəqiq əlaqənin qiymətləndirilməsi.

Praktikada bunun mənası odur ki, amin turşusu ardıcıllığının müqayisəsi üçün eynilik üçün 1 və ya qeyri-identifikasiya üçün 0 olan bir qiymətləndirmə sistemindən istifadə etmək əvəzinə, "yarım qiymətlər" verən bir qiymətləndirmə sistemindən istifadə etmək olar. ) struktur/funksional oxşarlıq üçün. Beləliklə, 5% eyniliyə malik iki amin turşusu ardıcıllığının ümumi daha yüksək "oxşarlıq" balı səbəbiylə əlaqəli olduğu göstərilə bilər.

Əlavə 1: Ardıcıllığın müqayisəsi

Anlamaq lazımdır ki, nukleotid və ya amin turşusu ardıcıllığında nə qədər çox məlumat olsa da, yalnız təkamül fərqlərinin müəyyən edilməsinin praktiki üsullarında faktiki olaraq istifadə olunan məlumat aktualdır. Bu üsullara iki (və ya daha çox) ardıcıllığın nə qədər oxşar olduğu sualına cavab vermək üçün ardıcıllığı riyazi alqoritmlərə uyğun müqayisə edən kompüter proqramları daxildir. Beləliklə, amin turşusu ardıcıllığının ümumiyyətlə gen ardıcıllığından hesablanmasından asılı olmayaraq, sual "ən yaxşı müqayisə əldə etmək üçün proqrama nukleotid və ya amin turşusu ardıcıllığını daxil etməliyəmmi?". Məhz bu kontekstdə dəyişiklik sürəti və qarşılıqlı çevrilmə ehtimalı ilə bağlı yuxarıdakı qeydlər nəzərə alınmalıdır.

Ardıcıl müqayisə üçün qabaqcıllardan birinin məqaləsindən sitat gətirmək üçün W. R. Pearson:

“Protein (və tərcümə edilmiş DNT) oxşarlıq axtarışları DNT:DNT axtarışlarından daha həssasdır. DNT:DNT düzülüşü, zülal:protein və ya tərcümə edilmiş DNT:zülal düzülüşündən 5-10 dəfə daha qısa təkamül geriyə baxma müddətinə malikdir. DNT: DNT düzülmələri 200-400 milyon ildən çox divergensiyadan sonra nadir hallarda homologiyanı aşkar edir; zülal: zülal düzülmələri müntəzəm olaraq 2,5 milyard ildən çox əvvəl ortaq əcdadı paylaşan ardıcıllıqlarda homologiyanı aşkarlayır (məsələn, insanlardan bakteriyalara). Üstəlik, DNT:DNT uyğunlaşma statistikası zülal:zülal statistikasından daha az dəqiqdir; gözlənilən dəyərləri < 0,001 olan zülal: zülal düzülmələri homologiya, DNT: DNT ekspeksiyası dəyərlərinin < 10 olması üçün etibarlı şəkildə istifadə edilə bilər.−6 tez-tez təsadüfən baş verir və 10−10 DNT:DNT axtarışlarına əsaslanan homologiya üçün daha geniş qəbul edilən hədddir.”

Vikipediyada ardıcıl düzülmə, BLOSUM və PAM matrislərinin istifadəsi haqqında məqalələr var. Berqdə ardıcıllıqla düzülmə bölməsi və b. online - nukleotid ardıcıllığı deyil, amin turşusunu ehtiva edir - də maraq doğura bilər.

Əlavə 2: Terminologiya və anlayışlar

Termin olaraq, Genetik kod, sualın redaktə olunmamış variantında sui-istifadə edilib - və mətbuatda geniş şəkildə sui-istifadə olunub - mən fikirləşdim ki, terminlər lüğəti faydalı ola bilər

DNT (hansı ki genom və onun tərkib hissəsidir genlər qurulur) 4-dən ibarət xətti polimerlərdir nukleotidlər. Bunların sırası adlanır nukleotid ardıcıllığı, və ya, yeganə purin və ya pirimidin bazası nukleotidlər arasında dəyişdiyi üçün, əsas ardıcıllıq.

Zülallar 20* xətti polimerlərdir amin turşuları. Bunların sırası adlanır amin turşusu ardıcıllığı.

Genetik Kod şifrədir - və üç nukleotidin 64 üçlüyü ilə 20 amin turşusu və bu nukleotidlər genin tərcümə oluna bilən hissəsinin bir hissəsi olduqda üç dayanma siqnalı arasındakı uyğunluğu göstərən cədvəl kimi təqdim edilə bilər. Genetik kod orqanizmlər arasında yüksək dərəcədə qorunur, lakin tamamilə deyildir (və mitoxondrial DNT ilə kodlanmış zülallar üçün fərqlidir).

In YOX vəziyyətlər söz ola bilər Genetik kod sinonimi kimi istifadə oluna bilər Genom, baxmayaraq ki, bu, hətta elmi mətbuat tərəfindən də sui-istifadə edilir və kompüter proqramçıları üçün kodlaşdırma təlimatlarının məhsulu üçün 'kod' adının istifadə edildiyi bir sahədə işlədikləri kimi işləmək çətin olur.

*Genetik kod müəyyən bir plastikliyə malikdir və iki əlavə amin turşusu müəyyən şəraitdə sonlanma kodonları ilə kodlaşdırıla bilər.


Abyssal və hadal balıqlarının mədə tərkibi və amin turşusu izotoplarının analizi ilə müqayisəli qidalanma ekologiyası

Mariana və Kermadec xəndəklərindən (Liparidae) iki hadal balığının trofik ekologiyasını təsvir edir.

Yırtıcı balıqlar xəndəklərdə xırda xərçəngkimilərin biokütləsinin artmasına görə üstünlük əldə edə bilər.

Abissal makrouridlərdəki mənbə amin turşularının aşağı δ 15 N dəyərləri yuxarı okeandan qaynaqlanan qida şəbəkəsini göstərir.

Abissal-hadal sərhəddində balıq icmasının strukturunda trofik ekologiyanın rolunu aydınlaşdırır.


Müqayisəli təkamül tədqiqatı: amin turşusu və ya nukleotidlərin müqayisəsi daha faydalıdır? - Biologiya

Amin turşuları canlı orqanizmlər tərəfindən zülal yaratmaq üçün istifadə edilən xüsusi üzvi molekullardır. Amin turşularının əsas elementləri karbon, hidrogen, oksigen və azotdur. Bədənimizdə zülal yaratmaq üçün birləşən iyirmi müxtəlif növ amin turşusu var. Bədənimiz əslində bəzi amin turşuları istehsal edə bilər, amma qalanını qidamızdan almalıyıq.

Zülallar amin turşularının uzun zəncirləridir. İnsan orqanizmində minlərlə müxtəlif zülal var. Sağ qalmağımıza kömək etmək üçün hər cür funksiyaları təmin edirlər.

Onlar niyə vacibdir?

Zülallar həyat üçün vacibdir. Bədənimizin təxminən 20%-i zülallardan ibarətdir. Bədənimizdəki hər bir hüceyrə funksiyaları yerinə yetirmək üçün zülallardan istifadə edir.

Zülallar hüceyrə daxilində əmələ gəlir. Hüceyrə zülal əmələ gətirdikdə buna deyilir protein sintezi. Zülalın necə hazırlanacağına dair təlimatlar hüceyrə nüvəsindəki DNT molekullarında saxlanılır. Protein istehsalında iki əsas mərhələ adlanır transkripsiyatərcümə.

Protein istehsalında ilk addım transkripsiya adlanır. Bu, hüceyrənin DNT-nin surətini (və ya "transkriptini") hazırladığı zamandır. DNT-nin nüsxəsi RNT adlanır, çünki ribonuklein turşusu adlanan fərqli bir növ nuklein turşusundan istifadə edir. RNT növbəti mərhələdə istifadə olunur ki, bu da tərcümə adlanır.

Zülal hazırlamaqda növbəti addım tərcümə adlanır. Bu, RNT-nin proteini təşkil edən amin turşuları ardıcıllığına çevrildiyi (və ya "tərcümə edilmiş") zamandır.

  • RNT ribosoma doğru hərəkət edir. Bu tip RNT-yə “xəbərçi” RNT deyilir. mRNA kimi qısaldılmışdır, burada "m" messenger üçündir.
  • mRNT ribosoma bağlanır.
  • Ribosom, kodon adlanan xüsusi üç hərfli "başlanğıc" ardıcıllığını taparaq mRNT-də haradan başlayacağını müəyyənləşdirir.
  • Ribosom daha sonra mRNT zəncirindən aşağıya doğru hərəkət edir. Hər üç hərf başqa bir amin turşusu molekulunu təmsil edir. Ribosom mRNT-dəki kodlara əsaslanaraq bir sıra amin turşuları qurur.
  • Ribosom "dayan" kodunu gördükdə tərcüməni bitirir və zülal tamamlanır.

Nəticələr

Mədəni yer fıstığında toxuma spesifik genlər

Becərilmiş yerfıstığı üçün 22 RNT seq məlumat dəstindən cəmi 3191 toxuma spesifik gen müəyyən edilmişdir (Cədvəl S1). Ən çox toxuma spesifik genlər ginesium toxumasında, ən az toxuma spesifik genlər isə şitil yarpaq toxumasında ifadə edilmişdir (şək. 1). Onlarda ifadə olunan toxuma-spesifik genlərin sayına görə sıralanan toxumaların azalan sırası ginecium, kök, nodul, Pattee 5 toxum, reproduktiv tumurcuq, Pattee 6 toxum, əsas gövdə yarpağı, sonrakı yarpaq, Pattee 8 toxum, periant, sap, Pattee idi. 7 toxum, Pattee 3 pod, hava gynofores, Pattee 5 pericarp, vegetativ tumurcuq, androecium, yeraltı jinofor, Pattee 6 pericarp, Pattee 1 pod, Pattee 10 toxum və şitil yarpaq toxuması (Şəkil 1). Yarpaq, tumurcuq, ginofor, pod, perikarp və toxum üçün RNT-seq məlumatları müvafiq olaraq üç, iki, iki, üç, iki və beş inkişaf mərhələsinə təsnif edilə bilər (Şəkil 1 və Cədvəl S1). Fərqli inkişaf mərhələləri fərdi toxumalar kimi nəzərə alınarsa, biz müvafiq olaraq doqquz yarpaq spesifik, on yeddi tumurcuq spesifik, iki ginofor spesifik, dörd pod spesifik, üç perikarp spesifik və iyirmi beş toxum spesifik gen əldə edə bilərik (Cədvəl). S2). Bu işdə biz analiz səviyyəsi olaraq toxumaların müxtəlif inkişaf mərhələlərindən istifadə etdik, çünki genlər məkan və zaman ifadəsində dəyişə bilər. Cinsi spesifik genlər sonrakı mərhələlərdə ifadə edilmədən müəyyən bir inkişaf mərhələsində ifadə edilə bilər 1 . (Bu genlər Cədvəl S2-də əlavə material kimi mövcuddur və becərilən fıstıqda məkan və müvəqqəti gen ifadə nümunələri üzərində tədqiqat üçün faydalı ola bilər).

Mədəni yer fıstığında toxuma spesifik genlərin sayı.

Bunun əksinə olaraq, 22 toxuma arasında eyni vaxtda ifadə edilən 38,745 gen tapdıq, bundan sonra ümumi genlər hesab olunur. Yetişdirilən fıstıq, iki əcdadının genlərinin sayına əsaslanaraq, təxminən 78.574 kodlaşdırma ardıcıllığına (CDS) malikdir. Arachis duranensis (36,734 gen) və Arachis ipaënsis (41.840 gen) 11 . Buna görə də, becərilən yerfıstığında toxuma spesifik genlər ümumi genlərin 4.06%-ni (78.574-dən 3.191-i), ümumi ifadə olunan genlər isə ümumi genlərin 49.31%-ni (78.574-dən 38.745) təşkil edir. Bundan əlavə, 1357 toxuma spesifik gen və 18627 ümumi gen əldə edilmişdir. A. duranensis, becərilən fıstıq genlərinin 1,73%-ni (78,574-dən 1,357) və 23,71%-ni (78,574-dən 18,627) təşkil edir. Eynilə, 1834 toxuma spesifik gen və 20117 ümumi gen əldə edilmişdir. A. ipaënsis, becərilən fıstıq genlərinin 2,32%-ni (78574-dən 1834-ü) və 25,60%-ni (78574-dən 20117) təşkil edir. Toxuma spesifik və ümumi genlər A. ipaënsis olanlardan çox idi A. duranensis. Bu, daha çox gen təkrarlanması hadisəsi ilə uyğundur A. ipaënsis içində olduğundan A. duranensis 11. Toxumalara xas genlər daha sonra cinsə spesifik və somatik toxuma spesifik genlərə təsnif edildi. Bu tədqiqatda cinsə xas genlər xüsusi olaraq ginoesium və androsium toxumalarında, somatik toxumaya xas genlər isə digər 20 toxumadan birində xüsusi olaraq ifadə edilmişdir. Cins və somatik toxuma spesifik genlər becərilən fıstıq genlərinin 0,66%-ni (78,574-dən 522) və 3,40%-ni (78,574-dən 2,669) təşkil edib. Cinsi spesifik və somatik spesifik genlər A. duranensis becərilən fıstıq genlərinin müvafiq olaraq 0,28%-ni (78574-dən 218-ni) və 1,45%-ni (78574-dən 1139) təşkil etmişdir. Cinsi spesifik və somatik spesifik genlər A. ipaënsis becərilən fıstıq genlərinin müvafiq olaraq 0,39%-ni (78574-dən 304-ü) və 1,95%-ni (78574-dən 1530-unu) təşkil etmişdir.

Toxuma spesifik genlərin gen ifadə səviyyələri ümumi genlərdən əhəmiyyətli dərəcədə aşağı idi (Mann-Whitney U testi, P < 0,01). Gen ifadə səviyyələri 22 toxuma arasında əhəmiyyətli dərəcədə fərqlənirdi (Kruskal-Wallis testi, Ki-kvadrat = 486.63, P < 0,05). Onu da qeyd etmək lazımdır ki, cinsin spesifik gen ifadə səviyyələri somatik toxuma spesifik genlərdən əhəmiyyətli dərəcədə yüksək idi (Mann-Whitney U testi, P < 0,01). Ginoesium-spesifik gen ifadə səviyyələri androeksium-spesifik genlərdən daha yüksək idi (Mann-Whitney U testi, P < 0,01). Toxumalara xas genlər də müxtəlif toxumalar üçün qeydlər arasında üst-üstə düşür (Şəkil S1). Bu analizlər toxumalara xas genlər arasında funksiyaya xas genlərin çatışmazlığını aşkar etdi. Bundan əlavə, gen ontologiyası (GO) təhlilləri müəyyən etdi ki, bir toxuma müxtəlif bioloji proseslərdə iştirak edən genlər üçün müxtəlif inkişaf mərhələlərində gen ifadəsini nümayiş etdirə bilsə də, eyni bioloji proseslər müxtəlif toxumalar arasında paylaşıla bilər (Şəkil S1). Biz ən çox yayılmış GO kateqoriyalarını 0008270 (sink ionunun bağlanması), 0006355 (transkripsiyanın tənzimlənməsi), 0016021 (transmembran), 0003676 (nuklein turşusu ilə bağlanması), 0005524 (ATP bağlanması), 00551105 (oksidləşmə-reduction) olduğunu tapdıq. (protein bağlanması), və 006508 (proteoliz Şəkil 2). Ətraflı GO annotasiyası Cədvəl S3-də verilmişdir.

Toxuma spesifik genlərdə GO maddələrinin müəyyən edilməsi. Ətraflı GO annotasiyası Cədvəl S3-də verilmişdir.

Toxumalara məxsus təkrarlanan genlər arasında təkamül fərqi

Cəmi 274 tam uzunluqlu dublikat gen cütü becərilən fıstıq RNT-seq məlumatlarından aşkar edilmişdir. K a, K s, və K a/K s dəyərlər 232 dublikat gen cütü arasında hesablanmış və 42 dublikat gen cütü çıxarılmışdır, çünki onların K s dəyərlər 0,01-dən az və ya 0,30-dan böyük idi. -nin orta dəyərləri K a, K s, və K a/K s müvafiq olaraq 0,08, 0,21 və 0,56 idi. Təmizləyici seçim 207 dublikat gen cütünün molekulyar təkamülündə üstünlük təşkil etdi. K a/K s 1-dən kiçik dəyərlər. Bunun əksinə olaraq, müsbət seçim 25 dublikat gen cütlüyündə həlledici qüvvə oynamışdır. K a/K s 1-dən böyük dəyərlər. Qeyd etmək lazımdır ki, bu dublikat gen cütləri, daha yüksək orta göstəricinin təklif etdiyi kimi, bəlkə də adaptiv təkamül keçirmişlər. K a/K s dəyərlər. Eynilə, cinsə meylli genlər arasında adaptiv təkamül aşkar edilmişdir Ektokarp spp. çünki onların müvafiq orta K a/K s dəyəri 0,5 6, 8-i keçib.

Təmizləyici seçimdən keçən dublikat gen cütləri arasında müvafiq olaraq 167 və 40-ı heterojen gen cütləri və homogen gen cütləri idi. Əsasən müsbət seçimlə formalaşan dublikat gen cütləri arasında müvafiq olaraq 16 və 9-u heterojen gen cütləri və homogen gen cütləri idi. Orta K aK s homogen gen cütləri üçün dəyərlər heterojen gen cütləri üçün qiymətlərdən daha aşağı idi (Mann-Whitney U testi, P < 0.05), heterojen gen cütlərinin homogen gen cütlərindən daha sürətli təkamül etdiyini göstərir. Orta K a/K s homogen gen cütlərinin dəyərləri heterojen gen cütlərininkindən daha böyük idi, lakin bu fərq statistik cəhətdən əhəmiyyətli deyildi (Mann-Whitney U testi, P > 0,05). Bundan əlavə, 176 və 19 dublikat gen cütü, müvafiq olaraq, somatik toxuma-spesifik genlərdən və cinsi-xüsusi genlərdən, 37 cüt gen cütü isə bir somatik toxuma-spesifik gendən və bir cinsə xas gendən (somatik-seks-spesifik gen) ibarət idi. ). The K aK s somatik cinsə spesifik dublikat genlərin dəyərləri həm somatik toxuma spesifik genlərin, həm də cinsin spesifik genlərinin dəyərlərini aşdı (Şəkil 3). Bu bir daha onu göstərir ki, heterojen gen cütləri homogen gen cütlərindən daha sürətli təkamül edir. Bundan əlavə, orta K s dəyər cinsə spesifik və somatik toxuma spesifik genlər arasında oxşar idi, lakin orta K a somatik toxuma spesifik genlərin dəyəri cinsi xüsusi genlərin dəyərini aşdı (Şəkil 3). Sinonim əvəzetmə nisbəti cinsə məxsus və somatik toxumaya xas genlər arasında oxşar idi, somatik toxuma spesifik genlərin qeyri-sinonim təkamül sürəti isə cinsin spesifik genlərindən daha sürətli idi. Bununla belə, orta K a/K s somatik toxuma spesifik genlərin və somatik cinsi spesifik genlərin dəyəri cinsə məxsus genlərin dəyərini aşdı, lakin bu fərq statistik cəhətdən əhəmiyyətli deyildi (Şəkil 3 Mann-Whitney U testi, P > 0,05). Buna baxmayaraq, orta K a/K s somatik toxuma spesifik genlərin, somatik cinsin spesifik genlərinin və cinsin spesifik genlərinin dəyərləri müvafiq olaraq 0,59, 0,50 və 0,46 olmuşdur. Ümumilikdə, somatik toxuma-spesifik genlər və somatik-seks-spesifik genlər əsasən rahat seçimdən keçdi, cinsə məxsus genlər isə daha güclü seçmə məhdudiyyəti yaşadılar.

Müqayisə K s, K a, və K a/K s cinsə spesifik, somatik spesifik və somatik cinsi genlərdə təkrarlanan gen cütlərinin.

Toxuma spesifik genlərdə kodon istifadə meyli

Filtrləmə meyarları tətbiq edildikdən sonra, kodon istifadə meylini təhlil etmək üçün cəmi 2,756 ardıcıllıq istifadə edilmişdir. Optimal kodonların tezliyi (Fop) müxtəlif toxuma növləri arasında əhəmiyyətli dərəcədə fərqlənməsə də (Kruskal-Wallis testi, Ki-kvadrat = 22.68, P > 0.05), somatik toxuma spesifik genlərin Fop dəyəri cinsə məxsus genlərdən əhəmiyyətli dərəcədə yüksək idi (Mann-Whitney U testi, P < 0,05). Üstəlik, ginoesium-spesifik genlərin Fop dəyərləri androsium-spesifik genlərinkindən bir qədər, lakin əhəmiyyətli dərəcədə yüksək deyildi (Mann-Whitney U testi, P > 0,05). Bu nəticələr, somatik toxuma spesifik genlərdə kodon istifadə meylinin cinsə məxsus genlərdən daha yüksək olduğunu göstərdi. Bundan əlavə, amin turşusu ardıcıllığının uzunluğu müxtəlif toxumalarda əhəmiyyətli dərəcədə fərqli idi (Kruskal-Wallis testi, Ki-kvadrat = 36.62, P < 0,05). Cinsə spesifik genlərin amin turşusu ardıcıllığı somatik toxuma spesifik genlərinkindən daha uzun idi (Mann-Whitney U testi, P < 0,05), halbuki, ginoesium-spesifik genlərin amin turşusu ardıcıllığı androeksium-spesifik genlərinkindən əhəmiyyətli dərəcədə uzun idi (Mann-Whitney U testi, P > 0,05).


Silikonda BLB Xəstəliklərinə Müqavimət Xa genlərinin xarakteristikası və müqayisəli təhlili Oryza sativa

Necə sitat gətirmək olar: Ramzan, M.A. Asghar, H. Rehman, A. Rashid, M. Jankuloski, L. Silikonda BLB Xəstəliklərinə Müqavimət Xa genlərinin xarakteristikası və müqayisəli təhlili Oryza sativa. Əvvəlcədən çaplar 2020, 2020100472 (doi: 10.20944/preprints202010.0472.v1). Ramzan, M.A. Asghar, H. Rehman, A. Rashid, M. Jankuloski, L. Oryza sativa-da BLB Xəstəliklərinə Müqavimət Xa genlərinin In-silico xarakteristikası və müqayisəli təhlili. Preprints 2020, 2020100472 (doi: 10.20944/preprints202010.0472.v1). Kopyalayın

Sitat gətirin:

Ramzan, M.A.Əsgər, H.Rəhman, A.Rəşid, M.Cankuloski, L. Silikonda BLB Xəstəliklərinə Müqavimət Xa genlərinin xarakteristikası və müqayisəli təhlili Oryza sativa. Əvvəlcədən çaplar 2020, 2020100472 (doi: 10.20944/preprints202010.0472.v1). Ramzan, M.A. Asghar, H. Rehman, A. Rashid, M. Jankuloski, L. Oryza sativa-da BLB Xəstəliklərinə Müqavimət Xa genlərinin In-silico xarakteristikası və müqayisəli təhlili. Preprints 2020, 2020100472 (doi: 10.20944/preprints202010.0472.v1). Kopyalayın


Dəstəkləyici məlumat

Əlavə Fayl S1.

Maksimum ehtimal analizləri üçün əlavə məlumat

Əlavə Fayl S2.

Bayes analizləri üçün əlavə məlumat

Əlavə fayl S3.

Bu tədqiqatda istifadə olunan bütün çoxsaylı ardıcıl düzülmələri və filogenetik ağacları ehtiva edən Zip faylı

Əlavə fayl S4.

Həm IR, həm də IGF1R ektodomenləri üçün Consurf xallarını ehtiva edən Zip faylı

Əlavə fayl S5.

IR üçün Evolutionary Trace nəticələrini ehtiva edən Zip faylı

Əlavə fayl S6.

Normal rejim hesablamaları vasitəsilə əldə edilən PDB strukturlarını ehtiva edən Zip faylı.


Əlaqədar Məlumat

Noroviruslar insanlarda viral qastroenterit epidemiyalarının əksəriyyətinin törədiciləridir. Son 15 il ərzində GGII.4 genotipinin norovirusları viral qastroenteritlərin dörd epidemiya mövsümünə səbəb olub, bu müddət ərzində dörd yeni variant (epidemiya variantları adlanır) yaranıb və rezident virusları sıxışdırıb çıxarıb. Bu epidemiya variantlarının mexanizmlərini və bioloji üstünlüklərini başa düşmək üçün biz bu müddət ərzində GGII.4 ştammlarının kapsid zülallarında genetik dəyişiklikləri öyrəndik. Nümayəndə nümunə Hollandiyada 15 il ərzində sistematik müşahidə zamanı toplanmış 574 GGII.4 epidemiya ştammından götürülüb və kapsid genləri cəmi 26 ştam üçün ardıcıllaşdırılıb. Üçölçülü struktur Norwalk virusundan (Hu/NoV/GGI.1/Norwalk/1968/US) istinad kimi istifadə edilməklə, homoloji modelləşdirmə ilə proqnozlaşdırılıb. Kapsid zülalının çıxıntılı hissəsində mutasiyaların (nukleotid və amin turşusu) yüksək əhəmiyyətli üstünlüklü toplanması və fiksasiyası genetik sürüşmə və seleksiyanın baş verməsi üçün güclü dəlillər təqdim etdi. Sonrakı yeni epidemiya variantları 25-ə qədər amin turşusu mutasiyası ilə fərqlənsə də, ardıcıl dəyişikliklər yalnız beş mövqedə müşahidə edilmişdir. Filogenetik təhlillər göstərdi ki, 2004-cü il variantından daha çox 2002-ci il variantı ilə əlaqəli olan 2006b variantı istisna olmaqla, hər bir variant öz xronoloji sələfindən törəmişdir. Müşahidə olunan genetik tapıntılar və epidemiologiyada dəyişikliklər arasında ardıcıl assosiasiya belə nəticəyə gəlməyə əsas verir ki, GGII.4 norovirus ştammlarının epoxal təkamülündə əhalinin toxunulmazlığı rol oynayır.

1990-cı illərin əvvəllərində viral qastroenterit epidemiyasına nəzarətin başlanğıcından bəri noroviruslar dünya miqyasında kəskin viral qastroenterit epidemiyalarının əsas səbəbi kimi tanınıb. Noroviruslar ailə daxilində bir cins təşkil edir Caliciviridae və genetik və antigen cəhətdən çox dəyişkəndirlər. Hazırda beş fərqli genoqrup (GGs) tanınır. GGI, GGII və GGIV-ə aid olan suşların insanlarda infeksiyaya səbəb olduğu bilinir. GG-lər daha çox genotiplərə bölünmüşdür, 80º (1) tam kapsid ardıcıllığı üzərində minimum amin turşusu ardıcıllığı eyniliyi ilə müəyyən edilmişdir.

Epidemiyaların səbəbi kimi ən çox müəyyən edilən ştamlar GGII.4 genotipinə aiddir. Hollandiyada bu, 12 illik müşahidə zamanı səciyyələnən bütün norovirus epidemiyalarının 68-də və səhiyyə ilə bağlı bütün epidemiyaların 81-də belə olub. 1995-ci ilin yanvarında Hollandiyada ilk dəfə aşkar edildikdən sonra GGII.4 ştammları Hollandiya əhalisi arasında ardıcıl olaraq mövcud olmuşdur (46). Bu müşahidələr dünya üzrə digər müşahidə tədqiqatlarının müşahidələri ilə uyğun gəlir (3, 4, 15, 17, 29, 36, 55).

Son 15 il ərzində 1995-1996, 2002-2003, 2004-2005 və 2006-2007-ci illərin qışlarında dörd epidemiya norovirus mövsümü baş verib. Bu ümumdünya epidemiyaları invariant olaraq üstünlük təşkil edən genotip GGII.4 tərəfindən törədilib və bu genotipin yeni variant soylarının yaranması ilə əlaqələndirilirdi (4, 31, 35, 52, 53). Əvvəllər RNT-dən asılı RNT polimerazın (RdRp) və ya kapsid geninin qismən ardıcıllığı ilə müəyyən edilmiş bu genetik variantlara bütün dünyada bir neçə ad verilmişdir. Burada onlar aşkar edildiyi ilk ildən istifadə edilməklə istinad edilir, lazım olduqda əlavə şəkilçi ilə tamamlanır. Aşağıdakı variantlar müəyyən edilmişdir: �, 1996, 2002, 2004, 2006a və 2006b.

Geniş miqyaslı epidemiyaların ardınca yeni nəsillərin meydana çıxması modeli göstərir ki, yeni variantlar əvvəllər dövriyyədə olan üstünlük təşkil edən variantdan bir və ya bir neçə həlledici üstünlük əldə etmişdir. Bu üstünlüyün mahiyyətinin nə olduğu bilinmir, lakin onun əsası çox güman ki, VP1-də tapıla bilər, çünki bu zülal virusun həyat siklində antigenlik, host spesifikliyi, ana hüceyrənin bağlanması və virus kimi əsas xüsusiyyətlər və funksiyalar üçün lazımdır. giriş xassələri və yeni hissəciklərin yığılması.

Noroviruslar üç açıq oxu çərçivəsinə (ORF) bölünən 𢏇.6 kb-lik müsbət zəncirli RNT genomuna malikdir. ORF1, RdRp də daxil olmaqla, qeyri-struktur zülallara posttranslationally işlənmiş bir poliproteini kodlayır. RdRp daxilində qorunan bölgələr adətən diaqnostik PCR analizləri üçün hədəf kimi istifadə olunur. Hollandiyada İctimai Sağlamlıq və Ətraf Mühit üzrə Milli İnstitutunda (RIVM), bölgə A (nukleotidlər 4279 - 4604 Lordsdale genom nömrələmə [GenBank qoşulma nömrəsi. <"type":"entrez-nucleotide","attrs":<"text ":"X86557","term_id":"1008952","term_text":"X86557">> X86557]) adətən epidemiya ştammlarının genotiplənməsi üçün istifadə olunur. İkinci ORF (ORF2) əsas struktur protein VP1-i kodlayır. Bu kapsid zülalının 90 dimeri Tϓ ikosahedral qabıq əmələ gətirir (41). Virionda ORF3 ilə kodlanmış proteinin az sayda nüsxəsi mövcuddur. Bu zülalın dəqiq rolu aydın deyil, baxmayaraq ki, o, həm VP1 ifadəsinin tənzimlənməsində, həm də kapsid-RNT kompleksinin sabitləşdirilməsində histona bənzər bir protein kimi fəaliyyət göstərir (2, 19, 22).

Noroviruslara qarşı toxunulmazlıq anlayışı məhdud olaraq qalır. Fərqli GG-lər və genotiplər arasında virusa bənzər hissəciklər və poliklonal antiserumlardan istifadə etməklə antigen fərqləri və çarpaz reaktivliklər nümayiş etdirilmişdir (20). Qısamüddətli toxunulmazlıq bildirildi, lakin əvvəlcədən mövcud olan antikorlar eyni genotiplə təkrar infeksiyaya qarşı qoruyucu deyildi (25, 39, 56). Zərərsizləşdirici antikorlara baxan tədqiqatlar hüceyrə mədəniyyətinin və ya kiçik heyvan model sistemlərinin olmaması səbəbindən mümkün olmamışdır (13). Yüksək mutasiya sürəti və rekombinasiya hadisələri nəticəsində müxtəlif GG-lər və hətta eyni GG daxilində genotiplər arasında yüksək səviyyəli genetik müxtəliflik böyük dərəcədə antigen müxtəlifliyinə kömək edir.

Həssaslıqda virus reseptorlarının varlığını və ya olmamasını təyin edən ana genetik faktorlar da mühüm rol oynayır (21, 23). Bu reseptorlar, histo-qan qrupu antigenləri, virusun potensial host hüceyrələrini yoluxdurmaq qabiliyyətini təyin edərək, virus ştamine spesifik bağlanma nümunələri göstərir. GGII.4-ə aid noroviruslar bu günə qədər təhlil edilmiş bütün genotiplərin histo-qan qrupu antigenləri ilə bağlanmanın ən geniş diapazonuna malik olduğundan, bu, bu virusların nisbi uğurunun bir hissəsini izah edə bilər (24). Digər müvəffəqiyyət faktorlarına ev sahibi xaricində viral hissəciklərin daha yüksək sabitliyi, daha yüksək təkrarlanma dərəcəsi və ya daha ətraflı araşdırılması lazım olan digər amillər daxil ola bilər.

Köhnə GGII.4 variantları ilə müqayisədə yeni GGII.4 variantlarının seçmə üstünlüyünün genetik və struktur əsasları haqqında daha çox məlumat əldə etmək üçün biz Hollandiyada aşkar edilmiş GGII.4 norovirus epidemiyası ştammlarının sistematik nümunəsinin tam kapsid ardıcıllığını müəyyən etdik. Viral qastroenteritlərin 13 illik müşahidəsi və onların genetik müxtəlifliyi və proqnozlaşdırılan quruluşu öyrənilmişdir (46). Bu tədqiqatın başlandığı vaxt GGII noroviruslarının yüksək ayırdetmə qabiliyyətinə malik üçölçülü (3D) modeli olmadığından Norwalk virusunun (NV GGI. 1) kapsid zülalı.


Materiallar və metodlar

Məlumat mənbələri

Eksperimental xarakterli zülallar.

Düzensiz zülal ardıcıllıqları eksperimental olaraq müəyyən edilmiş pozulmuş zülalların seçilmiş məlumat bazasından götürülüb, DisProt 3.6 (Vucetic et al. 2005). Cəmi 40,770 qalıq olan 287 nizamsız ardıcıllıq var idi. Hər nizamsız ardıcıllığın uzunluğu ≥30 qalıq idi. Düzensiz ardıcıllıqların orta uzunluğu 142 qalıq və orta 86 qalıq idi. Ən uzun nizamsız ardıcıllıq 2174 qalıqdan ibarət idi. The ordered protein sequences were taken from PDB Select 25, a nonredundant subset of the Protein Data Bank (PDB). This data set was chosen because all proteins share ≤25% sequence identity ( Boberg et al. 1992 Berman et al. 2000). The sequences were selected from structures that were determined by X-ray crystallography and had strong indications of order, with a resolution ≤2Å, an R factor ≤20%, and no missing backbone or side chain atoms ( Smith et al. 2003). The proteins in this data set are ≥80 residues in length and contained no nonstandard residues. There were 289 ordered sequences with a total of 67,548 residues. The ordered sequences had a mean length of 289 residues and a median of 193 residues. The longest ordered sequence was 907 residues. The proteins are listed in supplementary table S1 ( Supplementary Material online).

Families of Related Sequences.

Putative homologs of the experimentally characterized disordered and ordered proteins were identified by performing a basic alignment search tool (BLAST) search with each ordered and disordered sequence against GenBank release 159 ( Altschul et al. 1997 Benson et al. 2008). To ensure quality matches, the maximum allowed e value was 0.0001, and the minimum match length was at least 35% of the length of the query sequence. Match sequences were cropped to the region corresponding to the start and end of the query. Sequences identified as hypothetical, patented, or predicted were removed from the alignments. Only one sequence in a group of sequences with 100% identity was retained so that all sequences in a family were unique.

During this analysis, it was determined that families of proteins from the Human Immunodeficiency Virus, and some other viruses, contained large numbers of similar sequences having a disproportionate effect on the results. Many papers submitting sequences of these viruses obtained them from an individual organism (see for instance [ Huet et al. 1989 Herring et al. 2001]). In order to reduce any undue influence from these families, only one randomly chosen sequence from each referenced paper was included. Unreferenced sequences were not included. The sequences whose families were culled in this way included DP00048, DP00148, DP00160, and DP00424 for the disordered set and 1mml, 1idaa, and 1svb for the ordered set.

Procedure for Developing Matrices

To demonstrate different levels of evolutionary divergence, substitution matrices were developed for three percent identity levels, defined as 85% to <100%, 60–85%, and 40–60% identity ( table 1). The number of gaps of any length in the alignments was minimized to reduce ambiguity while still maintaining enough data for meaningful comparisons. This was achieved by specifying no gaps for matrices with 85% minimum percent identity and no more than four gaps for the 60% and 40% matrices. The maximum number of gaps was set to 4 because it was the lowest number that included the majority of alignments in the 60% and 40% percent identity levels.

Criteria Used to Develop Matrices.

Matrix Label (D/O) Minimum % Identity Maximum % Identity Maximum No. of Gaps Starting Matrix No. of Realignments (D/O)
D85/O85 85 <100 0 BLOSUM62 3/3
D60/O60 60 85 4 First 85%, zero gaps 4/3
D40/O40 40 60 4 First 60%, four gaps 3/3
Matrix Label (D/O) Minimum % Identity Maximum % Identity Maximum No. of Gaps Starting Matrix No. of Realignments (D/O)
D85/O85 85 <100 0 BLOSUM62 3/3
D60/O60 60 85 4 First 85%, zero gaps 4/3
D40/O40 40 60 4 First 60%, four gaps 3/3

Criteria Used to Develop Matrices.

Matrix Label (D/O) Minimum % Identity Maximum % Identity Maximum No. of Gaps Starting Matrix No. of Realignments (D/O)
D85/O85 85 <100 0 BLOSUM62 3/3
D60/O60 60 85 4 First 85%, zero gaps 4/3
D40/O40 40 60 4 First 60%, four gaps 3/3
Matrix Label (D/O) Minimum % Identity Maximum % Identity Maximum No. of Gaps Starting Matrix No. of Realignments (D/O)
D85/O85 85 <100 0 BLOSUM62 3/3
D60/O60 60 85 4 First 85%, zero gaps 4/3
D40/O40 40 60 4 First 60%, four gaps 3/3

Alignments for Counting Substitutions.

Amino acid substitution frequencies were inferred from sequence alignments. Sets of pairwise alignments were created ( fig. 1) such that each sequence of a family was aligned with every other sequence in that family using the Needleman–Wunsch algorithm as implemented by The European Molecular Biology Open Software Suite (EMBOSS)’ needle but modified to perform pairwise comparisons on a group of sequences loaded from a single file ( Needleman and Wunsch 1970 Rice et al. 2000). The gap-opening penalty was 10 and the gap-extension penalty was 0.5. The substitution matrix that was used to initially align the sequences is shown in table 1. The substitution matrix inferred from these alignments was then used to realign the sequences ( fig. 1). This realignment cycle was done for each matrix class and percent identity level until the difference between successive matrices had no individual log odds value changing by more than 1 and there were fewer than 10 log odds values that differed in subsequent iterations. Table 1 shows the numbers of cycles required for each matrix.

Iterative procedure used for constructing substitution matrices.

Iterative procedure used for constructing substitution matrices.

Pairwise alignments were included in counts for a substitution matrix based on two criteria, the percent identity and the number of gaps in the alignment. The process of including an alignment has three steps: 1) Pairwise alignments were performed between a putative family member and a sequence from the experimentally characterized set. If this alignment met the criteria for minimum percent identity and maximum number of gaps, then it was included in the count for a substitution matrix. 2) A family member included at this level was then used to recruit new family members based on pairwise alignments that met the criteria for minimum percent identity. Alignments among these new recruits were included in the count for a substitution matrix when their pairwise alignments with other recruits at the same level also met the criteria for minimum percent identity. 3) New family members identified in step 2 were then used to recruit the next level of family members based on pairwise alignments that met the criteria for minimum percent identity. This last step was repeated until no more alignments were added. At each new level, pairwise alignments between recruits that met the criteria for minimum percent identity were not included if their pairwise alignment with at least one established family member did not meet the criteria for minimum percent identify. Otherwise, sequences with very low percent identities in alignments with the sequence from the experimentally characterized set would be included. Alignments that did not meet the criteria for minimum percent identity were not included, even if these alignments were between established family members.

Calculating Substitution Matrices

Scaling by Family Size.

The amino acid substitutions and matches of all included alignments from each family were tallied and scaled according to family size. Large families have a disproportionate influence on substitution matrices because they increase the number of alignments, and thus the number of counted substitutions, at a rate of n × (n − 1)/2. Ideally, we would like to offset this effect by scaling the increase in number of alignments from a quadratic to a linear function. This was not possible because the system was developed such that the number of sequences did not directly determine the number of alignments. Therefore, the total number of substitutions each family contributed was scaled instead. In the scaling, it is assumed that the substitutions are increasing quadratically and then they are mapped to a linear function. Qoy y be the total number of substitutions for a family the scaled number of substitutions would be x when solving the equation y = x × (x 1)/2. The matrix of scaled substitution counts for that family can then be calculated by multiplying the matrix of raw substitution counts by x/y.

Calculating the Log Odds.

The log odds for the substitution matrices were calculated using the matrix of scaled substitution counts, C. To calculate amino acid frequencies, C was mirrored and values off of the diagonal were halved. Then, the sum of substitution counts of each column was divided by the total substitution counts in C to get the amino acid frequency səhi. To calculate the substitution frequencies qij, each value of C was divided by the total number of substitutions. The observed frequency of substitution qij is divided by the expected frequency səhisəhj to get the odds ratio of that substitution. The log odds value sij of the odds ratio is 2 × log2 of the odds ratio. In the 85% matrices, some of the amino acid substitutions had no counts. This prevented us from calculating their true log odds values, as the log of 0 is infinity. In order to approximate the values for these substitutions, a value that was half of the lowest existing count was used instead. This approximation gave an appropriately lower frequency for that substitution and worked well for scaled substitution counts.

Special treatment was also given to the X (any residue), B (N or D), and Z (Q or E) ambiguity codes. These ambiguity codes are present in a few of the sequences and are included in many substitution matrices. Substitution values between standard residues and the ambiguity codes B and Z were an average of the values for substitutions between their constituent residues and that standard residue. Values of X in the 85%, 60%, and 40% identity class matrices were replaced by the X values in the EMBOSS substitution matrices, EBLOSUM85, EBLOSUM60, and EBLOSUM40, respectively ( Rice et al. 2000).

Comparing Matrices Using the Sum of Off-Diagonal Matrix Values

In order to compare the disordered and ordered matrices calculated at a similar percent identity level, the sum of the off-diagonal values in the substitution matrix was computed. The off-diagonal sum of a substitution matrix's log odds values gives an idea of how unlikely substitutions are overall, separated from the context of the amino acid frequencies. More negative sums indicate substitutions are more unlikely overall for that matrix. A jackknife procedure was used to estimate the variance of this statistic: substitution matrices were calculated leaving out the substitution counts for one family at a time. The statistical difference between the off-diagonal values for disorder and order was then determined using Welch's t-test.


Nəticə

Human UCHL1 is known to play an important role in ubiquitin stability within neurons which is critical for ubiquitin–proteasome system and neuronal survival. Mutations in the human UCHL1 gene have been associated with various neurodegenerative disorders like PD, recessive hereditary spastic paraplegia (SPG79), AD and Huntington’s disease. Considering the indispensable role of the UCHL1 gene product in neuronal physiology and pathophysiology, the current study investigates the sequence evolutionary pattern and structural dynamics of UCHL1. Phylogenetic data suggest the ancient origin of UCHL1 at the root of gnathostomes (jawed vertebrate) history. Furthermore, molecular sequence evolutionary analysis reveals that UCHL1 has remained under strong functional constraints throughout the gnathostomes history which might have discouraged the duplication of this gene in any of the animal lineage analyzed in the present study. Comparative structural analysis of UCHL1 pinpointed a critical protein segment (amino acids 32 to 39 within the secretion site) with crucial implications in evolution and PD pathogenesis through a well known phenomenon of intraprotein conformational epistasis. This critical protein segment of UCHL1 can be targeted for drug designing and investigation for the treatment of PD in future.


Müəllif məlumatı

Michael R. Garvin and Erica T. Prates contributed equally to this work.

Əlaqələr

Oak Ridge National Laboratory, Biosciences Division, Oak Ridge, TN, USA

Michael R. Garvin, Erica T. Prates, Mirko Pavicic, Piet Jones, B. Kirtley Amos, Armin Geiger, Manesh B. Shah, Jared Streich, Joao Gabriel Felipe Machado Gazolla, David Kainer, Ashley Cliff, Jonathon Romero & Daniel Jacobson

The Bredesen Center for Interdisciplinary Research and Graduate Education, University of Tennessee Knoxville, Knoxville, TN, USA

Piet Jones, Armin Geiger, Ashley Cliff, Jonathon Romero & Daniel Jacobson

Department of Horticulture, N-318 Ag Sciences Center, University of Kentucky, Lexington, KY, USA

Lawrence Berkeley National Laboratory, Environmental Genomics & Systems Biology, Berkeley, CA, USA

Nathan Keith & James B. Brown

Department of Psychology, University of Tennessee Knoxville, Knoxville, TN, USA


Əlavə materiallar

The following are available online at https://www.mdpi.com/2073-4425/10/5/355/s1. Figure S1: Chromosomal distribution of GhHH3 genes on different chromosomes of G. hirsutum. A02 to A13 and D02 to D13 represent At and Dt sub-genomes G. hirsutum, respectively Figure S2: Gene structure and domain architecture of GhHH3 genes along with phylogenetic tree constructed by NJ method. (a) Gene structure of all GhHH3 genes with phylogenetic analysis. (b) Domain architecture of GhHH3 genes depicting protein motif distribution Table S1: List of all qPCR primers used in this study. Table S2: Gene ID and proposed names of all observed 19 different plant species including A. thaliana, B. napus, G. arboreum, G. hirsutum, G. max, G. raimondii, M. truncatula, O. sativa, P. trichocarpa, S. bicolor, S. tuberosum, T. cacao, V. vinifera. Z. mays, A. comosus, P. taeda, C. reinhardtii, P. patens, və S. moellendorffii Table S3: Biophysical properties of GhHH3 genes including locus ID, start and end point, strand, CDs (coding sequence), protein length, MW (molecular weight), pl (isoelectric point), gravity values, and predicted subcellular localization Table S4: Genes orthologous/paralogous of in At and Dt sub-genomes of G. hirsutum, G. dendrari (A genome), and G. raimondii (D genome). A total of 81 orthologous/paralogous gene pairs were identified as the result of segmental and whole genome duplication. Further, the Ka/Ks (non-synonymous/synonymous) ratio of all identified orthologous/paralogous gene pairs was calculated Table S5. Promoter cis-element analysis of 34 GhHH3 genlər. Predicted cis-element in the promoters of GhHH3 genes were characterized according to their relevance to growth and development, light, and stress responses as well Table S6. RNA-seq data analysis of 34 GhHH3 genes in two fuzzless/lintless mutants (M1lM2l). Further, genes were categorized on the basis of their up- or downregulated expression in these two mutants.


Videoya baxın: Cins inəklərin yerli iqlimə uyğunlaşdırlması üçün tədqiqatlar aparılır - Kəpəz TV (BiləR 2022).