Məlumat

9.5: Amin turşularının əvəzlənməsi üçün BLOSUM62 qiymətləndirmə matrisi - Biologiya

9.5: Amin turşularının əvəzlənməsi üçün BLOSUM62 qiymətləndirmə matrisi - Biologiya


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

BLASTP axtarışında əldə edilən nəticələr müxtəlif sözlərə ədədi qiymətlər təyin etmək üçün istifadə edilən bal matrisindən asılıdır. Hər klaster və ya blok daxilində
iki zülal düzüldükdə amin turşusu ardıcıllığı ən azı 62% eyni idi. Amin turşusunun dəyişdirilməsi üçün i amin turşusu üçün j, xal ifadə edilir:

harada Pij homoloji zülallarda əvəzlənmə tezliyidir və qi qj verilənlər bazasında i və j amin turşularının tezlikləridir. (1/λ) termini matrisdə inteqral dəyərlər yaratmaq üçün istifadə edilən miqyaslama faktorudur.

Növbəti səhifədəki BLOSUM62 matrisi zülal funksiyasını qorumaq üçün güclü təkamül təzyiqinə uyğundur. Gözlənildiyi kimi, hər hansı bir amin turşusu üçün ən ümumi əvəzedici özüdür. Ümumilikdə, müsbət ballar (gölgələnmiş) mənfi ballardan daha az rast gəlinir, bu, əksər əvəzetmələrin protein funksiyasına mənfi təsir etdiyini göstərir. Ən çox qorunan amin turşuları sistein, triptofan və histidindir ki, onlar da ən yüksək göstəricilərə malikdir. Maraqlıdır ki, bu sonuncu amin turşuları unikal kimyaya malikdir və çox vaxt zülallarda mühüm struktur və ya katalitik rol oynayır.


Qiymətləndirmə matrisi

Ardıcıllığın uyğunlaşdırılmasının məqsədi iki ardıcıllığın "ən oxşar elementlərini" uyğunlaşdırmaqdır. Bu oxşarlığı hansısa formada qiymətləndirmək lazımdır. Məsələn, aşağıdakı iki uyğunluğu nəzərdən keçirin:

Onlar olduqca oxşar görünürlər: hər ikisində bir "indel" və bir əvəzetmə var, sadəcə fərqli mövqelərdə. Ancaq hərfləri simlərin elementləri deyil, amin turşusu qalıqları kimi düşünsək, düzülmə (a) daha yaxşıdır, çünki izolösin (I) və leysin (L) oxşar yan zəncirlərdir, triptofan (W) isə çox fərqlidir. strukturu. Bu fiziki-kimyəvi ölçüdür ki, bu günlərdə lösinin sadəcə olaraq izolösini daha tez-tez əvəz etdiyini söyləməyə üstünlük verə bilərik --- bu müşahidə üçün əsas "səbəb" vermədən.

Hərçənd bunu izah etsək də, mutasiyanın I-i L-yə dəyişməsi və (a)-da olduğu kimi W-nin itirilməsi, W-nin L-yə çevrilməsi və mənim itirilməsindən daha çox ehtimal olunur. Biz gözləyərdik ki, I-dən L-ə dəyişiklik funksiyaya W-dən L-yə mutasiya qədər təsir etməyəcək --- lakin bu, öz mövzusuna layiqdir.

Uyğunlaşdırma ilə əldə edilən oxşarlığı kəmiyyətcə qiymətləndirmək üçün, hesablama matrisləri istifadə olunur: onlar hər bir mümkün əvəzetmə üçün bir dəyər ehtiva edir və uyğunlaşma hesabı hər düzülmüş amin turşusu cütü üçün matrisin girişlərinin cəmidir. Boşluqlar (indels) üçün xüsusi boşluq hesabı zəruridir --- çox sadə bir şey, sadəcə olaraq hər bir indeks üçün sabit bir cərimə hesabı əlavə etməkdir. The optimal uyğunlaşma hizalanma xalını maksimuma çatdıran biridir.

PAM matrislər xal matrislərinin ümumi ailəsidir. PAM deməkdir Percent Aqəbul etdi Mçıxışlar, burada "qəbul edilmişdir" mutasiyanın sözügedən ardıcıllıqla qəbul edildiyini bildirir. Beləliklə, PAM 250 qiymətləndirmə matrisindən istifadə o deməkdir ki, hər 100 amin turşusu üçün təxminən 250 mutasiya baş verə bilər, PAM 10 ilə isə hər 100 amin turşusu üçün yalnız 10 mutasiya qəbul edilir, beləliklə, yalnız çox oxşar ardıcıllıqlar faydalı uyğunlaşma xallarına çatacaqdır.

PAM matrisləri müsbət və mənfi dəyərləri ehtiva edir: düzülmə xalı sıfırdan böyükdürsə, ardıcıllıqlar əlaqəli hesab olunur (istifadə edilmiş bal matrisi ilə oxşardır), xal mənfi olarsa, onların olmadığı güman edilir. əlaqəli. Burada “əlaqə” zülalların funksionallığı ilə yanaşı təkamülü də nəzərdə tuta bilər və təbii ki, matrisin seçimi nəticəyə təsir edir, ona görə də faydalı nəticə əldə etmək üçün ardıcıllıqların oxşarlığı haqqında fərziyyə etmək lazımdır: daha doğrusu. uzaq ardıcıllıqlar PAM 10-dan istifadə edərək yaxşı uyğunlaşma yaratmayacaq və iki çox oxşar ardıcıllığın PAM 500 ilə optimal uyğunlaşdırılması PAM 50 ilə müqayisədə daha az faydalı ola bilər.

Nəhayət, qeyd etmək lazımdır ki, yalnız bəzi hesablama matrisləri istifadə olunur oxşarlıq hizalanmaları qiymətləndirmək üçün, lakin başqaları istifadə edir məsafə, odur ki, nəticələri şərh edərkən diqqətli olun!

Bu qısa və mütləq səthi icmaldan sonra siz matrislər haqqında daha çox oxumaq istəyə bilərsiniz.


YÜZLƏMƏLƏR

LALIGN - (EMBnet) iki ardıcıllıqla çoxlu uyğun gələn altseqmentləri tapır. Ardıcıllığın müxtəlif altseqmentləri üçün % identifikasiyası ilə birini təmin edir.

FFAS - Qatlama və Funksiya Təyinatı Sistemi. İstifadəçinin zülalının profili indi ilə müqayisə edilə bilər

20 əlavə profil verilənlər bazası. İstifadəçi bir sıra tablar vasitəsilə çoxsaylı nəticələr səhifələrində hərəkət edə bilər və həmçinin nöqtə qrafiki görüntüləyicisi, modelləşdirmə alətləri, təkmilləşdirilmiş 3D uyğunlaşdırma görüntüləyicisi və struktur oxşarlıqlar bazasına keçidlər kimi yeni funksiyaları özündə cəmləşdirə bilər. (İstinad: Jaroszewski, L. et al. 2011. Nuclein Acids Res. 39(Veb server problemi):W38-44)

İki Ardıcıllığı LALIGN/PLALIGN ilə müqayisə edin, zülal və ya DNT ardıcıllığının kəsişməyən yerli düzülmələrini hesablamaqla daxili dublikasiyaları tapın. LALIGN düzülmələri və oxşarlıq xallarını göstərir, PLALIGN isə "dot-slot" kimi qrafik təqdim edir.

SFESA (Satmaq Fix ikinci dərəcəli struktur EelementS in Alignments) - ikinci dərəcəli struktur sürüşmələri ilə ikili düzülmənin dəqiqləşdirilməsi üçün veb serverdir. SFESA yerli yerdəyişmələr tərəfindən yaradılan hizalanma variantlarını qiymətləndirir və ən yaxşı bal toplayan hizalanma variantını seçir. (İstinad: Tong J et al (2015). Proteinlər. 83(3): 411-427).

SON - nöqtə xətləri və rəngli düzülmələrlə yanaşı məlumatların idarə edilməsinə çoxlu nəzarət təmin edir ( İstinad: Kielbasa SM et al. Genome Res 21(3): 487-93).

Vasabi - (Andres Veidenberg, Helsinki Universiteti, Finlandiya) çoxlu düzülmə molekulyar ardıcıllıq məlumatlarının vizuallaşdırılması və təhlili üçün brauzer əsaslı proqramdır.

VerAlign çox ardıcıl düzülmə müqayisəsi eyni düzülmələrin istinad versiyası ilə sınaq düzülməsinin keyfiyyətini qiymətləndirən müqayisə proqramıdır.

Taksonomiya üçün ikili nukleotid ardıcıllığının düzülüşü (EzBioCloud, Seul Milli Universiteti, Koreya Respublikası) - < 5 kb nukleotid ardıcıllığı üçün rəng uyğunluqları və Myers və Miller əsasında oxşarlıq xalını verir (Qlobal uyğunlaşdırma)

GeneWise (EMBL-EBI) - zülal ardıcıllığını genomik DNT ardıcıllığı ilə müqayisə edir, intronlar və çərçivə dəyişdirmə xətalarına yol verir.

SIM - Zülal üçün uyğunlaşdırma aləti (ExPASy, İsveçrə) LALIGN-ə bənzər parçalanmış düzülmələr verir.

WebPRANK - server DNT, zülal və kodon ardıcıllığının uyğunlaşdırılmasını, həmçinin cDNA-ların zülalla tərcümə edilmiş uyğunlaşdırılmasını dəstəkləyir və genomik ardıcıllıqların uyğunlaşdırılması üçün daxili struktur modellərini ehtiva edir. Nəticədə düzəlişlər təkamül ardıcıllığı təhlillərində geniş istifadə olunan müxtəlif formatlarda ixrac edilə bilər. webPRANK serveri həmçinin ardıcıllıqla əlaqəli kladoqram kontekstində nəticələrin vizuallaşdırılması və sonrakı emal üçün güclü veb-əsaslı hizalama brauzerini ehtiva edir ki, bu da aşağı arxa etibarlılığa malik düzülmə sütunlarının çıxarılmasına imkan verir (məsələn). De novo hizalamalara əlavə olaraq, webPRANK filogenetik cəhətdən real boşluq nümunələri ilə əcdad ardıcıllıqlarını çıxarmaq və mövcud düzülmələrin annotasiyası və sonrakı işlənməsi üçün istifadə edilə bilər. (İstinad: Löytynoja, A., & Goldman, N. 2010. BMC Bioinformatika 11: 579).

PARLATMA 2 (NCBI) - DNT ardıcıllığının müqayisəsi üçün də faydalıdır. Yalnız zülallar və ya qısa DNT ardıcıllığı ilə istifadə olunan kiçik qrafik təqdim edir.

Protein Ardıcıllığı oxşarlığı və eynilik balları:

EMBOSS supermatcher Boşluğun açılması cəzası və Gap uzadılması cəzasında defolt olaraq müvafiq olaraq 10 və 0.5-dən istifadə edin.
EMBOSS uyğunlaşdırıcı - iki ardıcıllıq arasında ən yaxşı yerli düzülmələri tapır

FOLDALIGN - yüngül enerji modeli və ardıcıllıq oxşarlığı əsasında RNT strukturlarını qatlayır və hizalayır (qatlama düzəldir). Cari versiya cüt-cüt bükülmə hizalamaları edir. (İstinad: J. H. Havgaard et al. 2005. Bioinformatika 21: 1815 - 1824).

ÇOX ARALIQLIĞI MÜQAYISƏ EDİN :

MƏLUMAT: CLUSTAL W üçün iki yaxşı onlayn yardım saytı var. Bunlar bunlardır (a) CLUSTAL üçün onlayn yardım (Viki.) və, (b) Çox ardıcıl düzülmə , (Wiki)

ClustalW - Çox Ardıcıllıq Alignment (EBI, Birləşmiş Krallıq). Bu, məlumatların təqdimatı, homologiya matrisləri [BLOSUM (Henikoff), PAM (Dayhoff) və ya GONNET və filogenetik ağacların təqdimatı (Qonşu-Qoşulma, Phylip və ya Məsafə) üçün bir sıra seçimlər təqdim edir. ClustalW uyğunlaşdırılmasını təklif edən saytlar Kyoto Universitetində və chEMBLnet.org-dadır

Clustal Omega - hizalamalar yaratmaq üçün toxumlanmış bələdçi ağacları və HMM profil profili üsullarından istifadə edən yeni çox ardıcıl düzülmə proqramıdır. (İstinad: Sievers, F. et al. 2011. Molecular Systems Biology 7 Məqalə nömrəsi: 539)

MAFFT Çox ardıcıl düzülmə və NJ / UPGMA filogeniyası - Mən bu yaxınlarda ClustalW istifadə edərək on üç 50kb bakteriofaq genomunu uyğunlaşdırmağa cəhd etdim, heç bir uğur qazanmadı, MAFFT uyğunlaşmanı inanılmaz sürətlə təmin etdi. Təəssüf ki, bir ağac yaratmayacaq. Clustal məlumatları ClustalX-də açıldı və ağac standart parametrlərdə saxlandı və FigTree-də vizuallaşdırıldı (İstinad: Katoh, K. et al. 2002. Nucl. Acids Rese. 30 : 3059-3066).

DbClustal - (EMBL-EBI) BlastP verilənlər bazası axtarışından ardıcıllığı bir sorğu ardıcıllığı ilə uyğunlaşdırır. Düzəldici alqoritm ardıcıllıq cütləri arasında lövbər nöqtələri şəklində yerli hizalanma məlumatlarını daxil etmək üçün dəyişdirilmiş ClustalW2-ə əsaslanır. Çox rəngli çıxış.

LALIGN - Müqayisəli Genomika üçün VISTA Alətlərinin bir hissəsi

PROBCONS - zülal ardıcıllığının çoxsaylı düzülmələrini yaratmaq üçün yeni bir vasitədir. Ehtimal modelləşdirmə və ardıcıllığa əsaslanan hizalama üsullarının birləşməsindən istifadə edərək, PROBCONS bu günə qədər bütün hizalama metodlarının ən yüksək dəqiqliyinə nail olmuşdur. BAliBASE etalon uyğunlaşdırma verilənlər bazasında PROBCONS tərəfindən hazırlanmış düzülmələr cari proqramlarla müqayisədə statistik əhəmiyyətli təkmilləşməni göstərir, T-Coffee ilə müqayisədə orta hesabla 7% daha düzgün düzülmüş sütunlar, CLUSTAL W ilə müqayisədə 11% daha düzgün düzülmüş sütunlar və 14 ehtiva edir. DIALIGN sütunlarından % daha düzgün düzülmüş sütunlar. (İstinad: C.B. Do et al. 2005. Genome Res. 15: 330-340).

webPRANK - filogeniyadan xəbərdar olan çoxlu ardıcıllığın uyğunlaşdırılmasını, vizuallaşdırılmasını və istifadəsi asan veb-interfeysdə post-emalı özündə birləşdirir.( İstinad: Löytynoja, A., & Goldman, N. 2010. BMC Bioinformatics. 11:579).

REHBERLİK - etimad xallarının qiymətləndirilməsi üçün iki müxtəlif alqoritm tətbiq edir: (i) optimal həllər sayəsində uyğunlaşma qeyri-müəyyənliyini ölçən baş və ya quyruq (HoT) metodu (ii) uyğunlaşmanın möhkəmliyini ölçən GUIDANCE metodu bələdçi ağacının qeyri-müəyyənliyi. Server etimad xallarını MSA-ya layihələndirir və etibarsız şəkildə düzülmüş sütunlara və ardıcıllıqlara işarə edir. Bunlar aşağı axın təhlillərinə hazırlıq üçün avtomatik olaraq silinə bilər. N.B. Ən azı 8 ardıcıllıq lazımdır( İstinad: Penn, O. 2010. Nucleic Acids Res. 38(Veb Server məsələsi):W23-28).

SALIGN - istifadəçiyə standart parametr dəyərlərini ləğv etməyə icazə verərkən, girişlər əsasında avtomatik olaraq ən yaxşı uyğunlaşdırma prosedurunu müəyyən edir. Çoxlu düzülmələr bütün cüt-cüt düzülmə ballarının matrisindən hesablanan dendroqram tərəfindən idarə olunur. Ardıcıllığı strukturlara uyğunlaşdırarkən, SALIGN boşluqları optimal şəkildə yerləşdirmək üçün struktur mühit məlumatlarından istifadə edir. Əgər əlaqəli zülalların iki çox ardıcıl düzülüşü serverə daxil edilərsə, profil profilinin uyğunlaşdırılması həyata keçirilir.( İstinad: Braberg, H. et al. 2012. Bioinformatika. 28(15):2072-2073).

AlignMe (membran zülallarının uyğunlaşdırılması üçün) müxtəlif oxşarlıq ölçülərindən istifadə etməyə imkan verən çox çevik ardıcıllıqla düzülmə proqramıdır. Bu oxşarlıq ölçülərinə aşağıdakılar daxildir: əvəzetmə matrisləri, hidrofobiklik şkalaları və istənilən növ profillər (yəni, ikinci dərəcəli struktur proqnozları və ya transmembran proqnozları). ( İstinad: Xafizov K et al. 2014. Nucl. Acids Res. 42 (W1), W246-W251)

PRALINE - giriş ardıcıllığının hər biri üçün məlumatı optimallaşdırmaq üçün bir çox variantları olan çoxlu ardıcıllıqla uyğunlaşdırma proqramıdır, məsələn. qlobal və ya yerli ilkin emal, proqnozlaşdırılan ikinci dərəcəli struktur məlumatı və iterasiya imkanları. (İstinad: V.A. Simossis et al. (2005) Nuclein Acids Res. 33: 816-824). PRALINE çıxışının nümunəsi:

Gen Kontekst Aləti - bir gen və ya genlər qrupunun (sinteniya) genom kontekstini vizuallaşdırmaq üçün inanılmaz bir vasitədir. Aşağıdakı diaqramda bir RpoN (Sigma54) zülalı təhlil edilmişdir. (İstinad: R. Ciria və başqaları (2 004) Bioinformatika 20: 2307-2308).

ConSurf homoloji ardıcıllıqlar arasında filogenetik əlaqələr əsasında zülal/DNT/RNT molekulunda amin/nuklein turşusu mövqelərinin təkamüllə qorunub saxlanmasını qiymətləndirmək üçün bioinformatika vasitəsidir. Amin (və ya nuklein) turşusunun mövqeyinin təkamüllə qorunma dərəcəsi onun struktur və funksional əhəmiyyətindən güclü şəkildə asılıdır, sürətlə inkişaf edən mövqelər dəyişkəndir, yavaş-yavaş inkişaf edən mövqelər isə qorunur. (İstinad: Ashkenazy, H. et al. 2010. Nucl. Acids Res. 38 (əlavə 2): W529-W533).

MultAlin - Florence Corpet tərəfindən çoxlu ardıcıl düzülmə (Institut National de la Recherche Agronomique (INRA), Fransa). N.B. Nəticələr rəngli şəkildə təqdim olunur.

Çoxlu Alignment - GeneBee xidməti (Belozerski adına Fiziki-Kimyəvi Biologiya İnstitutu, Moskva Dövlət Universiteti, Rusiya) . N.B. Bu xidmət həmçinin məlumatların filogenetik analizini də təmin edir.

PROMALS3D - ardıcıllıq verilənlər bazası axtarışlarından, ikinci dərəcəli strukturun proqnozlaşdırılmasından, 3D strukturları ilə mövcud homologlardan və istifadəçi tərəfindən müəyyən edilmiş məhdudiyyətlərdən əldə edilən məlumatlardan istifadə edərək, çoxsaylı protein ardıcıllığı və/yaxud strukturlar üçün uyğunlaşdırmalar qurur. (İstinad: Pei, J. et al. 2008. Nuclein Acids Res. 36(7): 2295-2300 ).

SANSparallel: Uniprot-a qarşı interaktiv homoloji axtarış - veb-server üçüncü tərəf proqram təminatı ilə dərhal cavab və peşəkar uyğunlaşdırma vizualizasiyası ilə zülal ardıcıllığı verilənlər bazası axtarışlarını təmin edir. Çıxış Uniprot, UniRef90/50, Swissprot və ya Protein Məlumat Bankından ardıcıllıqla oxşar zülalların siyahısı, cüt-cüt düzülüşü və ya yığılmış düzülüşüdür. Yığılmış düzülmələrə Jalview-də və ya ardıcıl loqolar kimi baxılır. Verilənlər bazası axtarışı müştəri-server kimi yenidən tətbiq edilmiş, təkmilləşdirilmiş və paralelləşdirilmiş şəkilçi massiv qonşuluq axtarışı (SANS) metodundan istifadə edir. Metod son dərəcə sürətli və 50% ardıcıllığın eyniliyindən yuxarı BLAST kimi həssasdır. (İstinad: P. Somervuo & L. Holm. 2015. Nucl. Acids Res. 43 (W1): W24-W29).

DiAlign (Univ. Bielfeld, Almaniya) - "DIALIGN, Burkhard Morgenstern və başqaları tərəfindən hazırlanmış çoxlu düzülmə üçün yeni proqramdır. Standart hizalama üsulları tək qalıqların müqayisəsinə və boşluq cəzalarının tətbiqinə əsaslansa da, DIALIGN ardıcıllığın bütün seqmentlərini müqayisə edərək ikili və çoxlu düzülmələr qurur."

Qəhvə Kolleksiyası - T-Qəhvə (Defolt T-Qəhvədən istifadə edərək DNT, RNT və ya Zülalları uyğunlaşdırır), M-Qəhvə (Məşhur düzləşdiricilərin çıxışını birləşdirərək DNT, RNT və ya Zülalları bərabərləşdirir), R-Qəhvə (Pəhlən edilən ikinci dərəcəli istifadə edərək RNT ardıcıllığını düzəldir. strukturlar), Expresso (Struktur məlumatından istifadə edərək zülal ardıcıllığını hizalayır), PSI-Qəhvə (homoloji genişlənmədən istifadə edərək uzaqdan əlaqəli zülalları hizalayır) və TM-Qəhvə (homologiya genişlənməsindən istifadə edərək transmembran zülallarını hizalayır). (İstinad: Di Tommaso. P. et al. 2011. Nucleic Acids Res. 39(Veb Server məsələsi: W13-17 Chang, J.M. et al. 2012. BMC Bioinformatics. 13 Əlavə 4: S1).

TM-Aligner - transmembran zülalları üçün çoxlu ardıcıl düzülüşü təmin edir ( İstinad: Bhat B et al. (2017) Elmi Hesabatlar 7: Məqalə nömrəsi: 12543).

LocARNA - Msonlu Anin ligmenti RNTs - RNT molekullarının çoxsaylı uyğunlaşdırılması üçün bir vasitədir. LocARNA giriş kimi yalnız RNT ardıcıllığını tələb edir və eyni zamanda giriş ardıcıllığını qatlayacaq və uyğunlaşdıracaq. LocARNA konsensus strukturu ilə birlikdə çoxlu uyğunlaşdırmanı çıxarır. Qatlanma üçün o, Vyana RNT paketinin (və ya Zukerin mfoldu) RNAfoldu ilə olduğu kimi RNT-lər üçün çox real enerji modelindən istifadə edir. Düzəliş üçün o, RIBOSUM kimi oxşarlıq hesabını və real boşluq dəyərini təqdim edir. (İstinad: C. Smith et al. 2010. Nucl. Acids Res. 38: W373-377).

CARNA, RNT molekullarının çoxsaylı uyğunlaşdırılması üçün bir vasitədir. CARNA giriş kimi yalnız RNT ardıcıllığını tələb edir və əsas cüt ehtimal matrislərini hesablayacaq və onların tam struktur ansambllarına əsaslanaraq ardıcıllığı uyğunlaşdıracaq. Alternativ olaraq, siz ardıcıllıqlarınız üçün əsas cüt ehtimal matrislərini (.ps formatında nöqtə qrafikləri) və ya sabit strukturları (FASTA düzülüşündə annotasiya kimi) təmin edə bilərsiniz. Sabit strukturları təmin etsəniz, mümkün strukturların bütün ansamblı deyil, yalnız bu strukturlar uyğunlaşdırılır. LocARNA-dan fərqli olaraq, CARNA ən çox ehtimal olunan konsensus strukturunu seçmir, lakin eyni vaxtda bütün mümkün strukturlara ən yaxşı uyğun gələn düzülüşü hesablayır. Beləliklə, CARNA, birdən çox sabit quruluşa malik olan riboswitches kimi RNT-ləri uyğunlaşdırarkən xüsusilə faydalıdır. (İstinad: A. Dragos et al. 2012. Nucleic Acids Reseach 40: W49-W53)

Web-Beagle: ikinci dərəcəli RNT strukturlarının ikili qlobal və ya yerli uyğunlaşdırılması üçün veb server. (İstinad: E. Mattei et al. 2015. Nucl. Acids Res. 43 (W1): W493-W497).

Düzəlişlərin alternativ təqdimatları:
BOXSHADE - (Hofmann & Baron, Paster İnstitutu, Fransa) Bu versiya müxtəlif fayl formatlarını qəbul edir və sorğuçuya çıxışın görünüşünü (rəng və düzülmə, eləcə də format) müəyyən etməkdə xeyli çeviklik verir.

ESPript 3.0 - (IUniversite Lyon, Fransa) - təhlil və dərc məqsədi ilə düzülmüş ardıcıllıqlardan ardıcıllıq oxşarlıqlarını və ikinci dərəcəli struktur məlumatlarını göstərən proqramdır. Bunun üçün siz hizalanmanızı *.aln faylı kimi saxlamağınızı tələb edir. Çıxışın görünüşü və formatı üzərində yaxşı nəzarət mövcuddur (ps, tiff və gif). (İstinad: Robert X. & Gouet P. 2014. Nucl. Acids Res. 42 (W1), W320-W324).

Çoxlu Hizalama Şousu - (Bioinformatics.org/The Open Lab University of Massachusetts Lowell) Boyama hizalamalarında əhəmiyyətli seçim imkanı verir.

İki genom arasında ardıcıllıq müqayisəsi:


Nəticələr

Delta uyğunlaşma hesabı

Cütlü ardıcıl düzülmələrdə düzülmə xalları ardıcıllıq cütlərinin homoloji və ya əlaqəli olma ehtimalını qiymətləndirmək üçün ardıcıllıq oxşarlığının ölçüsü kimi istifadə edilə bilər. Bu fikrə uyğun olaraq, bir amin turşusu dəyişkənliyinin səbəb olduğu uyğunlaşma hesabındakı dəyişikliyin protein funksiyasına təsiri kimi şərh edilə bilər. Konkret olaraq, A zülalını nəzərə alsaq, işlək bir homoloji zülal B olduğunu fərz edək. Variasiyanın zülal A-ya təsirini ölçmək üçün variasiyanın tətbiqindən əvvəl və sonra protein A ilə B arasında oxşarlığını ölçə bilərik. Bizim fərziyyəmiz ondan ibarətdir ki, A zülalının funksional homolog zülal B ilə oxşarlığını azaldan variasiya daha çox zərərverici təsirə səbəb olur. Bu məqsədlə biz dəyişikliyin səbəb olduğu “oxşarlıq”da dəyişiklik ölçüsü kimi istifadə ediləcək “düzləşmə balında” dəyişikliyi təklif edirik.

Dəyişikliyin zülal funksiyasına təsir dərəcəsini ölçmək üçün a-nı təyin edirik delta hizalama hesabı (və ya sadəcə olaraq delta hesabı) zülal sorğusu ardıcıllığının və onun digər zülal mövzu ardıcıllığına nisbətən dəyişməsi, yarımqlobal uyğunlaşma hesabında dəyişiklik (yəni, qlobal düzülüşün son boşluqlarına görə cəzanın olmaması [20]) arasında və səbəb olduğu. Daha formal olaraq, burada - ilə yaranan variant ardıcıllığı və verilmiş amin turşusu əvəzetmə matrisi (məsələn, BLOSUM62) və boşluq cəzaları əsasında hesablanan iki zülal ardıcıllığı və arasında yarı qlobal uyğunlaşma hesabıdır.

Delta hesabı variasiyanın təsirini ölçmək üçün istifadə edilə bilər. Yəni, aşağı delta balları zülal funksiyasına zərərli təsir göstərən amin turşusu dəyişiklikləri kimi şərh olunur (Şəkil 1A, C və E), yüksək delta balları isə zülal funksiyasına neytral təsir göstərən variasiyalar kimi şərh olunur (Şəkil 1B, D, və F). Delta xalı düzləşdirmə ballarından hesablandığından və uyğunlaşma balları əvəzetmə matrisi əsasında hesablandığından, delta xalına yanaşmanın aşağıda təsvir olunduğu kimi digər alətlər üzərində üstünlükləri var.


Metodlar

Bitkilərdə CLE motivləri üçün yeni qalıq xal matrisinin hazırlanması

CLE motivi üçün yeni qalıq xal matrisi amin turşusu əvəzetmə matrisini, CLE motivlərinin amin turşusu istifadə tezliyi matrisini və CLE motivlərinin sahə çəkilərini birləşdirərək hazırlanmışdır.

Optimal amin turşusu əvəzetmə matrisini tapmaq üçün üç tez-tez istifadə edilən əvəzetmə matrisləri, BLOSUM62, BLOSUM80 və PAM250 116-dan istifadə etməklə sınaqdan keçirilmişdir. CLE dan namizədlər A. thaliana, O. sativa, S. moellendorfiiP. abies (Əlavə fayl 20: Cədvəl S9). Bu 116-nın xalları bildirildi CLE genlər böyükdən kiçiyə doğru bir sıra izlədi və Local Polinomial Regression Fitting (LOESS) metodundan istifadə edərək əyriyə uyğunlaşdırıldı. Sonrakı təhlillər üçün xal matrisini qurmaq üçün ən yüksək həssaslığa malik matris seçilmişdir.

CLE motivləri üçün amin turşusu istifadə tezliyi matrisini hazırlamaq üçün biz 1628 hesabatdan istifadə etdik. CLE genlər istinad kimi [7]. Hər bir amin turşusu qalığının faizi S CLE motivinin 12 yerindən hər birində aşağıdakı kimi hesablanmışdır:

harada Sij amin turşusunun faizini ifadə edir i saytda j aij amin turşularının sayını ifadə edir i saytda jn bildirilənlərin sayını əks etdirir CLE genlər.

Hər saytın çəkisi (wj) CLE motivinə əsaslanırdı Bitlər hər bir saytın dəyəri [71]. Dəyişdirilmiş Bitlər dəyərlər (bitlər) aşağıdakı addımlarla CLE motivinin hər bir sahəsinə çəki təyin etmək üçün istifadə edilmişdir: (1) amin turşularını seçin. Sij Hər bir sahə üçün əsas amin turşuları kimi ≥ 25%, (2) birləşir Sij bu amin turşuları üçün dəyərlər və (3) hesablayın bitlər Aşağıdakı tənlikdən istifadə edərək hər bir ərazidə amin turşularının nisbətinə əsaslanan dəyərlər:

harada m amin turşularının növlərini təmsil edir (m = 20), k ilə amin turşularının sayını ifadə edir Sij Saytda ≥ 25% j, Hj saytın dəyişdirilmiş entropiyasını təmsil edir j, və em əsasən giriş ardıcıllığının sayı 20-dən az olduqda tətbiq edilən düzəliş nömrəsidir.

Yeni qalıq xal matrisi N sonra amin turşusu əvəzetmə matrisini inteqrasiya etməklə qurulmuşdur M, amin turşusu istifadə tezliyi matrisi S və saytın çəkisi wj:

harada Mik amin turşusu arasında əvəzetmə balını təmsil edir i və amin turşusu k amin turşusu əvəzetmə matrisində, Sjk amin turşusunun tezliyini ifadə edir k saytda j amin turşusu istifadə tezliyi matrisində. Motif hesabı v hər bir CLE motivi yeni xal matrisini tətbiq etməklə hesablanmışdır N:

harada i yerində CLE motivinin bir amin turşusunu təmsil edir j.

Proqnozlaşdırılması üçün digər dəyişənlər CLE genlər

Hər bir CLE motivinin hesabından başqa (v), proqnozlaşdırmaq üçün digər amillər nəzərə alınmışdır CLE genlər, o cümlədən protein uzunluğu (L), siqnal peptid skorları (SP SignalP hesabı/D-dəyəri üçün TP TargetP balı/SP-dəyəri) və motiv mövqeyi (P). Hər bir zülal ardıcıllığı üçün siqnal peptid balları SignalP 4.1 Serverində (http://www.cbs.dtu.dk/services/SignalP/) [72] həssas D-cutoff dəyəri (SignalP üçün 0,34, TM şəbəkələri yoxdur) ilə hesablanmışdır. yalnız) və TargetP 1.1 Serveri (http://www.cbs.dtu.dk/services/TargetP/) [73] bitki qrupu ilə. Motif mövqeyi P aşağıdakı kimi hesablanmışdır:

harada L müvafiq zülalın uzunluğunu ifadə edir və ls CLE motivinin başlanğıc mövqeyini təmsil edir.

Maşın öyrənməsi ilə proqnozlaşdırma CLE bitkilərdə genlər

68 növün kodlaşdırma ardıcıllığı Phytozome v12 (https://phytozome.jgi.doe.gov/pz/portal.html) [74]-dən bütün genom səviyyəsində çıxarılıb. Kodlaşdırma ardıcıllığı P. abies PlantGenIE (http://plantgenie.org) saytından endirilib [75, 76]. Əvvəlcə zülal ardıcıllığını süzdük L < 30 və L > 300. Qalan zülal ardıcıllıqları üçün (30 ≤ L ≤ 300), biz 12 amin turşusu qalığı olan hər hansı fraqment üçün motiv hesabını hesabladıq. Bu zülal üçün potensial CLE motivi kimi ən yüksək xal toplayan motiv seçilmişdir. 1529 məlumat verdi CLE Phytozome v12.1 verilənlər bazasında [7] 53 növdən HMM alqoritmləri ilə müəyyən edilmiş genlər kimi etiketlənmişdir. CLE genlər. Sayı CLE genlər (X) müəyyən bir növdə sayılırdı. Əgər X ≤ 10, ən yüksək bal toplamış 30 namizəd seçilib. ilə bir növ üçün X > 10, 3X ən yüksək bal toplamış namizədlər seçilib. Bütün CLE genlər namizəd genlər siyahısından çıxarılıb. Qalan genlər qeyri-CLE genlər. Təlim məlumat dəstini yaratmaq üçün CLE və olmayanCLE genlər birləşdirildi.

Yuxarıda qeyd olunan beş dəyişəndən istifadə edərək təlim məlumat dəstini təhlil etmək üçün üç maşın öyrənmə alqoritmi, C4.5, Süni Neyron Şəbəkəsi (ANN) və Dəstək Vektor Maşını (SVM) istifadə edilmişdir. Hər üç alqoritm R dilində (R-3.4.0) həyata keçirilmişdir: C4.5, RWeka-0.4-37 paketi. Güvən Budama Faktoru C 0,01 (ANN, nnet-7,3-12 paketi) təyin edildi. Gizli təbəqə ölçüsündə neyronların sayı 20-yə təyin edildi. Maksimum təkrarlama sayı 1000-ə təyin edildi (SVM, e1071_1.6-8 paketi). Defolt parametrlər digər parametrlər üçün istifadə edilmişdir. Qalan 16 növdən namizəd genləri test məlumat dəsti üçün istifadə edilmişdir. Namizəd CLE-ləri üç təsnifatçıdan ən azı biri dəstəklədi.

Klasterləşdirilməsi CLE bitkilərdə genlər

Maşın öyrənməsi ilə proqnozlaşdırılan CLE namizədləri Evklid məsafəsinə əsaslanan yeni bir protokoldan istifadə edərək daha da qruplaşdırıldı (d). Hər bir namizəd ardıcıllığı və hər bildirilmiş Arabidopsis CLE motivi arasındakı Evklid məsafəsi onun minimum məsafəsini tapmaq üçün hesablanmışdır (dmin). Maksimum motivlərin ilk 5%-i dmin “başqaları” qrupuna aid edildi. Dəyişdirilmiş Evklid məsafəsi (d) hər iki CLE motivi arasında aşağıdakı kimi idi:

Harada aj yerində amin turşusunu təmsil edir j namizəd CLE motivi və bj yerində amin turşusunu təmsil edir j of A. thaliana CLE motivləri. Aralarındakı məsafə ajbj kimi müəyyən edilmişdir dj.

Bütün qruplar üçün CLE Namizəd genlər üçün qruplaşma ağacı qurmaq üçün R (R-3.4.0) ilə iyerarxik klasterləşdirmə (HCL) üsulu tətbiq edilmişdir. Filogenetik ağaclar A. thaliana CLE motivləri, siqnal peptidləri olmayan tam uzunluqlu CLE zülalları və hamıya qarşı bütün BLAST e-dəyərlərinin log-normallaşdırılmış dərəcəsi MEGA X [77] ilə qonşuya qoşulma (NJ) metodundan istifadə etməklə qurulmuşdur. Salxım ağacları və filogenetik ağaclar Evolview (http://www.evolgenius.info/evolview/) [78] istifadə edərək redaktə edilmişdir.

Statistik təhlil

CLE prekursor zülallarında və CLE motivlərində amin turşusu istifadəsində qərəzliliyi öyrənmək üçün bütün zülalların, bütün kiçik zülalların (yəni, uzunluğu 50 ilə 200 amin turşusu qalığı arasında olan zülalların) və bütün CLE namizədlərinin amin turşusu tərkibi 69-da təhlil edilmişdir. bitki növləri. Təkamülünü öyrənmək üçün CLE genlər, ədədlər CLE Namizəd genlər hər növdə və hər qrupda sayılırdı. CLE prekursor zülalları qrup üzrə hər bir CLE namizədinin motiv xallarının, zülal uzunluqlarının, motivlərin mövqelərinin, C-terminal quyruqlarının uzunluğunun, SignalP və TargetP ballarının paylanmasının təhlili ilə xarakterizə edilmişdir. müəyyən etmək üçün həlledici amillər a CLE namizəd gen yuxarıda qeyd olunan dəyişənlərin hər biri arasında korrelyasiya təhlili və zülal uzunluğunun üç diapazonunda, 51-100, 101-150 və > 150 amin turşusu qalıqlarında qərarın köməyi ilə aşkar edilmişdir. Qrup “digərləri” və BİA kimi namizədlərdəki CLE namizədlərinin qruplaşma ağacları hər bir cüt namizəd ardıcıllığına Evklid məsafəsinə əsaslanan HCL metodunu tətbiq etməklə qurulmuşdur. C-terminal quyruqlarının uzunluqları və hər bir alt qrupda onların müvafiq amin turşusu kompozisiyaları C-terminal quyruqlarının müxtəlif uzunluqlarına malik CLE namizədlərinin sayını göstərən istilik xəritəsindən istifadə etməklə qiymətləndirilmişdir. Konservləşdirilmiş qalıqları təmsil etmək üçün vebloqolardan istifadə edilmişdir. üçün A. thalianaZ. mays, gen strukturları CLE alternativ splicing ilə namizədlər gff3 fayllarından əldə edilmişdir A. thalianaZea mays Phytozome v12-də (https://phytozome.jgi.doe.gov/pz/portal.html).

Ardıcıllıq loqosu yaratmaq üçün Webloqo (http://weblogo.threeplusone.com/) [79] istifadə edilmişdir. MEME (http://meme-suite.org/tools/meme) [80] hər bir CLE motivinin e-dəyərlərini hesablamaq üçün istifadə edilmişdir. R paket pheatmap-1.0.17, corrplot-0.84 və UpSetR-1.4.0 müvafiq olaraq istilik xəritələri, korrelyasiya xəritələri və pozulmuş süjetlər yaratmaq üçün tətbiq edilmişdir. Digər süjetlər ggplot2–3.2.0 istifadə edərək yaradılmışdır. Bütün məlumatlar R dilindən (R-3.4.0 və R-3.6.1) istifadə etməklə işlənmişdir.


Videoya baxın: Məsələ həlli (Iyul 2022).


Şərhlər:

  1. Geteye

    Hesab edirəm ki, siz haqlı deyilsiniz. Mən əminəm. Mən mövqeyi müdafiə edə bilərəm. Mənə pm-də yazın.

  2. Tygoll

    Çox gülməli bir fikir



Mesaj yazmaq