Məlumat

Path-A proqnozlaşdırma sistemində giriş kimi qəbul edilən zülal ardıcıllığı nədir

Path-A proqnozlaşdırma sistemində giriş kimi qəbul edilən zülal ardıcıllığı nədir


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Path-A əsaslı metabolik yolun proqnozunu nəzərə alaraq (http://nar.oxfordjournals.org/content/34/suppl_2/W714.short). Yol proqnozu üçün maşın öyrənməsindən istifadə edir. Tutaq ki, giriş sorğu orqanizminin zülal ardıcıllığı idi. Mən başa düşə bilmirəm bu zülal ardıcıllıqları nədir? Bunlar reaksiyalar üçün fermentlərdirmi?

Əsas alqoritmin iki girişi var: sorğu orqanizmindən protein ardıcıllığı dəsti və hər bir hədəf yol üçün bir model yollar dəsti.


Mütləq deyil, onlar ferment ola bilərlər, lakin daha çoxunu (bütün proteom) ehtiva edirlər.

O, tək bir orqanizmdən bir sıra sorğu zülal ardıcıllığını ehtiva edən FASTA formatlı faylı götürür (qismən və ya tam proteom) və onun dəstəklənən metabolik yollarından hər hansı birində iştirak etmək ehtimalı olan ardıcıllığı müəyyən edir

Path-A, ardıcıllığın uyğunlaşdırılmasına və maşın öyrənməsinə əsaslanan təsdiqlənmiş proqnozlaşdırma üsullarından istifadə edərək, ixtiyari zülal dəstləri tərəfindən dəstəklənən yolları proqnozlaşdırır.


Dərin öyrənmə üsulları protein strukturunun proqnozlaşdırılmasına və zülal dizaynına əhəmiyyətli dərəcədə təsir göstərmişdir

Dərin öyrənmənin son istifadəsi homoloji olmayan zülal strukturunun modelləşdirilməsinin dəqiqliyini kəskin şəkildə artırdı.

Protein strukturunun proqnozlaşdırılması problemi əsasən ucdan-uca neyron şəbəkələrinin istifadəsi ilə qat səviyyəsində həll edildi.

Zülal strukturunun proqnozlaşdırılması üçün neyron şəbəkələrində saxlanılan məlumat yeni zülalların dizaynı üçün istifadə edilə bilər.

Zülal kompleksinin strukturunu modelləşdirmək və funksional zülalları dizayn etmək üçün dərin öyrənmə üsullarını genişləndirmək üçün daha çox iş tələb olunur.

Protein strukturunun proqnozu və dizaynı eyni qatlama prinsipi ilə idarə olunan iki tərs proses kimi qəbul edilə bilər. Son iki onillikdə tərəqqi durğun olaraq qalsa da, dərin neyron şəbəkələrinin məkan məhdudiyyətlərinin proqnozlaşdırılması və uçdan-uca model təliminə son tətbiqi zülal strukturunun proqnozlaşdırılmasının dəqiqliyini əhəmiyyətli dərəcədə yaxşılaşdırdı, problemi böyük ölçüdə bir-birinin ardınca qatlanma səviyyəsində həll etdi. domen zülalları. Zülal dizaynı sahəsi də dramatik təkmilləşmənin şahidi oldu, burada nəzərə çarpan nümunələr neyroşəbəkə modellərində saxlanılan məlumatların funksional protein dizaynını inkişaf etdirmək üçün istifadə edilə biləcəyini göstərdi. Beləliklə, dərin öyrənmə üsullarının zülal qatlamasının və dizayn yanaşmalarının müxtəlif mərhələlərinə daxil edilməsi maraqlı gələcək istiqaməti təmsil edir və hər iki sahəyə transformativ təsir göstərməyə davam etməlidir.


Mutasiya proqnozundan sonra PPI bağlayan enerji dəyişikliyi üçün TopNetTree modeli

Bu bölmə TopNetTree modelini və onun PPI ΔΔ-yə tətbiqini təsvir edirG proqnoz. Şəkil 1-də göstərildiyi kimi, təklif olunan TopNetTree iki əsas moduldan ibarətdir: topologiyaya əsaslanan funksiyaların yaradılması və CNN-in köməyi ilə GBT modeli (Şəkil 1). Xüsusiyyət yaratmaq üçün biz kimyəvi-fiziki deskriptorlar tərəfindən gücləndirilmiş struktur xüsusiyyətləri tutmaq üçün əsasən elementə və sahəyə xas davamlı homologiyadan istifadə etdik, öyrənmə modeli üçün isə proqnozlaşdırıcı olaraq CNN-dən daxilolmalar ilə qidalanan GBT-dən istifadə etdik. Biz təklif olunan TopNetTree-nin performansını üç çox istifadə olunan PPI etalon məlumat dəsti ilə nümayiş etdiririk.

The H0 funksiyalar CNN tərəfindən emal edilir, onun yastı təbəqəsi çıxışları ilə birlikdə H1,H2 və köməkçi xüsusiyyətlər - son proqnoz üçün GBT modelinə verilir.

PPI-lərin topoloji təmsili

Atomlar arasında cüt qarşılıqlı təsir sıfır homologiya qrupu ilə xarakterizə olunur (H0, həmçinin ölçü funksiyası kimi tanınır 37 ). Daha yüksək ölçülü homoloji qruplar PPI komplekslərində daha yüksək səviyyəli nümunələri kodlayır. Birinci homoloji qrup (H1), Evklid məsafəsi ilə yaranır (De) əsaslı filtrasiya, Şəkil 2-də göstərildiyi kimi loop və ya tunelə bənzər strukturları xarakterizə edir, halbuki ikinci homoloji qrup (H2) PPI komplekslərində boşluq strukturlarını təsvir edir. Müxtəlif ölçüləri birləşdirərək PPI-lərin hərtərəfli topoloji təsvirini əldə edirik.

Vəhşi tipdəki qalıq lösin mutasiyaya uğrayaraq alaninə çevrilir. Barkodlar mutant qalığın 12 Å kəsimi daxilində karbon atomları üçün yaradılır.

Topoloji təsvir müxtəlif bioloji və ya kimyəvi aspektlərin nümunələrini (məsələn, oksigen və azot atomları arasında hidrogen bağları, hidrofobiklik, qütbləşmə və s.) bir sıra atom koordinatları (yəni,) ilə təmsil olunan PPI sistemindən çıxara bilməlidir. , nöqtə buludu). Bu məqsədə çatmaq üçün atom koordinatlarının seçilmiş alt çoxluqlarından və dəyişdirilmiş məsafə matrislərindən istifadə edərək sadə komplekslər qururuq.

Element və sahəyə xas davamlı homologiyanın qurulması üçün biz PPI kompleksindəki atomları müxtəlif alt qruplara təsnif edirik:


Giriş

Qalıq-qalıq kontaktları üçölçülü zülal strukturunda müəyyən məsafə həddinə yaxın olan qalıq cütlərinə aiddir. Zülalla əlaqə xəritələri 3D zülal strukturunun “sadələşdirilmiş” 2D təsvirləridir və müasir zülal strukturunun proqnozlaşdırılması paketlərində ən vacib komponentlərdən biri kimi qəbul edilir[1-15]. Proqnozlaşdırılan qalıq kontaktlarının tətbiqi zülal topologiyasının proqnozlaşdırılmasına[16], potensial 3D modelin qiymətləndirilməsinə və süzülməsinə[17,18], zülal-zülal qarşılıqlı təsirinin proqnozlaşdırılmasına[19-21] qədər genişləndirilmişdir. Qalıq kontaktlar molekulyar dinamika simulyasiyalarının[22,23] prosedurunu sürətləndirmək və dok simulyasiyalarında[24] bağlanma yaxınlığını proqnozlaşdırmaq üçün məsafə məhdudiyyətləri kimi də istifadə edilə bilər.

Qalıq kontaktının dəqiq proqnozlaşdırılması və onun müvafiq tətbiqləri struktur bioinformatikanın ən çətin və perspektivli problemlərindən biri olmuşdur. Erkən əlaqə proqnozlaşdırma üsulları əsasən qarşılıqlı məlumat (MI), riyazi optimallaşdırma üsulları və ənənəvi maşın öyrənmə alqoritmlərinə əsaslanır. MIp və MIc kimi yerli statistik modellər tranzitiv korrelyasiyaların təsirini minimuma endirmək iqtidarında deyil, çünki qalıq cütü statistik olaraq digərlərindən asılı olmayaraq müalicə olunur. Fiziki məhdudiyyətlər, qalıq kontaktının proqnozlaşdırılması üçün tam xətti proqramlaşdırma üsulları ilə də istifadə edilə bilər [25,26]. Bu ab initio təmas proqnozlaşdırma üsulları təkamül məlumatlarına etibar etmir, bu da ardıcıl homologları olmayan zülallar üçün yaxşı həll yolu ola bilər, eyni zamanda bol homologları olan zülallar üçün proqnozlaşdırma dəqiqliyini əhəmiyyətli dərəcədə azalda bilər. SVMcon[27], NNcon[28], SVMSEQ[29], SPINE-2D[30] kimi ənənəvi maşın öyrənmə üsulları kontaktlar arasındakı korrelyasiyaya məhəl qoymadan, cüt strategiyaya əsaslanaraq əlaqə xəritəsi matrisini proqnozlaşdırır, ona görə də bu üsullar hələ də qeyri-qənaətbəxş proqnoz göstərir. xüsusilə uzun məsafəli kontaktlar üçün. Tam ədəd xətti proqramlaşdırmanı maşın öyrənmə üsulları ilə birləşdirən üsullar [31,32] təmasların proqnozlaşdırılması performansını tamamlayıcı üsullarla da yaxşılaşdıra bilər, lakin bu təkmilləşdirmə ənənəvi maşın öyrənmə metodları ilə müqayisədə əhəmiyyətli bir sıçrayış deyil.

Birbaşa birləşmə analizi (DCA)[33] və seyrək tərs kovariasiyanın qiymətləndirilməsi (PSICOV) [34] kimi qlobal statistik nəticə çıxarma üsulları birləşmiş qalıqların korrelyasiya modelini tutmaqda irəliləyiş əldə edir. Bu üsullar birbaşa və dolayısı ilə əlaqəli qalıqların fərqləndirilməsinin vacibliyini vurğulayır. DCA-nın ideyaları əsasında geniş spektrli metodlar hazırlanmışdır. EVfold (mfDCA) [35] diskret dəyişənlərlə nəticə çıxarmaq üçün orta sahə yaxınlaşmaları ilə həyata keçirilən DCA variantlarından biridir. plmDCA[36], GREMLIN[37] və CCMpred[38] yalançı ehtimalını maksimuma çatdırmaqla Ehtimallı Qrafik Modelin (Markov təsadüfi sahəsi) parametrləri kimi birbaşa birləşmələri öyrənirlər. Diskret amin turşusu dəyişənlərini davamlı Qauss təsadüfi dəyişənləri ilə əvəz edən gDCA[39], DCA-nın çox səmərəli çoxdəyişənli Qauss modelləşdirmə variantıdır. Freecontact[40] EVfold (mfDCA) və PSICOV üçün sürətli əvəzedicidir və həmçinin proqnoz nəticələrinə müxtəlif təsirlər göstərə bilən çoxlu dəqiq tənzimlənən parametrləri ehtiva edir. DCA əsaslı metodlar dərin MSA-lar mövcud olduqda MI metodları və ya ənənəvi maşın öyrənmə metodları ilə müqayisədə daha yüksək dəqiqlik göstərir. Qalıqlar arasında dolayı birləşməni necə ayırmaq barədə müxtəlif tədqiqatlar aparılsa da, COLORS[41] qalıq korrelyasiya matrisinin aşağı dərəcəli və seyrək parçalanması (LRS) vasitəsilə əsasən filogenetik meyllərin səbəb olduğu fon korrelyasiyasını aradan qaldırır. Təkamül birləşmə analizinə (ECA) əsaslanan bu üsullar təmasda olan qalıq cütlərinin MSA-da əks olunan uzunmüddətli təkamüllərdə əlaqəli mutasiyalar təqdim etməli olduğunu güman edir, lakin çox vaxt məhdud sayda homoloji ardıcıllığa malik hədəflər üçün gücsüz olur. Dəqiqliyi və geri çağırmağı daha da artırmaq üçün PconsC[42], MetaPSICOV[43], RRCRank və NeBcon[44] kimi konsensus-proqnozlaşdırıcılar konsensus proqnozları yaratmaq üçün müxtəlif ECA-əsaslı və ya ML-əsaslı əlaqə proqnozlaşdırıcılarının çıxışını birləşdirir.

Təkamüllü birləşmə analizi (ECA) və dərin neyron şəbəkələrinin inteqrasiyası ilə dəqiq kontakt proqnozlaşdırılmasında əhəmiyyətli irəliləyiş əldə edilmişdir. DeepCov[45] və PconsC4[46] kimi dərin öyrənmə (DL) əsaslı metodlar giriş kimi təmiz MSA-dan istifadə edir ki, bu da proqnozlaşdırma modellərinin mürəkkəbliyini və hesablama vaxtını xeyli azaldır. Halbuki, onların proqnozlaşdırma düzgünlüyünə MSA-dakı effektiv ardıcıllıqların sayı da böyük təsir göstərəcək. MSA-da effektiv ardıcıllıqlar adekvat olmadıqda, müxtəlif növ məlumatları giriş funksiyaları kimi birləşdirən DL metodları daha uğurlu olacaqdır. Bu kateqoriyaya aid üsullara RaptorX-Contact[47], DeepContact[48], DeepConPred2[49], DNCON2[50], DEEPCON [51], SPOT-Contact[52], DeepCDpred[53], ResPRE[54] və MapPred daxildir. [55]. Təbii dilin emalı üçün geniş miqyaslı dil modellərinin tətbiqindən bəri zülallar üçün oxşar modellərin hazırlanmasına böyük maraq yaranmışdır. CASP14-də AlphaFold2 qalıq məkana diqqətə əsaslanan neyron şəbəkə sistemi-Transformator tətbiq etdi. Orijinal AlphaFold bütün məsafələri bərabər çəkdi, müqayisədə diqqətə əsaslanan şəbəkə hansı kənarların vacib olduğunu müəyyən edə bilər. Rives və başqaları. [56] və Rao et al. [57]nəzarətsiz əlaqə proqnozunu yerinə yetirmək üçün transformator diqqət xəritələrindən istifadə etdi və modellər GREMLIN və ya CCMpred kimi ən yaxşı ECA metodlarından daha yaxşı performans göstərir. DL əsaslı əlaqə proqnozu bu yaxınlarda RaptorX[13], trRosetta[14] və AlhpaFold[15] kimi paketlərdə zülal strukturunun yenidən qurulmasına kömək etmək üçün görünməmiş qabiliyyət nümayiş etdirdi.

Baxmayaraq ki, qalıq təmas proqnozlaşdırıcılarının qiymətləndirilməsi CASP-də uzun müddətdir [58,59], təmasların qiymətləndirilməsi sessiyası üçün yalnız məhdud sayda hədəflər mövcuddur və müxtəlif qruplar tərəfindən verilən proqnozlaşdırma nəticəsi eyni girişlərə əsaslanmır. . Wuyun və başqaları[60] və de Oliveira et al. [61] 15 ECA/ML metodunu və 8 ECA metodunu eyni girişləri olan böyük zülal zəncirləri dəstlərində qiymətləndirmişdir. Süni intellekt tətbiqlərinin yüksələn dalğasında getdikcə daha çox dərin öyrənməyə əsaslanan kontakt proqnozlaşdırma üsulları inkişaf etdirildi. Bununla belə, bu DL metodları üzrə geniş miqyaslı etalon məlumat dəstləri və eyni girişlər vasitəsilə digər kateqoriyalar üzrə metodlarla müqayisəli qiymətləndirmə yoxdur. Bu məqsədlə mövcud metodların müxtəlif rakurslardan hərtərəfli nəzərdən keçirilməsi və tənqidi qiymətləndirilməsi zəruridir.

Bu araşdırmada, geniş perspektivlərə uyğun olaraq üç məlumat dəsti (610 zülaldan ibarət müstəqil test dəsti, 215 zülaldan ibarət test dəsti və 32 CASP13 hədəfi) üzrə yerli olaraq quraşdırılmış 18 əlaqə proqnozlaşdırıcısını (cari metodların nümayəndələri kimi) qiymətləndiririk. . S1 Cədvəlində qeyd olunduğu kimi, qiymətləndirilmiş metodlar ənənəvi ML, konsensus ML, ECA, tək girişli DL və çox girişli DL metodları daxil olmaqla bir neçə fərqli kateqoriyanı əhatə edir. Əvvəlki qiymətləndirmə işləri ilə müqayisədə bu tədqiqatın yenilikləri aşağıdakılardan ibarətdir: (1) Bizim qiymətləndirməmiz əvvəlki işlər kimi təkcə ümumi cəhətləri (ardıcıllığın uzunluğunun təsiri və effektiv MSA, protein struktur sinfi, metod oxşarlığı və s.) ehtiva etmir, həm də model ehtimalı, kontakt sıxlığı, fiziki kimya xassəsi, zülal sahələri, paylanma dispersiyası və işləmə vaxtı ilə bağlı perspektivləri özündə birləşdirir. (2) Hətta ümumi cəhətlər üçün də biz daha fərqli bucaqlardan müşahidələr təqdim etməyə çalışırıq. Məsələn, MSA axtarışı ən böyük protein ardıcıllığı verilənlər bazasına (NCBI-nr) qarşı aparılır, effektiv MSA-nın proqnozlaşdırma performansına və müxtəlif metodların tətbiq şərtlərinə təsirini daha yaxşı aşkar etmək üçün, biz xüsusi diqqətlə zülal struktur sinifləri üzrə müxtəlif metodların performansını təhlil edirik. daxili nizamsız və çoxdomenli zülallar üzərində. (3) Kontakt/üçüncü strukturun proqnozlaşdırılmasında mühüm rol oynayan DL əsaslı metodlar üzrə hərtərəfli və tənqidi qiymətləndirmə, əvvəllər eyni girişlərə malik geniş miqyaslı verilənlər bazalarında aparılmamış, lakin qiymətləndirmə təcrid olunmur, lakin qiymətləndirmənin bir hissəsi kimi nəzərdən keçirilir. ənənəvi ML, ECA və konsensus ML üsullarını yenidən nəzərdən keçirməklə əlaqə proqnozlaşdırma üsullarının təkamülü. (4) Müxtəlif üsullardan proqnozlaşdırılan kontaktlar, müxtəlif struktur siniflərindən yüksək dərəcədə lazımsız zülallardan ibarət geniş miqyaslı sınaq dəstinə əsaslanan üçüncü strukturun yenidən qurulmasına tətbiq edilir. Genişmiqyaslı qiymətləndirmə vasitəsilə biz performansa əhəmiyyətli dərəcədə təsir edən amilləri araşdırmaq, ən qabaqcıl proqnozlaşdırıcıları araşdırmaq, müxtəlif üsullar üçün tətbiq ssenarilərini araşdırmaq və gələcək təkmilləşdirmə üçün perspektiv istiqamətlər axtarmaq məqsədi daşıyırıq.


Müzakirə

Bu işlə, məhluldakı zülalların NMR məlumatlarının statistik təhlilinin amin turşusu ardıcıllığı və onurğa dinamikası arasındakı əlaqəyə kəmiyyətcə fikir verə biləcəyini nümayiş etdiririk. DynaMine magistral dinamika proqnozlaşdırıcısı əsaslanır S 2 sifariş parametrləri birbaşa eksperimental məlumat məzmunundan (NMR kimyəvi sürüşmələri) təxmin edilir və istifadə etdiyi sadə xətti proqnozlaşdırma metodologiyasına baxmayaraq əla nəticələr verir. DynaMine çox sürətlidir və amin turşusu qalıqlarının onurğa sümüyünün sərtliyinə və əlavə olaraq qalıq nizamına və nizamsızlığına görə necə davrandığına dair davamlı və incə bir şəkil verir. Bunu Şəkil 1-də göstərilən hər bir amin turşusu dinamikası xassələri göstərir. S 2 dəyəri kimyəvi sürüşmələrdən hesablanır və digər eksperimental NMR məlumatlarının (məsələn, istirahət parametrləri) daxil edilməsi əlavə olaraq NMR parametrlərinin hər qalıq dinamikası məlumatına çevrilməsini daha da yaxşılaşdırmaq üçün böyük potensiala malikdir. Bu inkişaflar, zülal dinamikası və funksiyası arasında indi yaxşı qurulmuş əlaqə ilə birlikdə, genomikadan zülalların yalnız ardıcıllıqla təhlilinə yeni bir ölçü əlavə etmək üçün yollar açır.

Bu xüsusilə məcburi köçkünlərə aiddir, burada dinamika onların xüsusiyyətlərinin müəyyən edilməsində əsas rol oynayır 34 . Bu günə qədər nəşr olunan >50 proqnozlaşdırıcıları bir çox fərqli hesablama prinsiplərindən istifadə edir, lakin onların əksəriyyəti DisProt 4 məlumatlarına əsaslanır. Məsələn, meta-prediktorların son inkişaflarına baxmayaraq, bu sahədə təkmilləşdirmələr hələ də çox zəruridir 9 . Bu proqnozlaşdırıcılardan istifadə edərkən zülal pozğunluğunun fiziki əsasları da qeyri-müəyyən olaraq qalır və biz burada pozğunluq-proqnozlaşdırma ballarının faktiki dəyərlərinin birbaşa məna daşıdığına dair şübhələri təsdiqləyirik 19 (Usullara baxın). Bu kontekstdə DynaMine proqnozlarını əvvəlki iş 35 ilə əlaqədar olaraq yerləşdirmək vacibdir ki, bu da proqnozlaşdırılan sərbəst enerji və pozğunluq arasında əlaqəni göstərir DynaMine enerji baxımından əlverişli vəziyyətlərində məlumat dəstimizdəki zülallar üçün müşahidə edilən dinamikanı proqnozlaşdırır. Biz göstəririk ki, bu enerji baxımından əlverişli dinamikalar həm də struktur pozğunluğu ilə fiziki olaraq bağlıdır və beləliklə, ikisi arasında əlaqəni möhkəm şəkildə qurur. Beləliklə, bizim yanaşmamız O/D-nin binar müalicəsi və pozğunluq məlumatlarının mənbəyi ilə bağlı əsas məhdudiyyətləri aradan qaldırır, o, sürətli onurğa dinamikasını əhatə edən eksperimental kimyəvi sürüşmə məlumatlarına əsaslanır, onurğa sütununun hərəkətlərini ifadə etmək üçün davamlı miqyasdan istifadə edir və 3D strukturların istifadəsindən yayınır. . Baxmayaraq ki, xüsusilə NMR strukturları həm də proqnozlaşdırıcıları hazırlamaq və ya tənzimləmək üçün yaxşı məlumat mənbəyidir 18 və strukturlar proqnozlaşdırmaq üçün istifadə edilə bilər. S 2 dəyəri 17, onlar daha dinamik bölgələr üçün məhluldakı zülalın konformasiyalarını təmsil etmir. Belə hallarda eksperimental məlumatlardan ehtiyatla istifadə etməklə mütəxəssis yanaşmaları tələb olunur 36 .

DynaMine həmçinin ardıcıllıqla funksiya ilə əlaqəli xüsusiyyətləri təyin edə bilər. O, qatlanmış domenlərin və ikinci dərəcəli struktur elementlərinin sərhədlərini müəyyən edir və qlobal təşkilatlanma səviyyəsi ilə seçilən müxtəlif nizamsız vəziyyətlərə həssas görünür. Struktur pozğunluğu təqribən iki qlobal tipə təsnif edilir 37: uzadılmış (təsadüfi rulona bənzər) və çökmüş (ərimiş qlobul tipli). DynaMine daha nizamsız struktur mühitinə daxil edilmiş ərimiş kürəciklərin (məsələn, NCBD və ya CBP) konturlarını çəkmək qabiliyyətinə malikdir. Məcburi köçkünlər öz bağlayıcı tərəfdaşlarını tez-tez yerli ardıcıllığın mühafizəsi 38,39 və bağlı konformasiya vəziyyətinə qarşı struktur qərəzliyi 6,7,8 ilə müəyyən edilən qısa davamlı ardıcıllıq motivləri vasitəsilə tanıyırlar. DynaMine, proqnozda zirvələr kimi görünən bu bölgələrdə yerli olaraq azalmış dinamikanı götürməyə qadir görünür. Post-translational modifikasiya yerlərində və hüceyrəaltı yeri təyin edən hədəf motivlərində olduğu kimi, bağlanma zamanı qatlanmaması lazım olan funksional motivlər üçün zirvələr proqnozlaşdırılmır. Bəzi hallarda, hətta USP7 ubiquitin ligase və onun nüvə lokalizasiyası siqnal motivləri ilə bağlanmış p53 seqmentində olduğu kimi, bu saytların yüksək dərəcədə məruz qaldığını göstərən aydın minimumlar da baş verir. Buna görə də DynaMine ardıcıllıqla funksional motivlərin növlərini düzgün müəyyən etmək və təyin etmək üçün həyati vacib məlumatları təmin edə bilər ki, bu da gələcəkdə ELM 40 və MiniMotif 41 verilənlər bazalarında verilənlərlə korrelyasiyaların hərtərəfli təhlilinin mövzusu olacaq.

Bundan əlavə, DynaMine-in əla performansı, qalığın dinamik xüsusiyyətlərinin zülal ardıcıllığında əsaslı şəkildə kodlana biləcəyini göstərir. Bu yaxınlarda genişmiqyaslı silisiumda 3D zülal strukturlarından molekulyar dinamika simulyasiyalarından istifadə etməklə aparılan araşdırma göstərdi ki, dinamika və funksiya bir-biri ilə sıx əlaqəlidir 42 və zülallarda müəyyən edilmiş dinamika nümunələri (“Dinasome”). (Eksperimental) sifariş parametri sürətli (ps-ns zaman şkalası) onurğa sütunu dinamikası ilə əlaqəli olsa da, DynaMine müşahidə edilən (ikili) struktur pozğunluğu ilə güclü korrelyasiya göstərir ki, bu da daha yavaş (yüksək μs-ə qədər) seqmental hərəkətlərlə bağlıdır. polipeptid zənciri. Bu əla razılaşma yəqin ki, bir-biri ilə əlaqəli olsa da, iki fərqli mənbədən gəlir.Birincisi, ədəbiyyatda göstərilmişdir ki, sürətli yerli hərəkətlər və daha yavaş, seqmental hərəkətlər sıx bağlıdır 15, burada kollektiv sürətli hərəkətlər polipeptid zəncirinin daha geniş miqyaslı, daha yavaş seqmental yenidən qurulmasını təşkil edir. İkincisi, kimyəvi yerdəyişmə ilə təxmin edilənlər, kimyəvi yerdəyişmələrin orta hesablamasına səbəb olduğu müddətcə, müxtəlif ikinci dərəcəli strukturlar arasında keçid kimi daha yavaş və daha geniş miqyaslı konformasiya mübadilə hadisələri ilə potensial olaraq əlaqələndirilir (bax: Metodlar). Biz proqnozlaşdırdığımız zaman S 2 kimyəvi yerdəyişmələrdən (və ardıcıllıqla) naməlum nisbətlərdə sürətli və daha yavaş hərəkətlərin qarışığını təmsil edir və bu, pozğunluq proqnozlaşdırıcısı kimi DynaMine-in altında yatan məlumatların fiziki mənasını gücləndirir. Bu, uzun (51 qalıq) pəncərə ilə niyə belə yaxşı işlədiyini də izah edə bilər. Ümumiyyətlə, DynaMine-in istifadəsi oxşar dinamik analizi üçün struktur məlumatı olmayan mövcud protein ardıcıllığının böyük hovuzunu açır. O, həmçinin məcburi köçkünlərin strukturunda və/yaxud dinamikasında kritik dəyişikliklərə səbəb olan mutasiyaların zülalın funksiyasında və/yaxud aqreqasiyasında dəyişikliklərə səbəb olduğu xəstəliklərlə bağlı mühüm ipuçları verə bilər 43,44.

Yekun olaraq, biz iddia edirik ki, DynaMine müstəqil sübutlar və dinamikanın və struktur pozğunluğun qərəzsiz mənzərəsini təqdim edir. Biz gözləyirik ki, DynaMine müxtəlif substratların (bobinşəkilli, ərimiş kürəşəkilli və hətta əvvəlcədən ərinmiş kürəyə bənzər) dayanıqlığının qiymətləndirilməsi və qiymətləndirilməsi üçün istifadə olunacaq və daha da əhəmiyyətlisi, o, zərərvericilərə kömək etmək üçün bir vasitə halına gətiriləcək. funksional bölgələrin proqnozlaşdırılması.


Təkmilləşdirilmiş Ekstremal Öyrənmə Maşın Alqoritmləri ilə Zülal Ardıcıllığının Təsnifatı

Böyük bioloji zülal ardıcıllığı verilənlər bazasından zülal ardıcıllığının dəqiq təsnifləşdirilməsi rəqabətqabiliyyətli farmakoloji məhsulların hazırlanmasında mühüm rol oynayır. Görünməyən ardıcıllığı bütün müəyyən edilmiş zülal ardıcıllığı ilə müqayisə etmək və kateqoriya indeksini ən yüksək oxşarlıq əldə edən zülalla qaytarmaq, ənənəvi üsullar adətən vaxt aparır. Buna görə də, zülal ardıcıllığının effektiv təsnifat sistemini qurmaq təcili və zəruridir. Bu yazıda biz SLFN-lərdən istifadə edərək zülal ardıcıllığının təsnifatının performansını öyrənirik. Təlim alqoritmləri kimi son səmərəli ekstremal öyrənmə maşını (ELM) və onun invariantlarından istifadə olunur. Optimal budanmış ELM ilk olaraq bu məqalədə zülal ardıcıllığının təsnifatı üçün istifadə edilmişdir. Performansı daha da artırmaq üçün eyni sayda gizli qovşaqlara və eyni aktivləşdirmə funksiyasına malik çoxsaylı SLFN-lərin ansambllar kimi istifadə edildiyi ansambl əsaslı SLFN strukturu qurulur. Hər bir ansambl üçün eyni məşq alqoritmi qəbul edilir. Yekun kateqoriya indeksi səs çoxluğu metodundan istifadə etməklə əldə edilir. Ansambl əsaslı SLFN-lər üçün iki yanaşma, yəni əsas ELM və OP-ELM qəbul edilmişdir. Protein İnformasiya Resurs Mərkəzindən əldə edilmiş məlumat dəstlərindən istifadə edərək, performans təhlil edilir və bir neçə mövcud metodlarla müqayisə edilir. Eksperimental nəticələr təklif olunan alqoritmlərin prioritetliyini göstərir.

1. Giriş

Zülal ardıcıllığı (həmçinin polipeptidlər kimi tanınır) xətti zəncirdə düzülmüş və kürə şəklində qatlanmış amin turşularından ibarət üzvi birləşmələrdir. Polimer zəncirindəki amin turşuları, bitişik amin turşusu qalıqlarının karboksil və amin qrupları arasındakı peptid bağları ilə birləşir. Zülaldakı amin turşularının ardıcıllığı genetik kodda kodlanmış bir genin ardıcıllığı ilə müəyyən edilir. Şəkil 1-də göstərildiyi kimi, gen dezoksiribonuklein turşusu (DNT) boyunca hüceyrəyə müəyyən bir məhsul istehsal etməyə imkan verən təlimatları kodlayan hər hansı bir seqmentdir. Tipik olaraq, ferment kimi bir zülal xüsusi bir hərəkətə başlayır.


Klinik proteomikada və zülal bioinformatikasında geniş tətbiqlərə görə, son illərdə zülal ardıcıllığı təhlilləri hərtərəfli tədqiq edilmişdir, məsələn, Barve et al. [1], Chen et al. [2], Cong et al. [3], Machado et al. [4], Carregari et al. [5] və Liu et al. [6]. Protein ardıcıllığının təhlili ümumiyyətlə silisiumdakı zülal ardıcıllığını xarakterizə etməyə kömək edir və zülal strukturlarının və funksiyalarının proqnozlaşdırılmasına imkan verir. Son tədqiqatlar göstərdi ki, zülal ardıcıllığının müqayisəli təhlili birbaşa DNT-ni müqayisə etməkdən daha həssasdır. Beləliklə, son onilliklərdə Zülal İnformasiya Resursu (PIR) (http://pir.georgetown.edu/), Protein Məlumat Bankı (PDB) (http://www. pdb.org/pdb/home/home.do) və Universal Protein Resursu (UniProt) (http://www.uniprot.org/). Beləliklə, həm kompüter alimləri, həm də bioloqlar üçün böyük zülal ardıcıllığı verilənlər bazasından faydalı məlumatlardan səmərəli istifadə etmək vacib və çətin bir vəzifəyə çevrilir. Baldi və Brunak [7] tərəfindən qeyd edildiyi kimi, zülal ardıcıllığının təsnifatı eyni zülal super ailəsindən ibarət olan zülal ardıcıllığının üzvlərinin təkamül baxımından əlaqəli olması və bir-biri ilə funksional və struktur cəhətdən əlaqəli olması hesabına zülal ardıcıllığının təhlilində mühüm rol oynayır. Üzv zülal ardıcıllığını superfamilya zülalına dəqiq şəkildə təsnif etmək, bütün fərdi üzv zülal ardıcıllıqları üzrə analiz əvəzinə xüsusi superailə daxilində bəzi molekulyar analizlərin aparılmasının faydasını göstərər. Ümumiyyətlə, iki zülal ardıcıllığı, ardıcıl düzülmə alqoritmləri ilə çıxarılan xüsusiyyət nümunələri yüksək homologiya göstərərsə, eyni kateqoriyaya təsnif edilir. Son bir neçə ildə görünməyən zülal ardıcıllığının sinifini müəyyən etmək üçün onu bəzi məlum zülal ardıcıllığı ilə müqayisə etmək və onların iPro-Class (http://pir.georgetown.edu) kimi oxşarlıqlarını hesablamaq üçün çoxlu uyğunlaşdırma alqoritmləri təklif edilmişdir. /), SAM (SAM: Sequence Alignment and Modeling Software System, Baskin Center for Computer Engineering and Science, http://www.cse.ucsc.edu/researchcompbio/) və MEME (MEME: Motif Elicitation UCSD üçün Çox Gözləmə Maksimumlaşdırılması) Kompüter Elmləri və Mühəndisliyi, http://meme.sdsc.edu). Bununla belə, test zülal ardıcıllığını bütün mövcud müəyyən edilmiş zülal ardıcıllığı ilə müqayisə etmək, xüsusən də verilənlər bazası böyük olduqda və görünməyən zülal ardıcıllığının uzunluğu uzun olduqda, çox vaxt tələb edən bir işdir. Buna görə də, böyük bir verilənlər bazasında sınaq zülalının ardıcıllığını tam olaraq etiketləmək üçün səmərəli və ağıllı bir təsnifat sisteminin yaradılması təcili və faydalı olur.

Son onilliklərdə statistik nəzəriyyəyə əsaslanan ümumi siqnal təsnifatları üçün qərar ağacları, statistik üsullar, dəstək vektor maşını (SVM) və neyron şəbəkələri (NN) kimi bir sıra üsullar hazırlanmışdır. Yang və başqaları. [8] zülal ardıcıllığında xüsusiyyət çıxarmaq üçün söz seqmentasiya metodundan istifadə etdi və sonra təsnifat üçün SVM-dən istifadə etdi. Bundan əlavə, Caragea et al. [9] zülal ardıcıllığı xüsusiyyət vektorunun ölçüsünü azaltmaq üçün hashing funksiyasından istifadə etdi və sonra SVM ilə təsnifat həyata keçirdi. SVM metodundan istifadəyə alternativ olaraq, neyron şəbəkələri aşağıdakı iki səbəbə görə zülal ardıcıllığının təsnifatı üçün başqa bir məşhur metoddur: (i) zülal ardıcıllığının xüsusiyyətləri ümumiyyətlə mürəkkəb xüsusiyyətlərə malik yüksək ölçülü məkanda paylandığı üçün adətən çətin olur. statistik və ya parametrləşdirilmiş yanaşmalardan istifadə edərək qənaətbəxş model tapmaq və (ii) neyron şəbəkələri modelə daxil edilmiş xam davamlı dəyərləri emal edə bilir. Son bir neçə ildə zülal ardıcıllığının təsnifatı üçün neyron şəbəkələrinə əsaslanan bir çox tədqiqat işləri aparılmışdır, məsələn, Wang et al. [10, 11] və Wang və Huang [12]. Wang et al. [10] təkmilləşdirilmiş təsnifat meyarları ilə zülal ardıcıllığı üçün modul radial əsas funksiyası (RBF) neyron şəbəkə təsnifatını təklif etdi və təsnifat etibarlılığını artırmaq üçün qərar qəbul etmək üçün iki evristik qayda təqdim edildi. Qeyri-səlis təsnifat qaydaları toplusunu yaradan ümumiləşdirilmiş radial əsas funksiyası (GRBF) neyron şəbəkəsi arxitekturası Wang və digərləri tərəfindən protein ardıcıllığının təsnifatı üçün hazırlanmışdır. [11]. Zülal ardıcıllığının təsnifatındakı əvvəlki məqalələrin əksəriyyəti ümumiyyətlə neyron şəbəkələri üçün qradient əsaslı alqoritmi seçir, bu da ümumiyyətlə vaxt aparır. Beləliklə, bu yaxınlarda Huang və digərləri tərəfindən təklif olunan tək gizli qatlı irəli ötürülən neyron şəbəkələri (SLFN) üçün hesablama baxımından səmərəli tənzimləməsiz alqoritm (ELM) adlı ekstremal öyrənmə maşınıdır. [13, 14] və daha da Huang et al. [15], Wang və Huang [12] tərəfindən protein ardıcıllığının təsnifatı üçün tətbiq edilmişdir. Wang və Huang [12] tərəfindən verilmiş eksperimental nəticələr göstərdi ki, ELM alqoritmi adi gradient əsaslı metoddan (həmçinin Levenberq [16] və Marquardt [17] tərəfindən işlənib hazırlanmış geri yayılma (BP) kimi tanınır) ilə müqayisədə minlərlə dəfə daha sürətli öyrənir. zülal ardıcıllığında daha yüksək təsnifat dərəcəsi ilə. Təsnifat performansını artırmaq və məşq vaxtını məqbul səviyyədə saxlamaq üçün Cao-da ELM neyron şəbəkəsindəki gizli neyron parametrlərini yeniləmək üçün özünə uyğunlaşan diferensial təkamüldən istifadə edən özünə uyğunlaşan təkamül ELM (SaE-ELM) təqdim edilmişdir. və b. [18].

Baxmayaraq ki, əsas ELM və onun dəyişməz SaE-ELM Wang və Huang [12] və Cao et al tərəfindən zülal ardıcıllığının təsnifatı üçün istifadə edilmiş və müzakirə edilmişdir. [18], müvafiq olaraq, təkmilləşdirmə üçün hələ də çoxlu otaqlar var. Wang və Huang [12] tərəfindən təqdim olunduğu və müzakirə edildiyi kimi, ELM öyrənməsi zülal ardıcıllığı verilənlər bazasında adi BP alqoritmindən daha sürətli olsa da, təsnifat sürətinin yaxşılaşması nisbətən kiçikdir. Bu məqsədlə biz bu məqalədə son təkmilləşdirilmiş ELM alqoritmləri əsasında zülal ardıcıllığının təsnifat performansını öyrənirik. Kağızın töhfələri üçqatdır. Birincisi, bu yaxınlarda hazırlanmış möhkəm və ümumi alqoritm Miche və digərləri tərəfindən hazırlanmış optimal budanmış ELM (OP-ELM) adlandırdı. [19] bu yazıda zülal ardıcıllığının təsnifatı üçün istifadə edilmişdir, burada Simila və Tikka [20] tərəfindən hazırlanmış çoxcavablı seyrək reqressiya (MRSR) texnikası və bir-birini tərk etmək (LOO) doğrulama meyarı OP-ELM-də istifadə olunur. müvafiq sayda gizli neyronların seçilməsi. İkincisi, ansambl əsaslı SLFN-lərin şəbəkə strukturu təklif edilir və zülal ardıcıllığının təsnifatı performansını daha da artırmaq üçün səs çoxluğu metodu qəbul edilir. Üçüncüsü, yeni strukturda hər bir ansambl üçün təlim alqoritmləri kimi həm əsas ELM, həm də OP-ELM istifadə olunur. Beləliklə, zülal ardıcıllığının təsnifatları üçün səsverməyə əsaslanan ELM (V-ELM) və səsverməyə əsaslanan OP-ELM (VOP-ELM) adlı iki alqoritm hazırlanmışdır. Təklif olunan bütün metodların performansı Protein İnformasiya Resursu (PIR) mərkəzindən zülal ardıcıllığı verilənlər bazasından istifadə etməklə təhlil edilir. Simulyasiyaların nəticələri Hsu və Lin [21] tərəfindən SVM, Haykin tərəfindən BP [22], Marquardt [17], Levenberq [16] və Huang və digərlərinin orijinal ELM kimi ən son müasir alqoritmlərlə müqayisə edilir. [13, 14, 23].

Qəzetdə qalan təşkilatlar aşağıdakılardır. Wang et al tərəfindən istifadə edilən bioloji zülal ardıcıllığı məlumatları üçün xüsusiyyət çıxarılması üsulu. [10, 11] 2-ci Bölmədə nəzərdən keçirilir. PIR verilənlər bazasından yüklənmiş zülal ardıcıllığının məlumat təsviri də bu bölmədə təqdim olunur. Bölmə 3-də ilk olaraq tək gizli qatlı neyron şəbəkəsindən istifadə edərək protein ardıcıllığının təsnifatı üçün son ELM və onun təkmilləşdirilmiş OP-ELM metodu verilir. Daha sonra zülal ardıcıllığının təsnifatı üçün çoxluq səsvermə üsulu ilə birləşdirilmiş ansambl əsaslı SLFN strukturu təklif olunur. Orijinal ELM və OP-ELM hər bir ansambl üçün öyrənmə alqoritmləri kimi istifadə olunur. Eksperimental nəticələr və performans müqayisələri Bölmə 4-də verilmişdir. Müzakirələr və nəticələr Bölmə 5-də verilmişdir.

2. Xüsusiyyətlərin çıxarılması

Wang et al tərəfindən təsvir edildiyi kimi. [10, 11], zülal ardıcıllığı ümumiyyətlə 20 amin turşusunun müxtəlif birləşmələrindən aşağıdakı kimi qeydlərlə hazırlanır.


Path-A proqnozlaşdırma sistemində giriş kimi qəbul edilən zülal ardıcıllığı nədir - Biologiya

ZÜLAL KİMYASI

MƏLUMAT: Siz Robert Russelin Struktur Proqnozlaşdırma Bələdçisi ilə məsləhətləşmək istəyə bilərsiniz. Amin turşularının biokimyəvi xassələri üçün PROWL, Amin Turşularının Hidrofobikliyi və Amin Turşu Cədvəli və İstinad Cədvəlinə (GenScript) baxın. Xüsusilə antikorlarla maraqlanırsınızsa, "The Antikor Resurs Səhifəsini" ziyarət etməyinizi tövsiyə edərdim.

Amin turşusu tərkibi və kütləsi &ndash ProtParam (ExPASy, İsveçrə)
İzoelektrik nöqtə - pI/Mw hesablama aləti (ExPASy, İsveçrə). Şarj və pH arasındakı əlaqənin planını istəyirsinizsə, ProteinChemist istifadə edin (ProteinChemist.com) və ya JVirGel Proteomik Alətləri (PRODORIC Net, Almaniya).
Kütləsi, pI, tərkibi və mol% asidik, əsas, aromatik, polar və s. amin turşuları - PEPSTATS (RƏHMƏT). Biokimya-onlayn (Vitalonik, Rusiya) bir% tərkibi, molekulyar çəkisi, pI və istənilən istənilən pH-da yük verir.

Peptid Molekulyar Çəki Kalkulyatoru (GenScript) - onlayn kalkulyator maraqlandığınız peptidinizin kimyəvi formulu və molekulyar çəkisini müəyyən edir. Daha dəqiq nəticələr əldə etmək üçün N- və C- terminal modifikasiyaları və disulfid körpülərinin yerləşdirilməsi kimi post-tərcümə modifikasiyalarını da təyin edə bilərsiniz.

İzoelektrik Nöqtə Kalkulyatoru 2.0 (IPC 2.0) - a izoelektrik nöqtələrin proqnozlaşdırılması üçün server və sKa dərin öyrənmə və dəstək vektor reqressiya modellərinin qarışığından istifadə edərək dəyərlər. Zülallar və peptidlər üçün IPC 2.0-ın proqnozlaşdırma dəqiqliyi (RMSD) əvvəlki alqoritmləri üstələyir. (İstinad: Kozlowski LP (2021) Nucl. Acids Res. Web Server məsələsi).

Tərkibi/Molekulyar Çəkinin Hesablanması (Georgetown Universiteti Tibb Mərkəzi, ABŞ) - bu saytla bağlı yeganə problem odur ki, toplu rejimdə işləyərkən ardıcıllığı adla müəyyən etmir, sadəcə ardıcıl nömrə

Protein kalkulyatoru (C. Putnam, The Scripps Research Institute, ABŞ) - verilmiş pH-da kütlə, pI, yükü hesablayır, amin turşusu qalıqlarını hesablayır və s.

Tm Predictor (P.C. Lyu Laboratoriyası, Milli Tsing-Hua Universiteti, Tayvan) - zülalların nəzəri ərimə temperaturunu hesablayır.

Antigenlik və allergenlik: Başlamaq üçün yaxşı yer İmmun Epitop Database (IEDB) olardı.

Abie Pro Peptid Antikor Dizaynı (Chang Bioscience)

Allergenlik serverləri: AllerTOP ( İstinad : Dimitrov, I. et al. 2013. BMC Bioinformatics 14(Əlavə 6): S4), AlgPred - allergen zülalların proqnozlaşdırılması və IgE epitoplarının xəritələşdirilməsi (İstinad: Saha, S. və Raghava, G.P.S. 2006. Nuklein turşularının tədqiqatı 34: W202-W209.), və SDAP - Allergen Zülalların Struktur Məlumat Bazası (İstinad: Ivanciuc, O. et al. 2003. Nucleic Acids Res. 31: 359-362).

EpiToolKit - vaksin dizaynına diqqət yetirməklə immunoloji suallar üçün virtual iş dəzgahıdır. O, MHC genotiplənməsini, epitop və neo-epitop proqnozunu, peyvəndin dizaynı üçün epitop seçimini və epitop yığımını əhatə edən bir sıra immunoinformatika vasitələri təklif edir. Bu yaxınlarda yenidən həyata keçirilən 2.0 versiyasında EpiToolKit bir sıra yeni funksionallıq təmin edir və ilk dəfə olaraq alətləri mürəkkəb iş axınlarında birləşdirməyə imkan verir. Təcrübəsiz istifadəçilər üçün o, mürəkkəb immunoloji məlumat dəstlərinin təhlili vasitəsilə istifadəçilərə rəhbərlik etmək üçün sadələşdirilmiş interfeyslər təklif edir. (İstinad: Schubert S et al. (2015) Bioinformatika 31(13): 2211&ndash2213).

skripka - Vacsin Itəhqiqat və OnLine Iməlumat Network - müxtəlif insan patogenləri arasında peyvəndlə əlaqəli tədqiqat məlumatlarının asan kurasiyasına, müqayisəsinə və təhlilinə imkan verir VIOLIN peyvənd haqqında məlumatın mərkəzləşdirilmiş mənbəyinə çevrilməsi və fundamental və klinik elmlər üzrə tədqiqatçıları peyvəndin tədqiqatı və inkişafı üçün seçilmiş məlumatlar və bioinformatika vasitələri ilə təmin etməsi gözlənilir. . VBLAST: Peyvənd Tədqiqatı üçün Fərdi BLAST Axtarışı 34 patogenin 77 genomuna qarşı müxtəlif axtarış strategiyalarına imkan verir. (İstinad: He, Y. et al. 2014. Nucleic Acids Res. 42 (Məlumat bazası məsələsi): D1124-32).

SVMTriP - IEDB verilənlər bazasından ən son ardıcıllıqla daxil olan antigenik epitopu proqnozlaşdırmaq üçün yeni bir üsuldur. Bizim metodumuzda daha yaxşı proqnozlaşdırma performansına nail olmaq üçün Tri-peptid oxşarlığı və Meyil skorlarını (SVMTriP) birləşdirərək Dəstək Vektor Maşınından (SVM) istifadə edilmişdir. Bundan əlavə, SVMTriP insan zülal ardıcıllığının fonundan viral peptidləri tanımağa qadirdir. (İstinad: Yao B et al. (2012) PLoS One 7(9): e45152).

Həllolma və kristallaşma qabiliyyəti:

EnzymeMiner - müxtəlif strukturlara, katalitik xüsusiyyətlərə və stabilliyə malik həll olunan fermentlərin avtomatlaşdırılmış şəkildə çıxarılmasını təklif edir. Çözünürlük proqnozu maşın öyrənməsi ilə hazırlanmış daxili SoluProt proqnozlaşdırıcısından istifadə edir.( İstinad: Hon J et al. 2020. Nucl Acids Res. 48 (W1): W104&ndashW109).

ESPRESSO (EStimasiyası PRotein ExpreSsion və BELƏ Kİlubility) - üç müxtəlif zülal ifadə sistemi üçün zülal ifadəsini və həllolma qabiliyyətini qiymətləndirmək üçün ardıcıl əsaslı proqnozlaşdırıcıdır: in vivo Escherichia coli, Brevibacillus, və buğda rüşeym hüceyrəsi yoxdur. (İstinad: Hirose S, & Noguchi T. 2013. Proteomika. 13:1444-1456).

SABLE - Nisbi Solvent AccessiBiLitiEs, ikinci dərəcəli strukturlar və naməlum strukturun zülalları üçün transmembran domenlərinin dəqiq ardıcıllıqla proqnozlaşdırılması. (İstinad: Adamczak R et al. 2004. Proteinlər 56:753-767).

SPred (Soluble Protein proqnozu) (Bioinformatika Mərkəzi, Mikrob Texnologiyaları İnstitutu, Çandiqarh, Hindistan) - zülalın həddindən artıq ifadədə həllolma qabiliyyətini proqnozlaşdırmaq üçün veb-serverdir E.coli. Proqnoz 'nr' zülal verilənlər bazası və parçalanmış amin turşusu tərkibinin PSI-BLAST axtarışı ilə yaradılan PSSM profili üzrə öyrədilmiş SVM modelinin hibridinə əsaslanır.

Protein&ndashSol - zülalın həllolma qabiliyyətini proqnozlaşdırmaq üçün veb serverdir. Hüceyrəsiz ifadə sistemində Escherichia coli zülalının həlli üçün mövcud məlumatlardan istifadə edərək, 35 ardıcıl əsaslı xüsusiyyət hesablanır. Xüsusiyyət çəkiləri aşağı və yüksək həlledici alt qrupların ayrılması ilə müəyyən edilir. Model proqnozlaşdırılan həllolma qabiliyyətini və orta dəyərlərdən ən çox kənara çıxan xüsusiyyətlərin göstəricisini qaytarır. (İstinad: Hebditch M et al. 2017. Bioinformatika 33(19): 3098&ndash3100).

CamSol - gücləndirilmiş həll qabiliyyəti olan protein variantlarının rasional dizaynı üçün. Metod, doğma vəziyyətini və bioloji aktivliyini qoruyarkən hədəf zülalın həllolma qabiliyyətinə ən çox təsir edənləri müəyyən etmək üçün on minlərlə mutasiyaların sürətli hesablama skrininqini həyata keçirməklə işləyir. (İstinad: Sormanni P və digərləri (2015) J Molec Biol 427(2): 478-490). N.B. Qeydiyyat tələb edir.

Süz Entropiya Rtəhsil səh rediction (SERp) - bu kəşfiyyat vasitəsi Səth Entropiyasının Azaldılması yanaşması ilə kristallaşma qabiliyyətini artırmaq üçün nəzərdə tutulmuş mutasiya üçün ən uyğun olan sahələrin müəyyən edilməsinə kömək etmək məqsədi daşıyır. (İstinad: Goldschmidt L.və b. 2007. Protein Elmi. 16:1569-1576)

CRYSTALP2 - üçün silisium içində zülalın kristallaşma meylinin proqnozlaşdırılması. (İstinad: Kurqan L, et al. 2009. BMC Structural Biology 9: 50) və, PPCpred - difraksiya keyfiyyətli kristalların istehsalına, kristalların istehsalına, protein materialının təmizlənməsinə və istehsalına meylin ardıcıllıqla proqnozlaşdırılması.( İstinad: M.J. Mizianty & L. Kurqan. 2011. Bioinformatika 27: i24-i33).

Antimikrobiyal peptidlər, vaksinlər və toksinlər:

APD (Amikrob əleyhinə Peptid Database) (İstinad: Wang, Z. and Wang, G 2004. Nucl. Acids Res.32: D590-D592)

Tip III ifrazat sistemi (T3SS) infeksiya prosesində host-patogen qarşılıqlı əlaqə üçün vacib mexanizmdir. Bir çox qram-mənfi bakteriyaların T3SSmachinery vasitəsilə ifraz olunan zülallar T3SS effektorları (T3SEs) kimi tanınır. Bunlar ya hostda hüceyrəaltı lokallaşdırıla bilər, ya da digər effektorları hədəf hüceyrəyə gətirmək üçün birbaşa ana membranla qarşılıqlı əlaqədə olan T3SS-nin iynə ucunun bir hissəsi ola bilər. T3SEdb, bütün eksperimental olaraq müəyyən edilmiş və ehtimal olunan T3SE-lərin hərtərəfli məlumat bazasını veb-saytda toplamaq üçün belə bir səyi təmsil edir. BLAST axtarışı mövcuddur. (İstinad: Tay DM et al. 2010. BMC Bioinformatika. 11 Əlavə 7:S4).

Effektiv (Vyana Universiteti, Avstriya və Münhen Texniki Universiteti, Almaniya) - Bakterial zülal ifrazı simbiotik və patogen bakteriyaların əsas virulent mexanizmidir. Beləliklə, effektor zülallar bakteriya sitozolundan hüceyrədənkənar mühitə və ya birbaşa eukaryotik ev sahibi hüceyrəyə daşınır. Effektiv portal bütün ictimaiyyətə açıq olan patogen və simbiontik genomlarda bakterial effektorlar üzrə əvvəlcədən hesablanmış proqnozlar, həmçinin istifadəçinin öz protein ardıcıllığı məlumatlarında effektorları proqnozlaşdırmaq imkanını təmin edir.

Vaxign, əks vaksinologiya strategiyasından istifadə edərək, genom ardıcıllığına əsaslanan vaksin hədəflərini proqnozlaşdıran ilk veb-əsaslı vaksin dizayn sistemidir. Vaxign boru kəmərində proqnozlaşdırılan xüsusiyyətlərə zülalın hüceyrəaltı yerləşməsi, transmembran spiralları, adhezin ehtimalı, insan və/və ya siçan zülallarına qorunma, patogen olmayan ştam(lar)ın genom(lar)ından ardıcıllıqla xaric edilməsi və epitopun MHC sinif I və sinif II ilə bağlanması daxildir. . Əvvəlcədən hesablanmış Vaxign verilənlər bazası >350 genomları üçün vaksin hədəflərinin proqnozunu ehtiva edir. (İstinad: He Y et al. 2010. J Biomed Biotechnol. 2010: 297505). Vaxign 2 Beta-nın daha yeni versiyası burada mövcuddur.

VacTarBac bir neçə patogen bakteriyalara qarşı peyvənd namizədlərini saxlayan bir platformadır. Peyvənd epitop kimi fəaliyyət göstərmə ehtimalı əsasında hazırlanmışdır, beləliklə, immunitet sisteminin bir neçə qolundan hər hansı birini induksiya etmək potensialına malikdir. Bu epitoplar 14 bakteriya növünün virulentlik faktoruna və essentail genlərinə qarşı proqnozlaşdırılıb. (İstinad: Nagpal G et al. (2018) Front Immunol. 9: 2280).

Abpred - bir Fv üçün bir amin turşusu ardıcıllığını götürəcək və proqnozlaşdırılan performansı hesablayacaq 12 biofiziki platformalar ( İstinad: Hebditch M & J Warwicker (2019) PeerJ. 7: e8199).

T3SE - Tip III sekresiya sisteminin effektor proqnozu (İstinad: Löwer M, & Schneider G. 2009. PLoS One. 4:e5917. Səhv: PLoS One. 20094(7).

SIEVE Server III növ ifraz olunan effektorların proqnozlaşdırılması üçün ictimai veb alətdir. SIEVE Server məlum ifraz olunan zülallardan öyrənilmiş modeldən istifadə edərək III tip sekresiya sistemləri ilə bakterial patogenlərin genomlarından potensial ifraz olunmuş effektorları qiymətləndirir. SIEVE Server yalnız zülalların zülal ardıcıllığının yoxlanılmasını tələb edir və hər bir giriş zülalının III tip ifraz olunmuş effektor olması ilə bağlı konservativ ehtimalı qaytarır. (İstinad: McDermott JE et al. 2011. Infect Immun. 79:23-32).

Dairəvi dikroizm:

Dairəvi dikroizm (Birkbeck Kolleci, Kristaloqrafiya Məktəbi, İngiltərə) DICHROWEB, Dairəvi Dikroizm spektroskopiyası təcrübələrindən əldə edilən məlumatların dekonvolyutsiyasına imkan verən interaktiv veb saytdır. O, bir sıra dekonvolyutsiya alqoritmləri (CONTINLL, SELCON3, CDSSTR, VARSLC, K2D) üçün interfeys təklif edir.

K2D2: CD spektrlərindən zülalın ikincil strukturunun faizlərinin proqnozlaşdırılması - 200 nm-dən 240 nm-ə qədər dəyişən 41 CD spektrinin məlumat nöqtəsini və ya 190-240 nm diapazonu üçün 51 məlumat nöqtəsini təhlil etməyə imkan verir (İstinad: Perez-Iratxeta C & Andrade- Navarro MA. 2008. BMC Struktur Biologiya 2008, 8:25)

K2D3 zülalın dairəvi dikroizm spektrindən spiral və ß zəncirinin tərkibini qiymətləndirmək üçün veb serverdir. K2D3 Dichrocalc ilə əldə edilmiş nəzəri spektrlərin verilənlər bazasından istifadə edir (İstinad: Louis-Jeune C et al. 2012. Proteinlər: Structure, Function, & Bioinformatika 80: 374&ndash381)

Sistein qalıqları:

DiANNA - sisteinin oksidləşmə vəziyyətini (76% dəqiqlik), sistein cütlərini (81% dəqiqlik) və disulfid bağının əlaqəsini (86% dəqiqlik) proqnozlaşdıracaq. (İstinad: Nucl. Acids Res. 33: W230-W232).

CYSREDOX (Rokfeller Universiteti, ABŞ) və KISPRED (CIRB Biocomputing Group, Bolonya Universiteti, İtaliya) zülallarda sistein qalıqlarının redoks vəziyyətini hesablayın.

Hidrofobiklik Plotter ( Yenilikçi ) - və Protein Hidroplotter - Alətlər altında seçin (ProteinLounge, San Dieqo, CA ).

Proteoliz və Kütləvi Spektrometriya:

Proteoliz - peptid kəsici (ExPASy, İsveçrə) bu da fermentlərin və kimyəvi maddələrin parçalanma yerlərini proqnozlaşdırır. Alternativ proteoliz sahəsi Mobility_plot 4.1-dir (Advanced Proteolytic Fingerprinting, IGH, Fransa).
Kütləvi spektroskopiyanı əhatə edən daha mürəkkəb zülal analizi üçün ExPasy peptidlərdə potensial zülal post-translational modifikasiyalarını proqnozlaşdırmaq üçün FindMod və eksperimental olaraq müəyyən edilmiş kütlələrdən zülallarda baş verə biləcək mümkün oliqosakkarid strukturlarını proqnozlaşdıra bilən GlycoMod-u təqdim etdi.

ProFound - peptid xəritələrinin kütləvi spektrlərindən məlumatlardan istifadə edərək zülal ardıcıllığı verilənlər bazasını axtarmaq üçün bir vasitədir. Verilənlər bazasındakı zülal ardıcıllıqlarını peptid xəritəsini yaratmaq ehtimalına görə sıralamaq üçün Bayes alqoritmi istifadə olunur. Sadələşdirilmiş versiyaya buradan daxil olmaq olar (Rokfeller Universiteti, Nyu-York, ABŞ) . İnsan öz protein bazasından istifadə edə bilməz.

Protein Prospektoru (Kaliforniya Universiteti) - zülal kütlə spektroskopisti üçün geniş çeşiddə alətlər təklif edir (məsələn, MS-Fit, MS-Tag, MS-Seq, MS-Pattern, MS-Homology).

Zülal ardıcıllığında təkrarlar Radardan istifadə etməklə aşkar edilə bilər ( R apid A avtomatik D eteksiya və A nin ligmenti R təkrar edir, Avropa Bioinformatika İnstitutu) və ya REPRO (İstinad: George RA. & Heringa J. 2000. Trends Biochem. Sci. 25: 515-517).

REPPER (REPyeyir və onların PERyodicities) - zülallarda qısa boşluqsuz təkrarlanan bölgələri aşkar edir və təhlil edir. Fourier Transform (FTwin) və daxili oxşarlıq təhlili (REPwin) ilə dövrilikləri tapır. FTwin müəyyən xassələri, məsələn, hidrofobikliyi əks etdirən amin turşularına ədədi dəyərlər təyin edir və müvafiq dövrlər haqqında məlumat verir. REPwin özünü uyğunlaşdırmalardan istifadə edir və əhəmiyyətli daxili oxşarlıqları aşkar edən təkrarları göstərir. Onlar serveri lifli zülallar üçün faydalı analitik alət halına gətirən PSIPRED və qıvrımlı rulonların proqnozlaşdırılması (COILS) ilə tamamlanır. (İstinad: M. Gruber et al. 2005. Nucl. Acids Res. 33: W239-W243).

İki ölçülü gellər:

JVirGel virtual iki ölçülü zülal gellərinin hesablanması - eukaryotların və prokaryotların (və ya fərdi zülalın) böyük siyahısından virtual 2D proteomlar yaradır. İki versiya: html (məhdud) və Java tətbiqetməsi (inanılmaz, lakin Java Runtime Environment-i quraşdırmalısınız. ( İstinad: K. Hiller et al. 2003. Nucl. Acids Res. 31: 3862-3865).

Virtual İki Ölçülü Protein Gelləri çəkin (PRODORIC Net, Almaniya) - öz protein ardıcıllığı məlumatlarınızdan və ya müxtəlif orqanizmlər üçün istifadə edərək.

Scratch Protein Predictor - (Genomika və Bioinformatika İnstitutu, Kaliforniya Universiteti, İrvine) - proqramlara daxildir: ACCpro: zülal qalıqlarının nisbi həlledici əlçatanlığı CMAPpro: Amin turşusu ilə əlaqə xəritələrinin proqnozlaşdırılması COBEpro: Davamlı B-hüceyrə epitoplarının proqnozlaşdırılması CONpro: zülaldakı hər bir qalığın kontaktlarının sayının orta səviyyədən yuxarı və ya aşağı olmasını proqnozlaşdırır həmin qalıq üçün DIpro: Disulfid körpülərinin proqnozu DISpro: Tənzimlənmiş bölgələrin proqnozu DOMpro: Domenlərin proqnozu SSpro: Zülalın ikincil strukturunun proqnozlaşdırılması SVMcon: Dəstək Vektor Maşınlarından istifadə edərək amin turşusu ilə əlaqə xəritələrinin proqnozlaşdırılması və, 3Dpro: Protein üçüncü strukturunun proqnozu (Ab) başlanğıc).

Mutagenez:

Gen mutagenez dizayneri (GenScript) gen mutasiyasını asanlaşdırmaq üçün nöqtə DNT mutagenez dizaynınızı sadə etmək üçün hazırlanmışdır. Vəhşi növdən DNT mutagenezini həyata keçirmək üçün sadəcə olaraq aşağıdakı sahəyə vəhşi tipli genin başlanğıc ardıcıllığını daxil edin və sonra maraq doğuran amin turşularını(lar)ı seçmək üçün &ldquofrom seçim&rdquo düyməsini klikləyin. Nəticə etibarilə, mutasiyaya uğramış zülalı kodlayan yeni gen ardıcıllığı &ldquosubmit&rdquo klikindən sonra yaradılacaq. Siz bir sıra ifadə sistemlərini seçə bilərsiniz.

I-Mutant2.0: mutasiya zamanı zülal sabitliyinin dəyişməsinin proqnozlaşdırıcısı - ya PDB istinad nömrəsini seçin, ya da öz zülalınızı yapışdırın. Cavab (e-poçtla) zülalın daha çox və ya daha az sabit olub-olmadığını göstərir, bu, "daha yaxşı" zülalların dizaynında istifadə edilə bilər. (İstinad: E. Capriotti və başqaları. 2005. Nucl. Acids Res. 33: W306-W310).

SIFT - The Sorting Idözümsüz fROM Tolerant (SIFT) alqoritmi kodlaşdırma variantlarının zülal funksiyasına təsirini proqnozlaşdırır, yəni amin turşularının əvəzlənməsinin ardıcıllıq homologiyasına və amin turşularının fiziki xassələrinə əsaslanaraq zülal funksiyasına təsir edib-etmədiyini proqnozlaşdırır. SIFT təbii olaraq baş verən qeyri-sinonim polimorfizmlərə və laboratoriya səbəbli səhv mutasiyalara tətbiq edilə bilər. (İstinad: N-L Sim et al. 2012. Nucleic Acids Research 40(1): W452&ndashW457).

mCSM-membran - mutasiyaların transmembran zülallarına təsirini proqnozlaşdırır. (İstinad: Pires DEV et al. 2020. Nucl Acids Res 48 (W1): W147&ndashW153).


ACT-SVM: Dəstək vektor əsas modelinə əsasən zülal-zülal qarşılıqlı əlaqəsinin proqnozlaşdırılması

Zülallar arasındakı qarşılıqlı əlaqə bir neçə orqanizmdə mühüm rol oynayır və bu problem hüceyrənin demək olar ki, bütün fəaliyyətlərində iştirak edə bilər. Zülal-zülal qarşılıqlı təsirinin (PPI) tədqiqi xəstəliklərin qarşısının alınması və müalicəsinə böyük töhfə verə bilər. Hal-hazırda, PPI-ləri proqnozlaşdırmaq üçün maşın öyrənməsinə əsaslanan bir çox proqnozlaşdırma metodları təklif edilmişdir. Bu yazıda biz PPI-ləri effektiv şəkildə proqnozlaşdıra bilən yeni ACT-SVM metodunu təklif edirik. ACT-SVM modeli zülal ardıcıllığını rəqəmsal xüsusiyyətlərə uyğunlaşdırır, A vektorunu və CT deskriptorunu əldə etmək üçün zülal ardıcıllığında iki dəfə xüsusiyyət çıxarılmasını həyata keçirir və onları vektorda birləşdirir. Sonra zülal cütünün xüsusiyyət vektorları dəstək vektor maşınının (SVM) təsnifatının girişi kimi birləşdirilir. Biz ehtiyatsız istifadə edirik H. pylori və metodumuzun proqnozlaşdırma performansını yoxlamaq üçün insan məlumat dəsti. Nəhayət, təklif olunan metod 0,727897 proqnoz dəqiqliyinə malikdir H. pylori məlumat və insan verilənlər bazası üçün 0,838799 proqnoz dəqiqliyi. Nəticələr göstərir ki, bu metodu PPI-lərin sabit və etibarlı proqnoz modeli adlandırmaq olar.

1. Giriş

Zülallar biologiya səviyyəsində 20 növ amin turşusundan ibarət bütün həyatın maddi əsasını təşkil edir [1]. Müxtəlif bioloji növlərin hüceyrələrində və toxumalarında əsas rol oynayan müxtəlif xüsusiyyətlərə və funksiyalara malik bir neçə növ zülal var. O, nəinki canlı orqanizmin mühüm hissəsidir, həm də həyat prosesində bütün mühüm həyat fəaliyyətlərində iştirak edir və həyata keçirir. Ancaq zülalların çoxu çox vaxt öz funksiyalarını tək yerinə yetirmir. Bunun əvəzinə, iki və ya daha çox zülalın bir zülal kompleksi meydana gətirərək birlikdə işləməsi daha çox yayılmışdır və nəhayət, böyük bir protein-zülal qarşılıqlı şəbəkəsi qurulur [2-6]. Aydındır ki, PPI-lər hüceyrə proseslərində əsas rol oynayır və immun cavab, material nəqli və gen ifadəsinin tənzimlənməsi kimi bir çox mühüm bioloji proseslərdə iştirak edir. Buna görə də, zülallar arasında qarşılıqlı əlaqənin tədqiqi zülalların funksiyası və mexanizminin tədqiqində ən mühüm əlaqələrdən birinə çevrilmişdir [7-9]. Bundan əlavə, PPI-lər virus patogeninin əsas molekulyar mexanizmidir ki, bu da onları xəstəliyin aşkarlanması və müalicəsi üçün mühüm tədqiqat obyektlərindən birinə çevirir.

PPİ-lərin tədqiqinin əhəmiyyəti PPİ-lərin proqnozlaşdırılması və müəyyən edilməsi üsullarını təkmilləşdirmişdir [10-13]. Son illərdə bəzi yüksək məhsuldarlığa malik laboratoriya biotexnologiyası PPI-lərdə, məsələn, iki hibrid maya (Sato və başqaları. Schwikowski və başqaları. Coates Hall) [14-16] və koimmunoprecipitation (Free et al.) [17] kimi geniş istifadə edilmişdir. ]. Bununla belə, hamısının ortaq və ya şəxsiyyətində bəzi qüsurları var. Məsələn, bəzi üsullar saxta neqativlərin və yalan pozitivlərin yüksək nisbətinin öhdəsindən gələ bilmir və bəzi üsullar zülalları çıxarmaq üçün daha çox nümunə materialı tələb edir ki, bu da təəccüblü dərəcədə bahalıdır. Eyni zamanda, zülalların filogenetik profili (Kim və başqaları) [18, 19], təbii dilin işlənməsi (Daraselia və b.) [20] və zülalın üçüncü quruluşu (Aloy və Russell) [21] kimi üsullar da tədqiqatçılar tərəfindən bəyənilib. Bununla belə, zülalla əlaqəli bioloji bilik yoxdursa, bu cür metodları həyata keçirmək çətindir və onlardan bəziləri PPI-ləri tam proqnozlaşdıra bilməz [22, 23].

Bundan əlavə, tədqiqatçıların yorulmaz səyləri ilə müəyyən edilmişdir ki, PPİ-ləri zülalın amin turşusu ardıcıllığına əsaslanaraq proqnozlaşdırmaq olar [24-27]. Eyni zamanda, maşın öyrənməsi uzaq və geniş tədqiqatçılar tərəfindən istifadə edilmişdir. Sonra zülal ardıcıllığına və maşın öyrənmə alqoritmlərinə əsaslanan çoxlu sayda proqnozlaşdırma metodları ortaya çıxdı [13, 28-32]. Məsələn, Cui et al. [33] viral zülallarla qarşılıqlı əlaqədə olan insan zülallarını proqnozlaşdırmaq üçün dəstək vektor maşın təsnifatçısından istifadə etmişdir [34-37]. Dhole və başqaları tərəfindən təklif olunan L1-logreg təsnifatı. ÜFE-ləri effektiv şəkildə proqnozlaşdıra və dərman dizaynı kimi əlaqəli tədqiqatları inkişaf etdirə bilər. Xia və başqaları. [38] PPI-ləri çıxarmaq üçün Spinning Forest adlı ardıcıl əsaslı multiklassifikator sistemi təklif etmişdir [39]. Onların metodunun performansı Saccharomyces cerevisiaeH. pylori verilənlər bazası əvvəllər nəşr olunmuş ədəbiyyat metodlarından daha yaxşıdır. Effektiv maşın öyrənmə üsulu kimi dərin öyrənmə də PPI-lərin proqnozlaşdırılmasında istifadə olunur (Du et al.) [40].

Bu yazıda biz ACT-SVM adlı PPI-ləri proqnozlaşdırmaq üçün dəstək vektor maşınına əsaslanan yeni bir proqnozlaşdırma modeli təklif edirik. Zülal ardıcıllığından xüsusiyyətləri çıxarmaq üçün iki fərqli üsuldan istifadə edildi və nəhayət, onları xüsusiyyət vektoruna çevirdik. Əvvəlcə verilənlər bazasında hər bir protein ardıcıllığı üçün A vektorunu çıxarırıq. Bundan sonra, zülal ardıcıllığını təsvir etmək üçün tərkib (C) və transformasiya (T) deskriptorları qururuq. Nəhayət, biz onların birləşməsindən təsnifatçının girişi kimi istifadə edirik. Ümumiyyətlə, proqnozlaşdırma metodumuzun performansını qiymətləndirmək üçün əyri altındakı sahə (AUC), dəqiqlik (Acc), spesifiklik (Sp) və Metyu korrelyasiya əmsalı (Mcc) istifadə olunur.

Biz əlavə olaraq proqnozlaşdırıcı performansı müqayisə etmək üçün 5 müxtəlif təsnifat qurmuşuq k-ən yaxın qonşu (KNN), süni neyron şəbəkəsi (ANN), təsadüfi meşə (RF), sadəlövh Bayes (NB) və logistik reqressiya (LR). Yeni proqnozlaşdırıcımızı qiymətləndirmək üçün H. pylori və insan məlumat dəstlərindən istifadə etdik. Eksperimental nəticələr göstərir ki, bizim tərəfimizdən təklif olunan dəstək vektor maşınına əsaslanan yeni model ən yaxşı performans göstərir.

2. Metodlar və materiallar

Elmi tədqiqatlarda ilk növbədə iş prosesini müəyyən etmək son dərəcə vacibdir. Bizim iş axını Şəkil 1-də nümayiş etdirilib. Birincisi, biz qeyri-ehtiyatsızlıq əldə etdik H. pylori və insan verilənlər bazası. Sonra A vektorunu, tərkibini və transformasiyasını (CT) qurmaqla hər bir zülal ardıcıllığını rəqəmsal xüsusiyyətlərə uyğunlaşdırırıq və onları təsnifatçının girişi kimi bir xüsusiyyət vektorunda birləşdiririk. Aşağıdakı proses müxtəlif təsnifat modellərini hazırlamaq üçün çıxarılan rəqəmsal xüsusiyyəti müxtəlif təsnifatçılara daxil etmək və onları müvafiq olaraq 5-qat çarpaz doğrulama, 8-qat çarpaz doğrulama və 10-qat çarpaz doğrulama ilə qiymətləndirməkdir. Nəhayət, müstəqil test verilənlər bazasında biz 6 təlim keçmiş modeli ardıcıl olaraq yoxladıq. Bundan əlavə, biz yeni proqnozlaşdırıcı gümüşümüzün və müqayisə kimi istifadə edilən beş modelimizin performansını qiymətləndirmək üçün AUC, Acc, Sp, Sn və MCC göstəricilərindən istifadə edirik.

2.1. Dataset

İnsanlar ÜFE-lərə artan diqqət yetirdikcə, BioGRID, GeneMANIA və DIP kimi ÜFE-ləri araşdırmaq üçün istifadə edilən verilənlər bazalarının sayı artır. Bununla belə, bu mövcud verilənlər bazalarında verilənlərdə qaçılmaz ehtiyatlar var. Proqnozlaşdırma alətimizi daha təsirli etmək üçün biz lazımsız hesab etdik H. pylori və Kong və digərləri tərəfindən istifadə edilən insan ÜFE məlumat dəsti. [41]. yüklədilər H. pylori və DIP verilənlər bazasından insan PPI-ləri məlumat dəsti və bu iki məlumat dəsti üçün lazımsız ardıcıllıqlar qurmaq üçün cd-hit alətindən istifadə etdi. Artıqlığı aradan qaldırdıqdan sonra H. pylori Məlumat dəstində 1458 qarşılıqlı zülal cütü və 1457 qarşılıqlı təsir göstərməyən zülal cütü, insan verilənlər bazasında isə 3899 qarşılıqlı zülal cütü və 4262 qarşılıqlı əlaqədə olmayan zülal cütü var.

2.2. Ardıcıllıq Xüsusiyyət Vektorları
2.2.1. Vektor qurun

A vektorunu qurarkən zülalın fiziki və kimyəvi xassələrinə istinad edirik. Zülal ardıcıllığını təşkil edən 20 amin turşusu Cədvəl 1-də göstərildiyi kimi 6 sinfə bölünür.

Bu şəkildə kateqoriyaya uyğun olaraq hər bir amin turşusunu ardıcıllıqla müvafiq C ilə əvəz edirik1, C2, …, C6. Sonra sadələşdirilmiş ardıcıllığı əldə edə bilərik. istifadə edirik fi sadələşdirilmiş ardıcıllıqla hər bir elementin baş vermə tezliyini təsvir etmək üçün (i = 1, 2, . 6) və nəhayət, A vektorunu əldə edin. Ətraflı tərifləri fi və A vektoru (1) və (2) tənlikləri ilə təsvir edilmişdir.

harada l zülal ardıcıllığının uzunluğu, mi növün sayıdır i protein ardıcıllığında amin turşuları, i = 1, 2, . 6. Məsələn, “MGPDDSKRYE” ardıcıllığı varsa, onu C ilə əvəz etmək olar.1, C6, C6, C5, C5, C3, C4, C4, C2, və C5. Bir C olduğunu görə bilərik1, bir C2, bir C3, iki C4, üç C5 və iki C6 sadələşdirilmiş ardıcıllıqla. Beləliklə,

Bir vektor kimi qurula bilər

Sonra zülalın xüsusiyyətini təsvir etmək üçün 6 ölçülü A vektoru əldə etdik.

2.2.2. Seyrək matris və deskriptor

Əvvəlcə 20 × tikirik n seyrək B matrisi, burada n zülal ardıcıllığında amin turşularının sayıdır. Bir zülal ardıcıllığının olduğunu güman edirik

Eyni zamanda 20 amin turşusu qoyuruq E, E = . Zaman i-E-dəki amin turşusu ilə eynidir j-S-də amin turşusu, müvafiq element

seyrək matrisdə 1 alır, əks halda 0 alır.Bu zülal ardıcıllığının seyrək matrisi aşağıdakı şəkildə nümayiş etdirilir:

Sonra seyrək matrisdəki 20 sıra vektorun hər birini P subvektorlarına bölürük. Deskriptor tərkibdən (C) və transformasiyadan (T) ibarətdir və onlar hər bir alt vektordan çıxarılır. Onların arasında (C) kompozisiya 0 və 1 tezliyi də daxil olmaqla iki hissədən ibarətdir. Keçid (T) üç hissədən ibarətdir: alt vektordakı 01 və 10 ədədlərinin cəmi, "11" və "111" sayı. Güman

, və zülal ardıcıllığının ilk ardıcıllığı “MYAHQAAA”dır. Sonra seyrək matrisdə birinci sıra vektorunun birinci subvektoru <0, 0, 1, 0, 0, 1, 1, 1>-dir. Aydındır ki, dörd “0”, dörd “1”, iki “01”, bir “10”, iki “11” və bir “111” var. Buna görə də, tərkibin və çevrilmənin (CT) beş hissəsi 4 ∗ 100%/8 = 50%, 4 ∗ 100%/8 = 50%, 3 (2 + 1 = 3), 2 və 1-dir. Beləliklə, zülal ardıcıllığı 400 ölçülü (4 ∗ 20∗5 = 400) vektorda təsvir edilmişdir.

2.2.3. Xüsusiyyət vektorlarının yenidən qurulması

Hər bir zülal ardıcıllığı üçün 6 ölçülü A vektoru və 400 ölçülü deskriptor da daxil olmaqla iki xüsusiyyət vektoru çıxardıq. Sonra onları zülalın xüsusiyyət vektoru kimi 406 ölçülü vektorda birləşdirdik. Nəhayət, iki zülalın xüsusiyyət vektorları, aralarındakı PPI-ləri təsvir edən 812 ölçülü xüsusiyyət vektoru kimi birləşdirilir.

2.3. Təsnifat konstruksiyası

Modelimiz SVM-ə əsaslanır. Xətti təsnifatçı kimi, SVM təsnifat problemlərində geniş istifadə olunur. Onun öyrənmə strategiyası intervalı maksimuma çatdırmaqdır. Nəhayət, nümunəni bölmək üçün xüsusiyyət məkanında ən böyük məsafəyə malik həndəsi hipertəpəni tapa bilər. SVM son dərəcə sabit və seyrəkdir. Nümunə məkanında bölmə hiperplanı kimi təsvir edilə bilər

Onların arasında hiperplanın istiqaməti müəyyən edilir ω, və b başlanğıcdan hipertəpəyə qədər olan məsafəni təmsil edir. Hiperplan nümunələri düzgün təsnif edə bilirsə, hiperplanın bir tərəfi müsbət nümunələr, digər tərəfi isə mənfi nümunələrdir. Nümunə məkanındakı nümunələrin olduğunu fərz edək

kimi ifadə edilə bilər

Nümunə məkanının istənilən nöqtəsindən hipertəpəyə qədər olan məsafə (6) tənliyi ilə təsvir edilə bilər:

Hiperplana ən yaxın nümunə nöqtəsi dəstək vektoru adlanır. Müsbət nümunə dayaq vektorundan hipertəpərə qədər olan məsafənin və mənfi nümunə dəstək vektorundan hipertəpəyə qədər olan məsafənin cəminə interval deyilir və onu aşağıdakı kimi ifadə etmək olar.

Dəstək vektor maşınının son məqsədi intervalı maksimuma çatdıran hiperplan tapmaqdır, ona görə də dəstək vektor maşını belə təsvir edilə bilər.

harada m nümunələrin sayıdır. Düsturlar (8) və (9) kimi də yenidən yazıla bilər

Davamlı təcrübələr vasitəsilə biz nəhayət SVM təsnifatının nüvə funksiyasını xətti nüvə funksiyasına təyin etdik. Və təklif etdiyimiz xüsusiyyət çıxarma metodumuz ACT ilə birlikdə, üstün proqnozlaşdırma performansı göstərdi H. pylori və insan məlumat toplusu.

2.4. Proqnozlaşdırıcının qiymətləndirilməsi

Təklif etdiyimiz proqnozlaşdırıcının etibarlılığını və sabitliyini yoxlamaq üçün biz istifadə edərək 6 modeli öyrətdik. H. pylori və insan verilənlər toplusunu əhatə etdi və 5-qat çarpaz doğrulama, 8-qat çarpaz doğrulama və 10-qat çarpaz doğrulama həyata keçirdi [42]. Faktiki təlimdə model adətən təlim məlumatlarına daha yaxşı uyğun gəlir, lakin təlim məlumatlarından kənar yeni məlumatlar üçün xüsusilə ideal deyil. k-qat çarpaz doğrulama modellərin ümumiləşdirmə qabiliyyətini qiymətləndirmək üçün istifadə edilə bilər, beləliklə daha yaxşı bir model seçmək və modelin çox mürəkkəb olmasının və həddindən artıq uyğunlaşmanın qarşısını almaq olar. K-qat çarpaz doğrulamanın əsas ideyası verilənlər bazasını bölməkdir k bərabər nisbətdə hissələri. Sonra verilənlərin hər bir hissəsi növbə ilə test verilənlər bazası kimi, digəri isə istifadə olunur kMəlumatların −1 hissəsi təlim məlumatları kimi istifadə olunur. k-qat üçün çarpaz doğrulama həyata keçirilir k təmin etmək üçün təlimlər k Verilənlərin bir hissəsi test məlumatları, qalanları isə test məlumatları olmuşdur k−1 hissə təlim məlumatları kimi istifadə edilmişdir. Alınan K eksperimental nəticələri modelin yekun balı kimi bərabər bölünür. üçün k-qat cross-validation, biz təyin edirik k Modelimizin performansını yoxlamaq üçün müvafiq olaraq 5, 8 və 10-a qədər.

Bu yazıda biz təklif etdiyimiz metodun proqnozlaşdırıcı performansını qiymətləndirmək üçün dəqiqlik (Acc), həssaslıq (Sn), spesifiklik (Sp) və Metyu korrelyasiya əmsalı (Mcc) daxil olmaqla dörd qiymətləndirmə göstəricisindən istifadə edirik. Onların arasında Acc modelin müsbət nümunələri düzgün təsnif etmək qabiliyyətini əks etdirir Sn təsnifatçının müsbət nümunələri tanımaq qabiliyyətini ölçür Sp modelin mənfi nümunələri tanımaq qabiliyyətini əks etdirir Mcc −1 və +1 arasında bir dəyər qaytarır, bu da ölçmək üçün tez-tez istifadə olunan göstəricidir binar təsnifat modellərinin performansı. Onların tərifləri aşağıdakılardır:

burada TP müsbət nümunələrə düzgün bölünmüş ədəddir, FP müsbət nümunələrə yanlış bölünmüş ədəddir, FN mənfi nümunələrə yanlış bölünmüş ədəddir və TN mənfi nümunələrə düzgün bölünmüşdür. Bundan əlavə, biz təklif etdiyimiz modelin performansını qiymətləndirmək üçün hələ də AUC dəyərindən istifadə edirik. AUC ROC əyrisi altında olan sahə kimi müəyyən edilir. Bir çox hallarda ROC əyrisi hansı təsnifatçının daha yaxşı işlədiyini aydın göstərmir. Rəqəmsal dəyər olaraq, müvafiq AUC dəyəri nə qədər böyükdürsə, təsnifat bir o qədər yaxşıdır. Beləliklə, biz modelin qiymətləndirmə meyarlarından biri kimi AUC dəyərindən istifadə edirik.

3. Nəticə və Müzakirə

3.1. Model Sabitlik Təhlili

K-qat çarpaz doğrulama xüsusi verilənlər bazasında müxtəlif maşın öyrənmə modellərinin performansını müqayisə etmək üçün geniş istifadə olunur. K-qat çarpaz doğrulama prinsipi verilənlər bazasını bərabər hissələrə bölməkdir k üçün paylar k məşqlər və son olaraq ortalamasını alırıq K nəticələr. Bununla belə, normadan kənara çıxanlar ola bilər k-zaman nəticələri, bu o deməkdir ki, bu təsnifatçı bütün nümunələrin proqnozlaşdırılması üçün yaxşı sabitliyə malik olmaya bilər. istifadə etdik H. pylori və 6 modeli öyrətmək üçün insan verilənlər toplusu və onların performansını qiymətləndirmək üçün 5 qat çarpaz doğrulama, 8 dəfə çarpaz doğrulama və 10 dəfə çarpaz doğrulama həyata keçirdi. 6 təsnifatçıda iki məlumat dəstinin 5-qat çarpaz doğrulama, 8-qat çarpaz doğrulama və 10-qat çarpaz doğrulamanın sabitliyini əks etdirmək üçün qutu qrafikləri çəkirik. 6 təsnifatçıda iki məlumat dəstinin 5 qat çarpaz doğrulama, 8 dəfə çarpaz doğrulama və 10 dəfə çarpaz doğrulama nəticələrini təsvir etmək üçün altı qutu qrafiki çəkildi. Onların arasında qutunun ordinatı dəqiqlikdir (Acc), absis isə 6 təsnifatçıdır. Yəni, hər qutunun 6 qutusu var və hər qutuda Acc dəyəri saxlanılır k dəfə k-klassifikatorda çarpaz doğrulama. Qutuların süjetləri H. pylori 5-qat çarpaz doğrulama, 8-qat çarpaz doğrulama və 10-qat çarpaz doğrulama üçün 6 təsnifat üzrə verilənlər bazası Şəkil 2(a)-da, insan verilənlər bazası üçün qutu qrafikləri isə Şəkil 2(b)-də nümayiş etdirilmişdir. .


İçindəkilər

Zülalın hüceyrəaltı lokalizasiyasını eksperimental olaraq müəyyən etmək zəhmətli və vaxt aparan bir iş ola bilər. Flüoresan mikroskopdan istifadə edərək lokalizasiyanı görmək üçün immun etiketləmə və ya etiketləmə (məsələn, yaşıl flüoresan zülal kimi) istifadə olunur. Yüksək ötürmə qabiliyyətinə alternativ proqnozdan istifadə etməkdir.

Kompüter elmində yeni yanaşmaların inkişafı, məlum lokalizasiyanın zülallarının artan verilənlər bazası ilə birlikdə hesablama alətləri indi bir çox orqanizmlər üçün sürətli və dəqiq lokalizasiya proqnozlarını təmin edə bilir. Bu, subcellular lokalizasiyanın proqnozlaşdırılmasının bioinformatika və maşın öyrənməsinin uğurla kömək etdiyi problemlərdən birinə çevrilməsi ilə nəticələndi.

İndi bir çox proqnozlaşdırma üsulları zülalın hüceyrəaltı lokalizasiyasının müəyyən edilməsi üçün bəzi yüksək məhsuldarlıqlı laboratoriya üsullarının dəqiqliyini üstələyir. [1] [2] Xüsusilə, iki və ya daha çox fərqli subhüceyrəaltı yerlər arasında eyni vaxtda mövcud ola bilən və ya arasında hərəkət edə bilən zülallarla işləmək üçün istifadə edilə bilən bəzi proqnozlaşdırıcılar [3] hazırlanmışdır. Proqnozlaşdırılan lokalizasiyaları təsdiqləmək üçün adətən eksperimental yoxlama tələb olunur.

1999-cu ildə PSORT subcellular lokalizasiyanı proqnozlaşdırmaq üçün ilk nəşr edilmiş proqram idi. [4] Sonrakı alətlər və vebsaytlar süni neyron şəbəkələri, dəstək vektor maşını və zülal motivləri kimi üsullardan istifadə etməklə buraxılmışdır. Proqnozlaşdırıcılar müxtəlif orqanizmlərdə zülallar üçün ixtisaslaşmış ola bilər. Bəziləri eukaryotik zülallar, [5] bəziləri insan zülalları, [6] və bəziləri bitki zülalları üçün ixtisaslaşmışdır. [7] Bakterial lokalizasiya proqnozlaşdırıcılarının proqnozlaşdırılması üsulları və onların dəqiqliyi nəzərdən keçirilmişdir. [8]

Zülalın hüceyrəaltı yerinin proqnozlaşdırılmasının inkişafı iki əhatəli araşdırma məqaləsində ümumiləşdirilmişdir. [9] [10] Ən son alətlər və təcrübə hesabatı Meinken və Min (2012) tərəfindən son məqalədə tapıla bilər.

Zülalın subhüceyrəvi lokalizasiyası ilə bağlı biliklər dərman kəşfi prosesi zamanı hədəfin müəyyənləşdirilməsini əhəmiyyətli dərəcədə yaxşılaşdıra bilər. Məsələn, ifraz olunan zülallar və plazma membranı zülalları hüceyrədənkənar məkanda və ya hüceyrə səthində lokalizasiyasına görə dərman molekulları tərəfindən asanlıqla əldə edilir.

Bakterial hüceyrə səthi və ifraz olunan zülallar peyvənd namizədləri və ya diaqnostik hədəflər kimi potensialları ilə də maraq doğurur. Xərçəng və Alzheimer xəstəliyi kimi bir sıra xəstəliklərin hüceyrələrində zülalların aberrant subcellular lokalizasiyası müşahidə edilmişdir. Qeyri-adi mühitlərdə yaşaya bilən bəzi arxelərdən ifraz olunan zülallar sənaye baxımından əhəmiyyətli tətbiqlərə malikdir.

Proqnozdan istifadə edərək, istənilən yerə satılan namizədləri tapmaq üçün çox sayda zülal qiymətləndirilə bilər.

Subcellular lokalizasiyanın proqnozlaşdırılmasının nəticələri verilənlər bazasında saxlanıla bilər. Nümunələrə çoxnövlü verilənlər bazası Compartments, FunSecKB2, göbələk məlumat bazası [11] PlantSecKB, bitki məlumat bazası [12] MetazSecKB, heyvan və insan verilənlər bazası [13] və ProtSecKB, protist verilənlər bazası daxildir. [14]


İçindəkilər

Elektron ötürmə zülalları Redaktə edin

Bir çox metabolik reaksiyalarda elektron daşıyıcısı kimi çıxış edən zülal, reduktaza təsir edən fermentə bağlanır. Bir elektron aldıqdan sonra o, dissosiasiya olunur və sonra oksidazını fəaliyyət göstərən növbəti fermentə (yəni elektronun qəbuledicisi) bağlanır. Zülallar arasındakı bu qarşılıqlı təsir elektronların səmərəli ötürülməsini təmin etmək üçün zülallar arasında yüksək spesifik birləşmədən asılıdır. Nümunələr: mitoxondrial oksidləşdirici fosforlaşma zənciri sisteminin komponentləri sitoxrom c-reduktaza / sitoxrom c / sitoxrom c oksidaz mikrosomal və mitoxondrial P450 sistemləri. [4]

Mitoxondrial P450 sistemləri vəziyyətində, elektron ötürücü zülal adrenodoksinin onun reduktazasına bağlanmasında iştirak edən xüsusi qalıqlar reduktaza səthində iki əsas Arg qalığı və adrenodoksin üzərində iki turşulu Asp qalığı kimi müəyyən edilmişdir. [5] Reduktazanın filogeniyası ilə bağlı daha yeni işlər göstərdi ki, zülal-zülal qarşılıqlı təsirində iştirak edən bu qalıqlar bu fermentin təkamülü boyu qorunub saxlanılmışdır. [6]

Siqnal ötürülməsi Redaktə edin

Hüceyrənin fəaliyyəti hüceyrədənkənar siqnallarla tənzimlənir. Siqnalın hüceyrələrin daxilində və/və ya daxilində yayılması müxtəlif siqnal molekulları arasında PPI-lərdən asılıdır. PPI-lər vasitəsilə siqnal yollarının işə salınması siqnal ötürülməsi adlanır və bir çox bioloji proseslərdə və Parkinson xəstəliyi və xərçəng kimi bir çox xəstəlikdə əsas rol oynayır.

Membran nəqliyyatı Redaktə edin

Bir zülal başqa bir zülal daşıya bilər (məsələn, sitoplazmadan nüvəyə və ya nüvə məsamələri idxalı vəziyyətində əksinə). [ sitat lazımdır ]

Hüceyrə metabolizması Redaktə edin

Bir çox biosintetik proseslərdə fermentlər bir-biri ilə qarşılıqlı təsir edərək kiçik birləşmələr və ya digər makromolekullar əmələ gətirir. [ sitat lazımdır ]

Əzələ daralması Redaktə edin

Əzələ daralmasının fiziologiyası bir neçə qarşılıqlı əlaqəni əhatə edir. Miyozin filamentləri molekulyar mühərriklər kimi çıxış edir və aktinə bağlanaraq filamentin sürüşməsinə imkan verir. [7] Bundan əlavə, skelet əzələsi lipid damlacıqları ilə əlaqəli zülallar ailəsinin üzvləri skelet əzələsində lipolizi tənzimləmək üçün yağ trigliserid lipazının aktivatoru və onun koaktivatoru müqayisəli gen identifikasiyası-58 kimi digər zülallarla birləşirlər.

Zülal-zülal qarşılıqlı təsirlərinin (PPİ) növlərini təsvir etmək üçün zülalların "keçici" şəkildə qarşılıqlı əlaqədə ola biləcəyini (qısa müddətdə, məsələn, siqnal ötürülməsi kimi müəyyən bir təsir yaratmaq üçün) və ya digər zülallarla qarşılıqlı əlaqədə ola biləcəyini nəzərə almaq vacibdir. canlı sistemlər daxilində molekulyar maşınlara çevrilən komplekslər yaratmaq üçün "sabit" bir yol. Zülal kompleksinin yığılması homo-oliqomerik və ya hetero-oliqomerik komplekslərin meydana gəlməsi ilə nəticələnə bilər. Adi komplekslərə əlavə olaraq, ferment-inhibitor və antikor-antigen kimi, domen-domen və domen-peptid arasında qarşılıqlı əlaqə də qurula bilər. Zülal-zülal qarşılıqlı təsirlərini müəyyən etmək üçün digər mühüm fərq onların təyin olunma üsuludur, çünki zülal cütləri arasında birbaşa fiziki qarşılıqlı əlaqəni ölçən üsullar var, “ikili” metodlar, zülal qrupları arasında fiziki qarşılıqlı əlaqəni ölçən digər üsullar isə, zülal partnyorlarının ikili təyini olmadan, "ko-kompleks" üsulları adlanır.

Homo-oliqomerlər və hetero-oliqomerlər Redaktə edin

Homo-oliqomerlər yalnız bir növ zülal alt bölməsindən ibarət olan makromolekulyar komplekslərdir. Zülal subunitlərinin yığılması zülalın dördüncü strukturunda qeyri-kovalent qarşılıqlı əlaqənin qurulması ilə idarə olunur. İlkin fərdi monomerlərə qayıtmaq üçün homo-oliqomerlərin pozulması çox vaxt kompleksin denatürasiyası tələb olunur. [8] Bir neçə fermentlər, daşıyıcı zülallar, iskele zülalları və transkripsiya tənzimləyici amillər homo-oliqomerlər kimi öz funksiyalarını yerinə yetirirlər. Fərqli zülal alt bölmələri bir neçə hüceyrə funksiyasını idarə etmək üçün vacib olan hetero-oliqomerlərdə qarşılıqlı təsir göstərir. Heteroloji zülallar arasındakı əlaqənin əhəmiyyəti hüceyrə siqnal hadisələri zamanı daha aydın görünür və bu cür qarşılıqlı təsirlər yalnız zülallardakı struktur domenlər (aşağıda təsvir edildiyi kimi) sayəsində mümkündür.

Sabit qarşılıqlı təsirlər və keçici qarşılıqlı təsirlər Redaktə edin

Stabil qarşılıqlı təsirlərə funksional rolları yerinə yetirmək üçün uzun müddət qarşılıqlı təsir göstərən, daimi komplekslərin bir hissəsini subunitlər kimi qəbul edən zülallar daxildir. Bunlar adətən homo-oliqomerlərə (məsələn, sitoxrom c) və ATPazın alt bölmələri kimi bəzi hetero-oliqomerik zülallara aiddir. Digər tərəfdən, bir zülal digər zülallarla qısa müddətdə və geri dönə bilən şəkildə yalnız müəyyən hüceyrə kontekstində - hüceyrə növü, hüceyrə dövrü mərhələsi, xarici amillər, digər bağlayıcı zülalların mövcudluğu və s. - qarşılıqlı təsir göstərə bilər. biokimyəvi kaskadlarda iştirak edən zülallar. Bunlara keçici qarşılıqlı təsirlər deyilir. Məsələn, bəzi G proteini ilə əlaqəli reseptorlar yalnız müvəqqəti olaraq G-yə bağlanıri/o zülallar hüceyrədənkənar liqandlar tərəfindən aktivləşdirildikdə, [9] bəziləri isə Gq-birləşdirilmiş reseptorlar, məsələn, muskarinik reseptor M3, G ilə əvvəlcədən cütləşməq reseptor-ligand bağlanmasından əvvəl zülallar. [10] Qlobular zülal domenləri (yəni MoRFs) ilə daxili nizamsız zülal bölgələri arasında qarşılıqlı əlaqə keçici qarşılıqlı təsirlərdir. [11]

Kovalent və qeyri-kovalent Redaktə edin

Kovalent qarşılıqlı təsirlər ən güclü assosiasiyaya malik olanlardır və disulfid bağları və ya elektron mübadiləsi ilə əmələ gəlir. Nadir olsa da, bu qarşılıqlı təsirlər ubiquitination və SUMOylation kimi bəzi posttranslational modifikasiyalarda müəyyənedicidir. Qeyri-kovalent bağlar adətən hidrogen bağları, ion qarşılıqlı təsirləri, Van der Waals qüvvələri və ya hidrofobik bağlar kimi zəif bağların birləşməsi ilə keçici qarşılıqlı təsirlər zamanı qurulur. [12]

Suyun rolu Redaktə edin

Su molekulları zülallar arasında qarşılıqlı təsirdə mühüm rol oynayır. [13] [14] Fərqli, lakin homoloji zülallardan yüksək ayırdetmədə əldə edilən komplekslərin kristal strukturları göstərmişdir ki, bəzi interfeys su molekulları homoloji komplekslər arasında qorunur. İnterfeys su molekullarının əksəriyyəti hər bir kompleksin hər iki tərəfdaşı ilə hidrogen bağları yaradır. Bir zülal tərəfdaşının bəzi interfeys amin turşusu qalıqları və ya atom qrupları digər zülal tərəfdaşı ilə həm birbaşa, həm də su vasitəçiliyi ilə qarşılıqlı əlaqədə olur. İki su molekulunun vasitəçilik etdiyi ikiqat dolayı qarşılıqlı təsirlər aşağı yaxınlıqlı homoloji komplekslərdə daha çoxdur. [15] Diqqətlə aparılan mutagenez təcrübələri, məs. bir tirozin qalığını fenilalaninə dəyişdirərək, su vasitəçiliyi ilə qarşılıqlı təsirlərin qarşılıqlı enerjiyə töhfə verə biləcəyini göstərdi. [16] Beləliklə, su molekulları zülallar arasında qarşılıqlı əlaqəni və çarpaz tanınmasını asanlaşdıra bilər.

Bir çox zülal komplekslərinin molekulyar strukturları rentgen kristalloqrafiyası üsulu ilə açılmışdır. [17] [18] Bu üsulla həll edilən ilk quruluş ser John Cowdery Kendrew tərəfindən sperma balinasının mioqlobin quruluşu idi. [19] Bu texnikada kristal atomlar tərəfindən difraksiyaya uğramış rentgen şüalarının bucaqları və intensivliyi filmdə aşkar edilir və beləliklə, kristalın içərisində elektronların sıxlığının üçölçülü şəkli alınır. [20]

Daha sonra zülal komplekslərinin molekulyar quruluşunu açmaq məqsədi ilə nüvə maqnit rezonansı da tətbiq olunmağa başlandı. İlk nümunələrdən biri kalmodulinə bağlı kalmodulin bağlayan domenlərin strukturu idi. [18] [21] Bu texnika atom nüvələrinin maqnit xassələrinin öyrənilməsinə əsaslanır və beləliklə, müvafiq atomların və ya molekulların fiziki və kimyəvi xassələrini müəyyən edir. Nüvə maqnit rezonansı zəif PPI-ləri xarakterizə etmək üçün əlverişlidir. [22]

Domenlərin redaktəsi

Zülallar digər zülallarla qarşılıqlı əlaqədə olmağa imkan verən struktur domenləri tutur və onların xüsusi ardıcıllığına bağlanır:

    Src homologiyası 2 (SH2) domeni

Molekulyar quruluşun tədqiqi zülallar arasında qarşılıqlı əlaqəni təmin edən interfeys haqqında incə detallar verə bilər. PPI interfeyslərini xarakterizə edərkən kompleksin növünü nəzərə almaq vacibdir. [8]

Qiymətləndirilən parametrlərə ölçü (mütləq ölçülərdə Å 2 və ya həlledicinin əlçatan səth sahəsində (SASA) ölçülür), forma, səthlər arasında tamamlayıcılıq, qalıq interfeys meylləri, hidrofobiklik, seqmentləşmə və ikincil struktur və kompleks əmələ gəlmədə konformasiya dəyişiklikləri daxildir. [8]

PPI interfeyslərinin böyük əksəriyyəti hidrofobik qalıqlarla, xüsusən aromatik qalıqlarla tez-tez zənginləşməsinə baxmayaraq, zülal nüvələri deyil, zülal səthlərinin tərkibini əks etdirir. [24] PPI interfeysləri dinamik və tez-tez planardır, baxmayaraq ki, onlar kürə şəklində və çıxıntılı da ola bilər.[25] Üç struktura - insulin dimerinə, tripsin-pankreatik tripsin inhibitor kompleksinə və oksihemoqlobinə əsaslanaraq, Cyrus Chothia və Joel Janin tapdılar ki, 1,130 və 1,720 Å 2 səth sahəsi su ilə təmasdan çıxarıldı, bu da hidrofobikliyin əsas amil olduğunu göstərir. PPI-lərin sabitləşməsi. [26] Sonrakı tədqiqatlar qarşılıqlı təsirlərin əksəriyyətinin basdırılmış səth sahəsini 1,600±350 Å 2-ə qədər dəqiqləşdirdi. Bununla belə, daha böyük qarşılıqlı əlaqə interfeysləri də müşahidə edildi və qarşılıqlı təsir tərəfdaşlarından birinin uyğunlaşmasında əhəmiyyətli dəyişikliklərlə əlaqələndirildi. [17] PPI interfeysləri həm forma, həm də elektrostatik tamamlayıcılıq nümayiş etdirir. [8] [10]

  • Zülal konsentrasiyası, bu da öz növbəsində ifadə səviyyələrindən və parçalanma dərəcələrindən təsirlənir
  • Zülallara və ya digər bağlayıcı ligandlara zülal yaxınlığı
  • Liqandların konsentrasiyası (substratlar, ionlar və s.)
  • Zülalların ətrafında digər zülalların, nuklein turşularının və ionların olması.
  • Kovalent modifikasiyaların baş verməsi

Onları aşkar etmək üçün bir çox üsul var. [1] [27] Yanaşmaların hər birinin özünəməxsus güclü və zəif tərəfləri var, xüsusən də metodun həssaslığı və spesifikliyi ilə bağlı. Ən ənənəvi və geniş istifadə olunan yüksək məhsuldarlıq metodları maya iki-hibrid skrininqi və kütlə spektrometriya ilə birləşdirilmiş yaxınlığın təmizlənməsidir.

Maya iki hibrid skrininq Redaktə edin

Bu sistem ilk dəfə 1989-cu ildə Fields and Song using tərəfindən təsvir edilmişdir Saccharomyces cerevisiae bioloji model kimi. [28] [29] Maya iki hibrid cütlü PPI-lərin (ikili metod) müəyyən edilməsinə imkan verir in vivo, burada iki zülal biofiziki birbaşa qarşılıqlı təsir üçün sınaqdan keçirilir. Y2H maya transkripsiya faktoru Gal4-ün funksional yenidən qurulmasına və sonradan His3 kimi seçici reportyorun aktivləşdirilməsinə əsaslanır. İki zülalın qarşılıqlı təsirini yoxlamaq üçün iki protein ifadə konstruksiyaları hazırlanır: bir zülal (X) Gal4 DNT-ni bağlayan domenə (DB) və ikinci protein (Y) Gal4 aktivləşdirmə sahəsinə (AD) birləşdirilir. Təhlildə maya hüceyrələri bu konstruksiyalarla çevrilir. Yem (DB-X) və yırtıcı (AD-Y) bir-biri ilə qarşılıqlı əlaqədə olmadıqda və funksional Gal4 transkripsiya faktorunu meydana gətirmədikcə müxbir genlərinin transkripsiyası baş vermir. Beləliklə, zülallar arasındakı qarşılıqlı əlaqə məruzəçi gen ifadəsinin nəticəsi olan məhsulların mövcudluğu ilə müəyyən edilə bilər. [12] [30] Reportyor genin mayaya əsas amin turşularını və ya nukleotidləri sintez etməyə imkan verən fermentləri ifadə etdiyi hallarda, selektiv mühit şəraitində maya artımı sınaqdan keçirilmiş iki zülalın qarşılıqlı təsirdə olduğunu göstərir. Bu yaxınlarda zülal qarşılıqlı təsirlərini aşkar etmək və prioritetləşdirmək üçün proqram nəşr olundu. [31] [32]

Faydalı olmasına baxmayaraq, maya iki hibrid sisteminin məhdudiyyətləri var. O, əsas host sistem kimi mayadan istifadə edir ki, bu da məməlilərə xas post-translational modifikasiyaları ehtiva edən zülalları öyrənərkən problem yarada bilər. Müəyyən edilmiş PPI-lərin sayı yüksək yalançı mənfi nisbət [33] və məsələn, membran zülallarını aşağı saldığı üçün adətən aşağı olur. [34] [35]

Y2H-dən istifadə edilən ilkin tədqiqatlarda yanlış pozitivlər üçün düzgün nəzarət (məsələn, DB-X AD-Y-nin iştirakı olmadan reportyor genini aktivləşdirdikdə) tez-tez həyata keçirilmirdi ki, bu da normaldan daha yüksək yanlış müsbət nisbətə gətirib çıxardı. Bu yanlış pozitivlərə nəzarət etmək üçün empirik çərçivə tətbiq edilməlidir. [36] Membran zülallarının daha aşağı əhatə dairəsi üzrə məhdudiyyətlər membran mayası iki hibrid (MYTH) [35] və split-ubiquitin sistemi [30] kimi maya iki hibrid variantlarının meydana çıxması ilə aradan qaldırıldı. nüvədə və bakteriyalarda həyata keçirilən iki hibrid sistemdə meydana gələn qarşılıqlı təsirlərlə məhdudlaşır [37]

Kütləvi spektrometriya ilə əlaqəli yaxınlığın təmizlənməsi Redaktə edin

Kütləvi spektrometriya ilə birləşdirilmiş yaxınlığın təmizlənməsi əsasən sabit qarşılıqlı təsirləri aşkar edir və beləliklə in vivo PPI-lərin funksional olduğunu daha yaxşı göstərir. [38] [30] Bu üsul adətən hüceyrədə ifadə olunan etiketlənmiş zülalın təmizlənməsi ilə başlayır. in vivo konsentrasiyalar və onun qarşılıqlı zülalları (yaxınlığın təmizlənməsi). Çox az çirkləndirici fonu olan zülalları təmizləmək üçün ən sərfəli və geniş istifadə edilən üsullardan biri Bertrand Serafin və Mattias Mann və müvafiq həmkarları tərəfindən hazırlanmış tandem yaxınlıq təmizlənməsidir. PPI-lər daha sonra müxtəlif üsullardan istifadə etməklə kütlə spektrometriyası ilə kəmiyyət və keyfiyyətcə təhlil edilə bilər: kimyəvi birləşmə, bioloji və ya metabolik birləşmə (SILAC) və etiketsiz üsullar. [8] Bundan əlavə, şəbəkə nəzəriyyəsi hüceyrələrdə müəyyən edilmiş zülal-zülal qarşılıqlı təsirlərinin bütün dəstini öyrənmək üçün istifadə edilmişdir. [3]

Nuklein turşusu proqramlaşdırıla bilən zülal massivi Redaktə edin

Bu sistem ilk dəfə 2004-cü ildə LaBaer və həmkarları tərəfindən in vitro transkripsiya və tərcümə sistemindən istifadə etməklə hazırlanmışdır. Onlar GST zülalı ilə birləşmiş maraq genini kodlayan DNT şablonundan istifadə edirlər və o, bərk səthdə hərəkətsizləşdirilib. Anti-GST antikoru və biotinləşdirilmiş plazmid DNT aminopropiltrietoksisilan (APTES) ilə örtülmüş slaydda bağlandı. BSA DNT-nin bağlanma effektivliyini artıra bilər. Biotinləşdirilmiş plazmid DNT avidin tərəfindən bağlandı. Hüceyrəsiz ifadə sistemindən, yəni dovşan retikulosit lizatından (RRL) istifadə etməklə yeni zülal sintez edildi və sonra slaydda bağlanmış anti-GST antikoru vasitəsilə yeni zülal tutuldu. Zülal-zülal qarşılıqlı təsirini yoxlamaq üçün hədəflənmiş protein cDNA və sorğu protein cDNA eyni örtülmüş slaydda immobilizasiya edildi. In vitro transkripsiya və tərcümə sistemindən istifadə edərək, hədəf və sorğu proteini eyni ekstraktla sintez edilmişdir. Hədəflənmiş zülal slaydda örtülmüş antikor tərəfindən sıraya bağlandı və sorğu zülalı massivi araşdırmaq üçün istifadə edildi. Sorğu zülalı hemaglutinin (HA) epitopu ilə işarələnmişdir. Beləliklə, iki zülal arasındakı qarşılıqlı əlaqə HA-ya qarşı antikorla vizuallaşdırıldı. [39] [40]

İntragenik tamamlama Edit

Bir gen tərəfindən kodlanmış bir polipeptidin çoxsaylı nüsxələri bir kompleks meydana gətirdikdə, bu zülal quruluşuna multimer deyilir. Müəyyən bir genin iki müxtəlif mutant allelləri tərəfindən istehsal olunan polipeptidlərdən multimer əmələ gəldikdə, qarışıq multimer tək olaraq mutantların hər biri tərəfindən yaradılmış qarışıq olmayan multimerlərdən daha böyük funksional aktivlik nümayiş etdirə bilər. Belə bir vəziyyətdə fenomen intragenik komplementasiya adlanır (həmçinin inter-allelik tamamlama adlanır). İntragenik tamamlama göbələklər də daxil olmaqla müxtəlif orqanizmlərdə bir çox müxtəlif genlərdə nümayiş etdirilmişdir. Neyrospora crassa, Saccharomyces cerevisiaeSchizosaccharomyces pombe bakteriya Salmonella typhimurium virus bakteriofajı T4, [41] bir RNT virusu [42] və insanlar. [43] Bu cür tədqiqatlarda eyni gendə qüsurlu olan çoxsaylı mutasiyalar tez-tez təcrid olunmuş və genin genetik xəritəsini yaratmaq üçün rekombinasiya tezlikləri əsasında xətti ardıcıllıqla xəritələnmişdir. Ayrı-ayrılıqda, tamamlamanı ölçmək üçün mutantlar cüt birləşmələrdə sınaqdan keçirildi. Belə tədqiqatların nəticələrinin təhlili belə nəticəyə gəlməyə əsas verir ki, intragenik komplementasiya, ümumiyyətlə, müxtəlif qüsurlu polipeptid monomerlərin multimer əmələ gətirmək üçün qarşılıqlı təsirindən yaranır. [44] Multimer əmələ gətirən polipeptidləri kodlayan genlər ümumi görünür. Məlumatların bir şərhi ondan ibarətdir ki, polipeptid monomerləri çox vaxt multimerdə elə düzülür ki, genetik xəritədə yaxın yerlərdə qüsurlu mutant polipeptidlər zəif fəaliyyət göstərən qarışıq multimer əmələ gətirir, halbuki uzaq ərazilərdə qüsurlu mutant polipeptidlər əmələ gəlir. daha effektiv fəaliyyət göstərən qarışıq multimer. Yaxınlıqdakı ribosomlardan çıxan iki yeni yaranan zülalın birbaşa qarşılıqlı təsiri homo-oliqomer (multimer) əmələ gəlməsinin ümumi mexanizmi kimi görünür. [45] Belə bir qarşılıqlı əlaqə ilə insan hüceyrələrində toplanan yüzlərlə protein oliqomeri müəyyən edilmişdir. [45] Ən çox yayılmış qarşılıqlı təsir forması qarşılıqlı təsir göstərən zülalların N-terminal bölgələri arasındadır. Dimer formalaşması xüsusi montaj maşınlarından asılı olmayaraq baş verə bilər. Ehtimal ki, özünü tanıma və multimer formalaşması üçün cavabdeh olan molekullararası qüvvələr Jehle tərəfindən müzakirə edilmişdir. [46]

Digər potensial üsullar Redaktə edin

Texnologiyanın inkişafı ilə birlikdə ÜFE-ləri müəyyən etmək üçün müxtəlif üsullar ortaya çıxdı. Bunlara koimmunopresipitasiya, zülal mikromassivləri, analitik ultrasentrifuqalama, işığın səpilməsi, flüoresan spektroskopiyası, lüminesansa əsaslanan məməli interaktom xəritələşdirilməsi (LUMIER), rezonans-enerji transfer sistemləri, məməli zülal-zülal qarşılıqlı əlaqəsi, biosurətli zülal kompensasiyası daxildir. analiz, həmçinin səth plazmon rezonansı və kalorimetriya ilə real vaxt etiketsiz ölçmələr. [34] [35]


Videoya baxın: Bədənimizi Qoruyan Zülallar (Iyul 2022).


Şərhlər:

  1. Cuuladh

    Siz nişanı vurmusunuz. Mənə elə gəlir ki, çox yaxşı fikirdir. Sizinlə tam razıyam.

  2. Ten Eych

    Müdaxilə etdiyim üçün üzr istəyirəm, amma zəhmət olmasa bir az daha çox məlumat verə bilərsiniz.

  3. Goltikree

    I regret, that I can not participate in discussion now. It is not enough information. But with pleasure I will watch this theme.

  4. Bruhier

    faydalı sual



Mesaj yazmaq