Məlumat

Bir siqnal peptidi ilə tranzit peptid arasındakı fərq nədir?

Bir siqnal peptidi ilə tranzit peptid arasındakı fərq nədir?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Bildiyimə görə, iki ad bir-birini əvəz edir və əksini söyləyən heç bir mənbə tapmadım. Heç bir fərq varmı, siqnal peptidi olmayan tranzit peptid varmı və ya əksinə?


Siqnal peptidləri adətən zülalın N ucunda yerləşir. Siqnal peptidləri translokon mexanizmləri tərəfindən işlənir və ifrazat sistemindəki orqanoidlərin membranları vasitəsilə çeşidləndikdən sonra ayrılır:

  • endoplazmik retikulum
  • Qolci cihazı
  • ER-Golgi keçid vezikülləri
  • plazma membran
  • lizosomlar

Transit peptidlər zülalı digər hüceyrəaltı orqanellələrə yönəldir, məsələn (UniProt-dan):

  • Mitoxondri
  • Apikoplast
  • Xromoplast
  • Xloroplast
  • Siyanel
  • Tilakoid
  • Amiloplast
  • Peroksizom
  • Glyoxysoma
  • Hidrogenosom

N-terminal tranzit peptidləri olduqca nadirdir. C-terminal tranzit peptid motivləri daha çox yayılmışdır. UniProt tranzit peptidləri siqnal peptidlərindən ayrı, diskret idarə olunan lüğət kimi saxlayır.


Siqnal peptidi

Bir genin kodlaşdırma ardıcıllığından əvvəl olan bir xəbərçi RNT (mRNA) molekulunun bölgəsi "lider ardıcıllığı" adlanır. Bu bölgə həm də “beş əsas tərcümə olunmamış bölgə” kimi tanınır (Şəkil 1) mRNT-nin. Lider ardıcıllıqlar tamamlayıcı ardıcıllıqların əsas cütləşməsi ilə ikinci dərəcəli strukturlar (gövdə-ilgələr) yaratmağa meyllidirlər. Onlar eukariotlarda və prokaryotlarda gen ifadəsinin tənzimlənməsində iştirak edirlər. Eukariotlarda lider ardıcıllığı bir neçə nukleotiddən 1000-dən çox nukleotidə qədər dəyişə bilər. Prokaryotlarda lider ardıcıllıqları adətən qısa olur və bəzən qısa lider peptidinə çevrilən zəiflədici seqmenti ehtiva edir. Lider peptid, RNT polimeraza operonun ilk struktur geninə çatmazdan əvvəl transkriptləri dayandırmaq funksiyasını yerinə yetirir. Viruslardakı lider ardıcıllıqların gen ifadəsinin, replikasiyanın və patogenliyin tənzimlənməsində mühüm rol oynadığı göstərilmişdir. Hüceyrə mRNA-larının lider ardıcıllığında mutasiyalar xəstəlik və şişlərin əmələ gəlməsinə təsir göstərə bilər.


Fon

İlkin plastidlər endosimbiontik mənşəli orqanoidlərdir [məs. 1, 2]. (endo-)simbiontdan orqanoidə keçid zamanı onun genlərinin çoxu ya itirilir, ya da daha yüksək dərəcədə hüceyrə nüvəsinə köçürülür [məs. 3, 4, 5]. Beləliklə, plastid proteomunun çox hissəsi ev sahibi hüceyrənin nüvəsində kodlanır, bu, kodlanmış zülalların post-translational olaraq iki zərf membranı vasitəsilə plastid lümeninə nəql edilməsini nəzərdə tutur. Dəqiq ticarət üçün, demək olar ki, bütün nüvə kodlu plastid zülalları xarakterik N-terminal topogen siqnal ardıcıllığı, tranzit peptid ilə təchiz edilmişdir [6]. Bu hədəfləmə məlumatı plastid idxalı üçün zəruri və kifayətdir və xloroplastların xarici/daxili zərf membranının translokonları ilə qarşılıqlı əlaqədə olur [TOC və TIC bu yaxınlarda 7-də nəzərdən keçirilmişdir]. Maraqlıdır ki, tranzit peptidlərin sorğuları ciddi konsensus ardıcıllığının olmadığını göstərir [8], lakin müsbət xalis yük, hidroksilləşdirilmiş amin turşularının yüksək səviyyələri və molekulyar şaperonlar üçün bağlama motivləri [9 və oradakı istinadlar] kimi bəzi ümumi xüsusiyyətlər.

Diatomlar, apikompleksa və ya kriptofitlər kimi ikinci dərəcəli təkamül keçirmiş orqanizmlər iki əlavə membranla əhatə olunmuş plastidləri saxlayır [10, 11]. Genomik analizlər əsas plastidlərdə olduğu kimi plastid təyinatı olan nüvə kodlu zülalların ümumi dəstini göstərdi [4]. İlkin plastidlərdən fərqli olaraq, buradakı zülallar klassik ER-yə bənzər siqnal peptidindən (SP) və sonra tranzit peptid kimi ardıcıllıqla (TP) ibarət ikitərəfli topogen siqnal ardıcıllığı (BTS) ilə təchiz edilmişdir [2, 12, 13. ]. Bu tranzit peptidəbənzər ardıcıllıq - archaeplastida-da olduğu kimi - plastidin idxalı üçün əvəzolunmazdır. in vivo apikompleksa və diatomlar üzərində təcrübələr [5, 14, 15]. Bu yaxınlarda Tonkin et al. [16] nümayiş etdirdi ki, hətta tranzit peptidlər üçün əsas qaydalara əməl edən təsadüfi seçilmiş ardıcıllıqlar (yuxarıya bax) apikompleksada hədəfləmə ardıcıllığı kimi fəaliyyət göstərə bilər ki, bu da tranzit peptidlərin aşağı mürəkkəbliyini göstərir. Bununla belə, diatomlarda və kriptofitlərdə apikompleksan tranzit peptid tərkibinə ən azı bir əsas fərq mövcuddur ki, bu da plastid zülalının idxalı üçün vacib olan TP-nin +1 mövqeyində yüksək dərəcədə konservləşdirilmiş aromatik amin turşusunun olmasıdır [5, 15, 17] . Apikompleksanın TP-ləri diatomlar və kriptofitlər kimi fenilalanindən çox asılı deyildir [18].

İkincil tranzit peptid kimi bölgələrdə əlavə xüsusiyyətləri araşdırmaq üçün diatomda hərtərəfli tədqiq etdik. Phaeodactylum tricornutum tranzit peptid kimi bölgədə dəyişikliklərlə fukoksantin-xlorofil a/c bağlayıcı zülal D (FcpD) BTS ilə birləşdirilən GFP-nin hədəfləmə davranışı. P. tricornutum kimi tədqiqatlar üçün ən uyğun sistemdir, çünki - apicomplexan kimi parazitlərin əksinə Plasmodium falciparum - ya dörd ətraf membrandan biri vasitəsilə yalnız xloroplast ER-yə (cER) daşınan və ya ikisi vasitəsilə periplastid bölməsinə (PPC) daşınan aralıq məhsullar (Şəkil 1) [1] asanlıqla izlənilə və tamamlanan idxaldan (bir-birindən) fərqləndirilə bilər. bütün dörd zərf membranı). Araşdırmalarımız bunu təsdiqlədi (i) müsbət xalis yük zülalın ən daxili iki plastid membrandan (TP-nin +1 mövqeyində aromatik amin turşusu olduqda) daşınması üçün kritik əhəmiyyətə malikdir, halbuki ikinci ən xarici membran vasitəsilə daşınma açıq şəkildə bu şəkildə idarə olunmur. Burada mənfi yüklər membran keçidinə mane olur. Bundan əlavə, biz bunu nümayiş etdiririk (ii) yetkin zülalın N-terminusu tranzit peptid kimi ardıcıllığın funksional ehtiyaclarına kömək edə bilər. Beləliklə, tapıntılarımız əlavə olaraq təkamül zamanı tranzit peptid kimi bölgələrin necə təkamül etdiyini göstərə bilər.

Plastid arxitekturasının sxematik təsviri P. tricornutum. Mürəkkəb plastid dörd membranla əhatə olunmuşdur (xaricidən içəriyə doğru hesablanır), ən xarici membran endoplazmatik retikulum ilə davamlıdır. CER, plastid prekursorlarının ER lümeninə 1-ci membrandan keçərək birgə translyasiya idxalını asanlaşdıran ribosomlarla örtülmüşdür. Qırmızı yosun əcdadı olan ikincil plastidlərin sonrakı membranlarının (göstərilmir) translokonu üçün namizədlər bu yaxınlarda aydınlaşdırıldı [bax: 30, 31, 32, 33, 38, 40, 41, 42]. cER, xloroplast endoplazmatik retikulum PPC, periplastid bölməsi IMS, membranlararası boşluq.


MATERİALLAR VƏ METODLAR

Təlim və test dəstləri

Olof Emanuelsson (Stokholm Bioinformatika Mərkəzi) metodumuzun parametrlərini təyin etmək üçün təsadüfi olaraq 20 cüt təlim və yoxlama dəstinə bölünmüş 150 ardıcıl ChloroP məlumat dəstini (3) təmin etdi. Təlim dəstləri 124 ardıcıllıqdan, doğrulama dəstləri isə hər bir dəstdə bərabər sayda sinifdaxili (məsələn, cTP) və sinifdənkənar nümunələrdən ibarət qalan 26 ardıcıllıqdan ibarət idi. Nəzərə alın ki, “təsdiqləmə dəsti testi” ifadəsini işlətdikdə biz təlim dəstinin bir hissəsində aparılan testlərə istinad edirik. Son sınaq üçün TargetP təlim dəstini (5) endirdik və artıq ChloroP təlim dəstində olan ardıcıllığı silmək üçün SWISS-PROT qoşulma nömrələrindən istifadə etdik. TargetP təlim dəsti 371 mitoxondrial tranzit peptid (mTP), 269 ifrazat yolu/siqnal peptid (SP), 48 'nüvə' (Nuc) və 87 'sistolik' (Cyt) ardıcıllığından ibarət idi, onlardan 17, 14, 9-u çıxardıq. və müvafiq olaraq 10 ardıcıllıq. SP, Nuc və Cyt ardıcıllıqlarının hamısı TargetP 'bitki dəstindən' idi. 141 cTP ardıcıllığından 28 lazımsız ardıcıllığı çıxardıq. Bunlar silinən yeganə ardıcıllıqlar idi və qalan test dəstində 113 sinifdaxili və 725 sinifdən kənar ardıcıllıq var.

Bir proteinin kodlaşdırılması

PCLR, logistik reqressiya və neyron şəbəkə modellərimiz üçün giriş ölçüsü 21-dir. İlk 20 giriş zülal ardıcıllığının ilk 55 mövqeyində amin turşusu tərkibinin faizlərindən ibarətdir. 21-ci giriş, ilk 55 mövqedə xüsusi zülalın amin turşusu paylanmasının dəyişmə ölçüsüdür. Metodlarımız ardıcıllıq uzunluqları 45 ilə 60 arasında olan doğrulama dəstlərində oxşar şəkildə yerinə yetirildi, lakin nəticədə, kvadrat xətaların (SSE) ölçmələrinin cəminə əsasən, tədqiqatımız üçün 55 uzunluq seçildi.

Əsas komponent logistik reqressiyası

Əsas komponentlərin təhlili verilənlərdən ko-xətti faktorinq və maşın öyrənmə alqoritmi üçün ölçüləri azaltmaq üsuludur (6). Biz R statistika paketindən istifadə edərək əsas komponent matrisində ilk 12 komponentdə (xüsusi dəyərin böyüklüyünü azaltmaqla sıralanmış) əsas komponent təhlili və sonrakı mərhələli logistik reqressiya həyata keçirdik (7). Proqnoz nəticələri yaratmazdan əvvəl sınaq məlumatlarını təlim məlumatlarının əsas komponent məkanına çevirdik.

Logistik reqressiya həmişə (0,1) arasında proqnozlar verir, lakin biz təsnifat üçün istifadə etmək üçün həddi tələb edirik. Doğrulama dəsti sınağı zamanı “ümumi say düzgün” saylarına əsaslanaraq biz təsnifat üçün 0,42 qərar həddi seçdik (məsələn, 0,41 proqnozu metodumuzun “xloroplast olmayan hədəfləməni” proqnozlaşdırdığı deməkdir). Nəzərə alınacaq bir sıra əsas komponentlər və təsnifat həddinə qərar verdikdən sonra biz bütün ChloroP təlim dəstində PCLR öyrətdik. Nəticə proqnozlaşdırıcı, əsas komponentlər və reqressiya əmsalları http://apicoplast.cis.upenn.edu/pclr/ saytında mövcuddur.

Logistik reqressiya

Daha sadə modelin bərabər performans təmin edib-etməyəcəyini görmək üçün əsas komponent pilləli logistik reqressiyaya əlavə olaraq standart pilləli logistik reqressiyaya cəhd etdik. R paketində biz PCLR işində olduğu kimi logistik reqressiya üçün eyni girişdən istifadə etdik. Doğrulama dəsti sınağı zamanı 0,40 qərar həddi seçilmiş və sonra HədəfP test dəstində istifadə edilmişdir.

Neyron şəbəkəsi

Biz NevProp4r1, sigmoidal gizli vahidləri və bir sigmoidal çıxış vahidi (http://www.scs.unr.edu/nevprop) olan standart irəli ötürülən neyron şəbəkəsindən istifadə etdik. Yuxarıda təsvir edilən PCLR işində olduğu kimi eyni girişlərdən istifadə etdik. Gizli bölmələrin sayı 1-dən 12-yə qədər dəyişdi, pik performans 4 gizli vahidlə baş verdi və qısa müddətdə performans azaldı. Doğrulama dəstinin performansına əsasən 0,005 çəki azalması seçilmişdir. Təlim üçün maksimum 700 iterasiya seçdik və yaxşı dayanma nöqtəsi seçmək üçün NevProp-un avtomatik qatar keçidindən istifadə etdik. Doğrulama dəstinin performansına (ümumi say düzgün) əsaslanaraq, biz 0,59 təsnifat həddini seçdik.

ChloroP neyron şəbəkəsi arxitekturası

ChloroP arxitekturası Emanuelssonda təsvir edilmişdir və b. (3) bununla belə, aydınlaşdırma və müqayisəli məqsədlər üçün qısa təsvir daxil edilir. ChloroP iki neyron şəbəkədən ibarətdir ki, burada birinci şəbəkənin müxtəlif girişlər dəstinə qarşı çıxışı yekun proqnoz üçün ikinci neyron şəbəkəsinə qidalanır. Birinci şəbəkəyə giriş zülalın ilk 100 mövqeyindən 51 amin turşusunun sürüşmə pəncərəsindən ibarətdir. Hər zülal üçün 100 sifarişli pəncərə var və onlar elə başlayırlar ki, birinci pəncərə zülal ardıcıllığının ilk 51 amin turşusundan ibarətdir. Əvvəlki pəncərənin sağa bir yerə köçürülməsi hər bir sonrakı pəncərəni təşkil edir. Pəncərələr 100-cü mövqedən keçmiş bir sahə ilə üst-üstə düşdükcə, "boş" amin turşuları proqnozlaşdırıcıya daxil olur. Bu pəncərələrdən 100-ü birinci təbəqəyə daxil olur və beləliklə, 100 proqnoz verilir.

Birinci şəbəkə 1020 giriş vahidindən, 2 gizli vahiddən və 1 çıxış vahidindən ibarətdir. Kifayət qədər çox sayda giriş vahidi neyron şəbəkəsində kateqoriyalı məlumatlardan istifadənin nəticəsidir. Bir mövqedə 20 mümkün atribut (amin turşusu) var və buna görə də hər mövqenin 20 giriş vahidi var. Bu vahidlərdən yalnız biri işə salınıb (“1.0” ilə işarələnir): digər 19-u “0.0”da qalır. Beləliklə, 51 mövqedən ibarət bir pəncərə 51 × 20 = 1020 giriş vahidi tələb edir. Bu partlayışı giriş ölçüsündə birləşdirən birinci təbəqə şəbəkəsinə qidalanan zülal ardıcıllığına görə 100 pəncərədir. Hamısı birlikdə, bir zülal haqqında proqnoz vermək üçün birinci səviyyə şəbəkəsinə 102 000 ümumi giriş tələb olunur. İkinci səviyyə şəbəkəsində 100 giriş vahidi, 10 gizli vahid və 1 çıxış vahidi var. Hər iki şəbəkə üçün gizli və çıxış təbəqələrində sigmoidal vahidlər istifadə olunur.

Biz ChloroP modelini http://www.cbs.dtu.dk/services/ChloroP/ ünvanında yerləşən veb-əlçatan ChloroPv1.1 buraxılışından istifadə edərək müqayisə etdik. Emanuelssonun təklif etdiyi kimi biz təsnifat həddi 0.50-dən istifadə etdik və b. ( 3).


Materiallar və metodlar

Fitoplazmanın homoloji ardıcıllığının identifikasiyası BLASTP proqram təminatından (Camacho et al., 2009) istifadə edilməklə, NCBI veb saytında standart parametrləri olan ‘qeyri-ehtiyatsız’ verilənlər bazasına (NCBI Resource Coordinators, 2018) qarşı həyata keçirilmişdir. SAP54 verilənlər bazası üçün Iwabuchi və digərlərinin fil-B qrupundan olan ardıcıllıqlar. (2020) digər üzvlərlə müşahidə edilən fillodiya induksiya edən fenotipi göstərmədikləri üçün xaric edildi, baxmayaraq ki, onlar hələ də funksional siqnal peptidinə və hələ kəşf edilməmiş funksiyalara malik ola bilərlər. Çox dəyişkən ola bilən Amp və Imp üçün biz əvvəlcə qaralama və ya tam fitoplazma genomlarından ikisi arasında yerləşən kodlaşdırma ardıcıllığını çıxardıq. groELnadE, və DnaDPyrG müvafiq olaraq. Daha sonra Amp və Imp homoloji ardıcıllıqlarının tam məlumat dəstini əldə etmək üçün tərcümə edilmiş ardıcıllıqlardan BLASTP sorğuları kimi istifadə etdik. Verilənlər dəstimizin mümkün qədər dolğun olmasını təmin etmək üçün Genbank-da açar söz axtarışı (müvafiq olaraq kantigen membran protein fitoplazması” və “imp”) aparıldı və hər iki strategiyadan təsdiqlənmiş hitlər birləşdirildi.


Siqnal peptidlərindən təsirlənən ifrazat zülalının istehsalı prosesində addımlar

Yuxarıda qeyd edildiyi kimi, siqnal peptidləri ixrac olunan zülalları sitozolda qalan zülallardan ayırır. Siqnal peptidləri ixrac edilən prekursor zülalların sitoplazmik membranda müvafiq protein translokazlarına hədəflənməsi və bağlanmasına vasitəçilik edir [49]. İxracın posttranslyasiya rejiminə vasitəçilik edən Sec siqnal peptidlərinin əlavə mühüm rolu, əlavə olunmuş yetkin zülal hissəsinin translasiyadan sonrakı qarşılıqlı əlaqədə olan zülallarla (məsələn, SecB) səmərəli qarşılıqlı əlaqəsini təmin etmək üçün qatlanmasını yavaşlatmaq və bu vasitə ilə müvafiq ixrac zülalları öz ixracına uyğun vəziyyətdədir [50, 51]. Bundan əlavə, Sec siqnal peptidləri üçün gen bölgələri qeyri-optimal kodonlar üçün güclü meylə malikdir, bu xüsusiyyət tərcümənin kinetikasını yavaşlatmaqla ixracın səmərəliliyinə və ifrazat istehsal prosesinin ümumi məhsuldarlığına dərin müsbət təsir göstərir [52] . Qeyri-optimal kodonların siqnal peptidləri üçün gen bölgələrində optimal kodonlarla əvəz edilməsi Escherichia coli maltoza bağlayan zülal [53] və ya β-laktamaz [54] çoxlu proteazlarda qüsurlu olan suşlarda və ya aşağı temperaturda qismən artırıla bilən zülal istehsalının azalması ilə nəticələndi. Bu onu göstərir ki, Sec siqnal peptidlərində mövcud olan nadir kodonlar vasitəsilə tərcümə sürətinin yavaşlatılması ixrac zülallarının ixrac mexanizminin komponentləri ilə səmərəli qarşılıqlı əlaqəsini təmin etmək və onların deqradasiyasının qarşısını almaq üçün çox vacibdir. Bundan əlavə, Sec siqnal peptidlərinin də Sec translokazının allosterik aktivatorları kimi fəaliyyət göstərdiyi aşkar edilmişdir [55].

Bir zülalın sitoplazmik membrana yönəldildiyi və köçürüldüyü effektivliyi və kinetikasını birbaşa müəyyən edən ifrazat zülal istehsal yolunda bu addımlarla yanaşı, siqnal peptidləri də dolayı yolla ümumi istehsal prosesinə təsir göstərir. Məsələn, müxtəlif siqnal peptidlərinin müəyyən bir hədəf zülalına birləşməsi, onların ikincil strukturunda və/yaxud sabitliyində fərqlənə bilən müxtəlif mRNT transkriptləri ilə nəticələnir və buna görə də müvafiq prekursor zülalların miqdarına əhəmiyyətli dərəcədə təsir göstərə bilər. sintez olunur [56, 57].


Nəticələr

Biz Philius-un inkişaf verilənlər bazasında performansını on qat çarpaz doğrulamadan istifadə edərək qiymətləndirdik. Biz modelin performansını, eləcə də hər üç növ etibar balının dəqiqliyini ölçdük. Siqnal peptidi olan zülallar üçün biz həmçinin parçalanma yerinin lokalizasiyasının dəqiqliyini nəzərə aldıq.

Metodumuzu Phobius ilə müqayisə etməyi seçdik, çünki bu, siqnal peptidlərini və tam transmembran topologiyalarını eyni vaxtda proqnozlaşdıran yeganə üsuldur. MemBrain [29] və P roteus [30] kimi bir neçə üsul, heç bir topoloji (daxili/xarici) məlumat olmadan transmembran sarmalları və siqnal peptidlərini proqnozlaşdırır. PONGO veb serveri [31] fərdi proqnozlaşdırıcıları birləşdirmədən fərdi transmembran topologiyası və siqnal peptid proqnozlaşdırıcılarından proqnozlar verir.

Protein Tipinin Təsnifatı

Əvvəlcə biz Philiusun müəyyən bir zülal sinfini G, SP+G, TM və ya SP+TM kimi nə dərəcədə dəqiq müəyyən etdiyini qiymətləndiririk. Cədvəl 1 dəqiqlik, dəqiqlik, həssaslıq, spesifiklik və Metyus korrelyasiya əmsalından istifadə edərək, Phobius və Philiusun bu tapşırıqda performansını göstərir. Qeyd edək ki, SP+TM alt çoxluğu yalnız 45 nümunədən ibarət olduğundan, inkişaf dəstindəki 2654 zülalın 2%-dən azını təşkil edir, biz bəzən daha mənalı statistika təmin etmək üçün onları digər TM zülalları ilə birlikdə qruplaşdıracağıq. Bu səviyyədə Philius və Phobius arasındakı ən böyük fərq, Philiusun Phobius-dan 29% daha az yalan pozitiv adlandırdığı TM və SP+TM kateqoriyasının dəqiqliyindədir. (Phobius 292 həqiqi müsbətdən 265-ni tapır və eyni məlumatda 2362 həqiqi neqativdən 82-ni səhv adlandırır, Philius 268 TP və 58 TN-ni səhv çağırır.) Ümumilikdə, G və SP+G alt çoxluqlarında performans mübadilədə bir qədər azalıb. ən çox maraq doğuran TM alt dəstinin təkmilləşdirilməsi üçün. Qeyd edək ki, bu məlumat dəstindəki sinif ölçüləri əyridir (48% SP+G, 41% G və 11% TM və SP+TM) və tam proteomla müqayisədə transmembran zülalları bu verilənlər bazasında bir faktorla az təmsil olunur. 2-dən 3-ə qədər.


ORİJİNAL ARAŞDIRMA məqaləsi

Fitoplazma tədqiqatlarına hələ də aksenik becərmə üsullarının olmaması mane olsa da, genom ardıcıllığının mövcudluğu fitoplazmaların yerləşdirdiyi virulentlik mexanizmlərinin səciyyələndirilməsində dramatik irəliləyişlərə imkan verdi və fitoplazmaların ifraz etdiyi effektorları müəyyən etmək üçün mühüm addım kimi siqnal peptidlərinin aşkar edilməsini vurğuladı. . Bununla belə, fitoplazma genomlarının çıxarılması üçün müxtəlif siqnal peptidlərinin proqnozlaşdırılması metodlarından istifadə edilmişdir və bu metodların fitoplazma ardıcıllığı üçün ümumi qiymətləndirilməsi indiyədək mövcud deyil. Bu işdə biz SiqnalP versiyalarının 3.0, 4.0, 4.1, 5.0 və Phobius-un proqnoz göstəricilərini bütün yatırılmış fitoplazma ardıcıllığından yaranan bir neçə ardıcıllıq verilənlər bazasında müqayisə etdik. Xüsusi parametrlərə malik SignalP 4.1 ən dolğun və ardıcıl proqnozlaşdırma qabiliyyətini göstərdi. Bununla belə, SignalP 4.1-in artan həssaslıq üçün konfiqurasiyası N-terminusda yerləşən transmembran domenlərində daha yüksək yanlış pozitiv göstəricilərə səbəb oldu. Bundan əlavə, həssas siqnal peptid proqnozları, siqnal peptidləri və transmembran bölgələri arasındakı əlaqə səbəbindən TMHMM və Phobius-un transmembran domeninin proqnozlaşdırılması qabiliyyəti ilə eyni şəkildə əldə edilə bilər. Burada təqdim olunan nəticələrdən əlavə, bu tədqiqatda toplanmış verilənlər dəstləri eksperimental ifrazat sübutlarının az olduğu bir sahədə siqnal peptid proqnozlaşdırıcılarını müqayisə etmək və qiymətləndirmək üçün dəyərli meyar təşkil edir. Bundan əlavə, bu tədqiqat bioinformatik proqnozlara inamı gücləndirmək üçün müqayisəli genomikanın faydasını göstərir.


Materiallar və metodlar

Hüceyrə Mədəniyyəti, mRNT Emalı və Kitabxana Assambleyası

Hüceyrələr f/2 AlgaBoost (AusAqua, Avstraliya) ilə əlavə edilmiş Tropic Marin PRO-REEF (Tropic Marin, Almaniya) içərisində 16 saat işıq və 8 saat qaranlıq dövrə ilə 25 °C-də yetişdirildi. Üç fərqli vaxt nöqtəsindən (işığın yandırılmasından 1 saat əvvəl başlayan hər 8 saatdan bir) 800 ml mədəniyyət (təxminən 5 × 10 5 hüceyrə/ml) hüceyrələri 20 dəqiqə ərzində 3000 × g-də sentrifuqalama yolu ilə yığılmışdır. Bu üç nümunənin RNT-si istehsal protokoluna uyğun olaraq aşağıdakı modifikasiya ilə TRIzol (Invitrogen, Almaniya) ilə ayrıca təcrid olundu: hüceyrə qranul TRIzol əlavə edilməzdən əvvəl 5-10 dəqiqə maye azotun iştirakı ilə üyüdüldü. RNT kəmiyyəti təyin edildikdən sonra nümunələr birləşdi ki, hər birindən bərabər miqdarda olsun və sonrakı emal üçün GATC-Biotech (Almaniya) üçün quru buz üzərində göndərin. GATC-də RNT "True-Full-Length cDNA" üçün onların standart protokolundan istifadə edərək gücləndirildi və sonra Titanium GS FLX (Roche) üzərində 2 milyon oxunuş ardıcıllığından əvvəl əlavə olaraq normallaşdırıldı. Adapter ardıcıllığının kəsilməsi, ilkin qruplaşma və oxunuşların yığılması GATC-Biotech tərəfindən həyata keçirilib. Ardıcıllıq orta uzunluğu 239 əsas olan 2502269 oxunuşla nəticələndi və bunlar 29,856 kontigdə yığıldı. Əlavə olaraq, biz 2,854-ü daxil etdik C. velia GenBank-dan (Benson et al. 2009) ifadə edilmiş ardıcıllıq etiketləri (EST). Çoxlu nüsxə zülalları birləşdirildi və 100 nt-dən qısa olan EST-kontigləri çıxarıldı. Bundan əlavə, BlastN ilə belə EST-kontiglər plastidal genomuna daxil olur C. velia (e dəyər kəsimi 10 − 10 , RefSeq, Pruitt et al. 2007) və ya Rfam verilənlər bazası (Gardner et al. 2009) xloroplastla kodlanmış transkriptlərin və kodlaşdırılmayan RNT ailələrinin qalıqlarını silmək üçün silindi. Bütün ardıcıllıqlar JO786643–JO814452 altında saxlanılmışdır.

Verilənlər Bazasının Hazırlanması

Zülal verilənlər bazası ardıcıllığı ya EuPathDB (Aurrecoechea et al. 2007) RefSeq-dən və ya aşağıdakı hallarda əldə edilmişdir. Cyanidioschyzon merolae (Matsuzakiet al. 2004), Ectocarpus siliculosus (Cock et al. 2010) və Emiliania Huxleyi (http://genome.jgi-psf.org/Emihu1/Emihu1.download.ftp.html) müvafiq genom layihəsinin ana səhifələrindən. Yüklənmiş fayllardan C-terminal stop kodonlarını çıxardıq və selenosisteinləri Xs ilə əvəz etdik. Adekvat sayda zülal ardıcıllığının mövcud olmadığı hallarda, əvəzinə və ya əlavə olaraq EST-kontigs istifadə edilmişdir. Bu məqsədlə GenBank-dan >1000 girişi olan bütün nəsillər üçün EST-ləri yükləyərək EST-contig verilənlər bazası yaratdıq. Qaldieriya -dən endirilmiş EST-lər Galdieria sulphuraria genom layihəsinin ana səhifəsi (Weber et al. 2004). Əlavə məlumat və orqanizmlərin siyahısı üçün əlavə məlumatlara baxın (Onlayn Əlavə Material). EST-contigs aşağıda təsvir edilən üsulla zülallara çevrildi və zülal bazası ilə birləşdirildi.

Chromera EST-contigs Min et al. (2005). EST ardıcıllığı partladıldı (BlastX Altschul et al. 1997), istifadə edərək e protein bazası və SwissProt verilənlər bazası üçün dəyər həddi ≤ 1 × 10 - 5 (Boeckmann et al. 2003). Partlayış hitləri olan ardıcıllıqlar üçün biz ən yaxşı partlayış hitinin (BBH) oxu çərçivəsindən istifadə edərək EST-kontiglərini tərcümə etdik. Partlayış vurmayan ardıcıllıqlar ən uzun polipeptidi (həm mənada, həm də antisensdən istifadə edərək) verən açıq oxu çərçivəsini (ORF) axtararaq de novo proqnozlaşdırıldı. N-terminal metionini olmayan ORF-lərdə EST-kontigdə ilk kodon ilk amin turşusuna çevrildi. C-terminal STOP kodonu əskik olduqda, EST-kontigdəki son kodon sonuncu amin turşusuna çevrildi. Tərcümə edilmiş EST-contigs of C. velia CDHIT (Weizhong və Godzik 2006) tərəfindən yavaş rejimdən (-g 1) istifadə edərək, hədd kimi 95% amin turşusu ardıcıllığı şəxsiyyətinə malik, təxminən eyni EST-kontiglərinin qohumlarına qruplaşdırılmışdır. Qalan EST-contigs üçün qarşılıqlı BBH (rBBH Tatusov et al. 1997) üçün axtarış e <1 × 10 − 10 dəyər kəsimi hər növ/cins üçün protein/EST məlumat dəstinə qarşı həyata keçirilmişdir. Eyni olan çoxlu BBH halında e dəyərlər, bütün hitlər saxlanıldı. Bu halda, rBBH yanaşması eyni genin EST-ləri daxilində lazımsız vuruşları azaltmaq üçün istifadə edilmişdir. Cütlü düzülmələr Chromera EST-kontigləri və onların rBBH-ləri Needle (EMBOSS Rice et al. 2000) istifadə edərək Needleman və Wunsch hizalama alqoritmi (Needleman and Wunsch 1970) ilə yenidən qurulmuşdur. Qlobal amin turşusu identifikasiyası ≥25% (xarici boşluqlar istisna olmaqla) olan cütlər əlavə təhlil üçün saxlanılıb. Birdən çox eyni dərəcədə oxşar vuruşlar olduqda Chromera EST-contig və ya bir protein daxilində Chromera EST-contigs, ən yüksək qlobal oxşarlığa malik rBBH istifadə edilmişdir. Üçün homoloji zülalların çoxluqları quruldu Chromera EST-contigs və bütün növ məlumat dəstlərində onların homoloqları. Yalnız EST-kontiglərindən ibarət 359 klasterin xaric edilməsi ümumilikdə 3,151 klaster verdi.

Filogenetik Ağaclar və Splitlər Şəbəkələri

Filogenetik ağacları yenidən qurmaq üçün bir qrupdan başqa bütün “xromalveolat olmayan” ardıcıllıqlar (daha yüksək ardıcıllıqla oxşarlığı göstərən) Chromera EST-contigs) qruplardan çıxarıldı. <4 qalan üzvü olan klasterlər buraxıldı. Cəmi 3,151 homoloji zülal çoxluğu standart parametrlərdən istifadə edərək MAFFT (Katoh və Toh 2008) tərəfindən uyğunlaşdırıldı. Çoxlu düzülmə keyfiyyəti Rəhbərlikdən istifadə etməklə qiymətləndirilmişdir (Penn et al. 2010). Boşluqlu düzülmə mövqeləri silindi və 86 qısa düzülmə (<10 mövqe) sonrakı təhlildən xaric edildi. Filogenetik ağaclar, Akaike məlumat meyarından (Akaike 1974) istifadə edərək, ProtTest 3 (Darriba et al. 2011) tərəfindən əldə edilən ən yaxşı uyğun modeldən istifadə etməklə PhyML ilə 2258 çox ardıcıl düzülüşündən (Guindon and Gascuel 2003) yenidən qurulmuşdur. Parçalanmış şəbəkənin yenidən qurulması üçün filogenetik ağaclardakı bütün bölünmələr Perl skripti ilə çıxarıldı və 37 rəqəmi daxil edən ikili modelə çevrildi. Əgər parçalanmada takson varsa i sonra rəqəm xi müvafiq nümunədə "1" olaraq təyin olundu, əks halda "0" idi. Ağacda əskik olan taksonlar “?.” işarəsi ilə göstərilmişdir. Nəticə nümunələri SplitsTree (Huson və Bryant 2006) istifadə edərək bölünmə şəbəkəsində ümumiləşdirilmişdir.

Tapmaq Chromera yaşıl və ya qırmızı mənşəli ardıcıllıqlar, Rhodophyta və Chloroplastida zülalları daxil olmaqla yalnız 1174 qrup istifadə edilmişdir. Bütün nonrodophyta və nonchloroplastida ardıcıllığı qruplardan çıxarıldı, bunlardan başqa Chromera. Hər bir ağac üçün bir qrup olaraq, BBH üçün C. velia ikincili endosimbiont kimi Rhodophyta, Chloroplastida, tərcümə edilmiş EST-contig və ya qırmızı yosunlu hər hansı orqanizmlərə aid olmayan istifadə edilmişdir. Filogenetik ağaclar yuxarıda təsvir edilən eyni metodologiyadan istifadə edilməklə, nəticədə düzülmələrdən (≥50 mövqeyə malik) yenidən quruldu və cəmi bir qrupdan ibarət 813 ağac verdi. Ən yaxın qonşu Chromera Hər bir ağacın içindəki ən kiçik cins axtarılaraq təyin olundu C. velia və ya yalnız rhodophyta (qırmızı siqnal) və ya xloroplastida (yaşıl siqnal) və kənar qrup daxil deyil. mövqeyinin müəyyən edilməsi üçün C. velia ağaclarda bacı qrup olaraq və ya qırmızı və ya yaşıl təbəqələrin içərisində ağacları kənar qruplara görə köklədik və Newick Utilities paketindən istifadə edərək ikinci ən yaxın qonşuları axtardıq (Junier və Zdobnov 2010). Uzun budaqların cazibəsini qiymətləndirmək üçün ən uzun budaqların çıxarılması eyni paket tərəfindən həyata keçirildi. Əlavə iki bölünmüş şəbəkə, hər bir ağacdakı qrup kimliyindən asılı olmayaraq, kompozit qrupdan istifadə edərək, qırmızı və ya yaşıl ən yaxın qonşuya bölünmüş ağaclardan yenidən quruldu.

Digər Növlərdə Homoloqların Yoxluğu/Mövcudluğu

rBBH yanaşmasına əlavə olaraq, homologlar Chromera Hər bir növ daxilində EST-kontiglər çoxluqların partladılması ilə müəyyən edilmişdir Chromera Növlərin məlumat dəstinə qarşı EST-contigs. BBHs ilə e dəyəri ≤ 1 × 10 −10 onların ilə uyğunlaşdırıldı Chromera Needle istifadə edərək homolog (EMBOSS Rice et al. 2000). Xarici boşluqların aradan qaldırılmasından sonra ≥25% amin turşusu eyniliyi ilə nəticələnən qlobal cüt düzülmələr indiki homoloq kimi təsnif edildi. Şəkil 2-də təqdim olunan qlobal amin turşusu identiklikləri ikili düzülmələrdən çıxarılmışdır. boyunca göstərilən klasterlər y oxlar aşağıdakı kimi sıralanır: 1) apikompleksan filumuna xas olan bütün çoxluqlar, 2) bütün üzvlərin klasterləri, 3) C. velia, apicomplexa xaricində üzvləri var. Üç kateqoriya daxilində çoxluqlar Apikompleksa daxilində mövcud homoloqların artan sayı və qeyri-Apikompleksa daxilində mövcud homoloqların azalan sayı ilə çeşidləndi.

Nüvə kodlu plastid zülallarının BTS-nin ardıcıl loqosu. Loqo, N-terminal siqnal peptidini və ardınca tranzit peptidini kodlayan 255 sekans əsasında hazırlanmışdır. BTS-in iki hissəsi arasında dekolte yerinə (qırmızı ox) nisbətən -20/+20 mövqeləri göstərilir. Sekretor və plastid zülallarının hər ikisi demək olar ki, eyni siqnal peptidini kodlayır, lakin yalnız sonuncu halda tranzit peptid izləyir. Tranzit peptidinin N-terminal hissəsi serin qalıqları ilə, C-terminal ucu isə müsbət yüklü arginin qalıqları ilə zənginləşdirilmişdir.

Nüvə kodlu plastid zülallarının BTS-nin ardıcıl loqosu. Loqo, N-terminal siqnal peptidini və ardınca tranzit peptidi kodlayan 255 sekans əsasında hazırlanmışdır. BTS-in iki hissəsi arasında dekolte yerinə (qırmızı ox) nisbətən -20/+20 mövqeləri göstərilir. Sekretor və plastid zülallarının hər ikisi demək olar ki, eyni siqnal peptidini kodlayır, lakin yalnız sonuncu halda tranzit peptid izləyir. Tranzit peptidinin N-terminal hissəsi serin qalıqları ilə, C-terminal ucu isə müsbət yüklü arginin qalıqları ilə zənginləşdirilmişdir.

Nüvə ilə kodlanmışın mövcudluğu/yoxluğu modeli və şəxsiyyəti Chromera velia EST-lər 34 orqanizmlə müqayisədə. (A) 3,151 ardıcıllıq spesifikliyinə və tezliyinə görə digər Apicomplexa ardıcıllıqlarına görə sıralanır. Yüz əlli bir ardıcıllığın yalnız Apicomplexa-da homologları var, halbuki 1,316 ardıcıllığın yalnız Apicomplexa-dan başqa orqanizmlərdə homologları var. Qeyd edək ki, Apicomplexa xaricində, C. velia ilə ümumi şəxsiyyətin ən yüksək miqdarını paylaşır Perkinsus marinus. (B), analizdə istifadə olunan genomlar daxilində kodlanmış zülalların potensial miqdarı.

Nüvə ilə kodlanmışın mövcudluğu/yoxluğu modeli və şəxsiyyəti Chromera velia EST-lər 34 orqanizmlə müqayisədə. (A) 3,151 ardıcıllıq spesifikliyinə və tezliyinə görə digər Apicomplexa ardıcıllıqlarına görə sıralanır. Yüz əlli bir ardıcıllığın yalnız Apicomplexa-da homologları var, halbuki 1,316 ardıcıllığın yalnız Apicomplexa-dan başqa orqanizmlərdə homologları var. Qeyd edək ki, Apicomplexa xaricində, C. velia ilə ümumi şəxsiyyətin ən yüksək miqdarını paylaşır Perkinsus marinus. (B), analizdə istifadə olunan genomlar daxilində kodlanmış zülalların potensial miqdarı.

Plastidal və ifrazat zülallarının proqnozlaşdırılması

Siqnal peptidinin proqnozlaşdırılması üçün yalnız metioninlə başlayan zülala çevrilmiş EST-kontigləri istifadə edilmişdir. SignalP V3.0 (Emanuelsson et al. 2007) potensial plastidal siqnal peptidləri ilə ardıcıllıqları tapmaq üçün istifadə edilmişdir. Chromera homologları olan ardıcıllıqlar (“Verilənlər Bazasının Hazırlanması”na baxın) və plastid hədəflənmiş kimi qeyd edilmiş ardıcıllıqlar da plastidal zülallar kimi təsnif edilmişdir. All 657 detected sequences were then manually inspected, and an analysis including BlastP, SignalP, and TargetP ( Emanuelsson et al. 2007) was used to determine the cleavage sites and distinguish plastidal from other secretory proteins. A sequence logo of the targeting signal was created using Weblogo ( Crooks et al. 2004) from positions −20 to +20 in respect to the predicted cleavage site.

Annotation of Sequences

KEGG annotations were determined by using KAAS ( Moriya et al. 2007) using translated Chromera sequences as query against the KEGG maps of 27 eukaryotes including (for the complete species name, see http://www.genome.ad.jp/tools/kaas/): hsa, dme, cel, ath, osa, olu, cme, sce, ddi, ehi, pfa, pyo, pkn, tan, tpv, bbo, cpv, cho, tgo, tet, ptm, tbr, tcr, lma, tva, pti, and tps. Protein functional categories were summarized as follows: KOs were mapped to the corresponding annotations obtained from KEGG FTP Server (http://www.genome.jp/kegg/download/). The main categories “Cellular Processes” and “Environmental Information Processing” were merged into “Cellular Processing and Signaling.” Proteins in the “Unclassified, poorly characterized” category were classified as “Unclassified.” All other “Unclassified” categories were added to subcategory “Other” of the corresponding main classification. Genes potentially associated with photosynthetic were identified by searching for the KEGG categories “Photosynthesis” and “Photosynthetic.”


Prediction of signal peptides and signal anchors by a hidden Markov model.

  • APA
  • Müəllif
  • BIBTEX
  • Harvard
  • Standart
  • RIS
  • Vankuver

ISMB-98 Proceedings. Cild. 6 AAAI Press, 1998. p. 122-130 (International Conference on Intelligent Systems for Molecular Biology. Proceedings).

Research output : Chapter in Book/Report/Conference proceeding › Article in proceedings › Research › peer-review

T1 - Prediction of signal peptides and signal anchors by a hidden Markov model.

AU - Krogh, Anders Stærmose

N2 - A hidden Markov model of signal peptides has been developed. It contains submodels for the N-terminal part, the hydrophobic region, and the region around the cleavage site. For known signal peptides, the model can be used to assign objective boundaries between these three regions. Applied to our data, the length distributions for the three regions are significantly different from expectations. For instance, the assigned hydrophobic region is between 8 and 12 residues long in almost all eukaryotic signal peptides. This analysis also makes obvious the difference between eukaryotes, Gram-positive bacteria, and Gram-negative bacteria. The model can be used to predict the location of the cleavage site, which it finds correctly in nearly 70% of signal peptides in a cross-validated test--almost the same accuracy as the best previous method. One of the problems for existing prediction methods is the poor discrimination between signal peptides and uncleaved signal anchors, but this is substantially improved by the hidden Markov model when expanding it with a very simple signal anchor model.

AB - A hidden Markov model of signal peptides has been developed. It contains submodels for the N-terminal part, the hydrophobic region, and the region around the cleavage site. For known signal peptides, the model can be used to assign objective boundaries between these three regions. Applied to our data, the length distributions for the three regions are significantly different from expectations. For instance, the assigned hydrophobic region is between 8 and 12 residues long in almost all eukaryotic signal peptides. This analysis also makes obvious the difference between eukaryotes, Gram-positive bacteria, and Gram-negative bacteria. The model can be used to predict the location of the cleavage site, which it finds correctly in nearly 70% of signal peptides in a cross-validated test--almost the same accuracy as the best previous method. One of the problems for existing prediction methods is the poor discrimination between signal peptides and uncleaved signal anchors, but this is substantially improved by the hidden Markov model when expanding it with a very simple signal anchor model.

KW - artificial intelligence

KW - artificial neural network

KW - Artificial Intelligence

KW - Neural Networks (Computer)

KW - Protein Sorting Signals

M3 - Article in proceedings

T3 - International Conference on Intelligent Systems for Molecular Biology. Proceedings