Məlumat

Protein PTM saytının proqnozu

Protein PTM saytının proqnozu


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Müəyyən bir zülalda post-translational modifikasiya sahələrini proqnozlaşdırmaq üçün silico analiz metodu varmı?


Əslində bu saytların çoxu var, mən aşağıda sadalananlardan bəzilərini istifadə etmişəm. Əlavə olaraq, ExpPASy-dən bu sahədə mövcud olan digər xidmətlərin bir neçə böyük siyahısı var, onu burada tapa bilərsiniz və burada tapa bilərsiniz Bioloji Ardıcıllıq Təhlili Mərkəzi.


Çox etiketli protein Lizin PTM saytlarını müəyyən etmək üçün konvolusion neyron şəbəkələri və ardıcıllıq qrafiki transformasiyasını birləşdirir

Yüksək performanslı çoxlu Lizin posttranslational modifikasiya sahələrini müəyyən etmək üçün hesablama üsulu.

Öyrənmə xüsusiyyətləri protein ardıcıllığından qrafik transformasiyasından istifadə etməklə çıxarılır.

Dərin konvolyusiya neyron şəbəkələri üçün hiperparametrlərin optimallaşdırılması.

Ən müasir üsullarla müqayisədə bizim metodumuz bütün ölçmə ölçülərində əhəmiyyətli irəliləyiş əldə etdi.

Qrafik transformasiya və dərin öyrənmədən istifadə edərək zülal funksiyası proqnozlarını təkmilləşdirə biləcək əlavə tədqiqatlar üçün əsas.


Proteomika və Bioinformatikanın İlnamələri

Md Mehedi Hasan 1* və Mst. Şəmimə Xatun 2

1 Bioelm və Bioinformatika Departamenti, Kyushu Texnologiya İnstitutu, 680-4 Kawazu, Iizuka, Fukuoka 820-8502, Yaponiya
2 Bioinformatika Laboratoriyası, Statistika Departamenti, Racshahi Universiteti, Racshahi, Banqladeş

* Yazışmalar üçün Ünvan: Md. Mehedi Həsən, Kyushu Texnologiya İnstitutu, Bioelm və Bioinformatika Departamenti, 680-4 Kawazu, Iizuka, Fukuoka 820-8502, Yaponiya, E-poçt: [email protected]

Tarixlər: Təqdim edildi: 27 fevral 2018-ci il Təsdiq edildi: 01 mart 2018-ci il Nəşr olundu: 02 mart 2018-ci il

Bu məqaləyə necə istinad etmək olar: Həsən MM, Xatun MS. Protein Post-Tərcümə Modifikasiya yerlərinin proqnozlaşdırılması: Ümumi baxış. Ann Proteom Bioinform. 2018 2: 049-057. DOI: 10.29328/journal.apb.1001005

Müəlliflik hüququ: © 2018 Hasan MM, et al. Bu, Creative Commons Attribution License əsasında paylanmış açıq giriş məqaləsidir və orijinal əsərə lazımi sitat gətirmək şərti ilə istənilən mühitdə məhdudiyyətsiz istifadəyə, paylanmağa və təkrar istehsala icazə verir.


NetPhos 3.1 Server

ATM, CKI, CKII, CaM-II, DNAPK, EGFR, GSK3, INSR, PKA, PKB, PKC, PKG, RSK, SRC, cdc2, cdk5p38MAPK.


QEYD: http://www.cbs.dtu.dk/services/NetPhosK ünvanındakı onlayn xidmət hazırda oflayndır
kinaz xüsusi proqnozlar üçün bu xidmət əvəzinə istifadə edilməlidir.

SİTATLAR

Nəticələri dərc etmək üçün istinad edin:

Eukaryotik zülalların fosforlaşma yerlərinin ardıcıllıq və struktur əsaslı proqnozu.
Blom, N., Gammeltoft, S. və Brunak, S.
Molekulyar Biologiya Jurnalı: 294(5): 1351-1362, 1999.

Kinazın spesifik proqnozları:

Amin turşusu ardıcıllığından zülalların translasiyadan sonrakı qlikosilasiyası və fosforlaşmasının proqnozlaşdırılması.
Blom N, Sicheritz-Ponten T, Gupta R, Gammeltoft S, Brunak S.
Proteomika: İyun 4(6):1633-49, baxış 2004.


Metodlar

PTMselect icmalı

PTMselect proteazların bütün mümkün birləşmələri ilə paralel həzmləri simulyasiya edərək MS analizi ilə zülal modifikasiyasının kəşfinin qlobal əhatə dairəsini yaxşılaşdırmaq üçün optimal proteaz dəstini müəyyən edir. PTMselect ilə dörd növ optimallaşdırma həyata keçirilə bilər:

Qlobal ən azı bir zülal üçün dəyişdirilmiş sayt əhatə dairəsinin kəşfi: bütün dəyişdirilmiş saytlar eyni əhəmiyyətə malikdir və PTMselect ən çox dəyişiklik əldə etmək üçün ən yaxşı həzm parametrlərini hesablayır.

Proqnozlaşdırılıb ən azı bir zülal üçün dəyişdirilmiş sayt əhatə dairəsinin kəşfi: dəyişdirilmək ehtimalı ən yüksək olan dəyişdirilmiş saytlar ən yüksək balları alır. PTMselect, dəyişdirilmə ehtimalı yüksək olan ən çox sayda sayta uyğunlaşdırmaq üçün həzm parametrlərini hesablayır.

Hədəflənmiş ən azı bir protein üçün dəyişdirilmiş sayt kəşfi: hədəf modifikasiya mövqelərinin siyahısı hər bir protein üçün istifadəçi tərəfindən verilir. PTMselect siyahılarda ən çox dəyişdirilmiş saytların və ya hədəflənmiş zülalların ümumi sayının, yəni ən azı bir hədəf modifikasiyası olan zülalların aşkarlanmasını optimallaşdırır.

Son variant birləşməkdir qlobal, proqnozlaşdırdıhədəflənmişdir istənilən sayda zülal və istənilən modifikasiya üçün optimallaşdırma.

PTMselect həzm parametrinin dəyişdirilmiş peptidlərini uzunluqlarına görə seçir və ya rədd edir. Həqiqətən, arasında bir uyğunsuzluq silisiumda uğurlu kütləvi spektrometriya üçün triptik peptid paylanması və optimal peptid uzunluğu həmişə müşahidə olunur 5 . PTMselect standart olaraq 7-40 amin turşusu peptid uzunluğu ilə simulyasiyalar həyata keçirir ki, bu da bizim və digər təcrübələrimizdə MS tərəfindən insan hüceyrə analizi üçün yaxşı ilkin parametrdir 5 . Bu diapazon istifadəçi tərəfindən tənzimlənə bilər.

PTMselect istifadəlilik

PTMselect istifadəyə yararlılıq və sürət nəzərə alınmaqla hazırlanmışdır.

PTMselect əsas təlimatı (əlavə video PhosphoSelect_Basic_Tutorial_and_Install_v3.mp4) göstərir ki, PTMselect bir neçə dəqiqə ərzində MS Windows-da quraşdırıla bilər. İstifadəçinin əsas vəzifəsi protein Fasta fayllarını yükləmək, sonra PTMselect-i işə salmaq və simulyasiya etmək üçün paralel həzmlərin sayını daxil etməkdir.

PTMselect qabaqcıl dərsliyi (əlavə video VideoTutorial2_TCRpathway_v3.mp4) göstərir ki, bütün siqnal yolunu tənzimləyən fosforlaşmaların aşkarlanması üçün ən yaxşı həzm parametrlərinin simulyasiyası da asandır. Bütün protein fasta faylları fasta qovluğuna kopyalanır və hədəf fosfosit faylları protein ardıcıllığında hədəf saytlarının mövqeləri ilə sadə mətn fayllarıdır. Nəticələr saniyələr ərzində əldə edilir.

PTM daşıyan amin turşuları asanlıqla dəyişdirilə bilər. Çoxlu modifikasiya yerlərinin aşkarlanmasının eyni vaxtda optimallaşdırılmasına imkan verən qeyri-məhdud sayda amin turşuları hədəfə alına bilər.

PTMseçmə alqoritmi

PTMseçmə girişi

PTMselect zülalların ardıcıllığını FASTA formatında emal edir (Şəkil 1a). PTMselect tərəfindən isteğe bağlı olaraq iki əlavə fayl növü yüklənə və işlənə bilər:

Dəyişdirilmiş mövqeləri olan proqnoz cədvəlləri və onların proqnoz balları. Bu cədvəllər istənilən proqnozlaşdırma alətindən əldə edilə bilər. PTMselect defolt olaraq PhosphoPICK 11 ilə uyğun gəlir. Müəyyən bir peptidin hər bir fosfoziti üçün PTMselect peptidin qlobal proqnozlaşdırılan xalını hesablamaq üçün PhosphoPICK-in fosfoziti “birləşdirilmiş xalını” cəmləyir.

Hədəf modifikasiyası sayt mövqelərinin siyahıları. Bu siyahılar bioloqun layihəsi üçün məcburi olan məlum modifikasiya yeri mövqelərini ehtiva edən mətn fayllarıdır, məsələn, siqnal yolunda iştirak edən fosfositlər (Şəkil 1c).

Siliko zülalının həzmində və peptid filtrində

PTMselect istifadəçidən simulyasiya etmək istədiyi paralel həzmlərin maksimum n sayını daxil etməyi xahiş edir. PTMselect birindən ([1], [2]. [1, 2], [1, 3]..) başlayaraq n proteazın bütün kombinasiyalarını hesablamaqla başlayır. Sonra, hər bir birləşmə üçün yerinə yetirir silisiumda proteinin paralel həzm edilməsi. PTMselect standart olaraq 8 proteaz və CNBr istifadə edir. Lazım gələrsə, bu siyahı azaldıla və ya artırıla bilər. Daha sonra peptidləri dəyişdirmə sahələri olmadan və ya peptid uzunluğu diapazonundan kənarda çıxarır.

Xal hesablanması

PTMselect beş balı hesablayır: maksimal, elektrotransfer dissosiasiya (ETD), toqquşmaya səbəb olan dissosiasiya (CID), proqnozlaşdırılan uyğunlaşdırılmış və proqnozlaşdırılan uyğunsuzluq.

Maksimal xal zülalda dəyişdirilmiş yerlərin ümumi sayıdır.

ETD hesabı həzm və filtrasiyadan sonra peptidlərdəki dəyişdirilmiş sahələrin ümumi sayıdır. Həqiqətən, hər hansı bir labile dəyişdirilmiş sayt birmənalı şəkildə elektro-transfer dissosiasiya 19,20 aid edilə bilər.

CID balı. Dəyişdirilmiş peptidlər toqquşma nəticəsində yaranan dissosiasiya 19,20 ilə təhlil edildikdə, labil dəyişdirilmiş saytlar həmişə birmənalı şəkildə aid edilə bilməz, çünki spektrlərdə tez-tez etibarlı sahəyə məxsus identifikasiyanı 21 pozan böyük neytral itki zirvələri üstünlük təşkil edir. Buna görə də PTMselect CID xalının hesablanmasında mono modifikasiya edilmiş peptidlərə daha çox çəki verir.

N dəyişdirilmiş sahəyə malik peptidin CID balı:

Bütün zülalın hesabı ilə k dəyişdirilmiş peptidlər:

Proqnozlaşdırılan uyğunlaşdırılmış xal həzm və filtrasiyadan sonra seçilmiş bütün peptidlər üçün proqnozlaşdırma proqramı tərəfindən proqnozlaşdırılan hər bir fərdi dəyişdirilmiş sayt xalının cəmidir.

Proqnozlaşdırılan bənzərsiz xal həzm və filtrasiyadan sonra rədd edilən bütün peptidlər üçün proqnozlaşdırma proqramı tərəfindən proqnozlaşdırılan hər bir fərdi dəyişdirilmiş sayt xalının cəmidir.

Nəticə çıxışı

Hər bir proteaz kombinasiyası üçün beş modifikasiya balı (maksimal, ETD, CID, proqnozlaşdırılan uyğun və uyğun olmayan) cədvəldə ixrac edilir. PTMselect həmçinin mono-modifikasiya edilmiş peptidlərin sayını, əlçatan və ya əlçatan olmayan hədəf peptidlərin sayını və hədəf sayt mövqelərinin müvafiq siyahılarını hesablayır. Hər bir proteaz kombinasiyası üçün dəyişdirilmiş peptidləri və modifikasiya yerlərinin mövqelərini əks etdirən qrafik xəritə yaradılır (Şəkil 1d). Hər bir peptid ardıcıllığında və bütün protein ardıcıllığında dəyişdirilmiş saytların təfərrüatları mətn faylında ixrac olunur. PTMselect bütün xalların cəmini hesablamaq üçün limitsiz sayda xal cədvəlini emal edə bilən xülasəni ehtiva edir. Hədəf modifikasiya saytlarından istifadə edildikdə, yekunlaşdırıcı sütun üzrə bir hədəf saytı olan cədvəl qurur. Beləliklə, hansı hədəf saytların proteazlar dəsti ilə müəyyən edilə və ya olmadığını görmək çox asandır.

PTMselect Benchmarks

Simulyasiya müddəti proteazların sayından və zülalın ölçüsündən asılıdır (bax. Əlavə Şəkil S2). Bir CORE i7 prosessoru olan Linux 64 bit iş stansiyasında 14-dən 5 həzm parametri üçün simulyasiya vaxtı, yəni. 2379 proteaz birləşməsinin simulyasiyası, Lamin üçün <6 san və Citron-kinase üçün <12 san.

Paralel proteazların həzmlərinin simulyasiyaları

Protein ardıcıllığı

PTMselect-i qiymətləndirmək üçün altı açıq zülal ardıcıllığından istifadə etdik (Əlavə fayllara baxın). PD-1, p53, Huntingtin, Citron-kinase, Cortactin və Lamin yüksək fosforlaşma səviyyəsinə, ölçü diapazonuna və bioloji aktuallığına görə seçilmişdir. Onların fasta ardıcıllığı UniProt verilənlər bazasından 22 əldə edilmişdir.

Altı zülal üçün PTMselect simulyasiyaları

Paralel proteaz həzmləri p53, PD-1, Huntingtin, Citron-kinase, Cortactin və Lamin üçün PTMselect (8 proteaz + CNBr) ilə təmin edilmiş standart proteazlar siyahısından istifadə edərək simulyasiya edilmişdir. 7 ilə 40 amin turşusu arasında peptid ölçüsü diapazonu ilə beşə qədər paralel həzm simulyasiya edildi (əlavə fayllar).

TCR siqnal yolunun PTMselect məqsədli təhlili

TCR siqnal yolunun zülallarının Fasta ardıcıllığı UniProt verilənlər bazasından 22 endirilib. İstinad 17 və PhosphoSitesPlus veb saytından 23 əldə edilən bu yoldakı zülallar üçün fosfosit mövqeləri. Hər bir protein üçün hədəf sayt mövqelərini ehtiva edən mətn faylı yaradılmış və PTMselect-də giriş kimi istifadə edilmişdir (Şəkil 1a). Fasta faylları və hədəf saytları hər bir zülal üçün hesab cədvəli hazırlamaq üçün PTMselect-də birlikdə işləndi. Hər bir hesab cədvəlində hər hansı həzm parametri ilə müəyyən edilə bilən və müəyyən edilə bilməyən hədəf fosfositlər verilmişdir. Bütün xal cədvəllərinin kombinasiyası xülasə cədvəlində PTMselect xülasəsi (Şəkil 1a) tərəfindən avtomatik olaraq hesablanmışdır. Sonra xülasə cədvəli bütün TCR yolunun (əlavə fayllar) MS analizi üçün ən yaxşı həzm parametrlərini müəyyən etmək üçün azalan qaydada müəyyən edilə bilən hədəf fosfositlərin sayına görə çeşidləndi.

Çarpaz söhbət nümunəsində birdən çox PTM-in PTMselect proqnozlaşdırılması

H3.1 proteininin sürətli ardıcıllığı (Musculus) UniProt verilənlər bazasından 22 əldə edilmişdir. N-terminal metionin ardıcıllıqdan çıxarıldı. Paralel proteaz həzmləri PTMselect (8 proteaz + CNBr) ilə təmin edilmiş standart proteazlar siyahısından istifadə etməklə H3.1 üçün simulyasiya edilmişdir. Eyni peptiddə K9 və K14 asetilləşməsinin çarpaz danışmasını təhlil etmək üçün biz Lys-C, Lys-N və Tripsin üçün buraxılmış parçalanmaların sayını 3-ə təyin etdik. Ximotripsin üçün buraxılmış parçalanmaların sayı 2, V8 üçün bir, Arg-C və Asp-N üçün isə sıfır idi (Əlavə Şəkil S5). Yalnız həm K9, həm də K14 ehtiva edən və K14 ilə bitməyən peptidləri təsdiqləmək üçün (biz hesab etdik ki, Lizin dəyişdirildikdə Lizin asetilasiyası buraxılmış parçalanmaya səbəb olur) müntəzəm ifadə ilə peptid filtrasiyasından istifadə edilmişdir. Daimi ifadə “KSTGGK” peptidləri süzmək üçün istifadə edilmişdir. KSTGGK-dan sonrakı nöqtə peptidlərdə təkcə KSTGGK ardıcıllığının olmadığını, həm də peptidlərin bitmədiyini bildirir. K14.

Kodun mövcudluğu

PTMselect ədədi hesablamalar üçün yüksək performanslı cross-platform Julia dili 24 istifadə edərək hazırlanmışdır. Fayllara (https://sites.google.com/site/fredsoftwares/products/ptm-select) ünvanından daxil olmaq olar. Fosfositlərin əsas və təkmil axtarışını yerinə yetirmək üçün PTMselect-dən istifadə üçün təlimatı əlavə fayllarda tapa bilərsiniz. PTM uyğunluğunu hesablamaq üçün istifadə edilən peptidlərin uyğunlaşdırılması aləti, PepAlign və siyahıların müqayisəsi aləti, nwCompare 25 (https://sites.google.com/site/fredsoftwares/products/pepalign) və (https://sites) ünvanlarında sərbəst mövcuddur. .google.com/site/fredsoftwares/products/nwcompare-julia).


3 Nəticələr

Bu işdə biz 86 insan zülalında 82 zülal cütündən 199 proteinlərarası PTM çarpaz danışıq cütünü əl ilə tərtib etdik (Bölmə 2-də və Əlavə Cədvəl S1-də təfərrüatlara baxın). Hər bir zülalın iştirak etdiyi PTM çarpaz söhbət hadisələrinin sayını hesablayarkən (Əlavə Cədvəl S2), maraqlıdır ki, bir neçə zülalda əksəriyyətdən (orta 4 hadisə), xüsusən də 26 hadisə ilə CDC25C, 22 hadisə ilə CDK1 var. və 16 hadisə ilə AKT1. Həmçinin, bir neçə zülal cütü digərlərinə nisbətən daha çox PTM çarpaz danışıq hadisələrinə malikdir (Əlavə Cədvəl S3), məs. 17 PTM çarpaz danışıq hadisələri ən çox CDC25C və CDK1 arasında baş verir. Biz daha sonra PTM çarpaz söhbətini zülal qarşılıqlı əlaqə şəbəkəsinə təqdim edirik (Əlavə Şəkil S1) və təəccüblü şəkildə aşkar etdik ki, 86 zülaldan 47-si bir alt qrafik təşkil edir, bu da PTM çarpaz söhbətinin hüceyrə siqnalizasiyasında mühüm rolunu təklif edir və tənzimləyici şəbəkə.

3.1 Qalıq səviyyəsində və motiv səviyyəsində ardıcıl təkamül

Ardıcıl təkamül iki amin turşusu arasındakı funksional əlaqəni öyrənmək üçün geniş istifadə olunur, çünki mürəkkəb ekoloji şəbəkələrdə növlər arasında qorunma qarşılıqlı asılılığını təqdim edir (de Juan və b., 2013). Burada, biz həm tək qalıq səviyyəsində, həm də 7-mer motiv səviyyəsində proteinlərarası PTM çarpaz söhbətinin ardıcıl təkamülünü araşdırırıq.

Biz əvvəlcə NHD-dən təxminən 50 onurğalıda iki qalığın birlikdə necə qorunduğunu və ya mutasiya etdiyini ölçmək üçün istifadə etdik. Şəkil 1A, AKT1-də S473 və PHB-də Y114 arasında çarpaz danışıq hadisəsi ilə 20 onurğalıda AKT1 və prohibitinin (PHB) nümunəsini göstərir. Bölmə 2-də təsvir olunduğu kimi, yalnız hər iki zülalın paylaşdığı növlər nəzərə alınır, beləliklə, Carlito syrichta PHB üçün əskik olduğu üçün atılır. Qalan 19 paylaşılan növ üçün 17 növ hər iki PTM qalıqları üçün eyni qorunma vəziyyətinə malikdir (16 birgə qorunan və 1 birgə mutasiyaya uğramış), bu nümunə üçün qalıqların birgə təkamülü xalını 17/19 verir. 199 çarpaz danışıq cütünün 168-i və 11 585 nəzarət cütünün 8574-ü üçün qalıq birgə təkamül balları daha sonra hesablanıb. Qalan 31 çarpaz danışıq və 3011 nəzarət cütlərində bu xüsusiyyət yoxdur, çünki ya zülallardan birində MSA yoxdur, ya da bir və ya iki mövqe dəyişikliyinə icazə verilsə belə, giriş PTM-nin amin turşusu MSA ilə uyğun gəlmir. Bu iki məlumat dəstindəki mövcud nümunələri müqayisə edərək, biz çarpaz danışıq PTM cütlərinin nəzarət PTM cütlərinə nisbətən əhəmiyyətli dərəcədə daha yüksək qalıq birgə təkamülünə malik olduğunu aşkar etdik (ortalama: 0,807 qarşı 0,704, P < 10 − 5, permutasiya testi ilə, Şəkil 1B).

Eyni MSA məlumatlarına əsaslanaraq, biz ardıcıllığın birgə təkamülünü qalıq səviyyəsindən ardıcıl motiv səviyyəsinə qədər genişləndirdik. Protein AKT1 və PHB arasında eyni nümunədə (Şəkil 2A), biz əvvəlcə PTM sahələrini əhatə edən ±3 amin turşularını 7-mer motivi kimi çıxardıq. AKT1-də S473 üçün Dipodomys ordii-də -1 və 0 mövqelərindəki iki qalıq onların insan istinadlarından fərqli idi, ona görə də bu növ üçün motivin qorunması 5/7 = 0,714-dür. Eynilə, biz bu iki zülalda bütün paylaşılan növlər üçün motivin qorunma ballarını əldə edə bilərik və iki motivin qorunma vektorunu təşkil edə bilərik. Sonra ümumi növlərin sayına normallaşdırılmış bu iki motivin qorunma vektoru arasındakı nöqtə hasilinin götürülməsi ilə motivin birgə təkamülü hesabı hesablanır. Qalıq səviyyəsi ilə eyni nümunə dəstlərindən, yəni 168 çarpaz danışıq cütü və 8574 nəzarət cütü, biz aydın şəkildə görürük ki, çarpaz danışıq PTM cütləri də nəzarət dəstinə nisbətən əhəmiyyətli dərəcədə yüksək motivin birgə təkamülünə malikdir (ortalama: 0,754 ilə müqayisədə 0.679, P < 10 − 5 permutasiya testi ilə, Şəkil 2B). Birlikdə, iki nəticə göstərir ki, həm PTM qalıq səviyyəsində, həm də motiv səviyyəsində ardıcıl təkamül zülallar arasında PTM çarpaz söhbətinin yaxşı göstəriciləri ola bilər.

3.2 İnsanda müxtəlif növlər və müxtəlif şərtlər arasında birgə modifikasiya

PTM-lərin funksional əhəmiyyətini təhlil etmək üçün zülal ardıcıllığının qorunmasından istifadənin effektivliyi, ehtimal ki, növlər arasında təxminən PTM qorunma statusu verdiyinə görədir. Beləliklə, çoxsaylı növlər arasında birbaşa və eksperimental olaraq təsdiqlənmiş PTM statusu PTM funksiyalarını və onların qarşılıqlı əlaqəsini öyrənmək üçün çox məlumatlandırıcı ola bilər (Beltrao və b., 2012 Landry və b., 2009). Həqiqətən, əvvəlki araşdırmamızda (Huang və b., 2015), biz göstərdik ki, üç növ arasında modifikasiyaların birgə konservasiyası bir zülal daxilində iki PTM arasında funksional qarşılıqlı əlaqə ilə potensial əlaqəyə malikdir və proteindaxili PTM çarpaz danışmasını proqnozlaşdırmaq üçün istifadə edilə bilər. Burada biz ortaq modifikasiyanı tətbiq edirik Homo sapiens, MusculusRattus norvegicus modifikasiyanın birgə konservasiyasını ölçmək üçün. Huang kimi və b. (2015), birgə modifikasiya iki PTM-nin üç növ üzrə istinad qalıqlarında eyni vaxtda saxladığı nisbəti ölçür. Şəkil 3A üç növdə AKT1 və PHB zülallarında iki PTM cütünün modifikasiya vəziyyətinin nümunəsini göstərir. AKT1-də S473 və PHB-də Y114 arasında çarpaz danışıq cütü insan və siçanda birgə modifikasiya vəziyyətlərinə malikdir və bu, 2/3 birgə modifikasiya balı verir, qeyri-danışıq cütü, AKT1-də S475 və PHB-də S121 , yalnız insanda müştərək modifikasiyaya malikdir, 1/3 bal verir. Baxmayaraq ki, hər iki PTM cütü üç növdə tam birgə qorunan qalıqlara malikdir, birgə modifikasiya səviyyələri fərqlidir və fərqli funksional asılılığı ifadə edə bilər. Burada ədalət naminə bir və ya iki PTM-i PhosphoSitePlus-da insan PTM dəstinə daxil olmayan 13 PTM çarpaz danışıq nümunəsini çıxardıq və nəticədə əlavə təhlil üçün 186 çarpaz danışıq cütü və 11 585 nəzarət cütümüz var. Bu iki nümunə dəstini müqayisə edərək, biz tapdıq ki, növlər üzrə birgə modifikasiya balı nəzarət cütlüklərinə nisbətən çarpaz danışıq cütlərində əhəmiyyətli dərəcədə yüksəkdir (ortalama: 0,429-a qarşı 0,507, permutasiya testi ilə P < 10 - 5, Şəkil 3B ).

Çarpaz söhbət PTM-lərinin növlər üzrə təhlili üzrə birgə modifikasiya. (A) İnsan, siçan və siçovullar arasında ardıcıl düzülmə ilə növlər arasında birgə modifikasiyanın nümayişi. (B) Çarpaz danışıq dəsti (müsbət) və nəzarət dəsti (mənfi) arasında növlər üzrə birgə modifikasiyanın müqayisəsi

Çarpaz söhbət PTM-lərinin növlər üzrə təhlili üzrə birgə modifikasiya. (A) İnsan, siçan və siçovullar arasında ardıcıl düzülmə ilə növlər arasında birgə modifikasiyanın nümayişi. (B) Çarpaz danışıq dəsti (müsbət) və nəzarət dəsti (mənfi) arasında növlər üzrə birgə modifikasiyanın müqayisəsi

Təkamül prosesi ilə yanaşı, bir növdə müxtəlif şərtlərdə modifikasiya vəziyyətinin korrelyasiyası da funksional birliklər təklif edə bilər. Əvvəlki bir araşdırmada, insanda 88 müxtəlif şəraitdə eyni vaxtda dəyişdirilmə meylini hesablayaraq, PTM saytları arasında funksional əlaqələri araşdırmaq üçün birgə baş vermə metodu təklif etdik (Li və b., 2017). Burada, eyni proteom-geniş insan fosforilasiyası verilənlər bazası proteinlərarası PTM cütləri üçün şərtlər arasında birgə modifikasiyanı ölçmək üçün istifadə olunur (daha ətraflı məlumat üçün Bölmə 2-ə baxın). Şəkil 4A 88 şərt üzrə birgə modifikasiyanın iki nümunəsini göstərir: protein FGR üzrə Y412 (tirozin-protein kinaz Fgr) və SLAF1 üzərində Y281 (limfositik aktivləşdirmə molekulu siqnalı) və SHIP2-də S132 arasında nəzarət nümunəsi arasında çarpaz danışıq nümunəsi və SLAF1-də Y281. 88 şərt üzrə onların fosforlaşma statusu (qırmızı: aktiv, mavi: sönmüş) istilik xəritəsində göstərilir, burada biz birgə modifikasiya xallarını hesablaya bilərik, yəni −log10(səh) Fisher dəqiq testində, bu iki nümunə üçün və çarpaz söhbət nümunəsi üçün 12.549 və nəzarət nümunəsi üçün 0.397 var. Bu xüsusiyyət yalnız fosforlaşma-fosforilləşmə cütləri üçün mövcud olduğundan, bizdə yalnız 199 çarpaz danışıqdan 87-si və 11 585 nəzarət PTM cütünün 3040-ı üçün birgə modifikasiya ballarımız var. Yenə də biz görürük ki, çarpaz danışıq cütləri bir çox şəraitdə nəzarət cütlərinə nisbətən açıq-aydın daha yüksək birgə modifikasiya nümayiş etdirir (orta: 1.044-ə qarşı 2.111, permutasiya testi ilə P < 10 − 5, Şəkil 4B) çarpaz danışıq PTM cütlərinin müstəqillik sıfır hipotezini rədd etmək şansı təsadüfi PTM cütlərinə nisbətən daha yüksəkdir. Yuxarıdakı iki təhlil birlikdə, müxtəlif növlər və fərqli şərtlər arasında birgə modifikasiyanın proteinlərarası çarpaz danışıq cütlərini müəyyən etmək üçün proqnozlaşdırıcı xüsusiyyətlər ola biləcəyini ortaya qoyur.

Çapraz danışıq PTM-lərinin müxtəlif şəraitdə təhlili üzrə birgə modifikasiya. (A) İki PTM cütü üçün 88 şərt üzrə birgə modifikasiyanın nümayişi (bütün fosforlaşmalar çarpaz danışır: FGR-də Y412 və SLAF1 nəzarətində Y281: SHIP2-də S132 və SLAF1-də Y281, müvafiq olaraq 12.549 və 0.017 xal əldə etdi). 88 şərtin xüsusi məlumatı Əlavə Cədvəl S2-də verilmişdir. (B) Çarpaz danışıq dəsti (müsbət) və nəzarət dəsti (mənfi) arasında müxtəlif şərtlər balları üzrə birgə modifikasiyanın müqayisəsi

Çapraz danışıq PTM-lərinin müxtəlif şəraitdə təhlili üzrə birgə modifikasiya. (A) İki PTM cütü üçün 88 şərt üzrə birgə modifikasiyanın nümayişi (bütün fosforlaşmalar çarpaz danışır: FGR-də Y412 və SLAF1 nəzarətində Y281: SHIP2-də S132 və SLAF1-də Y281, müvafiq olaraq 12.549 və 0.017 xal əldə etdi). 88 şərtin xüsusi məlumatı Əlavə Cədvəl S2-də verilmişdir. (B) Çarpaz danışıq dəsti (müsbət) və nəzarət dəsti (mənfi) arasında müxtəlif şərtlər balları üzrə birgə modifikasiyanın müqayisəsi

3.3 Zülallar arasında PTM çarpaz söhbətinin inteqrativ proqnozu

Yuxarıda göstərildiyi kimi, proteinlərarası PTM çarpaz danışıq cütləri həm ardıcıllıq səviyyəsində, həm də modifikasiya səviyyəsində təkamül korrelyasiyasını göstərir. Buna görə də, bu dörd xüsusiyyətin zülallar arasında PTM çarpaz danışmasını proqnozlaşdırmaq üçün istifadə edilə biləcəyini soruşuruq. Əvvəlcə dörd xüsusiyyətin hər birinin ayrı-seçkilik gücünü 10 dəfə çarpaz doğrulama ilə sınaqdan keçirdik. Şəkil 5A-da əyri altındakı sahə (AUC) dəyərləri göstərir ki, PTM qalıqları üzərində ardıcıl təkamül ən diskriminativ xüsusiyyətdir (AUC = 0.785) və o, həm də nisbətən aşağı zəngsizliyə malikdir, yəni yalnız 31-dir. 199 çarpaz danışıq və 11 585 nəzarət cütündən 3011-də qalıq birgə təkamül tədbirləri yoxdur. Aşağıdakı xüsusiyyətlər ardıcıllıq motivinin birgə təkamülü (168 çarpaz danışıq nümunəsi, AUC = 0,685) və şərtlər arasında birgə modifikasiyadır (87 çarpaz danışıq nümunəsi, AUC = 0,654). Bunun əksinə olaraq, növlər arasında birgə modifikasiyanın performansı qismən siçan və siçovullarda PTM məlumatlarının natamam olması səbəbindən nisbətən zəif idi (186 çarpaz danışıq nümunəsi, AUC = 0,558). Sonra, bu dörd xüsusiyyətin inteqrasiyasının tək bir xüsusiyyətdən istifadə ilə müqayisədə proqnozu yaxşılaşdıra biləcəyini soruşuruq. Ədalət naminə, biz tək funksiyalı modelləri və inteqrativ modeli müqayisə etmək üçün yalnız 76 çarpaz danışıq nümunəsindən və bütün bu dörd xüsusiyyətə malik 2593 nəzarət nümunəsindən istifadə etdik. Təəccüblü deyil ki, hər bir özəlliklə performans əvvəlki bütün mövcud nümunələrdən istifadə ilə müqayisədə bu kiçik verilənlər bazasında bir qədər azalır (Şəkil 5A və B-də tək xüsusiyyətə baxın). Bununla belə, üç proqnozlaşdırıcı xüsusiyyətin, məsələn, ardıcıl təkamül və şərtlər arasında birgə modifikasiyanın inteqrasiyası ən yaxşı performansa malikdir və tək bir xüsusiyyət (yəni qalıqların birgə təkamülü) ilə AUC-ni 0,756-dan 0,814-ə qədər artırır. Növlər arasında birgə modifikasiyanın məhdud proqnozlaşdırma gücünə görə, bu xüsusiyyət onu əlavə etməklə inteqrativ modeldə performansı yaxşılaşdıra bilmir. Buna görə də, biz inteqrativ modeldə bu xüsusiyyəti buraxırıq.

Fərqli funksiyalar birləşmələrindən istifadə edərək PTM çarpaz danışıq proqnozunun icrasının qiymətləndirilməsi 100 dəfə təkrarlanan çarpaz doğrulama ümumi ROC əyrisini yaratmaq üçün bir araya toplanır. (A) Qiymətləndirmə hər bir xüsusiyyət (birləşmə) üçün bütün mövcud nümunələr üzərində aparılır, çarpaz danışıq nümunələrinin ölçüsü mötərizədə təqdim olunur. (B) Qiymətləndirmə 76 çarpaz söhbət və 2593 nəzarət nümunəsi üzərində aparılır. İxtisarlar: ardıcıllıq qalığının birgə təkamülü (Seq_residue), ardıcıl motivin birgə təkamülü (Seq_motif), növlər üzrə birgə modifikasiya (PTM_növlər), müxtəlif şərtlər üzrə birgə modifikasiya (PTM_şərtlər), hər iki ardıcıllığın birgə təkamülü (Seq hər ikisi), hər ikisi birgə modifikasiya (hər ikisi PTM)

Fərqli funksiyalar birləşmələrindən istifadə edərək PTM çarpaz danışıq proqnozunun icrasının qiymətləndirilməsi 100 dəfə təkrarlanan çarpaz doğrulama ümumi ROC əyrisini yaratmaq üçün bir araya toplanır. (A) Qiymətləndirmə hər bir xüsusiyyət (birləşmə) üçün mövcud olan bütün nümunələr üzrə aparılır. (B) Qiymətləndirmə 76 çarpaz danışıq və 2593 nəzarət nümunəsi üzərində aparılır. İxtisarlar: ardıcıllıq qalığının birgə təkamülü (Seq_residue), ardıcıl motivin birgə təkamülü (Seq_motif), növlər üzrə birgə modifikasiya (PTM_növlər), müxtəlif şərtlər üzrə birgə modifikasiya (PTM_şərtlər), hər iki ardıcıllığın birgə təkamülü (Seq hər ikisi), hər ikisi birgə modifikasiya (hər ikisi PTM)

Şərtlər arasında birgə modifikasiya inteqrativ modelə çox töhfə versə də, çoxlu sayda nümunələr bu atributa malik deyil. Buna görə də, biz PTM cütü namizədlərinin əksəriyyəti üçün yalnız hər iki ardıcıl təkamül xüsusiyyətlərindən istifadə etməyi tövsiyə edirik. Həmçinin, ardıcıllıq xüsusiyyətinin birləşməsi şərtlər arasında birgə modifikasiya ilə müqayisədə ikiqat çarpaz danışıq nümunəsinin ölçüsünü verir (168-ə qarşı 76). Əlavə olaraq, Şəkil 5B göstərir ki, bu kiçik nümunə dəstində həm qalıq, həm də motivin birgə təkamülü inteqrasiyası onların hər ikisinə nisbətən daha yaxşı performans verir, baxmayaraq ki, bu təkmilləşdirmə cüzidir və daha geniş şəkildə araşdırılmalıdır.

3.4 PTM tipli qərəzinin proqnozlaşdırma performansına təsiri

199 zülallararası PTM çarpaz danışıq cütləri arasında 150 cüt iki fosforlaşma sahəsi arasında çarpaz danışıq hadisələridir (Cədvəl 1). Başqa sözlə, tərtib edilmiş çarpaz danışıq dəsti fosforlaşma-fosforilasiya PTM növlərinə meyllidir. Təlim dəstinə daxil edilməyən və ya az təmsil olunan PTM növləri üçün proqnozlaşdırma modelinin istifadə oluna biləcəyi aydın deyil. PTM növlərinin təsirini yoxlamaq üçün biz MBRF modellərini yalnız fosforlaşma-fosforilasiya çarpaz danışıq cütləri (150 çarpaz danışıq dəsti və 7312 nəzarət cütləri) ilə öyrətdik və qalan PTM növlərində (49 çarpaz danışıq cütü) proqnozlaşdırma performansını sınaqdan keçirdik. və 4273 nəzarət cütü). Şəkil 6 fosforilləşmə-fosforilasiya məlumat toplusunun yalnız iki ardıcıl təkamül xüsusiyyətlərinin mövcud olmasına baxmayaraq, digər PTM növləri üçün (AUC = 0,777) proqnozlaşdırıcı olduğunu göstərir. 0,65 həddi ilə yanlış müsbət nisbət 9,7%, həqiqi müsbət nisbət isə 38,5% ola bilər. Bu proqnoz müstəqil bir test kimi ekvivalentdir, zülallararası PTM çarpaz danışıq proqnozlaşdırmaqda metodumuzun gücünü və onun PTM tipli qərəzinə qarşı möhkəmliyini sübut edir.

Qərəzli təlim dəstlərindən istifadə edərək proqnozlaşdırma modelinin möhkəmliyinin qiymətləndirilməsi (fosforilasiya-fosforlaşma verilənlər toplusu). Təlim dəsti kimi fosforlaşma-fosforilasiya verilənlər toplusunu, qalanlarını isə sınaq dəsti kimi istifadə edən MBRF təsnifatçısının ROC əyriləri. Yanlış müsbət nisbət və həqiqi müsbət nisbət müvafiq hədd 0,35, 0,5 və 0,65-dən sonra mötərizədə təqdim olunur.

Qərəzli təlim dəstlərindən istifadə edərək proqnozlaşdırma modelinin möhkəmliyinin qiymətləndirilməsi (fosforilasiya-fosforlaşma verilənlər toplusu). Təlim dəsti kimi fosforlaşma-fosforilasiya verilənlər toplusunu, qalanlarını isə sınaq dəsti kimi istifadə edən MBRF təsnifatçısının ROC əyriləri. Yanlış müsbət nisbət və həqiqi müsbət nisbət müvafiq hədd 0,35, 0,5 və 0,65-dən sonra mötərizədə təqdim olunur.

3.5 PTM-X onlayn server

Əvvəlki zülaldaxili proqnozlaşdırma metodumuzu birləşdirərək, biz zülaldaxili və proteinlərarası PTM çarpaz danışıq proqnozu üçün PTM-X adlı veb server təqdim edirik (http://bioinfo.bjmu.edu.cn/ptm-x/) . Veb saytındakı MBRF proqnozlaşdırma modeli iki növ xüsusiyyət birləşmələri üçün bütün insan çarpaz danışıq və nəzarət cütləri ilə öyrədildi: (i) qalıq və motiv ardıcıllığının birgə təkamülü və (ii) şərtlər arasında birgə modifikasiyanın əlavə edilməsi. İstifadəçilər zülal UniProt qoşulma nömrəsini və zülal ardıcıllıqlarında PTM mövqelərini göstərərək namizəd PTM cütlərini daxil edə bilərlər. Sonra PTM-X serveri mətn faylına yükləmə linki ilə internetdə göstərməklə eyni funksiya birləşmələrindən istifadə edərək hər bir PTM cütü üçün yekun proqnoz nəticəsi verəcək (Əlavə Şəkil S3-dəki nümunəyə baxın). Giriş PTM cütləri, onların proqnoz xalları verilmiş hədddən yüksək olarsa, potensial çarpaz danışıq cütləri kimi qəbul edilə bilər. Ümumiyyətlə, ciddi hədd daha aşağı yalan müsbət nisbət verir, lakin daha yüksək yalan neqativlər verir, daha yumşaq hədd isə daha həssas proqnozlar əldə etmək üçün istifadə edilə bilər. Biz bu proseduru asanlaşdırmaq üçün interfeys təqdim edirik, əgər istifadəçilər veb-səhifədə proqnozlaşdırma xalını klikləsələr, 10-qat çarpaz doğrulamadan ROC əyrisi görünəcək və müvafiq yalan müsbət və doğru müsbət nisbəti proqnozlaşdırma balı ilə göstərəcək. seçilmiş hədd (Əlavə Şəkil S3).


Verilənlər bazası resursları

MS və digər eksperimental üsullar verilənlər bazaları vasitəsilə qlobal şəkildə paylaşılan böyük miqdarda PTM annotasiya məlumatı yaratmışdır (Şəkil 1). Hər bir verilənlər bazası viruslardan insanlara qədər növlərin növünə fərqli diqqət yetirməklə öz xüsusiyyətlərinə malikdir. Fərqli PTM-lərin mürəkkəbliyi və özəlliyi sayəsində heç bir verilənlər bazası PTM tədqiqatı üçün tam və hərtərəfli mənbə təmin edə bilməz [11]. Məsələn, bəzi verilənlər bazaları PhosphoBase [12] və O-qlikobaz [13] kimi müəyyən bir PTM növü haqqında məlumatları ehtiva edir, digərləri isə UniProt [14] və HPRD [15] kimi müxtəlif PTM-lər haqqında məlumatları ehtiva edir. Digər geniş istifadə olunan verilənlər bazaları [16-31] Cədvəl 1-də göstərilmişdir.


Protein PTM saytının proqnozu - Biologiya

Saw Swee Hock İctimai Səhiyyə Məktəbi, Sinqapur Milli Universiteti, Sinqapur
E-poçt: [email protected]

b Genomika və Sistem Biologiyası Mərkəzi, Biologiya Departamenti, Nyu-York Universiteti, Nyu-York, NY 10003, ABŞ

c Molekulyar və Hüceyrə Biologiyası İnstitutu, Elm, Texnologiya və Tədqiqatlar Agentliyi, Sinqapur

Mücərrəd

Tandem kütlə spektrometriyası proteom miqyasında post-translational modifikasiyaları (PTM) aşkar edə bilsə də, bildirilən PTM saytları çox vaxt natamam olur və yalan pozitivləri ehtiva edir. Hesablama yanaşmaları bu məlumat dəstlərini əlavə proqnozlarla tamamlaya bilər, lakin mövcud alətlərin əksəriyyəti tərtibatçılar tərəfindən tək PTM növü üçün əvvəlcədən öyrədilmiş proqnozlaşdırma modellərindən istifadə edir və çevik istifadəçi nəzarəti ilə çoxsaylı PTM-lər üçün geniş miqyaslı toplu proqnozu yerinə yetirmək çətin məsələ olaraq qalır. təlim məlumatlarının seçimi. We developed an R package called PTMscape which predicts PTM sites across the proteome based on a unified and comprehensive set of descriptors of the physico-chemical microenvironment of modified sites, with additional downstream analysis modules to test enrichment of individual or pairs of PTMs in protein domains. PTMscape is flexible in the ability to process any major modifications, such as phosphorylation and ubiquitination, while achieving the sensitivity and specificity comparable to single-PTM methods and outperforming other multi-PTM tools. Applying this framework, we expanded proteome-wide coverage of five major PTMs affecting different residues by prediction, especially for lysine and arginine modifications. Using a combination of experimentally acquired sites (PSP) and newly predicted sites, we discovered that the crosstalk among multiple PTMs occur more frequently than by random chance in key protein domains such as histone, protein kinase, and RNA recognition motifs, spanning various biological processes such as RNA processing, DNA damage response, signal transduction, and regulation of cell cycle. These results provide a proteome-scale analysis of crosstalk among major PTMs and can be easily extended to other types of PTM.


Prediction of S-Sulfenylation Sites Using Statistical Moments Based Features via CHOU’S 5-Step Rule

Post-translation modification (PTM) of cysteine S-sulfenylation sites in protein is important in cellular biology. S-sulfenylation plays a significant role in protein functioning, cell signaling and transcriptional regulation. Cysteine, S-sulfenylation site prediction is crucial in order to interpret the S-sulfenylation molecular mechanisms. In this study, statistical moments based methodology is proposed for cysteine S-sulfenylation site predictions. The system proposed has achieved accuracy far better than current state-of-the-art methods using tenfold cross validations and independent tests. The outcomes from the proposed method revealed that using statistical moments based features could produce more efficient and effective results. For the accessibility of the scientific community, we have developed a GitHub repository for cysteine S-sulfenylation sites prediction system which is freely accessible at https://www.github.com/ahmad-umt/S-Sulfenylation.

This is a preview of subscription content, access via your institution.


Giriş

Post translational modifications (PTMs) are alterations of the primary protein structure, including both new covalent links and cleavage events. Almost every protein in the cell undergoes modification during its lifetime [1] and more than 600 different amino acid modifications are catalogued in UniProtKB [2]. PTMs provide a way to expand the spectrum of protein functions as well as an additional layer for pathway regulation [3]. They are catalyzed by enzymes that identify a specific site in the substrate protein, with a plurality of PTM motifs residing in intrinsically disordered regions in order to facilitate enzyme accessibility [4]. Over the last few years, a deluge of methods have been proposed to predict PTM sites from sequence, for a recent review see e.g. [5]. The reasons for this popularity are broadly twofold. Given the paucity of experimental data for PTMs and their relevance for cellular regulation, there is a legitimate expectation that computational methods should fill in the experimental void. Computational methods can become hypothesis generators for an effective design of PTM experiments. Their implementation is straightforward due to the sequence specificity and peculiar physico-chemical properties of PTM motifs. This simplicity makes PTM prediction from sequence easily accessible to machine learning methods, but also presents several potential pitfalls [6]. In order to be useful for experimentalists, PTM predictors should provide good performance and be robust. Performance should be high enough to limit false positives to a minimum, while ensuring sufficient amount of correct predictions (true positives). Perhaps more importantly, the method should be robust enough to maintain performance across a range of different datasets, as it is often not clear which experimental conditions may introduce biases. On both accounts, PTM predictors may be problematic as they are rarely assessed by independent third parties. Indeed, their ability to identify new modification sites has been questioned [7] and effective results have been obtained only for a few PTM types [5]. The problem of validating machine learning methods has already been raised and best practices have been proposed [6]. Self-reported accuracy may be overestimated, with PTM predictors overfitting and not performing better than random when adopting the wrong training strategy [7]. Generalizing models for PTM site recognition is difficult as the number of experimental observations is low and many new types of motifs are still poorly characterized.

In this work, proline hydroxylation is taken as a case study to answer the question of how useful PTM predictors, especially those trained on small datasets, are to design experiments. Hydroxylation is one of the most abundant PTMs in the cell [8]. However, despite improvements in mass-spectrometry (MS) techniques, likely only a small fraction of all hydroxylated sites has so far been experimentally detected.

Proline hydroxylation (PH) is a PTM carried out by prolyl hydroxylases, catalyzing the addition of a hydroxyl group to the sidechain pyrrolidine ring at the gamma position. This modification is crucial for correct folding of the collagen triple-helix, which contains the conserved xPG motif. PH also plays a crucial role in signaling, in particular in oxygen sensing pathways, angiogenesis [9] and tumor cell proliferation [10, 11]. An example is HIF1α, the main target of the von Hippel-Lindau (pVHL) E3 ubiquitin ligase complex [12]. In normoxia, the prolyl hydroxylase domain-containing enzymes (PHDs) hydroxylate HIF1α, promoting its degradation through pVHL binding [13]. Under low oxygen concentration, the PHDs are inactivated and HIF-1α translocates into the nucleus to activate vascular proliferation and angiogenesis genes [14].

The first hydroxylation predictor [15] was trained to predict only collagen modifications. Several further PH predictors exist as web servers: HydPred [16], PredHydroxy [17], RF-Hydroxysite [18], iHyd-PseAAC [19] and iHyd-PseCp [20]. The latter has not been considered in our analysis as the server proved unstable, with frequent freezes. The stand-alone PH software OH-Pred [21], ModPred [4] and AMS3 [1] are also available. All are potential tools for large-scale analysis, taking only the protein sequence as input. Implementations include standard machine learning algorithms like Support Vector Machines, artificial Neural Networks and Random Forests, as well as alternative techniques like logistic regression and probabilistic classifiers. All methods were trained on SwissProt [22] annotation, with varying strategies to define positive and negative examples and different approaches to evaluate model quality. None of the PH predictors used a real independent dataset for validation, i.e. unaffected from SwissProt biases.

Here, we evaluate PH methods considering separately collagen and signalling examples as well as single proteins versus high throughput mass-spectrometry (MS) experiments. The majority of new hydroxylated prolines (Hyp) come from two MS recently published experiments, one on HeLa cells and another from a large experiment involving multiple tissues and samples [23–25]. These datasets are unseen for the PH predictors being tested, as they were not yet available in public databases when the predictors were trained. The number of MS hydroxylated sites is comparable to the entire SwissProt database and the new datasets allowed us to perform an unbiased blind test. A Naïve HMM predictor trained including MS data has also been implemented to simulate the effect of integrating new examples. The analysis presented here provides a starting point for a critical discussion on the problem of reliably predicting new PTMs.


Videoya baxın: Strategies for Post-translational Modifications PTMs (Iyul 2022).


Şərhlər:

  1. Tumi

    Müdaxilə üçün üzr istəyirəm, başqa bir həll təklif etmək istərdim

  2. Gokus

    Fikriniz faydalı olacaq

  3. Adler

    haqlı deyilsən. Gəlin bunu müzakirə edək.

  4. Raighne

    Bəli ... haqlısan

  5. Torrey

    It is remarkable, this valuable opinion

  6. Doane

    Üzr istəyirəm, amma mənim fikrimcə, səhv edirsən. PM-də mənə yaz.



Mesaj yazmaq