Məlumat

Fasta ardıcıllığından mutasiyaları çıxarın

Fasta ardıcıllığından mutasiyaları çıxarın


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Mənim .fasta formatında çoxlu miqdarda protein ardıcıllığım var və mən bu ardıcıllıqlardan yalnız amin turşusu mutasiyalarını çıxarmaq istərdim ki, sonda belə bir siyahıya sahib olmaq istəyirəm: I456L, W675T , və s. Bunu etmək üçün proqram və ya yol varmı? Minnətdar


ÇEVİRMƏK

Genome2D Genom Alətləri (Dr. Anne de Jong, Molekulyar Genetika, Qroningen Universiteti, Hollandiya) - bu, mənim hər cür analiz üçün getdiyim saytdır. "Genome Tools" altında "Conversions" seçin. .

Galaxy əlçatan, təkrarlana bilən və şəffaf hesablamalı biotibbi tədqiqatlar üçün açıq, veb-əsaslı platformadır. Bu veb server analiz alətlərini, genomik məlumatları, dərslik nümayişlərini, davamlı iş yerlərini və nəşr xidmətlərini istənilən alim üçün əlçatan edir. İstənilən ictimai və ya yerli Galaxy nümunəsinə aid olan geniş istifadəçi sənədləri mövcuddur. Təhlil və faylların qarşılıqlı çevrilməsi üçün geniş çeşidli alətlər təklif edir.

Ardıcıllıqla çevrilmə ( Bioinf @ Bugaco ) - çevirmə alətlərinin böyük dəsti.

Readseq D.G tərəfindən hazırlanmışdır. Gilbert (İndiana Universiteti) EMBL, GenBank və fasta ardıcıllığı formatları daxil olmaqla, ümumi bioloji ardıcıllıq formatlarının seçimi arasında biosekansları oxuyur və çevirir.

EMBOSS Seqret ardıcıllığı oxuyur və yazır (qaytarır). Verilənlər bazalarından ardıcıllıqların çıxarılması, ardıcıllığın göstərilməsi, ardıcıllığın yenidən formatlaşdırılması, ardıcıllığın əks tamamlayıcısının istehsalı, ardıcıllığın fraqmentlərinin çıxarılması, ardıcıllığın işinə çevrilməsi və ya yuxarıda göstərilən funksiyaların hər hansı bir kombinasiyası daxil olmaqla, müxtəlif tapşırıqlar üçün faydalıdır.

Format çeviricisi - Bu proqram müəyyən edilməmiş formatda ardıcıllığı və ya ardıcıllığı (məsələn, düzülmə) daxil edir və ardıcıllığı(ları) istifadəçi tərəfindən müəyyən edilmiş fərqli formata çevirir. Həmçinin *.gbk-ni *.gff3-ə çevirir.

ApolloRNA Convert data - TransTermHP, CRISPRfinder, MOSAIC, PatScan, DARN-in çevrilməsi! (GFF), Apollo tərəfindən oxuna bilən GFF və GAME XML formatında GenBank çıxış məlumatları.

GenBank Trans Extractor GenBank faylını giriş kimi qəbul edir və faylda təsvir edilən protein tərcümələrinin hər birini FASTA formatında qaytarır. GenBank Trans Extractor, DNT ardıcıllığının özündən daha çox DNT ardıcıllığının proqnozlaşdırılan zülal tərcümələri ilə maraqlandığınız zaman istifadə edilməlidir. Sequence Manipulation Suite-in bir hissəsi.

FeatureExtract 1.2L (yüngül) Server - GenBank girişlərindən və digər GenBank format fayllarından intron/ekson strukturu kimi ardıcıllıq və xüsusiyyət annotasiyasını çıxarır. (İstinad: R. Wernersson (2005) Nuclein Acids Res. 33 (Veb server problemi): W567&ndashW569).

Ardıcıllıq redaktoru - DNT və RNT ardıcıllığını çevirir. Antiparalel, tamamlayıcı və tərs ardıcıllıqlar yaradın.

Format çevrilməsi - (tək ardıcıllıq, ardıcıllıq dəsti, düzülmə, ağac, matris, . ) və format avtomatik olaraq tanınır. Nəticə: FASTA, NEXUS, PHYLIP, Clustal, EMBL, Newick, New Hampshire).

GenBank 2 Payet ( P. Lehvark və S. Greiner, Maks-Plank Molekulyar Bitki Fiziologiyası İnstitutu, Almaniya ) - bu son dərəcə faydalı proqram, yenidən işlənmiş GeSeq çıxışını NCBI təqdim etmək üçün tələb olunan Sequin formatına çevirmək üçün nəzərdə tutulmuşdur. Bununla belə, hər hansı xüsusi GenBank faylı GenBank 2 Sequin istifadə edərək NCBI təqdim etmək üçün hazırlana bilər.

JaMBW (Heydelberq Avropa Molekulyar Biologiya Laboratoriyası, Almaniya). Java əsaslı Molekulyar Bioloqun Workbench. Ardıcıllıq formatına çevrilməsi üçün Fəsil 1-i seçin (böyük />kiçik T />U tərs və ya tamamlayıcı ardıcıllıq).

Nuklein turşusu ardıcıllığı masajı (Allotron Biosensor Corporation) saxta materialı (rəqəmlər, fasilələr, HTML, boşluqlar) silməklə yanaşı, formatı dəyişir (böyük hərfdən kiçik hərfə, tamamlayıcıya, tərsinə, RNT-ni DNT-yə və üçlüklərə).

çıxarınUpStreamDNA (A. Villeqas, Ontario İctimai Səhiyyə) - Genbank yastı faylını (*.gbk) giriş kimi götürür və tapdığı hər bir CDS-i təhlil edir və əvvəlcədən müəyyən edilmiş DNT-nin yuxarı axını üçün uzunluğunu çıxarır (uzunluq arqument olacaq və başlanğıc kodonu üçün 3 nt daxil olacaq). Çıxış bu yuxarı axın DNT ardıcıllığının FFN faylı olacaq. N.B. bu, yalnız prokaryotik ardıcıllıqlar üçün İŞLƏYİR, çünki o, eukaryotikdə olan Parçalanmaları və ya Qoşulmaları idarə etmir. Bu məlumatlar daha sonra MEME kimi proqramlarla təhlil edilə bilər. Bu proqram müvəqqəti olaraq onlayn olaraq mövcud deyil, lakin onu buradan yükləmək olar.

GenBankı Fastaya çevirin (G. Rocap, Vaşinqton Universiteti, Okeanoqrafiya Məktəbi, ABŞ) - Xüsusiyyət cədvəli olan GenBank formatlı faylı seçin. Tərcümə edilmiş peptid ardıcıllığının, hər bir xüsusiyyət üçün DNT ardıcıllığının və ya bütün qeydin bütün DNT ardıcıllığının çıxarılmasını seçin. Əgər "Peptid Ardıcıllığı"-ni seçsəniz, xüsusiyyət cədvəlinizdə "tərcümə"alt xüsusiyyətləri olmalıdır.

FaBox (Palle Villesen Fredsted, Orhus Universiteti, Danimarka) - Fasta başlıq redaktoru, Fasta başlıq dəyişdiricisi, Fasta ardıcıllığı çıxaran, Fasta ardıcıllığı çıxarıcı, Fasta ardıcıllığı birləşdiricisi, Fasta verilənlər bazası bölücü/bölücü daxil olmaqla onlayn fasta ardıcıllığı alətlər qutusu

FeatureExtract - bu çox faydalı xidmət GenBank girişlərindən və digər GenBank format fayllarından intron/ekson strukturu kimi ardıcıllıq və xüsusiyyət annotasiyasını çıxarır. (İstinad: R. Wernersson. 2005. Nucl. Acids Res. 33 ( Veb Server problemi): W567-W569). Həmçinin 5' və 3' ardıcıllığının çıxarılması mümkündür.

SIGENAE Fasta Clean - SIGENAE AGENAE proqramının İnformasiya Sistemi deməkdir. AGENAE proqramı (Analysis of Breeding Animals&rsquo Genome) damazlıq heyvan genomikası - donuz, toyuq, alabalıq, iribuynuzlu mal-qara, dovşan, qoyun sahəsində tədqiqatların inkişaf etdirilməsi ambisiyasına malik Inra milli proqramıdır.

SeqScrub - FASTA fayl başlıqlarını təmizləyən və xarici verilənlər bazalarından məlumat əlavə edən veb proqramdır. (İstinad: Foley G et al. (2019) BioTechniques 67(2): 50-54).

PAL2NAL - zülalların çoxsaylı ardıcıl düzülməsini və müvafiq DNT (və ya mRNT) ardıcıllığını kodon düzülməsinə çevirən proqramdır. Proqram, hətta daxil olan DNT ardıcıllığının giriş zülal ardıcıllığı ilə uyğunsuzluğu və ya UTR, polyA quyruqları olsa belə, müvafiq kodon ardıcıllığını təyin edir. O, həmçinin psevdogenlərin təhlili üçün uyğun olan giriş hizalanmasında çərçivə sürüşmələri ilə məşğul ola bilər. Nəticədə kodon düzülüşü daha sonra sinonimlərin hesablanmasına məruz qala bilər (dS) və sinonim olmayan (dN) əvəzetmə dərəcələri. (İstinad: Suyama M et al. (2006) Nucl Acids Res 34: W609-W612).

Qarışıq DNT və Sequence Randomizer, öz ardıcıllığı ilə müqayisə etmək üçün ardıcıllığı təsadüfiləşdirməyə imkan verir.


“böyük data”¶ ilə işləmək

“böyük məlumat” termini bir qədər dumanlıdır. Lakin RAM-da (Random Access Memory) saxlanıla bilməyəcək qədər böyük ardıcıllıqla faylları yaratmaq, şübhəsiz ki, mümkündür.

Bu hallarda faylın bir hissəsini və fayl işlənərkən “gəlir” qeydlərini oxumağı bacarmaq lazımdır. Başqa sözlə, bütün faylın məzmunu heç vaxt RAM-da saxlanmır.

FASTA fayllarının işlənməsi ilə bağlı xüsusi halda, fayl üzərində işləyərkən FASTA qeydlərini “gəlir”’ etmək lazımdır. Bu o deməkdir ki, FASTA qeydlərinin böyük siyahısını yaradan və həmin siyahını qaytaran funksiya yarada bilməz. Əksinə, FASTA faylı işlənərkən FASTA qeydləri “verən” olan funksiya yaratmaq lazımdır.

Buna verim açar sözündən istifadə etməklə nail olmaq olar.

Bunu göstərmək üçün hər bir sətirdəki simvolların sayının əsas metrik olduğu mətn faylı olduğunu təsəvvür edin. Aşağıda fayl adını giriş parametri kimi qəbul edən və hər sətirdəki simvolların sayını əks etdirən tam ədədlərin siyahısını qaytaran funksiya var.

Fayl həqiqətən böyük olsaydı, yuxarıdakı funksiya problemlə üzləşərdi. Bunun səbəbi data_collection siyahısı RAM-da saxlanmasıdır. Əgər faylda kompüterin yaddaşından daha çox sətir varsa, funksiyanın çağırılması MemoryError ilə nəticələnəcək.

Necə olur ki, mən böyük faylları açanda MemoryError almıram?

Açıq funksiya əslində faylı oxumur. O, fayl üçün “handle” yaradır (faylın başlanğıcı üçün göstərici).

Fayl tutucusu faylın bütün məzmununu yaddaşa oxuyan read() funksiyasına malikdir. Əgər bu funksiyaya zəng etsəniz və fayl kifayət qədər böyük olsaydı, MemoryError ilə qarşılaşardınız. Bu funksiyanın nadir hallarda istifadə edilməsinin səbəbi budur.

Gəlir ifadəsindən “yield” sətirlərə bir-bir istifadə edən readlines() funksiyasından istifadə etmək daha çox yayılmışdır, buna görə də biz böyük faylları emal edə bilərik.

Fayl sapını for döngəsinə yerləşdirməklə faylı sətir-sətir emal etmək də mümkündür. Daha sonra fayl idarəsi hər dəfə bir sətir çıxararaq yığılmış “iterator” kimi davranır.

Aşağıda bütün məlumat strukturunun RAM-da saxlanması zərurətindən yayınaraq, xətlərin işləndiyi zaman onların uzunluqlarını “verməklə” bu problemi aradan qaldıran funksiya verilmişdir.

Bu praktikada necə istifadə edilə bilər? Nəticələri fayla yazmaq praktiki tətbiqdir. Buna aşağıdakı koddan istifadə etməklə nail olmaq olar.


Hədəf auditoriyası

Məzunlar, aspirantlar və yeni nəsil ardıcıllıq platformalarından (Illumina fokusunda) məlumatların təhlili ilə işləyən və ya başlamaq üzrə olan PI-lər. İstinad genomu tələb olunur.

İştirak üçün ilkin şərtlər:

Linux mühiti və S, R və ya Matlab ilə əsas tanışlıq. İştirak etməzdən əvvəl aşağıdakı sadə Linux və R dərsliklərini tamamlayıb başa düşməyi bacarmalıdır:

Siz həmçinin simsiz internet imkanlı öz noutbuk kompüterinizə ehtiyacınız olacaq. Minimum tələblər: 1024x768 ekran ayırdetmə qabiliyyəti, 1,5 GHz CPU, 1 GB RAM, Windows, Mac OS X və ya Linux-un son versiyaları (Son 3-4 ildə alınmış kompüterlərin əksəriyyəti, ehtimal ki, bunlara cavab verir. tələblər). Əgər öz kompüterinizə çıxışınız yoxdursa, siz CSHL-dən bir kompüter icarəyə götürə bilərsiniz. Laptop tələb etmək üçün əvvəlcədən CSHL ilə əlaqə saxlayın.”

Əlavə məzmunu seminar səhifəsində tapa bilərsiniz.


Fasta ardıcıllığından mutasiyaları çıxarın - Biologiya

sadə və gziplənmiş FASTA/Q faylından ardıcıllığa sürətli təsadüfi giriş üçün möhkəm python modulu

Pyfastx, istifadəçilərə sadə və ardıcıl ardıcıllıqlara təsadüfi daxil olmaq imkanı verən yüngül Python C uzantısıdır. gzipped FASTA/Q faylları. Bu modul istifadəçilər üçün FASTA-dan ardıcıllığı çıxarmaq və FASTQ-dan identifikator və indeks nömrəsi ilə oxumaq üçün sadə API təmin etmək məqsədi daşıyır. Pyfastx, həddindən artıq yaddaş istehlak etməmək üçün təsadüfi giriş üçün sqlite3 verilənlər bazası faylında saxlanılan indekslər quracaq. Bundan əlavə, pyfastx standartı təhlil edə bilər (ardıcıllıq eyni uzunluqda çoxlu sətirlərə yayılır) və qeyri-standart (ardıcıllıq müxtəlif uzunluqda bir və ya bir neçə sətirə yayılır) FASTA formatı. Bu modul sadə FASTA/Q faylını təhlil etmək üçün klib layihəsində @attractivechaos tərəfindən yazılmış kseq.h və təsadüfi giriş üçün gziplənmiş faylı indeksləşdirmək üçün indexed_gzip layihəsində @pauldmccarthy tərəfindən yazılmış zran.c-dən istifadə etmişdir.

Bu layihə @mdshw5-in pyfaidx layihəsindən və @brentp-in pyfasta layihəsindən çox ilhamlanıb.

  • Python uzantısı üçün tək fayl
  • Yüngül, FASTA/Q faylını təhlil etmək üçün səmərəli yaddaş
  • Gziplənmiş FASTA/Q faylından ardıcıllığa sürətli təsadüfi giriş
  • FASTA faylından ardıcıllığı sətir-sətir oxuyun
  • FASTA faylında N50 və L50 ardıcıllıqlarını hesablayın
  • GC tərkibini və nukleotidlərin tərkibini hesablayın
  • Əks, tamamlayıcı və antisens ardıcıllığı çıxarın
  • Əla uyğunluq, qeyri-standart FASTA faylını təhlil etmək üçün dəstək
  • FASTQ keyfiyyət hesabının çevrilməsinə dəstək
  • FASTA/Q faylını bölmək üçün komanda xətti interfeysi təmin edin

Hazırda pyfastx Python 3.5, 3.6, 3.7, 3.8, 3.9-u dəstəkləyir. Başlamazdan əvvəl həm pip, həm də Python quraşdırdığınızdan əmin olun.

Python Paket İndeksi (PyPI) vasitəsilə pyfastx quraşdıra bilərsiniz.

Pyfastx kseq.h üçün fasta/q faylında ardıcıllıqlar və ya oxunuşlar üzərində təkrarlamaq üçün sadə və sürətli piton bağlamasını təmin edir. FASTX obyekti müxtəlif dəstləri qaytarmaq üçün daxiletmə ardıcıllığı formatını (fasta və ya fastq) avtomatik aşkarlayacaq.

FASTX obyektində ardıcıllıqlar üzərində təkrarlanan zaman bir dəst (ad, ardıcıllıq, şərh) qaytarılacaq, şərh birinci boşluq simvolundan sonra başlıq xəttinin məzmunudur.

FASTX obyektində oxunuşları təkrarlayanda bir dəst (ad, ardıcıllıq, keyfiyyət, şərh) qaytarılacaq, şərh birinci boşluq simvolundan sonra başlıq xəttinin məzmunudur.

Sadə və ya gzipli FASTA faylını oxuyun və indeks yaradın, FASTA-ya təsadüfi giriş üçün dəstək.

Tikinti indeksi bir neçə dəfə çəkə bilər. İndeksin qurulması üçün tələb olunan vaxt FASTA faylının ölçüsündən asılıdır. İndeks qurulubsa, siz FASTA faylındakı istənilən ardıcıllığa təsadüfi daxil ola bilərsiniz. Növbəti dəfə FASTA faylından ardıcıllığı oxuduğunuz zaman vaxta qənaət etmək üçün indeks faylı təkrar istifadə edilə bilər.

Sadə və ya gziplənmiş FASTA faylını indeks yaratmadan təkrarlamağın ən sürətli yolu, iterasiya ad və ardıcıllığı ehtiva edən dəstini qaytaracaq.

Siz həmçinin FASTA obyektindən ardıcıllıq obyektini belə təkrarlaya bilərsiniz:

build_index ilə iterasiya=True (defolt) ardıcıllığın atributlarına daxil olmağa imkan verən ardıcıllıq obyektini qaytarın. pyfastx 0.6.3-də yeni.

N50 və L50 montajını hesablayın, qayıdın (N50, L50), N50, L50 haqqında ətraflı öyrənin

Uzunluğu >= müəyyən edilmiş uzunluqlu ardıcıllıqların sayını əldə edin

[Başlanğıc, son] koordinatları siyahısından istifadə etməklə, alt ardıcıllıqlar FASTA faylından götürülə bilər.

Bəzən fastanızda çoxlu identifikator və təsviri ehtiva edən uzun başlıq olacaq, məsələn, ">JZ822577.1 contig1 cDNA kitabxanası ağac pionunda çiçək ləçəklərinin cDNA kitabxanası subtractive hibridizasiya Paeonia suffruticosa cDNA, mRNA ardıcıllığı". Bu halda həm "JZ822577.1", həm də "contig1" identifikator kimi istifadə edilə bilər. identifikator kimi birini seçmək üçün açar funksiyanı təyin edə bilərsiniz.


SeqinR¶ istifadə edərək genom ardıcıllığı məlumatlarının alınması

NCBI verilənlər bazasından ardıcıllıq məlumatlarını əldə etmək üçün NCBI veb saytına getmək əvəzinə, SeqinR R paketindən istifadə edərək, NCBI-dən ardıcıllıq məlumatlarını birbaşa R-dən əldə edə bilərsiniz.

Məsələn, yuxarıda NCBI veb saytından NCBI girişi NC_001477 olan DEN-1 Dengue virusu genom ardıcıllığını necə əldə edəcəyinizi öyrəndiniz. Müəyyən bir NCBI qoşulması ilə ardıcıllığı əldə etmək üçün aşağıdakı R funksiyasından istifadə edə bilərsiniz “getncbiseq()”, əvvəlcə R-ə kopyalayıb yapışdırmalı olacaqsınız:

Getncbiseq() funksiyasını R-yə kopyalayıb yapışdırdıqdan sonra siz ondan NCBI Nukleotidlər bazasından ardıcıllığı əldə etmək üçün istifadə edə bilərsiniz, məsələn, DEN-1 Denq virusu (NC_001477 qoşulma):

Dəyişən dengueseq nukleotid ardıcıllığını ehtiva edən vektordur. Vektorun hər bir elementi ardıcıllığın bir nukleotidini ehtiva edir. Buna görə də, ardıcıllığın müəyyən bir ardıcıllığını çap etmək üçün sadəcə vektorun adını yazmalıyıq dengueseq ardınca həmin nukleotidlərin indekslərini ehtiva edən kvadrat mötərizələr. Məsələn, aşağıdakı əmr DEN-1 Dengue virusu genom ardıcıllığının ilk 50 nukleotidini çap edir:

Qeyd edək ki dengueseq[1:50] vektorun elementlərinə aiddir dengueseq 1-50 indeksləri ilə. Bu elementlər DEN-1 Denq virusu ardıcıllığının ilk 50 nukleotidini ehtiva edir.


DNT Sequence Quality - Phred - eyni vaxtda beşə qədər ardıcıllıq üçün əsas çağırış, xromatoqram ekranı və yüksək keyfiyyətli ardıcıllıq bölgəsinin qiymətləndirilməsi və təqdimatı təmin edir.

Ardıcıl montaj - istifadə edə bildiyiniz zaman öz contig montaj proqramına ehtiyacınız yoxdur:

EGassember - orijinal seqmenti və ya geni yenidən qurmaq üçün ov tüfənginin ardıcıllığı və ya gen transkriptləri (EST) fraqmentləri nəticəsində yaranan ardıcıllıq fraqmentlərini düzləşdirir və birləşdirir (İstinad: A. Masoudi-Nejad et al. 2006. Nucl. Acids Res. 34: W459-462).

CGE Assembler 1.2 - Illumina, 454, SOLid və Ion Torrent məlumatlarını toplayır (İstinad: Larsen MV, et al. J. Clin. Micobiol. 2012. 50(4): 1355-1361).
CGE SPAdes 3.9 - Illumina və Ion Torrent məlumatlarını toplayır (İstinad: S. Nurk və başqaları. Hesablama Molekulyar Biologiyada Araşdırma: s. 158-170).

CAP3 (PBIL, Fransa ), (İstinad: Huang,X. & Madan A. 1999. Genome Res. 9: 868-877) və burada.
CAP EST Assembler (Istituto FIRC di Oncologia Molecolare, İtaliya) - Hər ardıcıllıq üçün maksimum ardıcıllıq uzunluğu 30 kb - Maksimum ardıcıllıq sayı 10 kb

MicroScope veb saytı (Genoscope-da yerləşir), ekspert annotasiyası və müqayisəli genomika üçün mühit təmin edir. Genom layihəsi: Bitmiş və ya qaralama genom ardıcıllığının annotasiyası və müqayisəli təhlili. Əvvəlcədən şərh edilmiş ardıcıllıqlar üçün onlar yalnız NCBI RefSeq tam genom bölməsindən annotasiyaları birləşdirir. Metagenom layihəsi: yığılmış metagenomik ardıcıllığın annotasiyası və müqayisəli təhlili. Hal-hazırda, onlar hər qutuda 20 Mb-dan aşağı olan məlumat dəstlərini inteqrasiya edə bilirlər.

NanoPipe - müvafiq düzəliş edilmiş hizalanma parametrlərini təmin edən MinION ardıcıllıq texnologiyalarının xüsusiyyətləri nəzərə alınmaqla hazırlanmışdır. Hizalanma üçün hədəf növlərin/ardıcıllıqların diapazonu məhdud deyil və NanoPipe-in ​​təsviri istifadə səhifəsi istifadəçiyə NanoPipe təhlili ilə uğur qazanmağa kömək edir. Nəticələr hizalanma statistikasını, konsensus ardıcıllığını, polimorfizm məlumatlarını və hizalanmanın vizuallaşdırılmasını ehtiva edir. (İstinad: Shabardina V et al. (2019) Gigascience 8(2). pii: giy169).


COV2HTML: postgenomik həyat alimləri üçün bakterial növbəti nəsil sıralama (NGS) məlumatlarının vizuallaşdırılması və təhlili vasitəsi - həm əhatə dairəsinin vizuallaşdırılmasını, həm də prokaryotik orqanizmlərdə (bakteriyalar və faqlar) həyata keçirilən NGS uyğunlaşmalarının təhlilini həyata keçirməyə imkan verir. O, iki prosesi birləşdirir: nəhəng NGS xəritələşdirmə və ya əhatə dairəsi fayllarını genetik elementlər haqqında məlumatı ehtiva edən yüngül xüsusi əhatə fayllarına çevirən alət və statistik nəticələrin isteğe bağlı inteqrasiyası ilə məlumatların real vaxt rejimində təhlilinə imkan verən vizuallaşdırma interfeysi. (İstinad: Monot M. et al. 2014. OMICS 18(3): 184-95).

DCA Çox Ardıcıllıq Hizalanması ( Universitat Bielefeld, Almaniya) - amin turşusu, RNT və ya DNT ardıcıllığının sürətli, yüksək keyfiyyətli eyni vaxtda çoxsaylı ardıcıl düzülmələri istehsal etmək üçün proqramdır. (İstinad: Brinkmann, G. et al. Mathematical Programming 79: 71-97, 1997).

PhageTerm - təsadüfi parçalanmış NGS məlumatlarından bakteriofaq sonlarını və qablaşdırma rejimini təyin etmək üçün istifadə edilə bilən sürətli və istifadəçi dostu proqram paketidir. O, Galaxy paketinin bir hissəsidir və onu "NGS: Xəritəçəkmə" qovluğunda tapmaq olar. İdeal odur ki, siz avtomatlaşdırılmış cavab istəyirsiniz. (İstinad: Garneau JR, et al. 2017. Sci Rep. 7(1):8292).

QUAST - genom birləşmələrini qiymətləndirmək və müqayisə etmək üçün keyfiyyətin qiymətləndirilməsi vasitəsidir. Bu alət yeni ideyalar və keyfiyyət göstəriciləri ilə aparıcı montaj müqayisə proqram təminatını təkmilləşdirir. QUAST həm istinad genomu ilə, həm də istinadsız birləşmələri qiymətləndirə bilər.QUAST alimlərə tədqiqatlarında və nəşrlərində kömək etmək üçün çoxlu hesabatlar, xülasə cədvəlləri və süjetlər hazırlayır. (İstinad: A. Gurevich et al. 2013. Bioinformatika, 29(8): 1072&ndash1075). N.B. Bu server 2020-ci ilin aprel ayına kimidir, lakin onun yenidən onlayn olacağına ümidlər var (proqram yükləmələri üçün buraya baxın).

Sıralama səhvləri: - DNT ardıcıllığınız gözlənilən zülal ardıcıllığına uyğun gəlmirsə, zülal ardıcıllığını genomik DNT ardıcıllığı ilə müqayisə edən GeneWise (EMBL-EBI) saytında səhvləri yoxlaya bilərsiniz, bu da intronlar və çərçivə dəyişdirmə xətalarına imkan verir. Digər proqramlara aşağıdakılar daxildir:

FrameD ( İstinad: T. Schliex et al. 2003. Nucl. Acids Res. 31: 3738-3741)
AMIGene - mikrob genlərinin annotasiyası (İstinad: Bocs S et al. (2003) Nuklein turşuları Res. 13(31): 3723-3726).
yol :: zülalın geri tərcüməsi və uyğunlaşdırılması - fərqliliyin çərçivə dəyişikliyi mutasiyalarının və əvəzetmələrinin nəticəsi olduğu uzaq protein homologiyalarının tapılması problemini həll edir. İki giriş zülal ardıcıllığını nəzərə alaraq, metod hər bir zülal üçün ehtimal olunan DNT ardıcıllığının tam dəstinin yaddaşdan səmərəli qrafik təsvirlərini manipulyasiya etməklə onları kodlayan DNT ardıcıllığının bütün mümkün cütlərini gizli şəkildə uyğunlaşdırır. (İstinad: Gîrdea M et al. 2010. Molekulyar Biologiya üçün Alqoritmlər 5:)

In-silico.com (Dr. Joseba Bikandi və həmkarları, Bask Ölkəsi Universitetində Əczaçılıq Fakültəsi) - imkan verir silisiumda nəzəri PCR gücləndirilməsi, AFLP-PCR, məhdudlaşdırma analizi və bakterial və arxael genomları ilə impulslu sahə gel elektroforezi [PFGE] daxil olmaqla təcrübələr ictimai verilənlər bazasında tapıldı.

NCBI Prokaryotik Genomların Avtomatik Annotasiya Boru Kəməri. Bu, bakterial genomunuzu tamamilə şərh edəcək və sizə Sequin təqdim faylı təqdim edəcək. N.B. bir NCBI Phage Avtomatik Annotasiya Boru Kəməri inkişaf mərhələsindədir.

RAST (Subsistem Texnologiyasından istifadə edərək Sürətli Annotasiya) bakterial və arxa genomları şərh etmək üçün tam avtomatlaşdırılmış xidmətdir. Bütün filogenetik ağacda bu genomlar üçün yüksək keyfiyyətli genom annotasiyaları təqdim edir. Qeydiyyat tələb edir. (İstinad: Aziz, RK et al. 2008. BMC Genomics 9:75.).

BASys Bakterial Annotasiya Aləti - bu inanılmaz alət bakterial genomik ardıcıllığın avtomatlaşdırılmış, dərin annotasiyasını dəstəkləyir. O, xam DNT ardıcıllığı məlumatlarını və gen identifikasiyası məlumatının isteğe bağlı siyahısını (Glimmer) qəbul edir və geniş mətn annotasiyası və hiperlinkli görüntü çıxışını təmin edir. BASys, gen/zülal adı, GO funksiyası, COG funksiyası, mümkün paraloqlar və ortoloqlar, molekulyar çəki, izoelektrik nöqtə, operon strukturu, hüceyrəaltı lokalizasiya, siqnal peptidləri, transmembran bölgələri, ikincil struktur daxil olmaqla, hər bir gen üçün 60 annotasiya alt sahələrini müəyyən etmək üçün >30 proqramlarından istifadə edir. , 3D quruluşu, reaksiyaları və yolları. (İstinad: G.H. Van Domselaar et al. 2005. Nucl. Acids Res. 33(Veb server problemi): W455-W459).

MicroScope - (CEA, Institut de Génomique - Genoscope, Fransa) COG analizi, müqayisəli genomika da daxil olmaqla geniş çeşidli alətlərə çıxışı təmin edən mikrob genomu annotasiyası və təhlili platformasıdır. (İstinad: Vallenet D et al. (2017) Nuklein turşuları Res. 45(D1): D517-D528). Qeydiyyat tələb edir.

MAKER Veb Annotasiya Xidməti (MWAS) asanlıqla konfiqurasiya edilə bilən veb-əlçatan genom annotasiya boru kəməridir. Məqsədi kiçik və orta miqdarda eukaryotik və prokaryotik genom ardıcıllığına (yəni, BAC klonları, kiçik bütöv genomlar, ilkin ardıcıllıq məlumatları və s.) malik tədqiqat qruplarına öz məlumatlarını müstəqil şəkildə şərh etmək və təhlil etmək və yüklənə bilən məhsul istehsal etmək imkanı verməkdir. genom verilənlər bazasına daxil edilir. (İstinad: Holt, C. & Yandell, M. 2011. BMC Bioinformatika 12:491).

MITOS - boru kəməri Metazoan mitoxondrial genom ardıcıllığının ardıcıl və yüksək keyfiyyətli de novo annotasiyasını təmin etmək üçün nəzərdə tutulmuşdur. MITOS nəticələrinin annotasiya əhatə dairəsi və keyfiyyət baxımından RefSeq və MitoZoa ilə uyğunlaşdığını göstəririk. Eyni zamanda, biz əl ilə kurasiya strategiyalarından qaynaqlanan qərəzlərdən, nomenklaturanın uyğunsuzluğundan və yazı xətalarından qaçırıq. (İstinad: M. Bernt et al. 2013. Molecular Phylogenetics & Evolution 69:313-319).

GenSAS - Genome Sbərabərlik Aqeyd etmə Server - çoxlu struktur və funksional annotasiya vasitələrini işə salmaq üçün vahid qrafik interfeysi olan bir pəncərəli veb saytı təmin edir, genom ardıcıllığının vizuallaşdırılmasına və əl ilə kurasiyasına imkan verir. İstifadəçilər ardıcıllıqları öz hesablarına yükləyə və gen proqnozlaşdırma proqramlarını, zülal homologiyası axtarışlarını, xəritə EST-ləri işlədə, təkrarları, ORF-ləri və SSR-ləri fərdi parametr parametrləri ilə müəyyən edə bilərlər. Xüsusiyyətlərin son annotasiyasını seçmək və GBrowse kimi genom brauzerlərinə yükləmək üçün gff3 faylları yaratmaq üçün hər bir analiz qrafik interfeysin ayrı-ayrı treklərində xüsusi redaktə izləri ilə göstərilir. Bu Drupal əsaslı proqram təminatından istifadə edərək əlavə proqramlar asanlıqla əlavə edilə bilər.

Viral Genom ORF Reader (VIGOR) - yüksək ötürmə qabiliyyətinin proqnozlaşdırılmasını və annotasiyasını dəstəkləyir. VIGOR xarici strategiyadan istifadə edir və sınaqdan keçirdiyimiz RNT viral genomları üçün 98%-dən çox həssaslıq və spesifikliyə malikdir. VIGOR tərəfindən müəyyən edilmiş genomun spesifik xüsusiyyətlərinə çərçivə dəyişikliyi, ribosom sürüşməsi, RNT redaktəsi, kodon oxunmasının dayandırılması, üst-üstə düşən genlər, daxil edilmiş genlər və yetkin peptid parçalanma sahələri daxildir. Qrip və rotavirus üçün genotipləmə qabiliyyəti proqrama daxil edilmişdir.
(İstinad: S. Wang et al. 2011. BMC Bioinformatics 2010, 11:451)

FLAN (FLu ANnotation) qrip virusunun genom annotasiyası üçün NCBI veb serveridir, istifadəçi tərəfindən təmin edilən qrip A virusu və ya B qrip virusu ardıcıllığı üçün bir vasitədir. O, giriş qripi ardıcıllığı ilə kodlanmış zülal ardıcıllığını təsdiq edə və proqnozlaşdıra bilər. (İstinad: Y. Bao et al. 2007. Nucleic Acids Res. Web Server məsələsi) 35: W280-W284.)

CpGAVAS ( Chlorosəhsonuncu Genom Aqeyd etmə, Vizalizasiya, Aanaliz və GenBank Submission Tool) - xloroplast genomunun dəqiq annotasiyasına, dairəvi xəritələrin yaradılmasına, annotasiya edilmiş genomun faydalı analiz nəticələrinin verilməsinə, birbaşa GenBank-a təqdim edilə bilən faylların yaradılmasına imkan verir. (İstinad: C. Liu et al. 2012. BMC Genomics 13: 715)

Genom Aqeyd etmə Tköçürmək Utility (GATU) çox yaxından əlaqəli istinad genomuna əsaslanan bir genomu şərh edir. İstinad genomunun zülalları/yetkin peptidləri şərh ediləcək genomda genləri/yetkin peptidləri tapmaq üçün qeyd olunacaq genomla BLASTED olunur (İstinad: T. Tcherepano v et al. 2006. BMC Genomics 7:150.)

BioGPS (Scripps Araşdırma İnstitutu, ABŞ) - istifadəçinin fərdiləşdirilə biləcəyini və ictimaiyyətin genişlənməsini vurğulayan bir pəncərəli gen annotasiya portalıdır. Bu, fərdiləşdirilə bilən gen annotasiya portalıdır və gen və zülal funksiyası haqqında öyrənmək üçün tam mənbədir.

BAGEL (Qroningen Biomolekulyar Elmlər və Biotexnologiya İnstitutu, Haren, Hollandiya) - mövcud və ya təqdim edilməmiş GenBank faylından bakteriosinlərin mövcudluğunu məlum bakteriosinlər və bakteriosin aktivliyində iştirak edən bitişik genlər haqqında məlumat ehtiva edən verilənlər bazası əsasında müəyyən edəcək. Bakteriosinlər üçün alternativ yer bakteriosin təbii antimikrob peptidlərinin məlumat anbarı olan BACTIBASE-dir. Görmək . Əgər Laktik Turşu Bakteriyaları (LAB) və onun bakteriosinləri mövzusu ilə maraqlanırsınızsa, LABioicin.

MICcheck (krob genomu Yoxlayıner) - əvvəllər dərc edilmiş bakterial genomlarda və ya istifadəçinin *.gbk faylı olan genomlarda qeyd edilmiş genlər dəstlərinin və çərçivə sürüşmələrinin sürətli yoxlanılmasına imkan verir. Bu alət, çatışmayan və ya yanlış annotasiya edilmiş genləri tez yoxlamaq üçün funksional yenidən annotasiya addımından əvvəl ilkin addım kimi görünə bilər. 43-135 kb arasında olan faj genomları ilə gözəl işləyirdi. (İstinad: S. Cruveiller et al. 2005. Nucl. Acids Res. 33: W471- W479).

WebGeSter - Gead Süçün konserv Terminators - mənim sevimli terminator axtarış proqramı nəhayət internetə qoşuldu. Nəzərə alın ki, *.gbk faylından məlumatları təhlil etmək istəyirsinizsə, əvvəlcə onların "GenBank2GeSTer" çevirmə proqramından istifadə etməlisiniz. Diaqram daxil olmaqla hər bir terminatorun tam təsviri bu proqram tərəfindən hazırlanır. Bu sayt bakterial genomda (WebGeSTer DB) transkripsiya terminatorlarının geniş məlumat bazası ilə əlaqələndirilir (İstinad: Mitra A. et al. 2011. Nucl. Acids Res. 39(Verilənlər bazası məsələsi):D129-35).

RibEx: qabırğaaçar Məsplorer - potensial genlər (BLASTP ilə əlaqəli) və riboswitchlər də daxil olmaqla bir neçə yüz tənzimləyici element üçün <40kb DNT-ni skan edir. Əgər siz "atenuators üçün axtarış" üzərinə klikləsəniz, o, terminatorları və antiterminatorları tapır. O, NCBI-də kapkulyasiya edilmiş genləri və perits BLAST analizini təqdim edir (İstinad: C. Abreu-Goodger və E. Merino. 2005. Nucl. Acids Res. 33: W690-W692).

tRNAs: tRNAscan-SE - inanılmaz dərəcədə həssasdır və həmçinin tRNA molekullarının ikinci dərəcəli struktur diaqramlarını təqdim edir (İstinad: Schattner, P. et al. 2005. Nucleic Acids Res. 33: W686-689). Alternativ olaraq ARAGORN istifadə edin (İstinad: Laslett, D. & Canback. 2004. Nuklein turşularının tədqiqatı 32:11-16).
Test ardıcıllığı.

LTR_Finder - genom ardıcıllığında tam uzunluqlu LTR retrotranspsonlarını tapmaq üçün effektiv proqramdır. Daxiletmə faylının ölçüsü indi 50MB ilə məhdudlaşır (İstinad: Z. Xu & H. Wang. 2007. Nucl. Acids Res.35(Veb server problemi): W265-W268).
RTAanalyzer - retrotranspozonları tapır və L1 retrotranspozisiya imzalarını aşkar edir (İstinad: J-F. Lucier et al. 2007. Nucl. Acids Res. 35(Veb Server məsələsi): W269-W274

MG-RAST (Metagenom Rapid Anotation istifadə edərək Saltsistem Technology) metagenom nümunələrini şərh etmək üçün tam avtomatlaşdırılmış xidmətdir. O, ardıcıl fraqmentlərin annotasiyasını, onların filogenetik təsnifatını və ilkin metabolik rekonstruksiyanı təmin edir. Xidmət həmçinin filogenetik təsnifatların və metagenomların metabolik rekonstruksiyalarının müqayisəsi üçün vasitələr təqdim edir (İstinad: F. Meyer et al. 2008. BMC Bioinformatika 9: 386).

Fag zülallarını proqnozlaşdırmaq üçün aşağıdakı dörd proqramdan istifadə edilə bilər:

PVPred ( İstinad: Ding H et al (2014) Mol Biosyst 10(8): 2229-2235).
PHPred ( İstinad: Ding H (2016) Kompüterlər Biol Med 71: 156&ndash161).
PVP-SVM ( İstinad: Manavalan B et al. (2018) Front Microbiol 9: 476).
PVPred-SCM ( İstinad: Charoenkwan P et al. (2020) Hüceyrələr 9(2) pii: E353.

Xromosom replikasiyasının mənşəyi:

Ori-Finder və Ori-Finder 2 - müvafiq olaraq bakterial və arxeal genomlarda replikasiya mənşəyinin (orCs) identifikasiyası və təhlili üçün faydalı platformalardır. (İstinad: Luo H və başqaları (2019) Qısa Bioinform 20(4): 1114-1124). Nəzərə alın ki, bu vasitələrdən DoriC - xromosomlar və plazmidlər də daxil olmaqla prokaryotik genomlarda replikasiya mənşələrinin məlumat bazası yaratmaq üçün istifadə edilmişdir. (İstinad: Luo H & Gao F (2019) Nuklein Turşuları Res. 47(D1): D74-D77).

GenBank ilə bağlı problemlərdən biri də alimlərin təqdim etdikləri məlumatı yeniləməmələri və səhvləri düzəltmələridir. Bu qismən tənbəllikdən irəli gəlir, həm də GenBank-ın əksər hallarda Sequin faylının yeni versiyasını qəbul etmək istəməməsi ilə bağlıdır. Tbl2asn GenBank-a təqdim etmək üçün ardıcıl qeydlərin yaradılmasını avtomatlaşdıran komanda xətti proqramıdır, lakin mənim fikrimcə, istifadəsi asan deyil. Yeganə onlayn proqram GenBank 2 Sequin-dir ki, o, yalnız Sequin faylını (*.sqn) deyil, həm də beş sütunlu "Annotasiya Cədvəli" (*.tbl) yaradır. Bu, fasta formatlı DNT ardıcıllığı ilə birlikdə GenBank-a e-poçt ( [email protected] ) vasitəsilə təqdim edilə bilər. Bu olmadıqda, burada yükləmək üçün gbf2tbl.pl perl skriptini tövsiyə edirəm.


PlasmidFinder 1.3 - bakteriyaların ümumi və ya qismən ardıcıl izolatlarında plazmidləri müəyyən edir. Metod əsas uyğunsuzluq (Inc) qruplarına aid plazmidlərin replikonlarının müəyyən edilməsi üçün BLAST-dan istifadə edir. Enterobacteriaceae. Giriş kimi, metod həm əvvəlcədən yığılmış, tam və ya qismən genomlardan, həm də dörd müxtəlif ardıcıllıq platformasından qısa ardıcıllıq oxunuşlarından istifadə edə bilər. Həmçinin baxın pMLST ( İstinad: Carattoli A et al. 2014. Antimicrob. Agents Chemother. 58: 3895-903)

PHACTS bir faqın həyat tərzini (mülayim və ya litik) tez təsnif etmək üçün istifadə edilə bilər. Tələb olunanların hamısı təsnif ediləcək faqın proteomudur və PHACTS həmin faqın həyat tərzini proqnozlaşdıracaq və bu proqnoz üçün etimad dəyərini qaytaracaq. (İstinad: K. McNair et al. 2012. Bioinformatika 28: 614-618).

SpeciesFinder 1.0 (Danimarka Texniki Universiteti) - əvvəlcədən yığılmış, tam və ya qismən genomlardan bakteriyaların növlərini proqnozlaşdırır və qısa ardıcıllıqla oxuyur. Proqnoz 16S rRNT geninə əsaslanır.

CSI Phylogeny 1.1 (Call SNPs & Infer Phylogeny) - SNP-ləri çağırır, SNP-ləri süzür, saytın yoxlanışını həyata keçirir və yüksək keyfiyyətli* SNP-lərin birləşmiş uyğunlaşmasına əsaslanan filogeniya çıxarır. (İstinad: Kaas, R.S. et al. PLoS ONE 2014 9: e104984.)

KmerFinder 2.0 &ndash əvvəlcədən yığılmış, tam və ya qismən genomlardan bakteriya növlərini proqnozlaşdırır və qısa ardıcıllıqla oxuyur. Proqnoz verilənlər bazasındakı istinad bakteriyalarının genomları ilə istifadəçinin təqdim etdiyi genom arasında birgə baş verən k-merlərin (DNT ardıcıllığı məlumatında k nukleotidin alt sətirləri, bu halda 16-mers) sayına əsaslanır. (İstinad: Hasman H et al. 2013. J Clin Microbiol. 52:139-146)

VIOLIN: Peyvəndin Tədqiqi və Onlayn İnformasiya Şəbəkəsi - müxtəlif insan patogenləri arasında peyvəndlə bağlı tədqiqat məlumatlarının asan kurasiyasına, müqayisəsinə və təhlilinə imkan verir. peyvənd tədqiqatı və inkişafı üçün bioinformatika vasitələri. VBLAST: Peyvənd Tədqiqatı üçün Xüsusi BLAST Axtarışı 34 patogenin 77 genomuna qarşı müxtəlif axtarış strategiyalarına imkan verir. (İstinad: He, Y. et al. 2014. Nucleic Acids Res. 42 (Verilənlər bazası məsələsi): D1124-32).

MLST 1.8 (MultiLocus Sequence Typing) - hazırda yalnız yığılmış genomlar və kontiglərlə işləyir (İstinad: Larsen MV et al. 2012. J. Clin. Micobiol. 50: 1355-1361).

ECFfinder - ekstrasitoplazmik funksiya (ECF) siqma faktorları - alternativ siqma amillərinin ən böyük qrupu - bakterial siqnal ötürülməsinin üçüncü fundamental mexanizmini təmsil edir, hər bakterial genomda orta hesabla altı belə tənzimləyici var. Onların qohum anti-siqma amilləri ilə birlikdə, onlar ilk növbədə transmembran siqnal ötürülməsini asanlaşdıran yüksək modul dizaynı təmsil edirlər. (İstinad: Staron A et al. (2009) Mol Microbiol 74(3): 557-581).

BacWGSTdb - mühüm bakterial patogenlərin yaranması və yayılmasının monitorinqi üçün nəzərdə tutulmuşdur. Ətraflı olaraq, o, iki xüsusi məqsədə xidmət edir: Yazma və İzləmə. Birincisi həm ənənəvi multi-locus sequence typing (MLST) və bütöv genom ardıcıllığı tipləmə (WGST) səviyyəsində inteqrasiya olunmuş genotipləşdirməyə aiddir. Sonuncu, yazmaq nəticəsinə görə mənbə izlənməsinə (yəni, çox oxşar təcridlərin tapılması) aiddir və BacWGSTdb-də saxlanılan məlumatları təcrid edir. (İstinad: Z. Ruan 7 Y. Feng, Nuclein Acids Research. 2016 44(D1): D682-D687).

SISTR: Salmonella In Silico Tyazmaq Rmənbə - (Kanada İctimai Səhiyyə Agentliyi, Qida ilə yoluxan zoonozlar laboratoriyası) qaralama bakterial genom birləşmələrindən çoxlu Salmonella subtipləşdirmə metodları üçün silisium məlumatlarını sürətlə şərh etmək üçün bioinformatika resursudur. Genoserotipləmə ilə serovar proqnozunu yerinə yetirməklə yanaşı, bu resurs aşağıdakılar üçün ardıcıllığa əsaslanan tipləmə analizlərini birləşdirir: Çox Lokus Ardıcıllığı Yazma (MLST), ribosomal MLST (rMLST) və əsas genom MLST (cgMLST). Google Chrome-un Firefox-un da dəstəklənməsi tövsiyə olunur, lakin bu proqramdakı SVG vizualizasiyaları o qədər də həssas olmaya bilər. Internet Explorer dəstəklənmir.

FSFinder2 (Frameshift Signal Finder) - Proqramlaşdırılmış ribosomal çərçivə dəyişməsi virus, bakteriya və insan da daxil olmaqla eukariotlar kimi geniş spektrli orqanizmlərdən müəyyən genlərin ifadəsində iştirak edir. Proqramlaşdırılmış çərçivə dəyişikliyində ribosom bir mesajçı RNT-dəki xüsusi siqnala cavab olaraq müəyyən bir yerdə alternativ çərçivəyə keçir. Proqramlaşdırılmış çərçivə dəyişikliyi viral hissəciklərin morfogenezində, avtogen nəzarətdə və alternativ enzimatik fəaliyyətlərdə rol oynayır. Ümumi çərçivə sürüşməsi -1 çərçivə sürüşməsidir, bu zaman ribosom tək bir nukleotidi yuxarı istiqamətə dəyişir. -1 kadr dəyişikliyinin əsas elementləri sürüşkən sahədən, ribosomun oxu çərçivələrini dəyişdirdiyi yerdə və bir neçə nukleotidin aşağı axınında yerləşən psevdoknot və ya gövdə döngəsi kimi stimullaşdırıcı RNT strukturundan ibarətdir. +1 çərçivə sürüşmələri -1 çərçivə dəyişikliyindən daha az yayılmışdır, lakin müxtəlif orqanizmlərdə müşahidə olunur.

InBase, The Intein Database and Registry - Protein splicing, zülal prekursorundan aradakı zülal ardıcıllığının (INTEIN) kəsilməsi və yetkin ekstein host zülalını yaratmaq üçün yan zülal fraqmentlərinin (EXTEINS) eyni vaxtda bağlanması kimi müəyyən edilir. pulsuz bağırsaq (Perler 1994). Protein birləşməsi, bağlanmış eksteinlər arasında yerli peptid bağı ilə nəticələnir. Bu, BLAST analizinə icazə verən verilənlər bazası saytıdır. (İstinad: Perler, F.B. 2002. Nuclein Acids Res. 30: 383-384).

P2RP (Proqnozlaşdırılan Prokaryotik Tənzimləyici Zülallar) - istifadəçilər amin turşusu və ya genomik DNT ardıcıllığını daxil edə bilər və orada proqnozlaşdırılan zülallar DNT-ni bağlayan domenlərə və/və ya iki komponentli sistem domenlərinə sahib olmaq üçün skan edilir. Bu şəkildə müəyyən edilmiş RP-lər birmənalı olaraq qeyd edilmiş ailələrə bölünür. (İstinad: Barakat M, et al. 2013. BMC Genomics 14:269).

P2CS (Prokaryotic 2-Component Systems) Prokaryotic Two-Component Systems (TCSs) analizi üçün hərtərəfli mənbədir. TCS-lər bir reseptor histidin kinazdan (HK) və tərəfdaş cavab tənzimləyicisindən (RR) ibarətdir və mühüm prokaryotik davranışlara nəzarət edir. BLASTP istifadə edərək axtarış edilə bilər. (İstinad: P. Ortet et al. 2015. Nucl. Acids Res. 43 (D1): D536-D541).

COG analizi - Cparıltıları Ortoloji Groups - COG zülal verilənlər bazası ortoloqlar dəstini çıxarmaq üçün bütün tam ardıcıllıqlı mikrob genomlarında proqnozlaşdırılan və məlum zülalları müqayisə etməklə yaradılıb. Hər bir COG ən azı üç nəsildə ortoloji olduğu aşkar edilmiş bir qrup zülaldan ibarətdir və çox güman ki, qədim qorunmuş domenə (CloVR) uyğun gəlir. Bu təhlili təklif edən saytlara aşağıdakılar daxildir:

WebMGA (İstinad: S. Wu et al. 2011. BMC Genomics 12:444), RAST (İstinad: Aziz RK et al. 2008. BMC Genomics 9:75) və BASys (Baktual Aqeyd etmə Ssistem İstinadı: Van Domselaar GH et al. 2005. Nuklein turşuları Res. 33(Veb Server məsələsi):W455-459.) və JGI IMG (Iinteqrasiya olunmuş Mikrob Genomes İstinad: Markowitz VM et al. 2014. Nucl. Acids Res. 42: D560-D567. )

Digər saytlar:

EggNOG - Ortoloji qruplar və əmələ gələn funksional annotasiyaların verilənlər bazası Nnəzarət olunur Ortoloji Gtam genomlardan qruplar (NOGs) ayırır və sonra meydana çıxan gen ailələrinə hərtərəfli xarakteristika və təhlil boru xəttini tətbiq edir. (İstinad: Powell S et al. 2014. Nucleic Acids Res. 42 (D1): D231-D239

OrthoMCL - ardıcıllıq oxşarlığına görə zülalları ortoloji qruplara qruplaşdırmaq üçün başqa bir alqoritmdir. Proses adətən 6 ilə 72 saat arasında davam edir. (İstinad: Fischer S et al. 2011. Curr Protoc Bioinformatics Chapter 6: Unit 6.12.1-19).

KAAS (KYUMURTA Aavtomatik Aqeyd etmə Server) əl ilə seçilmiş KEGG GENES verilənlər bazası ilə BLAST və ya GHOST müqayisələri ilə genlərin funksional annotasiyasını təmin edir. Nəticə KO (KEGG Orthology) tapşırıqlarını və avtomatik olaraq yaradılan KEGG yollarını ehtiva edir. (İstinad: Moriya Y et al. 2007. Nucleic Acids Res. 35(Veb Server məsələsi): W182-185).

ResFinder (Acquired antimicrobial rezistent gen finder) - bütün genom məlumatlarında əldə edilmiş antimikrob müqavimət genlərinin identifikasiyası üçün BLAST-dan istifadə edir. Giriş kimi, metod həm əvvəlcədən yığılmış, tam və ya qismən genomlardan, həm də dörd müxtəlif ardıcıllıq platformasından qısa ardıcıllıq oxunuşlarından istifadə edə bilər. 100% eyniliyə malik 1411 fərqli müqavimət geni ilə sınaqdan keçirilmişdir. (İstinad: Zankari E et al. 2012. J Antimicrob Chemother. 67:2640-2644)

ARG-ANNOT (Antibiotik Rmüqavimət Gen-DEYİLation) bakterial genomlarda mövcud və ehtimal olunan yeni antibiotik müqaviməti (AR) genlərini aşkar etmək üçün yaradılmış yeni vasitədir. ARG-ANNOT istifadəçiyə veb interfeysi olmadan ardıcıllığı təhlil etməyə imkan verən Bio-Edit proqramında yerli partlayış proqramından istifadə edir (İstinad: Gupta, S.K. et al. 2014. Antimicrob Agents Chemother. 58: 212&ndash220).

KART (The Chərtərəfli Antibiotik Rmüqavimət Database) - Antibiotik Müqavimət Ontologiyası (ARO) və AMR gen aşkarlama modelləri tərəfindən təşkil edilən məlum müqavimət determinantları və əlaqəli antibiotiklərin ciddi şəkildə seçilmiş kolleksiyası (İstinad: Jia, B. et al. 2017. Nuklein turşularının tədqiqatı, 45: D566-573).

MEGARes - yüksək ötürmə qabiliyyəti olan asiklik təsnifatçıların inkişafı və böyük məlumatların iyerarxik statistik təhlili üçün zəmin təmin edən əl ilə hazırlanmış antimikrob müqavimət məlumat bazası və annotasiya strukturudur (İstinad: Lakin, S.N.. et al. 2017. Nuklein turşularının tədqiqatı, 45: D574-D580).

BacMet (Antibacterial Biocide & amp Görüşdüal Resistance Gens Database) - yüksək etibarlı məzmuna malik biosid və metal müqavimət genlərinin verilənlər bazası. BacMet 1.1 versiyasında eksperimental olaraq təsdiqlənmiş verilənlər bazasında 704 müqavimət genləri var, proqnozlaşdırılan verilənlər bazasında isə 40,556 müqavimət genləri var (İstinad: Pal, C. et al. 2014. Nucleic Acids Research, 42: D737-743).

İxtisaslaşmış annotasiya - CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats):

CRISPRfinder - yerli istehsal məlumatlarında CRISPR-lərin asanlıqla aşkarlanmasına və verilənlər bazasında mövcud olan CRISPR-lərin məsləhətləşməsinə imkan verir. O, həmçinin qeyd edildiyi zaman CRISPR ilə əlaqəli (cas) genlərin mövcudluğu haqqında məlumat verir. . (İstinad: I. Grissa et al. 2007. Nucl. Acids Res. 35 (Veb server problemi): W52-W57).

CRISPRmap -həm bakterial, həm də arxeal sistemlərin təkrar mühafizəsi və müxtəlifliyi haqqında tez və ətraflı məlumat təqdim edir. O, bu günə qədər CRISPR-lərin ən böyük məlumat dəstini ehtiva edir və qorunmuş ardıcıllıq ailələrini, endoribonükleazlar üçün potensial struktur motivlərini və təkamül əlaqələrini müəyyən etmək üçün hərtərəfli müstəqil klasterləşdirmə təhlillərinə imkan verir. (İstinad: S.J. Lange et al. 2013. Nuklein turşularının tədqiqatı, 41: 8034-8044).

CRISPI: CRISPR İnteraktiv verilənlər bazası - əlaqəli CRISPR ilə əlaqəli genlərin (CAS) tam repertuarını ehtiva edir. Çoxlu qrafik alətləri və funksiyaları olan istifadəçi dostu veb interfeysi istifadəçilərə nəticələr çıxarmağa, şəxsi ardıcıllıqlarda CRISPR-ni tapmağa və ya boşluqlar ilə ardıcıllığın oxşarlığını hesablamağa imkan verir.( İstinad: Rousseau C et al. 2009. Bioinformatika. 25: 3317&ndash3318).

CRISPRtarget - bu, CRISPR RNT-lərinin ən çox ehtimal olunan hədəflərini proqnozlaşdırır. Bu, yeni ardıcıllaşdırılmış genomik və ya metagenomik məlumatlarda hədəfləri tapmaq üçün istifadə edilə bilər. (İstinad: Biswas A et al. 2013. RNA Biol. 10:817-827).

CRISPy-web - istifadəçi tərəfindən təmin edilən hər hansı mikrob genomu üçün sgRNA-ların dizaynı üçün CRISPy-ə əsaslanan istifadəsi asan veb alətdir. CRISPy-web tədqiqatçılara mümkün sgRNA-ları skan etmək üçün interaktiv şəkildə öz genomlarının bir bölgəsini seçməyə imkan verir. Potensial hədəfdən kənar uyğunluqlar yoxlanıldıqdan sonra nəticədə sgRNA ardıcıllığı qrafik olaraq göstərilir və mətn fayllarına ixrac edilə bilər. (İstinad: K. Blin et al. 2016. Synthetic and Systems Biotechnology 1(2): 118-121).

Xüsusi annotasiya - virulentlik determinantları: Bu, terapiya üçün bakteriofaqlar üzərində işləyənlər üçün xüsusilə maraqlıdır

VirulenceFinder (Danimarka Texniki Universiteti) &ndash virulent genlərin identifikasiyası. Metodda məlum virulent genlərin identifikasiyası üçün BLAST-dan istifadə olunur Escherichia coli. Metod virulent genləri də əhatə edəcək şəkildə genişləndirilir EnterokokStaphylococcus aureus. Giriş kimi, metod həm əvvəlcədən yığılmış, tam və ya qismən genomlardan, həm də dörd müxtəlif ardıcıllıq platformasından qısa ardıcıllıq oxunuşlarından istifadə edə bilər.

ClanTox: qısa heyvan toksinlərinin təsnifatı - hər bir ardıcıllığın toksin kimi olub-olmadığını proqnozlaşdırır və statistik etimad əsasında müsbət proqnozlaşdırılan namizədlərin sıralanmış siyahısını təqdim edir. Hər bir zülal üçün siqnal peptidinin olması, sistein qalıqlarının sayı və əlaqəli funksional qeydlər daxil olmaqla əlavə məlumat təqdim olunur. (İstinad: G. Naamati et al. 2009. Nucleic Acids Res. 37 (Veb server problemi): W363&ndashW368).

t3db Toksin və Toksin Hədəf Məlumat Bazası - ətraflı toksin məlumatlarını hərtərəfli toksin hədəf məlumatı ilə birləşdirir. Verilənlər bazasında hazırda 1670 müvafiq toksin hədəf qeydləri ilə əlaqəli 3053 toksin var. Hər bir toksin qeydi (ToxCard) 50-dən çox məlumat sahəsini ehtiva edir və kimyəvi xüsusiyyətlər və deskriptorlar, toksiklik dəyərləri, molekulyar və hüceyrə qarşılıqlı təsirləri və tibbi məlumatlar kimi məlumatları ehtiva edir. (İstinad: Lim E et al. 2010. Nucleic Acids Res. 38 (Məlumat bazası məsələsi): D781-786).

TAfinder 2.0 - bakterial genomda Tip II toksin-antitoksin lokuslarını müəyyən etmək üçün veb-əsaslı alətdir ( İstinad: Xie Y et al. (2018) Nucleic Acids Res. 46(D1): D749-D753).

İnsanlar üçün Bakterial Ekzotoksinlərin DBETH Məlumat bazası 26 müxtəlif insan patogen bakteriya cinsindən olan 229 ekzotoksin üçün ardıcıllıqlar, strukturlar, qarşılıqlı əlaqə şəbəkələri və analitik nəticələrin verilənlər bazasıdır. Bütün toksinlər 24 müxtəlif Toksin sinfinə bölünür. DBETH-nin məqsədi insan patogen bakterial ekzotoksinlər üçün hərtərəfli məlumat bazası təmin etməkdir. (İstinad: Chakraborty A et al. 2012. Nucleic Acids Res. 40 (Məlumat bazası məsələsi): D615-620).

VFDB - bakterial patogenlər (həmçinin Chlamydia və Mycoplasma daxil olmaqla) üçün virulentlik amillərinin inteqrasiya olunmuş və hərtərəfli məlumat bazasıdır. (İstinad: L.H. Chen et al. 2012. Nucleic Acids Res. 40 (Məlumat bazası məsələsi): D641-D645).

PAIDB (Patogenlik Iböhtan atmaq Database) - Patogenlik adaları (PAİ) və müqavimət adaları (REI) patogenlərin təkamülü üçün açardır və bakterial infeksiya prosesində tamamlayıcı rol oynayır. PAI-lər xəstəliyin inkişafını təşviq edərkən, REİ-lər çoxlu antimikrob agentlərə qarşı ev sahibinə fitness üstünlüyü verir. Köməkçi proqram, PAI Finder, çox ardıcıllıqlı sorğuda PAI kimi regionları və ya REI-yə bənzər bölgələri müəyyən edir. ( İstinad : S.H Yoon et al. 2015. Nucl. Acids Res. 43 (D1): D624-D630).

IslandViewer - yeni interaktiv genom vizuallaşdırma aləti, IslandPlot və genişləndirilmiş virulentlik faktoru, antimikrob müqavimət geni və patogenlə əlaqəli gen annotasiyaları, həmçinin yaxından əlaqəli genomlarda bu genlərin homoloqları daxildir. Xüsusilə, natamam genomlar IslandViewer 3-də giriş kimi qəbul edilir, baxmayaraq ki, onlar istifadəçiləri mümkün olduqda tam genomlardan istifadə etməyə çağırırlar. (İstinad: B.K. Dhillon et al. 2015. Nucl. Acids Res. 43 (W1): W104-W108).

Gypsy Database - virusların, mobil genetik elementlərin (MGEs Ty3/Gypsy, Retroviridae, Ty1/Copia və Bel/Pao LTR retroelementləri və Caulimoviridae bitkilərin pararetrovirusları) və digər genomik təkrarlar. BLAST və HMM axtarışları üçün təchiz edilmişdir. (İstinad: Llorens, C et al. 2011. Nucl. Acids Res. 39(əlavə 1): D70-D74).

PanDaTox (Pan Genomik DaGenomik elementlər üçün baza Toxic to Bakteriyalara) - yeni antibiotiklərin və biotexnoloji cəhətdən faydalı funksional genlərin kəşfinə kömək etmək üçün E. coli-də klonlana bilməyən genlərin və intergenik bölgələrin məlumat bazasıdır. O, həmçinin metabolik mühəndisliyin səmərəliliyini artırmaq üçün nəzərdə tutulmuşdur. BLAST Axtarış xüsusiyyəti daxildir. (İstinad: Mitai G & Sorek R. 2012. Biomühəndislik, 3: 218-221.)

PathogenFinder (patogen potensialı proqnozlaşdırır) &ndash İnsan patogenləri olmayan 513 bakteriya və insan patogenləri kimi şərh edilən 372 bakteriyanın tam genomlarına əsasən, ya əsasən patogen olmayan, ya da patogenlərlə əlaqəli olan zülal ailələrinin məlumat bazası yaradılmışdır. Bu verilənlər bazası daha sonra bakteriyaların patogen potensialını proqnozlaşdırmaq üçün istifadə olunur. Giriş kimi, metod həm əvvəlcədən yığılmış, tam və ya qismən genomlardan, həm də dörd müxtəlif ardıcıllıq platformasından qısa ardıcıllıq oxunuşlarından istifadə edə bilər. (İstinad: Cosentino S et al. 2013. PLoS ONE 8: e77302)

VirulentPred - bakterial virulent zülalların ardıcıllığını proqnozlaşdırmaq üçün SVM əsaslı bir üsuldur, proteomlarda virulent zülalları yoxlamaq üçün istifadə edilə bilər. Eksperimental olaraq təsdiqlənmiş virulent zülallarla birlikdə, proqnozlaşdırma metodu ilə bir neçə ehtimal olunan, şərhsiz və hipotetik zülal ardıcıllığının yüksək balla virulent zülallar olacağı proqnozlaşdırılıb. (İstinad: Garg A & Gupta G. 2008. BMC Bioinformatika 9: 62).

Tip III ifrazat sistemi (T3SS) infeksiya prosesində host-patogen qarşılıqlı əlaqə üçün vacib mexanizmdir. Bir çox qram-mənfi bakteriyaların T3SSmachinery vasitəsilə ifraz olunan zülallar T3SS effektorları (T3SEs) kimi tanınır. Bunlar ya hostda hüceyrəaltı lokallaşdırıla bilər, ya da digər effektorları hədəf hüceyrəyə gətirmək üçün birbaşa ana membranla qarşılıqlı əlaqədə olan T3SS-nin iynə ucunun bir hissəsi ola bilər. T3SEdb, bütün eksperimental olaraq müəyyən edilmiş və ehtimal edilən T3SE-lərin hərtərəfli məlumat bazasını veb-saytda toplamaq üçün belə bir səyi təmsil edir. BLAST axtarışı mövcuddur. (İstinad: Tay DM et al. 2010. BMC Bioinformatika. 11 Əlavə 7:S4).

Effektiv (Vyana Universiteti, Avstriya və Münhen Texniki Universiteti, Almaniya) - Bakterial zülal ifrazı simbiotik və patogen bakteriyaların əsas virulentlik mexanizmidir. Bununla da effektor zülallar bakteriya sitozolundan hüceyrədənkənar mühitə və ya bilavasitə eukaryotik ana hüceyrəyə daşınır. Effektiv portal bütün ictimaiyyətə açıq olan patogen və simbiontik genomlarda bakterial effektorlar üzrə əvvəlcədən hesablanmış proqnozlar, habelə istifadəçinin öz protein ardıcıllığı məlumatlarında effektorları proqnozlaşdırmaq imkanını təmin edir.

SIEVE Server III növ ifraz olunan effektorların proqnozlaşdırılması üçün ictimai veb alətdir. SIEVE Server məlum ifraz olunan zülallardan öyrənilmiş modeldən istifadə edərək III tip sekresiya sistemləri ilə bakterial patogenlərin genomlarından potensial ifraz olunmuş effektorları qiymətləndirir. SIEVE Server yalnız zülalların zülal ardıcıllığının yoxlanılmasını tələb edir və hər bir giriş zülalının III tip ifraz olunmuş effektor olması ilə bağlı konservativ ehtimalı qaytarır. (İstinad: McDermott JE et al. 2011. Infect Immun. 79:23-32).

T3SE - Tip III sekresiya sisteminin effektor proqnozu (İstinad: Löwer M, & Schneider G. 2009. PLoS One. 4:e5917. Səhv: PLoS One. 20094(7).

Phage_Finder - tamamlanmış bakterial genomlarda profaq bölgələrini müəyyən etmək üçün yaradılmışdır. Profaqları əl ilə müəyyən edilmiş 42 bakteriya genomundan ibarət test verilənlər bazasından istifadə edərək, Phage_Finder bölgələrin 91% -ni tapdı, nəticədə 7% yalan müsbət və 9% yalan mənfi profaqlar. 302 tam bakterial genomun axtarışı ümumi bakterial DNT-nin 2,7%-ni təşkil edən 403 ehtimal edilən profaq bölgəsini proqnozlaşdırdı. 285 ehtimal bağlanma yerinin təhlili tRNT-lərin intergenik (31%) və ya intragenik (28%) bölgələrə nisbətən bir qədər tez-tez (33%) inteqrasiya hədəfləri olduğunu, tmRNA-ların isə regionların 8%-də hədəfləndiyini aşkar etdi. (İstinad: D.E. Fouts. 2006. Nuklein turşuları Res. 34 : 5839&ndash5851).

Prophinder - bakterial genomlarda profaqları aşkar etmək üçün istifadə olunan vasitədir. GenBank formatlı faylı seçin.

PHAST (PHAGe Squlaq Tool) - bakterial genomlar və ya plazmidlər daxilində profaq ardıcıllığını tez və dəqiq müəyyən etmək, şərh etmək və qrafik şəkildə göstərmək üçün nəzərdə tutulmuşdur. O, ya xam DNT ardıcıllığı məlumatlarını, ya da qismən annotasiya edilmiş GenBank formatlı məlumatlarını qəbul edir və surətlə bir sıra verilənlər bazası müqayisələrini, eləcə də profaq ardıcıllıqlarını və profaj xüsusiyyətlərini tapmaq, şərh etmək və göstərmək üçün fag &ldquocornerstone&rdquo xüsusiyyətinin identifikasiyası addımlarını yerinə yetirir. Digər prophage identifikasiya vasitələri ilə müqayisədə PHAST 40 dəfəyə qədər sürətli və 15%-ə qədər həssasdır. O, həmçinin həm xam DNT ardıcıllığı məlumatlarını, həm də Genbank fayllarını emal edə və şərh edə bilər, profaq xüsusiyyətləri və profaj &ldquoquality&rdquo haqqında zəngin şərhli cədvəllər təqdim edir və bütöv və natamam profajı ayırd edə bilir. PHAST həmçinin, bütün müəyyən edilmiş profaq komponentlərini həm dairəvi, həm də xətti genomik görünüşlərdə göstərən yüklənə bilən, yüksək keyfiyyətli, interaktiv qrafiklər yaradır. Bundan əlavə, testlər göstərir ki, PHAST bütün mövcud faq aşkarlama alətlərindən 85,4% həssaslıqla və ya bir qədər dəqiqdir. müsbət proqnoz dəyəri 94,2% təşkil edir. (İstinad: Zhou, Y. et al. 2011. Nucl. Acids Res. 39(əlavə 2): W347-W352).

FAZER PHAGe Squlaq Tool Einkişaf etmiş Release - bakterial genomlar və plazmidlər daxilində profaq ardıcıllığının sürətli identifikasiyası və annotasiyası üçün PHAST-a əhəmiyyətli təkmilləşdirmədir. Çoxsaylı proqram təkmilləşdirmələri və əhəmiyyətli aparat təkmilləşdirmələri indi PHASTER-i daha sürətli, daha səmərəli, vizual olaraq daha cəlbedici və daha çox istifadəçi dostu etmişdir. Xüsusilə, PHASTER indi PHAST-dan 4,3 dəfə sürətlidir. (İstinad: D. Arndt et al. Nucleic Acids Res. 2016 44(W1):W16-21).

Prophage Hunter - bakterial genomlardan profaq genomlarını çıxarmaq, profaqların fəaliyyətini qiymətləndirmək, filogenetik cəhətdən əlaqəli faqları müəyyən etmək və fag zülallarının funksiyasına şərh vermək üçün bir pəncərəli veb xidməti təqdim edir. (İstinad: Song W et al. (2019) Nucleic Acids Res 47(W1): W74&ndashW80).

IslandViewer - iki ardıcıl kompozisiya GI proqnozlaşdırma metodu SIGI-HMM və IslandPath-DIMOB və vahid müqayisəli GI proqnozlaşdırma metodu IslandPick (İstinad: Langille et al. 2008. BMC Bioinformatics) birləşdirir. 9: 329).

PAIDB (PAtogenlik Iböhtan DataBase) məlum PAI-ləri toplamaq və prokaryotik tam genomlarda potensial PAI bölgələrini aşkar etmək üçün səy göstərmişdir. Patogenlik adaları (PAİ) müxtəlif virulentlik faktorlarını kodlayan patogenlərin fərqli genetik elementləridir. (İstinad: Yoon SH et al. 2007. Nucleic Acids Res. 35 (Verilənlər bazası məsələsi): D395-D400).

MTGIpick, genomlar haqqında şərhsiz məlumat və ya digər məlumat dəstlərindən əvvəlcədən məlumat almadan bir genomdan genomik adaları müəyyən edə bilər. Süni və real genomlardan yadplanetli fraqmentləri ilə simulyasiyalarda MTGIpick müxtəlif eksperimentlərdə güclü nəticələr bildirdi (İstinad: Dai Q et al. (2018) Qısa Bioinform 19(3): 361-373).


SyntTax - sinteniyanı prokaryotik taksonomiya ilə əlaqələndirən veb serverdir. SyntTax bütün tam ardıcıllıqlı prokaryotlara (Arxeya və Bakteriyalara) intuitiv giriş imkanı verən tam iyerarxik taksonomik ağacdan ibarətdir. Tək və ya çoxlu orqanizmlər ağacdakı müvafiq dərəcə qovşaqlarını seçməklə onların nəsli əsasında seçilə bilər. Sinteny proqramları arasında bu mənim sevimli proqramdır ( İstinad: Oberto J. 2013. BMC Bioinformatics. 14:4). Aşağıdakı nəticələr istilik şoku siqma faktorundan (RpoH) istifadə etməklə yaradılmışdır Salmonella Typhimurium qarşı Pseudomonadales.

Synteny İdentifikasiyası və Genomun Yenidən Qurulmasının Təhlili üçün Cinteny Server (A. U. Sinha və C. Meller, Cincinnati Universiteti, ABŞ) - bu server çoxlu genomlar arasında sintenik bölgələri tapmaq və ölçü kimi geriyə doğru məsafədən istifadə edərək genomun yenidən təşkilinin dərəcəsini ölçmək üçün istifadə edilə bilər. Siz layihə yarada və öz məlumatlarınızı yükləyə və ya əvvəlcədən yüklənmiş prokaryot və ya eukaryot məlumatları ilə işləyə bilərsiniz.

SimpleSynteny - çoxlu orqanizm genomları arasında əvvəlcədən seçilmiş gen hədəfləri dəstinin sinteniyasını qiymətləndirmək üçün boru xətti təmin edir. İstifadə rahatlığına diqqət yetirilmişdir və istifadəçilərdən yalnız öz genomları və maraq doğuran genlər üçün FASTA faylları təqdim etmələri tələb olunur. SimpleSynteny daha sonra istifadəçiyə genomları son yüksək keyfiyyətli rəqəmə birləşdirməzdən əvvəl fərdi olaraq tədqiq və fərdiləşdirmənin iterativ prosesinə rəhbərlik edir. (İstinad: Veltri D et al. 2016. Nucleic Acids Res. 44 (Veb server problemi): W41&ndashW45).

Synteny Portal - eukaryotik genom istifadəçiləri asanlıqla (i) UCSC genom brauzeri verilənlər bazasında əvvəlcədən qurulmuş düzülmələrdən istifadə etməklə çoxsaylı növlər arasında sinteniya blokları qura, (ii) yüksək keyfiyyətli şəkillər kimi sintenik əlaqələri vizuallaşdıra və yükləyə, (iii) genetik ilə sinteniya bloklarına baxa bilərlər. məlumat və (iv) intuitiv və istifadəsi asan veb-əsaslı interfeysdə aşağı axın sinteniya əsaslı analizlər üçün giriş kimi istifadə olunacaq sinteniya bloklarının təfərrüatlarını endirin. (İstinad: Lee J et al. 2016. Nucleic Acids Res 44(W1): W35&ndashW40).

AutoGRAPH çox növlərin müqayisəli genomik analizi üçün inteqrasiya olunmuş veb serverdir. O, iki və ya üç növ arasında sinteniya xəritələrinin qurulması və vizuallaşdırılması, növlər arasında makrosinteniya və mikrosinteniya əlaqələrinin təyini və nümayişi və təkamül qırılma nöqtələrinin vurğulanması üçün nəzərdə tutulmuşdur.
Veb server istinad xromosomu və bir və ya iki sınaqdan keçmiş genom(lar) arasında marker/lövbər sifarişlərinin ikili müqayisəsi yolu ilə sinteniya xəritələrini qurur. O, istifadəçilərə bir neçə xüsusiyyətləri vizuallaşdırmağa və xarakterizə etməyə imkan verir: Konservləşdirilmiş seqmentlər (CS), Konservləşdirilmiş Seqmentlər Sifarişli (CSO) və kəsilmə nöqtələri. (İstinad: Derrien T et al. 2007. Bioinformatika 23:498-499).

Sibeliya (Kaliforniya Universiteti, San Dieqo, ABŞ) - iterativ de Bruijn qrafiklərindən istifadə edərək çox yaxından əlaqəli mikrob genomlarında sinten bloklarını tapmaq üçün bir vasitədir. Əksər digər vasitələrdən fərqli olaraq, Sibelia genomlarda təkrarlanan sinteniya bloklarını, eləcə də çoxsaylı genomlar tərəfindən paylaşılan blokları tapa bilir. O, hər biri fərqli qranulyarlıq səviyyəsini təmsil edən çox qatlı iyerarxiya strukturunda sinten bloklarını təmsil edir.

Kablammo sizə veb brauzerinizdən BLAST nəticələrinin interaktiv vizualizasiyasını yaratmağa kömək edir. Ən maraqlı düzülmələrinizi tapın, hər biri üçün ətraflı parametrləri sadalayın və nəşrə hazır vektor şəklini ixrac edin. İstifadəsi inanılmaz dərəcədə asandır - burada BLASTN müqayisəsi üçün nəticələr Escherichia faqlar T1 (sorğu) və ADB-2. (İstinad: Wintersinger JA et al. Bioinformatika 31:1305-1306).


M1CR0B1AL1Z3R - sadə qrafik istifadəçi interfeysi vasitəsilə mikrob genomikası məlumatlarının təhlilini aparmaq üçün “bir pəncərə”dir.M1CR0B1AL1Z3R-də həyata keçirilən bəzi xüsusiyyətlər bunlardır: (i) ehtimal olunan açıq oxu çərçivələrinin çıxarılması və gen məzmununun müqayisəli genomik təhlili (ii) orfoloji dəstlərin çıxarılması və onların ölçü paylanmasının təhlili (iii) genin mövcudluğu-yoxluq nümunələrinin təhlili (iv) filogenetikin yenidən qurulması. ağac, nəsillər arasında GC məzmun dəyişikliyini çıxaran, çıxarılan ortoloji dəst (v) əsasında. M1CR0B1AL1Z3R qabaqcıl üsullardan istifadə edərək onlarla bakterial genomun çıxarılmasını və təhlilini asanlaşdırır. (İstinad: Avram O və digərləri (2019) Nucleic Acids Res. 47(W1): W88-W92).

GeneOrder 4.0 (D. Seto, Bioinformatika və Hesablama Biologiyası, George Mason Univ., ABŞ) iki bakterial genom arasında gen sırasını müqayisə etmək üçün istifadə olunmaq üçün nəzərdə tutulmuşdur (İstinad: Mahadevan P. & Seto D. 2010. BMC Araşdırma Qeydləri 3:41).
CoreGenes (D. Seto və P. Mahadevan, Bioinformatika və Hesablama Biologiyası, George Mason Univ., ABŞ) - müqayisə edilən iki genom arasında ümumi olan genlərin ümumi sayını hesablayır, müəyyən bir genomla ümumi olan genlərin faiz dəyərini göstərir, bir cüt proteomun tərkibində olan unikal genləri təyin edir. CoreGenes 3.5 toplu CoreGenes serveridir. Mən bakterial virusların təsnifatında bu resurslar dəstindən geniş istifadə etmişəm.

Əgər GenBank-da hələ saxlanmamış faq üçün gbk faylınız varsa, burada istifadə etmək üçün məlumatlarınızı CoreGenes formatına çevirmək üçün bu təlimatlardan istifadə edə bilərsiniz.

WebACT - bu, Artemis əsasında DNT ardıcıllığını müqayisə edən ACT (Artemis Müqayisə Aləti) veb versiyasıdır (İstinad: 21: 3422 - 3423 EMBL-EBI verilənlər bazası səhifəsinə daxil olun və sizi maraqlandıran ardıcıllıq üçün EMBL qoşulma nömrəsini müəyyən etmək üçün EMBL və "Standart Sorğu Forması" seçin.

Panseq (Chad Laing, Kanada Xalq Sağlamlığı Agentliyi) - bir qrup genomik ardıcıllığın 'pan genomunun' analizi üçün alətlər qrupu. Bir bakteriya növünün pan-genomu əsas genomdan və köməkçi genofonddan ibarətdir ki, sonuncusu orqanizmin subpopulyasiyalarının xüsusi mühitə uyğunlaşmasına imkan verir. Bunlara başqa ştam və ya ştammlar qrupuna münasibətdə bir ştam və ya ştamlar qrupuna xas olan ardıcıllıqları tapacaq Novel Region Finder daxildir. Pan-genom Analizi ardıcıllığınız arasında pan-genomu müəyyən edir və əsas genomda SNP-ləri tapır və köməkçi genomik bölgələrin paylanmasını müəyyən edir. Loci Selector verilənlər bazası arasında ən yaxşı ayrı-seçkiliyi təklif edən lokusları müəyyən edir. (İstinad: Laing, C. et al. 2010. BMC Bioinformatika. 11: 461).

PARIGA - istifadəçilərə istifadəçi tərəfindən seçilmiş iki ardıcıllıq dəstində hər şeyə qarşı BLAST axtarışlarını yerinə yetirməyə imkan verir. Üstəlik, o, iki BLAST çıxışını python-serialized-obyektlər verilənlər bazasında saxladığından, nəticələr prosesi yenidən həyata keçirmədən və əlavə proqramlaşdırma səylərindən qaçmadan real vaxt rejimində bir neçə parametrə görə süzülə bilər. (İstinad: Orsini M. et al. 2013. PLoS One 8(5):e62224).

EDQAR (Esəmərəli Dmüqayisə üçün atabase çərçivəsi Genom ABLAST hesabından istifadə edərək təhlil edir Ratios) - EDGAR yüksək məhsuldarlıq yanaşmasında avtomatik olaraq genom müqayisələrini yerinə yetirmək üçün nəzərdə tutulmuşdur və əsas genom, pan genom və təkton analizi və Venn diaqramının qurulması üçün istifadə edilə bilər. (İstinad: Blom J. et al. 2009. BMC Bioinformatika 10: 154).

OrthoVenn - genom geniş müqayisəsi və çoxsaylı növlər üzrə ortoloji qrupların annotasiyası üçün veb serverdir. O, ortoloji qrupların müqayisəsi üçün onurğalıların, metazoaların, protistlərin, göbələklərin, bitkilərin və bakteriyaların əhatə dairəsini təmin edir və həmçinin istifadəçi tərəfindən müəyyən edilmiş növlərdən fərdiləşdirilmiş protein ardıcıllığının yüklənməsini dəstəkləyir. İnteraktiv Venn diaqramı, xülasə sayları və növlər arasında paylaşılan çoxluqların ayrılması və kəsişməsinin funksional xülasələri OrthoVenn nəticəsinin bir hissəsi kimi göstərilir. OrthoVenn həmçinin müxtəlif ardıcıllıq təhlili alətlərindən istifadə edərək klasterlərin ətraflı görünüşlərini ehtiva edir. Bundan əlavə, o, tək surətli genlərin ortoloji qruplarını müəyyən edir və açar sözlər və ya BLAST vasitəsilə xüsusi genlərin qruplarının fərdi axtarışına imkan verir. (İstinad: Y. Yang et al. 2015. Nucl. Acids Res. 43 (W1): W78-W84). Burada da tapıldı.

BEACON müxtəlif Annotasiya Metodlarından (AM) müəyyən genomun annotasiyalarını müqayisə edən proqram vasitəsidir. O, giriş kimi GenBank formatından istifadə edir və fərdi AM-lərdən orijinal annotasiyaların siyahısı ilə yanaşı Genişləndirilmiş Annotasiya (EA) əldə edir. (İstinad: Kalkatawi M, BMC Genomics. 201516(1): 1-8).

ANI (Ason dərəcə Nukleotid Identity) kalkulyatoru - iki genomik məlumat dəsti arasında həm ən yaxşı hitlərdən (birtərəfli ANI) və həm də qarşılıqlı ən yaxşı hitlərdən (ikitərəfli ANI) istifadə edərək orta nukleotid eyniliyini təxmin edir. Tipik olaraq, eyni növün genomları arasında ANI dəyərləri 95% -dən yuxarıdır (məsələn, Escherichia coli). 75%-dən aşağı olan dəyərlərə etibar edilməməlidir və əvəzinə AAI istifadə edilməlidir. Bu alət həm tam, həm də qaralama genomları (multi-fasta) dəstəkləyir. (İstinad: Goris J et al. 2007. Int J Syst Evol Microbiol. 57(Pt 1): 81-91).

Average Nucleotide Identity (ANI) kalkulyatoru - onların ANI Kalkulyatoru orijinal OrthoANI alqoritminin təkmilləşdirilmiş iterasiyası olan OrthoANIu alqoritmindən istifadə edir, hansı ki, BLAST əvəzinə USEARCH istifadə edir (İstinad: Yoon, S. H. et al. (2017). Antonievanek. 110:1281&ndash1286).

VİRİDİK (Virbizə Intergenomik Diduruş Chesablayıcı C. Moraru, Dəniz Mühitinin Kimya və Biologiya İnstitutu, Almaniya) - ICTV tərəfindən bakteriofaq təsnifatının birinci səviyyəsi iki virus arasında ümumi DNT ardıcıllığının eyniliyini hesablamağı əhatə edir. Bu yeni alət fag genomları arasında cüt-cüt intergenomik məsafələri/oxşarlıqları hesablayır. Onu işə salmaq üçün maraq doğuran bütün fag genomları ilə tək fasta faylı yükləyin, layihə yaradın və run düyməsini basın. Layihə yaradılarkən göstəriləcək layihə identifikatorunu yadda saxlayın. Hesablamalar uzun sürərsə, məlumatlara daxil olmaq üçün ona ehtiyacınız olacaq.

GGDC (Genom-to-Genom Dduruş Calculator) - DNT-DNT hibridizasiyasını (DDH) təqlid edə bilən bütün genom məsafələrini çıxarmaq üçün üsullar təqdim edir. GGDC ilə hesablanmış dəyərlər, "ANI" kimi alternativ yanaşmalara nisbətən yaş laboratoriya GDH dəyərləri ilə bir qədər yaxşı korrelyasiya verir. Bu məsafə funksiyaları həmçinin çox azaldılmış genomların və təkrarlanan ardıcıllıq bölgələrinin öhdəsindən gələ bilər. Onlardan bəziləri genomik məlumatın itkin fraksiyalarına qarşı da çox möhkəmdir (natamam genom ardıcıllığı səbəbindən). Beləliklə, bu veb-xidmət genom əsaslı növlərin təsviri üçün istifadə edilə bilər. (İstinad: Meier-Kolthoff JP et al. 2013. BMC Bioinformatika 14: 60).

POGO-DB - İntensiv hesablamalı bütöv genom BLASTlarına əsaslanaraq, POGO-DB cüt genom üzrə bir neçə ölçü təmin edir: (a) ardıcıllığın ən azı 70%-ni əhatə edən və 30-a malik olan bütün iki istiqamətli ən yaxşı partlayış vuruşlarının orta Amin Turşusu İdentifikasiyası % ardıcıllıq eyniliyi (b) İki genom arasında gen məzmununda oxşarlığı qiymətləndirən Genomik Akışkanlıq (c) İki genom arasında paylaşılan ortoloqların sayı (iki meyarla müəyyən edildiyi kimi) (d) Ən çox oxşar 16S rRNA genlərinin cüt eyniliyi (e) Qlobal miqyasda qorunan 73 əlavə marker geninin (bütün genomların ən azı 90%-də mövcud olması bizim tərəfimizdən müəyyən edilmişdir) cüt şəxsiyyəti. (İstinad: Lan Y et al. 2014. Nucl. Acids Res. 42 (D1): D625-D632).

VICTOR (Virus Classifikasiya və Tree binası Online Rmənbə Leibniz-Institut DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH). Bu veb xidməti bakterial və arxa virusları ("faglar") onların genom və ya proteom ardıcıllığından istifadə edərək müqayisə edir. Nəticələrə budaq dəstəyi ilə Genome-BLAST Distance Phylogeny metodundan (GBDP) istifadə edərək fərz edilən filogenomik ağaclar, həmçinin növ, cins və ailə səviyyəsində təsnifat üçün təkliflər daxildir. (Xidmət digər virus növlərinə də tətbiq oluna bilər, lakin bu baxımdan hələ sınaqdan keçirilməyib.) FASTA fayllarınızı, GenBank fayllarınızı və/və ya GenBank qoşulma ID-lərinizi yükləyin. (İstinad: JP Meier-Kolthoff & M Göker. 2017. Bioinformatika 33(21): 3396&ndash3404).

VIRFAM fag genomlarında baş-boyun-quyruq modullarının və rekombinaz genlərinin tanınmasına həsr edilmişdir. Bu serverdən bakteriofaqların zülal ardıcıllığı daxilində xüsusi zülal ailələrinin uzaq homoloqlarını axtarmaq üçün istifadə edə bilərsiniz. Daxiletmə: faj çıxışınızın zülal ardıcıllığı, virusunuzun yerləşdiyi filogenetik ağac daxildir. (İstinad: Lopes A et al. Nucleic Acids Res. (2010) 38(12): 3952-62).

Seeker - fag ardıcıllığının istinadsız identifikasiyası üçün dərin öyrənmə vasitəsidir. Seeker, ardıcıllıq məlumat dəstlərində faqların sürətli aşkarlanmasına və fag ardıcıllığının bakterial olanlardan təmiz diferensiallaşdırılmasına imkan verir, hətta müəyyən edilmiş faq ailələrinə az ardıcıl oxşarlığı olan faqlar üçün. Biz Arayıcının naməlum faqları müəyyən etmək və bəziləri məlum faq ailələrindən yüksək dərəcədə fərqlənən naməlum faqları aşkar etmək üçün Axtarıcıdan istifadə etmək qabiliyyətini hərtərəfli təsdiq edirik. (İstinad: Auslander N və başqaları (2020) doi.org/10.1101/2020.04.04.025783)

VipTree - tBLASTx tərəfindən hesablanmış genom miqyasında ardıcıllıq oxşarlıqlarına əsaslanan viral genom ardıcıllığının "proteomik ağacını" yaradır. Orijinal proteomik ağac konsepsiyası (yəni, "theFage Proteomik Ağacı&rdquo) Rohwer və Edwards, 2002 tərəfindən hazırlanmışdır. Proteomik ağac onlarla, yüzlərlə və minlərlə virus arasında qlobal genomik oxşarlıq əlaqələrini aşkar edən dendroqramdır. Proteomik ağac quyusunda müəyyən edilmiş viral qrupların müəyyən edilmiş viral taksonomiyalara uyğun olduğu göstərilmişdir. (İstinad: Nishimura Y et al. (2017) Bioinformatika 33: 2379&ndash2380).

MiGA (Microbial Genomlar Atlas) - genom aqreqatı Orta Nukleotid əsasında naməlum sorğu genomik ardıcıllığının tam və ya qismən, bütün taksonomik olaraq təsnif edilmiş taksonlara qarşı mövcud genom ardıcıllığı ilə təsnifləşdirilməsinə, həmçinin digər əlaqəli genomlarla, o cümlədən becərilməmiş genomlarla müqayisə etməyə imkan verən veb-server. və Amino Acid Identity (ANI/AAI) anlayışları. (İstinad: Rodriguez-R et al (2018) Nuklein turşularının tədqiqatı 46(W1): W282-W288).

CGView Server - sirkulyar genomlar üçün müqayisəli genomika alətidir ki, bu da ardıcıllıq xüsusiyyətləri haqqında məlumatı ardıcıllıq təhlili nəticələri kontekstində vizuallaşdırmağa imkan verir. Bir genom ardıcıllığı proqrama FASTA, GenBank, EMBL və ya xam formatda verilir. FASTA formatında üçə qədər müqayisə ardıcıllığı (və ya ardıcıllıq dəsti) də təqdim edilə bilər. CGView Server genom ardıcıllığını müqayisə ardıcıllığı ilə müqayisə etmək üçün BLAST-dan istifadə edir və sonra nəticələri və hər hansı mövcud xüsusiyyət məlumatını (GenBank, EMBL və ya isteğe bağlı GFF faylından) və ya analiz məlumatını (isteğe bağlı GFF faylından) yüksək səviyyəli məlumatlara çevirir. bütün genom ardıcıllığını göstərən keyfiyyətli qrafik xəritə və ya maraq dairəsinin böyüdülmüş görünüşünü. BLAST müqayisələrinin necə aparıldığını müəyyən etmək və nəticələrin necə göstərilməsinə nəzarət etmək üçün bir neçə variant mövcuddur.( İstinad: Grant JR & Stothard P. 2008. Nucleic Acids Res. 36 (Veb server problemi): W181-184)

Jena Prokaryotik Genom Viewer (JPGV) - GenBank düz faylından (*.gbk) xətti və ya dairəvi qrafiklər yaradır, o cümlədən arzu olunarsa GC məzmunu, GC əyriliyi, purin artıqlığı və keto artıqlığı göstərilə bilər. Həmçinin əlaqəli genomlara qarşı BLAST analizinə imkan verir. Pulsuz qeydiyyat tələb olunur.

GenomeVx - redaktə edilə bilən, nəşr keyfiyyəti ilə mitoxondrial və xloroplast genomlarının və böyük plazmidlərin xəritələrini yaradır. Bu xəritələr genlərin və xromosom xüsusiyyətlərinin yerini, habelə mövqe miqyasını göstərir. Proqram giriş kimi ya xam xüsusiyyət mövqelərini, ya da GenBank qeydlərini götürür. Sonuncu halda, xüsusiyyətlər avtomatik olaraq çıxarılır və rənglənir, bunun bir nümunəsi verilir. Nəticə Adobe Portativ Sənəd Formatındadır (PDF) və Adobe Illustrator kimi proqramlar tərəfindən redaktə edilə bilər.( İstinad: G. Conant & K. Woolfe. 2008. Bioinformatika 24:861-862).

myGenomeBrowser - bioloqlara genom brauzerlərini qurmaq, sorğulamaq və paylaşmaq üçün bir yol təqdim edən veb əsaslı mühitdir. JBrowse üzərində qurulan bu alət sistem administratorlarının müdaxiləsini sadələşdirərək və minimuma endirərkən istifadəçilərə daha çox muxtariyyət vermək üçün nəzərdə tutulub. İstifadəçilərə məlumatlarını sorğulamağa, təhlil etməyə və paylaşmağa imkan verən genom brauzerinin əsas xüsusiyyətlərini genişləndirdilər. ( İstinad: S. Carrere & J. Gouzy. Bioinformatika (2017) 33 (8): 1255-1257).

DNAPlotter - genomların dairəvi və xətti təsvirlərini yaratmaq üçün interaktiv Java proqramıdır. Artemis kitabxanalarından ardıcıl faylların (EMBL, GenBank, GFF) yüklənməsinin istifadəçi dostu üsulunu, eləcə də əlaqəli verilənlər bazalarından məlumatları təmin etmək üçün istifadə edərək, istifadəçi tərəfindən müəyyən edilə bilən ayrı-ayrı treklərdə göstərmək üçün maraq doğuran xüsusiyyətləri süzür. O, məqalələr və ya veb səhifələr üçün keyfiyyətli nəşr şəkilləri hazırlamaq üçün istifadə edilə bilər.( İstinad: Carver, T. et al. 2008. Bioinformatika 25:119-120)

GeneWiz (Danimarka Texniki Universiteti Bioloji Ardıcıllıq Təhlili Mərkəzi) aşağıdakı kimi xətti və ya dairəvi genom altazları istehsal edir. Onların əksər bakteriyalar üçün hazır adları var, lakin GenBank formatında (.gbk) fərdi məlumatları yükləməklə sizin genomunuzun genetik və fiziki xüsusiyyətlərini göstərən öz diaqramını yarada bilərsiniz.

OrganellarGenomeDRAW - istifadəçilərə GenBank faylları və ya keçid nömrələri kimi təqdim olunan həm dairəvi, həm də xətti şərhli genom ardıcıllığının yüksək keyfiyyətli vizual təqdimatlarını yaratmağa imkan verən proqram alətləri dəstidir. DNT ardıcıllığının bütün növləri giriş kimi qəbul edilsə də, proqram orqanella genomlarının xüsusiyyətlərini düzgün təsvir etmək üçün xüsusi olaraq optimallaşdırılmışdır. Son genişləndirmə transkript və ya zülal bolluğu məlumatları kimi kəmiyyət gen ifadəsi məlumatlarının birbaşa genom xəritəsinə çəkilməsini asanlaşdırır (İstinad: Lohse M, et al. 2013. Nucleic Acids Res. 41(Veb Server məsələsi):W575-81) .

PlasmaDNA - Birincil DNT ardıcıllığından başlayaraq, PlasmaDNA məhdudiyyət sahələrini, açıq oxu çərçivələrini, primer tavlama ardıcıllığını və müxtəlif ümumi domenləri axtarır. Verilənlər bazaları istifadəçi tərəfindən onun ən ümumi klonlama ehtiyaclarına uyğun olaraq asanlıqla genişləndirilə bilər. PlasmaDNA eyni vaxtda birdən çox ardıcıllığı idarə edə və qrafik şəkildə təmsil edə bilər və əgər varsa, ardıcıllığın sonundakı kənarları yaddaşda saxlayır. Bu o deməkdir ki, fraqmentləri virtual olaraq həzm etmək, həzm məhsullarını layihəyə əlavə etmək və yeni ardıcıllıqlar yaratmaq üçün uyğun ucları olan parçaları bir-birinə bağlamaq mümkündür. Plazmidlər üçün əla paket. (İstinad: Angers-Loustau A və başqaları. 2007. BMC Mol Biol. 2007 8:77).

GSDraw (Gen Structure Draw Server) gen strukturunun sxematik diaqramlarını çəkmək üçün gen ailəsi üçün veb serverdir. İstifadəçilər genomik, CDS və transkript ardıcıllıqlarını təqdim edə bilərlər. GSDraw bu məlumatdan gen strukturunu, zülal motivini və filogenetik ağacını əldə etmək üçün istifadə edir, sonra bunun üçün diaqram çəkir. (İstinad: Wang Y, et al. 2013. Nucleic Acids Res. 41(Verilənlər bazası məsələsi):D1159-66).

GECA, gen ekson/intron təşkilatını təmsil etmək və gen ailəsinin üzvləri arasında gen strukturunda dəyişiklikləri vurğulamaq üçün istifadəçi dostu bir vasitədir. Bu, CIWOG istifadə edərək müvafiq genlərdə ümumi intronların identifikasiyası ilə tamamlanan protein uyğunlaşmasına əsaslanır. GECA, ekzonların miqyaslanacağı gen strukturlarının nəticədə uyğunlaşdırılmış dəstini göstərən əsas qrafik təsviri yaradır. GECA-nın mühüm və orijinal xüsusiyyəti ondan ibarətdir ki, o, bu gen strukturlarını sonrakı genlər arasında ardıcıllıq oxşarlığını vurğulayan simvolik ekranla birləşdirir. Qeyd etmək lazımdır ki, gen strukturunun əlaqəli genlər arasında oxşarlıq əlamətləri ilə birləşməsi intronların qazanılması və ya itirilməsi ilə bağlı mümkün hadisələri tez müəyyən etməyə imkan verir və ya səhv struktur annotasiyalarına işarə edir. Çıxış şəkli elmi nəşrlər üçün istifadə oluna bilən portativ şəbəkə qrafikası formatında yaradılır. (İstinad: Fawal N, et al. 2012. Bioinformatika 28:1398-9).

GeneDesign - sintetik genlərin dizaynı üçün əla mənbədir. Buraya kodon optimallaşdırılması və məhdudlaşdırma yerlərinin aradan qaldırılması üçün alətlər daxildir (İstinad: Richarson, S.M. et al. 2006. Genome Research 16:550-556)

Orphelia - Orphelia naməlum filogenetik mənşəyi olan qısa, ekoloji DNT ardıcıllıqlarında zülal kodlayan genlərin proqnozlaşdırılması üçün metagenomik ORF tapma vasitəsidir. Orphelia, qrupumuz tərəfindən bu yaxınlarda təqdim edilmiş iki mərhələli maşın öyrənmə yanaşmasına əsaslanır. ORF-lərin ilkin çıxarılmasından sonra həmin ORF-lərdən xüsusiyyətləri çıxarmaq üçün xətti diskriminantlardan istifadə olunur. Sonradan, süni neyron şəbəkəsi xüsusiyyətləri birləşdirir və fraqmentdə hər bir ORF üçün gen ehtimalını hesablayır. Acgöz strategiya, üst-üstə düşmə məhdudiyyəti ilə yüksək bal toplayan ORF-lərin ehtimal birləşməsini hesablayır. (İstinad: K.J. Hoff et al. 2009. Nucl. Acids Res. 37(Veb server problemi: W101-W105).

WebMGA sürətli metagenomik analiz üçün fərdiləşdirilə bilən veb serverdir və buraya ORF çağırışı, ardıcıllıqla klasterləşdirmə, xam oxunuşların keyfiyyətinə nəzarət, ardıcıllıq artefaktlarının və çirklənmələrin aradan qaldırılması, taksonomik analiz, funksional annotasiya və s. kimi təhlillər üçün 20-dən çox istifadə olunan alətləri ehtiva edir. WebMGA-nın arxasında yerli kompüter klasterimizdə paralel işləmək üçün həyata keçirildi. (İstinad: Wu S, et al. 2011. BMC Genomics. 12:444).

MG-RAST (Metagenomics RAST) serveri ardıcıllıq məlumatlarına əsaslanaraq mikrob populyasiyaları haqqında kəmiyyət məlumatlarını təmin edən metagenomlar üçün avtomatlaşdırılmış analiz platformasıdır. Server ilk növbədə prokaryotik metagenomik ov tüfəngi nümunələri üçün yükləmə, keyfiyyətə nəzarət, avtomatlaşdırılmış annotasiya və təhlili təmin edir. (İstinad: Wilke A, et al. 2016. Nucleic Acids Res. 44(D1):D590-4).

Metagenomik Ardıcıllıqların MetaBin Kompleks Taksonomik Təyinatı (İnteqrasiya edilmiş Bioinformatika Laboratoriyası, RIKEN, Yaponiya) veb serveri və müstəqil proqramı həm Sangerdən, həm də sonrakılardan əldə edilən müxtəlif uzunluqlarda (&ge45 bp) tək və qoşa uclu ardıcıllığın oxunuşlarının daha sürətli və dəqiq taksonomik təyin edilməsinə imkan verir. -nəsil ardıcıllığı platformaları. Dərslik var.

AmphoraNet - metagenomik və genomik filotipləmə üçün 31 bakterial və 104 arxa zülal kodlayan marker genlərindən istifadə edir. Bunların əksəriyyəti tək nüsxə genlərdir, buna görə də AmphoraNet metagenomik ov tüfəngi ardıcıllığı məlumatlarından bakterial və arxeal icmaların taksonomik tərkibini qiymətləndirmək üçün uyğundur. (İstinad: Kerepesi C, et al. 2014. Gen. 533:538-40).

METAGENassist - istifadəçilərə müxtəlif ətraf mühit saytlarından və ya müxtəlif bioloji hostlardan bakterial siyahıyaalma məlumatlarını götürməyə və verilənlər üzərində hərtərəfli çoxşaxəli statistik təhlillər aparmağa imkan verir. Bu çoxvariantlı analizlər taksonomik və ya avtomatik yaradılan fenotipik etiketlərdən istifadə etməklə edilə və müxtəlif yüksək keyfiyyətli qrafik alətlərdən istifadə etməklə vizuallaşdırıla bilər. Bakterial siyahıyaalma məlumatları 16S rRNA məlumatlarından, NextGen ov tüfənginin ardıcıllığından və ya hətta klassik mikrob yetişdirmə üsullarından əldə edilə bilər. Dərslik daxildir. (İstinad: Arndt D, et al. 2012. Nucleic Acids Res. 40(Veb server məsələsi): W88-95).

Real vaxt metagenomikası (Dr. Robert Edvards, San Dieqo Dövlət Universiteti, ABŞ) - metagenom annotasiyasında növbəti inqilabdır: Real vaxtda məlumatların işlənməsi və təhlili.Nəhayət, heç bir gözləmə olmadan real vaxt rejimində metagenomu şərh edə bilərsiniz. Analiz üçün öz məlumatlarınızı yükləyə bilərsiniz. Onlar fasta və ya fastq fayllarını qəbul edir və siz zip və ya gzip sıxılmış məlumatları təqdim edə bilərsiniz.

EBI Metagenomics (EMBL-EBI) - nümunənin filogenetik müxtəlifliyi, eləcə də funksional və metabolik potensialı haqqında anlayışlar təmin etmək məqsədi daşıyan metagenomik məlumatların təhlili və arxivləşdirilməsi üçün avtomatlaşdırılmış boru kəməridir. Siz depoda olan bütün ictimai məlumatlara sərbəst şəkildə baxa bilərsiniz. Xidmət rRNASelector istifadə edərək rRNA ardıcıllığını müəyyən edir və Qiime istifadə edərək 16S rRNA üzərində taksonomik analiz aparır. Qalan oxunuşlar InterPro ardıcıllıq təhlili resursundan istifadə edərək proqnozlaşdırılan zülal kodlaşdırma ardıcıllığının funksional təhlili üçün təqdim olunur. InterPro ardıcıllıqları ailələrə təsnif etmək və funksional əhəmiyyətli domenlərin və saytların mövcudluğunu proqnozlaşdırmaq üçün diaqnostik modellərdən istifadə edir. Bu resursdan istifadə etməklə xidmət BLAST əsaslı funksional metagenomik analizlərə güclü və mürəkkəb alternativ təklif edir. EBI Metagenomics xidmətinə təqdim edilən məlumatlar avtomatik olaraq Avropa Nukleotid Arxivində (ENA) arxivləşdirilir. Ardıcıllıq məlumatları üçün qoşulma nömrələri verilir.

Kaiju - sıxılmış FASTA və ya FASTQ formatında nukleotid ardıcıllığını qəbul edən metagenomika üçün sürətli və həssas taksonomik təsnifatdır. Oxumalar NCBI taksonomiyasından və bakterial, arxeal və viral genomlardan olan zülal ardıcıllığının istinad verilənlər bazasından istifadə edərək birbaşa taksonlara təyin edilir. Varsayılan olaraq, Kaiju ya NCBI RefSeq-dən mövcud olan tam genomlardan, ya da NCBI BLAST tərəfindən istifadə edilən lazımsız protein verilənlər bazasının mikrobial alt dəstindən istifadə edir. Kaiju oxunanları amin turşusu ardıcıllığına çevirir, daha sonra zülal düzülüşündə uyğunsuzluqlara imkan verən maksimum dəqiq uyğunluqları (MEM) tapan Burrows-Wheeler transformunun yaddaşa qənaət edən tətbiqi üzərində dəyişdirilmiş geri axtarışdan istifadə edərək verilənlər bazasında axtarılır. (İstinad: Menzel P et al. 2016. (Nat. Commun. 7:11257)

PhyloPythiaS - siniflər arasında iyerarxik əlaqələrdən istifadə edən sürətli və dəqiq ardıcıllıq kompozisiyasına əsaslanan təsnifatçıdır. Veb server ilə taksonomik təyinatlar ümumi modellə və ya istifadəçilərin təyin edə və yarada biləcəyi nümunə-xüsusi modellərlə edilə bilər. Bir neçə interaktiv vizuallaşdırma rejimləri və çoxsaylı yükləmə formatları taksonomik tapşırıqların tez və rahat təhlilinə və aşağı axının işlənməsinə imkan verir. (İstinad: Patil KR, et al. 2012. PLoS One. 7:e38581).

Virtual Metagenom - 16S rRNA ardıcıllığından metagenomları yenidən qurmaq üçün veb server. geniş miqyaslı genomik ardıcıllıqdan istifadə etmədən ətraf mühit mikrob icmalarında virtual metagenomun sürətli və səmərəli yenidən qurulması üçün yeni bir üsul. Bu yanaşmanı virtual metagenoma bənzər təşkilatları yenidən qurmaq üçün tam ardıcıl genomlarla xəritələşdirilmiş denaturasiya qradiyenti gel elektroforez analizindən əldə edilmiş 16S rRNA gen ardıcıllığından istifadə edərək nümayiş etdiririk. (İstinad: Okuda S, et al. 2012. Nat Commun. 3:1203.)

MetaPhlAn2 (versiya 2.0.0) - növ səviyyəli qətnamə ilə metagenomik ov tüfəngi ardıcıllığı məlumatlarından mikrob icmalarının (Bakteriyalar, Arxeya, Eukaryotlar və Viruslar) tərkibinin profilini yaratmaq üçün hesablama vasitəsidir. O, həmçinin xüsusi ştammları müəyyən edə və bütün növlər üçün nümunələr arasında ştammları izləyə bilir. Bu, birmənalı taksonomik təyinatlara, orqanizmin nisbi bolluğunun dəqiq qiymətləndirilməsinə və bakteriya, arxeya, eukaryotlar və viruslar üçün növ səviyyəsində həll etməyə imkan verir. (İstinad: Segata N, et al. 2012. Nature Methods 8: 811&ndash814).

CoMet-Universe &mdash protein domen imzalarına əsaslanan metagenomların müqayisəli təhlili üçün veb-server. DNT ardıcıllığınızın yüklənməsindən başlayaraq CoMet boru kəməri genlərin proqnozlaşdırılması, Pfam 27 istifadə edərək protein domeninin aşkarlanması, KEGG yollarına əsaslanan metabolik profilləşdirmə və həyatın bütün sahələrində və viruslarda takson bolluğunun qiymətləndirilməsi daxil olmaqla, hərtərəfli metagenom analizi üçün bütün zəruri addımları yerinə yetirir. (İstinad: Aßhauer KP et al. Int J Mol Sci. 2014 15(7):12364-78).

16S Təsnifatı - metagenomik verilənlər toplusunda 16S rRNA hiperdəyişən regionlarının sürətli və dəqiq taksonomik təsnifatı üçün vasitədir. Həqiqi metagenomik məlumat dəstlərində o, filum səviyyəsində 99,7%-ə qədər, cins səviyyəsində isə 99,0%-ə qədər dəqiqlik göstərdi. (İstinad: N. Chaudhary et al. 2015. PLoS One 10(2): e0116106). Onu da buradan əldə etmək olar

DNAATLAS (DNA2.0 Inc., ABŞ) - Bütün ardıcıllığınız üçün bir yer. Genbank, Gen Designer, Excel, Word və demək olar ki, istənilən mətn əsaslı format daxil olmaqla, bütün konstruksiyalarınızı asanlıqla idxal edin. DNT Atlas dərhal yükləmə fayllarınızı təhlil edir və hər bir ardıcıllığın xüsusiyyət, konstruksiya, primer, DNT və ya amin turşusu olub-olmadığını müəyyən edir. Ardıcıllığınızda qeyd edilmiş funksiyaları və primerləri yükləyin. 1000-dən çox funksiyadan ibarət seçilmiş siyahımızla qeyd edilmiş konstruksiyaları dərhal nəzərdən keçirin və ya özünüz əlavə edin. Ardıcıllığınızı tez uyğunlaşdırmaq və müqayisə etmək üçün BLAST əsaslı ardıcıllıq axtarışından istifadə edin. Ardıcıllığınızı, xüsusiyyətlərinizi və primerlərinizi izləyin. Onları etiketlərdən istifadə edərək kateqoriyalara ayırın - dondurucu yerlərdən tutmuş xarakteristika məlumatlarına qədər. (qeydiyyat tələb olunur).

SuperPhy (Chad Laing və Vic Gannon, Kanada İctimai Səhiyyə Agentliyi) nin proqnozlaşdırıcı genomikası üçün onlayn vasitədir Escherichia coli. Platforma bütün ictimaiyyət üçün mövcud olan analiz alətlərini və genom ardıcıllığı məlumatlarını birləşdirir E. coli genomları yaradır və ictimai və ya özəl parametrlər altında istifadəçilərdən yeni genom ardıcıllıqlarının yüklənməsini asanlaşdırır. SuperPhy geoməkan və filogenetik kontekst daxil olmaqla, gərginlik metadatasına əsaslanan minlərlə genom ardıcıllığının real vaxt analizini təmin edir.

Bakteriofagınızın adlandırılması: Bu, bakterial virus icmasının üzvlərinin yeni təcrid olunmuş faqlarını düzgün adlandırmaları üçün böyük əhəmiyyət kəsb edir. Başlamaq üçün yaxşı yer "Fajınızı necə adlandırmaq və təsnif etmək olar: Qeyri-rəsmi bələdçi"dir." ( İstinad: Adriaenssens E & Brister JR. 2017. Viruslar 9(4). pii: E70) aşağıdakı məqamları əlavə edəcəyəm (a) təklif etdiyiniz adın artıq istifadə edilmədiyini yoxlayın və (b) bu ​​adlar olduğu üçün fajınızı Enterobacter ia phage ø1234 və ya Enterobacteria phage 2017/ABC_567 adlandırmayın. Beynəlxalq Virusların Taksonomiyası Komitəsi (ICTV) tərəfindən yeni növ və cins taksonlarının yaradılması ilə bir araya sığmır. Təklif etdiyiniz adın unikal olub olmadığını öyrənmək üçün məsləhətləşin:

Fag Adı Yoxlanışı (Stiven T. Abedon, Ohayo Dövlət Universiteti, ABŞ) - "sizin" faq adının hazırda Google Scholar, Google Books, PubMed və ya hətta Bakteriofaj Adları 2000-də tapılıb- tapılmadığını görmək.

CPT Phage Adı Axtarışı (Texas A&M Universitetində Phage Texnologiyaları Mərkəzi)


BLAST verilənlər bazası

Şübhəsiz ki, BLAST ilə tanış olan oxucular maraqlandılar: orada deyillər verilənlər bazaları BLAST axtarışlarında iştirak edən bir növ? Mütləq deyil. Gördüyümüz kimi, sadə FASTA faylları həm sorğu, həm də mövzu dəsti üçün kifayət edəcəkdir. Ancaq belə çıxır ki, hesablama baxımından sadə FASTA faylları asanlıqla axtarılmır. Beləliklə, BLAST+ makeblastdb adlı alət təqdim edir ki, o, mövzu FASTA faylını eyni məlumatın indekslənmiş və tez axtarılan (lakin insan tərəfindən oxuna bilməyən) versiyasına çevirir, eyni adlı fayl dəstində saxlanılır (çox vaxt .pin ilə bitən ən azı üç, .psq , və .phr zülal ardıcıllığı üçün, .nin , .nsq və .nhr isə nukleotid ardıcıllığı üçün). Bu fayl dəsti “verilənlər bazasını” təmsil edir və verilənlər bazası adı bu faylların paylaşılan fayl adı prefiksidir.

FASTA faylında makeblastdb-ni işə salmaq kifayət qədər sadədir: makeblastdb -in <fasta faylı> -out <məlumat bazası adı> -dbtype <type> -title <title> -parse_seqids , burada <type> prot və ya nüvələrdən biridir və <type>-dir. zəruri). -parse_seqids bayrağı göstərir ki, FASTA faylındakı ardıcıllıq identifikatorları verilənlər bazasına daxil edilməlidir ki, onlar çıxışlarda, eləcə də blastdbcmd (aşağıda müzakirə olunur) kimi digər alətlər tərəfindən istifadə oluna bilsinlər.

BLAST verilənlər bazası yaradıldıqdan sonra blastn et al. ilə digər variantlardan istifadə edilə bilər:

  • -db <verilənlər bazası adı>
    • Axtarış üçün verilənlər bazasının adı (-subject istifadə etməkdən fərqli olaraq).
    • Əgər onlar mövcuddursa, çoxnüvəli sistemdə <integer> CPU nüvələrindən istifadə edin.

    -db seçimindən istifadə edərkən BLAST alətləri verilənlər bazası fayllarını üç yerdə axtaracaq: (1) hazırkı iş kataloqu, (2) ev kataloqunuz və (3) $BLASTDB mühit dəyişənində göstərilən yollar.

    Alət blastdbcmd BLAST verilənlər bazaları haqqında məlumat əldə etmək üçün istifadə edilə bilər - məsələn, blastdbcmd -db <database name> -info - və verilənlər bazalarını blastdbcmd -list <path> ilə verilmiş yolda göstərə bilər (beləliklə, blastdbcmd -list $BLASTDB göstərəcək standart axtarış yollarında tapılan verilənlər bazası). Bu alət həmçinin çıxış fayllarında bildirilən ID-lər kimi məlumatlara əsaslanaraq verilənlər bazalarından ardıcıllıq və ya onlar haqqında məlumat çıxarmaq üçün istifadə edilə bilər. Həmişə olduğu kimi, BLAST kimi proqram təminatı üçün yardım və sənədləri oxumaq çox tövsiyə olunur.


    Fayl formatının çevrilməsi

    Tutaq ki, Fasta faylına çevirmək istədiyiniz GenBank faylınız var. Məsələn, GenBank kataloqu altında Biopython vahid testlərinə daxil olan cor6_6.gb faylını nəzərdən keçirək.

    Bio.SeqIO.parse() funksiyasından istifadə edərək faylı belə oxuya bilərsiniz:

    Qeyd edək ki, bu faylda altı qeyd var. İndi qeydləri çap etmək əvəzinə, bu GenBank faylını Fasta faylına çevirmək üçün SeqRecord iteratorunu Bio.SeqIO.write() funksiyasına keçirək:

    Və ya daha qısa şəkildə Bio.SeqIO.convert() funksiyasından istifadə etməklə (Biopython 1.52 və ya daha sonra), sadəcə olaraq:

    Bu nümunədə GenBank faylı belə başladı:

    Nəticədə Fasta faylı belə görünür:

    Qeyd edək ki, bütün Fasta faylı identifikator, təsvir və ardıcıllıqla saxlaya bilər.

    Format sətirlərini dəyişdirərək, bu kod istənilən dəstəklənən fayl formatları arasında çevirmək üçün istifadə edilə bilər.


    SNP saytları: multi-FASTA uyğunlaşmalarından SNP-lərin sürətli səmərəli çıxarılması

    Sürətlə azalan genom ardıcıllığı xərcləri prokaryotik populyasiya tədqiqatlarında istifadə edilən nümunələrin sayının mütənasib artmasına səbəb olmuşdur. Geniş bir genom düzülüşündən tək nukleotid polimorfizmlərinin (SNPs) çıxarılması indi adi bir işdir, lakin mövcud alətlər tədqiqatların həcminin artması ilə effektiv şəkildə miqyaslana bilmədi. Bu alətlər yavaşdır, yaddaş səmərəsizdir və qeyri-standart prosedurlarla quraşdırılır. təqdim edirik SNP saytları təvazökar resurslardan istifadə etməklə SNP-ləri çoxlu FASTA uyğunluğundan sürətlə çıxara bilər və aşağı axın təhlili üçün bir çox formatda nəticələr çıxara bilər. SNP-lər 59 MB RAM və 1 CPU nüvəsindən istifadə etməklə 267 saniyə ərzində 8,3 GB-lıq uyğunlaşdırma faylından (1842 takson, 22 618 sayt) çıxarıla bilər ki, bu da onu təvazökar kompüterlərdə işləməyi mümkün edir. Debian və Homebrew paket menecerləri vasitəsilə quraşdırmaq asandır və 20-dən çox əməliyyat sistemində uğurla sınaqdan keçirilmişdir. SNP saytları C dilində həyata keçirilir və açıq mənbə lisenziyası GNU GPL 3 versiyası altında mövcuddur.


    Fasta ardıcıllığından mutasiyaları çıxarın - Biologiya

    Məndə .fasta formasında çoxlu miqdarda zülal ardıcıllığı və hər biri eyni uzunluqda olan istinad ardıcıllığı var. Mən bu ardıcıllıqlardan yalnız amin turşusu mutasiyalarını çıxarmaq istərdim ki, sonda belə bir siyahıya sahib olmaq istəyirəm: I456L, W675T və s. Bunu etmək üçün proqram və ya hər hansı bir yol varmı? Minnətdar

    Pierre'nin tam həlli var, lakin bu işləmirsə, fərqi müəyyən edəcək və onu çıxaracaq -outfmt 3 ilə blastp istifadə edə bilərsiniz.

    Biopython blast analizatoru qalanını bitirməyə kömək edə bilər.

    bioalcidaejdk http://lindenb.github.io/jvarkit/BioAlcidaeJdk.html və ilk ardıcıllığın istinad olduğu fasta faylından istifadə:

    Pierre Lindenbaum Mən qat dist tapa bilmirəm, və bioalcidaejdk.jar çox. Bioalcidae qovluğunda bioalcidaejdk.java adlı fayl var.

    Quraşdırma təlimatlarına əməl etdinizmi:

    java kompilyatoru SDK 11. Zəhmət olmasa bu javanın $-da olduğunu yoxlayın. JAVA_HOME qurmaq kifayət deyil: (məsələn: https://github.com/lindenb/jvarkit/issues/23 )

    Genomax və Pierre Lindenbauma təşəkkür edirəm. JDK kompilyatorumla bağlı problemim var idi, sadəcə həll etdim, işə başladım və hər şey yaxşı getdi.

    Cavabınızı əlavə etməzdən əvvəl daxil olun.

    Bu saytdan istifadə İstifadəçi Müqaviləmizi və Məxfilik Siyasətimizi qəbul etmək deməkdir.