Məlumat

Nukleotid ardıcıllığında oxu çərçivələrinin sayı

Nukleotid ardıcıllığında oxu çərçivələrinin sayı



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Molekulyar biologiya sinfində bu sual verildi:

"5'... ATATGAATGATGACAT... 3' nukleotidlərinin ardıcıllığı ilə neçə oxu çərçivəsi başlayır?"


Hər bir nukleotid ardıcıllığının altı mümkün oxu çərçivəsi var, çünki hər bir kodon (bir amin turşusunu təyin edən) əsas üçlükdən (3 kadr) ibarətdir və kodlaşdırıla bilən tamamlayıcı bir zəncir var (3 tərs çərçivə).

Ardıcıllığınızdakı mümkün açıq oxu çərçivələrini tapmaq üçün başlanğıc kodonlarını axtarmalısınız. Yəni: ATG. Ancaq deyildiyi kimi, tamamlayıcı strand kodlaşdırma ola bilər. Beləliklə, əgər məlum ardıcıllığınızda CAT varsa, bu, əks teldə ATG olacaq və həm də açıq oxu çərçivəsi ola bilər.

İndi onları sayın və sonra cavabları müqayisə etmək üçün oxuyun.


Xüsusi ardıcıllığınız dörd başlanğıc kodonu ehtiva edir (3x ATG və 1x CAT, bu da ATG-ni tamamlayıcı tərsdə edir).

5'... AT ATG A ATG ATG PİŞİYƏ… 3'

3'… TA TAC T TAC TAC T GTA… 5'


TƏRCÜMƏ : DNT Zülal

SAYTLAR: Bütün altı oxu çərçivələrində tərcümə etməyə imkan verən bir sıra əla saytlar mövcuddur. Ardıcıllığınızdakı genləri müəyyən etməkdə ciddi maraqlanırsınızsa, vizualları və Pipeline və ya GeneMark sayəsində "ORF Finder"-ni tövsiyə edərdim. Sonuncu iki proqram uzun ardıcıllıqların təhlilinə icazə verir (qutuda olmayan əlavə ilə təqdim edin).

Frameshift səhvləri:

AMIGen
yol :: zülalın geri tərcüməsi və uyğunlaşdırılması - fərqliliyin çərçivə dəyişikliyi mutasiyalarının və əvəzetmələrinin nəticəsi olduğu uzaq protein homologiyalarının tapılması problemini həll edir. İki giriş zülal ardıcıllığını nəzərə alaraq, metod hər bir zülal üçün ehtimal olunan DNT ardıcıllığının tam dəstinin yaddaşdan səmərəli qrafik təsvirlərini manipulyasiya etməklə onları kodlayan DNT ardıcıllığının bütün mümkün cütlərini gizli şəkildə uyğunlaşdırır. (İstinad: Gîrdea M et al. 2010. Molekulyar Biologiya üçün Alqoritmlər 5:)

Sadə tərcümə vasitələri - DNT-dən zülal ardıcıllığına:

Oxu çərçivə tapıcısını açın (NCBI) - daxil etdiyiniz DNT ardıcıllığında açıq oxu çərçivələrini (ORF) axtarır. Proqram, protein tərcüməsi ilə birlikdə hər bir ORF-nin diapazonunu qaytarır. Potensial zülal kodlaşdırma seqmentləri üçün yeni ardıcıllaşdırılmış DNT-ni axtarmaq üçün ORF tapıcıdan istifadə edin, yeni hazırlanmış SMART BLAST və ya adi BLASTP istifadə edərək proqnozlaşdırılan zülalı yoxlayın.

Altı çərçivəli tərcümələr Tuebingen, Rusiya, Bioline və Science Launcher-də edilə bilər.

EMBOSS Sixpack (EMBL-EBI) - DNT ardıcıllığını oxuyur və vizual şəkildə üç irəli və (istəyə görə) üç tərs tərcüməni çıxarır. Alternativ olaraq EMBOSS Transeq istifadə edin

MBS Tərcüməçi (JustBio Alətləri) - Mükəmməl yeni saytdır, çünki xüsusi olaraq ATG-dən tərcümə oluna bilər və nəticələr amin turşusu ardıcıllığını örtən nukleotid ardıcıllığı ilə təqdim olunur. Əlyazmaya Kəsmək/Yapışdırmaq üçün idealdır. Bu pulsuz alətdən istifadə etmək üçün qeydiyyatdan keçməlisiniz. Digər sürətli tərcümə vasitələri burada və buradadır.

Tərcümə etmək (ExPASy, İsveçrə) - nukleotid (DNT/RNT) ardıcıllığının zülal ardıcıllığına çevrilməsinə imkan verən alətdir.

DNT-dən protein tərcüməsi (Bask Ölkəsi Universiteti, İspaniya) və burada.

Çox ardıcıllığın tərcüməsi:

Virtual Ribosom ( İstinad: R. Wernersson. 2006. Nucl. Acids Res. 34 (veb Server Problemi): W385-388) - Mən hesab edirəm ki, ilk iki saytın çıxışı çoxsaylı DNT ardıcıllığını tərcümə etmək üçün optimaldır.

RevTrans 1.4 Server (CBS, Danimarka Texniki Universiteti)

TranslatorX - zülal kodlayan nukleotid ardıcıllığını onların müvafiq amin turşusu tərcümələrinə əsaslanaraq uyğunlaşdırmaq üçün nəzərdə tutulmuş veb serverdir. TranslatorX yeniliklərinə aşağıdakılar daxildir: (i) bütün sənədləşdirilmiş genetik kodların istifadəsi və hər bir ardıcıllıq üçün müxtəlif genetik kodların təyin edilməsi imkanı (ii) müxtəlif çoxsaylı uyğunlaşdırma proqramlarının batareyası (iii) mümkün olduqda qeyri-müəyyən kodonların tərcüməsi (iv) yenilikçi meyar zülal məlumatlarına əsaslanan GBlocks ilə təmiz nukleotid düzülmələri və (v) zəngin çıxış, o cümlədən düzülmələrin Jalview ilə təchiz edilmiş qrafik vizualizasiyası, müvafiq amin turşularına görə rənglənmiş kodon əsaslı düzülmələr, kompozisiya meylinin ölçüləri və birinci, ikinci və üçüncü kodon mövqeyə xüsusi uyğunlaşmalar. (İstinad: Abascal F, et al. (2010) Nucleic Acids Res. 38: W7-13).


Frameshift mutasiyalarının effektləri

Frameshift mutasiyaları zülalın kodlaşdırma ardıcıllığında ən zərərli dəyişikliklərdən biridir. Onların polipeptid uzunluğunda və kimyəvi tərkibində genişmiqyaslı dəyişikliklərə səbəb olma ehtimalı olduqca yüksəkdir, nəticədə hüceyrənin biokimyəvi proseslərini tez-tez pozan qeyri-funksional zülal yaranır. Frameshift mutasiyaları mRNT-nin tərcüməsinin vaxtından əvvəl dayandırılmasına, eləcə də genişlənmiş polipeptidin əmələ gəlməsinə səbəb ola bilər.

Frameshift mutasiyasının aşağı axınında olan amin turşusu ardıcıllıqları da orijinal ardıcıllıqdan kimyəvi cəhətdən fərqli ola bilər. Məsələn, inteqral transmembran zülalında çərçivə dəyişikliyi mutasiyası baş verərsə, bu, lipid iki qatını əhatə edən hidrofobik qalıqların uzanmasını əhəmiyyətli dərəcədə dəyişdirə bilər və zülalın hüceyrəaltı yerdə olmasını qeyri-mümkün edir. Belə səhvlər baş verdikdə, hüceyrə tez-tez funksional zülalın çatışmazlığını dərk edir və mutasiyaya uğramış genin ifadəsini yuxarı tənzimləməklə kompensasiya etməyə çalışır. Bu, hətta hüceyrənin tərcümə mexanizmlərini alt-üst edə bilər, çoxlu sayda səhv qatlanmış zülallarla nəticələnə bilər ki, bu da nəticədə hətta hüceyrə ölümünün bütün funksiyalarının geniş miqyaslı pozulmasına səbəb ola bilər.

Genlərdə çərçivə dəyişikliyi mutasiyalarının səbəb olduğu xəstəliklərə Crohn xəstəliyi, kistik fibroz və bəzi xərçəng formaları daxildir. Digər tərəfdən, bəzi zülallar disfunksiyaya uğradıqda, tərkibində çərçivə dəyişikliyi mutasiyası olan kemokin reseptor geni (CCR5) olan insanlarda HİV-ə qarşı müqavimətdə göründüyü kimi, qoruyucu təsir göstərə bilər.

Çərçivə dəyişikliyi mutasiyalarının olmasının əsas səbəbi orqanizmin genetik məlumatı triplet əsaslı genetik kod vasitəsilə amin turşusu ardıcıllığına çevirmək mexanizmidir. Bu o deməkdir ki, mRNT-dəki hər üç nukleotid dəsti ya bir amin turşusu, ya da tərcüməni dayandırmaq üçün göstərişdir.

Genetik kodun kəşfi

Mendelin genetik xüsusiyyətlərin ötürülməsi ilə bağlı ilkin təcrübələri, genetik məlumat daşıyan diskret fiziki və kimyəvi varlığa işarə etdi. Hüceyrələrin kütləvi biokimyəvi analizinə əsasən, dörd əsas komponent - karbohidratlar, yağlar, zülallar və nuklein turşuları aşkar edilmişdir. Bu komponentlərdən hər hansı biri genetik materialı təmsil edə bilər.

Genomun kimyəvi təbiəti ilə bağlı ilkin araşdırmalar, 20 amin turşusu olan zülalların Mendel faktorlarını və ya genlərini daşıma ehtimalı yüksək olduğunu fərz edirdi. Lakin sonrakı təcrübələr göstərdi ki, nuklein turşuları genetik məlumatın daşıyıcısıdır. Bu, maraqlı bir çətinlik yaratdı. Nuklein turşuları kimyəvi cəhətdən 4 müxtəlif nukleotiddən ibarət polimerlər kimi təhlil edilsə də, bədəndəki göz qamaşdıran müxtəlif forma və funksiyalar haqqında məlumatın yalnız 4 nukleotiddən necə yarandığı aydın deyildi.

Üçlü Kodon

Bir az sonra, molekulyar biologiyanın mərkəzi doqması göstərdi ki, əksər orqanizmlər RNT-dən DNT və zülallar arasında vasitə kimi istifadə edirlər. Bu, dörd əsasın 20 amin turşusunu kodlaşdırmaq üçün məlumatı necə daşıya biləcəyi ilə bağlı növbəti sualı gündəmə gətirdi. Əgər hər bir nukleotid tək bir amin turşusu üçün kodlanırsa, onda yalnız dörd amin turşusu etibarlı və təkrar istehsal oluna bilən şəkildə kodlana bilərdi. Hər iki nukleotid bir amin turşusunu kodlasaydı, bu, yenə də yalnız 16 amin turşusuna səbəb olardı. Buna görə də 20 amin turşusunu kodlaşdırmaq üçün minimum üç nukleotid lazım idi.

Nukleotid tripletlərindən 64 permutasiya mümkündür, burada üçlükdəki hər mövqe 4 nukleotiddən biri ola bilər. Bu nukleotid üçlüyü kodon adlanırdı. Bu, həm də artıqlıq ideyasına səbəb oldu - hər bir amin turşusu birdən çox kodon üçlüyü ilə təmsil oluna bilər. Bəzi eksperimentlər həmçinin kodonların tərcümə maşını tərəfindən 3 əsasdan ibarət diskret parçalar kimi “oxuduğunu” aşkar etdi. Yəni, ribosomlar bu kodonları bir sıra üç hərfli sözlər kimi “görür”. Məsələn, bir RNT molekulunda AAAGGCAAG ardıcıllığı varsa, o zaman o, 3 kodondan AAG, GGC və AAG-dan maksimum 3 amin turşusunu kodlaya bilər.

Ribosomların köçürülməsi

Hər bir amin turşusu böyüyən polipeptid zəncirinə bağlandıqdan sonra ribosom üç əsas irəliləyir. Ribosomun hərəkət tərzi, çərçivə dəyişikliyi mutasiyalarının zərərli olmasının və zülal funksiyasına qeyri-mütənasib təsir göstərməsinin vacib səbəbidir. Məsələn, ribosom hər dəfə yalnız bir əsasla hərəkət edərsə, 9 nukleotiddən ibarət əvvəlki mRNT AAA, AAG, AGG, GGC, GCA, CAA və AAG kimi oxuna bilər və 7 amin turşusu olan bir polipeptid əmələ gətirir. Əgər ribosomların translokasiyası hər dəfə yalnız bir baza hərəkət etsəydi, tək nukleotidin daxil edilməsi amin turşusu ardıcıllığında kiçik bir dəyişikliklə nəticələnəcək və ola bilsin ki, polinükleotid uzunluğunda heç bir dəyişiklik olmayacaq.

Oxu çərçivələri

Əvvəlki nümunədə polinükleotid zənciri maksimum 3 amin turşusunu kodlaya bilər. Bununla birlikdə, yuxarı bölgələrdən asılı olaraq, uzanan qutular da yalnız 2 amin turşusu ilə nəticələnir. Yəni, ribosom əvvəlcə AAA əvəzinə AAG və ya AGG ilə eyniləşərsə, nukleotid polimeri fərqli şəkildə oxunur. Beləliklə, tərcümənin başlanğıc saytının mövqeyindən asılı olaraq, hər hansı kodlaşdırma ardıcıllığı 3 fərqli şəkildə oxuna bilər. Əksər DNT tamamlayıcı qoşa zəncirlərdən ibarət olduğundan, cəmi 6 fərqli “oxu çərçivəsi”nə gətirib çıxarır, onlardan yalnız biri son zülal üçün düzgün amin turşusu ardıcıllığı ilə nəticələnir.

Bununla belə, indel mutasiyası olduqda, oxunma çərçivəsində mutasiyanın aşağı axınında dəyişiklik olur. Bu, çərçivə dəyişdirmə mutasiyası ilə nəticələnir.


ORF Finder:

ORF finder NCBI saytında mövcud olan proqramdır. Bütün açıq oxu çərçivələrini və ya mümkün protein kodlaşdırma bölgəsini ardıcıllıqla müəyyən edir. Bu, mümkün oxu çərçivələrindən birinə uyğun gələn 6 üfüqi çubuğu göstərir. DNT-nin hər istiqamətində 3 mümkün oxu çərçivəsi olardı. Beləliklə, hər DNT ardıcıllığı üçün cəmi 6 mümkün oxu çərçivəsi (6 üfüqi çubuq) olacaqdır. 6 mümkün oxu çərçivəsi əks teldə +1, +2, +3 və -1, -2 və -3-dür. Nəticədə amin turşuları saxlanıla bilər və oxşar ardıcıllıqları və ya amin turşularını tapmaq üçün partlayışdan istifadə edərək müxtəlif zülal verilənlər bazalarında axtarış edə bilərsiniz. Nəticə mümkün protein ardıcıllığını və açıq oxu çərçivəsinin uzunluğunu və s. göstərir.


Müzakirə

Pre-genomik dövrdə genom başına genlərin sayı müxtəlif texnikalar əsasında proqnozlaşdırılırdı və bəzən müəyyən bir növün qəbul edilən “mürəkkəbliyi” ilə tənzimlənən digər növlərdən ekstrapolyasiya edilirdi. Beləliklə, insan genomunun 100.000-dən çox gen ehtiva edəcəyi proqnozlaşdırılırdı [39]. Təəccüblüdür ki, genom ardıcıllığı və genom annotasiyasından sonra bu rəqəm bu hesablamanın dörddə birinə düşdü [40]. In Drosophila, annotasiya xromosomlara uyğunlaşdırılmış 13,907 protein kodlaşdıran geni göstərdi (2011-ci ilin oktyabrında əldə edilmiş FlyBase buraxılışı 5 [21]), bu, xromosom zolaqlarının sayına və müəyyən edilmiş bölgələrin doyma mutagenezinə əsaslanan köhnə təxminlər arasındadır (5000 gen) [41] ] və təkrar olunmayan DNT tərkibinin qiymətləndirilməsinə əsaslananlar (80.000 gen) [42], [43]-də nəzərdən keçirildiyi kimi. Az sayda genlə çox sayda funksiyanı necə yerləşdirə bilərik? Bir neçə cavab təklif edilmişdir: mürəkkəb genetik qarşılıqlı təsirlər, alternativ splicing və qeyri-protein kodlayan genlər [44]. Daha az müzakirə edilən başqa bir ehtimal, qeyri-kanonik kodlaşdırma ardıcıllığının genom annotasiya boru kəmərlərindən aşkarlanmadan qaçması ola bilər. Artıq insanlarda və siçanlarda böyük sayda RNT "kodlaşdırılmayan" hesab olunur (məlumatları KODLA). Ola bilər ki, bunların çoxu həqiqətən tərcümə edilmiş və funksional smORF-ləri kodlayır. Məsələn, insanlarda təkamül sürətlənməsinə məruz qalmış və buna görə də insana xas xüsusiyyətlərin əldə edilməsində iştirak etmək üçün namizəd kimi qəbul edilən ehtimal kodlaşdırılmayan HAR1F geni [45] özündə bir neçə smORF (JP Couso, dərc olunmamış müşahidələr) ehtiva edir. Əslində, ehtimal olunan smORF-lər orta hesabla hər 400 bp-də bərabər paylansaydı, bizdə tapdığımız kimi Drosophila, əksər kodlaşdırmayan RNT-lərdə smORF-lər olmalıdır.

Maya genomu annotasiyası üçün proqramlar ilkin olaraq 100-dən az kodon üçün kodlaşdıran ardıcıllığı istisna etsə də [1], maya smORF genlərinin mövcudluğu üçün ən yaxşı öyrənilmiş genom olaraq qalır [46-49]. smORF axtarışçıları kiçik ORF-lərin ilkin skrininqi üçün hesablama metodlarından istifadə etdilər və daha sonra müxtəlif ifadə identifikasiya üsullarından istifadə edərək smORF-lərin ifadə edilib-edilmədiyini yoxladılar [18]. Bu yaxınlarda, Kastenmayer və b. [19] tərcümə və ya transkripsiyanın sübutu ilə ədəbiyyatdan bütün potensial smORF-ləri topladı və belə nəticəyə gəldi ki, S. cerevisiae genomda 299 potensial funksional smORF var ki, bu da mayadakı genlərin 5%-ni təşkil edir. Bunlardan ən azı 168-də (Cədvəl 4-də sınaqdan keçirilmişlərin 67%-i) peptidlərə çevrilməsinin sübutu tapıldı.

genomunun son araşdırması A. thaliana transkripsiya və ya təmizləyici seçim üçün dəlil göstərən 3241 smORF aşkar etmişdir [11]. Bu təxmin Hanada maya ilə müqayisədə daha böyük bir sifarişdir və b. [11] transkripsiya və ya amin turşusu ardıcıllığının qorunub saxlanması (Ka/Ks < 1 testinin versiyası) ilə smORF-ləri birləşdirərək 3,241 smORF geninin sayına çatır. Ona görə də biz hesab edərik ki, bu rəqəm bizim 4561 qorunan smORF-ə bənzər maksimum təxmindir. Bununla belə, Hanada və b. həm transkripsiyası, həm də amin turşusunun qorunub saxlanması sübutu olan smORF-lərin faktiki sayının 941-dir. Ərəbidopsis genlər, mayada nəzərdə tutulan fraksiyaya bərabərdir. Bu günə qədər bu təxminlərin heç bir funksional təsdiqi bildirilməyib.

Fritin öyrənilməsi və b. [28] RIKEN-də smORF-ləri aşkar etmək üçün əvvəlcə prokaryot genomları üçün nəzərdə tutulmuş CRITICA gen aşkarlama proqram paketinin modifikasiyasından istifadə etmişdir. Musculus cDNA kolleksiyası. CRITICA-nın kodlaşdırma ardıcıllığını müəyyən etmək üçün giriş nöqtəsi növlər arasında ardıcıllıq oxşarlığı və xüsusilə ehtimal olunan ORF-lərin kodlaşdırma məzmununun qorunmasıdır. Beləliklə, bu tədqiqat bizim öz boru kəmərimizlə müqayisə edilə bilər, beləliklə ardıcıllıqla oxşarlıq, kodlaşdırmanın qorunması və transkripsiyanın sübutu smORF funksionallığının göstəriciləri hesab olunur və onların aşkarlanması üçün filtr kimi istifadə olunur. Buna görə də maraqlıdır ki, Frith tərəfindən siçanda tapılan ehtimal olunan yeni smORF kodlaşdırma ardıcıllığının həcmi və b. 100-dən çox amin turşusu olan ORF-lərə malik olan kanonik genlərin artıq qeyd edilmiş hissəsinin 5%-də yenə çox oxşardır. Bu fraksiyanın əsaslandığı smORF-lərin ümumi sayı (1,240) az qiymətləndirilə bilər, çünki kiçik cDNA-lar cDNA kolleksiyalarından xaric edilir (çünki onlar kəsilmiş cDNA-ları təmsil edə bilər), lakin Frith və b. [28] smORF tərkibli cDNA-larının ölçü bölgüsündə heç bir qərəz aşkar etmədilər. Həmin araşdırmada müəlliflər bu yeni smORF nümunələrinin tərcüməsini qiymətləndirdilər və qiymətləndirilən 25 smORF-dən 14-ü (56%) üçün tərcümə dəlili tapdılar, bu hissədə tapılana çox oxşar bir hissə. S. cerevisiae (67%). Tətbiq olunan üsulların (siçan və milçəklərdə yaşıl flüoresan zülal etiketləməsi və mayada etiketləmə və proteomikanın qarışığı) hələ də yalan neqativlər yarada biləcəyini nəzərə almaq vacibdir. Bu fraksiyaları eukariotlarda real smORF-lərin ümumi sayı üçün korrektor kimi tətbiq etdikdən sonra belə, rəqəmlər hələ də şərh edilmiş zülal kodlaşdıran genlərin təxminən 2-3,5%-ni, yəni hər bir orqanizm üçün bir neçə yüz yeni kodlaşdırma ardıcıllığını saxlayır (Cədvəl 4).

Əvvəllər digər eukariotlarda (Cədvəl 4-də ümumiləşdirilmiş) həyata keçirilən bu üç smORF axtarışı nəticəsində əldə edilən ümidverici nəticələr bizi SMORF-lər üçün axtarış aparmağa sövq etdi. Drosophila. The Drosophila genom ən yaxşı şərh edilənlərdən biri hesab olunur [20, 50-53], lakin bizim araşdırmamız göstərir ki, digər eukariotlarda olduğu kimi smORF-lərin olduqca oxşar bir hissəsi genom annotasiya səyləri ilə aşkarlanmaqdan qaça bilər və funksional genlərin mühüm mənbəyi ola bilər. Cədvəl 4). Üçün proqramlar Drosophila's genom annotasiyası smORF-lərə malik genləri öz proqnozlarından tamamilə kənarlaşdırmır, lakin qısa kodlaşdırma ardıcıllığının proqramların kəsilmə hədlərindən qaça biləcəyi irəli sürülür [20]. Bu yaxınlarda bu 100 amin turşusu həddinin aşağı salınması uzunluğu 50 amin turşusundan yuxarı təxminən 700 ehtimal smORF-nin əlavə edilməsinə səbəb oldu (2010-cu ilin mayında əldə edilmiş FlyBase buraxılışı 5 [21]), lakin bunların əksəriyyəti izoformalara və ya kəsilmiş cDNA-lara aiddir. kanonik uzun genlərdən ibarətdir və burada müəyyən etdiyimiz smORF-lərlə üst-üstə düşmür (V Pereira və JP Couso, dərc olunmamış müşahidələr). Yenə də təsdiq etdik ki, bunlardan ən azı 25-i uyğun gəlir vicdanlı Tərcümənin proteomik sübutu və 42 ilə 99 amin turşusu arasında dəyişən ölçüləri olan smORFs (Cədvəl 3). Nəhayət, biz bu yaxınlarda xarakterizə etdik tal 11-32 amin turşusundan ibarət smORF-ləri kodlayan gen tapdı və bu peptidlərin inkişaf zamanı mühüm hüceyrə siqnal funksiyalarını yerinə yetirdiyini göstərdi [22-24]. Bu nümunələrə əlavə olaraq, biz burada daha yüzlərlə funksional smORF-nin mövcudluğuna dair sübutlar təqdim edirik.

Nə qədər DrosophilasmORFs həqiqətən funksionaldır?

Ardıcıllığın qorunması, onu təsadüfi qorunmadan ayırmaq üçün müvafiq nəzarətə məruz qaldıqda, funksionallığın qəbul edilmiş əlamətidir. D. psevdoobscuraD. melanoqaster təqribən 25-55 milyon il əvvəl ayrılıb və neytral ardıcıllıqları sındırmaq üçün kifayət qədər divergensiyadan keçib, lakin funksional qorunmanı maskalamaq üçün kifayət qədər böyük deyil [27]. Bütün ORF-nin mühafizəsi, başlanğıcdan dayanana qədər, kifayət qədər sərt filtr kimi görünür, çünki i) ilkin tBLASTn axtarışı daha az sərtləşdirildikdə sağ qalan smORF-lərin sayı artmır ii) sağ qalan smORF-lər çox yüksək sayda sintenik qorunma göstərir və iii) 4,561 qorunmuş smORF-in ölçü bölgüsü başlanğıc hovuzlardan və təsadüfi idarəetmələrdən əhəmiyyətli dərəcədə fərqlidir, halbuki o, əlavə filtrlər tətbiq edildikdən sonra dəyişmir (Əlavə fayl 1). Təxminən 4500 smORF, buna görə də, funksional smORF-lərin sayının yuxarı təxminini təşkil edə bilər. Drosophila, Hanada ilə uyğun olacaq və b. [11] təxmini 3,241 smORFs Ərəbidopsis.

Mübahisə edilə bilər ki, sintenik konservasiya (yəni genomun homoloji bölgələrində qorunma) həqiqi konservasiyanı (ehtimal ki, funksional əhəmiyyətə görə) sadə oxşarlıqdan (ehtimal ki, təsadüf nəticəsində) fərqləndirmək üçün qəti meyar kimi qəbul edilməlidir. Lakin sinteniyanın olmaması fərdi gen translokasiyası ilə bağlı ola bilər. Maraqlıdır ki, əvvəllər annotasiya edilmiş və proteomika ilə təsdiqlənmiş 25 smORF-nin demək olar ki, 50%-i sintenik mövqelərdə qorunmur. D. psevdoobscura (Cədvəl 3). Eynilə, 178 smORF-lərimiz başlanğıc və dayanma kodonları ilə qorunur D. psevdoobscura, Ka/Ks < 0.1-ə malikdir və transkripsiyaya dair çoxsaylı sübutlara malikdir, lakin onlar sintenik mövqelərdə qorunub saxlanılmış kimi görünmür (Şəkil 4). Qeyd edək ki, hər iki bu 25 smORF, üstəlik bizdə ayrıca funksiya sübutu olan digər 6-sı (E Magny və JP Couso, dərc olunmamış müşahidələr) 2 kb-dan az transkriptlərə aiddir, ola bilsin ki, kiçik smORF-kodlaşdırma transkriptləri kanonik analoqlarından daha mobildir. . Bu faktları nəzərə alaraq, biz ehtimal olunan funksional smORF-lərin yuxarı qiymətləndirilməsi üçün sinteniyanı nəzərdən keçirməməyi qərara aldıq, lakin mühafizəkar qiymətləndirməmizi yaratmaq üçün onu meyarlar sırasına daxil edək.

Mühafizəkar yanaşmadan sonra biz belə bir mövqe tutduq ki, funksional smORF həm də amin turşusu ardıcıllığının saxlanması və transkripsiyasının sübutunu göstərməlidir. Buna görə də biz əvvəlcə bu konservləşdirilmiş 3144 sintetik smORF-də ardıcıllığın qorunması modelini öyrəndik və müşahidə etdik ki, 1075 smORF Ka/Ks balını < 0.1 göstərir ki, bu da onları 10% FDR ilə təsadüfi konservasiyadan fərqləndirir. Sonra biz bu 1075 smORF və transkripsiya edilmiş bölgələr arasındakı yazışmaları qiymətləndirdik. Drosophila genom. Yenə mühafizəkar meyardan istifadə edərək, biz müşahidə edirik ki, bu smORF-lərdən 401-i bir neçə dəfə transkripsiya edilmiş fraqmentləri üst-üstə düşür. Beləliklə, bu 401 smORF funksional olmaq üçün çox güclü namizədlərdir, çünki onlar həm transkripsiyanın, həm də amin turşusunun qorunmasının sübutunu təqdim edir (faktik ardıcıllıqlar üçün Əlavə fayllar 3 və 4-ə baxın). Əl ilə kurasiya və funksional tədqiqatları gözləyən ilkin klasterləşdirmə təhlilimiz göstərir ki, bu 401 smORF 383 müxtəlif transkriptə aid ola bilər və buna görə də təxminən 380 smORF ehtiva edən genlərin sayı üçün bizim aşağı təxminimizdir. Drosophila. Bununla belə, bunlar düzgün qiymətləndirilməmiş ola bilər. Birincisi, Manakın eksperimental məlumatları və b. [36] və burada transkripsiyanı müəyyən etmək üçün istifadə etdiyimiz modENCODE yalnız embriogenez zamanı ifadə edilən transkriptləri aşkar edir. O, transkripsiya baxımından aktiv və beyin və cinsi vəzilər kimi spesifik transkriptlərlə zəngin orqanlar da daxil olmaqla, yalnız həyat dövrünün sürfə və ya yetkin fazaları zamanı ifadə edilən transkriptləri buraxır. Bundan əlavə, embriogenez zamanı transkripsiyanın yüksək məhsuldarlıqla aşkarlanması mütləq deyil, lakin qaçılmaz eksperimental məhdudiyyətlərə məruz qalır. Beləliklə, embrionun yalnız bir neçə hüceyrəsində ifadə olunan genlər təmsil olunmaya bilər (E Magny və JP Couso, nəşr olunmamış müşahidələr). İkincisi, Ka/Ks testi qısa ardıcıllıqla məhdud faydalıdır və Ka/Ks < 1 limiti ilə 9%-ə qədər yalan neqativ [38] yaradır. 10% FDR əldə etmək üçün biz testi aşağı salmalı olduq. Ka/Ks 0,1 ilə məhdudlaşdırır ki, bu da daha uzun zülal ardıcıllığı üçün istifadə olunan adi < 1-dən bir dərəcə aşağıdır və əlavə 1,868 smORF-i buraxır (Cədvəl 2). Ka/Ks > 1 olan 314 smORF-nin adaptiv təkamüldən keçən orijinal tərcümə edilmiş kodlaşdırma ardıcıllığı ola biləcəyi də mümkündür [54]. Nəhayət, transkripsiya, sinteniya və Ka/Ks < 0.1 sübutu olan 401 smORF-nin orta uzunluğu və populyasiya ölçüsünün paylanması sinteniya, transkripsiya və Ka/Ks < 0.1 sübutu olmayan 4561 qorunmuş smORF-dən əhəmiyyətli dərəcədə fərqlənmir. (Şəkil 2 Əlavə fayl 1), transkripsiya və ya zülal ardıcıllığının qorunub saxlanmasına dair heç bir cari dəlil olmayan bəzi smORF-lərin aşağı səviyyələrdə və ya inkişafın və həyat tarixinin hələ tam öyrənilməmiş mərhələlərində transkripsiya oluna biləcəyini təklif edir. Ümumilikdə, Ka/Ks, transkripsiya və sinteniya təhlilindən əldə etdiyimiz nəticə budur ki, bizim təxminlərimizdə təxminən 400 funksional smORF Drosophila möhkəmdir, lakin bəlkə də çox mühafizəkardır. Daha az mühafizəkar nəticə odur ki, 4561-ə qədər funksional smORF mövcud ola bilər. Bu rəqəmlər arasında nəzərə alınan faktiki filtrlərdən və kəsilmə dəyərlərindən asılı olaraq digər təxminlər mümkündür (hər bir filtrin tətbiqi nəticələrinin və bu filtrlər arasında müxtəlif üst-üstə düşmələrin bölgüsü üçün Şəkil 4-ə baxın).

İstənilən halda, 400 smORF-dən aşağı olan təxmin hazırda şərh edilmiş protein kodlaşdıran genlərin təxminən 3%-ni təşkil edir və 5%-lik təxminlərə uyğundur. Sakkaromislər [19], Muş [28] və mühafizəkar Ərəbidopsis təxmin etmək. Buna görə də biz funksional smORF-lərin sayı üçün bu mühafizəkar qiymətləndirməyə üstünlük veririk Drosophila.

SmORF funksionallığının əlavə sübutunun əldə edilməsi

Konservləşdirilmiş 401 smORF-in tam genom annotasiyası, o cümlədən əl ilə kurasiya D. psevdoobscura, üst-üstə düşən transkriptlər və Ka/Ks < 0.1 ilə, onların aid olduğu gen modellərini yaratmaq üçün zəruri gələcək addımdır, lakin onların funksionallığı və ya tərcüməsi ilə bağlı qəti sübut təqdim etməyəcək, bu da yalnız eksperimental yoxlamadan əldə edilə bilər.

Biz hesablama axtarışımızın məhdud eksperimental funksional təsdiqini təqdim edirik, əvvəllər dərc edilmiş tədqiqatların müşahidələrini birləşdiririk və nəticələr hesablama təxminlərimizi təsdiqləyir. Şərhdə 25 smORF üçün peptidlər D. melanoqaster Ölçüləri 42-dən 99-a qədər olan genom proteomik üsullarla təcrid edilmişdir və onların tərcüməsinin birbaşa və birmənalı sübutunu təqdim edir. Bəzi hallarda bu smORF-lər çox eksonlu transkriptlərin birləşdirilməsindən sonra yaranır və bu, tətbiq edə biləcəyimiz filtrlərin sayını məhdudlaşdırır. Bununla belə, müşahidə oluna bilər ki, transkripsiya edilmiş ardıcıllıqla çoxsaylı üst-üstə düşmə sübutları istisna olmaqla, bu smORF-lərin çoxu bizim tBLASTn E-dəyəri < 10 -3, sintetik qorunma və Ka/Ks < 0,1 filtrlərimizdən hər hansı birini keçir (Cədvəl 3). ). Boru kəmərimizin bu sınağı onun sərt olduğunu göstərir və bizim 401 funksional smORF-in təxminini təsdiqləyir. Drosophila mühafizəkar kimi.

Mümkündür ki, 100-dən az amin turşusunun peptidlərini aşkar etmək üçün xüsusi hazırlanmış yeni proteomik yanaşmalar [55, 56] bu 401 smORF-in tərcüməsi üçün qəti sübut təqdim edə bilər. Bununla birlikdə, böcəklərdə müvəffəqiyyətli peptidomik yanaşmalar, o cümlədən Drosophila, yalnız bir neçə halda bildirilmişdir və yalnız orqan-orqan və mərhələ-mərhələ cəhd edilə bilər [57-59]. Yenə də, bu cür proteomika və peptidomika tədqiqatları müntəzəm olaraq qeyd olunanlarla uyğunlaşdırıla bilməyən çox sayda “yetim” ehtimal ardıcıllığını aşkar edir. Drosophila zülallar [40, 56, 60]. Problem yüksək inamlı ardıcıllıqlar əldə etmək üçün proteomik boru kəmərləri üçün daha az ardıcıl imza (həzm yerləri və s.) təklif edən çox qısa peptidlərlə daha ciddidir. Bu yetim ardıcıllıqlar artefakt ola bilər və ya şərhsiz funksional smORF-lərin məhsulları ola bilər.

Bu smORF-lərin funksionallığı üçün alternativ bir sübut Drosophila genetik analizlərlə əldə edilə bilər. Tək smORF genetik tədqiqatları funksional smORF-ləri dəqiq səciyyələndirə bilər və onların aid olduğu gen modellərini yaratmaq üçün vacibdir [22-24], lakin metodlar, xərclər və vaxt məhdudiyyəti səbəbindən bütün genom taramasına genişləndirilə bilməz. Halbuki funksional genetik analiz adi haldır D. melanoqaster, standart genetik üsullar hazırda yalnız tədqiqat konsorsiumu tərəfindən cəhd edilə bilən yüzlərlə lokusun təhlili üçün uyğun deyil. Hətta mayada S. cerevisiae, daha yüksək sürəti və manipulyasiya asanlığı ilə Kastenmayer və b. [19] oxşar şəkildə əvvəlki tədqiqatlardan əldə edilən məlumatları və öz mutasiya səylərini birləşdirdilər və yalnız 247 smORF mutantından 22-də mutant böyümə fenotipini aşkar edə bildilər. Digər fenotip növləri qiymətləndirilməmişdir, lakin görünür, bu aşağı eukariotda məlum funksiyaları olan smORF-lərin hissəsini artırmaq üçün daha ətraflı tədqiqatlara ehtiyac var (çünki oxşar böyümə fenotipini göstərən kanonik genlərin hissəsi cəmi 25% təşkil edir [4] ). Maraqlıdır ki, 18,873 mutant allel tərəfindən müəyyən edilən heyrətamiz sayda (16,383) ehtimal olunan lokuslar hələ də heç birinə uyğunlaşdırılmayıb. Drosophila gen (FlyBase [21], FB2010_05 buraxılış 5 qeydi, 2010-cu ilin mayında əldə edilib). Bu mutantların bir neçəsi, ehtimal ki, kanonik genlərin itirilmiş allellərinə uyğundur. Bununla belə, onların əhəmiyyətli bir hissəsi əslində smORF-lər də daxil olmaqla, şərh edilməmiş genlər və kodlaşdırma ardıcıllığı ilə əlaqələndirilə bilər.

Beləliklə, çox güman ki, smORF-lərin tərcüməsi və funksionallığı üçün eksperimental sübut əldə etmək üçün xüsusi tədqiqat səylərinə ehtiyac var. Drosophila, ehtimal ki, genetik manipulyasiya asanlığı və geniş genom annotasiyası səbəbindən bunun üçün ən uyğun olan daha yüksək eukaryot modeli. Tək bir smORF kodlaşdıran genin analizinin nəticələrinə əsasən, bu müəssisə səy göstərməyə dəyərdi. tarsalsızHəyatın bir neçə mərhələsində görkəmli əsas funksiyaları olan və kodlaşdırılmış peptidləri hüceyrə siqnalları kimi işləyir [22-24] və antibakterial və ya cinsi peptidlər kimi digər smORF məhsullarının mühüm funksiyaları [60, 61]. Əgər burada təqdim olunan bioinformatika axtarışının nəticələri, beləliklə, sonrakı proteomik və funksional tədqiqatlarla təsdiqlənirsə. Drosophila, bu, xərc və vaxtın daha böyük məhdudiyyətlər olduğu onurğalılarda oxşar funksional tədqiqatlara haqq qazandırar. Funksional olaraq tərcümə edilmiş smORF-lər və smORF-kodlayan genlərin indi mövcud olduğu göstərilmişdir SakkaromislərDrosophila, onların onurğalılarda da olma ehtimalı var. Biz mütləq fərdi smORF-lərin onurğalılarda qorunub saxlanacağını gözləmirik (digər şeylərlə yanaşı, onların kiçik ölçüləri uzaq növlər arasında homoloqların hesablama identifikasiyasını çətinləşdirir, əgər qeyri-mümkündür), lakin biz smORF-ləri kodlayan yeni gen sinfinin yeni bir gen təqdim etməsini gözləyirik. sinif, cari genom annotasiyalarına yüzlərlə və hətta minlərlə əlavə kodlaşdırma ardıcıllığı əlavə edir.


ORF-açıq oxu çərçivəsi?? - (Sentyabr/11/2004)

ORF bir başlanğıc (metionin ATG) kodonu ilə başlayan və mənasız bir kodonla bitən bir DNT parçasıdır. Hər bir DNT parçasının hər istiqamətdə üçü olmaqla altı mümkün oxu çərçivəsi var. İstifadə olunan oxu çərçivəsi hansı amin turşularının bir gen tərəfindən kodlanacağını müəyyənləşdirir. Bir genin tərcüməsində (eukariotlarda) adətən yalnız bir oxu çərçivəsi istifadə olunur və bu, çox vaxt ən uzun açıq oxu çərçivəsidir. Açıq oxu çərçivəsi məlum olduqdan sonra DNT ardıcıllığı onun müvafiq amin turşusu ardıcıllığına çevrilə bilər. Açıq oxu çərçivəsi əksər növlərdə atg (Met) ilə başlayır və dayanma kodonu (taa, tag və ya tga) ilə bitir.

Bir DNT ardıcıllığından ORF-ni proqnozlaşdırmaq üçün istifadə edilə bilən bir çox onlayn vasitə var.

Cavab verdiyiniz üçün çox şadam! və köməyinizə görə təşəkkür edirəm, lakin ORF haqqında daha çox şübhələrim var. ümid edirəm fikirlərinizi mənimlə bölüşə bilərsiniz!

1. oxu çərçivəsi və açıq oxu çərçivəsi eyni sözdürmü? bu məni çaşdırır
cox!

2. Niyə onlar "oxuyan çərçivə" dan əvvəl "open" əlavə etməlidirlər?

3. bundan başqa açıq oxu çərçivəsi aktiv gendirmi?

Təəssüf edirəm ki, bunu aydınlaşdıra bilmədim.

Oxu çərçivəsi bir sıra üçlüklər kimi nukleotid ardıcıllığını oxumağın üç mümkün yolundan biridir. Açıq oxu çərçivəsi potensial olaraq proteinə çevrilə bilən Oxu çərçivəsidir.

Proqnozlaşdırılan açıq oxu çərçivəsi həmişə mövcud proteini təmsil etmir.

onda siz demək istəyirsiniz ki, açıq oxu çərçivəsi peptidi kodlaşdırmaq potensialına malik bir növ oxu çərçivəsidir?

"Açıq" hissəsi oxu çərçivəsi daxilində dayanma kodonunun olmamasına aiddir.

Praktiki baxımdan bir zülalı kodlaya bilən DNT ardıcıllığı əldə edəndə onu vektor NTi adlı bəzi proqram təminatı vasitəsilə işlədirəm. Bu, 6 mümkün (3 irəli/3 geri) üçlü çərçivədə ORF-ləri axtarır. Varsayılan olaraq, bir ORF başlanğıc kodonu (ATG və ya GTG) ilə başlamalı və ən azı 300 kodon (900bp) davam etməli və dayanma kodonunda (TAA TGA TAG) bitməlidir. Adətən 5 çərçivənin kifayət qədər uzun ORF-ləri olmur (yəni qapalı oxu çərçivələri, qısa müddət sonra dayanacaqları olan kodonlara başlayır) və çərçivələrdən yalnız biri ORF yaradacaq.

"Açıq" hissəsi oxu çərçivəsi daxilində dayanma kodonunun olmamasına aiddir.

Praktiki baxımdan bir zülalı kodlaya bilən DNT ardıcıllığı əldə edəndə onu vektor NTi adlı bəzi proqram təminatı vasitəsilə işlədirəm. Bu, 6 mümkün (3 irəli/3 geri) üçlü çərçivədə ORF-ləri axtarır. Varsayılan olaraq, bir ORF başlanğıc kodonu (ATG və ya GTG) ilə başlamalı və ən azı 300 kodon (900bp) davam etməli və dayanma kodonunda (TAA TGA TAG) bitməlidir. Adətən 5 çərçivənin kifayət qədər uzun ORF-ləri olmur (yəni qapalı oxu çərçivələri, qısa müddət sonra dayanacaqları olan kodonlara başlayır) və çərçivələrdən yalnız biri ORF yaradacaq.

ORF-nin başlanğıc kodonu ilə başladığını və dayanma kodonu ilə bitdiyini söylədiniz,
onda necə ORF-də stop kodonu yoxdur?

Bağışlayın, mən internet saytından əldə etdiyim təriflərdə bu qarışıqlığı görə bildim

""Açıq" hissəsi oxu çərçivəsi daxilində dayanma kodunun olmamasına istinad edir"

Vacib söz "iç"
açıq oxu çərçivəsi: ortada heç bir dayanacaq olmayan bir dayanma ilə bitən başlanğıcla başlayan uzun kodlar.

Bu köhnə mövzunu yeni tapdım, çünki yeni, lakin əlaqəli bir sual vermək istəyirəm.

Mən bütün geni deyil, yalnız bir genin bir hissəsini kodlayan cDNT-ni ardıcıllıqla tərtib etdim. Mənə elə gəlir ki, orada başlanğıc kodonu yoxdur. Qismən genimi necə tərcümə edə bilərəm?

Bir genin açıq oxu çərçivəsi ilə kodlaşdırma bölgəsi arasındakı fərq nədir?


SmORFs ilə problem

Funksiya və ya digər zülal kodlaşdıran genlərlə homologiyanın eksperimental sübutu olmayan smORF-lər sadəcə olaraq genom annotasiyaları ilə silinir. Bu ixtiyari kəsilmə üç əsas səbəbə görə məna kəsb edir. Birincisi, smORF-lər onların çoxluğuna görə problem yaradır. Klassik, əvvəlcədən sıralanan genetik məlumatlara ardıcıllıqla verilmiş heyvanlardakı minlərlə annotasiya edilmiş genlərə uyğun görünə bilər, lakin onlar zülal kodlayan genlərin maya və meyvə milçəklərində yüz minlərlə və milyonlarla olduğu anlayışı ilə ziddiyyət təşkil edir. məməlilər (şək. 1).

İkincisi, gen kəşfi üçün standart hesablama üsulları smORF-lərlə yaxşı işləmir. Açıq oxu çərçivəsinin (ORF) əslində bir gen kodlaşdırma ardıcıllığı olub-olmadığını yoxlamaq üçün qəbul edilmiş üsul ya onun əvvəllər müəyyən edilmiş zülallarla oxşarlığını və ya əlaqəli növlər arasında qorunmasını aşkar etməkdir. Gen ardıcıllığına çıxışla bu yanaşma hesablama baxımından əhəmiyyətsiz görünür. Bununla belə, Blast və əlaqəli üsullar ölçüdən asılıdır (çünki onlar qorunmanın mütləq miqdarını, yəni qorunan mövqelərin sayını ölçürlər) və qısa ardıcıllıqlar fiziki olaraq kanonik zülallar üçün funksionallığın qəbul edilmiş göstəricisi olan yüksək qorunma ballarını əldə edə bilmirlər. . Bu Blast “handikapı” 80 aa-dan aşağı təsir göstərməyə başlayır və bu, 20 aa-dan aşağı ifrat olur [2]. Nisbi mühafizənin standart tədbirləri də yaxşı nəticə vermir. Kanonik zülal kodlayan ORF-lər üçün müxtəlif növlər arasında amin turşusu ardıcıllığının qorunması var və K a/K s metrik bu təmizləyici seçimi nukleotid səviyyəsində ölçür. Beləliklə, əlaqəli növlər arasında funksional ORF-lərin müqayisəsinin sinonim və sinonim olmayan kodon əvəzetmələrinin (nisbət) üstünlük təşkil etməsi gözlənilir. K a/K s <1). Bununla belə, çox qısa ardıcıllıqlar üçün statistik əhəmiyyətli dəyərləri qiymətləndirmək çətindir, çünki mümkün dəyişikliklərin sayı azdır, belə ki, K a/K s 100 aa-dan aşağı proqnoz gücünü itirir [2]. smORF yoxlanışına uyğunlaşdırılmış yanaşmalar fərqli nömrələr verdi [2, 3] və smORF namizədlərinin çoxluğu buna mane oldu. Bundan əlavə, adekvat sayda eksperimental təsdiqlənmiş smORF-lərin olmaması səbəbindən bioinformatika analizlərində istifadə üçün funksional smORF-lərin spesifik xüsusiyyətləri üçün aydın meyarlar yoxdur.

Üçüncüsü, eksperimental yanaşmalar çoxhüceyrəli orqanizmlərdə bu smORF sirrini aydınlaşdırmayıb. Maya kimi birhüceyrəli eukariotlarda eksperimental olaraq smORF-ləri genomik səviyyədə yoxlamaq cəhdləri edilmişdir ki, bu da yüzlərlə smORF-nin fenotip yarada biləcəyini göstərdi [4] və “smORF-lərin əhəmiyyətsiz və qeyri-funksional olduğu” null fərziyyəsini təkzib etdi. Bununla belə, yüksək smORF nömrələri səbəbindən, metazoanlarda smORF funksiyasının genom miqyasında eksperimental xarakteristikası, hətta onurğasız modellərdə belə mümkün olmamışdır. Caenorhabditis elegansDrosophila. Daha sonra tutma-22 vəziyyəti yaranır ki, bununla da mutasiyalar və digər funksional göstəricilər yaxınlıqdakı genlərə təyin olunur, çünki smORF-lər qeyd olunmur. Buna baxmayaraq, molekulyar funksiya, növlər arasında geniş qorunma və tibbi əhəmiyyət kimi xüsusiyyətlər daxil olmaqla, bir neçə metazoa smORF-nin bioloji funksiyası eksperimental olaraq müəyyən edilmişdir ([5]-də nəzərdən keçirilmişdir). Bununla belə, biz sadəcə olaraq nə qədər başqa funksional smORF-lərin xarakterik olmayan qaldığı barədə heç bir fikrimiz yoxdur.


Nukleotid ardıcıllığında oxu çərçivələrinin sayı - Biologiya

Aşağıdakı məşqdə sizə naməlum DNT ardıcıllığı veriləcək və ardıcıllığı amin turşusu ardıcıllığına çevirmək və düzgün oxuma çərçivəsini müəyyən etmək üçün veb alətindən istifadə etməyi xahiş edəcəklər. You will then save this amino acid sequence to a word processing program (or e-mail it to yourself) if you want to use it in the next exercise.

Obtaining your sequence
In the lab, this might be obtained by sequencing a clone from a cDNA library or by isolating an amplified DNA fragment from a PCR amplification. Often, when we sequence such a product we find we have an unexpected fragment of DNA which we need to analyze. Here we will provide a partial sequence at random from our database of sequences. A partial nucleotide sequence will appear in the window below after you click on the Get Gene Sequence button.

Translating the Sequence
Several sites on the web perform a translation of an input sequence. Clicking on the Expasy link below will open a new window giving you access to a translation tool. Translating the DNA sequence is done by reading the nucleotide sequence three bases at a time and then looking at a table of the genetic code to arrive at an amino acid sequence. This program examines the input sequence in all six possible frames (i.e. reading the sequence from 5' to 3' and from 3' to 5' starting with nt 1, nt 2 and nt 3). What we typically look for in identifying the proper translation is the frame that gives the longest amino acid sequence before a stop codon is encountered. (Since there are 64 codons and three code for nonsense, we expect a stop codon to appear on average once every 20 amino acids if we simply read a sequence "out of frame". However, "on average" is just that, and it is possible to have an incorrect reading frame give an extended sequence with no stop codons. The next exercise will address that problem.

We will use Expasy tools for translation. Clicking on it will open a new window so you can return to this window for instructions and to copy your sequence.


Tərcümə

Reading Frame and Usage of Genetic Code

The initiator AUG codon defines the reading frame of a mRNA. Translation proceeds from this start in steps of three nucleotides (one codon). The frequent occurrence of termination codons out of frame prevents translation in the wrong frame for other than short stretches. However, there are mRNAs which for correct translation need a change of reading frame. Bu, üçün belədir Escherichia coli termination or release factor-2 (RF2). The readthrough of a stop codon requires a tRNA that would decode a stop (nonsense) codon as a sense codon and incorporate a specific amino acid. Such tRNAs are called ‘suppressor tRNAs.’

A few proteins in eubacteria and eukarya contain seleno-cystein (Se-Cys). This is not incorporated by a posttranslational modification as in other cases of nonstandard amino acids. Se-Cys is incorporated instead during translation in response to one of the stop codons. The mechanism for this involves a special tRNA (tRNA Sec ) which reads the stop codon. A set of enzymes has specific functions in this system. One of them is a special form of elongation factor Tu called SelB that uniquely binds tRNA Sec . SelB has the property of identifying a specific secondary structure of the mRNA that precedes the stop codon that corresponds to Se-Cys. This leads to the suppression of the stop codon and the incorporation of Se-Cys.


Reading frame

oxu çərçivəsi
The sequence of nucleotide triplets (codons) that runs from a specific translation start codon in a mRNA to a stop codon. Some mRNAs can be translated into different polypeptides by reading in two different oxu çərçivəsis. (Figure 4-21)
Tam lüğət.

A series of triplet codons beginning from a specific nucleotide. Depending on where one begins, each DNA strand contains three different oxu çərçivəsis.

Open Reading Frame (ORF)
Regions of DNA/RNA sequences that have the potential to code for proteins.
Related .

for which a protein product has not yet been identified.
Return to Search Page
If you know of any terms that have been omitted from this glossary that you feel would be useful to include, please send details to the Editorial Office at GenScript.

s
In the previous example, the polynucleotide chain can code for a maximum of 3 amino acids. However, depending on the upstream regions, the stretch cans also result in only 2 amino acids.

. A way of looking at or, (if you are a transcription enzyme or ribosome) interacting with, a region of protein-coding DNA or RNA so that codons can be read 'correctly'.

- One of three possible ways of grouping an mRNA sequence by threes to yield an amino acid sequence.
Silent Mutation - A substitution base mutation that changes a codon, but because of degeneracy does not change the amino acid that codon specifies.

is a portion of a DNA molecule that, when translated into amino acids, contains no stop codons.

(ORF). A region of DNA or mRNA containing a series of codons uninterrupted by stop codons and therefore capable of coding for a polypeptide chain.
Ooplasmic transfer. Process by which healthy cytoplasm from a donor egg is used to enhance the cytoplasmic environment of a recipient egg.

s in which it could be read.

is something that we as humans use, but the concept is still the same for the molecules that are in charge of genetic translation. Inside our cells, ribosomes and tRNAs are working hard to match amino acids to every codon.

(ORF).
View QuickTime Movie
p53's Role in the Cell
Shows various roles that p53 plays in the cell to protect the genome of the organism.
View QuickTime Movie .

with lots of stop codons is not used for translation.

shifts
Substitution, one base replaced by another
Duplication, repetition of part of the sequence
Addition, Addition extra base
Change in one or more nucleotide bases in the DNA
Change in the genotype (may be inherited) .

[edit]
A codon is defined by the initial nucleotide from which translation starts.

s of DNA with a particular pattern
"Gene finding" by computer algorithms and heuristics
Developmental Geneticist .

) The term given to any stretch of a chromosome that could encode a polypeptide sequence, i.e., the region between a methionine codon (ATG) that could serve to initiate proteins translation, and the inframe stop codon downstream of it.

(ORF)
The sequence of DNA or RNA located between the start-code sequence (initiation codon) and the stop-code sequence (termination codon). (ORNL)
Operon
A set of genes transcribed under the control of an operator gene. (ORNL)
Optimal Alignment .

Exon: The coding sequence of a eukaryotic gene (see also open

).
Exon - intron boundary: Introns end with the dinucleotide ApG [3' splice site / acceptor] and start with the dinucleotide GpT [5' splice site / donor].

(ORF): a DNA sequence which is believed, on the basis of statistical evidence, to code for protein, but for which no matching protein or mRNA is known. ORFs can often be confirmed by matching their sequences to a database of known genes or EST's.

(ORF) corresponds to any nucleotide sequence that can potentially encode a protein. In TAIR ORFs include those that are experimentally verified by comparison to cDNA sequence as well as ORFs predicted by computational methods. Predicted ORFs include those encoding hypothetical proteins (e.

.) Operator. A prokaryotic regulatory element that interacts with a repressor to control the transcription of adjacent structural genes. Organelle.

similar to "tweezers" and which is used for grasping small tissues or organs fossil remains or traces of an organism that lived long agofounder effect change in allele frequencies as the result of the migration of a small subgroup of a population frameshift mutation mutation that shifts the "

In the test problems, the GA with multiple

s produced significantly better solutions than a standard GA on two out of the four problems and better average solutions on the remaining two.

Now a insertion or deletion, you won't have silent insertion or deletions because you're going to change things and if you notice by adding in a g in front of that c now I've shifted which three amino acids sorry which three nucleotides I'm reading so my my

will contain the codon "ATG."
You can predict the amino acid sequence of the protein by using the Universal Genetic Code.

by two and changes the amino acids that are produced after the insertion. The insertion can code for a stop codon too soon or too late in the translation process. The resulting proteins will be either too short or too long. These proteins are for the most part defunct.

for the mRNA.
The initiator tRNA, already associated with the complex, then hydrogen-bonds with the start codon.
Proteins called initiation factors bring in the large subunit so that the initiator tRNA occupies the P site.

frameshift mutation A mutation that causes a

shift for all codons downstream of the mutation.
fraternal twins Non-identical twins two individuals born at the same time, but developing from two separate zygotes. See also: identical twins.

- A mutation caused by either the insertion or deletion of a number od nucleotide pairs in DNA, the effect of which is a change in the

of codens in an mRNA molecule during the protein synthesis, resulting in an abnormal aminoacid sequence .

for translation is set by the AUG start codon near the 5' end of the mRNA. Genetik kod universaldır. Bir neçə istisna olmaqla, demək olar ki, bütün növlər zülal sintezi üçün eyni genetik koddan istifadə edirlər ki, bu da Yerdəki bütün həyatın ümumi mənşəyi paylaşdığına güclü sübutdur.

Point mutations are the result of the substitution of a single base. Frame-shift mutations occur when the

of the gene is shifted by addition or deletion of one or more bases. With the exception of mitochondria, all organisms use the same genetic code.

The intron's code must be properly expressible, otherwise a stop codon or a shift in the

will cause the protein to be non-functional.
Exon cassette mode: in this case, certain exons are spliced out to alter the sequence of amino acids in the expressed protein.


Videoya baxın: 25. AMİNLER Organik Kimya AYT YKS Kimya (Avqust 2022).