Mavzu : Biologik ketma-ketliklarni ma`lumotlar bazalari bo`yicha taqqoslanishi uchun dasturlar


EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasi



Yüklə 0,57 Mb.
səhifə3/11
tarix23.12.2023
ölçüsü0,57 Mb.
#157531
1   2   3   4   5   6   7   8   9   10   11
Biologik ketma-ketliklarni ma`lumotlar bazalari bo`yicha taqqoslanishi uchun dasturlar

EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasi 
EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasi (shuningdek, EMBL-Bank nomi bilan ham tanilgan) ENA bo'limi bo'lib, unda yuqori darajadagi genom yig'ish tafsilotlari, shuningdek yig'ilgan ketma-ketliklar va ularning funktsional izohlari mavjud.  EMBL-Bank genom konsorsiumlari va kichikroq tadqiqot guruhlari tomonidan to'g'ridan-to'g'ri taqdim etish , shuningdek, patent arizalari bilan bog'liq ketma-ketlik ma'lumotlarini olish orqali yordam beradi . 
114-chizilish holatiga ko'ra (2012 yil dekabr), EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasi siqilmagan fayl hajmi 1,6 terabayt bo'lgan taxminan 5 × 10 11 nukleotidni o'z ichiga oladi . 
EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasi turli manbalardan olingan turli xil ma'lumotlarni qo'llab-quvvatlaydi, jumladan, lekin ular bilan cheklanmagan:

  • Ular bilan bog'langan namuna ma'lumotlari bilan ifodalangan ketma-ketlik teglari .

  • Nukleotidlar ketma-ketligi yig'ilishning turli bosqichlarida, jumladan, to'liq kontiglar va izohli, to'liq yig'ilgan ketma-ketlikdagi butun genom sekvensiyasi loyihalaridan yaratiladi .

  • Transkriptomikaga oid maʼlumotlar , masalan, qoʻshimcha DNK , ixtiyoriy izoh bilan.

  • Mavjud kodlash ketma-ketliklarining yangi yoki kengaytirilgan izohlari , masalan, boshlang'ich yoki to'xtash kodonlari tuzatilgan yangi ketma-ketlik versiyalari .

MBL Nukleotidlar ketma-ketligi ma'lumotlar bazasi odatda EMBL-Bank formati deb ataladigan ma'lumotlarni ko'rsatish va saqlash uchun tekis faylli ochiq matn formatidan foydalanadi. EMBL-Bank formati DDBJ va GenBankdagi yozuvlar uchun boshqa sintaksisdan foydalanadi, ammo har bir format NCBI Taxon ma'lumotlar bazasi tomonidan aniqlangan taksonomiyalar kabi ma'lum standartlashtirilgan nomenklaturadan foydalanadi . EMBL formatidagi faylning har bir satri ikki harfli kod bilan boshlanadi, masalan, kirish raqamini belgilash va yozuvga tegishli kalit so'zlar ro'yxati; har bir yozuv bilan tugaydi . 

 

Aminokislotalar ketma-ketliklarini taqqoslashda foydalaniladigan dasturlar


PDB Site Scan- oqsil strukturalarini aktiv saytlarni qidirish dasturlari

Protein ma'lumotlar banki ( PDB )  oqsillar va nuklein kislotalar kabi yirik biologik molekulalarning uch o'lchovli strukturaviy ma'lumotlar bazasidir . Odatda rentgen kristallografiyasi , NMR spektroskopiyasi yoki tobora krioelektron mikroskopiya yordamida olingan va butun dunyo bo'ylab biologlar va biokimyogarlar tomonidan taqdim etilgan ma'lumotlar Internetda unga a'zo tashkilotlarning veb-saytlari (PDBe, PDBj, RCSB, va BMRB ). PDB Worldwide Protein Data Bank , wwPDB deb nomlangan tashkilot tomonidan nazorat qilinadi .


PDB, strukturaviy genomika kabi tizimli biologiya sohalarida kalit hisoblanadi . Ko'pgina yirik ilmiy jurnallar va ba'zi moliya agentliklari endi olimlardan o'z tuzilmalari ma'lumotlarini PDBga taqdim etishlarini talab qiladi. Ko'pgina boshqa ma'lumotlar bazalari PDBda saqlanadigan protein tuzilmalaridan foydalanadi. Masalan, SCOP va CATH oqsil tuzilmalarini tasniflaydi, PDBsum esa gen ontologiyasi kabi boshqa manbalardan olingan ma'lumotlardan foydalangan holda PDB yozuvlarining grafik ko'rinishini taqdim etadi .
PDBni boshlash uchun ikkita kuch birlashdi: rentgen nurlari diffraktsiyasi bilan aniqlangan oqsil tuzilishi ma'lumotlarining kichik, ammo o'sib borayotgan to'plami; va yangi mavjud bo'lgan (1968) molekulyar grafik displey, Brookhaven RAster Displey (BRAD), bu oqsil tuzilmalarini 3 o'lchamli tasvirlash uchun. 1969 yilda Brookhaven milliy laboratoriyasida Valter Hamiltonning homiyligi bilan Edgar Meyer ( Texas A&M universiteti ) atom koordinatalari fayllarini umumiy formatda saqlash uchun dasturiy ta'minot yozishni boshladi, ularni geometrik va grafik baholash uchun foydalanish mumkin. 1971 yilga kelib, Meyer dasturlaridan biri, SEARCH tadqiqotchilarga oqsil tuzilmalarini oflayn rejimda oʻrganish uchun maʼlumotlar bazasidan maʼlumotlarga masofadan kirish imkonini berdi. SEARCH tarmoqqa ulanishni ta'minlashda muhim rol o'ynadi va shu bilan PDBning funktsional boshlanishini belgiladi.
Protein ma'lumotlar banki 1971 yil oktyabr oyida Nature New Biology jurnalida  Buyuk Britaniyaning Kembrij kristallografik ma'lumotlar markazi va Brukhaven milliy laboratoriyasi, AQSh o'rtasidagi qo'shma korxona sifatida e'lon qilindi.
1973 yilda Hamilton vafotidan so'ng, Tom Koeztle keyingi 20 yil davomida PDB rahbariyatini o'z zimmasiga oldi. 1994 yil yanvar oyida Isroilning Veyzman nomidagi fan instituti xodimi Joel Sussman PDB rahbari etib tayinlandi. 1998 yil oktyabr oyida PDB Strukturaviy bioinformatika bo'yicha tadqiqot hamkorligiga (RCSB) o'tkazildi; transfer 1999-yil iyun oyida yakunlandi. Yangi direktor Helen M. Berman edi. Rutgers universiteti (RCSB boshqaruv muassasalaridan biri, ikkinchisi San-Diego UC da San-Diego Superkompyuter markazi ). 2003 yilda wwPDB tashkil etilishi bilan PDB xalqaro tashkilotga aylandi. Ta'sischilar PDBe (Yevropa), RCSB (AQSh) va PDBj (Yaponiya).  BMRB  2006 yilda qo'shilgan. wwPDB ning to'rtta a'zosining har biri PDB ma'lumotlarini joylashtirish, ma'lumotlarni qayta ishlash va tarqatish markazlari vazifasini bajarishi mumkin. Ma'lumotlarni qayta ishlash wwPDB xodimlarining har bir yuborilgan yozuvni ko'rib chiqishi va izohlashini anglatadi. Keyin ma'lumotlarning ishonchliligi avtomatik ravishda tekshiriladi (ushbu tekshirish dasturining manba kodi jamoatchilikka bepul taqdim etilgan)
PDB ma'lumotlar bazasi har hafta yangilanadi ( UTC +0 chorshanba), uning egalari ro'yxati bilan birga. 2020-yil 1-aprel holatiga koʻra , PDB quyidagilardan iborat:

Ko'pgina tuzilmalar rentgen nurlari diffraktsiyasi bilan aniqlanadi, ammo tuzilmalarning taxminan 10% protein NMR tomonidan aniqlanadi . Rentgen nurlari diffraktsiyasidan foydalanganda oqsil atomlarining koordinatalarining yaqinlashuvi olinadi, NMR yordamida esa oqsilning juft atomlari orasidagi masofa taxmin qilinadi. Oqsilning yakuniy konformatsiyasi NMR dan masofaviy geometriya masalasini yechish orqali olinadi. 2013 yildan keyin ko'payib borayotgan oqsillar krioelektron mikroskopiya bilan aniqlanadi . Bog'langan tashqi jadvaldagi raqamlarni bosish ushbu usul bilan aniqlangan tuzilmalarning misollarini ko'rsatadi.


Struktura faktor fayliga ega bo'lgan rentgen nurlari diffraktsiyasi bilan aniqlangan PDB tuzilmalari uchun ularning elektron zichligi xaritasini ko'rish mumkin. Bunday tuzilmalarning ma'lumotlari "elektron zichlik serveri" da saqlanadi. 
Tarixiy jihatdan PDBdagi tuzilmalar soni taxminan eksponensial sur'atda o'sib bordi, 1982 yilda 100 ta tuzilma, 1993 yilda 1000 ta tuzilma, 1999 yilda 10 000 ta va 2014 yilda 100 000 ta tuzilma ro'yxatga olingan

UniProt – eng yirik oqsil ma`lumot bazasi



Yüklə 0,57 Mb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9   10   11




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©www.genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə