Bioinformatika: BLAST qanday ishlaydi?

Bioinformatika: BLAST qanday ishlaydi?

Avvalgi maqolamizda aytib o’tganimizdek barcha bioinformatik dasturlar biologiya sohasidagi ma’lumotlar ko’lami bilan ishlashni osonlashtirish uchun xizmat qiladi. Bugun ana shunday dasturlardan birining qanday ishlashi haqida gaplashamiz.
Bioinformatik dasturlarning ayrimlari online rejimda, boshqa birlari esa offline rejimida ishlaydi. BLAST dasturi online rejimda ishlaydigan dasturlardan hisoblanadi. Ya’ni bu dasturni ishlatish uchun Siz avvalo internetga ulangan bo’lishingiz kerak.

BLAST o’zi nima?

BLAST (Basic Local Alignment Search Tool – asosiylokal tekislanishni izlash vositasi) bu kompyuter dasturlaridan biri bo’lib, u oqsil yoki nuklein kislotalar gomologlarini mavjud bazadan izlab topishga xizmat qiladi. Sodda qilib tushuntirilganda sizda oqsil yoki nuklein kislotalarning ma’lumbir ketma-ketligi bor. Lekin siz bu nuklein kislota qaysi turga tegishli ekanligini bilmaysiz. BLAST sizga mana shu qo’lingizdagi nukleotidlar ketma-ketligi qaysi turga tegishli ekanligini aniqlashga yordam beradi. Albattau bazada mavjud bo’lgan millionlab namunalarga solishtirish asosida sizga kerakli natijani chiqarib beradi. BLAST dasturini 1990-yilda AQSHlik bir guruh tadqiqotchilar ishlab chiqqanlar.

BLAST qanday ishlaydi?

Men bugungi maqolada imkoni boricha sodda tilda BLAST dan qanday foydalanish haqida ma’lumot bermoqchiman. Jarayonni tushunishingiz uchun o’zim olib borayotgan tadqiqotlar misolida tushuntirib ketaman.

Men ayni vaqtda O’zbekiston baliqlarining DNK barkodingi va filogenetikasi ustida shug’ullanmoqdaman. Ushbu ilmiy tadqiqot ishimda men uchun O’zbekiston suv havzalaridan yig’ilgan baliq namunalari kerak bo’ladi. Men mana so’nggi 3 yil davomida O’zbekistondagi turli suv havzalaridan baliq namunalarini yig’ib kelmoqdaman. Ayrim baliq turlarini tashqi ko’rinishidan, morfologik belgilaridan juda osongina ajrata olaman, ayrimlarini maxsus aniqlagich kitoblaridan foydalangan holda aniqlayman. Ba’zi suv havzalaridan baliq namunalarini yig’ishda faqatgina juda mayda baliq chavoqlari yoki aniqlagich bilan ham qaysi tur ekanligini aniqlab bo’lmaydigan turlar uchrab turadi. 2017 yil fevral oyida Toshkent viloyatidagi Chiqchiq suv havzasidan baliq namunalari yig’ayotganimda juda kichkina baliq namunasini olgan edim. Uning kim ekanligini o’sha vaqtda aniqlay olmaganman.

Xitoyda qaytgach laboratoriya sharoitida o’sha baliq namunasining to’qimasidan mitoxondriya DNK ni ajratib olib (bu alohida mavzu), mitoxondriyadagi COI genini PZR mashinasida amplifikatsiya qildim. Elektroforez jarayoni ushbu genni to’g’ri ajratib olganimni ko’rsatdi. Men natijalarni maxsus kompaniyalarga jo’natdim. Ular menga o’sha noma’lum baliq namunasidan olingan COI genidagi nukleotidlar ketma-ketligini o’qib berishdi. Ular jo’natgan natija taxminan quyida ko’rinishda edi.

Bu tasvirda DNK ikkala zanjirining ma’lum bir fragmenti va undagi nukleotidlarning spektrlari tasvirlangan. Nukleotidlar spektri va ularning rangidan ajratib olish haqida avval ham yozgan edim. DNK ning ushu holatini ko’rish uchun “ContigExpress Project” bioinformatsion dasturidan foydalaniladi. Ushbu rasmda DNK ning 5’-3’ (1) va 3’-5’ (2) zanjirlarini ko’rishingiz mumkin. COI geni o’rtacha 700 ta nukleotiddan iborat bo’ladi.
Biz DNK zanjirlarining holatini tekshirib ulardan umumiy holatda quyidagi nukleotidlar ketma-ketligini qo’lgan kiritamiz.

Mana bizda 723 ta nukleotidlardan tashkil topgan DNK ning bitta zanjiri fragmentining nukleotidlari turibdi. Ana endi uni BLAST yordamida kimga tegishli ekanligini topib olamiz.

BLAST ga qanday kiriladi?

Buning uchun kompyuterda internetni yoqib AQSHning Biotexnologik ma’lumotlar milliy markazi (NCBI) saytiga kiramiz. U yerdan BLAST bo’limi tanlaymiz. Bizda quyidagi oyna ochiladi.

Biz nukleotidlar ketma-ketligini tekshirmoqchi bo’lganimiz uchun chap tomonda turgan Nucleotide BLAST tugmasini bosamiz. Kompyuter ekranida quyidagi oyna ochiladi.

Nukleotidlarimizni birinchi yuqoridagi qizil ko’rsatgichda ko’rsatilgan joyga ko’chirib olib qo’yamiz (Ctrl+C va Ctrl+V). Shundan so’ng ikkinchi ko’rsatkich ko’rsatayotgan joy belgilanganligini tekshiramiz. Bu nuqta siz yuklagan nukleotidlarni qaysi ma’lumotlar ba’zasi bilan solishtirish kerakligini aniqlashtirish uchun kerak. U yerda ayni vaqtda Human genomic + transcript – odam genomi va Mouse genomic + transcript – sichqon genomi ma’lumotlar bazasi ko’rsatilmoqda. Biz Others – boshqalar degan bo’limini tanladik. Oxirgi ko’rsatkich Highly similar sequences – ‘juda ham o’xshash ketma-ketlik’ degan tugma tanlanganligini ko’rsatmoqda. Bu bizga biz tekshirayotgan nukleotidlar ketma-ketligiga eng yaqin natijani ko’rsatib berishi uchun kerak. Shulardan keyin pastda chap tomonda turgan BLAST tugmasini bir marotaba bosamiz. Dastur bizga NCBI ma’lumotlar bazasidagi barcha nukleotidlar ketma-ketligi bilan bizning namunamizni solishtirib, biznikiga o’xshash bo’lgan natijalarni ko’rsatib beradi. BLAST bosilganidan so’ng quyidagi oyna ochiladi.

BLAST natijalari

Oynaning yuqori qismida BLAST amalga oshirilgan operatsiya haqida qisqacha ma’lumot va bizning nukleotidlar solishtirilishidan qo’lgan kiritilgan dastlabki 100 ta eng o’xshash natijalarning diagramma holatidagi tasviri ko’rsatiladi. Agar tekshirilayotgan nukleotidlar ketma-ketligidagi 200 tadan ortiq nukleotidlar o’zaro o’xshash chiqsa natijalar qizil rangda tasvirlanadi. Yuqoridagi rasmda 1 dan 700 tagacha bo’lgan moviy tasvir bu bizning nukleotidlar, pastdagilari esa biznikiga mos tushgan natijalarning ko’rinishi. Oynaning pastrog’iga tushsak, natijalarning barcha ko’rsargichlarini ko’rishimiz mumkin bo’ladi.

Ushbu tasvirdagi birinchi raqamda (1) bizning nukleotidlar ketma-ketligiga mos kelgan bazadagi organizmlarning nomi yozilgan. E’tibor bersangiz deyarli barcha natijalarda Pseudorasbora parva organizmiga tegishli ko’rsatkichlar keltirilgan. Ikkinchi raqamda (2) bizning nukleotidlarimiz bazadagi nukleotidlarning qancha foizi bilan o’zaro mos tushganligini ko’rsatadi. Uchinchi raqam (3) esa biz tekshirayotgan turning aniqlanish foizini ko’rsatadi. To’rtinchi raqam (4) esa bazadagi organizm ma’lumotlarining raqami, bu xuddi bizning passport raqamimizga o’xshaydi. Bazadagi har bir organizm ma’lumotlari xuddi mana shunday raqam bilan belgilanadi. E’tibor bersangiz deyarli barcha ko’rsatkichlar (3-raqamdagisi) 98-99 foizni ko’rsatmoqda. Biz tekshirayotgan baliq juda ham yuqori ehtimollik bilan Pseudorasbora parva ekanligi ma’lum bo’ladi.

Natijalar tahlili

Oynaning yana bir pastrog’iga tushsak, mana shu har bir natija ko’rsatkichi bilan bizdagi ko’rsatkich qanday solishtirilgani ko’rsatiladi.

Birinchi qatorda bizning nukleotidlar (qizil ko’rsatkich) ikkinchi qatorda bazadagi organizm nukleotidlari (ko’k ko’rsatkich) o’zaro birma-bir solishtirib ko’rsatilgan. Yuqoridagi qizil to’rtburcha ichida 691/704 (98%) deb yozib qo’yilibdi. Bu degani solishtirilgan 704 ta nukleotiddan 691 tasi aynan bir xil va tekshirilayotgan organizm aynan mana shu tur ekanligining ehtimoli 98% degan ma’noni bildiradi.

Yuqorida biz COI genini teshirayotganimizni aytib o’tgan edik. COI geniga xos bo’lgan xususiyatlardan biri shuki, barcha organizmlarda ushbu gen tarkibida bo’shliqlar (gap) mavjud bo’lmaydi. Ya’ni DNK ning biror qismi nukleotidsiz bo’lmaydi. Qizil yumaloq aylanada esa 704 ta solishtirilgan nukleotidlar ichida bitta mana shunday gap mavjud deyilmoqda. O’sha bo’shliq (gap) pastda ko’rsatilgan. U bazadagi namunada turibdi. O’sha bo’shliq yuqorisida bizning namunada adenin (A) turibdi. Bu shundan dalolat beradiki, bizning namunadagi aynan o’sha A ortiqcha. U qayerdan paydo bo’lib qoldi? Buni ishning boshida ContigExpress Project dasturida ishlayotganimizdagi jarayondan topib olamiz. Deyarli yuqori ehtimollik bilan biz DNK zanjirini noto’g’ri o’qish natijasida uni qo’shib olgan bo’lib chiqamiz. Chunki bazadagi ma’lumotlarda bunday kamchiliklar bo’lmaydi.

Demak xulosa sifatida biz tekshirayotgan organizm Pseudorasbora parva ekanligini bilib oldik. Ushbu baliqni to’g’ri aniqlaganimizni fishbase.org sayti orqali tekshirib ko’ramiz. U yerdagi bizga quyidagi baliqning ma’lumotlari ko’rsatilmoqda.

Men tutgan kichik baliq ham taxminan ayni rasmdagidek edi. Ma’lumotni yanada aniqlashtirish uchun ushbu baliq tarqalgan mamlakatlar ro’yxatini tekshiraman va u yerda O’zbekiston ko’rsatilgan. Demak hammasi to’g’ri ketmoqda.

Savol yuzaga keladi!

BLAST ko’rsatgan ko’rsatkichlar rostdan ham aniqmi? Men tutgan baliq aniq Pseudorasbora parva mi?
BLAST menga aniqlik darajasi 98-99% deb ko’rsatmoqda. Bu deyarli aniq degan gap. Agar o’xshashlik ko’rsatkichi 96 foizdan past bo’lsa demak bu yuqori ehtimollik bilan boshqa tur bo’lib chiqar edi. Lekin turni aniqlash, natijani tasdiqlash bu bilan yakunlanmaydi. Oldinda MEGA dasturida tekshirib ko’rish turibdi. MEGA dasturi yordamida turlarning o’zaro genetik masofasi K2P (Kimura-2-parameter) usulida tekshiriladi. Qolaversa u yerda filogenetik daraxt tuzish yordamida ham bu turlarning genetik jihatdan qay darajada bir-biriga yaqin yoki uzoq ekanligini tekshirish mumkin. Bir nechta bioinformatik dasturlar yordamiga mana shunday biz ko’zlagan maqsadga erishamiz.
Bundan tashqari yana juda ko’p savollar yuzaga kelayotgan bo’lishi mumkin. Masalan, ular quyidagicha bo’lishi mumkin:

Biz tekshirayotgan organizm turning ma’lumotlari bazada bo’lmasachi?
Biz qaysi tur ekanligi aniq bo’lgan organizmning nukleotidlari tekshirilganda butkul boshqa tur ko’rsatilsachi?
Umuman hech qanday natija chiqmasa nima qilinadi?

Tekshirilayotganda natija masalan 80 foiz chiqib qolsa, nima qilinadi?
Bunga o’xshash savollarning har biriga atroflicha javob berish mumkin, lekin ular boshqa maqolaning mavzusi bo’lib qoladi. Keyinchalik BLASTning bu jihatlariga yana to’xtalishga harakat qilamiz.

BLAST ning boshqa funksiyalari

BLASTning funksiyalari men ko’rsatgan misol bilan yakunlanib qolmaydi. Men bugungi maqolada ularning atigi yarmiga yaqinini ko’rsatib berdim xolos. Uning boshqa funksiyalari haqida mana bu yerda yanada ko’proq ma’lumotlarni o’qishingiz mumkin.

Atamalar: bioinformatika, BLAST

Muallif haqida

Izohlar

  1. Ziyoviddin Yusupov
    Ziyoviddin Yusupov 27 Fevral, 2019, 13:58

    Ajoyib! Bunday illustrativ maqolalar ilm qilmoqchi bo’lgan sistematiklarga(hoh u botanik, hoh u zoolog bo’lsin) o’ta zarur! Buni yana davom etishingizni juda hohlardim. Ko’pchilik bu sohada o’qib maqolalar qiladi, lekin hech bunday narsalarni o’rgatishni hohlamaydi, DNK ni ajaratish (Kit yoki klassik metod farqlari) , Primer tanlash (NCBI bazini solishtiruv)va PCR(uning turlari va uning bosqichlaridagi harorat dasturlarini aniqlash) gacha bo’lgan jarayonlar haqida to’liqroq ma’lumotlar bo’lganda yana ham qiziqarli bo’lgan bo’lardi. Ishlarga Omad!

  2. Ziyoviddin Yusupov
    Ziyoviddin Yusupov 27 Fevral, 2019, 14:01
  3. New genomicis
    New genomicis 27 May, 2019, 09:07

    Mening fikrim bu haqida zoʻr! Meni adminlardan bitta iltimosim bor edi UniGene haqida maʼlumot bersalaringiz.
    Javob uchun oldindan rahmat!

  4. rashidtojiboev
    rashidtojiboev 24 Iyun, 2019, 11:48

    Qoyil komentlarni juda tez javob qaytarar ekansiz…

  5. Muhammad
    Muhammad 25 Sentabr, 2019, 17:24

    juda foydali ma’lumot boldi Baxtiyor aka!

Faqat ro'yxatdan o'tgan foydalanuvchilar fikr qoldirishlari mumkin.