سه شنبه, ۲ مرداد, ۱۴۰۳ / 23 July, 2024
مجله ویستا

برآیند علوم زیستی و محاسباتی


وظیفه اصلی بیوانفورماتیك طراحی سیستم های كامپیوتری و مدل های ریاضی برای نگهداری، مدیریت و تحلیل داده های بیولوژیكی است.
ابزارهای بیوانفورماتیكی در آینده قادر خواهند بود كه با دانستن یك توالی ژنی، نحوه بروز صفت در سلول زنده را توصیف كنند.
بیوانفورماتیك دانشی بین رشته ای است. نقطه اتصال ریاضیات، علوم محاسباتی و علوم زیستی. این شاخه از علم با توجه به گسترش روزافزون حیطه های علمی و درگیر شدن آنها با هم و طرح مسائل مشترك بین شاخه هایی از علم كه پیش از این چندان ربطی به هم نداشتند از یك طرف و گسترش توجه به زیست شناسی و به خصوص زیست شناسی مولكولی در دو دهه اخیر، بسیار مورد توجه پژوهشگران ریاضی و زیست شناسان قرار گرفته است. اگر بخواهیم موضوع علم بیوانفورماتیك را در یك جمله خلاصه كنیم، می توان گفت: «طراحی سیستم های كامپیوتری و مدل های ریاضی برای نگهداری، مدیریت و تحلیل مجموعه عظیمی از داده های بیولوژیكی و همچنین ارائه دانش زیستی» موضوع بیوانفورماتیك است. محتوای این «مجموعه عظیم داده ای» چیست؟ بیوانفورماتیك با چه مسائلی درگیر است؟ چه جایگاهی در كنار علوم دیگر دارد؟
با توجه به گسترش روزافزون و توجه به این شاخه در كشورمان در این گزارش نگاهی داریم به كلیات بیوانفورماتیك.
• توالی ها
اطلاعات وراثتی هر سلول در مولكول های طویلی به نام «دیوكسی ریبونوكلئیك اسید» یا DNA نگهداری می شود. DNA پلیمری است كه از چهار مونومر ساخته شده است. این مونومرها كه باز هستند به اختصار A، T، C و G نامیده می شوند. به این ترتیب برای نمایش مولكول DNA دانشمندان از یك رشته طولانی از این چهار حرف استفاده می كنند. به این رشته طولانی، توالی می گویند. در واقع DNA زنجیره ای دوگانه و به هم تابیده است، كه هر دو مونومر از هر زنجیره با مونومری از زنجیره مقابل، در هم جفت می شوند، به این صورت كه A با T و G با C جفت می شوند. پس با دانستن توالی یك زنجیره، توالی متقابل به دست می آید. در درون هسته هر سلول، مولكول DNA چندین بار تاب می خورد و برای استحكام بیشتر، به دور گلوله هایی از چربی حلقه می زند. به این مجموعه كروموزوم می گویند. برای مثال در بدن انسان ۴۶ كروموزوم وجود دارد كه همه خصلت های انسانی در آنها كد شده اند.
اما مولكول DNA به تنهایی قادر به كنترل فعالیت های حیاتی موجود زنده نیست. بلكه هر كدام از قسمت های این دنباله باید طی فرآیندی كه روخوانی و ترجمه نام دارد، در درون اندامی از سلول به نام ریبوزوم به یك آنزیم یا پروتئین معادل آن تبدیل شوند. این آنزیم یا پروتئین است كه برای مثال وارد جریان خون می شود و به وظایف محوله فرد می پردازد. به هر قسمتی از یك مولكول DNA كه یك پروتئین را كد می كند، یك ژن می گویند. یك مولكول DNA حاوی هزاران ژن است كه هر كدام وظیفه ای خاص خود دارند، به این ترتیب جریان اطلاعات كه توصیف كننده رفتار و عملكرد هر سلول زنده است، در DNA كنترل می شود.
پروتئین ها نیز زنجیره ای از آمینواسیدها هستند. بیش از بیست نوع آمینواسید وجود دارد كه با نسبت دادن یك علامت به هر كدام، توالی پروتئینی نشان داده می شود. هر سه تا باز روی DNA یك آمینواسید را كد می كنند. به این ترتیب از روی یك توالی ژنی، می توان توالی پروتئینی خاص آن را به دست آورد.
به این ترتیب نخستین و مهمترین شباهت زیست شناسی مولكولی و علوم كامپیوتر نمایان شد: توالی ها، داده هایی دیجیتالی هستند. قسمت عمده ای از داده هایی كه در مدل ها، الگوریتم ها و پایگاه های داده ای (Data base) بیوانفورماتیك مورد تحلیل قرار می گیرند، به توالی ها اختصاص دارد.
• پایگاه های داده
جریان اطلاعاتی را كه منجر به بروز یك واكنش خاص توسط یك سلول زنده یا یك موجود چند سلولی می شود را در دیاگرام زیر می توان خلاصه كرد:
توالی ژنی، توالی RNA، توالی پروتئین، ساختار پروتئین، عملكرد پروتئین، بروز صفت در سلول زنده.
براین اساس، هدف نهایی بیوانفورماتیك این است كه با در دست داشتن توالی DNAهای یك سلول یا یك موجود زنده، تمام خصوصیات و رفتارهای آن را پیش بینی كند.
یكی از محرك های اصلی برای فعالیت روزافزون در زمینه بیوانفورماتیك پروژه های ژنوم و پروتیوم بوده اند. پروژه های ژنوم، با هدف تعیین كد توالی DNAهای موجودات زنده تعریف شده اند كه مهمترین و بزرگ ترین آنها پروژه ژنوم انسانی است. این پروژه كه یك برنامه بزرگ جهانی بود و دانشمندانی از سراسر جهان در آن شركت داشتند، وظیفه اش شناخت كامل DNA انسان است. این پروژه یكی از چهار پروژه عظیم جهانی است كه البته به لطف ساخت دستگاهی به نام PCR كه به این فرآیند سرعت بخشید، در سال ۲۰۰۲ و سه سال پیش از موعد پانزده ساله پیش بینی شده اولیه، به پایان رسید. پایگاه های داده ای اینترنتی مخصوص این كار توالی های به دست آمده را در اختیار پژوهشگران قرار می دهند. این پایگاه ها كاملاً عمومی هستند و با وارد كردن هر توالی دلخواه می توان تمام توالی های مشابه به همراه مجموعه كاملی از اطلاعات مربوط به آنها را استخراج كرد. این پایگاه های بیوانفورماتیك حجم زیادی از اطلاعات ژنتیكی را در خود حفظ كرده اند و در طول مدت كوتاهی كه از راه اندازیشان می گذرد، به مهمترین ابزار پژوهشی در زیست شناسی مولكولی مبدل گشته اند.
سرعت رشد اطلاعات موجود در پایگاه های داده ای به صورت نمایی رشد می یابد. طوری كه برای مثال در پایگاه Gen Bank هر ۱۴ ماه حجم اطلاعات دو برابر می شود. به طور مشابه برای پروتئین هم پروژه پروتیوم تعریف شده است. كه البته در اینجا حجم كار به طرز بسیار وحشتناكی بالاتر است. در عین حال روش های خوبی مثل روش های به كار رفته در پروژه ژنوم در دست نیست ضمن اینكه بسیاری از پروتئین ها و آنزیم ها، ناشناخته مانده اند. هدف این پروژه ها تعیین توالی پروتئین ها و شكل ساختاری سه بعدی آنها است. به خصوص این آخری كه نقش اساسی در عملكردهای پروتئین ها دارد. اگر پروژه ژنوم در طی یك فرآیند ۱۲ ساله به پایان رسید ما با توجه به حجم كار پروژه پروتیوم، به نظر می رسد كه حدود یك قرن برای به پایان رساندن این پروژه كه با همكاری اكثر مراكز پژوهشی جهان در حال انجام است، لازم باشد.
• زمینه های مهم بیوانفورماتیك
۱- تحلیل توالی های ژنوم
هدف اولیه بیوانفورماتیك طراحی روش های استخراج، نگهداری، پردازش و تحلیل تعداد بسیار زیادی از توالی ها بود. رسیدن به این هدف، برای محققان علوم زیستی دستاورد عظیمی به شمار می رود. به طور كلی در طی چند سال اخیر، كاوش در این پایگاه های داده ای برای پژوهشگران زیست شناسی مولكولی به یك فعالیت روزمره و نیاز حیاتی مبدل شده است. برای مثال فرض كنید كه توالی قسمتی از یك DNA در آزمایشگاه به دست آمده است.
نخستین سئوالی كه به ذهن می رسد این است كه آیا این توالی در برگیرنده یك ژن هست یا نه؟ در صورت مثبت بودن جواب، این ژن در كجای زنجیره DNA اصلی قرار دارد و نهایتاً آنزیمی را كه كد می كند چه نقشی در سلول یا در فرآیندهای حیاتی ایفا می كند؟ در غیاب بیوانفورماتیك و ابزارهای آن، ماه ها وقت لازم است تا یك تیم تحقیقاتی به حدس های اولیه ای درباره پاسخ سئوالات فوق برسد. در حالی كه تنها با یك كامپیوتر شخصی متصل به این پایگاه های داده ای ظرف چند دقیقه می توان به جواب قطعی یا حدس هایی محكم رسید.
سرعت بالای روش های تعیین توالی با روش های كامپیوتری و مدل های ریاضی در طراحی تراشه های DNA به دست آمده اند. دستگاه های فوق پیشرفته مجهز به تراشه های DNA قادر هستند ضمن تعیین توالی همزمان هزاران قطعه نوكلئوتیدی آنها را به طور خودكار در پایگاه های داده ای به ثبت برساند.
۲- پیش بینی ساختار سه بعدی (ساختار سوم و چهارم) پروتئین
كاركرد مولكول های عظیم پروتئین به شدت به شكل فضایی و ساختار سه بعدی آنها بستگی دارد. از طرفی همان گونه كه دیدیم ژن ها نیز از طریق عملكرد پروتئین هایی كه می سازند، نقش خود را اعمال می كنند. بنابراین شناخت كامل ماهیت و وظیفه ژن ها، منوط به دانستن اطلاعات كافی درباره پروتئین ها است. ولی پروژه های پروتیوم با وجود این اهمیت حیاتی، به كندی پیش می روند.
دلایل این كندی پیشرفت، هزینه های زیاد و كندی روند تعیین توالی پروتئین ها و مشكل بودن تعیین ساختار سه بعدی آنها در آزمایشگاه است. با توجه به سرعت بالای روند كار در پروژه های ژنوم، حل مسائل پروتئینی مهمترین چالش حال حاضر بیوانفورماتیك به حساب می آید.
دو اصل اساسی برای تعیین ساختار سه بعدی پروتئین از روی توالی آن وجود دارد كه هر كدام روش جداگانه ای را برای حل مسئله ساختار پیشنهاد می كنند:
* پروتئین هایی كه توالی نسبتاً مشابهی دارند، شكل فضایی شبیه به هم پیدا می كنند: جست وجو برای یافتن توالی های مشابه.
*شكل فضایی مولكول به نحوی است كه به حداقل انرژی برسد: استفاده از قوانین شیمی، فیزیك و ترمودینامیك.
۳- تحلیل كاركردی در سطح ژنوم
ابزارهای تحلیل كلان داده های زیستی، روش كار پژوهش های مهندسی ژنتیك، داروسازی و زیست شناسی را دگرگون كرده اند. فناوری جدید بیوانفورماتیكی امكانات جدید و بسیار قوی را فراهم ساخته است؛ مثل بررسی همزمان میزان فعالیت هزاران ژن در سلول، تحلیل نحوه تعامل تعداد زیادی پروتئین و تحلیل خصوصیات هزاران سلول جهش یافته در آن واحد. این مسائل با به كارگیری روش های آماری پیشرفته و كلاستربندی حل شده اند. دانش مربوط به این بخش تحت عنوان «ژنوم شناسی كاركردی» به یكی از فعال ترین زمینه های تحقیقی در بیوانفورماتیك مبدل شده است.
از دستاوردهای مهم در این زمینه می توان به پیش بینی نقش و كاركرد ژن ها در سلول بدون نیاز به تحلیل داده های پروتئینی اشاره كرد.
۴- ایجاد و مدیریت پایگاه های داده ای
صرف نظر از نوع داده های تولید شده در زیست شناسی مولكولی و نحوه تحلیل و تفسیر آنها، باید این داده ها را از طریق پایگاه هایی در اختیار پژوهشگران قرار داد. اما نحوه این ارائه هم مشكلات خاص خود را پیش رو دارد؛ مثل نحوه حصول اطمینان از درستی داده های ثبت شده و چگونگی نمایش مفید داده ها برای كاربران. از این جهت اداره كنندگان پایگاه های بزرگ بیوانفورماتیكی، چالش هایی بیش از یك مهندس پیش رو دارند.
۵- مدل سازی ریاضی فرآیندهای حیات
استفاده كنندگان ابزارها و داده های بیوانفورماتیكی محدود به متخصصان زیست شناسی مولكولی نمی شود. گروهی كه اخیراً به اهمیت بیوانفورماتیك پی برده اند، فیزیولوژیست ها هستند. آنها با استفاده از حجم عظیم داده های ژنومی و پروتیومی در تلاشند تا راه شبیه سازی فرآیندهای بیوشیمیایی سلول های زنده را هموار سازند.
تلاش محققان این است كه فرآیندهای خاص سلولی را شبیه سازی كرده و با یك پارچه سازی آنها به یك سلول كامل برسند كه در این صورت یكی از هدف های مهم بیوانفورماتیك علوم زیستی محقق خواهد شد؛ یعنی درك كامل ساز و كار ارگانیسم های زنده در سطح مولكولی.در خاتمه باید یادآور شد كه اهمیت بیوانفورماتیك تنها در سرعت بخشیدن به كارهای آزمایشگاهی نیست بلكه گسترش این شاخه علمی و طرح و پاسخگویی به سئوالات جدید افق های نوینی را پیش روی زیست شناسان گشوده است.
منبع : روزنامه شرق