شنبه, ۶ بهمن, ۱۴۰۳ / 25 January, 2025
مجله ویستا

عالم پیر, گرید جوان Grid Computing و بزرگ ترین ماشینهای علمی ساخت بشر


عالم پیر, گرید جوان Grid Computing و بزرگ ترین ماشینهای علمی ساخت بشر

اگر همه چیز مطابق برنامه پیش برود, سال آینده بزرگ ترین ماشین علمی ای که تاکنون ساخته شده است, در مجتمع زیرزمینی پرپیچ و خمی در سوئیس, نزدیک ژنو, به بهره برداری خواهد رسید

اگر همه چیز مطابق برنامه پیش برود، سال آینده بزرگ‌ترین ماشین علمی‌ای که تاکنون ساخته شده است، در مجتمع زیرزمینی پرپیچ و خمی در سوئیس، نزدیک ژنو، به بهره‌برداری خواهد رسید. تصادم‌گر بزرگ هادرون ‌(LHC) که در عمق بیش از صد متری زیر زمین قرار دارد، دو باریکه پروتون را در جهت‌های مخالف هم در یک تونل دایره‌ای ۲۷ کیلومتری شتاب خواهد داد. این دو باریکه، در حالی که تقریباً به سرعت نور رسیده‌اند، به صورت متقابل (شاخ به شاخ) با هم برخورد می‌کنند و رگباری از بقایای زیراتمی را تولید می‌کنند که دانش‌پیشگان انتظار دارند ذراتی مرموز را که قبلاً هرگز مشاهده نشده‌اند، در میان آن‌ها بیابند. این امر می‌تواند منجر به تغییر در درک بنیادی ما از جهان گردد. دست‌کم، امید است که چنین شود. پژوهشگران سازمان تحقیقات هسته‌ای اروپا (سرن)، جایی که LHC به بهره‌برداری خواهد رسید، می‌دانند که یافتن ذرات مادی گریزانی که آن‌ها در جست‌وجویش هستند، کار بسیار دشواری خواهد بود. برای یافتن این ذرات، پژوهشگران باید توده‌های مهیبی از داده‌های مربوط به برخوردها را غربال نمایند: انتظار می‌رود فوران داده‌ها در LHC به طور متوسط، سالانه به پانزده میلیون گیگابایت برسد؛ این مقدار بیشتر از میزان داده‌ای است که برای پر کردن شش دی‌وی‌دی استاندارد در دقیقه لازم است. به این ترتیب مرتب کردن و تحلیل نمودن این کوه داده‌ها کاری است فراتر از توان هر ابرکامپیوتری در جهان. پس در همان حال که تیم LHC برای تکمیل نمودن ماشین غول‌پیکر زیرزمینی در تکاپو است، روی سطح زمین گروه دیگری از فیزیک‌پیشگان و متخصصان علوم کامپیوتر در حال حل نمودن مسئله‌ای مستقل هستند: فراهم آوردن زیرساختی محاسباتی‌ که از پس سیلاب داده‌های LHC برآید. راه‌حلی که آنان یافته‌اند مجموعه‌ای پهناور از کامپیوترهای قدرتمند که حدوداً در دویست مرکز پژوهشی در سراسر دنیا گسترده‌اند و به گونه‌ای مرتبط و پیکربندی شده‌اند که همچون یک سیستم واحد پردازش موازی کار کنند. این نوع زیرساخت یک گرید پردازشی (computing grid) خوانده می‌شود

شبکه‌های گرید محاسباتی در اواخر دهه ۱۹۹۰ به عنوان جایگزینی پیشنهادی برای سوپرکامپیوترهای متداول پدیدار شدند تا به حل مسائل خاصی بپردازند که مستلزم محاسبات عددی انبوه و دسترسی به حجم بیشتری از داده‌های توزیع‌یافته بودند.

ایده اصلی این بود که با شبکه‌هایی که به قدر کافی سریع باشند و با بهره‌گیری از نرم‌افزار مناسب، گروه‌های تحقیقاتی متعدد که از لحاظ جغرافیایی نیز پراکنده بودند، می‌توانستند منابع پردازشی و منابع مدیریت داده‌های خود را در قالب سیستمی واحد به اشتراک بگذارند و بدین ‌صورت این سیستم توانایی درگیر شدن با مسائلی را داشته‌ باشد که از عهده هر یک از این گروه‌ها به تنهایی، خارج بود.

پژوهشگران امید داشتند چنین گریدهایی همان کاری را برای توان محاسباتی انجام دهند که شبکه‌های توزیع برق برای الکتریسیته انجام می‌دهند: توان محاسباتی را همه جا در دسترس قرار دهند؛ فقط کامپیوتر شخصی خود را به یک شبکه گرید متصل کنید و به صورت بی‌درنگ به قدرت پردازشی عظیمی با بهایی قابل قبول دسترسی داشته‌ باشید.

هنوز به‌طور کامل به آن هدف نرسیده‌ایم. امروزه، اگرچه گریدها در همه جا گسترده شده‌اند، اغلب آن‌ها سیستم‌هایی تخصصی هستند که فقط برای گروه‌های خاصی از پژوهشگران در شاخه‌هایی مانند فیزیک انرژ‌ی‌های بالا، تحقیقات ژنتیکی و مانیتورینگ زمین‌لرزه قابل دسترسی هستند. به این ترتیب، چگونه می‌توانیم گریدها را به ابزارهای روزمره پژوهشی تبدیل کنیم که در شاخه‌های علمی و فنی متنوع‌‌تری از آن‌ها بهره‌برداری گردد؟

این پرسشی است که سرن و دانشگاه‌های همکار آن، آژانس‌های تحقیقاتی و شرکت‌ها، امیدوارند به آن پاسخ دهند. بیشتر این سازمان‌ها در اروپا قرار دارند. البته برخی هم در ایالات متحده، آسیا و آمریکای لاتین هستند. آن‌ها به این منظور می‌خواهند از تجربه گرید LHC به‌عنوان پایه‌ای برای ایجاد یک زیرساخت عظیم جهانی گرید بهره ببرند. این گروه که توسط سرن هدایت می‌گردد، می‌کوشد این گرید جدید جهانی را به ابزاری تبدیل کند که توانایی حل مسائل بسیار متنوعی را در حوزه علوم، مهندسی و صنعت داشته‌ باشد.

این طرح که سرمایه آن توسط اتحادیه اروپا تأمین می‌شود، «توانمند ساختن گریدها برای (استفاده در) EsciencE» یا EGEE نامیده می‌شود. در پس این نام اختصاریِ زمخت، تلاش‌های بلندپروازانه‌ای در جریان است (کادر پایین با عنوان «جهانی شدن» را ببینید).

گرید EGEE هم‌اکنون توان پردازشی بیش از بیست هزار پردازنده مرکزی، توان ذخیره‌سازی‌ بیش از پنج میلیون گیگابایت - البته بر مبنای پیش‌بینی‌ها حجم دیتای LHC به سرعت در حال افزایش است - و شبکه‌ای جهانی که بیش از دویست پایگاه در جاهایی مثل پاریس، مسکو، تایپه و شیکاگو را به هم متصل می‌سازد را با یکدیگر درآمیخته است.

این گرید هم‌اکنون در حال کار با داده‌های امتحانی برای آزمایش‌های LHC (کادر «انفجار بزرگ داده‌ها» در صفحه بعد را ببینید) و همچنین برای یک دوجین کاربردهای مختلف در زمینه‌هایی مانند اخترفیریک، تصویربرداری پزشکی، بیوانفورماتیک، مطالعات جوی، اکتشاف نفت و گاز، تحقیقات دارویی و پیش‌بینی مالی است. این شبکه در حال حاضر بزرگ‌ترین گرید علمی همه‌‌منظوره است و هر ماه هم بزرگ‌تر می‌شود.

به نظر می‌رسد گریدها قسمتی طبیعی از سیر تکاملی محاسبات توزیع‌‌یافته باشند. اگر به بعضی از سوپرکامپیوترهای نخستین بنگرید، این ماشین‌ها شامل کابینت‌هایی، هر یک به اندازه یک یخچال بودند که بار کاری محاسبات را میان چندین پردازنده تقسیم می‌کردند.

سپس کلاسترها (شبکه‌های خوشه‌مانند) آمدند که شامل گروه‌هایی از کامپیوترهای نسبتاً ارزان و با اندازه‌ کوچک‌تر بودند (معمولاً کامپیوترهایی شخصی با سیستم‌عامل لینوکس) که سیستم‌های پردازش موازی وسیعی را تشکیل می‌دادند که در تمامی اتاق‌ها، ساختمان‌ها و حتی محوطه‌های دانشگاهی گسترده می‌شدند. اما با افزایش سرعت و کاهش قیمت شبکه‌های کامپیوتری، برخی از محققان دریافتند که حتی اجتماعی ناهمگون‌تر و پراکنده‌تر از کامپیوترها را نیز می‌توان برای این منظور مورد استفاده قرار داد.

این پژوهشگران زیرساختی را برای خود مجسم می‌کردند که بر خلاف سوپرکامپیوترها یا کلاسترها، تحت مالکیت، مدیریت و استفاده چندین سازمان باشد. همچنین به جای طراحی یکپارچه سخت‌افزار و نرم‌افزار، این زیر ساخت روی چند نوع مختلف سیستم‌عامل، سیستم‌فایلی و فناوری‌های شبکه کار کند. به این ترتیب ایده محاسبات گرید به وجود آمد و گروهی از پیشگامان گرید، شروع به فعالیت برای محقق ساختن این روِیا نمودند.

ایان فاستر، از آزمایشگاه ملی آرگون در ایلی‌نوی، و کارل کسلمن، از دانشگاه کالیفرنیای جنوبی در لس‌انجلس، در زمره این پیشگامان بودند. این دو در سال ۱۹۹۸ کتابی را با عنوان «گرید: طرح کلی یک زیرساخت محاسباتی جدید» (انتشارات مورگان کافمن) منتشر ساختند که فوراً به مرجع اصلی این حیطه نو تبدیل گشت.

دست‌کم در حد نظریه، گریدها شامل همه نوع سیستم هستند: سوپرکامپیوترها، کلاسترهای غول‌آسا، کامپیوترهای شخصی رومیزی، و همچنین ادوات ذخیره‌سازی، بانک‌های اطلاعاتی، حسگرها و ادوات علمی. اما اگرچه بسیاری از پروژه‌های گرید به سمت این گوناگونی اجزا پیش می‌روند، بیشتر آن‌ها هنوز بر گرد مجموعه‌ای همگن‌تر از سیستم‌ها مجتمع شده‌اند.

گرید EGEE عمدتاً شامل چندین کلاستر از کامپیوترهای شخصی است (بعضی از مؤسسه‌ها یک دوجین کامپیوتر دارند و برخی چند هزار) که به انبوهی از سرورهای دیسک و سیلوهای نوار مغناطیسی اختصاص‌یافته‌ای متصل هستند که برای بک‌آپ‌گیری و ذخیره‌سازی طولانی‌مدت داده‌ها به کار می‌روند.

این گرید برای توزیع کردن کارهای محاسباتی میان کلاسترهایی که متعلق به گروه‌های مختلف هستند، متکی به اینترنت و شبکه‌های تحقیقاتی پرسرعت اختصاصی است؛ چنانکه گویی تمام این ماشین‌ها در یک اتاق قرار داشته ‌باشند.

از میان شبکه‌های EGEE، مهم‌ترین آن‌ها که Gant۲eG نام دارد، یک زیرساخت آکادمیک شبکه‌ای فیبرنوری است که ۳۴ کشور اروپایی را به هم متصل می‌کند و اتصالاتی با شبکه‌های تحقیقاتی مشابه در سایر نقاط جهان دارد.

هنوز توان محاسباتی خالص بعضی از سوپرکامپیوترها بیشتر از توان EGEE است. اما روزی این وضعیت می‌تواند تغییر کند و این بستگی به آن دارد که این گرید با چه سرعتی رشد کند و با چه سرعتی بتواند نیروهایش را با سایر گریدهای اصلی ملی و بین‌المللی متحد سازد.

برای نمونه، گرید Open Science که در ایالا‌ت‌متحده پایه‌گذاری شده و تاکنون تعداد زیادی دیتاسنتر در بیش از پنجاه مؤسسه را به یکدیگر متصل کرده است، از بسیاری جهات مشابه گرید ایجاد شده در اتحادیه اروپا است و به زودی قابلیت همکاری با EGEE را خواهد یافت.

اما حقیقت آن است که چنین گریدهایی، حتی هنگامی که به یکدیگر متصل شوند، هنوز نمی‌توانند جای سوپرکامپیوترها را بگیرند. برخی از مسائل، مانند انواع خاصی از شبیه‌سازی‌های آب و هوا، چنان محاسبات درهم پیچیده‌ای دارند که پردازنده‌های متعدد یک سوپرکامپیوتر باید برای حل آن‌ها با سرعتی خارق‌العاده داده‌ها را با هم مبادله نمایند و این قابلیتی است که دستیابی به آن برای گریدها دشوار است.

هدف گریدهایی مانند EGEE چیزی است که پردازش با توان عملیاتی بالا خوانده می‌شود؛ یعنی سر و کار داشتن با مقادیر زیادی محاسبات مشابه، اما مستقل. به بیان دیگر، بهترین بهره از گریدها در مسائلی حاصل می‌شود که می‌توانند به تعداد زیادی قطعات کوچک‌تر تقسیم شده و به طور موازی مورد پردازش قرار گیرند.

اگرچه گریدها عمدتاً ابزاری برای پژوهش‌های آکادمیک باقی می‌مانند، گام‌های بلندی نیز به سوی جهان تجارت برداشته‌اند. خیلی از شرکت‌های بزرگ بعد از سرمایه‌گذاری‌های تکنولوژیکی برای بهره گرفتن از آن در تجارت الکترونیکی، مدیریت روابط با مشتری و سیستم‌های زنجیره منابع، اکنون گریدهای محاسباتی را در صدر فهرست ملزومات خود قرار می‌دهند.

از نخستین مؤسساتی که چنین تصمیمی اتخاذ نموده‌اند، مؤسسات مالی هستند که برخی از آن‌ها از گریدها برای انجام تحلیل‌های پیچیده ریسک استفاده می‌کنند. شرکت‌های دارویی نیز گریدها را برای مطالعه آثار داروهای جدید به کار می‌برند.

تمام عرضه‌کنندگان اصلی کامپیوتر، از جمله اچ‌پی، آی‌بی‌ام، مایکروسافت و سان، این بازار را زیر نظر دارند و اکنون سخت‌افزارها و نرم‌افزارهایی را ارائه می‌کنند که سرورها، کامپیوترهای شخصی و مین‌فریم‌ها را قادر می‌سازند از قدرت گرید بهره ببرند. این گزینه‌های تجاری اگرچه سودمند هستند، هنوز نمی‌توانند تعداد زیاد کامپیوترها، شبکه‌ها و سیستم‌ها را در یک گرید عظیم مانند EGEE مدیریت نمایند.

علاوه بر این، شرکت‌های مختلف نهایتاً فناوری‌های گرید متفاوتی را توسعه داده‌اند. بنابراین بر خلاف وب (که اتفاقاً آن هم در سرن توسعه یافت)، که مبتنی بر یک مجموعه استانداردهای عمومی است، گریدهای موجود بر پایه فناوری‌های بسیار متنوعی بنا گشته‌اند.

به نظر می‌رسد این حوزه برای آن که یک شرکت به تنهایی خطر ارائه محصولات و خدمات در مقیاس وسیع را بپذیرد، بیش از حد نارس است. در این مورد، صنعت یک سیاست صبر و مشاهده را پیشه کرده و نقش رهبری را به جامعه آکادمیک سپرده، همچنان که غالباً در مورد فناوری‌های نوظهور چنین بوده‌ است.

در واقع به همین دلیل است که پروژه‌های بزرگ گرید هنوز به حمایت مالی عمومی نیاز دارند. حرکت‌های بین‌المللی گرید مانند EGEE در نظر دارند با توسعه و آزمایش فناوری‌های محاسباتی، شبکه و امنیت، و با تلاش برای رسیدن به استانداردهای عمومی، مدل گرید را یک قدم به پیش ببرند.

این تلاش‌ها مکمل کارهای تشکل‌های استانداردهای بین‌المللی، مانند Global Grid Forum است که از همگرایی و تعامل کاری فناوری‌ها حمایت می‌کنند.

اما با وجود چنین تلاش‌هایی برای استاندارد‌سازی، واژه محاسبات گرید برای افراد مختلف معانی متفاوتی دارد؛ چنانکه غالباً درباره کلمات شعارگونه تکنولوژیکی رخ می‌دهد. یکی از عواملی که منشأ اشتباه در این زمینه گشته، مفهوم خدمات محاسباتی ارائه شده توسط شرکت‌های کامپیوتری است که بنا بر تقاضای مشتری (On-demand) ارائه شود.

مفهوم متداول در اذهان چنین است که یک مشتری که نیاز به قدرت پردازشی اضافه دارد، بتواند به دیتاسنتر یک عرضه‌کننده متصل شود و برای آنچه که استفاده می‌کند، هزینه پرداخت کند. این مفهومی جالب است. اما لزوماً به فناوری گرید نیاز ندارد.

در مرتبه بعد سیستم‌هایی به منظور جمع‌آوری توان محاسباتی از منابع بلااستفاده قرار دارند، مانند ۲SETI@home، برنامه محبوب محافظ صفحه نمایشگر که برای جست‌وجوی داده‌های حاصل از امواج رادیویی نجومی در پی نشانه‌های هوشمندی فرا زمینی، از کامپیوترهای شخصی مردم عادی بهره می‌برد.

با در نظر گرفتن این که SETI@home تاکنون روی بیش از پنج میلیون کامپیوتر شخصی در سراسر جهان دانلود شده است، جاه‌طلبی‌های پروژه‌ای مانند EGEE برای یکپارچه ساختن صدهزار کامپیوتر، در مقام مقایسه نسبتاً کم به نظر می‌آید.

اما شباهت‌های این دو پروژه، تفاوت‌های آن‌ها را به شکلی گمراه‌کننده جلوه‌گر می‌سازند. نوع نرم‌افزار علمی‌ای که روی گرید EGEE اجرا می‌شود، با پیکربندی‌های پیچیده‌ای سر و کار دارد و نیازمند تبادل داده‌ها به شکلی قابل اطمینان و ایمن است؛ چیزی که اتصال نامنظم کامپیوترهای شخصی نمی‌تواند فراهم آورد.

سرن پایگاهی است که در یک رمان ترسناک مشهور دن براون تصویر شده‌ است. اما سرنی که در این رمان ترسیم شده، یک پایگاه فضایی براق با یک هواپیمای Mach ۱۵ و ماشینی خیالی است که به طور انبوه پاد‌ماده تولید می‌کند و بسیار دور از سرن واقعی‌ای است که ادارات مختلف و نامرتب آن در دهه ۱۹۷۰ به صورت ساختمان‌هایی موقتی بنا گشتند. با این حال، ظواهر امر می‌توانند فریب‌دهنده باشند: برخی از پیشرفته‌ترین پروژه‌های علمی و تکنولوژیکی امروز، درون ساختمان‌های سرن در جریانند.

در یک خانه ویلایی بی‌تکلف که در مجاورت تشکیلات اصلی محاسبات سرن قرار دارد، مرکز عصبی پروژه EGEE بنا نهاده شده ‌است. هنگامی که در آوریل ۲۰۰۴ پروژه آغاز گشت، هدفش ایجاد یک گرید بود که مؤسسه‌هایی را در اروپا و تعدادی را نیز در ایالا‌ت‌متحده و روسیه به هم متصل سازد. اما هنگامی که گروه‌های دیگری در آسیا و خاورمیانه به این حرکت پیوستند، این کار به سرعت شکل یک حرکت جهانی را گرفت.

نخستین فاز دوساله این پروژه در ماه مارس ۲۰۰۶ به پایان رسید و مرحله دوساله دوم شروع شده‌ است. هدف آن است که گرید را به مکان‌های بیشتری گسترش دهند و نهایتاً تا سال ۲۰۰۸ به بیش از صد هزار CPU و چند ده پتابایت ظرفیت ذخیره‌سازی برسند (هر پتابایت حدوداً یک میلیون گیگابایت است).

احتمالاً مهم‌ترین قسمت یک گرید، چیزی است که میان‌افزار (middleware) خوانده می‌شود. میان‌افزار مجموعه‌ای از برنامه‌ها است که هر مؤسسه برای آن که سیستم‌های خود را به قسمتی از گرید تبدیل کند، باید روی آن‌ها اجرا نماید. میان‌افزار بررسی می‌کند که چه منابعی (شامل قدرت پردازشی، ذخیره‌سازی و دیتابیس) در دسترس هستند و تصمیم می‌گیرد که کجا و در چه زمانی کارهایی را که توسط کاربران ارائه شده است، به انجام برساند.

میان‌افزار به عنوان یک لایه نرم‌افزاری میانی، بین کامپیوترهای گرید، شبکه‌ها و برنامه‌های کاربران فعالیت می‌کند. با بهره‌گیری از میان‌افزار، ساختار زیرین پیچیده گرید برای محققانی که آن را به صورت یک ماشین مجازی واحد می‌بینند، شفاف می‌گردد

تیم EGEE به جای آن که سعی کند میان‌افزار را از پایه بنا نماید، اجزای نرم‌افزاری را از شماری از پروژه‌های مختلف مربوط به گرید اقتباس کرد. برای مدیریت نمودن تمام کارهای گرید، میان‌افزار EGEE که gLite نام دارد، متکی به اجزایی از کیت نرم‌افزاری Globus است.

Globus یک بسته نرم‌افزاری پرکاربرد گرید است که توسط فاستر، کسلمن و همکاران آن‌ها توسعه داده‌ شده ‌است. همچنین gLite برای ایفای وظایف محاسباتی توزیع‌یافته خود، از Condor بهره می‌برد که یک سیستم پرطرفدار مدیریت بار محاسباتی است که توسط تیم Miron Livny در دانشگاه ویسکانزین در مدیسون توسعه داده شده است.

gLite بر خلاف نامش (که مفهوم سبکی را القا می‌کند) بیش از یک میلیون خط کد را شامل می‌شود که به زبان‌های مختلف نوشته‌ شده‌اند و بسته آن بیش از صد مگابایت حجم دارد. اما این اسم بیانگر این حقیقت است که رهیافتی واقع‌گرایانه اتخاذ شده تا مجموعه‌ای پایه‌ای از سرویس‌های گرید به دست آیند که در مقیاس جهانی اجرا می‌شوند و مسائل پیشرفته‌تر به آینده موکول شده‌اند.

برای آن که درکی ابتدایی از نحوه کار گرید به دست آورید، اقدامی جدید را در نظر بگیرید که در آن آزمایشگاه‌هایی از آسیا و اروپا برای بررسی سیصدهزار ترکیب دارویی پیشنهادی بر ضد آثار دردناک ویروس آنفلوانزای مرغی، H۵N۱، از EGEE استفاده کردند.

حدود دو هزار کامپیوتر در گرید، یک برنامه شبیه‌سازی مولکولی را به مدت چهار هفته در آوریل سال ۲۰۰۶‌ اجرا کردند؛ کاری که برای یک کامپیوتر صد سال طول می‌کشید. این کار متکی به برنامه‌ای بود که توانایی یک مولکول دارو را برای جای گرفتن در پروتئین‌های کلیدی سطح H۵N۱ می‌سنجد.

اگر مولکولی این کار را با موفقیت انجام دهد، فعالیت آن پروتئین‌ها را کُند می‌کند و توانایی انتشار ویروس مختل می‌گردد. شش مؤسسه شرکت‌کننده در EGEE که در فرانسه، ایتالیا، اسپانیا و تایوان قرار دارند، داروهای نامزد را انتخاب کردند و هر یک از آن‌ها شبیه‌سازی‌های خود را به گرید ارائه کرد.

● چگونه پانزده میلیون گیگابایت داده را ذخیره می‌کنید؟

هنگامی که تصادم‌گر بزرگ هادرون‌ در سرن در سال ۲۰۰۷ شروع به کار کند، نتایج برخورد میان دو گروه از پروتون‌هایی را ثبت خواهد کرد که در جهات مخالف یکدیگر حرکت می‌کند و انرژی‌ای دارند معادل با یک اتومبیل که با سرعت ۲۵هزار کیلومتر در ساعت حرکت کند.

برخوردها در چهار نقطه در تونل دایره‌ای LHC رخ می‌دهند، در جاهایی که هم‌اکنون آشکارسازهای غول‌پیکر را سوار می‌کنند. این برخوردها به فیزیک‌پیشگان امکان می‌دهند نظری سریع بر ذراتی داشته ‌باشند که مدت‌هاست از جهان ما ناپدید شده‌اند، مانند بوزون فرضیه‌‌ای هیگز که آخرین قطعه اساسی گم‌شده از مدل استاندارد ذرات بنیادی به شمار می‌رود.

بزرگ‌ترین این آشکارسازها، ATLAS، حفره‌ای زیرزمینی به بلندای شش طبقه را پر می‌کند. انتظار می‌رود ATLAS یک میلیارد برخورد را در ثانیه آشکارسازی نماید. با توجه به این‌که یک برخورد منفرد در یک آشکارساز، تصویری با صدها مسیر ذره ایجاد می‌کند که معادل با چندین مگابایت داده است، نرخ تولید داده‌ها سرسام‌آور خواهد بود.

دانش‌پیشگان تنها با یک فرایند به شدت گزینشی که حدوداً یکی در یک میلیون رویداد را انتخاب می‌کند، شانس این را می‌یابند که داده‌ها را ذخیره کنند. حتی با این حال، پیش‌بینی می‌شود تجمع داده‌ها در یک سال به بیش از پانزده میلیون گیگابایت برسد.

سرن راهی برای ذخیره این حجم داده به صورت متمرکز ندارد و حتی اگر راهی داشت، یک مخزن مرکزی داده‌ها برای اکثر مؤسسات دوردستی که درگیر پروژ LHC هستند، نامناسب می‌بود. از این رو ایجاد یک زیرساخت جهانی برای ذخیره و تحلیل نمودن داده‌های LHC ضروری است.

ایجاد این زیرساخت از گرید محاسباتی LHC که در سال ۲۰۰۲ به بهره‌برداری رسید، آغاز گشت و اکنون گریدهای متعددی را در بر می‌گیرد؛ از جمله گریدهای EGEE.

داده‌های LHC فرصت عملیاتی ایده‌آلی را برای شروع کار پروژه EGEE فراهم می‌آورند. اما نهایتاً اگر اهداف این حرکت محقق شوند، پروژه‌های تحقیقاتی فیزیک ذرات بنیادی تنها یکی از طیف وسیع پروژه‌های علمی خواهد بود که روی این گرید همه‌منظوره اجرا خواهند شد

شبیه‌سازی‌ها توسط یک قسمت از میان‌افزار به نام واسطه منابع دریافت می‌شوند. واسطه منابع مجموع توان محاسباتی برای پردازش تمام شبیه‌سازی‌ها را تخمین می‌زند و سپس منابع قابل دسترسی در سراسر گرید را بررسی می‌کند. در یک کار مشخص، تمام اعضای EGEE شرکت نمی‌کنند و بنابراین واسطه منابع باید بفهمد که کدام را می‌توان مورد استفاده قرار داد.

یک روش انجام این کار، تعریف کردن یک «سازمان مجازی» است؛ زیرمجموعه‌ای از تمام مؤسسه‌های شرکت‌کننده که علایق علمیِ مشترکی دارند. در شبیه‌سازی آنفلوانزا، بازیگر اصلی یک سازمان مجازی EGEE به نام BioMedبود که حدوداً شصت پایگاه در اروپا، روسیه، تایوان و … دارد.

در مرحله بعد، واسطه منابع، کارها را با استفاده از اینترنت یا شبکه‌های اختصاصی در مکان‌های مختلف توزیع می‌کند. ممکن است قسمتی از کارها به آزمایشگاه‌های فیزیک Corpuscular در کلرمونت‌فراند در فرانسه برود، قسمتی دیگر به سوی مرکز تحقیقات Genomics در تایوان حرکت کند، قسمت سوم به دانشگاه بیرمنگام در انگلیس برود و قسمتی هم به مؤسسه فناوری‌های زیست-پزشکی در ایتالیا برسد.

این قسمت‌ها و تمام کارهای دیگر مورد پردازش قرار گرفته و نتایج، به واسطه منابع بازگردانده می‌شوند و واسطه منابع دوباره آن‌ها را به شکل راه‌حل کامل به هم متصل می‌کند. مسئله بیت به بیت و در مؤسساتی که توسط قاره‌ها و اقیانوس‌ها از هم جدا گشته‌اند، حل می‌شود.

داده‌های خروجی هر محاسبه، به منظور تأمین امنیت بسیار زیاد، در سه پایگاه ذخیره می‌شوند: دو پایگاه در فرانسه و یکی در تایوان. بیش از شصت هزار فایل خروجی با حجم داده ششصد گیگابایت در گرید EGEE ایجاد و ذخیره شدند. ترکیب‌های دارویی بالقوه بر ضد آنفلوانزای مرغی اکنون مشخص گشته‌اند و بر حسب میزان موفقیتی که به نظر می‌رسد در مسدود کردن فعالیت ویروس در شبیه‌سازی‌ها داشته‌اند، رتبه‌بندی شده‌اند.

سایر برنامه‌هایی که روی گرید EGEE اجرا می‌شوند، به روش مشابهی کار می‌کنند. (کادر صفحه قبل با عنوان «حل مسئله» را ببینید.) برخی از پژوهشگران از EGEE برای تحلیل تصاویر پزشکی، مانند اسکن‌های توموگرافی تابش پوزیترون (PET) که در بیمارستان‌ها نگهداری می‌شوند، استفاده می‌کنند.

مهندسان در Compagnie Generale de Geophysique در پاریس، از گرید برای پردازش داده‌های ژئوفیزیکی در جست‌وجوی نفت، گاز، معادن و برای مطالعات محیطی استفاده می‌کنند. همچنین UNOSAT، پروژه‌ای متعلق به سازمان ملل متحد، مشغول آزمایش کردن با یک برنامه گرید به منظور فشرده نمودن داده‌های ماهواره‌ای دارای وضوح بالا است که در منابعی در سراسر جهان نگهداری می‌شوند. داده‌های فشرده شده را می‌توان سریع‌تر به کارکنان محلی رساند که وظیفه عملیات نجات بعد از سوانح طبیعی و امداد پس از جنگ را بر عهده دارند.

هنوز به آن نقطه مطلوب نرسیده‌ایم که استفاده از گرید برای کارهای علمی همان ‌قدر معمول شود که امروزه استفاده از کامپیوترهای شخصی و وب متداول است. اما کاربران EGEE به طور فزاینده‌ای در حال متکی شدن به آن هستند. سال گذشته بیش از یک هزار پژوهشگر از پنج قاره، حدود دو میلیون کار محاسباتی را به گرید EGEE ارائه نمودند که از شبیه‌سازی‌های نسبتاً کوچک تا مسائل عظیم محاسبات عددی را شامل می‌شد.

طرح‌های فاز دوم EGEE مستلزم ادامه گسترش زیرساخت این پروژه و افزایش تعداد کاربردهای آن است. در زمان شروع فاز دوم، روزانه ۲۵هزار کار مورد پردازش قرار گرفته‌اند. همچنین گستردگی جهانی این پروژه برای توسعه آن مهم است و تلاش‌هایی در جریان است تا گستره گرید EGEE را به حوزه‌های جغرافیایی بالتیک، مدیترانه، چین، هند و آمریکای لاتین برسانند.

در عین حال هنوز هم مشکلاتی بنیادی ظاهر می‌شوند. یکی از آن‌ها، حفظ ضریب اطمینان گرید است. EGEE نیازمند آن است که روند تکامل خود از یک ابزار تحقیقاتی به یک زیرساخت تولیدی واقعی را به پایان رساند. از این رو یک عنصر اساسی پروژه EGEE (که در واقع نیمی از کل بودجه را به خود اختصاص داده)، شامل حصول اطمینان از این امر است که تمام مؤسسات شرکت‌کننده دارای کادر آموزش‌دیده باشند.

همچنین مراکز ملی و منطقه‌ای سرویس گرید به منظور هماهنگ ساختن روزآمدسازی‌ها و زیر نظر گرفتن کارایی شبکه ایجاد گردند و همچنین مراکز تلفنی‌ای که، پاسخگوی سؤالات فوری دانش‌پیشگانی باشند که به زبان‌های گوناگون صحبت می‌کنند.

در نهایت گرید تنها در صورتی متداول خواهد شد که پژوهشگران (که معمولاً مشتری‌های معترضی هستند)، متقاعد شوند که گرید برای آن‌ها پرفایده و کم‌دردسر است. عملیات پردازشی سرهم‌بندی‌شده و واسط‌های کاربری بد به سادگی چنین کاربرانی را فراری خواهد داد و آن‌ها احتمالاً به منابع محلّی خود اکتفا خواهند کرد؛ هرچند در حد توانایی‌های گرید نباشد.

با در نظر داشتن این مسئله، EGEE نسخه سوم gLite را ارائه کرده است که در آن تخصیص منابع و قابلیت‌های تبادل داده بهبود یافته‌اند تا بتواند از عهده پاسخگویی به خواسته‌های گوناگون گروه‌های علمی متفاوت برآید.

درباره آینده گرید EGEE و سایر گریدها، کارشناسان معتقدند همچنان که استفاده از گریدها متداول شود، دیگر نخواهیم‌ توانست آن‌ها را از وب و سایر برنامه‌های اینترنتی تمیز دهیم. یعنی به این ترتیب استفاده نمودن از گرید برای دسترسی به توان محاسباتی یا ظرفیت ذخیره‌سازی، تفاوتی با رزرو کردن بلیت پرواز یا دانلود کردن موسیقی نخواهد داشت. مانند بسیاری از فناوری‌ها، موفقیت گرید هنگامی حاصل خواهد شد که در زمینه زندگی تکنولوژیکی ما محو شده باشد.

برنامه‌های گوناگونی که با مسائل پیچیده مواجهند، هم‌اکنون روی گرید EGEE اجرا می‌شوند:

▪ فیزیک انرژی‌های بالا و اخترفیزیک‌

ـ LHC: تحلیل و ذخیره‌سازی داده‌های حاصل از چهار سیستم آشکارسازی تصادم‌گر بزرگ هارون‌ها

ـ MAGIC: شبیه‌سازی‌های پرتوهای کیهانی برای تحلیل داده‌های تلسکوپ MAGIC در جزایر قناری.

ـ‌ ANTARES: تحیلی داده‌های آشکارساز زیرآب میوآن که قرار است در دریای مدیترانه ساخته شود.

▪ پزشکی و علوم زیستی‌

ـ WISDOM: تحلیل ترکیب‌های شیمیایی به منظور کشف کردن داروهای جدید بر ضد بیماری‌های گوناگون.

ـ GPS: بانک اطلاعاتی و ابزارهای تحلیل پروتئین‌ها برای پژوهشگرانی که روی ژنوم‌هایی که تاکنون مرتب شده‌اند، تحقیق می‌کنند.

ـ‌ GATE: شبیه‌سازی برهم‌کنش بافت با تشعشع برای برنامه‌ریزی جهت پرتودرمانی.

ـ‌ SiMRI۳D: شبیه‌سازی فیزیک یک سیستم سه بعدی تصویر‌برداری با تشدید مغناطیسی (MRI).

ـ SPLATCHE: شبیه‌سازی پراکندگی انسان‌ها در یک محدوده جغرافیایی برای مطالعه تغییرات ژنتیکی.

▪ علوم زمین

ـ CODESA ۳D: شبیه‌سازی فرایندهای فیزیکی حاکم بر جریان آب‌های زیرزمینی در سیستم‌های هیدرولوژیک (آب‌شناسی).

ـ EGEODE: پردازش داده‌های لرزه‌نگاری برای اکتشاف لایه‌های زمین و جست‌وجوی ذخایر نفت و گاز.

ـ GOME: تحلیل داده‌های نموداری و تصویری ماهواره‌ای برای تحقیقات اوزون و تشخیص ریزش (نشت) نفت‌

ـ PARTICLE SMASHER: پروتون‌هایی که در تونل ۲۷ کیلومتری LHC به صورت شاخ‌به‌شاخ با هم برخورد خواهند کرد

نویسندگان: Fabrizio Gagliardi و Francois Grey ؛

ترجمه: سیدمصطفی ناطق‌الا‌سلا‌م‌

منابعی برای مطالعه بیشتر

برای اطلاعات بیشتر در زمینه تکنولوژی و کاربردهای EGEE، مراجعه کنید به:

www.eu-egee.org

گرید Open Science یکی از بزرگ‌ترین پروژه‌های گرید در ایالات متحده است:

www.opensciencegrid.org

برای اطلاعات بیشتر در زمینه تکنولوژی گرید، سایت‌های زیر را ببینید:

http://gridcafe.web.cern.ch

www.globus.org