چهارشنبه, ۱۰ بهمن, ۱۴۰۳ / 29 January, 2025
مجله ویستا


تحلیل داده پایگاه‌ها: بررسی داده پایگاه‌های تهران بزرگ


تحلیل داده پایگاه‌ها: بررسی داده پایگاه‌های تهران بزرگ
این مقاله به موضوعاتی می پردازد كه ایجاد داده پایگاهی برای محدودهٔ تهران بزرگ مستلزم آن هاست و به ویژگی های سودمند چنین امری نیز اشارهٔ خاص دارد بعلاوه بر نیاز به استانداردی برای داده پایگاه ها تأكید می كند و نگاهی هم به تقویت كارآیی كاركردی این داده پایگاه ها دارد. این مقاله با ذكر تلاش هایی كه در ایران برای شبكه كردن كتابخانه های ایران از طریق خدمات تحویل مدرك و داده پایگاه های مركز اطلاعات و مدارك عملی ایران انجام گرفته به پایان می رسد. در حال حاضر، صنعت رایانه بر همگی ابعاد زندگی ما اثر گذاشته و در حال تبدیل به یك صنعت بنیادین است. ولی باید به یاد داشت كه سیستم های رایانه ای نیز حساس تر و پیچیده تر شده اند و خطاهای كوچك چه بسا كه ضایعات سنگین و برگشت ناذیری رابه بار آورد. این سیستم ها با انعطاف پذیری بالای خود برای همین حد از دقت ساخته شده اند. این ویژگی استفاده كنندگان را به تقاضای مستمر برای تغییر در این سیستم ها واداشته است. از سوی دیگر این سیستم های نرم افزاری سرعت توسعهٔ سیستم ها را كه در مواردی به تغییر كلی در محیط عملیاتی منجر می شود افزایش می دهد و تقویت می كند. همگی این ها به نوبهٔ خود باعث ظهور مسائلی در زمینهٔ سازگاری و كارآیی می گردد. بدین ترتیب راهبری(۱) سیستم های نرم افزاری به یك مسئله ویژه بدل می شود. به موجب برخی ارقام، راهبری گاهی تا به ۶۷ درصد از هزینه اصلی نصب نرم افزار می رسد. در طول انجام این بررسی، دریافتیم كه مستندات نرم افزاری هنوز یك مسئله است. هم.م مهندسان ایرانی نرم افزار، اصولا" كم ترین اهمیت را برای این جنبه از تولید نرم افزار قائل اند. حتی در قرار دادهایی كه به شركت های نرم افزاری داده می شود حداكثر یك عبارت ظاهری و تشریفاتی دربارهٔ مستندات نرم افزاری دیده می شود. در بیش تر موارد، كسانی كه قار است راهبری نرم افزاری را به عهده بگیرند باید در طول اجرای آن حضور داشته باشند. رفتار رسمی این است كه اگر نرم افزار درست كاركرد، ناراحت نشوید! اما خنده دار این كه هر اشكالی كه درطراحی قطعات نرم افزاری وجود داشته باشد، به هزینه های بعدی راهبری تبدیل [ و به هزینه های دیگر خریدار، بار ] می شود. تعداد باز هم كم تری از شركت ها هستند كه متعهد باشند به این كه عمدهٔ هزینه های راهبری را [با دقت كردن] در ساخت محصول، به حداقل برسانند. برعكس،قاعدهٔ عمومی هر چه كم تر كردن زمان اجرا است، نه زمان راهبری. بنابرگزارش تحقیقی كه از سوی ISIS انجام شده در برخی موارد حتی انتخاب نادرست زبان برنامه نویسی برای كدهای اصلی ممكن است باعث افزایش سرسام آور هزینه های راهبری شود اما مهم ترین موضوع شاید بی توجهی تولید كنندهٔ نرم افزار به این نكتهٔ بدیهی باشد كه سیستم های نرم افزاری قرار نیست تا ابد عمر كنند. در درون مراكز اطلاع رسانی ایرانی، تعداد اندكی هستند كه استانداردهای لازم الاجرا و فرایندهای [كنترل و ] تأیید را در عرصه سییتم های نرم افزاری به كار بندند. با افزایش خودكار سازی در مراكز اطلاع رسانی ایرانی و با وجود گرایش كنونی در ساخت داده پایگاه های داخلی ودر دسترس گذاشتن آن ها حتی برای استفاده كنندگاه راه دور، تحقیقی در موضوع پذیرش استانداردهای نرم افزار داده پایگاه ها انجام شد. شهرداری تهران در پی آن بود كه امكان ادارهٔ یك داده پایگاه بسیار بزرگ شامل ۱۵۰ واحد اطلاعاتی یا داده پایگاه فرعی را بررسی كند. این داده پایگاه ها را نزدیك به چهل مرجع جداگانه در دست ایجاد و خدمات دهی داشتند و عرصه هایی همچون حوادث، رویدادهای فرهنگی، مراكز پزشكی، فهرست قیمت ها، كتابخانه ها، و حتی خدمات سفارتخانه های خارجی در این داده پایگاه ها ملحوظ شده بود. اساسا" هدف شبكهٔ محدودهٔ تهران بزرگ تأمین دسترسی به این اطلاعات به دو شكل زیر است:
۱) با واسطه: از طریق كیوسك های اطلاعات؛
۲) بیواسطه: از طریق شبكه رایانه ای؛ مثل نمونه ای كه”مؤسسهٔ ندا رایانه” راه اندزی كرده و پیشتاز در گسترش دسترسی همگانی به اینترنت در ایران است. صرفه جویی بالقوه ناشی از كاهش تعداد سفرهای درون شهری كه با كاهش آلودگی و نیز بهره گیری بهتر از منابع ارتباطی همراه است به شبكهٔ محدودهٔ تهران بزرگ جاذبه و مقبولیت بخشیده است. وقتی كسی از ایجاد سرویسی برای ارائه خدمات به حدود ۱۰۰۰۰۰ نفر در روز صحبت می كند، نقش استانداردها بسیار برجسته تر می شود. هماهنگ كنندگان داده پایگاه نیازمند بررسی و به هم پیوستن یك برچسب مجازی به دست آمده از سیستم های داده پایگاهی هستند. در بیش تر موارد مبدل های واسطهٔ نرم افزاری خاصی باید نوشته می شد تا بتوان عناصر داده ای را از داده پایگاه های مختلف صادر یا به آن ها وارد كرد. هیچ چیزی بیش از بخش كتابخانه ای نمی تواند وسعت كار را به روشنی تصویر كند. عمدهٔ كتابخانه های تهران در زمان انجام این بررسی روی هم رفته از چهار سیستم متفاوت خودكارسازی كتابخانه استفاده می كردند كه همدیگر را نمی خواندند. ظاهرا" در آن زمان هنوز اخبار ۵۰/۳۹ Z به صحنهٔ كتابداری ایران نرسیده بود. بنابراین، این بررسی اساسا" در دو مسیر انجام شد. در مسیر اول كوشش بر این بود كه میزان پایبندی داده پایگاه های جاری به مجموعهٔ استاندارد های موجود، از قبیل استانداردهای ایزو و یونی سیست را مشخص كند. این كار میزانی برای اندازه گیری دامنه و عمق اصلاحات نرم افزاری لازم برای ادغام داده پایگاه ها به دست می دهد. مسیر دوم در پی رسیدن به استانداردهای جدیدی برای تضمین سازگاری و عملیات پذیری بین سیستمی بود. همهٔ این بخش ها در معرض الگوی كسفیت بوئن(۲) قرار داشتند كه بر معیار های نرم افزاری مشخص و تعریف شده مبتنی است. این معیار ها عبارت بودند از:
▪ صحت؛
▪ اطمینان پذیری؛
▪ بازدهی؛
▪ انسجام؛
▪ كارآیی؛
▪ راهبری پذیری؛
▪ نرمش پذیری؛
▪ آزمایش پذیری؛
▪ حمل و نقل پذیری؛
▪ قابلیت استفادهٔ مجدد؛
▪ قابلیت عملیات متقابل؛
“وراپایگا هی”(۳) موضوع مهمی در بررسی این بخش های اطلاعاتی بود. مثلا" داده پایگاه هایی را كه به وسیلهٔ مراجع مالی همچون بانك ها و مؤسسات پس انداز و قرض الحسنه ایجاد می شد همگان نمی توانستند مشاهده و بررسی كنند. با این حال، محافظ های مناسبی كه به منظور تأمین محرمانگی تدارك(۴)شده اند قابل دسترسی اند. برای خدمات كنترل اعتبار[مالی]، ابزار تأیید نیرومندی تهیه شده كه با اطلاعات مالی همراه می شود و از طریق “ادارهٔ ثبت شركت هایی ایرانی” قابل دسترسی است. در عین حال، فرایند بررسی علاوه بر تحلیل تأثیر تك تك داده پایگاه ها، نیازمند ارزیابی تأثیر آنها در تركیب با دیگر داده پایگاه ها نیز هست. این كار می تواند چشم انداز جذابی را نتیجه دهد كه توسعهٔ سریع داده پایگاه های سفارشی با میزان بالاتری از قابلیت اجریی بلاواسطه را تضمین می كند. مثلا" ادغام “داده پایگاه شركت نامه رسانی پیك بادپا” و “داده پایگاه كد پستی شركت پست ایران” داده پایگاهی را نتیجه می دهد كه می توان از آن برای تحویل كارآمد و صرفه مندانهٔ كالاهای حساس در تهران بهره گرقت. عمدهٔ داده پایگاه های دایر در محدودهٔ تهران بزرگ از سوی دولت ایران حمایت مالی می شوند. اما فقدان كامل استانداردسازی در ایجاد آن ها به وضوح به چشم می خورد. معدودی از این داده پایگاه ها اعلام كرده اند كه مجموعه استاندارد های گروه ایزو ۹۰۰۰ را رعایت می كنند. با آن كه ۲۹۰۰ ISIRI به “اصول استاندارد ایرانی برای تبادل اطلاعات” (ISCLL) می پردازد، برخی طراحان داده پایگاه ها بوجه بایسته ای به آن نكرده اند و در نتیجه، وقتی این داده پایگاه ها قرار بود به كاربردهای مبتنی بر وب تغییر شكل دهند، اشكالات جدی بروز می كرد. دربارهٔ میزان سازگاری با رفتار اطلاع جویی استفاده كنندگان هیچ استانداردی موجود یا در دست تهیه نبود. این امر زماین كه شخص بخواهد داده پایگاهی را برای گروه بزرگ تری از مخاطبان – با پس زمینه های متفاوت قومی- فرهنگی و تحصیلی، نظیر آنچه در میان شهروندان تهرانی می بینیم- ارتقای سطح دهد، به مسئله ای جدی بدل می شود. در برخی از جنبه های ناوبری اطلاعات و بازنمایی تصویری معناشناختی به این امر پرداخته شده داده پایگاه های بسیار معدودی از ویژگی های كمكی استاندارد یاكمك های تصویری تقویت شدهٔ ناوبری بهره می گیرند “ماورا” كه یك عملگر شبكهٔ دیگر در ایران است، در حال حاضر تحقیقی را دربارهٔ ایجاد كمك های دقیق نرم افزار مبنا دنبال می كند. اما سال ها طول می كشد تا این تلاش ها به نتیجهٔ ملموسی برسد.
● یافته های این بررسی
در حدود ۶/۷۳ درصد داده پایگاه های محدودهٔ تهران بزرگ برای عملیات با دستگاه های ۲۸۶AT یا دستگاه های قوی تر، و ۵/۱۴ درصد برای دستگاه های ۳۸۶AT یا بالاتر طراحی شده اند. ظاهرا" طراحان می خواسته اند از سخت افزارهای خاص و پردازشگرهای قدرتمند اجتناب كنند. در حدود ۷/۵۲ درصد از داده پایگاه های پژوهشی از تركیبی از بسته های حاضر و آماده، و نرم افزارهای سفارشی استفاده كرده اند و ۶/۳۶ درصد از نرم افزار یونسكو، یعنی SDC/ISIS به عنوان نرم افزار اصلی بهره برده اند. ۲/۶۹ درصد این داده پایگاه ها دارای پوشش پنج ساله اند و نزدیك به ۷۰ درصد آن ها منضما" روز آمد می شوند. داده پایگاه های چند رشته ای ۴۲ درصد داده پایگاه های موجود در محدودهٔ تهران بزرگ را تشكیل می دهند. در مرتبهٔ بعد رشته مهندسی(۲۰درصد)، علوم انسانی (۶/۱۴ درصد)، پزشكی (۶/۳درصد)، و علوم پایه (۱۸ درصد) قرار دارند. ۷۵ درصد داده پایگاه ها كتابشناختی و تنها هفت درصد آن ها متن كامل هستند. ۶۴ درصد داده پایگاه های موجود در تهران بزرگ دارای پوشش كشوری اندو اطلاعات خود را از تمام بخش های كشور گردآوری می كنند. بدین ترتیب گمان می رود كه تهران دارای بیش ترین میزان تمركز از حیث نهاد های اطلاع رسانی دولتی باشد. گزارش كامل این بررسی در سال ۱۹۹۶ ارائه شد. در سال ۱۹۹۷ مشاوران پژوهشی در ندارایانه، ماورا، و تعدادی ازنهادهای اطلاع رسانی خصوصی در ایران تصمیم گرفتند بستری برای آزمودن راه حل های احتمالی برای این مسئله ایجاد كنند. قرار بر این شد كه این پایگاه ها هر كدام یك محصول به شمار آید و بر همین قیاس نیز با آنها رفتار شود. تصمیم گرفته شد كه پروژه های غیر فعال OCLC ندا رایانه و “فرهنگ ۱” ماورا از فعال شوند و به گروه منتخبی از داده پایگاه ها متصل گردند. در زمان نوشتن این مقاله، پروژه OCLC ندارایانه موفق شده است كه با ۱۰ كتابخانهٔ همكار سرویس قابل قبولی را در شبكهٔ خود ارائه كند. این سرویس، داده پایگاه های كتابخانهٔ ملی ایران و مركز اطلاعات و مدارك علمی ایران، و خدمات تحویل مدرك این مركز را نیز شامل می شود. در هر حال، كار ایجاد یك میانجی نرم افزاری هوشمند هنوز در مرحلهٔ اثبات است.
پی نوشت ها
Maintenance
Boenm quality model
Meta- basing
Privacy
* *- Fahim – nia, F. and Naghshineh, N. (۱۹۸۹) , “ Databases analysis: a review of metropolitan Tehran databases”; in ۴۹th FID Congress and conference, Jaipur & New delhi, ۱۱-۱۷ Ocgober ۱۹۹۸.
نوشته : فاطمه فهیم نیا- نادر نقشینه
مركز اطلاعات و مدارك علمی ایران
منبع : فصلنامه علوم اطلاع رسانی