یکشنبه, ۳۱ تیر, ۱۴۰۳ / 21 July, 2024
مجله ویستا

اصطلاحنامه در نظام ذخیره و بازیابی اطلاعات


نظام بازیابی اطلاعات, نظامی است كه هدفش تسهیل شناسایی مدارك یا داده هایی است كه متناسب با نیاز اطلاعاتی خاصی باشد و بازیابی این مدارك با داده ها با توجه به محدودیت موادی كه در مجموعه موجود است

نظام بازیابی اطلاعات, نظامی است كه هدفش تسهیل شناسایی مدارك یا داده هایی است كه متناسب با نیاز اطلاعاتی خاصی باشد و بازیابی این مدارك با داده ها با توجه به محدودیت موادی كه در مجموعه موجود است.بازیابی اطلاعات یك عمل ساده و مكانیكی نیست؛ كاری است پیچیده و فكری كه منظور آن ایجاد ارتباط میان كسانی است كه این اطلاعات را تولید می كنند (نویسندگان مطالب) و افرادی كه این اطلاعات را مصرف می‌كنند (محققان, متخصصان و سایر دانش پژوهان ). بنابراین، نقش عمده نظام برقرار كردن این ارتباط از طریق مطابقت اطلاعات موجود در مجموعه با نیاز اطلاعاتی استفاده كنندگان و نزدیك كردن هر چه بیشتر این دو به یكدیگر است.برای اینكه نظام قادر به انجام این عمل باشد. باید محتوای مجموعه كاملاً مشخص باشد, یعنی مدارك از لحاظ محتوا بدقت توصیف شده باشند. اما این به تنهایی كافی نیست, بلكه باید نیاز جستجو كننده اطلاعات هم بشكلی به نظام عرضه شود كه عمل انطباق بین مدارك ذخیره شده و پرسش مطرح شده را تسریع كند. معمولاً این كار بوسیله استفاده از نوعی زبان نمایه انجام میگیرد.زبان نمایه یكی از اجزای عمده نظام ذخیره و بازیابی اطلاعات محسوب می شود. هر نظام اطلاعاتی از نقطه نظر عملكرد, معمولاً شامل اجزای زیر است:

۱) انتخاب گردآوری: سیاست و خط مشی تعیین كننده محتوای مجموعه.

۲) مأخذ درون داد: ویژگیهایی از مدرك برای توصیف آن و برای انتخاب اصطلاحات نمایه بكار می رود.

۳) زبان نمایه: مجموعه اصطلاحات و قوانینی كه نحوه استفاده از اصطلاحات را تعیین می كند.

۴) نشانه گذاری: عرصه اصطلاحات نمایه به صورت علائم و نشانه ها.

۵) نظم مجموعه: ترتیب و نظم عناصر در درون مجموعه اطلاعات ذخیره شده.

۶) تجزیه و تحلیل پرسش: ترجمه مفاهیم پرسش به اصطلاحات موجود در زبان نمایه.

۷) شیوه جستجو: روشی كه برای جستجوی در مجموعه بكار می رود.

۸) شكل برون داد: عرضه مشخصات ظاهری مدرك و اطلاعات لازم دیگر كه بعنوان پاسخ به پرسش مطرح شده در اختیار جستجو كننده گذاشته می شود.[۱]هر یك از اجزای فوق در ایجاد نظام ذخیره و بازیابی اطلاعات و كارآیی آن نقش اساسی و مهمی دارد. در این میان، آنچه بسبب پیچیدگیش ذهن متخصصان اطلاع رسانی را بیشتر به خود مشغول داشته است نشان دادن محتوای مدارك است و به این جهت شاید بتوان گفت زبان نمایه كه برای بیان موضوع و محتوای مدارك بكار می‌رود. مساله ای است كه اهمیت بیشتری دارد.

زبانهای نمایه را بر اساس معیارهای متفاوت. به گونه های مختلف دسته بندی كرده اند ولی بطور كلی می‌توان گفت كه این زبانها عمدتاً بر دو نوعند:

۱)زبانهای مهار شده[۲]: این زبانها، حاوی اصطلاحاتی هستند كه برای نمایه سازی مدارك انتخاب و پذیرفته شده‌اند و از آن جمله اند: طرحهای رده بندی سنتی، فهرستهای قراردادی سر عنوانهای موضوعی و اصطلاحنامه ها.

۲) زبانهای آزاد[۳]: در این زبانها، محدودیتی از نظر نوع واژه وجود ندارد؛ هر واژه با اصطلاح مناسبی می‌تواند بدون قید و شرط از زبان طبیعی گرفته شود، یعنی عیناً از زبان مدرك نقل گردد و یا متناسب با موضوع مدرك تعیین شود.اینكه كدامیك از دو روش فوق در میزان بازیابی مدارك و كیفیت كار موثرتر است، نكته ای است كه هنوز بدرستی روشن نیست و اختلاف نظرهایی كه در میان اهل فن وجود دارد موید این مطلب است. اما آنچه در عمل مشاهده می شود این است كه اكثر نظامهای دایر و فعال اطلاع رسانی كه خدمات گسترده ای را عرضه می كنند، از زبان مهار شده برای آماده سازی مدارك خویش استفاده می كنند و ابزاری كه بدین منظور بكار می رود اصطلاحنامه است. بدین جهت، مطلب حاضر به بحث درباره این وسیله اختصاص یافته است.

●تعریف اصطلاحنامه

اصطلاحنامه، واژه ای است كه در فارسی معادل واژه انگلیسی Thesaurus بكار رفته است. واژه Thesaurus در اصل از یونانی و لاتین گرفته شده كه بمعنای گنجینه یا خزانه است و سالهاست كه بمعنای گنجینه لغات استفاده می گردد.بر اساس رهنمود نظام جهانی اطلاعات علمی (یونی سیست)[۴] اصطلاحنامه را می توان یا از نظر عملكردش تعریف كرد و یا از عملكردش تعریف كرد و یا از لحاظ ساختارش. از نظر عملكرد، اصطلاحنامه وسیله ای برای مهار كردن واژه ها است و در برگرداندن زبان طبیعی مدارك، نمایه سازان یا استفاده كنندگان به زبان مقید نظام استفاده می‌شود. از نظر ساختار، اصطلاحنامه مجموعه لغات مهار شده و پویای یك زمینه خاص از دانش بشری است كه از لحاظ معنا و نوع مرتبط اند.[۵]

●پیشینه تاریخی

اولین اثری كه تحت عنوان اصطلاحنامه شهرت یافت، اصطلاحنامه روژه بود[۶]. این اصطلاحنامه كه اولین ویرایش آن در ۱۸۵۲ بچاپ رسید و هنوز هم ویرایشهای جدید آن منبع معتبری برای نویسندگان و مترجمان است، یك فرهنگ ساده لغات نیست و با آن تفاوت بسیار دارد. زیرا معمولاً وقتی به یك فرهنگ مراجعه می‌كنیم كه واژه ای را می دانیم و به دنبال معنای آن می گردیم. اما از این اصطلاحنامه موقعی استفاده می‌شود كه فكر و عقیده ای را در سر داریم و در جستجوی كلمه یا عبارت دقیق و مناسب برای بیان آن هستیم. به این جهت برخلاف فرهنگها، تنظیم آن الفبایی نیست بلكه بر اساس افكار و ایده هاست كه در گروههای كلی نظیر زمان، مكان، ماده، حواس، اراده، عواطف. . . دسته بندی شده اند. هر گروه شامل تقسیمات فرعی تری است كه هر یك از آنها به نوبه خود چندین كلمه یا عبارت را در برمی گیرد. در زیر هر كلمه، تمام كلمات مترادف و عبارات وابسته به آن مفهوم و شكلهای مختلف دستوری آنها ذكر می شود و ارتباط بین كلمات با ارجاعهای لازم مشخص می گردد. به این ترتیب اصطلاحنامه روژه در واقع یك طرح رده‌بندی اصطلاحات است كه فهرستی الفبایی نیز بدنبال دارد و ارزش آن در نحوه ارتباط دادن مفاهیم بیكدیگر با توجه به معانی متفاوت آنهاست.البته قصد تهیه كننده این اصطلاحنامه، استفاده از آن در ذخیره و بازیابی اطلاعات نبود بلكه كمك به كسانی بود كه برای تصنیف متن یا متونی بدنبال اصطلاحات صحیح و مناسب برای بیان فكر و اندیشه خود بودند. ضمناً این نكته را هم باید اضافه كرد كه تنظیم واژگان براساس مفاهیم، فكر تازه ای نبود كه از روژه سرچشمه گرفته باشد قبل از این تاریخ هم، چنین اندیشه ای بشكلها و مضمونهای مختلف و برای هدفهای متفاوت تجلی كرده بود و به جرات می توان گفت كه بحثهای كنونی در مورد ماهیت اصطلاحنامه و اصطلاحنامه‌سازی ریشه تاریخی دارد. اما اهمیت اصطلاحنامه روژه در این است كه ساخت ویژه آن چارچوب مطلوبی را برای طرحریزی اصطلاحنامه امروزی، در اختیار متخصصان اطلاع رسانی گذاشته است.نیاز به اصطلاحنامه در ذخیره و بازیابی اطلاعات از زمانی احساس شد كه نظامهای اطلاع رسانی با مشكلات مهمی در مرحله، جستجو و بازیابی اطلاعات مواجه گردیدند. زیرا اولاً رشد مداركی كه منتشر می شد سیر صعودی داشت و این امر موجب افزایش سریع حجم اطلاعات كتابشناختی می شد و از این رو لازم بود بنحوه ذخیره آنها از نظر محتوا توجه بیشتری شود. ثانیاً در روشهای متداول نمایه سازی اكثراً از زبان طبیعی بویژه نظام تك واژه[۷] استفاده می شد. نظام تك واژه كه در سال ۱۹۵۱ بوسیله مورتیمر تاوبه[۸] معرفی گردید بعلت اینكه روشی ساده و ارزان در مرحله درون داد بود، ابتدا سخت مورد استقبال قرار گرفت اما مشكلات اساسی آن در مرحله جستجو خیلی زود آشكار شد، یكی از مشكلات عمده، ناشی از فقدان كنترل واژگانی بود. چون مدارك هم موضوع و مربوط بهم بعلت نمایه سازی با تك واژه های استخراج شده از متن، غالباً از هم جدا می‌افتادند و بهنگام بازیابی نظام هیچ كمكی برای كنار هم آوردن این كلمات نمی كرد و چنانچه جستجو در زیر همه كلمات پیش بینی شده انجام می گرفت. جستجو كننده باز هم نمی توانست مطمئن باشد كه جستجوی كاملی صورت گرفته است. مشكل دیگر جستجو در مجموعه ای بود كه مرتباً بر حجم آن افزوده می شد و بهمان نسبت جستجوهای جامع. مشكلتر می شد. به لحاظ این مسایل. بتدریج نمایه سازی با تك واژه حاوی خود را به نمایه سازی با تك مفهوم گزیده شده. داد و به این ترتیب پایه و اساس ایجاد اصطلاحنامه بازیابی اطلاعات گذاشته شد.اولین كسی كه در این راه قدم برداشت هانس بیترلون بود. او تحت تاثیر روش اصطلاحنامه روزه. در صدد برآمد كلمات مجاز همراه با ارجاعهای لازم جهت استفاده در نمایه سازی موضوعی فراهم آورد .

[۱] - William Goffman and Vaun A. Newill. "A Methodology for Test and Evaluation of Information Retrieval systems", Information Storage and Retrieval ۳ (August ۱۹۶۶): ۲۱.

[۲]- Controlled Languages

[۳] - Free Languages

[۴] - World Science Information System of Unesco (UNISIST)

[۵] - Unesco. UNISIST Guidelines for the Establishment and Development of Monolingual Thesauri, Paris, Unesco, ۱۹۷۳. P. ۶.

[۶] - Peter Mark Roget. Thesaurus of English Worlds and Phrases.

[۷] - Uniterm System

[۸] - Mortimer Taube

نوشته: مهرانگیز حریری


شما در حال مطالعه صفحه 1 از یک مقاله 2 صفحه ای هستید. لطفا صفحات دیگر این مقاله را نیز مطالعه فرمایید.