شنبه, ۶ بهمن, ۱۴۰۳ / 25 January, 2025
نمایه سازی ماشینی
در عصر ارتباطات و اطلاعات، نقش بنیادین تحقیق در نیل به پیشرفت و توسعه علمی فرهنگی و اقتصادی اجتماعی جوامع بشری از یک سو و رشد و فزونی پرشتاب دستاوردهای علمی و فنی و نیز به تبع آن متون و مدارک پژوهشی علمی و فنی، آموزشی و اطلاعاتی در سطح جهانی از سوی دیگر سبب شده که در روند ایجاد ارتباطات و اشاعه اطلاعات درحوزه گسترده اطلاع رسانی ، نمایه سازی در صدر توجه قرارگیرد و یکی از انواع پرکاربرد آن که سرعت ویکدستی در نمایه سازی را به دنبال دارد، نمایه سازی ماشینی است وآن عبارتست از انتخاب واژه های کلیدی یک اثر بوسیله روشهای ماشینی به منظور گسترش شناسه های نمایه با استفاده از کامپیوتر برای بیرون آوردن ونشان دادن واژه های نمایه بدون دخالت انسان در حالی که یک بار برنامه، و سیاست کار آن، به ماشین داده شده است.
● مقدمه:
قرن حاضر را عصر انفجار اطلاعات نامیده اند. عصری که با افزایش سریع تعداد مدارک و توسعه رشتههای علمی مواجه هستیم. عصری که گردآوری، ذخیره ، بازیابی و اشاعه اطلاعات به شدت تغییر یافته است. رشد و فزونی دستاوردهای علمی و فنی و افزایش متون و مدارک پژوهشی و کاهش زمان جهت بازیابی اطلاعات مورد نظر و دستیابی به مطالب روزآمدتر اهمیت نمایه سازی را روشن تر میسازد و این امر در راستای بهبود ارائه خدمات به کاربراست. درواقع نمایه سازی حلقه ارتباطی میان تولید کننده و مصرف کننده اطلاعات ، درجهت دستیابی آسان و سریع به دانش مورد نیاز کاربردی وسیع و اهمیتی ویژه مییابد.در دانشنامه کتابداری واطلاع رسانی نمایه چنین تعریف شده است: صورتی از موضوعها و واژه های مهم ودیگر مطالب یک یا چند کتاب با ارجاع به صفحاتی که این مطالب در آنها آمده است.(۳) راولی نمایه را یک رشته محلهای دستیابی سازمان یافته که استفاده کننده را از اطلاعات معلوم به اطلاعات اضافی ناشناخته راهنمایی میکند تعریف میکند.(۲) نمایه عبارتست از مجموعه شناسه های الفبایی یا نظام یافته ای که کاربر رابه جایگاه اطلاعات درون مدرک هدایت می کند.
فرایند تهیه نمایه برای یک اثر یا تحلیل محتوای اطلاعاتی یک اثر به منظوراستخراج نمایه واژه ها با شیوه ای نظام مندو موثر را نمایه سازی گویند. نمایه سازی ثبت و ضبط محتوای اطلاعاتی مدارک با استفاده از روشهای گوناگون به منظور سازمان دادن اطلاعات به قصد سهولت بازیابی می باشد. نمایه سازی یکی از رهیافت های سازماندهی مواد در علم کتابداری واطلاع رسانی است که از دهه ۵۰ و ۶۰ میلادی قرن جاری روشهای آن تکامل یافته است . با حضور کامپیوتر روش های نمایه سازی دچار تحول گردیده و در حال حاضر نمایه سازی های از طریق کامپیوتر و نرم افزارهای توسعه یافته در این زمینه انجام می شود که به آن نمایه سازی ماشینی گویند. به طور کلی کاربرد کامپیوتر درنمایه سازی را به دو دسته تقسیم می کنند: نمایه سازی رایانه ای و نمایه سازی با کمک رایانه.
● نمایه سازی رایانه ای:
تعریف نمایه سازی ماشینی: نمایه سازی کامپیوتری، رایانه ای ، ماشینی و خودکار همگی با هم مترادفند و بجای یکدیگر به کار میروند و تعریف آنها عبارتست از انتخاب واژه های کلیدی یک اثر بوسیله روش های ماشینی به منظور گسترش شناسه های نمایه با استفاده از کامپیوتر برای بیرون آوردن ونشان دادن واژه های نمایه بدون دخالت انسان در حالی که یک بار برنامه و سیاست کارآن به ماشین داده شده است.(۳)انجام کلیه مراحل نمایه سازی کتاب اعم از انتخاب واستخراج اصطلاحات نمایه ای ازمتن ، مدخل آرایی و ارائه جاینماهای هر مدخل و چاپ نمایه توسط رایانه وبدون دخالت انسان را نمایه سازی رایانهای گویند.(۷)
نمایه سازی مراحل کنترل اصطلاحات تخصصی، تعین توصیفگرها و هماهنگی بین این توصیفگرها راداراست. هنگامیکه توصیفگرها توسط نمایه ساز انتخاب میشوند از نمایه سازی دستی سخن به میان می آید و اگر این کار را کامپیوتر انجام دهد، نمایه سازی خودکار یا ماشینی نامیده میشود. جهت استفاده از روش نمایه سازی ماشینی داده ها باید به صورت ماشین خوان درآیند. اینکه واژگان از کدام محدوده متن انتخاب شوند به نرم افزار به کارگرفته شده بستگی دارد.(۸)در این نوع نمایه سازی همه امور از انتخاب کلید واژه، شماره گذاری ، ترتیب بندی و غیره توسط کامپیوتر انجام می گیرد. کامپیوتر مفاهیم مهم را که بارها تکرار شده اند و جزو کلمات غیر موضوعی زبان نیستند، به علاوه اسمهای اشخاص، مکانها وغیره رابه عنوان کلید واژه در نظر میگیرد.کامپیوتر مفاهیم مهم را توسط یک نرم افزار به نام نرم افزار بسامدی استخراج می کند. مثلایک مفهوم که در ذیل یک بخش ازمتن بارها تکرارشده باشند، محتملا کلید وا ژه است، مگر آن که جزو واژگان غیر موضوعی باشد. واژگان غیر موضوعی مانند(است، که ، را و...) توسط یک فهرست به نام فهرست ایستی مشخص و نادیده گرفته میشود. قسمت دیگر نرم افزار یک دادگان حاوی اسمهای خاص است. نرم افزار با استفاده از این دادگان ، اسمهای خاص متن را تشخیص میدهد و به عنوان کلید واژه در نظر می گیرد.نمایه سازانی که با اصول تحلیل و طراحی سیستم و برنامه سازی کاربردی آشنایی دارند، میتوانند در زمینه کامپیوتری سازی نمایه سازی موثر باشند.
طرح های موفقی که دراجرای نمایه سازی ماشینی ارائه گردیده عبارتند از:
کتابخانه ملی پزشکی در آمریکا.AIMS طرح که توسط زیمنس اجراشد.COPSY و طرح LISA طرح طرح دانشکده پزشکی هاروارد: سیستمی برای یکی سیستم بازیابی هوشمند اطلاعات در مدارک بیولوژی و پزشکی بر پایه روش های آماری و زبان شناختی.
▪ نمایه سازی رایانه ای عمدتا به دوشیوه زیرا نجام می شود:
الف) حفظ اصطلاح:
این شیوه توسط دکتر سوزان آرتاندی در سال ۱۹۶۳ به کار گرفته شد. در نمایه سازی به شیوه حفظ اصطلاح یک تعریف عملیاتی از اصطلاحات نمایه ای لازم و ضروری است تا رایانه بتواند راهنمایی برای انتخاب موضوعهای مدرک تهیه کند، علاوه براین باید برنامه یا مجموعه برنامه های سازگار با این شیوه ساخته شود. در نظام حفظ اصطلاح سیاهه یا فهرستی به رایانه داده میشود که حاوی کلمات کلیدی است و به نظام گفته میشود، هریک از کلمات این لیست را که درمتن بود ،حفظ کند و آنرا به عنوان اصطلاح نمایه ای انتخاب کند. دراین روش استفاده از اصطلاحات از پیش انتخاب شده راهنمای خوب ومفیدی است و امکان انتخاب واژه های استفاده شده به وسیله مولف مدرک را فراهم میکند. نقطه ضعف این روش این است که تضمینی وجود ندارد تا تمامی مفاهیم موضوعات جدید ومهم نمایهسازی شوند.
ب) حذف اصطلاح:
درشیوه حذف اصطلاح یک سیاهه بازدارنده به رایانه داده می شود که کلمات فهرست را هرکجا که بودحذف کند و بقیه را به عنوان کلید واژه انتخاب نماید.نمایه سازی کوئیک و کواک از نوع حذف اصطلاح هستند. در این شیوه آنچه راکه نباید کلیدواژه تلقی شود، حذف میشود.
● نمایه سازی کوئیک:
در نمایه سازی کوئیک که همان نمایه درون بافتی است تمام کلمه های موجود درعناوین مدارک راکه توسط برنامه ای به کامپیوتر داده شده ، با سیاهه ای ازواژه های غیرمجاز(واژه های غیرموضوعی که درفهرست ایستی یا بازدارنده قرار میگیردتا درردیف الفبایی خود به عنوان سرشناسه قرار نگیرد) دربرنامه کامپیوتر مطابقت داده میشود.کلمه هایی که درسیاهه واژه های غیرمجاز وجودندارد، بطورخودکارکلیدواژه محسوب میشود. مدخلی که باهریک از این کلیدواژه هادرست میشودبه صورتی است که این واژه را دردرون بافت خود ، یعنی همراه با بقیه کلمه های آن عنوان ، درشکل و نظم طبیعی اش نشان میدهد. این بافت شامل همه واژه ها از جمله واژه های غیر مجاز نیز میشود و به این ترتیب گرچه واژه های غیرمجاز در نمایه نامه مدخل قرار نمیگیرد، اماهمراه با سایر کلمات عنوان، درمدخل می آید تا محیط کلیدواژه و معناومفهوم آن را دقیقتر آشکار سازد و ارتباط میان کلیدواژه های عنوان را بهتر نمایش دهد. به این ترتیب بی درنگ دریافته میشود که عنوان مربوط با نیاز مراجعه کننده مناسبت داردیانه.برون داد رایانه ای میتواند به صورت چاپی دردسترس مراجعان قرارگیرد. (۱)
هرخط نمایه درون بافتی معمولا شامل سه بخش است: کلیدواژه یا مدخل، بافت(متن) ونشانه بازیابی(جاینما). نمایه واژهها به صورت ستونی درمرکز یا سمت چپ صفحه ویاسمت راست آن(درفارسی) به ترتیب الفبایی میآیدو با همین کلمه هاست که جوینده ، جستجوی خود رادرنمایه آغاز میکند.برای مشخص کردن پایان عنوان، درهرنمایه از علامت قراردادی خاصی نظیرعلامت جمع یا مساوی و یاخط اریب(اسلش/) وغیره استفاده میشود تاجستجوگر بتواند به سهولت ابتدای عنوان را پیدا کرده و عنوان را درشکل طبیعی خود به سرعت مرورکند. از مزایای این نمایه سرعت وسهولت آن میباشد، درضمن به متخصص نمایه سازی نیازی نداردزیرا که با وجود فهرست بازدارنده این کار را کامپیوتر انجام میدهد. ازطرفی کلمه کلیدی درمتن عبارت مورد جستجو قرار دارد و این مسئله به جستجو گر کمک شایانی میکند.
● نمایه کواک:
نمایه کواک همان نمایه برون بافتی است. این نمایه برای رهایی از مسائل و مشکلات ناشی از ضرورت کوتاه کردن عنوان و نیز به منظور ساده ساختن خواندن مدخلها طراحی شده است. دراین نمایه هرکلیدواژه به ترتیب از عنوان خود خارج شده و مقدم برسایر اجزای عنوان قرارمیگیرد.سپس عنوان مدرک به ترتیب طبیعی خود و به طور کامل درزیر این واژه یا به دنبال آن میآید. به این ترتیب برای هر واژه مهم یک مدخل ساخته میشود.دراین نمایه نیز کلمات مجاز درمتن عنوان وجود دارد وکلید واژه قرار نمیگیرد.(۱)
نمایه گردان و نمایه چرخشی نمایه هایی هستند که هم خانواده نمایه کوئیک و کوواک میباشند وشرح آنها آورده می شود.
▪ نمایه گردان : شیوه ای ازنمایه سازی که درآن واژه های مهم عنوان ،مقدمه ، عناوین فصلها، بخشها، چکیده و نتیجه گیری انتخاب میشود و به عنوان شناسه درنظر گرفته میشود.این شیوه اکنون به صورت ماشینی انجام میشود. بدین نحو که واژه های انتخاب شده به منظور الفبایی شدن درمرکز گذاشته میشود و بقیه عبارت در دوطرف آن قرار میگیرد. این شیوه بیشتر برای مدارک فنی استفاده میشود. (۳)
▪ نمایه گردشی : نمایه ای از مجموعه مدارک ومنابع کتابخانه که برحسب رده بندی چهریزهای تنظیم شده باشدو درآن شناسه ها برحسب همه کلمات برگزیده و عبارات مهم ، خواه مستقیم یامقلوب انتخاب میشوند و بقیه عناصر که معنی جمله را تکمیل میکنند پشت آن میآید این نمایه شبیه کشف الآیات و کشف الابیات است. (۳)
● نمایه سازی با کمک رایانه
دراین نظام نخست نمایه ساز با دقت متن را میخواند، شناسه های موضوعی را انتخاب و علامت گذاری می کند و نمایه دستنویس تهیه میکند. آن گاه اپراتورمدخلها را براساس نمایه دستنویس از طریق صفحه کلید وارد رایانه میکند. بعداز ورود ، رایانه مدخلها را بر اساس نظم خاصی مرتب میکند، توصیفگرها را زیر شنا سه ها میبرد، جاینماهای هرمدخل را با هم ادغام میکندو بعد یک نمایه الفبایی ارائه میدهد. در این برنامه هر اصطلاح نمایه ای همراه جاینماهای آن وارد میشودو اگر توصیفگرداشته باشد، پس از شناسه این توصیفگر با یک ممیز آورده میشود. رایانه نیز پس از بررسی مدخل ها بر اساس برنامه از پیش طراحی شده آن مداخل را تنظیم میکند. این نوع نمایه سازی با دوروش متفاوت انجام میشود:
۱) نمایه سازی در محیط گرافیکی (نمایه سازی درون کاشتی)
امروزه بیشتر نرم افزارها در محیط جی. یو. آی یعنی با رابط گرافیکی کار میکنند. Graphic User Interface (GUI)
کاربا این روش به صورت زیراست:
نمایه سازیا ویراستار، پس از اتمام صفحه آرایی و مشخص شدن شماره صفحه های کتاب ، صفحه ها را ازصفحه نمایش کامپیوتر مرور میکندوکلیدواژه ها یا کلمات و عبارتهای مهم را انتخاب میکند. این عبارت انتخاب شده از نظر سیستم یک کلیدواژه محسوب میگردد. نمایه ساز همزمان با انتخاب کردن این کلید واژه ها باید یک پنجره واژه پرداز مستقل دیگر را باز میکندو مدخلهای ارجاعی را که درمورد برخی مدخلها پیش میآیند به طور دستی تحریر مینماید. نتیجه این کار یک فایل فرعی نیز به دست میآید. نمایه ساز فایل اصلی مدخلها وفایل فرعی را ادغام و توسط یک برنامه ترتیب بندی مناسب الفبایی میکند. نمایه ساز این مداخل الفبایی شده را مطالعه میکندو هرگاه به فرایند تبدیل با کاما نیاز باشد فرایند به طوردستی در فایل انجام میدهد سپس برنامه الفبایی کننده شماره صفحه ها را به طور صعودی مرتب میکند. .
۲) نمایه سازی در محیط دستوری ( نمایه سازی فرمانی)
این نرم افزار در محیط سی. ال. آی یعنی با رابط دستوری (فرمانی) کار میکنند: Command- Line Interface
کار با این روش مانند سیستم عامل چنین است:
نمایه ساز پس از اتمام صفحه آرایی و مشخص شدن شماره های صفه های کتاب ، صفحه ها را در صفحه نمایش کامپیوتر مطالعه میکندو کلیدواژه ها را بادونماد کاملا استثنایی چپ و راست که در مشابه آن درمتن وجود نداشته باشد، علامت گذاری میکند(مثلا کلیدواژه درون سه کروشه قرار میگیردیا...) که این هم نوعی انتخاب کلیدواژه است. سپس نمایه ساز در همان فایل ارجاعات مورد نظر تحریر میکند. پی از اتمام علامت گذاری با کروشه ها وارجاعات و تبدیلها یک ابزار نرم افزار میتواند کل نمایه را تهیه و الفبایی کند. اگر نرم افزاردارای امکانات نمایه سازی نباشد ویراستار میتواند یک برنامه بسیار ساده (مثلا به زبان بیسیک بنویسد) که فهرست کلیدواژه های علامت گذاری شده و شماره صفحه های آنها را استخراج کندویک برنامه یا ابزار ساده دیگر نمایه را ترتیب بندی و مرتب کند. بنابراین نمایه کتاب نمیتواند به صورت کاملا رایانه ای ساخته شود و رایانه فقط قادر است مدخلها را ذخیره و به منظور اصلاحات به سرعت بازیابی کند. پس رایانه نمیتواند جایگزین نمایه ساز شود. برنامه رایانه ای مدخلها را الفبایی میکندومانع دوباره کاری مدخلها میشودوارجاعهای دوسویه را کنترل ونمایه راچاپ میکند.روشهای نمایه سازی کتاب با کمک رایانه دارای مزایای سرعت ورود اصطلاحات نمایه ای، ظرفیت ذخیره سازی بالا ، سهولت اصلاح ، حروفچینی وتایپ، ویرایش و چاپ نمایه هستندواز لحاظ اقتصادی مقرون به صرفه می باشند.(۷)
تجهیزات لازم برای نمایه سازی ماشینی:
تمامی روشهای نمایه سازی ماشینی میکوشند مراحل فراهم آوری اطلاعات و سازماندهی توصیفگرهای یک مدرک را به صورت کامل خودکار سازی نمایند. نمایه سازی ماشینی به دو صورت انجام می پذیرد و هرکدام تجهیزات خاص خودرا می طلبد:
۱) تجهیزات لازم نمایه سازی ماشینی مدرک. برای آنکه توصیفگرها ازدرون متن استخراج شوند.به عبارت دیگر وارونه سازی متن انجام میگیرد.(روش استخراجی) هنگام وارونه سازی متن از میان مدارک فقط واژگان سیاهه بازدارنده استخراج می شوند وکنارگداشته میشوند. مابقی به عنوان واژه های نشان دهنده محتوای مدرک بصورت مقلوب ذخیره می شوند. بنابراین مراحل لازم برای وارونه سازی به این شرح می باشدکه اولا تولید داده های وارونه شده بوسیله استخراج همه مفاهیم ازمدرک با اشاره به شماره مدرک صورت می گیردو ثانیا مفاهیمی از داده ها نمایه که درسیاهه بازدارنده نیز وجوددارد، حذف می شوند.
۲) تجهیزات مربوط به مفاهیم . دراین روش یک بانک واژگان وجوددارد که نوعی واژه نامه می باشد. (روش استنادی)
● روش های نمایه سازی ماشینی
الف. روش های زبان شناختی: این روشها می کوشند با کمک تحلیل های شکل شناسی و ساختار نحوی و معنایی مدرک توصیفگرها را استخراج نمایند. که این روشها به سه دسته تقسیم میگردد:
ـ تجزیه و تحلیل ریخت شناسی که برمبنای ریشه لغات عمل میکند.
کلمات بدون بار معنایی موجود در سیاهه بازدارنده را حذف می کند.
- شکل های دستوری صرف کلمه را به یک شکل میآورد.
- ضمایر را براساس اسامی مربوط به آنها مرتب میکند.
ـ تجزیه و تحلیل نحوی که درسطح جملات امکانپذیر است و برمبنای علامتهای نحو لغات انجام میشود.
ـ تجزیه و تحلیل معنا شناختی که درسطح مدارک مشترک در یک پایگاه صورت میگیرد . ارتباطات معنایی موجود در یک مدرک شناسایی میشوند تا متون مشترک بتوانند به صورت واحدهای هم معنی تجزیه شوند.
ب. روش های آماری: مشخص می کندکه معنی هرمفهوم منفرد در مدرک با حضور آن در جایگاههای مختلف مدرک ارتباط تنگاتنگ دارد. بنابراین لغات درون متن شمارش میشوندو ارتباط آنها ارزش گذاری میشود. هدف آمارگیری از اطلاعات آن است که لغات دارای بارمعنایی در مدرک به عنوان توصیفگر انتخاب شوند. روش های آماری عملا برای بالابردن جامعیت به کار گرفته می شوند. درحالیکه روشهای زبان شناختی در جهت بهبود مانعیت کاردارند.
ج. روش های مبتنی براحتمالات: در این روشها تئوری احتمالات برای مدل سازی ریاضی مراحل بازیابی به کارگرفته میشود. درحالیکه در توزیع آماری اصطلاحات یک مدرک مورد استفاده قرار میگیرد.این روش با عملیات ریاضی مفروضات ساده و مطمئنی را ارائه می دهد. فرض برآن است که مدارک براساس میزان ربط درهنگام بازیابی مورد ارزیابی قرارمیگیرند.
متغیرهای مداخله گر در نمایه سازی ماشینی( مشکلاتی که حین نمایه سازی ماشینی با آن مواجه هستیم) :
چند زبانه مجموعه مدارک
عدم محدودیت درموضوعات و عناوین و رشته ها
سطح غیر تخصصی زبان مدرک
مدارک بسیار قدیمی با لغات منسوخ موجود درآنها
▪ مراحل نمایه سازی کامپیوتری :
- ذخیره اطلاعات
- تشخیص اطلاعات
- تفکیک اطلاعات به پاره های اطلاعاتی
- مقایسه پاره های اطلاعاتی
- طبقه بندی
- انتخاب
درنمایه سازی ماشینی اساس کار ذخیره اطلاعات به صورت الکترونیکی و تشخیص اطلاعات بسته به توانایی سیستم جهت این تشخیص و سپس تفکیک به پاره های اطلاعاتی توسط کامپیوتر می باشد.
- منظور از ذخیره اطلاعات به صورت الکترونیکی ، ذخیره اطلاعات بخشی ازمدرک است که جهت نمایه سازی ازآن استفاده می شودو شامل عنوان یا چکیده یا فهرست مندرجات یا حتی کل مدرک می باشد.
- منظور از تشخیص اطلاعات، تشخیص کلمات وجملاتی است که به صورت الکترونیکی ذخیره شده است و بستگی به توانایی سیستم از لحاظ سخت افزاری و نرم افزاری دارد.
- منظور از تفکیک اطلاعات به پاره های اطلاعاتی این است که کل اطلاعات یک مدرک که ذخیره شده است به جملات یا کلمات شکسته شود.
- منظور از مقایسه پاره های اطلاعاتی همان مقایسه جملات یا کلماتی است که در مراحل قبل شکسته شده است.
- منظور از طبقه بندی پاره های اطلاعاتی ، اولویت بندی پاره های اطلاعاتی برحسب نیاز و با توجه به برنامه ای است که قبلا به سیستم داده شده است.
- انتخاب آخرین مرحله است که پس از اولویت بندی پاره های اطلاعاتی آن دسته از اصطلاحاتی که در اولویت قرارگرفته اند به عنوان توصیفگرانتخاب میشوند و اصطلاحات نامناسب حذف می شوند.
● نمایه سازی خودکار درمحیط وب:
وب به عنوان یکی از جذاب ترین بخشهای اینترنت کاربردهای فراوانی دارد ومجموعهای است از صفحات به هم پیوسته که حاوی اطلاعات مفیدی درزمینه های موضوعی متفاوت است. همه دلایل مربوط به چرایی سازماندهی اطلاعات در محیط چاپی با شدت بیشتری درمحیط الکترونیک صادق است.چرا که امروزه میلیونها نفر نیازهای خودرا ازطریق وب مرتفع میسازند.درحال حاضر موتورهای کاوش وب راتحت ضابطه درآورنده اندو با نمایه سازی صفحات ، پاسخی برای پرس وجوی کاربران فراهم می آورند. نحوه سازماندهی اطلاعات بازتاب مستقیمی درنحوه بازیابی (رتبه بندی ونمایش) نتایج دارد. موتورهای کاوش هریک با الگوریتمها و سیاستهای متفاوتی به مقوله نمایه سازی می نگرند.تفاوت درنتایج بازیابی شده در موتورهای کاوش مختلف نشان بارزی از وجود تفاوت درالگوریتمهای نمایه سازی آنهاست. سازماندهی وسپس ذخیره مناسب اطلاعات به بازیابی نتایج مرتبط ومناسب خواهدانجامید.
نمایه سازی بایکی از دوروش دستی وخودکار انجام می گیرد. در محیط وب به دلیل حجم وسیع اطلاعات منتشر شده عملا نمیتوان به شیوه های دستی متوسل شد. بنابراین نمایه سازی دروب به صورت خودکار وتوسط موتورهای کاوش انجام میشود. موتورهای کاوش پایگاههای اطلاعاتی قابل جستجویی هستند که از طریق برنامه های کامپیوتری به شناسایی ونمایه سازی خودکار صفحات وب میپردازند. موتورهای کاوش برنامه های خودکاری هستند که هیچ گونه وابستگی به نیروی انسانی ندارند.
● رویکردهای نمایه سازی خودکار دروب:
دربیانی کلی میتوان گفت که تاکنون درحوزه ذخیره وفن آوری اطلاعات در وب شاهد رویکردهای نمایه سازی گوناگونی چون محتوامحتوری و معنا محوری بوده ایم که شرح آنها آورده خواهد شد.
۱) محتوا محوری:
اغلب موتورهای کاوش حاضر از روش نمایه ساز ی برمبنای کلیدواژه های متن استفاده میکنند.دراین شکل فرایند نمایه سازی سه مرحله خواهد داشت : شکستن کلمات، تعدیل وحذف کلمات غیرموضوعی، استفاده از الگوریتم ریشه ساز جهت تولید ریشه های مفاهیم. درمرحله شکستن کلمات، داده هایی که به صورت رشته ای از کاراکترها هستندمورد بررسی قرار گرفته وحدود کلمات وفاصله میان آنها مشخص می گردد. درمرحله تعدیل کلمات مزاحم، بزرگ نویسی ، نقطه گذاری ومواردی از این دست مدیریت می شود. کلمات مزاحم درنمایه سازی کلماتی هستند که بار معنایی خاصی ندارند و تنها برای ایجاد پیوستگی و ارتباط در جمله ها به کار می روند. بعد از این مرحله از الگوریتمی جهت تولید ریشه ها و مفاهیم استفاده می شود.
۲) معنا محوری:
درحال حاضر اغلب موتورهای کاوش رویکردی مکانیکی دارندو به مفاهیم ، الگوها وکلیدهایی که به فهم مفاهیم می انجامد توجهی ندارند. دراین ابزارها، جست و جوی واقعی صرفابر مبنای کلیدواژه هاست. استفاده از فهرست مترادفها وبهره گیری از جست وجوی فازی از راهبردهای مطرح شده جهت رفع مشکلات جست وجوی کلید واژه ای است. روشی که دراینجا مطرح است بهره گیری از نمایه سازی معنایی پنهان جهت بهبود مانعیت، جامعیت ورتبه بندی نتایج کاوش است.نمایه سازی معنایی پنهان به کاربران این اجازه را میدهد که جست وجوی خودرا به مفاهیم و نه فقط کلید واژه ها محدود کنند.درزمینه نمایه سازی خودکار دروب حرکتهای جاری به سمت بهره گیری ازداده های ساختار یافته وتحقق وب معنایی است ، اما این حرکتها به طورکامل به انجام نرسیده است و هنوز مشکلات حل نشده فراوانی در این مسیر وجوددارد. بی گمان کتابداران واطلاع رسانان به عنوان متولیان سازماندهی دانش بشر ، میتوانند دراین زمینه نقش موثری ایفا کنند. بدیهی است دراین راستا کتابدار باید خودرا به دانش وفناوریهای نوین اطلاعاتی مجهز نماید تابتواند وظیفه نمایه سازی وذخیره سازی اطلاعات را انجام دهد.
● نتیجه گیری :
نمایه سازی یکی از سریعترین روشهای بازیابی اطلاعات محتوای مدارک است و با توجه به افزایش روزبه روز مدارک و توسعه رشته های علمی ضروری به نظر می رسد. نمایه سازی ماشینی از انواع نمایه سازی است که هماهنگی و یکدستی درنمایه سازی را به دنبال دارد. دراین روش انتخاب واژه های کلیدی توسط ماشین انجام می گیرد. البته این درحالی است که یک بار سیاست کار آن به ماشین داده شده است. دراین روش انتخاب کلیدواژه ها، کنترل اصطلاحات تخصصی و هماهنگی بین آنها توسط ماشین انجام میگیرد. عمدتا نمایه سازی ماشینی به دوروش رایانه ای و با کمک رایانه انجام میگیرد. روش رایانه ای داراری انواع حذف اصطلاح و حفظ اصطلاح است که نمایه کوئیک و کوواک از نوع حذف اصطلاح هستند. نمایه سازی با کمک رایانه درمحیط گرافیکی و دستوری انجام میگیرد. درصورت استفاده از هر کدام از روش ها نیاز به نرم افزار هایی داریم که دراین زمینه راهگشا باشند. میتوان از رویکردهای نمایه سازی خودکار درمحیط وب نیز استفاده نمود که این مسئله نیز درراستای دستیابی به هدف اصلی نمایه سازی که همان سازماندهی اطلاعات به قصد سهولت بازیابی است، میباشد.
کتابنامه
۱. دیانی، محمدحسین(۱۳۷۹). مواد وخدمات مرجع : فشرده درسها.تهران: انتشارات کتابخانه رایانهای.
۲. راولی ، جنیفرای(۱۳۷۴). نمایه سازی و چکیده نویسی. ترجمه جعفر مهراد. تهران : سازمان مدارک فرهنگی انقلاب اسلامی.
۳. سلطانی، پوری. راستین، فرودین(۱۳۸۱).اصطلاحنامه کتابداری . تهران : فرهنگ معاصر.
۴. فوگمان، روبرت(۱۳۷۴). تحلیل موضوعی و نمایه سازی: مبانی نظری و توصیه های عملی . تهران : کتابخانه ملی.
۵.لارج، آندرو.تر، لوسی.هاتلی، ریچارد(۱۳۸۳). جستجوی اطلاعات در عصر اطلاعات: اصول و مهارتها. ترجمه زاهدبیگدلی.ویراسته زهیر حیاتی. تهران: نشر کتابدار.
۶.محمدی فر ، محمدرضا(۱۳۸۱). مبانی نمایه سازی. تهران: وزارت فرهنگ و ارشاد اسلامی. سازمان چاپ و انتشارات.
۷.نوروزی، علیرضا(۱۳۸۰). نمایه سازی کتاب: راهنمای برای ناشران، نمایه سازان، کتابداران، مولفان و مترجمان. تهران: چاپار.
۸. نیاکان، شهرزاد(۱۳۸۳). نمایه سازی ماشینی. تهران. مرکز اطلاعات و مدارک علمی ایران.
۹.یوسفی، احمد."اصول و روشهای نمایه سازی رایانه ای". فصلنامه کتاب. دوره ۹،شماره۲،ص۶۰-۴۸.
۱۰. Bakewell, K.G. B (۱۹۷۸). Classification and Indexing Practice. London: Clive Bingly.
۱۱. Evans, Richard T. Computerized indexing service for publishers, authors, packagers and corporations. Available from: www.Mindsping.com
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست