سه شنبه, ۹ بهمن, ۱۴۰۳ / 28 January, 2025
مجله ویستا
مروری بر نمایهسازی معانی پنهان: نظریه و کاربردها
نمایهسازی معانی پنهان روشی است که اطلاعات را در قالب معانی ذخیره میکند، و از رابطهٔ پنهان میان اصطلاحات و متن استفاده مینماید. در این روش معایب توجه به اصطلاح در یک سند به صورت منفرد، برطرف میگردد. در نظام بازیابی که به این روش فراهم میآید، بهجای تطبیق لغوی اصطلاحات کلیدی، رابطهٔ معنایی میان اصطلاحات نیز مورد توجه قرار میگیرد. در این مقاله، نظریه و کاربردهای نمایهسازی معانی پنهان در نظامهای بازیابی مورد بررسی قرار میگیرند.
در میان گونههای مختلف اطلاعات موجود در اینترنت، بیشتر اطلاعات، بخصوص اسناد و مدارک علمی، دارای قالببندی متنی میباشند و بنابراین بازیابی اطلاعات متنی از اهمیت بسیاری برخوردار است (Kowalski, ۱۹۹۷).
برای آنکه بازیابی اسناد در اینترنت امکانپذیر باشد، باید روشی مناسب برای پیادهسازی، ذخیرهٔ اسناد و نمایهسازی انتخاب گردد. در میان روشهای گوناگون پیادهسازی سند و درخواست، غالباً روش «فضای بُرداری» [۲] مورد استفاده قرار میگیرد. در این روش، سند و درخواست به صورت بُردارهایی از فرکانس یا وزن اصطلاحات نمایه، پیادهسازی میگردند. در میان فرمولهای کلاسیک وزندهی اصطلاحات نمایه، سادهترین فرمول، استفاده از فراوانی، و بسامد معکوس میباشد: IDF*W=TF
در این روش، وزن هر اصطلاح از ضرب دفعات تکرار اصطلاح در سند (TF) [۳] در دفعات تکرار اصطلاح در کل اسناد (IDF) بهدست میآید. برای آنکه طول اسناد در وزن اصطلاحات، اثرگذار نباشد میتوان وزن نهایی را با استفاده از طول سند، «نرمال» کرد. درنهایت هر سند به یک بُردار تبدیل خواهد شد؛ با مقایسهٔ بینبُردار درخواست و بردار سند، اسناد مرتبط [۴] بازیابی میگردند. یکی از روشهای معمول برای محاسبهٔ شباهت میان بردارها، محاسبهٔ زاویهٔ میان بردار درخواست و بردار سند است. هرچه زاویهٔ میان این دو بردار کمتر باشد، سند و درخواست، شبیهترند (شکل شماره ۱)(Salton, ۱۹۸۳). درنهایت پس از نمایهسازی و محاسبهٔ وزن برای تمامی اصطلاحات کلیدی سند، یک ماتریس به نام ماتریس اصطلاح ـ سند [۵] به دست خواهد آمد. هر سطر از این ماتریس، بردار مشخصهٔ یکی از اسناد میباشد و هر مدخل از ماتریس، وزنهای محاسبهشده در اسناد است (شکل شماره ۲)(Salton, ۱۹۸۳).
مسعود بهمن آبادی
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست