سه شنبه, ۴ اردیبهشت, ۱۴۰۳ / 23 April, 2024
مجله ویستا


نمایه سازی تصویر در پایگاههای اطلاعاتی


نمایه سازی تصویر در پایگاههای اطلاعاتی
● چکیده
یک تصویر ممکن است با ارزش تر از هزاران کلمه باشد اما هزاران کلمه نتوانند ویژگیهای یک تصویر را بیان کنند تکنولوژی پردازش تصاویر قابلیت های بالقوه ای را برای کتابخانه ها و مراکز اطلاع رسانی به وجود آورده تا حجم پایگاههای اطلاعاتی تصویری خود را افزایش دهند اما رسیدن به یک توافق بر روی اینکه کدامیک از روشهای نمایه سازی تصویر مناسب تر است دشوار است زیرا هریک ازاین روش ها مزایا و معایب خاص خود را دارند, این مقاله به برخی از روشهایی که برای نمایه سازی یک تصویر به کار می رود اشاره می کند و نمونه هایی از هریک را ذکر می کند.
● مقدمه
تا پیش از آغاز جنگ جهانی دوم مجموعه های عکس برای عموم قابل دسترس نبود و تنها پس از آن بود که قابل دسترس شد در دوره بین سالهای ۱۹۳۰ تا ۱۹۶۰ ما شاهد افزایش مجموعه های تصاویر بودیم . در این زمان به علت رشد مجموعه عکس مشکل دسترسی موضوعی به تصاویر مطرح شد.
در ابتدا مجموعه های عکس و بازیابی موضوعی آن مورد توجه افرادی غیر از کتابداران قرار گرفت به طور مثال خن[۱] از موسسه هنر شیکاگو در مقاله ای پبشنهاد می کند که برای اسلایدها صفحه عنوانی مشابه آنچه که در تک نگاشته ها وجود دارد در نظر گرفت.
در سال ۱۹۳۹ تاریخدان هنری ارین پانوفسکی [۲] محتوای موضوعی یرای آثار هنری را در سه سطح تعریف کرد .
۱) پیش نگاری[۳]
۲) پیکر نگاری [۴]
۳) شمایل شناسی[۵]
در سطح اول موضوع و محتوا توسط واقعیات یا نمای ظاهری تعیین می شود . سطح دوم یا سطح پیکر نگاری برخی دانشهای فرهنگی از مفاهیم را لازم خواهد داشت . سطح سوم یا شمایل شناسی یک تفسیر پیشرفته و درک عمیق و یک پیش زمینه از آن تصویر را نیاز خواهد داشت و از آنجا که سطح سوم درک مفهومی پیچیده ای را دارد یا یک حد ثابتی نمی تواند نمایه سازی شود A Brief History of,۲۰۰۲)).
بعدها افرادی مانند مارکی[۶] (۱۹۸۴) , شات فورد[۷] (۱۹۸۶) و وان دراستار[۸] (۱۹۹۵) پیشنهاد کردند که یک تصویر را باید در عین واحد از سه منظر پیش پیکرنگاری , پیکر نگاری وشمایل شناسی مورد توجه قرارداد مثلا درنمایه سازی تصویری از برج ایفل پیش پیکر نگاری(برج, رودخانه, درخت) پیکرنگاری( برج ایفل, رودخانه سابن) واصلاحات شمایل شناسی ( خیال انگیزی, تعطیلات هیجان انگیز) را باید به این تصویر اختصاص داد (لنکستر, ۳۲۳,۱۳۸۲).
در طول دهه ۱۹۴۰ منابع سمعی و بصری از بعد آموزشی مورد توجه قرار گرفت اما مشکلات فهرست نویسی و سازماندهی این مواد مورد غفلت قرار گرفت . در طول دهه ۱۹۵۰ بر روی عوامل اقتصادی ایجاد ونگهداری مجموعه های تصویر توجه شد و همچنین مشکلات اجرایی بازیابی مجموعه های تصاویر مورد توجه قرار گرفت .
در طول دهه ۱۹۶۰ شاهد افزایش رده بندی و فهرست نویسی اسلایدها و منابع وابسته به سمعی و بصری بودیم . سیستم رده بندی تصاویر و اسلایدهای علمی و تاریخی و هنر توسط تنسی[۹] و سیمونز [۱۰] در دانشگاه کالیفرنیا در سانتا کروز[۱۱] توسعه یافت . این سیستم اولین طرحی بود که برای فهرست نویسی اسلایدها و نمایه سازی تصاویر به کار رفت . پیش فرض اولیه این افراد این بود که یک تصویر در مقایسه با کلمات و جملات یک کتاب گویا تر است و رده بندی اسلایدها باید به گونه ای خاص تر انجام شود . ویرایش اولیه این سیستم در سال ۱۹۶۹ و ویرایش نهایی آن در سال ۱۹۷۰ تهیه شد .
در سال ۱۹۷۵ پروژه تحقیقاتی دیگری توسط غیر کتابداران انجام شد این پروژه توسط شخصی با نام هانس ران [۱۲] که یک صنعت گر سوئیسی بود انجام شد . او یک طرح نمایه اسلاید با نام مجموعه اسلایدهای رنگی را ایجاد کرد که این طرح درحقیقت یک پایگاه اطلاعاتی اولیه بود که تقربیا شامل ۴۵۰ کلید واژه به زبان انگلیسی و آلمانی بود که به ۱۴ رده کلی تقسیم می شد دسته بندی موضوعی ران شامل کلیسا , ابزار و وسایل , تاریخ و جغرافیا , طبیعت , حرفه , مذهب و مقدسین , شهرها و ساختمانها و زندگی مردم بود البته سیستم ران به سمت نقاشی های اروپایی گرایش داشت . تلاش برای نمایه سازی موضوعی با مجموعه ران خاتمه نیافت در سال ۱۹۷۸ کنفرانسی با نام منابع بصری برپا شد که موضوع این کنفرانس دسترسی موضوعی به به تصاویر بصری بود این کنفرانس مورد توجه محققان برجسته و متخصصانی که در زمینه تصاویر کار می کردند قرار گرفت . اهداف این کنفرانس با کنفرانس دیگری که با نام کنفرانس بلمونت[۱۳] شناخته می شود تداوم یافت موضوع این کنفرانس دسترسی هوشمند به منابع بصری بود این کنفرانس در سال ۱۹۸۰ انجام شد. شرکت کنندگان این کنفرانس ۹ نیاز یک سیستم پیکر نگاری[۱۴] را مطرح کردند و اشاره کردند این سیستم باید همه اصطلاحات محتوا ومفهوم را در برگیرد یعنی براین باور بودند نمایه سازی موضوعی تصاویر بر پایه مفهوم و محتوا هردو باشد . نمایه سازی مفهومی مسلما محدودیتهای دارد زیرا تاحد زیادی انتزاعی و ذهنی است و بنابراین به آسانی به دست نمی آید. و علاوه براین پیش بینی اینکه یک تصویر در چه مورد می خواهد استفاده شود دشوار است
(A Brief History of,۲۰۰۲).
●انواع روشهای نمایه سازی تصاویر که تاکنون آمده است
رایج ترین روش آماده سازی تصاویر در یک پایگاههای اطلاعاتی با هدف بازیابی, ایجاد کردن فیلدهایی شامل داده های کتابشناختی مانند هنرمند , عکاس , عنوان و... می باشد که همراه این فیلدها فیلدی می آید که شامل برخی فنون توصیفی برای حمایت از فیلدهای توصیفی است . این پایگاههای اطلاعاتی ها در عمل مشکلاتی دارند اولا اینکه برخی تصاویر چند بعدی هستند و هرکسی از یک جنبه ای که به کارش می آید به آن توجه می کند . وحتی ممکن است یک تصویر با هدفی جدا از آنچه توسط خالقش ایجاد شده استفاده شود به طور مثال تصویری از یک خیابان شلوغ در قرن ۱۹ ممکن است مورد استفاده چندین نفر قرار گیرد و هرکدام از آنها از یک بعدی به آن توجه کنند مثلا معمار از نظر ساختمان سازی به آن توجه کند و تاریخدان از دید تغییراتی که در این دوره انجام شده به آن توجه کند .
دوما بر خلاف کتابها و دیگر اسناد تصاویر صریحا به وسیله عنوان , پیشگفتار,مقدمه یا چکیده شان توضیح داده نمی شوند در نتیجه بیندگان باید خیلی زیاد خودشان به تعبیری که از یک تصویر می کنند متکی باشند .
این امر می تواند مشکلاتی را بخصوص زمانی که تصاویر رمزی و نمادین هستند ایجاد کند به طور مثال تصویر یک مرد همراه با شیر ممکن است مفهومش نشان دادن غرور باشد.
تکیه کردن روی مفاهیم مفهومی و ذهنی اشکالش این است که از یک سو دیدگاه یک نمایه ساز با نمایه ساز دیگر متفاوت است و از سوی دیگر ممکن است که یک نمایه ساز واحد دیدگاهش در زمانهای مختلف متفاوت باشد .
بنابراین واضح است که نمایه سازی تصاویرکار ساده ای نیست و به همین دلیل باید تنوعی از نقاط دسترسی برای کاربران فراهم کرد تا بتوانند تصاویر مورد نیاز خود را بازیابی کنند .
چنانچه بسر[۱۵] اشاره می کند یک تصویر ممکن است هزاران بار با ارزش تر از کلمات باشد اما هزار توصیفگر شاید برای توصیف محتوای یک پایگاههای اطلاعاتی تصویری مناسب نباشد.
در نتیجه تلاشهای زیادی برای کنترل شمار زیاد کلمات تصاویر انجام شد از اینرو توجه زیادی بر روی سیستم های نمایه سازی تزاروسی صورت گرفت(باکستر,۱۹۹۵).
● سیستم های نمایه سازی تزاروسی
از انواع این تزاروس که برای نمایه سازی تصاویر اسستفاده شده می توان به موارد زیر اشاره کرد ولی باید اشاره کرد که همه این تزاروس ها اختصاصا برای نمایه سازی تصاویر ایجاد نشده است .
تزاروس هنرو معماری (AAT) این تزاروس یک واژه نامه ساختار یافته است که می تواند برای بهبود دسترسی موضوعی به مباحث هنر و معماری ومنابع فرهنگی استفاده شود خواستگاه چنین سیستمی مدیون دورا کوچ[۱۶] می باشد که استاد تاریخ و معماری در موسسه Polytechnicr Rensselae بود, کوچ بحث جدی برای ضرورت زبانهای نمایه سازی ایجاد کرد.
اولین ویرایش AAT در سا ل۱۹۹۰ توسط انتشارات آکسفورد منتشر شد. این تزاروس درحال حاضر شامل ۱۲۵ هزار اصطلاح است که به طور سلسله مراتبی منتشر می شود . قالب AATاز تجزیه و تحلیل موضوعات تئوری رنسانس است که همه دانشها را به ۵ رده اصلی شامل خصوصیات فیزیکی , ماده , انرژی, زمان, مکان, تقسیم می کند. هر چهرریزه این تزاروس شامل گروه مشابهی از مفاهیم است که آنها را از چهرریزه دیگر متمایز می کند. وسه نوع رابطه سلسله مراتبی هم ارز و وابسته در این تزاروس وجود دارد پیترسون[۱۷](۱۹۹۰) AAT را بر اساس سرعنوان کتابخانه ملی پزشکی مدل گذاری کرد این سلسله مراتب شامل ریشه شناسی, توصیف, ویژگیهای فیزیکی, سبکها و دوره ها, کارگزاران[۱۸] و فعالیتها می باشدو (The AAT,۲۰۰۲)
مزایای AAT این است که از همارایی زاید پرهیز می کند. و ترکیب اصطلاحات را در زمان بازیابی ممکن می سازد. روی حوزه های هنر و تاریخ متمرکز شده و در آن زمینه اختصاصی تر کار کرده است, و همچنین شمار زیاد اصطلاحات را در برمی گیرد. اما چنین تزاروسی خالی از اشکال نیست و آن این است که کار کردن با چنین تزاروسی بسیار وقت گیر است و تحقیقاتی که انجام شده نشان داده که حتی پس از آموزش, کار با این تزاروس و استفاده از آن برای نمایه سازی اسلایدها به طور متوسط ۴۰ دقیقه طول می کشد(باکستر,۱۹۹۵).
نوع دیگر از سیتمهای نمایه سازی تزاروسی که برای تصاویر استفاده می شود TGM است که تزاروس منابع گرافیکی می باشد منبع اصلی برای اصطلاحات این تزا روس سرعنوان موضوعی کتابخانه کنگره است که بطور اختصاصی برای نمایه سازی تصاویر ثابت مانند عکس کلیشه , کارتونها و غیره به کار می رود هر چند که تصاویری که جنبه تاریخی و هنری دارند را شامل نمی شود این اصطلاحنامه الفبایی است و از روابط هم ارز , سلسله مراتبی و وابسته برخودار است TGM نسبت به AATحالت عام تری دارد۲۰۰۲) , . (TGM
▪ مزایای TGM
۱) به طور مخصوص برای نمایه سازی تصاویر بصری تهیه شده است .
۲) در یک مجموعه متنوع از جمله کتابخانه , آرشیو و.. می تواند استفاده شود.
۳) چند بعدی بودن آن
۴) اصطلاحات خاص تری برای تصاویر می تواند از طریق تقسیمات جغرافیایی , جنگها نامها و حوادث ساخته شود,۲۰۰۲) (Useful Comparisons.
▪ محدویتهای TGM
۱) شمار نسبتا کم اصطلاحات
۲) روابط سلسله مراتبی کاملا در همه رده ها توسعه پیدا نکرده است
۳) پیش همارایی بودن این اصطلاحنامه
۴) این اصطلاحنامه برای بخش عکس کتابخانه کنگره طراحی شده است و ممکن است کمتر به کار سایر کتابخانه ها بیاید ,۲۰۰۲) . (TGM
نوع دیگر از سیتمهای نمایه سازی تزاروسی که برای تصاویر هم استفاده می شود ICONCLASS است طرح اولیه این تزاروس در اواخر دهه ۱۹۴۰ و اوایل دهه ۱۹۵۰توسط هنری وال[۱۹] استاد تاریخ هنر در دانشگاه لیدن[۲۰] توسعه یافت او می خواست طرحی ایجاد کند که با همه موضوعات نقاشی سازگار باشد او در سال ۱۹۷۲ مرد و پروژه اش توسط گروهی از دانشجویان سابقش به راهنمایی کوپری[۲۱] ادامه یافت ICONCLASS از دوکلمه iconography”و classification ریشه گرفته است این سیستم در بین سالهای ۱۹۷۳ تا ۱۹۸۵ منتشر شد و یک سیستم سلسله مراتبی است که کدهایی (مانند دیویی) را مرتب می کند این تزاروس شامل ۱۷ جلد و هرکدام از این کدهای الفبایی با یک توصیفگر موضوعات عملی یا موضوعاتی که درهنرهای زیبا یافت می شوند ارتباط داده می شوند این کدها د ر۹ بخش اصلی هستند که شامل
۱) مذهب , سحر و امور مافوق طبیعه
۲) طبیعت
۳) انسان
۴) جامعه وفرهنگ
۵) مفاهیم چهره ریزه ای
۶) تاریخ
۷) انجیل
۸) منابع
۹) اسطوره شناسی و تاریخ باستان
برخی آن را خبره ترین و پیچیده ترین سیستم نمایه سازی برای هنرهای زیبا می دانند البته انتقادهایی به این تزاروس می شود به طور مثال سادرلند[۲۲](۱۹۸۲) معتقد است ICONCLASS برای بررسی پیکرنگاری تاریخ و هنر مناسب است ولی در مورد توصیف موضوعات رایجی مانند جداول, خانه ها و غیره چندان راضی کننده نیست و تاحد زیادی زمان گیراست.
سیستم تزاروسی دیگر که برای نمایه سازی تصاویر استفاده می شود TELCLASS نام دارد این تزاروس توسط ایوانز[۲۳] درکتابخانه فیلم و ویدئو BBC-TV در سال ۱۹۷۵ توسعه یافته است این طرح برای همه دانشهای بصری است این سیستم شامل کدهای الفبایی و اصطلاحات مرتبط با آن می باشد که در ۶ گروه اصلی مرتب شده است, که شامل :
۱) شفاهیات
۲) طرح کلی
۳) واقعیات
۴) شبیه سازی
۵) فنون
۶) رسمی[۲۴]
اگرچهTELCLASS توسط BBC برای استفاده داخلی اش تهیه شده است اما سازمانهای دگیر از آن استفاده می کنند(باکستر,۱۹۹۵).● اصطلاحنامه بصری و سیستم های ترکیبی وابسته
استفاده از اصطلاحنامه بصری در سالهای اخیر مورد توجه قرار گرفته و موضوع تحقیقات بسیار قرار گرفته است و البته باید یاداوری کرد که در سیستم هایی که به طور آزمایشی از اصطلاحنامه بصری استفاده کرده اند کلمات به طور کامل حذف نشده است.
از نمونه های اصطلاحنامه بصری می توان مرکز فضایی (NASA Johnson (JSC در هوستون[۲۵] اشاره کرد , این سیستم برای بازیابی تصاویر مجموعه های فضایی طراحی شده این سیستم یک رویکرد متنی سنتی تر را دنبال می کند دست اندرکاران این سیستم بر این باورند که این سیستم با سایر پایگاههای اطلاعاتی تصویری متفاوت است این سیستم عملگرهای بولی را به کار نمی برد در عوض از موتور بازیابی داده های سیستم[۲۶] استفاده می کند این سیستم از شمار زیادی از الگوریتمهای جستجوی آماری استفاده می کند که تصاویر بازیابی شده را بر حسب شباهت به سوال مرتب می کنند در نتیجه احتمال اینکه کاربر تصویری مرتبط با آنچه که به دنبالش است پیدا کند افزایش می یابد.
این سیستم از حدود ۲۰۰ تصویر رایج ساخته شده که از نرم افزار هیپرکارد[۲۷] استفاده می کند که کلید واژه کاربر را با اصطلاحات مرتبط در تزاروس JCC(که یک تزاروس سلسله مراتبی از لغات هوانوردی که برای استفاده خانگی ناسا[۲۸] تهیه شده), پیوند می زند. در نتیجه گزینش اصطلاحات توصیفی در تزاروس , تصاویر مرتبط و همان طور تصاویر عام تر و خاص تر در پایگاههای اطلاعاتی بازیابی می شود . هرچند این نمونه بدون مشگل نیست ولی سازوکار آماری مذکور به طور اتوماتیک مهمترین تصاویری که به اصطلاحات تزاروس مرتبط شده اند را بازیابی می کند.
تحقیقات نشان می دهد تزاروس بصری بیشتر برای مصارف اتفاقی و کاربران بی تجربه تر مفید است حال آنکه رویکرد تزاروس متنی برای کاربران با تجربه تر مفید است . سیستم دیگری که در زمینه تزاروس بصری کارمی کند در دانشگاه سیراکوس[۲۹] است که هدف از ایجاد این سیستم ایجاد تزاروس بصری مفهومی با تمرکز روی تصاویر طراحی شده بود آنها دنبال سیستمی هستند که در شناسایی برگ گیاهان و اجزای آن به کاربران کمک کند در این سیستم در ابتدا برای کاربران گستره ای از تصاویر که برگهای اصلی و شکلهای آنها را شرح می دهد نمایش داده می شود کاربر یکی از این نمونه ها را انتخاب می کند و سپس می تواند این نمونه را اصلاح و دستکاری کند و در نهایت پس از اصلاحاتی که کاربر روی آن انجام می دهد تصویر اصلاح شده, برا ی کاربر نمایش داده می شود برای انجام این کار این سیستم از مجموعه ای از نرم افزارهای رایج در طراحی کامپیوتر ها مانند استفاده می کند کنترل پوینتز[۳۰]و هندلس[۳۱] استفاده می کند(باکستر,۱۹۹۵).
البته نمونهای دیگری از تزاروس های بصری وجود دارد که هنوز چندان توسعه نیافته است.
● زبانهای توصیف تصویر
برخی محققان به دنبال روش های جایگزین برای نمایه سازی دستی تصاویر هستند و بر این باورند که مناسب ترین روش برای ذخیره و بازیابی متوالی و اتوماتیک استفاده از زبانهای تخصصی است که توصیف یک تصویر را بر عهده گیرند می باشند که این زبان به وسیله کد ماشین خوان در دانشگاه لندن به طور آزمایشی به کار رفت آنها یک زبان توصیف تصویر که مبتنی بر مدل داده ای روابط بر مبنای خصیصه- موجودیت ها[۳۲] است و اشاره می کنند که این زبان ممکن است مشابه سیسم کلیدی که دربخش - خصیصه[۳۳] و عمل- تاثیر[۳۴]استفاده می شود باشد و این سیستم درچکیده استینز [۳۵] مطابق با دقت برای اسم وصفت وفعل که عموما یک توصیف ساده از یک تصویر را ارائه می دهد می باشد استفاده از یک بخش از قوانین ارائه شده به نحو تخصصی نشان می دهد که مشابه با آن چیزی که در PRECIS (چکیده) استفاده می شود این زبان توصیف تصویر را برای ساختار دهی به روش یکنواخت را ممکن می سازد و همچنین روابط بین موضوعات را در یک تصویر ممکن می سازد که استفاده از آن را به عنوان معیار بازیابی مجاز می کند.
هرچند این زبان توصیف تصویر برای مجموعه های کوچک عملی است ولی همچنان برای نمایه سازی مدخلها و نیازهای کاربران ما ناچار هستیم ورود اطلاعات و کدگذاری را به شیوه دستی انجام دهیم و کاربرد این زبان در مجموعه های بزرگ ممکن است پیچیده و زمان گیر باشد(باکستر,۱۹۹۵).
● بازیابی و نمایه سازی تصاویر توسط محتوا
اخیرا تحقیقات زیادی برای توسعه سیستم هایی صورت گرفته که به جای تکیه بر توصیف تصویر از طریق متن تصاویراز تحلیل اتوماتیک محتوا و مچ کردن تصاویر با توجه به سوال کاربر استفاده کنند بیشتر این سیستم ها مبتنی بر تحلیل ریاضی و آرایه پیکسلهایی است که یک تصویر دیجیتالی را تشکیل می دهد می باشد(باکستر,۱۹۹۵).
بازیابی تصاویر محتوایی یا CBIR در سالهای اخیر تلاشهای زیادی را به خود معطوف کرده و برای استخراج سریعتر استفاده می شود این سیستم متکی بر خواص قابل سنجش مثل رنگ , شکل و متن است با CBIR تصاویر با کیفیت مشابه می توانند جمع آوری شوند این سیستم رویکرد مفیدی برای بازیابی علائم تجاری دارد ولی در مورد اسامی کمتر مفید است (,۲۰۰۲ The Future of).
در CBIR سوال کاربر به دو شکل زیر تفسیر می شود
۱) یک تصویر مشابه با آنچه که مورد نیاز و از قبل با هدف مچ کردن در سیستم وجود دارد بازیابی شود.
۲) یک سوال ساختار مورد دلخواه خواسته شده را شرح می دهد .
از بین سیستم های CBIR می توان به سیستمی اشاره کرد که توسط ریکمن[۳۶]و استون هام[۳۷] در دانشگاه برونل[۳۸] توسعه یافته این سیستم مبنایش از پروژه ویزارد[۳۹] و استون هام[۴۰] می باشد این سیستم توسط الگوی انطباق یک تصویر ورودی از صورت انسان با مجموعه ای از تصاویر سیاه سفید که در یک پایگاههای اطلاعاتی تصویر صورت انسان وجود دارد کار می کند این سیستم از یک شبکه عصبی ۸ گرهی استفاده می کند تلاشهایی برای شبیه کردن این واکنش با واکنش فرآیند مغزی صورت گرفته است. فرایند کاری این پایگاههای اطلاعاتی بسیار پیچیده است(باکستر,۱۹۹۵).
سیتم دیگر CBIR, VisualSEEk and WebSEEk می باشد این دو سیستم سیستم هایی هستند که برای استفاده در وب جهان گستر طراحی شده اند و اجازه می دهند که در خواستها از طریق کلید واژه ها و ویژگیهای بصری وارد این سیستم ها شوند هر دو این سیستم ها در دانشگاه کلمبیا توسعه یافته اند و از طریق free trials قابل دسترس هستند(,۲۰۰۲ The Future of).
Excalibur RetrievalWare سیستمی است که به کاربران اجازه می دهد که در جستجوی تصاویر بر رنگ , شکل ظاهری وضوح و وزن نسبی متکی باشند و هر ویژگی می تواند برای دقت بیشتر خودش را تطبیق دهد.
امید بخش تر تولیداتی است که ویژگیهای کلامی را با ویژگیهای بصری ترکیب کند چنانچه رای[۴۱] می گوید اختلاف اصلی بین یک سیستم بازیابی کامپیوتری و سیستم بازیابی تصویری این است که انسان یک بخش غیر قابل اجتناب در سستم های بعدی است (,۲۰۰۲ Future (The.
در حال حاضر بر ترکیب این دو شیوه یعنی ویژگیهای کلامی و بصری تاکید می کنند شرکت رور و همکاران در دانشگاه دریایی آمریکا بر روی نمایه سازی تصاویر کار کردند و در روش آنها تر کیبی از متن و ویژگیهای پیکسلی استفاده شده بود و برای اعمال طبقه بندی محلی بر روی عکسها از یک الگوی شبکه عصبی استفاده شده بود و از فرایند تجزیه خودکار برای شرح تصاویر استفاده شده بود.
در حال حاضر برخی سیستمها توسعه یافته اند که می خواهند برای نمایه سازی تصاویر از بازخورد کاربر استفاده کنند ابیلوا[۴۲] پیشنهاد می کند که از فیدبک کاربران شناسایی نتایج جستجو یمرتبط و غیر مرتبط استفاده کرد به طور مثال ارباچ یکی از چند نویسنده ای است که به ضرورت نمایه سازی مجموعه های تصاویر از دیدگاه بهره گیران تاکید می کند و ترنر اصطلاحاتی که بهره گیران برای استفاده در تصاویر انتخاب می کنند با توصیف کوتاه نوشته شده درباره تصاویرمقایسه کرد او به سطح بالایی از همخوانی رسید.
در حال حاضر یکی از سیستمهای بسیار موفق در بازار QBIC است که توسط شرکت IBM توسعه یافته این سیستم به کاربران اجازه می دهند که تصاویر مرتبط را به وسیله کشیدن آنچه که در ذهن دارند جستجو کنند و یا از طریق گزینش تصویر مرتبط از روی الگوهای متنی و رنگی آن را بازیابی کنند QBIC یک سیستم نیمه اتوماتیک است که از رنگ و متن و شکل برای نمایه سازی و بازیابی تصاویر استفاده می کند این سیستم از یک رابطه گرافیکی استفاده می کندسیستم کیوبیک انواع مختلفی از درخواسته های تصویری را فراهم »ی اورد . دو درخواست عام تر عبارتند از درخواست شییء و درخواست تصویری . درخواستهای شییء تصاویری را بازیابی می کنند که اشیای تصویری آنها با مشخصه های درخواست انتطباق دارد مثل یافتن شکلهایی که قرمز و گرد هستند .در حالی که درخواستهای تصویری , ویژگیهای کلی تصویر را بازیابی می کنند مثل یافتن تصاویری که بیشتر رنگ مایه قرمز و آبی دارند برای انجام درخواست های شییء باید اشیا را در هر صحنه و عموما از طریق ترسیم نقشه کلی آن قبل از درخواستها شناسایی کرد. فرآیند ترسیم نقشه کلی اشیا و سپس محاسبه صفات یا مشخصه های هر شییء و هر تصویر به عنوان یک کل را طبقه بندی تصویری گویند .ابزارهای طراحی پایه ای مثل چهار ضلعی , بیضی, چند ضلعی , قلم موی نقاشی و یک ابزار مارپیچ (که نقشه کلی تصاویر انتخابی را ترسیم می کند) وجود دارند یک ابزار پرکردن[۴۳] از طریق ترسیم خودکار نقشه کلی پیکسل هایی شبیه به پیکسل انتخابی پوشش دادن تصاویری با کنتراست بالا را تسریع می کند(لنکستر,۱۳۸۲, ۳۱۸)
به طور کلی می توان گفت گرچه روشهای غیر کلامی برای بازیابی تصاویر وجود دارند اما احتمالا بتوان از نمایه سازی و بازیابی کلمه – پایه ای معمول در بسیاری از جستجوها استفاده کرد و اگرچه ایده جستجو از طریق تصویر بسیار توصیه شده است اما این روش همیشه نمی تواند جایگزین قدرت توصیفی کلمات باشد که ممکن است برای برخی از مفاهیم موجز مناسب تر باشد.
به عبارت دیگر متن یک خلاصه بصری می تواند اطلاعات با ارزشی را فراهم آورد که در تصویر وجود ندارد بنابراین اگرچه بازیابی تصویری منطقا برای دستیابی سریع به تصاویر مناسب است اما این بدان معنی نیست که این روش جانشین خلاصه متن خواهد شد.
● نتیجه گیری
دستیابی توافق بر روی نمایه سازی تصاویر دشوار است زیرا افراد نمی توانند بر روی آنچه که یک تصویر واقعا نشان می دهد موافقت داشته باشند حتی برخی افراد مثل شات فورد بین آنچه در تصویر وجود دارد و چیزیکه از آن صحبت می کند تمایز قائل شده اند زیرا آنچه در تصویر وجود دارد کم و بیش با مسائل عینی روبروست حال آنکه آنچه یک تصویر از آن صحبت می کند بیشتر با امور انتزاعی سروکار دارد.
دیده شده که راه حل پیشنهادی برای مشکلات بازیابی تصاویر خیلی متنوع است و هرکدام از این روشها مزایا و مشکلاتی دارند بنابراین برخی نوسیندگان بین نمایه سازی شفاهی (یعنی بازنمود متنی یک تصویر) و نمایه سازی تصویری(استخراج مشخصه ها و در نتیجه نقاط دسترسی از خود تصویر) تفاوت قائل شده اند و این تمایز کاملا روشن است و یک سیستم بازیابی تصویر می تواند هر دونوع نمایه سازی را در بر داشته باشد و برخی دیگر تاکید کرده اند که بازیابی کارامد تصاویر فقط بر اساس انطباق صرف تصویرحاصل نمی آید و هنوز نوعی برچسب گذاری متنی ضرورت دارد مناسب ترین روش حداقل برای برخی اهداف ممکن است روشی باشد که دستیابی معمول از طریق متن (اصطلاحات نمایه ای با شرح توصیفی) را با انطباق تصویری در هم آمیزد وروش عملی استفاده از یک اصطلاحنامه تصویری است اصطلاحنامه ای که تصاویر نمونه را همراه با برچسب های شفاهی یا احتمالا بدون برچسب های شفاهی ذخیره کند.
افسانه کرمی
دانشجوی کارشناس ارشد کتابداری و اطلاع رسانی دانشگاه تهران
پانوشتها:
[۱] . Kohn
[۲] . Erin Panafski
[۳] . Pre- Icongraph
[۴] . Icongraph
[۵] . Icongraphical
[۶] Markie
[۷] Shutford
[۸] Van der Starre
[۹] .Luraine Tansey
[۱۰] .Wendell Simons
[۱۱] . Santa Cruz
[۱۲] .Hance C. Rahn
[۱۳] .Belmont
[۱۴] . Icongraph
[۱۵] .Besser
[۱۶] .Dora Couch
[۱۷] . Peterson
[۱۸] Agents
[۱۹] Henry Van de Wall .
[۲۰] .University of Leiden
.[۲۱] Couprie
[۲۲] . Sunderland
[۲۳] . Evans
[۲۴] . formal
[۲۵] Houston
[۲۶] . system’s data retrieval engine
[۲۷] Hypercard
[۲۸] NASA
[۲۹] Syracuse
[۳۰] control points
[۳۱] handles
[۳۲] Entity-Attribute-Relationship
[۳۳] part/property
[۳۴] action/effect
[۳۵] Austin’s PRECIS
[۳۶] Rickman
[۳۷] Stonham
[۳۸] Brunel
[۳۹] Wizard
[۴۰] Stonham
[۴۱] Rai
[۴۲] Eubilva
[۴۳] Fill Tools
فهرست منابع :
۱. "A Brief History of Image Analysis".۲۰۰۲[on-line].available:
http://www.slais.ubc.ca/people/students/student-rojects/C_Wanczycki/libr۵۱۷/history.html
۲. Baxter, Graeme(۱۹۹۵)." Image indexing and retrieval: some problems and proposed solutions"[on-line].available:
http://www.emeraldinsight.com/Insight/ViewContentServlet?Filename=Published/EmeraldFullTextArticle/Articles/۱۷۲۰۰۶۰۴۱۱.html
۳."TGM: Thesaurus of Graphic Materials".۲۰۰۲[on-line].available:
http://www.slais.ubc.ca/people/students/student-projects/C_Wanczycki/libr۵۱۷/tgm.html .
۴." The AAT: The Art and Architecture Thesaurus".۲۰۰۲[on-line].available:
http://www.slais.ubc.ca/people/students/student-projects/C_Wanczycki/libr۵۱۷/aat.html
۵." The Future of Image Indexing".۲۰۰۲[on-line].available:
http://www.slais.ubc.ca/people/students/student-projects/C_Wanczycki/libr۵۱۷/future.html
۶. "Useful Comparisons: Benefits and Limitations of AAT and TGM".۲۰۰۲[on-line].available:
http://www.slais.ubc.ca/people/students/student-projects/C_Wanczycki/libr۵۱۷/comparison.html
۷.لنکستر, اف دبلیو(۱۳۸۲).نمایه سازی و چکیده نویسی.ترجمه عباس گیلوری.تهران,چاپار.
منبع : نما مجله الکترونیکی پژوهشگاه اطلاعات و مدارک علمی ایران


همچنین مشاهده کنید