دوشنبه, ۶ اسفند, ۱۴۰۳ / 24 February, 2025
مجله ویستا

فولکسونومی رویکردی نوین به سازماندهی اطلاعات در محیط وب


فولکسونومی رویکردی نوین به سازماندهی اطلاعات در محیط وب

افزایش انتشار اطلاعات در شبکه وب و رشد دسترس پذیری منابع عرضه شده در آن برای کاربران عمومی و خاص, سازماندهی منابع اطلاعاتی موجود در شبکه جهانی را ضروری ساخته است

افزایش انتشار اطلاعات در شبکه وب و رشد دسترس پذیری منابع عرضه شده در آن برای کاربران عمومی و خاص، سازماندهی منابع اطلاعاتی موجود در شبکه جهانی را ضروری ساخته است. تلاشهای انجام شده در سالهای اخیر مانند استفاده از واژگان کنترل شده و اصطلاحنامه ها در ایجاد راهنماهای وبی، گسترش رده بندی های دیوئی و کنگره در جهت رده بندی منابع اینترنتی و به کارگیری ابر داده ها برای سهولت دسته بندی اطلاعات از جمله تلاشهای انجام گرفته در این خصوص است تا با بکار گیری آنها، علاوه بر سهولت در بازیابی اطلاعات تحت وب، میزان دسترسی پذیری به منابع اطلاعاتی ارزشمند برای کاربران عمومی و خاص نیز افزایش یابد. مقاله حاضر به معرفی نوعی رده بندی جدید با عنوان "فولکسونومی" می پردازد و نقش آن را در بهبود بازیابی اطلاعات توسط عامه کاربران، توسعه خدمات "آگاهی رسانی جاری" ، اشاعه و اشتراک اطلاعات تحت وب و نیز تاثیر استفاده از این روش نوین در رده بندی همه انواع فرمتهای اطلاعاتی از قبیل متن، فایلهای صوتی و تصویری، صفحات وب، کتابهای الکترونیکی و غیره... را بررسی می کند و نیز مواردی از پروژه های انجام شده در این زمینه را بر می شمارد.

● مقدمه

به همان میزان كه روزانه حجم عظیمی از اطلاعات در وب منتشر می گردد، دسترسی كاربران به اطلاعات موردنیازشان نیز پیچیده و دشوار شده است؛ بخصوص اگر جستجو و بازیابی در بین میلیاردها ركورد اطلاعات كه به اشكال مختلف از قبیل صفحات HTML، اسناد و متون الكترونیكی، فایلهای صوتی و تصویری و داده های گرافیكی، كه بدون هیچ گونه نظم و ترتیب استاندارد و مشخصی در سرتاسر شبكه جهان گستر وب پراكنده شده اند، برای آنها مشكل باشد. با افزایش نیازهای اطلاعاتی كاربران؛ و نیز رشد روزافزون حجم اطلاعات در وب، ضرورت سازماندهی و نظم و ترتیب بخشیدن به منابع اطلاعاتی موجود در وب، از سوی كتابداران و متخصصان اطلاع رسانی مطرح شده است (باتیلی، ۱۳۷۸؛ حاجی زین العابدینی،۱۳۸۱).

وب اكنون به عنوان یك منبع اطلاعاتی روزآمد و همیشه در دسترس در نظر گرفته می شود و به كتابخانه ای مبدل شده كه دانش های بشری را به شكلی الكترونیكی در خود گردآوری كرده است اما مهم ترین و اصلی ترین تفاوت این به اصطلاح كتابخانه دیجیتالی بزرگ با كتابخانه های معمولی، در روند سازماندهی و رده بندی اطلاعات و اسناد موجود در آنها است زیرا استانداردها و قوانین مدونی با هدف گردآوری، سازماندهی، بازیابی و اشاعه اطلاعات و دانش در کتابخانه ها تدوین گردیده که از جمله آنها می توان به قوانین فهرست نویسی انگلو- امریکن یا رده بندی های دهدهی دیوئی و کنگره اشاره کرد(فتاحی، ۱۳۷۷)؛ در حالی که یک چنین قوانین مشابهی برای اطلاعات و اسناد موجود در وب تدوین نشده اند.

▪ طی سالیان اخیر، تلاش های متعددی از سوی برخی سازمانها،كتابخانه ها و افراد، برای سازماندهی منابع اینترنتی صورت گرفته است كه از جمله آنها می توان به موارد زیر اشاره كرد:

۱) استفاده از طرح های رده بندی كنگره و دیوئی برای سازماندهی منابع اینترنتی:

استفاده از شیوه های سنتی رده بندی برای سازماندهی و رده بندی محتوای آنلاین سابقه ای نسبتا طولانی دارد ( Macgregor،۲۰۰۶). بطور مثال سرویس خدمات اطلاع رسانی BUBL راهنمای خود را مطابق با رده بندی دیوئی دسته بندی كرده است. برای نمونه، در این راهنما، وب سایت ها و صفحاتی كه محتوای آنها در موضوعات آموزش، حقوق، سیاست، اقتصاد یا جامعه شناسی هستند در رده ۳۰۰ كه به علوم اجتماعی اختصاص دارد دسته بندی شده اند. مثال دیگر، پروژه CYBERSTACKS می باشد كه اطلاعات و منابع اینترنتی را با استفاده از نظام رده بندی كنگره سازماندهی كرده است. نیز در این مورد می توان از راهنمای CyberDewey نام برد كه با بهره گیری از سیستم دیوئی منابع اینترنتی را دسته بندی كرده است. عمده ترین دلیل استفاده از طرح های رده بندی دیوئی یا كنگره، كاربرد قابلیت های این طرح ها هم در جهت سازماندهی منابع و هم بازیابی موضوعی آنها بوده اما با وجود قدمت طولانی استفاده از این طرحها در جهت ساماندهی محتوای آنلاین، به نظر می رسد موفقیت چندانی حاصل نشده است.

۲) بهره گیری از واژگان كنترل شده بخصوص اصطلاحنامه ها و تزاروس ها، با هدف ایجاد راهنماهای وبی (دایركتوریها ):

بسیاری از كتابخانه های دیجیتالی آنلاین، منابع خود را با استفاده از سرعنوانهای موضوعی كنگره نمایه سازی كرده اند و برخی نیز با بهره جستن از اصطلاحنامه های تخصصی و موضوعی محتوای خود را سامان داده اند مانند پایگاه اینترنتی Artifact كه از اصطلاحنامه موضوعی هنر ومعماری استفاده كرده است. از موارد دیگر می توان به راهنمای وبی Dmoz ، نمایه كتابداران برای اینترنت ، كتابخانه عمومی اینترنت و دایركتوریهای Yahoo و Google اشاره كرد. در این راهنماها نوعی روند سلسلسه مراتبی "كل به جزء" برای رده بندی منابع اینترنتی در نظر گرفته شده است. مثلا:

Science > Math > Application > Communication Theory > Cryptography

دسته بندی اطلاعات در این راهنماها مطابق با قواعدی است که در هرکدام از آنها اعمال می شود و صفحات وب و پایگاههای اینترنتی را در موضوعات از پیش تعیین شده رده بندی می کنند.

● "واژگان كنترل شده" و نقش آنها در سازماندهی منابع اینترنتی

ساختار سلسلسه مراتبی و معناشناختی "واژگان كنترل شده" از جمله مهمترین ویژگیهای این ابزارها برای بازیابی و جستجوی اطلاعات در محیطهای چاپی و الكترونیكی است؛ زیرا:

۱) در واژگان كنترل شده، لغات مترادف و نزدیك به هم با گزینش یك لغت خاص، یكدست شوند(Macgregor،۲۰۰۶). این امر با استفاده از ارجاعات مختلف از لغات انتخاب شده به لغات انتخاب نشده، صورت می گیرد و از تشویش و پراكندگی در ساختار واژگان جلوگیری كرده و كاربر را به سوی بهترین انتخاب و گزینه راهنمایی می كند. ضمن اینكه منابع مرتبط را نیز به یكدیگر پیوند می دهد؛ مانند:

اتومبیل

ماشین

نگاه كنید به : خودرو

۲) در واژگان كنترل شده، لغات متشابه و هم آوا از یكدیگر مجزا می شوند (مانند "Java" كه نام یك زبان برنامه نویسی است و "Java" كه نام جزیره ای متعلق به اندونزی می باشد). این امر از سردرگمی كاربر در نتایج جستجو جلوگیری می كند و امكان عمل بیشتری به نمایه ساز می دهد.

۳) لغاتی كه ممكن است از نظر قواعد املایی، مشكلاتی برای كاربران و ویراستاران ایجاد كنند، در "واژگان كنترل شده"، مشخص می گردند و اگر كاربرد آنها در واژگان ضرورتی نداشته باشد، حذف می گردند.

۴) نكته مهم تر در "واژگان كنترل شده"، حاكم شدن نوعی روند سلسله مراتبی معناشناختی در بین واژه ها است كه كاربر را در بازیابی منابع و اطلاعات مرتبط یاری می دهد. دسته بندی واژگان در این سلسلسه مراتب بر اساس لغات هم موضوع و مرتبط و از اعم به اخص یا برعكس صورت می گیرد. (مانند "لنینیسم" كه از گونه "كمونیسم" است و آن نیز از جمله "نظریه های سیاسی" بشمار می رود).

۵) در ساختار "واژگان كنترل شده"، استفاده از علائم و نشانه ها، امری مهم است و كاربر با استفاده از نشانه ها و علائم تعریف شده در هر واژگانی، ارتباطات بین لغات را تشخیص داده و كاربردهای آنها را در می یابد.

نمونه های بسیار مهم و مطرح در زمینه "واژگان كنترل شده" عبارتند از: طرحهای رده بندی كتابشناختی (مانند كنگره و دیوئی)، فهرست سرعنوانهای موضوعی (مانند سرعنوانهای موضوعی كنگره و سرعنوانهای پزشكی MESH )، و انواع اصطلاحنامه ها (مانند كلیه اصطلاحنامه های تخصصی و عمومی).

عمده راهنماهای وبی مهم موجود در وب، از "واژگان كنترل شده" برای ساماندهی محتوای خود بهره می گیرند و این موضوع، در كنار مزایایی كه دارد، مشكلاتی نیز برای بازیابی اطلاعات در وب برای كاربران فراهم می كند؛ بطور مثال، برای یك كاربر تشخیص اینكه وب سایت مورد جستجوی وی در كدام دسته قرار دارد مشكل است و برای یك ویراستار نیز تشخیص اینكه یك وب سایت، بایستی در كدام یك از گروهها و دسته ها قرار بگیرد مشكل به نظر می رسد. فقدان برخی زمینه های موضوعی خاص و دقیق برای توصیف اطلاعات تخصصی و جدید، حجم روزافزون منابع مختلف اطلاعاتی در محیط وب در مقایسه با نیروی انسانی معدود و متخصص در جهت سازماندهی محتوای آنلاین و نیز هزینه های مالی و زمانی فراوان درجهت آموزش افراد مورد نیاز برای سازماندهی منابع اینترنتی از جمله مشكلات استفاده از "واژگان كنترل شده" برای ساماندهی محتوای اطلاعات موجود در وب به شمار می رود.

▪ بطور كلی "راهنماهای وبی " از اشكالات عمده ای برخودار هستند كه از جمله آنها می توان به موارد زیر اشاره كرد:

- انتشار روزانه میلیون ها فرمت اطلاعاتی در وب، عملا امكان روزامد نگاه داشتن اطلاعات دسته بندی شده در راهنماها را از معدودی ویراستار سلب می نماید. بر اساس آمارهای موجود در راهنمای وبی Dmoz ، بالغ بر ۵۲۸۱۹۶۰ وب سایت در ۵۹۰۰۰۰ موضوع دسته بندی شده اند. واضح است كه این میزان وب سایت، درصد ناچیزی از كل میلیاردها صفحه وب را شامل می شود.

- عمده راهنماهای موجود در وب، راهنمای وب سایت ها و پایگاههای اینترنتی محسوب می شوند و صرفا كاربران را به وب سایت ها هدایت می كند. اطلاعات صفحات شخصی ایجاد شده توسط كاربران، مطالب و اطلاعات منتشر شده در وبلاگها، مقالات و نوشته های علمی و پژوهشی درج شده در وب سایت های گوناگون، اخبار و رویدادهای متنوع منتشر شده در سایت های خبرگزاریها و روزنامه ها و همچنین اغلب صفحات داخلی پایگاههای اینترنتی در راهنماهای وبی گنجانیده نمی شوند.

- علاوه بر متن، فرمتهای مختلف اطلاعاتی از قبیل صوت و تصویر، عكس و ویدئو، جدول و نقشه و نمودار، نرم افزارها و برنامه های كاربردی، فایلهای اطلاعاتی PDF و word ، اسلایدها و فایلهای مختلف دیگر نیز در وب پراكنده و منتشر شده اند كه راهنماهای وبی فاقد اطلاعات آنها هستند.

۳) به کارگیری ابرداده ها در سازماندهی منابع اینترنتی

استفاده از ابرداده ها نیز روش دیگری برای نظم بخشیدن به منابع اطلاعاتی موجود در اینترنت به شمار می رود.ابرداده ها بخصوص از نظر قابلیت هایی که در زمینه تسهیل فرایند جستجو، مکان یابی، انتخاب، ارزیابی و مستند سازی منابع اطلاعاتی، تحلیل محتوا و نمایه سازی منابع وب و مدیریت اطلاعات ایفا می کنند، حائز اهمیت هستند(مختاری نبی،۱۳۸۲). استفاده از ابرداده ها، بیشتر در پایگاههای اطلاعاتی تحت وب، کتابخانه های دیجیتالی و برخی موتورهای جستجوی تخصصی نمود بیشتری داشته است. از نمونه های انجام گرفته در این زمینه برای نظم دهی به محتوای آنلاین، می توان به پروژه دابلین کر اشاره کرد. در این مورد، پدیدآورنده، با استفاده از ۱۵ عنصر از قبیل عنوان، نام پدیدآورنده، موضوع، ناشر، تاریخ، نوع، منبع، زبان و فیلدهای دیگری که بر حسب اختیار می تواند از آنها بهره بگیرد، اطلاعات را سازماندهی می کند. استفاده از ابرداده ها، با وجود قابلیت هایی از قبیل دقت در مدیریت اطلاعات تحت شبکه، تسهیل امر بازیابی اطلاعات و توصیف فایلهای غیرمتنی، مشکلاتی را نیز به همراه داشته است(محمدی،۱۳۸۳)؛ از قبیل نیاز به دانش تخصصی و موضوعی در امر نمایه سازی و فهرست نویسی اسناد و اطلاعات، هزینه های مالی و زمانی در به روند خلق و به کارگیری آنها، لزوم استفاده از متخصصان موضوعی و نمایه سازان آموزش دیده و پیچیده بودن آنها برای کاربر عادی. علاوه بر این، رشد سرسام آور منابع وب، امکان بهره گیری از عناصر ابرداده ای برای سازماندهی همه اطلاعات منتشر شده را غیرممکن می سازد.

سید مهدی حسینی

منابع و ماخد:

- باتیلی، سیو(۱۳۷۸)."فهرستنویسی و رده بندی منابع الکترونیکی: چیره دستی های کهنه در محیطی نو"، ترجمه علی اکبر پورسرباز، کتابداری و اطلاع رسانی، جلد ۲، شماره ۴.

- حاجی زین العابدینی, محسن(۱۳۸۱)."فهر ستنویسی و رده بندی منابع اینترنتی: استفاده از چیره دست هایی گذشته"، پایان نامه کارشناسی ارشد کتابداری و اطلاع رسانی پزشکی، دانشکده مدیریت و اطلاع رسانی پزشکی، دانشگاه علوم پزشکی ایران

- مختاری نبی، ابراهیم(۱۳۸۲). "سازماندهی منابع اینترنتی: چالش ها و ضرورت ها"،نما(مجله الکترونیکی پژوهشگاه اطلاعات و مدارک علمی ایران)، شماره چهارم، دوره اول؛آنلاین:

http://www۴.irandoc.ac.ir/data/E_J/vol۱/organaizing.htm

- محمدی، حسین (۱۳۸۳)."ابرداده: مفاهیم و کاربردها"،نما (مجله الکترونیکی پژوهشگاه اطلاعات و مدارک علمی ایران)، شماره سوم، دوره دوم؛ آنلاین: http://irandoc.ac.ir/data/E_J/vol۲/metadata.htm

- فتاحی، رحمت الله (۱۳۷۷). فهرست نویسی: اصول و روشها. – مشهد: دانشگاه فردوسی.

- Bryant, Todd (۲۰۰۶). “Social Software in Academia”.EDUCAUSE Quarterly (۲)۲۰۰۶

Retrieved March ۱۰, ۲۰۰۷, from http://www.educause.edu/ir/library/pdf/eqm۰۶۲۷.pdf

- Crossett, James (۲۰۰۶). “Social data classification”. April ۲۰۰۶.

- Macgregor, George, and McCulloch, Emma (۲۰۰۶). “Collaborative tagging as a knowledge organization and resource discovery tool”. Library Review, ۵۵(۵): ۲۹۱-۳۰۰.

- Mathes, Adam (۲۰۰۴). “Folksonomies: Cooperative Classification and Communication Through Shared Metadata”, Retrieved January ۲۵, ۲۰۰۷, from http://www.adammathes.com/academic/computer-mediated-communication/folksonomies.html

- McFedries, Paul (۲۰۰۶). “Technically Speaking: Folk wisdom”. IEEE Spectrum, February ۲۰۰۶. Retrieved January ۲۵, ۲۰۰۷, from http://www.spectrum.ieee.org/feb۰۶/۲۷۵۶

- Scott A, Golder, and Bernardo A, Huberman (۲۰۰۶). “The structure of collaborative tagging systems”. Journal of Information Science, ۳۲(۲): ۱۹۸-۲۰۸

- Vander Wal, Thomas (۲۰۰۵). “Off the Top: Folksonomy Entries”. Retrieved January ۲۵, ۲۰۰۷, from: http://vanderwal.net/random/category.php?cat=۱۵۳

- Wikipedia (۲۰۰۶). “Folksonomy”. Retrieved January ۲۵, ۲۰۰۷, from http://en.wikipedia.org/wiki/Folksonomy

- Zhang, Lei, and Wu, Xian (۲۰۰۶). “Emergent semantics from Folksonomies: A quantitative study”. Journal on data semantics vi lecture notes in computer science ۴۰۹۰: ۱۶۸-۱۸۶ ۲۰۰۶

- Hotho, Andreas, and Jaeschke, Robert (۲۰۰۶). “Information retrieval in Folksonomies: Search and ranking”. Semantic Web: Research and Applications, Proceeding Lecture Notes in Computer ۴۰۱۱: ۴۱۱-۴۲۶ ۲۰۰۶


شما در حال مطالعه صفحه 1 از یک مقاله 3 صفحه ای هستید. لطفا صفحات دیگر این مقاله را نیز مطالعه فرمایید.