جمعه, ۷ اردیبهشت, ۱۴۰۳ / 26 April, 2024
مجله ویستا


درک ابرداده و استانداردهای آن


درک ابرداده و استانداردهای آن
● چكیده
ظهور محیط‌های الکترونیکی جدید و منابع الکترونیکی مختلف، ضرورت الگوها، روشها و استانداردها و ابزارهای جدید برای ذخیره، سازماندهی و بازیابی دقیق آنها را اثبات کرده است. ابرداه به عنوان روشی نظامند برای شناسایی، توصیف و مکان یابی منابع الکترونیکی بر روی شبکه، درواقع برای پاسخ به چنین نیازی ابداع شده است. آشنایی کتابداران و اطلاع رسانان با ابزارهای جدید سازماندهی منابع اطلاعاتی الکترونیکی یك ضرورت است. قالبهای ابرداده ای دابلین کور، متس و مودس که در این مقاله معرفی شدند، پرکاربردترین قالبهای ابرداده ای در ایجاد کتابخانه های دیجیتالی است.
● مقدمه
"ابرداده فهرست تهیه شده توسط افراد است"[۲].
دنیای فناوری اطلاعات غرق گفتگو درباره ابرداده است. امروزه به نظر می رسد هرکسی در حال ایجاد یک قالب ابرداده ای است. یک ابرنشانه[۳] در زبان نشانه گذاری فرامتن[۴] برای حمل ابرداده در منابع اینترنتی وجود دارد؛ به طوریکه متخصصان ابرداده را برای توصیف ژنوم ها توسعه داده اند؛ و ناشران دارای یک قالب ابرداده ای برای تسهیل انتقال داده های تبلیغاتی و قیمت به خرده فروشان هستند. چه چیزی در دنیای فناوری در حال رخ دادن است که موجب شده هر فردی تصور کند برای مدیریت و کنترل اطلاعات در اینترنت ابرداده پاسخ است؟ اگر ابرداده پاسخ است، در این صورت پرسش چیست و در کتابخانه ها و فهرستهای کتابخانه چه معنایی دارد (۱)؟
● تعریف ابرداده[۵]
واقعیت این است که گسترش شتابناک پدیده اینترنت در دهه اخیر و بخصوص ابداع وب باعث نگرانی بسیاری از دست اندرکاران و متخصصان در اطلاع رسانی گردیده است. این نگرانی از این بابت است که اطلاعات تولید و منتشر شده از طریق اینترنت و وب با سرعت شگفت انگیزی درحال افزایش است و مدیریت و کنترل این منابع کاری بسیار دشوار است. این نگرانی ها سبب شده با ابداع راهکارها و روشهای علمی تاحدودی بر اداره و ساماندهی منابع روی وب تسلط یابند. ارائه راهکاری تحت عنوان "ابرداده" باعث شد انتهای روشنی برای مدیریت و کنترل اطلاعات در اینترنت گشوده شود(۶).
درابتدا بایستی حدود و دامنه این واژه را مشخص نماییم، به چه چیزی ابرداده اطلاق می شود. بررسی تاریخی مفهوم ابرداده نشان می دهد که این اصطلاح از مدتها قبل مورد استفاده قرار گرفته است. اما قبل از فراگیر شدن آن به طورگسترده در دهه ۱۹۹۰ دارای چنین هدف گسترده ای نبود. این اصطلاح اولین بار در سال ۱۹۶۹ به عنوان یک شرکت آمریکایی به کار رفته است . بنابراین ابرداده مفهومی نو با مضمون کهن است (۶) چرا که کتابداران قبل از ظهور رایانه یا اینترنت با سازماندهی اطلاعات در کتابخانه به ایجاد ابرداده (برای مثال ایجاد پیشینه های کتابشناختی، نمایه سازی مقالات و پایان نامه ها و ایجاد پایگاه اطلاعاتی از آنها،...) پرداخته اند.
تعریف رایج از ابرداده، " داده درباره داده" است. اگرچه این تعریف گمراه کننده است و به شناخت ما درباره اینکه ابرداده چیست کمکی نمی کند، اما برای ما روشی برای شناخت ابرداده فراهم نماید.
در وهله اول، ابرداده اطلاعات ساخت یافته است، به این معنی که آن ابداع بشری است و در طبیعت یافت نمی شود. یک نمونه خوب از اطلاعات ساخت یافته استفاده از طول و عرض جغرافیایی برای توصیف زمین و نقاط روی آن است. پرواضح است که سیاره واقعی دارای خطوط در اطراف آن نیست، اگرچه ما به دیدن نقشه ها و کره ها با آن نقاط عادت کرده ایم، اما اختراع طول و عرض جغرافیایی به ما این امکان را می دهد تا درباره مکانهای روی سیاره و ردیابی دقیق آن در فضاهای وسیع بدون علامت و راهنما گفتگو نماییم.
این مسئله ما را به دومین ویژگی مهم ابرداده هدایت می کند: ابرداده بوسیله افراد بنا به هدف یا نقشی خاص تهیه می شود. بنابراین نقشه ای از سیستم مترو میان رانندگان توزیع می شود؛ از طریق رمزگذاری رنگی، مسیرها و نشانه ها برای راهنمایی رانندگان در میان شبکه پرپیچ و خم مسیرها و نقاط نقل و انتقال، مشخص می شود. اغلب این نقشه ها تنها و به زحمت نشانگر مقیاس واقعی و جغرافیایی شهر است که بوسیله مترو بکار گرفته می شود. اما کاملا مفید است، به این دلیل که آن منظره مترو مرکزی را بر گستره و دقت جغرافیایی مورد توجه و تأکید قرار می دهند. نقشه راه همان منطقه به وضعیت واقعی نزدیکتر خواهد بود، اما اگر آن نقشه بوسیله کمیته توریستی طراحی شود، در آن هتلها، موزه ها، نقاط گردشگری و فضاهای پارک مشخص خواهد شد. درست همانطوریکه هیچ نقشه جداگانه ای برای برآوردن تمام نیازها وجود ندارد، یک نوع ابرداده برای مدارک یا سایر اشیاء اطلاعاتی هم وجود ندارد. این به این دلیل است که خود شیء تعیین کننده نوع ابرداده نیست، بلکه نیازها و اهداف افرادی که آن را ایجاد می کنند و افرادیکه از آن استفاده می نمایند، نوع ابرداده را تعیین می کند. همچنین از ابرداده به عنوان جایگزینی[۶] برای شیء واقعی استفاده می شود. در فهرست کتابخانه مدخلها جایگزینی هایی برای کتابها در قفسه ها هستند، ولی آن بررسی هر کتاب را جهت انتخاب یکی از آنها برای استفاده کنندگان کتابخانه دشوار خواهد ساخت. حداقل کتاب فیزیکی وجود دارد. در محیط دیجیتالی، بدلیل آنکه بیشتر منابع به آسانی قابل تورق و بررسی نیستند و سایر منابع داده های روشنی درباره خودشان ارائه نمی دهند، نقش جایگزین ابرداده ای حائزاهمیت است.
افزایش علاقه به ابرداده بخشی از تلاش برای سامان دادن دنیای نسبتا نامنظم منابع دیجیتالی و فراهم کردن دسترسی و خدماتی که قبل از آن در هیچ کجا وجود نداشته است، می باشد. همچنین آن روشی برای مبادله داده ها میان مخازن پراکنده منابع و امکان جستجو در انبار دیجیتالی است (۱).
درمجموع، می توان ابرداه را روشی نظامند دانست که منابع الکترونیکی روی شبکه را شناسایی، توصیف و مکان یابی می کند. اطلاعات ابرداده ای در مورد منبع الکترونیکی شامل اطلاعات مربوط به عنوان سایت یا منبع، موضوع، پدیدآورنده سایت، ناشر، تاریخ نشر یا ایجاد سایت، جزئیات مالکیت معنوی اثر، زبان، پوشش، توصیف و کلیدواژه های قابل جستجو برای هر منبع و کد و نشانه هایی برای رده بندی محتوای مدارک می باشد.
● قالب توصیف منبع[۷] و زبان نشانه گذاری گسترش پذیر[۸]
دوآغازه ای که شما همزمان با هم با بیان ابرداده خواهید شنید زبان نشانه گذاری گسترش پذیر یا XML و قالب توصیف منبع یا RDF است. زمانیکه برخی افراد درباره XML و RDF صحبت می کنند گویی که این دوآغازه خودشان قالب ابرداده ای هستند، اما این آشوبی میان قالب و محتوا است. درعمل XML و RDF قالبهای داده ای عمومی هستند که می توانند در موارد گوناگون استفاده شوند. خصوصا، ازXML اغلب به عنوان قالب مدرک استفاده می شود و قالب کلی تری است که از آن HTML حاصل می شود.
اگر شما با ساختار رکورد XML آشنا نیستید، در این صورت ممکن است آن برای شما نسبتا پیچیده و اسرارآمیز به نظر آید. در واقع، اگرچه ممکن است ایجاد رکوردهای داده ای با آن پیچیده باشد، اما قالب پایه ای آن بسیار ساده است.
هرگاه شما فیلدهای رکورد مارک را با تگ هایی مانند استفاده از "۲۴۵" به معنی "عنوان" در نظر بگیرید:
۲۴۵ $a Hamlet, Prince of Denmark
در این صورت XML تنها روش دیگری برای تگ زدن یک قطعه داده است، اگرچه آن شامل گذاشتن یک تگ شروع و یک تگ پایانی (با یک "/" قبل از نام تگ) در اطراف هر عنصر داده ای است:
<title>Hamlet, Prince of Denmark</title>
تگ ها می تواند هر چیزی که شما تمایل دارید باشد، به شرط اینکه شما آنها را در یک قالب داده ای تعریف ساختار، از قبل تعیین کرده باشید. بنابراین اگر شما ترجیح می دهید، تعریفتان می تواند دارای هر کدام از تگ های زیر برای "عنوان" باشد.
<۲۴۵>Hamlet, Prince of Denmark</۲۴۵>
<ti>Hamlet, Prince of Denmark</ti>
در اصلXML ، مشابه تگ ها و فیلدهای فرعی مارک، سلسله مراتبی است. مزایای آن بیش از مارک۲۱ است که می تواند به اندازه ای که سطوح سلسله مراتبی لازم است را دارا باشد. برخلاف مارک۲۱ که می تواند دارای دو سطح تگ و فیلد فرعی باشد.
RDF یک مرحله یا دو مرحله بعد از XML است. آن بر روابط میان عناصر داده ای تأکید دارد. همانطور که از نام RDF برمی آید ایجاد یک مکانیزمی برای توصیف منابع و اسناد برروی اینترنت است و رابطه کلیدی آن توصیف[۹] می باشد. RDF عنصر ضروری و مهمی از وب معنایی است که توسط ائتلاف شبکه جهانگستر وب[۱۰] برای افزودن عنصر معنایی و در چارچوب توصیف منابع برای اشتراک داده ها روی اینترنت ایجاد شده است.
RDF پیچیده تر و نسبت به XML کمتر استفاده شده است و هنوز مشخص نیست، آیا آن به عنوان یک زبان عمومی در توصیف جهانی وب موفق است. به طور قطع به نظر می رسد RDF به شناخت عمیق تری در مفاهیم خاص فلسفی نسبت به XML نیاز دارد و تعداد افرادی که آن را معمایی تلقی می کنند، بسیار بیشتر از آنانی که آن را به عنوان یک راه حل می بینند، می باشد. (نمونه پایین مربوط به یک رکورد Creative Commons است که از یک قالب ساده RDF استفاده می کند) (۱).
● ابرداده برای اشیاء شبه مدرک[۱۱]
می توان با این پرسش اساسی آغاز نمود که ابرداده با فهرست کتابخانه چه تفاوتی دارد؟ خاطر نشان کردن اینکه قالبهای ابرداده ای معرفی شده در این مقاله (دابلین کور، مودس و متس) مهمترین قالبهایی هستند که امروزه استفاده می شوند، اما بیش از همه این سه قالب عموما در کتابخانه های دیجیتالی بکار میروند.
بدون تردید فهرست نویسی در کتابخانه شرط لازم ایجاد مدرک ابرداده ای است. منشاء آن را می توان در اواسط دهه ۱۸۰۰ در قوانین جوت و پانیزی[۱۲] یافت. تقریبا هر شخص آموزش دیده ای با انگلوآمریکن جهانی آشنا است. در شمار زیادی، مصداقهای فهرستنویسی کتابخانه شدیدا هر طرح ابرداده ای که درحال استفاده شدن برای کتابها است را تحت کنترل درآورده است (اگرچه احتمالا نه در مقالات مجلات). با این وجود، به مجرداینکه توسعه دهندگان کاربردهای اینترنت نیاز به ابرداده برای مدارک پیوسته داشتند، از استانداردهای کتابداری استفاده نکردند. درواقع، استاندارد ابرداده ای مدرک که بر کاربردهای غیرکتابداری پایه گذاری شده، قالب ابرداده ای دابلین کور است (۱).
● دابلین کور[۱۳]
دابلین در کلمه دابلین کور اشاره به مرکز OCLC در دابلین اوهایو دارد و بدلیل آنکه OCLC سازمان حمایتی دابلین کور بوده است، شما ممکن است تصور کنید که دابلین کور از سنت کتابداری تشکیل شده است. درواقع، تلاش زیادی برای جدا کردن دابلین کور از سنت کتابداری صورت گرفت و اینکه در بیشتر موارد این تلاشها موفق بوده است. هدف دابلین کور فراهم کردن مجموعه ای ساده از عناصر داده ای برای توصیف مدارک و سایر اشیاء روی اینترنت بود. آن بسیار ساده است بطوریکه هر کسی می تواند یک پیشینه برای مدارک خود ایجاد نماید. دابلین کور ۱۵ عنصر هسته دارد، که می تواند با استفاده از تعدادی توصیفگر ارائه شود. عناصر هسته بسیار کلی هستند بنابراین بجای "نویسنده"[۱۴] هسته "پدیدآور"[۱۵] دارد. اما پدیدآور می تواند برای نویسنده یا مصنف و غیره تعیین شود. به آسانی شما می توانید یک رکورد دابلین کور را برای هر چیزی ایجاد نمایید، مانند:
creator = Karen Coyle
title = Understanding Metadata and its Purpose
date = December, ۲۰۰۴
description = The first draft of an article for Journal of Academic Librarianship
subject = metadata
type = text
امید دابلین کور این بود که مدارک روی اینترنت توصیفهای کتابشناختی خود را حمل خواهند نمود و از این رو عناصرداده ای به اطلاعاتی مانند نویسنده، عنوان و تاریخ رمزگذاری شده اند. به تعبیری این "[۱۶]دیدگاه شبه کتابدار" را معرفی می کند، که احتمالا باید یک مدرک را بوسیله نویسنده یا عنوانش یافت. امروزه بر روی اینترنت دابلین کور، به شدت استفاده می شود، اگرچه آن در ایجاد فهرستی از منابع اینترنتی نتیجه نداده است. در عوض، دابلین کور ابرداده توصیف مدرک برای انواعی از کاربردهای مبتنی بر وب شده است. یک نمونه از قالب دابلین کور مجوز کرییتیو کامانز[۱۷] است (۱).
کرییتیو کامانز بنیادی غیرانتفاعی است که در راستای گسترش دسترسی‌پذیری آثار بدیع برای دیگران به منظور استفاده اشتراکی و سازنده فعالیت می‌کند. آن توسط لاری لزیگ[۱۸] استاد شناخته شده حقوق دانشگاه استانفورد در انتقادش نسبت به فایده قانون کپی رایت در استفاده و استفاده مجدد از عقاید پشینیان توسعه یافت. این مجوز به پدیدآورندگان امکان می دهد تا برای استفاده از آثارشان، مجموعه ای کوچک از مجوزها را توسعه دهند تا بتواند به آسانی به فایلهای روی اینترنت متصل شود (۲). این مجوزها بیان می کند که استفاده و استفاده های مجدد توسط پدیدآورنده اثر تضمین می شود. علاوه بر مجوز، نرم افزار کرییتیو کامانز به پدیدآور امکان افزودن ابرداده توصیفی مانند پدیدآور، عنوان، تاریخ، توصیف کوتاهی از فقره اطلاعاتی را می دهد. این مجوزها از عناصر دابلین کور پدیدآور، عنوان، تاریخ، توصیف استفاده می کنند .استفاده از مجوز کریپتو کامانز نیازی به شناخت قانون کپی رایت یا قراردادها ندارد و عناصر توصیفی عناصری هستند که تقریبا هر کسی به آسانی می تواند آنها را درک کند. در مواردی دابلین کور به هدف اش با فراهم کردن هسته عناصر توصیفی نائل شده است که می تواند در انواع گسترده ای از کاربردهای وب گنجانده شود. یکی از مواردی که دابلین کور را برای هر کسی آسان و قابل استفاده ساخته است، درگیرنشدن در قوانین فهرستنویسی است. این چیزی است که خلاف طبیعت فهرستنویسی در کتابداری است و به طور قطع قابلیت استفاده دوباره از محتوای رکوردهای دابلین کور را کاهش می دهد. توصیفهایی از هر عنصر داده ای در استاندارد دابلین کور وجود دارد، بنابراین مفهوم عنصر داده ای به طور کلی تعیین می شود (۱).
● مودس: استاندارد توصیف ابرداده ای شیء گرا[۱۹]
قالب مارک یک رکورد بی اندازه پیچیده برای رمزگذاری اطلاعات کتابشناختی است. این قالب در عالم کتابداری مشهور است و بوسیله نظامهای کتابداری در ایالات متحده، کانادا، و سایر کشورها خصوصا در کشورهای انگلیسی زبان حمایت می شود. در محیط شبکه ای در شرایطی که ابرداده توصیفی می تواند بر روی نظامها ارسال شود و می تواند درون یا همراه با انواع دیگر ابرداده باشد، استفاده از رکوردهای مارک با این هدف، ایده آل به نظر خواهد رسید. با این وجود، گنجاندن رکوردهای مارک درون ابرداده، استفاده از ساختار داده ای XML را ضروری ساخته است، درحالیکه مارک یک رکورد XML نیست. کتابخانه کنگره روشی را برای تبدیل رکورد مارک به XML ایجاد کرده است، اما آن با اقبال زیادی روبرو نشد و احتمالا به این دلیل که رکورد مارک بزرگتر و جزئی تر از اکثر نظامهای مورد نیاز است، و استفاده اش از تگ های عددی و کدهای فیلد فرعی موجب شده درک آن را بدون آموزش قابل توجهی مشکل سازد. چیزی که مورد نیاز بود نسخه ای خوشایندتر و باکیفیت تر از مارک بود تا بتواند عناصرکلیدی داده ای از رکورد مارک را قبول نماید و آنها را به یک قالب آسان و قابل درک XML ارسال نماید. بنابراین استاندارد توصیف ابرداده ای شی گرا (مودس) متولد شد.
مودس از تگ های قابل درک بشری بجای تگ های سه رقمی و کدهای فیلدفرعی مارک (یعنی "عنوان" بجای "۲۴۵") استفاده می کند. آن بیشتر عناصر داده ای فیلد ثابت، به استثنای کدهای قالب فیزیکی (از۰۰۷) و بیشتر کدهای نوع (از ۰۰۸) را نادیده می گیرد. همچنین آن برخی قابلیت ها و نوآوری ها را معرفی می کند. مودس یک ساختار نام گذاری شده "نام" را تعیین می کند که فیلدها و فیلدهای فرعی برای اسامی شخصی، سازمانی و برای کنفرانسها را ارائه می نماید. این ساختار می تواند در هر جایی که نامها ظاهر خواهند شد، یا به شکل سرشناسه، شناسه های افزوده یا موضوعات استفاده شوند. بنابراین با یک فیلد نام شبیه:
<name type="personal">
<namePart>Shakespeare, William</namePart>
<namePart type="date">۱۵۶۴-۱۶۱۶</namePart>
</name>
می تواند به عنوان یک فیلد نویسنده استفاده شود یا آن می تواند قسمتی از یک سرعنوان موضوعی باشد.
<subject authority=‘‘lcsh’’>
<name type=‘‘personal’’>
<namePart>Shakespeare, William</namePart>
<namePart type=‘‘date’’>۱۵۶۴–۱۶۱۶</namePart>
</name>
<topic>Bibliography</topic>
<topic>Periodicals</topic>
</subject>
اگرچه آن از مارک ۲۱ بدست می آید و بسیار جزئی تر از دابلین کور است، مودس قوانین بسیار کمتری از مارک ۲۱ دارد. مانند دابلین کور، در آن فیلدهای غیرضروری وجود ندارد و تمام فیلدها قابل تکرارهستند. مودس نه تنها ارزشهای بسیار زیادی نسبت به مارک دارد؛ بلکه آن روشی نوین از مارک ۲۱ است: مفاهیم سرشناسه یا شناسه افزوده وجود ندارد، تمام نویسندگان فقط نویسندگان هستند؛ و یک رکورد می تواند عناوین چندگانه بدون یک "عنوان اصلی" تکی داشته باشد. زمانیکه رکوردهای مارک ۲۱ به مودس تبدیل می شوند، شما رکوردی در XML می گیرید که نوعی از "MARC- lite"[۲۰] است (۴). رکوردهای مودس همچنین می تواند از ابرداده های کتابشناختی ایجاد شوند، و اغلب در پایگاههای اطلاعاتی استفاده می شود که ترکیبی از فهرست کتابخانه و سایر داده های کتابشناختی خواهد بود (۱).
● متس[۲۱]: ابرداده به عنوان ساختار
مدیریت کتابخانه های متشکل از شیء های دیجیتالی نیازمند مدیریت ابرداه های آن شیء هاست. ابرداده های ضروری برای مدیریت موفق و استفاده از شیء های دیجیتالی، گسترده تر و متفاوت تر از ابرداده های مورد استفاده در مدیریت مجموعه آثار چاپی و سایر منابع فیزیکی می باشد. در فهرستهای کتابخانه ها ابرداده توصیفی هر کتاب ثبت می شود. اگر کتابخانه در ثبت دقیق ابرداده ساختاری سازمان منتشردهنده کتاب ناموفق باشد، به هم پیوستگی صفحه های کتاب مذکور از بین نخواهد رفت. همچنین اگر کتابخانه در بیان نحوه چاپ کتاب و استفاده از ابزارهای ویژه دقت نکرده باشد، در بازیابی کتاب توسط محققان آثار منفی در پی نخواهد داشت، اما این مسائل درخصوص نسخه دیجیتالی همان کتاب صحیح نیست. بدون ابرداده ساختاری، تصویر صفحه یا فایل متنی به وجود آورنده اثر دیجیتالی کمتر مورد استفاده قرار خواهد گرفت. برای اهداف مدیریت داخلی، کتابخانه باید ابرداده فنی مناسب جهت روزآمدسازی و انتقال متناوب داده و اطمینان از ماندگاری منابع باارزش دسترسی داشته باشد. این قالب استاندارد با فراهم کردن یک قالب کدگذاری برای ابرداده توصیفی، مدیریتی و ساختاری جهت آثار متنی و تصویری به حل این مسئله کمک کند. نتیجه و حاصل از اینکار، مدارک با قالب XML می باشد که از این طریق کدگذاری ابرداده های ضروری جهت مدیریت شیء های دیجیتالی در مخزن و نیز تبادل چنین شیء هایی بین مخزنها (یا بین مخزنها و کاربران آنها) فراهم می شود(۶).
با این اوصاف، مدرک ابرداده ای وجود دارد که هدف "توصیف" به مفهوم فهرستنویسی نیست. یک مثال از قالب ابرداده ای که در حال استفاده توسط کتابخانه ها و آرشیوهای دیجیتالی است، استاندارد رمزگذاری و انتقال ابرداده (متس) می باشد. از متس به عنوان "یک روکش" برای حفظ فایلها با یکدیگر استفاده می شود تا یک شیء دیجیتالی ایجاد شود. برخلاف جلدکتاب، مدارک دیجیتالی اغلب از تعدادی فایلهای جداگانه ارائه شده در صفحات یا واحدهای دیگر ساخته می شود. و بر خلاف کتاب فیزیکی، جلد یا عنوان صفحه قابل رویت نیست، نه می توان از انگشت شست برای یافتن صفحه ای خاص در کتاب استفاده نمود. متس را به عنوان صحافی، جلد و ردیابی یک گروه از فایلهای دیجیتالی تصور کنید (۳).
همچنین آن شامل اطلاعات فنی است که نیاز به کنترل و شناخت این فایلها خواهد داشت، مانند قالبهای فایل، فناوری استفاده شده در پویش اگر فقره اطلاعاتی زندگی اش را برروی کاغذ آغاز کند، و تغییرشکل دیجیتالی و فشردگی که برروی فایلها استفاده شده است. چیزی که متس تعیین نمی کند ابرداده توصیفی است. درعوض امکان ایجاد رکوردهای متس برای درج در هر ابرداده توصیفی وجود دارد. این ویژگی مهم، دنیای ابرداده را توصیف می کند، که ما همچنین آن را در نمونه کریپتوکامانز مشاهده نمودیم: ابرداده می تواند دوباره استفاده شود بجای اینکه دوباره اختراع شود. معمولا رکوردهای متس ابرداده توصیفی در دابلین کور یا در مودس را حمل می کنند (۱).
● ابرداده و فهرست کتابخانه
آیا ابرداده جایگزین فهرستنویسی خواهد شد؟ در بالا بیان شد که یکی از مسائل مهم در رکورد دابلین کور این است که آن از قوانین فهرستنویسی بی بهره است و بنابراین پیش بینی پذیری کمی میان جوامع یا پروژه ها باتوجه به محتوای فیلدها وجود دارد. چیزی که فهرستها و فهرستنویسی کتابخانه فراهم می کند میزان بالایی از یکنواختی و یکدستی در داده های ذخیره شده در پیشینه ها است. این یکنواختی خدمت به استفاده کنندگان است، که می توانند از یک کتابخانه به یک کتابخانه دیگر به راحتی حرکت نمایند. اما ارزش اصلی یکنواختی در پیشینه ها امکان فهرستنویسی اشتراکی و مبادله پیشینه های فهرستنویسی میان کتابخانه ها و نظامهای کتابداری است. همچنین آن به کارگزاران و فروشندگان نظامهای کتابخانه برای تولید یک محصول امکان می دهد تا بتواند در هر کتابخانه استفاده شود، درست همانطوری که فهرستبرگه استاندارد شده می تواند درون هر کشوی فهرست برگه ای جاگیرد.
قابلیت هایی که نتیجه این یکنواختی است فوق العاده است و جامعه کتابداری نیازمند این یکنواختی برای فهرستنویسی منابع دست اولش است. اما کتابخانه در سازماندهی منابع سنتی کمتر حرکت می کند، و نه قوانین فهرستنویسی و نه نظامهای کتابخانه ای راه حل های قابل اجرایی را فراهم نمی کنند. پیش خود تصور کنید که شما آرشیوی دارید که تصویرهایی از شهر خودتان در اوایل قرن ۲۰ دارد، و شما تمایل دارید آنها را بر روی وب قابل دسترس سازید. اجازه دهید بگویم که شما حدودا یک هزار عکس از آنها دارید. در بیشتر آنها، شما تصور و ایده ای از عکاس ندارید، و اغلب عکسها تاریخی ندارند. کسی در گذشته در پشت آنها چیزی نوشته است، یعنی، Main street, circa۱۹۱۰ فهرست کردن و تولید رکوردهای مارک ۲۱ از این عکسها زمان زیادی نخواهد گرفت و رکوردهای نتیجه اطلاعات کمی خواهد داشت. ولی، شما می توانید رکورد دابلین کور را به سادگی به شکل زیر، تولید کنید:
Date=circa۱۹۱۰
Description=main street
این رکورد نمی تواند در فهرست پیوسته یتان وارد شود، اگرچه رکوردهای شبیه این می تواند اهداف فناوری های ابرموتورهای جستجو باشد که امکان جستجوی تکی را بجای رفتن در چندین پایگاههای اطلاعاتی با قالبهای ابرداده ای مختلف فراهم می سازد. فایده مهمی که این رکوردها دارند می تواند سریعا و به سادگی بوسیله کارمند کتابخانه با کمی آموزش ایجاد شود. ابرداده مانند دابلین کور از سطح پیش بینی پذیری بی بهره است که آن هم استفاده مجدد نظامند و گسترده از رکوردها را امکان پذیر خواهد ساخت. در حقیقت این قالبهای ابرداده ای و سایر قالبهای ابرداده ای، اغلب در نظامهای ویژه و مستقل غیریکپارچه[۲۲] برای مبادله داده ها استفاده می شوند. همانطورکه کتابخانه ها در اواخر قرن ۱۹ برای مبادله داده ها آغاز کردند، نظامهای ویژه نیز با این هدف شروع نمودند، در واقع توسعه دهندگان ممکن است به این نتیجه برسند که محتوای رکوردهای ابرداده ای، نه ساختار رکوردشان، موجب تفاوت بین یک راه حل نظام تکی و دنیای کتابشناختی منسجم است. به عبارت دیگر، ممکن است تصور نماییم زمانیکه ابرداده رشد نماید، به فهرستنویسی تبدیل شود (۱ ).
● نتیجه گیری
ظهور محیط های الکترونیکی جدید و منابع الکترونیکی مختلف، ضرورت الگوها، روشها و استانداردها و ابزارهای جدید برای ذخیره، سازماندهی و بازیابی دقیق آنها را اثبات کرده است. ابرداده درواقع برای پاسخ به چنین نیازی پا به منصه ظهور گذارده است. کتابداران و اطلاع رسانان که سالهاست به عنوان سازماندهندگان منابع اطلاعاتی چاپی ایفای نقش کرده اند لازم است با ابزارهای جدید سازماندهی منابع اطلاعاتی الکترونیکی آشنا شوند (۵). قالبهای ابرداده ای دابلین کور، متس و مودس که در این مقاله معرفی شدند، پرکاربردترین قالبهای ابرداده ای در ایجاد کتابخانه های دیجیتالی است. شناخت و استفاده موثر از این قالبها از گامهای اساسی در سازماندهی مطلوب اطلاعات الکترونیکی به ویژه منابع اینترنتی است.
ترجمه و تألیف: مریم اسدی
یادداشتها:
[۱] ۱- کارشناس ارشد کتابداری و اطلاع رسانی
[۲] - این نقل قول در ابتدا به تام دلزی از کتابخانه ملی کانادا (ابرداده: فهرستنویسی برای افراد) و سپس به میشل گورمن (...ابرداده فهرست تهیه شده توسط افراد است) نسبت داده شده است.
[۳] Meta Tag
[۴] HTML: HyperText Markup Language
[۵] Metadata
[۶] Surrogate
[۷] Resource Description Framework (RDF)
[۸] eXtensible Markup Language (XML)
[۹] about
[۱۰] World Wide Web Consortium (W۳C)
[۱۱] Document –like objects
[۱۲] Jewett and Panizzi
[۱۳] Dublin Core
[۱۴] Author
[۱۵] Creator
[۱۶] librarian- like point of view
[۱۷] Creative Commons license
[۱۸] Larry Lessig
[۱۹] MODS: Metadata Object Description Standard
[۲۰] MARC۲۱- lite Bibliographic Format زیرمجموعه ای از MARC ۲۱ Bibliographic Format است که راهنمای مرجع فوری برای برچسب زدن و شامل تمام عناصر ضروری برای ایجاد توصیفهای کتابشناختی اقلام اطلاعاتی است.
[۲۱] METS: Metadata Encoding and Transmission Standard
[۲۲] ad hoc and stand alone systems
منابع
۱. Karen Colyle.(۲۰۰۵)."Managing Technology: Understanding metadata and its purpose". The Journal of Academic Librarianship, v.۳۱, n.۲, p.۱۶۰-۱۶۳.
۲. http://www.creativecommons.org. access in: ۲۰۰۶-۱۱-۲۴
۳. http://www.loc.gov/standards/mets/. access in: ۲۰۰۶-۱۱-۲۴
۴. http://www.loc.gov/marc/bibliographic/lite/genintro.html. access in: ۲۰۰۶-۱۱-۲۴
۵. علی اصغر شیری. "ابرداده و تاثیر آن بر فهرستهای ماشین خوان...". فهرستهای رایانه ای کاربرد و توسعه: مجموعه مقالات همایش کاربرد و توسعه فهرستهای رایانه ای در کتابخانه های ایران. به کوشش رحمت الله فتاحی.- مشهد: دانشگاه فردوسی مشهد، ۱۳۷۹.
۶. فاطمه نبوی. کتابخانه دیجیتالی: مبانی نظری.... مشهد: سازمان کتابخانه ها موزه ها و مرکز اسناد آستان قدس رضوی، ۱۳۸۴.
منبع : نما مجله الکترونیکی پژوهشگاه اطلاعات و مدارک علمی ایران


همچنین مشاهده کنید