شنبه, ۲۹ دی, ۱۴۰۳ / 18 January, 2025
مجله ویستا

درک ابرداده و استانداردهای آن


درک ابرداده و استانداردهای آن

بدون تردید فهرست نویسی در کتابخانه شرط لازم ایجاد مدرک ابرداده ای است منشاء آن را می توان در اواسط دهه ۱۸۰۰ در قوانین جوت و پانیزی یافت

● چكیده

ظهور محیط‌های الکترونیکی جدید و منابع الکترونیکی مختلف، ضرورت الگوها، روشها و استانداردها و ابزارهای جدید برای ذخیره، سازماندهی و بازیابی دقیق آنها را اثبات کرده است. ابرداه به عنوان روشی نظامند برای شناسایی، توصیف و مکان یابی منابع الکترونیکی بر روی شبکه، درواقع برای پاسخ به چنین نیازی ابداع شده است. آشنایی کتابداران و اطلاع رسانان با ابزارهای جدید سازماندهی منابع اطلاعاتی الکترونیکی یك ضرورت است. قالبهای ابرداده ای دابلین کور، متس و مودس که در این مقاله معرفی شدند، پرکاربردترین قالبهای ابرداده ای در ایجاد کتابخانه های دیجیتالی است.

● مقدمه

"ابرداده فهرست تهیه شده توسط افراد است"[۲].

دنیای فناوری اطلاعات غرق گفتگو درباره ابرداده است. امروزه به نظر می رسد هرکسی در حال ایجاد یک قالب ابرداده ای است. یک ابرنشانه[۳] در زبان نشانه گذاری فرامتن[۴] برای حمل ابرداده در منابع اینترنتی وجود دارد؛ به طوریکه متخصصان ابرداده را برای توصیف ژنوم ها توسعه داده اند؛ و ناشران دارای یک قالب ابرداده ای برای تسهیل انتقال داده های تبلیغاتی و قیمت به خرده فروشان هستند. چه چیزی در دنیای فناوری در حال رخ دادن است که موجب شده هر فردی تصور کند برای مدیریت و کنترل اطلاعات در اینترنت ابرداده پاسخ است؟ اگر ابرداده پاسخ است، در این صورت پرسش چیست و در کتابخانه ها و فهرستهای کتابخانه چه معنایی دارد (۱)؟

● تعریف ابرداده[۵]

واقعیت این است که گسترش شتابناک پدیده اینترنت در دهه اخیر و بخصوص ابداع وب باعث نگرانی بسیاری از دست اندرکاران و متخصصان در اطلاع رسانی گردیده است. این نگرانی از این بابت است که اطلاعات تولید و منتشر شده از طریق اینترنت و وب با سرعت شگفت انگیزی درحال افزایش است و مدیریت و کنترل این منابع کاری بسیار دشوار است. این نگرانی ها سبب شده با ابداع راهکارها و روشهای علمی تاحدودی بر اداره و ساماندهی منابع روی وب تسلط یابند. ارائه راهکاری تحت عنوان "ابرداده" باعث شد انتهای روشنی برای مدیریت و کنترل اطلاعات در اینترنت گشوده شود(۶).

درابتدا بایستی حدود و دامنه این واژه را مشخص نماییم، به چه چیزی ابرداده اطلاق می شود. بررسی تاریخی مفهوم ابرداده نشان می دهد که این اصطلاح از مدتها قبل مورد استفاده قرار گرفته است. اما قبل از فراگیر شدن آن به طورگسترده در دهه ۱۹۹۰ دارای چنین هدف گسترده ای نبود. این اصطلاح اولین بار در سال ۱۹۶۹ به عنوان یک شرکت آمریکایی به کار رفته است . بنابراین ابرداده مفهومی نو با مضمون کهن است (۶) چرا که کتابداران قبل از ظهور رایانه یا اینترنت با سازماندهی اطلاعات در کتابخانه به ایجاد ابرداده (برای مثال ایجاد پیشینه های کتابشناختی، نمایه سازی مقالات و پایان نامه ها و ایجاد پایگاه اطلاعاتی از آنها،...) پرداخته اند.

تعریف رایج از ابرداده، " داده درباره داده" است. اگرچه این تعریف گمراه کننده است و به شناخت ما درباره اینکه ابرداده چیست کمکی نمی کند، اما برای ما روشی برای شناخت ابرداده فراهم نماید.

در وهله اول، ابرداده اطلاعات ساخت یافته است، به این معنی که آن ابداع بشری است و در طبیعت یافت نمی شود. یک نمونه خوب از اطلاعات ساخت یافته استفاده از طول و عرض جغرافیایی برای توصیف زمین و نقاط روی آن است. پرواضح است که سیاره واقعی دارای خطوط در اطراف آن نیست، اگرچه ما به دیدن نقشه ها و کره ها با آن نقاط عادت کرده ایم، اما اختراع طول و عرض جغرافیایی به ما این امکان را می دهد تا درباره مکانهای روی سیاره و ردیابی دقیق آن در فضاهای وسیع بدون علامت و راهنما گفتگو نماییم.

این مسئله ما را به دومین ویژگی مهم ابرداده هدایت می کند: ابرداده بوسیله افراد بنا به هدف یا نقشی خاص تهیه می شود. بنابراین نقشه ای از سیستم مترو میان رانندگان توزیع می شود؛ از طریق رمزگذاری رنگی، مسیرها و نشانه ها برای راهنمایی رانندگان در میان شبکه پرپیچ و خم مسیرها و نقاط نقل و انتقال، مشخص می شود. اغلب این نقشه ها تنها و به زحمت نشانگر مقیاس واقعی و جغرافیایی شهر است که بوسیله مترو بکار گرفته می شود. اما کاملا مفید است، به این دلیل که آن منظره مترو مرکزی را بر گستره و دقت جغرافیایی مورد توجه و تأکید قرار می دهند. نقشه راه همان منطقه به وضعیت واقعی نزدیکتر خواهد بود، اما اگر آن نقشه بوسیله کمیته توریستی طراحی شود، در آن هتلها، موزه ها، نقاط گردشگری و فضاهای پارک مشخص خواهد شد. درست همانطوریکه هیچ نقشه جداگانه ای برای برآوردن تمام نیازها وجود ندارد، یک نوع ابرداده برای مدارک یا سایر اشیاء اطلاعاتی هم وجود ندارد. این به این دلیل است که خود شیء تعیین کننده نوع ابرداده نیست، بلکه نیازها و اهداف افرادی که آن را ایجاد می کنند و افرادیکه از آن استفاده می نمایند، نوع ابرداده را تعیین می کند. همچنین از ابرداده به عنوان جایگزینی[۶] برای شیء واقعی استفاده می شود. در فهرست کتابخانه مدخلها جایگزینی هایی برای کتابها در قفسه ها هستند، ولی آن بررسی هر کتاب را جهت انتخاب یکی از آنها برای استفاده کنندگان کتابخانه دشوار خواهد ساخت. حداقل کتاب فیزیکی وجود دارد. در محیط دیجیتالی، بدلیل آنکه بیشتر منابع به آسانی قابل تورق و بررسی نیستند و سایر منابع داده های روشنی درباره خودشان ارائه نمی دهند، نقش جایگزین ابرداده ای حائزاهمیت است.

افزایش علاقه به ابرداده بخشی از تلاش برای سامان دادن دنیای نسبتا نامنظم منابع دیجیتالی و فراهم کردن دسترسی و خدماتی که قبل از آن در هیچ کجا وجود نداشته است، می باشد. همچنین آن روشی برای مبادله داده ها میان مخازن پراکنده منابع و امکان جستجو در انبار دیجیتالی است (۱).

درمجموع، می توان ابرداه را روشی نظامند دانست که منابع الکترونیکی روی شبکه را شناسایی، توصیف و مکان یابی می کند. اطلاعات ابرداده ای در مورد منبع الکترونیکی شامل اطلاعات مربوط به عنوان سایت یا منبع، موضوع، پدیدآورنده سایت، ناشر، تاریخ نشر یا ایجاد سایت، جزئیات مالکیت معنوی اثر، زبان، پوشش، توصیف و کلیدواژه های قابل جستجو برای هر منبع و کد و نشانه هایی برای رده بندی محتوای مدارک می باشد.

● قالب توصیف منبع[۷] و زبان نشانه گذاری گسترش پذیر[۸]

دوآغازه ای که شما همزمان با هم با بیان ابرداده خواهید شنید زبان نشانه گذاری گسترش پذیر یا XML و قالب توصیف منبع یا RDF است. زمانیکه برخی افراد درباره XML و RDF صحبت می کنند گویی که این دوآغازه خودشان قالب ابرداده ای هستند، اما این آشوبی میان قالب و محتوا است. درعمل XML و RDF قالبهای داده ای عمومی هستند که می توانند در موارد گوناگون استفاده شوند. خصوصا، ازXML اغلب به عنوان قالب مدرک استفاده می شود و قالب کلی تری است که از آن HTML حاصل می شود.

اگر شما با ساختار رکورد XML آشنا نیستید، در این صورت ممکن است آن برای شما نسبتا پیچیده و اسرارآمیز به نظر آید. در واقع، اگرچه ممکن است ایجاد رکوردهای داده ای با آن پیچیده باشد، اما قالب پایه ای آن بسیار ساده است.

هرگاه شما فیلدهای رکورد مارک را با تگ هایی مانند استفاده از "۲۴۵" به معنی "عنوان" در نظر بگیرید:

۲۴۵ Hamlet, Prince of Denmark

در این صورت XML تنها روش دیگری برای تگ زدن یک قطعه داده است، اگرچه آن شامل گذاشتن یک تگ شروع و یک تگ پایانی (با یک "/" قبل از نام تگ) در اطراف هر عنصر داده ای است:

<title>Hamlet, Prince of Denmark</title>

تگ ها می تواند هر چیزی که شما تمایل دارید باشد، به شرط اینکه شما آنها را در یک قالب داده ای تعریف ساختار، از قبل تعیین کرده باشید. بنابراین اگر شما ترجیح می دهید، تعریفتان می تواند دارای هر کدام از تگ های زیر برای "عنوان" باشد.

<۲۴۵>Hamlet, Prince of Denmark</۲۴۵>

<ti>Hamlet, Prince of Denmark</ti>

در اصلXML ، مشابه تگ ها و فیلدهای فرعی مارک، سلسله مراتبی است. مزایای آن بیش از مارک۲۱ است که می تواند به اندازه ای که سطوح سلسله مراتبی لازم است را دارا باشد. برخلاف مارک۲۱ که می تواند دارای دو سطح تگ و فیلد فرعی باشد.

RDF یک مرحله یا دو مرحله بعد از XML است. آن بر روابط میان عناصر داده ای تأکید دارد. همانطور که از نام RDF برمی آید ایجاد یک مکانیزمی برای توصیف منابع و اسناد برروی اینترنت است و رابطه کلیدی آن توصیف[۹] می باشد. RDF عنصر ضروری و مهمی از وب معنایی است که توسط ائتلاف شبکه جهانگستر وب[۱۰] برای افزودن عنصر معنایی و در چارچوب توصیف منابع برای اشتراک داده ها روی اینترنت ایجاد شده است.

RDF پیچیده تر و نسبت به XML کمتر استفاده شده است و هنوز مشخص نیست، آیا آن به عنوان یک زبان عمومی در توصیف جهانی وب موفق است. به طور قطع به نظر می رسد RDF به شناخت عمیق تری در مفاهیم خاص فلسفی نسبت به XML نیاز دارد و تعداد افرادی که آن را معمایی تلقی می کنند، بسیار بیشتر از آنانی که آن را به عنوان یک راه حل می بینند، می باشد. (نمونه پایین مربوط به یک رکورد Creative Commons است که از یک قالب ساده RDF استفاده می کند) (۱).

● ابرداده برای اشیاء شبه مدرک[۱۱]

می توان با این پرسش اساسی آغاز نمود که ابرداده با فهرست کتابخانه چه تفاوتی دارد؟ خاطر نشان کردن اینکه قالبهای ابرداده ای معرفی شده در این مقاله (دابلین کور، مودس و متس) مهمترین قالبهایی هستند که امروزه استفاده می شوند، اما بیش از همه این سه قالب عموما در کتابخانه های دیجیتالی بکار میروند.

بدون تردید فهرست نویسی در کتابخانه شرط لازم ایجاد مدرک ابرداده ای است. منشاء آن را می توان در اواسط دهه ۱۸۰۰ در قوانین جوت و پانیزی[۱۲] یافت. تقریبا هر شخص آموزش دیده ای با انگلوآمریکن جهانی آشنا است. در شمار زیادی، مصداقهای فهرستنویسی کتابخانه شدیدا هر طرح ابرداده ای که درحال استفاده شدن برای کتابها است را تحت کنترل درآورده است (اگرچه احتمالا نه در مقالات مجلات). با این وجود، به مجرداینکه توسعه دهندگان کاربردهای اینترنت نیاز به ابرداده برای مدارک پیوسته داشتند، از استانداردهای کتابداری استفاده نکردند. درواقع، استاندارد ابرداده ای مدرک که بر کاربردهای غیرکتابداری پایه گذاری شده، قالب ابرداده ای دابلین کور است (۱).

● دابلین کور[۱۳]

دابلین در کلمه دابلین کور اشاره به مرکز OCLC در دابلین اوهایو دارد و بدلیل آنکه OCLC سازمان حمایتی دابلین کور بوده است، شما ممکن است تصور کنید که دابلین کور از سنت کتابداری تشکیل شده است. درواقع، تلاش زیادی برای جدا کردن دابلین کور از سنت کتابداری صورت گرفت و اینکه در بیشتر موارد این تلاشها موفق بوده است. هدف دابلین کور فراهم کردن مجموعه ای ساده از عناصر داده ای برای توصیف مدارک و سایر اشیاء روی اینترنت بود. آن بسیار ساده است بطوریکه هر کسی می تواند یک پیشینه برای مدارک خود ایجاد نماید. دابلین کور ۱۵ عنصر هسته دارد، که می تواند با استفاده از تعدادی توصیفگر ارائه شود. عناصر هسته بسیار کلی هستند بنابراین بجای "نویسنده"[۱۴] هسته "پدیدآور"[۱۵] دارد. اما پدیدآور می تواند برای نویسنده یا مصنف و غیره تعیین شود. به آسانی شما می توانید یک رکورد دابلین کور را برای هر چیزی ایجاد نمایید، مانند:

creator = Karen Coyle

title = Understanding Metadata and its Purpose

date = December, ۲۰۰۴

description = The first draft of an article for Journal of Academic Librarianship

subject = metadata

type = text

امید دابلین کور این بود که مدارک روی اینترنت توصیفهای کتابشناختی خود را حمل خواهند نمود و از این رو عناصرداده ای به اطلاعاتی مانند نویسنده، عنوان و تاریخ رمزگذاری شده اند. به تعبیری این "[۱۶]دیدگاه شبه کتابدار" را معرفی می کند، که احتمالا باید یک مدرک را بوسیله نویسنده یا عنوانش یافت. امروزه بر روی اینترنت دابلین کور، به شدت استفاده می شود، اگرچه آن در ایجاد فهرستی از منابع اینترنتی نتیجه نداده است. در عوض، دابلین کور ابرداده توصیف مدرک برای انواعی از کاربردهای مبتنی بر وب شده است. یک نمونه از قالب دابلین کور مجوز کرییتیو کامانز[۱۷] است (۱).

کرییتیو کامانز بنیادی غیرانتفاعی است که در راستای گسترش دسترسی‌پذیری آثار بدیع برای دیگران به منظور استفاده اشتراکی و سازنده فعالیت می‌کند. آن توسط لاری لزیگ[۱۸] استاد شناخته شده حقوق دانشگاه استانفورد در انتقادش نسبت به فایده قانون کپی رایت در استفاده و استفاده مجدد از عقاید پشینیان توسعه یافت. این مجوز به پدیدآورندگان امکان می دهد تا برای استفاده از آثارشان، مجموعه ای کوچک از مجوزها را توسعه دهند تا بتواند به آسانی به فایلهای روی اینترنت متصل شود (۲). این مجوزها بیان می کند که استفاده و استفاده های مجدد توسط پدیدآورنده اثر تضمین می شود. علاوه بر مجوز، نرم افزار کرییتیو کامانز به پدیدآور امکان افزودن ابرداده توصیفی مانند پدیدآور، عنوان، تاریخ، توصیف کوتاهی از فقره اطلاعاتی را می دهد. این مجوزها از عناصر دابلین کور پدیدآور، عنوان، تاریخ، توصیف استفاده می کنند .

ترجمه و تألیف: مریم اسدی

یادداشتها:

[۱] ۱- کارشناس ارشد کتابداری و اطلاع رسانی

[۲] - این نقل قول در ابتدا به تام دلزی از کتابخانه ملی کانادا (ابرداده: فهرستنویسی برای افراد) و سپس به میشل گورمن (...ابرداده فهرست تهیه شده توسط افراد است) نسبت داده شده است.

[۳] Meta Tag

[۴] HTML: HyperText Markup Language

[۵] Metadata

[۶] Surrogate

[۷] Resource Description Framework (RDF)

[۸] eXtensible Markup Language (XML)

[۹] about

[۱۰] World Wide Web Consortium (W۳C)

[۱۱] Document –like objects

[۱۲] Jewett and Panizzi

[۱۳] Dublin Core

[۱۴] Author

[۱۵] Creator

[۱۶] librarian- like point of view

[۱۷] Creative Commons license

[۱۸] Larry Lessig

[۱۹] MODS: Metadata Object Description Standard

[۲۰] MARC۲۱- lite Bibliographic Format زیرمجموعه ای از MARC ۲۱ Bibliographic Format است که راهنمای مرجع فوری برای برچسب زدن و شامل تمام عناصر ضروری برای ایجاد توصیفهای کتابشناختی اقلام اطلاعاتی است.

[۲۱] METS: Metadata Encoding and Transmission Standard

[۲۲] ad hoc and stand alone systems

منابع

۱. Karen Colyle.(۲۰۰۵)."Managing Technology: Understanding metadata and its purpose". The Journal of Academic Librarianship, v.۳۱, n.۲, p.۱۶۰-۱۶۳.

۲. http://www.creativecommons.org. access in: ۲۰۰۶-۱۱-۲۴

۳. http://www.loc.gov/standards/mets/. access in: ۲۰۰۶-۱۱-۲۴

۴. http://www.loc.gov/marc/bibliographic/lite/genintro.html. access in: ۲۰۰۶-۱۱-۲۴

۵. علی اصغر شیری. "ابرداده و تاثیر آن بر فهرستهای ماشین خوان...". فهرستهای رایانه ای کاربرد و توسعه: مجموعه مقالات همایش کاربرد و توسعه فهرستهای رایانه ای در کتابخانه های ایران. به کوشش رحمت الله فتاحی.- مشهد: دانشگاه فردوسی مشهد، ۱۳۷۹.

۶. فاطمه نبوی. کتابخانه دیجیتالی: مبانی نظری.... مشهد: سازمان کتابخانه ها موزه ها و مرکز اسناد آستان قدس رضوی، ۱۳۸۴.


شما در حال مطالعه صفحه 1 از یک مقاله 2 صفحه ای هستید. لطفا صفحات دیگر این مقاله را نیز مطالعه فرمایید.