دوشنبه, ۱۷ اردیبهشت, ۱۴۰۳ / 6 May, 2024
مجله ویستا

مروری بر رایجترین زبانهای نشانه گذاری منابع وب


مروری بر رایجترین زبانهای نشانه گذاری منابع وب
تقریبا با پیدایش وب جهانی زبان های نشانه گذاری به منظور تدوین‏، نمایش و ارائه مدارك وب به وجود آمدند. در حال حاضر زبانهای نشانه گذاری متعددی كه بر شكلهای گوناگون مدارك وب تاكید دارند گسترش یافته اند. متداولترین این زبانها كه عموماَ برخاسته از زبان نشانه گذاری تعمیم یافته استاندارد SGML می باشند عبارتند از HTML، XML، XHTML، HDML و WML كه در اینجا سعی گردیده است با اشاره به ویژگی های هر كدام از این زبانها، به معرفی اجمالی آنها پرداخته شود.
●مقدمه
تقریباَ همزمان با ایجاد وب جهانی زبان های نشانه گذاری (Mark-up Language) نیز پا به عرصه وجود گذاشتند. نیاز به این زبانها از آنجایی سرچشمه گرفته است كه سازمانها نیازمند مدیریت شمار زیادی از مداركی بودند كه می بایست به شكل های متنوعی مبادله و ارائه گردند.
ابرداده ها نیز جهت یكدستی در شكل نمایش و میانكنش پذیری(Interoperability) نیاز به ابزاری برای تعریف مدارك داشتند كه زبان های نشانه گذاری بهترین راه را برای این منظور فراهم می ‌آورند. زبانهای نشانه گذاری متداولترین فرم های رقمی هستند كه ابرداده ها در حد وسیعی، از صفحات وب گرفته تا پیشینه های الكترونیكی، از آنها استفاده می كنند.
زبانهای نشانه گذاری اساساَ برخاسته از پردازش متن( Text Processing ) می باشند. زبانهای نشانه گذاری بنابر تعریف عبارتند از: «نظام های رایانه ای كه می توانند اجزاء ایجاد مدرك و پردازش انتشار را خودكار می سازند». [۱]
زبانهای نشانه گذاری اولیه كه تاكید بیشتری بر متن داشته اند، عبارت بودند از: Troff ، Rich Text Format (RTF) و LaTex . اما در حال حاضر زبانهای نشانه گذاری دیگری در حال گسترش هستند كه به شكلهای گوناگونی از مدارك اختصاص داشته و نقش های متنوعی را در كاربردهای وب ایفا می كنند. در اینجا سعی گردیده است به معرفی اجمالی برخی از آنها كه در محیط وب و منابع الكترونیكی رواج بیشتری دارند، پرداخته شود.
● SGML
در اواخر دهه ۱۹۶۰ سه نفر از پژوهشگران IBM به نامهای گلد فارب، موشر و لوری اولین بار بحث نشانه گذاری تعمیم یافته را مطرح كردند. آنها معتقد بودند كه یك زبان نشانه گذاری می بایست دارای سه خصیصه باشد:
۱- ارائه داده ها باید به گونه ای رایج باشد
۲- نشانه گذاری باید گسترش پذیر باشد
۳- انواع مدرك نیازمند قواعدی می باشند. [۲]
این خصیصه ها چارچوب ارائه ابرداده را فراهم آورد و به دنبال آن نیاز به برقراری یك زبان نشانه گذاری استاندارد تعمیم پذیر احساس گردید.
SGML یا زبان نشانه گذاری تعمیم یافته استاندارد (Standard Generalized Markup Language) را می توان یك فرازبان(Meta language ) به شمار آورد. این زبان به عنوان یك استاندارد بین المللی (ISO ۸۸۷۹) در سال ۱۹۸۶ تدوین گردید. این استاندارد بر این اساس به وجود آمد تا به وسیله آن یك زبان مشتركی تعریف شود كه بسته های نرم افزاری و پردازشگرهای مختلف از طریق بكارگیری طرحواره های مشابه بتوانند به مبادله اطلاعات بپردازند. به این ترتیب اطلاعاتی كه به صورت متن ارائه می گردد می تواند از یك برنامه یا كاربرد به برنامه یا كاربرد دیگر بدون تغییر در شكل و ساختار، آن انتقال یابد.
در این زبان آن طور كه انتظار می رفت، تدوین كنندگان آن یك دسته برچسبهای(tags) جهانی را تعریف كردند كه در آن هر برچسب معنی خاص خود را دارد. به عنوان مثال برای مشخص كردن نام یك فرد از برچسب <name> استفاده می شود كه در زمان نمایش، نامی كه با این برچسب مشخص گردیده به صورت اریب یا درشت ظاهر می شود. [۳]
با این وجود SGML دارای كاستی هایی در تعریف مدارك الكترونیكی بوده كه خود باعث به وجود آمدن زبان نشانه گذاری دیگری گردیده است. اما آنچه درباره SGML اهمیت دارد این است كه این زبان با وجود كاستیهای بسیار مبنای زبانهای متداول و پركاربرد امروز از جمله HTML و XML می‌باشد.
●HTML
HTML یا زبان نشانه گذاری فرامتن در اویل دهه ۱۹۹۰ برمبنای SGML به وجود آمد. به طوری كه پژوهشگران بتوانند به سادگی اطلاعات را در شبكه ها خصوصاَ وب به اشتراك بگذارند. [۴] كلمه Hyper در ابتدای سرنام این زبان در مقابل Linier یا خطی است. بدین معنی كه در برنامه نویسی خطی اگر در یك سطر از برنامه اشتباهی رخ دهد، كل برنامه با اشكال مواجه شده و اجرا نمی‌شود، اما در این زبان هر سطر نقش مستقلی داشته و بقیه برنامه بدون اشكال جرا می شود.
HTML نقش عمده ای در بازیابی اطلاعات دارد. HTML بدان منظور طراحی گردید كه یك مدرك امكان دیده شدن توسط «مرورگرها»(Browsers)را با قابلیتهای مختلف داشته باشد. لذا HTML به شما این امكان را می دهد تا بخشهایی از متن مثل عناوین یا پاراگرافها را انتخاب و نشانه گذاری كرده و تجزیه و تحلیل این بخشهای انتخاب شده از متن را به مرورگرها واگذار نمائید. بنابر این ممكن است یك مرورگر تنها ابتدای هر پاراگراف را در نظر بگیرد و دیگری تمام متن را.
ساختارهای HTML متن را به قسمتهایی تقسیم می كند كه عناصر(Elements) نام دارند. این قسمتها خود به دو بخش تقسیم می شوند: آنهایی كه چگونگی نمایش پیكره یك مدرك را توسط مرورگر تعریف می‌كنند كه با برچسب <BODY> مشخص می شوند و آنهایی كه اطلاعات پیرامون مدرك از قبیل عنوان یا روابط آن مدرك با دیگر مدارك را تعریف می نمایند و با برچسبهایی مثل <HEAD> مشخص می گردند.
تفاوت عمده این زبان با SGML آن است كه SGML در حد قابل توجهی مشكل و پیچیده بوده و بیشتر برای مجموعه های انبوه مدارك طراحی می شود. همین پیچیدگی آن باعث گردیده كه در حیطه های استراتژیك و از نظر امنیتی با اهمیت كاربرد داشته باشد. خوشبختانه HTML از این نظر بسیار ساده تر می باشد.
با این حال HTML به نوبه خود نیز دارای ضعف هایی می باشد كه باعث گردیده تا متخصصین زبانهای نشانه گذاری و نرم افزار، زبان دیگری را گسترش دهند كه XML نام دارد. این زبان بسیاری از جنبه‌های مفید HTML و SGML را نیز در بر دارد. [۵]
●XML
از آنجا كه هدف از طراحی زبان نشانه گذاری گسترش پذیر(eXtensible Markup Language:XML) در واقع جبران كاستیهای زبان HTML می باشد، لذا بهتر است ابتدا به برخی از نارسائیهای HTML اشاره شود. اساساَ یكی از ضعفهای HTML توجه كم آن به چگونگی ارائه اطلاعات در مرورگرها است. به عبارت دیگر عنوان،‌ سرعنوانها، اطلاعات پدیدآور و امثال آن باید در درون عناصری مثل TITLE، H۱ ، EM ، ADDRESS و غیره قرار گیرد. ولی استفاده از FONT و عناصری مثل آن كه شكل ظاهری و زیبایی را تشكیل می دهند، بدون درنظر گرفتن محیط رایانه دریافت كننده، بسیار مشكل است. این تا حدی است كه گاه پردازش اطلاعات را با مشكل مواجه ساخته یا حتی غیر ممكن می كند. لذا می توان گفت كه در HTML بیشتر به محتوای اطلاعات توجه گردیده تا به شكل ارائه آن و لذا می توان گفت كه HTML بیشتر برای كاربرانی مطلوب است كه نیاز به ساختار رنگارنگ، خطوط زیبا و محیط گرافیكی خاصی ندارند. [۶].
این خصیصه باعث گردیده است كه بسیاری از صفحات وب كه حاوی برچسبهای خاصی از یك نسخه خاص یك مرورگر هستند، توسط دیگر مرورگرها قابل خواندن نباشند.
اما این تنها مشكل HTML نیست. اگر شما بخواهید اطلاعاتی را با دقت بالا نشانه گذاری نمائید، بنابر منظورتان شما به عناصر زیادی نیاز خواهید داشت كه در HTML وجود ندارند. مثلاَ ممكن است شما نیاز به عناصری برای فرمولهای شیمی، داده های ریاضی و غیره داشته باشید. این مستلزم داشتن عناصر فوق العاده بسیاری است كه در این صورت نه برای كاربر و نه برای پدیدآور مطلوب نمی باشد.
مشكل دیگر اینكه HTML از ساختار درونی كمی برخوردار است. بدین معنی كه اگر شما به جنبه معنایی(Semantic)توجهی نداشته باشید می توانید به سادگی HTML بنویسید. به عنوان مثال شما مایلید در پیكره متن (BODY) سرعنوانی را داشته باشید (H۱) كه سرعنوان دیگری را در درون خود دارا بوده (H۲) و باز به نوبه خود آن نیز حاوی سرعنوانهای دیگری است (H۳) ، مانند آنچه كه در یك كتاب می بینیم. اما در HTML این نیاز احساس در نظر گرفته نشده است. [۶]
با توجه به مشكلات قابل توجه HTML كه به برخی از آنها اشاره شد،‌ كنسرسیوم وب جهانی W۳C در تابستان سال ۱۹۹۶ كار بر روی زبان جدیدی را آغاز نمود. W۳C گروهی را جهت تدوین زبان نشانه گذاری XML تشكیل داد كه گروه كاریXWG-XML (XML Work Group) نام گرفت. این گروه كار خود را به سه فاز تقسیم كردند:
فاز ۱: تعریف استانداردی برای ایجاد زبانهای نشانه گذاری
فاز ۲: گسترش یك استاندارد متداول برای برقراری پیوند میان این زبانهای نشانه گذاری
فاز ۳: گسترش یك استاندارد متداول مخصوص شكل ظاهری مداركی كه برای زبانها كدگذاری می شوند.
همان طور كه گفته شد، قبلاَ استانداردی برای زبانهای نشانه گذاری تدوین گردیده بود كه SGML نام دارد. از آنجا كه این استاندارد به منظور اینكه رایانه ها و زبانهای مختلف بتوانند مدارك SGML را مبادله كنند، نیاز به تعریف زبان نشانه گذاری هر مدرك یعنی DTD داشتند،‌ و با توجه به پیچیدگی SGML ، XWG ویرایش جدیدی از SGML كه همان XML است را گسترش دادند. به همین خاطر آن را SGML سبك(SGML light) نیز مینامند.در XML شما می توانید اطلاعات مداركتان را به طور دقیق تری نسبت به HTML كدگذاری كنید كه این امر مانعیت را در بازیابی مدارك بالا می برد. بدین ترتیب برنامه هایی كه این مدارك را پردازش می كنند، آنها را بهتر می فهمند و منظور نویسنده مدارك نیز بهتر منتقل می شود. برای مثال یك فروشنده مواد غذایی می تواند اطلاعات مربوط به كالری، قیمت، مدت زمان تهیه هركدام از محصولات را به گونه ای ارائه دهد كه برنامه بتواند برمبنای پیشنهادات كاربران، محصولات را بر اساس كالری، قیمت یا هریك از مشخصه ها مرتب كند،‌ زیرا اطلاعات به گونه است كه رایانه می تواند آن را بفهمد. [۸]
همچنین XML گام بزرگی به سوی نظامهای تعاملی خبره اطلاعات به شمار می آید. برای مثال می توان یك نظام پرسش و پاسخ آماده (FAQ) را به سادگی در این زبان نشانه گذاری كرد. در زیر نمونه بسیار ساده ای از آن آورده می شود:
<?xml version="۱.۰" encoding="UTF-۸" standalone="yes"?>
<!DOCTYPE FAQ SYSTEM "FAQ.DTD">
<FAQ>
<INFO>
<SUBJECT> XML </SUBJECT>
<AUTHOR> Alireza Saadat</AUTHOR>
<EMAIL> alireza_saadat۲۰۰۳@yahoo.com </EMAIL>
<VERSION> ۱.۰ </VERSION>
<DATE> ۱۶.aug.۲۰۰۵ </DATE>
</INFO>
<PART NO="۱">
<Q NO="۱">
<QTEXT>What is XML?</QTEXT>
<A>SGML light.</A>
</Q>
<Q NO="۲">
<QTEXT>What can I use it for?</QTEXT>
<A>Anything.</A>
</Q>
</PART>
</FAQ>
در XML زبان نشانه گذاری شده بالا DTD زیر را دارد:
<!ELEMENT FAQ (INFO, PART+)>
<!ELEMENT INFO (SUBJECT, AUTHOR, EMAIL?, VERSION?, DATE?)>
<!ELEMENT SUBJECT (#PCDATA)>
<!ELEMENT AUTHOR (#PCDATA)>
<!ELEMENT EMAIL (#PCDATA)>
<!ELEMENT VERSION (#PCDATA)>
<!ELEMENT DATE (#PCDATA)>
<!ELEMENT PART (Q+)>
<!ELEMENT Q (QTEXT, A)>
<!ELEMENT QTEXT (#PCDATA)>
<!ELEMENT A (#PCDATA)>
<!ATTLIST PART NO CDATA #IMPLIED
TITLE CDATA #IMPLIED>
<!ATTLIST Q NO CDATA #IMPLIED>
XHTML
انگیزه ایجاد XHTML ، ایجاد یك نوع مدرك بود كه بتواند بین وسایل ارتباطاتی مختلف مثل رایانه، تلویزیون، تلفن همراه، رایانه های جیبی یا PDA، پیجر، ماشینهای كتاب خوان رقمی، ساعتهای هوشمند و غیره مشترك بوده و به اندازه كافی برای نگارش یك محتوای ساده،‌ توانمند با گسترش نوع مدرك XHTML شمار كاربران وب به حداكثر می رسد. XHTML قسمتهای بنیادین و رایج HTML را به عنوان مبنای طراحی خود قرار داده است. این قسمتها عبارتند از:
● متن اصلی (شامل سرعنوانها، پاراگرافها و فهرستها)
● فراپیوندها و پیوندهای مرتبط با مدارك
●جداول اصلی
●تصاویر
● ابرداده
اینها نقطه آغاز طراحی زبان XHTML به شمار می آیند. در مجموع باید گفت هدف از XHTML را محدود كردن زبانهای آینده از نظر كاركرد نیست، بلكه از آنجایی كه عناصر در HTML۴ (چارچوبها، جداول پیشرفته و ...) برای یك سرویس گیرنده رایانه رومیزی تدوین گردیده اند،‌ برای ابزارهای غیر آن چندان مناسب نیست. XHTML با استفاده از كاركردهای بنیادین HTML۴ كه زبان بسیار حجیم و با زیر مجموعه بسیاری است، هم برای میانكنش پذیری در محیط وب مناسب بوده و هم امكان سازگاری سخت افزاری و نرم افزاری با افزایش تعداد كاربران كه همان مقیاس پذیری(Scalability) است، را فراهم می آورد. [۸]
●HDML و WML
كاربرد این دو زبان در تلفنهای همراه است. HDML یا زبان نشانه گذاری ابزار دستی(Hand hold Device Markup Language) برای لایه نمایش(Presentation Layer)درشبكه بكار می رود. شركت نوكیا و اریكسون برای پیاده سازی یك مرورگر كامل WAP (قرارداد كاربرد بی سیم[Wireless Application Protocol]) برای لایه نمایش بر روی تلفنهای همراه از زبان نشانه گذاری دیگری استفاده كردند كه WML یا زبان نشانه گذاری بی سیم(Wireless Markup Language) نام دارد. این مسئله باعث شد تا تمام مؤسسات IT و تجارت الكترونیكی بی سیم، نظامهای خود را برای هردوی این نسخه ها پشتیبانی كنند.
برای اینكه افراد مجبور نباشد جهت تغییر حامل شبكه ی خود گوشی خود را تغییر دهند، ابزاری به وجود آمده كه «نظام جهانی برای ارتباطات متحرك(Global System for Mobile communication)» یا GSM نام دارد. این وسیله اجازه می دهد كه كارت هایی حامل WAP هستند بتوانند از WML استفاده كنند. [۹]

نوشته: علیرضا سعادت
دانشجوی كارشناسی ارشد علوم كتابداری و اطلاع رسانی دانشگاه شیراز
كارشناس مركز اطلاع رسانی و كتابخانه مركزی دانشگاه فردوسی مشهد
E-mail: alireza_saadat۲۰۰۳@yahoo.com
منابع
۱) Goldfarb, C. F. and Prescod, P. The XML handbook. ۳rd ed , Upper saddle river: NJ, Prenice Hall , ۲۰۰۱.
۲) Haynes, David. Metadata for information management and retrieval. London: Facet Publishing, ۲۰۰۴.
۳) Burnard, Lou, “What is SGML and how does it help?”
www.oasis-open.org/cover/burnardw۲۵-index.html ; [accessed ۲۰۰۵/۰۸/۰۱]
۴) Campbell, Allen Gary, “Mark my words” Electronic musician, vol.۱۷, Issue۱۱, (Nov۲۰۰۱).
۵) Graham,Lon,“Introduction to HTML”(۵Jan۱۹۹۸);
www.utoronto.ca/webdocs/HTMLdocs/NewHTML/html-intro.html . [accessed ۲۰۰۵/۸/۱]
۶) Flyn, Peter, “The XML FAQ” (۱July۲۰۰۵) http://xml.silmaril.ie , [accessed ۲۰۰۵/۸/۹]
۷) Garshol, Lars Maius, “An introduction to XML”;
www.garshol.priv.no/download/text/wml-into/index-en.html , [accessed ۲۰۰۵/۸/۱۰]
۸) “XHTML basic”; http://www.w۳-org/TR/xhtml-basic , [accessed ۲۰۰۵/۸/۳]
۹) Schwartz, Ephraim, “HDML or WAP plus WML? It disaster looms over mobile mictrowars” Infoworld, vol۲۲, no۴ (۲۰۰۰/۰۲/۱۰).
منبع : نما مجله الکترونیکی پژوهشگاه اطلاعات و مدارک علمی ایران