یکشنبه, ۲۳ اردیبهشت, ۱۴۰۳ / 12 May, 2024
مجله ویستا

آشنایی مقدماتی با Google Sitemaps


آشنایی مقدماتی با Google Sitemaps

موتورهای جستجویی چون گوگل برای جمع آوری اطلاعات وب سایت های مختلف از نرم افزارهایی به نام عنكبوت spider استفاده می كنند

●Google Sitemaps چیست ؟

موتورهای جستجویی چون گوگل برای جمع آوری اطلاعات وب سایت های مختلف از نرم افزارهایی به نام عنكبوت (spider) استفاده می كنند. وظیفه ی این نرم افزارها این است كه به هنگام ورود به یك وب سایت تمامی لینكهای موجود در آن را شناسایی كرده و به سمت آنها هدایت شوند. بدین ترتیب تمامی صفحات لینك داده شده، مرور شده و اطلاعات آنها در بانكهای اطلاعاتی گوگل ذخیره می گردد. این نرم افزارها به صورت دوره ای این وب سایت ها را مجددا بررسی می كنند و از آخرین تغییرات اعمال شده در آنها مطلع می گردند.

با استفاده از Google Sitemaps كه یكی از جدیدترین امكانات موتور جستجوی گوگل است، ارتباط بین وب سایت و این موتور جستجو بسیار دقیقتر بوده و به عمل به روز رسانی اطلاعات در موتور جستجوی گوگل سرعت می بخشد.

این مقاله به معرفی این ابزار می پردازم و در مقالات آتی نحوه استفاده از آن را شرح خواهم داد.

عنكبوت های موتورهای جستجو به راحتی رد لینكهای صفحات پویا (dynamic) را نمی گیرند و این بدان معنی است كه در صورتی كه وب سایت شما شامل صفحاتی پویاست امكان ثبت نشدن بعضی از صفحات آن در موتورهای جستجو وجود دارد. در این هنگام است كه Google Sitemaps به كمك شما می آید و كار معرفی چنین لینكهایی را انجام می دهد.

وجود چنین تكنیكی به هیچ عنوان به این معنی نیست كه نحوه كار سنتی موتور جستجوگر گوگل از بین می رود. این تكنیك تنها روشی برای تسریع در عمل جمع آوری اطلاعات سایتها است و مجهز نبودن سایتها به این ابزار به عنوان ضعف وب سایت مذكور تلقی نمی شود.

برنامه Google Sitemaps به صورت مجانی عرضه شده است و باید به این نكته توجه نمود كه استفاده از آن به هیچ عنوان در رتبه وب سایت شما در نتایج گوگل تاثیری نخواهد داشت. این برنامه در راستای اهداف شركت گوگل طراحی شده است و امید آن می رود كه با استفاده از آن نتایج سودمندی به هنگام جستجوی وب مشاهده گردد.

لازم به ذكر است Google Sitemaps هنوز به عنوان ابزار رسمی معرفی نگردیده و تنها نسخه بتای آن معرفی شده است.

●نحوه استفاده از Google Sitemaps

برای استفاده از این ابزار، طی مراحل زیر الزامیست:

۱. ساخت sitemap معتبر

۲. اضافه كردن sitemap مذكور به حساب كاربری خود در Google Sitemaps

۳. به روز نمودن فایل sitemap خود به هنگام تغییر در سایت خود

استفاده از Google Sitemaps برای همه وب سایتها امكان پذیر است. لذا چه سایت شما در برگیرنده یك صفحه است و چه شامل میلیونها صفحه پویاست این روش برای معرفی وب سایتتان به موتورهای جستجو توصیه می گردد.

●ساخت sitemap

جهت ساخت sitemap سایت خود چندین راه وجود دارد. در زیر به بعضی از این راه ها اشاره شده است:

۱. در صورتی كه لیست صفحات موجود در وب سایت خود را در فایل متنی خاصی ذخیره كرده اید، می توانید از نرم افزار Google Sitemap Generator برای sitemap سایت استفاده نمایید.

۲. در صورتی كه امكان استفاده از نرم افزار Google Sitemap Generator را ندارید (برای مثال اگر زبان Python بر سرور شما نصب نمی باشد)، می توانید از نرم افزارهای جانبی دیگر استفاده نمایید.

۳. همچنین امكان آماده سازی sitemap به صورت دستی و بر اساس پروتكل sitemap نیز وجود دارد.

برای مشاهده sitemap نمونه شركت گوگل به اینجا مراجعه نمایید :

http://www.google.com/sitemap.xml

قالبهای متفاوت sitemap قابل شناسایی برای گوگل

گوگل امكان شناسایی Sitemap های مختلفی را دارد ولی از بین انواع معرفی شده آن بهترین گزینه استفاده از sitemapهایی است كه از پروتكل Sitemap استفاده می كنند. دلیل این پیشنهاد آن است كه اولا با استفاده از این پروتكل علاوه بر آدرس صفحات سایت، اطلاعات مربوط به هر یك از این صفحات نیز قابل ثبت می باشند. ثانیا در صورت استفاده از پروتكل Sitemap ، دیگر موتورهای جستجو نیز امكان استفاده از Sitemap طراحی شده را خواهند داشت.

●پروتكل Sitemap :

این قالب یك پروژه متن باز (Open Source) است كه توسط شركت گوگل و با استفاده از زبان xml طراحی شده است و همانطور كه پیش از این نیز اشاره شد فایلهای Sitemapی كه از این پروتكل استفاده نمایند علاوه بر نگهداری آدرس صفحات سایت امكان ذخیره سازی اطلاعات مربوط به هر صفحه را نیز دارا خواهند بود.

OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)

این قالب، تنها برای سایت هایی توصیه می گردد كه هم اكنون از این پروتكل استفاده می كنند.

Syndication feed

گوگل قابلیت استفاده از RSS ۲.۰ و Atom ۰.۳ feeds را نیز دارا می باشد. تنها در صورتی كه هم اكنون از وجود چنین فید هایی در سایت خود بهره می برید، از این روش استفاده نمایید. لازم به ذكر است كه فیدها ممكن است تنها اطلاعات آخرین صفحات اضافه شده به سایت را ذخیره نمایند.

●فایل متنی

در این قالب از یك فایل متنی (Text File) كه در هر سطر آن آدرس یك صفحه ذكر شده است استفاده می شود. در این روش تنها آدرس صفحات ذخیره می شوند و بر خلاف پروتكل Sitemap امكان افزوردن اطلاعات اضافی را ندارد.پس از ساخت فایل Sitemap سایت خود می بایست آن را در بخش كاربری خود در سایت گوگل ثبت نمایید.

●محل قرارگیری فایل Sitemap

پس از ساخت فایل sitemap می بایست آن را در وب سایت خود قرار دهید. نرم افزارهای جستجوگر گوگل تنها قادر به مرور صفحاتی از صفحات معرفی شده در sitemap هستند كه در سطح زیرین پوشه قرارگیری فایل sitemap قرار گرفته اند. بدین معنی كه اگر فایل sitemap شما در پوشه فرضی www.sitename.com/foo/ قرار داشته باشد، نرم افزارهای مذكور تنها قادر به مرور صفحات موجود در پوشه foo و پوشه های زیرین آن هستند و در صورتی كه در فایل sitemap شما آدرس صفحاتی موجود در دیگر پوشه های ریشه ثبت شده باشد، نرم افزارهای جستجوگر به سراغ آن صفحات نخواهند رفت. لذا بهترین مكان برای قرارگیری فایل sitemap ریشه سایت است (در اینجا www.sitename.com) بدین ترتیب تمامی صفحات معرفی شده در sitemap توسط نرم افزارهای جستجوگر مرور خواهند شد.

●محتویات فایل Sitemap

به هنگام ساخت فایل sitemap به نكات زیر دقت كنید:

فایل sitemap امكان ذخیره سازی آدرس صفحات مختلف و یا آدرس sitemapهای دیگر را دارد.در صورتی كه فایل sitemap شامل آدرس sitemapهای دیگر است می بایست از روش خاصی برای معرفی آنها استفاده نمود و تعداد این sitemap‌ها نباید از ۱۰۰۰ آدرس تجاوز كند. (روش معرفی sitemapها در مقالات آتی شرح داده خواهد شد.)

فایل sitemap نباید بیشتر از ۵۰۰۰۰ آدرس را در خود ذخیره كند. علاوه بر آن حجم این فایل در حالت معمولی (فشرده نشده) نباید از ۱۰ مگابایت بیشتر شود. در صورت نیاز به فایل بزرگتر ، به جای استفاده از یك فایل از وجود چند فایل sitemap بهره ببرید.

تمامی آدرس های معرفی شده در فایل sitemap می بایست از قاعده یكسانی برای آدرس دهی استفاده كنند. به عنوان مثال اگر آدرس یك صفحه را با http://www.sitename.com آغاز نموده اید نباید آدرس صفحه دیگر را با http://sitename.com آغاز نمایید. به همین ترتیب برای آدرس دهی تمامی صفحات معرفی شده در sitemap باید از یكی از روش های فوق استفاده گردد.به هنگام معرفی صفحات سایت، آدرس آن را به طور كامل، به همراه پروتكل (برای مثال //:http) و ممیزهای الزامی دیگر مشخص نمایید.در آدرس دهی از شماره جلسه (Session ID) استفاده نكنید.در آدرس دهی صفحات تنها مجاز به استفاده از كاراكترهای اسكی خاصی هستید و استفاده از كد برخی از كنترلها و كاراكترهای خاص غیر مجاز می باشد. در صورت معتبر نبودن فایل sitemap ساخته شده، به هنگام معرفی آن به گوگل با پیغام خطای مربوط به آن روبرو خواهید شد.تا اینجا تنها به معرفی ابزار Google Sitemaps پرداختیم. در مقالات بعدی بیشتر با نحوه استفاده از آن آشنا خواهید شد.