چهارشنبه ۲۷ دی ۱۳۹۶ / Wednesday, 17 January, 2018

Google Sitemap چیست؟


Google Sitemap چیست؟
موتورهای جستجویی چون گوگل برای جمع آوری اطلاعات وب سایت های مختلف از نرم افزارهایی به نام عنکبوت (spider) استفاده می کنند. وظیفه ی این نرم افزارها این است که به هنگام ورود به یک وب سایت تمامی لینکهای موجود در آن را شناسایی کرده و به سمت آنها هدایت شوند. بدین ترتیب تمامی صفحات لینک داده شده، مرور شده و اطلاعات آنها در بانکهای اطلاعاتی گوگل ذخیره می گردد. این نرم افزارها به صورت دوره ای این وب سایت ها را مجددا بررسی می کنند و از آخرین تغییرات اعمال شده در آنها مطلع می گردند.
با استفاده از Google Sitemaps که یکی از جدیدترین امکانات موتور جستجوی گوگل است، ارتباط بین وب سایت و این موتور جستجو بسیار دقیقتر بوده و به عمل به روز رسانی اطلاعات در موتور جستجوی گوگل سرعت می بخشد.
این مقاله به معرفی این ابزار می پردازم و در مقالات آتی نحوه استفاده از آن را شرح خواهم داد.
عنکبوت های موتورهای جستجو به راحتی رد لینکهای صفحات پویا (dynamic) را نمی گیرند و این بدان معنی است که در صورتی که وب سایت شما شامل صفحاتی پویاست امکان ثبت نشدن بعضی از صفحات آن در موتورهای جستجو وجود دارد. در این هنگام است که Google Sitemaps به کمک شما می آید و کار معرفی چنین لینکهایی را انجام می دهد.
وجود چنین تکنیکی به هیچ عنوان به این معنی نیست که نحوه کار سنتی موتور جستجوگر گوگل از بین می رود. این تکنیک تنها روشی برای تسریع در عمل جمع آوری اطلاعات سایتها است و مجهز نبودن سایتها به این ابزار به عنوان ضعف وب سایت مذکور تلقی نمی شود.
برنامه Google Sitemaps به صورت مجانی عرضه شده است و باید به این نکته توجه نمود که استفاده از آن به هیچ عنوان در رتبه وب سایت شما در نتایج گوگل تاثیری نخواهد داشت. این برنامه در راستای اهداف شرکت گوگل طراحی شده است و امید آن می رود که با استفاده از آن نتایج سودمندی به هنگام جستجوی وب مشاهده گردد.لازم به ذکر است Google Sitemaps هنوز به عنوان ابزار رسمی معرفی نگردیده و تنها نسخه بتای آن معرفی شده است.
●نحوه استفاده از Google Sitemaps
برای استفاده از این ابزار، طی مراحل زیر الزامیست:
۱. ساخت sitemap معتبر
۲. اضافه کردن sitemap مذکور به حساب کاربری خود در Google Sitemaps
۳. به روز نمودن فایل sitemap خود به هنگام تغییر در سایت خود
استفاده از Google Sitemaps برای همه وب سایتها امکان پذیر است. لذا چه سایت شما در برگیرنده یک صفحه است و چه شامل میلیونها صفحه پویاست این روش برای معرفی وب سایتتان به موتورهای جستجو توصیه می گردد.
●ساخت sitemap
جهت ساخت sitemap سایت خود چندین راه وجود دارد. در زیر به بعضی از این راه ها اشاره شده است:
۱. در صورتی که لیست صفحات موجود در وب سایت خود را در فایل متنی خاصی ذخیره کرده اید، می توانید از نرم افزار Google Sitemap Generator برای sitemap سایت استفاده نمایید.
۲. در صورتی که امکان استفاده از نرم افزار Google Sitemap Generator را ندارید (برای مثال اگر زبان Python بر سرور شما نصب نمی باشد)، می توانید از نرم افزارهای جانبی دیگر استفاده نمایید.
۳. همچنین امکان آماده سازی sitemap به صورت دستی و بر اساس پروتکل sitemap نیز وجود دارد.
برای مشاهده sitemap نمونه شرکت گوگل به اینجا مراجعه نمایید : http://www.google.com/sitemap.xml
قالبهای متفاوت sitemap قابل شناسایی برای گوگل
گوگل امکان شناسایی Sitemap های مختلفی را دارد ولی از بین انواع معرفی شده آن بهترین گزینه استفاده از sitemapهایی است که از پروتکل Sitemap استفاده می کنند. دلیل این پیشنهاد آن است که اولا با استفاده از این پروتکل علاوه بر آدرس صفحات سایت، اطلاعات مربوط به هر یک از این صفحات نیز قابل ثبت می باشند. ثانیا در صورت استفاده از پروتکل Sitemap ، دیگر موتورهای جستجو نیز امکان استفاده از Sitemap طراحی شده را خواهند داشت.
●پروتکل Sitemap :
این قالب یک پروژه متن باز (Open Source) است که توسط شرکت گوگل و با استفاده از زبان xml طراحی شده است و همانطور که پیش از این نیز اشاره شد فایلهای Sitemapی که از این پروتکل استفاده نمایند علاوه بر نگهداری آدرس صفحات سایت امکان ذخیره سازی اطلاعات مربوط به هر صفحه را نیز دارا خواهند بود.
OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)
این قالب، تنها برای سایت هایی توصیه می گردد که هم اکنون از این پروتکل استفاده می کنند.
Syndication feed
گوگل قابلیت استفاده از RSS ۲.۰ و Atom ۰.۳ feeds را نیز دارا می باشد. تنها در صورتی که هم اکنون از وجود چنین فید هایی در سایت خود بهره می برید، از این روش استفاده نمایید. لازم به ذکر است که فیدها ممکن است تنها اطلاعات آخرین صفحات اضافه شده به سایت را ذخیره نمایند.
●فایل متنی
در این قالب از یک فایل متنی (Text File) که در هر سطر آن آدرس یک صفحه ذکر شده است استفاده می شود. در این روش تنها آدرس صفحات ذخیره می شوند و بر خلاف پروتکل Sitemap امکان افزوردن اطلاعات اضافی را ندارد.پس از ساخت فایل Sitemap سایت خود می بایست آن را در بخش کاربری خود در سایت گوگل ثبت نمایید.
●محل قرارگیری فایل Sitemap
پس از ساخت فایل sitemap می بایست آن را در وب سایت خود قرار دهید. نرم افزارهای جستجوگر گوگل تنها قادر به مرور صفحاتی از صفحات معرفی شده در sitemap هستند که در سطح زیرین پوشه قرارگیری فایل sitemap قرار گرفته اند. بدین معنی که اگر فایل sitemap شما در پوشه فرضی www.sitename.com/foo/ قرار داشته باشد، نرم افزارهای مذکور تنها قادر به مرور صفحات موجود در پوشه foo و پوشه های زیرین آن هستند و در صورتی که در فایل sitemap شما آدرس صفحاتی موجود در دیگر پوشه های ریشه ثبت شده باشد، نرم افزارهای جستجوگر به سراغ آن صفحات نخواهند رفت. لذا بهترین مکان برای قرارگیری فایل sitemap ریشه سایت است (در اینجا www.sitename.com) بدین ترتیب تمامی صفحات معرفی شده در sitemap توسط نرم افزارهای جستجوگر مرور خواهند شد.
●محتویات فایل Sitemap
به هنگام ساخت فایل sitemap به نکات زیر دقت کنید:
فایل sitemap امکان ذخیره سازی آدرس صفحات مختلف و یا آدرس sitemapهای دیگر را دارد.
در صورتی که فایل sitemap شامل آدرس sitemapهای دیگر است می بایست از روش خاصی برای معرفی آنها استفاده نمود و تعداد این sitemap‌ها نباید از ۱۰۰۰ آدرس تجاوز کند. (روش معرفی sitemapها در مقالات آتی شرح داده خواهد شد.)
فایل sitemap نباید بیشتر از ۵۰۰۰۰ آدرس را در خود ذخیره کند. علاوه بر آن حجم این فایل در حالت معمولی (فشرده نشده) نباید از ۱۰ مگابایت بیشتر شود. در صورت نیاز به فایل بزرگتر ، به جای استفاده از یک فایل از وجود چند فایل sitemap بهره ببرید.
تمامی آدرس های معرفی شده در فایل sitemap می بایست از قاعده یکسانی برای آدرس دهی استفاده کنند. به عنوان مثال اگر آدرس یک صفحه را با http://www.sitename.com آغاز نموده اید نباید آدرس صفحه دیگر را با http://sitename.com آغاز نمایید. به همین ترتیب برای آدرس دهی تمامی صفحات معرفی شده در sitemap باید از یکی از روش های فوق استفاده گردد.به هنگام معرفی صفحات سایت، آدرس آن را به طور کامل، به همراه پروتکل (برای مثال //:http) و ممیزهای الزامی دیگر مشخص نمایید.در آدرس دهی از شماره جلسه (Session ID) استفاده نکنید.در آدرس دهی صفحات تنها مجاز به استفاده از کاراکترهای اسکی خاصی هستید و استفاده از کد برخی از کنترلها و کاراکترهای خاص غیر مجاز می باشد. در صورت معتبر نبودن فایل sitemap ساخته شده، به هنگام معرفی آن به گوگل با پیغام خطای مربوط به آن روبرو خواهید شد.


منبع : ایران سئو

مطالب مرتبط

چگونه از طریق سیستم های جستجو ترافیک برای سایت خود بدست آوریم؟


دو نكته بسیار مهم وابتدائی دررابطه با اینكه چگونه با سیستم های جستجو كار كنیم و چگونه بهترین كارآئی مقدور را از سیستم های جستجو به نفع سایت بدست آوریم ٫ وجوددارد.
۱. سایت خودرا به نحواحسن در سیستم های جستجوی مختلف به ثبت برسانید
۲. سایت خودرابرای واژه های مربوط به سایت در هنگام جستجو قابل دیدن كنید
ربوت های سیستم های جستجوی سایت ها یك سیستم احمقی است كه فقط میتوانند نوشته ها را بخوانند و همچنین پیروی از لینك های آماری نمایند٫ بدین معنی كه این قبیل ربوت ها قادر به درك یك نوشته در یك تصویر نمی باشند و همچنین متاسفانه از درك جاواسكریپت ویا قاب ها ویا لینك های تركیبی عـاجـزند
چگونه مشكلات سایت خود را بیابیم؟
یكی از روش ها استفاده از لینك زیر است
http://www.searchengineworld.com/cgi-bin/sim_spider.cgi
كه این طریقه ماشین عنكبوتی روی موضوع كه سایت شماست مطالعه كرده و نقاط ضعف وقوت آن را میشناساند
امابرای بهتر دیده شدن چه بایستی كرد؟
حروف ? و & و = درهنگام خواندن آدرس یك صفحه بوسیله ربوت ها قابل رؤیت وخواندن نیست
لذابعنوان مثال آدرس :
http://www.qmars.dk/pageexample.asp?wid=۱۲ نمی تواند بوسیله ربوت ها رؤیت گردد
البته می توان این قبیل آدرس ها را با فیلتر ISAPI به نوشته قابل فهمی برای سیستم های جستجو تبدیل نمود
Relativ URL
URL های نسبی نیز میتوانند برای ماشین های جستجو زحمت زا باشند كه البت این اشكال و تحقیق درمورد آن را میتوان بوسیله Spider Simulator برطرف نمود
كنترل نمایانگرها
فراموش نشود كه مابایستی كاری كنیم كه ربوت ها برای دسترسی به سایت ما و اندیس گذاری آن دچار مشكل و یا دشواری نباشند زیرا كه مشكل آنها در واقع مشكل سایت مااست
یكی از فراوان ترین مشكل دررابطه با ربوت ها مشكل تشخیص اینكه كدام نمایانگر بایستی برای این سایت در نظرگرفته شده باشد وحتی درمواردی مثلا Googlebot اگر نتواند كه كدام BROWSER را بایستی انتخاب كند كه به این سایت بیاید در نتیجه كل آن را ندیده میگیرد
پس سفارش میشود كه :
• هرصفحه بوسیله یك نمایانگر بطوركامل همخوانی داشته باشد
• كاربر در صورت بكار بردن یك نمایانگر پیش بینی نشده به یك صفحه مناسب هدایت شود
مـنـوهای جاواسكریپت
این قبیل منوها كه سایت كیومرث نیز آن را بكار برده است یكی از مشكلات سنگین برای ربوت ها میباشد
لذا حتی المكان از بكار بردن این قبیل منوها خودداری گردد٫
البته بزرگترین دلیل آن این است كه ربوت ها از درك و فهم لینك های موجود در این قبیل منوها عاجز هستند
قـــاب ها (FRAME)
سایت هائی كه از قاب استفاده میكنند بوسیله ربوت ها قابل رؤیت نیستند لذا از بكاربردن قاب تا حدامكان اجتناب شود
ولی اگر این امكان وجود ندارد سفارش میشود كه تمام صفحه های موجود در قاب ها بیستی كاملا در رابطه با ربوت ها
بررسی كامل گردد واینكه هرصفحه در یك قاب میتواند به تنهائی بوسیله ربوت شكار شود
وهمچنین سفارش میشود كه در تمام صفحات موجود در قاب ها بوسیله یك
سكریپت در صورتی كه صفحه در قاب خود جا نیاید به صفحه اول سایت هدایت گردد
لینك ها(LINK)
یكی از مسائل بسیار مهم دررابطه با ربوت ها این است كه آنها این امكان را داشته باشند
كه به كلیه محتویات سایت شما كه عبارتند از تعدادی صفحه دسترسی داشته باشند كه با خواندن و آنالیز آنها
بتوانند سایت شما را اندیس گذاری نمایند
درنتیجه سفارش میشود كه یك شبكه لینك درست نمایید كه در آن آدرس تمام صفحات شما درآنجا قید گردیده باشد
حال با قرارددادن این مجموعه لینك در میان تاگ NOSCRIPT این امكان را به ربوت میدهید كه این لینك ها را بخواند
مثال :
<NOSCRIPT>
<A href="page۱.htm">صفحه اول </A>
<A href="page۲.htm">صفحه دوم </A>
<A href="page۳.htm">صفحه سوم </A>
<A href="page۴.htm">صفحه چهارم </A>
<A href="page۵.htm">صفحه پنجم</A>
<A href="page۶.htm">صفحه ششم </A>
</NOSCRIPT>
درغیراین صورت می توان از یك تصویر ترانسپارانت GIF استفاده نمود ودر قسمت آلترناتیو آن میتوان این مجموعه لینك را قرار داد
سفارش میشود كه این تصویر با سایز حداقل ده در ده باشد یعنی ارتفاع آن ده و عرض آن نیز ده باشد
چراكه بعضی از ربوت ها سایزكمتر را نمی بینند
یكی دیگر از امكانات استفاده از NOFRAME است كه ترتیب آن دقیقا مثل NOSCRIPT میباشد
در صفحه اول سایتتان سفارش میشود كه از NOFRAME همراه با شبكه لینك های دیگر صفحه هایتان را قرار دهید
در ضمن در همین منظقه می توانید به مقدار دویست كلمه را بنویسید چون این كلمه ها نیز بوسیله ربوت خواند میشود
درجـــه یــا انـدازه دیـــده شـدن سایت
اگر تا حال همه نكات بالا را كه دررابطه با دردسترس قرار دادن داده های مورد نیاز ربوت ها را رعایت كرده اید اینك به مرحله بعدی كار كه احتمال بیشتر دیده شدن را در سیستم های جستجو بالا می برد را نظری می افكنیم
تـیـتـر صـفـحه(TITLE)
مهم ترین مطلب ویا واژه مورد كاربرد در سایت حتما بایستی در تیتر صفحه بیاید همیشه بیاد داشته باشیم كه هرصفحه در سایت مــا بایستی تیتر ویژه خود را داشته باشد ودر همه تیتر های سایت شما سفارش میشود كه نام شركت ٫ مؤسسه ویا سایت شما بایستی بصورت مثال زیر در تیتر ها قید گردد
<TITLE> farsi names - qmars interactive site</TITLE>
و
<TITLE> persian chat - qmars interactive site</TITLE>
و
<TITLE> iranian FAQ - qmars interactive site</TITLE>
بدین معنی كه qmars interactive site درهمه صفحه ها در قسمت تیتر آن صفحه تكرار میشود
• هــرصفحه فـقـط یك تیتر دارد نه بیشتر
• بیشترین تعداد حرفی را كه میتوان در قسمت تیتر نوشت ٦٥ حرف است كه با احتساب فاصله بین واژه ها كه خود نیز حرفی است تعداد در جمع به ٧٥ حرف میرسد ونه بیشتر
• بكاربردن تعداد حروف بیشتراز این ماكزیمم نه فـقـط قابل خواندن نیست بلكه باعث زیان زدن به صفحه مورد نظرتان میباشد
اطلاعاتی درباره META
توضیحــی(Description)
واژه های كلیدی(KEYWORD)
تیتر های سرصفحه(H۱, H۲,...)
اشتهارویامعروفیت لینك ها ووزن آنها(Link Popularity)
این سیستم هـا هــروزه تكمیل وتكمیل تر میشود

وبگردی
مقایسه بودجه مراکز حوزوی با دانشگاه ها
مقایسه بودجه مراکز حوزوی با دانشگاه ها - به‌جز وزارت ارشاد، هیچ‌یک از این 40 ارگان و نهاد در قبال میلیاردها تومان بودجه‌هایی که دریافت می‌دارند پاسخگو نبوده نیستند.
ویدئویی از لحظات اولیه برخورد کشتی چینی با نفتکش سانچی و انفجار
ویدئویی از لحظات اولیه برخورد کشتی چینی با نفتکش سانچی و انفجار - ویدئویی از لحظات اولیه برخورد کشتی چینی با نفتکش سانچی و انفجار
فیلم/ گریه شدید وزیر کار در گفت‌و‌گوی تلفنی با خانواده خدمه نفتکش «سانچی»
فیلم/ گریه شدید وزیر کار در گفت‌و‌گوی تلفنی با خانواده خدمه نفتکش «سانچی» - علی ربیعی وزیر کار، رفاه و امور اجتماعی در گفت‌وگوی تلفنی با خانواده یکی از خدمه نفتکش «سانچی» اظهار همدردی کرد.
تصاویر هولناک از آخرین لحظات کشتی سانچی
تصاویر هولناک از آخرین لحظات کشتی سانچی - توقف عملیات خنک سازی و مهار آتش در شب گذشته، موجب رسیدن آتش به مخازن سمت چپ کشتی و انفجارهای شدید صبح امروز شد که در نهایت پس از چند ساعت به غرق شدن کامل نفتکش ایرانی انجامید.
از «خس و خاشاک» دیروز تا «آشغال» امروز
از «خس و خاشاک» دیروز تا «آشغال» امروز - این اتفاق بیشتر از هر موضوع دیگری سبب شد تا مردم یاد خاطرات سال ۸۸ بیفتند؛ آن زمانی که یک فرد با به زبان آوردن سخنانی ناشایست و بدون تفکر، مردمی را که برای بیان خواسته‌های‌شان به خیابان‌ها آمده‌ بودند، خس و خاشاک خواند و سبب شعله‌ور شدن آتش شد.
عدالت با  6 دلار در سال!
عدالت با 6 دلار در سال! - فیلم - رضا رشیدپور در برنامه حالا خورشید با کنایه به واریز سود سهام عدالت گفت: به خارجی ها نگوییم این سود سهام عدالت ماست، بگوییم ما روز شش دلاری مزگان داریم.
تحقیری که در دنیا میشویم / نفتکش ایرانی خدمه ایرانی با پرچم پاناما
تحقیری که در دنیا میشویم / نفتکش ایرانی خدمه ایرانی با پرچم پاناما - اگر از همه این ابهامات در خصوص مالکیت این کشتی که بگذریم، مهم‌ترین سوالی که این روز‌ها مطرح است، به آتشی باز می‌گردد که ظاهرا قرار نیست خاموش شود و یک هفته است که می‌سوزد. حریقی که اگر نبود حادثه پلاسکو، ممکن بود آن را ناشی از بزرگ بودن سانچی و حجم زیاد بارش بدانیم یا برعکس، از ناتوانی اطفاکنندگان در این ماجرا گلایه سردهیم، اما حالا به شکل گیری ابهامی بزرگ‌تر منجر شده...
ورود بی‌چادر و باآرایش به این بیمارستان ممنوع است
ورود بی‌چادر و باآرایش به این بیمارستان ممنوع است - خانم مسئول انتظامات جلوی درمانگاه بیمارستان بقیه‌الله ایستاده، جلوی زنان مانتویی را می‌گیرد و با گرفتن کارت شناسایی به آنها چادر می‌دهد. خیلی از زنان اینجا قبل از ورود به بیمارستان مانتویی هستند اما با گذشتن از در ورودی چادری می‌شوند.
کسی به ایرانی ها اهمیتی نمی دهد
کسی به ایرانی ها اهمیتی نمی دهد - ممکن است دود وارد محیط ایزوله ای شود که احتمالا دریانوردان در آنجا حضور دارند، پرسیده ایم چرا نجاتشان تا این حد طولانی شده است؟ گفته می شود چینی ها کم کاری می کنند ناراحتم از اینکه وقتی کشتی چینی تصادف کرد همه سرنشینان آن سالم هستند اما کسی به ایرانی ها اهمیتی نمی دهد.
عکس خواستگاری کریم انصاریفرد از دختر یونانی با زمرد گرانقیمت
عکس خواستگاری کریم انصاریفرد از دختر یونانی با زمرد گرانقیمت - رسانه های مطرح یونانی با انتشار تصاویری از رابطه عاطفی ملی پوش ایرانی باشگاه المپیاکوس با یک میلیاردر یونانی - آمریکایی پرده برداشتند و مدعی شدند این دو تصمیم خود را برای ازدواج قطعی کرده اند.
چرا حداد و ولایتی بیشتر از 50 شغل دارند؟
چرا حداد و ولایتی بیشتر از 50 شغل دارند؟ - بخشی از تکثر مسئولیت های بعضی چهره‌های سیاسی به بی‌اعتمادی نظام به افراد کارآمد برمی‌گردد و علت دیگر این موضوع، اعتماد غیرمعقول به این افراد است. با این حال این افراد هرچقدر هم که توانمند باشند، از نظر روان شناسی و انسان شناسی در بخشی از مسئولیت های خود ناموفقند.
فیلم نابغه ۱۰ ساله‌ طراح خودرو / قبلی هم انرژی هسته ای کشف کرده بود!
فیلم نابغه ۱۰ ساله‌ طراح خودرو / قبلی هم انرژی هسته ای کشف کرده بود! - فیلم - حسین عطایی ۱۰ سال دارد و در حوزه طراحی مفهومی خودرو فعالیت می کند. او ۶ اختراع ثبت شده دارد، مدرسه نمی رود و از دو شرکت تسلا و ولوو دعوت به همکاری شده است. او مشاور رییس سازمان برنامه و بودجه است. گفتگوی رضا رشیدپور با نابغه ١٠ساله طراحی خودرو را اینجا ببینید.
تست تصادف سمند در انگلیس / فقط با سرعت 50 کیلومتر در ساعت !
تست تصادف سمند در انگلیس / فقط با سرعت 50 کیلومتر در ساعت ! - تست برخورد جلوی خودرو با سرعت 50 کیلومتر در ساعت برای سمند TU5 ، توسط یکی از سازمانهای معتبر ارزیابی خودرو در انگلستان صورت گرفت.
کشور محل درمان آیت الله هاشمی شاهرودی مشخص شد (+عکس)
کشور محل درمان آیت الله هاشمی شاهرودی مشخص شد (+عکس) - سرانجام بعد از مدت ها سکوت درباره این که آیت الله سیدمحمود هاشمی شاهرودی برای درمان به کدام کشور رفته است، خبرگزاری اهل بیت(ع) از درمان رئیس مجمع تشخیص مصلحت نظام در آلمان خبر داد و نوشت:
فیلم جنجالی از حجت الاسلام قاسمیان در کرمانشاه
فیلم جنجالی از حجت الاسلام قاسمیان در کرمانشاه - این فیلم حواشی زیادی را در فضای مجازی به همراه داشته است.
جنجال نیوشا ضیغمی: من اصلا ایشان را آدم حساب نمیکنم
جنجال نیوشا ضیغمی: من اصلا ایشان را آدم حساب نمیکنم - اولین قسمت از برنامه هاردتاک کاکتوس را با صحبت های جذاب نیوشا ضیغمی در مورد خانواده و همسرش ، ماجرای صحبت های جنجالی یک هواپیما ، 8 سال احمدی نژاد و ...
    پربازدیدها