سه شنبه, ۱ خرداد, ۱۴۰۳ / 21 May, 2024
مجله ویستا

مهارت در جستجوی اطلاعات از طریق اینترنت


مهارت در جستجوی اطلاعات از طریق اینترنت

خط فارسی دارای مشكلات مختلفی است كه در جستجو و بازیابی اطلاعات, مسائل و مشكلات فراوانی را فراروی كابران اینترنت قرار می دهد

خط فارسی دارای مشكلات مختلفی است كه در جستجو و بازیابی اطلاعات، مسائل و مشكلات فراوانی را فراروی كابران اینترنت قرار می‌دهد. به خصوص با رشد سریع انتشارات الكترونیكی بر روی وب در شكل‌های مختلف پایگاه‌های اطلاعاتی، وبلاگ و... هیچ قاعده مشخص و ثابتی برای رسم‌الخط فارسی وجود ندارد و این مسأله باعث شده تا جستجوگران مطالب فارسی با مشكلات فراوانی روبرو شوند.

اینترنت به عنوان یك محمل اطلاعاتی عظیم، منابع اطلاعاتی را در مقیاسی وسیع در دسترس مخاطبان بالقوه قرار داده است. سهولت دسترسی به منابع اطلاعاتی اعم از متن و سایر رسانه‌ها عمده‌ترین مزیت اینترنت محسوب می‌شود. این توانایی كه هر كس ناشر آثار خود باشد عواقب ناخواسته‌ای را نیز در پی خواهد داشت و آشكارترین معضل، آن است كه انبوهی از منابع بسیار متنوع و غیرقابل مدیریت را فراهم می‌آورد.

افزایش سریع منابع اینترنتی نیازمند یك سازمان‌دهی مفید و مؤثر است. هرچند در حال حاضر راهنمای‌هایی برای منابع اینترنتی تهیه شده است كه براساس فایل‌های مقلوب ساخته شدهِ توسط موتورهای جستجو و با استفاده از قابلیت‌های مختلف این موتورها از جمله؛ استفاده از عملگرهای بولی، جستجوی دقیق عبارت، محدود كردن یك جستجو به بخش خاصی از ركورد (مانند عنوان، آدرس) كوتاه‌سازی كلمات، جستجوی نزدیك‌یابی واژه‌ها، ایجاد محدودیت زمانی و منطقه‌ای و زبانی و .... به جستجوی اطلاعات كمك می‌كند اما باید تاكید كرد كه در امر بازیابی اطلاعات از اینترنت بدون نمایه‌سازی نظام یافته نمی‌توان انتظار بازیابی مفید و مؤثر را داشت. هرچند بیشترین اطلاعات موجود بر روی اینترنت به زبان انگلیسی است، ولی حجم اطلاعات به زبان فارسی نیز با سرعت در حال افزایش است و كاربران به دلایل مختلفی علاقه زیادی به اطلاعات فارسی نشان می‌دهند و از آن جایی كه زبان غالب در اینترنت انگلیسی است، جستجو به زبان‌های غیرانگلیسی از جمله فارسی، مسایل و مشكلات مختلفی را جدای از مشكلات عمومی اینترنت دارد.

حجم اطلاعات به زبان فارسی در روی اینترنت در اشكال مختلف آن به سرعت رشد كرده است. در حال حاضر توسعه وبلاگ‌های فارسی، سایت‌های علمی، تبلیغاتی و دانشگاهی به زبان فارسی باعث شده است كه جایگاه زبان فارسی تا حد زبان اول ارتباطات اینترنتی نزد ایرانیان و فارسی‌زبانان در سراسر جهان ارتقا یابد. شاید بتوان گفت كه اولین مرجع وبلاگ‌نویسی فارسی با انتشار راهنمای ساخت وبلاگ فارسی آغاز شده است.

بدون شك دومین موج نیز با شروع به كار سایت پرشین بلاگ كه امكان راه‌اندازی وبلاگ برای كاربران فارسی زبان را با سهولت بیش‌تری فراهم می‌كند آغاز شده است. اما پیامد قابل توجه دیگری كه رشد وبلاگ‌نویسی در ایران داشته است پیدایش سایت‌های اینترنتی فارسی زبانی است كه صاحبان وبلاگ‌ها ایجاد كرده‌اند و این خود موج جدیدی از گسترش كاربرد اینترنت در جامعه ایران به حساب می‌آید. اكنون روی آوردن برخی از روزنامه‌نگاران، پژوهش‌گران، دانشجویان به وب فارسی و استفاده از منابع خبری، علمی و .... موجب تقویت نقش رسانه‌ای وب فارسی شده است.

پدیده دیگری كه باعث گسترش زبان و خط فارسی در اینترنت شده است، ایجاد كتابخانه‌های دیجیتالی فارسی در شبكه جهانی است. با این كه از شكل‌گیری كتابخانه‌های فارسی در شبكه جهانی مدت زیادی نمی‌گذرد، اما با این حال به سرعت در حال رشد و گسترش است. شماری از این كتابخانه‌ها در پایگاه‌های اینترنتی شكل گرفته‌اند و بسیاری وبلاگ‌هایی هستند كه برای این‌ كار راه‌اندازی شده‌اند.

از ویژگی‌های این‌ كتابخانه‌ها این است كه هیچ‌ یك جنبه تجاری ندارند. آنچه در بسیاری از كتابخانه‌های مجازی فارسی در دسترس است تنها شامل كتاب نیست، بلكه نوشته‌هایی اعم از داستان، مقاله، تك نگاشت و .... نیز در میان مجموعه‌ها دیده می‌شود. هم چنین آثاری كه احتمالاً هیچ گاه چاپ كاغذی ندارند و البته وجود كتاب‌هایی كه مدت‌هاست نایاب‌ هستند و مجال انتشار دوباره نیافته‌اند و یا آثاری كه امروز به دلایلی بازچاپ آن‌ها مقدور نیست، از جاذبه‌های كتابخانه‌های مجازی‌اند. پایگاه اینترنتی كتاب‌های رایگان فارسی، پایگاه اینترنتی بانی تك، كتابخانه مجازی داستان‌های فارسی، آوای آزاد، پایگاه اینترنتی خوابگرد، كتابخانه دوات، پایگاه اینترنتی سخن، وبلاگ كتابخانه هرمس، پایگاه اینترنتی گفتمان، پایگاه تاریخ و فرهنگ ایران زمین، ‌پایگاه مركز جهانی اطلاع‌رسانی آل البیت، كتابخانه پایگاه اینترنتی حوزه، پایگاه اینترنتی امام علی (ع)، پایگاه اینترنتی كتابخانه دیجیتال و .... شماری از این كتابخانه‌ها هستند.

كاربران به دلایل مختلفی از قبیل «دسترسی آسان و ارزان به حجم عظیم اطلاعات، عدم نیاز اطلاعات یافته شده از اینترنت به تایپ مجدد، دسترسی سریع و اطلاعات جدید، صرفه‌جویی در وقت و عدم تسلط اكثر كاربران به زبان انگلیسی كه زبان غالب بر اینترنت است» به دنبال اطلاعات فارسی از اینترنت هستند. گسترش زبان و انبوهی از نوشتارها ایجاب می‌كند كه خط ضابطه داشته باشد و از سوی دیگر پیشرفت فن‌آوری و پیدایش اینترنت خواستار ضابطه و قانونمندی است. اطلاع‌رسانی كه جنبه بین‌الملی پیدا كرده است بدون دستورِ خطی سامان یافته و نظام‌مند میسر نیست و دست‌كم بر دشواری‌ها می‌آفریند.

در حال حاضر وبلاگ‌های فارسی مقام دوم یا سوم را در جهان دارا می‌باشد. به نظر دكتر آشوری، اگر زبان فارسی به همین صورت بی‌دقت در اینترنت به كار رود در سطح زبانی برای تفنن باقی خواهد ماند و كم‌تر حرفی جدی به این زبان زده خواهد شد. آینده زبان فارسی در اینترنت بستگی به این دارد كه نویسندگان فارسی تا چه حد كار خود را جدی بگیرند و این زبان را بازسازی كنند كه از لحاظ قدرت بیان و دقت مفاهیم و استواری ساختار دستوری به زبان انگلیسی نزدیك شود.

نبود استاندارد ثابت رسم‌الخط فارسی موجب این شده است كه به تعداد صفحات وب فارسی سبك و سیاق نگارش به كار رفته باشد، لذا می‌توان چنین ارزیابی كرد كه اكثر وب‌های فارسی در برخی خصوصیات مشترك می‌باشند از جمله این كه نگارش برخی از آن‌ها زبان غیررسمی و محاوره‌ای است و به خصوص در متون علمی اغلب واژه‌های بیگانه به دفعات استفاده می‌شود. رسم‌الخط مورد استفاده نیز متفاوت و سلیقه‌ای است و برخی از آن‌ها غلط‌های تایپی و نگارشی فراوانی دارند و این خصوصیات، اغلب به جهت محدودیت‌های محیط الكترونیكی و عدم تطابق رسم‌الخط فارسی با آن می‌باشد كه نمایه‌سازی و سپس جستجو به این زبان را با دشواری‌هایی رو به رو می‌سازد.

با توجه به این نكته كه اطلاعات ارزشمند فراوانی در اینترنت وجود دارد و اینترنت با شتابی فراوان به یك منبع اطلاعاتی ممتاز تبدیل شده است. موتورهای جستجو به عنوان یكی از اساسی‌ترین دروازه‌های ورود به منابع اینترنتی دارای ضعف‌هایی هستند .

▪ می‌توان به این موارد اشاره كرد:

- در یك مجموعه از یافته‌های بازیابی شده مدخل‌های تكراری فراوانی ملاحظه می‌شود.

- نتایج غیر قابل پیش‌بینی هستند.

- نتایج چه بسا گمراه كننده باشند؛ ممكن است جستجویی در یك موتور كاوش نتیجه‌ای نداشته، ولی در موتور دیگر دارای یافته‌های فراوان باشد.

- موتورهای كاوش محتویات پایگاه‌های اطلاعاتی خودشان را نشان نمی‌دهند و از معیارهایی كه برای گنجاندن یك مدرك در فایل‌هایشان دارند حتی شرحی ارایه نمی‌كنند.

- مهار واژگانی وجود ندارد و قواعد نقطه‌گذاری و بزرگ‌نویسی نیز استاندارد نیست.

- بدون بررسی عملی هر عنصر، اغلب نمی‌توان میزان ربط و رابطه‌ها را تحلیل كرد. یعنی اطلاعات كافی در مدخل نمایه نیست تا فرد بتواند دست به انتخاب بزند.

- عدم توان موتورهای جستجو در تمایز میان مداركی كه توسط فرد الف نوشته شده و مداركی كه درباره فرد الف نوشته شده است.

- منابع قابل توجهی در شبكه وب وجود دارند كه توسط موتورهای جستجو نمایه نمی‌شوند. به این بخش از وب اصطلاحاً وب نامریی می‌گویند. «وب نامریی بخش بزرگی از وب است كه موتورهای جستجو آن‌ها را نمی‌توانند نمایه كنند و عبارتند از: سایت‌های دارای رمز عبور، فایل‌های پی.دی.اف از متون آرشیو شده، ابزارهای تعاملی نظیر ماشین حساب‌ها و برخی از واژه‌نامه‌ها و هم‌چنین بعضی از پایگاه‌های اطلاعاتی، منابع محافظت شده از طریق اسم كاربر و گذر واژه، منابع و صفحات وب بدون پیوند و صفحات افزون بر حداكثر تعداد صفحات قابل مرور.»


شما در حال مطالعه صفحه 1 از یک مقاله 2 صفحه ای هستید. لطفا صفحات دیگر این مقاله را نیز مطالعه فرمایید.