جمعه, ۱ فروردین, ۱۴۰۴ / 21 March, 2025
مهارت در جستجوی اطلاعات از طریق اینترنت

خط فارسی دارای مشكلات مختلفی است كه در جستجو و بازیابی اطلاعات، مسائل و مشكلات فراوانی را فراروی كابران اینترنت قرار میدهد. به خصوص با رشد سریع انتشارات الكترونیكی بر روی وب در شكلهای مختلف پایگاههای اطلاعاتی، وبلاگ و... هیچ قاعده مشخص و ثابتی برای رسمالخط فارسی وجود ندارد و این مسأله باعث شده تا جستجوگران مطالب فارسی با مشكلات فراوانی روبرو شوند.
اینترنت به عنوان یك محمل اطلاعاتی عظیم، منابع اطلاعاتی را در مقیاسی وسیع در دسترس مخاطبان بالقوه قرار داده است. سهولت دسترسی به منابع اطلاعاتی اعم از متن و سایر رسانهها عمدهترین مزیت اینترنت محسوب میشود. این توانایی كه هر كس ناشر آثار خود باشد عواقب ناخواستهای را نیز در پی خواهد داشت و آشكارترین معضل، آن است كه انبوهی از منابع بسیار متنوع و غیرقابل مدیریت را فراهم میآورد.
افزایش سریع منابع اینترنتی نیازمند یك سازماندهی مفید و مؤثر است. هرچند در حال حاضر راهنمایهایی برای منابع اینترنتی تهیه شده است كه براساس فایلهای مقلوب ساخته شدهِ توسط موتورهای جستجو و با استفاده از قابلیتهای مختلف این موتورها از جمله؛ استفاده از عملگرهای بولی، جستجوی دقیق عبارت، محدود كردن یك جستجو به بخش خاصی از ركورد (مانند عنوان، آدرس) كوتاهسازی كلمات، جستجوی نزدیكیابی واژهها، ایجاد محدودیت زمانی و منطقهای و زبانی و .... به جستجوی اطلاعات كمك میكند اما باید تاكید كرد كه در امر بازیابی اطلاعات از اینترنت بدون نمایهسازی نظام یافته نمیتوان انتظار بازیابی مفید و مؤثر را داشت. هرچند بیشترین اطلاعات موجود بر روی اینترنت به زبان انگلیسی است، ولی حجم اطلاعات به زبان فارسی نیز با سرعت در حال افزایش است و كاربران به دلایل مختلفی علاقه زیادی به اطلاعات فارسی نشان میدهند و از آن جایی كه زبان غالب در اینترنت انگلیسی است، جستجو به زبانهای غیرانگلیسی از جمله فارسی، مسایل و مشكلات مختلفی را جدای از مشكلات عمومی اینترنت دارد.
حجم اطلاعات به زبان فارسی در روی اینترنت در اشكال مختلف آن به سرعت رشد كرده است. در حال حاضر توسعه وبلاگهای فارسی، سایتهای علمی، تبلیغاتی و دانشگاهی به زبان فارسی باعث شده است كه جایگاه زبان فارسی تا حد زبان اول ارتباطات اینترنتی نزد ایرانیان و فارسیزبانان در سراسر جهان ارتقا یابد. شاید بتوان گفت كه اولین مرجع وبلاگنویسی فارسی با انتشار راهنمای ساخت وبلاگ فارسی آغاز شده است.
بدون شك دومین موج نیز با شروع به كار سایت پرشین بلاگ كه امكان راهاندازی وبلاگ برای كاربران فارسی زبان را با سهولت بیشتری فراهم میكند آغاز شده است. اما پیامد قابل توجه دیگری كه رشد وبلاگنویسی در ایران داشته است پیدایش سایتهای اینترنتی فارسی زبانی است كه صاحبان وبلاگها ایجاد كردهاند و این خود موج جدیدی از گسترش كاربرد اینترنت در جامعه ایران به حساب میآید. اكنون روی آوردن برخی از روزنامهنگاران، پژوهشگران، دانشجویان به وب فارسی و استفاده از منابع خبری، علمی و .... موجب تقویت نقش رسانهای وب فارسی شده است.
پدیده دیگری كه باعث گسترش زبان و خط فارسی در اینترنت شده است، ایجاد كتابخانههای دیجیتالی فارسی در شبكه جهانی است. با این كه از شكلگیری كتابخانههای فارسی در شبكه جهانی مدت زیادی نمیگذرد، اما با این حال به سرعت در حال رشد و گسترش است. شماری از این كتابخانهها در پایگاههای اینترنتی شكل گرفتهاند و بسیاری وبلاگهایی هستند كه برای این كار راهاندازی شدهاند.
از ویژگیهای این كتابخانهها این است كه هیچ یك جنبه تجاری ندارند. آنچه در بسیاری از كتابخانههای مجازی فارسی در دسترس است تنها شامل كتاب نیست، بلكه نوشتههایی اعم از داستان، مقاله، تك نگاشت و .... نیز در میان مجموعهها دیده میشود. هم چنین آثاری كه احتمالاً هیچ گاه چاپ كاغذی ندارند و البته وجود كتابهایی كه مدتهاست نایاب هستند و مجال انتشار دوباره نیافتهاند و یا آثاری كه امروز به دلایلی بازچاپ آنها مقدور نیست، از جاذبههای كتابخانههای مجازیاند. پایگاه اینترنتی كتابهای رایگان فارسی، پایگاه اینترنتی بانی تك، كتابخانه مجازی داستانهای فارسی، آوای آزاد، پایگاه اینترنتی خوابگرد، كتابخانه دوات، پایگاه اینترنتی سخن، وبلاگ كتابخانه هرمس، پایگاه اینترنتی گفتمان، پایگاه تاریخ و فرهنگ ایران زمین، پایگاه مركز جهانی اطلاعرسانی آل البیت، كتابخانه پایگاه اینترنتی حوزه، پایگاه اینترنتی امام علی (ع)، پایگاه اینترنتی كتابخانه دیجیتال و .... شماری از این كتابخانهها هستند.
كاربران به دلایل مختلفی از قبیل «دسترسی آسان و ارزان به حجم عظیم اطلاعات، عدم نیاز اطلاعات یافته شده از اینترنت به تایپ مجدد، دسترسی سریع و اطلاعات جدید، صرفهجویی در وقت و عدم تسلط اكثر كاربران به زبان انگلیسی كه زبان غالب بر اینترنت است» به دنبال اطلاعات فارسی از اینترنت هستند. گسترش زبان و انبوهی از نوشتارها ایجاب میكند كه خط ضابطه داشته باشد و از سوی دیگر پیشرفت فنآوری و پیدایش اینترنت خواستار ضابطه و قانونمندی است. اطلاعرسانی كه جنبه بینالملی پیدا كرده است بدون دستورِ خطی سامان یافته و نظاممند میسر نیست و دستكم بر دشواریها میآفریند.
در حال حاضر وبلاگهای فارسی مقام دوم یا سوم را در جهان دارا میباشد. به نظر دكتر آشوری، اگر زبان فارسی به همین صورت بیدقت در اینترنت به كار رود در سطح زبانی برای تفنن باقی خواهد ماند و كمتر حرفی جدی به این زبان زده خواهد شد. آینده زبان فارسی در اینترنت بستگی به این دارد كه نویسندگان فارسی تا چه حد كار خود را جدی بگیرند و این زبان را بازسازی كنند كه از لحاظ قدرت بیان و دقت مفاهیم و استواری ساختار دستوری به زبان انگلیسی نزدیك شود.
نبود استاندارد ثابت رسمالخط فارسی موجب این شده است كه به تعداد صفحات وب فارسی سبك و سیاق نگارش به كار رفته باشد، لذا میتوان چنین ارزیابی كرد كه اكثر وبهای فارسی در برخی خصوصیات مشترك میباشند از جمله این كه نگارش برخی از آنها زبان غیررسمی و محاورهای است و به خصوص در متون علمی اغلب واژههای بیگانه به دفعات استفاده میشود. رسمالخط مورد استفاده نیز متفاوت و سلیقهای است و برخی از آنها غلطهای تایپی و نگارشی فراوانی دارند و این خصوصیات، اغلب به جهت محدودیتهای محیط الكترونیكی و عدم تطابق رسمالخط فارسی با آن میباشد كه نمایهسازی و سپس جستجو به این زبان را با دشواریهایی رو به رو میسازد.
با توجه به این نكته كه اطلاعات ارزشمند فراوانی در اینترنت وجود دارد و اینترنت با شتابی فراوان به یك منبع اطلاعاتی ممتاز تبدیل شده است. موتورهای جستجو به عنوان یكی از اساسیترین دروازههای ورود به منابع اینترنتی دارای ضعفهایی هستند .
▪ میتوان به این موارد اشاره كرد:
- در یك مجموعه از یافتههای بازیابی شده مدخلهای تكراری فراوانی ملاحظه میشود.
- نتایج غیر قابل پیشبینی هستند.
- نتایج چه بسا گمراه كننده باشند؛ ممكن است جستجویی در یك موتور كاوش نتیجهای نداشته، ولی در موتور دیگر دارای یافتههای فراوان باشد.
- موتورهای كاوش محتویات پایگاههای اطلاعاتی خودشان را نشان نمیدهند و از معیارهایی كه برای گنجاندن یك مدرك در فایلهایشان دارند حتی شرحی ارایه نمیكنند.
- مهار واژگانی وجود ندارد و قواعد نقطهگذاری و بزرگنویسی نیز استاندارد نیست.
- بدون بررسی عملی هر عنصر، اغلب نمیتوان میزان ربط و رابطهها را تحلیل كرد. یعنی اطلاعات كافی در مدخل نمایه نیست تا فرد بتواند دست به انتخاب بزند.
- عدم توان موتورهای جستجو در تمایز میان مداركی كه توسط فرد الف نوشته شده و مداركی كه درباره فرد الف نوشته شده است.
- منابع قابل توجهی در شبكه وب وجود دارند كه توسط موتورهای جستجو نمایه نمیشوند. به این بخش از وب اصطلاحاً وب نامریی میگویند. «وب نامریی بخش بزرگی از وب است كه موتورهای جستجو آنها را نمیتوانند نمایه كنند و عبارتند از: سایتهای دارای رمز عبور، فایلهای پی.دی.اف از متون آرشیو شده، ابزارهای تعاملی نظیر ماشین حسابها و برخی از واژهنامهها و همچنین بعضی از پایگاههای اطلاعاتی، منابع محافظت شده از طریق اسم كاربر و گذر واژه، منابع و صفحات وب بدون پیوند و صفحات افزون بر حداكثر تعداد صفحات قابل مرور.»
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست