دوشنبه, ۱۷ اردیبهشت, ۱۴۰۳ / 6 May, 2024
مجله ویستا


مسائل‌ زبان‌ و خط فارسی‌ در ذخیره‌‌سازی و بازیابی‌ اطلاعات


مسائل‌ زبان‌ و خط فارسی‌ در ذخیره‌‌سازی و بازیابی‌ اطلاعات
بانك‌های‌ اطلاعاتی‌ فارسی‌، پیش‌ از آن‌ كه‌ فرهنگستان‌ زبان‌ معیارهای‌ لازم‌ را برای‌كاربرد اصطلاحات‌ علمی‌ و رسم‌الخط فارسی‌ تعیین‌ كند شكل‌ گرفتند. مجریان‌بانك‌های‌ اطلاعاتی‌ و نمایه‌سازان‌، خواسته‌ یا ناخواسته‌ ـ با مسائل‌ واژه‌ گزینی‌ و جنبه‌هایی‌ از زبانشناسی‌ درگیر شدند. در كار واژه‌ گزینی‌، اطلاع‌‌رسانان‌ ـ به‌ لحاظ ماهیت‌ حرفه‌خود ـ واژه‌های‌ رایج‌ در جامعه‌ تولیدكنندگان‌ و استفاده‌ كنندگان‌ از اطلاعات‌ را مد نظردارند و خود را مجاز به‌ واژه‌سازی‌ و اعمال‌ سلیقه‌ نمی‌دانند. واژه‌های‌ تازه‌ ساخت‌ نیز تازمانی‌ كه‌ در جامعه‌ مقبولیت‌ لازم‌ را به‌ دست‌ نیاورده‌ باشند و در مدارك‌ به‌ كرات‌ دیده ‌نشوند، در نظام‌های‌ ذخیره‌ و بازیابی‌ اطلاعات‌ یا ظاهر نمی‌شوند و یا میهمان‌ چندروزه‌اند. بخش‌ قابل‌ توجهی‌ از مشكلات‌ نمایه‌‌سازان‌ از رواج‌ و كاربرد واژه‌ ناشی‌ می‌شود.متخصصان‌ برای‌ یك‌ مفهوم‌ واحد اصطلاحات‌ متفاوت‌ به‌ كار می‌برند. حتی‌ متخصصانی‌كه‌ در یك‌ رشته‌ و در یك‌ جامعه‌ كوچك‌ كار می‌كنند خود را ملزم‌ به‌ هماهنگی‌ در كاربرد واژه‌های‌ تخصصی‌ نمی‌بینند. به‌ علاوه‌ برای‌ بسیاری‌ از اصطلاح‌های‌ وارداتی‌ معادل‌های ‌متفاوت‌ در زبان‌ فارسی‌ وجود دارد كه‌ در مواردی‌ همه‌، كم‌ و بیش‌، به‌ یك‌ اندازه‌ كاربرد دارند. این‌ گونه‌ مطالب‌ به‌ علاوه‌ مسائل‌ رسم‌الخط فارسی‌، آوانویسی اسامی‌ عناصر وتركیبات‌ شیمیائی‌، سرواژه‌ها و كوته‌‌نوشته‌ها سبب‌ شده‌ است‌ تا ذخیره‌ اطلاعات‌ به‌ زبان‌فارسی‌ با كندی‌ صورت‌ گیرد و جستجو و بازیابی‌ كارایی‌ مطلوب‌ را نداشته‌ باشد.در این‌ مقاله‌ سعی‌ خواهد شد نمونه‌ هایی‌ از تجربه‌های‌ واژه‌ گزینی‌ در ذخیره ‌اطلاعات‌ ارائه‌ شود تا با‌ توجه‌ به‌ آنها، شاهد تسریع‌ و تسهیل‌ ذخیره‌ و بازیابی ‌اطلاعات‌ به‌ زبان‌ فارسی‌ باشیم‌. كتابداران‌ از مدتها پیش‌ دریافتند كه‌ رابطه‌ای‌ مستقیم‌ و الزامی‌ بین‌ تحلیل‌ موضوعی ‌مطالب‌ و زبانشناسی‌ وجود دارد. این‌ رابطه‌ با پیدایش‌ علم‌ اطلاع‌‌رسانی‌ و كاربرد رایانه‌ در این‌ رشته‌، شتاب‌ و اهمیت‌ بیشتری‌ یافت‌. امروزه‌ اطلاع‌‌رسانی‌ و اصطلاح‌شناسی ‌شاخه‌‌هایی‌ از علوم‌ را تشكیل‌ می‌دهند كه‌ ارتباطی‌ نزدیك‌ و مداوم‌ بین‌ آن‌ها برقرار است‌. دانش‌ اطلاع‌رسانی‌ در حوزه‌ء فعالیت‌ خود عمدتاً با اطلاعات‌ نوشتاری‌، كه‌ زبان‌ وسیله ‌اصلی‌ انتقال‌ آن‌ است‌، سروكار دارد. متخصصان‌ در مناسبات‌ علمی‌ از زبان‌های‌ ویژه ‌استفاده‌ می‌كنند. هسته ء ‌اصلی‌ هر زبان‌ ویژه‌، اصطلاحات‌ علمی‌ یا واژگان‌ آن‌ است‌. این‌اصطلاحات‌ برای‌ ارتباط علمی‌ و انتقال‌ صحیح‌ اطلاعات‌ به‌ كار گرفته‌ می‌شود و چنانچه ‌دچار هرج‌ و مرج‌ و نابسامانی‌ شود، طبعاً زبان‌ تفهیم‌ و تفاهم‌ و جریان‌ درست‌ اطلاعات ‌مختل‌ می‌شود. كتابداران‌ و اطلاع‌‌رسانان‌ كه‌ رابط بین‌ تولیدكنندگان‌ و مصرف‌ كنندگان‌ اطلاعات‌ هستند، پیش‌ از سایر متخصصان‌ ضرورت‌ استانداردكردن‌ واژگان‌ علوم‌ را دریافتند و همزمان‌ با توسعه‌ بانك‌های‌ اطلاعاتی‌ به رعایت آن‌ اصرار ورزیدند.در كشورهای‌ غربی‌ بیش‌ از ۳۰ سال‌ است‌ كه‌ رایانه‌ها در ذخیره‌ و بازیابی‌ اطلاعات ‌و ایجاد پایگاه‌های‌ اطلاعات‌ كتابشناختی‌ به ‌‌كار گرفته ‌‌شده‌اند. در این‌ مدت ‌اصطلاحنامه‌های‌ تخصصی‌ متعددی‌ كه‌ بعضی‌ از آنها شهرت‌ و اعتبار دارند، باهمكاری‌ متخصصان‌ موضوعی‌ و زبانشناسان‌ تدوین‌ گردیدند. رایانه‌ها از جهت‌سخت‌افزاری‌ و نرم‌افزاری‌ پیشرفت‌ كردند و ما امروزه‌ شاهد استفاده‌ از سیستم‌های ‌هوشمند در ذخیره‌ و بازیابی‌ اطلاعات‌ هستیم‌.در نظام‌های‌ اطلاعاتی‌، واژه‌ها به‌ دوگونه‌ "زبان‌ آزاد" و "زبان‌ مهارشده‌" ظاهر می‌گردند. در استفاده‌ از زبان‌ آزاد، اصطلاح‌های‌ تخصصی‌ بدون‌ آن‌ كه‌ هیچ‌ گونه‌ كنترلی‌ درمورد آن‌ها اعمال‌ شود، به‌ همان‌ صورت‌ كه‌ در مدارك‌ آمده‌اند، در سیستم‌ وارد و ذخیره‌ می‌شوند. مسوولیت‌ توجه‌ به‌ كلیه‌ اصطلاحات‌ معادل‌ و شكل‌های‌ متفاوت‌ نوشتاری‌ یك‌اصطلاح‌ هنگام‌ بازیابی‌ اطلاعات‌ به‌ عهده‌ كاربر است‌. حسن‌ این‌ روش‌ كاهش‌ زمان ‌آماده‌سازی‌ و پردازش‌ اطلاعات‌ و تقلیل‌ نیاز به‌ نیروی‌ متخصص‌ است‌.انواع‌ نمایه‌های‌ گردان‌ (۱)كه‌ براساس‌ چرخش‌ عنوان‌های‌ مدارك‌ و الفبایی‌ كردن‌ هر یك‌ از واژه‌های‌ عنوان‌ طراحی‌ شده‌اند، از این‌ نوع‌ اند. در استفاده‌ از زبان‌ مهار شده‌، نظام‌های‌ ذخیره‌ و بازیابی‌ اطلاعات‌ با بهره‌گیری‌ از متخصصان‌ موضوعی‌ و صرف‌ وقت‌ و نیروی‌ قابل‌ ملاحظه‌ای‌ می‌كوشند تا اطلاعات‌ را در قالب‌ زبانی‌ مهار شده‌ و مقید ذخیره‌ كنند تا كاربر و رابط اطلاعات‌(۲) در زمانی‌ كوتاه‌تر وبا نیرویی‌ كمتر، درصد بالایی‌ از اطلاعات‌ پایگاه‌ را بازیابی‌ نمایند. اصطلاحنامه‌های ‌تخصصی‌(۳) ابزار كار این‌ روش‌اند. نظام‌های‌ بازیابی‌ تمام‌ متن‌(۴) و آزاد متن‌(۵) كه‌ با رواج‌استفاده‌ از شبكه‌ جهانی‌ وب‌ شناخته‌ شدند، از زبان‌ آزاد و زبان‌ مهار شده‌، تؤاماً در سیستم‌های‌ هوشمند سود می‌جویند.در ایران‌ این‌ امور سابقه‌ چندانی‌ ندارد. از عمر پایگاههای‌ اطلاعاتی‌ فارسی‌ بیش‌ از۱۰ سال‌ نمی‌گذرد. پیش‌ از آن‌ كه‌ فرهنگستان‌ زبان‌ معیارهای‌ لازم‌ را برای‌ كاربرد اصطلاحات‌ علمی‌ و رسم‌الخط فارسی‌ تعیین‌ كند، پایگاه‌های‌ اطلاعاتی‌ شكل‌ گرفتند و مجریان‌ آن‌ها و نمایه‌‌سازان‌، خواسته‌ یا ناخواسته‌، با مسائل‌ واژه‌‌گزینی‌ و جنبه‌‌هایی‌ از زبانشناسی‌ درگیر شدند.البته‌ در این‌ مدت‌ به‌ مدد رسانه‌های‌ ارتباطی‌ و بهره‌گیری‌ از دانش‌ و تجربه‌ كشورهای‌ پیشرفته‌، بسیاری‌ از مراحل‌ را شتابان‌ پیمودیم‌ و شاید بسیاری‌ از مشكلات‌ را چون‌ دیگر مشكل‌ به‌ حساب‌ نمی‌آمدند، حس‌ نكردیم‌. ولی‌ بتدریج‌ كه‌ برحجم‌ اطلاعات‌ فارسی‌ افزوده‌ شد، دشواری‌های‌ خط و زبان‌ فارسی‌ خودنمایی‌ كرد، از محاسن‌ روش‌های‌ ذخیره‌ و بازیابی‌ كاست‌ و بر معایب‌ آنها افزود، حل‌ آن‌ها روزبه‌‌روز مشكل‌تر شد و اعمال‌ بعضی‌ روش‌های‌ ماشینی‌ ممكن‌ نگردید.كتابداران‌ و اطلاع‌‌رسانان‌ كه‌ به‌ لحاظ ماهیت‌ حرفه‌ خود با واژه‌های‌ رایج‌ در جامعه‌ء ‌تولیدكنندگان‌ و مصرف‌‌كنندگان‌ اطلاعات‌ سر و كار دارند، خود را مجاز به‌ اعمال‌ سلیقه ‌نمی‌دانند. خط و زبان‌ هم‌ مطلبی‌ نیست‌ كه‌ بتوان‌ با اجرای‌ الگوهای‌ غربی‌ بر مسایل‌ آن‌ فایق ‌آمد. تنها با استمداد از نهادهای‌ مسوول‌ و یاری‌ آنها می‌توانند به‌ رفع‌، و یا حداقل‌ مهار این‌مشكلات‌ بپردازند. نویسنده‌ء ‌ مقاله‌ به‌ عنوان‌ یكی‌ از كسانی‌ كه‌ با مسائل‌ پایگاه‌های ‌اطلاعاتی‌ مدارك‌ فارسی‌ سر و كار داشته‌ و آن‌ها را تجربه‌ كرده‌ است‌، تلاش‌ خواهد كرد درحد حوصله‌ و وقت‌ مقاله‌ نمونه‌هایی‌ ارائه‌ دهد تا مشخص‌ گردد دشواری‌های‌ زبان‌ و خط فارسی‌ چگونه‌ سبب‌ می‌شود اولاً ـ در نظام‌هایی‌ كه‌ براساس‌ زبان‌ آزاد طراحی‌ شده‌اند به ‌دلیل‌ تعدد اصطلاح‌های‌ معادل‌ و پراكندگی‌ آن‌ها در محل‌های‌ الفبایی‌ مختلف‌، مشخص‌ نبودن‌ حد كلمه‌ در واژه‌های‌ مركب‌ و استاندارد نبودن‌ شكل‌ نوشتاری‌ كلمات‌، نتیجه‌ جستجو جامعیت‌ مطلوب‌ را نداشته‌ باشد. ثانیاً در نظام‌‌‌هایی‌ كه‌ از زبان‌ مهارشده ‌بهره‌ می‌گیرند به‌ دلیل‌ همین‌ مسایل‌، نیرو و زمانی‌ بیش‌ از آنچه‌ تصور می‌رود برای‌ واژه‌گزینی‌ و معادل‌ یابی‌، هماهنگی‌ و یكسان‌ سازی‌ شكل‌ نوشتاری‌ اصطلاحات‌ صرف‌ شود.● گوناگونی‌ معادل‌های‌ علمی‌
متخصصان‌ در بیان‌ و انتقال‌ یك‌ مفهوم‌ از اصطلاحات‌ متفاوت‌ استفاده‌ می‌كنند. نظری‌ اجمالی‌ به‌ یكی‌ دو واژه‌‌نامه‌ء ‌‌تخصصی‌ كه‌ براساس‌ كاربرد اصطلاحات‌ در منابع‌ تهیه ‌شده‌اند نشان‌ می‌دهد كه‌ بازار واژه‌سازی‌ و به‌ قول‌ یكی‌ از زبان‌شناسان‌ واژهء‌ بازی‌ رواج‌ دارد. به‌ عنوان‌ نمونه‌ واژگان‌ كتابداری‌ و اطلاع‌رسانی‌(۶) نشان‌ می‌دهد متخصصان‌ این‌ رشته‌ء‌ ‌۶ معادل‌ برای‌Manual ۹ معادل برایOnline ۱۲ معادل‌ برای‌ Layout و ۱۳ معادل‌ برای ‌Cross refrence بكار برده‌اند. از این‌ گونه‌ نمونه‌ها در تمام‌ رشته‌ها فراوان‌ است‌ كه‌ مواردی ‌از آنها در ضمیمه‌ء‌ مقاله‌ آورده‌ می‌شود. متأسفانه‌ فرهنگستان‌ زبان‌ هم‌ با تصویب‌ برخی‌ معادل‌های‌ نامأنوس‌ (مانند پروَنجا به‌ جای‌ فایل‌؛ پروندان‌ به‌ جای‌ زونكن‌) سهمی‌ در این‌بازار آشفته‌ دارد. حال‌ آنكه‌ در كشورهای‌ پیشرفته‌، اصل‌ اصطلاح‌ ـ چه‌ خوش‌‌ساخت‌ و چه‌ بدساخت‌ ـ پذیرفته‌ می‌شود و بدون‌ اعمال‌ سلیقه‌، به‌ همان‌ صورت‌، به كار می‌رود.به‌ راستی‌ نمایه‌ ساز باید كدام‌ یك‌ از اصطلاحات‌ معادل‌ را اصل‌ قرار دهد و از بقیه‌ به‌آن‌ ارجاع‌ بسازد؟ چه‌ معیاری‌ در دست‌ دارد؟ رابط اطلاعات‌، یا به‌ قول‌ فرهنگستان‌ كارور، اگر بخواهد با استفاده‌ از منطق‌ بول(۷) بین‌ دو یا سه‌ اصطلاح‌ رابطه‌ منطقی‌ برقرار كند چه ‌تدبیری‌ باید بیاندیشد تا حداكثر نسبت‌ بازیافت‌(۸) را داشته‌ باشد؟
● ضبط اسامی‌
در برگردان‌ اسامی‌ افراد، سازمان‌ها، عناصر و تركیبات‌ شیمیایی‌، ابزار و تجهیزات‌، محل‌های‌ جغرافیایی‌ و مانند آن‌ها از زبان‌های‌ بیگانه‌ به‌ فارسی‌، قاعده‌ خاصی‌ وجود ندارد. هر متخصص‌، نویسنده‌ و مترجمی‌ بنا به‌ ذوق‌ و سلیقه‌، میزان‌ آشنایی‌ با زبان‌ مبدأ و دانش‌ و تخصص‌ خود، آن‌ها را به‌ فارسی‌ برگردانده‌ و در متون‌ بكار برده‌ است‌. این‌ نابسامانی‌ حتی‌ در انتشارات‌ سازمان‌های‌ علمی‌ و فرهنگی‌ كشور نیز دیده‌ می‌شود.
▪ نمونه‌:
ـ پستالزی‌،ژوهان‌هنریش‌/پستالوزی‌،یوهان‌هانریش‌/‌پستالوزی‌، ژان‌ هانری‌
ـ فلیشیا/ فلیسیا/ فلیشا/ فلیسا
ـ رابینسون‌/ روبینسون‌/ ربینسون‌/ روبنسن‌
ـ پیرسون‌/ پی‌یرسون‌/ پی‌یرسن
ـ اف‌. آی‌. دی‌/ فید
ـ دبلیو. اچ‌. او/ هو
ـ پتاسیم‌/ پتاسیوم‌/ پوتاسیوم‌/ پوتاسیم‌
ـ كادمیوم/كادمیم/كادیوم
ـ ئیدروژن/ هیدروژن
ـ آلزایمر/ الزایمر
ـ آفریقا/ افریقا
ـ آمریكا/ امریكا
آیا می‌توان‌ تمام‌ شكل‌های‌ حرف‌ نویسی‌ و آوانویسی‌ اسامی‌ را پوشش‌ داد و پایگاه ‌اطلاعاتی‌ را با ارجاعات‌ متعدد انباشت‌؟
● سرهم‌‌نویسی‌، جدانویسی‌،و بی‌‌فاصله‌ نویسی‌
شیوه‌ خط فارسی‌ چنان‌ است‌ كه‌ بسیاری‌ از واژه‌ها را می‌توان‌ به‌ چند صورت‌ نوشت‌. این‌ چندگونگی‌ شكل‌ واژه‌ها، برای‌ رایانه‌ قابل‌ درك‌ نیست‌. چرا كه‌ واژه‌ها را تنها به‌ همان‌ صورتی‌ كه‌ ذخیره‌ كرده‌ است‌ می‌شناسد و بازیابی‌ می‌كند. لذا در مقابل‌ سایر شكل‌های ‌نوشتاری‌ یك‌ اصطلاح‌ ناآگاه‌ است‌ و در هنگام‌ جستجوی‌ اطلاعات‌ پاسخ‌ منفی‌ می‌دهد. رابط‌های‌ اطلاعات‌ برای‌ پرهیز از این‌ مشكل‌، عموماً از فهرست‌ كلید واژه‌ها استفاده‌می‌كنند كه‌ این‌ امر سبب‌ شده‌ است‌ تا از امكانات‌ منطق‌ بول‌ در بازیابی‌ اطلاعات‌ به‌ خوبی ‌بهره‌ گرفته‌ نشود. در مواقعی‌ كه‌ بازیابی‌ از محدوده‌ فیلد كلید واژه‌ها، كه‌ اصطلاحات‌ مهارشده‌اند، فراتر می‌رود و فیلدهای‌ عنوان‌، پدیدآورنده‌ و ناشر را شامل‌ می‌شود، این ‌ناهماهنگی‌ كاملا به‌ چشم‌ می‌خورد. گاه‌ یك‌ واژه‌ مركب‌ براساس‌ شكل‌ نگارش‌ آن‌ در چند محل‌ الفبایی‌ مختلف‌، جدا از هم‌ قرار می‌گیرد. علامت‌ جمع‌ "ها" كه‌ به‌ صورت‌ سرهم‌ یا جدا نوشته‌ شود نیز، همین‌ وضع‌ را در فهرست‌های‌ رایانه‌ای‌ ایجاد می‌كند.
▪ نمونه‌:
ـ آب‌بند/ آببند
ـ آب‌شش‌/ آبشش
ـ آب‌كاری‌/ آبكاری
ـ آب‌گرم‌كن‌/ آب‌گرمكن‌/ آبگرم‌كن‌/ آبگرمكن
ـ بی‌خوابی‌/ بیخوابی‌
ـ بی‌حس‌‌كننده‌/ بیحس‌‌كننده‌
ـ بیماری‌زا/ بیماریزا
ـ دستگاه‌ یخ‌ساز/ دستگاه‌ یخساز
ـ دستگاه‌ هم‌زن‌/ دستگاه‌ همزن‌
ـ ماشین‌ ظرف‌شویی‌/ ماشین‌ ظرفشویی‌
ـ یخ‌زدگی‌/ یخزدگی
ـ یخ‌بندان‌/ یخبندان‌
یون‌ساز/ یونساز
ـ خاك‌برداری/خاكبرداری
ـ نام‌گذاری/نامگذاری
ـ خشك‌شویی/خشكشویی
ـ غلام حسین/غلامحسین
ـ علی‌رضا/علیرضا
ـ حسن‌علی/حسنعلی
ـ كتاب‌درسی/كتاب درسی
ـ برنامه‌درسی/برنامه درسی
ـ نیروی‌انسانی/نیروی انسانی
ـ دانشگاه‌ها/دانشگاهها
ـ كوه‌ها/كوهها● انواع‌ جمع‌
تعدّد علائم‌ جمع‌ (ها؛ ان؛ ات‌؛ ین‌؛ ون‌) و وجود جمع‌ بی‌قاعده‌ در زبان‌ فارسی‌ سبب ‌گردیده‌ است‌ در پایگاه‌هایی‌ كه‌ كلید واژه‌ها را به‌ صورت‌ جمع‌ به‌ كار می‌برند، مشكلی‌ بر مشكلات‌ بالا افزوده‌ شود. نمایه‌ساز در هنگام‌ نمایه‌‌سازی‌ در انتخاب‌ بین‌ مدارس‌ / مدرسه‌ها، اساتید/ استادان‌/ استادها، محققان‌/ محققین‌ و مانند آن‌ها، مردد است‌. رابط اطلاعات‌ در موقع‌ بازیابی‌ باید شكل‌های‌ مختلف‌ جمع‌ كلیدواژه‌ها را در نظر داشته‌ باشد ویا، با استفاده‌ از علائم‌ قراردادی،‌ واژه‌ را برش‌(۹) بزند. در هر دو صورت‌، بازهم‌ احتمال‌ پوشش‌ ندادن‌ بعضی‌ از جمع‌های‌ بی‌‌قاعده‌ وجود دارد.آن‌ دسته‌ از پایگاه‌های‌ اطلاعاتی‌ كه‌ كلید واژه‌ها را به‌ صورت‌ مفرد بكار می‌برند، بااین‌ مشكل‌ مواجه‌ نیستند. البته‌ مسایل‌ جزئی‌ وجود دارد كه‌ به‌ نوعی‌ حل‌ می‌كنند، از آن‌جمله‌ اصطلاحاتی‌ كه‌ در شكل‌ جمع‌، مفهومی‌ متمایز از شكل‌ مفرد دارند (مانند تشكیلات‌، تجهیزات‌، امكانات‌، تسهیلات‌، ارتباطات‌) و یا برخی‌ اصطلاحات‌ كه‌ به‌صورت‌ مفرد نامأنوس‌اند (مثل‌ گروه‌ همسالان‌، فرصت‌های‌ شغلی‌، خدمات‌ مشاوره‌، اوقات‌ فراغت‌). در این‌ گونه‌ موارد یا معادلی‌ مناسب‌ را جایگزین‌ می‌كنند (مانند سازمان ‌به‌ جای ‌تشكیلات‌ و یا رسانه‌ همگانی‌ به‌ جای‌ وسایل‌ ارتباط جمعی‌) یا چنانچه ‌ممكن‌ باشد شكل‌ مفرد واژه‌ را، به‌ امید آن‌ كه‌ پذیرفته‌ شود برمی‌گزینند (مانند وقت‌ فراغت ‌به‌ جای‌ اوقات‌ فراغت‌) در غیر این‌ صورت‌ همان‌ شكل‌ جمع‌ را بكار می‌برند.
● صورت‌های‌ مختلف‌ نوشتاری‌
همزه‌، الف‌ مقصوره‌، تشدید و دوگانگی‌ شكل‌ نوشتاری‌ واژه‌ها و اسامی‌، سبب ‌ناهماهنگی‌هایی‌ در ورود داده‌ها و پراكندگی‌ اطلاعات‌ پردازش‌ شده‌ می‌گردد.
▪ نمونه‌:
ـ هیأت‌ مدیره‌/ هیئت‌
ـ مسأله‌ اجتماعی‌/ مسئله‌ اجتماعی‌
ـ مسؤولیت‌ والدین‌/ مسئولیت‌ والدین‌
ـ عطایی‌/ عطائی‌
ـ رؤوف‌/ رئوف
ـ اسماعیل‌/ اسمعیل
ـ اسحاق‌/ اسحق
ـ آیینه/ آینه
ـ طومار/ تومار
ـ موّحدی/ موحدی
ـ داود/ داوود
ـ طاوس/ طاووس
ـ آیت‌اللهی/ آیت الهی
ـ لیلا/ لیلی
● حاصل‌ سخن‌
زبان‌ علم‌ را "زبانی‌ ارتباطی‌ و اطلاعاتی‌، روشن‌ و سرراست‌ و عاری‌ از ابهام‌"(۱۰) تعریف‌ كرده‌اند، آیا زبان‌ فارسی‌ در حیطه‌ علم‌ چنین‌ ویژگی‌هایی‌ دارد؟ آیا در نقش ‌ارتباطی‌ و اطلاعاتی‌ خود موفق‌ بوده‌ است‌؟ تصور نمی‌كنم‌ پاسخ‌ چنین‌ پرسش‌هایی‌ مثبت ‌باشد. طبعاً پایگاه‌های‌ اطلاعاتی‌ كه‌ با استفاده‌ از این‌ زبان‌ به‌ ذخیره‌ و بازیابی‌ اطلاعات ‌می‌پردازند، نمی‌توانند كارایی‌ مطلوب‌ را داشته‌ باشند. عواملی‌ كه‌ پیش‌تر بدان‌ اشاره‌ شد سبب‌ كندی‌ مراحل‌ ذخیره‌ و بازیابی‌ اطلاعات‌ می‌شوند، نسبت‌ بازیافت‌ اطلاعات‌ را كاهش‌ می‌دهند و همواره‌ می‌توان‌ نسبت‌ به‌ جامعیت‌ نتیجه‌ یك‌ جستجو شك‌ كرد.پایگاه‌های‌ اطلاعاتی‌ مدارك‌ فارسی‌ با وجود عمر كوتاه‌شان‌ با مشكلات‌ بسیاری‌دست‌ بگریبانند كه‌ اگر هر چه‌ زودتر چاره‌ اندیشی‌ نشود، با توجه‌ به‌ هجوم‌ اطلاعات‌، دیگر مهار آن‌ها آسان‌ نخواهد بود. در این‌ زمینه‌ پیشنهاد می‌شود:
فرهنگستان‌ برای‌ یكسان‌‌سازی‌ واژه‌های‌ علمی‌ و جلوگیری‌ از ناهماهنگی‌ بیشترگام‌های‌ سریع‌تر و مؤثرتری‌ بردارد. همزمان‌ با ظهور و ورود هر پدیده‌ و یا فرآورده‌ علمی‌،پیش‌ از آن‌ كه‌ معادل‌های‌ گوناگون‌ رواج‌ یابند، اصطلاح‌ مناسب‌ را انتخاب‌ و اعلام‌ نماید.ـ دستورالعمل‌هایی‌ در مورد شیوه‌ نگارش‌ اصطلاحات‌ و واژه‌های‌ فارسی‌ كه‌ موردتأیید اهل‌ فن‌ باشد، تدوین‌ و برای‌ اجرا به‌ كلیه‌ واحدهای‌ چاپ‌ و نشر ابلاغ‌ شود.ـ برای‌ تدوین‌ اصطلاحنامه‌های‌ تخصصی‌ در زبان‌ فارسی‌، كه‌ حاوی‌ اصطلاحات ‌معیار در هر رشته‌ و شیوه‌ نوشتاری‌ مورد قبول‌ باشد، اقداماتی‌ مؤثر، هماهنگ‌ و حساب‌شده‌ از طرف‌ سازمان‌های‌ ذیربط صورت‌ گیرد.ـ متخصصان‌ رایانه‌ در جهت‌ استفاده‌ از امكانات‌ این‌ پدیده‌ قرن‌ و هوشمندكردن‌ سیستم‌ها برای‌ پردازش‌ خط فارسی‌، چاره‌‌‌جویی‌ و هم‌اندیشی‌ بیشتری‌ داشته‌ باشند.
پی‌نوشت‌ها:
۱. Permuted Index
۲. Information intermediary
۳. Thesaurus
۴. Full-Text
۵. Free-Text
۶. هاشمی‌، ابوالفضل‌ (۱۳۷۶). واژگان‌ كتابداری‌ و اطلاع‌ رسانی‌. تهران‌، دبیرخانه‌ هیأت‌امنای‌ كتابخانه‌های‌ كشور.
۷. Boolean logic
۸. Recall ratio
۹. Truncation

۱۰. حق‌ شناس‌، علی‌ محمد (۱۳۷۲). در جست‌ و جوی‌ زبان‌ علم‌. مجموعه‌ مقالات‌سمینار زبان‌ فارسی‌ در زبان‌ علم‌. تهران‌: مركز نشر دانشگاهی‌. ص‌ ۱۳-۶.
منابع:
آشوری‌، داریوش‌ (۱۳۷۵). بازاندیشی‌ زبان‌ فارسی‌; ده‌ مقاله‌، ویرایش‌ دوم‌. تهران‌: نشرمركز.
اكبری‌ نژاد، سعید (۱۳۷۶). فاصله‌ خالی‌ میان‌ واژه‌ها در ذخیره‌ و بازیابی‌ رایانه‌ای‌اطلاعات‌. فصلنامه‌ كتاب‌. (بهار و تابستان‌). ص‌ ۵۶-۴۹.
امامی‌، كریم‌ (۱۳۷۱). لزوم‌ بازنگری‌ در شیوه‌ نگارش‌ خط فارسی‌. آدینه‌. ۷۴/۷۳(شهریور) ص‌ ۱۹-۱۸.
باطنی‌، رضا (۱۳۷۱). نگاهی‌ تازه‌ به‌ شیوه‌ خط فارسی‌. آدینه‌. ۷۵ (آبان‌). ص‌ ۴۵-۴۴.
بهزادی‌، ماندانا (۱۳۷۵). شیوه‌ ضبط اعلام‌ انگلیسی‌ در فارسی‌. تهران‌: مركز نشر دانشگاهی‌ ;كتابخانه‌ ملی‌ جمهوری‌ اسلامی‌ ایران‌.
حری‌، عباس‌ (۱۳۷۲). كامپیوتر و رسم‌الخط فارسی‌، پیام‌ كتابخانه‌. سال‌ سوم‌. شماره‌ ۱.(بهار) ص‌ ۱۱-۶.
حق‌ شناس‌، علی‌ محمد (۱۳۷۲). در جست‌ و جوی‌ زبان‌ علم‌. مجموعه‌ مقالات‌ سمینارزبان‌ فارسی‌ در زبان‌ علم‌. تهران‌: مركز نشر دانشگاهی‌. ص‌ ۱۳-۶.
صنعتی‌، محمد (۱۳۷۱). دشواری‌های‌ زبان‌ فارسی‌ با كامپیوتر. آدینه‌. ۷۲ (مرداد).
ص‌ ۵۷-۵۶.
كابلی‌، ایرج‌ (۱۳۷۱). فراخوان‌ برای‌ فارسی‌ نویسی‌ و پیشنهاد به‌ تاجیكان‌. آدینه‌. ۷۲
(مرداد) ص‌ ۵۵-۵۰.
مآخذنمونه‌ها
امینی‌، سید محمد (۱۳۷۰). واژگان‌ فیزیك‌. تهران‌: مركز نشر دانشگاهی‌.
باقری‌، محمد (۱۳۷۲). واژگان‌ ریاضی‌. تهران‌: نشر فرهنگان‌.
بریجانیان‌، ماری‌ (۱۳۷۱). فرهنگ‌ اصطلاحات‌ فلسفه‌ و علوم‌ اجتماعی‌، ویرایش‌ بهاءالدین‌ خرمشاهی‌. تهران‌: مؤسسه‌ مطالعات‌ و تحقیقات‌ فرهنگی‌.
پورجوادی‌، علی‌. واژگان‌ شیمی‌ و مهندسی‌ شیمی‌، تهران‌: مركز نشر دانشگاهی‌.
هاشمی‌، سید محمد (۱۳۷۶). واژگان‌ كتابداری‌ و اطلاع‌رسانی‌. تهران‌: دبیرخانه‌ هیأت‌امنای‌ كتابخانه‌های‌ عمومی‌ كشور.
همایون‌، همادخت‌ (۱۳۷۱). واژه‌ نامه‌ زبانشناسی‌ و علوم‌ وابسته‌. تهران‌: مؤسسه‌ مطالعات‌و تحقیقات‌ فرهنگی‌.
نوشته: لیلا مرتضائی‌
عضو هیأت‌ علمی‌ مركز اطلاعات‌ و مدارك‌ علمی‌ ایران‌
منبع : فصلنامه علوم اطلاع رسانی