چهارشنبه, ۳ بهمن, ۱۴۰۳ / 22 January, 2025
تجزیه و تحلیل مدارك و نظریه زبان شناسی
در این مقاله از یكی از جنبه های دانش اطلاع رسانی یعنی تجزیه و تحلیل مدارك و رابطه آن با نظریه زبان شناسی سخن میرود [۱]منظور از "تجزیه و تحلیل مدارك"[۲]در این مورد بخصوص استخراج مفاهیم از مدارك نوشته شده است. البته مدارك نوشته شده را نباید منحصر به "مدارك علمی نمود، بلكه سایر مدارك مانند متون ـ مدارك تاریخی ـ اساطیر ـ فرهنگ عامه ـ نوشته های مذهبی و مانند اینها نیز در این رده مورد توجه هستند. منظور از ارائه این مقاله در درجه اول بحث درباره مدارك علمی است و در درجه دوم اشاره به گروههای مختلف متون تا آنجا كه در حدود معین به روش تحلیل مدارك مربوط می شوند.در مورد استخراج مفاهیم از مدارك، كه قبلا" ذكر شد، هر كس مجاز است كه برای چنین منظوری نظری را كه خود با روش موجود مناسب میداند بپذیرد، كه خود سبب بی نظمی میگردد. این بی نظمی بعلت ان است كه بیشتر روشهای مشروحه تحت عنوان وسیع آماده سازی مدارك یا ارائه مدارك، در دانش اطلاع رسانی، مانند زمینه های دیگر، بصورت یك وسیله جستجوی مفهوم در نظر گرفته می شود. بعنوان مثال این موضوع در روشهای آماری نیز صدق می كند، روشی كه در آن حالت های مختلف (مانند تعداد دفعات، فاصله آماری و غیره) بمنظور آشكارساختن مفاهیم چند كلمه معنی دار یا چند جمله از یك مجموعه بكار می آید. این روشها قبل از اینكه در سالهای ۶۰ در دانش اطلاع رسانی متداول شود در روان شناسی، ادبیات، جامعه شناسی و غیره مورد استفاده قرار می گرفت. البته روشهای مذكور را اكنون می توان به اعتباری بعنوان قسمتی از وسایل تحلیلی زبان شناسی تلقی كرد، چنانكه امروز "زبان شناسی آماری" یكی از كاملترین رشته های علوم زبان شناسی بشمار می آید. در این جا از اشاره به "معنا شناختی آماری" بخاطر پرهیز ا زمشكلات و نقایصی كه برای منظور ما پیش خواهند آورد چشم پوشی می شود.باری موضوع مورد بحث نویسنده را می توان بنحو صریحتر چنین بیان نمود: بررسی همكاری دانش زبان شناسی با كیفیت روشهائی كه در آماده سازی مدارك در دانش اطلاع رسانی از آنها استفاده می شود. برای سهولت كار می توان این روشها را به دو گروه وسیع قسمت كرد:
الف) روش های طبقه بندی، كه در آن حاصل تحلیل مدارك، فهرستی است از واحدهای زبان شناختی كه ا زمتون زبان طبیعی استخراج و به روشهای مختلف مرتب شده اند (مانند نمایه ها و هماهنگ سازها).
ب) روشهای تبدیلی، كه در آن متون زبان طبیعی (مدارك یا پرسشها) موضوع عملیات پیچیده تری هستند مانند نمایه سازی ـ تجزیه و تحلیل معنایی و تركیبی ـ ارائه آنها در زبان اطلاع رسانی و غیره. مفهوم این دودستگی برای متخصصان دانش اطلاع رسانی آشنا است و احتیاج به تفسیر ندارد، همینطور احتیاجی نیست كه تاكید شود كه روشهای تركیبی كه متشكل از روشهای طبقه بندی و تبدیلی است، معمول ترین روشها هستند.
۱) نمایه ها و هماهنگ سازها
ابتدا می پردازیم به بیان ساده ترین روشهای نمایه سازی: عناصر (غالبا" كلمات) در زبان طبیعی از مجموعه موجود انتخاب و بنحو مشخصی مرتب می گردند، بعد به واحدهای قرینه (از یك نوع یا انواع مختلف) تقسیم می شوند (مانند عبارات، جمله ها و غیره) و سرانجام بصورت طبقه بندی شده كه غالبا" در بردارنده یك دستگاه ارجاعی برای واحدهای گشوده تری در مجموعه است تظاهر میكند (مدارك، صفحات، پاراگرافها و غیره). روش و نتیجه كار هر دو مشخص هستند و بعنوان نمونه می توان نمایه های گردان[۳] را جزو این گروه ذكر كرد. در اینجا مساله قابل توجهی كه مطرح میشود اینست كه آیا زبان شناسی در توسعه قواعد اطلاع رسانی مثمرثمر بوده است یا نه؟
با مطالعه مراحل ذكر شده در بالا، بشرح كوتاهی در زمینه مساله انتخاب می پردازیم. باید گفت راه حل هائی كه در دانش اطلاع رسانی مورد استفاده قرار می گیرد بستگی خیلی كمی با زبان شناسی دارد. قبل از هر چیز باید واحدهای دارای معنی و واحدهای فاقد معنی را از هم تشخیص دهیم. بعد ببینیم در زبان طبیعی كدام بیان رساننده مقصود شناخته می شود یعنی كدام مدخلها در یك نمایه موجود ضرور و كدام غیر ضرور است. جواب این سئوال به میزان رسابودن نمایه، مقصود نمایه ساز و همچنین به خود مجموعه بستگی دارد. در این زمینه، در زبانشناسی، روش خاصی موجود نیست، مگر آنكه استفاده از فهرست كلمات غیرمجاز[۴]را بعنوان یك روش زبانشناسی تلقی كنیم. كه در این صورت زبانشناسان هر زبان، فهرستی استاندارد شده از لغاتی كه نباید بعنوان مدخلهای نمایه بكار رود تهیه می نمایند. به چنین فهرستی نه تنها باید حروف ربط، قیود، حرف اضافه و نظایر آنرا اضافه كرد، بلكه تعداد زیادی از اصطلاحات كه در عبارات علم معانی وجود دارد و برای استفاده كنندگان از فهرست در درجه اهمیت كمتری قرار دارند، بآنها اضافه شود. طبیعی است كه فهرست كلمات غیر مجاز تهیه شده توسط دانشمندان دانش اطلاع رسانی یك فهرست تجربی و دور از نظریه های زبان شناسی است.
با توجه به مرحله دیگری از انتخاب، نظریه مشابهی می توان اظهار نمود: بعضی كلمات بهتر است به تنهائی بكار برده شوند، ولی در موارد دیگر لازم است كه یك یا چند واژه بصورت تركیبی بكار روند تا گویای مفهوم معینی باشند. طبیعی است كه در حالت اخیر جابجائی واژه هائی كه در تركیب بكار رفته اند موجب تغییر مفهوم و پیدایش مفاهیم جدید خواهند شد. یك چنین زمینه ای اساس كار واژه سازی است. درباره لغت نامه ـ اصطلاحات ـ اختصارات و غیره مطالب زیادی نوشته شده است كه در مسائل علمی وابسته به نمایه سازی در دانش اطلاع رسانی می تواند مفید باشد. ولی به هر حال نمی توان باین امر اكتفا كرد. از آنجا كه نمایه های مربوط به مدارك منحصرا" نمایه هائی هستند سوگرفته و مشخص در یك زمینه خاص، تصمیم گیری درچنین مواردی باز بر اساس ملاحضات تجربی و جدا از روشهای پیشرفته فرهنگ نویسی خواهد بود.سومین مرحله انتخاب، گزینش است.
در این مرحله انتخاب واژه ها بشكل طبیعی آن بعنوان مدخلهای نمایه انجام می شود. نمونه هائی از آنرا می توان در دانش اطلاع رسانی یافت. در گام اول، روش تبدیل از اشكال به پایه ها بطور وضوح با تجزیه و تحلیل ریخت شناختی[۵]، همانطور كه در زبان شناسی نظری بكار برده شده است، مرتبط است. معهذا لازم به یادآوری است كه با وجود اینكه متخصصان تجزیه و تحلیل ریخت شناسی در سده شانزدهم برای هر زبا ن علمی مانند زبانهای انگلیسی ـ روسی ـ آلمانی ـ فرانسه ـ و به مقاصد مختلف (مانند ترجمه ماشینی، لغت نویسی، تجزیه و تحلیل تركیبی و غیره) قواعدی به دست داده اند، باز بنظر نمی رسد كه این قواعد بتوانند بعنوان قواعد استاندارد شده جهت نمایه سازی در دكومانتاسیون در هر یك از زبانهای فوق بحساب آیند.
بعد از انتخاب مدخل نمایه ها، مساله طرز قرار گرفتن آنها بصورتی كه كار تحقیق را آسانتر نماید مطرح می شود. آسانترین راه، روش الفبائی كردن آنهاست. این روش تا حدی در زبان شناسی یك روش ابتدائی است. بعضی نمایه ها از الگوی دیگری كه بر پایه روابط معنایی استوار است متابعت می نمایند. رده بندی مدخلها از روی تركیب معانی صورت میگیرد، مانند واژه نامه مفهومی[۶] كه شناخته شده است، و یا واژه نامه های زبان طبیعی[۸].پایه های نظری واژه نامه های زبان طبیعی هنوز كاملا" ساخته نشده اند و نمی توان ادعا كرد كه ترتیبات معنایی اصطلاحات زبان طبیعی مستخرج از مدارك علمی از لحاظ زبان شناسی دارای ارزش خاصی است. البته روشهائی پیشنهاد شده است كه هدف اساسی چنین گروه ها و طبقه بندیهائی را در بر می گیرد. این روشها از سوئی به نظرات و تحقیقاتی كه زمانی بوسیله هریس[۹] متداول شده بود و تا اندازه ای خارج از بحث زبان شناسی است متكی است، و از سوئی دیگر به مقیاسهای آماری مانند آنچه در طبقه بندی خودكار مورد استفاده قرار میگیرد. البته طبقه بندی خودكار رابطه ای غیر زبان شناختی با سمانتیك دارد.
بعد از انتخاب و طبقه بندی مدخلهای نمایه، مساله رده بندی مفاهیم و طریقه ارائه آنها جهت استفاده كنندگان مطرح میشود. در این مرحله نمایه ساز از میان اصطلاحات بیشماری كه مربوط به متن می باشد نسبت به تقدم و تاخر آنها تصمیم میگیرد. در این صورت است كه دو مساله پیش میآید:
۱) كدام اصطلاح با توجه به ضرورت دانش اطلاع رسانی بهترین است؟
۲) و آیا از روشهای زبان شناسی می توان برای رده بندی مفاهیم زبان طبیعی از چنین اصطلاحاتی استفاده كرد؟ جواب سئوال (۱) از طرفی به ذوق و سلیقه و از طرفی دیگر به تشخیص عملی بودن آن بستگی دارد. در قسمت (۲) بویژه مواقعی كه برای اصطلاحات اختیار شده محدودیت قائل باشند امكان انتخاب كم میشود و این بدین جهت است كه گر چه زبان شناسان هنوز از مفاهیم: جمله، عبارت، بند و غیره استفاده می كنند معهذا در مورد وجود چنین اختلافات آشنائی كمتری دارند و بطور یقین این بیانی است از این حقیقت كه:
۱) متخصصان دانش اطلاع رسانی اصطلاحات صریح را بیشتر ترجیح میدهند، نظیر عناوین مدارك و جملات چكیده های تلگرافی.
۲) نكته دیگر اینكه بعلت عدم روابط مشخص مجبورند بر اساس روابط تجربی تصمیم گیری نمایند.
در هیچ یك از سه بحث فوق بنظر نمی آید كه زبان شناسی بتواند كمك زیادی به دكومانتالیست ها بنماید. قواعد پیشرفته تجزیه و تحلیل متون در زبان شناسی بطور كلی بمنظور آمادگی قدرت درك یك شخص در تكلم و فهم زبان مشخص است. در صورتیكه هدف نمایه سازها در دانش اطلاع رسانی بیشتر سودمند نمودن نتیجه سخن رانی ها و نطق ها در جهان مباحث است تا كیفیات دیگر آنها. دستورالعملها و یا قواعدی كه بر حسب روابط تجربی بوجود آمده اند نه تنها در این مورد پذیرفته هستند بلكه بدلیل صرفه جوئی در وقت توصیه هم می شوند. در این مورد اصول نطری مبنی بر متابعت دستورالعملها از قواعد دستوری زبان طبیعی وجود ندارد.
[۱] برای بررسی و تحقیق وسیع تری در زمینه "زبان شناسی و دانش اطلاع رسانی" می توان به منابع زیر رجوع كرد: مقاله ای تحت همین عنوان و بوسیله C. Montgomery (۱۹۷۲) – همچنین مقاله هایی كه توسط M. Kay و K. Sparch jones (۱۹۷۱) نوشته شده است و نیز گزارشی كه بوسیله همین نویسنده برای F.I.D چاپ شده است. مقاله دیگری نیز بزبان فرانسه و در همین زمینه توسط M.Coyaud (۱۹۷۲) نوشته شده است.
[۲] تجزیه و تحلیل مدارك در زبان فرانسه "Anyalyse documentaire " است كه در اینجا سعی شده است در قالب همان معنی بكار برده شود. این نام از اسم گروهی كه از پانزده سال پیش شروع بكار نموده اند یعنی گروهentre d`analyze documentaire pour l`archeologie اخذ شده است.
[۳] KWIC
[۴] Stop-list (فهرستی است از كلماتی كه بعلت فقدان ارزش اطلاعاتی در نمایه بكار نمی روند).
[۵] Morphological
[۶] Conceptual dictionaries
[۷] رجوع شود به: (Roget for English, watburg and halling for French, etc.)
[۸] Harris
[۹] Thesaurus
[۱۰] Symbols
[۱۱] رجوع شود به: (Gardin, ۱۹۶۹)
نوشته: ژان كلودگاردن
ترجمه: آنوش هارطونیان
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست