سه شنبه, ۲ مرداد, ۱۴۰۳ / 23 July, 2024

مجله ویستا

طرح ایجاد پایگاه داده های زبان فارسی با كمك كامپیوتر

این طرح ، طرحی بنیادی و گسترده برای زبان فارسی است كه با توجه به هدف ، سودمندیها و كاربران گوناگون آن ، می تواند به عنوان طرح مادر یا پشتیبان برای بسیاری از طرحهای زبانی ، ادبی و زبانشناختی زبان فارسی به كار گرفته شود . اكنون چند ماه است كه اجرای فازاول این طرح در پژوهشگاه علوم انسانی و مطالعات فرهنكی آغاز شده است .

۱ هدف طرح

هدف این طرح گردآوری و سازماندهی یك پیكره زبانی پایه برای زبان فارسی (شامل متنهای مهم و واژگان عمده آن ) در درون یك سیستم اطلاعات كامپیوتری و ایجاد نخستین بانك داده های زبان فارسی برای بهره گیری همه كاربران و پژوهندگان است .

۲ - پیشینه بانكهای داده های زبانی

گرچه درگذشته سازمانها ، مراكز پژوهشی ، كتابخانه ها و مانند اینها به گردآوری اطلاعات تخصصی در زمینه های گوناگون و ارائه آنها با سرعت و تنوع زیاد علاقه مند بوده اند ؛ اماتنها پس از پیدایش كامپیوتر ، اندیشه ایجاد پایگاههای داده ها و بانكهای اطلاعاتی به خود جامه عمل پوشید . بویژه در زمینه پژوهشهای زبانی و فرهنگ نگاری ، روشهای كامپیوتری (یعنی پردازش خودكار زبان طبیعی Automated Natural Language Processing بسیار موفق بوده است . در سه دهه گذشته ، بیشتر كشورهای صنعتی به ایجاد بانكهای زبانی خود پرداختنه اند . این كشورها ، ابتدا با گردآوری داده ها یا پیكره های زبانی (Corpus Linguistics ) ) و سپس با سازماندهی آنها در پایگاههای داده ها (Databases) و بانكهای اطلاعات زبانی (Linguistic Data Banks )، از شبكه های جهانی داده های زبانی (International Networks of Linguistic Data ) بهره برداری می كنند . در پیوست الف ، نمونه هایی از هریك آورده شده و برای آگاهی از جزئیات بیشتر ، از منابع مربوط نیز یاد گردیده زبان فارسی را همواره از نظر منابع ادبی و واژگان ، یكی از زبان ها ی غنی و با سابقه به شمار آورده اند ؛ اما تا كنون بررسی همه جانبه و دقیقی با تكیه بر آمار و داده های كافی ، درباره این زبان انجام نیافته است . همچنین بسیاری از پژوهشهای زبانشناختی و تصمیم گیریها در برنامه ریزی زبانی ، تنها با دسترسی به یك پیكره زبانی كافی و است .

۳-دلایل پیشنهاد طرحمستند ، ارزش و اعتبار خواهند داشت از سوی دیگر، با گسترش كار برد كامپیوتر و پیدایش امكانات تازه نرم افزاری و سخت افزاری ، و وجود نمونه های بسیاری از این گونه بانك های داده ای زبانی در جهان و اثبات سود مندی و كارایی آنها ، زمان برای آغاز كوششهایی برای زبان فارسی ، از هر جهت مناسب می نماید .

دستیابی سریع به مجمو عه عظیمی از پیكره زبان فارسی و نیز امكان هرگونه جستجوی جهتدار، موضوعی و یا ساختاری در میان داده ها ، آرزوی هر پژوهنده زبان است . یك گنجینه بسامان از متنهای مهم و واژگان فارسی ، منبعی قابل اعتماد و آماری دقیق در دسترس افراد یا سازمانهای علاقه مند قرار می دهد . برخی از كاربردها ی بانك داده های زبانی در زمینه های زیر است :

- فعالیتهای گوناگون فرهنگ نگاری

- واژه گزینی علمی

- بررسیهای دستوری و تدوین دستور زبان امروز

- بررسی تحولات تاریخی زبان فارسی و پیگیری سیر تحول واژگان آن

- مطالعات سبك شناسی در دوره های گوناگون ، یا درباره نویسندگان و شاعران مشخص

- بررسیهای آوایی و گویش شناسی

- تالیف تدوین فرهنگ تاریخی زبان فارسی

- اجرای طرح ترجمه ماشینی برای زبان فارسی

۵- كاربران

به طور كلی همه سازمانها و افرادی كه به گونه ای با زبان فارسی و مسائل گوناگون آن سرو كار دارند، می توانند كاربران بالقوه این پایگاه باشند .

۵-۱- سازمانها

- سازمانهایی كه به پژوهشهای زبانی و زبان شناختی می پردازند ، مانند پژوهشگاه علوم انسانی و مطالعات فرهنگی ؛

- سازمانهای برنامه ریزی زبانی ، مانند فرهنگستان زبان ؛

- سازمانهایی كه با آموزش زبان سروكار دارند ، مانند دانشگاه ها و وزارت آموزش و پرورش ؛

- سازمانهای چاپ و نشر ؛

- كتابخانه ها و مراكز اسناد ؛

- رسانه های همگانی ، و بسیاری از سازمانهای دیگر ؛

۴-۲- اشخاص

- نویسندگان ، شاعران و روز نامه نگاران ؛

- مترجمان و ویراستاران ؛

- منتقدان ادبی ؛

- زبانشناسان ؛

- فرهنگ نگاران ؛

- چكیده نویسان ؛

- دستور نویسان ؛

- اصطلاحشناسان ؛

- برنامه سازان كامپیوتر ؛

- معلمان زبان و پژوهندگانی كه از داده های زبانی به عنوان ماده اولیه كار خود بهره می گیرند .

۶- مراحل اجرای طرح

این طرح به طور كلی ، در سه دوره یا فاز متفاوت انجام می پذیرد :

- دوره ۱. گردآوری داده ها و فراهم آوردن واژه ها مه های بسامدی ؛

- دوره ۲. سارماندهی و ایجاد پایگاه داده ها

- دوره۳. بهره برداری ، نگهداری ، افزایش داده ها و روز آینده سازی پایگاه .

ترتیب زمانی ، زمانبندی تخمینی و ارتباط دوره ها به صورت زیر خواهند بود :

۷ ویژگیهای پایگاه داده ها

در این طرح ، زبان فارسی و ساختار داده ها ، دارای مشخصات ویژه ای خواهند بود كه در زیر تنها به چارچوب

آنها اشاره می شود :

۷ ۱ زبان فارسی

۷ ۱ ۱ گستره و محدوده :

شما در حال مطالعه صفحه 1 از یک مقاله 3 صفحه ای هستید. لطفا صفحات دیگر این مقاله را نیز مطالعه فرمایید.

سه شنبه, ۲ مرداد, ۱۴۰۳ / 23 July, 2024

طرح ایجاد پایگاه داده های زبان فارسی با كمك كامپیوتر

دریافت مدرک ششم، دریافت مدرک نهم و دریافت مدرک دیپلم رسمی

ثبت شرکت و اقامت عمان

نمایندگی رسمی فروش کلیه محصولات شرکت صنعتی الکتریک خراسان با …

لوله و اتصالات آهنی و فولادی در آهن21

تاثیرات طرز خوابیدن در فرم سر نوزاد

اگر سر کودک فقط در یک حالت قرار گیرد، سطوح بازی که بین استخوان‌هاست در یک طرف سر برخلاف سمت دیگر بسته می‌شود.

فیلم کمدی و جدید Son Of Rambow (پسر رامبو)

لیبرتارینیسم چیست و چه می گوید

آزادیخواهی از اندیشه تا عمل

کدام باورها دربارۀ خواص چای درست و کدام یک نادرست هستند؟

عبدالحسین ، مونس علیشاه ذوالریاستین

سن مناسب بچه دار شدن،چه زمانی است؟(2)

يک بررسی علمی جديد تخمين می زند که زوج‌ها برای رسيدن به شمار بچه‌هايی که می خواهند داشته باشند، تا چه زمانی از لحاظ سن زن وقت دارند.

زایمان در آب

زایمان در آب

اتانول

رفع وابستگی با انقلاب در تولید قوت ملی

رفع وابستگی با انقلاب در تولید قوت ملی

هوش کودک، اثرات ژنتیک بر حافظه

آیا حافظه و هوش فرزندان تاثیرپذیر از ژنتیک والدین آنان است؟

بازگشت سهیلی به اوج

گشت ارشاد یک اکشن اجتماعی با زیرلایه های سیاسی ـ انتقادی است

آزادی علمی و استقلال دانشگاه

آزادی علمی و استقلال دانشگاه

این ماه برای باردار شدن مناسب است؟

4 ماه پیش سقط داشتم، کورتاژ شدم، آیا زمان مناسبی برای بارداری است؟

Siemens AX۷۲

رابطه زناشویی بعد از زایمان، نکات مهم

برای داشتن رابطه زناشویی بعد از زایمان نکته مهم برنامه‌ریزی است

تار و پود فرهنگ

تار و پود فرهنگ

چگونه نهال عشق را پرورش دهیم؟

دو آجر را باید با دقت روی هم نهاد

شمس الدین /جمال‌الدین محمد زرندی

مشتری, کلید رشد شرکت ها

مدیران عامل همیشه برای ایجاد رشد پایدار و سازمانی تحت فشار بوده اند یکی از بخش هایی که در راستای ایجاد رشد کمتر مورد توجه قرار می گیرد, بخش بازاریابی است

دندان درآوردن نوزاد، درمان بی اشتهایی

آیا شیرخواران در دوران دندان دراوردن به علت کم شدن اشتها٬ وزنشون کم می شود و یا کمتر وزن گیری دارند؟

آیا علاوه بر تزریق، راه دیگری برای استفاده از انسولین وجود دارد؟

اصول علمی برای رشد مؤثر عضلات

اصول علمی برای رشد مؤثر عضلات

گیاهان در معرض خطر

دیابت در کمین این کودکان است

در حدود نیمی از زنان از رژیم های غذایی با کیفیت پایین پیروی می کنند

سیدمحمودبن محمود حسنی گلستانه

بی تحرکی کودکان را نادیده نگیرید

عدم انجام فعالیت‌های بدنی از عواملی است که منجر به کمبود کلسیم در کودکان و نوجوانان می‌شود

کاهش بازده مغز با غذاهای آلرژی زا

مقاومت از سنگال تا لبنان

مقاومت از سنگال تا لبنان

میانگین بودجه هزینه های بازاریابی چقدر است

درمان ورم پا در بارداری، ساده ترین روش

استفاده از داروها برای درمان ورم پا نمی‌تواند بهترین گزینه باشد زیرا آثار جانبی و معایب زیادی دارد.

در كارتان موفق باشید با رعایت این نكات ...

لکه بینی در بارداری، علامت چیست؟

به علت وجود 5 سی سی مایع آزاد در کلدوساک خلفی کمی لکه بینی دارم.

زن متولد دی

دغدغه‌ای از دیروز تا امروز

مراقبتهای بعد از تولد نوزاد، چند توصیه

از آنجا که ساعت های اولیه بعد از تولد بسیار برای نوزاد اهمیت دارد٬ مادران باید نسبت به اینکه بعد از به دنیا آمدن...

برخی دیگر از رویدادهای ۳۰ سپتامبر

خطر خواب های آشفته

وسترن آسیایی

وسترن آسیایی

سید برهان‌الدین قدسی خلخالی تبریزی

جنسیت مرد نام پدر میر شبیه‌الحمد تخلص قدسی و برهان تولد و وفات ۱۲۵۷ ۱۳۱۴ شمسی محل تولد ایران اردبیل اردبیل شهرت علمی و فرهنگی شاعر پدر او از علماءِ معروف آن دیار …

دو فیلم، دو دوره تی وی فوبیا:درباره مناسبات تلویزیون و فیلم مستند

دو فیلم، دو دوره تی وی فوبیا:درباره مناسبات تلویزیون و فیلم مستند

طالع‌بینی ۳۰ فروردین سال ۹۵

خوشبختانه فعلا لزومی ندارد که بخواهید وقتتان را صرف استراتژی و برنامه ریزی کنید، زیرا کارهای فعلیتان با اهداف درازمدتتان در هماهنگی کامل هستند

بالا رفتن شانس بارداری، راهکارها

برای افزایش باروری و بالا رفتن استروژن چی مصرف کنم؟ بستگی به شرح حال شما و...

آتوسا پورکاشیان (۱۳۶۷-)

بوسیدن نوزادان، ممنوع یا مجاز؟

اگر والدین چنین کودکی هستید همواره مطمئن شوید که به خوبی مراقب بهداشت او هستید.

داروهای همسرم تمام شده پس چرا باردار نشدم؟

این طور نیست که شما بلافاصله پس از طی دوره درمانی باردار شوید.

جغرافیای حکمت ایرانی