اگر صفحه را درست نمی‌بینید اینجا را کلیک کنید

فارسی چند واژه از هر زبان گرفته است؟
فرهاد قربان‌زاده از شمار وام‌واژه‌های رایج در فارسی به تفکیکِ هر زبان نوشته است. به گزارش ایسنا، این فرهنگ‌نویس و ویراستار در تازه‌ترین نوشتار خود که آن را در صفحه‌ شخصی‌اش منتشر کرده، با عنوان «شمار واژه‌های عربیِ رایج در فارسی» چنین آورده است:      ▫️ برخی معتقدند نیمی از واژه‌های رایج در فارسی عربی است. معیار این افراد برای دست یافتن به این آمار بر نگارنده روشن نیست، ولی می‌دانم که برای شمارش واژه‌های عربیِ رایج در فارسی با چند پرسش روبه‌رو هستیم:      ۱. فارسی معاصر را باید در نظر داشته باشیم یا آمیخته‌ای از فارسی کهن و معاصر یا فقط فارسی کهن را؟ برای نمونه، آیا باید برخی واژه‌های عربیِ به‌کاررفته در دُرۀ نادره و تاریخ وصاف و تاریخ جهانگشای را، حتی اگر فقط یک بار در تاریخ زبان فارسی به‌کار رفته باشد، جزو واژه‌های عربیِ رایج در فارسی به‌شمار بیاوریم؟      ۲. با هزاران واژۀ مشتق (مانند طفلک) و مرکّب (مانند کتابخانه) و مشتق‌مرکّب (مانند وطن‌پرستی) چه کنیم و این واژه‌ها را فارسی بدانیم یا عربی ـ فارسی؟      ۳. واژه‌های عربیِ کم‌بسامدی مانند مال‌التجاره و موطن و مافات را با واژه‌های عربیِ پربسامدی مانند غم و کتاب و ساعت یکسان در شمار بیاوریم؟      ۴. فارسی گفتاری را باید در نظر داشته باشیم یا فارسی نوشتاری را؟ روشن است که بسامد واژه‌های عربی در فارسی گفتاری کمتر از فارسی نوشتاری است.      ▫️ برای دست یافتن به شمارِ تقریبیِ واژه‌های عربی در فارسی چند معیار را پیش روی خود قرار داده‌ام. نکتۀ بسیار مهم اینکه این معیارها با توجه به امکانات من بوده و لزوماً درست‌ترین و بی‌نقص‌ترین معیارها نیستند. نخست این معیارها را با توجه به پرسش‌های بالا یادآور می‌شوم:      ۱. فقط واژه‌های رایج در فارسی معاصر را شمارش کرده‌ام و با واژه‌های به‌کاررفته در متن‌های کهن کاری نداشته‌ام. البته اگر بخواهیم به سبک‌شناسی و زبان‌شناسی تاریخی بپردازیم، شمارش واژه‌های کهن نیز اهمیت دارد، ولی مخاطب خود را عموم مردم و غیرمتخصصان دانسته‌ام و آن‌ها با فارسی کهن سروکاری ندارند.      ۲. به‌دلیل کمبود وقت و امکانات، واژه‌های مشتق و مرکّب و مشتق‌مرکّبِ عربی ـ فارسی را فارسی دانسته‌ام و آگاهم که این روش از دقت آمار می‌کاهد.      ۳. به‌دلیل کمبود وقت و امکانات، واژه‌های عربیِ کم‌بسامد را با واژه‌های عربیِ پربسامد یکسان در شمار آورده‌ام و آگاهم که این روش نیز از دقت آمار می‌کاهد. یعنی اگر یک فارسی‌زبان روزی ده بار واژۀ ساعت را به‌کار ببرد، ولی در عمرش فقط یک بار موطن را به‌کار ببرد، بسامد هر دو واژه را عدد ۱ درنظر گرفته‌ام (در زبان‌شناسی پیکره‌ای به دو مفهوم token و type پرداخته شده که در اینجا به آن‌ها نمی‌پردازم). درست‌تر این است که تکرار نیز در آمار واژه‌های عربیِ رایج در فارسی نقش داشته باشد و با وقت و امکانات اندکی که دارم نتوانستم تکرار را نیز در آمار خود بیاورم.      ۴. فقط به فارسی نوشتاری پرداخته‌ام.      ▫️ منبع نگارنده برای شمارش وام‌واژه‌های رایج در فارسی فرهنگی فارسی است که خودم آن را تألیف کرده‌ام و هنوز منتشر نشده‌است.      ▫️ شمار وام‌واژه‌های برگرفته از برخی زبان‌ها، مانند انگلیسی، بسیار بیش از چیزی است که در پایین آمده، ولی هنوز آن‌ها را به فرهنگ نیفزوده‌ام. با تکمیل فرهنگ این آمار دست‌خوش اندکی دگرگونی خواهد شد.      ▫️ این احتمال را در نظر داشته باشید که ممکن است معدودی از ریشه‌ها درست نباشد. این مشکل در کلیت آمار تأثیر چندانی ندارد.      ▫️ شمارش دقیق‌ترِ وام‌واژه‌های رایج در فارسی می‌تواند موضوع مقاله‌ای زبان‌شناختی باشد. امید است که دوستان زبان‌شناس با مراجعه به پیکره‌های زبانیِ برچسب‌زنی‌شده پژوهش‌های کامل‌تر و دقیق‌تری انجام دهند.      ▫️ اینک شمار وام‌واژه‌های رایج در فارسی به تفکیکِ هر زبان:      - واژه‌های فرهنگ: ٢١۸١۶ (١۰۰ درصد)      - واژه‌های فارسی (و «زبان دیگر + فارسی»): ۱۱۸۰٢ (۵۴.۱۰ درصد)      - واژه‌های عربی: ۷۳۵۳ (۳۳.۷۰ درصد)      - واژه‌های فرانسوی: ۱۸۳۵ (۸.۴۱ درصد)      - واژه‌های ترکی / مغولی: ۲۷۸ (۱.۲۷ درصد)      - واژه‌های انگلیسی: ۲۳۴ (۱.۰۷ درصد)      - واژه‌های روسی: ۷۰ (۰.۳۲ درصد)      - واژه‌های هندی / سنسکریت: ۶۶ (۰.۳ درصد)      - واژه‌های یونانی: ٢۵ (۰.۱۱ درصد)      - واژه‌های برگرفته از زبان‌های دیگر: ۱۵۳ (۰.۷ درصد) پ.ن: رسم‌الخط نگارنده در بازتاب این نوشتار حفظ شده است. انتهای پیام